KR20210002575A

KR20210002575A - 단백질의 분비 생산법

Info

Publication number: KR20210002575A
Application number: KR1020207033331A
Authority: KR
Inventors: 유미 나가세; 요시히코 마츠다
Original assignee: 아지노모토 가부시키가이샤
Priority date: 2018-04-20
Filing date: 2019-04-22
Publication date: 2021-01-08
Also published as: EP3783106A1; AU2019256065A1; JP2023184699A; WO2019203368A1; JPWO2019203368A1; JP7439749B2; EP3783106A4; US20210024941A1; CN112004929A; CN112004929B

Abstract

코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규의 기술을 개발하여, 이종 단백질의 분비 생산법을 제공한다. 이종 단백질을 분비 생산하는 능력을 갖고, 하기 성질 (A), (B), 및 (C)로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변된 코리네형 세균을 배양하여, 이종 단백질을 분비 생산한다: (A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질; (B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질; (C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질.

Description

단백질의 분비 생산법

본 발명은, 이종 단백질의 분비 생산법에 관한 것이다.

미생물에 의한 이종 단백질의 분비 생산으로서는, 지금까지 바실러스속 세균(비특허문헌 1), 메탄올 자화성 효모 피키아 파스토리스(Pichia pastoris) (비특허문헌 2), 및 아스퍼질루스속 사상균(비특허문헌 3, 4) 등에 의한 이종 단백질의 분비 생산이 보고되어 있다.

또한, 코리네형 세균에 의해 이종 단백질을 분비 생산하는 시도도 이루어지고 있다. 코리네형 세균에 의한 이종 단백질의 분비 생산에 대해서는, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)(이후, C. 글루타미쿰으로 약칭하는 경우가 있다)에 의한 뉴클레아제나 리파아제의 분비(특허문헌 1, 비특허문헌 5), 서브틸리신 등의 프로테아제의 분비(비특허문헌 6), 코리네형 세균의 세포 표층 단백질 PS1이나 PS2(CspB라고도 한다)의 신호 펩타이드를 이용한 단백질의 분비(특허문헌 2), PS2(CspB)의 신호 펩타이드를 이용한 피브로넥틴 결합 단백질의 분비(비특허문헌 7), PS2(CspB)나 SlpA(CspA라고도 한다)의 신호 펩타이드를 이용한 프로트랜스글루타미나아제의 분비(특허문헌 3), 변이형 분비 시스템을 이용한 단백질의 분비(특허문헌 4), 변이주에 의한 프로트랜스글루타미나아제의 분비(특허문헌 5) 등의 보고가 있다. 또한, 코리네형 세균에 의한 이종 단백질의 분비 생산량을 높이는 기술로서, 세포 표층 단백질의 활성을 저하시키는 것(특허문헌 6, 7), 페니실린 결합 단백질의 활성을 저하시키는 것(특허문헌 6), 메탈로펩티다아제를 코딩하는 유전자의 발현을 증강하는 것(특허문헌 7), 리보솜 단백질 S1 유전자에 변이를 도입하는 것(특허문헌 8), 신호 펩타이드와 이종 단백질 사이에 Gln-Glu-Thr을 포함하는 아미노산 서열을 삽입하여 이종 단백질을 발현시키는 것(특허문헌 9) 등이 알려져 있다.

일반적인 단백질 분비 경로는 원핵생물에서부터 진핵생물까지 널리 존재하는 Sec계라고 불리는 경로이지만, 최근, Sec계와는 전혀 다른 단백질 분비 경로가 식물 세포의 엽록체의 틸라코이드막에서 발견되었다(비특허문헌 8). 이 신규의 분비 경로는, 그에 의해 분비되는 단백질의 신호 서열에 아르기닌-아르기닌의 서열이 공통으로 존재하고 있기 때문에(비특허문헌 8), Tat계(트윈-아르기닌 전위 시스템, Twin-Arginine Translocation system)라고 명명되었다. Sec계에서는 단백질이 고차(高次) 구조를 형성하기 전의 상태로 분비되는 반면, Tat계에서는 단백질은 세포 내에서 고차 구조를 형성한 후에 세포막을 통과하여 분비되는 것으로 알려져 있다(비특허문헌 9). 코리네형 세균에서도 Tat계 의존성 신호 펩타이드를 이용한 단백질의 분비 생산의 보고가 있다(특허문헌 8, 10).

세균이 세포 내외의 다양한 환경 변화에 반응하는 시스템으로서, 「2성분 제어계」라고 불리는 신호 전달 경로가 알려져 있다. 2성분 제어계는, 환경 변화의 자극을 감지하는 역할의 센서 키나아제와, 센서 키나아제로부터 신호를 받아서 하류의 유전자의 발현을 제어하는 역할의 반응 조절인자의 2개의 성분으로 이루어지는 제어 시스템이다. 구체적으로는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달되고, 인산화에 의해 활성화된 반응 조절인자가 전사 인자로서 하류의 유전자 발현을 조절한다.

C. 글루타미쿰의 2성분 제어계에 관한 지견은 비특허문헌 10 등에 자세히 기재되어 있다. C. 글루타미쿰에 있어서는, 2성분 제어계로서 지금까지 적어도 13종류의 시스템이 알려져 있다. 2성분 제어계로서, 구체적으로는 PhoRS 시스템, SenX3-RegX3 시스템, HrrSA 시스템을 들 수 있다.

PhoRS 시스템은 센서 키나아제의 PhoS 단백질과, 반응 조절인자의 PhoR 단백질로 이루어진다. PhoRS 결손주의 분석에 의해, PhoRS 시스템은 환경 중의 인산 결핍을 감지하여 신호 전달을 행하는 제어계인 것이 밝혀져 있다(비특허문헌 11).

SenX3-RegX3 시스템은 센서 키나아제의 SenX3 단백질과, 반응 조절인자의 RegX3 단백질로 이루어진다. C. 글루타미쿰 ATCC 13032주에서의 RegX3 결손주는 취득 불가능하기 때문에, SenX3-RegX3 시스템은 ATCC 13032주에 있어서는 필수 시스템이라고 생각되고 있다(비특허문헌 10, 12). 한편, regX3 유전자 발현 저하주의 분석에 의해, SenX3-RegX3 시스템은, 무기 인산의 결핍에 반응하는 유전자의 발현이나 NAD⁺의 생합성에 관련된 유전자의 발현을 유도하는 것이 밝혀져 있다(비특허문헌 12).

그러나, RegX3-SenX3 시스템과, 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.

HrrSA 시스템은 센서 키나아제인 HrrS 단백질과, 반응 조절인자인 HrrA 단백질로 이루어진다. HrrSA 결손주의 분석에 의해, HrrSA 시스템은 헴(haem)의 존재 하에, 헴의 분해에 관여하는 유전자나 호흡 사슬 중의 헴 함유 단백질을 코딩하는 유전자의 발현을 유도하고, 헴의 생합성에 관여하는 유전자의 발현을 억제하는 것이 밝혀져 있기 때문에, 헴의 항상성 유지에 관여하고 있다고 생각되고 있다(비특허문헌 13).

그러나, HrrSA 시스템과, 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.

모든 생물은, 갑작스런 온도 상승(열 충격)에 반응하여 열 충격 단백질이라고 불리는 다양한 단백질을 발현한다. 열 충격 단백질에는, 단백질의 폴딩을 돕는 분자 샤프론이나 미스폴딩된 단백질을 분해하는 프로테아제 등이 포함된다. 분자 샤프론의 1종인 GroEL은, 보조 인자인 GroES와 함께 GroEL-GroES 복합체를 형성하고, 그 내부에서 단백질의 폴딩이 일어난다. 코리네박테리움 글루타미쿰의 유전체 (GenBank 등록번호 AP017557)에는, 2카피의 groEL 유전자, 즉 groEL1 유전자(NCBI locus_tag CGBL_0106870)와 groEL2 유전자(NCBI locus_tag CGBL_0126550), 및 1카피의 groES 유전자(NCBI locus_tag CGBL_0106860)가 존재한다. hrcA 유전자(NCBI locus_tag CGBL_0121890)에 코딩되는 전사 인자 HrcA는, groEL1, groEL2, 및 groES 유전자의 전사를 억제하고 있고, hrcA 유전자의 결손주에서는 groEL1, groEL2, 및 groES의 전사량이 증가하는 것으로 알려져 있다(비특허문헌 14). 또한, E. 콜라이에 있어서는, GroEL 및 GroES의 공발현에 의해, 다양한 이종 단백질의 수율이나 가용성이 상승하는 것이 확인되어 있다(비특허문헌 15).

그러나, HrcA나 GroEL 및 GroES와, 코리네형 세균에서의 이종 단백질의 분비 생산과의 관계는 지금까지 알려져 있지 않다.

특허문헌 1: 미국특허 4,965,197호 특허문헌 2: 일본 공개특허공보 특표평6-502548호 특허문헌 3: 일본 특허 제4320769호 특허문헌 4: 일본 공개특허공보 특개평11-169182 특허문헌 5: 일본 특허 제4362651호 특허문헌 6: WO2013/065869호 특허문헌 7: WO2013/065772호 특허문헌 8: WO2013/118544호 특허문헌 9: WO2013/062029호 특허문헌 10: 일본 특허 제4730302호

비특허문헌 1: Microbiol. Rev., 57,109-137(1993) 비특허문헌 2: Biotechnol., 11, 905-910(1993) 비특허문헌 3: Biotechnol., 6, 1419-1422(1988) 비특허문헌 4: Biotechnol., 9, 976-981(1991) 비특허문헌 5: J. Bacteriol., 174, 1854-1861(1992) 비특허문헌 6: Appl. Environ. Microbiol., 61, 1610-1613(1995) 비특허문헌 7: Appl. Environ. Microbiol., 63, 4392-4400(1997) 비특허문헌 8: EMBO J., 14, 2715-2722(1995) 비특허문헌 9: J. Biol. Chem., 25; 273(52), 34868-74(1998) 비특허문헌 10: Appl. Microbiol. Biotechnol., 94, 1131-1150(2012) 비특허문헌 11: J. Bacteriol., 188, 724-732(2006) 비특허문헌 12: Han Min Woo, Regulatory and metabolic aspects of the phosphate starvation response of Corynebacterium glutamicum, URN (NBN): urn:nbn:de:hbz:061-20100825-090114-5, 뒤셀도르프 대학 박사 논문(2010) 비특허문헌 13: J. Bacteriol., 193, 1212-1221(2011) 비특허문헌 14: J. Bacteriol., 191, 2964-2072(2009) 비특허문헌 15: Microb. Cell. Fact., 8: 9(2009)

본 발명은, 코리네형 세균에 의한 이종 단백질의 분비 생산을 향상시키는 신규의 기술을 개발하고, 코리네형 세균에 의한 이종 단백질의 분비 생산법을 제공하는 것을 과제로 한다.

본 발명자들은, 상기 과제를 해결하기 위해서 예의 연구를 행한 결과, RegX3 단백질, HrrSA 시스템, 및 HrcA 단백질로부터 선택되는 2종 이상의 활성이 저하되도록 코리네형 세균을 개변함으로써, 코리네형 세균의 이종 단백질의 분비 생산능이 향상되는 것을 발견하여 본 발명을 완성시켰다.

즉, 본 발명은 이하와 같이 예시할 수 있다.

[1]

이종 단백질의 제조 방법으로서,

이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및

분비 생산된 이종 단백질을 회수하는 단계를 포함하고,

상기 코리네형 세균이, 하기 성질 (A), (B), 및 (C):

(A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질;

(B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질;

(C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변되어 있으며,

상기 유전자 구축물이, 5'에서 3'방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 이종 단백질을 코딩하는 핵산 서열을 포함하고,

상기 이종 단백질이, 상기 신호 펩타이드와의 융합 단백질로서 발현되는, 방법.

[2]

상기 성질 (A), (B) 및 (C)가 각각 하기 성질 (A1), (B1) 및 (C1)인, 상기 방법:

(A1) RegX3 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;

(B1) HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;

(C1) HrcA 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질.

[3]

상기 코리네형 세균이 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖는, 상기 방법.

[4]

상기 코리네형 세균이 상기 성질 (A)와 (B)와 (C)의 조합을 갖는, 상기 방법.

[5]

HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.

[6]

적어도 HrrA 단백질의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.

[7]

HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.

[8]

적어도 HrrA 단백질의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 상기 방법.

[9]

상기 RegX3 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 42에 나타낸 아미노산 서열을 포함하는 단백질;

(b) 서열번호 42에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질;

(c) 서열번호 42에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질.

[10]

상기 HrrS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 44에 나타낸 아미노산 서열을 포함하는 단백질;

(b) 서열번호 44에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질;

(c) 서열번호 44에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질.

[11]

상기 HrrA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 46에 나타낸 아미노산 서열을 포함하는 단백질;

(b) 서열번호 46에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질;

(c) 서열번호 46에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질.

[12]

상기 HrcA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 48에 나타낸 아미노산 서열을 포함하는 단백질;

(b) 서열번호 48에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질;

(c) 서열번호 48에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질.

[13]

regX3 유전자의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써, 상기 성질 (A)가 얻어진;

hrrS 유전자 및/또는 hrrA 유전자의 발현을 저하시킴으로써, 또는 hrrS 유전자 및/또는 hrrA 유전자를 파괴함으로써, 상기 성질 (B)가 얻어진; 및/또는,

hrcA 유전자의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써, 상기 성질 (C)가 얻어진, 상기 방법.

[14]

regX3 유전자의 결실에 의해, 상기 성질 (A)가 얻어지고;

hrrS 유전자 및/또는 hrrA 유전자의 결실에 의해, 상기 성질 (B)가 얻어지고; 및/또는,

hrcA 유전자의 결실에 의해, 상기 성질 (C)가 얻어진, 상기 방법.

[15]

상기 코리네형 세균이, 추가로, 변이형 PhoS 단백질을 코딩하는 phoS 유전자를 유지하도록 개변되어 있는, 상기 방법.

[16]

상기 변이가, 야생형 PhoS 단백질에 있어서, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환한 변이인, 상기 방법.

[17]

상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가, 라이신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파르트산 잔기, 또는 아스파라긴 잔기인, 상기 방법.

[18]

상기 야생형 PhoS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열을 포함하는 단백질;

(b) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질;

(c) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질.

[19]

상기 신호 펩타이드가 Tat계 의존성 신호 펩타이드인, 상기 방법.

[20]

상기 Tat계 의존성 신호 펩타이드가 TorA 신호 펩타이드, SufI 신호 펩타이드, PhoD 신호 펩타이드, LipA 신호 펩타이드, 및 IMD 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 상기 방법.

[21]

상기 코리네형 세균이, 추가로 Tat계 분비 시스템을 코딩하는 유전자로부터 선택되는 1종 이상의 유전자의 발현이 비개변주와 비교하여 상승하도록 개변되어 있는, 상기 방법.

[22]

상기 Tat계 분비 시스템을 코딩하는 유전자가, tatA 유전자, tatB 유전자 tatC 유전자, 및 tatE 유전자로 이루어지는, 상기 방법.

[23]

상기 신호 펩타이드가 Sec계 의존성 신호 펩타이드인, 상기 방법.

[24]

상기 Sec계 의존성 신호 펩타이드가 PS1 신호 펩타이드, PS2 신호 펩타이드 및 SlpA 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 상기 방법.

[25]

상기 유전자 구축물이, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 상기 방법.

[26]

상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 상기 방법.

[27]

상기 코리네형 세균이 코리네박테리움속 세균인, 상기 방법.

[28]

상기 코리네형 세균이 코리네박테리움 글루타미쿰인, 상기 방법.

[29]

상기 코리네형 세균이, 코리네박테리움 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 코리네박테리움 글루타미쿰 ATCC 13869에서 유래하는 개변주인, 상기 방법.

[30]

상기 코리네형 세균이, 세포 표층 단백질의 세포당 분자수가 비개변주와 비교하여 저하되어 있는 코리네형 세균인, 상기 방법.

도 1은, C. 글루타미쿰 YDK010::phoS(W302C)주 및 그 유전자 결손주에서 VHH 항체 N15(CspA의 신호 펩타이드를 융합한 N15)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 2는, C. 글루타미쿰 YDK010::phoS(W302C)주 및 이 유전자 결손주에서 CspB6Xa-LFABP(CspB의 신호 펩타이드, 성숙 CspB의 N 말단 서열, 및 인자 Xa 프로테아제 인식 서열을 융합한 LFABP)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.
도 3은, C. 글루타미쿰 YDK010::phoS(W302C)주 및 그 유전자 결손주에서 bFGF(TorA 신호 펩타이드를 융합한 bFGF)를 발현시켰을 때의 SDS-PAGE의 결과를 나타낸 사진이다.

이하, 본 발명을 상세하게 설명한다.

본 발명의 방법은, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및 분비 생산된 이종 단백질을 회수하는 단계를 포함하는 이종 단백질의 제조 방법으로서, 상기 코리네형 세균이 특정한 성질을 갖도록 개변되어 있는, 방법이다.

<1> 본 발명의 방법에 사용되는 코리네형 세균

본 발명의 방법에 사용되는 코리네형 세균은, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균이며, 또한, 특정한 성질을 갖도록 개변된 코리네형 세균이다. 또한, 본 발명의 방법에 사용되는 코리네형 세균을 「본 발명의 세균」 또는 「본 발명의 코리네형 세균」이라고도 한다. 또한, 본 발명의 세균이 갖는 이종 단백질의 분비 발현용의 유전자 구축물을 「본 발명에 사용되는 유전자 구축물」이라고도 한다.

<1-1> 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균

본 발명의 코리네형 세균은, 이종 단백질의 분비 발현용의 유전자 구축물(본 발명에 사용되는 유전자 구축물)을 가짐으로써, 이종 단백질을 분비 생산하는 능력을 갖는다.

본 발명에 있어서, 단백질이 「분비」된다는 것은 단백질이 세균 균체 외(세포 외)로 이송되는 것을 말한다. 세균 균체 외(세포 외)로서는, 배지 중이나 균체 표층을 들 수 있다. 즉, 분비된 단백질 분자는, 예를 들면, 배지 중에 존재해 있어도 좋고, 균체 표층에 존재해 있어도 좋고, 배지 중과 균체 표층의 양쪽에 존재해 있어도 좋다. 즉, 단백질이 「분비」되는 것에는, 최종적으로 그 단백질의 모든 분자가 배지 중에 완전하게 유리(遊離) 상태에 놓이는 경우에 한정되지 않고, 예를 들면, 그 단백질의 모든 분자가 균체 표층에 존재하고 있는 경우나, 그 단백질의 일부의 분자가 배지 중에 존재하고, 나머지 분자가 균체 표층에 존재하고 있는 경우도 포함된다.

즉, 본 발명에 있어서, 「이종 단백질을 분비 생산하는 능력」이란, 본 발명의 세균을 배지 중에서 배양했을 때에, 배지 중 및/또는 균체 표층에 이종 단백질을 분비하고, 배지 중 및/또는 균체 표층으로부터 회수할 수 있는 정도로 축적하는 능력을 말한다. 축적량은, 예를 들면, 배지 중에서의 축적량으로서, 바람직하게는 10㎍/L 이상, 보다 바람직하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상, 더욱 바람직하게는 1g/L 이상이라도 좋다. 또한, 축적량은, 예를 들면, 균체 표층에서의 축적량으로서, 균체 표층의 이종 단백질을 회수하여 배지와 동량의 액체에 현탁한 경우에 현탁액 중에서의 이종 단백질 농도가 바람직하게는 10㎍/L 이상, 보다 바람하게는 1mg/L 이상, 특히 바람직하게는 100mg/L 이상이 되는 양이라도 좋다. 또한, 본 발명에 있어서 분비 생산되는 「단백질」이란, 올리고펩타이드나 폴리펩타이드 등 펩타이드로 불리는 형태도 포함하는 개념이다.

본 발명에 있어서, 「이종 단백질」이란, 이 단백질을 발현 및 분비시키는 코리네형 세균에 있어서 외래성인 단백질을 말한다. 이종 단백질은, 예를 들면, 미생물 유래의 단백질이라도 좋고, 식물 유래의 단백질이라도 좋고, 동물 유래의 단백질이라도 좋고, 바이러스 유래의 단백질이라도 좋고, 또한 인공적으로 아미노산 서열을 디자인한 단백질이라도 좋다. 이종 단백질은, 특히, 인간 유래의 단백질이라도 좋다. 이종 단백질은 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 다량체 단백질이란, 2 이상의 서브유닛으로 이루어지는 다량체로서 존재할 수 있는 단백질을 말한다. 다량체에 있어서, 각 서브유닛은, 이황화 결합 등의 공유 결합으로 연결되어 있어도 좋고, 수소 결합이나 소수성 상호 작용 등의 비공유 결합으로 연결되어 있어도 좋고, 이들의 조합에 의해 연결되어 있어도 좋다. 다량체에 있어서는, 1 이상의 분자간 이황화 결합이 포함되는 것이 바람직하다. 다량체는, 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 또한, 다량체 단백질이 헤테로 다량체인 경우에는, 다량체를 구성하는 서브유닛 중, 적어도 하나의 서브유닛이 이종 단백질이면 좋다. 즉, 모든 서브유닛이 이종 유래라도 좋고, 일부의 서브유닛만이 이종 유래라도 좋다. 이종 단백질은 천연이고 분비성인 단백질이라도 좋고, 천연이고 비분비성인 단백질이라도 좋지만, 천연이고 분비성인 단백질인 것이 바람직하다. 또한, 이종 단백질은 천연이고 Tat계 의존의 분비성 단백질이라도 좋고, 천연이고 Sec계 의존의 분비성 단백질이라도 좋다. 「이종 단백질」의 구체적인 예는 후술한다.

생산되는 이종 단백질은 1종류뿐이라도 좋고, 2 이상의 종류라도 좋다. 또한, 이종 단백질이 헤테로 다량체인 경우에는, 1종류의 서브유닛만 생산되어도 좋고, 2 이상의 종류의 서브유닛이 생산되어도 좋다. 즉, 「이종 단백질을 분비 생산한다」는 것에는, 목적의 이종 단백질을 구성하는 서브유닛들 중, 모든 서브유닛을 분비 생산하는 경우 이외에도, 일부의 서브유닛만을 분비 생산하는 경우도 포함된다.

코리네형 세균은 호기성의 그램양성 간균이다. 코리네형 세균으로서는, 코리네박테리움속 세균, 브레비박테리움(Brevibacterium)속 세균, 및 마이크로박테리움(Microbacterium)속 세균 등을 들 수 있다. 코리네형 세균을 사용하는 것의 이점으로서는, 종래 이종 단백질의 분비 생산에 이용되고 있는 사상균, 효모, 바실러스속 세균 등에 비해, 원래 균체 외에 분비되는 단백질이 매우 적어서, 이종 단백질을 분비 생산했을 경우의 정제 과정의 간략화나 생략화를 기대할 수 있는 것, 또한, 당, 암모니아, 및 무기염 등을 함유하는 단순 배지에서 잘 생육하기 때문에, 배지 비용이나 배양 방법, 배양 생산성에서 우수하다는 것 등을 들 수 있다.

코리네형 세균으로서는, 구체적으로는 하기와 같은 종을 들 수 있다.

코리네박테리움 아세토아시도필룸(Corynebacterium acetoacidophilum)

코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum)

코리네박테리움 알카노리티쿰(Corynebacterium alkanolyticum)

코리네박테리움 칼루나에(Corynebacterium callunae)

코리네박테리움 크레나툼(Corynebacterium crenatum)

코리네박테리움 글루타미쿰

코리네박테리움 릴리움(Corynebacterium lilium)

코리네박테리움 멜라쎄콜라(Corynebacterium melassecola)

코리네박테리움 써모아미노게네스(코리네박테리움 에피시엔스)(Corynebacterium thermoaminogenes(Corynebacterium efficiens))

코리네박테리움 헤르쿨리스(Corynebacterium herculis)

브레비박테리움 디바리카룸(코리네박테리움 글루타미쿰)(Brevibacterium divaricatum)

브레비박테리움 플라붐(코리네박테리움 글루타미쿰)(Brevibacterium flavum)

브레비박테리움 임마리오필룸(Brevibacterium immariophilum)

브레비박테리움 락토페르멘툼(코리네박테리움 글루타미쿰)(Brevibacterium lactofermentum)

브레비박테리움 로세움(Brevibacterium roseum)

브레비박테리움 사카롤리티쿰(Brevibacterium saccharolyticum)

브레비박테리움 티오게니탈리스(Brevibacterium thiogenitalis)

코리네박테리움 암모니아게네스(코리네박테리움 스타티오니스)(Corynebacterium ammoniagenes(Corynebacterium stationis))

브레비박테리움 알붐(Brevibacterium album)

브레비박테리움 세리눔(Brevibacterium cerinum)

마이크로박테리움 암모니아필룸(Microbacterium ammoniaphilum)

코리네형 세균으로서는, 구체적으로는 하기와 같은 균주를 들 수 있다.

코리네박테리움 아세토아시도필룸 ATCC 13870

코리네박테리움 아세토글루타미쿰 ATCC 15806

코리네박테리움 알카노리티쿰 ATCC 21511

코리네박테리움 칼루나에 ATCC 15991

코리네박테리움 크레나툼 AS1.542

코리네박테리움 글루타미쿰 ATCC 13020, ATCC 13032, ATCC 13060, ATCC 13869, FERM BP-734

코리네박테리움 릴리움 ATCC 15990

코리네박테리움 멜라쎄콜라 ATCC 17965

코리네박테리움 써모아미노게네스 (코리네박테리움 에피시엔스) AJ 12340(FERM BP-1539)

코리네박테리움 헤르쿨리스 ATCC 13868

브레비박테리움 디바리카툼(코리네박테리움 글루타미쿰) ATCC 14020

브레비박테리움 플라붐(코리네박테리움 글루타미쿰) ATCC 13826, ATCC 14067, AJ 12418(FERM BP-2205)

브레비박테리움 임마리오필룸 ATCC 14068

브레비박테리움 락토퍼멘툼(코리네박테리움 글루타미쿰) ATCC 13869

브레비박테리움 로세움 ATCC 13825

브레비박테리움 사카롤리티쿰 ATCC 14066

브레비박테리움 티오게니탈리스 ATCC 19240

코리네박테리움 암모니아게네스(코리네박테리움 스타티오니스) ATCC 6871, ATCC 6872

브레비박테리움 알붐 ATCC 15111

브레비박테리움 세리눔 ATCC 15112

마이크로박테리움 암모니아필룸 ATCC 15354

또한, 코리네박테리움속 세균에는, 종래 브레비박테리움속으로 분류되어 있었지만, 현재 코리네박테리움속으로 통합된 세균(Int. J. Syst. Bacteriol., 41, 255(1991))도 포함된다. 또한, 코리네박테리움 스타티오니스에는, 종래 코리네박테리움 암모니아게네스로 분류되어 있었지만, 16S rRNA의 염기서열 분석 등에 의해 코리네박테리움 스타티오니스로 재분류된 세균도 포함된다(Int. J. Syst. Evol. Microbiol., 60, 874-879(2010)).

이들 균주는, 예를 들면, 미국세포균주은행(주소: 미국 버지니아주 20108 머내서스 사서함 1549 메리랜드 20852 락빌 파크론 드라이브 12301)에서 분양을 받을 수 있다. 즉, 각 균주에 대응하는 등록번호가 부여되어 있고, 이 등록번호를 이용하여 분양을 받을 수 있다(http://www.atcc.org/참조). 각 균주에 대응하는 등록번호는 미국세포균주은행의 카탈로그에 기재되어 있다. 또한, 이들 균주는, 예를 들면, 각 균주가 기탁된 기탁 기관에서 입수할 수 있다.

특히, 야생주 C. 글루타미쿰 ATCC 13869로부터 스트렙토마이신(Sm) 내성 변이주로서 분리된 C. 글루타미쿰 AJ 12036(FERM BP-734)은, 그 친주(야생주)에 비해, 단백질의 분비에 관한 기능을 담당하는 유전자에 변이가 존재하는 것으로 예측되고, 단백질의 분비 생산능이 최적 배양 조건하에서의 축적량으로서 약 2 내지 3배로 매우 높고, 숙주균으로서 적합하다(WO02/081694). AJ 12036은, 1984년 3월 26일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-734가 부여되어 있다.

또한, 코리네박테리움 써모아미노게네스 AJ 12340(FERM BP-1539)은, 1987년 3월 13일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-1539가 부여되어 있다. 또한, 브레비박테리움 플라붐 AJ 12418(FERM BP-2205)은, 1988년 12월 24일에 공업기술원 미생물공업기술연구소(현, 독립행정법인 제품평가기술기반기구 특허생물기탁센터, 우편번호: 292-0818, 주소: 니혼 치바켄 키사라즈시 카즈사카마타리 2-5-8 120호실)에 국제기탁으로서 원기탁되어, 수탁번호 FERM BP-2205가 부여되어 있다.

또한, 상술한 바와 같은 코리네형 세균을 친주로서, 돌연변이법이나 유전자 재조합법을 이용하여 단백질의 분비 생산능이 높아진 주(株)를 선발하여, 숙주로서 이용해도 좋다. 예를 들면, 자외선 조사 또는 N-메틸-N'-니트로소구아니딘 등의 화학 변이제에 의한 처리를 행한 후, 단백질의 분비 생산능이 높아진 주를 선발할 수 있다.

또한, 이러한 균주로부터 세포 표층 단백질을 생산하지 않도록 개변한 균주를 숙주로서 사용하면, 배지 중 또는 균체 표층에 분비된 이종 단백질의 정제가 용이해져, 특히 바람직하다. 이러한 개변은, 돌연변이법 또는 유전자 재조합법에 의해 염색체 위의 세포 표층 단백질의 코딩 영역 또는 그 발현 조절 영역에 변이를 도입함으로써 행할 수 있다. 세포 표층 단백질을 생산하지 않도록 개변된 코리네형 세균으로서는, C. 글루타미쿰 AJ 12036(FERM BP-734)의 세포 표층 단백질 PS2의 결손주인 C. 글루타미쿰 YDK010주(WO2004/029254)를 들 수 있다.

이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균은, 상술한 바와 같은 코리네형 세균에, 본 발명에 사용되는 유전자 구축물을 도입하여 유지시킴으로써 얻을 수 있다. 즉, 본 발명의 세균은, 예를 들면, 상술한 바와 같은 코리네형 세균에서 유래하는 개변주라도 좋다. 본 발명의 세균은, 구체적으로는, 예를 들면, C. 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 C. 글루타미쿰 ATCC 13869에서 유래하는 개변주라도 좋다. 또한, C. 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주는, C. 글루타미쿰 ATCC 13869에서 유래하는 개변주에도 해당한다. 본 발명에 사용되는 유전자 구축물이나 그 도입법에 대해서는 후술한다.

<1-2> 특정한 성질

본 발명의 세균은 특정한 성질을 갖도록 개변되어 있다. 특정한 성질을 갖도록 코리네형 세균을 개변함으로써, 이 세균의 이종 단백질을 분비 생산하는 능력을 향상시킬 수 있는, 즉, 이 세균에 의한 이종 단백질의 분비 생산을 증대시킬 수 있다.

본 발명의 세균은, 이종 단백질을 분비 생산하는 능력을 갖는 코리네형 세균을, 특정한 성질을 갖도록 개변함으로써 얻을 수 있다. 또한, 본 발명의 세균은, 특정한 성질을 갖도록 코리네형 세균을 개변한 후에, 이종 단백질을 분비 생산하는 능력을 부여함으로써도 얻을 수 있다. 본 발명에 있어서, 본 발명의 세균을 구축하기 위한 개변은 임의의 순서로 행할 수 있다. 또한, 본 발명의 세균의 구축에 사용되는, 특정한 성질을 갖도록 개변되기 전의 주는, 이종 단백질의 분비 발현용의 유전자 구축물을 갖는다고 가정한 경우에, 이종 단백질을 분비 생산할 수 있어도 좋고, 할 수 없어도 좋다. 즉, 본 발명의 세균은, 예를 들면, 특정한 성질을 갖도록 개변됨으로써 이종 단백질을 분비 생산하는 능력을 획득한 것이라도 좋다. 구체적으로는, 예를 들면, 본 발명의 세균은, 특정한 성질을 갖도록 개변되기 전에는 이종 단백질의 분비 발현용의 유전자 구축물을 갖고 있어도 이종 단백질을 분비 생산할 수 없었던 주로부터 얻어진 것으로서, 특정한 성질을 갖도록 개변됨으로써 이종 단백질을 분비 생산할 수 있게 된 것이라도 좋다.

「특정한 성질」이란, 하기 (A), (B), 및 (C)로부터 선택되는 2개 이상의 성질의 조합이다:

(A) RegX3 단백질의 활성이 저하되는 성질;

(B) HrrSA 시스템의 활성이 저하되는 성질;

(C) HrcA 단백질의 활성이 저하되는 성질.

상기 성질 (A) 내지 (C)에 있어서, 활성은 모두 비개변주에 비해 저하된다.

「특정한 성질」은, 구체적으로는, 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 상기 성질 (B)와 (C)의 조합, 또는 상기 성질 (A)와 (B)와 (C)의 조합이라도 좋다. 즉, 본 발명의 세균은, 예를 들면, 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖고 있어도 좋다. 또한, 본 발명의 세균은, 예를 들면, 상기 성질 (A)와 (B)와 (C)의 조합을 갖고 있어도 좋다. 바꿔 말하면, 본 발명의 세균은 상기 성질 (A)와 (B)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (C)를 갖고 있어도 좋다. 또한, 본 발명의 세균은 상기 성질 (A)와 (C)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (B)를 갖고 있어도 좋다. 또한, 본 발명의 세균은 상기 성질 (B)와 (C)의 조합을 갖고 있어도 좋고, 추가로, 상기 성질 (A)를 갖고 있어도 좋다.

<1-2-1> RegX3 단백질의 활성 저하

이하, RegX3 단백질 및 이를 코딩하는 regX3 유전자에 대하여 설명한다. RegX3 단백질은 SenX3-RegX3 시스템의 반응 조절인자이다. SenX3-RegX3 시스템은 2성분 제어계 중 하나이며, 환경 중의 자극에 대한 반응을 유도한다. SenX3-RegX3 시스템은, senX3 유전자에 코딩되는 센서 키나아제 SenX3과, regX3 유전자에 코딩되는 반응 조절인자 RegX3으로 이루어진다.

코리네형 세균이 갖는 regX3 유전자의 염기서열 및 이들에 코딩되는 RegX3 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 regX3 유전자의 염기서열, 및 이 유전자가 코딩하는 RegX3 단백질의 아미노산 서열을, 각각 서열번호 41 및 42에 나타낸다. 즉, regX3 유전자는, 예를 들면, 서열번호 41에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, RegX3 단백질은, 예를 들면, 서열번호 42에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 「(아미노산 또는 염기)서열을 갖는다」라는 표현은 특별히 기재하지 않는 한, 당해 「(아미노산 또는 염기)서열을 포함한다」는 것을 의미하고, 당해 「(아미노산 또는 염기)서열로 이루어진다」는 경우도 포함한다.

regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 regX3 유전자(예를 들면 서열번호 41에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, RegX3 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질(예를 들면 서열번호 42에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 이러한 원래의 기능이 유지된 변이체를 「보존적 변이체」라고 하는 경우가 있다. 본 발명에 있어서, 「regX3 유전자」라는 용어는 상기 예시한 regX3 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「RegX3 단백질」이라는 용어는 상기 예시한 RegX3 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 보존적 변이체로서는, 예를 들면, 상기 예시한 regX3 유전자나 RegX3 단백질의 동족체나 인위적인 개변체를 들 수 있다.

「원래의 기능이 유지되고 있다」란, 유전자 또는 단백질의 변이체가, 원래의 유전자 또는 단백질의 기능(예를 들면 활성이나 성질)에 대응하는 기능(예를 들면 활성이나 성질)을 갖는 것을 말한다. 즉, 「원래의 기능이 유지되고 있다」란, regX3 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 RegX3 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, RegX3 단백질에 있어서는, 단백질의 변이체가, RegX3 단백질로서의 기능(예를 들면, 서열번호 42에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, RegX3 단백질에 있어서는, 단백질의 변이체가, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「RegX3 단백질로서의 기능」이란, 구체적으로는, SenX3-RegX3 시스템의 반응 조절인자로서의 기능이라도 좋다. 「SenX3-RegX3 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 SenX3 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「SenX3-RegX3 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화된 SenX3 단백질로부터의 인산기 전이에 의해 활성화되고, 유전자의 발현을 제어(예를 들면, 유도 또는 억제)하는 기능이라도 좋다. SenX3 단백질로서는, 본 발명의 세균이 본래적으로 갖는 SenX3 단백질을 들 수 있다. C. 글루타미쿰 ATCC 13869의 senX3 유전자의 염기서열, 및 이 유전자가 코딩하는 SenX3 단백질의 아미노산 서열을, 각각 서열번호 39 및 40에 나타낸다. SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자로서는, 무기 인산의 결핍에 반응하는 유전자(예를 들면, pstSCAB, ugpAEBC, phoC, 및 ushA 유전자)나 NAD⁺의 생합성에 관여하는 유전자(예를 들면, ndnR-nadA-nadC-nadS 오페론 유전자)를 들 수 있다.

RegX3 단백질의 변이체가 SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시키고, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현이 저하되는지 여부를 확인함으로써 확인할 수 있다. 또한, RegX3 단백질의 변이체가 SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 regX3 유전자의 결손주에 도입하고, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현이 증대하는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 regX3 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 regX3 유전자 결손주를 사용할 수 있다.

이하, 보존적 변이체에 대해서 예시한다.

regX3 유전자의 동족체 또는 RegX3 단백질의 동족체는, 예를 들면, 상기 예시한 regX3 유전자의 염기서열 또는 상기 예시한 RegX3 단백질의 아미노산 서열을 질의 서열로서 사용한 BLAST 검색이나 FASTA 검색에 의해 공개 데이터 베이스로부터 용이하게 취득할 수 있다. 또한, regX3 유전자의 동족체는, 예를 들면, 코리네형 세균의 염색체를 주형으로 하여, 이들 공지된 regX3 유전자의 염기서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로서 사용하는 PCR에 의해 취득할 수 있다.

regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질의 아미노산 서열(예를 들면, 서열번호 42에 나타낸 아미노산 서열)에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한 상기 「1개 또는 여러 개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 다르지만, 구체적으로는, 예를 들면, 1 내지 50개, 1 내지 40개, 1 내지 30개, 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.

상기의 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가는, 단백질의 기능이 정상적으로 유지되는 보존적 변이이다. 보존적 변이의 대표적인 것은 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는 Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는 Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는 Gln, Asn 사이에서, 염기성 아미노산인 경우에는 Lys, Arg, His 사이에서, 산성 아미노산인 경우에는 Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는 Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환으로 간주되는 치환으로서는, 구체적으로는, Ala로부터 Ser 또는 Thr로의 치환, Arg로부터 Gln, His 또는 Lys로의 치환, Asn으로부터 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp로부터 Asn, Glu 또는 Gln으로의 치환, Cys로부터 Ser 또는 Ala로의 치환, Gln으로부터 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu로부터 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly로부터 Pro로의 치환, His로부터 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile로부터 Leu, Met, Val 또는 Phe로의 치환, Leu로부터 Ile, Met, Val 또는 Phe로의 치환, Lys로부터 Asn, Glu, Gln, His 또는 Arg로의 치환, Met로부터 Ile, Leu, Val 또는 Phe로의 치환, Phe로부터 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser로부터 Thr 또는 Ala로의 치환, Thr로부터 Ser 또는 Ala로의 치환, Trp로부터 Phe 또는 Tyr로의 치환, Tyr로부터 His, Phe 또는 Trp로의 치환, 및 Val로부터 Met, Ile 또는 Leu로의 치환을 들 수 있다. 또한, 상기한 바와 같은 아미노산의 치환, 결실, 삽입, 또는 부가에는, 유전자가 유래하는 세균의 개체 차이, 종의 차이에 근거한 경우 등 천연에서 발생하는 변이(mutant 또는 variant)에 의해 발생하는 것도 포함된다.

또한, regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 RegX3 단백질의 아미노산 서열(예를 들면, 서열번호 42에 나타낸 아미노산 서열) 전체에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.

또한, regX3 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 regX3 유전자의 염기서열(예를 들면, 서열번호 41에 나타낸 염기서열)의 상보 서열 또는 이 상보 서열로 제조될 수 있는 프로브와 엄격한 조건하에서 하이브리드화하는 DNA라도 좋다. 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 게시하면, 동일성이 높은 DNA끼리, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 DNA끼리 하이브리드화하고, 이보다 동일성이 낮은 DNA끼리 하이브리드화하지 않는 조건, 또는 통상의 서던 하이브리드화의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 60℃, 0.1×SSC, 0.1% SDS, 보다 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서 1회, 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.

상기 프로브는, 예를 들면, 유전자의 상보 서열의 일부라도 좋다. 이러한 프로브는, 공지된 유전자의 염기서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로 하고, 이들 염기서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 프로브로서는, 예를 들면, 300bp 정도 길이의 DNA 단편을 사용할 수 있다. 이 경우, 하이브리드화의 세정 조건으로서는 50℃, 2×SSC, 0.1% SDS를 들 수 있다.

또한, regX3 유전자는, 상기 예시한 regX3 유전자 또는 그 보존적 변이체의 염기서열에 있어서, 임의의 코돈을 그것과 등가의 코돈으로 치환한 염기서열을 갖는 것이라도 좋다.

또한, 아미노산 서열간의 「동일성」이란, blastp에 의해 디폴트 설정의 점수 파라미터 (행렬: BLOSUM62; 갭 비용: 기존 = 11, 확장 = 1; 조합 조정: 조건부 조합 점수 행렬조정)를 사용하여 산출되는 아미노산 서열간의 동일성을 의미한다. 또한, 염기서열간의 「동일성」이란, blastn에 의해 디폴트 설정의 점수 파라미터 (정합/부정합 점수 = 1,-2; 갭 비용 = 선형)를 사용하여 산출되는 염기서열간의 동일성을 의미한다.

또한, 상기의 유전자나 단백질의 변이체에 관한 기재는 SenX3 단백질, HrrSA 단백질, HrcA 단백질, PhoRS 단백질, 세포 표층 단백질, Tat계 분비 시스템, 본 발명에 있어서 분비 생산되는 이종 단백질 등의 임의의 단백질, 및 이들을 코딩하는 유전자에도 준용할 수 있다.

「RegX3 단백질의 활성이 저하된다」란, SenX3-RegX3 시스템의 반응 조절인자의 기능이 저하되는 것을 의미해도 좋다. 따라서, RegX3 단백질의 활성의 저하는, 구체적으로는, 예를 들면, SenX3-RegX3 시스템에 의해 발현이 유도되는 유전자의 발현의 저하를 지표로서 측정할 수 있다. 또한, 「RegX3 단백질의 활성이 저하된다」란, 특히, RegX3 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. RegX3 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. RegX3 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(regX3 유전자)의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써 저하시킬 수 있다. 또한, 2성분 제어계에 있어서는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달된다. 따라서, RegX3 단백질의 활성은, 예를 들면, SenX3 단백질의 자기 인산화된 히스티딘 잔기로부터 인산기가 전이하는, RegX3 단백질의 아스파르트산 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 당해 아스파르트산 잔기는, RegX3 단백질의 52 위치의 아스파르트산 잔기(D52)이다. 「RegX3 단백질의 D52」란, 구체적으로는, 서열번호 42의 D52에 상당하는 아스파르트산 잔기를 의미한다. 임의의 RegX3 단백질에서의 「RegX3 단백질의 D52」의 위치에 대해서는, 후술하는 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」의 위치에 관한 설명을 준용할 수 있다. 당해 아스파르트산 잔기는, 예를 들면, 단독으로, 또는 그 주변의 영역과 함께 치환 또는 결실되어도 좋다. 즉, 예를 들면, 당해 아스파르트산 잔기만 치환 또는 결실되어도 좋고, 당해 아스파르트산 잔기를 포함하는 영역이 치환 또는 결실되어도 좋다.

또한, 코리네형 세균의 종류에 따라서는, RegX3 단백질은 필수적일 수 있다. 예를 들면, C. 글루타미쿰 ATCC 13032에 있어서, RegX3 단백질은 필수인 것이 시사되어 있다. 본 발명의 세균에 있어서 RegX3 단백질이 필수인 경우에는, 적절히 RegX3 단백질의 활성을 잔존시킬 수 있다. 예를 들면, 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성의 일부를 잔존시켜도 좋다. 또한, 예를 들면, 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성을 완전하게 소실시키고, 별도로 본 발명의 세균이 본래적으로 갖는 RegX3 단백질의 활성보다도 낮은 수준으로 RegX3 단백질의 활성을 부여해도 좋다. RegX3 단백질의 활성은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다. 마찬가지로, regX3 유전자의 발현량은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다. 마찬가지로, RegX3 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주와 비교하여, 1% 이상, 5% 이상, 10% 이상, 15% 이상, 20% 이상, 30% 이상, 또는 50% 이상의 수준으로 잔존해도 좋다.

<1-2-2> HrrSA 시스템의 활성 저하

이하, HrrSA 시스템 및 이를 코딩하는 유전자에 대하여 설명한다. HrrSA 시스템은 2성분 제어계의 하나이며, 환경 중의 자극(예를 들면 헴의 존재)에 대한 반응을 유도한다. HrrSA 시스템은, hrrS 유전자에 코딩되는 센서 키나아제 HrrS와, hrrA 유전자에 코딩되는 반응 조절인자 HrrA로 이루어진다. hrrS 유전자 및 hrrA 유전자를 총칭하여 「hrrSA 유전자」라고도 한다. HrrS(HrrS 단백질) 및 HrrA(HrrA 단백질)을 총칭하여 「HrrSA 단백질」이라고도 한다.

코리네형 세균이 갖는 hrrSA 유전자의 염기서열 및 이들에 코딩되는 HrrSA 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 hrrS 유전자의 염기서열, 및 이 유전자가 코딩하는 HrrS 단백질의 아미노산 서열을, 각각 서열번호 43 및 44에 나타낸다. C. 글루타미쿰 ATCC 13869의 hrrA 유전자의 염기서열, 및 이 유전자가 코딩하는 HrrA 단백질의 아미노산 서열을, 각각 서열번호 45 및 46에 나타낸다. 즉, hrrSA 유전자는, 예를 들면, 각각 서열번호 43 및 45에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, HrrSA 단백질은, 예를 들면, 각각 서열번호 44 및 46에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다.

hrrSA 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 hrrSA 유전자(예를 들면 서열번호 43 또는 45에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, HrrSA 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 HrrSA 단백질(예를 들면 서열번호 44 또는 46에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 즉, 「hrrSA 유전자」라는 용어는 상기 예시한 hrrSA 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「HrrSA 단백질」이라는 용어는 상기 예시한 HrrSA 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. HrrSA 단백질 및 hrrSA 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, hrrSA 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.

또한, 「원래의 기능이 유지되고 있다」란, hrrSA 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 HrrSA 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrSA 단백질에 있어서는, 단백질의 변이체가, HrrSA 단백질로서의 기능(예를 들면, 서열번호 44 또는 46에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrS 단백질에 있어서는, 단백질의 변이체가, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrrA 단백질에 있어서는, 단백질의 변이체가, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「HrrSA 단백질로서의 기능」이란, 구체적으로는, 각각, HrrSA 시스템의 센서 키나아제로서의 기능 및 HrrSA 시스템의 반응 조절인자로서의 기능이라도 좋다. 「HrrSA 시스템의 센서 키나아제로서의 기능」이란, 구체적으로는, 반응 조절인자인 HrrA 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「HrrSA 시스템의 센서 키나아제로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화되고, 인산기 전이에 의해 HrrA 단백질을 활성화시키는 기능이라도 좋다. 「HrrSA 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 HrrS 단백질과 함께 환경 중의 자극에 대한 반응을 유도하는 기능이라도 좋다. 「HrrSA 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 자극을 감지하여 자기 인산화된 HrrS 단백질로부터의 인산기 전이에 의해 활성화되고, 유전자의 발현을 제어(예를 들면, 유도 또는 억제)하는 기능이라도 좋다. HrrSA 시스템에 의해 발현이 유도되는 유전자로서는, 헴의 분해에 관여하는 유전자(예를 들면, hmuO 유전자)나 호흡 사슬 중의 헴 함유 단백질을 코딩하는 유전자(예를 들면, ctaE-qcrCAB 오페론 유전자나 ctaD 유전자)를 들 수 있다. HrrSA 시스템에 의해 발현이 억제되는 유전자로서는, 헴의 생합성에 관여하는 유전자(예를 들면, hemE-hemY-hemL-cg0519-ccsX-ccdA-resB-resC 오페론 유전자, hemA-hemC 오페론 유전자, 및 hemH 유전자)를 들 수 있다.

HrrSA 단백질의 변이체가 HrrSA 시스템의 센서 키나아제 또는 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시켜, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 저하 또는 증대하는지 여부를 확인함으로써 확인할 수 있다. 또한, HrrS 단백질의 변이체가 HrrSA 시스템의 센서 키나아제로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrrS 유전자의 결손주에 도입하여, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 증대 또는 저하되는지 여부를 확인함으로써 확인할 수 있다. 또한, HrrA 단백질의 변이체가 HrrSA 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrrA 유전자의 결손주에 도입하여, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현이 헴의 존재 하에서 증대 또는 저하되는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 hrrS 유전자 또는 hrrA 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 hrrS 유전자 또는 hrrA 유전자의 결손주나, C. 글루타미쿰 ATCC 13032주의 hrrS 유전자 또는 hrrA 유전자의 결손주를 사용할 수 있다.

「HrrSA 시스템의 활성이 저하된다」란, 환경 중의 자극에 대한 HrrSA 시스템을 통해 유도되는 반응의 정도가 저하되는 것을 의미해도 좋다. HrrSA 시스템의 활성은, 예를 들면, HrrS 단백질 및/또는 HrrA 단백질(즉 HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽)의 활성을 저하시킴으로써 저하시킬 수 있다. 즉, 「HrrSA 시스템의 활성이 저하된다」란, HrrS 단백질 및/또는 HrrA 단백질의 활성이 저하되는 것을 의미해도 좋다. 본 발명에 있어서는, 예를 들면, 적어도 HrrA 단백질의 활성이 저하되어도 좋다. 「HrrS 단백질의 활성이 저하된다」란, HrrSA 시스템의 센서 키나아제의 기능이 저하되는 것을 의미해도 좋다. 「HrrA 단백질의 활성이 저하된다」란, HrrSA 시스템의 반응 조절인자의 기능이 저하되는 것을 의미해도 좋다. 따라서, HrrSA 시스템, HrrS 단백질, 또는 HrrA 단백질의 활성의 저하는, 구체적으로는, 예를 들면, 헴의 존재 하에서의, HrrSA 시스템에 의해 발현이 유도 또는 억제되는 유전자의 발현의 저하 또는 증대를 지표로서 측정할 수 있다. 또한, 「HrrSA 시스템의 활성이 저하된다」란, 특히, HrrSA 시스템의 세포당 분자수가 저하되는 것을 의미해도 좋다. 마찬가지로, 「HrrS 단백질 및/또는 HrrA 단백질의 활성이 저하된다」란, 특히, HrrS 단백질 및/또는 HrrA 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. HrrSA 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. HrrSA 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(hrrSA 유전자)의 발현을 저하시킴으로써, 또는 hrrSA 유전자를 파괴함으로써 저하시킬 수 있다. 또한, 2성분 제어계에 있어서는, 센서 키나아제가 자극을 감지하면 특정한 히스티딘 잔기가 자기 인산화되고, 그 인산기가 반응 조절인자의 특정한 아스파르트산 잔기로 전이함으로써 신호가 전달된다. 따라서, HrrSA 시스템의 활성, 구체적으로 HrrS 단백질의 활성은, 예를 들면, HrrS 단백질의 자기 인산화되는 히스티딘 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 또한, HrrSA 시스템의 활성, 구체적으로 HrrA 단백질의 활성은, 예를 들면, HrrS 단백질의 자기 인산화된 히스티딘 잔기로부터 인산기가 전이하는, HrrA 단백질의 아스파르트산 잔기를 치환 또는 결실함으로써도 저하시킬 수 있다. 당해 히스티딘 잔기는, HrrS 단백질의 217 위치의 히스티딘 잔기(H217)이다. 「HrrS 단백질의 H217」이란, 구체적으로는, 서열번호 44의 H217에 상당하는 히스티딘 잔기를 의미한다. 당해 아스파르트산 잔기는, HrrA 단백질의 54 위치의 아스파르트산 잔기(D54)이다. 「HrrA 단백질의 D54」란, 구체적으로는, 서열번호 44의 D54에 상당하는 아스파르트산 잔기를 의미한다. 임의의 HrrSA 단백질에서의 「HrrS 단백질의 H217」 또는 「HrrA 단백질의 D54」의 위치에 대해서는, 후술하는 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」의 위치에 관한 설명을 준용할 수 있다. 당해 히스티딘 잔기 또는 아스파르트산 잔기는, 예를 들면, 단독으로, 또는 그 주변의 영역과 함께 치환 또는 결실되어도 좋다. 즉, 예를 들면, 당해 히스티딘 잔기 또는 아스파르트산 잔기만 치환 또는 결실되어도 좋고, 당해 히스티딘 잔기 또는 아스파르트산 잔기를 포함하는 영역이 치환 또는 결실되어도 좋다.

<1-2-3> HrcA 단백질의 활성 저하

이하, HrcA 단백질 및 이를 코딩하는 hrcA 유전자에 대하여 설명한다. HrcA 단백질은 열 충격 단백질의 전사 억제자이다.

코리네형 세균이 갖는 hrcA 유전자의 염기서열 및 이들에 코딩되는 HrcA 단백질의 아미노산 서열은, 예를 들면, NCBI(미국 국립 생물공학 정보센터) 등의 공개 데이터 베이스로부터 취득할 수 있다. C. 글루타미쿰 ATCC 13869의 hrcA 유전자의 염기서열, 및 이 유전자가 코딩하는 HrcA 단백질의 아미노산 서열을, 각각 서열번호 47 및 48에 나타낸다. 즉, hrcA 유전자는, 예를 들면, 서열번호 47에 나타낸 염기서열을 갖는 유전자라도 좋다. 또한, HrcA 단백질은, 예를 들면, 서열번호 48에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다.

hrcA 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 hrcA 유전자(예를 들면 서열번호 47에 나타낸 염기서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, HrcA 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 HrcA 단백질(예를 들면 서열번호 48에 나타낸 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 즉, 「hrcA 유전자」라는 용어는 상기 예시한 hrcA 유전자에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. 마찬가지로, 「HrcA 단백질」이라는 용어는 상기 예시한 HrcA 단백질에 한정되지 않고, 그 보존적 변이체도 포함하는 것으로 한다. HrcA 단백질 및 hrcA 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, hrcA 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.

또한, 「원래의 기능이 유지되고 있다」란, hrcA 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질(즉 HrcA 단백질)을 코딩하는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrcA 단백질에 있어서는, 단백질의 변이체가, HrcA 단백질로서의 기능(예를 들면, 서열번호 48에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, HrcA 단백질에 있어서는, 단백질의 변이체가, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 것이라도 좋다. 즉, 「HrcA 단백질로서의 기능」이란, 구체적으로는, 열 충격 단백질의 전사 억제자로서의 기능이라도 좋다. 「열 충격 단백질의 전사 억제자로서의 기능」이란, 구체적으로는, 열 충격 단백질을 코딩하는 유전자(열 충격 유전자)의 전사를 억제하는 기능이라도 좋다. HrcA 단백질에 의해 전사가 억제되는 열 충격 유전자로서는, groEL1 유전자나 groEL2 유전자 등의 groEL 유전자나, groES 유전자를 들 수 있다.

HrcA 단백질의 변이체가 열 충격 단백질의 전사 억제자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체의 활성을 코리네형 세균에 있어서 저하시켜, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)가 증대하는지 여부를 확인함으로써 확인할 수 있다. 또한, HrcA 단백질의 변이체가 열 충격 단백질의 전사 억제자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 hrcA 유전자의 결손주에 도입하여, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)가 저하되는지 여부를 확인함으로써 확인할 수 있다. 코리네형 세균의 hrcA 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 hrcA 유전자 결손주를 사용할 수 있다.

「HrcA 단백질의 활성이 저하된다」란, 열 충격 단백질의 전사 억제자의 기능이 저하되는 것을 의미해도 좋다. 따라서, HrcA 단백질의 활성의 저하는, 구체적으로는, 예를 들면, groEL 유전자나 groES 유전자 등의 열 충격 유전자의 전사(발현)의 증대를 지표로서 측정할 수 있다. 또한, 「HrcA 단백질의 활성이 저하된다」란, 특히, HrcA 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. HrcA 단백질 등의 단백질의 활성을 저하시키는 방법에 대해서는 후술한다. HrcA 단백질의 활성은, 예를 들면, 이 단백질을 코딩하는 유전자(hrcA 유전자)의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써 저하시킬 수 있다.

<1-3> 그 외의 성질

본 발명의 세균은 이종 단백질을 분비 생산할 수 있는 한, 원하는 성질을 갖고 있어도 좋다. 예를 들면, 본 발명의 세균은, 세포 표층 단백질의 활성이 저하되어 있어도 좋다(WO2013/065869, WO2013/065772, WO2013/118544, WO2013/062029). 예를 들면, 본 발명의 세균은, 페니실린 결합 단백질의 활성이 저하되도록 개변되어 있어도 좋다(WO2013/065869). 예를 들면, 본 발명의 세균은, 메탈로펩티다아제를 코딩하는 유전자의 발현이 상승하도록 개변되어 있어도 좋다(WO2013/065772). 예를 들면, 본 발명의 세균은, 변이형 리보솜 단백질 S1 유전자(변이형 rpsA 유전자)를 갖도록 개변되어 있어도 좋다(WO2013/118544). 예를 들면, 본 발명의 세균은, 변이형 phoS 유전자를 갖도록 개변되어 있어도 좋다(WO2016/171224). 예를 들면, 본 발명의 세균은, Tat계 분비 시스템이 증강되어 있어도 좋다. 이들의 성질 또는 개변은 단독으로, 또는 적절히 조합하여 이용할 수 있다.

<1-3-1> 변이형 phoS 유전자의 도입

본 발명의 세균은, 변이형 phoS 유전자를 유지하도록 개변되어 있어도 좋다. 「변이형 phoS 유전자를 유지한다」는 것을, 「변이형 phoS 유전자를 갖는다」 또는 「phoS 유전자에 변이를 갖는다」라고도 한다. 또한, 「변이형 phoS 유전자를 유지한다」는 것을, 「변이형 PhoS 단백질을 갖는다」 또는 「PhoS 단백질에 변이를 갖는다」라고도 한다.

이하, phoS 유전자 및 PhoS 단백질에 대하여 설명한다. phoS 유전자는, PhoRS 시스템의 센서 키나아제인 PhoS 단백질을 코딩하는 유전자이다. PhoRS 시스템은 2성분 제어계의 하나이며, 환경 중의 인산 결핍에 대한 반응을 유도한다. PhoRS 시스템은, phoS 유전자에 코딩되는 센서 키나아제 PhoS와, phoR 유전자에 코딩되는 반응 조절인자 PhoR로 이루어진다.

본 발명에 있어서, 「특정한 변이」를 갖는 PhoS 단백질을 「변이형 PhoS 단백질」, 이를 코딩하는 유전자를 「변이형 phoS 유전자」라고도 한다. 「변이형 phoS 유전자」는, 바꿔 말하면, 「특정한 변이」를 갖는 phoS 유전자이다. 또한, 본 발명에 있어서, 「특정한 변이」를 갖지 않는 PhoS 단백질을 「야생형 PhoS 단백질」, 이를 코딩하는 유전자를 「야생형 phoS 유전자」라고도 한다. 「야생형 phoS 유전자」는, 바꿔 말하면, 「특정한 변이」를 갖지 않는 phoS 유전자이다. 또한, 여기서 말하는 「야생형」이란, 「변이형」과 구별하기 위한 편의상의 기재이며, 「특정한 변이」를 갖지 않는 한, 천연에서 얻어지는 것에만 한정되지 않는다. 「특정한 변이」에 대해서는 후술한다.

야생형 phoS 유전자로서는, 예를 들면, 코리네형 세균의 phoS 유전자를 들 수 있다. 코리네형 세균의 phoS 유전자로서, 구체적으로는, 예를 들면, C. 글루타미쿰 YDK010주, C. 글루타미쿰 ATCC 13032주, C. 글루타미쿰 ATCC 14067주, C. 칼루나에, C. 크레나툼 및 C. 에피시엔스의 phoS 유전자를 들 수 있다. C. 글루타미쿰 YDK010주의 phoS 유전자의 염기서열을 서열번호 1에 나타낸다. 또한, 이들 phoS 유전자가 코딩하는 야생형 PhoS 단백질의 아미노산 서열을, 각각 서열번호 2 내지 7에 나타낸다.

야생형 phoS 유전자는 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 phoS 유전자의 변이체라도 좋다. 마찬가지로, 야생형 PhoS 단백질은 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 야생형 PhoS 단백질의 변이체라도 좋다. 즉, 「야생형 phoS 유전자」라는 용어는 상기 예시한 야생형 phoS 유전자에만 한정되지 않고, 그 보존적 변이체로서 「특정한 변이」를 갖지 않는 것도 포함하는 것으로 한다. 마찬가지로, 「야생형 PhoS 단백질」이라는 용어는 상기 예시한 야생형 PhoS 단백질에만 한정되지 않고, 그 보존적 변이체로서 「특정한 변이」를 갖지 않는 것도 포함하는 것으로 한다. 야생형 PhoS 단백질 및 야생형 phoS 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 야생형 phoS 유전자는 「특정한 변이」를 갖지 않으며, 또한, 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다.

또한, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 단백질에 있어서는, 단백질의 변이체가, PhoS 단백질로서의 기능(예를 들면, 서열번호 2 내지 7에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 야생형 PhoS 단백질에 있어서는, 단백질의 변이체가, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 것이라도 좋다. 즉, 「PhoS 단백질로서의 기능」이란, 구체적으로는, PhoRS 시스템의 센서 키나아제로서의 기능이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 구체적으로는, 반응 조절인자인 PhoR 단백질과 함께 환경 중의 인산 결핍에 대한 반응을 유도하는 기능이라도 좋다. 「PhoRS 시스템의 센서 키나아제로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화되고, 인산기 전이에 의해 PhoR 단백질을 활성화시키는 기능이라도 좋다.

PhoS 단백질의 변이체가 PhoRS 시스템의 센서 키나아제로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 phoS 유전자의 결손주에 도입하여, 인산 결핍에 대한 반응성이 보완되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 반응성의 보완은, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건에서 발현이 유도되는 것으로 알려져 있는 유전자의 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732(2006)). 코리네형 세균의 phoS 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 phoS 유전자 결손주나, C. 글루타미쿰 ATCC 13032주의 phoS 유전자 결손주를 사용할 수 있다.

야생형 PhoS 단백질에 있어서는, 자기 인산화되는 히스티딘 잔기가 보존되어 있는 것이 바람직하다. 즉, 보존적 변이는, 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기에서 발생하는 것이 바람직하다. 「자기 인산화되는 히스티딘 잔기」란, 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 또한, 야생형 PhoS 단백질은, 예를 들면, 상기 예시한 야생형 PhoS 단백질의 보존 서열을 갖는 것이 바람직하다. 즉, 보존적 변이는, 예를 들면, 상기 예시한 야생형 PhoS 단백질에 있어서 보존되고 있지 않은 아미노산 잔기에서 발생하는 것이 바람직하다.

변이형 PhoS 단백질은, 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「특정한 변이」를 갖는다.

즉, 바꿔 말하면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에는, 상기 예시한 야생형 PhoS 단백질이나 그 보존적 변이체와 동일해도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열에 있어서, 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 「특정한 변이」를 갖는 것 이외에, 서열번호 2 내지 7에 나타낸 아미노산 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 보다 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 단백질이라도 좋다.

즉, 바꿔 말하면, 변이형 PhoS 단백질은 상기 예시한 야생형 PhoS 단백질에 있어서, 「특정한 변이」를 갖고, 또한, 당해 「특정한 변이」 이외의 개소에 추가로 보존적 변이를 포함하는 변이체라도 좋다. 구체적으로는, 예를 들면, 변이형 PhoS 단백질은 서열번호 2 내지 7에 나타낸 아미노산 서열에 있어서, 「특정한 변이」를 갖고, 또한, 당해 「특정한 변이」 이외의 개소에 추가로 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 갖는 단백질이라도 좋다.

변이형 phoS 유전자는, 상기와 같은 변이형 PhoS 단백질을 코딩하는 한, 특별히 제한되지 않는다.

이하, 변이형 PhoS 단백질이 갖는 「특정한 변이」에 대하여 설명한다.

「특정한 변이」는, 상술한 바와 같은 야생형 PhoS 단백질의 아미노산 서열이 변화되는 것이며, 또한, 이종 단백질의 분비 생산에 유효한 것이면 특별히 제한되지 않는다.

「특정한 변이」는, 이종 단백질의 분비 생산량을 향상시키는 변이인 것이 바람직하다. 「이종 단백질의 분비 생산량을 향상시킨다」란, 변이형 phoS 유전자를 갖도록 개변된 코리네형 세균(개변주)이, 비개변주보다도 많은 양의 이종 단백질을 분비 생산할 수 있는 것을 말한다. 「비개변주」란, phoS 유전자에 변이를 갖지 않는 대조주, 즉 변이형 phoS 유전자를 갖지 않는 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주의, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더 바람직하게는 1.3배 이상, 더 바람직하게는 2배 이상, 특히 바람직하게는 5배 이상의 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 농축되어 있지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축되어 있지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다. 또한, 「이종 단백질의 분비 생산량을 향상시킨다」란, 모든 이종 단백질의 분비 생산량이 향상될 필요는 없고, 분비 생산의 타겟으로서 설정한 이종 단백질의 분비 생산량이 향상되면 충분하다. 「이종 단백질의 분비 생산량을 향상시킨다」란, 구체적으로는, 예를 들면, 실시예에 기재된 이종 단백질의 분비 생산량을 향상시키는 것을 의미해도 좋다.

어떤 변이가 이종 단백질의 분비 생산량을 향상시키는 변이인지 여부는, 예를 들면, 코리네형 세균에 속하는 균주를 기초로 당해 변이를 갖는 PhoS 단백질을 코딩하는 유전자를 갖도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하여, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.

아미노산 서열의 변화로서는 아미노산 잔기의 치환이 바람직하다. 즉, 「특정한 변이」는, 야생형 PhoS 단백질 중 어느 하나의 아미노산 잔기가 다른 아미노산 잔기로 치환되는 것인 것이 바람직하다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는 1잔기라도 좋고, 2잔기 또는 그 이상의 조합이라도 좋다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 아미노산 잔기라도 좋다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 보다 바람직하게는 자기 인산화되는 히스티딘 잔기 이외의 HisKA 도메인의 아미노산 잔기라도 좋다. 「자기 인산화되는 히스티딘 잔기」란, 야생형 PhoS 단백질의 276 위치의 히스티딘 잔기를 가리킨다. 「HisKA 도메인」이란, 야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다. 「특정한 변이」에 의해 치환이 발생하는 아미노산 잔기는, 특히 바람직하게는 야생형 PhoS 단백질의 302 위치의 트립토판 잔기(W302)라도 좋다.

상기 변이에 있어서, 치환 후의 아미노산 잔기로서는, K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), W(Trp), Y(Tyr), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln) 중, 원래의 아미노산 잔기 이외의 것을 들 수 있다. 치환 후의 아미노산 잔기로서는, 예를 들면, 이종 단백질의 분비 생산량이 향상되는 것을 선택할 수 있다.

W302가 치환될 경우, 치환 후의 아미노산 잔기로서는, 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기를 들 수 있다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 구체적으로는, K(Lys), R(Arg), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), C(Cys), M(Met), D(Asp), E(Glu), N(Asn), Q(Gln)을 들 수 있다. 「방향족 아미노산 및 히스티딘 이외의 아미노산 잔기」로서, 더 구체적으로는, K(Lys), A(Ala), V(Val), S(Ser), C(Cys), M(Met), D(Asp), N(Asn)을 들 수 있다.

또한, phoS 유전자에서의 「특정한 변이」란, 코딩하는 PhoS 단백질에 상기와 같은 「특정한 변이」를 발생시키는 염기서열상의 변이를 의미한다.

본 발명에 있어서, 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」란, 서열번호 2의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 예를 들면, 「W302」란, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 의미한다. 상기 아미노산 잔기의 위치는 상대적인 위치를 나타내는 것으로서, 아미노산의 결실, 삽입, 부가 등에 의해 그 절대적인 위치는 전후(前後)하는 경우가 있다. 예를 들면, 서열번호 2에 나타낸 아미노산 서열로 이루어지는 야생형 PhoS 단백질에 있어서, X 위치보다도 N 말단측의 위치에서 1 아미노산 잔기가 결실된, 또는 삽입된 경우, 원래의 X 위치의 아미노산 잔기는, 각각, N 말단으로부터 세어 X-1번째 또는 X+1번째의 아미노산 잔기가 되지만, 「야생형 PhoS 단백질의 X 위치의 아미노산 잔기」로 간주된다. 구체적으로는, 예를 들면, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「W302」는 각각 302 위치, 302 위치, 302 위치, 321 위치, 275 위치, 및 286 위치의 트립토판 잔기를 가리킨다. 또한, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「야생형 PhoS 단백질의 276 위치의 히스티딘 잔기(자기 인산화되는 히스티딘 잔기)」는 각각 276 위치, 276 위치, 276 위치, 295 위치, 249 위치, 및 260 위치의 히스티딘 잔기를 가리킨다. 또한, 서열번호 2 내지 7에 나타낸 야생형 PhoS 단백질의 아미노산 서열에 있어서, 「야생형 PhoS 단백질의 266 내지 330 위치의 아미노산 잔기로 이루어지는 영역(HisKA 도메인)」은 각각 266 내지 330 위치, 266 내지 330 위치, 266 내지 330 위치, 285 내지 349 위치, 239 내지 303 위치, 및 250 내지 314 위치의 아미노산 잔기로 이루어지는 영역을 가리킨다.

또한, 여기서 말하는 「Ｗ302」는 통상 트립토판 잔기이지만, 트립토판 잔기가 아니어도 좋다. 즉, 야생형 PhoS 단백질이 서열번호 2 내지 7에 나타낸 아미노산 서열 이외의 아미노산 서열을 갖는 경우에는, 「W302」는 트립토판 잔기가 아닌 경우가 있을 수 있다. 따라서, 예를 들면, 「W302가 시스테인 잔기로 치환되는 변이」에는, 「W302」가 트립토판 잔기인 경우에 당해 트립토판 잔기가 시스테인 잔기로 치환되는 변이에 한정되지 않고, 「W302」가 K(Lys), R(Arg), H(His), A(Ala), V(Val), L(Leu), I(Ile), G(Gly), S(Ser), T(Thr), P(Pro), F(Phe), Y(Tyr), M(Met), D(Asp), E (Glu), N(Asn), 또는 Q(Gln)인 경우에 당해 아미노산 잔기가 시스테인 잔기로 치환되는 변이도 포함된다. 다른 변이에 대해서도 마찬가지이다.

임의의 PhoS 단백질의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 2에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 PhoS 단백질의 아미노산 서열과 서열번호 2의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다. 정렬은, 예를 들면, 공지된 유전자 분석 소프트웨어를 이용하여 행할 수 있다. 구체적인 소프트웨어로서는, 히타치 솔루션즈 제조의 DNASIS나, 제네틱스 제조의 GENETYX 등을 들 수 있다(Elizabeth C. Tyler et al., Computers and Biomedical Research, 24(1), 72-96, 1991; Barton GJ et al., Journal of molecular biology, 198(2), 327-37. 1987).

변이형 phoS 유전자는, 예를 들면, 야생형 phoS 유전자를, 코딩되는 PhoS 단백질이 상기한 「특정한 변이」를 갖도록 개변함으로써 취득할 수 있다. 개변시킬 야생형 phoS 유전자는, 예를 들면, 야생형 phoS 유전자를 갖는 생물로부터의 클로닝에 의해, 또는 화학 합성에 의해 취득할 수 있다. 또한, 변이형 phoS 유전자는 야생형 phoS 유전자를 사용하지 않고 취득할 수도 있다. 예를 들면, 화학 합성에 의해 변이형 phoS 유전자를 직접 취득해도 좋다. 취득한 변이형 phoS 유전자를 추가로 개변하여 이용해도 좋다.

유전자의 개변은 공지된 수법에 의해 행할 수 있다. 예를 들면, 부위 특이적 변이법에 의해, DNA의 목적의 부위에 목적의 변이를 도입할 수 있다. 부위 특이적 변이법으로서는, PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H. A. Eds., Stockton press(1989); Carter, P., Meth. in Enzymol., 154, 382(1987))이나, 파지(phage)를 사용하는 방법(Kramer, W. and Frits, H. J., Meth. in Enzymol., 154, 350(1987); Kunkel, T. A. et al., Meth. in Enzymol., 154, 367(1987))을 들 수 있다.

이하, 변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 수법에 대하여 설명한다.

변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 변이형 phoS 유전자를 코리네형 세균에 도입함으로써 달성할 수 있다. 또한, 변이형 phoS 유전자를 갖도록 코리네형 세균을 개변하는 것은, 코리네형 세균의 염색체상의 phoS 유전자에 상기한 「특정한 변이」를 도입함으로써도 달성할 수 있다. 염색체상의 유전자로의 변이 도입은 자연 변이, 변이유발 처리, 또는 유전자 공학적 수법에 의해 달성할 수 있다.

변이형 phoS 유전자를 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 본 발명의 세균에 있어서, 변이형 phoS 유전자는, 코리네형 세균에서 기능하는 프로모터의 제어 하에서 발현 가능하게 유지되어 있으면 좋다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 phoS 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 본 발명의 세균에 있어서, 변이형 phoS 유전자는, 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 위에 존재하고 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 본 발명의 세균은, 변이형 phoS 유전자를 1카피만 갖고 있어도 좋고, 2 이상의 카피를 갖고 있어도 좋다. 본 발명의 세균은 1종류의 변이형 phoS 유전자만 갖고 있어도 좋고, 2 이상의 종류의 변이형 phoS 유전자를 갖고 있어도 좋다. 변이형 phoS 유전자의 도입은, 예를 들면, 후술하는, 유전자의 발현을 상승시키는 수법에서의 유전자의 도입이나, 본 발명에 사용되는 유전자 구축물의 도입과 마찬가지로 행할 수 있다.

본 발명의 세균은 야생형 phoS 유전자를 갖고 있어도 좋고, 갖고 있지 않아도 좋지만, 갖고 있지 않은 것이 바람직하다.

야생형 phoS 유전자를 갖지 않는 코리네형 세균은, 염색체상의 야생형 phoS 유전자를 파괴함으로써 취득할 수 있다. 야생형 phoS 유전자의 파괴는 공지된 수법에 의해 행할 수 있다. 구체적으로는, 예를 들면, 야생형 phoS 유전자의 프로모터 영역 및/또는 코딩 영역의 일부 또는 전부를 결손시킴으로써 야생형 phoS 유전자를 파괴할 수 있다.

또한, 염색체상의 야생형 phoS 유전자를 변이형 phoS 유전자로 치환함으로써, 야생형 phoS 유전자를 갖지 않고, 또한, 변이형 phoS 유전자를 갖도록 개변된 코리네형 세균을 취득할 수 있다. 이러한 유전자 치환을 행하는 방법으로서는, 예를 들면, 「Red 구동형 통합(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)), Red 구동형 통합법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법 등을 들 수 있다(미국특허 제6303383호, 일본 공개특허공보 특개평05-007491호).

PhoS 단백질은 반응 조절인자인 PhoR 단백질과 함께 기능하는, 즉 환경 중의 인산 결핍에 대한 반응을 유도한다. 따라서, 본 발명의 세균은, 변이형 PhoS 단백질이 기능하도록 phoR 유전자를 갖는다. phoR 유전자는, PhoRS 시스템의 반응 조절인자인 PhoR 단백질을 코딩하는 유전자이다. 「phoR 유전자를 갖는다」는 것을, 「PhoR 단백질을 갖는다」라고도 한다. 통상, 본 발명의 세균이 본래적으로 갖는 PhoR 단백질이 변이형 PhoS 단백질과 함께 기능하면 충분하다. 한편, 본 발명의 세균에는, 본 발명의 세균이 본래적으로 갖는 phoR 유전자 이외에, 또는 그를 대신하여, 적당한 phoR 유전자가 도입되어 있어도 좋다. 도입되는 phoR 유전자는, 변이형 PhoS 단백질과 함께 기능하는 PhoR 단백질을 코딩하는 것이면 특별히 제한되지 않는다.

phoR 유전자로서는, 예를 들면, 코리네형 세균의 phoR 유전자를 들 수 있다. 코리네형 세균의 phoR 유전자로서, 구체적으로는, 예를 들면, C. 글루타미쿰 YDK010주, C. 글루타미쿰 ATCC 13032주, C. 글루타미쿰 ATCC 14067주, C. 칼루나에, C. 크레나툼, 및 C. 에피시엔스의 phoR 유전자를 들 수 있다. C. 글루타미쿰 ATCC 13032주의 phoR 유전자의 염기서열 및 PhoR 단백질의 아미노산 서열을, 각각, 서열번호 8 및 9에 나타낸다.

phoR 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 phoR 유전자의 변이체라도 좋다. 마찬가지로, PhoR 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 PhoR 단백질의 변이체라도 좋다. 즉, 「phoR 유전자」라는 용어에는, 상기 예시한 phoR 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「PhoR 단백질」이라는 용어에는 상기 예시한 PhoR 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. PhoR 단백질 및 phoR 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, phoR 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, PhoR 단백질에 있어서는, 단백질의 변이체가, PhoR 단백질로서의 기능(예를 들면, 서열번호 9에 나타낸 아미노산 서열로 이루어지는 단백질의 기능)을 갖는 것이라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, PhoR 단백질에 있어서는, 단백질의 변이체가, PhoRS 시스템의 반응 조절인자로서의 기능을 갖는 것이라도 좋다. 즉, 「PhoR 단백질로서의 기능」이란, 구체적으로는, PhoRS 시스템의 반응 조절인자로서의 기능이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 구체적으로는, 센서 키나아제인 PhoS 단백질과 함께 환경 중의 인산 결핍에 대한 반응을 유도하는 기능이라도 좋다. 「PhoRS 시스템의 반응 조절인자로서의 기능」이란, 더 구체적으로는, 환경 중의 인산 결핍을 감지하여 자기 인산화된 PhoS 단백질로부터의 인산기 전이에 의해 활성화되고, 환경 중의 인산 결핍에 반응하는 유전자의 발현을 제어하는 기능이라도 좋다.

PhoR 단백질의 변이체가 PhoRS 시스템의 반응 조절인자로서의 기능을 갖는지 여부는, 예를 들면, 이 변이체를 코딩하는 유전자를 코리네형 세균의 phoR 유전자의 결손주에 도입하고, 인산 결핍에 대한 반응성이 보완되는지 여부를 확인함으로써 확인할 수 있다. 인산 결핍에 대한 반응성의 보완은, 예를 들면, 인산 결핍 조건에서의 생육의 향상으로서, 또는 인산 결핍 조건에서 발현이 유도되는 것으로 알려져 있는 유전자의 발현의 유도로서 검출할 수 있다(J. Bacteriol., 188, 724-732(2006)). 코리네형 세균의 phoR 유전자의 결손주로서는, 예를 들면, C. 글루타미쿰 YDK010주의 phoR 유전자 결손주나, C. 글루타미쿰 ATCC 13032주의 phoR 유전자 결손주를 사용할 수 있다.

<1-3-2> 세포 표층 단백질의 활성 저하

본 발명의 세균은 세포 표층 단백질의 활성이 저하되어 있는 것이라도 좋다. 본 발명의 세균은, 구체적으로는, 세포 표층 단백질의 활성이 비개변주와 비교하여 저하되어 있는 것이라도 좋다. 「세포 표층 단백질의 활성이 저하된다」란, 특히, 세포 표층 단백질의 세포당 분자수가 저하되는 것을 의미해도 좋다. 이하에, 세포 표층 단백질 및 이를 코딩하는 유전자에 대하여 설명한다.

세포 표층 단백질은, 세균이나 고세균의 세포 표층(S층)을 구성하는 단백질이다. 코리네형 세균의 세포 표층 단백질로서는, C. 글루타미쿰의 PS1 및 PS2(CspB)(일본 공개특허공보 특표평6-502548), 및 C. 스타티오니스의 SlpA(CspA)(일본 공개특허공보 특개평10-108675)를 들 수 있다. 이들 중에서는, PS2 단백질의 활성을 저하시키는 것이 바람직하다.

C. 글루타미쿰 ATCC 13869의 cspB 유전자의 염기서열 및 이 유전자가 코딩하는 PS2 단백질(CspB 단백질)의 아미노산 서열을 각각 서열번호 10 및 11에 나타낸다.

또한, 예를 들면, 28주의 C. 글루타미쿰에 대하여, CspB 동족체의 아미노산 서열이 보고되어 있다(J Biotechnol., 112, 177-193(2004)). 이들 28주의 C. 글루타미쿰과 cspB 유전자 동족체의 NCBI 데이터 베이스의 GenBank 등록번호를 이하에 예시한다(괄호 안이 GenBank 등록번호를 나타낸다).

C. 글루타미쿰 ATCC 13058(AY524990)

C. 글루타미쿰 ATCC 13744(AY524991)

C. 글루타미쿰 ATCC 13745(AY524992)

C. 글루타미쿰 ATCC 14017(AY524993)

C. 글루타미쿰 ATCC 14020(AY525009)

C. 글루타미쿰 ATCC 14067(AY524994)

C. 글루타미쿰 ATCC 14068(AY525010)

C. 글루타미쿰 ATCC 14747(AY525011)

C. 글루타미쿰 ATCC 14751(AY524995)

C. 글루타미쿰 ATCC 14752(AY524996)

C. 글루타미쿰 ATCC 14915(AY524997)

C. 글루타미쿰 ATCC 15243(AY524998)

C. 글루타미쿰 ATCC 15354(AY524999)

C. 글루타미쿰 ATCC 17965(AY525000)

C. 글루타미쿰 ATCC 17966(AY525001)

C. 글루타미쿰 ATCC 19223(AY525002)

C. 글루타미쿰 ATCC 19240(AY525012)

C. 글루타미쿰 ATCC21341(AY525003)

C. 글루타미쿰 ATCC21645(AY525004)

C. 글루타미쿰 ATCC31808(AY525013)

C. 글루타미쿰 ATCC31830(AY525007)

C. 글루타미쿰 ATCC31832(AY525008)

C. 글루타미쿰 LP-6(AY525014)

C. 글루타미쿰 DSM20137(AY525015)

C. 글루타미쿰 DSM20598(AY525016)

C. 글루타미쿰 DSM46307(AY525017)

C. 글루타미쿰 22220(AY525005)

C. 글루타미쿰 22243(AY525006)

코리네형 세균이 속하는 종 또는 균주에 의해, 세포 표층 단백질을 코딩하는 유전자의 염기서열에 차이가 존재하는 경우가 있기 때문에, 세포 표층 단백질을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질을 코딩하는 유전자의 변이체라도 좋다. 마찬가지로, 세포 표층 단백질은 원래의 기능이 유지되고 있는 한, 상기 예시한 세포 표층 단백질의 변이체라도 좋다. 즉, 예를 들면, 「cspB 유전자」라는 용어에는 상기 예시한 cspB 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「CspB 단백질」이라는 용어에는 상기 예시한 CspB 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 세포 표층 단백질 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 세포 표층 단백질을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, 세포 표층 단백질에 있어서는, 예를 들면, 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는 것이라도 좋다.

「코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질」이란, 코리네형 세균에서 활성을 저하시켰을 때에 비개변주보다도 많은 양의 이종 단백질을 분비 생산하는 능력을 코리네형 세균에 부여하는 성질을 말한다. 「비개변주」란, 세포 표층 단백질의 활성이 저하되어 있지 않은 대조주를 말하고, 예를 들면, 야생주 또는 친주라도 좋다. 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 이종 단백질의 분비 생산량이 비개변주와 비교하여 증대하는 한 특별히 제한되지 않지만, 예를 들면, 배지 중 및/또는 균체 표층에서의 축적량으로서, 비개변주의, 바람직하게는 1.1배 이상, 보다 바람직하게는 1.2배 이상, 더 바람직하게는 1.3배 이상, 특히 바람직하게는 2배 이상의 양의 이종 단백질을 분비 생산하는 것이라도 좋다. 또한, 「비개변주보다도 많은 양의 이종 단백질을 분비 생산한다」란, 농축되어 있지 않은 비개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 없지만, 농축되어 있지 않은 개변주의 배양 상청을 SDS-PAGE에 제공하여 CBB로 염색했을 때에는 이종 단백질을 검출할 수 있는 것이라도 좋다.

어떤 단백질이 코리네형 세균에서 활성을 저하시켰을 때에 이종 단백질의 분비 생산량을 비개변주와 비교하여 상승시키는 성질을 갖는지 여부는, 코리네형 세균에 속하는 균주를 기초로 그 단백질의 활성이 저하되도록 개변된 주를 제작하고, 당해 개변주를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양을 정량하여, 개변 전의 주(비개변주)를 배지에서 배양했을 때에 분비 생산되는 이종 단백질의 양과 비교함으로써 확인할 수 있다.

본 발명에 있어서, 「세포 표층 단백질의 활성이 저하되어 있다」는 것에는, 세포 표층 단백질의 활성이 저하되도록 코리네형 세균이 개변된 경우, 및 코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우가 포함된다. 「코리네형 세균에 있어서 원래 세포 표층 단백질의 활성이 저하되어 있는 경우」에는, 코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우가 포함된다. 즉, 세포 표층 단백질의 활성이 저하되어 있는 코리네형 세균으로서는, 예를 들면, 원래 세포 표층 단백질을 갖지 않는 코리네형 세균을 들 수 있다. 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는 경우」로서는, 예를 들면, 코리네형 세균이 원래 세포 표층 단백질을 코딩하는 유전자를 갖지 않는 경우를 들 수 있다. 또한, 「코리네형 세균이 원래 세포 표층 단백질을 갖지 않는다」란, 코리네형 세균이, 당해 코리네형 세균이 속하는 종의 다른 주에서 발견되는 세포 표층 단백질로부터 선택되는 1 이상의 단백질을 원래 갖지 않는 것이라도 좋다. 예를 들면, 「C. 글루타미쿰이 원래 세포 표층 단백질을 갖지 않는다」란, C. 글루타미쿰주가, 다른 C. 글루타미쿰주에서 발견되는 세포 표층 단백질로부터 선택되는 1 이상의 단백질, 즉, 예를 들면 PS1 및/또는 PS2(CspB)를 원래 갖지 않는 것이라도 좋다. 원래 세포 표층 단백질을 갖지 않는 코리네형 세균으로서는, 예를 들면, 원래 cspB 유전자를 갖지 않는 C. 글루타미쿰 ATCC 13032를 들 수 있다.

<1-3-3> 단백질의 분비계

본 발명의 세균은 단백질의 분비계를 갖는다. 단백질의 분비계는 목적의 이종 단백질을 분비할 수 있는 것이면 특별히 제한되지 않는다. 단백질의 분비계로서는, Sec계(Sec계 분비 시스템)나 Tat계(Tat계 분비 시스템)를 들 수 있다. 본 발명의 세균은 단백질의 분비계가 증강되어 있어도 좋다. 예를 들면, 본 발명의 세균은, Tat계 분비 시스템을 코딩하는 유전자로부터 선택되는 1 이상의 유전자의 발현이 상승하도록 개변되어 있어도 좋다. 본 발명에 있어서, 이러한 개변을 「Tat계 분비 시스템의 증강」이라고도 한다. Tat계 분비 시스템의 증강은, 특히, Tat계 의존성 신호 펩타이드를 이용하여 이종 단백질을 분비 생산하는 경우에 적합하다. Tat계 분비 시스템을 코딩하는 유전자의 발현을 상승시키는 수법에 대해서는 일본 특허 제4730302호에 기재되어 있다.

Tat계 분비 시스템을 코딩하는 유전자로서는 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자를 들 수 있다.

Tat계 분비 시스템을 코딩하는 유전자로서, 구체적으로는, C. 글루타미쿰의 tatA 유전자, tatB 유전자, 및 tatC 유전자를 들 수 있다. C. 글루타미쿰 ATCC 13032의 tatA 유전자, tatB 유전자, 및 tatC 유전자는, 각각, NCBI 데이터 베이스에 GenBank 등록번호 NC_003450(버전 NC_003450.3 GI:58036263)으로서 등록되어 있는 유전체 서열 중, 1571065 내지 1571382 위치의 서열의 상보 서열, 1167110 내지 1167580 위치의 서열, 및 1569929 내지 1570873 위치의 서열의 상보 서열에 상당한다. 또한, C. 글루타미쿰 ATCC 13032의 TatA 단백질, TatB 단백질, 및 TatC 단백질은, 각각, GenBank 등록번호 NP_600707(버전 NP_600707.1 GI:19552705, locus_tag="NCgl1434"), GenBank 등록번호 NP_600350(버전 NP_600350.1 GI:19552348, locus_tag="NCgl1077"), 및 GenBank 등록번호 NP_600706(버전 NP_600706.1 GI:19552704, locus_tag="NCgl1433")으로서 등록되어 있다. C. 글루타미쿰 ATCC 13032의 tatA 유전자, tatB 유전자, 및 tatC 유전자의 염기서열 및 TatA 단백질, TatB 단백질, 및 TatC 단백질의 아미노산 서열을 서열번호 12 내지 17에 나타낸다.

또한, Tat계 분비 시스템을 코딩하는 유전자로서, 구체적으로는, E. 콜라이의 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자를 들 수 있다. E. 콜라이 K-12 MG1655의 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자는, 각각, NCBI 데이터 베이스에 GenBank 등록번호 NC_000913(버전 NC_000913.2 GI:49175990)으로서 등록되어 있는 유전체 서열 중, 4019968 내지 4020237 위치의 서열, 4020241 내지 4020756 위치의 서열, 4020759 내지 4021535 위치의 서열, 658170 내지 658373 위치의 서열에 상당한다. 또한, E. 콜라이 K-12 MG1655의 TatA 단백질, TatB 단백질, TatC 단백질, 및 TatE 단백질은, 각각, GenBank 등록번호 NP_418280(버전 NP_418280.4 GI:90111653, locus_tag="b3836"), GenBank 등록번호 YP_026270(버전 YP_026270.1 GI:49176428, locus_tag="b3838"), GenBank 등록번호 NP_418282(버전 NP_418282.1 GI:16131687, locus_tag="b3839"), 및 GenBank 등록번호 NP_415160(버전 NP_415160.1 GI:16128610, locus_tag="b0627")으로서 등록되어 있다.

Tat계 분비 시스템을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 시스템을 코딩하는 유전자의 변이체라도 좋다. 마찬가지로, Tat계 분비 시스템은 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 분비 시스템의 변이체라도 좋다. 즉, 예를 들면, 「tatA 유전자」, 「tatB 유전자」, 「tatC 유전자」, 및 「tatE 유전자」라는 용어에는, 각각, 상기 예시한 tatA 유전자, tatB 유전자, tatC 유전자, 및 tatE 유전자 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. 마찬가지로, 「TatA 단백질」, 「TatB 단백질」, 「TatC 단백질」, 및 「TatE 단백질」이라는 용어에는, 각각, 상기 예시한 TatA 단백질, TatB 단백질, TatC 단백질, 및 TatE 단백질 이외에도, 그 보존적 변이체도 포함되는 것으로 한다. Tat계 분비 시스템 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, Tat계 분비 시스템을 코딩하는 유전자는 원래의 기능이 유지되고 있는 한, 상기 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 「원래의 기능이 유지되고 있다」란, Tat계 분비 시스템에 있어서는, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질을 세포 외로 분비하는 기능을 갖는 것이라도 좋다.

<1-4> 단백질의 활성을 저하시키는 수법

이하에, RegX3 단백질, HrrSA 단백질, 및 HrcA 단백질 등의 단백질의 활성을 저하시키는 수법에 대하여 설명한다. 또한, 이하에 기재하는 단백질의 활성을 저하시키는 수법은, 야생형 PhoS 단백질의 파괴에도 이용할 수 있다.

「단백질의 활성이 저하된다」란, 이 단백질의 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 「단백질의 활성이 저하된다」란, 구체적으로는, 이 단백질의 세포당 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 여기서 말하는 「비개변주」란, 표적의 단백질의 활성이 저하되도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주를 들 수 있다. 비개변주로서, 구체적으로는, 각 세균종의 기준주(type strain)를 들 수 있다. 또한, 비개변주로서, 구체적으로는, 코리네형 세균의 설명에서 예시한 균주도 들 수 있다. 즉, 일 양태에 있어서, 단백질의 활성은 기준주(즉 본 발명의 세균이 속하는 종의 기준주)와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 ATCC 13032와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 ATCC 13869와 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 AJ 12036(FERM BP-734)과 비교하여 저하되어도 좋다. 또한, 다른 양태에 있어서, 단백질의 활성은 C. 글루타미쿰 YDK010주와 비교하여 저하되어도 좋다. 또한, 「단백질의 활성이 저하된다」는 것에는, 이 단백질의 활성이 완전하게 소실되어 있는 경우도 포함된다. 「단백질의 활성이 저하된다」란, 더 구체적으로는, 비개변주와 비교하여, 이 단백질의 세포당 분자수가 저하되어 있는 것, 및/또는, 이 단백질의 분자당 기능이 저하되어 있는 것을 의미해도 좋다. 즉, 「단백질의 활성이 저하된다」고 하는 경우의 「활성」이란, 단백질의 촉매 활성에 한정되지 않고, 단백질을 코딩하는 유전자의 전사량(mRNA량) 또는 번역량(단백질의 양)을 의미해도 좋다. 「단백질의 세포당 분자수」란, 이 단백질의 분자수의 세포당 평균값을 의미해도 좋다. 또한, 「단백질의 세포당 분자수가 저하되어 있다」는 것에는, 이 단백질이 전혀 존재하고 있지 않은 경우도 포함된다. 또한, 「단백질의 각 분자의 기능이 저하되어 있다」는 것에는, 이 단백질의 각 분자의 기능이 완전하게 소실되어 있는 경우도 포함된다. 단백질의 활성의 저하의 정도는, 단백질의 활성이 비개변주와 비교하여 저하되어 있으면 특별히 제한되지 않는다. 단백질의 활성은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

단백질의 활성이 저하되는 개변은, 예를 들면, 이 단백질을 코딩하는 유전자의 발현을 저하시킴으로써 달성할 수 있다. 「유전자의 발현이 저하된다」란, 이 유전자의 발현이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 발현이 저하된다」란, 구체적으로는, 이 유전자의 세포당 발현량이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 세포당 발현량」이란, 이 유전자의 발현량의 세포당 평균값을 의미해도 좋다. 「유전자의 발현이 저하된다」란, 더 구체적으로는, 유전자의 전사량(mRNA량)이 저하되는 것, 및/또는, 유전자의 번역량(유전자로부터 발현되는 단백질의 양)이 저하되는 것을 의미해도 좋다. 「유전자의 발현이 저하된다」는 것에는, 이 유전자가 전혀 발현되고 있지 않은 경우도 포함된다. 또한, 「유전자의 발현이 저하된다」는 것을, 「유전자의 발현이 약화된다」고도 한다. 유전자의 발현은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

유전자의 발현의 저하는, 예를 들면, 전사 효율의 저하에 의한 것이라도 좋고, 번역 효율의 저하에 의한 것이라도 좋고, 이들의 조합에 의한 것이라도 좋다. 유전자의 발현의 저하는, 예를 들면, 유전자의 프로모터, 샤인-달가노(SD, Shine-Dalgarno) 서열(리보솜 결합 부위(RBS)라고도 한다), RBS와 개시 코돈 사이의 스페이서 영역 등의 발현 조절 서열을 개변함으로써 달성할 수 있다. 발현 조절 서열을 개변하는 경우에는, 발현 조절 서열은, 바람직하게는 1염기 이상, 보다 바람직하게는 2염기 이상, 특히 바람직하게는 3염기 이상이 개변된다. 유전자의 전사 효율의 저하는, 예를 들면, 염색체상의 유전자의 프로모터를 보다 약한 프로모터로 치환함으로써 달성할 수 있다. 「보다 약한 프로모터」란, 유전자의 전사가, 원래 존재하고 있는 야생형의 프로모터보다도 약화되는 프로모터를 의미한다. 보다 약한 프로모터로서는, 예를 들면, 유도형의 프로모터를 들 수 있다. 즉, 유도형의 프로모터는, 비유도 조건 하(예를 들면, 유도 물질의 비존재 하)에서 보다 약한 프로모터로서 기능할 수 있다. 또한, 발현 조절 서열의 일부 또는 전부를 결실시켜도 좋다. 또한, 유전자의 발현의 저하는, 예를 들면, 발현 제어에 관한 인자를 조작함으로써도 달성할 수 있다. 발현 제어에 관한 인자로서는, 전사나 번역 제어에 관한 저분자(유도 물질, 저해 물질 등), 단백질(전사 인자 등), 핵산(siRNA 등) 등을 들 수 있다. 또한, 유전자의 발현의 저하는, 예를 들면, 유전자의 코딩 영역에 유전자의 발현이 저하되는 변이를 도입함으로써도 달성할 수 있다. 예를 들면, 유전자의 코딩 영역의 코돈을, 숙주에서 보다 저빈도로 이용되는 동의(同義) 코돈으로 치환함으로써, 유전자의 발현을 저하시킬 수 있다. 또한, 예를 들면, 후술하는 바와 같은 유전자의 파괴에 의해, 유전자의 발현 자체가 저하될 수 있다.

또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 이 단백질을 코딩하는 유전자를 파괴함으로써 달성할 수 있다. 「유전자가 파괴된다」란, 정상적으로 기능하는 단백질을 생산하지 않도록 이 유전자가 개변되는 것을 의미한다. 「정상적으로 기능하는 단백질을 생산하지 않는다」는 것에는, 이 유전자로부터 단백질이 전혀 생산되지 않는 경우나, 이 유전자로부터 분자당 기능(예를 들면 활성이나 성질)이 저하 또는 소실된 단백질이 생산되는 경우가 포함된다.

유전자의 파괴는, 예를 들면, 염색체상의 유전자를 결실(결손)시킴으로써 달성할 수 있다. 「유전자의 결실」이란, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실을 말한다. 또한, 염색체상의 유전자의 코딩 영역의 전후의 서열을 포함하여, 유전자 전체를 결실시켜도 좋다. 유전자의 코딩 영역의 전후의 서열에는, 예를 들면, 유전자의 발현 조절 서열이 포함되어도 좋다. 단백질의 활성의 저하를 달성할 수 있는 한, 결실시키는 영역은 N 말단 영역(단백질의 N 말단측을 코딩하는 영역), 내부 영역, C 말단 영역(단백질의 C 말단측을 코딩하는 영역) 등 중 어느 영역이라도 좋다. 통상, 결실시키는 영역은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 결실시키는 영역은, 예를 들면, 유전자의 코딩 영역 전체 길이의 10% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상의 길이의 영역이라도 좋다. 또한, 결실시키는 영역의 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 결실시키는 영역의 하류에서 프레임 시프트가 발생할 수 있다.

또한, 유전자의 파괴는, 예를 들면, 염색체상의 유전자의 코딩 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 중지 코돈(넌센스 변이)을 도입하는 것, 또는 1 내지 2염기의 부가 또는 결실(프레임 시프트 변이)을 도입하는 것 등에 의해서도 달성할 수 있다(Journal of Biological Chemistry 272: 8611-8617(1997), Proceedings of the National Academy of Sciences, USA 955511-5515(1998), Journal of Biological Chemistry 26116, 20833-20839(1991)).

또한, 유전자의 파괴는, 예를 들면, 염색체상의 유전자의 코딩 영역에 다른 염기서열을 삽입함으로써도 달성할 수 있다. 삽입 부위는 유전자 중 어느 영역이라도 좋지만, 삽입하는 염기서열은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 또한, 삽입 부위의 전후의 서열은 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 삽입 부위의 하류에서 프레임 시프트가 발생할 수 있다. 다른 염기서열로서는, 코딩되는 단백질의 활성을 저하 또는 소실시키는 것이면 특별히 제한되지 않지만, 예를 들면, 항생 물질 내성 유전자 등의 마커 유전자나 목적 물질의 생산에 유용한 유전자를 들 수 있다.

유전자의 파괴는, 특히, 코딩되는 단백질의 아미노산 서열이 결실(결손)되도록 실시해도 좋다. 바꿔 말하면, 단백질의 활성이 저하되는 개변은, 예를 들면, 단백질의 아미노산 서열을 결실시킴으로써, 구체적으로는, 아미노산 서열이 결실되는 단백질을 코딩하도록 유전자를 개변함으로써 달성할 수 있다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질의 아미노산 서열의 일부 또는 전부의 영역의 결실을 말한다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질에 있어서 원래의 아미노산 서열이 존재하지 않게 되는 것을 말하고, 원래의 아미노산 서열이 다른 아미노산 서열로 변화되는 경우도 포함된다. 즉, 예를 들면, 프레임 시프트에 의해 다른 아미노산 서열로 변화된 영역은 결실된 영역으로 간주해도 좋다. 아미노산 서열의 결실에 의해, 전형적으로는 단백질의 전체 길이가 단축되지만, 단백질의 전체 길이가 변화되지 않거나, 또는 연장되는 경우도 있을 수 있다. 예를 들면, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 결실된 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들면, 유전자의 코딩 영역에의 중지 코돈의 도입에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 도입 부위보다 하류의 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들면, 유전자의 코딩 영역에서의 프레임 시프트에 의해, 당해 프레임 시프트 부위가 코딩하는 영역을 결실시킬 수 있다. 아미노산 서열의 결실에서의 결실시키는 영역의 위치 및 길이에 대해서는, 유전자의 결실에서의 결실시키는 영역의 위치 및 길이의 설명을 준용할 수 있다.

염색체상의 유전자를 상기한 바와 같이 개변하는 것은, 예를 들면, 정상적으로 기능하는 단백질을 생산하지 않도록 개변한 파괴형 유전자를 제작하고, 당해 파괴형 유전자를 포함하는 재조합 DNA로 숙주를 형질 전환하여, 파괴형 유전자와 염색체상의 야생형 유전자로 상동 재조합을 일으키게 함으로써, 염색체상의 야생형 유전자를 파괴형 유전자로 치환하여 달성할 수 있다. 이때, 재조합 DNA에는 숙주의 영양 요구성 등의 형질에 따라, 마커 유전자를 포함시켜 두면 조작하기 쉽다. 파괴형 유전자로서는, 유전자의 코딩 영역의 일부 또는 전부의 영역을 결실한 유전자, 미스센스 변이를 도입한 유전자, 넌센스 변이를 도입한 유전자, 프레임 시프트 변이를 도입한 유전자, 트랜스포존이나 마커 유전자 등의 삽입 서열을 삽입한 유전자를 들 수 있다. 상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 예를 들면, 파괴형 유전자를 포함하는 선상 DNA로서, 양단에 염색체상의 야생형 유전자의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 숙주를 형질 전환하여, 야생형 유전자의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 한 단계로 야생형 유전자를 파괴형 유전자로 치환할 수 있다. 파괴형 유전자에 의해 코딩되는 단백질은 생성했다 하더라도 야생형 단백질과는 다른 입체 구조를 갖고, 기능이 저하 또는 소실된다. 이러한 상동 재조합을 이용한 유전자 치환에 의한 유전자 파괴는 이미 확립되어 있고, 「Red 구동형 통합(Red-driven integration)」이라고 불리는 방법(Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)), Red 구동형 통합법과 λ파지 유래의 절제 시스템(Cho, E. H., Gumport, R. I., Gardner, J. F. J. Bacteriol. 184: 5200-5203(2002))을 조합한 방법(WO2005/010175호 참조) 등의 직쇄상 DNA를 사용하는 방법이나, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법 등이 있다(미국특허 제6,303,383호, 일본 공개특허공보 특개평05-007491호).

또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 돌연변이 처리에 의해 행하여도 좋다. 돌연변이 처리로서는, X선의 조사, 자외선의 조사, 및 N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), 메틸메탄설포네이트(EMS), 및 메틸메탄설포네이트(MMS) 등의 변이제에 의한 처리를 들 수 있다.

상기와 같은 단백질의 활성을 저하시키는 수법은 단독으로 사용해도 좋고, 임의의 조합으로 사용해도 좋다.

단백질의 활성이 저하된 것은, 이 단백질의 활성을 측정함으로써 확인할 수 있다.

단백질의 활성이 저하된 것은, 이 단백질을 코딩하는 유전자의 발현이 저하된 것을 확인함으로써도 확인할 수 있다. 유전자의 발현이 저하된 것은, 이 유전자의 전사량이 저하된 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 저하된 것을 확인함으로써 확인할 수 있다.

유전자의 전사량이 저하된 것의 확인은, 이 유전자로부터 전사되는 mRNA의 양을 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는, 노던 하이브리드화, RT-PCR, 마이크로어레이, RNA-Seq 등을 들 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). mRNA의 양은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

단백질의 양이 저하된 것의 확인은, SDS-PAGE를 행하여 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 저하된 것의 확인은, 항체를 사용하여 웨스턴 블롯팅에 의해 행할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

유전자가 파괴된 것은, 파괴에 사용한 수단에 따라 이 유전자의 일부 또는 전부의 염기서열, 제한 효소 지도, 또는 전체 길이 등을 결정함으로써 확인할 수 있다.

<1-5> 유전자의 발현을 상승시키는 수법

이하에, Tat계 분비 시스템을 코딩하는 유전자 등의 유전자의 발현을 상승시키는 수법에 대하여 설명한다.

「유전자의 발현이 상승한다」란, 이 유전자의 발현이 비개변주와 비교하여 상승하고 있는 것을 의미한다. 「유전자의 발현이 상승한다」란, 구체적으로는, 이 유전자의 세포당 발현량이 비개변주와 비교하여 상승하고 있는 것을 의미한다. 「유전자의 세포당 발현량」이란, 이 유전자의 발현량의 세포당 평균값을 의미해도 좋다. 여기서 말하는 「비개변주」란, 표적의 유전자의 발현이 상승하도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는 야생주나 친주를 들 수 있다. 비개변주로서, 구체적으로는, 각 세균종의 기준주(type strain)를 들 수 있다. 또한, 비개변주로서, 구체적으로는, 코리네형 세균의 설명에서 예시한 균주도 들 수 있다. 즉, 일 양태에 있어서, 유전자의 발현은 기준주(즉 본 발명의 세균이 속하는 종의 기준주)와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 ATCC 13032와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 ATCC 13869와 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 AJ 12036(FERM BP-734)과 비교하여 상승해도 좋다. 또한, 다른 양태에 있어서, 유전자의 발현은 C. 글루타미쿰 YDK010주와 비교하여 상승해도 좋다. 「유전자의 발현이 상승한다」란, 더 구체적으로는, 유전자의 전사량(mRNA량)이 증대하는 것, 및/또는, 유전자의 번역량(유전자로부터 발현된 단백질의 양)이 증대하는 것을 의미해도 좋다. 또한, 「유전자의 발현이 상승한다」는 것을, 「유전자의 발현이 증강된다」라고도 한다. 유전자의 발현의 상승 정도는, 유전자의 발현이 비개변주와 비교하여 상승하고 있으면 특별히 제한되지 않는다. 유전자의 발현은, 비개변주의, 바람직하게는 1.5배 이상, 보다 바람직하게는 2배 이상, 더 바람직하게는 3배 이상으로 상승해도 좋다. 또한, 「유전자의 발현이 상승한다」는 것에는, 원래 표적의 유전자가 발현되고 있는 균주에 있어서 이 유전자의 발현량을 상승시키는 것뿐만 아니라, 원래 표적의 유전자가 발현되고 있지 않은 균주에 있어서 이 유전자를 발현시키는 것도 포함된다. 즉, 「유전자의 발현이 상승한다」는 것에는, 예를 들면, 표적의 유전자를 유지하지 않은 균주에 이 유전자를 도입하여, 이 유전자를 발현시키는 것도 포함된다.

유전자의 발현의 상승은, 예를 들면, 유전자의 카피수를 증가시킴으로써 달성할 수 있다.

유전자의 카피수의 증가는, 숙주의 염색체에 해당 유전자를 도입함으로써 달성할 수 있다. 염색체로의 유전자의 도입은, 예를 들면, 상동 재조합을 이용하여 행할 수 있다(Miller, J. H. Experiments in Molecular Genetics, 1972, Cold Spring Harbor Laboratory). 상동 재조합을 이용하는 유전자 도입법으로서는, 예를 들면, Red 구동형 통합(Red-driven integration)법 (Datsenko, K. A, and Wanner, B. L. Proc. Natl. Acad. Sci. U S A. 97: 6640-6645(2000)) 등의 직쇄상 DNA를 사용하는 방법, 온도 감수성 복제 기점을 포함하는 플라스미드를 사용하는 방법, 접합 전달 가능한 플라스미드를 사용하는 방법, 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터를 사용하는 방법, 파지를 사용한 형질도입법을 들 수 있다. 상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 구체적으로는, 예를 들면, 표적 유전자를 포함하는 선상 DNA로서, 양단에 염색체상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비한 선상 DNA로 코리네형 세균을 형질 전환하여, 치환 대상 부위의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 치환 대상 부위를 표적 유전자로 치환할 수 있다. 상동 재조합에 사용하는 재조합 DNA는, 형질 전환체를 선택하기 위한 마커 유전자를 구비하고 있어도 좋다. 유전자는 1카피만 도입되어도 좋고, 2카피 또는 그 이상 도입되어도 좋다. 예를 들면, 염색체 위에 다수의 카피가 존재하는 서열을 표적으로서 상동 재조합을 행함으로써 염색체에 유전자의 다수의 카피를 도입할 수 있다. 염색체 위에 다수의 카피가 존재하는 서열로서는, 반복 DNA 서열, 트랜스포존의 양단에 존재하는 역위 반복 서열을 들 수 있다. 또한, 목적 물질의 생산에 불필요한 유전자 등의 염색체상의 적당한 서열을 표적으로서 상동 재조합을 행하여도 좋다. 또한, 유전자는, 트랜스포존이나 Mini-Mu를 사용하여 염색체 위에 랜덤으로 도입할 수도 있다(일본 공개특허공보 특개평2-109985호, US5,882,888, EP0805867B1). 트랜스포존으로서는, 인공 트랜스포존을 이용해도 좋다(일본 공개특허공보 특개평9-70291).

염색체 위에 표적 유전자가 도입된 것의 확인은, 이 유전자의 전부 또는 일부와 상보적인 서열을 갖는 프로브를 사용한 서던 하이브리드화, 또는 이 유전자의 서열에 기초하여 작성한 프라이머를 사용한 PCR 등에 의해 확인할 수 있다.

또한, 유전자의 카피수의 증가는, 이 유전자를 포함하는 벡터를 숙주에 도입함으로써도 달성할 수 있다. 예를 들면, 표적 유전자를 포함하는 DNA 단편을, 숙주에서 기능하는 벡터와 연결하여 이 유전자의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질 전환함으로써 이 유전자의 카피수를 증가시킬 수 있다. 표적 유전자를 포함하는 DNA 단편은, 예를 들면, 표적 유전자를 갖는 미생물의 유전체 DNA를 주형으로 하는 PCR에 의해 취득할 수 있다. 벡터로서는, 숙주의 세포 내에서 자율 복제 가능한 벡터를 사용할 수 있다. 벡터는 멀티 카피 벡터인 것이 바람직하다. 또한, 형질 전환체를 선택하기 위해서, 벡터는 항생 물질 내성 유전자 등의 마커를 갖는 것이 바람직하다. 또한, 벡터는, 삽입된 유전자를 발현하기 위한 프로모터나 종결자를 구비하고 있어도 좋다. 벡터는, 예를 들면, 세균 플라스미드 유래의 벡터, 효모 플라스미드 유래의 벡터, 박테리오파지 유래의 벡터, 코스미드, 또는 파지미드 등이라도 좋다. 코리네형 세균에서 자율 복제 가능한 벡터로서, 구체적으로는, 예를 들면, pHM1519(Agric. Biol. Chem., 48, 2901-2903(1984)); pAM330(Agric. Biol. Chem., 48, 2901-2903(1984)); 이들을 개량한 약제 내성 유전자를 갖는 플라스미드; 플라스미드 pCRY30(일본 공개특허공보 특개평3-210184); 플라스미드 pCRY21, pCRY2KE, pCRY2KX, pCRY31, pCRY3KE, 및 pCRY3KX(일본 공개특허공보 특개평2-72876, 미국특허 제5,185,262호); 플라스미드 pCRY2 및 pCRY3(일본 공개특허공보 특개평1-191686); pAJ655, pAJ611, 및 pAJ1844(일본 공개특허공보 특개소58-192900); pCG1(일본 공개특허공보 특개소57-134500); pCG2(일본 공개특허공보 특개소58-35197); pCG4 및 pCG11(일본 공개특허공보 특개소57-183799); pVK7(일본 공개특허공보 특개평10-215883); pVK9(US2006-0141588); pVC7(일본 공개특허공보 특개평9-070291); pVS7(WO2013/069634)을 들 수 있다.

유전자를 도입할 경우, 유전자는 발현 가능하게 숙주에 유지되어 있으면 좋다. 구체적으로는, 유전자는 숙주에서 기능하는 프로모터 서열에 의한 제어를 받아 발현하도록 유지되어 있으면 좋다. 프로모터는 숙주에서 기능하는 것이면 특별히 제한되지 않는다. 「숙주에서 기능하는 프로모터」란, 숙주에서 프로모터 활성을 갖는 프로모터를 말한다. 프로모터는 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 도입하는 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 프로모터로서는, 후술하는 바와 같은 코리네형 세균에서 기능하는 프로모터를 이용할 수 있다.

유전자의 하류에는, 전사 종료를 위한 종결자를 배치할 수 있다. 종결자는 숙주에서 기능하는 것이면 특별히 제한되지 않는다. 종결자는 숙주 유래의 종결자라도 좋고, 이종 유래의 종결자라도 좋다. 종결자는 도입하는 유전자 고유의 종결자라도 좋고, 다른 유전자의 종결자라도 좋다.

각종 미생물에 있어서 이용 가능한 벡터, 프로모터, 종결자에 관해서는, 예를 들면 「미생물학 기초강좌 8 유전자공학, 공립 출판, 1987년」에 상세하게 기재되어 있고, 이들을 이용하는 것이 가능하다.

또한, 2 이상의 유전자를 도입할 경우, 각 유전자가 발현 가능하게 숙주에 유지되어 있으면 좋다. 예를 들면, 각 유전자는 모두가 단일의 발현 벡터 위에 유지되어 있어도 좋고, 모두가 염색체 위에 유지되어 있어도 좋다. 또한, 각 유전자는 복수의 발현 벡터 위에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 각각 유지되어 있어도 좋다. 또한, 2 이상의 유전자로 오페론을 구성하여 도입해도 좋다.

도입되는 유전자는, 숙주에서 기능하는 단백질을 코딩하는 것이면 특별히 제한되지 않는다. 도입되는 유전자는 숙주 유래의 유전자라도 좋고, 이종 유래의 유전자라도 좋다. 도입되는 유전자는, 예를 들면, 이 유전자의 염기서열에 기초하여 설계한 프라이머를 사용하고, 이 유전자를 갖는 생물의 유전체 DNA나 이 유전자를 탑재하는 플라스미드 등을 주형으로 하는, PCR에 의해 취득할 수 있다. 또한, 도입되는 유전자는, 예를 들면, 이 유전자의 염기서열에 기초하여 전체 합성해도 좋다(Gene, 60(1), 115-127(1987)). 취득한 유전자는 그대로, 또는 적절히 개변하여 이용할 수 있다. 유전자의 개변은 공지된 수법에 의해 행할 수 있다. 예를 들면, 부위 특이적 변이법에 의해, DNA의 목적의 부위에 목적의 변이를 도입할 수 있다. 즉, 예를 들면, 부위 특이적 변이법에 의해, 코딩되는 단백질이 특정한 부위에서 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하도록, 유전자의 코딩 영역을 개변할 수 있다.

또한, 유전자의 발현의 상승은, 유전자의 전사 효율을 향상시킴으로써 달성할 수 있다. 또한, 유전자의 발현의 상승은, 유전자의 번역 효율을 향상시킴으로써 달성할 수 있다. 유전자의 전사 효율이나 번역 효율의 향상은, 예를 들면, 발현 조절 서열의 개변에 의해 달성할 수 있다. 「발현 조절 서열」이란, 유전자의 발현에 영향을 주는 부위의 총칭이다. 발현 조절 서열로서는, 예를 들면, 프로모터, 샤인-달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다), 및 RBS와 개시 코돈 사이의 스페이서 영역을 들 수 있다. 발현 조절 서열은, 프로모터 검색 벡터나 GENETYX 등의 유전자 분석 소프트웨어를 사용하여 결정할 수 있다. 이들 발현 조절 서열의 개변은, 예를 들면, 상동 재조합을 이용하여 행할 수 있다. 상동 재조합을 이용한 개변 수법으로서는, 온도 감수성 벡터를 사용한 방법이나, Red 구동형 통합법(WO2005/010175)을 들 수 있다.

유전자의 전사 효율의 향상은, 예를 들면, 염색체상의 유전자의 프로모터를 보다 강력한 프로모터로 치환함으로써 달성할 수 있다. 「보다 강력한 프로모터」란, 유전자의 전사가, 원래 존재하고 있는 야생형의 프로모터보다도 향상되는 프로모터를 의미한다. 코리네형 세균에서 이용할 수 있는 보다 강력한 프로모터로서는, 인위적으로 설계 변경된 P54-6 프로모터(Appl. Microbiol. Biotechnol., 53, 674-679(2000)), 코리네형 세균 내에서 아세트산, 에탄올, 피루브산 등으로 유도할 수 있는 pta, aceA, aceB, adh, amyE 프로모터, 코리네형 세균 내에서 발현량이 많은 강력한 프로모터인 cspB, SOD, tuf(EF-Tu) 프로모터(Journal of Biotechnology, 104(2003) 311-323, Appl. Environ. Microbiol., 2005 Dec; 71(12): 8587-96.), lac 프로모터, tac 프로모터, trc 프로모터를 들 수 있다. 또한, 보다 강력한 프로모터로서는, 각종 리포터 유전자를 사용함으로써 기존 프로모터의 고활성형인 것을 취득해도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이 함으로써, 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터의 강도의 평가법 및 강력한 프로모터의 예는, 골드슈타인(Goldstein) 등의 논문(Prokaryotic Promoters in Biotechnology. Biotechnol. Annu. Rev., 1, 105-128(1995)) 등에 기재되어 있다.

유전자의 번역 효율의 향상은, 예를 들면, 염색체상의 유전자의 샤인-달가노(SD) 서열(리보솜 결합 부위(RBS)라고도 한다)을 보다 강력한 SD 서열로 치환함으로써 달성할 수 있다. 「보다 강력한 SD 서열」이란, mRNA의 번역이, 원래 존재하고 있는 야생형의 SD 서열보다도 향상되는 SD 서열을 의미한다. 보다 강력한 SD 서열로서는, 예를 들면, 파지 T7 유래의 유전자 10의 RBS를 들 수 있다(Olins P. O. et al, Gene, 1988, 73, 227-235). 또한, RBS와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 여러 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 상당히 영향을 끼치는 것으로 알려져 있어, 이들을 개변함으로써도 유전자의 번역 효율을 향상시킬 수 있다.

유전자의 번역 효율의 향상은, 예를 들면, 코돈의 개변에 의해서도 달성할 수 있다. 예를 들면, 유전자 중에 존재하는 희귀 코돈을, 보다 고빈도로 이용되는 동의 코돈으로 치환함으로써 유전자의 번역 효율을 향상시킬 수 있다. 즉, 도입되는 유전자는, 예를 들면, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다. 코돈의 치환은, 예를 들면, 부위 특이적 변이법에 의해 행할 수 있다. 또한, 코돈이 치환된 유전자 단편을 전체 합성해도 좋다. 다양한 생물에서의 코돈의 사용 빈도는, 「코돈 사용 데이터 베이스」(http://www.kazusa.or.jp/codon; Nakamura, Y. et al, Nucl. Acids Res., 28, 292(2000))에 개시되어 있다.

또한, 유전자의 발현의 상승은, 표적 유전자의 발현을 상승시키는 조절인자를 증폭하는 것, 또는, 표적 유전자의 발현을 저하시키는 조절인자를 결실 또는 약화시킴으로써도 달성할 수 있다.

상기와 같은 유전자의 발현을 상승시키는 수법은 단독으로 사용해도 좋고, 임의의 조합으로 사용해도 좋다.

형질 전환의 방법은 특별히 한정되지 않고, 종래 알려진 방법을 사용할 수 있다. 예를 들면, 에쉐리키아·콜라이 K-12에 대하여 보고되어 있는 바와 같은, 수용균 세포를 염화칼슘으로 처리하여 DNA의 투과성을 증대시키는 방법(Mandel, M. and Higa, A.,J. Mol. Biol. 1970, 53, 159-162)이나, 바실러스 서브틸리스에 대하여 보고되어 있는 바와 같은, 증식 단계의 세포로부터 컴피턴트 세포를 조제하여 DNA를 도입하는 방법(Duncan, C. H., Wilson, G. A. and Young, F. E..,1977. Gene 1: 153-167)을 사용할 수 있다. 또는, 바실러스 서브틸리스, 방선균류, 및 효모에 대하여 알려져 있는 바와 같은, DNA 수용균의 세포를, 재조합 DNA를 용이하게 받아들이는 원형질체 또는 스페로플라스트(spheroplast)의 상태로 하여 재조합 DNA를 DNA 수용균에 도입하는 방법(Chang, S. and Choen, S. N., 1979. Mol. Gen. Genet., 168: 111-115; Bibb, M. J., Ward, J. M. and Hopwood, O.A., 1978. Nature 274: 398-400; Hinnen, A., Hicks, J. B. and Fink, G. R. 1978. Proc. Natl. Acad. Sci. USA 75: 1929-1933)도 응용할 수 있다. 코리네형 세균의 형질 전환은, 구체적으로는, 예를 들면, 원형질법(Gene, 39, 281-286(1985)), 전기천공법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개평2-207791호) 등에 의해 행할 수 있다.

유전자의 발현이 상승한 것은, 예를 들면, 이 유전자로부터 발현되는 단백질의 활성이 상승한 것을 확인함으로써 확인할 수 있다. 단백질의 활성이 상승한 것은 이 단백질의 활성을 측정함으로써 확인할 수 있다. 예를 들면, Tat계 분비 시스템의 활성이 상승한 것은, 예를 들면, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질의 분비 생산량이 증대한 것을 확인함으로써 확인할 수 있다. 이 경우, Tat계 의존성 신호 펩타이드가 N 말단에 부가된 단백질의 분비 생산량은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승하고 있는 것이 바람직하다.

또한, 유전자의 발현이 상승한 것은, 예를 들면, 이 유전자의 전사량이 상승한 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 상승한 것을 확인함으로써 확인할 수 있다.

유전자의 전사량이 상승한 것의 확인은, 이 유전자로부터 전사되는 mRNA의 양을 야생주 또는 친주 등의 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는 노던 하이브리드화, RT-PCR, 마이크로어레이, RNA-Seq 등을 들 수 있다(Sambrook, J., et al., Molecular Cloning A Laboratory Manual/Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). mRNA의 양은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승해도 좋다.

단백질의 양이 상승한 것의 확인은, SDS-PAGE를 행하여 분리된 단백질 밴드의 강도를 확인함으로써 행할 수 있다. 또한, 단백질의 양이 상승한 것의 확인은, 항체를 사용하여 웨스턴 블롯팅에 의해 행할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 단백질의 양(예를 들면, 세포당 분자수)은, 예를 들면, 비개변주의, 1.5배 이상, 2배 이상, 또는 3배 이상으로 상승해도 좋다.

<1-6> 이종 단백질의 분비 발현용의 유전자 구축물과 그 도입

분비성 단백질은, 일반적으로, 프레단백질(preprotein, 프레펩타이드라고도 한다) 또는 프레프로단백질(preproprotein, 프레프로펩타이드라고도 한다)로서 번역되고, 그 후, 프로세싱에 의해 성숙 단백질이 되는 것으로 알려져 있다. 구체적으로는, 분비성 단백질은 일반적으로, 프레단백질 또는 프레프로단백질로서 번역된 후, 프레 부분인 신호 펩타이드가 프로테아제(일반적으로 신호 펩티다아제라고 불린다)에 의해 절단되어 성숙 단백질 또는 프로단백질로 변환되고, 프로단백질은 프로테아제에 의해 더욱 프로 부분이 절단되어 성숙 단백질이 된다. 따라서, 본 발명의 방법에 있어서는, 이종 단백질의 분비 생산에 신호 펩타이드를 이용한다. 또한, 본 발명에 있어서, 분비형 단백질의 프레단백질 및 프레프로단백질을 총칭하여 「분비형 단백질 전구체」라고 하는 경우가 있다. 본 발명에 있어서, 「신호 펩타이드」(「신호 서열」이라고도 한다)란, 분비성 단백질 전구체의 N 말단에 존재하며, 통상, 천연의 성숙 단백질에는 존재하지 않는 아미노산 서열을 말한다.

본 발명에 사용되는 유전자 구축물은, 5'에서 3' 방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 이종 단백질을 코딩하는 핵산 서열을 포함한다. 신호 펩타이드를 코딩하는 핵산 서열은 프로모터 서열의 하류에, 이 프로모터에 의한 제어를 받아 신호 펩타이드가 발현되도록 연결되어 있으면 좋다. 이종 단백질을 코딩하는 핵산 서열은 신호 펩타이드를 코딩하는 핵산 서열의 하류에, 이 신호 펩타이드와의 융합 단백질로서 이종 단백질이 발현되도록 연결되어 있으면 좋다. 당해 융합 단백질을 「본 발명의 융합 단백질」이라고도 한다. 또한, 본 발명의 융합 단백질에 있어서, 신호 펩타이드와 이종 단백질은 인접해 있어도 좋고, 인접해 있지 않아도 좋다. 즉, 「이종 단백질이 신호 펩타이드와의 융합 단백질로서 발현된다」란, 이종 단백질이 신호 펩타이드에 인접하여 이 신호 펩타이드와의 융합 단백질로서 발현되는 경우에 한정되지 않고, 이종 단백질이 다른 아미노산 서열을 통하여 신호 펩타이드와의 융합 단백질로서 발현되는 경우도 포함된다. 예를 들면, 후술하는 바와 같이, 본 발명의 융합 단백질에 있어서, 신호 펩타이드와 이종 단백질 사이에는, Gln-Glu-Thr을 포함하는 아미노산 서열이나 효소적 절단에 사용되는 아미노산 서열 등의 삽입 서열이 포함될 수 있다. 또한, 후술하는 바와 같이, 최종적으로 얻어지는 이종 단백질은 신호 펩타이드를 갖고 있지 않아도 좋다. 즉, 「이종 단백질이 신호 펩타이드와의 융합 단백질로서 발현된다」란, 이종 단백질이 발현시에 신호 펩타이드와의 융합 단백질을 구성하고 있으면 충분하고, 최종적으로 얻어지는 이종 단백질이 신호 펩타이드와의 융합 단백질을 구성하고 있을 것을 필요로 하지 않는다. 핵산 서열은 「유전자」라고 바꿔 말할 수 있다. 예를 들면, 이종 단백질을 코딩하는 핵산 서열을 「이종 단백질을 코딩하는 유전자」 또는 「이종 단백질 유전자」라고도 한다. 핵산 서열로서는 DNA를 들 수 있다. 또한, 본 발명에 사용되는 유전자 구축물은, 코리네형 세균에서 본 발명의 융합 단백질을 발현시키기 위해서 유효한 조절 서열(오퍼레이터, SD 서열, 종결자 등)을, 이들이 기능할 수 있도록 적절한 위치에 갖고 있어도 좋다.

본 발명에서 사용되는 프로모터는, 코리네형 세균에서 기능하는 프로모터인 한 특별히 제한되지 않는다. 프로모터는 코리네형 세균 유래(예를 들면 숙주 유래)의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는 이종 단백질 유전자 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 「코리네형 세균에서 기능하는 프로모터」란, 코리네형 세균에 있어서 프로모터 활성을 갖는 프로모터를 말한다.

이종 유래의 프로모터로서, 구체적으로는, 예를 들면, tac 프로모터, lac 프로모터, trp 프로모터, 및 araBAD 프로모터 등의 E. 콜라이 유래의 프로모터를 들 수 있다. 이 중에서도, tac 프로모터 등의 강력한 프로모터나, araBAD 프로모터 등의 유도형 프로모터가 바람직하다.

코리네형 세균 유래의 프로모터로서는, 예를 들면, 세포 표층 단백질인 PS1, PS2(CspB라고도 한다), SlpA(CspA라고도 한다)의 유전자의 프로모터, 각종 아미노산 생합성계 유전자의 프로모터를 들 수 있다. 각종 아미노산 생합성계 유전자의 프로모터로서, 구체적으로는, 예를 들면, 글루타민산 생합성계의 글루타민산 탈수소효소 유전자, 글루타민 합성계의 글루타민 합성효소 유전자, 라이신 생합성계의 아스파르토키나아제 유전자, 트레오닌 생합성계의 호모세린 탈수소효소 유전자, 이소류신 및 발린 생합성계의 아세토하이드록시산 합성효소 유전자, 류신 생합성계의 2-이소프로필말산 합성효소 유전자, 프롤린 및 아르기닌 생합성계의 글루타민산 키나아제 유전자, 히스티딘 생합성계의 포스포리보실-ATP 피로포스포릴라아제 유전자, 트립토판, 티로신 및 페닐알라닌 등의 방향족 아미노산 생합성계의 데옥시아라비노헵투론산 인산(DAHP) 합성효소 유전자, 이노신산 및 구아닐산과 같은 핵산 생합성계에서의 포스포리보실 피로포스페이트(PRPP) 아미도트랜스퍼라제 유전자, 이노신산 탈수소효소 유전자, 및 구아닐산 합성효소 유전자의 프로모터를 들 수 있다.

또한, 코리네형 세균에서 기능하는 프로모터로서는, 상술한 바와 같은, 코리네형 세균에서 이용할 수 있는 보다 강력한 프로모터를 들 수 있다. 또한, 프로모터로서는, 각종 리포터 유전자를 사용함으로써 기존 프로모터의 고활성형인 것을 취득하여 이용해도 좋다. 예를 들면, 프로모터 영역 내의 -35, -10 영역을 콘센서스 서열에 가까이 함으로써, 프로모터의 활성을 높일 수 있다(국제공개 제00/18935호). 프로모터 강도의 평가법 및 강력한 프로모터의 예는, 골드슈타인 등의 논문(Prokaryotic promoters in biotechnology. Biotechnol. Annu. Rev., 1, 105-128(1995)) 등에 기재되어 있다. 또한, 리보솜 결합 부위(RBS)와 개시 코돈 사이의 스페이서 영역, 특히 개시 코돈의 바로 상류의 서열(5'-UTR)에서의 여러 개의 뉴클레오티드의 치환, 또는 삽입, 또는 결실이 mRNA의 안정성 및 번역 효율에 상당히 영향을 끼치는 것으로 알려져 있어, 이들을 개변하는 것도 가능하다.

본 발명에서 사용되는 신호 펩타이드는, 코리네형 세균에서 기능하는 신호 펩타이드인 한 특별히 제한되지 않는다. 신호 펩타이드는 코리네형 세균 유래(예를 들면 숙주 유래)의 신호 펩타이드라도 좋고, 이종 유래의 신호 펩타이드라도 좋다. 신호 펩타이드는 이종 단백질 고유의 신호 펩타이드라도 좋고, 다른 단백질의 신호 펩타이드라도 좋다. 「코리네형 세균에서 기능하는 신호 펩타이드」란, 목적의 단백질의 N 말단에 연결했을 때에, 코리네형 세균이 당해 단백질을 분비할 수 있는 펩타이드를 말한다. 어떤 신호 펩타이드가 코리네형 세균에서 기능하는지 여부는, 예를 들면, 목적의 단백질을 당해 신호 펩타이드와 융합시켜 발현시켜, 당해 단백질이 분비되는지를 확인함으로써 확인할 수 있다.

신호 펩타이드로서는, Tat계 의존성 신호 펩타이드나 Sec계 의존성 신호 펩타이드를 들 수 있다.

「Tat계 의존성 신호 펩타이드」란, Tat계에 의해 인식되는 신호 펩타이드를 말한다. 「Tat계 의존성 신호 펩타이드」란, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Tat계 분비 시스템에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.

Tat계 의존성 신호 펩타이드로서는, 예를 들면, E. 콜라이의 TorA 단백질(트리메틸아민-N-산화환원효소)의 신호 펩타이드, E. 콜라이의 SufI 단백질(ftsI의 억제자)의 신호 펩타이드, 바실러스 서브틸리스의 PhoD 단백질(포스포디에스테라아제)의 신호 펩타이드, 바실러스 서브틸리스의 LipA 단백질(리포산 신타아제)의 신호 펩타이드, 아르트로박터 글로비포르미스의 IMD 단백질(이소말토덱스트라나아제)의 신호 펩타이드를 들 수 있다. 이들 신호 펩타이드의 아미노산 서열은 이하와 같다.

TorA 신호 펩타이드: MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATA(서열번호 18)

SufI 신호 펩타이드: MSLSRRQFIQASGIALCAGAVPLKASA(서열번호 19)

PhoD 신호 펩타이드: MAYDSRFDEWVQKLKEESFQNNTFDRRKFIQGAGKIAGLSLGLTIAQS(서열번호 20)

LipA 신호 펩타이드: MKFVKRRTTALVTTLMLSVTSLFALQPSAKAAEH(서열번호 21)

IMD 신호 펩타이드: MMNLSRRTLLTTGSAATLAYALGMAGSAQA(서열번호 22)

Tat계 의존성 신호 펩타이드는 트윈-아르기닌 모티프를 갖는다. 트윈-아르기닌 모티프로서는, 예를 들면, S/T-R-R-X-F-L-K(서열번호 23)나 R-R-X-#-#(#: 소수성 잔기)(서열번호 24)을 들 수 있다.

「Sec계 의존성 신호 펩타이드」란, Sec계에 의해 인식되는 신호 펩타이드를 말한다. 「Sec계 의존성 신호 펩타이드」란, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Sec계 분비 시스템에 의해 당해 단백질이 분비되는 펩타이드라도 좋다.

Sec계 의존성 신호 펩타이드로서는, 예를 들면, 코리네형 세균의 세포 표층 단백질의 신호 펩타이드를 들 수 있다. 코리네형 세균의 세포 표층 단백질에 대해서는 상술한 바와 같다. 코리네형 세균의 세포 표층 단백질로서는, C. 글루타미쿰에서 유래하는 PS1 및 PS2(CspB)(일본 공개특허공보 특표평6-502548) 및 C. 스타티오니스에서 유래하는 SlpA(CspA)(일본 공개특허공보 특개평10-108675)를 들 수 있다. C. 글루타미쿰의 PS1의 신호 펩타이드(PS1 신호 펩타이드)의 아미노산 서열을 서열번호 25에, C. 글루타미쿰의 PS2(CspB)의 신호 펩타이드(PS2 신호 펩타이드)의 아미노산 서열을 서열번호 26에, C. 스타티오니스의 SlpA(CspA)의 신호 펩타이드(SlpA 신호 펩타이드)의 아미노산 서열을 서열번호 27에 나타낸다.

Tat계 의존성 신호 펩타이드는 트윈-아르기닌 모티프를 갖고, 또한, 원래의 기능이 유지되고 있는 한, 상기 예시한 Tat계 의존성 신호 펩타이드의 변이체라도 좋다. 또한, Sec계 의존성 신호 펩타이드는 원래의 기능이 유지되고 있는 한, 상기 예시한 Sec계 의존성 신호 펩타이드의 변이체라도 좋다. 신호 펩타이드 및 이를 코딩하는 유전자의 변이체에 대해서는, 상기한 RegX3 단백질 및 regX3 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들면, 신호 펩타이드는, 상기 예시한 신호 펩타이드의 아미노산 서열에 있어서, 1개 또는 여러 개의 위치에서의 1개 또는 여러 개의 아미노산이 치환, 결실, 삽입 및/또는 부가된 아미노산 서열을 갖는 펩타이드라도 좋다. 또한, 신호 펩타이드의 변이체에서의 상기 「1개 또는 여러 개」란, 구체적으로는, 바람직하게는 1 내지 7개, 보다 바람직하게는 1 내지 5개, 더 바람직하게는 1 내지 3개, 특히 바람직하게는 1 내지 2개를 의미한다. 또한, 본 발명에 있어서, 「TorA 신호 펩타이드」, 「SufI 신호 펩타이드」, 「PhoD 신호 펩타이드」, 「LipA 신호 펩타이드」, 「IMD 신호 펩타이드」, 「PS1 신호 펩타이드」, 「PS2 신호 펩타이드」, 및 「SlpA 신호 펩타이드」라는 용어에는, 각각, 서열번호 18 내지 27에 기재된 펩타이드 이외에도, 그 보존적 변이체도 포함되는 것으로 한다.

Tat계 의존성 신호 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Tat계에 의해 인식되는 것을 말하고, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Tat계 분비 시스템에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Tat계 의존성 신호 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 시스템의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Tat계 분비 시스템의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.

Sec계 의존성 신호 펩타이드에 대한 「원래의 기능이 유지되고 있다」란, Sec계에 의해 인식되는 것을 말하고, 구체적으로는, 목적의 단백질의 N 말단에 연결했을 때에, Sec계 분비 시스템에 의해 당해 단백질이 분비되는 기능을 갖는 것이라도 좋다. 어떤 펩타이드가 Sec계 의존성 신호 펩타이드로서의 기능을 갖는지 여부는, 예를 들면, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 시스템의 증강에 의해 증대하는 것을 확인하는 것이나, 당해 펩타이드를 N 말단에 부가한 단백질의 분비 생산량이 Sec계 분비 시스템의 결손에 의해 감소하는 것을 확인함으로써 확인할 수 있다.

신호 펩타이드는, 일반적으로, 번역 산물이 균체 외로 분비될 때에 신호 펩티다아제에 의해 절단된다. 즉, 최종적으로 얻어지는 이종 단백질은 신호 펩타이드를 갖고 있지 않아도 좋다. 또한, 신호 펩타이드를 코딩하는 유전자는 천연형 그대로도 사용할 수 있지만, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변해도 좋다.

본 발명에서 사용되는 유전자 구축물에 있어서는, 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열이 삽입되어 있어도 좋다(WO2013/062029). 또한, 당해 「Gln-Glu-Thr을 포함하는 아미노산 서열」을 「본 발명에서 사용되는 삽입 서열」이라고도 한다. 본 발명에서 사용되는 삽입 서열로서는, WO2013/062029에 기재된 Gln-Glu-Thr을 포함하는 아미노산 서열을 들 수 있다. 본 발명에서 사용되는 삽입 서열은, 특히, Sec계 의존성 신호 펩타이드와 조합하여 적합하게 사용할 수 있다.

본 발명에서 사용되는 삽입 서열은, 코리네형 세균의 세포 표층 단백질 CspB의 성숙 단백질(이하, 「성숙 CspB」 또는 「CspB 성숙 단백질」이라고도 한다)의 N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열인 것이 바람직하다. 「N 말단으로부터의 3 아미노산 잔기 또는 그 이상으로 이루어지는 서열」이란, N 말단의 1 위치의 아미노산 잔기로부터, 3 위치 또는 그 이상의 아미노산 잔기까지의 아미노산 서열을 말한다.

코리네형 세균의 세포 표층 단백질 CspB에 대해서는 상술한 바와 같다. CspB로서, 구체적으로는, 예를 들면, C. 글루타미쿰 ATCC 13869의 CspB나 상기 예시한 28주의 C. 글루타미쿰의 CspB, 및 이들의 변이체를 들 수 있다. 서열번호 11에 나타낸 C. 글루타미쿰 ATCC 13869의 CspB의 아미노산 서열 중, 1 내지 30 위치의 아미노산 잔기가 신호 펩타이드에 상당하고, 31 내지 499 위치의 아미노산 잔기가 CspB 성숙 단백질에 상당한다. 신호 펩타이드 부분 30 아미노산 잔기를 제외한, C. 글루타미쿰 ATCC 13869의 CspB 성숙 단백질의 아미노산 서열을 서열번호 28에 나타낸다. 또한, C. 글루타미쿰 ATCC 13869의 성숙 CspB에 있어서, N 말단의 1 내지 3 위치의 아미노산 잔기가 Gln-Glu-Thr에 상당한다.

본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 3 내지 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 3 내지 8, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 보다 바람직하다. 본 발명에서 사용되는 삽입 서열은 성숙 CspB의 1 위치의 아미노산 잔기로부터, 4, 6, 17, 50 위치 중 어느 하나의 아미노산 잔기까지의 아미노산 서열인 것이 특히 바람직하다.

본 발명에서 사용되는 삽입 서열은, 예를 들면, 하기 (A) 내지 (H)의 아미노산 서열로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.

(A) Gln-Glu-Thr

(B) Gln-Glu-Thr-Xaa1(서열번호 29)

(C) Gln-Glu-Thr-Xaa1-Xaa2(서열번호 30)

(D) Gln-Glu-Thr-Xaa1-Xaa2-Xaa3(서열번호 31)

(E) 성숙 CspB의 4 내지 7 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열

(F) 성숙 CspB의 4 내지 8 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열

(G) 성숙 CspB의 4 내지 17 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열

(H) 성숙 CspB의 4 내지 50 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어지는 아미노산 서열

(A) 내지 (H)의 아미노산 서열에 있어서, Xaa1은 Asn, Gly, Thr, Pro, 또는 Ala이며, Xaa2는 Pro, Thr, 또는 Val이며, Xaa3은 Thr 또는 Tyr이다. 또한, (A) 내지 (H)의 아미노산 서열에 있어서, 「성숙 CspB의 4 내지 X 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr」이란, Gln-Glu-Thr의 Thr에 성숙 CspB의 N 말단의 4 위치로부터 X 위치까지의 아미노산 잔기가 융합되어 있는 것을 의미한다. 또한, 통상, 성숙 CspB의 N 말단의 1 내지 3번째의 아미노산 잔기는 Gln-Glu-Thr이며, 이 경우, 「성숙 CspB의 4 내지 X 위치의 아미노산 잔기와 융합된 Gln-Glu-Thr로 이루어진 아미노산 서열」이란, 성숙 CspB의 1 내지 X 위치의 아미노산 잔기로 이루어지는 아미노산 서열과 같은 뜻이다.

또한, 본 발명에서 사용되는 삽입 서열은, 구체적으로는, 예를 들면, Gln-Glu-Thr-Asn-Pro-Thr(서열번호 32), Gln-Glu-Thr-Gly-Thr-Tyr(서열번호 33), Gln-Glu-Thr-Thr-Val-Thr(서열번호 34), Gln-Glu-Thr-Pro-Val-Thr(서열번호 35), 및 Gln-Glu-Thr-Ala-Val-Thr(서열번호 36)로 이루어지는 그룹으로부터 선택되는 아미노산 서열인 것이 바람직하다.

본 발명에 있어서, 「성숙 CspB의 X 위치의 아미노산 잔기」란, 서열번호 28에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기를 의미한다. 임의의 성숙 CspB의 아미노산 서열에 있어서, 어느 아미노산 잔기가 「서열번호 28에서의 X 위치의 아미노산 잔기에 상당하는 아미노산 잔기」인지는, 당해 임의의 성숙 CspB의 아미노산 서열과 서열번호 28의 아미노산 서열과 정렬을 행함으로써 결정할 수 있다.

본 발명의 방법에 의해 분비 생산되는 이종 단백질로서는, 예를 들면, 생리활성 단백질, 수용체 단백질, 백신으로서 사용되는 항원 단백질, 효소, 그 외 임의의 단백질을 들 수 있다.

효소로서는, 예를 들면, 트랜스글루타미나아제, 프로테인 글루타미나아제, 이소말토덱스트라나아제, 프로테아제, 엔도펩티다아제, 엑소펩티다아제, 아미노펩티다아제, 카르복시펩티다아제, 콜라게나아제, 및 키티나아제 등을 들 수 있다. 트랜스글루타미나아제로서는, 예를 들면, 스트렙토버티실리움 모바렌세(Streptoverticillium mobaraense) IFO 13819(WO01/23591), 스트렙토버티실리움 시나모네움(Streptoverticillium cinnamoneum) IFO 12852, 스트렙토버티실리움 그리세오카르네움 (Streptoverticillium griseocarneum) IFO 12776, 스트렙토마이세스 리디쿠스(Streptomyces lydicus) (WO96/06931) 등의 방선균이나, Oomycetes(WO96/22366) 등의 사상균의 분비형 트랜스글루타미나아제를 들 수 있다. 프로테인 글루타미나아제로서는, 예를 들면, 크리세오박테리움 프로테오리티쿰(Chryseobacterium proteolyticum)의 프로테인 글루타미나아제를 들 수 있다(WO2005/103278). 이소말토덱스트라나아제로서는, 예를 들면, 아트로박터 글로비포르미스의 이소말토덱스트라나아제를 들 수 있다(WO2005/103278).

생리활성 단백질로서는, 예를 들면, 성장 인자(증식 인자), 호르몬, 사이토카인, 항체 관련 분자를 들 수 있다.

성장 인자(증식 인자)로서, 구체적으로는, 예를 들면, 표피 성장 인자(EGF), 인슐린 성장 인자-1(IGF-1), 형질전환 성장 인자(TGF), 신경 성장 인자(NGF), 뇌 유래 신경영양 인자(BDNF), 혈관 내피세포 증식 인자(VEGF), 과립구 콜로니 자극 인자(G-CSF), 과립구 마크로파지 콜로니 자극 인자(GM-CSF), 혈소판 유래 성장 인자(PDGF), 에리트로포이에틴(EPO), 트롬보포이에틴(TPO), 산성 섬유아세포 증식 인자(aFGF 또는 FGF1), 염기성 섬유아세포 증식 인자(bFGF 또는 FGF2), 각질세포 증식 인자(KGF-1 또는 FGF7, KGF-2 또는 FGF10), 간세포 증식 인자(HGF)를 들 수 있다.

호르몬으로서, 구체적으로는, 예를 들면, 인슐린, 글루카곤, 소마토스타틴, 인간 성장 호르몬(hGH), 부갑상선 호르몬(PTH), 칼시토닌, 엑세나타이드를 들 수 있다.

사이토카인으로서, 구체적으로는, 예를 들면, 인터루킨, 인터페론, 종양 괴사 인자(TNF)를 들 수 있다.

또한, 성장 인자(증식 인자), 호르몬, 및 사이토카인은 서로 엄밀하게 구별되지 않아도 좋다. 예를 들면, 생리활성 단백질은 성장 인자(증식 인자), 호르몬, 및 사이토카인으로부터 선택되는 어느 하나의 그룹에 속하는 것이라도 좋고, 이들로부터 선택되는 복수의 그룹에 속하는 것이라도 좋다.

또한, 생리활성 단백질은 단백질 전체라도 좋고, 그 일부라도 좋다. 단백질의 일부로서는, 예를 들면, 생리활성을 갖는 부분을 들 수 있다. 생리활성을 갖는 부분으로서, 구체적으로는, 예를 들면, 부갑상선 호르몬(PTH) 성숙체의 N 말단 34 아미노산 잔기로 이루어지는 생리활성 펩타이드 테리파라타이드를 들 수 있다.

「항체 관련 분자」란, 완전 항체를 구성하는 도메인으로부터 선택되는 단일의 도메인 또는 2 혹은 그 이상의 도메인의 조합으로 이루어지는 분자종을 포함하는 단백질을 말한다. 완전 항체를 구성하는 도메인으로서는, 중쇄의 도메인인 VH, CH1, CH2, 및 CH3, 및 경쇄의 도메인인 VL 및 CL을 들 수 있다. 항체 관련 분자는 상기의 분자종을 포함하는 한, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 또한, 항체 관련 분자가 다량체 단백질인 경우에는, 단일 종류의 서브유닛으로 이루어지는 호모 다량체라도 좋고, 2 이상의 종류의 서브유닛으로 이루어지는 헤테로 다량체라도 좋다. 항체 관련 분자로서, 구체적으로는, 예를 들면, 완전 항체, Fab, F(ab')、F(ab')₂, Fc, 중쇄(H쇄)와 경쇄(L쇄)로 이루어지는 2량체, Fc 융합 단백질, 중쇄(H쇄), 경쇄(L쇄), 단쇄 Fv(scFv), sc(Fv)₂, 이황화 결합 Fv(sdFv), 이원항체, VHH 단편(Nanobody(등록상표))를 들 수 있다. 항체 관련 분자로서, 더 구체적으로는, 예를 들면, 트라스투주맙을 들 수 있다.

수용체 단백질은 특별히 제한되지 않고, 예를 들면, 생리활성 단백질이나 그 밖의 생리활성 물질에 대한 수용체 단백질이라도 좋다. 그 밖의 생리활성 물질로서는, 예를 들면, 도파민 등의 신경전달물질을 들 수 있다. 또한, 수용체 단백질은, 대응하는 리간드가 알려져 있지 않은 희귀 수용체라도 좋다.

백신으로서 사용되는 항원 단백질은 면역 반응을 유도할 수 있는 것이면 특별히 제한되지 않고, 상정하는 면역 반응의 대상에 따라 적절히 선택하면 좋다.

또한, 그 밖의 단백질로서, 간형 지방산 결합 단백질(Liver-type fatty acid-binding protein, LFABP), 형광 단백질, 면역글로블린 결합 단백질, 알부민, 세포 외 단백질을 들 수 있다. 형광 단백질로서는 녹색 형광 단백질(GFP)을 들 수 있다. 면역글로블린 결합 단백질로서는 단백질 A, 단백질 G, 단백질 L을 들 수 있다. 알부민으로서는 인간 혈청 알부민을 들 수 있다.

세포 외 단백질로서는, 피브로넥틴, 비트로넥틴, 콜라겐, 오스테오폰틴, 라미닌, 이들의 부분 서열을 들 수 있다. 라미닌은 α쇄, β쇄, 및 γ쇄로 이루어지는 헤테로 3량체 구조를 갖는 단백질이다. 라미닌으로서는, 포유류의 라미닌을 들 수 있다. 포유류로서는, 인간, 원숭이, 침팬지 등의 영장류, 마우스, 쥐, 햄스터, 모르모트 등의 설치류, 토끼, 말, 소, 양, 염소, 돼지, 개, 고양이 등 그 밖의 각종 포유류를 들 수 있다. 포유류로서는, 특히 인간을 들 수 있다. 라미닌의 서브유닛쇄(즉, α쇄, β쇄, 및 γ쇄)로서는, 5종의 α쇄(α1 내지 α5), 3종의 β쇄(β1 내지 β3), 3종의 γ쇄(γ1 내지 γ3)를 들 수 있다. 라미닌은 이들 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌으로서, 구체적으로는, 예를 들면, 라미닌 111, 라미닌 121, 라미닌 211, 라미닌 213, 라미닌 221, 라미닌 311, 라미닌 321, 라미닌 332, 라미닌 411, 라미닌 421, 라미닌 423, 라미닌 511, 라미닌 521, 라미닌 523을 들 수 있다. 라미닌의 부분 서열로서는, 라미닌의 E8 단편인 라미닌 E8을 들 수 있다. 라미닌 E8은, 구체적으로는, α쇄의 E8 단편(α쇄 E8), β쇄의 E8 단편(β쇄 E8), 및 γ쇄의 E8 단편(γ쇄 E8)으로 이루어지는 헤테로 3량체 구조를 갖는 단백질이다. 라미닌 E8의 서브유닛쇄(즉, α쇄 E8, β쇄 E8, 및 γ쇄 E8)를 총칭하여 「E8 서브유닛쇄」이라고도 한다. E8 서브유닛쇄로서는, 상기 예시한 라미닌 서브유닛쇄의 E8 단편을 들 수 있다. 라미닌 E8은 이들 E8 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌 E8로서, 구체적으로는, 예를 들면, 라미닌 111E8, 라미닌 121E8, 라미닌 211E8, 라미닌 221E8, 라미닌 332E8, 라미닌 421E8, 라미닌 411E8, 라미닌 511E8, 라미닌 521E8을 들 수 있다.

이들 단백질 등의 이종 단백질을 코딩하는 유전자는 그대로, 또는 적절히 개변하여 이용할 수 있다. 이종 단백질을 코딩하는 유전자는, 예를 들면, 사용하는 숙주에 따라, 및/또는 원하는 활성을 얻기 위해 개변할 수 있다. 예를 들면, 이종 단백질을 코딩하는 유전자는, 코딩되는 이종 단백질의 아미노산 서열에 1개 또는 여러 개의 아미노산의 치환, 결실, 삽입 및/또는 부가가 포함되도록 개변되어도 좋다. 상기한 RegX3 단백질 및 regX3 유전자의 변이체에 관한 기재는, 본 발명의 방법에 의해 분비 생산되는 이종 단백질 및 이를 코딩하는 유전자에도 준용할 수 있다. 또한, 유래하는 생물종으로 특정되는 단백질은, 당해 생물종에서 발견되는 단백질 자체에 한정되지 않고, 당해 생물종에서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 이들의 변이체도 포함하는 것으로 한다. 이들 변이체는 당해 생물종에서 발견되어도 좋고, 발견되지 않아도 좋다. 즉, 예를 들면, 「인간 유래 단백질」이란, 인간에게서 발견되는 단백질 자체에 한정되지 않고, 인간에게서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 이들의 변이체를 포함하는 것으로 한다. 또한, 이종 단백질을 코딩하는 유전자는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 예를 들면, 이종 단백질을 코딩하는 유전자는, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 개변되어도 좋다.

본 발명의 유전자 구축물은, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하고 있어도 좋다. 효소적 절단에 사용되는 아미노산 서열을 본 발명의 융합 단백질에 삽입함으로써, 발현된 융합 단백질을 효소적으로 절단하여 목적의 이종 단백질을 얻을 수 있다.

효소적 절단에 사용되는 아미노산 서열은, 펩타이드 결합을 가수분해하는 효소에 의해 인식되고 절단되는 서열이면 특별히 제한되지 않고, 목적의 이종 단백질의 아미노산 서열에 따라 사용 가능한 서열을 적절히 선택하면 좋다. 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열은, 이 아미노산 서열에 기초하여 적절히 설계할 수 있다. 예를 들면, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열은, 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 설계할 수 있다.

효소적 절단에 사용되는 아미노산 서열은, 기질 특이성이 높은 프로테아제의 인식 서열인 것이 바람직하다. 이러한 아미노산 서열로서, 구체적으로는, 예를 들면, 인자 Xa 프로테아제의 인식 서열이나 proTEV 프로테아제의 인식 서열을 들 수 있다. 인자 Xa 프로테아제는 단백질 중의 Ile-Glu-Gly-Arg(=IEGR, 서열번호 37)의 아미노산 서열을, proTEV 프로테아제는 단백질 중의 Glu-Asn-Leu-Tyr-Phe-Gln(=ENLYFQ, 서열번호 38)의 아미노산 서열을 인식하고, 각 서열의 C 말단측을 특이적으로 절단한다.

본 발명의 방법에 의해 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일해도 좋고, 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 비교하여, 1개 또는 여러 개의 아미노산을 여분으로 부가된, 또은 결실된 것이라도 좋다. 또한 상기 「1개 또는 여러 개」란, 목적의 이종 단백질의 전체 길이나 구조 등에 따라서도 다르지만, 구체적으로는 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.

또한, 분비 생산되는 이종 단백질은 프로 구조부가 부가된 단백질(프로단백질)이라도 좋다. 분비 생산되는 이종 단백질이 프로단백질인 경우, 최종적으로 얻어지는 이종 단백질은 프로단백질이라도 좋고, 그렇지 않아도 좋다. 즉, 프로단백질은 프로 구조부를 절단하여 성숙 단백질이 되어도 좋다. 절단은, 예를 들면, 프로테아제에 의해 행할 수 있다. 프로테아제를 사용하는 경우에는, 최종적으로 얻어지는 단백질의 활성이라는 관점에서, 프로단백질은 일반적으로는 천연의 단백질과 거의 같은 위치에서 절단되는 것이 바람직하고, 천연의 단백질과 완전하게 같은 위치에서 절단되어 천연의 것과 동일한 성숙 단백질이 얻어지는 것이 보다 바람직하다. 따라서, 일반적으로는, 천연에서 생기는 성숙 단백질과 동일한 단백질이 생기는 위치에서 프로단백질을 절단하는 특이적 프로테아제가 가장 바람직하다. 그러나, 상술한 바와 같이, 최종적으로 얻어지는 이종 단백질의 N 말단 영역은 천연의 단백질과 동일하지 않아도 좋다. 예를 들면, 생산되는 이종 단백질의 종류나 사용 목적 등에 따라서는, 천연의 단백질에 비해 N 말단이 아미노산 잔기 1 내지 여러 개분으로 길거나 짧은 단백질이 보다 적절한 활성을 갖는 경우가 있다. 본 발명에서 사용할 수 있는 프로테아제에는, 디스파제(Dispase, 베링거 만하임사 제조)과 같은 상업적으로 입수할 수 있는 것 이외에, 미생물의 배양액, 예를 들면 방선균의 배양액 등으로부터 얻어지는 것이 포함된다. 이러한 프로테아제는 미정제 상태에서 사용할 수도 있고, 필요에 따라 적당한 순도까지 정제한 후에 사용해도 좋다. 또한, 프로 구조부를 절단하여 성숙 단백질을 얻는 경우에는, 삽입한 Gln-Glu-Thr을 포함하는 아미노산 서열은 프로 구조부와 함께 절단 제거되기 때문에, Gln-Glu-Thr을 포함하는 아미노산 서열 후에 효소적 절단에 사용되는 아미노산 서열을 제공하지 않아도 목적의 단백질을 얻을 수 있다.

본 발명에 사용되는 유전자 구축물을 코리네형 세균에 도입하는 수법은 특별히 제한되지 않는다. 「본 발명에 사용되는 유전자 구축물의 도입」이란, 이 유전자 구축물을 숙주에 유지시키는 것을 말한다. 「본 발명에 사용되는 유전자 구축물의 도입」에는, 미리 구축한 이 유전자 구축물을 숙주에 일괄하여 도입하는 경우에 한정되지 않고, 적어도 이종 단백질 유전자가 숙주에 도입되고, 숙주 내에서 이 유전자 구축물이 구축되는 경우도 포함된다. 본 발명의 세균에 있어서, 본 발명에 사용되는 유전자 구축물은, 플라스미드와 같이 염색체 외에서 자율 증식하는 벡터 위에 존재해 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 본 발명에 사용되는 유전자 구축물의 도입은, 예를 들면, 상기한 유전자의 발현을 상승시키는 수법에서의 유전자의 도입과 마찬가지로 행할 수 있다. 또한, 본 발명의 세균을 구축함에 있어서, 본 발명에 사용되는 유전적 구축물의 도입, 특정한 성질의 부여, 및 그 외의 개변은 임의의 순서로 행할 수 있다.

본 발명에 사용되는 유전자 구축물은, 예를 들면, 이 유전자 구축물을 포함하는 벡터를 사용하여 숙주에 도입할 수 있다. 예를 들면, 본 발명에 사용되는 유전자 구축물을 벡터와 연결하여 이 유전자 구축물의 발현 벡터를 구축하고, 당해 발현 벡터로 숙주를 형질 전환함으로써, 이 유전자 구축물을 숙주에 도입할 수 있다. 또한, 예를 들면, 벡터가 코리네형 세균에서 기능하는 프로모터를 구비할 경우, 당해 프로모터의 하류에 본 발명의 융합 단백질을 코딩하는 염기서열을 연결함으로써도, 본 발명에 사용되는 유전자 구축물의 발현 벡터를 구축할 수 있다. 벡터는, 코리네형 세균에서 자율 복제 가능한 것이면 특별히 제한되지 않는다. 코리네형 세균에서 이용할 수 있는 벡터에 대해서는 상술한 바와 같다.

또한, 본 발명에 사용되는 유전자 구축물은, 예를 들면, 인공 트랜스포존 등의 트랜스포존을 사용하여 숙주의 염색체 위에 도입할 수 있다. 트랜스포존이 사용되는 경우에는, 상동 재조합 또는 그 자신의 전이능에 의해 본 발명에 사용되는 유전자 구축물이 염색체 위에 도입된다. 또한, 본 발명에 사용되는 유전자 구축물은 그 외에, 상동 재조합을 이용하는 도입법에 의해 숙주의 염색체 위에 도입할 수 있다. 상동 재조합을 이용하는 도입법으로서는, 예를 들면, 직쇄상 DNA, 온도 감수성 복제 기점을 포함하는 플라스미드, 접합 전달 가능한 플라스미드, 또는 숙주 내에서 기능하는 복제 기점을 갖지 않는 자살 벡터 등을 사용하는 방법을 들 수 있다. 또한, 적어도 이종 단백질 유전자를 염색체 위에 도입하고, 본 발명에 사용되는 유전자 구축물을 염색체 위에 구축해도 좋다. 이 경우, 이종 단백질 유전자 이외의, 본 발명에 사용되는 유전자 구축물의 구성 요소의 일부 또는 전부는 숙주의 염색체 위에 원래 존재하는 것이라도 좋다. 구체적으로는, 예를 들면, 숙주의 염색체 위에 원래 존재하는 프로모터 서열과 이 프로모터 서열의 하류에 접속된 신호 펩타이드를 코딩하는 핵산 서열을 그대로 이용하고, 이 신호 펩타이드를 코딩하는 핵산 서열의 하류에 접속된 유전자만을 목적의 이종 단백질 유전자로 치환함으로써도, 염색체 위에 본 발명에 사용되는 유전자 구축물이 구축되고, 본 발명의 세균을 구축할 수 있다. 이종 단백질 유전자 등의, 본 발명에 사용되는 유전자 구축물의 일부의 염색체로의 도입은, 본 발명에 사용되는 유전자 구축물의 염색체로의 도입과 마찬가지로 행할 수 있다.

본 발명에 사용되는 유전자 구축물이나 그 구성 요소(프로모터 서열, 신호 펩타이드를 코딩하는 핵산 서열, 이종 단백질을 코딩하는 핵산 서열 등)는, 예를 들면, 클로닝에 의해 취득할 수 있다. 구체적으로는, 예를 들면, 목적의 이종 단백질을 갖는 생물로부터의 클로닝에 의해 이종 단백질 유전자를 취득하고, 신호 펩타이드를 코딩하는 염기서열의 도입이나 프로모터 서열의 도입 등의 개변을 행하여, 본 발명에 사용되는 유전자 구축물을 취득할 수 있다. 또한, 본 발명에 사용되는 유전자 구축물이나 그 구성 요소는 화학 합성에 의해서도 취득할 수 있다(Gene, 60(1), 115-127(1987)). 취득한 유전자 구축물이나 그 구성 요소는 그대로, 또는 적절히 개변하여 이용할 수 있다.

또한, 2 이상의 종류의 단백질이 발현되는 경우, 각 단백질의 분비 발현용의 유전자 구축물은, 목적의 이종 단백질의 분비 발현을 달성할 수 있도록 본 발명의 세균에 유지되어 있으면 좋다. 구체적으로는, 예를 들면, 각 단백질의 분비 발현용의 유전자 구축물은, 모두가 단일의 발현 벡터 위에 유지되어 있어도 좋고, 모두가 염색체 위에 유지되어 있어도 좋다. 또한, 각 단백질의 분비 발현용의 유전자 구축물은, 복수의 발현 벡터 위에 각각 유지되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 각각 유지되어 있어도 좋다. 「2 이상의 종류의 단백질이 발현되는 경우」란, 예를 들면, 2 이상의 종류의 이종 단백질이 분비 생산되는 경우나, 헤테로 다량체 단백질이 분비 생산되는 경우를 말한다.

본 발명에 사용되는 유전자 구축물의 코리네형 세균으로의 도입 방법은 특별히 한정되지 않고, 일반적으로 사용되는 방법, 예를 들면, 원형질법 (Gene, 39, 281-286(1985)), 전기천공법(Bio/Technology, 7, 1067-1070(1989)), 전기 펄스법(일본 공개특허공보 특개평2-207791호) 등을 사용할 수 있다.

<2> 이종 단백질의 제조 방법

상기한 바와 같이 하여 얻어지는 본 발명의 세균을 배양하고, 이종 단백질을 발현시킴으로써, 균체 외에 분비된 다량의 이종 단백질이 얻어진다.

본 발명의 세균은 통상 사용되는 방법 및 조건에 따라 배양할 수 있다. 예를 들면, 본 발명의 세균은 탄소원, 질소원, 무기 이온을 함유하는 통상의 배지에서 배양할 수 있다. 또한 높은 증식을 얻기 위해서, 비타민, 아미노산 등의 유기 미량 영양소를 필요에 따라 첨가할 수도 있다.

탄소원으로서는 글루코스 및 수크로스와 같은 탄수화물, 아세트산과 같은 유기산, 알코올류, 그 외를 사용할 수 있다. 질소원으로서는 암모니아 가스, 암모니아수, 암모늄염, 그 외를 사용할 수 있다. 무기 이온으로서는 칼슘 이온, 마그네슘 이온, 인산 이온, 칼륨 이온, 철 이온 등을 필요에 따라 적절히 사용한다. 배양은 pH 5.0 내지 8.5, 15℃ 내지 37℃의 적절한 범위로 호기적 조건 하에서 행하고, 1 내지 7일간 정도 배양한다. 또한, 코리네형 세균의 Ｌ-아미노산 생산에서의 배양 조건이나, 그 외 Sec계 의존, Tat계 의존의 신호 펩타이드를 사용한 단백질의 제조법에 기재된 조건을 사용할 수 있다(WO01/23591, WO2005/103278 참조). 또한, 이종 단백질의 발현을 위해 유도형 프로모터를 사용한 경우에는, 배지에 프로모터 유도제를 첨가하여 배양을 행할 수도 있다. 이러한 조건 하에서 본 발명의 세균을 배양함으로써, 목적 단백질은 균체 내에서 다량으로 생산되어 효율적으로 균체 외에 분비된다. 또한, 본 발명의 방법에 의하면, 생산된 이종 단백질은 균체 외에 분비되기 때문에, 예를 들면 트랜스글루타미나아제 등의 미생물의 균체 내에서 다량으로 축적되면 일반적으로 치사적인 단백질도, 치사적 영향을 받지 않고 연속적으로 생산할 수 있다.

본 발명의 방법에 의해 배지 중에 분비된 단백질은, 당업자에게 잘 알려진 방법에 따라 배양 후의 배지로부터 분리 정제할 수 있다. 예를 들면, 균체를 원심분리 등에 의해 제거한 후, 염석, 에탄올 침전, 한외 여과, 겔 여과 크로마토그래피, 이온 교환 컬럼 크로마토그래피, 친화성 크로마토그래피, 중고압 액체 크로마토그래피, 역상 크로마토그래피, 소수성 크로마토그래피 등 알려진 적절한 방법, 또는 이들을 조합함으로써 분리 정제할 수 있다. 또한, 어떤 경우에는, 배양물이나 배양 상청을 그대로 사용해도 좋다. 본 발명의 방법에 의해 균체 표층에 분비된 단백질도 당업자에게 잘 알려진 방법, 예를 들면 염 농도의 상승, 계면활성제의 사용 등에 의해 가용화한 후에, 배지 중에 분비된 경우와 마찬가지로 하여 분리 정제할 수 있다. 또한, 어떤 경우에는, 균체 표층에 분비된 단백질을 가용화하지 않고, 예를 들면 고정화 효소로서 사용해도 좋다.

목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여 SDS-PAGE를 행하여, 분리된 단백질 밴드의 분자량을 확인함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여, 항체를 사용한 웨스턴 블롯팅에 의해 확인할 수 있다(Molecular cloning, Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001). 또한, 목적의 이종 단백질이 분비 생산된 것은, 단백질 서열분석기를 사용하여 목적 단백질의 N 말단 아미노산 서열을 검출함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 분비 생산된 것은, 질량 분석계를 사용하여 목적 단백질의 질량을 결정함으로써 확인할 수 있다. 또한, 목적의 이종 단백질이 효소나 어떤 측정 가능한 생리활성을 갖는 것인 경우에는, 목적의 이종 단백질이 분비 생산된 것은, 배양 상청 및/또는 균체 표층을 포함하는 분획을 시료로 하여, 목적의 이종 단백질의 효소활성 또는 생리활성을 측정함으로써 확인할 수 있다.

실시예

이하, 실시예를 참조하여 본 발명을 더 구체적으로 설명하지만, 본 발명은 이들 실시예에 한정되는 것은 아니다.

실시예 1: regX3 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축

(1) regX3 유전자 결손용 벡터 pBS5TΔregX3의 구축

C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 2성분 제어계 SenX3-RegX3의 반응 조절인자 RegX3을 코딩하는 regX3 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0104880).

PurElute^TM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 49와 서열번호 50의 프라이머를 사용하여 regX3 유전자의 5'측 상류 약 1 kbp를, 서열번호 51과 서열번호 52의 프라이머를 사용하여 regX3 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. 다음에, 증폭된 양 DNA 단편을 주형으로, 서열번호 49와 서열번호 52에 나타낸 DNA를 프라이머로서 사용한 PCR법에 의해 양 DNA 단편이 융합된 약 2 kbp의 DNA 단편을 얻었다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, regX3 유전자 결손용의 벡터 pBS5TΔregX3을 얻었다. 결찰 반응에는 DNA 결찰 키트<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.

(2) YDK010::phoS(W302C)주의 regX3 유전자 결손주의 구축

실시예 1(1)에서 구축한 pBS5TΔregX3으로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자가 결손된 YDK010::phoS(W302C)ΔregX3주를 얻었다.

실시예 2: hrrA 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축

(1) hrrA 유전자 결손용 벡터 pBS5TΔhrrA의 구축

C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 2성분 제어계 HrrSA의 반응 조절인자 HrrA를 코딩하는 hrrA 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0128750).

PurElute^TM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 53과 서열번호 54의 프라이머를 사용하여 hrrA 유전자의 5'측 상류 약 1 kbp를, 서열번호 55와 서열번호 56의 프라이머를 사용하여 hrrA 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 증폭된 각각 약 1 kbp의 DNA 단편을 아가로스 겔 전기영동 후, 목적의 밴드를 잘라내고, Wizard® SV 겔 및 PCR 클린업 시스템(Promega)을 사용하여 겔에서 회수하였다. 회수한 2개의 DNA 단편을, 인퓨전 반응에 의해 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, hrrA 유전자 결손용 벡터 pBS5TΔhrrA를 얻었다. 인퓨전 반응에는 인퓨전® HD 클로닝 키트(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.

(2) YDK010::phoS(W302C)주의 hrrA 유전자 결손주의 구축

실시예 2(1)에서 구축한 pBS5TΔhrrA로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrrA 유전자가 결손된 YDK010::phoS(W302C)ΔhrrA주를 얻었다.

실시예 3: hrcA 유전자를 결손시킨 코리네박테리움 글루타미쿰의 구축

(1) hrrA 유전자 결손용 벡터 pBS5TΔhrcA의 구축

C. 글루타미쿰 ATCC 13869주의 유전체 서열 및 열 충격 단백질의 전사 제어 인자 HrcA를 코딩하는 hrcA 유전자의 염기서열은 이미 결정되어 있다(GenBank 등록번호 AP017557, NCBI locus_tag CGBL_0121890).

PurElute^TM 유전체 DNA 키트(EdgeBio)를 사용하여 조제한 C. 글루타미쿰 ATCC 13869주의 염색체 DNA를 주형으로 하여, 서열번호 57과 서열번호 58의 프라이머를 사용하여 hrcA 유전자의 5'측 상류 약 1 kbp를, 서열번호 59와 서열번호 60의 프라이머를 사용하여 hrcA 유전자의 3'측 하류 약 1 kbp의 영역을, 각각 PCR법에 의해 증폭하였다. 다음에, 증폭된 양 DNA 단편을 주형으로, 서열번호 57과 서열번호 60에 나타낸 DNA를 프라이머로서 사용한 PCR법으로 의해 양 DNA 단편이 융합된 약 2 kbp의 DNA 단편을 얻었다. PCR에는 Pyrobest® DNA 폴리머라제(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다. 이 DNA 단편을 WO2006/057450에 기재된 pBS5T의 SmaI 부위에 삽입함으로써, hrcA 유전자 결손용의 벡터 pBS5TΔhrcA를 얻었다. 결찰 반응에는 DNA 결찰 키트<Mighty Mix>(Takara Bio)를 사용하고, 반응 조건은 업자가 권장하는 프로토콜에 따랐다.

(2) YDK010::phoS(W302C)주의 hrcA 유전자 결손주의 구축

실시예 3(1)에서 구축한 pBS5TΔhrcA로, WO2016/171224에 기재된YDK010::phoS(W302C)주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrcA 유전자가 결손된 YDK010::phoS(W302C)ΔhrcA주를 얻었다.

실시예 4: regX3 및 hrcA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축

실시예 3(1)에서 구축한 pBS5TΔhrcA로, 실시예 1(2)에서 구축한 YDK010::phoS(W302C)ΔregX3주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrcA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrcA주를 얻었다.

실시예 5: hrrA 및 hrcA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축

실시예 3(1)에서 구축한 pBS5TΔhrcA로, 실시예 2(2)에서 구축한 YDK010::phoS(W302C)ΔhrrA주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, hrrA 유전자와 hrcA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔhrrAΔhrcA주를 얻었다.

실시예 6: regX3 및 hrrA 유전자를 2중 결손시킨 코리네박테리움 글루타미쿰의 구축

실시예 2(1)에서 구축한 pBS5TΔhrrA로, 실시예 1(2)에서 구축한 YDK010::phoS(W302C)ΔregX3주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrrA 유전자가 2중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrrA주를 얻었다.

실시예 7: regX3, hrrA, 및 hrcA 유전자를 3중 결손시킨 코리네박테리움 글루타미쿰의 구축

실시예 2(1)에서 구축한 pBS5TΔhrrA로, 실시예 4(2)에서 구축한 YDK010::phoS(W302C)ΔregX3ΔhrcA주를 형질 전환하였다. 얻어진 형질 전환체로부터 WO2006/057450에 기재된 방법에 따라 균주의 선택을 행하여, regX3 유전자와 hrrA 유전자와 hrcA 유전자가 3중 결손된 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 얻었다.

실시예 8: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 VHH 항체 N15의 분비 발현

(1) VHH 항체 N15의 분비 발현 플라스미드의 구축

단백질 IZUMO1의 N 말단 도메인에 대한 VHH 항체 N15의 아미노산 서열은 이미 결정되어 있다(DDBJ 등록번호: AB926006). 이 아미노산 서열을 <서열번호 61>에 나타내었다. C. 글루타미쿰의 코돈 사용 빈도를 고려하여, N15를 코딩하는 염기서열을 디자인하였다. 디자인한 염기서열을 <서열번호 62>에 나타낸다. 다음에, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자의 프로모터의 하류에 C. 암모니아게네스 ATCC 6872주 유래의 CspA(SlpA라고도 한다; GenBank 등록번호 BAB62413)의 신호 펩타이드 25 아미노산 잔기를 코딩하는 DNA 및 <서열번호 62>에 기재된 DNA를 연결하고, 또한 5'-측에 KpnI 부위를, 3'-측에 BamHI 부위를 부가한 신호 펩타이드와 N15와의 융합 단백질(이하, 단지 N15로 표기한다)의 발현 카세트를 전부 합성하였다. 전부 합성한 DNA 단편을 제한 효소 KpnI 및 BamHI로 처리한 후에, 일본 공개특허공보 특개평9-322774에 기재된 pPK4의 KpnI-BamHI 부위에 삽입함으로써, N15의 분비 발현 플라스미드인 pPK4_CspAss_N15를 구축하였다. 삽입 단편의 염기서열 결정의 결과, 설계대로의 N15를 코딩하는 유전자가 구축되어 있는 것을 확인하였다. 염기서열의 결정은 BigDye® 터미네이터(v3.1) 사이클 시퀀싱 키트 (Applied Biosystems)와 3130 유전자 분석기 (Applied Biosystems)를 사용하여 행하였다.

(2) regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 VHH 항체 N15의 분비 발현

실시예 8(1)에서 얻어진 N15의 분비 발현 플라스미드 pPK4_CspAss_N15를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK4_CspAss_N15주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK4_CspAss_N15주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK4_CspAss_N15주를 얻었다.

얻어진 각 형질 전환체를, 25mg/L의 카나마이신을 포함하는 MMTG 액체 배양지(글루코스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, HCl로 수득한 대두염산 가수분해액 0.2g(총 질소량), 탄산칼슘 50g, 물로 1L로 하여 pH 7.0으로 조정)에서 각각 30℃, 72시간 배양하였다.

배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 6.5μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는, YDK010::phoS(W302C)주와 비교하여, N15 분비량이 현저하게 향상되어 있었다(도 1).

염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 N15의 밴드 강도의 수치화를 행하고, 각종 결손주에서 N15를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 N15를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 2.49배 내지 4.70배의 범위에서 N15의 분비량이 향상되고 있는 것을 확인하였다(표 1).

이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 N15 분비 생산에 있어서, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.

실시예 9: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 간형 지방산 결합 단백질(LFABP)의 분비 발현

WO2016/171224에 기재된 pPK4_CspB6Xa-LFABP를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK4_CspB6Xa-LFABP주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK4_CspB6Xa-LFABP주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK4_CspB6Xa-LFABP주를 얻었다. pPK4_CspB6Xa-LFABP는, 인간의 간형 지방산 결합 단백질(이하, LFABP라고 표기한다)의 분비 발현 플라스미드이다. pPK4_CspB6Xa-LFABP는, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자(PS2 유전자)의 프로모터, 및 이 프로모터의 하류에 발현 가능하게 연결된 C. 글루타미쿰 ATCC 13869주 유래의 CspB의 신호 펩타이드 30 아미노산 잔기, 이 주(株) 유래의 CspB 성숙 단백질의 N 말단 6 아미노산 잔기, 인자 Xa 프로테아제의 인식 서열 IEGR, 및 LFABP의 융합 단백질(이하, CspB6Xa-LFABP라고 표기한다)을 코딩하는 유전자를 갖는다.

배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 2.0μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는 YDK010::phoS(W302C)주와 비교하여, CspB6Xa-LFABP 분비량이 현저하게 향상되어 있었다(도 2).

염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 CspB6Xa-LFABP의 밴드 강도의 수치화를 행하고, 각종 결손주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 CspB6Xa-LFABP를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 2.04배 내지 5.13배의 범위에서 CspB6Xa-LFABP의 분비량이 향상되고 있는 것을 확인하였다(표 2).

이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 CspB6Xa-LFABP 분비 생산에 있어서도, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다.

실시예 10: regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 염기성 섬유아세포 성장인자(bFGF)의 분비 발현

(1) Tat계 분비 시스템을 코딩하는 tatABC 유전자와 TorA 신호 서열이 부가된 염기성 섬유아세포 성장인자(bFGF)을 코딩하는 유전자의 공발현 플라스미드의 구축

인간의 염기성 섬유아세포 성장인자(bFGF)의 아미노산 서열은 이미 결정되어 있다(DDBJ 등록번호: E61144). 이 아미노산 서열을 <서열번호 63>에 나타내었다. C. 글루타미쿰의 코돈 사용 빈도를 고려하여, bFGF 을 코딩하는 염기서열을 디자인하였다. 디자인한 염기서열을 <서열번호 64>에 나타내었다.

다음에, C. 글루타미쿰 ATCC 13869주 유래의 cspB 유전자의 프로모터의 하류에 E. 콜라이 유래의 TorA 단백질(UniProt 등록번호: P33225)의 신호 펩타이드 39 아미노산 잔기를 코딩하는 DNA 및 <서열번호 64>에 기재된 DNA를 연결하고, 또한 5'-측과 3'-측 양쪽에 KpnI 부위를 부가한 신호 펩타이드와 bFGF와의 융합 단백질(이하, 단지 bFGF라고 표기한다)의 발현 카세트를 전부 합성하였다. 전부 합성한 DNA 단편을 제한 효소 KpnI로 처리한 후에, WO2016/171224에 기재된 pPK6의 KpnI 부위에 삽입함으로써, bFGF의 분비 발현 플라스미드인 pPK6_T_bFGF를 구축하였다. 삽입 단편의 염기서열 결정의 결과, 설계대로의 bFGF를 코딩하는 유전자가 구축되어 있는 것을 확인하였다. 염기서열의 결정은 BigDye® 터미네이터(v3.1) 사이클 시퀀싱 키트 (Applied Biosystems)와 3130 유전자 분석기 (Applied Biosystems)를 사용하여 행하였다.

(2) regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자를 결손시킨 코리네박테리움 글루타미쿰을 사용한 염기성 섬유아세포 성장인자(bFGF)의 분비 발현

실시예 10(1)에서 얻어진 bFGF의 분비 발현 플라스미드 pPK6_T_bFGF를 사용하여, C. 글루타미쿰 YDK010::phoS(W302C)주, 실시예 4에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrcA주, 실시예 5에서 얻어진 YDK010::phoS(W302C)ΔhrrAΔhrcA주, 실시예 6에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrA주, 및 실시예 7에서 얻어진 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA주를 각각 형질전환하고, YDK010::phoS(W302C)/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔregX3ΔhrcA/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔhrrAΔhrcA/pPK6_T_bFGF주, YDK010::phoS(W302C)ΔregX3ΔhrrA/pPK6_T_bFGF주, 및 YDK010::phoS(W302C)ΔregX3ΔhrrAΔhrcA/pPK6_T_bFGF주를 얻었다.

얻어진 각 형질 전환체를, 25mg/L의 카나마이신을 포함하는 MMTG 액체 배양지(글루코스 120g, 황산마그네슘 7수화물 3g, 황산암모늄 30g, 인산 2수소칼륨 1.5g, 황산철 7수화물 0.03g, 황산망간 5수화물 0.03g, 티아민염산염 0.45mg, 비오틴 0.45mg, DL-메티오닌 0.15g, HCl로 수득한 대두염산 가수분해액 0.2g(총 질소량), 탄산칼슘 50g, 물로 1L로 하여 pH7.0으로 조정)에서 각각 30℃, 72시간 배양하였다.

배양 종료 후, 각 배양액을 원심분리하여 얻어진 배양 상청 1.0μL을 환원 SDS-PAGE에 제공하고나서 SYPRO 오렌지(Life technologies)로 염색을 행하였다. 그 결과, 각종 결손주에서는 YDK010::phoS(W302C)주와 비교하여, bFGF 분비량이 현저하게 향상되어 있었다(도 3).

염색 후, 화상 분석 소프트웨어인 Multi Gauge(FUJIFILM)를 사용하여 bFGF의 밴드 강도의 수치화를 행하고, 각종 결손주에서 bFGF를 발현시켰을 때의 밴드 강도를, YDK010::phoS(W302C)주에서 bFGF를 발현시켰을 때의 밴드 강도를 1.00으로 했을 때의 상대값으로서 산출하였다. 그 결과, 각종 결손주에서는, 1.69배 내지 3.08배의 범위에서 bFGF의 분비량이 향상되고 있는 것을 확인하였다(표 3).

이러한 사실로부터, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은, YDK010::phoS(W302C)주에서의 TorA 신호 서열을 사용한 bFGF분비 생산에 있어서도, 분비량 향상을 초래하는 유효 변이인 것이 명확해졌다. 즉, regX3, hrrA, 및 hrcA 유전자의 2종 이상의 유전자 결손은 Sec계 분비 경로에 한정되지 않고, Tat계 분비 경로에서도, 이종 단백질 분비량을 유의적으로 향상시킬 수 있는 변이인 것을 알았다.

[산업상의 이용 가능성]

본 발명에 의해 이종 단백질을 효율적으로 분비 생산할 수 있다.

〔서열표의 설명〕

서열번호 1: C. 글루타미쿰 YDK010의 phoS 유전자의 염기서열

서열번호 2: C. 글루타미쿰 YDK010의 PhoS 단백질의 아미노산 서열

서열번호 3: C. 글루타미쿰 ATCC 13032의 PhoS 단백질의 아미노산 서열

서열번호 4: C. 글루타미쿰 ATCC 14067의 PhoS 단백질의 아미노산 서열

서열번호 5: C. 칼루나에의 PhoS 단백질의 아미노산 서열

서열번호 6: C. 크레나툼의 PhoS 단백질의 아미노산 서열

서열번호 7: C. 에피시엔스의 PhoS 단백질의 아미노산 서열

서열번호 8: C. 글루타미쿰 ATCC 13032의 phoR 유전자의 염기서열

서열번호 9: C. 글루타미쿰 ATCC 13032의 PhoR 단백질의 아미노산 서열

서열번호 10: C. 글루타미쿰 ATCC 13869의 cspB 유전자의 염기서열

서열번호 11: C. 글루타미쿰 ATCC 13869의 CspB 단백질의 아미노산 서열

서열번호 12: C. 글루타미쿰 ATCC 13032의 tatA 유전자의 염기서열

서열번호 13: C. 글루타미쿰 ATCC 13032의 TatA 단백질의 아미노산 서열

서열번호 14: C. 글루타미쿰 ATCC 13032의 tatB 유전자의 염기서열

서열번호 15: C. 글루타미쿰 ATCC 13032의 TatB 단백질의 아미노산 서열

서열번호 16: C. 글루타미쿰 ATCC 13032의 tatC 유전자의 염기서열

서열번호 17: C. 글루타미쿰 ATCC 13032의 TatC 단백질의 아미노산 서열

서열번호 18: TorA 신호 펩타이드의 아미노산 서열

서열번호 19: SufI 신호 펩타이드의 아미노산 서열

서열번호 20: PhoD 신호 펩타이드의 아미노산 서열

서열번호 21: LipA 신호 펩타이드의 아미노산 서열

서열번호 22: IMD 신호 펩타이드의 아미노산 서열

서열번호 23, 24: 트윈-아르기닌 모티프의 아미노산 서열

서열번호 25: PS1 신호 펩타이드의 아미노산 서열

서열번호 26: PS2 신호 펩타이드의 아미노산 서열

서열번호 27: SlpA 신호 펩타이드의 아미노산 서열

서열번호 28: C. 글루타미쿰 ATCC 13869의 CspB 성숙 단백질의 아미노산 서열

서열번호 29 내지 36: 본 발명에서 사용되는 삽입 서열의 일 양태의 아미노산 서열

서열번호 37: 인자 Xa 프로테아제의 인식 서열

서열번호 38: ProTEV 프로테아제의 인식 서열

서열번호 39: C. 글루타미쿰 ATCC 13869의 senX3 유전자의 염기서열

서열번호 40: C. 글루타미쿰 ATCC 13869의 SenX3 단백질의 아미노산 서열

서열번호 41: C. 글루타미쿰 ATCC 13869의 regX3 유전자의 염기서열

서열번호 42: C. 글루타미쿰 ATCC 13869의 RegX3 단백질의 아미노산 서열

서열번호 43: C. 글루타미쿰 ATCC 13869의 hrrS 유전자의 염기서열

서열번호 44: C. 글루타미쿰 ATCC 13869의 HrrS 단백질의 아미노산 서열

서열번호 45: C. 글루타미쿰 ATCC 13869의 hrrA 유전자의 염기서열

서열번호 46: C. 글루타미쿰 ATCC 13869의 HrrA 단백질의 아미노산 서열

서열번호 47: C. 글루타미쿰 ATCC 13869의 hrcA 유전자의 염기서열

서열번호 48: C. 글루타미쿰 ATCC 13869의 HrcA 단백질의 아미노산 서열

서열번호 49 내지 60: 프라이머

서열번호 61: VHH 항체 N15를 코딩하는 염기서열

서열번호 62: VHH 항체 N15의 아미노산 서열

서열번호 63: bFGF를 코딩하는 염기서열

서열번호 64: bFGF의 아미노산 서열

<110> Ajinomoto Co., Inc. <120> METHOD FOR SECRETORY PRODUCTION OF PROTEIN <130> E090-19068 <150> JP2018-081138 <151> 2018-04-20 <160> 64 <170> KoPatentIn 3.0 <210> 1 <211> 1458 <212> DNA <213> Corynebacterium glutamicum <400> 1 atggaaaacc cttatgtcgc tgcgctcgat gacgataaaa aagaagtcgg cgcaataaaa 60 gaagcagaaa aagaacctga aataggtccc atcagagctg ccggacgagc cataccgctg 120 cgcacccgca tcattttgat cgtggtgggt atcgccgggc ttggtttgct ggtcaacgcg 180 attgctgttt ccagcctcat gcgtgaagtt tcctataccc gcatggatca agagctagag 240 acctcgatgg ggacgtgggc gcataacgtt gagctgttta atttcgatgg cgtccgccaa 300 gggccaccca gcgattatta tgtggccaag gtttttcctg atggatccag cattattttc 360 aacgatgcac aatcggcacc caatctagct gaaaccacca tcggtactgg tccacacact 420 gtggatgctg ctagcggttc tgcctccaac actccgtggc gtgtgatggc ggaaaagaac 480 ggtgacatta tcaccgtggt gggtaaaagc atggggcgtg aaacaaacct gctgtaccga 540 ttggtgatgg tgcagatgat catcggcgcg ctgattctgg ttgctatttt gattacttca 600 ctcttcctag tcagacgctc gttgcggccg ttgagagaag ttgaagagac cgccaccagg 660 attgcgggcg gtgatttgga tcgacgtgtc ccgcagtggc caatgaccac agaagtcgga 720 cagctgtcga atgccctcaa tatcatgttg gagcagctcc aagcctcaat tctgaccgcc 780 cagcaaaaag aagctcagat gcgccgattc gttggcgacg cctcccacga gctccgcaca 840 ccactgacct ctgtgaaggg cttcaccgag ctgtattcat caggtgcaac agatgatgcc 900 aactgggtca tgtccaagat cggtggcgaa gcccaacgca tgagtgtgct tgtggaagac 960 ctcctgtcac tgacgcgtgc cgaaggccag caaatggaga agcaccgcgt tgacgtgctg 1020 gaactcgcat tggcagtacg cggatccatg cgagcagcct ggccagatcg caccgtcaac 1080 gtgtccaata aagccgagtc cattccagtt gttgaaggcg acccaacccg cctccaccaa 1140 gttctcacca acctggttgc caacggactc aaccacggcg gaccggacgc ggaagtcagc 1200 attgagatca acaccgatgg gcaaaacgtg aggattctcg tggcagacaa cggtgtcgga 1260 atgtctgaag aagatgccca gcatatcttc gagcgtttct accgcgccga ttcctcccgc 1320 tcacgcgcat ccggcggatc gggcctcggc cttgcgatca cgaaatccct ggtcgaaggc 1380 cacggcggca cagtcaccgt cgacagcgtg caaggcgaag gcacggtgtt cacgatcacc 1440 ttgccggcgg tttcttaa 1458 <210> 2 <211> 485 <212> PRT <213> Corynebacterium glutamicum <400> 2 Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Asp Lys Lys Glu Val 1 5 10 15 Gly Ala Ile Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg 20 25 30 Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val 35 40 45 Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser 50 55 60 Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu 65 70 75 80 Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp 85 90 95 Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe 100 105 110 Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asn 115 120 125 Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala 130 135 140 Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn 145 150 155 160 Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn 165 170 175 Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile 180 185 190 Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu 195 200 205 Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly 210 215 220 Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly 225 230 235 240 Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser 245 250 255 Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly 260 265 270 Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe 275 280 285 Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met 290 295 300 Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp 305 310 315 320 Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg 325 330 335 Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala 340 345 350 Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile 355 360 365 Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn 370 375 380 Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser 385 390 395 400 Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp 405 410 415 Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg 420 425 430 Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly 435 440 445 Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr 450 455 460 Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr 465 470 475 480 Leu Pro Ala Val Ser 485 <210> 3 <211> 485 <212> PRT <213> Corynebacterium glutamicum <400> 3 Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val 1 5 10 15 Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg 20 25 30 Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val 35 40 45 Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser 50 55 60 Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu 65 70 75 80 Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp 85 90 95 Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe 100 105 110 Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp 115 120 125 Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala 130 135 140 Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn 145 150 155 160 Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn 165 170 175 Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile Ile Gly Ala Leu Ile 180 185 190 Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu 195 200 205 Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly 210 215 220 Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly 225 230 235 240 Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser 245 250 255 Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly 260 265 270 Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe 275 280 285 Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met 290 295 300 Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp 305 310 315 320 Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg 325 330 335 Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala 340 345 350 Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile 355 360 365 Pro Val Val Lys Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn 370 375 380 Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser 385 390 395 400 Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp 405 410 415 Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg 420 425 430 Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly 435 440 445 Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr 450 455 460 Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr 465 470 475 480 Leu Pro Ala Val Ser 485 <210> 4 <211> 485 <212> PRT <213> Corynebacterium glutamicum <400> 4 Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Asp Glu Asn Gln Glu Val 1 5 10 15 Gly Val Lys Lys Glu Ala Glu Lys Glu Pro Glu Ile Gly Pro Ile Arg 20 25 30 Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg Ile Ile Leu Ile Val 35 40 45 Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala Val Ser 50 55 60 Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln Glu Leu Glu 65 70 75 80 Thr Ser Met Gly Thr Trp Ala His Asn Val Glu Leu Phe Asn Phe Asp 85 90 95 Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala Lys Val Phe 100 105 110 Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Gln Ser Ala Pro Asp 115 120 125 Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His Thr Val Asp Ala Ala 130 135 140 Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val Met Ala Glu Lys Asn 145 150 155 160 Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met Gly Arg Glu Thr Asn 165 170 175 Leu Leu Tyr Arg Leu Val Val Val Gln Met Ile Ile Gly Ala Leu Ile 180 185 190 Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu Val Arg Arg Ser Leu 195 200 205 Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr Arg Ile Ala Gly Gly 210 215 220 Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly 225 230 235 240 Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser 245 250 255 Ile Leu Thr Ala Gln Gln Lys Glu Ala Gln Met Arg Arg Phe Val Gly 260 265 270 Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Phe 275 280 285 Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp Ala Asn Trp Val Met 290 295 300 Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp 305 310 315 320 Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys His Arg 325 330 335 Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg Gly Ser Met Arg Ala 340 345 350 Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn Lys Ala Glu Ser Ile 355 360 365 Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val Leu Thr Asn 370 375 380 Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Asp Ala Glu Val Ser 385 390 395 400 Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg Ile Leu Val Ala Asp 405 410 415 Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln His Ile Phe Glu Arg 420 425 430 Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly 435 440 445 Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Gly Gly Thr 450 455 460 Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr Val Phe Thr Ile Thr 465 470 475 480 Leu Pro Ala Val Ser 485 <210> 5 <211> 504 <212> PRT <213> Corynebacterium callunae <400> 5 Met Glu Asn Pro Tyr Val Ala Ala Leu Asp Lys Asn Ser Asn Phe Gly 1 5 10 15 Ala Lys Asp Thr Asp Ser Ala Val Ser Asp Ser Thr Glu Val Ser Gln 20 25 30 Asn Asn Asp Gly Ile Gly Thr Pro Ala Thr Ala Glu Pro Lys Val Gly 35 40 45 Pro Ile Arg Thr Ala Gly Arg Ala Met Pro Leu Arg Thr Arg Ile Ile 50 55 60 Leu Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Val 65 70 75 80 Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met Asp Gln 85 90 95 Asp Leu Glu Ser Ala Met Gly Thr Trp Val Arg Asn Val Glu Leu Phe 100 105 110 Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr Val Ala 115 120 125 Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala Glu Ser 130 135 140 Ala Pro Asp Leu Gly Gln Thr Thr Ile Gly Thr Gly Pro His Thr Val 145 150 155 160 Glu Ala Ala Glu Gly Ser Ala Ser Ser Thr His Trp Arg Val Met Ala 165 170 175 Ala Lys Asn Gly Asp Val Ile Thr Val Val Gly Lys Ser Met Gly Arg 180 185 190 Glu Ser Thr Leu Leu Tyr Arg Leu Val Val Val Gln Met Val Ile Gly 195 200 205 Val Leu Ile Leu Ile Ala Ile Leu Ile Gly Ser Phe Phe Leu Val Arg 210 215 220 Arg Ser Leu Lys Pro Leu Arg Glu Val Glu Glu Thr Ala Ser Arg Ile 225 230 235 240 Ala Gly Gly Glu Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr 245 250 255 Glu Val Gly Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu 260 265 270 Gln Thr Ser Ile Met Asn Ala Gln Gln Lys Glu Ala Gln Met Arg Arg 275 280 285 Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val 290 295 300 Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Gln Asp Ala Asp 305 310 315 320 Trp Val Leu Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser Val Leu 325 330 335 Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu 340 345 350 Lys His Arg Val Asp Met Leu Glu Leu Ala Leu Ala Val Arg Gly Ser 355 360 365 Leu Lys Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ala Asn Arg Ser 370 375 380 Glu Asn Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His Gln Val 385 390 395 400 Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro Glu Ala 405 410 415 Glu Val Asn Ile Gln Val Glu Thr Ala Asp Asp Lys Val Lys Ile Leu 420 425 430 Val Ile Asp Asn Gly Val Gly Met Ser Lys Glu Asp Ala Glu His Ile 435 440 445 Phe Glu Arg Phe Tyr Arg Ala Asp Thr Ser Arg Ser Arg Ala Ser Gly 450 455 460 Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His 465 470 475 480 Gly Gly Thr Ile Thr Val Asp Ser Glu Leu Gly Lys Gly Thr Val Phe 485 490 495 Ser Ile Ile Leu Pro Ala Ala Glu 500 <210> 6 <211> 458 <212> PRT <213> Corynebacterium crenatum <400> 6 Ile Gly Pro Ile Arg Ala Ala Gly Arg Ala Ile Pro Leu Arg Thr Arg 1 5 10 15 Ile Ile Leu Ile Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn 20 25 30 Ala Ile Ala Val Ser Ser Leu Met Arg Glu Val Ser Tyr Thr Arg Met 35 40 45 Asp Gln Glu Leu Glu Thr Ser Met Gly Thr Trp Ala His Asn Val Glu 50 55 60 Leu Phe Asn Phe Asp Gly Val Arg Gln Gly Pro Pro Ser Asp Tyr Tyr 65 70 75 80 Val Ala Lys Val Phe Pro Asp Gly Ser Ser Ile Ile Phe Asn Asp Ala 85 90 95 Gln Ser Ala Pro Asp Leu Ala Glu Thr Thr Ile Gly Thr Gly Pro His 100 105 110 Thr Val Asp Ala Ala Ser Gly Ser Ala Ser Asn Thr Pro Trp Arg Val 115 120 125 Met Ala Glu Lys Asn Gly Asp Ile Ile Thr Val Val Gly Lys Ser Met 130 135 140 Gly Arg Glu Thr Asn Leu Leu Tyr Arg Leu Val Met Val Gln Met Ile 145 150 155 160 Ile Gly Ala Leu Ile Leu Val Ala Ile Leu Ile Thr Ser Leu Phe Leu 165 170 175 Val Arg Arg Ser Leu Arg Pro Leu Arg Glu Val Glu Glu Thr Ala Thr 180 185 190 Arg Ile Ala Gly Gly Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met 195 200 205 Thr Thr Glu Val Gly Gln Leu Ser Asn Ala Leu Asn Ile Met Leu Glu 210 215 220 Gln Leu Gln Ala Ser Ile Leu Ser Ala Gln Gln Lys Glu Ala Gln Met 225 230 235 240 Arg Arg Phe Val Gly Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr 245 250 255 Ser Val Lys Gly Phe Thr Glu Leu Tyr Ser Ser Gly Ala Thr Asp Asp 260 265 270 Ala Asn Trp Val Met Ser Lys Ile Gly Gly Glu Ala Gln Arg Met Ser 275 280 285 Val Leu Val Glu Asp Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln 290 295 300 Met Glu Lys His Arg Val Asp Val Leu Glu Leu Ala Leu Ala Val Arg 305 310 315 320 Gly Ser Met Arg Ala Ala Trp Pro Asp Arg Thr Val Asn Val Ser Asn 325 330 335 Lys Ala Ala Ser Ile Pro Val Val Glu Gly Asp Pro Thr Arg Leu His 340 345 350 Gln Val Leu Thr Asn Leu Val Ala Asn Gly Leu Asn His Gly Gly Pro 355 360 365 Asp Ala Glu Val Ser Ile Glu Ile Asn Thr Asp Gly Gln Asn Val Arg 370 375 380 Ile Leu Val Ala Asp Asn Gly Val Gly Met Ser Glu Glu Asp Ala Gln 385 390 395 400 His Ile Phe Glu Arg Phe Tyr Arg Ala Asp Ser Ser Arg Ser Arg Ala 405 410 415 Ser Gly Gly Ser Gly Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu 420 425 430 Gly His Gly Gly Thr Val Thr Val Asp Ser Val Gln Gly Glu Gly Thr 435 440 445 Val Phe Thr Ile Thr Leu Pro Ala Val Ser 450 455 <210> 7 <211> 471 <212> PRT <213> Corynebacterium efficiens <400> 7 Met Thr Ala Pro Glu Asn Pro His Ala Gln Val Thr Pro Val Gly Arg 1 5 10 15 Phe Arg Gln Ala Ala Arg Gly Val Pro Leu Arg Thr Arg Ile Ile Leu 20 25 30 Leu Val Val Gly Ile Ala Gly Leu Gly Leu Leu Val Asn Ala Ile Ala 35 40 45 Val Ser Ser Leu Met Arg Glu Val Ser Tyr Ser Arg Met Asp Gln Glu 50 55 60 Leu Glu Ser Ala Met Asn Ser Trp Ala Gln Thr Ala Glu Leu Phe Gly 65 70 75 80 Ser Ile Thr Leu Gly Pro Pro Ser Asp Tyr Tyr Val Val Arg Ile Phe 85 90 95 Pro Asp Gly Ser His Met Val Phe Asn Gln Ser Asp Ser Ala Pro Asp 100 105 110 Leu Gly Glu Thr Thr Ile Gly Ile Gly Pro His Thr Ala Ser Ala Ala 115 120 125 Pro Gly Ser Ser Ser Ser Val Pro Trp Arg Val Ile Ala Ile Ser Asp 130 135 140 Asn Gly Thr Ile Thr Val Val Gly Lys Ser Leu Ala Pro Glu Ser Met 145 150 155 160 Leu Leu Tyr Arg Leu Val Ile Val Gln Leu Val Ile Gly Met Leu Ile 165 170 175 Val Val Ala Ile Leu Leu Ser Ser Leu Tyr Leu Val Asn Arg Ser Leu 180 185 190 Arg Pro Leu Arg Glu Val Glu Lys Thr Ala Lys Ser Ile Ala Gly Gly 195 200 205 Asp Leu Asp Arg Arg Val Pro Gln Trp Pro Met Thr Thr Glu Val Gly 210 215 220 Gln Leu Ala Asn Ala Leu Asn Ile Met Leu Glu Gln Leu Gln Ala Ser 225 230 235 240 Ile Leu Ser Ala Gln Glu Lys Glu Ser Gln Met Arg Arg Phe Val Gly 245 250 255 Asp Ala Ser His Glu Leu Arg Thr Pro Leu Thr Ser Val Lys Gly Tyr 260 265 270 Ser Glu Leu Tyr His Ser Gly Ala Thr Arg Asp Ala Asp Trp Val Leu 275 280 285 Ser Lys Ile Ser Gly Glu Ala Gln Arg Met Ser Val Leu Val Glu Asp 290 295 300 Leu Leu Ser Leu Thr Arg Ala Glu Gly Gln Gln Met Glu Lys Arg Pro 305 310 315 320 Val Asp Val Leu Glu Leu Ser Leu Ser Val Ala Ser Ser Met Arg Ala 325 330 335 Ala Trp Pro Glu Arg Ser Ile Thr Val Val Asn Lys Thr Gly Ser Leu 340 345 350 Pro Val Val Glu Gly Asp Ala Thr Arg Leu His Gln Val Leu Thr Asn 355 360 365 Leu Val Asn Asn Gly Leu Asn His Gly Gly Pro Asp Ala Ser Val Glu 370 375 380 Ile Glu Ile Ser Ala Glu Gly Gly Ser Val Leu Val Arg Val Val Asp 385 390 395 400 Asp Gly Val Gly Met Thr Ala Glu Asp Ala Gln His Ile Phe Glu Arg 405 410 415 Phe Tyr Arg Thr Asp Thr Ser Arg Ser Arg Ala Ser Gly Gly Ser Gly 420 425 430 Leu Gly Leu Ala Ile Thr Lys Ser Leu Val Glu Gly His Arg Gly Thr 435 440 445 Ile Thr Val Asp Ser Glu Val Gly Glu Gly Thr Val Phe Thr Ile Thr 450 455 460 Leu Pro Ser Arg Met Glu Asp 465 470 <210> 8 <211> 708 <212> DNA <213> Corynebacterium glutamicum <400> 8 atggacaacc agtctgacgg acaaatccgc gtactcgtcg ttgatgacga gccaaacatc 60 gtcgagctgc tcaccgtaag ccttaaattc caaggcttcg cagtgatgac cgccaacgat 120 ggcaatgaag ccctgaagat tgctcgtgag ttccgtccag acgcatacat cctcgatgtc 180 atgatgccag gaatggacgg cttcgagctg ctgaccaagc tgcgcggcga aggccttgac 240 agcccagttc tgtacctcac cgcaaaggat gccgtggagc accgcatcca cggcctgacc 300 atcggcgctg acgactacgt gaccaagcct ttctccctgg aagaagtaat cacccgcctg 360 cgcgtgattc ttcgtcgcgg tggagcagtt gaagaagaca cctcaacttc cctgcagtac 420 gcagacctca ccctcaacga tgaaacccac gaggtcacca aggctggcga actgatcgat 480 ctttccccaa ctgaattcaa cctcctgcgc tacctcatgc tcaacgctga agtggtgctg 540 tccaaggcaa agatcctgga taacgtgtgg cactacgatt ttggtggcga cggcaacgtc 600 gtggaatcct acatctccta cctgcgccgc aaggtggaca cccaggatcc gcagctaatt 660 cagactgttc gtggcgttgg atatgttctg cgcaccccac gtagctaa 708 <210> 9 <211> 235 <212> PRT <213> Corynebacterium glutamicum <400> 9 Met Asp Asn Gln Ser Asp Gly Gln Ile Arg Val Leu Val Val Asp Asp 1 5 10 15 Glu Pro Asn Ile Val Glu Leu Leu Thr Val Ser Leu Lys Phe Gln Gly 20 25 30 Phe Ala Val Met Thr Ala Asn Asp Gly Asn Glu Ala Leu Lys Ile Ala 35 40 45 Arg Glu Phe Arg Pro Asp Ala Tyr Ile Leu Asp Val Met Met Pro Gly 50 55 60 Met Asp Gly Phe Glu Leu Leu Thr Lys Leu Arg Gly Glu Gly Leu Asp 65 70 75 80 Ser Pro Val Leu Tyr Leu Thr Ala Lys Asp Ala Val Glu His Arg Ile 85 90 95 His Gly Leu Thr Ile Gly Ala Asp Asp Tyr Val Thr Lys Pro Phe Ser 100 105 110 Leu Glu Glu Val Ile Thr Arg Leu Arg Val Ile Leu Arg Arg Gly Gly 115 120 125 Ala Val Glu Glu Asp Thr Ser Thr Ser Leu Gln Tyr Ala Asp Leu Thr 130 135 140 Leu Asn Asp Glu Thr His Glu Val Thr Lys Ala Gly Glu Leu Ile Asp 145 150 155 160 Leu Ser Pro Thr Glu Phe Asn Leu Leu Arg Tyr Leu Met Leu Asn Ala 165 170 175 Glu Val Val Leu Ser Lys Ala Lys Ile Leu Asp Asn Val Trp His Tyr 180 185 190 Asp Phe Gly Gly Asp Gly Asn Val Val Glu Ser Tyr Ile Ser Tyr Leu 195 200 205 Arg Arg Lys Val Asp Thr Gln Asp Pro Gln Leu Ile Gln Thr Val Arg 210 215 220 Gly Val Gly Tyr Val Leu Arg Thr Pro Arg Ser 225 230 235 <210> 10 <211> 1500 <212> DNA <213> Corynebacterium glutamicum <400> 10 atgtttaaca accgtatccg cactgcagct ctcgctggtg caatcgcaat ctccaccgca 60 gcttccggcg tagctatccc agcattcgct caggagacca acccaacctt caacatcaac 120 aacggcttca acgatgctga tggatccacc atccagccag ttgagccagt taaccacacc 180 gaggaaaccc tccgcgacct gactgactcc accggcgctt acctggaaga gttccagtac 240 ggcaacgttg aggaaatcgt tgaagcatac ctgcaggttc aggcttccgc agacggattc 300 gatccttctg agcaggctgc ttacgaggct ttcgaggctg ctcgcgttcg tgcatcccag 360 gagctcgcgg cttccgctga gaccatcact aagacccgcg agtccgttgc ttacgcactc 420 aaggctgacc gcgaagctac cgcagctttc gaggcttacc tcagcgctct tcgtcaggtt 480 tcagtcatca acgatctgat cgctgatgct aacgccaaga acaagactga ctttgcagag 540 atcgagctct acgatgttct ttacaccgac gccgacatct ctggcgatgc tccacttctt 600 gctcctgcat acaaggagct gaaggacctt caggctgagg ttgacgcaga cttcgagtgg 660 ttgggcgagt tcgcaattga taacaatgaa gacaactacg tcattcgtac tcacatccct 720 gctgtagagg cactcaaggc agcgatcgat tcactggtcg acaccgttga gccacttcgt 780 gcagacgcta tcgctaagaa catcgaggct cagaagtctg acgttctggt tccccagctc 840 ttcctcgagc gtgcaactgc acagcgcgac accctgcgtg ttgtagaggc aatcttctct 900 acctctgctc gttacgttga actctacgag aacgtcgaga acgttaacgt tgagaacaag 960 acccttcgcc agcactactc ttccctgatc cctaacctct tcatcgcagc ggttggcaac 1020 atcaacgagc tcaacaatgc agatcaggct gcacgtgagc tcttcctcga ttgggacacc 1080 gacctcacca ccaacgatga ggacgaagct tactaccagg ctaagctcga cttcgctatc 1140 gagacctacg caaagatcct gatcaacggt gaagtttggc aggagccact cgcttacgtc 1200 cagaacctgg atgcaggcgc acgtcaggaa gcagctgacc gcgaagcaga gcgcgcagct 1260 gacgcagcat accgcgctga gcagctccgc atcgctcagg aagcagctga cgctcagaag 1320 gctctcgctg aggctcttgc taatgcaggc aacaacgaca acggtggcga caactcctcc 1380 gacgacaagg gaaccggttc ttccgacatc ggaacctggg gacctttcgc agcaattgca 1440 gctatcatcg cagcaatcgc agctatcttc ccattcctct ccggtatcgt taagttctaa 1500 <210> 11 <211> 499 <212> PRT <213> Corynebacterium glutamicum <400> 11 Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala 1 5 10 15 Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala Gln Glu 20 25 30 Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala Asp Gly 35 40 45 Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu Thr Leu 50 55 60 Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe Gln Tyr 65 70 75 80 Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln Ala Ser 85 90 95 Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala Phe Glu 100 105 110 Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala Glu Thr 115 120 125 Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala Asp Arg 130 135 140 Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg Gln Val 145 150 155 160 Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn Lys Thr 165 170 175 Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp Ala Asp 180 185 190 Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu Leu Lys 195 200 205 Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly Glu Phe 210 215 220 Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His Ile Pro 225 230 235 240 Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp Thr Val 245 250 255 Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala Gln Lys 260 265 270 Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr Ala Gln 275 280 285 Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser Ala Arg 290 295 300 Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu Asn Lys 305 310 315 320 Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe Ile Ala 325 330 335 Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala Ala Arg 340 345 350 Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp Glu Asp 355 360 365 Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr Tyr Ala 370 375 380 Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala Tyr Val 385 390 395 400 Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg Glu Ala 405 410 415 Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg Ile Ala 420 425 430 Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu Ala Asn 435 440 445 Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp Lys Gly 450 455 460 Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala Ile Ala 465 470 475 480 Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser Gly Ile 485 490 495 Val Lys Phe <210> 12 <211> 318 <212> DNA <213> Corynebacterium glutamicum <400> 12 atgtccctcg gaccatggga aattggaatc attgtcctgc tgatcatcgt gctgttcggc 60 gcgaagaagc tgcctgatgc agctcgttcc atcggccgtt ccatgcgcat cttcaagtct 120 gaagtcaaag aaatgaacaa ggacggcgat accccagaac aacagcagca gcctcagcag 180 cagattgcgc ccaaccagat cgaggctcct cagccaaact ttgagcagca ctaccaggga 240 cagcaggttc agcagcctca gaaccctcag acccctgact accgtcagaa ctacgaggat 300 ccaaaccgca cctcttaa 318 <210> 13 <211> 105 <212> PRT <213> Corynebacterium glutamicum <400> 13 Met Ser Leu Gly Pro Trp Glu Ile Gly Ile Ile Val Leu Leu Ile Ile 1 5 10 15 Val Leu Phe Gly Ala Lys Lys Leu Pro Asp Ala Ala Arg Ser Ile Gly 20 25 30 Arg Ser Met Arg Ile Phe Lys Ser Glu Val Lys Glu Met Asn Lys Asp 35 40 45 Gly Asp Thr Pro Glu Gln Gln Gln Gln Pro Gln Gln Gln Ile Ala Pro 50 55 60 Asn Gln Ile Glu Ala Pro Gln Pro Asn Phe Glu Gln His Tyr Gln Gly 65 70 75 80 Gln Gln Val Gln Gln Pro Gln Asn Pro Gln Thr Pro Asp Tyr Arg Gln 85 90 95 Asn Tyr Glu Asp Pro Asn Arg Thr Ser 100 105 <210> 14 <211> 471 <212> DNA <213> Corynebacterium glutamicum <400> 14 atgttttcta gcgtgggttg gggagagatc ttcctcttag tcgttgtggg ccttgttgtc 60 atcggcccgg aacggttgcc tcgtttgatc caggacgcac gcgctgcgct gctcgctgca 120 cgtaccgcta tcgacaatgc aaagcagtcg ttggacagtg attttggttc ggaatttgat 180 gaaatccgaa agccactaac ccaggttgca cagtacagcc ggatgagccc caagacggcc 240 atcactaagg cgttatttga taatgattcc tcgttcctgg atgactttga tccaaagaag 300 atcatggccg aaggaacaga aggcgaagct cagcgcaaca agcaggcagc tgacaacaat 360 gcgaatgtgg tggaacgtcc agctgatggt tccaccgcac gcccaacgca aaacgatcca 420 aaagacggcc cgaattactc aggtggcgtc tcttggaccg atattattta g 471 <210> 15 <211> 156 <212> PRT <213> Corynebacterium glutamicum <400> 15 Met Phe Ser Ser Val Gly Trp Gly Glu Ile Phe Leu Leu Val Val Val 1 5 10 15 Gly Leu Val Val Ile Gly Pro Glu Arg Leu Pro Arg Leu Ile Gln Asp 20 25 30 Ala Arg Ala Ala Leu Leu Ala Ala Arg Thr Ala Ile Asp Asn Ala Lys 35 40 45 Gln Ser Leu Asp Ser Asp Phe Gly Ser Glu Phe Asp Glu Ile Arg Lys 50 55 60 Pro Leu Thr Gln Val Ala Gln Tyr Ser Arg Met Ser Pro Lys Thr Ala 65 70 75 80 Ile Thr Lys Ala Leu Phe Asp Asn Asp Ser Ser Phe Leu Asp Asp Phe 85 90 95 Asp Pro Lys Lys Ile Met Ala Glu Gly Thr Glu Gly Glu Ala Gln Arg 100 105 110 Asn Lys Gln Ala Ala Asp Asn Asn Ala Asn Val Val Glu Arg Pro Ala 115 120 125 Asp Gly Ser Thr Ala Arg Pro Thr Gln Asn Asp Pro Lys Asp Gly Pro 130 135 140 Asn Tyr Ser Gly Gly Val Ser Trp Thr Asp Ile Ile 145 150 155 <210> 16 <211> 945 <212> DNA <213> Corynebacterium glutamicum <400> 16 atgtccattg ttgagcacat caaagagttt cgacgccgac ttcttatcgc tctggcgggc 60 atcctcgtgg gcaccattat cggctttatt tggtacgatt tctcattttg gcagatcccc 120 actttgggcg agctgctgag ggatccgtac tgttctctgc ctgctgaatc ccgctgggcc 180 atgagcgact cagaggaatg tcgactgctc gcaaccggcc cgtttgatcc attcatgctt 240 cgccttaaag tagcggcgtt ggtgggtatg gttcttggct cacccgtgtg gctgagccag 300 ctgtggggct ttatcacccc aggtttgatg aagaatgagc gccgttacac cgcaatcttc 360 gtcacgattg ctgttgtgct gtttgtcggc ggtgctgttc ttgcgtactt cgtcgttgca 420 tatggtttgg agttcctcct taccattggt ggagacaccc aggcagcggc cctgactggt 480 gataagtact tcggattctt gctcgcgttg ttggcgattt tcggcgtgag cttcgaagtt 540 ccactggtga tcggcatgct caacattgtg ggtatcttgc cttacgatgc cattaaagat 600 aagcgacgca tgatcatcat gattttgttc gtgttcgctg ctttcatgac acccggccag 660 gatcctttca ccatgttggt gttggcgctt tcactcaccg ttctggtaga gcttgccctg 720 cagttctgtc gtttcaacga caaacgccgg gacaagaagc gcccagaatg gcttgatggc 780 gatgacctct ctgcatcacc actggatact tctgctggtg gagaagatgc tccaagccca 840 gtcgaaaccc cagaggcggt ggagccttcg cggatgctga acccaagtgg ggaggcgtcg 900 ataagctata aacccgggcg cgccgacttc ggtgacgtgc tctag 945 <210> 17 <211> 314 <212> PRT <213> Corynebacterium glutamicum <400> 17 Met Ser Ile Val Glu His Ile Lys Glu Phe Arg Arg Arg Leu Leu Ile 1 5 10 15 Ala Leu Ala Gly Ile Leu Val Gly Thr Ile Ile Gly Phe Ile Trp Tyr 20 25 30 Asp Phe Ser Phe Trp Gln Ile Pro Thr Leu Gly Glu Leu Leu Arg Asp 35 40 45 Pro Tyr Cys Ser Leu Pro Ala Glu Ser Arg Trp Ala Met Ser Asp Ser 50 55 60 Glu Glu Cys Arg Leu Leu Ala Thr Gly Pro Phe Asp Pro Phe Met Leu 65 70 75 80 Arg Leu Lys Val Ala Ala Leu Val Gly Met Val Leu Gly Ser Pro Val 85 90 95 Trp Leu Ser Gln Leu Trp Gly Phe Ile Thr Pro Gly Leu Met Lys Asn 100 105 110 Glu Arg Arg Tyr Thr Ala Ile Phe Val Thr Ile Ala Val Val Leu Phe 115 120 125 Val Gly Gly Ala Val Leu Ala Tyr Phe Val Val Ala Tyr Gly Leu Glu 130 135 140 Phe Leu Leu Thr Ile Gly Gly Asp Thr Gln Ala Ala Ala Leu Thr Gly 145 150 155 160 Asp Lys Tyr Phe Gly Phe Leu Leu Ala Leu Leu Ala Ile Phe Gly Val 165 170 175 Ser Phe Glu Val Pro Leu Val Ile Gly Met Leu Asn Ile Val Gly Ile 180 185 190 Leu Pro Tyr Asp Ala Ile Lys Asp Lys Arg Arg Met Ile Ile Met Ile 195 200 205 Leu Phe Val Phe Ala Ala Phe Met Thr Pro Gly Gln Asp Pro Phe Thr 210 215 220 Met Leu Val Leu Ala Leu Ser Leu Thr Val Leu Val Glu Leu Ala Leu 225 230 235 240 Gln Phe Cys Arg Phe Asn Asp Lys Arg Arg Asp Lys Lys Arg Pro Glu 245 250 255 Trp Leu Asp Gly Asp Asp Leu Ser Ala Ser Pro Leu Asp Thr Ser Ala 260 265 270 Gly Gly Glu Asp Ala Pro Ser Pro Val Glu Thr Pro Glu Ala Val Glu 275 280 285 Pro Ser Arg Met Leu Asn Pro Ser Gly Glu Ala Ser Ile Ser Tyr Lys 290 295 300 Pro Gly Arg Ala Asp Phe Gly Asp Val Leu 305 310 <210> 18 <211> 39 <212> PRT <213> Escherichia coli <400> 18 Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala 1 5 10 15 Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu 20 25 30 Thr Pro Arg Arg Ala Thr Ala 35 <210> 19 <211> 27 <212> PRT <213> Escherichia coli <400> 19 Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu 1 5 10 15 Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala 20 25 <210> 20 <211> 48 <212> PRT <213> Bacillus subtilis <400> 20 Met Ala Tyr Asp Ser Arg Phe Asp Glu Trp Val Gln Lys Leu Lys Glu 1 5 10 15 Glu Ser Phe Gln Asn Asn Thr Phe Asp Arg Arg Lys Phe Ile Gln Gly 20 25 30 Ala Gly Lys Ile Ala Gly Leu Ser Leu Gly Leu Thr Ile Ala Gln Ser 35 40 45 <210> 21 <211> 34 <212> PRT <213> Bacillus subtilis <400> 21 Met Lys Phe Val Lys Arg Arg Thr Thr Ala Leu Val Thr Thr Leu Met 1 5 10 15 Leu Ser Val Thr Ser Leu Phe Ala Leu Gln Pro Ser Ala Lys Ala Ala 20 25 30 Glu His <210> 22 <211> 30 <212> PRT <213> Arthrobacter globiformis <400> 22 Met Met Asn Leu Ser Arg Arg Thr Leu Leu Thr Thr Gly Ser Ala Ala 1 5 10 15 Thr Leu Ala Tyr Ala Leu Gly Met Ala Gly Ser Ala Gln Ala 20 25 30 <210> 23 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Twin-Arginine Motif <220> <221> misc_feature <222> (1)..(1) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <400> 23 Xaa Arg Arg Xaa Phe Leu Lys 1 5 <210> 24 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Twin-Arginine Motif <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (4)..(5) <223> Xaa can be any hydrophobic amino acid <400> 24 Arg Arg Xaa Xaa Xaa 1 5 <210> 25 <211> 43 <212> PRT <213> Corynebacterium glutamicum <400> 25 Met Arg Asp Thr Ala Phe Arg Ser Ile Lys Ala Lys Ala Gln Ala Lys 1 5 10 15 Arg Arg Ser Leu Trp Ile Ala Ala Gly Ala Val Pro Thr Ala Ile Ala 20 25 30 Leu Thr Met Ser Leu Ala Pro Met Ala Ser Ala 35 40 <210> 26 <211> 30 <212> PRT <213> Corynebacterium glutamicum <400> 26 Met Phe Asn Asn Arg Ile Arg Thr Ala Ala Leu Ala Gly Ala Ile Ala 1 5 10 15 Ile Ser Thr Ala Ala Ser Gly Val Ala Ile Pro Ala Phe Ala 20 25 30 <210> 27 <211> 25 <212> PRT <213> Corynebacterium stationis <400> 27 Met Lys Arg Met Lys Ser Leu Ala Ala Ala Leu Thr Val Ala Gly Ala 1 5 10 15 Met Leu Ala Ala Pro Val Ala Thr Ala 20 25 <210> 28 <211> 469 <212> PRT <213> Corynebacterium glutamicum <400> 28 Gln Glu Thr Asn Pro Thr Phe Asn Ile Asn Asn Gly Phe Asn Asp Ala 1 5 10 15 Asp Gly Ser Thr Ile Gln Pro Val Glu Pro Val Asn His Thr Glu Glu 20 25 30 Thr Leu Arg Asp Leu Thr Asp Ser Thr Gly Ala Tyr Leu Glu Glu Phe 35 40 45 Gln Tyr Gly Asn Val Glu Glu Ile Val Glu Ala Tyr Leu Gln Val Gln 50 55 60 Ala Ser Ala Asp Gly Phe Asp Pro Ser Glu Gln Ala Ala Tyr Glu Ala 65 70 75 80 Phe Glu Ala Ala Arg Val Arg Ala Ser Gln Glu Leu Ala Ala Ser Ala 85 90 95 Glu Thr Ile Thr Lys Thr Arg Glu Ser Val Ala Tyr Ala Leu Lys Ala 100 105 110 Asp Arg Glu Ala Thr Ala Ala Phe Glu Ala Tyr Leu Ser Ala Leu Arg 115 120 125 Gln Val Ser Val Ile Asn Asp Leu Ile Ala Asp Ala Asn Ala Lys Asn 130 135 140 Lys Thr Asp Phe Ala Glu Ile Glu Leu Tyr Asp Val Leu Tyr Thr Asp 145 150 155 160 Ala Asp Ile Ser Gly Asp Ala Pro Leu Leu Ala Pro Ala Tyr Lys Glu 165 170 175 Leu Lys Asp Leu Gln Ala Glu Val Asp Ala Asp Phe Glu Trp Leu Gly 180 185 190 Glu Phe Ala Ile Asp Asn Asn Glu Asp Asn Tyr Val Ile Arg Thr His 195 200 205 Ile Pro Ala Val Glu Ala Leu Lys Ala Ala Ile Asp Ser Leu Val Asp 210 215 220 Thr Val Glu Pro Leu Arg Ala Asp Ala Ile Ala Lys Asn Ile Glu Ala 225 230 235 240 Gln Lys Ser Asp Val Leu Val Pro Gln Leu Phe Leu Glu Arg Ala Thr 245 250 255 Ala Gln Arg Asp Thr Leu Arg Val Val Glu Ala Ile Phe Ser Thr Ser 260 265 270 Ala Arg Tyr Val Glu Leu Tyr Glu Asn Val Glu Asn Val Asn Val Glu 275 280 285 Asn Lys Thr Leu Arg Gln His Tyr Ser Ser Leu Ile Pro Asn Leu Phe 290 295 300 Ile Ala Ala Val Gly Asn Ile Asn Glu Leu Asn Asn Ala Asp Gln Ala 305 310 315 320 Ala Arg Glu Leu Phe Leu Asp Trp Asp Thr Asp Leu Thr Thr Asn Asp 325 330 335 Glu Asp Glu Ala Tyr Tyr Gln Ala Lys Leu Asp Phe Ala Ile Glu Thr 340 345 350 Tyr Ala Lys Ile Leu Ile Asn Gly Glu Val Trp Gln Glu Pro Leu Ala 355 360 365 Tyr Val Gln Asn Leu Asp Ala Gly Ala Arg Gln Glu Ala Ala Asp Arg 370 375 380 Glu Ala Glu Arg Ala Ala Asp Ala Ala Tyr Arg Ala Glu Gln Leu Arg 385 390 395 400 Ile Ala Gln Glu Ala Ala Asp Ala Gln Lys Ala Leu Ala Glu Ala Leu 405 410 415 Ala Asn Ala Gly Asn Asn Asp Asn Gly Gly Asp Asn Ser Ser Asp Asp 420 425 430 Lys Gly Thr Gly Ser Ser Asp Ile Gly Thr Trp Gly Pro Phe Ala Ala 435 440 445 Ile Ala Ala Ile Ile Ala Ala Ile Ala Ala Ile Phe Pro Phe Leu Ser 450 455 460 Gly Ile Val Lys Phe 465 <210> 29 <211> 4 <212> PRT <213> Corynebacterium glutamicum <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is Asn, Gly, Thr, Pro, or Ala <400> 29 Gln Glu Thr Xaa 1 <210> 30 <211> 5 <212> PRT <213> Corynebacterium glutamicum <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is Asn, Gly, Thr, Pro, or Ala <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is Pro, Thr, or Val <400> 30 Gln Glu Thr Xaa Xaa 1 5 <210> 31 <211> 6 <212> PRT <213> Corynebacterium glutamicum <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa is Asn, Gly, Thr, Pro, or Ala <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is Pro, Thr, or Val <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa is Thr or Tyr <400> 31 Gln Glu Thr Xaa Xaa Xaa 1 5 <210> 32 <211> 6 <212> PRT <213> Corynebacterium glutamicum <400> 32 Gln Glu Thr Asn Pro Thr 1 5 <210> 33 <211> 6 <212> PRT <213> Corynebacterium glutamicum <400> 33 Gln Glu Thr Gly Thr Tyr 1 5 <210> 34 <211> 6 <212> PRT <213> Corynebacterium glutamicum <400> 34 Gln Glu Thr Thr Val Thr 1 5 <210> 35 <211> 6 <212> PRT <213> Corynebacterium glutamicum <400> 35 Gln Glu Thr Pro Val Thr 1 5 <210> 36 <211> 6 <212> PRT <213> Corynebacterium glutamicum <400> 36 Gln Glu Thr Ala Val Thr 1 5 <210> 37 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Factor Xa <400> 37 Ile Glu Gly Arg 1 <210> 38 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> ProTEV <400> 38 Glu Asn Leu Tyr Phe Gln 1 5 <210> 39 <211> 1161 <212> DNA <213> Corynebacterium glutamicum <400> 39 atgcgtcgcc acaagtccgc ggtcaccctg tccgaaaatc aggtcaccac ggtggggcag 60 gtcctccact tggcgattca aggctcccca acgggaatca cggttgtcga tcgcaccggc 120 gacgtcatct tatccaacgg ccgcgcccac gaattgggca tcgtccacga aagatccgtc 180 gacggcaacg tttggcgcgt cgcccaggaa gccttccaag accaagaaac ccactcactc 240 gacgtccacc cagaccgcaa tccgcggcgc ccgggtagtc gcatcaccgc agtgcaggca 300 gtggtcaagc ctttaacgct tatcgacgat cgtttcgtga tcatctatgc ctccgacgaa 360 tccgaaaacg tgcgcatgga atcggcacgc cgagacttcg tcgcaaacgt ctcccacgaa 420 ctgaaaaccc ccgtcggcgg catggcactc ctcgcggaag ccctcatgga atcctccgac 480 gacccagaac aagtcgaata cttcggatcc aggctccacc gcgaagccca ccgcatggcc 540 gacatgatca acgaactgat ctccctttcc aaacttcagg gcgccgaacg actccctgat 600 atggaacccg tccaggctga cgacatcatc agcgaagcca tcgaacgcac ccaactcgcc 660 gccgacaacg ccaacatcga aatcattcgc ggcgaccgca ccggcgtttg ggtagaagcc 720 gatcgatccc tgctggtcac agccctggcg aacctgatca gcaatgcaat caactactca 780 ccaaaatcag tccccgtctc cgtttcacaa agcatccgaa acgacgtggt catgatccga 840 gtaaccgacc gcggcattgg catcgcaccc gaagaccaag gccgagtttt cgaaagattc 900 ttccgcgtcg acaaagcccg ctcccgccaa accggcggaa ctggccttgg cctcgcgata 960 gtcaaacatg tcatggccaa ccatggcggt agtattagtt tgtggtcacg tcctggaaca 1020 ggctccacat tcacacttga actccccgtt tatcacccag agtccaagga accggcagga 1080 tctaagcagg gacctagttt ggattcacct attcgtacga ctgcgtccaa agcatctggg 1140 cgccgaaagg aaaaatcatg a 1161 <210> 40 <211> 386 <212> PRT <213> Corynebacterium glutamicum <400> 40 Met Arg Arg His Lys Ser Ala Val Thr Leu Ser Glu Asn Gln Val Thr 1 5 10 15 Thr Val Gly Gln Val Leu His Leu Ala Ile Gln Gly Ser Pro Thr Gly 20 25 30 Ile Thr Val Val Asp Arg Thr Gly Asp Val Ile Leu Ser Asn Gly Arg 35 40 45 Ala His Glu Leu Gly Ile Val His Glu Arg Ser Val Asp Gly Asn Val 50 55 60 Trp Arg Val Ala Gln Glu Ala Phe Gln Asp Gln Glu Thr His Ser Leu 65 70 75 80 Asp Val His Pro Asp Arg Asn Pro Arg Arg Pro Gly Ser Arg Ile Thr 85 90 95 Ala Val Gln Ala Val Val Lys Pro Leu Thr Leu Ile Asp Asp Arg Phe 100 105 110 Val Ile Ile Tyr Ala Ser Asp Glu Ser Glu Asn Val Arg Met Glu Ser 115 120 125 Ala Arg Arg Asp Phe Val Ala Asn Val Ser His Glu Leu Lys Thr Pro 130 135 140 Val Gly Gly Met Ala Leu Leu Ala Glu Ala Leu Met Glu Ser Ser Asp 145 150 155 160 Asp Pro Glu Gln Val Glu Tyr Phe Gly Ser Arg Leu His Arg Glu Ala 165 170 175 His Arg Met Ala Asp Met Ile Asn Glu Leu Ile Ser Leu Ser Lys Leu 180 185 190 Gln Gly Ala Glu Arg Leu Pro Asp Met Glu Pro Val Gln Ala Asp Asp 195 200 205 Ile Ile Ser Glu Ala Ile Glu Arg Thr Gln Leu Ala Ala Asp Asn Ala 210 215 220 Asn Ile Glu Ile Ile Arg Gly Asp Arg Thr Gly Val Trp Val Glu Ala 225 230 235 240 Asp Arg Ser Leu Leu Val Thr Ala Leu Ala Asn Leu Ile Ser Asn Ala 245 250 255 Ile Asn Tyr Ser Pro Lys Ser Val Pro Val Ser Val Ser Gln Ser Ile 260 265 270 Arg Asn Asp Val Val Met Ile Arg Val Thr Asp Arg Gly Ile Gly Ile 275 280 285 Ala Pro Glu Asp Gln Gly Arg Val Phe Glu Arg Phe Phe Arg Val Asp 290 295 300 Lys Ala Arg Ser Arg Gln Thr Gly Gly Thr Gly Leu Gly Leu Ala Ile 305 310 315 320 Val Lys His Val Met Ala Asn His Gly Gly Ser Ile Ser Leu Trp Ser 325 330 335 Arg Pro Gly Thr Gly Ser Thr Phe Thr Leu Glu Leu Pro Val Tyr His 340 345 350 Pro Glu Ser Lys Glu Pro Ala Gly Ser Lys Gln Gly Pro Ser Leu Asp 355 360 365 Ser Pro Ile Arg Thr Thr Ala Ser Lys Ala Ser Gly Arg Arg Lys Glu 370 375 380 Lys Ser 385 <210> 41 <211> 699 <212> DNA <213> Corynebacterium glutamicum <400> 41 atgacgacaa tcctgatcgt tgaagatgag gaatcgttag cagatccttt ggcctttctt 60 cttcgcaaag aaggttttga caccatcatc gccggtgatg gcccaaccgc acttgtggag 120 ttcagtcgca acgaaatcga catcgtcctc ttagacctca tgctcccagg catgtctggc 180 accgacgtat gcaaagaact ccgcagcgta tccactgttc ccgtcatcat ggtcaccgcc 240 cgcgactccg agatcgacaa agttgttggc ctcgaactcg gcgccgatga ttatgtaacc 300 aagccatatt cttcccgcga actcatcgcc cgcatccgcg ctgtcctgcg ccgacgcgga 360 gttactgaaa ccgaagccga agaattacca cttgacgatc aaatcctcga aggcggccgc 420 gtccgcatgg acgtcgattc ccacaccgtc accgtcggtg gcgaaccagt gagcatgcca 480 ctgaaggaat tcgaccttct ggagtacctc ctccgcaacg ccggccgagt cctcacccgc 540 ggacagctca tcgaccgaat ttggggcgca gattacgtcg gcgacaccaa aaccctcgac 600 gttcatgtca aaaggttgcg ttccaagatc gaagaagagc catctcgacc tcgttacctc 660 gtgaccgtgc gtggattggg ctacaaattc gagctgtag 699 <210> 42 <211> 232 <212> PRT <213> Corynebacterium glutamicum <400> 42 Met Thr Thr Ile Leu Ile Val Glu Asp Glu Glu Ser Leu Ala Asp Pro 1 5 10 15 Leu Ala Phe Leu Leu Arg Lys Glu Gly Phe Asp Thr Ile Ile Ala Gly 20 25 30 Asp Gly Pro Thr Ala Leu Val Glu Phe Ser Arg Asn Glu Ile Asp Ile 35 40 45 Val Leu Leu Asp Leu Met Leu Pro Gly Met Ser Gly Thr Asp Val Cys 50 55 60 Lys Glu Leu Arg Ser Val Ser Thr Val Pro Val Ile Met Val Thr Ala 65 70 75 80 Arg Asp Ser Glu Ile Asp Lys Val Val Gly Leu Glu Leu Gly Ala Asp 85 90 95 Asp Tyr Val Thr Lys Pro Tyr Ser Ser Arg Glu Leu Ile Ala Arg Ile 100 105 110 Arg Ala Val Leu Arg Arg Arg Gly Val Thr Glu Thr Glu Ala Glu Glu 115 120 125 Leu Pro Leu Asp Asp Gln Ile Leu Glu Gly Gly Arg Val Arg Met Asp 130 135 140 Val Asp Ser His Thr Val Thr Val Gly Gly Glu Pro Val Ser Met Pro 145 150 155 160 Leu Lys Glu Phe Asp Leu Leu Glu Tyr Leu Leu Arg Asn Ala Gly Arg 165 170 175 Val Leu Thr Arg Gly Gln Leu Ile Asp Arg Ile Trp Gly Ala Asp Tyr 180 185 190 Val Gly Asp Thr Lys Thr Leu Asp Val His Val Lys Arg Leu Arg Ser 195 200 205 Lys Ile Glu Glu Glu Pro Ser Arg Pro Arg Tyr Leu Val Thr Val Arg 210 215 220 Gly Leu Gly Tyr Lys Phe Glu Leu 225 230 <210> 43 <211> 1335 <212> DNA <213> Corynebacterium glutamicum <400> 43 atgcagtcaa gcctagatcg tgtgtcggaa accggacgca atgagctcga tgttgaaacc 60 cttgtgaaga aggggaatca accgggcgcg atgagctatc gcaacagtat ccacattttg 120 acagcctcgc tgctggtcgt ggggttggga gcttccgccc gcctgacgct gccgatgttt 180 gcgctgtcgt gcgtgctgtt gtttgtgtgg ggttttctgt acttctatgg atcaaccaaa 240 cgcgtagatt tgagccacgg catgcagctg ggctggctgt ttgtgctgac gctggtgtgg 300 atttttatgg tgccgatcgt gcccgtgtcc atttatctgc tgttcccgct gtttttcctc 360 tatctacagg tgatgcctga cgtgagaggc attattgcga ttttgggtgc gacagcgatt 420 gcgattgcca gccagtattc cgtggggttg acctttggtg gtgtgatggg tccggtggtc 480 tctgcgatcg tgaccgtggc tattgattac gcgttccgca cgttgtggcg ggtgaataat 540 gaaaagcagg aattgattga tcagttgatt gaaactcgct cccagctggc ggtgacggaa 600 cgaaatgcgg gtatcgctgc ggaacgtcaa cgtattgcgc atgaaattca cgacacggtc 660 gcccagggac tctcctccat tcaaatgctg ctgcatgtct ctgaacagga gattctcgtt 720 gctgagatgg aagagaagcc aaaggaggcg atcgtgaaga agatgcgcct tgcccgacaa 780 acagcctccg acaatctcag tgaggctcgc gcgatgattg cggcgttgca accagcagcg 840 ctgtctaaaa cctccttgga agcagcactt caccgcgtca cagaaccgtt gttgggtatt 900 aattttgtga tttctgtcga cggtgatgtt cgccaactgc ccatgaaaac tgaagccacc 960 cttctgcgaa ttgctcaagg tgcgatcgga aatgtggcga aacattcaga ggcgaaaaac 1020 tgccacgtga cactaaccta cgaagacaca gaagtacgcc ttgatgtggt tgatgacggt 1080 gtgggttttg agccttcgga agtgtccagt acccccgctg gccttggcca tatcggctta 1140 accgcattgc agcagcgcgc gatggaattg cacggcgaag ttatagtgga atctgcatat 1200 gggcagggta ctgcggtatc tgcagcattg ccggtggagc caccagaggg gtttgtcggg 1260 gcgccggttt tggcagattc ggactcaagt gctacaggcg aggttgaact aagttctcca 1320 actgacgatg agtaa 1335 <210> 44 <211> 444 <212> PRT <213> Corynebacterium glutamicum <400> 44 Met Gln Ser Ser Leu Asp Arg Val Ser Glu Thr Gly Arg Asn Glu Leu 1 5 10 15 Asp Val Glu Thr Leu Val Lys Lys Gly Asn Gln Pro Gly Ala Met Ser 20 25 30 Tyr Arg Asn Ser Ile His Ile Leu Thr Ala Ser Leu Leu Val Val Gly 35 40 45 Leu Gly Ala Ser Ala Arg Leu Thr Leu Pro Met Phe Ala Leu Ser Cys 50 55 60 Val Leu Leu Phe Val Trp Gly Phe Leu Tyr Phe Tyr Gly Ser Thr Lys 65 70 75 80 Arg Val Asp Leu Ser His Gly Met Gln Leu Gly Trp Leu Phe Val Leu 85 90 95 Thr Leu Val Trp Ile Phe Met Val Pro Ile Val Pro Val Ser Ile Tyr 100 105 110 Leu Leu Phe Pro Leu Phe Phe Leu Tyr Leu Gln Val Met Pro Asp Val 115 120 125 Arg Gly Ile Ile Ala Ile Leu Gly Ala Thr Ala Ile Ala Ile Ala Ser 130 135 140 Gln Tyr Ser Val Gly Leu Thr Phe Gly Gly Val Met Gly Pro Val Val 145 150 155 160 Ser Ala Ile Val Thr Val Ala Ile Asp Tyr Ala Phe Arg Thr Leu Trp 165 170 175 Arg Val Asn Asn Glu Lys Gln Glu Leu Ile Asp Gln Leu Ile Glu Thr 180 185 190 Arg Ser Gln Leu Ala Val Thr Glu Arg Asn Ala Gly Ile Ala Ala Glu 195 200 205 Arg Gln Arg Ile Ala His Glu Ile His Asp Thr Val Ala Gln Gly Leu 210 215 220 Ser Ser Ile Gln Met Leu Leu His Val Ser Glu Gln Glu Ile Leu Val 225 230 235 240 Ala Glu Met Glu Glu Lys Pro Lys Glu Ala Ile Val Lys Lys Met Arg 245 250 255 Leu Ala Arg Gln Thr Ala Ser Asp Asn Leu Ser Glu Ala Arg Ala Met 260 265 270 Ile Ala Ala Leu Gln Pro Ala Ala Leu Ser Lys Thr Ser Leu Glu Ala 275 280 285 Ala Leu His Arg Val Thr Glu Pro Leu Leu Gly Ile Asn Phe Val Ile 290 295 300 Ser Val Asp Gly Asp Val Arg Gln Leu Pro Met Lys Thr Glu Ala Thr 305 310 315 320 Leu Leu Arg Ile Ala Gln Gly Ala Ile Gly Asn Val Ala Lys His Ser 325 330 335 Glu Ala Lys Asn Cys His Val Thr Leu Thr Tyr Glu Asp Thr Glu Val 340 345 350 Arg Leu Asp Val Val Asp Asp Gly Val Gly Phe Glu Pro Ser Glu Val 355 360 365 Ser Ser Thr Pro Ala Gly Leu Gly His Ile Gly Leu Thr Ala Leu Gln 370 375 380 Gln Arg Ala Met Glu Leu His Gly Glu Val Ile Val Glu Ser Ala Tyr 385 390 395 400 Gly Gln Gly Thr Ala Val Ser Ala Ala Leu Pro Val Glu Pro Pro Glu 405 410 415 Gly Phe Val Gly Ala Pro Val Leu Ala Asp Ser Asp Ser Ser Ala Thr 420 425 430 Gly Glu Val Glu Leu Ser Ser Pro Thr Asp Asp Glu 435 440 <210> 45 <211> 639 <212> DNA <213> Corynebacterium glutamicum <400> 45 atgattcgcg tgctgcttgc tgatgaccac gaaatcgtga ggctcggact ccgggctgtg 60 ctggaaagcg ccgaggacat tgaagtggtg ggcgaagtct ccaccgccga aggtgcggtg 120 caggcagccc gagaaggcgg aatcgacgtc atcttgatgg acctccgatt cggccccggc 180 gtccaaggaa cccaggtatc caccggcgca gacgccaccg cagccatcaa gcgaaacatc 240 gataacccgc caaaagtcct ggttgtgacc aactacgaca ccgacacaga catcctcggc 300 gcaatcgaag ccggcgcact gggctacctg ctcaaagacg ccccaccgag cgaactcctg 360 gcagcagtac gatccgcagc agaaggtgac tccacactgt cacccatggt tgctaaccgc 420 ctgatgactc gcgtgcgaac ccccaaaacc tcactcaccc cacgcgagct ggaggttctc 480 aaactggtcg ccggcggttc ctccaaccgc gacattggcc gtatcctctt cctctcagaa 540 gccacggtga aatcccacct cgtgcacatc tacgacaagc tcggcgtgcg gtcacgtacc 600 tccgctgtcg cagccgcacg tgagcagggg ctgctgtag 639 <210> 46 <211> 212 <212> PRT <213> Corynebacterium glutamicum <400> 46 Met Ile Arg Val Leu Leu Ala Asp Asp His Glu Ile Val Arg Leu Gly 1 5 10 15 Leu Arg Ala Val Leu Glu Ser Ala Glu Asp Ile Glu Val Val Gly Glu 20 25 30 Val Ser Thr Ala Glu Gly Ala Val Gln Ala Ala Arg Glu Gly Gly Ile 35 40 45 Asp Val Ile Leu Met Asp Leu Arg Phe Gly Pro Gly Val Gln Gly Thr 50 55 60 Gln Val Ser Thr Gly Ala Asp Ala Thr Ala Ala Ile Lys Arg Asn Ile 65 70 75 80 Asp Asn Pro Pro Lys Val Leu Val Val Thr Asn Tyr Asp Thr Asp Thr 85 90 95 Asp Ile Leu Gly Ala Ile Glu Ala Gly Ala Leu Gly Tyr Leu Leu Lys 100 105 110 Asp Ala Pro Pro Ser Glu Leu Leu Ala Ala Val Arg Ser Ala Ala Glu 115 120 125 Gly Asp Ser Thr Leu Ser Pro Met Val Ala Asn Arg Leu Met Thr Arg 130 135 140 Val Arg Thr Pro Lys Thr Ser Leu Thr Pro Arg Glu Leu Glu Val Leu 145 150 155 160 Lys Leu Val Ala Gly Gly Ser Ser Asn Arg Asp Ile Gly Arg Ile Leu 165 170 175 Phe Leu Ser Glu Ala Thr Val Lys Ser His Leu Val His Ile Tyr Asp 180 185 190 Lys Leu Gly Val Arg Ser Arg Thr Ser Ala Val Ala Ala Ala Arg Glu 195 200 205 Gln Gly Leu Leu 210 <210> 47 <211> 1026 <212> DNA <213> Corynebacterium glutamicum <400> 47 gtgagtgcaa cagagaaacg tagatacgaa gtgttgcggg ccatcgtcgc tgattacatt 60 gcgtctcagg aacctgtcgg atcgaagtca ctcctcgagc gccataagct caacgtgagt 120 tctgcgacga tccgcaacga tatgtcggtg ctggaatccg atggctttat cgtccaggag 180 catgcaagtt ctggccgggt accaaccgaa aagggttacc gcctttttgt tgattccatc 240 catgacatca agccgctgtc gctggcggaa cggcgcgcta ttttgggctt ccttgaaggg 300 ggagtggact tagaggacgt gctgcgcagg tctgtgcagc tgttgtctca gctcacccat 360 caggctgccg tggtgcagct gcccaccttg aaaacagcgc gcgtgaagca ctgcgaggtg 420 gtgccgctgt cgccgatgcg cttgctgctg gtgctcatta ccgatactgg ccgtgtagat 480 cagcgcaacg tggaacttga ggaaccgctg gcggcggaag aagttaatgt gctgcgcgat 540 ctgctcaacg gcgcgctagg ggagaaaacg ctgacggctg catcagatgc gctggaggag 600 ttggctcagc aagccccaac cgatattcgt gatgccatgc gccgctgctg cgatgtactg 660 gtgaacacgc ttgtcgatca accctctgac cgcctgatcc tcgccggcac ctcaaacctc 720 acccgcttaa gcagggaaac ctccgcgagc ctaccgatgg ttttagaagc cttggaagag 780 caggtggtca tgttgaaact gctgtccaat gtcactgatc ttgaccaagt gagcgtgcat 840 attggcggcg aaaatgaaga cattgagctg cgcagcgcaa cggtgattac caccggttac 900 ggctcccagg gcagcgcact gggcggattg ggggtggttg gccccaccta tatggactac 960 tcgggaacaa tttctaaggt gtccgccgtt gctaagtatg ttggtcgtgt gctcgctggc 1020 gaatag 1026 <210> 48 <211> 341 <212> PRT <213> Corynebacterium glutamicum <400> 48 Met Ser Ala Thr Glu Lys Arg Arg Tyr Glu Val Leu Arg Ala Ile Val 1 5 10 15 Ala Asp Tyr Ile Ala Ser Gln Glu Pro Val Gly Ser Lys Ser Leu Leu 20 25 30 Glu Arg His Lys Leu Asn Val Ser Ser Ala Thr Ile Arg Asn Asp Met 35 40 45 Ser Val Leu Glu Ser Asp Gly Phe Ile Val Gln Glu His Ala Ser Ser 50 55 60 Gly Arg Val Pro Thr Glu Lys Gly Tyr Arg Leu Phe Val Asp Ser Ile 65 70 75 80 His Asp Ile Lys Pro Leu Ser Leu Ala Glu Arg Arg Ala Ile Leu Gly 85 90 95 Phe Leu Glu Gly Gly Val Asp Leu Glu Asp Val Leu Arg Arg Ser Val 100 105 110 Gln Leu Leu Ser Gln Leu Thr His Gln Ala Ala Val Val Gln Leu Pro 115 120 125 Thr Leu Lys Thr Ala Arg Val Lys His Cys Glu Val Val Pro Leu Ser 130 135 140 Pro Met Arg Leu Leu Leu Val Leu Ile Thr Asp Thr Gly Arg Val Asp 145 150 155 160 Gln Arg Asn Val Glu Leu Glu Glu Pro Leu Ala Ala Glu Glu Val Asn 165 170 175 Val Leu Arg Asp Leu Leu Asn Gly Ala Leu Gly Glu Lys Thr Leu Thr 180 185 190 Ala Ala Ser Asp Ala Leu Glu Glu Leu Ala Gln Gln Ala Pro Thr Asp 195 200 205 Ile Arg Asp Ala Met Arg Arg Cys Cys Asp Val Leu Val Asn Thr Leu 210 215 220 Val Asp Gln Pro Ser Asp Arg Leu Ile Leu Ala Gly Thr Ser Asn Leu 225 230 235 240 Thr Arg Leu Ser Arg Glu Thr Ser Ala Ser Leu Pro Met Val Leu Glu 245 250 255 Ala Leu Glu Glu Gln Val Val Met Leu Lys Leu Leu Ser Asn Val Thr 260 265 270 Asp Leu Asp Gln Val Ser Val His Ile Gly Gly Glu Asn Glu Asp Ile 275 280 285 Glu Leu Arg Ser Ala Thr Val Ile Thr Thr Gly Tyr Gly Ser Gln Gly 290 295 300 Ser Ala Leu Gly Gly Leu Gly Val Val Gly Pro Thr Tyr Met Asp Tyr 305 310 315 320 Ser Gly Thr Ile Ser Lys Val Ser Ala Val Ala Lys Tyr Val Gly Arg 325 330 335 Val Leu Ala Gly Glu 340 <210> 49 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 gaattgggca tcgtccacga aa 22 <210> 50 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 caacgatcag gattgtcgtc atg 23 <210> 51 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 catgacgaca atcctgatcg ttggcgtgga ttgggctaca aattc 45 <210> 52 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 gctaattatg ggcatccaag gg 22 <210> 53 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 tcgagctcgg tacccccaaa aggaatcagg ccag 34 <210> 54 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 54 gacctagttc aaacacggga ggctgctgta gcg 33 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 tgtttgaact aggtccttcc 20 <210> 56 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 ctctagagga tccccggttg acctttggtg gtg 33 <210> 57 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 catcattggg ctgagtacct g 21 <210> 58 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 cgaatagctg cgggtatagt tg 22 <210> 59 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 59 caactatacc cgcagctatt cgtacgtttc tctgttgcac tcac 44 <210> 60 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 60 gttgattggt gcggacggtt t 21 <210> 61 <211> 117 <212> PRT <213> Vicugna pacos <400> 61 Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Asp 20 25 30 Ala Met Thr Trp Val Arg Gln Ala Pro Gly Lys Ala Leu Glu Trp Val 35 40 45 Ser Ser Ile Thr Leu Leu Gly Gly Gly Ile Pro Tyr Tyr Ser Asp Thr 50 55 60 Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Thr Lys Asn Met Leu 65 70 75 80 Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr 85 90 95 Cys Ala Lys Gly Phe Lys Ser Asp Tyr Pro Arg Gly Gln Gly Thr Gln 100 105 110 Val Thr Val Ser Ser 115 <210> 62 <211> 354 <212> DNA <213> Vicugna pacos <400> 62 caggttcagc ttgtggaatc cggcggtggc ttggtgcagc ctggtggctc ccttcgcttg 60 tcttgcgcag cttccggctt caccttctcc aacgatgcaa tgacctgggt ccgtcaggca 120 cctggtaaag cgcttgagtg ggtttcctct atcaccctgc tcggtggcgg tattccatac 180 tactctgata ccgtgaaggg ccgcttcacc atctcccgtg acaacaccaa aaacatgctg 240 tacctgcaga tgaactctct caagccagaa gataccgcag tctactactg tgctaagggt 300 ttcaaatccg actaccctcg cggtcagggc acccaggtga ccgtctcctc ttag 354 <210> 63 <211> 154 <212> PRT <213> Homo sapiens <400> 63 Ala Ala Gly Ser Ile Thr Thr Leu Pro Ala Leu Pro Glu Asp Gly Gly 1 5 10 15 Ser Gly Ala Phe Pro Pro Gly His Phe Lys Asp Pro Lys Arg Leu Tyr 20 25 30 Cys Lys Asn Gly Gly Phe Phe Leu Arg Ile His Pro Asp Gly Arg Val 35 40 45 Asp Gly Val Arg Glu Lys Ser Asp Pro His Ile Lys Leu Gln Leu Gln 50 55 60 Ala Glu Glu Arg Gly Val Val Ser Ile Lys Gly Val Cys Ala Asn Arg 65 70 75 80 Tyr Leu Ala Met Lys Glu Asp Gly Arg Leu Leu Ala Ser Lys Cys Val 85 90 95 Thr Asp Glu Cys Phe Phe Phe Glu Arg Leu Glu Ser Asn Asn Tyr Asn 100 105 110 Thr Tyr Arg Ser Arg Lys Tyr Thr Ser Trp Tyr Val Ala Leu Lys Arg 115 120 125 Thr Gly Gln Tyr Lys Leu Gly Ser Lys Thr Gly Pro Gly Gln Lys Ala 130 135 140 Ile Leu Phe Leu Pro Met Ser Ala Lys Ser 145 150 <210> 64 <211> 465 <212> DNA <213> Homo sapiens <400> 64 gctgccggat ctattaccac gctcccggcg ctcccggaag acggtggaag cggcgccttc 60 ccacctggcc acttcaaaga cccgaaacgt ctgtattgta aaaatggcgg ttttttcctc 120 cgcatccacc cagatggtcg cgtcgatggt gtccgcgaaa agtccgaccc acacatcaag 180 ctgcaactgc aagcagagga acgtggcgtc gtgagcatca agggcgtgtg cgcaaaccgc 240 tatctggcca tgaaggagga tggtcgcctt cttgcatcca aatgcgtgac cgatgaatgc 300 ttcttctttg aacggctgga gtccaacaat tacaacacct accgctcccg caagtatacc 360 tcctggtatg tcgccctgaa acgcacggga caatataaac tgggttccaa gaccggtcct 420 ggccaaaagg cgattctttt cctcccaatg tccgcgaagt cttga 465

Claims

이종 단백질의 제조 방법으로서,
상기 이종 단백질의 분비 발현용의 유전자 구축물을 갖는 코리네형 세균을 배양하는 단계, 및
분비 생산된 이종 단백질을 회수하는 단계를 포함하고,
상기 코리네형 세균이, 하기 성질 (A), (B), 및 (C):
(A) RegX3 단백질의 활성이 비개변주와 비교하여 저하되는 성질;
(B) HrrSA 시스템의 활성이 비개변주와 비교하여 저하되는 성질;
(C) HrcA 단백질의 활성이 비개변주와 비교하여 저하되는 성질로부터 선택되는 2개 이상의 성질의 조합을 갖도록 개변되어 있으며,
상기 유전자 구축물이, 5'에서 3'방향으로, 코리네형 세균에서 기능하는 프로모터 서열, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열, 및 상기 이종 단백질을 코딩하는 핵산 서열을 포함하고,
상기 이종 단백질이, 상기 신호 펩타이드와의 융합 단백질로서 발현되는, 방법.
제1항에 있어서, 상기 성질 (A), (B) 및 (C)가 각각 하기 성질 (A1), (B1) 및 (C1)인, 방법:
(A1) RegX3 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(B1) HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수가 비개변주와 비교하여 저하되는 성질;
(C1) HrcA 단백질의 세포당 분자수가 비개변주와 비교하여 저하되는 성질.
제1항 또는 제2항에 있어서, 상기 코리네형 세균이 상기 성질 (A)와 (B)의 조합, 상기 성질 (A)와 (C)의 조합, 또는 상기 성질 (B)와 (C)의 조합을 갖는, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 코리네형 세균이 상기 성질 (A)와 (B)와 (C)의 조합을 갖는, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
제5항에 있어서, 적어도 HrrA 단백질의 활성을 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, HrrS 단백질 및 HrrA 단백질의 어느 한쪽 또는 양쪽의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
제7항에 있어서, 적어도 HrrA 단백질의 세포당 분자수를 저하시킴으로써, 상기 성질 (B)가 얻어진, 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 RegX3 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 42에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 42에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 42에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, SenX3-RegX3 시스템의 반응 조절인자로서의 기능을 갖는 단백질인, 방법.
제2항 내지 제9항 중 어느 한 항에 있어서, 상기 HrrS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 44에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 44에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 44에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 센서 키나아제로서의 기능을 갖는 단백질인, 방법.
제2항 내지 제10항 중 어느 한 항에 있어서, 상기 HrrA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 46에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 46에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질;
(c) 서열번호 46에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, HrrSA 시스템의 반응 조절인자로서의 기능을 갖는 단백질인, 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 HrcA 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 48에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 48에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질;
(c) 서열번호 48에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 열 충격 단백질의 전사 억제자로서의 기능을 갖는 단백질인, 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, regX3 유전자의 발현을 저하시킴으로써, 또는 regX3 유전자를 파괴함으로써, 상기 성질 (A)가 얻어진;
hrrS 유전자 및/또는 hrrA 유전자의 발현을 저하시킴으로써, 또는 hrrS 유전자 및/또는 hrrA 유전자를 파괴함으로써, 상기 성질 (B)가 얻어진; 및/또는,
hrcA 유전자의 발현을 저하시킴으로써, 또는 hrcA 유전자를 파괴함으로써, 상기 성질 (C)가 얻어진, 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, regX3 유전자의 결실에 의해, 상기 성질 (A)가 얻어지고;
hrrS 유전자 및/또는 hrrA 유전자의 결실에 의해, 상기 성질 (B)가 얻어지고; 및/또는,
hrcA 유전자의 결실에 의해, 상기 성질 (C)가 얻어진, 방법.
제1항 내지 제14항 중 어느 한 항에 있어서, 상기 코리네형 세균이, 추가로, 변이형 PhoS 단백질을 코딩하는 phoS 유전자를 유지하도록 개변되어 있는, 방법.
제15항에 있어서, 상기 변이가 야생형 PhoS 단백질에 있어서, 서열번호 2의 302 위치의 트립토판 잔기에 상당하는 아미노산 잔기를 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기로 치환한 변이인, 방법.
제16항에 있어서, 상기 방향족 아미노산 및 히스티딘 이외의 아미노산 잔기가, 라이신 잔기, 알라닌 잔기, 발린 잔기, 세린 잔기, 시스테인 잔기, 메티오닌 잔기, 아스파르트산 잔기, 또는 아스파라긴 잔기인, 방법.
제16항 또는 제17항에 있어서, 상기 야생형 PhoS 단백질이 하기 (a), (b), 또는 (c)에 기재된 단백질:
(a) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열을 포함하는 단백질;
(b) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입 및/또는 부가를 포함하는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질;
(c) 서열번호 2 내지 7 중 어느 하나에 나타낸 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, PhoRS 시스템의 센서 키나아제로서의 기능을 갖는 단백질인, 방법.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 신호 펩타이드가 Tat계 의존성 신호 펩타이드인, 방법.
제19항에 있어서, 상기 Tat계 의존성 신호 펩타이드가 TorA 신호 펩타이드, SufI 신호 펩타이드, PhoD 신호 펩타이드, LipA 신호 펩타이드 및 IMD 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 방법.
제19항 또는 제20항에 있어서, 상기 코리네형 세균이, 추가로, Tat계 분비 시스템을 코딩하는 유전자들로부터 선택되는 1종 이상의 유전자의 발현이 비개변주와 비교하여 상승하도록 개변되어 있는, 방법.
제21항에 있어서, 상기 Tat계 분비 시스템을 코딩하는 유전자가 tatA 유전자, tatB 유전자, tatC 유전자 및 tatE 유전자로 이루어지는, 방법.
제1항 내지 제18항 중 어느 한 항에 있어서, 상기 신호 펩타이드가 Sec계 의존성 신호 펩타이드인, 방법.
제23항에 있어서, 상기 Sec계 의존성 신호 펩타이드가 PS1 신호 펩타이드, PS2 신호 펩타이드 및 SlpA 신호 펩타이드로 이루어지는 그룹으로부터 선택되는 어느 하나의 신호 펩타이드인, 방법.
제1항 내지 제24항 중 어느 한 항에 있어서, 상기 유전자 구축물이, 코리네형 세균에서 기능하는 신호 펩타이드를 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 방법.
제25항에 있어서, 상기 유전자 구축물이, Gln-Glu-Thr을 포함하는 아미노산 서열을 코딩하는 핵산 서열과 이종 단백질을 코딩하는 핵산 서열 사이에, 추가로, 효소적 절단에 사용되는 아미노산 서열을 코딩하는 핵산 서열을 포함하는, 방법.
제1항 내지 제26항 중 어느 한 항에 있어서, 상기 코리네형 세균이 코리네박테리움속 세균인, 방법.
제27항에 있어서, 상기 코리네형 세균이 코리네박테리움 글루타미쿰인, 방법.
제28항에 있어서, 상기 코리네형 세균이, 코리네박테리움 글루타미쿰 AJ 12036(FERM BP-734)에서 유래하는 개변주 또는 코리네박테리움 글루타미쿰 ATCC 13869에서 유래하는 개변주인, 방법.
제1항 내지 제29항 중 어느 한 항에 있어서, 상기 코리네형 세균이, 세포 표층 단백질의 세포당 분자수가 비개변주와 비교하여 저하되어 있는 코리네형 세균인, 방법.