KR20180020213A

KR20180020213A - 유도성 공발현 시스템에 사용을 위한 벡터

Info

Publication number: KR20180020213A
Application number: KR1020187000942A
Authority: KR
Inventors: 세아 맥클레인; 마크 블라섹; 필립 배리시; 제레미 민셜
Original assignee: 에이비에스씨아이, 엘엘씨
Priority date: 2015-06-16
Filing date: 2016-06-16
Publication date: 2018-02-27
Also published as: IL256094A; IL256094B2; EP4039810A1; JP6976860B2; US20160376602A1; IL256094B1; WO2016205570A1; ES2906725T3; CN107849572A; MX2017016400A; DK3310919T3; EP3310919B1; EP3310919A1; CA2986443A1; AU2016278242A1; HK1253045A1; US11371048B2; IL307555A; AU2016278242B2; JP2021153600A

Abstract

본 발명은 각 유전자 산물의 발현의 제어된 유도가 가능한 유도성 공발현 시스템에 사용을 위한 발현 벡터를 제공한다.

Description

유도성 공발현 시스템에 사용을 위한 벡터

관련 출원의 참조

본 출원은 2012년 8월 5일자로 출원된 미국 가출원 제61/679,751호 및 2012년 12월 29일자로 출원된 미국 가출원 제61/747,246호에 대한 우선권의 이득을 35 U.S.C. §119(e) 하에 청구하는, 2013년 8월 5일자로 출원된 국제 특허 출원 PCT/US2013/053562의 35 U.S.C. §371 하의 국내 단계 진입 건인 미국 특허 출원 제 14/419,653호의 일부 계속 출원인 미국 특허 출원 제14/740,475호의 일부 계속 출원이고, 이들 전부의 전체 내용을 본 명세서에 참고로 편입시킨다.

미국 특허 출원 제14/740,475호는 또한 2012년 8월 5일자로 출원된 미국 가출원 제61/679,751호, 및 2012년 12월 29일자로 출원된 미국 가출원 제61/747,246호에 대한 우선권의 이득을 35 U.S.C. §119(e) 하에 청구하는 2013년 8월 5일자로 출원된 국제 특허 출원 PCT/US2013/053562의 우선권을 청구하는 2014년 2월 5일자로 출원된 국제 특허 출원 PCT/US2014/014968의 부분 계속 출원이며, 이들 전부의 전체 내용을 본 명세서에 참고로 편입시킨다.

서열 목록에 대한 참조

본 출원은 본 명세서에 참고로 편입되는 전자 제출된 서열 목록을 포함한다.

발명의 분야

본 발명은 분자 생물학 및 생명공학적 제조의 일반 기술 분야이다. 보다 구체적으로, 본 발명은 재조합 단백질 발현의 기술 분야이다.

생명공학적 물질의 생산은 복잡한 과정이고, 희망하는 생성물이 상이한 유전자에 의해 코딩되는 분자의 조합, 예컨대 2 이상의 상이한 폴리펩타이드로 형성된 다량체 단백질인 경우에는 더 그러하다. 다수 유전자 산물의 성공적인 공발현은 1종 이상의 유전자 산물의 동시 발현으로 인해 심각해 지는, 수많은 도전의 극복을 요구한다. 극복해야만 하는 문제들은 1가지 이상의 벡터 유형을 사용시 상용성 발현 벡터의 생성; 생성물의 정확한 화학양론적 비율의 획득; 결합 파트너에 대해 적절한 입체형태로 정확하게 폴딩되는 유전자 산물의 생성; 세포 및 원치않는 단백질, 예컨대 부정확하게 폴딩되고/되거나 부정확한 입체형태인 단백질로부터 희망 단백질의 정제; 및 희망 생성물(들)의 수율을 극대화하는 한 측면에 따라, 봉입체 형성의 최소화를 포함한다. 많은 다양한 접근법들이 이들 도전을 해결하기 위해 착수되었지만, 더 양호한 공발현 방법에 대한 요구는 여전히 존재한다.

lac 및 ara 프로모터를 함유하는 플라스미드를 포함하여, 몇몇 유도성 박테리아 단백질 발현 시스템이 개별 단백질을 발현하고자 고안되었다. 이들 시스템은 그들이 야생형 이.콜라이(E. coli)의 전체 성장 배양 개체군 내에서 균일하게 단백질을 유도시키는데 실패함에 따라 발현시키기 힘든 단백질의 공발현에서 유용성이 제한적이었다(Khlebnikov and Keasling, "Effect of lacY expression on homogeneity of induction from the P_tac and P_trc promoters by natural and synthetic inducers", Biotechnol Prog 2002 May-Jun; 18(3): 672-674). 야생형 이.콜라이 lac 및 ara 시스템의 경우처럼, 유도인자에 대한 수송 단백질의 발현이 유도인자의 존재에 의존적인 경우, 유도인자의 세포 농도는 수송 단백질의 생성을 개시시키기 위한 한계치 수준에 도달해야만 하지만, 그러한 한계치에 도달했을 때, 비제어적인 양성 피드백 루프가 발생될 수 있고, 그 결과는 세포 내 유도인자의 고수준 및 그에 따라 유도성 프로모터로부터 발현의 고수준, 즉 "실무율(all-or-none)" 현상이다. 성장 배지 내 유도인자의 농도 증가는 고발현 방식으로 존재하는 개체군 내 세포의 비율을 증가시킨다. 이러한 유형의 시스템이 개체군 규모에서 단백질 발현의 농도-의존적 유도를 유발시키지만, 독성인 것을 포함하여, 발현의 엄격한 제어를 요하거나, 가용성이 불충분하거나, 또는 다른 이유로 특별한 농도를 요하는 단백질의 발현 및 생성은 최적이하이다.

유도인자의 유도인자-의존적 수송을 제거하여, 단일 프로모터 발현 시스템에서 "실무율" 유도 현장을 해결하려는 일부 노력이 이루어져 왔다. 일례는 락토스 퍼미아제 유전자(lacYam)에 무효 돌연변이를 갖고, 수송체의 부재 하에서 어느 정도 세포막을 통과할 수 있는 lac 프로모터의 대체 유도인자, 예컨대 IPTG(아이소프로필-티오-β-D-갈락토사이드)를 사용하는 것이다(Jensen et al., "The use of lac-type promoters in control analysis", Eur J Biochem 1993 Jan 15; 211(1-2): 181-191). 다른 접근법은 아라비노스 수송체 유전자에 결함이 있지만, 락토스 퍼미아제 유전자에 돌연변이, lacY(A117C)를 갖는 균주에서 아라비노스 유도성 프로모터를 사용하여, 세포로 아라비노스를 수송할 수 있게 하는 것이다(Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377).

개별 단백질 발현 시스템의 성분들은 공발현 시스템에서 그들의 사용을 배제하고, 종종 비상용성인데, 그들이 상이한 유도인자-프로모터 시스템 사이의 혼선'으로 인해 부정적으로 영향받을 수 있거나, 상호 배타적인 게놈 변형을 요구하거나, 또는 일반 대사 조절이 가해질 수 있기 때문이다. lac 및 ara 유도성 프로모터 시스템간 '혼선' 문제를 해결하기 위한 시도는 lac 프로모터의 유도인자인, IPTG 존재 하에서 araBAD 프로모터를 유도시키는 이의 능력을 개선시키기 위한 AraC 전사 활성인자의 방향성 진화를 포함하였다(Lee et al., "Directed evolution of AraC for improved compatibility of arabinose- and lactose-inducible promoters", Appl Environ Microbiol 2007 Sep; 73(18): 5711-5715; Epub 2007 Jul 20). 그러나, ara 및 lac 유도성 프로모터를 기반으로 하는 발현 벡터의 상용성은 상호 배타적 게놈 변형, 즉 아라비노스에 의한 araBAD 프로모터의 균일 유도를 위한 lacY 점 돌연변이(lacY(A117C)), 및 IPTG에 의한 lac 프로모터의 균일 유도를 위한 무효 lacY 유전자의 요건에 기인하여 여전히 제한적이다. 일반 대사 조절, 예를 들어 탄소 이화산물 억제(CCR)가 또한 유도성 프로모터의 상용성에 영향을 줄 수 있다. CCR은 다른 당류보다 포도당의 우선적인 사용에서 확인되는 바와 같이, 보다 선호되는 화합물이 존재할 때 탄소-함유 화합물의 이용에 필요한 유전자의 억제를 특징으로 한다. ara 및 prp 유도성 프로모터 시스템의 경우에서, 아라비노스의 존재는 prpBCDE 프로모터로부터 발현을 유도하는 피로피오네이트의 능력을 감소시키며, CCR이 관여하는 것으로 여겨지는 효과이다(Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 2012 Aug 1; 504(1): 116-121, Epub 2012 May 3). 이들 문제를 극복한 유도성 공발현 시스템에 대한 필요성이 명확하게 존재한다.

본 발명은 각 유전자 산물 성분의 제어된 유도를 할 수 있는 유도성 공발현 시스템에서 사용을 위한 발현 작제물(expression construct)을 제공한다. 본 발명의 일 실시형태는 2종 이상의 유도성 프로모터를 포함하는 발현 작제물이고, 상기 유도성 프로모터의 적어도 하나는 상기 유도성 프로모터의 다른 것의 유도인자와 상이한 유도인자에 반응성이고, 상기 유도성 프로모터의 어떠한 것도 테트라사이클린 유도성 프로모터, 구리 유도성 프로모터, 및 메티오닌 유도성 프로모터로 이루어진 군으로부터 선택된 유도성 프로모터가 아니다. 일부 실시형태에서, 상기 발현 작제물은 락토스 유도성 프로모터를 포함하지 않고, 일정 실시형태에서, 상기 발현 작제물은 포스페이트 고갈에 의한 유도성 프로모터를 포함하지 않는다. 추가 실시형태에서, 발현 작제물은 염색체외(extrachromosomal)에 존재한다. 본 발명의 추가 실시형태는 2종 이상의 유도성 프로모터를 포함하는 발현 작제물을 제공하고, 상기 유도성 프로모터의 적어도 하나는 상기 유도성 프로모터의 다른 것의 유도인자와 상이한 유도인자에 반응성이고, (A) 각각의 유도성 프로모터는 L-아라비노스 유도성 프로모터, 프로피오네이트 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택되거나, 또는 (B) 적어도 1종의 유도성 프로모터는 araBAD 프로모터, prpBCDE 프로모터, rhaSR 프로모터, xlyA 프로모터, lacZYA 프로모터, 및 phoA 프로모터로 이루어진 군으로부터 선택되거나, 또는 (C) 상기 발현 작제물은 일부 실시형태에서 prpBCDE 프로모터인 적어도 1종의 프로피오네이트 유도성 프로모터, 및 L-아라비노스 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 포함하거나, 또는 (D) 상기 발현 작제물은 일부 실시형태에서 araBAD 프로모터인 적어도 1종의 L-아라비노스 유도성 프로모터, 및 프로피오네이트 유도성 프로모터, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 포함하거나, 또는 (E) 적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이거나, 또는 (F) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (G) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3151의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%) 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (H) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3151의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드, 및 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 50개(또는 적어도 75개, 또는 적어도 100개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드를 포함하거나, 또는 (I) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개(또는 적어도 3250개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드를 포함하거나, 또는 (J) 상기 발현 작제물은 서열번호 15의 적어도 3000개(또는 적어도 3250개, 또는 적어도 3500개, 또는 적어도 4000개, 또는 적어도 5000개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열을 포함하거나, 또는 (K) 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 1833 내지 5304를 포함하거나, 또는 (L) 상기 발현 작제물은 서열번호 15를 포함하거나, 또는 (M) 상기 발현 작제물은 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열을 더 포함하고, 일부 실시형태에서, 상기 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되거나; 또는 (N) 상기 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다.

본 발명은 또한 (a) 서열번호 15의 뉴클레오타이드 4937 내지 5185의 적어도 225개(또는 적어도 240개)의 인접한 염기와 적어도 97%의 서열 동일성을 갖는 뉴클레오타이드; (b) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 300개(또는 적어도 350개)의 인접한 염기와 적어도 80%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (c) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 350개(또는 적어도 375개, 또는 적어도 400개, 또는 적어도 425개)의 인접한 염기와 적어도 87%(또는 적어도 90%, 또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (d) 서열번호 2의 뉴클레오타이드 10 내지 1822의 적어도 400개(또는 적어도 450개, 또는 적어도 500개)의 인접한 염기와 적어도 90%(또는 적어도 95%)의 서열 동일성을 갖는 뉴클레오타이드 서열; (e) 서열번호 15의 뉴클레오타이드 2818 내지 3259; (f) 서열번호 15의 뉴클레오타이드 4937 내지 5185; (g) 서열번호 15의 뉴클레오타이드 4937 내지 5304; (h) 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5185; (i) 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304; (j) 서열번호 2의 뉴클레오타이드 10 내지 1822; 및 (k) 서열번호 2, 서열번호 4, 서열번호 5, 서열번호 6, 서열번호 7, 서열번호 8 및 서열번호 15로 이루어진 군으로부터 선택된 뉴클레오타이드 서열로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는 발현 작제물을 제공한다. 본 발명의 일정 실시형태에서, 상기 발현 작제물은 일부 실시형태에서 araBAD 프로모터인 L-아라비노스 유도성 프로모터; 일부 실시형태에서 prpBCDE 프로모터인 프로피오네이트 유도성 프로모터; 일부 실시형태에서 rhaSR 프로모터인 람노스 유도성 프로모터; 일부 실시형태에서 xlyA 프로모터인 자일로스 유도성 프로모터; 일부 실시형태에서 lacZYA 프로모터인 락토스 유도성 프로모터; 및 일부 실시형태에서 phoA 프로모터인 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 유도성 프로모터를 포함하고, 일부 실시형태에서, 상기 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다.

본 발명의 추가 실시형태에서, 발현 작제물은 pBAD240, pPRO43, pPRO44, pPRO45, pPRO430, pPRO430CloDF, 및 pSOL로 이루어진 군으로부터 선택된 플라스미드에 폴리뉴클레오타이드 서열을 삽입시키는 단계를 포함하는 방법에 의해 생성된다.

본 발명은 적어도 1종의 유도성 프로모터를 포함하는 상기 단락에 기술된 바와 같은 본 발명의 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 더 제공한다. 본 발명의 일부 실시형태에서, 이러한 숙주 세포는 원핵생물 세포이고, 일부 예에서는 이. 콜라이 세포이고, 일정 실시형태에서는 이. 콜라이 ASE(DGH) 세포이다. 본 발명의 다른 실시형태에서, 숙주 세포는 진핵생물 세포이고, 일부 예에서는 효모 세포이며, 일부 추가 예에서는 사카로마이세스 세레비지아(Saccharomyces cerevisiae) 세포이다. 본 발명은 또한 하기 중 하나 이상을 더 포함하는 숙주 세포를 제공한다: (a) araBAD 유전자의 결실; (b) araE 및/또는 araFGH 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자;(d) prpB 및/또는 prpD 유전자의 감소된 유전자 기능; (e) sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) gor 및 trxB 유전자의 감소된 유전자 기능; (g) AscG 유전자의 감소된 유전자 기능; (h) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (i) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (j) 샤페론, 예컨대 단백질 다이설파이드 아이소머라제(PDI)를 코딩하는, 폴리뉴클레오타이드. 일정 추가 실시형태에서, (A) 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 가지며, 다른 예로서, 상기 수송체 단백질을 코딩하는 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG, 및 xylH로 이루어진 군으로부터 선택되거나, 또는 특히 araE이거나, 또는 상기 유전자 기능의 변경은 보다 구체적으로 항시성 프로모터(constitutive promoter)로부터 araE의 발현이고/이거나; (B) 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖고, 추가 예로서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 유전자는 araA, araB, araD, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되고/되거나; (C) 숙주 세포는, 추가 실시형태에서 유전자가 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖고/갖거나; (D) 숙주 세포는 티오레독신 환원효소 유전자, 특히 trxB의 유전자 기능의 감소된 수준을 갖고/갖거나; (E) 숙주 세포는, 일정 실시형태에서 유전자가 글루타티온 환원효소 유전자 gor 및/또는 글루타티온 합성효소 유전자 gshA 및 gshB 중 하나 이상인, 글루타티온 환원효소 유전자 및/또는 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖고/갖거나; (F) 숙주 세포는 AhpC의 적어도 하나의 돌연변이체를 발현하고/하거나; (G) 숙주 세포는 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 갖고, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되고/되거나; (H) 숙주 세포는 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 갖고, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택된다.

본 발명의 다른 측면에서, 2 이상의 유형의 발현 작제물을 포함하는 숙주 세포가 제공되고, 각 유형의 상기 발현 작제물은 유도성 프로모터를 포함하며, 상기 각 유형의 발현 작제물은 서로 다른 유형의 발현 작제물의 유도성 프로모터가 아닌 유도성 프로모터를 포함하거나, 또는 각 유형의 상기 발현 작제물은 서로 다른 유형의 발현 작제물의 복제 기원과 상이한 복제 기원을 포함한다.

본 발명의 추가 실시형태에서, 숙주 세포에 포함되는 적어도 1종의 발현 작제물은 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열을 더 포함하고, 일부 실시형태에서, 전사 조절인자를 코딩하는 폴리뉴클레오타이드 서열 및 상기 전사 조절인자가 결합하는 유도성 프로모터는 동일한 발현 작제물에 존재하고, 추가 예에서, 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되거나, 또는 구체적으로 AraC이거나, 또는 PrpR이다.

본 발명은 또한 적어도 1종의 유도성 프로모터를 포함하는, 상기 단락에 기술된 바와 같은 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 또한 제공하고, 상기 적어도 1종의 발현 작제물은 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함한다. 본 발명의 다른 예는 적어도 1종의 유도성 프로모터 및 유도성 프로모터로부터 전사되는 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 포함하는 적어도 1종의 발현 작제물을 포함하는 숙주 세포를 포함하고, 일정 실시형태에서 적어도 1종의 유전자 산물은 폴리펩타이드이거나, 또는 신호 서열이 결여된 폴리펩타이드이거나, 또는 적어도 하나 및 20개 보다 적은 이황화 결합, 또는 적어도 2개 및 17개보다 적은 이황화 결합, 또는 적어도 18개 및 100개보다 적은 이황화 결합, 또는 적어도 3개 및 10개보다 적은 이황화 결합, 또는 적어도 3개 및 8개보다 적은 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이거나, 또는 인플릭시맙 중쇄 또는 경쇄 또는 이의 단편이다.

본 발명은 또한 예컨대 상기 기술된 바와 같은 본 발명의 숙주 세포의 배양물을 성장시키는 단계, 및 일부 실시형태에서 적어도 1종의 유도성 프로모터의 유도인자를 첨가하는 단계, 및 추가 실시형태에서, 배양물로부터 유전자 산물을 정제하는 단계에 의해 유전자 산물을 생성시키는 방법을 제공한다. 본 발명의 특정 측면에서, 상기 방법으로 생성된 유전자 산물은 적어도 하나의 이황화 결합을 형성하거나, 또는 적어도 2개 및 17개보다 적은 이황화 결합을 형성하거나, 또는 적어도 2개 및 10개보다 적은 이황화 결합을 형성하거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이다. 본 발명은 또한 상기 방법으로 생성된 유전자 산물을 제공하고, 상기 유전자 산물은 신호 펩타이드가 결여되고, 일정 실시형태에서 적어도 하나의 이황화 결합, 또는 적어도 2개 및 17개보다 적은 이황화 결합, 또는 적어도 18개 및 100개 보다 적은 이황화 결합, 또는 적어도 3개 및 10개보다 적은 이황화 결합, 또는 적어도 3개 및 8개보다 적은 이황화 결합을 형성하거나, 또는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개 및 9개로 이루어진 군으로부터 선택된 다수의 이황화 결합을 형성하는 폴리펩타이드이거나, 또는 면역글로불린 중쇄 또는 경쇄 또는 이의 단편이다. 이 방법으로 생성된 유전자 산물, 및 일부 실시형태에서는, 일정 실시형태에서 항체이거나, 또는 보다 구체적인 예에서, 무당화 항체, 키메라 항체, 또는 인간 항체인, 다량체 생성물의 일부가 또한 본 발명에서 제공된다.

또한 상기 단락에 기술된 바와 같은 발현 작제물을 포함하는 키트; 숙주 세포를 포함하는 키트로서, 상기 숙주 세포는 상기 단락에 기술된 바와 같은 본 발명의 적어도 1종의 발현 작제물을 포함하는 숙주 세포인 키트; 및 일부 실시형태에서 적어도 1종의 유도인자를 배양물에 첨가하는 단계를 포함하는, 본 발명의 숙주 세포를 성장시켜 생성된 유전자 산물 또는 다량체 생성물을 포함하는 키트로서, 일부 실시형태에서 상기 다량체 생성물은 항체이거나, 또는 보다 구체적인 예에서 무당화 항체, 키메라 항체 또는 인간 항체인 키트가 본 발명의 시스템 및 방법에 의해 제공된다.

도 1은 유도인자(5)의 적용시 상이한 유전자 산물을 발현시켜, 다량체 생성물(6)을 형성하는, 2종의 상이한 유도성 발현 벡터(3) 및 (4)를 포함하는 숙주 세포(1)를 포함하는, 유도성 공발현 시스템의 개략적인 예시도이다.
도 2는 유도성 공발현 시스템의 특정 용도의 개략적인 개시도로서, 이. 콜라이 숙주 세포 게놈(2)이 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 코딩하며, 발현 벡터 pBAD24(또는 L-아라비노스 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pBAD240)(3)는 면역글로불린 중쇄의 L-아라비노스 유도성 발현을 제공하고, 발현 벡터 pPRO33(또는 프로피오네이트 유도성 프로모터를 함유하는 다른 발현 벡터, 예컨대 pPRO43, pPRO430, pPRO430(CloDF13), pPRO44, 또는 pPRO45)(4)은 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하며, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 3은 유도인자(5)의 적용 시 상이한 유전자 산물을 발현하여, 다량체 생성물(6)을 형성하는, 2종의 상이한 유도성 프로모터(3) 및 (4)를 포함하는 유도성 발현 벡터를 포함하는 숙주 세포(1)를 포함하는, 유도성 공발현 시스템의 개략적인 예시도이다.
도 4는 유도성 공발현 시스템의 특정 용도의 개략적인 예시도로서, 이. 콜라이 숙주 세포 게놈(2)은 유전자 변경 예컨대 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태를 포함하고, 다중 프로모터 발현 벡터 예컨대 pSOL은 (3) 면역글로불린 중쇄의 L-아라비노스 유도성 발현 및 (4) 면역글로불린 경쇄의 프로피오네이트 유도성 발현을 제공하여, 유도(5) 시 다량체 항체 생성물(6)을 형성시킨다.
도 5는 유도성 공발현 시스템에 사용하기 위한 벡터("pSOL"이라고도 하는 "이중 벡터")의 개략적인 대표도이다.
도 6은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프이고, 이 그래프에서, 프로피오네이트 유도성 prpBCDE 프로모터로부터 발현된 적색 형광 단백질(RedFP) 유래의 형광이 도시된다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pPRO, pBAD': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 먼저 열거하였고, 다음으로 L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 열거하였다.
도 7은 박테리아 세포에서 형광 단백질의 공발현의 시간 경과를 도시한 그래프로서, 이 그래프에서 L-아라비노스 유도성 araBAD 프로모터로부터 발현된, 노란색 형광 단백질(YellowFP) 유래의 형광을 도시한다. 'pSOL': 이. 콜라이 ASE(DGH) 세포 내 pSOL-YellowFP-RedFP. 'pBAD, pPRO': 이. 콜라이 ASE(DGH) 세포 내 pBAD24-YellowFP/pPRO33-RedFP. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였는데, L-아라비노스 농도(0 마이크로몰, 6.66 마이크로몰, 또는 66.61 마이크로몰)를 먼저 열거한 후, 프로피오네이트 농도(0mM, 5mM, 또는 20mM)를 열거하였다.

비상용성 고발현 시스템 성분의 문제는 개별 발현 작제물 상에 위치되고, 일부 실시형태에서는 상이한 유도인자에 의해 활성화되는 상용성의 균일하게 유도될 수 있는 프로모터 시스템을 이용하는 협동적인 박테리아 공발현 시스템의 개발에 의해 해결된다. 본 발명의 장점은 제한없이, 1) 유도성 공발현 시스템 내 성분의 개선된 상용성; 2) 함께 다량체를 형성하는 유전자 산물, 또는 유전자 산물의 다른 조합의 유도성 발현(2 이상의 유전자 산물의 공발현); 3) 독립적으로 적정할 수 있는 유도에 의한 유전자 산물 공발현의 개선된 제어; 4) 유전자 산물 복합체 및 예컨대 다량체 생성물을 발현시키기 힘든 다른 생성물 및 이황화 결합을 형성하는 생성물의 개선된 발현; 5) 유전자 산물 공발현의 능력적인 최적화를 포함한다.

공발현되는 유전자 산물. 본 발명의 유도성 공발현 시스템은 희망 생성물에 기여하는 2 이상의 상이한 유전자 산물을 공발현하도록 디자인된다. 희망 생성물은 공발현된 유전자 산물로부터 생성된 다량체일 수 있거나, 또는 공발현을 사용하여 희망 생성물에 더해 그 희망 생성물의 발현을 보조하는 추가의 생성물 또는 생성물들의 조합을 생성시킬 수 있다.

'다량체 생성물'은 다량체 생성물의 기능을 수행하도록 함께 조립되는 유전자 산물의 세트를 의미하고, 유전자 산물과 다른 분자, 예컨대 변형 효소(키나제, 펩티다제 등), 샤페론, 수송체 등 간의 일시적인 회합을 의미하지 않는다. 본 발명의 일정 실시형태에서, 다량체 생성물은 이종다량체이다. 많은 실시형태에서, 공발현된 유전자 산물은 다량체 단백질의 서브유닛인 폴리펩타이드이게 된다. 그러나, 다수의 상이한 비코딩 RNA 분자, 또는 폴리펩타이드와 비코딩 RNA 유전자 산물의 조합을 공발현하기 위해 본 발명의 유도성 공발현 시스템을 사용하는 것이 또한 가능하다. 비단백질 코딩 RNA(npcRNA), 비메신저 RNA(nmRNA), 및 기능적 RNA(fRNA)라고도 하는, 비코딩 RNA 분자는 많은 상이한 유형의 RNA 분자, 예컨대 메신저 RNA가 아니고, 따라서 번역을 통해 폴리펩타이드의 형성을 위한 주형이 아닌 마이크로RNA를 포함한다.

많은 생물학적으로 중요한 생성물이 상이한 폴리펩타이드 사슬의 조합으로 형성된다. 항체 및 항체 단편 이외에도, 본 발명의 유도성 공발현 방법으로 생성시킬 수 있는 다른 다량체 생성물은 G-커플링된 단백질 수용체 및 리간드-게이팅 이온 채널 예컨대 니코틴성 아세틸콜린 수용체, GABA_A 수용체, 글리신 수용체, 세로토닌 수용체, 글루타메이트 수용체, 및 ATP-게이팅 수용체 예컨대 P2X 수용체를 포함한다. 보툴리늄 신경독소(흔히 BoTN, BTX, 또는 이의 시판 형태 중 하나, 보톡스(BOTOX)(상표명)(오나보툴리늄톡신A)라고 함)는 이황화 결합으로 연결된 중쇄 및 경쇄로 형성된다(Simpson et al., "The role of the interchain disulfide bond in governing the pharmacological actions of botulinum toxin", J Pharmacol Exp Ther 2004 Mar; 308(3): 857-864, Epub 2003 Nov 14). 상이한 폴리펩타이드 사슬로 형성된 생성물의 다른 예는 인슐린으로서, 진핵생물에서 단일 폴리펩타이드 사슬로 먼저 번역되어, 폴딩된 후 최종적으로 이황화 결합에 의해 함께 유지되는 2개의 폴리펩타이드 사슬로 절단된다. 단일한 숙주 세포에서 보튤리늄 신경독소 또는 성숙한 인슐린의 효율적인 생성이 본 발명의 유도성 공발현 방법의 사용의 예시이다.

본 발명의 방법은 정확하게 폴딩되고/되거나 기능성 생성물로 조립되고, 그러한 기능성 생성물 내의 바람직한 위치(예컨대 실시예 11과 같은 방법으로 결정할 수 있음)에서 바람직한 개수의 이황화 결합을 갖는 유전자 산물을 생성하도록 디자인된다. 유전자 산물 예컨대 폴리펩타이드에 대한 이황화 결합의 개수는 그것이 바람직한 기능성 생성물로 존재 시 그 유전자 산물에 의해 형성되는 분자내 및 분자간 결합의 총 개수이다. 예를 들어, 인간 IgG 항체의 경쇄는 전형적으로 3개의 이황화 결합(2개의 분자내 결합 및 1개의 분자간 결합)을 가지며, 인간 IgG 항체의 중쇄는 전형적으로 7개의 이황화 결합(4개의 분자내 결합 및 3개의 분자간 결합)을 갖는다. 일부 실시형태에서, 바람직한 유전자 산물은 다른 유전자 산물, 예컨대 그 바람직한 유전자 산물의 생성에 유익한, 샤페론과 공발현된다. 샤페론은 다른 유전자 산물의 비공유 폴딩 또는 언폴딩, 및/또는 조립 또는 탈조립을 보조하지만, 구조가 극들의 정상적인 생물학적 기능을 수행시(폴딩 및/또는 조립의 과정을 완료함) 최종 단량체 또는 다량체 유전자 산물 구조에는 존재하지 않는 단백질이다. 샤페론은 발현 작제물 내 유도성 프로모터 또는 항시성 프로모터로부터 발현될 수 있거나, 또는 숙주 세포 염색체로부터 발현될 수 있고, 바람직하게는, 숙주 세포내 샤페론 단백질(들)의 발현은 바람직한 생성물로 적절하게 폴딩 및/또는 조립되는 공발현된 유전자 산물을 생성하도록 충분하게 높은 수준이다. 이. 콜라이 숙주 세포에 존재하는 샤페론의 예는 세포질 또는 주변세포질 단백질의 단백질 응집을 방지하는데 사용되고 있는, 폴딩 인자 DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig(촉발 인자), 및 FkpA이다. DnaK/DnaJ/GrpE, GroEL/GroES, 및 ClpB는 단백질 폴딩을 보조하는데서 상승적으로 기능할 수 있고 따라서 조합한 이들 샤페론의 발현은 단백질 발현에 이득인 것으로 확인되었다(Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). 원핵생물 숙주 세포에서 진핵생물 단백질을 발현하는 경우, 진핵생물 샤페론 단백질, 예컨대 동일 또는 관련 진핵생물 종 유래의 단백질 단백질 다이설파이드 아이소머라제(PDI)가 본 발명의 일정 실시형태에서, 바람직한 유전자 산물과 공발현되거나 또는 유도적으로 공발현된다.

유도성 프로모터. 다음은 유전자 산물의 발현 또는 공발현을 위한 발현 작제물에 사용할 수 있는 유도성 프로모터와, 그러한 발현 작제물을 함유하는 숙주 세포에 대해 만들 수 있는 유전자 변형의 일부에 대한 설명이다. 이들 유도성 프로모터 및 관련 유전자의 예는 달리 특정하지 않으면, 이. 콜라이 K-12(미국 균주 은행(American Type Culture Collection) 기탁 번호 ATCC 10798)의 아균주인, 에스케리치아 콜라이(Escherichia coli)(이. 콜라이) 균주 MG1655(미국 균주 은행 기탁 번호 ATCC 700926)에서 유래된다. 표 1은 유도성 프로모터 및 관련 유전자의 이들 예에 대한 뉴클레오타이드 서열의 이. 콜라이 MG1655에서의 게놈 위치를 열거한다. 표 1에서 게놈 위치로 언급된, 뉴클레오타이드 및 다른 유전자 서열은 본 명세서에 참고로 분명하게 편입된다. 본 명세서에 기술된 이. 콜라이 프로모터, 유전자 및 균주에 관한 추가의 정보는 ecoliwiki.net에 위치하는, 온라인 EcoliWiki 자원을 비롯하여, 많은 공공 자원에서 확인할 수 있다.

아라비노스 프로모터(본 명세서에서 사용 시, '아라비노스'는 L-아라비노스를 의미함). 아라비노스 이용에 관여하는 몇몇 이. 콜라이 오페론-araBAD, araC, araE, 및 araFGH-은 아라비노스에 의해 유도될 수 있지만 용어 '아라비노스 프로모터' 및 'ara 프로모터'는 전형적으로 araBAD 프로모터를 표시하는데 사용된다. 몇몇 추가 용어, 예컨대 P_ara, P_araB, P_araBAD, 및 P_BAD가 이. 콜라이 araBAD 프로모터를 표시하는데 사용되어 왔다. 'ara 프로모터' 또는 상기 제공된 대체 용어의 본 명세서에서 사용은 이. 콜라이 araBAD 프로모터를 의미한다. 다른 용어의 사용에서 확인할 수 있듯이, 'araC-araBAD 프로모터', araBAD 프로모터는 2방향성 프로모터의 일부로 여겨지는데, araBAD 프로모터는 한 방향으로 araBAD 오페론의 발현을 제어하고, araBAD 프로모터와 아주 가깝게 반대 가닥 상에 있는 araC 프로모터는 다른 방향으로 araC 코딩 서열의 발현을 제어한다. AraC 단백질은 ara BAD 프로모터의 양성 및 음성 전사 조절인자이다. 아라비노스의 부재하에서, AraC 단백질은 P_BAD로부터의 전사를 억제하지만, 아라비노스 존재 하에서, AraC 단백질은, 아라비노스 결합 시 이의 입체형태를 변경하여, P_BAD로부터의 전사를 가능하게 하는 양성 조절 성분이 된다. araBAD 오페론은 L-아라비노스를, 중간체 L-리불로스 및 L-리불로스-포스페이트를 통해 D-자일룰로스-5-포스페이트로 전환시켜, 대사시키는 단백질을 코딩한다. 아라비노스 유도성 프로모터로부터 발현의 유도를 극대화시키는 목적을 위해, L-아라비노스의 L-리불로스로의 전환을 촉매하는, AraA의 기능을 제거하거나 또는 감소시키고, 경우에 따라 또한 AraB 및 AraD 중 적어도 하나의 기능을 제거하거나 또는 감소시키는데 유용하다. 아라비노스를 다른 당류로 전환시키는 세포의 능력을 제거하거나 또는 감소시켜서, 세포 내 아라비노스의 유효 농도를 감소시키는 숙주 세포의 능력을 제거하거나 또는 감소시키는 것은 아라비노스 유도성 프로모터의 유도에 더 많은 아라비노스를 이용할 수 있게 한다. 아라비노스를 숙주 세포로 이동시키는 수송체를 코딩하는 유전자는 저친화성 L-아라비노스 양자 심포터를 코딩하는 araE,및 ABC 수퍼패밀리 고친화성 L-아라비노스 수송체의 서브유닛을 코딩하는 araFGH 오페론이다. L-아라비노스를 세포로 수송할 수 있는 다른 단백질은 LacY 락토스 퍼미아제의 일정 돌연변이체로서, 각각 위치 177에 알라닌 대신 시스테인 또는 발린 아미노산을 갖는, LacY(A177C) 및 LacY(A177V) 단백질이다(Morgan-Kiss et al., "Long-term and homogeneous regulation of the Escherichia coli araBAD promoter by use of a lactose transporter of relaxed specificity", Proc Natl Acad Sci U S A 2002 May 28; 99(11): 7373-7377). 아라비노스 유도성 프로모터의 균일한 유도를 달성하기 위해, 아라비노스에 의한 조절과 독립적으로 아라비노스를 세포로 수송시키는 것이 유용하다. 이는 오직 항시성 프로모터로부터 전사되도록 AraFGH 수송체 단백질의 활성을 제거 또는 감소시키고 araE의 발현을 변경시켜 항시성 프로모터로부터만 전사되도록 하여 수행될 수 있다. araE의 항상성 발현은 천연 araE 유전자의 기능을 제거하거나 또는 감소시키고, 항시성 프로모터로부터 발현되는 AraE 단백질에 대한 코딩 서열을 포함하는 발현 작제물을 세포에 도입시키는 것에 의해 수행될 수 있다. 대안적으로, AraFGH 기능이 결여된 세포에서, 숙주 세포의 염색체 araE 유전자의 발현을 제어하는 프로모터는 아라비노스 유도성 프로모터에서 항시성 프로모터로 변화될 수 있다. 유사한 방식으로, 아라비노스 유도성 프로모터의 균일한 유도를 위한 추가 대안으로서, AraE 기능이 결여된 숙주 세포는 항시성 프로모터로부터 발현되는 세포에 존재하는 임의의 기능성 AraFGH 코딩 서열을 가질 수 있다. 다른 대안으로서, 숙주 염색체 내 항시성 프로모터로 천연 araE 및 araFGH 프로모터를 치환시켜서, 항시성 프로모터로부터 araE 유전자 및 araFGH 오페론 둘 다를 발현시키는 것이 가능하다. 또한 AraE 및 the AraFGH 아라비노스 수송체 둘 다의 활성을 제거시키거나 또는 감소시키고, 그러한 상황에서 LacY 락토스 퍼미아제가 아라비노스를 수송시킬 수 있게 하는 LacY 락토스 퍼미아제 내 돌연변이를 사용하는 것이 가능하다. lacY 유전자의 발현은 아라비노스에 의해 정상적으로는 조절되지 않으므로, LacY 돌연변이체 예컨대 LacY(A177C) 또는 LacY(A177V)의 사용은 아라비노스 유도성 프로모터가 아라비노스의 존재에 의해 유도될 때 '실무율' 유도 현상을 야기시키지 않는다. LacY(A177C) 단백질은 세포로 아라비노스를 수송하는 것이 보다 효과적으로 확인되므로, LacY(A177C) 단백질을 코딩하는 폴리뉴클레오타이드의 사용이 LacY(A177V) 단백질을 코딩하는 폴리뉴클레오타이드의 사용보다 바람직하다.

프로피오네이트 프로모터. '프로피오네이트 프로모터' 또는 'prp 프로모터'는 이. 콜라이 prpBCDE 오페론을 위한 프로모터이고, P_prpB라고도 한다. ara 프로모터와 유사하게, prp 프로모터는 2방향성 프로모터의 일부로서, 한 방향으로는 prpBCDE 오페론의 발현을 제어하고, 다른 방향으로 prpR 코딩 서열의 발현을 제어하는 prpR 프로모터를 갖는다. PrpR 단백질은 prp 프로모터의 전사 조절인자이고, PrpP 단백질이 2-메틸사이트레이트('2-MC')에 결합시 prp 프로모터로부터의 전사를 활성화시킨다. 프로피오네이트(프로파노에이트라고도 함)는 프로피온산(또는 '프로판산')의 이온, CH₃CH₂COO^―이고, 물의 염석시 유성층을 생성하고 비누성 칼륨 염을 갖는, 이러한 분자 부류의 일정 특성을 공유하는 화학식 H(CH₂) _n COOH를 갖는 최소의 '지방'산이다. 시판되는 프로피오네이트는 일반적으로 프로피온산의 1가 양이온 염, 예컨대 나트륨 프로피오네이트(CH₃CH₂COONa), 또는 2가 양이온 염, 예컨대 칼슘 프로피오네이트(Ca(CH₃CH₂COO)₂)로 판매된다. 프로피오네이트는 막투과성이고 PrpE(프로피오닐-CoA 합성효소)에 의한 프로피오네이트의 프로피오닐-CoA로의 전환, 및 이후 PrpC(2-메틸사이트레이트 신타제)에 의한 프로피오닐-CoA의 2-MC로의 전환에 의해 2-MC로 대사된다. prpBCDE 오페론에 의해 코딩되는 다른 단백질, PrpD(2-메틸사이트레이트 디하이드라타제) 및 PrpB(2-메틸아이소사이트레이트 리아제)는 더 작은 생성물 예컨대 피루베이트 및 숙시네이트로 2-MC의 추가 이화작용에 관여한다. 세포 성장 배지에 첨가된 프로피오네이트에 의한 프로피오네이트 유도성 프로모터의 유도를 극대화하기 위해서, 프로피오네이트를 2-MC로 전환시키기 위한 PrpC 및 PrpE 활성뿐만 아니라, 제거되거나 또는 감소된 PrpD 활성, 및 경우에 따라 2-MC가 대사되는 것을 방지하는 PrpB 활성을 갖는 숙주 세포를 갖는 것이 바람직하다. 2-MC 생합성에 관여하는 단백질을 코딩하는 다른 오페론은 scpA-argK-scpBC 오페론이고, sbm-ygfDGH 오페론이라고도 한다. 이들 유전자는 이후 PrpC에 의해 2-MC로 전환시킬 수 있는, 프로피오닐-CoA로 숙시네이트의 전환에 필요한 단백질을 코딩한다. 이들 단백질의 기능의 제거 또는 감소는 2-MC 유도인자의 생성을 위한 유사한 경로를 제거시키고, 따라서 프로피오네이트 유도성 프로모터의 발현의 배경 수준을 감소시키게 되고, 외생적으로 공급되는 프로피오네이트에 대한 프로피오네이트 유도성 프로모터의 감응성을 증가시키게 된다. 균주 JSB(Lee and Keasling, "A propionate-inducible expression system for enteric bacteria", Appl Environ Microbiol 2005 Nov; 71(11): 6856-6862)를 생성시키기 위해, 이. 콜라이 BL21(DE3)에 도입시킨 sbm-ygfD-ygfG-ygfH-ygfI의 결실은 외생적으로 공급된 유도인자의 부재 하에서 배경 발현을 감소시키는데 도움이 되었지만. 이러한 결실은 또한 균주 JSB의 prp 프로모터로부터의 총 발현을 감소시킨 것으로 확인되었다. 그러나, 결실 sbm-ygfD-ygfG-ygfH-ygfI는 또한 기능이 알려지지 않은 추정상 LysR-패밀리 전사 조절인자를 코딩하는 ygfI에 분명하게 영향을 준다는 것을 주의해야 한다. 유전자 sbm-ygfDGH는 하나의 오페론으로서 전사되고, ygfI는 대항 가닥으로부터 전사된다. ygfH 및 ygfI 코딩 서열의 3' 말단이 소수의 염기쌍에 의해 중첩되어서, sbm-ygfDGH 오페론의 전부를 제거시킨 결실이 역시 분명하게 ygfI 코딩 기능을 제거한다. ygfI의 발현이 영향받지 않도록 ygfH(또는 scpC) 유전자의 3' 말단을 충분하게 남겨둔 채로 sbm-ygfDGH 유전자 산물, 예컨대 YgfG(ScpB라고도 함, 메틸말로닐-CoA 디카복실라제)의 서브셋의 기능 제거 또는 감소, 또는 대부분의 sbm-ygfDGH(또는 scpA-argK-scpBC) 오페론의 결실은 유도된 발현의 최대 수준을 감소시키지 않고 프로피오네이트 유도성 프로모터로부터의 배경 발현을 감소시키기에 충분할 수 있다.

람노스 프로모터(본 명세서에서 사용 시, '람노스'는 L-람노스를 의미함). '람노스 프로모터' 또는 'rha 프로모터', 또는 P_rhaSR은 이. 콜라이 rhaSR 오페론을 위한 프로모터이다. ara 및 prp 프로모터처럼, rha 프로모터는 2방향성 프로모터의 일부로서, 한 방향으로 rhaSR 오페론의 발현을 제어하고, rhaBAD 프로모터는 다른 방향으로 rhaBAD 오페론의 발현을 제어한다. 그러나, rha 프로모터는 발현을 조정하는데 관여하는 2개의 전사 조절인자, RhaR 및 RhaS를 갖는다. RhaR 단백질은 람노스의 존재 하에서 rhaSR 오페론의 발현을 활성화시키는 한편, RhaS 단백질은 각각 L-람노스 이화 및 수송 오페론의 발현을 활성화시킨다(Wickstrum et al., "The AraC/XylS family activator RhaS negatively autoregulates rhaSR expression by preventing 사이클릭 AMP receptor protein activation", J Bacteriol 2010 Jan; 192(1): 225-232). RhaS 단백질이 또한 rhaSR 오페론의 발현을 활성화시킬 수 있지만, 사실상 RhaS는 훨씬 더 많은 수준으로 RhaR과의 발현을 공동활성화시키는 사이클릭 AMP 수용체 단백질(CRP)의 능력을 방해하여 이 발현을 음성적으로 자가조절한다. rhaBAD 오페론은 L-람노스를 L-람눌로스로 전환시키는 람노스 이화작용 단백질 RhaA(L-람노스 아이소머라제); L-람눌로스를 인산화시켜서 L-람눌로스-1-P를 형성시키는 RhaB(람눌로키나제); 및 L-람눌로스-1-P를 L-락트알데하이드 및 DHAP(다이하이드록시아세톤포스페이트)로 전환시키는 RhaD(람눌로스-1-포스페이트 알돌라제)를 코딩한다. 람노스 유도성 프로모터로부터 발현의 유도에 이용할 수 있는 람노스의 양을 극대화하기 위해서, RhaA, 또는 경우에 따라 RhaA, 및 RhaB 및 RhaD 중 하나의 기능을 제거시키거나 또는 감소시켜서, 이화작용에 의해 분해되는 람노스의 양을 감소시키는 것이 바람직하다. 이. 콜라이 세포는 또한 rmlBDACX(또는 rfbBDACX) 오페론에 의해 코딩되는 단백질 RmlA, RmlB, RmlC 및 RmlD(각각 RfbA, RfbB, RfbC 및 RfbD라고도 함)의 활성을 통해 알파-D-포도당-1-P로부터 L-람노스를 합성할 수 있다. 람노스 유도성 프로모터로부터의 배경 발현을 감소시키고, 외생적으로 공급되는 람노스에 의한 람노스 유도성 프로모터의 유도의 감응성을 강화시키기 위해, RmlA, RmlB, RmlC 및 RmlD 단백질 중 1종 이상의 기능을 제거시키거나 또는 감소시키는 것이 유용할 수 있다. L-람노스는 RhaT, 람노스 퍼미아제 또는 L-람노스:양자 심포터에 의해 세포로 수송된다. 상기에 언급한 바와 같이, RhaT의 발현은 전사 조절인자 RhaS에 의해 활성화된다. RhaT의 발현을 람노스(RhaS의 발현을 유도)에 의한 유도에 독립적으로 만들기 위해, 숙주 세포는 세포 내 모든 기능성 RhaT 코딩 서열이 항시성 프로모터로부터 발현되도록 변경될 수 있다. 추가적으로, 기능성 RhaS가 생성되지 않도록, RhaS에 대한 코딩 서열을 결실시키거나 또는 불활성화시킬 수 있다. 세포에서 RhaS의 기능을 제거시키거나 또는 감소시켜서, rhaSR 프로모터로부터의 발현 수준은 RhaS에 의한 음성적 자가조절 부재로 인해 증가되고, 람노스 이화작용성 오페론 rhaBAD의 발현 수준을 감소되어, rha 프로모터로부터 발현을 유도시키는 람노스의 능력이 더 증가된다.

자일로스 프로모터(본 명세서에서 사용 시, '자일로스'는 D-자일로스를 의미함). 자일로스 프로모터, 또는 'xyl 프로모터', 또는 P_xylA는 이. 콜라이 xylAB 오페론을 위한 프로모터를 의미한다. 자일로스 프로모터 영역은 xylAB 오페론 및 xylFGHR 오페론이 둘 다 이. 콜라이 염색체 상에서 반대 방향으로 인접한 자일로스 유도성 프로모터로부터 발현된다는 점에서 다른 유도성 프로모터와 구성이 유사하다(Song and Park, "Organization and regulation of the D-xylose operons in Escherichia coli K-12: XylR acts as a transcriptional activator", J Bacteriol. 1997 Nov; 179(22): 7025-7032). P_xylA 및 P_xylF 프로모터 둘 다의 전사 조절인자는 자일로스 존재 하에서 이들 프로모터의 발현을 활성화시키는, XylR이다. xylR 유전자는 xylFGHR 오페론의 일부로서 또는 xylH 및 xylR 단백질-코딩 서열 사이에 위치된, 자일로스에 의해 유도될 수 없는, 그 자체의 약한 프로모터로부터 발현된다. D-자일로스는 XylA(D-자일로스 아이소머라제)에 의해 D-자일로스를 D-자일룰로스로 전환시킨 후, XylB(자일룰로키나제)에 의해 인산화되어 D-자일룰로스-5-P를 형성하여 이화된다. 자일로스 유도성 프로모터로부터의 발현의 유도에 이용할 수 있는 세포에서 자일로스의 양을 극대화시키기 위해, 적어도 XylA의 기능, 또는 경우에 따라 XylA 및 XylB 둘 다의 기능을 제거시키거나 또는 감소시켜, 이화작용에 의해 분해되는 자일로스의 양을 감소시키는 것이 바람직하다. xylFGHR 오페론은 ABC 수퍼패밀리 고친화성 D-자일로스 수송체의 서브유닛인, XylF, XylG, 및 XylH를 코딩한다. 이. 콜라이 저친화성 자일로스-양자 심포터를 코딩하는 xylE 유전자는 그 발현이 역시 자일로스에 의해 유도될 수 있는 별개의 오페론을 나타낸다. 자일로스 수송체의 발현을 자일로스에 의한 유도에 독립적으로 만들기 위해서, 숙주 세포는 모든 기능성 자일로스 수송체가 항시성 프로모터로부터 발현되도록 변경될 수 있다. 예를 들어, xylFGHR 오페론은 xylFGH 코딩 서열이 결실되어, XylR이 자일로스 유도성 P_xylF 프로모터로부터 발현되는 유일한 활성 단백질로서 남겨지고, 이의 천연 프로모터보다는 항시성 프로모터로부터 xylE 코딩 서열이 발현되도록 변경될 수 있다. 다른 예로서, xylR 코딩 서열은 발현 작제물의 P_xylA 또는 P_xylF 프로모터로부터 발현되는 한편, xylFGHR 오페론이 결실되고 xylE가 항상적으로 발현되거나, 또는 대안적으로 xylFGH 오페론(발현 작제물에 존재하므로 xylR 코딩 서열이 결여)은 항시성 프로모터로부터 발현되고 xylE 코딩 서열은 활성 단백질을 생성하지 않도록 결실되거나 또는 변경된다.

락토스 프로모터. 용어 '락토스 프로모터'는 lacZYA 오페론을 위한 락토스 유도성 프로모터를 의미하고, 또한 lacZp1이라고도 불리는 프로모터이며, 이러한 락토스 프로모터는 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.2, 11-JAN-2012)에서 대략 365603-365568(마이너스 가닥, 대략 365603-365598에 RNA 중합효소 결합('-35') 부위, 365579-365573에 프리브노우 박스('-10'), 및 365567에 전사 개시 부위를 가짐)에 위치된다. 일부 실시형태에서, 본 발명의 유도성 공발현 시스템은 락토스 유도성 프로모터 예컨대 lacZYA 프로모터를 포함할 수 있다. 다른 실시형태에서, 본 발명의 유도성 공발현 시스템은 락토스 유도성 프로모터가 아닌 하나 이상의 유도성 프로모터를 포함한다.

알칼리 포스파타제 프로모터. 용어 '알칼리 포스파타제 프로모터' 및 'phoA 프로모터'는 phoApsiF 오페론을 위한 프로모터로서, 포스페이트 고갈 상태 하에서 유도되는 프로모터를 의미한다. phoA 프로모터 영역은 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.3, 16-DEC-2014)에서 대략 401647-401746(플러스 가닥, 401695-401701에 프리브노우 박스('-10')가짐(Kikuchi et al., "The nucleotide sequence of the promoter and the amino-terminal region of alkaline phosphatase structural gene(phoA) of Escherichia coli", Nucleic Acids Res 1981 Nov 11; 9(21): 5671-5678))에 위치한다. phoA 프로모터를 위한 전사 활성인자는, PhoB로서, 센서 단백질 Phor과 함께, 이. 콜라이에서 2-성분 신호 전달 시스템을 형성하는 전사 조절인자이다. PhoB 및 PhoR은 이. 콜라이 K-12 아균주 MG1655의 게놈 서열(NCBI 기준 서열 NC_000913.3, 16-DEC-2014)에서 대략 417050-419300(플러스 가닥, 417,142-417,831에 PhoB 코딩 서열 및 417,889-419,184에 PhoR 코딩 서열을 가짐)에 위치된, phoBR 오페론으로부터 전사된다. phoA 프로모터는 유도인자의 첨가에 의해서보다는 물질-세포내 포스페이트-의 결여에 의해 유도된다는 점에서 상기 기술된 유도성 프로모터와 다르다. 이러한 이유로, phoA 프로모터는 일반적으로 숙주 세포가 포스페이트가 고갈된 단계, 예컨대 발효의 후기 단계에 생성되게끔 유전자 산물의 전사를 유도시키는데 사용된다. 일부 실시형태에서, 본 발명의 유도성 공발현 시스템은 phoA 프로모터를 포함할 수 있다. 다른 실시형태에서, 본 발명의 유도성 공발현 시스템은 phoA 프로모터가 아닌 하나 이상의 유도성 프로모터를 포함한다.

발현 작제물. 발현 작제물은 관심 대상 1종 이상의 유전자 산물의 발현을 위해 디자인된 폴리뉴클레오타이드이고, 따라서 천연적으로 유래된 분자가 아니다. 발현 작제물은 숙주 세포 염색체로 통합될 수 있거나, 또는 숙주 세포 염색체와 독립적으로 복제되는 폴리뉴클레오타이드 분자, 예컨대 플라스미드 또는 인공 염색체로서 숙주 세포 내에서 유지될 수 있다. 발현 작제물의 예는 숙주 세포 염색체로 하나 이상의 폴리뉴클레오타이드 서열의 삽입에 의한 폴리뉴클레오타이드이고, 삽입된 폴리뉴클레오타이드 서열은 염색체 코딩 서열의 발현을 변경시킨다. 발현 벡터는 1종 이상의 유전자 산물의 발현에 특별하게 사용되는 플라스미드 발현 작제물이다. 1종 이상의 발현 작제물은 숙주 세포 염색체로 통합될 수 있거나 또는 염색체외 폴리뉴클레오타이드 예컨대 플라스미드 또는 인공 염색체 상에 유지될 수 있다. 다음은 유전자 산물의 발현 또는 공발현을 위해 발현 작제물에 사용될 수 있는 특정 유형의 폴리뉴클레오타이드 서열의 설명이다.

복제 기원. 발현 작제물은 독립적으로 복제되는 폴리뉴클레오타이드로서 숙주 세포 내에서 유지되기 위해서, 레플리콘이라고도 하는, 복제 기원을 포함해야만 한다. 복제를 위해 동일한 기전을 사용하는 상이한 레플리콘은 반복되는 세포 분열을 통해 단일한 숙주 세포에서 함께 유지될 수 없다. 그 결과, 플라스미드는 표 2에 나타낸 바와 같이, 그들이 함유하는 복제 기원에 따라서 비상용성 군으로 분류될 수 있다.

발현 작제물에 사용을 위한 복제 기원 및 대표 플라스미드 [1]
비상용성군	복제 기원:	카피수:	대표 플라스미드(ATCC 기탁 번호):
colE1,pMB1	colE1	15-20	colE1(ATCC 27138)
	pMB1	15-20	pBR322(ATCC 31344)
	변형된pMB1	500-700	pUC9(ATCC 37252)
IncFII, pT181	R1(ts)	15-120	pMOB45(ATCC 37106)
F, P1, p15A, pSC101, R6K, RK2 [2]	p15A	18-22	pACYC177(ATCC 37031); pACYC184(ATCC 37033); pPRO33(애드진 17810) [3]
	pSC101	∼5	pSC101(ATCC 37032): pGBM1(ATCC 87497)
	RK2	4-7 [2]	RK2(ATCC 37125)
CloDF13 [4]	CloDF13	20-40 [4]	pCDFDuet™-1(EMD 밀리포어 카탈로그 번호 71340-3)
ColA [4]	ColA	20-40 [4]	pCOLADuet™-1(EMD 밀리포어 카탈로그 번호 71406-3)
RSF1030 [4]	RSF1030 (NTP1이라고도 함)	> 100 [4]	pRSFDuet™-1(EMD 밀리포어 카탈로그 번호 71341-3)
표 2에 대한 주석: [1] www.bio.davidson.edu/courses/Molbio/Protocols/ORIs.html, 및 문헌 [Sambrook and Russell, "Molecular Cloning: A laboratory manual", 3^rd Ed., Cold Spring Harbor Laboratory Press, 2001]로부터 개작함. [2] Kues and Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516. [3] pPRO33 플라스미드(미국 특허 제8178338 B2호; May 15 2012; Keasling, Jay)가 애드진 플라스미드 17810으로서 애드진(Addgene)(www.addgene.org)에서 입수 가능함. [4] openwetware.org/wiki/CH391L/S12/Origins_of_Replication; 2013년 8월 3일 접속.

복제 기원은 다른 기준 중에서도, 비상용성 군, 카피수, 및/또는 숙주 범위를 기반으로 발현 작제물에 사용을 위해 선택될 수 있다. 상기에 기술된 바와 같이, 2 이상의 상이한 발현 작제물이 다수의 유전자 산물의 공발현을 위해 동일 숙주 세포에서 사용되려면, 상이한 발현 작제물이 상이한 비상용성 군 유래의 복제 기원을 함유하는 것, 예를 들어 한 발현 작제물에는pMB1 레플리콘이 다른 것에는 p15A 레플리콘인 것이 최선이다. 숙주 염색체 분자의 수에 대한, 세포 내 발현 작제물의 평균 카피수는 그 발현 작제물에 함유된 복제 기원에 의해 결정된다. 카피수는 세포 당 소수의 카피부터 수백의 범위일 수 있다(표 2). 본 발명의 일 실시형태에서, 동일한 유도인자에 의해 활성화되지만, 상이한 복제 기원을 갖는 유도성 프로모터를 포함하는 상이한 발현 작제물이 사용된다. 세포 내에서 일정한 근사치의 카피수로 각각의 다른 발현 작제물을 유지시키는 복제 기원을 선택하여, 상이한 발현 작제물로부터 발현되는 다른 유전자 산물에 대해서, 한 발현 작제물로부터 발현되는 유전자 산물의 전체 생성 수준을 조정하는 것이 가능하다. 예로서, 다량체 단백질의 서브유닛 A 및 B를 공발현시키기 위해, colE1 레플리콘, ara 프로모터, 및 ara 프로모터로부터 발현되는 서브유닛 A에 대한 코딩 서열: 'colE1-P_ara-A'를 포함하는 발현 작제물을 생성시킨다. 다른 발현 작제물은 p15A 레플리콘, ara 프로모터, 및 서브유닛 B에 대한 코딩 서열: 'p15A-P_ara-B'를 포함하는 것을 생성시킨다. 이들 2가지 발현 작제물은 동일한 숙주 세포 내에서 함께 유지될 수 있고, 서브유닛 A 및 B 둘 다의 발현은 성장 배지에 하나의 유도인자, 아라비노스의 첨가에 의해 유도된다. 2개 서브유닛의 발현된 양의 화학양론적 비율을 원하는 비율에 더 가깝게 만들기 위해서, 서브유닛 A의 발현 수준을 서브유닛 B의 발현 수준에 비해 상당히 증가시킬 필요가 있으면, 예를 들어, pUC9 플라스미드의 복제 기원('pUC9ori')에 존재하는 바와 같은 변형된pMB1 레플리콘을 갖는 서브유닛 A에 대한 신규한 발현 작제물: pUC9ori-P_ara-A를 생성시킬 수 있다. 고카피수 발현 작제물 예컨대 pUC9ori-P_ara-A로부터 발현되는 서브유닛 A는 p15A-P_ara-B로부터의 서브유닛 B의 발현에 비해 생성되는 서브유닛 A의 양을 증가시킬 것이다. 유사한 방식으로, 저카피수로 발현 작제물을 유지시키는 복제 기원, 예컨대 pSC101의 사용은 그 작제물로부터 발현되는 유전자 산물의 전체 수준을 감소시킬 수 있다. 복제 기원의 선택은 또한 어떠한 숙주 세포가 그 레플리콘을 포함하는 발현 작제물을 유지시킬 수 있는지 결정할 수 있다. 예를 들어, colE1 복제 기원을 포함하는 발현 작제물은 장내세균과에 속하는 종으로, 이용할 수 있는 숙주 범위가 비교적 협소한데 반해, RK2 레플리콘을 포함하는 발현 작제물은 이. 콜라이, 슈도모나스 애루지노사(Pseudomonas aeruginosa), 슈도모나스 푸티다(Pseudomonas putida), 아조토박터 비넬란디(Azotobacter vinelandii), 및 알칼리제네스 유트로퍼스(Alcaligenes eutrophus)에서 유지될 수 있고, 발현 작제물이 RK2 레플리콘 및 RK2 플라스미드 유래 일부 조절인자 유전자를 포함하면, 시노리조비움 멜리로티(Sinorhizobium meliloti), 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens), 카울로박터 크레센터스(Caulobacter crescentus), 아시네토박터 칼코아세티커스(Acinetobacter calcoaceticus), 및 로도박터 스파에로이데스(Rhodobacter sphaeroides)처럼 다양한 숙주 세포에서 유지시킬 수 있다(Kues and Stahl, "Replication of plasmids in gram-negative bacteria", Microbiol Rev 1989 Dec; 53(4): 491-516).

진핵생물 세포에서 유도성 발현 또는 공발현을 위한 발현 작제물을 생성시키는데 유사한 고려사항을 적용할 수 있다. 예를 들어, 사카로마이세스 세레비지아( Saccharomyces cerevisiae)의 2-미크론 원형 플라스미드는 다른 효모 균주 유래의 플라스미드, 예컨대 pSR1(ATCC 기탁 번호 48233 및 66069; Araki et al., "Molecular and functional organization of yeast plasmid pSR1", J Mol Biol 1985 Mar 20; 182(2): 191-203) 및 pKD1(ATCC 기탁 번호. 37519; Chen et al., "Sequence organization of the circular plasmid pKD1 from the yeast Kluyveromyces drosophilarum", Nucleic Acids Res 1986 Jun 11; 14(11): 4471-4481)와 상용성이다.

선별 마커. 발현 작제물은 일반적으로 선별 배양 배지에서 숙주 세포의 생존 또는 성장에 필수적인 단백질을 코딩하는, 선별 마커라고도 하는, 선별 유전자를 포함한다. 선별 유전자를 포함하는 발현 작제물을 함유하지 않는 숙주 세포는 그 배양 배지에서 생존하지 못하게 된다. 전형적인 선별 유전자는 항생제 또는 다른 독소에 대한 내성을 부여하거나, 또는 숙주 세포의 영양 요구성 결핍을 보완하는 단백질을 코딩한다. 선별 계획의 일례는 약물 예컨대 숙주 세포의 성장을 중지시키는 항생체를 이용하는 것이다. 선별 마커를 포함하는 발현 작제물을 함유하는 세포들은 약물 내성을 부여하는 단백질을 생성시켜서 그 선별법을 견디게 된다. 선별 마커의 선별에 일반적으로 사용되는 항생제의 일부예(및 항생제 내성 표현형을 제공하는 유전자를 표시하는 약어)는 암피실린(Amp^R), 클로람페니콜(Cml^R 또는 Cm^R), 카나마이신(Kan^R), 스펙티노마이신(Spc^R), 스트렙토마이신(Str^R), 및 테트라사이클린(Tet^R)이다. 표 2의 많은 대표 플라스미드는 선별 마커를 포함하는데, 예컨대 pBR322(Amp^R, Tet^R);pMOB45(Cm^R, Tet^R); pACYC177(Amp^R, Kan^R); 및 pGBM1(Spc^R, Str^R)이다. 선별 유전자에 대한 천연 프로모터 영역은 일반적으로, 이의 유전자 산물의 코딩 서열과 함께, 발현 작제물의 선별 마커 부분의 일부로서 포함된다. 대안적으로, 선별 유전자의 코딩 서열은 항시성 프로모터로부터 발현될 수 있다.

유도성 프로모터. 본 명세서에서 기술한 바와 같이, 본 발명의 유도성 공발현 시스템의 일부로서 발현 작제물에 포함될 수 있는 몇몇 상이한 유도성 프로모터가 존재한다. 바람직한 유도성 프로모터는 이. 콜라이 K-12 아균주 MG1655 게놈 서열을 기준으로 표 1에 정의된 바와 같은 프로모터 폴리뉴클레오타이드 서열의 적어도 30개(보다 바람직하게는, 적어도 40개, 가장 바람직하게 적어도 50개)의 인접한 염기와 적어도 80% 폴리뉴클레오타이드 서열 동일성(보다 바람직하게는, 적어도 90% 동일성, 가장 바람직하게는, 적어도 95% 동일성)을 공유하고, 폴리뉴클레오타이드 서열 동일성의 백분율은 실시예 11의 방법을 이용하여 결정된다. '표준' 유도 조건(실시예 5 참조) 하에서, 바람직한 유도성 프로모터는 De Mey 등의 정량적 PCR 방법(실시예 6)을 이용하여 결정 시, 이. 콜라이 K-12 아균주 MG1655의 상응하는 '야생형' 유도성 프로모터의 강도의 적어도 75%(보다 바람직하게는, 적어도 100%, 가장 바람직하게는, 적어도 110%)를 갖는다. 발현 작제물 내에서, 유도성 프로모터는 유도적으로 발현시키려는 유전자 산물의 코딩 서열에 대해 5'(또는 '상류')에 위치되어서, 유도성 프로모터의 존재는 유전자 산물을 코딩하는 폴리뉴클레오타이드의 코딩 서열에 대해 5'에서 3' 방향으로 유전자 산물 코딩 서열의 전사를 유도하게 된다.

리보솜 결합 부위. 폴리펩타이드 유전자 산물의 경우, 유도적으로 발현시키고자 하는 유전자 산물의 코딩 서열의 전사 개시 부위와 개시 코돈 사이의 영역의 뉴클레오타이드 서열은 폴리펩타이드 유전자 산물의 mRNA의 5' 비번역 영역('UTR')에 상응한다. 바람직하게는, 5' UTR에 상응하는 발현 작제물의 영역은 숙주 세포의 종에서 확인되는 공통 리보솜 결합 부위(RBS, 또한 샤인-달가르노(Shine-Dalgarno) 서열이라고도 함)와 유사한 폴리뉴클레오타이드 서열을 포함한다. 원핵생물(고세균 및 박테리아)에서, RBS 공통 서열은 GGAGG 또는 GGAGGU이고, 박테리아 예컨대 이. 콜라이에서, RBS 공통 서열은 AGGAGG 또는 AGGAGGU이다. RBS는 전형적으로 5개 내지 10개의 개재 뉴클레오타이드만큼 개시 코돈으로부터 이격된다. 발현 작제물에서, RBS 서열은 바람직하게 AGGAGGU 공통 서열과 바람직하게 적어도 55% 동일하고, 보다 바람직하게 적어도 70% 동일하며, 가장 바람직하게 적어도 85% 동일하고, 5개 내지 10개의 개재 뉴클레오타이드, 보다 바람직하게 6개 내지 9개의 개재 뉴클레오타이드, 및 가장 바람직하게 6개 또는 7개의 개재 뉴클레오타이드만큼 개시 코돈으로부터 이격된다. 바람직한 번역 개시 속도를 일으키는 소정 RBS의 능력은 RBS 계산기를 사용하여, 웹사이트 salis.psu.edu/software/RBSLibraryCalculatorSearchMode에서 계산할 수 있고, 동일한 도구를 사용하여 100,000+배 범위에 걸친 번역 속도에 대해 합성 RBS를 최적화시킬 수 있다(Salis, "The ribosome binding site calculator", Methods Enzymol 2011; 498: 19-42).

다중 클로닝 부위. 폴리링커라고도 하는 다중 클로닝 부위(MCS)는 서로 중첩되거나 또는 매우 가깝게 다수의 제한효소 부위를 함유하는 폴리뉴클레오타이드이다. MCS의 제한효소 부위는 전형적으로 MCS 서열 내에서 1회 존재하고, 바람직하게 플라스미드의 나머지 또는 다른 폴리뉴클레오타이드 작제물 내에 존재하지 않아서, 제한 효소가 오직 MCS 내에서만 플라스미드 또는 다른 폴리뉴클레오타이드 작제물을 절단할 수 있게 한다. MCS 서열의 예는 pBAD18, pBAD18-Cm, pBAD18-Kan, pBAD24, pBAD28, pBAD30, 및 pBAD33를 포함하는, pBAD 시리즈의 발현 벡터(Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130); 또는 pBAD 벡터에서 유도된 pPRO 시리즈의 발현 벡터, 예컨대 pPRO18, pPRO18-Cm, pPRO18-Kan, pPRO24, pPRO30, 및 pPRO33(미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay)의 것이 있다. 다중 클로닝 부위는 프로모터 서열의 3'(또는 하류)에 다중 클로닝 부위를 위치시켜서 발현 작제물의 생성에 사용될 수 있으며, MCS는 코딩 서열의 전사가 일어나게 되도록 프로모터에 대해 적절한 위치에, 작제물에 발현 또는 공발현시키려는 유전자 산물의 코딩 서열을 삽입시키는데 사용될 수 있다. 어떠한 제한 효소가 MCS 내에서 절단에 사용되는지에 따라서, 코딩 서열 또는 다른 폴리뉴클레오타이드 서열이 발현 작제물에 삽입된 후 발현 작제물 내에 MCS 서열의 일부 부분이 남을 수 있다. 임의의 남겨진 MCS 서열은 삽입된 서열의 상류, 또는 하류, 또는 양쪽 부분에 있을 수 있다. 리보솜 결합 부위는 MCS의 상류, 바람직하게는 바로 인접하거나 또는 오직 소수의 뉴클레오타이드만큼 MCS로부터 이격될 수 있고, 이러한 경우에 RBS는 MCS에 삽입된 임의의 코딩 서열의 상류이게 된다. 다른 대안은 MCS 내에 리보솜 결합 부위를 포함시키는 것인데, 이러한 경우, MCS내에서 절단에 사용되는 제한 효소의 선택은 RBS가 삽입된 서열에 대해서 어떻게 유지되는지 여부를 결정하게 된다. 추가의 대안은 바람직하게 전사된 메신저 RNA로부터 번역의 개시를 자극하도록 임의의 코딩 서열에 대해 적절하게, MCS에서 발현 작제물에 삽입시키려는 폴리뉴클레오타이드 서열 내에 RBS를 포함시키는 것이다.

항시성 프로모터로부터의 발현. 본 발명의 발현 작제물은 항시성 프로모터로부터 발현되는 코딩 서열을 또한 포함할 수 있다. 유도성 프로모터와 달리, 항시성 프로모터는 대부분의 성장 조건 하에서 계속적인 유전자 산물 생성을 개시한다. 항시성 프로모터의 일례는 베타-락타마제를 코딩하고 pBR322(ATCC 31344), pACYC177(ATCC 37031), 및 pBAD24(ATCC 87399)를 포함하는, 많은 플라스미드에 의해 숙주 세포에 부여되는 암피실린 내성(Amp^R) 표현형을 담당하는, Tn3 bla 유전자의 것이 있다. 발현 작제물에 사용될 수 있는 다른 항시성 프로모터는 이. 콜라이 K-12 아균주 MG1655에서 위치 1755731-1755406(플러스 가닥)에 위치하는 이. 콜라이 지단백질 유전자, lpp의 프로모터이다(Inouye and Inouye, "Up-promoter mutations in the lpp gene of Escherichia coli", Nucleic Acids Res 1985 May 10; 13(9): 3101-3110). 이. 콜라이에서 이종성 유전자 발현에 사용되는 항시성 프로모터의 추가예는 이. 콜라이 K-12 아균주 MG1655에서 위치 1321169-1321133(마이너스 가닥)에 위치하는 trpLEDCBA 프로모터가 있다(Windass et al., "The construction of a synthetic Escherichia coli trp promoter and its use in the expression of a synthetic interferon gene", Nucleic Acids Res 1982 Nov 11; 10(21): 6639-6657). 항시성 프로모터는 본 명세서에 기술된 대로, 선별 마커의 발현, 및 또한 희망 생성물의 공발현에 유용한 다른 유전자 산물의 항상성 발현을 위해 발현 작제물에 사용될 수 있다. 예를 들어, 유도성 프로모터의 전사 조절인자, 예컨대 AraC, PrpR, RhaR 및 XylR은 2방향성 유도성 프로모터로부터 발현되지 않으면, 대안적으로 그들이 조절하는 유도성 프로모터와 동일한 발현 작제물 상에서, 또는 다른 발현 작제물 상에서, 항시성 프로모터로부터 발현될 수 있다. 유사하게, 유도인자의 생성 또는 수송에 유용한 유전자 산물, 예컨대 PrpEC, AraE 또는 Rha, 또는 소수의 예로서, 세포의 환원-산화 환경을 변형시키는 단백질이 발현 작제물 내의 항시성 프로모터로부터 발현될 수 있다. 공발현되는 유전자 산물의 생성에 유용한 유전자 산물, 및 최종 희망 생성물은 또한 샤페론 단백질, 보조인자 수송체 등을 포함한다.

신호 펩타이드. 본 발명의 방법에 의해 발현되거나 또는 공발현되는 폴리펩타이드 유전자는 각각 그러한 유전자 산물이 숙주 세포 세포질에서 주변 세포질로 유출되거나, 또는 세포질에 유지되는 것이 바람직한지 여부에 따라서, 신호 펩타이드를 함유할 수 있거나, 또는 그들이 결여될 수 있다. 신호 펩타이드(또한 신호 서열, 리더 서열, 또는 리더 펩타이드라고도 함)는 단일 알파-나선을 형성하는 경향을 갖는, 구조적으로 소수성 아미노산의 스트레치, 대략 5개 내지 20개 아미노산 길이 및 종종 대략 10개 내지 15개 아미노산 길이를 특징으로 한다. 이러한 소수성 스트레치는 종종 양으로 하전된 아미노산(구체적으로 리신)이 농축된 더 짧은 스트레치가 바로 앞에 선행된다. 성숙한 폴리펩타이드로부터 절단되는 신호 펩타이드는 전형적으로 신호 펩티아제에 의해 인식되고 절단되는 아미노산의 스트레치에서 종결된다. 신호 펩타이드는 원핵생물의 원형질막(또는 이.콜라이 같은 그람 음성 박테리아의 내막)을 통해서, 또는 진핵생물의 소포체로, 번역과 동시에 또는 번역 후에, 폴리펩타이드의 수송을 유도하는 능력을 통해 기능적으로 특징될 수 있다. 신호 펩타이드가 이. 콜라이와 같은 숙주 세포의 주변세포질 공간으로 폴리펩타이드를 수송시킬 수 있는 정도는 예를 들어, 예컨대 실시예 12에 제공된 방법을 이용해서, 세포질에 유지된 단백질로부터 주변세포질 단백질을 분리하여 결정할 수 있다.

숙주 세포. 본 발명의 유도성 공발현 시스템은 다수의 유전자 산물을 발현하도록 디자인되었고, 본 발명의 일정 실시형태에서, 유전자 산물은 숙주 세포에서 공발현된다. 다량체 생성물의 성분의 효율적이고 비용 효과적인 유도성 공발현을 가능하게 하는 숙주 세포의 예가 제공된다. 숙주 세포는 배양된 단리된 세포이외에도, 다세포 유기체의 일부인 세포, 또는 상이한 유기체 또는 유기체의 체계 내에서 성장시킨 세포를 포함할 수 있다. 또한, 본 발명의 유도성 공발현 시스템의 발현 작제물은 세포 무함유 시스템, 예컨대 맥아 추출물 또는 박테리아 세포 추출물을 기반으로 한 것, 예컨대 이. 콜라이 추출물 및 항온처리 장치 예컨대 RTS 프로테오마스터(ProteoMaster)(Roche Diagnostics GmbH; Mannheim, Germany)를 사용한 연속-교환 세포 무함유(CEDF) 단백질 합성 시스템(Jun et al., "Continuous-exchange cell-free protein synthesis using PCR-generated DNA and an RNase E-deficient extract", Biotechniques 2008 Mar; 44(3): 387-391)에서 사용될 수 있다.

원핵생물 숙주 세포. 본 발명의 일부 실시형태에서, 유전자 산물의 공발현을 위해 디자인된 발현 작제물은 숙주 세포, 바람직하게 원핵생물 숙주 세포에 제공된다. 원핵생물 숙주 세포는 고세균(예컨대 할로페락스 볼카니(Haloferax volcanii), 설포로버스 솔파타리커스(Sulfolobus solfataricus)), 그람 양성 박테리아(예컨대 바실리스 서브틸리스(Bacillus subtilis), 바실러스 리체니포르미스(Bacillus licheniformis), 브레비바실러스 코시넨시스(Brevibacillus choshinensis), 락토바실러스 브레비스(Lactobacillus brevis), 락토바실러스 부치네리(Lactobacillus buchneri), 락토코커스 락티스(Lactococcus lactis), 및 스트렙토마이세스 리비단스(Streptomyces lividans)), 또는 알파프로테오박테리아(아그로박테리움 투머파시엔스(Agrobacterium tumefaciens), 카울로박터 크레센터스(Caulobacter crescentus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 및 시노리조비움 멜리로티(Sinorhizobium meliloti)), 베타프로테오박테리아(알칼리제네스 유트로퍼스(Alcaligenes eutrophus)), 및 감마프로테오박테리아(아시네토박터 칼코아세티커스(Acinetobacter calcoaceticus), 아조토박터 비네란디(Azotobacter vinelandii), 에스케리치아 콜라이(Escherichia coli), 슈도모나스 애루지노사(Pseudomonas aeruginosa), 및 슈도모나스 푸티다(Pseudomonas putida))를 포함한 그람 음성 박테리아를 포함할 수 있다. 바람직한 숙주 세포는 장내세균과의 감마프로테오박테리아, 예컨대 엔테로박터(Enterobacter), 어위니아(Erwinia), 에스케리치아(이. 콜라이 포함), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 살모넬라(Salmonella)(살모넬라 티피뮤리움(Salmonella typhimurium)), 세라티아(Serratia)(세라티아 마르세스칸스(Serratia marcescans)) 및 시겔라(Shigella)를 포함한다.

진핵생물 숙주 세포. 진핵생물 세포 예컨대 효모(캔디다 세하타(Candida shehatae), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 프라질리스(Kluyveromyces fragilis), 다른 클루이베로마이세스 종, 피키아 파스토리스(Pichia pastoris), 사카로마이세스 세레비지아(Saccharomyces cerevisiae), 사카로마이세스 칼스베르젠시스(Saccharomyces carlsbergensis)라고도 알려진 사카로마이세스 파스토리아너스(Saccharomyces pastorianus), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 데케라/브레타노마이세스(Dekkera/Brettanomyces) 종 및 야로위아 리포리티카(Yarrowia lipolytica)); 다른 진균(아스퍼질러스 니둘란스(Aspergillus nidulans), 아스퍼질러스 니거(Aspergillus niger), 뉴로스포라 크라사(Neurospora crassa), 페니실리움(Penicillium), 톨리포클라디움(Tolypocladium), 트리코더마 레에시아(Trichoderma reesia)); 곤충 세포주(드로소필라 멜라노가스터 슈나이더(Drosophila melanogaster Schneider) 2 세포 및 스포돕테라 프루지페르다(Spodoptera frugiperda) Sf9 세포); 및 불멸화 세포주(중국 햄스터 난소(CHO) 세포, HeLa 세포, 어린 햄스터 신장(BHK) 세포, 원숭이 신장 세포(COS), 인간 배아 신장(HEK, 293, 또는 HEK-293) 세포, 및 인간 간세포 암종 세포(Hep G2))를 포함한 포유동물 세포주를 포함하는, 많은 추가 유형의 숙주 세포가 본 발명의 유도성 공발현 시스템에 사용될 수 있다. 상기 숙주 세포들은 미국 균주 은행(American Type Culture Collection)에서 입수할 수 있다.

숙주 세포 유전자 기능에 대한 변경. 유도인자에 의한 숙주 세포 개체군의 효율적이고 균일한 유도를 촉진하기 위해서, 유도성 발현 작제물을 포함하는 숙주 세포의 유전자 기능에 일정 변경을 만들 수 있다. 바람직하게는, 발현 작제물, 숙주 세포 유전자형, 및 유도 조건의 조합은 실시예 6에 기술된 바와 같은 Khlebnikov 등의 방법으로 측정시, 각 유도된 프로모터로부터 유전자 산물을 발현하는 배양에서 세포의 적어도 75%(보다 바람직하게 적어도 85%, 및 가장 바람직하게는, 적어도 95%)를 유발시킨다. 이. 콜라이 이외의 숙주 세포의 경우, 이들 변경은 이. 콜라이 유전자와 유사한 숙주 세포 내에서 기능을 보유하는 유전자, 또는 이. 콜라이 유전자와 구조적으로 유사한 유전자의 기능을 포함할 수 있다. 숙주 세포 유전자 기능에 대한 변경은 그 전체의 유전자 단백질-코딩 서열을 결실시키거나, 또는 유전자의 충분히 큰 부분을 결실시키거나, 유전자에 서열을 삽입시키거나, 또는 아니면 유전자 서열을 변경시키도록 기능성 유전자 산물의 감소된 수준이 그 유전자로부터 만들어지게 유전자 기능을 제거 또는 감소시키는 것을 포함한다. 숙주 세포 유전자 기능에 대한 변경은 또한, 예를 들어 유전자의 더 높은 수준의 전사를 유도하는 더 강력한 프로모터를 생성하도록 천연 프로모터를 변경시키거나, 또는 더욱 고도의 활성 유전자 산물이 유발되게, 단백질 코딩 서열에 미스센스 돌연변이를 도입시켜 유전자 기능을 증가시키는 것을 포함한다. 숙주 세포 유전자 기능에 변경은 예를 들어, 항상적으로 활성화된 프로모터를 생성시키도록 천연 유도성 프로모터를 변경하는 것을 포함하여, 임의 방식으로 유전자 기능을 변경시키는 것을 포함한다. 유도성 프로모터와 관련하여 본 명세서에 기술된 바와 같이, 유도인자의 수송 및 대사를 위한 유전자 기능의 변경, 및 샤페론 단백질의 변경된 발현이외에도, 탄소 이화산물 억제(CCR) 조절 시스템 및/또는 숙주 세포의 환원-산화 환경을 변화시키는 것도 가능하다.

탄소 이화산물 억제 ( CCR). 숙주 내에서 활성 CCR 조 절 시스템의 존재는 유도성 프로모터로부터 전사를 활성화시키는 유도인자의 능력에 영향을 줄 수 있다. 예를 들어, 숙주 세포 예컨대 이. 콜라이를 포도당을 함유하는 배지에서 성장시키는 경우, 다른 탄소 공급원의 이용에 필요한 유전자, 예컨대 araBAD 및 prpBCDE 오페론은 적어도, 심지어 아리비노스 또는 프로피오네이트 유도인자가 또한 성장 배지에 존재하더라도 낮은 수준으로 발현된다. 포도당 이외의 탄소 공급원의 이용 체계가 또한 존재하는데, ara 및 prp 유도성 프로모터 시스템의 경우처럼, 아라비노스의 존재가 prpBCDE 프로모터로부터 발현을 유도하는 프로피오네이트의 능력을 감소시킨다(Park et al., "The mechanism of sugar-mediated catabolite repression of the propionate catabolic genes in Escherichia coli", Gene 2012 Aug 1; 504(1): 116-121; Epub 2012 May 3). 따라서 세포의 CCR 기전은 선호되는 탄소 공급원이 덜 선호되는 탄소 공급원에 의한 유도를 억제하게 하게 되므로, 유도성 공발현 시스템에서 2 이상의 탄소 공급원을 사용하는 것을 더 어렵게 만든다. 상기 문헌 [Park et al.]의 저자들은 cAMP와 독립적으로 기능할 수 있는 변경된 cAMP 수용체 단백질을 생성하는 돌연변이체 crp 유전자, 또는 CCR의 조절에 관여하는 PTS(포스포트랜스퍼라제 시스템) 유전자의 결실을 사용하여, 아라비노스에 의한 prp 프로모터의 억제를 경감시키고자 시도하였지만, 양쪽 시도 모두 대체로 성공적이지 않았다.

그러나, 문헌 [Park et al.] 저자들이 사용한 PTS-넉아웃 균주는 이. 콜라이 ptsHI-crr 오페론이 결실된 균주 TP2811을 기반으로 한다(Hernandez-Montalvo et al., "Character-ization of sugar mixtures utilization by an Escherichia coli mutant devoid of the phosphotransferase system", Appl Microbiol Biotechnol 2001 Oct; 57(1-2): 186-191). 전체 ptsHI-crr 오페론의 결실은 단지 crr 유전자의 결실보다 더욱 유의하게 전체 cAMP 합성에 영향을 주는 것으로 확인되었다(Levy et al., "cyclic AMP synthesis in Escherichia coli strains bearing known deletions in the pts phosphotransferase operon", Gene 1990 Jan 31; 86(1): 27-33). 다른 접근법은 이. 콜라이에서 CCR의 핵심 성분인, 포도당 특이적 EII A(EII A^glc)를 코딩하는 숙주 세포의 ptsG 유전자의 기능을 제거시키거나 또는 감소시키는 것이다(Kim et al., "Simultaneous consumption of pentose and hexose sugars: an optimal microbial phenotype for efficient fermentation of lignocellulosic biomass", Appl Microbiol Biotechnol 2010 Nov; 88(5): 1077-1085, Epub 2010 Sep 14). prp 프로모터의 높은 전사를 야기시키는, 숙주 세포 예컨대 이. 콜라이의 게놈 내 다른 변경은 AscG를 코딩하는, ascG 유전자의 유전자 기능을 제거시키거나 또는 감소시키는 것이다. AscG는 정상 성장 조건 하에서 베타-D-글루코사이드-이용 오페론 ascFB의 억제인자이고, 또한 prp 프로모터의 전사를 억제하며, prp 프로모터로부터의 전사를 증가시키는 것으로 확인되었다(Ishida et al., "Participation of regulator AscG of the beta-glucoside utilization operon in regulation of the propionate catabolism operon", J Bacteriol 2009 Oct; 191(19): 6136-6144; Epub 2009 Jul 24). 추가의 대안은 강력한 항시성 프로모터의 제어 하에, 또는 보다 선호되는 탄소 공급원 유도인자의 제어 하에 위치시켜서, 덜 선호되는 탄소 공급원 유도인자에 의해 유도될 수 있는 프로모터의 전사 조절인자의 발현을 증가시키는 것이다. 예를 들어, 보다 선호되는 아라비노스의 존재 하에서 덜 선호되는 탄소 공급원 자일로스의 이용에 필요한 유전자의 유도를 증가시키기 위해서, XylR의 코딩 서열을 이. 콜라이 araBAD 오페론에 위치시켰다(Groff et al., "Supplementation of intracellular XylR leads to coutilization of hemicellulose sugars", Appl Environ Microbiol 2012 Apr; 78(7): 2221-2229, Epub 2012 Jan 27). 따라서 유도성 공발현 작제물을 포함하는 숙주 세포는 덜 선호되는 탄소 공급원 유도인자(들)에 의해 유도될 수 있는 프로모터의 전사 조절인자에 대한 유전자 기능의 증가된 수준, 및 CCR 시스템, 예컨대 crr 및/또는 ptsG 및/또는 ascG에 관여하는 유전자에 대해 제거되거나 또는 감소된 유전자 기능을 포함한다.

다른 화합물로 유도인자를 대사시키는(metabolize) 능력이 결여되도록, 유전자 변형된 본 발명의 숙주 세포는 덜 선호되는 탄소 공급원에 의해 조절되는 프로모터 상의 유도인자에 의한 CCR을 반드시 보이는 것은 아니다. 상당한 CCR 효과의 부재는 매우 낮은 농도의 비대사 유도인자를 사용했을 때 관찰되며, 놀랍게도, 이러한 매우 낮은 농도는 또한 유전자 산물의 최적 수율을 생성시키는데 가장 효과적이다. 예를 들어, 유전자 산물의 공발현은 L-아라비노스 유도성 araBAD 프로모터로부터 하나의 유전자 산물 성분 및 프로피오네이트 유도성 prpBCDE 프로모터로부터 다른 유전자 산물 성분을 발현시켜 수행될 수 있다. 숙주 세포, 예컨대 이. 콜라이 EB0001 및 EB0002 세포(하기 실시예 1에 기술됨)에서, 공발현은 전형적으로 세포의 OD 유닛 당 100 마이크로몰(0.0015%) 미만의 L-아라비노스 유도인자 농도에서 다량체 유전자 산물의 최고 수율이 생성되었고, 이들 L-아라비노스 농도에서, prpBCDE 프로모터의 매우 적거나 또는 전혀 없는 L-아라비노스 매개 CCR이 관찰되었다.

보조인자의 세포 수송. 기능을 위해 보조인자를 필요로 하는 효소를 생성시키기 위해 본 발명의 유도성 공발현 시스템을 사용하는 경우, 이용가능한 전구체로부터 보조인자를 합성할 수 있거나, 또는 환경으로부터 흡수할 수 있는 숙주 세포를 사용하는 것이 도움이 된다. 일반적인 보조인자는 ATP, 조효소　A, 플라빈 아데닌 다이뉴클레오타이드(FAD), NAD⁺/NADH, 및 헴을 포함한다.

숙주 세포 환원-산화 환경. 많은 다량체 유전자 산물, 예컨대 항체는 이황화 결합을 함유한다. 이. 콜라이 및 많은 다른 세포의 세포질은 정상적으로 티오레독신 및 글루타레독신/글루타티온 효소 시스템에 의해 환원 상태가 유지된다. 이는 세포질에서 이황화 결합의 형성을 못하게 만들고, 이황화 결합이 필요한 단백질은 이황화 결합 형성 및 이성질체화가 DsbABCD 및 DsbG를 포함하는 Dsb 시스템에 의해 촉매되는 주변세포질로 유출된다. 주변세포질로 모두 정상적으로 수송되는, 시스테인 옥시다제 DsbA, 다이설파이드 아이소머라제 DsbC, 또는 Dsb 단백질의 조합의 높은 발현은 이황화 결합을 필요로 하는 이종성 단백질의 발현에 이용되었다(Makino et al., "Strain engineering for improved expression of recombinant proteins in bacteria", Microb Cell Fact 2011 May 14; 10: 32). 이들 Dsb 단백질의 세포질 형태, 예컨대 신호 펩타이드가 결여되어서 주변세포질로 수송되지 않는 DsbC('cDsbC')의 세포질 형태를 발현시키는 것이 또한 가능하다. 세포질 Dsb 단백질 예컨대 cDsbC는 숙주 세포의 세포질을 더욱 산화적으로 만들고 그에 따라 세포질에서 생성되는 이종성 단백질에서 이황화 결합의 형성에 더욱 도움이 되게 만드는데 유용하다. 숙주 세포 세포질은 또한 티오레독신 및 글루타레독신/글루타티온 효소 시스템을 직접적으로 변경시켜 더욱 산화적으로 만들어질 수 있는데, 티오레독신 환원효소(trxB)와 함께, 글루타티온 환원효소(gor) 또는 글루타티온 합성효소(gshB)에 결함이 있는 돌연변이체 균주는 세포질을 산화적으로 만든다. 이들 균주는 리보뉴클레오타이드를 감소시킬 수 없고, 따라서 외생성 환원제, 예컨대 다이티오트레이톨(DTT)의 부재 하에서 성장할 수 없다. 퍼옥시리독신 AhpC를 코딩하는 유전자 ahpC에 억제인자 돌연변이(ahpC*)는 환원된 글루타티온을 발생시키는 다이설파이드 환원효소로 전환시켜서, 효소 리보뉴클레오타이드 환원효소 상에서 전자의 채널링을 가능하게 하고 gor 및 trxB에 결함이 있거나, gshB 및 trxB에 결함이 있는 세포가 DTT 부재 하에서 성장할 수 있게 한다. AhpC의 상이한 부류의 돌연변이된 형태는 감마글루타밀시스테인 합성효소(gshA)의 활성에 결함 및 trxB에 결함이 있는 균주가 DTT 부재 하에서 성장할 수 있게 하며, 이들은 AhpC V164G, AhpC S71F, AhpC E173/S71F, AhpC E171Ter, 및 AhpC dup162-169를 포함한다(Faulkner et al., "Functional plasticity of a peroxidase allows evolution of diverse disulfide-reducing pathways", Proc Natl Acad Sci U S A 2008 May 6; 105(18): 6735-6740, Epub 2008 May 2). 세포질이 산화된 이러한 균주에서, 노출된 단백질 시스테인은 이황화 결합의 형성이 일어나는, 그들의 생리적 기능의 반적으로, 티오레독신에 의해 촉매되는 과정에서 쉽게 산화된다.

숙주 세포에 만들 수 있는 다른 변경은 숙주 세포 세포질 내 효모 미토콘드리아의 내막 공간으로부터 설프하이드릴 옥시다제 Erv1p를 발현시키는 것인데, 이는 gor 또는 trxB에 돌연변이의 부재 하에서도, 이. 콜라이의 세포질 내에서 진핵생물 기원의 다양한 복합체, 이황화-결합된 단백질의 생성을 증가시키는 것으로 확인되었다(Nguyen et al., "Pre-expression of a sulfhydryl oxidase significantly increases the yields of eukaryotic disulfide bond containing proteins expressed in the cytoplasm of E. coli" Microb Cell Fact 2011 Jan 7; 10: 1). 유도성 공발현 작제물을 포함하는 숙주 세포는 바람직하게 또한 cDsbC 및/또는 Erv1p를 발현하고, trxB 유전자 기능에 결함이 있고, 또한 gor, gshB 또는 gshA의 유전자 기능에 결함이 있으며, 적어도 하나의 적절한 돌연변이체 형태의 AhpC를 발현하여 숙주 세포가 DTT 부재 하에서 성장할 수 있게 된다.

폴리펩타이드 유전자 산물의 당화. 숙주 세포는 폴리펩타이드를 당화시키는 그들의 능력에 변경을 가질 수 있다. 예를 들어, 진핵생물 숙주 세포는 당단백질을 형성하는 폴리펩타이드의 정상 진핵생물 당화를 손상시키도록, 글리코실트랜스퍼라제 및/또는 올리고사카릴트랜스퍼라제 유전자의 유전자 기능을 제거하거나 또는 감소시킬 수 있다. 폴리펩타이드를 정상적으로 당화시키지 않는, 원핵생물 숙주 세포, 예컨대 이. 콜라이는 당화 기능을 제공하는 진핵생물 및 원핵생물 유전자 세트를 발현하도록 변경될 수 있다(DeLisa et al., "Glycosylated protein expression in prokaryotes", WO2009089154A2, 2009 Jul 16).

유전자 기능이 변경된 이용가능한 숙주 세포 균주. 본 발명의 유도성 공발현 시스템 및 방법에 사용하는데 바람직한 숙주 세포 균주를 생성시키기 위해서, 이미 바람직한 유전자 변경을 포함하는 균주를 사용해서 출발하는 것이 유용하다(표 3).

숙주 세포 균주
균주:	유전자형:	공급처:
이. 콜라이 TOP10	F- mcrAΔ( mrr-hsdRMS-mcrBC) φ80lacZΔM15 ΔlacX74 recA1 araD139Δ(ara-leu)7697 galU galK rpsL (Str^R) endA1 nupG λ-	인비트로젠 라이프 테크놀로지스 카탈로그 번호 C4040-10, C4040-03, C4040-06, C4040-50, 및 C4040-52
이.콜라이 오리가미(Origami)(상표명) 2	Δ(ara-leu)7697 ΔlacX74 ΔphoA PvuII phoR araD139 ahpC galE galK rpsL F'[lac ⁺ lacI ^q pro] gor522::Tn10 trxB(Str^R, Tet^R)	Merck(EMD 밀리포어 케미칼스) 카탈로그 번호 71344
이. 콜라이 셔플(SHuffle)(등록상표) 익스프레스	fhuA2 [lon] ompT ahpC gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--Tet^S)2 [dcm] R(zgb-210::Tn10 --Tet^S) endA1 ΔgorΔ(mcrC-mrr)114::IS10	뉴 잉글랜드 바이오랩스 카탈로그 번호 C3028H

숙주 세포 유전자 기능을 변경하는 방법. 유전자 기능을 제거하거나, 감소시키거나 또는 변화시키기 위해 숙주 세포 유전자에 변경을 가하기 위해 당분야에 알려진 많은 방법들이 존재한다. 숙주 세포 예컨대 이. 콜라이 및 다른 원핵생물에서 유전자의 표적화된 파괴를 만드는 방법이 기술되었고(Muyrers et al., "Rapid modification of bacterial artificial chromosomes by ET-recombination", Nucleic Acids Res 1999 Mar 15; 27(6): 1555-1557; Datsenko and Wanner, "One-step inactivation of chromosomal genes in Escherichia coli K-12 using PCR products", Proc Natl Acad Sci U S A 2000 Jun 6; 97(12): 6640-6645), 유사한 Red/ET 재조합 방법을 사용하기 위한 키트가 시판된다(예를 들어, 독일, 하이델베르그 소재의 진 브릿지스 게엠베하의 퀵 앤 이지(Quick & Easy) 이. 콜라이 유전자 결실 키트). 본 발명의 일 실시형태에서, 숙주 세포의 하나 이상의 유전자의 기능은 파괴하려는 유전자의 코딩 서열 내 뉴클레오타이드 서열, 예컨대 서열의 게놈 위치를 참고로 여기에 편입된 이. 콜라이 K-12 아균주 MG1655 코딩 서열 중 하나를 동정하고, 보다 구체적으로 그 코딩 서열 내에서 각각 50개 뉴클레오타이드의 2개의 인접한 스트레치를 선택하여 제거시키거나 또는 감소된다. 다음으로 퀵 앤 이지 이. 콜라이 유전자 결실 키트를 제조사의 설명서에 따라 사용하여 선별 마커를 함유하는 폴리뉴클레오타이드 작제물을 선택된 인접한 코딩 서열의 스트레치 사이에 삽입시켜서, 유전자의 정상 기능을 제거시키거나 또는 감소시킨다. Red/ET 재조합 방법은 또한 프로모터 서열을, 상이한 프로모터 예컨대 항시성 프로모터, 또는 일정 수준의 전사를 촉진할 것으로 예상되는 인공 프로모터로 치환시키는데 사용될 수 있다(De Mey et al., "promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26). 숙주 세포 유전자의 기능은 또한 RNA 침묵화 방법으로 제거시키거나 또는 감소될 수 있다(Man et al., "Artificial trans-encoded small non-coding RNAs specifically silence the selected gene expression in bacteria", Nucleic Acids Res 2011 Apr; 39(8): e50, Epub 2011 Feb 3). 추가로, 숙주 세포 유전자 기능을 변경시키는 기지의 돌연변이를 전통적인 유전자 방법을 통해 숙주 세포에 도입시킬 수 있다.

본 발명의 유도성 공발현 시스템

본 발명의 유도성 공발현 시스템은 2 이상의 발현 작제물을 포함하는 숙주 세포를 포함하고, 상기 발현 작제물은 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하며, 상기 숙주 세포는 유전자 산물의 균일한 유도성 발현을 가능하게 하는 변경된 유전자 기능을 갖는다. 도 1은 하기 성분들을 갖는 본 발명의 유도성 공발현 시스템의 개략적이 대표도를 도시한다: (1) 숙주 세포, (2) 숙주 게놈(유전자 변경을 포함), (3) 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하는 발현 벡터 'X', (4) 다른 유전자 산물의 발현을 유도하는 유도성 프로모터를 포함하는 상이한 발현 벡터 'Y', (5) 발현의 화학적 유도인자, 및 (6) 다량체 공발현 생성물. 도 3은 유도성 프로모터((3) 및 (4)) 및 동일한 발현 벡터 상에 존재하는 유도성 프로모터에 의해 발현되는 생성물의 코딩 서열을 갖는 도 1에 도시된 것과 유사한 개략적인 대표도를 도시한다.

도 2는 균일하게 유도될 수 있는 발현을 가능하게 하는 적절한 게놈 변경을 수용하는 이. 콜라이 숙주 세포 내에서 pPRO33(미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay)(또는 pPRO43, pPRO430, pPRO430(CloDF13), pPRO44, 또는 pPRO45) 발현 벡터 상에서 프로피오네이트 유도성 프로모터(prpBCDE 프로모터)와 조합하여 pBAD24(또는 pBAD240) 발현 벡터 상의 araBAD 프로모터를 이용하는, 본 발명의 유도성 공발현 시스템의 특정 예의 개략적인 대표도를 도시한다. 이러한 방식으로, 다량체 생성물의 각 성분의 발현의 엄격한 제어 및 최적화가 수많은 공발현 용도에 사용을 위해 획득될 수 있다. 이러한 실시형태에서, 숙주 세포(1)는 단백질 발현 분야에서 통용되는, 그람 음성 박테리아 에스케리치아 콜라이이다. 숙주 게놈(2)은 신호 펩타이드가 결여된 다이설파이드 아이소머라제 DsbC의 세포질 형태의 발현을 포함하여, 균일하게 유도될 수 있는 단백질 공발현을 용이하게 하는 돌연변이 또는 다른 변경을 갖는 숙주 세포의 게놈이다. 일 실시형태에서, 게놈 변경은 외생적으로 적용되는 L-아라비노스로 플라스미드 기반 ara 프로모터의 균일한 유도를 용이하게 하기 위한, araBAD 오페론 넉아웃 돌연변이 및, 항시성 프로모터로부터 araE 및 araFGH의 발현, 또는 araEFGH-결핍 배경에서 lacY 유전자 내 점 돌연변이(A117C), 및 또한 생체내에서 2-메틸사이트레이트로 전환되는, 외생적으로 적용된 프로피오네이트로 플라스미드 기반 프로피오네이트 프로모터의 균일한 유도를 용이하게 하기 위한, 불활성화된 프로피오네이트 물질 대사 유전자, prpD를 포함한다. 유도성 공발현 시스템에 유용하고, 숙주 세포에 도입될 수 있는 다른 게놈 변경은 제한없이, prpBCDE 프로모터로부터의 배경 발현을 감소시키기 위한, scpA-argK-scpBC 오페론의 표적화 불활성화; L-아라비노스 유도성 프로모터 예컨대 araBAD 프로모터로부터 덜 선호되는 탄소 공급원(프로피오네이트)에 대한 전사 조절인자(PrpR)의 발현, 및/또는 L-아라비노스 존재 하에서 프로피오네이트에 의한 유도의 CCR 시스템에 의한 억제를 피하기 위해, CCR 시스템, 예컨대 crr 및/또는 ptsG에 관여하는 유전자에 대한 제거 또는 감소된 유전자 기능; 티오레독신 환원효소(trxB)와 함께, 글루타티온 환원효소(gor) 또는 글루타티온 합성효소(gshB)에 대한 유전자 기능 수준의 감소, 및/또는 숙주 세포질에 덜 강력한 환원 환경을 제공하고 이황화 결합 형성을 촉진하도록, 숙주 세포 세포질에 효모 미토콘드리아 설프하이드릴 옥시다제 Erv1p의 발현; 예컨대 샤페론 단백질 예컨대 DnaK/DnaJ/GrpE, DsbC/DsbG, GroEL/GroES, IbpA/IbpB, Skp, Tig(촉발 인자), 및/또는 FkpA의 강력한 항시성 프로모터로부터의 발현의 증가된 수준; 및 내생성 프로테아제 활성(예컨대 Lon 및 OmpT 프로테아제의 활성) 및 리컴비나제 활성을 감소시키는 다른 돌연변이를 포함한다.

도 2에 도시한 바와 같이, 2종의 상용성 발현 벡터(3, 4)는 2종의 상이한 유전자 산물의 동시 발현(공발현)을 가능하도록 숙주 세포에 유지된다. 이러한 실시형태에서, 한 발현 벡터('L-아라비노스 유도된 발현 벡터')는 L-아라비노스 유도된 프로모터를 함유하고, araBAD 프로모터가 다중 클로닝 부위(MCS)에 클로닝된 삽입된 발현 서열의 발현을 구동시키는 pBAD 또는 관련 플라스미드와 유사하거나 또는 동일하다. L-아라비노스 유도된 발현 벡터는 또한 온전한 발현 벡터를 함유하는 숙주 세포(박테리아 콜로니)의 선별을 용이하게 하기 위해서, 항생제 내성 유전자(예컨대 베타-락타마제를 코딩하고 암피실린에 대한 내성을 부여하는 Tn3 bla 유전자, 또는 아미노글리코사이드 3'-포스포트랜스퍼라제를 코딩하고 카나마이신에 대한 내성을 부여하는 유전자)에 대한 코딩 서열을 함유한다. 복제 기원(ORI)은 박테리아 숙주 세포 내에서 플라스미드의 증식에 필요하다. L-아라비노스 유도된 발현 플라스미드는 또한 araC를 코딩하는 폴리뉴클레오타이드 서열을 함유하는데, 이 전사 조절인자는 araBAD 프로모터의 L-아라비노스 유도를 가능하게 하고 전사 억제를 통해서 비유도 상태시 '누수' 배경 발현을 감소시킨다. 다른 발현 벡터('프로피오네이트 유도된 발현 벡터')는 프로피오네이트 유도된 프로모터가 다중 클로닝 부위(MCS)에 클로닝된 삽입된 발현 서열의 발현을 구동시키는, pPRO 또는 관련 플라스미드와 유사하거나 또는 동일하다. 플라스미드는 또한 온전한 발현 벡터를 함유하는 숙주 세포의 선별을 용이하게 하도록 항생제 내성 유전자(예컨대 클로람페니콜에 대한 내성을 부여하는 클로람페니콜 아세틸트랜스퍼라제를 코딩하는 cat 유전자)의 코딩 서열을 함유한다. 복제 기원(ORI)은 박테리아 숙주 세포 내에서 플라스미드의 증식에 필요하다. 또한, 프로피오네이트 유도된 발현 벡터는 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 함유하고, 이 전사 조절인자는 prpBCDE 프로모터의 프로피오네이트(2-메틸사이트레이트) 유도를 가능하게 하고 비유도 상태에서 '누수' 배경 발현을 감소시킨다. 유도의 개별 적정, 플라스미드 상용성, 및 발현 벡터의 공증식을 용이하게 하기 위해서, 발현 벡터는 상이한 유도인자에 반응성인 프로모터, 상용성 복제 기원, 및 상이한 항생제 내성 마커를 함유하는 것이 유용하다. 본 발명의 일 실시형태에서, L-아라비노스 유도성 araBAD 프로모터를 함유하는 pBAD24(pMB1 또는 'pBR322' ORI, Amp^R) 또는 관련 발현 벡터 예컨대 pBAD240(pMB1 ORI, Kan^R)은 숙주 세포 내에서 프로피오네이트 유도성 prpBCDE 프로모터를 함유하는 pPRO33, pPRO43, pPRO430, 또는 관련 발현 벡터(p15A ORI, Cm^R)와 조합된다.

프로피오네이트 유도성 prpBCDE 프로모터 예컨대 pPRO430(CloDF13), pPRO44(RSF1030 ORI), 또는 pPRO45(CloDF13)를 함유하는 상용성 발현 벡터는 또한 araBAD-프로모터 함유 발현 벡터(pMB1 ORI)와 조합하여 사용될 수 있다. 발현 벡터는 적절한 항생제, 즉 암피실린, 클로람페니콜, 및/또는 카나마이신이 보충된 성장 배지를 사용해서 공증식되고 유지된다. 일 실시형태에서, 하나의 발현 벡터는 전체 길이 항체의 중쇄를 코딩하는 폴리뉴클레오타이드 서열을 포함하고, 다른 발현 벡터는 전체 길이 항체의 경쇄를 코딩하는 폴리뉴클레오타이드 서열을 포함하고, 각 코딩 서열은 개별 발현 벡터의 MCS에 인프레임으로 클로닝되었다. 일정 유전자 산물 예컨대 항체의 생성을 위해서, 숙주 유기체에 대한 코딩 서열 최적화(다른 고려사항 중에서, 코돈 편중성 및 GC 함량에 대한 조정을 포함)는 공발현 시스템의 발현 작제물에 삽입되는 코딩 서열을 결정하게 된다.

도 2를 다시 참조하면, 유전자 산물의 공발현은 저렴한 외생적으로 적용된 화학적 대사산물, L-아라비노스 및 프로피오네이트(5)에 의해 유도된다. 각 유전자 산물의 발현의 유도 수준은 그 자체의 화학적 유도인자로 독립적으로 적정하여서, 단백질 공발현의 최적화를 용이하게 한다. 이는 안정화를 위한 결합 파트너를 필요로 하는 단백질 복합체 및 단백질의 발현에 유용하고, 달리 단백질을 발현시키는 것이 어려운, 예컨대 가용성이 불충분하거나 또는 세포 독성이 있는 것들의 발현을 용이하게 할 수 있다. 이러한 예에서, 유도 시, 항체 중쇄 및 경쇄는 각각 개별적으로 발현된 후, 단백질은 중쇄 및 경쇄를 구성하는 전체 길이 항체의 형성 및 안정화를 가능하게 하는 이황화 브릿지(박테리아 숙주의 세포질내)를 연결하고 형성한다. 단백질은 숙주 유기체의 다양한 구획을 향할 수 있다. 예를 들어, 이. 콜라이에서, 단백질은 세포질, 세포막, 주변세포질에서 발현될 수 있거나, 또는 배지로 분비될 수 있다. 적절한 항온처리 시간 후, 세포 및 배지를 수집하고, 공발현된 유전자 산물(6)을 포함하는, 전체 단백질을 추출한다. 추출 후, 희망 생성물은 공발현 시스템에서 생성된 유전자 산물의 성질에 따라서 당분야에 잘 알려진 많은 방법들(예를 들어, 액상 크로마토그래피)를 이용해서 정제할 수 있다. 도 2에 도시된 예에서, 다량체 생성물(전체 길이 항체)는 크로마토그래피 방법을 이용해서 추출 및 정제된다. 정제된 온전한 항체는 단백질-결합 염료 또는 면역조직화학법을 포함하는, 표준 기술을 이용해서 비변성 겔 상에서 시각화된다. 전체 길이 항체 생성물은 많은 연구, 진단 또는 다른 용도에 사용될 수 있다.

도 4는 아라비노스 유도성 프로모터(3), 프로피오네이트 유도성 프로모터(4), 및 동일한 발현 벡터에 존재하는 항체 중쇄 및 경쇄에 대한 코딩 서열을 갖는, 도 2에 도시된 것과 유사한 개략적인 대표도를 도시한다. 프로피오네이트 유도성 프로모터로부터 항체 중쇄 및 아라비노스 유도성 프로모터로부터 항체 경쇄를 발현시키는 것이 또한 가능하다.

본 발명의 방법으로 제조된 생성물

다양한 공발현 용도, 및 생성물의 특성에서, 본 발명의 유도성 공발현 시스템을 이용하는 광범위한 다능성이 존재한다.

당화. 본 발명의 방법으로 공발현된 유전자 산물은 당화되거나 또는 비당화될 수 있다. 본 발명의 일 실시형태에서, 공발현된 유전자 산물은 폴리펩타이드이다. 당화된 폴리펩타이드는 공유적으로 부착된 글리코실기를 포함하는 폴리펩타이드이고, 폴리펩타이드의 특정 잔기에 정상적으로 부착된 모든 글리코실기를 포함하는 폴리펩타이드(완전 당화된 폴리펩타이드), 부분적으로 당화된 폴리펩타이드, 당화가 정상적으로 일어나지 않는 1개 이상의 잔기에 당화된(변경된 당화) 폴리펩타이드, 및 1개 이상의 특정 잔기에 정상적으로 부착된 글리코실기와 구조적으로 다른 적어도 하나의 글리코실기로 당화된(변형된 당화) 폴리펩타이드를 포함한다. 변형된 당화의 예는 폴리펩타이드를 푸코실화시키는 능력이 결여된 숙주 세포에서 폴리펩타이드의 발현에 의해, 그들에 부착된 글리코실기에 푸코실 모이어티를 결여시킨 폴리펩타이드인, "탈푸코실화" 또는 "푸코스 결핍" 폴리펩타이드의 생성이다. 비당화 폴리펩타이드는 공유적으로 결합된 글리코실기를 포함하지 않는 폴리펩타이드이다. 비당화 폴리펩타이드는 폴리펩타이드의 탈당화, 또는 무당화 폴리펩타이드의 생성의 결과일 수 있다. 탈당화 폴리펩타이드는 당화된 폴리펩타이드를 효소적으로 탈당화시켜 얻을 수 있는데 반해, 무당화 폴리펩타이드는 폴리펩타이드를 당화시키는 능력을 갖지 않는 숙주 세포, 예컨대 원핵생물 세포 또는 적어도 1종의 당화 효소의 기능이 제거되거나 또는 감소된 세포에서 폴리펩타이드를 발현시켜 생성시킬 수 있다. 특정 실시형태에서, 공발현된 폴리펩타이드는 무당화되고, 보다 특정 실시형태에서, 무당화 폴리펩타이드는 원핵생물 세포 예컨대 이. 콜라이에서 공발현된다.

유전자 산물의 다른 변형. 본 발명의 방법에 의해 공발현된 유전자 산물은 다른 유형의 분자에 공유적으로 연결될 수 있다. 본 발명의 범주를 제한하지 않고, 공발현된 유전자 산물에 공유적으로 연결될 수 있는 분자의 예는 폴리펩타이드(예컨대 수용체, 리간드, 사이토카인, 성장 인자, 폴리펩타이드 호르몬, DNA-결합 도메인, 단백질 상호작용 도메인 예컨대 PDZ 도메인, 키나제 도메인, 항체 및 임의의 이러한 폴리펩타이드의 단편); 수용성 중합체(예컨대 폴리에틸렌 글리콜(PEG), 카복시메틸셀룰로스, 덱스트란, 폴리비닐 알콜, 폴리옥시에틸화 폴리올(예컨대 글리세롤), 폴리에틸렌 글리콜 프로피온알데하이드, 및 유사한 화합물, 이의 유도체, 또는 혼합물); 및 세포독성제(예컨대 화학요법제, 성장 억제제, 독소(예컨대 박테리아, 진균, 식물, 또는 동물 기원의 효소 활성 독소, 또는 이의 단편), 및 방사능 동위원소)를 포함한다.

또한, 본 발명의 방법으로 공발현시키려는 유전자 산물은 유전자 산물의 정제 및/또는 검출에 도움을 주는 분자 모이어티를 포함하도록 디자인될 수 있다. 많은 그러한 모이어티는 당분야에 공지되어 있고, 일례로서, 폴리펩타이드 유전자 산물은 6개 또는 그 이상의 히스티딘, 바람직하게 6개 내지 10개 연속되는 히스티딘 잔기, 가장 바람직하게 6개 히스티딘 잔기를 그의 N 말단 또는 C 말단에 갖는, 폴리히스티딘 '태그' 서열을 포함하도록 디자인될 수 있다. 폴리펩타이드의 말단 상에 폴리히스티딘 서열의 존재는 코발트 또는 니켈 기반 친화성 매질이 그에 결합될 수 있어서, 다른 폴리펩타이드로부터 분리될 수 있게 한다. 폴리히스티딘 태그 서열은 엑소펩티다제에 의해 제거될 수 있다. 다른 예로서, 형광 단백질 서열을 폴리펩타?? 유전자 산물의 일부로서 발현시킬 수 있는데, 형광 단백질에 대한 아미노산 서열을 폴리펩타이드 유전자 산물의 아미노산 서열의 N 말단 또는 C 말단에 첨가시킨다. 일정 파장의 빛에 노출시 최종 융합 단백질이 형광하여, 융합 단백질의 존재를 육안으로 검출할 수 있게 된다. 잘 알려진 형광 단백질은 애쿠오레아 빅토리아(Aequorea victoria)의 녹색 형광 단백질이고, 많은 다른 형광 단백질이 그들을 코딩하는 뉴클레오타이드 서열과 함께 시판된다.

항체. 본 발명의 일 실시형태에서, 공발현된 유전자 산물은 항체이다. 용어 '항체'는 광범위한 의미로 사용되고 특히 '천연' 항체, 완전 인간 항체, 인간화된 항체, 키메라 항체, 다중특이적 항체(예컨대 이중특이적 항체), 단일클론 항체, 다클론 항체, 항체 단편, 및 항원에 결합할 수 있는 항체에서 유도된 다른 폴리펩타이드를 포함한다. 본 명세서에서 달리 표시하지 않으면, 면역글로불린 중쇄의 잔기의 번호매김('EU 번호매김')은 문헌[Kabat et al., Sequences of Proteins of Immunological Interest, Fifth Edition, 1991, National Institute of Health, Bethesda, Maryland]에서처럼 EU 지수(인간 IgG1 EU 항체의 잔기 번호매김)이다.

'천연' 항체는 일반적으로 2개의 동일한 경(L)쇄 및 2개의 동일한 중(H)쇄로 구성된, 약 150,000 달톤의 이종사량체 당단백질이다. 각 경쇄는 하나의 공유 이황화 결합에 의해 중쇄에 연결되는 한편, 사슬간 이황화 연결의 수는 상이한 면역글로불린 아이소타입의 중쇄 간에 다양하다. 각각의 중쇄 및 경쇄는 또한 규칙적으로 간격을 둔 사슬내 이황화 브릿지를 갖는다. 각각의 중쇄는 이의 N 말단에 수많은 불변 도메인이 후속되는 가변 도메인(V_H)을 갖는다. 각각의 경쇄는 이의 N 말단에 가변 도메인(V_L) 및 C 말단에 불변 도메인을 가지며, 경쇄의 불변 도메인은 중쇄의 제1 불변 도메인과 정렬되고 경쇄 가변 도메인은 중쇄의 가변 도메인과 정렬된다. 용어 '가변'은 가변 도메인의 일정 부분이 항체들 간에 서열이 광범위하게 다르고 항원에 대한 각 특정 항체의 특이성 미치 결합에 사용된다는 점을 의미한다. 그러나, 가변성은 항체의 가변 도메인 전반에서 고르게 분포되는 것은 아니다. 경쇄 및 중쇄 가변 도메인 둘 다의 초가변 영역(HVR)이라고 하는 3개 절편에 집중되어 있다. 가변 도메인의 보다 고도로 보존된 부분은 프레임워크 영역(FR)이라고 한다. 천연 중쇄 및 경쇄의 가변 도메인은 각각 3개의 HVR에 의해 연결된 4개의 FR 영역을 포함하고, 다른 사슬 유래의 HVR은 항체의 항원-결합 부위의 형성에 기여한다.

용어 'Fc 영역'은 면역글로불린 중쇄의 C 말단 영역을 의미하고, 천연 Fc 영역 및 변이 Fc 영역을 포함한다. 면역글로불린 중쇄의 Fc 영역의 경계가 다양할 수 있지만, 인간 IgG 중쇄 Fc 영역은 위치 Cys226의 아미노산 잔기, 또는 Pro230에서 이의 카복실 말단까지의 스트레치로 정의될 수 있다. 다르게, Fc 영역은 보존된 C_H2 면역글로불린 도메인의 N 말단 잔기(Ala231)부터 C 말단으로 확장된 것으로 정의될 수 있고, 다수의 보존된 도메인 예컨대 C_H2, C_H3 및 C_H4를 포함할 수 있다. 천연 Fc 영역의 C 말단 리신(EU 번호매김 체계에 따른 잔기 447)은 예를 들어, 항체의 생성 또는 정제 동안, 또는 항체의 중쇄를 코딩하는 핵산을 재조합적으로 조작하여 제거시킬 수 있다. 따라서, 온전한 항체의 조성물은 모든 K447 잔기가 제거된 항체 개체군, K447 잔기가 제거되지 않은 항체 개체군, 및 K447 잔기가 있고 없는 항체의 혼합물을 갖는 항체 개체군을 포함할 수 있다. 항체의 Fc 영역은 면역학적 세포의 동원 및 항체 의존적 세포독성(ADCC)에 결정적이다. 구체적으로, 항체에 의해 유발되는 ADCC 반응의 성질은 많은 세포 유형의 표면 상에 위치하는 수용체(FcR)와 Fc 영역의 상호작용에 의존적이다. 인간은 적어도 5가지의 상이한 부류의 Fc 수용체를 함유한다. FcR에 항체의 결합은 다른 면역학적 세포를 동원하는 그 능력 및 동원된 세포의 유형을 결정한다. 따라서, 오직 일정 종류의 세포만을 동원할 수 있는 변경된 Fc 영역을 갖는 항체를 조작하는 능력은 요법에 결정적으로 중요할 수 있다(미국 특허 출원 제20090136936호 A1, 05-28-2009, Georgiou, George). 포유동물 세포에 의해 생성되는 천연 항체는 전형적으로 Fc 영역의 CH2 도메인의 Asn297에 N-연결을 통해 일반적으로 부착되는, 분지형, 이중촉각 올리고당을 포함한다. 일정 실시형태에서, 본 발명의 방법으로 생성된 항체는 당화되지 않거나 또는 무당화인데, 예를 들어 Fc 영역의 잔기 297의 치환, 또는 폴리펩타이드를 당화시키는 능력을 갖지 않는 숙주 세포에서의 발현에 기인한다. 변경된 ADCC 반응으로 인해, 비당화 항체는 더 낮은 수준의 염증 반응 예컨대 신경 염증을 자극시킬 수 있다. 또한, 또한, 무당화 Fc 영역을 갖는 항체는 Fc 수용체에 대해 매우 낮은 결합 친화성을 가지므로, 그러한 항체는 이들 수용체를 보유하는 다수의 면역 세포에 결합하지 않는다. 이는 비특이적 결합을 감소시키고, 또는 생체 내에서 항체의 반감기를 증가시켜서, 요법제로 매우 유리하게 만들기 때문에 상당한 장점이다.

용어 '전체 길이 항체', '온전한 항체', 및 '전체 항체'는 이하에 정의된 바와 같은 항체 단편이 아닌 이의 실질적으로 온전한 '천연' 형태의 항체를 의미하는데 상호교환적으로 사용된다. 이 용어는 특히 가변 도메인 및 Fc 영역을 각각이 포함하는 중쇄를 갖는 항체를 의미한다. '항체 단편'은 바람직하게 이의 항원 결합 영역을 포함하는, 온전한 항체의 일부를 포함한다. 항체 단편의 예는 Fab, Fab', F(ab')₂, Fc, Fd 및 Fv 단편; 다이아바디; 선형 항체; 단쇄 항체 분자 예컨대 scFv; 및 항체 단편으로 형성된 다중특이적 항체를 포함한다.

'인간 항체'는 인간에 의해 생성된 항체에 상응하는 아미노산 서열을 보유한 것이다. '키메라' 항체는 중쇄 및/또는 경쇄의 일부분이 특정 종에서 유도되거나 또는 특정 항체 부류 또는 아부류에 속하는 항체의 상응하는 서열과 동일하거나, 또는 일정 정도의 아미노산 서열 동일성을 공유하는 한편, 사슬(들)의 나머지는 다른 종에서 유도되거나 또는 다른 항체 부류 또는 아부류에 속하는 항체의 상응하는 서열과 동일하거나, 또는 일정 정도 아미노산 서열 동일성을 공유하는 것을 비롯하여, 그러한 항체의 단편을 의미한다. '인간화' 항체는 비인간 면역글로불린 분자에서 유도된 최소 아미노산 잔기를 함유하는 키메라 항체이다. 일 실시형태에서, 인간화 항체는 수용자 항체의 HVR 잔기가 비인간 종(도너 항체) 예컨대 마우스, 래트, 토끼 또는 인간이외의 영장류의 면역글로불린 HVR 유래의 잔기로 치환된 인간 면역글로불린(수용자 항체)이다. 일부 예에서, 인간 수용자 항체의 FR 잔기는 상응하는 비인간 잔기로 치환된다. 또한, 인간화 항체는 수용자 항체 또는 도너 항체에 존재하지 않는 잔기를 포함할 수 있다. 용어 '단일클론 항체'는 실질적으로 균질한 항체의 개체군에서 얻은 항체를 의미하며, 그 개체군을 포함하는 개별 항체는 가능한 돌연변이, 예컨대 소량에 존재할 수 있는 천연 유래 돌연변이를 제외하고는 동일하다. 따라서, 수식어 '단일클론'은 개별 항체의 혼합물이 아닌 항체의 특징을 의미한다. 상이한 결정부(에피토프)에 대항해 유도된 상이한 항체를 전형적으로 포함하는, 다클론 항체 조제물과 대조적으로, 단일클론 항체 조제물의 각각의 단일클론 항체는 항원 상의 동일한 단일 결정부에 대항해 유도된다. 그들의 특이성 이외에도, 단일클론 항체 조제물은 그들이 전형적으로 다른 면역글로불린으로 오염되지 않는다는 점에서 유리하다.

분자 예컨대 항체의 '결합 친화성'은 일반적으로 분자의 단일 결합 부위 및 이의 결합 파트너(예컨대 항체 및 이에 결합하는 항원) 사이의 비공유적 상호작용의 총합의 강도를 의미한다. 달리 언급하지 않으면, '결합 친화성'은 결합쌍 구성원(예컨대 항체 및 항원) 사이의 1:1 상호작용을 반영하는 고유한 결합 친화성을 의미한다. 그의 파트너 Y에 대한 분자 X의 친화성은 일반적으로 해리 상수(Kd)로 표시할 수 있다. 저친화성 항체(높은 Kd)는 일반적으로 항원에 서서히 결합하여 쉽게 해리되는 경향이 있는 반면, 고친화성 항체(저 Kd)는 일반적으로 빠르게 항체에 결합하여 더 길게 결합된 채로 남아 있는 경향이 있다. 결합 친화성을 측정하는 다양한 방식이 당분야에 공지되어 있고, 임의의 그러한 방식을 본 발명의 목적을 위해 사용할 수 있다. 결합 친화성을 측정하기 위한 특정한 예시적인 방법을 실시예 8에 기술한다. 본 발명의 방법에 의해 생성되고/되거나 사용되는 항체 및 항체 단편은 실시예 8에 기술된 바와 같은 표면 플라스몬 공명 검정법으로 측정 시 바람직하게 100mM보다 낮은 결합 친화성을 가지며, 보다 바람직하게 10nM보다 낮은 결합 친화성을 갖고, 가장 바람직하게 2nM보다 낮은 결합 친화성을 갖는다.

무당화 항체를 인식하는 항체(2차). 이. 콜라이 기반 또는 당화 효소가 없는 다른 원핵생물 발현 시스템에서 항체의 생성은 일반적으로 1차 항체로서 사용할 수 있는, 무당화 항체를 산출한다. 무당화 1차 항체를 생성하기 위해 본 발명의 유도성 공발현 시스템을 사용하는 것 이외에도, 본 발명의 유도성 공발현 시스템은 또한 무당화 1차 항체를 특이적으로 인식하는 2차 항체를 효과적으로 생성시키는데 사용될 수 있다. 본 발명의 일 측면은 연구, 분석, 진단 또는 치료 목적을 위해 비당화 또는 무당화 1차 항체를 검출할 수 있는 2차 항체 시스템이다. 일례로서, 2차 항체 시스템은 하기 성분들과 함께 제공된다: 에피토프, 1차 항체, 2차 항체, 및 검출 시스템. 에피토프는 살아있는 동물에 도입시 면역학적 반응을 생성하는 항원 결정부이거나 또는 아니면 항체에 의해 인식될 수 있는 항원의 일부분(일반적으로 단백질)이다. 실제로, 관심 에피토프는 혼합물 또는 조직 내에 존재할 수 있다. 일 실시형태에서, 에피토프는 인간 조직에서 암종 세포에서 발현되는 단백질이다. 1차 항체는 에피토프를 인식하여 결합하고, 바람직하게는 에피토프에 특이적으로 결합하는, 항체 단편, 단일 전체 길이 항체(단일 클론), 또는 상이한 전체 길이 항체의 혼합물(다클론)이다. 이러한 예에서 전체 길이 항체는 이황화 브릿지에 의해 연결된 2개의 중쇄 폴리펩타이드 및 2개의 경쇄 폴리펩타이드를 포함한다. 각각의 사슬은 불변 영역 (Fc) 및 가변 영역(Fv)을 포함한다. 전체 길이 항체에 2개의 항원 결합 부위가 존재한다. 본 발명의 일 실시형태에서, 1차 항체는 관심 에피토프를 인식하여 결합하는 전체 길이 무당화 항체(예컨대 이. 콜라이 기반 발현 시스템에서 생성)이다. 2차 항체는 무당화 1차 항체를 인식하여 결합하고, 바람직하게 무당화 1차 항체에 특이적으로 결합하는, 항체 단편, 단일 전체 길이 항체(단일클론), 또는 상이한 전체 길이 항체의 혼합물(다클론)이다. 본 발명의 일 실시형태에서, 2차 항체는 전체 길이 1차 항체의 무당화 Fc 부분을 인식하여 결합하는 전체 길이 항체이다. 이러한 경우에서, 항체 결합 부위는 C 말단 리신 잔기가 있거나 또는 없는, 무당화 1차 항체의 Fc 부분을 특이적으로 인식하도록 선택 및/또는 조작된다. 다른 실시형태에서, 2차 항체는 무당화 1차 항체의 추가 영역(에피토프), 또는 제한없이 1차 항체에 공유적으로 부착된 폴리펩타이드를 포함하는 추가의 조작된 에피토프를 인식하도록 조작될 수 있다. 2차 항체는 전체 길이 무당화 항체 분자(다양한 면역글로불린 부류 예컨대 IgG, IgA 등을 포함) 또는 항체 단편 예컨대 Fc 또는 Fab 상에 존재하는 단일 또는 다수 부위(에피토프)에서 유도될 수 있다. 따라서, 이러한 방식으로 생성된 일부 2차 항체는 임의의 무당화 전체 길이 항체에 대해 광범위한 특이성을 가질 수 있다. 본 발명의 1차 및 2차 항체는 또한 전통적인 방법(면역화된 토끼를 사용한 다클론 항체 생성 또는 마우스 하이브리도마를 사용한 단일클론 항체 생성) 및 재조합 DNA 기술 예컨대 항원 결합 폴리펩타이드를 동정하기 위한 파지 디스플레이 방법에 의해 생성된 것을 포함한다.

검출 시스템은 일반적으로, 2차 항체의 검출, 시각화, 및/또는 정량을 할 수 있는 2차 항체에 결합하거나 또는 연결되는 작용제를 포함한다. 다양한 검출 시스템은 제한없이 형광 염료, 효소, 방사능 동위원소, 또는 중금속을 포함해 당분야에 잘 알려져 있다. 이들은 2차 항체에 추가의 폴리펩타이드의 직접 물리적 연결을 포함할 수 있거나 또는 포함하지 않을 수 있다. 이러한 2차 항체 시스템의 적용은 제한없이, 면역조직화학법, 웨스턴 블롯팅, 및 효소-연결 면역흡착 검정법(ELISA)을 포함한다. 예를 들어, 면역조직화학법에서 사용을 위한 일 실시형태에서, 관심 에피토프는 조직의 얇은 절개부 상에 존재할 수 있어서, 무당화 1차 항체를 그 조직에 도포하여 에피토프에 결합되도록 한다. 미결합된 1차 항체를 제거한 후, 무당화 1차 항체에 특이적으로 결합할 수 있는 2차 항체를 조직에 도포하여 1차 항체에 결합할 수 있게 한다. 미결합된 항체를 제거한 후, 검출 시스템 시약을 도포한다. 예를 들어, 2차 항체가 효소에 연결되면, 발색성 효소 기질이 조직에 도포되어 반응할 수 있게 한다. 반응성 효소 기질의 직접 현미경 또는 형광현미경 시각화를 이후 수행할 수 있다. 다른 검출 방법이 당분야에 잘 알려져 있다. 무당화 항체를 인식하는 2차 항체를 사용하는 시스템의 장점은 제한없이, 다음을 포함한다: 1) 2차 항체가 달리 진핵생물 조직에 존재하지 않는 1차 항체의 무당화 Fc 부분에 결합하도록 디자인되었기 때문에 면역조직화학에서 증가된 특이성; 2) 1차 항체에 대한 증가된 특이성 때문에 감소된 배경 염색; 3) 1차 및/또는 2차 항체를 원핵생물 예컨대 이. 콜라이에서 발생시킬 수 있으므로 2차 항체 시스템 생성의 감소된 비용; 및 4) 항체 개발의 전체 공정이 원핵생물 예컨대 이. 콜라이에서 수행될 수 있기 때문에, 마우스 및 토끼를 포함하는, 포유동물의 불필요한 이용의 회피.

산업 용도로 사용되는 효소. 많은 산업 공정들이 본 발명의 방법으로 생성될 수 있는 효소를 이용한다. 이들 공정은 폐수 처리 및 다른 생물환경정화 및/또는 해독 공정; 제지 및 섬유 산업 재료의 표백; 및 생연료로 효율적으로 발효될 수 있는 재료료 생물량의 분해를 포함한다. 많은 예에서, 미생물 숙주 세포 또는 바람직하게 박테리아 숙주 세포에서 이들 용도를 위한 효소를 생성시키는 것이 바람직하지만, 활성 효소는 효소 폴딩 및/또는 보조인자의 요구 문제로 인해 대량으로 발현시키는 것이 어렵다. 본 발명의 일정 실시형태에서, 본 발명의 유도성 공발현 방법은 산업적 용도의 효소, 예컨대 아라비노스 이용 및 자일로스 이용 효소(예를 들어, 자일로스 아이소머라제(EC 5.3.1.5)) 또는 리그닌 분해 퍼옥시다제(예를 들어, 리그닌 퍼옥시다제(EC 1.11.1.14), 망간 퍼옥시다제(EC 1.11.1.13), 다재다능 퍼옥시다제(EC 1.11.1.16), 또는 라카제(EC 1.10.3.2))를 생성시키는데 사용된다.

실시예 1

공발현을 촉진하도록 숙주 세포에 게놈 변경의 도입

상기에 기술된 바와 같이 숙주 세포 유전자 발현에 일정 변경은 희망 유전자 산물(들)의 공발현을 개선시킬 수 있다. 일정 숙주 세포, 이. 콜라이 ASE(DGH) 세포는 이. 콜라이 셔플(SHuffle)(등록상표) 익스프레스 세포로부터 유도되었고, 그들 유전자형은 이. 콜라이 셔플 익스프레스 ΔaraBAD Δsbm-ygfDGH ΔaraEp::J23104로 표시할 수 있다. 이. 콜라이 ASE(DGH) 세포는 다음과 같이 생성시켰다. 결실 및 변경은 게놈 서열을 균일하게 제거하는, 대항선택에 의한 결실로 설명되는, 리컴비니어링 방법을 사용하여 진 브릿지스 게엠베하(Gene Bridges GmbH) (독일 하이델베르크 소재)를 통해 이. 콜라이 셔플 익스프레스 숙주 세포 게놈에 만들었다. 숙주 세포에 의한 아라비노스 이화작용이 감소되도록 숙주 세포 araBAD 오페론의 결실을 만들어, 보다 많은 아라비노스 유도인자가 araBAD 프로모터를 포함하는 발현 작제물로부터 공발현되는 유전자 산물의 유도에 이용될 수 있다. 이러한 결실은 이. 콜라이 게놈의 위치 70,135 내지 65,867(마이너스 가닥)(게놈 뉴클레오타이드 서열 내 위치는 모두 표 1에 제공됨)에 상응하는, araBAD 오페론의 4269개 염기쌍을 제거하여, 천연 araBAD 프로모터의 대부분 내지 AraD 코딩 영역의 소수 코돈을 제외한 전부가 제거된다. 결실 접합부 주변 뉴클레오타이드 서열(마이너스 가닥)(위치 70,136 | 위치 65,866)은 TTAT | TACG이다. 다른 결실을 sbm-ygfDGH(scpA-argK-scpBC라고도 함) 오페론 내에 만들어서, 2-메틸 사이트레이트의 생합성에 관여하는 유전자의 기능을 제거해, 외생적으로 공급되는 프로피오네이트에 대한 숙주 세포의 프로피오네이트 유도성 프로모터의 감응성을 증가시켰다. sbm-ygfDGH 결실은 5542개 염기쌍(이. 콜라이 게놈의 위치 3,058,754 내지 3,064,295)을 제거하여, sbm-ygfDGH 프로모터 및 ygfH 코딩 서열의 마지막 코돈을 제외한 오페론의 전부를 제거시키는 한편, 인접한 ygfI 코딩 서열 및 중지 코돈은 온전하게 남겨두었다. 결실 연결부 주변의 뉴클레오타이드 서열(플러스 가닥)(위치 3,058,753 | 위치 3,064,296)은 ACAA | GGGT이다. 이. 콜라이 셔플 익스프레스 숙주 세포 게놈에 만들어진 이들 결실 이외에도, 진 브릿지스 게엠베하는 게놈 rpsL 유전자 코딩 서열에 점 돌연변이를 도입시켜, 마이너스 가닥 상에서 위치 3,472,574부터 3,472,200까지 연장되어, 위치 3,472,447의 A가 G로 변화되어서, Lys43에 대한 코돈이 Arg에 대한 코돈으로 변경되고 그 결과 돌연변이체 rpsL-Arg43 유전자가 발현될 때 스트렙토마이신-내성 표현형을 유발되었다. 상기 기술된 바와 같이 보다 엄격하게 제어된 유도성 발현을 가증하게 하는, 숙주 세포 게놈에 대한 다른 변경은 araE 프로모터를 아라비노스에 반응성인 것보다는 항상성으로 만드는 것이다. CRP-cAMP 및 AraC 결합 부위를 포함하는, 천연 araE 프로모터의 대부분은 97개 염기쌍(위치 2,980,335 내지 2,980,239(마이너스 가닥))을 결실시키고 항상성 J23104 프로모터의 35개 염기쌍 서열을 갖는 서열로 치환하여 제거하였다(서열번호 1; J23104의 뉴클레오타이드 서열은 partsregistry.org 웹사이트, parts.igem.org/Main_Page에서 입수함). 변경된 araE 프로모터 내 최종 접합 부위 서열은 TGAA | TTGA ... TAGC | TTCA이다.

EB0001이라고도 하는 균주인, 이. 콜라이 ASE(DGH)의 유전자형은 다음과 같이 표시될 수 있다:

ΔaraBAD fhuA2 [lon] ompT ahpC ^Δ gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--Tet^S)2 [dcm] R(zgb-210::Tn10--Tet^S) ΔaraEp::J23104 ΔscpA-argK-scpBC endA1 rpsL-Arg43 ΔgorΔ(mcrC-mrr)114::IS10

균주 EB0002는 EB0001 prpD, 또는 다음과 같이 발현될 수 있는 유전자형을 갖는다:

ΔaraBAD fhuA2 ΔprpD [lon] ompT ahpC ^Δ gal λatt::pNEB3-r1-cDsbC(Spec, lacI) ΔtrxB sulA11 R(mcr-73::miniTn10--Tet^S)2 [dcm] R(zgb-210::Tn10--Tet^S) ΔaraEp::J23104 ΔscpA-argK-scpBC endA1 rpsL-Arg43 ΔgorΔ(mcrC-mrr)114::IS10

임의의 이들 게놈 변경, 또는 이들의 임의 조합을 갖는, 이. 콜라이 숙주 세포 예컨대 이. 콜라이 셔플 익스프레스 숙주 세포 또는 EB0001 세포 또는 EB0002 세포가 유전자 산물의 유도성 공발현에 적용될 수 있다.

실시예 2

유도성 프로모터를 포함한 발현 벡터

A. 발현 벡터 pPRO43

발현 벡터 pPRO43(서열번호 2)은 프로피오네이트 유도성 prpBCDE 프로모터로부터 관심 유전자 산물을 발현시키는데 사용되었고, pPRO33 발현 벡터의 뉴클레오타이드 서열을 기준으로 구축되었다. pPRO33의 뉴클레오타이드 서열은 pBAD18 벡터(유전자 은행 등록 번호 X81838.1), prpR-P_prpB 영역의 이. 콜라이 게놈 서열, 및 문헌[Guzman et al., "Tight regulation, modulation, and high-level expression by vectors containing the arabinose PBAD promoter", J Bacteriol 1995 Jul; 177(14): 4121-4130], 및 [미국 특허 제8178338호 B2; May 15 2012; Keasling, Jay]에 기술된 바와 같은 pBAD33 벡터의 서열로부터 편집되었다. pPRO33의 뉴클레오타이드 서열은 서열분석으로 확인하였고 서열번호 3으로 제공하였다.

pPRO43에서 전사 활성인자 prpR을 코딩하는 뉴클레오타이드 서열은 문헌 [Welch et al., "Design parameters to control synthetic gene expression in Escherichia coli", PLoS One 2009 Sep 14; 4(9): e7002; doi: 10.1371/journal.pone.0007002]에 기술된 것과 같은 방법을 이용해서 DNA2.0(캘리포니아주 멘로파크 소재)을 통해서 이. 콜라이에서 발현을 위해 최적화시켰다. pPRO43의 최적화된 prpR 서열은 도시된 것과 반대 가닥 상에서, 서열번호 2의 뉴클레오타이드 1593 내지 7인 prpP 코딩 서열의 상류의 다른 서열 및 RBS를 포함한다. pPRO43 벡터는 또한 2개의 HindIII 부위가, 하나는 MCS에 2번째는 prpP 코딩 서열에 있는 pPRO33과 대조적으로 다중 클로닝 부위(MCS)에 오직 하나의 HindIII 제한효소 부위를 갖는다.

B. 발현 벡터 pPRO430 및 pPRO430(CloDF13)

발현 벡터 pPRO430(서열번호 4)은 pPRO43의 뉴클레오타이드 서열(서열번호 2)을 기반으로 DNA2.0으로 합성되었다. pPRO430 벡터는 p15 복제 기원, 클로람페니콜에 내성(Cm^R)을 부여하는 유전자, 상기 기술된 이. 콜라이에서 발현을 위해 최적화된 prpR 코딩 서열, 및 코딩 서열이 삽입될 수 있는 프로피오네이트 유도성 prpBCDE 프로모터 하류의 클로닝 부위를 함유한다는 점에서 pPRO43과 유사하다. pPRO430 발현 벡터는 클로닝 부위의 상류에 최적화된 RBS 서열-AGGAGGAAAACATA(서열번호 4의 뉴클레오타이드 3566-3579)을 갖는다는 점에서 pPRO43과 상이하다. pPRO430 발현 벡터는 또한 일부 뉴클레오타이드 서열의 제거 및 짧은 종결인자의 사용을 통해 pPRO43에 비해 간소화되었고, 그 결과 pPRO430 뉴클레오타이드 서열(서열번호 4)은 5883 염기인 pPRO43 뉴클레오타이드 서열(서열번호 2)과 비교하여, 오직 3698 염기를 갖는다. pPRO430(CloDF13) 발현 벡터(서열번호 5)는 BfuAI 제한효소 부위가 측접된, pPRO430의 p15 복제 기원이 pPRO430의 고카피수 CloDF13 복제 기원(CloDF13)으로 치환된 것을 제외하고 pPRO430과 동일하다.

C. 발현 벡터 pBAD240

발현 벡터 pBAD240(서열번호 6)은 pBAD24의 뉴클레오타이드 서열(유전자은행 데이터베이스 등록 번호 X81837.1(25-OCT-1995))을 기반으로 DNA2.0에 의해 합성되었다. 발현 벡터 pBAD240은 코딩 서열이 삽입될 수 있는 클로닝 부위의 상류에 최적 RBS 서열-AGGAGGTAAAAA(서열번호 6의 뉴클레오타이드 3125 내지 3136)을 갖는 것이 pBAD24와 상이하다. pBAD240 뉴클레오타이드 서열은 또한 일부 뉴클레오타이드 서열의 제거, 및 더 짧은 종결인자의 사용에 의해 pBAD24에 비해 감소되었고, 그 결과 pBAD240 뉴클레오타이드 서열(서열번호 C)은 4542개 염기의 pBAD24 뉴클레오타이드 서열과 비교하여, 오직 3255개 염기를 갖는다. pBAD240 발현 벡터는 또한 pBAD24의 암피실린 내성 유전자보다는, 카나마이신 내성을 부여하는 유전자(Kan^R)를 포함한다.

D. 발현 벡터 pPRO44 및 pPRO45

발현 벡터 pPRO44(서열번호 7) 및 pPRO45(서열번호 8)는 pPRO43(서열번호 2)의 뉴클레오타이드 서열을 기반으로 생성되었는데, pPRO44(RSF1030) 및 pPRO45(CloDF13) 발현 벡터에 사용된 것과 상이한 복제 기원을 갖는다. 프라이머는 각각의 복제 기원 서열의 상류에 AatII 제한효소 부위 및 상류에 SpeI 제한효소 부위를 첨가하기 위해서, pPRO43, RSF1030 복제 기원, 및 CloDF13 복제 기원에 대해 디자인되었다. pPRO43 및 RSF1030 뉴클레오타이드 서열은 이들 프라이머(각각 서열번호 9 및 10, 서열번호 11 및 12)를 이용해서 증폭되었고, 증폭된 생성물은 SpeI 및 AatII로 분해하였으며, 바람직한 제한효소 단편을 겔 정제하여 함께 결찰시켜서 pPRO44(서열번호 7)를 생성시켰다. 최종 pPRO44 발현 벡터를 서열분석하여 PCR 증폭을 통해 돌연변이가 도입되지 않았음을 확인하였다. pPRO45를 생성시키기 위해서, CloDF13 뉴클레오타이드 서열을 프라이머(서열번호 13 및 14)를 이용해서 증폭시켜 SpeI 및 AatII 부위를 첨가시켰고, CloDF13 증폭 생성물 및 pPRO44는 SpeI 및 AatII 제한 효소로 분해하여 바람직한 단편을 겔 정제하였으며, 이후 함께 결찰시켜 pPRO45(서열번호 8)를 형성시켰다. pPRO45의 CloDF13 부분을 서열분석하여 PCR 증폭을 통해 돌연변이가 도입되지 않았음을 확인하였다.

실시예 3

박테리아 세포에서 형광 단백질의 유도성 공발현을 위한 이중 프로모터 벡터 pSOL의 사용

A. 이중-프로모터 pSOL 발현 벡터의 구축.

'이중 벡터' 또는 'pSOL'이라고 하는, 2종의 상이한 유도성 프로모터를 포함하는 발현 벡터를 도 5에 개략적으로 도시하였다. 이 벡터는 DNA2.0(캘리포니아주 멘로파크 소재)에 의해 합성하였고, 이. 콜라이 숙주 세포에서 발현을 위해 최적화된, 몇몇 폴리뉴클레오타이드 서열, 또는 '성분'을 함유한다. pSOL에서 이용된 폴리뉴클레오타이드 성분의 설명을 하기 표 4에 제공하였고, pSOL의 뉴클레오타이드 서열은 서열번호 15로 제공하였다.

pSOL 이중-프로모터 발현 벡터의 폴리뉴클레오타이드 성분
성분의 명칭:	서열번호 15(또는 이의 상보체)에서 성분의 위치:	성분의 설명:
BfuAI	상보체(29-38)	BfuAI 제한효소 부위
Ori_pBR	39-651	pBR322(pMB1) 복제 기원
ROP	상보체(703-894)	코딩 서열: 이. 콜라이 조절 단백질 rop(RNA one modulator rom)
BfuAI	895-900	BfuAI 제한효소 부위
Kan-R	상보체(901-1710)	코딩 서열: 카나마이신 내성 단백질
P_kan	상보체(1711-1832)	카나마이신 내성 단백질의 발현을 위한 프로모터
term. apFAB389	상보체(1833-1923)	종결인자 apFAB389(BIOFAB, 에머빌, 캘리포니아 소재)
BsmBI	상보체(1924-1929)	BsmBI 제한효소 부위
araC	상보체(1930-2808)	코딩 서열: AraC 전사 조절 단백질
MKS	상보체(2809-2817)	코딩 서열: MKS(메티오닌-리신-세린)
rbs	상보체(2818-2840)	리보솜 결합 부위
araC 프로모터	상보체(2959-2987)	AraC의 발현용 프로모터
araBAD 프로모터	3084-3111	삽입된 코딩 서열의 발현을 위한 araBAD 오페론 유래의 프로모터
NheI	3134-3139	NheI 제한효소 부위
최적화된 RBS	3140-3151	최적화된 리보솜 결합 부위(pBAD240의 것과 같음)
BsaI	상보체(3158-3163)	BsaI 제한효소 부위
BsaI	3164-3169	BsaI 제한효소 부위
XbaI	3172-3177	XbaI 제한효소 부위
term. apFAB391	3178-3259	종결인자 apFAB391(BIOFAB, 에머빌, 캘리포니아 소재)
term. apFAB381	상보체(3260-3349)	종결인자 apFAB391(BIOFAB, 에머빌, 캘리포니아 소재)
opt. prpR	상보체(3350-4936)	최적화된 코딩 서열: PrpR 전사 조절 단백질
prpB 프로모터	5114-5129	삽입된 코딩 서열의 발현을 위한 prpBCDE 오페론 유래의 프로모터
HindIII	5166-5171	HindIII 제한효소 부위
rbs	5172-5185	최적화된 리보솜 결합 부위(pPRO430의 것과 같음)
BsaI	상보체(5186-5191)	BsaI 제한효소 부위
BsaI	5192-5197	BsaI 제한효소 부위
Xho	5199-5204	XhoI 제한효소 부위
3 프레임 중지	5205-5215	모든 3개 정방향 리딩 프레임의 중지 코돈
term. apFAB390	5216-5304	종결인자 apFAB390(BIOFAB, 에머빌, 캘리포니아 소재)

구체적으로, pSOL 발현 벡터는 관심 단백질의 유도성 공발현을 위해 사용할 수 있는 2종의 상이한 유도성 프로모터: 아라비노스 유도성 araBAD 프로모터 및 프로피오네이트 유도성 prpBCDE 프로모터를 포함한다. pSOL의 변이체가 또한 관심 단백질의 유도성 공발현을 위해 사용될 수 있는데, 예컨대 araBAD 프로모터 및 prpBCDE 프로모터의 위치가 복제 기원에 대해 바뀐 pSOL 기반 발현 벡터이다. pSOL 발현 벡터의 추가의 유용한 변이체는 AraC 전사 활성인자에 대한 코딩 서열 및/또는 PrpR 전사 활성인자에 대한 코딩 서열이 발현 벡터에 존재하지 않지만, 대신 개별 폴리뉴클레오타이드 예컨대 상이한 염색체외 성분, 또는 숙주 게놈으로부터 발현되는 것을 포함한다. pSOL 발현 벡터의 추가 변이체는 서열번호 15의 pSOL 뉴클레오타이드 위치 5304 내지 29 사이에 삽입된 제3 유도성 프로모터를 포함하는 것으로서, 상기 제3 유도성 프로모터가 prpB 프로모터 및 이의 관련 클로닝 부위 및 종결인자의 하류에 있고, prpB 프로모터와 동일한 방향으로 배향된다. pSOL 발현 벡터의 이러한 변이체의 제3 유도성 프로모터는 예를 들어 람노스 유도성 프로모터 예컨대 rhaSR 프로모터, 자일로스 유도성 프로모터 예컨대 xylAB 프로모터, 또는 포스페이트 고갈에 의한 유도성 프로모터 예컨대 phoA 프로모터일 수 있다.

B. 형광 단백질의 유도성 공발현.

pBAD24 및 pPRO33 발현 벡터의 조합으로부터의 공발현과 이중 프로모터 pSOL 벡터로부터의 공발현의 수준을 비교하기 위해서, pBAD24 및 pPRO33 벡터를 사용하여 노란색 형광 단백질(YellowFP) 및 적색 형광 단백질(RedFP)을 각각 발현시켰다. pSOL의 L-아라비노스 유도성 araBAD 프로모터를 사용하여 YellowFP를 발현시켰고, 프로피오네이트 유도성 prpBCDE 프로모터를 사용하여 RedFP를 발현시켰다. The YellowFP는 515㎚에서 여기되고 528㎚ 내지 530㎚에서 최대 방출을 가지며(Nagai et al., "A variant of yellow fluorescent protein with fast and efficient maturation for cell-biological applications", Nat Biotechnol 2002 Jan; 20(1): 87-90), RedFP는 610㎚에서 최대 방출을 갖고 587㎚에서 여기된다(Shaner et al., "Improved monomeric red, orange and yellow fluorescent proteins derived from Discosoma sp. red fluorescent protein", Nat Biotechnol 2004 Dec; 22(12): 1567-1572; Epub 2004 Nov 21).

pBAD24-YellowFP 및 pPRO33-RedFP 플라스미드를 구축하기 위해서, YellowFP 및 RedFP에 대한 코딩 서열을 DNA 2.0을 통해 이. 콜라이에서 발현을 위해 최적화시켰다. YellowFP 및 RedFP에 대해 최적화된 코딩 서열은 NheI 및 SalI으로 분해하였고, 분해된 삽입물을 각각 NheI/SalI-절단 pBAD24 및 pPRO33에 결찰시켰다. pSOL의 경우, DNA2.0은 각각 araBAD 프로모터 및 prpBCDE 프로모터 영역에서 최적화된 리보솜 결합 부위의 하류에서 pSOL 발현 벡터에 YellowFP 및 RedFP에 대해 최적화된 코딩 서열을 삽입시키기 위해 증폭 기반 엘렉트라 클로닝 시스템을 사용하였다. pBAD24-YellowFP 및 pPRO33-RedFP 발현 작제물은 이. 콜라이 ASE(DGH) 세포(이. 콜라이 ASE(DGH) 세포는 실시예 1에 기술됨)에 공동형질전환시켰고, pSOL-YellowFP-RedFP 발현 작제물을 또한 개별적으로 이. 콜라이 ASE(DGH) 세포에 형질전환시켰다.

ASE(DGH)('pBAD, pPRO') 중 pBAD24-YellowFP/pPRO33-RedFP 및 ASE(DGH)('pSOL') 중 pSOL-YellowFP-RedFP의 배양물을 밤새 37℃에서 각각 클로람페니콜과 암피실린을 함유하거나 또는 카나마이신을 함유하는 LB 배지 중에서 275 RPM에서 진탕하면서 성장시켰다. 0.7의 OD600에서, 세포를 항생제가 더해진 LB 배지 2 x 6mL로 0.01의 OD600으로 희석시키고, 30℃에서 0.75의 OD600에 도달할 때까지 275 RPM에서 진탕하면서 성장시켰다. 세포를 30℃에서 7분 동안 3800 x g에서 펠렛화시켰고, 추가 탄소 공급원없이 항생제가 더해진 M9 배지에 0.7의 OD600으로 재현탁시켰다. 재현탁된 세포를 다음과 같이 웰당 200 마이크로리터로 다중 웰 플레이트에 플레이팅하였다.

A, B열: ASE(DGH) 콜로니 1의 pBAD24-YellowFP/pPRO33-RedFP

C, D열: ASE(DGH) 콜로니 2의 pBAD24-YellowFP/pPRO33-RedFP

E, F열: ASE(DGH) 콜로니 1의 pSOL-YellowFP-RedFP

G, H열: ASE(DGH) 콜로니 2의 pSOL-YellowFP-RedFP

세포를 다양한 농도의 프로피오네이트(수동) 및 L-아라비노스(디지탈 분배기에 의함)의 첨가에 의해 유도시켰는데 프로피오네이트 농도는 0mM, 1mM, 2.5mM, 5mM, 및 20mM이었고 L-아라비노스 농도는 0 마이크로몰, 0.67 마이크로몰, 3.33 마이크로몰, 6.66 마이크로몰, 및 66.61 마이크로몰이었다.

플레이트를 "급속" 진탕 속도를 이용해서 30℃에서 바이오텍 시너지(Biotek Synergy)(등록상표) 4 마이크로플레이트(BioTek Instruments Inc., Winooski, Vermont)에서 항온처리하고, 형광성을 15분마다 8시간 동안 모니터링하였다. 형광 값을 동일한 유도인자 농도에서 배양된 샘플에 대해 평균 내었고, 평광발광은 도 6 및 도 7에 도시된 바와 같이 시간에 따라 그래프화하였다. 도 6은 프로피오네이트 유도성 prpBCDE 프로모터로부터 발현된, 시간에 따라 RedFP로부터의 형광도를 도시한다. 샘플의 각 평균군에 대한 유도인자 농도는 범례에 도시하였고, 프로피오네이트 농도가 먼저 열거된 후, L-아라비노스 농도를 열거하였다. 도 7은 L-아라비노스 유도성 araBAD 프로모터로부터 발현된, 시간에 따른 YellowFP로부터의 형광도를 도시한다. 샘플의 각 평균군에 대한 유도인자 농도를 범례에 도시하였고, L-아라비노스 농도가 먼저 열거된 후 프로피오네이트 농도를 열거하였다. 유도인자 농도의 각 조합의 경우, 관찰된 형광도에 의해 표시된 바와 같이, 측정된 형광 단백질의 발현은 pBAD24-YellowFP/pPRO33-RedFP 조합에 존재하는 상응하는 유도성 프로모터보다 pSOL 이중 프로모터 발현 벡터에 존재하는 유도성 프로모터로부터가 더 높았다. pBAD24 및 pPRO33에 비해 pSOL로부터 형광 단백질 발현의 이러한 높은 수준은 도 6 및 도 7에 도시된 유도인자 농도의 조합에서 관찰되었을 뿐만 아니라, 명확을 기하기 위하여 그래프에서 생략시킨 유도인자 농도의 조합에서도 관찰되었다.

C. 프리프로인슐린과 단백질 다이설파이드 아이소머라제의 유도성 공발현.

이중 프로모터 pSOL 벡터를 사용한 단백질 다이설파이드 아이소머라제(PDI)와 프리프로인슐린의 공발현에 의해 생성된 프리프로인슐린의 양을 pBAD240(서열번호 6) 및 pPRO430(서열번호 4) 발현 벡터(이들 벡터의 구축에 대해 실시예 2 참조)의 조합을 사용한 공발현으로 생성된 프리프로인슐린의 양과 비교하였다.

pBAD240 및 pPRO430 벡터를 사용하여 각각 프리프로인슐린 및 단백질 다이설파이드 아이소머라제(PDI)를 발현시켰다. pSOL 내 L-아라비노스 유도성 araBAD 프로모터를 사용하여, 프리프로인슐린을 발현시켰고, 프로피오네이트 유도성 prpBCDE 프로모터를 사용하여 PDI를 발현시켰다. 염화칼슘 처리에 의한 형질전환에 적격하게 만든 EB0001 세포(이. 콜라이 ASE(DGH) 세포라고도 함, 실시예 1 참조)를 pBAD240-프리프로인슐린 및 pPRO430-PDI 벡터 둘 다를 함유하는 용액에 첨가한 후, 42℃에서 20초간 열충격을 주고 5분간 얼음 상에 두었다. 공동형질전환된 세포를 900 마이크로리터 SOC 과성장 배지(뉴 잉글랜드 바이오랩스 카탈로그 번호 B9020S)에 37℃에서 1시간 동안 275 RPM에서 진탕하면서 25 마이크로그램/mL의 카나마이신 및 12 마이크로그램/mL의 클로람페니콜을 함유하는 한천 플레이트 상에 플레이팅하기전에 회수하였다. pPRO430을 함유하는 세포의 성장을 위한 50 마이크로그램/mL의 카나마이신, 및 12 마이크로그램/mL의 클로람페니콜의 항생제 농도를 액체 배양 조건에서 사용하였다. EB0001 세포를 유사한 방식으로 단일 pSOL-프리프로인슐린-PDI 벡터로 형질전환시켰지만, 한천 플레이트 상에 플레이팅하고, 이후에 50 마이크로그램/mL의 카나마이신만을 함유하는, 액체 배양으로 성장시켰다. 각 형질전환으로부터 단일 콜로니를 선택하여 적절한 항생제(들)가 더해진 LB 배지에서 30℃로 275 RPM에서 진탕하면서 밤새 정지기에 도달할 때까지 배양하였고, 이들 배양물을 사용하여 EB0001 균주 내 pBAD240-프리프로인슐린/pPRO430-PDI 및 EB0001 균주 내 pSOL-프리프로인슐린-PDI의 글리세롤 스톡을 확립시켰다.

유도를 위해 세포를 성장시키기 위해서, 적절한 항생제(들)가 있는 100mL의 LB 배지에 각 글리세롤 스톡으로부터 직접 접종하였고, 밤새 30℃에서 275 RPM으로 진탕하면서 배양하였다. 적절한 항생제(들)가 있는 100mL의 신선한 LB 배지에 0.2의 OD600에 도달할 때까지 희석한 후, 이 세포를 다시 30℃에서 275 RPM으로 진탕하면서 OD600가 0.6 내지 0.8에 도달할 때까지 배양하였다. 이 시점에, 적절한 부피를 펠렛화(3800 x g, 10분)시켜서 80mL 유도 배지(적절한 항생제(들)가 더해진 M9)에 현탁하여 0.7 내지 0.75의 OD600을 제공하였다.

유도 배지에 재현탁된 세포를 3mL/웰식 유도를 위해 24웰의 깊은 웰 배양 플레이트에 플레이팅하였다. 다음으로 각 유도인자 조건을 위해 300X 유도인자 스톡의 10 마이크로리터를 섞어서 플레이트에서 배양물을 유도시켰고, 6시간 동안 27℃에서 275 RPM으로 진탕하면서 항온처리시켰다. 각 웰의 배양물의 OD600은 6시간 항온처리 후 100 마이크로리터의 이중증류수에 100 마이크로리터의 배양물을 첨가하고, 큐벳 OD로 전환시키기 위해 하기 그래프 맞춤을 이용하여 에포치(Epoch) 플레이트 판독기(BioTek, Winooski, Vermont)를 사용하여 측정하였다: OD600_큐벳 =(OD600_플레이트*1.9796)-0.07. 각 웰의 세포를 이후 3800 x g에서 7분간 실온에서 펠렛화하여 수확하였다. 상청액은 펠렛으로부터 흡입시켜 버렸고 세포 펠렛 샘플을 -80℃에 저장하였다.

각 세포 펠렛의 프리프로인슐린의 양은 제조사의 설명서에 따라서 WES 시스템(ProteinSimple, 캘리포니아주 산호세 소재) 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용하여 결정하였다. 저장된 세포 펠렛을 얼음 상에서 10분간 해동시킨 후, 유도 후 수확 시 배양 농도보다 2배 더 높은 세포 농도로 용해 완충액(배양물 mL 당 인산칼륨 pH 8, 1% 옥틸글루코사이드; 1X 프로테아제 억제제; 2 U 벤조나제(EMD# 70746, EMD Millipore, 매사추세츠주 빌레리카 소재); 및 배양물 mL 당 2.25 kU r리소자임(EMD# 71110, EMD Millipore, 매사추세츠주 빌레리카 소재))에서 용해시켰다. 용해는 얼음에서 10분간 항온처리시켜 진행시킨 후, 샘플을 20,000 x g에서 15분간 4℃에서 원심분리로 투명하게 하였다. WES 분석을 위한 준비에서, 용해물을 0.1X WES 완충액에 희석하고, 이들을 0.02X의 최종 농도가 되게 하였다. 각 샘플에 대해서, 5 마이크로리터의 희석된 샘플을 1.25 마이크로리터 환원 5X 샘플 완충액(형광 표준물과 함께, 200mM의 최종 농도로 DTT 첨가)에 첨가하였다. WES 시스템에 로딩하기 전에, 샘플을 95℃에서 10분간 가열하였다. 프리프로인슐린의 검출을 위한 1차 항체는 마우스 항인슐린 항체였고, 2차 항체는 홀스래디시 퍼옥시다제(HRP)가 표지된 염소 항마우스 항체였다. WES 분석의 결과는 표 5 및 표 6에 나타내었다.

2종의 개별 벡터를 이용해서 PDI와 공발현 시 생성된 프리프로인슐린의 양(마이크로그램/mL/OD)
		L-아라비노스 농도(마이크로몰)
		0.123	1.23	3.7	11.1	33.3	300
프로피오네이트 농도(mM)	0	0.08	0.35	2.77	4.33	3.63	6.43
	0.1	0.12	0.66	2.28	3.46	4.24	5.42
	1	0.19	1.31	4.85	5.47	6.58	9.82

단일 pSOL 벡터를 이용해서 PDI와 공발현시 생성된 프리프로인슐린의 양(마이크로그램/mL/OD)
		L-아라비노스 농도(마이크로몰)
		0.123	1.23	3.7	11.1	33.3	300
프로피오네이트 농도 (mM)	0	0.02	10.02	18.64	21.58	21.99	22.35
	0.27	0.00	7.57	15.24	16.55	19.79	18.21
	0.8	0.69	8.56	16.57	19.15	19.95	18.51
	2.4	0.34	9.58	19.14	15.38	16.55	12.90

표 5 및 표 6의 결과의 비교는 비슷한 유도인자 농도에서, pSOL 벡터는 2-벡터 공발현 시스템보다 2배 내지 8배 더 많은 양의 프리프로인슐린을 생성시켰음을 보여준다.

실시예 4

인플릭시맙의 유도성 공발현

인플릭시맙은 염증성 사이토카인인 TNF-알파에 결합하는 키메라 단일클론 항체이고, TNF-알파가 관여하는 병태 예컨대 자가면역 질환(크론병, 류마티스성 관절염, 건선 등)의 치료에 사용된다. 인플릭시맙은 중쇄(서열번호 16으로 표시된 아미노산 서열) 및 경쇄(서열번호 17로 표시된 아미노산 서열)로 형성되고, 이들 사슬 각각은 마우스 항-TNF-알파 항체로부터 유도된 가변 도메인 서열, 및 인간 불변 도메인을 갖는다. 이. 콜라이에서 발현을 위한 코돈 최적화 및 서열번호 16 및 17을 코딩하는 폴리뉴클레오타이드의 합성은 DNA2.0(캘리포니아주 멘로파크 소재)으로 수행하였다.

DNA2.0 엘렉트라 클로닝 방법(www.dna20.com/products/expression-vectors/electra-system)을 사용하여 인플릭시맙 발현 작제물을 생성시켰다. pBAD240 발현 벡터의 엘렉트라 클로닝 부위로 인플릭시맙 중쇄에 대한 최적 코딩 서열을 삽입시켜 형성된 발현 작제물은 pBAD240-인플릭시맙_HC이고, 서열번호 18로 표시된 뉴클레오타이스 서열을 갖는다. pPRO430 발현 벡터의 엘렉트라 클로닝 부위에 인플릭시맙 경쇄에 대해 최적화된 코딩 서열을 삽입시켜 형성된 발현 작제물은 pPRO430-인플릭시맙_LC이고, 서열번호 19로 표시된 뉴클레오타이드 서열을 갖는다. 최적화된 인플릭시맙 중쇄 및 경쇄 코딩 서열 둘 다를 유사한 방식으로 pSOL 발현 벡터(서열번호 15)에 클로닝하여서, araBAD 프로모터로부터 중쇄가 발현되고, prpBCDE 프로모터로부터 경쇄가 발현되게 하였다. 최종 pSOL-인플릭시맙 발현 벡터는 서열번호 20으로 표시된 뉴클레오타이드 서열을 갖는다. pBAD240-인플릭시맙_HC 및 pPRO430-인플릭시맙_LC 발현 작제물을 사용하여 42℃에서 열 충격과 이후, 37℃에서 밤새 성장을 통해 이. 콜라이 ASE(DGH) 세포를 공동형질전환시켰고, pSOL-인플릭시맙 발현 작제물도 유사한 방식으로 이. 콜라이 ASE(DGH) 세포에 형질전환시켜서, ASE(DGH)(pBAD240-인플릭시맙_HC/pPRO430-인플릭시맙_LC) 세포 및 ASE(DGH)(pSOL-인플릭시맙) 세포를 생성시켰다.

이들 세포는 일반적으로 실시예 3에 기술된 대로 성장시켰는데, 선별 화합물 예컨대 카나마이신 및/또는 클로람페니콜의 필요에 따른 첨가를 포함하였고, 항체 발현의 유도를 위해 세포를 대략 0.7(0.6-1.0)의 OD600에서 추가의 탄소 공급원없이 M9 배지에 재현탁시켰다. 다음으로 세포를 아라비노스(초기에 0.1%를 포함한 농도) 및 프로피오네이트(초기에 50mM을 포함한 농도)의 첨가를 통해 유도시켰다. 아라비노스 및 프로피오네이트의 농도의 조정은 실시예 5에 기술된 대로 수행할 수 있다. 유도 후, 항체가 생성된 숙주 세포를 효소 예컨대 리소자임을 사용한 화학적 용해에 의해서, 또는 기계적 파괴 방법 예컨대 초음파 처리 또는 미세유체 모델 M-110Y 미세유동화기(Microfluidics International Corp., 매사추세츠주 웨스트우드 소재)를 사용한 미세유동화를 통해 파괴하였다. 15분간 실온에서 20,000 x g에서 원심분리를 사용하여 불용성 분획으로부터 분리하였고, 발현된 항체를 포함한 가용성 단백질을 함유하는 상청액을 수집하였다.

인플릭시맙 항체는 제조사의 설명서(역시 실시예 3 참조)에 따라서, WES 시스템(ProteinSimple, 캘리포니아주 산호세 소재) 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용하여 검출 및 정량하였다. 가용성 단백질 추출물을 모세관 세트에 적재하고, 단백질을 크기별로 전기영동으로 분리한 후, 샘플 내 항체를 차단 단계(1차 상체의 사용대신), 및 인간 항체 중쇄 및 경쇄를 인식하는 HRP-접합된 염소 항인간 2차 항체와 항온처리시켜 검출하였다. 항체 검출은 모세관에 화학발광 기질의 첨가 및 효소-촉매 반응 동안 방출되는 빛의 직접 포획을 통해 수행하였다. 분자량 추정치는 각 실시에 대해 12 kDa 내지 230 kDa 범위의 6개 바이오틴화된 단백질을 이용하여 생성시킨 표준 곡선을 이용해서 계산하였다. 형광 표준물을 샘플 적재 완충액에 포함시켜서, 분자량 표준물과 샘플을 정렬시키는데 사용된 내부 표준물을 각 샘플에 제공하였다.

소정 분자량으로 존재하는 단백질의 양을 결정하기 위해서, 기지량의 단백질 포준물을 일부 모세관에서 이동시켰다. 이러한 경우에, 예를 들어 10 마이크로그램/mL에서 출발하여 1.0 나노그램/mL로 희석시킨, 기지 단백질 농도를 갖는 시판 인플릭시맙의 연속 희석물을 준비하였다. 대략 5 WES 시스템 모세관을 사용해서 연속 희석물을 이동시켰다. 실험 및 연속 희석물 모세관 둘 다에서 각 인플릭시맙 단백질 밴드에 대해, 단백질 밴드의 화학발광 강도를 나타내는 WES 시스템 소프트웨어를 통해 곡선을 생성시키고, 각 곡선 하 영역을 평가하고, 이들 영역의 표준 곡선을 인플릭시맙 연속 희석물 모세관의 인플릭시맙 단백질 밴드에 대해 그래프화하였다. 실험 샘플의 농도를 결정하기 위해서, 실험 인플릭시맙 샘플의 화학발광 강도를 나타내는 각 곡선 하 영역은 기지 인플릭시맙 농도의 샘플에 대해 생성시킨 표준 곡선과 비교할 수 있다.

인플릭시맙 항체는 실시예 7에 기술된 대로 더욱 정제될 수 있고, 인플릭시맙 항체의 추가 특징규명은 실시예 8(항체 결합 친화성의 측정) 및 실시예 9(공발현 생성물에 존재하는 이황화 결합의 특징규명)에 기술되어 있다.

실시예 5

다양한 유도인자 농도에 의한 공발현의 적정

본 발명의 발현 시스템을 사용해서 다량체 생성물의 생성을 최적화하기 위해서, 유도인자의 농도를 독립적으로 조정 또는 적정하는 것이 가능하다. 유도성 프로모터 예컨대 L-아라비노스 유도성, 프로피오네이트 유도성, L-람노스 유도성, 또는 D-자일로스 유도성 프로모터를 포함하는 발현 작제물을 함유하는 숙주 세포를 적절한 항생제를 함유하는 M9 최소 배지에서 원하는 밀도(예컨대 대략 0.5의 OD₆₀₀) 로 성장시킨 후, 세포를 경우에 따라 탄소 공급원 예컨대 글리세롤 없이, 적절한 항생제 및 다양한 농도의 각 유도제와 함께 제조된, 소량의 M9 최소 배지에 분취하였다. 소량 적정은 200mL 내지 500mL 진탕 플라스크에서 수행할 수 있다. 발현을 유도하는데 필요한 L-아라비노스, L-람노스, 또는 D-자일로스의 농도는 전형적으로 세포의 OD 유닛 당 0.02%보다 낮다(그리고 종종 실질적으로 낮다). 적정 실험에서, 시험되는 L-아라비노스의 농도는 모두 세포의 OD 유닛 당 2% 내지 1.5%, 1%, 0.5%, 0.2%, 0.1%, 0.05%, 0.04%, 0.03%, 0.02%, 0.01%, 0.005%, 0.002%, 0.001%, 0.0005%, 0.0002%, 0.0001%, 0.00005%, 0.00002%, 0.00001%, 0.000005%, 0.000002%, 0.000001%, 0.0000005%, 0.0000002%, 0.0000001%, 0.00000005%, 0.00000002%, 및 0.00000001% 범위일 수 있다. 66.61 마이크로몰 농도의 L-아라비노스는 0.001%의 L-아라비노스에 상응한다. L-아라비노스, L-람노스, 또는 D-자일로스에 대한 대안적인 적정 실험은 몰농도로 표시되는 하기 농도를 시험하는 것이다: 모두 세포의 OD 유닛 당, 250mM, 100mM, 50mM, 25mM, 10mM, 5mM, 2.5mM, 1.0mM, 500 마이크로몰, 250 마이크로몰, 100 마이크로몰, 75 마이크로몰, 50 마이크로몰, 25 마이크로몰, 10 마이크로몰, 5.0 마이크로몰, 2.5 마이크로몰, 1.0 마이크로몰, 500nM, 250nM, 100nM, 50nM, 25nM, 10nM, 5.0nM, 2.5nM, 1.0nM, 500pM, 250pM, 100pM, 50pM, 25pM, 10pM, 5.0pM, 2.5pM, 및 1.0pM. 프로피오네이트의 경우, 시험되는 농도는 모두 세포의 OD 유닛 당 1M 내지 750mM, 500mM, 250mM, 100mM, 75mM, 50mM, 25mM, 10mM, 5mM, 1mM, 750 마이크로몰, 500 마이크로몰, 250 마이크로몰, 100 마이크로몰, 50 마이크로몰, 25 마이크로몰, 10 마이크로몰, 5.0 마이크로몰, 2.5 마이크로몰, 1.0 마이크로몰, 500nM, 250nM, 100nM, 50nM, 25nM, 10nM, 5.0nM, 2.5nM, 및 1.0nM 범위일 수 있다.

시험되는 L-아라비노스(또는 L-람노스 또는 D-자일로스)의 각 농도 'x'의 경우, 제1 유도인자의 농도 'x'를 함유하는 각 튜브에 첨가되는 상이한 유도인자 예컨대 프로피오네이트의 농도는 일련의 각 샘플에서 다양하였다. 대안적으로, 적절 실험은 유도인자를 대사하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는 숙주 세포의 경우, 세포의 OD 유닛 당 0.0015%(100 마이크로몰)의 임의의 L-아라비노스, L-람노스, 또는 D-자일로스, 및/또는 세포의 OD 유닛 당 100 마이크로몰(또는 50 마이크로몰 내지 250 마이크로몰의 농도) 프로피오네이트인 유도인자 농도의 '표준' 조합에서 출발할 수 있다. 유도인자를 대사하는 단백질이 기능성인 숙주 세포의 경우, 유도인자 농도의 '표준' 조합은 세포의 OD 유닛 당 0.2%(13mM)의 임의의 L-아라비노스, L-람노스, 또는 D-자일로스, 및/또는 세포의 OD 유닛 당 83mM(또는 50mM 내지 100mM 농도)의 프로피오네이트이다. '표준' 조합에서 변화시킨 유도인자 농도의 추가 조합이 시험되었고, 일련의 적정 실험에서, 초기 실험의 결과를 사용하여 이후 실험에서 사용되는 유도인자 농도를 '미세 조율'할 수 있다. 유사한 적정 실험을 제한없이 L-아라비노스, 프로피오네이트, L-람노스, 및 D-자일로스를 포함하는, 본 발명의 유도성 공발현 시스템에서 사용되는 임의의 유도인자 조합으로 수행할 수 있다. 6시간 동안 유도인자의 존재 하에서 성장 후, 세포를 펠렛화시키고, 희망 생성물을 세포로부터 추출하고, 세포의 질량 값 당 생성물의 수율을 정량적 면역 검정법 예컨대 ELISA에 의해서, 또는 생성물의 정제 및 280㎚에서 UV 흡광도를 통한 정량으로 결정한다.

발현되는 단백질을 형광 단백질 모이어티, mKate2 적색 형광 단백질 (Evrogen, 러시아 모스크바 소재), 또는 애쿠오레아 빅토리아(Aequorea victoria) 및 바실러스 세레우스(Bacillus cereus) 유래의 강화된 녹색 형광 단백질에 의해 제공되는, 형광 단백질 모이어티를 포함하도록 조작하는, 고수율 검정법을 이용해서 유도인자 농도를 적정하는 것이 가능하다. 고수율 적정 실험에서 유도인자의 상이한 농도에 의해 생성된 유전자 산물의 양 및 활성을 결정하는 다른 접근법은 생체분자 결합 상호작용을 측정할 수 있는 센서, 예컨대 표면 플라스몬 공명을 검출하는 센서, 또는 생체층 간섭계(BLI)를 적용한 센서(예를 들어, 옥테트(Octet)(등록상표) QK 시스템(forteBIO, 캘리포니아주 멘로파크 소재))를 사용하는 것이다. 발현되는 유전자 산물에 충분한 특이성으로 결합하는 항체가 이용가능하면, 유전자 산물은 상기 실시예 3에 기술된 바와 같이 WES 시스템 상에서 이동시키는, 모세관 전기영동 웨스턴 블롯을 이용해서 검출 및 정량할 수 있다.

실시예 6

프로모터의 강도 및 유도성 발현의 균일성의 측정

프로모터의 강도는 적합한 대조군에 대해서, 그 프로모터에서 개시되는 유전자 산물의 전사량으로서 측정된다. 발현 작제물의 유전자 산물의 발현을 유도하는 항시성 프로모터의 경우, 프로모터의 '야생형' 형태, 또는 '하우스키핑' 유전자 유래의 프로모터를 시험하려는 프로모터 대신에 사용하는 것을 제외하고, 적합한 대조군은 동일한 발현 작제물을 사용할 수 있었다. 유도성 프로모터의 경우, 프로모터로부터 유전자 산물의 발현은 유도 및 비유도 조건 하에서 비교할 수 있다.

A. 프로모터로부터 전사된 RNA의 수준을 결정하기 위해 정량적 PCR을 사용한 프로모터 강도의 측정

De Mey 등의 방법("Promoter knock-in: a novel rational method for the fine tuning of genes", BMC Biotechnol 2010 Mar 24; 10: 26)을 이용해서 배양으로 성장시킬 수 있는 숙주 세포에서 프로모터의 상대적 강도를 결정하였다. 시험하려는 프로모터를 갖는 발현 작제물을 포함하는 숙주 세포, 및 대조군 발현 작제물을 함유하는 대조군 숙주 세포는 삼중으로 배양으로 성장시켰다. 1mL의 샘플을 mRNA 및 단백질 수집을 위해 OD₆₀₀= 1.0에서 채취하였다. 전체 RNA 추출은 RNeasy 미니 키트(QIAGEN, 네덜란드 소재)를 이용해서 수행하였다. RNA의 순도는 퀴아젠(QIAGEN)에서 추천하는 FA-아가로스 겔 상에서 입증하였고 RNA 농도는 260㎚의 흡광도를 측정하여 결정하였다. 2 마이크로그램의 RNA를 사용하고 무작위 프라이머 및 리버트애드(RevertAid) H 마이너스 M-MulV 역전사효소(Fermentas, 매릴랜드 글렌 버니 소재)를 사용하여 cDNA를 합성하였다. 프로모터의 강도는 프로모터로부터 생성되는 전사물에 상응하는 cDNA를 증폭시키기 위해 디자인된 정방향 및 역방향 프라이머를 사용하여 아이사이클러 아이큐(iCycler IQ)(등록상표)(Bio-Rad, 벨기에 에케 소재)에서 수행한 RT-qPCR을 통해 결정하였다. (이러한 목적을 위해 문헌 [De Mey et al.]의 저자들은 Fw-ppc-qPCR 및 Rv-ppc-qPCR 프라이머, 및 대조군 하우스키핑 유전자 rpoBand 유래의 프라이머 Fw-rpoB-qPCR 및 Rv-rpoB-qPCR을 사용하였음). SYBR GreenER qPCR 수퍼믹스(Life Technologies, 뉴옥주 그랜드 아일랜드 소재)를 이용해서 간단한 UDG(우라실 DNA 글리코실라제) 항온처리(50℃에서 2분) 직후 PCR 증폭(95℃에서 8.5분; 40사이클의 95℃에서 15초 및 60℃에서 1분) 및 프라이머 이량체 존재를 확인하고 반응의 특이성을 분석하기 위한 용융 곡선 분석(95℃에서 1분, 55℃에서 1분 및 80사이클로 10초간 55℃+0.5℃/사이클)을 수행하였다. PCR 사이클링 전 UDG 항온처리 단계는 이전 반응으로부터 임의의 오염된 dU 함유 생성물을 파괴한다. UDG는 이후 정상 PCR 사이클링 동아나 고온에 의해 불활성화되어서, 진짜 표적 서열의 증폭을 가능하게 한다. 각 샘플은 삼중으로 수행하였다. 상대적 발현 비율은 PE 어플라이드 바이오시스템(PerkinElmer, 캘리포니아주 포스터 시티 소재)의 "델타-델타 ct 방법"을 이용해서 계산하였다.

B. 형광 리포터 유전자를 사용한 유도성 프로모터 강도 및 유도의 균일성 측정

이들 실험은 Khlebnikov 등의 방법("Regulatable arabinose-inducible gene expression system with consistent control in all cells of a culture", J Bacteriol 2000 Dec; 182(24): 7029-7034)을 이용해서 수행하였다. 유도성 프로모터의 유도를 측정하는 실험은 탄소 공급원으로서 3.4% 글리세롤이 보충된 C 배지에서 수행하였다(Helmstetter, "DNA synthesis during the division cycle of rapidly growing Escherichia coli B/r", J Mol Biol 1968 Feb 14; 31(3): 507-518). 형광 리포터 유전자의 발현을 제어하는 적어도 1종의 유도성 프로모터를 포함하는 발현 작제물을 함유하는 이. 콜라이 균주는 0.6 내지 0.8의 600㎚(OD600)에서의 광학 밀도까지 항생제 선별 하에 37℃에서 성장시켰다. 세포는 원심분리(15,000 x g)를 통해 회수하였고, 탄소 공급원이 없는 C 배지에서 세척하고, 항생제, 글리세롤 및/또는 유도인자(유전자 발현의 유도용)를 함유하는 신선한 C 배지에 0.1 내지 0.2의 OD600까지 재현탁시키고, 6시간 동안 항온처리시켰다. 분석을 위해 성장 기간 동안 통상적으로 샘플을 채취하였다. 배양물 형광은 360/40-nm-파장 여기 및 520/10-nm-파장 발광 필터를 구비한 벌사플루오르(Versafluor) 형광광도계(Bio-Rad Inc., 캘리포니아주 에르쿨레스 소재) 상에서 측정하였다. 유도시 유도성 프로모터로부터의 발현 강도는 대조군(예컨대 비유도) 세포에 대해 유도된 세포의 최대 개체군-평균 형광의 비율(형광/OD 비율)로 표시할 수 있다. 세포 개체군 내에서 유도의 균일성을 결정하기 위해서, 유세포측정법을 아르곤 레이저(488㎚의 파장 및 15 mW에서 방출) 및 525㎚ 파장 통과대역 필터를 구비한 벡크만-쿨터 에픽스(Beckman-Coulter EPICS) XL 유세포 측정기(Beckman Instruments Inc., 캘리포니아주 팰로앨토 소재) 상에서 수행하였다. 분석 전에, 샘플 세포를 여과(필터 공극 크기, 0.22 마이크로미터)시킨 포스페이트-완충 염수로 세척하고, 0.05의 OD600으로 희석시키고, 얼음에 위치시켰다. 각 샘플에 대해, 500 내지 1,000 이벤트/초 사이의 속도로 30,000 이벤트를 수집하였다. 각 샘플에서 유도된(형광) 세포의 비율은 유세포측정 데이터로부터 계산할 수 있다.

실시예 7

항체의 정제

본 발명의 유도성 공발현 시스템을 생성된 항체는 임의의 세포 및 찌꺼기를 제거하기 위해 10분간 10,000 x g에서 용해된 숙주 세포의 샘플을 원심분리하여 정제하였다. 상청액을 0.45 마이크로미터 필터를 통해 여과시켰다. 1mL의 재조합 단백질 G-세파로스(Sepharose)(등록상표) 4B 칼럼(Life Technologies, 뉴옥주 그랜드 아일랜드 소재)을 1mL/분의 유속을 얻도록 설치하였고, 하기 완충액과 함께 사용하였다: 결합 완충액: 0.02M 인산나트륨, pH 7.0; 용리 완충액: 0.1M 글리신-HCl, pH 2.7; 및 중화 완충액: 1M Tris-HCl, pH 9.0. 칼럼은 5 칼럼 부피(5mL)의 결합 완충액으로 평형화시킨 후, 샘플을 칼럼에 적용하였다. 칼럼은 5 내지 10 칼럼 부피의 결합 완충액으로 세척하여 불순물 및 미결합 물질을 제거하였고, 용리물에서 단백질이 검출되지 않을 때까지 계속하였다(280㎚의 UV 흡광도로 결정). 다음으로 칼럼을 5 칼럼 부피의 용래 완충액으로 용리하였고, 칼럼을 즉시 5 내지 10 칼럼 부피의 결합 완충액으로 재평형화시켰다.

실시예 8

항체 결합 친화성의 측정

"Kd" 또는 "Kd 값"으로 표시하는, 항체 결합 친화성은 하기 검정법으로 기술한 바와 같이 관심 항체의 Fab 형식 및 이의 항원을 이용해서 수행된 방사성표지된 항원-결합 검정법(RIA)에 의해 측정된다. 전체 길이 항체의 Fab 형식의 생성은 당분야에 공지되어 있다. 항원에 대한 Fab의 용액-결합 친화성은 미표지된 항원의 적정 시리즈 존재 하에서 최소 농도의 (¹²⁵I)-표지된 항원으로 Fab를 평형화시킨 후, 항-Fab 항체 코딩된 플레이트로 결합된 항원을 포획하여 측정한다(예를 들어, 하기 문헌들을 참조함: Chen et al., "Selection and analysis of an optimized anti-VEGF antibodi: crystal structure of an affinity-matured Fab in complex with antigen", J Mol Biol 1999 Nov 5; 293(4): 865-881). 검정 조건을 확립하기 위해서, 마이크로타이터 플레이트(DYNEX Technologies, Inc., 버지니아주 샹타이 소재)를 밤새 50mM의 탄산나트륨(pH 9.6) 중 5 마이크로그램/mL의 포획 항-Fab 항체(Cappel Labs, 펜실베니아주 웨스트체스터 소재)로 코팅시키고, 후속하여 실온(대략 23℃)에서 2 내지 5시간 동안 PBS 중 2%(w/v) 소혈청 알부민으로 차단시켰다. 비흡착 플레이트(Nunc #269620; Thermo Scientific, 뉴욕주 로체스터 소재)에서, 100pM 또는 26pM [¹²⁵I]-항원을 관심 Fab의 연속 희석물과 혼합하였다(예를 들어, 문헌 Presta et al., "Humanization of an anti-vascular endothelial growth factor monoclonal Antibody for the therapy of solid tumors and other disorders", Cancer Res 1997 Oct 15; 57(20): 4593-4599]의 항-VEGF 항체, Fab-12의 평가와 일관적임). 관심 Fab를 다음으로 밤새 항온처리시켰지만, 이러한 항온처리는 평형에 도달한 것을 보장하기 위해 장기간(예를 들어, 약 65시간) 동안 계속할 수 있다. 이후, 혼합물을 실온에서 항온처리(예를 들어, 1시간)을 위해 포획 플레이트로 옮겼다. 이후 용액을 제거하고 플레이트를 8회 PBS 중 0.1% 트윈(TWEEN)20(상표명) 계면활성제로 세척하였다. 플레이트를 건조시켰을 경우, 150 마이크로리터/웰의 섬광제(MICROSCINT-20™; PerkinElmer, 매사추세츠주 월섬 소재)를 첨가하였고, 플레이트를 10분간 탑카운트(TOPCOUNT)(상표명) 감마 카운터(PerkinElmer) 상에서 계측하였다. 20% 미만 또는 그와 동일한 최대 결합을 제공하는 각 Fab의 농도를 경쟁-결합 검정법에 사용을 위해 선택하였다.

대안적으로, Kd 또는 Kd 값은 대략 10 반응 유닛(RU)에서 고정된 항원 CM5 칩을 이용해서 25℃에서 비아코어(BIACORE)(등록상표)-2000 또는 비아코어-3000 장비(BIAcore, Inc., 뉴저지주 피스카타웨이 소재)를 사용한 표면-플라스몬 공명 검정을 사용하여 측정한다. 간략하게, 카복시메틸화된 덱스트란 바이오센서 칩(CM5, BIAcore Inc.)을 공급사의 설명서에 따라서 N-에틸-N'-(3-다이메틸아미노-프로필)-카보다이이미드 하이드로클로라이드(EDC) 및 N-하이드록시숙신이미드(NHS)로 활성화시켰다. 대략 10 RU의 커플링된 단백질을 획득하기 위해 5 마이크로리터/분의 유속으로 주입 전에 항원을 5 마이크로그램/mL(대략 0.2 마이크로몰)로, 10mM 아세트산나트륨, pH 4.8을 이용해서 희석하였다. 항원의 주입 후, 1M 에탄올아민을 주입하여 미반응 기를 차단하였다. 동역학 측정을 위해 Fab의 2배 연속 희석물(0.78nM 내지 500nM)을 대략 25 마이크로리터/분의 유속으로 25℃에서 0.05% 트윈 20 계면활성제를 함유한 PBS(PBST) 중에서 주입하였다. 결합 속도(k_on) 및 해리 속도(k_off)는 결합 및 해리 센서그램을 동시에 적합화시켜서 단순 일대일 랑뮈어 결합 모델(비아코어 평가 소프트웨어 버전 3.2)을 사용해서 계산하였다. 평형 해리 상수(Kd)는 k_off/k_on비율로 계산하였다. 상기 표면-플라스몬 공명 검정에 의해 결합 속도가 10⁶M^-1s^-1을 넘으면, 결합 속도는 분광광도계, 예컨대 스탑-플로우-장착된 분광광도계(Aviv Instruments) 또는 교반 큐벳 구비된 8000-시리즈 SLM-아민코(AMINCO)(상표명) 분광광도계(ThermoSpectronic)에서 측정하듯이 증가된 농도의 항원 존재 하에, 25℃에서 PBS, pH 7.2 중 20nM 항-항원 항체(Fab 형태)의 형광 방출 강도(여기=295㎚; 방출=340㎚, 16㎚ 통과대역)의 증가 또는 감소를 측정하는 형광 소광 기술을 이용해서 결정할 수 있다.

항체-항원 결합에 대한 평형 해리 상수(Kd)를 결정하기 위한 다른 방법은 옥테트 레드 시스템(ForteBio, Pall Corporation, 뉴욕주 포트 워싱턴)(www.fortebio.com/octet-RED96.html)을 사용한다. 초기 측정 단계는 기준값을 결정한 후, His-태깅된 항원을 25nM의 농도로 Ni-NTA 바이오센서 상에 10분간 1X KB+ 완충액(PBS 중 0.01% BSA, 0.002% 트윈-20, pH 7.4) 중에서 적재시킨 후, 다른 기준값 측정 단계(오직 2분간 1X KB+ 완충액)를 후속하였다. 센서를 이후 10분간 항체를 함유한 웰에 함침(해리 단계)시키고, 20분간 1X KB+ 완충액으로 세척하여 해리를 측정하였다. 평형 해리 상수(Kd)는 k_off 및 k_on 속도를 결정하는 옥테트 소프트웨어를 사용하여, k_off/k_on의 비율로 계산하였다.

실시예 9

발현 생성물에 존재하는 이황화 결합의 특징규명

단백질 발현 생성물의 이황화 결합 개수 및 위치는 비환원 조건 하에서, 프로테아제, 예컨대 트립신으로 단백질의 분해, 및 최종 펩타이드 단편에 대한 순차적 전자 전달 해리(ETD) 및 충돌-유도 해리(CID) MS 단계(MS2, MS3)를 조합한 질량 분광광도법(MS)을 수행하여 결정할 수 있다(Nili et al., "Defining the disulfide bonds of insulin-like growth factor-bond protein-5 by tandem mass spectrometry with electron transfer dissociation and collision-induced dissociation", J Biol Chem 2012 Jan 6; 287(2): 1510-1519; Epub 2011 Nov 22).

공발현된 단백질의 분해. 이황화 결합 재배열을 방지하기 위해서, 임의의 자유 시스테인 잔기를 먼저 알킬화를 통해 차단하였는데, 발현된 단백질을 4 M 우레아를 포함한 완충액에 20℃에서 30분간 진탕하면서 알킬화제 요오도아세타미드(5mM)과 빛으로부터 보호하여 항온처리시켰다. 대안적으로 바람직하게 NEM이 알킬화제로 사용되었고, 변성 조건(6M GuaHCl) 하에서 수행된 환원/알킬화와 조합하여 트립신 단백질가수분해하였다. 알킬화 후, 공발현된 단백질은 프리캐스트 겔을 이용해서 비환원 SDS-PAGE를 통해 분리하였다. 대안적으로, 공발현된 단백질은 요오도아세타미드 또는 NEM이 있거나, 또는 대조군으로서 없이 전기영동 후 겔에서 항온처리시켰다. 단백질 밴드를 염색하고, 이중탈이온수로 탈염색하고, 절개하고, 30분간 20℃에서 진탕하면서 500 마이크로리터의 50mM 중탄산암모늄, 50%(v/v) 아세토나이트릴에서 2회 항온처리시켰다. 단백질 샘플을 2분간 100% 아세토나이트릴에서 탈수시키고, 진공 원심분리를 통해 건조시키고, 얼음 상에서 15분간 50mM 중탄산암모늄 및 5mM 염화칼슘을 함유하는 완충액 중에서 10 mg/mL의 트립신 또는 카이모트립신으로 재수화시켰다. 과량의 완충액을 제거하고 효소가 없는 50 마이크로리터의 동일 완충액으로 교체한 후, 진탕하면서 각각 트립신 및 카이모트립신에 대해 37℃ 또는 20℃에서 16시간 동안 항온처리하였다. 분해는 3 마이크로리터의 88% 포름산을 첨가하여 중지시키고, 간단한 와류 후, 상청액을 제거하고 분석까지 -20℃에 저장하였다. 트립신분해가 불충분한 서열 범위(75% 미만)를 제공하면 대안적인 단백질 단편화 방법(LysC, Glu-C, 또는 CNBr)이 사용된다. NEM의 존재 하에서 산성 조건 하에 환원제 TCEP(트리스(2-카복시에틸)포스핀)의 사용은 부분적으로 온전한 이황화 연결을 갖는 단편에 대한 접근성을 제공한다. 이황화-온전한 분해 지도는 환원(DTT 또는 TCEP) 분해 지도와 비교하였다.

질량 분광분석법에 의한 이황화 결합의 위치. 펩타이드를 0.1% 포름산을 함유하는 이동상에서 20 마이크로리터/분으로 1㎜×8㎜ 트랩 칼럼(Michrom BioResources, Inc., 캘리포니아주 오번 소재) 상에 주입하였다. 트랩 카트리지를 5 mm Zorbax SB-C18 정지상을 함유하는 0.5㎜ ×250㎜ 칼럼(Agilent Technologies, Santa Clara, CA)과 인라인으로 위치시키고, 펩타이드를 1100 시리즈 모세관 HPLC(Agilent Technologies)를 이용해서 10 마이크로그램/분으로 90분간 2 내지 30% 아세토나이트릴 농도구배를 통해 분리하였고, 대안적으로 UPLC에 적합한 C18 칼럼을 사용하였다. 펩타이드는 ETD 소스가 구비된 LTQ 벨로스(Velos) 선형 이온 트랩(Thermo Fisher Scientific Inc., 매사추세츠주 월섬 소재)을 이용해서 분석하였다. 전자분무 이온화는 캡티브 스프레이 소스(Captive Spray source)(Michrom Bioresources, Inc.), 또는 바람직하게 3.0 kV에서 미코팅된, 약한 용융 실리카 이미터(New Objective Inc., 매사추세츠주 워번 소재)를 이용해서 수행하였다. 대안적으로, 중형 단백질가수분해 단편의 분석은 써모(Thermo) LTQ-FT MS(7 Tesla) 장비, 또는 시냅트(Synapt) G2-Si 4극자 진행파 이온 이동성 비행시간(ToF) 질량 분광광도계(Waters Corp., 매사추세츠주 밀퍼드 소재)를 사용하여 수행하였다. 바람직하게는, 펩타이드는 오비트랩 퓨젼(Orbitrap Fusion)(상표명) 트리브리드(Tribrid)(상표명) 질량 분광광도계(Thermo Fisher Scientific)를 사용하여 분석하였다. 이황화-연결된 펩타이드는 카복시 말단에 2개의 염기성 잔기(아르기닌 또는 리신) 및 2개의 N 말단의 존재로 인하여 트립신처리 후 +4 또는 그보다 큰 전하 상태를 갖는다. 이들 이황화-연결된 펩타이드는 오비트랩 퓨젼 장비를 통해 우선적으로 단리시켜서 이황화 결합이 ETD 단편화를 이용해서 분해될 수 있다. 점검 MS 스캔은 점검 스캔에서 가장 강한 이온 상의 CID 및 ETD MS2 스캔으로 이루어진 7 데이터-의존적 스캔이 후속되었고, ETD MS2 스캔에서 제1 내지 제5의 가장 강한 이온에 대한 5 MS3 CID 스캔을 후속하였다. CID 스캔은 35의 정규화된 충돌 에너지를 사용하였고, ETD 스캔은 보충 활성화가 가능한 100 ms 활성화 시간을 사용하였다. MS2 CID 및 ETD 스캔을 개시하는 최소 신호는 10,000이었고, MS3 CID 스캔의 개시를 위한 최소 신호는 1000이었고, 모든 MS2 및 MS3에 대한 단리 너비는 3.0 m/z였다. 소프트웨어의 동적 배제 특징은 1의 반복 계측, 100의 배제 목록 크기, 및 30초의 배제 지속기간으로 가능하였다. ETD MS2 스캔의 수집을 위한 특이적 가교종을 표적으로 하는 포함 목록을 사용하였다. MS2 및 MS3 스캔을 위한 개별 데이터 파일은 ZSA 전하 상태 분석을 사용하는 바이오웍스(Bioworks) 3.3(Thermo Fisher Scientific)으로 생성시켰다. 펩타이드 서열에 대한 MS2 및 MS3 스캔의 일치는 시퀘스트(Sequest)(V27, Rev 12, Thermo Fisher Scientific)를 통해 수행하였다. 분석은 효소 특이성없이, 2.5의 부모 이온 질량 내성, 1.0의 단편 질량 내성, 및 산화된 메티오닌 잔기에 대한 +16의 가변 질량으로 수행하였다. 다음으로 결과는 95 및 99%의 최소 펩타이드 및 단백질 확률을 사용하여 프로그램 스캐폴드(V3_00_08, Proteome Software, 오리건주 포틀랜드 소재)를 이용해서 수행하였다. 데이터 해석을 위한 소프트웨어 도구는 다이설피네이터 노드가 구비된 프로테옴 디스커버러(Proteome Discoverer)(상표명) 2.0(Thermo Fisher Scientific)을 포함하였다. MS3 결과의 펩타이드는 스캔 번호에 의해 분류하였고, 시스테인 함유 펩타이드는 ETD MS2 스캔에서 관찰된 5 최고 강도 이온에서 생성된 MS3 스캔의 군에서 동정되었다. 이황화-연결종에 참여하는 시스테인 펩타이드의 정체는 점검 스캔 및 ETD MS2 스캔에서 관찰된 부모 이온 질량의 수동 조사에 의해 더욱 확인하였다.

실시예 10

박테리아 세포 주변세포질, 스페로플라스트, 및 전체 세포로부터 발현 생성물의 단리

본 발명의 유도성 발현 시스템은 세포의 상이한 구획, 예컨대 세포질 또는 주변세포질에 축적되는 유전자 산물을 발현시키는데 사용될 수 있다. 숙주 세포 예컨대 이. 콜라이 또는 에스. 세레비지아는 외부 세포막 또는 세포벽을 가지며, 외막 또는 벽이 제거되면 스페로플라스트를 형성할 수 있다. 이러한 숙주에서 만들어진 발현된 단백질은 하기 방법을 사용하여, 주변세포질, 또는 스페로플라스트, 또는 전체 세포로부터 특별히 정제될 수 있다(Schoenfeld, "Convenient, rapid enrichment of periplasmic and spheroplasmic protein fractions using the new PeriPreps™ Periplasting Kit", Epicentre Forum 1998 5(1): 5; www.epibio.com/newsletter/f5_1/f5_1pp.asp 참조). 페리프렙스(PeriPreps)(상표명) 페리플라스팅 키트(Epicentre® Biotechnologies, 위스콘신 매디슨 소재; www.epibio.com/pdftechlit/107pl0612.pdf에서 프로토콜 입수 가능)를 사용하는 이러한 방법은 이. 콜라이 미치 다른 그람 음성 박테리아에 대해 디자인되었지만, 일반적인 접근법을 다른 숙주 세포 예컨대 에스. 세레비지아에 대해 변형시킬 수 있다.

1. 정지기의 더 나이든 세포 배양물은 통상적으로 리소자임 처리에 일부 내성이 입증되어서, 박테리아 숙주 세포 배양은 오직 후기 대수기까지 성장시킨다. 재조합 단백질의 발현이 과도하면, 세포가 이르게 용해될 수 있으므로, 세포 배양은 과도한 단백질 합성이 유도될 수 있는 높은 성장 온도 또는 풍부 배지에서 성장시키지 않는다. 단백질 발현이 유도되면, 세포는 대수기 또는 초기 정지기여야 한다.

2. 세포 배양물을 실온에서 10분간 최소 1,000 x g에서 원심분리하여 펠렛화시킨다. 주: 세포는 신선해야만하고, 냉동시켜서는 안된다. 세포 펠렛의 습윤 무게는 이 프로토콜에 필요한 시약의 양을 계산하기 위해 결정된다.

3. 세포는 세포 현탁물이 균질할때까지 와류 혼합 또는 파이펫팅을 통해서, 세포 각 그램에 대해 최소 2mL의 페리프렙스 페리플라스팅 완충액(200mM Tris-HCl pH 7.5, 20% 수크로스, 1mM EDTA, 및 30 U/마이크로리터 용해 준비 리소자임)에 완전하게 재현탁된다. 주: 과도한 교반은 스페로플라스트의 이른 용해를 초래하여 세포질 단백질로 주변세포질 분획의 오염을 유발시킬 수 있다.

4. 실온에서 5분간 항온처리시킨다. 용해 준비 리소자입은 실온에서 최적으로 활성이 있다. 저온(0℃ 내지 4℃)에서 항온처리 시간을 필요로 하며, 그러한 온도에서 항온처리 시간은 2배 내지 4배로 연장된다.

5. 본래 세포 펠렛 무게(단계 2)의 각 그램 당 3mL의 정제수를 4℃에서 첨가하고 반전시켜 혼합한다.

6. 10분간 얼음에서 항온처리시킨다.

7. 용해된 세포를 최소 4,000 x g에서 15분간 실온에서 원심분리하여 펠렛화시킨다.

8. 주변세포질 분획을 함유하는 상청액을 깨끗한 튜브로 옮긴다.

9. 오염된 핵산을 분해시키기 위하여, 옴니클리브 엔도뉴클레아제를 선택적으로페리프렙스 용해 완충액에 첨가한다. 뉴클레아제의 포함은 일반적으로단백질의 수율 및 용해물의 취급 용이성을 개선시키지만, 뉴클레아제의 첨가가 일부 경우에 바람직하지 않을 수 있는데, 예를 들어 뉴클레아제 사용은 잔류 뉴클레아제 활성 또는 마그네슘 보조인자에 대한 일시적 노출이 후속 검정 또는 정제된 단백질의 사용을 방해하면 피해야 한다. 유사하게, 옴니클리브 엔도뉴클레아제를 불활성화시키기 위해 용해물에 EDTA의 첨가는 후속 검정 또는 정제된 단백질의 사용을 방해할 수 있다. 뉴클레아제가 첨가되면, 2 마이크로리터의 옴니클리브 엔도뉴클레아제 및 10 마이크로리터의 1.0M MgCl₂는 단계 10에서 필요한 용해 완충액의 각 밀리리터에 대해 페리프렙스 용해 완충액(10mM Tris-HCl pH 7.5, 50mM KCl, 1mM EDTA, 및 0.1% 데옥시콜레이트)으로 최대 1mL까지 희석된다.

10. 펠렛을 본래 세포 펠렛 무게의 각 그램에 대해 5mL의 페리프렙스 용해 완충액에 재현탁시킨다.

11. 펠렛은 실온에서 10분간 항온처리시킨다(포함된다면, 옴니클리브 엔도뉴클레아제 활성은 점도의 상당한 감소를 야기시키게 되며, 항온처리는 세포 현탁물이 물의 경도를 가질때까지 계속됨).

12. 세포 찌꺼기는 최소 4,000 x g에서 15분간 4℃에서 원심분리하여 펠렛화시킨다.

13. 스페로플라스트 분획을 함유하는 상청액을 깨끗한 튜브로 옮긴다.

14. 옴니클리브 엔도뉴클레아제가 페리프렙스 용해 완충액에 첨가되었으면, 20 마이크로리터의 500mM EDTA가 마그네슘을 킬레이팅하기 위해 최종 스페로플라스트 분획의 각 밀리리터에 대해 첨가된다(용해물 중 EDTA의 최종 농도는 10mM임). 옴니클리브 엔도뉴클레아제로 핵산의 가수분해 후, 용해물은 실질량의 모노뉴클레오타이드 또는 올리고뉴클레오타이드를 함유할 수 있다. 이들 분해 생성물의 존재는 용해물의 후속 처리에 영향을 줄 수 있으며, 예를 들어, 뉴클레오타이드는 수지와 상호작용에 의한 음이온 교환 수지의 결합능을 감소시킬 수 있다.

상기 프로토콜은 하기의 변형으로 전체 세포 단백질을 제조하는데 사용될 수 있다. 단계 2에서 펠렛화시킨 세포는 신선하거나 또는 냉동될 수 있고, 단계 4에서, 세포는 15분간 항온처리되며, 단계 5 내지 8은 생략되고, 단계 10에서, 3mL의 페리프렙스 용해 완충액은 본래 세포 펠렛 무게의 각 그램 당 첨가된다.

주변세포질, 또는 스페로플라스트, 또는 전체 세포 단백질 샘플의 제조 후, 샘플은 임의의 수많은 단백질 특징규명 및/또는 정량 방법으로 분석될 수 있다. 일례에서, 주변세포질 및 스페로플라스트 단백질의 성공적인 분획화는 SDS-PAGE를 통해서 주변세포질 및 스페로플라스트 분획의 분취물을 분석하여 확인하였다(2 마이크로리터의 각 분획이 일반적으로 쿠마시 브릴리언트 블루 염색에 의한 시각화에 충분함). 소정 분획에 고유한 단백질의 존재 또는 특정 단백질의 농축은 성공적인 분획화를 의미한다. 예를 들어, 숙주 세포가 암피실린 내성 마커를 갖는 고카피수 플라스미드를 함유하면, 주로 주변세포질 분획 내 β-락타마제(31.5 kDa)의 존재는 성공적인 분획화를 의미한다. 주변세포질 공간에 존재하는 다른 이. 콜라이 단백질은 알칼리 포스파타제(50 kDa) 및 연장 인자 Tu(43 kDa)를 포함한다. 소정 분획에 존재하는 단백질의 양은 임의의 많은 방법(예컨대 다른 방법들 중에서도, SDS-PAGE 및 염색 또는 표지된 단백질 밴드의 밀도계 분석, 방사능표지된 단백질의 섬광 계측, 효소-연결 면역흡착 검정법(ELISA), 또는 섬광 근접 검정법)을 이용해서 정량할 수 있다. 스페로플라스트 분획과 비교하여 주변세포질 분획에 존재하는 단백질 양의 비교는 단백질이 세포질에서 주변세포질로 유출되는 정도를 의미한다.

실시예 11

폴리뉴클레오타이드 또는 아미노산 서열 유사성의 결정

폴리뉴클레오타이드 서열 또는 아미노산 서열 동일성의 백분율은 정렬된 심볼, 즉 양쪽의 정렬된 서열에서 동일한, 뉴클레오타이드 또는 아미노산의 개수를 갭을 포함하여, 2개 서열의 정렬에서 심볼의 총 개수로 나눈 것으로 정의된다. 2개 서열 간 유사성 정도(동일성 비율)은 웹사이트 blast.ncbi.nlm.nih.gov/Blast.cgi를 통해 이용할 수 있는 니들만-분치 글로벌 서열 정렬 도구(Needleman-Wunsch Global Sequence Alignment Tool)로 미국립 생명공학 정보 센터(NCBI)에서 실행하여, 니들만 및 분치의 글로벌 정렬 방법(J. Mol. Biol. 48:443, 1970)을 사용한 서열 정렬을 통해 결정할 수 있다. 일 실시형태에서, 니들만 및 분치 정렬 매개변수는 디폴트 값으로 설정된다(각각 2 및 -3의 일치/비일치 점수, 및 각각 5 및 2의 존재 및 연장에 대한 갭 비용). 서열 비교의 당업자가 사용하는 다른 프로그램을 또한 사용하여, 서열을 정렬시킬 수 있으며, 예컨대, 예를 들어 blast.ncbi.nlm.nih.gov/Blast.cgi 웹사이트에 기술된 디폴트 매개변수 설정을 이용해서, NCBI에서 실행하는, 기본 국소 정렬 검색 도구 또는 블라스트(BLAST)(등록상표) 프로그램(Altschul et al., "Basic local alignment search tool", J Mol Biol 1990 Oct 5; 215(3): 403-410)이 있다. 블라스트 알고리즘은 다음과 같이 사용할 수 있는 2가지를 포함한 다수 선택 매개변수를 갖는다: (A) 낮은 조성 복잡성을 갖는 문의 서열의 절편 또는 바람직하게 이용하지 않거나 또는 '오프'로 설정된, 짧은-주기성 내부 반복부로 이루어진 절편을 차폐하기 위한 필터의 포함, 및 (B) '예상치' 또는 E-점수라고 하는 데이터베이스 서열에 대한 일치를 보고하기 위한 통계적 유의성 한계치(예상되는 일치 확률이 단지 우연으로 존재하고, 일치에 할당된 통계적 유의성이 E-점수 한계치보다 크면, 그 일치는 보고되지 않음). 이러한 '예상치' 또는 E-점수값이 디폴트 값(10)으로부터 조정되면, 바람직한 한계치 값은 0.5, 또는 높은 선호도 순으로 0.25, 0.1, 0.05, 0.01, 0.001, 0.0001, 0.00001, 및 0.000001이다.

본 발명을 실시하는데 있어서, 분자 생물학, 미생물학, 및 재조합 DNA 기술의 많은 통상의 기술이 선택적으로 사용된다. 그러한 통상의 기술은 벡터, 숙주 세포, 및 재조합 방법에 관한 것이다. 이들 기술은 잘 알려져 있고, 예를 들어, 하기 문헌들에 잘 설명되어 있다: [Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Mc, San Diego, CA]; [Sambrook et al., Molecular Cloning-A Laboratory Manual(3rd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2000]; 및 [Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.,(supplemented through 2006)]. 예를 들어 세포 단리 및 배양 및 후속 핵산 또는 단백질 단리에 관해 유용한 다른 참고 문헌은 다음의 문헌들을 포함한다: [Freshney(1994) Culture of Animal Cells, a Manual of Basic Technique, third edition, Wiley-Liss, New York] 및 이에 인용된 참고 문헌; [Payne et al.(1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY]; [Gamborg and Phillips(Eds.)(1995) Plant Cell, Tissue and Organ Culture]; [Fundamental Methods Springer Lab Manual, Springer- Verlag(Berlin Heidelberg New York)]; 및 [Atlas and Parks(Eds.) The Handbook of Microbiological Media(1993) CRC Press, Boca Raton, FL]. 핵산 제조 방법(예를 들어, 시험관내 증폭, 세포로부터 정제, 또는 화학 합성), 핵산 조작 방법(예를 들어, 부위 지정 돌연변이유발법, 제한효소 분해, 결찰 등), 및 핵산의 조작 및 제조에 유용한 다양한 벡터, 세포주 등이 상기 참조문헌에 기술되어 있다. 또한, 본질적으로 임의의 폴리뉴클레오타이드(표지되거나 또는 바이오틴화된 폴리뉴클레오타이드 포함)는 다양한 상업적 공급처로부터 맞춤 또는 표준 주문할 수 있다.

본 발명은 본 발명의 실시를 위한 일정 방식을 포함하는 것으로 확인되거나 또는 제안된 특정 실시형태에 대해 기술되었다. 본원의 관점에서, 본 발명의 의도하는 범주를 벗어나지 않고 예시된 특정 실시형태에 많은 변형 및 변화가 가해질 수 있다는 것은 당업자가 이해할 것이다.

특허 공개를 포함하는, 모든 인용된 참조문헌은 그들 전체로 참고로 본 명세서에 편입된다. 공개된 게놈 위치 또는 다른 설명에서 언급된 뉴클레오타이드 및 다른 유전자 서열이 또한 명백하게 참고로 본 명세서에 편입된다.

서열목록에 표시된 서열

SEQUENCE LISTING <110> AbSci, LLC McClain, Sean Valasek, Mark Barish, Philip Minshull, Jeremy <120> VECTORS FOR USE IN AN INDUCIBLE COEXPRESSION SYSTEM <130> AbSci-01PCT2 <160> 20 <170> PatentIn version 3.5 <210> 1 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> J23104 promoter <400> 1 ttgacagcta gctcagtcct aggtattgtg ctagc 35 <210> 2 <211> 5883 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pPRO43 <400> 2 atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60 cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120 agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180 agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240 cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300 accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360 agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420 cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480 cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540 gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600 catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660 acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720 cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780 ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840 acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900 ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960 ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020 gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080 catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140 gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200 gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260 ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320 gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380 attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440 ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500 caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560 tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620 atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680 aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740 attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800 gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860 agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920 gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980 tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040 tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160 tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220 ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280 cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340 atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400 agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460 cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520 gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820 tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060 cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180 acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300 ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660 caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720 caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780 ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840 tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900 actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960 cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020 aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080 cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140 ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200 cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260 aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320 gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380 ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440 attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500 cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560 ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620 ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680 cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740 cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800 ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860 gtgcgtaacg gcaaaagcac cgccggacat cagcgctagt agcggagtgt atactggctt 4920 actatgttgg cactgatgag ggtgtcagtg aagtgcttca tgtggcagga gaaaaaaggc 4980 tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct cgctcactga 5040 ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac ggggcggaga 5100 tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc ggcaaagccg 5160 tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc aaatcagtgg 5220 tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggcgg ctccctcgtg 5280 cgctctcctg ttcctgcctt tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg 5340 tctcattcca cgcctgacac tcagttccgg gtaggcagtt cgctccaagc tggactgtat 5400 gcacgaaccc cccgttcagt ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 5460 caacccggaa agacatgcaa aagcaccact ggcagcagcc actggtaatt gatttagagg 5520 agttagtctt gaagtcatgc gccggttaag gctaaactga aaggacaagt tttggtgact 5580 gcgctcctcc aagccagtta cctcggttca aagagttggt agctcagaga accttcgaaa 5640 aaccgccctg caaggcggtt ttttcgtttt cagagcaaga gattacgcgc agaccaaaac 5700 gatctcaaga agatcatctt attaatcaga taaaatattt gctcatgagc ccgaagtggc 5760 gagcccgatc ttccccatcg gtgatgtcgg cgatataggc gccagcaacc gcacctgtgg 5820 cgccggtgat gccggccacg atgcgtccgg cgtagaggat ctgctcatgt ttgacagctt 5880 atc 5883 <210> 3 <211> 5882 <212> DNA <213> Artificial Sequence <220> <223> pPRO33 vector <400> 3 atcgattcag cttttcagcc gccgccagaa cgtcgtccgg ctgatgccta aataattcgc 60 cgctgctgtt ttatcgccat taaatttctc cagtgcctgt tgtggtgtca gtaagcgtgg 120 agcgggagtt ttcgccgact cgcgcgccag ttccggcagt agcagttgca taaactgcgg 180 cgttaaatcc ggcgtcggtt ccacacttaa aaacagcgcc agtcgttcca tcatattgcg 240 cagttcacga atattgcctg gccagtcgta gtgcagcagc acagtttcac ttgcctgtaa 300 cccctggcgt aatgcagcag aaaatggggc ggagagcgcc gccagagaca ctttcaaaaa 360 gctttccgcc agcggaagaa tatccgccac ccgctcgcgc agtggtggca attgcagacg 420 caaaatactc agccgataaa acagatcacg gcgaaaacgt ccttgctgca tatcttcttc 480 cagattgcag tgagtggcgc taatgacccg tacatctacc ggaacaggct gatgcccgcc 540 gacgcgggtg acctcttttt cttccagcac ccgcagcagc cgggtctgca aaggtagcgg 600 catttcgcca atctcatcca gaaacagcgt accgccgtgg gcaatttcga acagcccggc 660 gcgacctccg cgtcgcgagc cggtaaacgc cccttcctca tagccaaaca gttctgcttc 720 cagcagcgat tcggcaatcg ccccgcagtt gacggcaaca aacggatgcg actttttgcc 780 ctgtcgcgca tcgtggcggg caaaatattc ccgatgaatc gcctgggccg ccagctcttt 840 gcccgtcccc gtttccccct caatcaacac cgccgcactg gagcgggcat acagcaaaat 900 agtctgccgt acttgttcca tctgtggtga ttgaccgagc atatcgccca gcacgtaacg 960 agtacgcagg gcgttgcggg tggcatcgtg agtgttatgg cgtaacgaca tgcgcgtcat 1020 atccagcgca tcgctgaacg cctggcgcac ggtggcggcg gaatagataa aaattccggt 1080 cattccggct tcttctgcca aatcggtaat cagccctgcg ccgaccaccg cttcggtgcc 1140 gttagctttt agctcgttaa tctgcccgcg tgcgtcttcc tcggtaatgt agctacgttg 1200 gtcgaggcgc aaattaaagg ttttttgaaa cgccaccagc gctggaatgg tttcctgata 1260 ggtgacaacg ccgatagaag aggtgagttt tccggctttt gccagtgcct gtaacacatc 1320 gtagccgctc ggtttaatca aaataactgg cactgacagg cggcttttca ggtacgcgcc 1380 gttagagcca gccgcgatga tggcgtcaca gcgttcgttt gccagtttct tgcggatgta 1440 ggtcactgct ttttcaaagc caagctgaat aggggtaatg ttcgccaggt gatcaaactc 1500 gaggctgata tcgcgaaaca gctcgaacag gcgcgttaca gataccgtcc agataaccgg 1560 tttgtcgtca ttaagccgtg gtggatgtgc catagcgcac cgcaaagtta agaaaccgaa 1620 tattgggttt agtcttgttt cataattgtt gcaatgaaac gcggtgaaac attgcctgaa 1680 acgttaactg aaacgcatat ttgcggatta gttcatgact ttatctctaa caaattgaaa 1740 ttaaacattt aattttatta aggcaattgt ggcacacccc ttgctttgtc tttatcaacg 1800 caaataacaa gttgataaca agctagcgaa ttcgagctcg gtacccgggg atcctctaga 1860 gtcgacctgc aggcatgcaa gcttggctgt tttggcggat gagagaagat tttcagcctg 1920 atacagatta aatcagaacg cagaagcggt ctgataaaac agaatttgcc tggcggcagt 1980 agcgcggtgg tcccacctga ccccatgccg aactcagaag tgaaacgccg tagcgccgat 2040 ggtagtgtgg ggtctcccca tgcgagagta gggaactgcc aggcatcaaa taaaacgaaa 2100 ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 2160 gagtaggaca aatccgccgg gagcggattt gaacgttgcg aagcaacggc ccggagggtg 2220 gcgggcagga cgcccgccat aaactgccag gcatcaaatt aagcagaagg ccatcctgac 2280 ggatggcctt tttgcgtttc tacaaactct tttgtttatt tttctaaata cattcaaata 2340 tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 2400 gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 2460 ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 2520 cagcaaacta ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg 2580 gatggaggcg gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt 2640 tattgctgat aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg 2700 gccagatggt aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat 2760 ggatgaacga aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact 2820 gtcagaccaa gtttactcat atatacttta gattgattta cgcgccctgt agcggcgcat 2880 taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 2940 cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 3000 aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 3060 ccaaaaaact tgatttgggt gatggttcac gtagtgggcc atcgccctga tagacggttt 3120 ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 3180 caacactcaa ccctatctcg ggctattctt ttgatttata agggattttg ccgatttcgg 3240 cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 3300 taacgtttac aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 3360 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 3420 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 3480 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 3540 ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 3600 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtc 3660 aggcatttga gaagcacacg gtcacactgc ttccggtagt caataaaccg gtaaaccagc 3720 aatagacata agcggctatt taacgaccct gccctgaacc gacgaccggg tcgaatttgc 3780 tttcgaattt ctgccattca tccgcttatt atcacttatt caggcgtagc aaccaggcgt 3840 ttaagggcac caataactgc cttaaaaaaa ttacgccccg ccctgccact catcgcagta 3900 ctgttgtaat tcattaagca ttctgccgac atggaagcca tcacaaacgg catgatgaac 3960 ctgaatcgcc agcggcatca gcaccttgtc gccttgcgta taatatttgc ccatggtgaa 4020 aacgggggcg aagaagttgt ccatattggc cacgtttaaa tcaaaactgg tgaaactcac 4080 ccagggattg gctgagacga aaaacatatt ctcaataaac cctttaggga aataggccag 4140 gttttcaccg taacacgcca catcttgcga atatatgtgt agaaactgcc ggaaatcgtc 4200 gtggtattca ctccagagcg atgaaaacgt ttcagtttgc tcatggaaaa cggtgtaaca 4260 agggtgaaca ctatcccata tcaccagctc accgtctttc attgccatac ggaattccgg 4320 atgagcattc atcaggcggg caagaatgtg aataaaggcc ggataaaact tgtgcttatt 4380 tttctttacg gtctttaaaa aggccgtaat atccagctga acggtctggt tataggtaca 4440 ttgagcaact gactgaaatg cctcaaaatg ttctttacga tgccattggg atatatcaac 4500 ggtggtatat ccagtgattt ttttctccat tttagcttcc ttagctcctg aaaatctcga 4560 taactcaaaa aatacgcccg gtagtgatct tatttcatta tggtgaaagt tggaacctct 4620 tacgtgccga tcaacgtctc attttcgcca aaagttggcc cagggcttcc cggtatcaac 4680 agggacacca ggatttattt attctgcgaa gtgatcttcc gtcacaggta tttattcggc 4740 gcaaagtgcg tcgggtgatg ctgccaactt actgatttag tgtatgatgg tgtttttgag 4800 gtgctccagt ggcttctgtt tctatcagct gtccctcctg ttcagctact gacggggtgg 4860 tgcgtaacgg caaaagcacc gccggacatc agcgctagta gcggagtgta tactggctta 4920 ctatgttggc actgatgagg gtgtcagtga agtgcttcat gtggcaggag aaaaaaggct 4980 gcaccggtgc gtcagcagaa tatgtgatac aggatatatt ccgcttcctc gctcactgac 5040 tcgctacgct cggtcgttcg actgcggcga gcggaaatgg cttacgaacg gggcggagat 5100 ttcctggaag atgccaggaa gatacttaac agggaagtga gagggccgcg gcaaagccgt 5160 ttttccatag gctccgcccc cctgacaagc atcacgaaat ctgacgctca aatcagtggt 5220 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggcggc tccctcgtgc 5280 gctctcctgt tcctgccttt cggtttaccg gtgtcattcc gctgttatgg ccgcgtttgt 5340 ctcattccac gcctgacact cagttccggg taggcagttc gctccaagct ggactgtatg 5400 cacgaacccc ccgttcagtc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 5460 aacccggaaa gacatgcaaa agcaccactg gcagcagcca ctggtaattg atttagagga 5520 gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa aggacaagtt ttggtgactg 5580 cgctcctcca agccagttac ctcggttcaa agagttggta gctcagagaa ccttcgaaaa 5640 accgccctgc aaggcggttt tttcgttttc agagcaagag attacgcgca gaccaaaacg 5700 atctcaagaa gatcatctta ttaatcagat aaaatatttg ctcatgagcc cgaagtggcg 5760 agcccgatct tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc 5820 gccggtgatg ccggccacga tgcgtccggc gtagaggatc tgctcatgtt tgacagctta 5880 tc 5882 <210> 4 <211> 3698 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pPRO430 <400> 4 ccccagaggc aggtctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 60 tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 120 gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 180 gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 240 acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 300 gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 360 agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 420 tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 480 ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 540 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 600 accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 660 gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 720 ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 780 cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 840 aacctgcctc taaaaacttt tattacgccc cgccctgcca ctcatcgcag tactgttgta 900 attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 960 ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatagtg aaaacggggg 1020 cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 1080 tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 1140 cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 1200 cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 1260 cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc ggatgagcat 1320 tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 1380 cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 1440 ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 1500 atccagtgat ttttttctcc atcatattct tcctttttca atattattga agcatttatc 1560 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1620 gggtcagtgt tacaaccaat taaccaattc tgatctcctg ttagtgaggg ttaatgcccg 1680 gaacgaagaa aggcccaccc gtgaaggtga gccagtgagt tggttacatt ttctcttgag 1740 ggtttagctt ttcagacgac gccaaaaggt cgtacgtgaa atacccaaat agttggccgc 1800 agccgtcttg tcaccattaa acttctcaag cgcttgctgc ggggtcagca aacgcggagc 1860 cggcgtcttt gcgctctcac gcgccagctc cggcagcagc aactgcatga attgcggagt 1920 cagatccggg gtcggctcaa cggacaggaa cagcgccagg cgttccatca tattacgcag 1980 ctcgcggatg ttacccggcc agtcataatg cagcagcacc gtttcgctcg cctgcagacc 2040 ctggcgcagt gccgcagaga acggtgcgct cagggctgcc agcgagactt tcaggaaaga 2100 ctccgccagc ggtaaaatgt cggcgacacg ttcacgcaac ggcgggagct gcagacgcag 2160 aatgctcagg cggtagaaca ggtcgcgacg aaaacggccc tgttgcatat cctcttccag 2220 attgcagtgg gtcgcgctaa tcacgcgcac gtctaccgga accggttgat gaccaccgac 2280 gcgggtcact tctttctctt ccagcacacg cagcagacgg gtttgcaatg gcagcggcat 2340 ctcaccgatc tcgtccagga acaaggtgcc gccgtgggca atttcaaaca aaccagcacg 2400 gccaccgcga cggctacccg tgaatgcgcc ctcttcgtag ccaaacagct cagcttccag 2460 caggctttcc gcgattgcac cgcaattaac tgccacaaac ggatgagatt tcttaccctg 2520 gcgggcatcg tgacgggcga aatactcacg atggattgct tgcgcagcca gttccttacc 2580 cgtaccagtc tcgccttcga tcagaacagc cgcgctgcta cgtgcataca gcagaatggt 2640 ctggcgaact tgctccattt gagggctttg gcccagcata tcacccagga cataacgggt 2700 acgcagcgca ttacgcgtcg catcgtgggt gttgtggcgc aggctcattc tggtcatgtc 2760 cagggcgtcg ctgaacgcct gacgcaccgt tgccgcgctg tagataaaga tgcccgtcat 2820 gcccgcttct tcggccaagt ccgtgatcag acccgcacca accacagcct cggtaccgtt 2880 cgctttcagt tcgttgatct ggccacgtgc atcttcctcg gtaatgtagc tgcgttggtc 2940 caggcgcaga ttaaaggtct tttgaaacgc gaccagcgca gggatcgttt cctggtaggt 3000 gacaacgcca atcgaggagg tcagtttgcc tgccttcgcc agcgcctgca agacatcgta 3060 accgctcggc ttaatcagga tcaccggcac ggacagacgg gatttcaggt aggcaccatt 3120 gctacccgct gcgataatgg cgtcacaacg ctcgttggcc agctttttgc gaatgtaggt 3180 aacggctttc tcgaaaccca gctgaatcgg agtgatgttc gccaggtgat caaactccag 3240 gctaatgtcg cggaacaact cgaacagacg ggtgacgcta acggtccaaa taactggttt 3300 atcatcgttc aaacgcggtg ggtgtgccat ggtgaatacc tcctgttaag aaaccgaata 3360 ttgggtttaa acttgtttca taattgttgc aatgaaacgc ggtgaaacat tgcctgaaac 3420 gttaactgaa acgcatattt gcggattagt tcatgacttt atctctaaca aattgaaatt 3480 aaacatttaa ttttattaag gcaattgtgg cacacccctt gctttgtctt tatcaacgca 3540 aataacaagt tgataacaaa agcttaggag gaaaacatag agaccggtct ctctcgagta 3600 actagttgat agagatcaag ccttaacgaa ctaagacccc cgcaccgaaa ggtccggggg 3660 ttttttttga ccttaaaaac ataaccgagg agcagaca 3698 <210> 5 <211> 3610 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pPRO430(CloDF13) <400> 5 ccccagaggc aggtgcgctg cggacacata caaagttacc cacagattcc gtggataagc 60 aggggactaa catgtgaggc aaaacagcag ggccgcgccg gtggcgtttt tccataggct 120 ccgccctcct gccagagttc acataaacag acgcttttcc ggtgcatctg tgggagccgt 180 gaggctcaac catgaatctg acagtacggg cgaaacccga caggacttaa agatccccac 240 cgtttccggc gggtcgctcc ctcttgcgct ctcctgttcc gaccctgccg tttaccggat 300 acctgttccg cctttctccc ttacgggaag tgtggcgctt tctcatagct cacacactgg 360 tatctcggct cggtgtaggt cgttcgctcc aagctgggct gtaagcaaga actccccgtt 420 cagcccgact gctgcgcctt atccggtaac tgttcacttg agtccaaccc ggaaaagcac 480 ggtaaaacgc cactggcagc agccattggt aactgggagt tcgcagagga tttgtttagc 540 taaacacgcg gttgctcttg aagtgtgcgc caaagtccgg ctacactgga aggacagatt 600 tggttgctgt gctctgcgaa agccagttac cacggttaag cagttcccca actgacttaa 660 ccttcgatca aaccacctcc ccaggtggtt ttttcgttta cagggcaaaa gattacgcgc 720 agaaaaaaag gatctcaaga agatcctttg atcacctgcc tctaaaaact tttattacgc 780 cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 840 gccatcacag acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 900 cgtataatat ttgcccatag tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 960 taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 1020 aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 1080 gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 1140 ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 1200 tttcattgcc atacggaact ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 1260 ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 1320 ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 1380 acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccatcatatt 1440 cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 1500 atttgaatgt atttagaaaa ataaacaaat aggggtcagt gttacaacca attaaccaat 1560 tctgatctcc tgttagtgag ggttaatgcc cggaacgaag aaaggcccac ccgtgaaggt 1620 gagccagtga gttggttaca ttttctcttg agggtttagc ttttcagacg acgccaaaag 1680 gtcgtacgtg aaatacccaa atagttggcc gcagccgtct tgtcaccatt aaacttctca 1740 agcgcttgct gcggggtcag caaacgcgga gccggcgtct ttgcgctctc acgcgccagc 1800 tccggcagca gcaactgcat gaattgcgga gtcagatccg gggtcggctc aacggacagg 1860 aacagcgcca ggcgttccat catattacgc agctcgcgga tgttacccgg ccagtcataa 1920 tgcagcagca ccgtttcgct cgcctgcaga ccctggcgca gtgccgcaga gaacggtgcg 1980 ctcagggctg ccagcgagac tttcaggaaa gactccgcca gcggtaaaat gtcggcgaca 2040 cgttcacgca acggcgggag ctgcagacgc agaatgctca ggcggtagaa caggtcgcga 2100 cgaaaacggc cctgttgcat atcctcttcc agattgcagt gggtcgcgct aatcacgcgc 2160 acgtctaccg gaaccggttg atgaccaccg acgcgggtca cttctttctc ttccagcaca 2220 cgcagcagac gggtttgcaa tggcagcggc atctcaccga tctcgtccag gaacaaggtg 2280 ccgccgtggg caatttcaaa caaaccagca cggccaccgc gacggctacc cgtgaatgcg 2340 ccctcttcgt agccaaacag ctcagcttcc agcaggcttt ccgcgattgc accgcaatta 2400 actgccacaa acggatgaga tttcttaccc tggcgggcat cgtgacgggc gaaatactca 2460 cgatggattg cttgcgcagc cagttcctta cccgtaccag tctcgccttc gatcagaaca 2520 gccgcgctgc tacgtgcata cagcagaatg gtctggcgaa cttgctccat ttgagggctt 2580 tggcccagca tatcacccag gacataacgg gtacgcagcg cattacgcgt cgcatcgtgg 2640 gtgttgtggc gcaggctcat tctggtcatg tccagggcgt cgctgaacgc ctgacgcacc 2700 gttgccgcgc tgtagataaa gatgcccgtc atgcccgctt cttcggccaa gtccgtgatc 2760 agacccgcac caaccacagc ctcggtaccg ttcgctttca gttcgttgat ctggccacgt 2820 gcatcttcct cggtaatgta gctgcgttgg tccaggcgca gattaaaggt cttttgaaac 2880 gcgaccagcg cagggatcgt ttcctggtag gtgacaacgc caatcgagga ggtcagtttg 2940 cctgccttcg ccagcgcctg caagacatcg taaccgctcg gcttaatcag gatcaccggc 3000 acggacagac gggatttcag gtaggcacca ttgctacccg ctgcgataat ggcgtcacaa 3060 cgctcgttgg ccagcttttt gcgaatgtag gtaacggctt tctcgaaacc cagctgaatc 3120 ggagtgatgt tcgccaggtg atcaaactcc aggctaatgt cgcggaacaa ctcgaacaga 3180 cgggtgacgc taacggtcca aataactggt ttatcatcgt tcaaacgcgg tgggtgtgcc 3240 atggtgaata cctcctgtta agaaaccgaa tattgggttt aaacttgttt cataattgtt 3300 gcaatgaaac gcggtgaaac attgcctgaa acgttaactg aaacgcatat ttgcggatta 3360 gttcatgact ttatctctaa caaattgaaa ttaaacattt aattttatta aggcaattgt 3420 ggcacacccc ttgctttgtc tttatcaacg caaataacaa gttgataaca aaagcttagg 3480 aggaaaacat agagaccggt ctctctcgag taactagttg atagagatca agccttaacg 3540 aactaagacc cccgcaccga aaggtccggg ggtttttttt gaccttaaaa acataaccga 3600 ggagcagaca 3610 <210> 6 <211> 3255 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pBAD240 <400> 6 ggcctttctt cggtagaaac cccgagagca ggtatcaaag gatcttcttg agatcctttt 60 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 120 ttgccggatc aagagctacc aactcttttt ccgaggtaac tggcttcagc agagcgcaga 180 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 240 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 300 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 360 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 420 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 480 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 540 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag catcgatttt 600 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgca gaaaggccca 660 cccgaaggtg agccaggtga ttacatttgg gccctcatca gaggttttca ccgtcatcac 720 cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 780 tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 840 ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcata cctgcttaga 900 aaaactcatc gagcatcaag tgaaactgca atttattcat atcaggatta tcaataccat 960 atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 1020 tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 1080 atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 1140 ccggtgagaa tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat 1200 tacgctcgtc atcaaaatca ctcgcaccaa ccaaaccgtt attcattcgt gattgcgcct 1260 gagcgagacg aaatacgcga tcgccgttaa aaggacaatt acaaacagga atcgaatgca 1320 accggcgcag gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt 1380 ctaatacctg gaatgctgtt ttccctggga tcgcagtggt gagtaaccat gcatcatcag 1440 gagtacggat aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagcc 1500 tgaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact 1560 ctggcgcatc gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat 1620 cgcgagccca tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg 1680 agcaagacgt ttcccgttga atatggctca tagctcctga aaatctcgat aactcaaaaa 1740 atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 1800 caagtcaaaa gcctccgcgg gagagtgttc accgacaaac aacagataaa acaaaaggcc 1860 cagtcttccg actgagcctt ttgttttatt tgatgtctgg cagttcccga gacgttatga 1920 caacttgacg gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct 1980 ggccccggtg cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt 2040 gcgaccgacg gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat 2100 acgttggtcc tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga 2160 cagacgcgac ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc 2220 tgccaggtga tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg 2280 gagcgactcg ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc 2340 cagcagctcc gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc 2400 gctgaaatgc ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga 2460 cggccagtta agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata 2520 ccattcgcga gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa 2580 aatatcaccc ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg 2640 aatggtgaga ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag 2700 ataaccgttg gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc 2760 cggcagcagg ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga 2820 agaaaccaat tgtccatatt gcatcagaca ttgccgtctc tgcgtctttt actggctctt 2880 ctcgctaacc aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa 2940 agccatgaca aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga 3000 ttatttgcac ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga 3060 tcctacctga cgctttttat cgcaactctc tactgtttct ccatacccgt ttttttgggc 3120 tagcaggagg taaaaaaaat gtgagaccgg tctcggtcta gataactagt tgatcggtca 3180 gtttcacctg atttacgtaa aaacccgctt cggcgggttt ttgcttttgg aggggcagaa 3240 agatgaatga ctgtc 3255 <210> 7 <211> 5802 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pPRO44 <400> 7 atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60 cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120 agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180 agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240 cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300 accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360 agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420 cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480 cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540 gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600 catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660 acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720 cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780 ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840 acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900 ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960 ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020 gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080 catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140 gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200 gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260 ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320 gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380 attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440 ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500 caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560 tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620 atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680 aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740 attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800 gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860 agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920 gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980 tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040 tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160 tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220 ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280 cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340 atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400 agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460 cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520 gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820 tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060 cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180 acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300 ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660 caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720 caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780 ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840 tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900 actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960 cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020 aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080 cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140 ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200 cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260 aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320 gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380 ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440 attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500 cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560 ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620 ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680 cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740 cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800 ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860 gtgcgtaacg gcaaaagcac cgccggacat caactagtct tccgcttcct cgctcactga 4920 ctcgctacgc tcggtcgttc gactgcggcg agcggtgtca gctcactcaa aagcggtaat 4980 acggttatcc acagaatcag gggataaagc cggaaagaac atgtgagcaa aaagcaaagc 5040 accggaagaa gccaacgccg caggcgtttt tccataggct ccgcccccct gacgagcatc 5100 acaaaaatcg acgctcaagc cagaggtggc gaaacccgac aggactataa agataccagg 5160 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 5220 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgttggt 5280 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 5340 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 5400 acttatcgcc actggcagca gccattggta actgatttag aggactttgt cttgaagtta 5460 tgcacctgtt aaggctaaac tgaaagaaca gattttggtg agtgcggtcc tccaacccac 5520 ttaccttggt tcaaagagtt ggtagctcag cgaaccttga gaaaaccacc gttggtagcg 5580 gtggtttttc tttatttatg agatgatgaa tcaatcggtc tatcaagtca acgaacagct 5640 attccgttga cgtctatttg ctcatgagcc cgaagtggcg agcccgatct tccccatcgg 5700 tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg ccggccacga 5760 tgcgtccggc gtagaggatc tgctcatgtt tgacagctta tc 5802 <210> 8 <211> 5791 <212> DNA <213> Artificial Sequence <220> <223> Expression vector pPRO45 <400> 8 atcgatttag cttttcagac gacgccaaaa ggtcgtacgt gaaataccca aatagttggc 60 cgcagccgtc ttgtcaccat taaacttctc aagcgcttgc tgcggggtca gcaaacgcgg 120 agccggcgtc tttgcgctct cacgcgccag ctccggcagc agcaactgca tgaattgcgg 180 agtcagatcc ggggtcggct caacggacag gaacagcgcc aggcgttcca tcatattacg 240 cagctcgcgg atgttacccg gccagtcata atgcagcagc accgtttcgc tcgcctgcag 300 accctggcgc agtgccgcag agaacggtgc gctcagggct gccagcgaga ctttcaggaa 360 agactccgcc agcggtaaaa tgtcggcgac acgttcacgc aacggcggga gctgcagacg 420 cagaatgctc aggcggtaga acaggtcgcg acgaaaacgg ccctgttgca tatcctcttc 480 cagattgcag tgggtcgcgc taatcacgcg cacgtctacc ggaaccggtt gatgaccacc 540 gacgcgggtc acttctttct cttccagcac acgcagcaga cgggtttgca atggcagcgg 600 catctcaccg atctcgtcca ggaacaaggt gccgccgtgg gcaatttcaa acaaaccagc 660 acggccaccg cgacggctac ccgtgaatgc gccctcttcg tagccaaaca gctcagcttc 720 cagcaggctt tccgcgattg caccgcaatt aactgccaca aacggatgag atttcttacc 780 ctggcgggca tcgtgacggg cgaaatactc acgatggatt gcttgcgcag ccagttcctt 840 acccgtacca gtctcgcctt cgatcagaac agccgcgctg ctacgtgcat acagcagaat 900 ggtctggcga acttgctcca tttgagggct ttggcccagc atatcaccca ggacataacg 960 ggtacgcagc gcattacgcg tcgcatcgtg ggtgttgtgg cgcaggctca ttctggtcat 1020 gtccagggcg tcgctgaacg cctgacgcac cgttgccgcg ctgtagataa agatgcccgt 1080 catgcccgct tcttcggcca agtccgtgat cagacccgca ccaaccacag cctcggtacc 1140 gttcgctttc agttcgttga tctggccacg tgcatcttcc tcggtaatgt agctgcgttg 1200 gtccaggcgc agattaaagg tcttttgaaa cgcgaccagc gcagggatcg tttcctggta 1260 ggtgacaacg ccaatcgagg aggtcagttt gcctgccttc gccagcgcct gcaagacatc 1320 gtaaccgctc ggcttaatca ggatcaccgg cacggacaga cgggatttca ggtaggcacc 1380 attgctaccc gctgcgataa tggcgtcaca acgctcgttg gccagctttt tgcgaatgta 1440 ggtaacggct ttctcgaaac ccagctgaat cggagtgatg ttcgccaggt gatcaaactc 1500 caggctaatg tcgcggaaca actcgaacag acgggtgacg ctaacggtcc aaataactgg 1560 tttatcatcg ttcaaacgcg gtgggtgtgc catggtgaat acctcctgtt aagaaaccga 1620 atattgggtt taaacttgtt tcataattgt tgcaatgaaa cgcggtgaaa cattgcctga 1680 aacgttaact gaaacgcata tttgcggatt agttcatgac tttatctcta acaaattgaa 1740 attaaacatt taattttatt aaggcaattg tggcacaccc cttgctttgt ctttatcaac 1800 gcaaataaca agttgataac aagctagcga attcgagctc ggtacccggg gatcctctag 1860 agtcgacctg caggcatgca agcttggctg ttttggcgga tgagagaaga ttttcagcct 1920 gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 1980 tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 2040 tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 2100 aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 2160 tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 2220 ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 2280 cggatggcct ttttgcgttt ctacaaactc ttttgtttat ttttctaaat acattcaaat 2340 atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 2400 agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 2460 cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 2520 gcagcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact 2580 ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt 2640 ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg 2700 ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta 2760 tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac 2820 tgtcagacca agtttactca tatatacttt agattgattt acgcgccctg tagcggcgca 2880 ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 2940 gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 3000 caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 3060 cccaaaaaac ttgatttggg tgatggttca cgtagtgggc catcgccctg atagacggtt 3120 tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 3180 acaacactca accctatctc gggctattct tttgatttat aagggatttt gccgatttcg 3240 gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 3300 ttaacgttta caatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 3360 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 3420 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 3480 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 3540 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 3600 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 3660 caggcatttg agaagcacac ggtcacactg cttccggtag tcaataaacc ggtaaaccag 3720 caatagacat aagcggctat ttaacgaccc tgccctgaac cgacgaccgg gtcgaatttg 3780 ctttcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3840 tttaagggca ccaataactg ccttaaaaaa attacgcccc gccctgccac tcatcgcagt 3900 actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg gcatgatgaa 3960 cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg cccatggtga 4020 aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg gtgaaactca 4080 cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg aaataggcca 4140 ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc cggaaatcgt 4200 cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa acggtgtaac 4260 aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata cggaattccg 4320 gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac ttgtgcttat 4380 ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg ttataggtac 4440 attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg gatatatcaa 4500 cggtggtata tccagtgatt tttttctcca ttttagcttc cttagctcct gaaaatctcg 4560 ataactcaaa aaatacgccc ggtagtgatc ttatttcatt atggtgaaag ttggaacctc 4620 ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 4680 cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgg 4740 cgcaaagtgc gtcgggtgat gctgccaact tactgattta gtgtatgatg gtgtttttga 4800 ggtgctccag tggcttctgt ttctatcagc tgtccctcct gttcagctac tgacggggtg 4860 gtgcgtaacg gcaaaagcac cgccggacat caactagtgc gctgcggaca catacaaagt 4920 tacccacaga ttccgtggat aagcagggga ctaacatgtg aggcaaaaca gcagggccgc 4980 gccggtggcg tttttccata ggctccgccc tcctgccaga gttcacataa acagacgctt 5040 ttccggtgca tctgtgggag ccgtgaggct caaccatgaa tctgacagta cgggcgaaac 5100 ccgacaggac ttaaagatcc ccaccgtttc cggcgggtcg ctccctcttg cgctctcctg 5160 ttccgaccct gccgtttacc ggatacctgt tccgcctttc tcccttacgg gaagtgtggc 5220 gctttctcat agctcacaca ctggtatctc ggctcggtgt aggtcgttcg ctccaagctg 5280 ggctgtaagc aagaactccc cgttcagccc gactgctgcg ccttatccgg taactgttca 5340 cttgagtcca acccggaaaa gcacggtaaa acgccactgg cagcagccat tggtaactgg 5400 gagttcgcag aggatttgtt tagctaaaca cgcggttgct cttgaagtgt gcgccaaagt 5460 ccggctacac tggaaggaca gatttggttg ctgtgctctg cgaaagccag ttaccacggt 5520 taagcagttc cccaactgac ttaaccttcg atcaaaccac ctccccaggt ggttttttcg 5580 tttacagggc aaaagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcgac 5640 gtctatttgc tcatgagccc gaagtggcga gcccgatctt ccccatcggt gatgtcggcg 5700 atataggcgc cagcaaccgc acctgtggcg ccggtgatgc cggccacgat gcgtccggcg 5760 tagaggatct gctcatgttt gacagcttat c 5791 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> pPRO_REV_SpeI primer <400> 9 gactgactag ttgatgtccg gcggt 25 <210> 10 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> pPRO_FOR_AatII primer <400> 10 tcagctgacg tctatttgct catgagcc 28 <210> 11 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> RSF1030_FOR_SpeI primer <400> 11 gcaaaagcac cgccggacat caactagtct tccgcttcct cgctca 46 <210> 12 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> RSF1030_REV_AatII primer <400> 12 gccacttcgg gctcatgagc aaatagacgt caacggaata gctgttcgtt ga 52 <210> 13 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> CloDF13_FOR_SpeI primer <400> 13 gcaaaagcac cgccggacat caactagtgc gctgcggaca cataca 46 <210> 14 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> CloDF13_REV_AatII primer <400> 14 gccacttcgg gctcatgagc aaatagacgt cgatcaaagg atcttcttga gatcct 56 <210> 15 <211> 5304 <212> DNA <213> Artificial Sequence <220> <223> Dual-promoter vector, pSOL <400> 15 ggcctttctt cggtagaagt cttcccccag aggcaggtat caaaggatct tcttgagatc 60 ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 120 tttgtttgcc ggatcaagag ctaccaactc tttttccgag gtaactggct tcagcagagc 180 gcagatacca aatactgttc ttctagtgta gccgtagtta ggccaccact tcaagaactc 240 tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 300 cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 360 gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 420 actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 480 ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 540 gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcatcg 600 atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcagaaag 660 gcccacccga aggtgagcca ggtgattaca tttgggccct catcagaggt tttcaccgtc 720 atcaccgaaa cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc 780 acagatgtct gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgttaatgt 840 ctggcttctg ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcatacctgc 900 ttagaaaaac tcatcgagca tcaaatgaaa ttgcaattta ttcatatcag gattatcaat 960 accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 1020 taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 1080 tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 1140 tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 1200 gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 1260 cgcctgagcg aggcgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 1320 gtgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 1380 ttcttctaat acctggaacg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 1440 atcaggagta cggataaaat gcttgatggt cggaagtggc ataaattccg tcagccagtt 1500 tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 1560 caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 1620 attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 1680 cctcgacgtt tcccgttgaa tatggctcat agctcctgaa aatctcgata actcaaaaaa 1740 tacgcccggt agtgatctta tttcattatg gtgaaagttg gaacctctta cgtgccgatc 1800 aagaagacgg tcaaaagcct ccggtcggag gccgggagag tgttcaccga caaacaacag 1860 ataaaacaaa aggcccagtc ttccgactga gccttttgtt ttatttgatg tctggcagtt 1920 cccgagacgt tatgacaact tgacggctac atcattcact ttttcttcac aaccggcacg 1980 gaactcgctc gggctggccc cggtgcattt tttaaatacc cgcgagaaat agagttgatc 2040 gtcaaaacca acattgcgac cgacggtggc gataggcatc cgggtggtgc tcaaaagcag 2100 cttcgcctgg ctgatacgtt ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg 2160 gcggaaaaga tgtgacagac gcgacggcga caagcaaaca tgctgtgcga cgctggcgat 2220 atcaaaattg ctgtctgcca ggtgatcgct gatgtactga caagcctcgc gtacccgatt 2280 atccatcggt ggatggagcg actcgttaat cgcttccatg cgccgcagta acaattgctc 2340 aagcagattt atcgccagca gctccgaata gcgcccttcc ccttgcccgg cgttaatgat 2400 ttgcccaaac aggtcgctga aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt 2460 attggcaaat attgacggcc agttaagcca ttcatgccag taggcgcgcg gacgaaagta 2520 aacccactgg tgataccatt cgcgagcctc cggatgacga ccgtagtgat gaatctctcc 2580 tggcgggaac agcaaaatat cacccggtcg gcaaacaaat tctcgtccct gatttttcac 2640 caccccctga ccgcgaatgg tgagattgag aatataacct ttcattccca gcggtcggtc 2700 gataaaaaaa tcgagataac cgttggcctc aatcggcgtt aaacccgcca ccagatgggc 2760 attaaacgag tatcccggca gcaggggatc attttgcgct tcagccatac ttttcatact 2820 cccgccattc agagaagaaa ccaattgtcc atattgcatc agacattgcc gtctctgcgt 2880 cttttactgg ctcttctcgc taaccaaacc ggtaaccccg cttattaaaa gcattctgta 2940 acaaagcggg accaaagcca tgacaaaaac gcgtaacaaa agtgtctata atcacggcag 3000 aaaagtccac attgattatt tgcacggcgt cacactttgc tatgccatag catttttatc 3060 cataagatta gcggatccta cctgacgctt tttatcgcaa ctctctactg tttctccata 3120 cccgtttttt tgggctagca ggaggtaaaa aaaatgtgag accggtctcg gtctagatcg 3180 gtcagtttca cctgatttac gtaaaaaccc gcttcggcgg gtttttgctt ttggaggggc 3240 agaaagatga atgactgtct ctcctgttag tgagggttaa tgcccggaac gaagaaaggc 3300 ccacccgtga aggtgagcca gtgagttggt tacattttct cttgagggtt tagcttttca 3360 gacgacgcca aaaggtcgta cgtgaaatac ccaaatagtt ggccgcagcc gtcttgtcac 3420 cattaaactt ctcaagcgct tgctgcgggg tcagcaaacg cggagccggc gtctttgcgc 3480 tctcacgcgc cagctccggc agcagcaact gcatgaattg cggagtcaga tccggggtcg 3540 gctcaacgga caggaacagc gccaggcgtt ccatcatatt acgcagctcg cggatgttac 3600 ccggccagtc ataatgcagc agcaccgttt cgctcgcctg cagaccctgg cgcagtgccg 3660 cagagaacgg tgcgctcagg gctgccagcg agactttcag gaaagactcc gccagcggta 3720 aaatgtcggc gacacgttca cgcaacggcg ggagctgcag acgcagaatg ctcaggcggt 3780 agaacaggtc gcgacgaaaa cggccctgtt gcatatcctc ttccagattg cagtgggtcg 3840 cgctaatcac gcgcacgtct accggaaccg gttgatgacc accgacgcgg gtcacttctt 3900 tctcttccag cacacgcagc agacgggttt gcaatggcag cggcatctca ccgatctcgt 3960 ccaggaacaa ggtgccgccg tgggcaattt caaacaaacc agcacggcca ccgcgacggc 4020 tacccgtgaa tgcgccctct tcgtagccaa acagctcagc ttccagcagg ctttccgcga 4080 ttgcaccgca attaactgcc acaaacggat gagatttctt accctggcgg gcatcgtgac 4140 gggcgaaata ctcacgatgg attgcttgcg cagccagttc cttacccgta ccagtctcgc 4200 cttcgatcag aacagccgcg ctgctacgtg catacagcag aatggtctgg cgaacttgct 4260 ccatttgagg gctttggccc agcatatcac ccaggacata acgggtacgc agcgcattac 4320 gcgtcgcatc gtgggtgttg tggcgcaggc tcattctggt catgtccagg gcgtcgctga 4380 acgcctgacg caccgttgcc gcgctgtaga taaagatgcc cgtcatgccc gcttcttcgg 4440 ccaagtccgt gatcagaccc gcaccaacca cagcctcggt accgttcgct ttcagttcgt 4500 tgatctggcc acgtgcatct tcctcggtaa tgtagctgcg ttggtccagg cgcagattaa 4560 aggtcttttg aaacgcgacc agcgcaggga tcgtttcctg gtaggtgaca acgccaatcg 4620 aggaggtcag tttgcctgcc ttcgccagcg cctgcaagac atcgtaaccg ctcggcttaa 4680 tcaggatcac cggcacggac agacgggatt tcaggtaggc accattgcta cccgctgcga 4740 taatggcgtc acaacgctcg ttggccagct ttttgcgaat gtaggtaacg gctttctcga 4800 aacccagctg aatcggagtg atgttcgcca ggtgatcaaa ctccaggcta atgtcgcgga 4860 acaactcgaa cagacgggtg acgctaacgg tccaaataac tggtttatca tcgttcaaac 4920 gcggtgggtg tgccatggtg aatacctcct gttaagaaac cgaatattgg gtttaaactt 4980 gtttcataat tgttgcaatg aaacgcggtg aaacattgcc tgaaacgtta actgaaacgc 5040 atatttgcgg attagttcat gactttatct ctaacaaatt gaaattaaac atttaatttt 5100 attaaggcaa ttgtggcaca ccccttgctt tgtctttatc aacgcaaata acaagttgat 5160 aacaaaagct taggaggaaa acatagagac cggtctctct cgagtaacta gttgatagag 5220 atcaagcctt aacgaactaa gacccccgca ccgaaaggtc cgggggtttt ttttgacctt 5280 aaaaacataa ccgaggagca gaca 5304 <210> 16 <211> 451 <212> PRT <213> Artificial Sequence <220> <223> Infliximab chimeric (murine variable doman, human constant domain) heavy chain <400> 16 Met Glu Val Lys Leu Glu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly 1 5 10 15 Gly Ser Met Lys Leu Ser Cys Val Ala Ser Gly Phe Ile Phe Ser Asn 20 25 30 His Trp Met Asn Trp Val Arg Gln Ser Pro Glu Lys Gly Leu Glu Trp 35 40 45 Val Ala Glu Ile Arg Ser Lys Ser Ile Asn Ser Ala Thr His Tyr Ala 50 55 60 Glu Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asp Ser Lys Ser 65 70 75 80 Ala Val Tyr Leu Gln Met Thr Asp Leu Arg Thr Glu Asp Thr Gly Val 85 90 95 Tyr Tyr Cys Ser Arg Asn Tyr Tyr Gly Ser Thr Tyr Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser 115 120 125 Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala 130 135 140 Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val 145 150 155 160 Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala 165 170 175 Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val 180 185 190 Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His 195 200 205 Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys 210 215 220 Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly 225 230 235 240 Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met 245 250 255 Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His 260 265 270 Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val 275 280 285 His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr 290 295 300 Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly 305 310 315 320 Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile 325 330 335 Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val 340 345 350 Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser 355 360 365 Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu 370 375 380 Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro 385 390 395 400 Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val 405 410 415 Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met 420 425 430 His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser 435 440 445 Pro Gly Lys 450 <210> 17 <211> 215 <212> PRT <213> Artificial Sequence <220> <223> Infliximab chimeric (murine variable doman, human constant domain) light chain <400> 17 Met Asp Ile Leu Leu Thr Gln Ser Pro Ala Ile Leu Ser Val Ser Pro 1 5 10 15 Gly Glu Arg Val Ser Phe Ser Cys Arg Ala Ser Gln Phe Val Gly Ser 20 25 30 Ser Ile His Trp Tyr Gln Gln Arg Thr Asn Gly Ser Pro Arg Leu Leu 35 40 45 Ile Lys Tyr Ala Ser Glu Ser Met Ser Gly Ile Pro Ser Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Ser Ile Asn Thr Val Glu 65 70 75 80 Ser Glu Asp Ile Ala Asp Tyr Tyr Cys Gln Gln Ser His Ser Trp Pro 85 90 95 Phe Thr Phe Gly Ser Gly Thr Asn Leu Glu Val Lys Arg Thr Val Ala 100 105 110 Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser 115 120 125 Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu 130 135 140 Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser 145 150 155 160 Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu 165 170 175 Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val 180 185 190 Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys 195 200 205 Ser Phe Asn Arg Gly Glu Cys 210 215 <210> 18 <211> 4594 <212> DNA <213> Artificial Sequence <220> <223> pBAD240-Infliximab_HC expression construct <400> 18 ggcctttctt cggtagaaac cccgagagca ggtatcaaag gatcttcttg agatcctttt 60 tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt 120 ttgccggatc aagagctacc aactcttttt ccgaggtaac tggcttcagc agagcgcaga 180 taccaaatac tgttcttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 240 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 300 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 360 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 420 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 480 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 540 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag catcgatttt 600 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgca gaaaggccca 660 cccgaaggtg agccaggtga ttacatttgg gccctcatca gaggttttca ccgtcatcac 720 cgaaacgcgc gaggcagctg cggtaaagct catcagcgtg gtcgtgaagc gattcacaga 780 tgtctgcctg ttcatccgcg tccagctcgt tgagtttctc cagaagcgtt aatgtctggc 840 ttctgataaa gcgggccatg ttaagggcgg ttttttcctg tttggtcata cctgcttaga 900 aaaactcatc gagcatcaag tgaaactgca atttattcat atcaggatta tcaataccat 960 atttttgaaa aagccgtttc tgtaatgaag gagaaaactc accgaggcag ttccatagga 1020 tggcaagatc ctggtatcgg tctgcgattc cgactcgtcc aacatcaata caacctatta 1080 atttcccctc gtcaaaaata aggttatcaa gtgagaaatc accatgagtg acgactgaat 1140 ccggtgagaa tggcaaaagc ttatgcattt ctttccagac ttgttcaaca ggccagccat 1200 tacgctcgtc atcaaaatca ctcgcaccaa ccaaaccgtt attcattcgt gattgcgcct 1260 gagcgagacg aaatacgcga tcgccgttaa aaggacaatt acaaacagga atcgaatgca 1320 accggcgcag gaacactgcc agcgcatcaa caatattttc acctgaatca ggatattctt 1380 ctaatacctg gaatgctgtt ttccctggga tcgcagtggt gagtaaccat gcatcatcag 1440 gagtacggat aaaatgcttg atggtcggaa gaggcataaa ttccgtcagc cagtttagcc 1500 tgaccatctc atctgtaaca tcattggcaa cgctaccttt gccatgtttc agaaacaact 1560 ctggcgcatc gggcttccca tacaatcgat agattgtcgc acctgattgc ccgacattat 1620 cgcgagccca tttataccca tataaatcag catccatgtt ggaatttaat cgcggcctcg 1680 agcaagacgt ttcccgttga atatggctca tagctcctga aaatctcgat aactcaaaaa 1740 atacgcccgg tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat 1800 caagtcaaaa gcctccgcgg gagagtgttc accgacaaac aacagataaa acaaaaggcc 1860 cagtcttccg actgagcctt ttgttttatt tgatgtctgg cagttcccga gacgttatga 1920 caacttgacg gctacatcat tcactttttc ttcacaaccg gcacggaact cgctcgggct 1980 ggccccggtg cattttttaa atacccgcga gaaatagagt tgatcgtcaa aaccaacatt 2040 gcgaccgacg gtggcgatag gcatccgggt ggtgctcaaa agcagcttcg cctggctgat 2100 acgttggtcc tcgcgccagc ttaagacgct aatccctaac tgctggcgga aaagatgtga 2160 cagacgcgac ggcgacaagc aaacatgctg tgcgacgctg gcgatatcaa aattgctgtc 2220 tgccaggtga tcgctgatgt actgacaagc ctcgcgtacc cgattatcca tcggtggatg 2280 gagcgactcg ttaatcgctt ccatgcgccg cagtaacaat tgctcaagca gatttatcgc 2340 cagcagctcc gaatagcgcc cttccccttg cccggcgtta atgatttgcc caaacaggtc 2400 gctgaaatgc ggctggtgcg cttcatccgg gcgaaagaac cccgtattgg caaatattga 2460 cggccagtta agccattcat gccagtaggc gcgcggacga aagtaaaccc actggtgata 2520 ccattcgcga gcctccggat gacgaccgta gtgatgaatc tctcctggcg ggaacagcaa 2580 aatatcaccc ggtcggcaaa caaattctcg tccctgattt ttcaccaccc cctgaccgcg 2640 aatggtgaga ttgagaatat aacctttcat tcccagcggt cggtcgataa aaaaatcgag 2700 ataaccgttg gcctcaatcg gcgttaaacc cgccaccaga tgggcattaa acgagtatcc 2760 cggcagcagg ggatcatttt gcgcttcagc catacttttc atactcccgc cattcagaga 2820 agaaaccaat tgtccatatt gcatcagaca ttgccgtctc tgcgtctttt actggctctt 2880 ctcgctaacc aaaccggtaa ccccgcttat taaaagcatt ctgtaacaaa gcgggaccaa 2940 agccatgaca aaaacgcgta acaaaagtgt ctataatcac ggcagaaaag tccacattga 3000 ttatttgcac ggcgtcacac tttgctatgc catagcattt ttatccataa gattagcgga 3060 tcctacctga cgctttttat cgcaactctc tactgtttct ccatacccgt ttttttgggc 3120 tagcaggagg taaaaaaaat ggaagttaaa ttagaagaaa gcggcggcgg tttggtgcaa 3180 cctggcggtt cgatgaagtt gagctgcgtc gcaagcggtt tcattttttc caaccactgg 3240 atgaactggg tgcgccagtc tccggaaaag ggtctggaat gggttgcgga gatccgtagc 3300 aagagcatca atagcgcgac gcattatgcc gagagcgtca aaggccgctt caccatttct 3360 cgtgacgaca gcaaaagcgc tgtgtatctg caaatgaccg acttgcgtac cgaggacacg 3420 ggcgtgtatt actgctcccg caactattac ggttccacct acgactactg gggccagggt 3480 acgaccctga ccgttagctc ggcgagcacc aagggtccga gcgtctttcc gctggcaccg 3540 agcagcaaaa gcaccagcgg tggtaccgcc gcactgggtt gcctggtgaa agattacttc 3600 ccggaaccgg ttactgtgag ctggaacagc ggcgcgctga cctctggcgt gcacacgttc 3660 ccggcagttc tgcaaagcag cggcctgtac tccctgtcca gcgtcgtcac cgtgccgagc 3720 agcagcctgg gtacgcaaac ctatatttgt aacgtcaatc acaagccgag caacaccaaa 3780 gtggacaaaa aagtcgaacc gaaaagctgc gataaaaccc atacttgtcc gccgtgcccg 3840 gccccggagc ttctgggtgg tccaagcgtt tttctgttcc cgccgaagcc gaaagacacc 3900 ctgatgatca gccgcacccc tgaggtgacc tgtgtggtag ttgacgtttc ccacgaagat 3960 ccagaggtca agtttaactg gtatgtggat ggcgtcgaag ttcacaatgc aaagaccaag 4020 ccgcgtgaag aacagtataa ctctacgtac cgtgtcgtga gcgttctgac tgttctgcac 4080 caggattggc tgaacggcaa agagtacaag tgcaaggtta gcaataaagc gctgccggct 4140 ccgatcgaga aaaccatttc taaggctaaa ggtcagccgc gtgagccgca agtttacacc 4200 ctgccaccga gccgtgatga gctgacgaaa aatcaagtat ctctgacctg tctggtcaaa 4260 ggtttttacc caagcgatat cgcggttgaa tgggagagca acggccagcc ggagaataat 4320 tacaagacga cgcctccggt gctggatagc gatggttcgt ttttcctgta cagcaagttg 4380 acggttgata aaagccgttg gcaacagggt aacgtgttct cctgttccgt catgcatgaa 4440 gcgctgcaca accattatac tcagaaaagc ctcagcctgt ccccgggtaa ataagtctag 4500 ataactagtt gatcggtcag tttcacctga tttacgtaaa aacccgcttc ggcgggtttt 4560 tgcttttgga ggggcagaaa gatgaatgac tgtc 4594 <210> 19 <211> 4332 <212> DNA <213> Artificial Sequence <220> <223> pPRO430-Infliximab_LC expression construct <400> 19 ccccagaggc aggtctagcg gagtgtatac tggcttacta tgttggcact gatgagggtg 60 tcagtgaagt gcttcatgtg gcaggagaaa aaaggctgca ccggtgcgtc agcagaatat 120 gtgatacagg atatattccg cttcctcgct cactgactcg ctacgctcgg tcgttcgact 180 gcggcgagcg gaaatggctt acgaacgggg cggagatttc ctggaagatg ccaggaagat 240 acttaacagg gaagtgagag ggccgcggca aagccgtttt tccataggct ccgcccccct 300 gacaagcatc acgaaatctg acgctcaaat cagtggtggc gaaacccgac aggactataa 360 agataccagg cgtttccccc tggcggctcc ctcgtgcgct ctcctgttcc tgcctttcgg 420 tttaccggtg tcattccgct gttatggccg cgtttgtctc attccacgcc tgacactcag 480 ttccgggtag gcagttcgct ccaagctgga ctgtatgcac gaaccccccg ttcagtccga 540 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggaaagac atgcaaaagc 600 accactggca gcagccactg gtaattgatt tagaggagtt agtcttgaag tcatgcgccg 660 gttaaggcta aactgaaagg acaagttttg gtgactgcgc tcctccaagc cagttacctc 720 ggttcaaaga gttggtagct cagagaacct tcgaaaaacc gccctgcaag gcggtttttt 780 cgttttcaga gcaagagatt acgcgcagac caaaacgatc tcaagaagat catcttatta 840 aacctgcctc taaaaacttt tattacgccc cgccctgcca ctcatcgcag tactgttgta 900 attcattaag cattctgccg acatggaagc catcacagac ggcatgatga acctgaatcg 960 ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatagtg aaaacggggg 1020 cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 1080 tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 1140 cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 1200 cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 1260 cactatccca tatcaccagc tcaccgtctt tcattgccat acggaactcc ggatgagcat 1320 tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 1380 cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 1440 ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 1500 atccagtgat ttttttctcc atcatattct tcctttttca atattattga agcatttatc 1560 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 1620 gggtcagtgt tacaaccaat taaccaattc tgatctcctg ttagtgaggg ttaatgcccg 1680 gaacgaagaa aggcccaccc gtgaaggtga gccagtgagt tggttacatt ttctcttgag 1740 ggtttagctt ttcagacgac gccaaaaggt cgtacgtgaa atacccaaat agttggccgc 1800 agccgtcttg tcaccattaa acttctcaag cgcttgctgc ggggtcagca aacgcggagc 1860 cggcgtcttt gcgctctcac gcgccagctc cggcagcagc aactgcatga attgcggagt 1920 cagatccggg gtcggctcaa cggacaggaa cagcgccagg cgttccatca tattacgcag 1980 ctcgcggatg ttacccggcc agtcataatg cagcagcacc gtttcgctcg cctgcagacc 2040 ctggcgcagt gccgcagaga acggtgcgct cagggctgcc agcgagactt tcaggaaaga 2100 ctccgccagc ggtaaaatgt cggcgacacg ttcacgcaac ggcgggagct gcagacgcag 2160 aatgctcagg cggtagaaca ggtcgcgacg aaaacggccc tgttgcatat cctcttccag 2220 attgcagtgg gtcgcgctaa tcacgcgcac gtctaccgga accggttgat gaccaccgac 2280 gcgggtcact tctttctctt ccagcacacg cagcagacgg gtttgcaatg gcagcggcat 2340 ctcaccgatc tcgtccagga acaaggtgcc gccgtgggca atttcaaaca aaccagcacg 2400 gccaccgcga cggctacccg tgaatgcgcc ctcttcgtag ccaaacagct cagcttccag 2460 caggctttcc gcgattgcac cgcaattaac tgccacaaac ggatgagatt tcttaccctg 2520 gcgggcatcg tgacgggcga aatactcacg atggattgct tgcgcagcca gttccttacc 2580 cgtaccagtc tcgccttcga tcagaacagc cgcgctgcta cgtgcataca gcagaatggt 2640 ctggcgaact tgctccattt gagggctttg gcccagcata tcacccagga cataacgggt 2700 acgcagcgca ttacgcgtcg catcgtgggt gttgtggcgc aggctcattc tggtcatgtc 2760 cagggcgtcg ctgaacgcct gacgcaccgt tgccgcgctg tagataaaga tgcccgtcat 2820 gcccgcttct tcggccaagt ccgtgatcag acccgcacca accacagcct cggtaccgtt 2880 cgctttcagt tcgttgatct ggccacgtgc atcttcctcg gtaatgtagc tgcgttggtc 2940 caggcgcaga ttaaaggtct tttgaaacgc gaccagcgca gggatcgttt cctggtaggt 3000 gacaacgcca atcgaggagg tcagtttgcc tgccttcgcc agcgcctgca agacatcgta 3060 accgctcggc ttaatcagga tcaccggcac ggacagacgg gatttcaggt aggcaccatt 3120 gctacccgct gcgataatgg cgtcacaacg ctcgttggcc agctttttgc gaatgtaggt 3180 aacggctttc tcgaaaccca gctgaatcgg agtgatgttc gccaggtgat caaactccag 3240 gctaatgtcg cggaacaact cgaacagacg ggtgacgcta acggtccaaa taactggttt 3300 atcatcgttc aaacgcggtg ggtgtgccat ggtgaatacc tcctgttaag aaaccgaata 3360 ttgggtttaa acttgtttca taattgttgc aatgaaacgc ggtgaaacat tgcctgaaac 3420 gttaactgaa acgcatattt gcggattagt tcatgacttt atctctaaca aattgaaatt 3480 aaacatttaa ttttattaag gcaattgtgg cacacccctt gctttgtctt tatcaacgca 3540 aataacaagt tgataacaaa agcttaggag gaaaacatat ggatatttta ttgacccaaa 3600 gcccagccat tctgtctgtt tccccgggcg agcgtgtttc ttttagctgc cgtgcaagcc 3660 agttcgttgg ttcatcgatc cactggtacc aacagcgtac gaacggtagc ccgcgtctgc 3720 tgattaagta cgcgagcgaa agcatgagcg gtatcccgag ccgcttcagc ggtagcggca 3780 gcggcacgga cttcacgctg agcatcaata cggttgaaag cgaggacatc gcggactatt 3840 actgccagca gagccattct tggccgttta cctttggcag cggtaccaat ctggaagtta 3900 aacgcaccgt ggcagcgccg tccgttttca tttttcctcc gtccgatgag caactgaaat 3960 cgggcacggc cagcgtcgtg tgtctgttga acaacttcta cccgcgtgag gcgaaggtgc 4020 agtggaaagt ggacaacgcg ctgcaatccg gtaatagcca ggaaagcgtc accgaacaag 4080 atagcaagga cagcacctac agcctgagct ctactctgac cctgagcaag gctgattatg 4140 agaaacacaa ggtctatgca tgtgaggtga cccatcaggg tctgtccagc ccggtcacca 4200 aaagcttcaa tcgcggtgag tgctaactcg agtaactagt tgatagagat caagccttaa 4260 cgaactaaga cccccgcacc gaaaggtccg ggggtttttt ttgaccttaa aaacataacc 4320 gaggagcaga ca 4332 <210> 20 <211> 7288 <212> DNA <213> Artificial Sequence <220> <223> pSOL-Infliximab expression construct <400> 20 agctcctgaa aatctcgata actcaaaaaa tacgcccggt agtgatctta tttcattatg 60 gtgaaagttg gaacctctta cgtgccgatc aagaagacgg tcaaaagcct ccggtcggag 120 gccgggagag tgttcaccga caaacaacag ataaaacaaa aggcccagtc ttccgactga 180 gccttttgtt ttatttgatg tctggcagtt cccgagacgt tatgacaact tgacggctac 240 atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc cggtgcattt 300 tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac cgacggtggc 360 gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt ggtcctcgcg 420 ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac gcgacggcga 480 caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca ggtgatcgct 540 gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg actcgttaat 600 cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca gctccgaata 660 gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga aatgcggctg 720 gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc agttaagcca 780 ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt cgcgagcctc 840 cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat cacccggtcg 900 gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg tgagattgag 960 aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac cgttggcctc 1020 aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca gcaggggatc 1080 attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa ccaattgtcc 1140 atattgcatc agacattgcc gtctctgcgt cttttactgg ctcttctcgc taaccaaacc 1200 ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca tgacaaaaac 1260 gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt tgcacggcgt 1320 cacactttgc tatgccatag catttttatc cataagatta gcggatccta cctgacgctt 1380 tttatcgcaa ctctctactg tttctccata cccgtttttt tgggctagca ggaggtaaaa 1440 aaaatggaag ttaaattaga agaaagcggc ggcggtttgg tgcaacctgg cggttcgatg 1500 aagttgagct gcgtcgcaag cggtttcatt ttttccaacc actggatgaa ctgggtgcgc 1560 cagtctccgg aaaagggtct ggaatgggtt gcggagatcc gtagcaagag catcaatagc 1620 gcgacgcatt atgccgagag cgtcaaaggc cgcttcacca tttctcgtga cgacagcaaa 1680 agcgctgtgt atctgcaaat gaccgacttg cgtaccgagg acacgggcgt gtattactgc 1740 tcccgcaact attacggttc cacctacgac tactggggcc agggtacgac cctgaccgtt 1800 agctcggcga gcaccaaggg tccgagcgtc tttccgctgg caccgagcag caaaagcacc 1860 agcggtggta ccgccgcact gggttgcctg gtgaaagatt acttcccgga accggttact 1920 gtgagctgga acagcggcgc gctgacctct ggcgtgcaca cgttcccggc agttctgcaa 1980 agcagcggcc tgtactccct gtccagcgtc gtcaccgtgc cgagcagcag cctgggtacg 2040 caaacctata tttgtaacgt caatcacaag ccgagcaaca ccaaagtgga caaaaaagtc 2100 gaaccgaaaa gctgcgataa aacccatact tgtccgccgt gcccggcccc ggagcttctg 2160 ggtggtccaa gcgtttttct gttcccgccg aagccgaaag acaccctgat gatcagccgc 2220 acccctgagg tgacctgtgt ggtagttgac gtttcccacg aagatccaga ggtcaagttt 2280 aactggtatg tggatggcgt cgaagttcac aatgcaaaga ccaagccgcg tgaagaacag 2340 tataactcta cgtaccgtgt cgtgagcgtt ctgactgttc tgcaccagga ttggctgaac 2400 ggcaaagagt acaagtgcaa ggttagcaat aaagcgctgc cggctccgat cgagaaaacc 2460 atttctaagg ctaaaggtca gccgcgtgag ccgcaagttt acaccctgcc accgagccgt 2520 gatgagctga cgaaaaatca agtatctctg acctgtctgg tcaaaggttt ttacccaagc 2580 gatatcgcgg ttgaatggga gagcaacggc cagccggaga ataattacaa gacgacgcct 2640 ccggtgctgg atagcgatgg ttcgtttttc ctgtacagca agttgacggt tgataaaagc 2700 cgttggcaac agggtaacgt gttctcctgt tccgtcatgc atgaagcgct gcacaaccat 2760 tatactcaga aaagcctcag cctgtccccg ggtaaataag tctagataac tagttgatcg 2820 gtcagtttca cctgatttac gtaaaaaccc gcttcggcgg gtttttgctt ttggaggggc 2880 agaaagatga atgactgtct ctcctgttag tgagggttaa tgcccggaac gaagaaaggc 2940 ccacccgtga aggtgagcca gtgagttggt tacattttct cttgagggtt tagcttttca 3000 gacgacgcca aaaggtcgta cgtgaaatac ccaaatagtt ggccgcagcc gtcttgtcac 3060 cattaaactt ctcaagcgct tgctgcgggg tcagcaaacg cggagccggc gtctttgcgc 3120 tctcacgcgc cagctccggc agcagcaact gcatgaattg cggagtcaga tccggggtcg 3180 gctcaacgga caggaacagc gccaggcgtt ccatcatatt acgcagctcg cggatgttac 3240 ccggccagtc ataatgcagc agcaccgttt cgctcgcctg cagaccctgg cgcagtgccg 3300 cagagaacgg tgcgctcagg gctgccagcg agactttcag gaaagactcc gccagcggta 3360 aaatgtcggc gacacgttca cgcaacggcg ggagctgcag acgcagaatg ctcaggcggt 3420 agaacaggtc gcgacgaaaa cggccctgtt gcatatcctc ttccagattg cagtgggtcg 3480 cgctaatcac gcgcacgtct accggaaccg gttgatgacc accgacgcgg gtcacttctt 3540 tctcttccag cacacgcagc agacgggttt gcaatggcag cggcatctca ccgatctcgt 3600 ccaggaacaa ggtgccgccg tgggcaattt caaacaaacc agcacggcca ccgcgacggc 3660 tacccgtgaa tgcgccctct tcgtagccaa acagctcagc ttccagcagg ctttccgcga 3720 ttgcaccgca attaactgcc acaaacggat gagatttctt accctggcgg gcatcgtgac 3780 gggcgaaata ctcacgatgg attgcttgcg cagccagttc cttacccgta ccagtctcgc 3840 cttcgatcag aacagccgcg ctgctacgtg catacagcag aatggtctgg cgaacttgct 3900 ccatttgagg gctttggccc agcatatcac ccaggacata acgggtacgc agcgcattac 3960 gcgtcgcatc gtgggtgttg tggcgcaggc tcattctggt catgtccagg gcgtcgctga 4020 acgcctgacg caccgttgcc gcgctgtaga taaagatgcc cgtcatgccc gcttcttcgg 4080 ccaagtccgt gatcagaccc gcaccaacca cagcctcggt accgttcgct ttcagttcgt 4140 tgatctggcc acgtgcatct tcctcggtaa tgtagctgcg ttggtccagg cgcagattaa 4200 aggtcttttg aaacgcgacc agcgcaggga tcgtttcctg gtaggtgaca acgccaatcg 4260 aggaggtcag tttgcctgcc ttcgccagcg cctgcaagac atcgtaaccg ctcggcttaa 4320 tcaggatcac cggcacggac agacgggatt tcaggtaggc accattgcta cccgctgcga 4380 taatggcgtc acaacgctcg ttggccagct ttttgcgaat gtaggtaacg gctttctcga 4440 aacccagctg aatcggagtg atgttcgcca ggtgatcaaa ctccaggcta atgtcgcgga 4500 acaactcgaa cagacgggtg acgctaacgg tccaaataac tggtttatca tcgttcaaac 4560 gcggtgggtg tgccatggtg aatacctcct gttaagaaac cgaatattgg gtttaaactt 4620 gtttcataat tgttgcaatg aaacgcggtg aaacattgcc tgaaacgtta actgaaacgc 4680 atatttgcgg attagttcat gactttatct ctaacaaatt gaaattaaac atttaatttt 4740 attaaggcaa ttgtggcaca ccccttgctt tgtctttatc aacgcaaata acaagttgat 4800 aacaaaagct taggaggaaa acatatggat attttattga cccaaagccc agccattctg 4860 tctgtttccc cgggcgagcg tgtttctttt agctgccgtg caagccagtt cgttggttca 4920 tcgatccact ggtaccaaca gcgtacgaac ggtagcccgc gtctgctgat taagtacgcg 4980 agcgaaagca tgagcggtat cccgagccgc ttcagcggta gcggcagcgg cacggacttc 5040 acgctgagca tcaatacggt tgaaagcgag gacatcgcgg actattactg ccagcagagc 5100 cattcttggc cgtttacctt tggcagcggt accaatctgg aagttaaacg caccgtggca 5160 gcgccgtccg ttttcatttt tcctccgtcc gatgagcaac tgaaatcggg cacggccagc 5220 gtcgtgtgtc tgttgaacaa cttctacccg cgtgaggcga aggtgcagtg gaaagtggac 5280 aacgcgctgc aatccggtaa tagccaggaa agcgtcaccg aacaagatag caaggacagc 5340 acctacagcc tgagctctac tctgaccctg agcaaggctg attatgagaa acacaaggtc 5400 tatgcatgtg aggtgaccca tcagggtctg tccagcccgg tcaccaaaag cttcaatcgc 5460 ggtgagtgct aactcgagta actagttgat agagatcaag ccttaacgaa ctaagacccc 5520 cgcaccgaaa ggtccggggg ttttttttga ccttaaaaac ataaccgagg agcagacagg 5580 cctttcttcg gtagaagtct tcccccagag gcaggtatca aaggatcttc ttgagatcct 5640 ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 5700 tgtttgccgg atcaagagct accaactctt tttccgaggt aactggcttc agcagagcgc 5760 agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg 5820 tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg 5880 ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt 5940 cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac 6000 tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg 6060 acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg 6120 gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcatcgat 6180 ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcagaaaggc 6240 ccacccgaag gtgagccagg tgattacatt tgggccctca tcagaggttt tcaccgtcat 6300 caccgaaacg cgcgaggcag ctgcggtaaa gctcatcagc gtggtcgtga agcgattcac 6360 agatgtctgc ctgttcatcc gcgtccagct cgttgagttt ctccagaagc gttaatgtct 6420 ggcttctgat aaagcgggcc atgttaaggg cggttttttc ctgtttggtc atacctgctt 6480 agaaaaactc atcgagcatc aaatgaaatt gcaatttatt catatcagga ttatcaatac 6540 catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 6600 ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 6660 ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 6720 aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 6780 cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 6840 cctgagcgag gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt 6900 gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 6960 cttctaatac ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 7020 caggagtacg gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta 7080 gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 7140 actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 7200 tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 7260 tcgacgtttc ccgttgaata tggctcat 7288

Claims

2종 이상의 유도성 프로모터를 포함하는 발현 작제물(expression construct)로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 적어도 3000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 적어도 3250개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(e) 서열번호 15의 적어도 3500개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(f) 서열번호 15의 적어도 4000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(g) 서열번호 15의 적어도 5000개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물.
2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(c) (a) 및 (b) 둘 다를 포함하는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제1항 또는 제2항에 있어서, 상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 425개의 인접한 염기와 적어도 87% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 400개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 2818 내지 3259의 적어도 350개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 350개의 인접한 염기와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열; 및
(e) 서열번호 15의 뉴클레오타이드 4937 내지 5304의 적어도 300개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제3항에 있어서, 상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 87% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 2818 내지 3259와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열;
(d) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(e) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열; 및
(f) 서열번호 15의 뉴클레오타이드 4937 내지 5304와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 3140 내지 3151 및 서열번호 15의 뉴클레오타이드 5172 내지 5185로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304로 이루어진 군으로부터 선택된 적어도 하나의 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제6항에 있어서, 상기 발현 작제물은 서열번호 15의 뉴클레오타이드 2818 내지 3259 및 서열번호 15의 뉴클레오타이드 4937 내지 5304를 포함하는, 발현 작제물.
2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3000개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열;
(c) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열; 및
(d) 서열번호 15의 뉴클레오타이드 1833 내지 5304의 적어도 3250개의 인접한 염기와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물.
2종 이상의 유도성 프로모터를 포함하는 발현 작제물로서,
적어도 1종의 유도성 프로모터가 프로피오네이트 유도성 프로모터이고 적어도 1종의 다른 유도성 프로모터가 L-아라비노스 유도성 프로모터이며,
상기 발현 작제물은,
(a) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 80% 동일성을 갖는 뉴클레오타이드 서열;
(b) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 90% 동일성을 갖는 뉴클레오타이드 서열; 및
(c) 서열번호 15의 뉴클레오타이드 1833 내지 5304와 적어도 95% 동일성을 갖는 뉴클레오타이드 서열
로 이루어진 군으로부터 선택된 뉴클레오타이드 서열을 포함하는, 발현 작제물.
제8항 또는 제9항에 있어서, 상기 발현 작제물은 서열번호 15를 포함하는, 발현 작제물.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 발현 작제물은 염색체외(extrachromosomal)에 존재하는, 발현 작제물.
제1항 내지 제11항 중 어느 한 항에 있어서, 람노스 유도성 프로모터, 자일로스 유도성 프로모터, 락토스 유도성 프로모터, 및 포스페이트 고갈에 의한 유도성 프로모터로 이루어진 군으로부터 선택된 적어도 1종의 유도성 프로모터를 더 포함하는, 발현 작제물.
제12항에 있어서, 적어도 1종의 유도성 프로모터는 상기 rhaSR 프로모터, 상기 xlyA 프로모터, 상기 lacZYA 프로모터, 및 상기 phoA 프로모터로 이루어진 군으로부터 선택되는, 발현 작제물.
제1항 내지 제13항 중 어느 한 항에 있어서, 유도성 프로모터에 결합하는 전사 조절인자를 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함하는, 발현 작제물.
제14항에 있어서, 상기 전사 조절인자는 AraC, PrpR, RhaR 및 XylR로 이루어진 군으로부터 선택되는, 발현 작제물.
제1항 내지 제15항 중 어느 한 항에 있어서, 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 더 포함하는, 발현 작제물.
제1항 내지 제16항 중 어느 한 항의 발현 작제물을 포함하는, 키트.
제1항 내지 제16항 중 어느 한 항의 발현 작제물을 포함하는, 숙주 세포.
제18항에 있어서, 상기 숙주 세포는 원핵생물 세포인, 숙주 세포.
제19항에 있어서, 상기 숙주 세포는 이. 콜라이(E. coli)인, 숙주 세포.
제18항 내지 제20항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 갖는, 숙주 세포.
제21항에 있어서, 상기 수송체 단백질을 코딩하는 상기 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG 및 xylH로 이루어진 군으로부터 선택되는, 숙주 세포.
제22항에 있어서, 상기 유전자 기능의 변경은 항시성 프로모터(constitutive promoter)로부터 araE의 발현인, 숙주 세포.
제18항 내지 제23항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는(metabolize) 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
제24항에 있어서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 상기 유전자는 araA, araB, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되는, 숙주 세포.
제18항 내지 제25항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
제26항에 있어서, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 상기 유전자는 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 숙주 세포.
제18항 내지 제27항 중 어느 한 항에 있어서, 상기 숙주 세포는 티오레독신 환원효소 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
제28항에 있어서, 상기 티오레독신 환원효소 유전자는 trxB인, 숙주 세포.
제18항 내지 제29항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖는, 숙주 세포.
제30항에 있어서, 상기 글루타티온 합성효소 유전자는 gshA 및 gshB로 이루어진 군으로부터 선택되는, 숙주 세포.
제18항 내지 제31항 중 어느 한 항에 있어서, 상기 숙주 세포는 AhpC의 적어도 하나의 돌연변이체 형태를 발현하는, 숙주 세포.
제18항 내지 제32항 중 어느 한 항에 있어서, 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되는, 숙주 세포.
제18항 내지 제32항 중 어느 한 항에 있어서, 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택되는, 숙주 세포.
제18항 내지 제34항 중 어느 한 항에 있어서, 상기 숙주 세포는, (a) 상기 araBAD 유전자의 결실; (b) 상기 araE 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자; (d) 상기 prpB 유전자의 감소된 유전자 기능; (e) 상기 sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) 상기 gor 및 trxB 유전자의 감소된 유전자 기능; (g) AhpC의 돌연변이체 형태를 코딩하는 폴리뉴클레오타이드; (h) 상기 AscG 유전자의 감소된 유전자 기능; (i) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (j) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (k) 단백질 다이설파이드 아이소머라제를 코딩하는 폴리뉴클레오타이드 중 하나 이상을 포함하는, 숙주 세포.
제1항 내지 제16항 중 어느 한 항의 상기 발현 작제물 및 숙주 세포를 포함하는, 키트.
제36항에 있어서, 상기 숙주 세포는 원핵생물 세포인, 키트.
제37항에 있어서, 상기 숙주 세포는 이. 콜라이인, 키트.
제36항 내지 제38항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자에 대한 수송체 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 변경을 갖는, 키트.
제39항에 있어서, 상기 수송체 단백질을 코딩하는 상기 유전자는 araE, araF, araG, araH, rhaT, xylF, xylG 및 xylH로 이루어진 군으로부터 선택되는, 키트.
제40항에 있어서, 상기 유전자 기능의 변경은 항시성 프로모터로부터 araE 의 발현인, 키트.
제36항 내지 제41항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
제42항에 있어서, 적어도 1종의 상기 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 상기 유전자는 araA, araB, prpB, prpD, rhaA, rhaB, rhaD, xylA 및 xylB로 이루어진 군으로부터 선택되는, 키트.
제36항 내지 제43항 중 어느 한 항에 있어서, 상기 숙주 세포는 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 적어도 1종의 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
제44항에 있어서, 적어도 1종의 유도성 프로모터의 유도인자의 생합성에 관여하는 단백질을 코딩하는 상기 유전자는 scpA/sbm, argK/ygfD, scpB/ygfG, scpC/ygfH, rmlA, rmlB, rmlC 및 rmlD로 이루어진 군으로부터 선택되는, 키트.
제36항 내지 제45항 중 어느 한 항에 있어서, 상기 숙주 세포는 티오레독신 환원효소 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
제46항에 있어서, 상기 티오레독신 환원효소 유전자는 trxB인, 키트.
제36항 내지 제47항 중 어느 한 항에 있어서, 상기 숙주 세포는 글루타티온 합성효소 유전자의 유전자 기능의 감소된 수준을 갖는, 키트.
제48항에 있어서, 상기 글루타티온 합성효소 유전자는 gshA 및 gshB로 이루어진 군으로부터 선택되는, 키트.
제36항 내지 제49항 중 어느 한 항에 있어서, 상기 숙주 세포는 AhpC의 돌연변이체 형태를 발현하는, 키트.
제36항 내지 제50항 중 어느 한 항에 있어서, 적어도 1종의 L-아라비노스 유도성 프로모터 및 AraC를 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 L-아라비노스 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 araA 및 araB로 이루어진 군으로부터 선택되는, 키트.
제36항 내지 제50항 중 어느 한 항에 있어서, 적어도 1종의 프로피오네이트 유도성 프로모터 및 PrpR을 코딩하는 폴리뉴클레오타이드 서열을 포함하는 발현 작제물을 포함하고, 상기 숙주 세포는 적어도 1종의 상기 프로피오네이트 유도성 프로모터의 유도인자를 대사시키는 단백질을 코딩하는 적어도 1종의 유전자의 감소된 유전자 기능을 가지며, 상기 유전자는 prpB 및 prpD로 이루어진 군으로부터 선택되는, 키트.
제36항 내지 제52항 중 어느 한 항에 있어서, 상기 숙주 세포는 (a) 상기 araBAD 유전자의 결실; (b) 상기 araE 유전자의 변경된 유전자 기능; (c) lacY(A177C) 유전자; (d) 상기 prpB 유전자의 감소된 유전자 기능; (e) 상기 sbm/scpA-ygfD/argK-ygfGH/scpBC 유전자의 감소된 유전자 기능; (f) 상기 gor 및 trxB 유전자의 감소된 유전자 기능; (g) AhpC의 돌연변이체 형태를 코딩하는 폴리뉴클레오타이드; (h) 상기 AscG 유전자의 감소된 유전자 기능; (i) 신호 펩타이드가 결여된 DsbC의 형태를 코딩하는 폴리뉴클레오타이드; (j) Erv1p를 코딩하는 폴리뉴클레오타이드; 및 (k) 단백질 다이설파이드 아이소머라제를 코딩하는 폴리뉴클레오타이드 중 하나 이상을 포함하는, 키트.
(누락)
유전자 산물을 제조하는 방법으로서, 상기 방법은 제18항 내지 제35항 중 어느 한 항의 상기 숙주 세포의 배양물을 성장시키는 단계로서, 상기 숙주 세포는 각각의 유도성 프로모터로부터 전사되는 적어도 1종의 유전자 산물을 코딩하는 적어도 하나의 폴리뉴클레오타이드 서열을 포함하는 적어도 1종의 발현 작제물을 포함하는, 상기 숙주 세포의 배양물을 성장시키는 단계, 및 상기 배양물에 상기 유도성 프로모터의 각각에 대한 유도인자를 첨가하는 단계를 포함하는, 유전자 산물을 제조하는 방법.
제55항에 있어서, 상기 방법은 상기 배양물로부터 적어도 1종의 유전자 산물을 정제하는 단계를 더 포함하는, 유전자 산물을 제조하는 방법.
제55항 또는 제56항에 있어서, 상기 유전자 산물은 다량체 생성물의 일부인, 유전자 산물을 제조하는 방법.
제55항 내지 제57항 중 어느 한 항에 있어서, 상기 적어도 1종의 유전자 산물은 (a) 면역글로불린 중쇄; (b) 면역글로불린 경쇄; 및 (c) (a) 내지 (b) 중 어느 하나의 단편으로 이루어진 군으로부터 선택되는, 유전자 산물을 제조하는 방법.
제58항에 있어서, 상기 다량체 생성물은 항체인, 유전자 산물을 제조하는 방법.
제55항 또는 제56항에 있어서, 상기 유전자 산물은 프리프로인슐린인, 유전자 산물을 제조하는 방법.
제60항에 있어서, 상기 프리프로인슐린은 L-아라비노스 유도성 프로모터로부터 발현되는, 유전자 산물을 제조하는 방법.