KR102036399B1

KR102036399B1 - 단백질 발현용 재조합 박테리아 숙주 세포

Info

Publication number: KR102036399B1
Application number: KR1020147032673A
Authority: KR
Inventors: 필립 조나단 바세트; 데이비드 폴 험프리즈; 파레쉬쿠마르 만지브하이 파텔
Original assignee: 유씨비 파마, 에스.에이.
Priority date: 2012-05-14
Filing date: 2013-05-13
Publication date: 2019-10-24
Also published as: CA2872328C; ME03309B; AU2013261915B2; BR112014027357A2; DK2850100T3; SG11201406474RA; RS58219B1; JP6420759B2; HRP20190025T1; IL235041B; US20150111249A1; CL2014003112A1; US9951365B2; CN104487454A; JP2015516166A; CA2872328A1; LT2850100T; MX353066B; HUE040624T2; CN110591991A

Abstract

본 발명은 a.) D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자 및 b.) FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘(folding)을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자를 포함하는 재조합 그람(gram) 음성 박테리아 세포로서, 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는 것인 세포, 이 세포의 이용 방법, 단백질, 특히 항체, 예컨대 항 FcRn 항체의 발현에 있어서의 이 세포의 용도 및 본원에 기술된 방법에 의해 제조된 단백질에 관한 것이다.

Description

단백질 발현용 재조합 박테리아 숙주 세포{RECOMBINANT BACTERIAL HOST CELL FOR PROTEIN EXPRESSION}

본 발명은 재조합 박테리아 숙주 균주, 특히 이. 콜라이(E. coli)에 관한 것이다. 또한 본 발명은 이러한 세포에서 관심의 단백질을 생성하는 방법에 관한 것이다.

박테리아 세포, 예컨대 이. 콜라이는 재조합 단백질의 제조에 일반적으로 사용된다. 재조합 단백질의 생성용으로 박테리아 세포, 예컨대 이. 콜라이를 사용하는 것에 대한 많은 이점이 있으며, 이는 특히 플라스미드를 통한 유전자 삽입을 허용하는 숙주 세포로서의 박테리아 세포의 다재다능한 성질로 인한 것이다. 이. 콜라이는 인간 인슐린을 비롯하여 다수의 재조합 단백질의 제조에 사용되어 왔다.

재조합 단백질을 제조하기 위하여 박테리아 세포를 사용하는 것에 대한 많은 이점에도 불구하고, 프로테아제 민감성 단백질을 생성하는 것에 대한 어려움을 비롯하여 여전히 상당한 제한이 있다. 프로테아제는 이. 콜라이 주변 세포질(periplasm) 및 세포질에 있어서 오래되거나, 손상되거나, 잘못 접힌(mis-folded) 단백질을 턴오버(turn over)시키는 데 중요한 역할을 한다. 박테리아 프로테아제는 관심의 재조합 단백질을 분해시키는 작용을 하며, 이에 의해 활성 단백질의 수율이 흔히 유의하게 감소된다.

다수의 박테리아 프로테아제가 동정되었다. 이. 콜라이에서 프로테아제 III(ptr), DegP, OmpT, Tsp, prlC, ptrA, ptrB, pepA-T, tsh, espc, eatA, clpP 및 lon을 비롯한 프로테아제가 동정되었다.

Tsp(Prc로도 공지됨)는 60 kDa의 주변 세포질 프로테아제이다. Tsp의 첫 번째의 공지된 기질은 페니실린 결합 단백질-3(Penicillin-binding protein-3; PBP3)이었지만(문헌[Determination of the cleavage site involved in C-terminal processing of penicillin-binding protein 3 of Escherichia coli; Nagasawa H, Sakagami Y, Suzuki A, Suzuki H, Hara H, Hirota Y. J Bacteriol. 1989 Nov;171(11):5890-3] 및 문헌[Cloning, mapping and characterization of the Escherichia coli Tsp gene which is involved in C-terminal processing of penicillin-binding protein 3; Hara H, Yamamoto Y, Higashitani A, Suzuki H, Nishimura Y. J Bacteriol. 1991 Aug;173 (15):4799-813], Tsp는 파지 테일(phage tail) 단백질을 또한 절단할 수 있음이 나중에 발견되었으며, 따라서, 이것은 테일 특이적 프로테아제(Tail Specific Protease; Tsp)로 개명되었다(문헌[Silber et al., Proc. Natl. Acad. Sci. USA, 89: 295-299 (1992)]). 실버(Silber) 등의 문헌[Deletion of the prc(tsp) gene provides evidence for additional tail-specific proteolytic activity in Escherichia coli K-12; Silber, K.R., Sauer, R.T.; Mol Gen Genet 1994 242:237-240]에는 prc 결실 균주(KS1000)가 기술되어 있으며, 여기서, 돌연변이는 Kan^r 마커를 포함하는 단편으로 prc 유전자의 절편을 대체함으로써 생성되었다.

Tsp(prc) 활성의 감소는 관심의 단백질의 단백질 분해를 감소시키는 데 바람직하다. 그러나, 프로테아제 prc가 결여된 세포는 낮은 오스몰 농도에서 감열적 성장을 나타낸다는 것이 밝혀졌다. 하라(Hara)등은 유전자외 억제(spr) 돌연변이를 함유하는 내열성 복귀 돌연변이체를 단리하였다(문헌[Hara et al., Microbial Drug Resistance, 2: 63-72 (1996)]). Spr은 18 kDa의 막 결합 주변 세포질 프로테아제이며, spr의 기질은 세포 분열 동안 세포벽 가수분해에 연루된 외막의 펩티도글리칸 및 Tsp이다. spr 유전자는 UniProtKB/Swiss-Prot P0AFV4(SPR_ECOLI)로 표기된다.

돌연변이 spr 유전자를 포함하는 개선된 프로테아제 결실 균주가 기술되었다. 첸(Chen) 등은 prc(Tsp)의 돌연변이와 또 다른 프로테아제, DegP의 돌연변이의 상이한 조합을 지닌 이. 콜라이 균주의 구성을 기술하고 있는데, 이는 상기 유전자의 상류 및 하류 영역을 증폭시키고 이들을 선발 마커 및 sprW174R 돌연변이를 포함하는 벡터에서 함께 라이게이션시킴으로써 생성된다(문헌[High-level accumulation of a recombinant antibody fragment in the periplasm of Escherichia coli requires a triple-mutant, (ΔDegP Δprc sprW174R) host strain, Chen C, Snedecor B, Nishihara JC, Joly JC, McFarland N, Andersen DC, Battersby JE, Champion KM. Biotechnol Bioeng. 2004 Mar 5;85(5):463-74]). ΔDegP, Δprc 및 sprW174R 돌연변이는 최고 수준의 항체 경쇄, 항체 중쇄 및 F(ab')2-LZ를 제공하는 것으로 밝혀졌다. 유럽 특허 제1341899호에는 각각 프로테아제 DegP 및 Prc를 코딩하는 염색체 DegP 및 prc에 결함이 있으며, prc 돌연변이체를 보유하고 있는 균주가 나타내는 성장 표현형을 억제하는 단백질을 코딩하는 돌연변이 spr 유전자를 보유한 이. 콜라이 균주가 개시되어 있다.

Tsp 및 spr 둘 모두에 돌연변이를 함유하는 다른 개선된 프로테아제 결실 균주가 국제 특허 공개 제WO2011/086136호에 기술되어 있다.

국제 특허 공개 제WO02/48376호에 개시된 균주는 lac^-이며, 티미딘, 푸코스 또는 말토스가 탄소원으로 이용되는 배양에서는 성장할 수 없다. 이는 상업적 규모로서의 사용용으로 의도된 균주에 있어서 심하게 불리할 수 있다. 상기 균주와 결부된 추가의 불리한 점, 예를 들어 알칼리 포스파타아제의 생성의 결여가 있을 수 있다. 후자는 배양 배지로부터의 포스페이트의 이용에 연루된 주변 세포질 단백질이다.

특정 단백질은 펩티딜-프롤릴 이소머라아제 및/또는 이소머라아제 활성 및/또는 샤페론 활성을 나타내며, 재조합 단백질 발현에 이용되는 세포주에서 이용될 때 유리한 특성을 제공하는 것으로 밝혀졌다.

본 발명은 Tsp 및 spr 둘 모두의 돌연변이와, 재조합 단백질의 유리한 제조 수단을 제공하는, 단백질 접힘을 용이하게 할 수 있는 단백질(들)을 코딩하는 하나 이상의 유전자를 지닌 새로운 박테리아 균주를 제공한다.

본 발명의 제1 측면에서, 하기를 포함하는 재조합 그람(gram) 음성 박테리아 세포가 제공되며, 여기서, 이 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는다:

a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자 및

b. FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자(들).

본 발명의 일 실시 양태에서, 하기를 코딩하는 재조합 그람 음성 박테리아 세포가 제공되며, 여기서, 이 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 가지며, 세포 게놈 DNA의 나머지는 재조합 세포가 유래된 야생형 세포와 동질 유전자형이다:

a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자,

b. FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상이 단백질을 발현 또는 과발현시킬 수 있는 유전자(들),

c. 관심의 단백질, 예를 들어 항체 또는 이의 결합 단편을 발현할 수 있는 유전자.

일 실시 양태에서, 세포의 게놈은 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형, 돌연변이된 spr 유전자, 및 단백질 접힘을 용이하게 할 수 있는 단백질을 발현하는 유전자(들)를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.

제2 측면에서, 본 발명은 야생형 세포와 비교하여 Tsp 단백질 활성을 갖고, spr 단백질을 코딩하는 돌연변이 spr 유전자를 포함하는 재조합 그람 음성 박테리아 세포를 제공하며, 여기서, 세포의 게놈은 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형, 돌연변이된 spr 유전자 및 단백질 및 단백질 접힘을 용이하게 할 수 있는 단백질의 발현용으로 도입된 유전자(들)를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.

본 발명의 제1 및 제2 측면에 의해 제공된 세포는 유리한 성장 및 단백질 생성 표현형을 나타낸다.

제3 측면에서, 본 발명은 상기에 정의된 재조합 그람 음성 박테리아 세포에서 관심의 단백질을 발현시키는 것을 포함하는, 관심의 단백질을 제조하는 방법을 제공한다.

제4 측면에서, 본 발명은 또한 본원에 기술된 방법에 의해 발현된 단백질까지 연장된다.

도 1은 숙주 세포 및 "샤페론"의 다양한 조합을 이용하여 수행된 5 L 규모의 발효의 결과를 나타낸다. W3110은 야생형 이. 콜라이 균주이다. 다양한 조합은 다음과 같았다: 샤페론을 포함하지 않는 야생형; FkpA 및 Skp를 포함하는 야생형; 국제 특허 공개 제WO2011/086136호에 공개된 바와 같이 MXE016 돌연변이 spr 및 Δ Tsp; MXE016 및 FkpA; MXE016 및 Skp; MXE016 및 FkpA 및 Skp; 국제 특허 공개 제WO2011/086136호에 개시된 MXE017; MXE017 및 FkpA 및 Skp.
도 2는 5.4, 6.0 및 7.0 g/h의 유도 후 공급량에서의 공급량 변화 실험의 결과를 나타내며, MXE016에 있어서, 더욱 높은 공급량에서 만들어진 추가의 Fab' 중 대다수는 상청액에서 손실되었다.
도 3a, 도 3b는 MXE016 +/- FkpA의 생존율(도 3a) 및 Fab' 역가(도 3b)를 나타낸다.
도 4는 20 L 파일럿(pilot) 규모의 생산에 있어서의 일차 회수 데이터를 나타낸다.
도 5는 20 L 파일럿 규모 생산의 비환원 조건 하에서의 SDS-PAGE 염색 겔 상에서의 일차 회수를 나타낸다. FkpA 관련 밴드 이외에는, 단백질 프로필은 두 균주 사이에서 매우 유사한 것으로 보인다.
도 6은 20 L 파일럿 규보 공정에 있어서 비환원 조건 하에서의 His-태그 웨스턴 블롯(western blot)을 나타낸다. 전장 FkpA가 검출되었으며, 이는 대략 30 kDa의 밴드에 상응하고, 신호는 MXE016 단독에서는 검출되지 않았는데, 이는 예상된 바와 같다.
도 7a 내지 도 7c는 다양한 유전자에서의 다양한 돌연변이를 나타낸다.
도 7d는 항체의 경쇄(LC), 항체의 중쇄(HC)를 코딩하는 폴리뉴클레오티드 서열, FkpA 폴리뉴클레오티드 서열 및/또는 Skp 폴리뉴클레오티드를 포함하는 벡터의 생성의 도해를 나타낸다.
도 8은 다양한 폴리뉴클레오티드 및 아미노산 서열을 나타낸다.
서열의 간단한 설명
서열 번호 1은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAC를 포함하는 야생형 Tsp 유전자의 DNA 서열이다.
서열 번호 2는 야생형 Tsp 단백질의 아미노산 서열이다.
서열 번호 3은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAT를 포함하는 돌연변이된 넉아웃(knockout) Tsp 유전자의 DNA 서열이다.
서열 번호 4는 야생형 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 5는 야생형 프로테아제 III 단백질의 아미노산 서열이다.
서열 번호 6은 돌연변이된 넉아웃 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 7은 야생형 DegP 유전자의 DNA 서열이다.
서열 번호 8은 야생형 DegP 단백질의 아미노산 서열이다.
서열 번호 9는 돌연변이된 DegP 유전자의 DNA 서열이다.
서열 번호 10은 돌연변이된 DegP 단백질의 아미노산 서열이다.
서열 번호 11은 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 12는 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 13은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 14는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 15는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 16은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 17은 야생형 spr 유전자의 DNA 서열이다.
서열 번호 18은 처음 26개 아미노산 잔기인 신호 서열을 포함하는 야생형 spr 유전자의 서열이다.
서열 번호 19는 신호 서열을 포함하지 않는 비돌연변이 spr 유전자의 서열이다.
서열 번호 20은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 21은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 아미노산 서열이다.
서열 번호 22는 돌연변이 넉아웃 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 23은 OmpA 올리고뉴클레오티드 어댑터의 서열을 나타낸다.
서열 번호 24는 이. 콜라이 Fab 발현을 위한 유전자간 서열 1(intergenic sequence 1; IGS1)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 25는 이. 콜라이 Fab 발현을 위한 유전자간 서열 2(IGS2)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 26은 이. 콜라이 Fab 발현을 위한 유전자간 서열 3(IGS3)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 27은 이. 콜라이 Fab 발현을 위한 유전자간 서열 4(IGS4)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 28은 야생형 FkpA 유전자의 DNA 서열이다.
서열 번호 29는 야생형 FkpA 유전자의 단백질 서열이다.
서열 번호 30은 FkpA his 태그 유전자의 DNA 서열이다.
서열 번호 31은 FkpA his 태그 유전자의 단백질 서열이다.
서열 번호 32는 야생형 skp 유전자의 DNA 서열이다.
서열 번호 33은 야생형 skp 유전자의 단백질 서열이다.
서열 번호 34는 skp his 태그 유전자의 DNA 서열이다.
서열 번호 35는 skp his 태그 유전자의 단백질 서열이다.
서열 번호 36 내지 74는 FcRn 항체 또는 이의 단편의 다양한 아미노산 및 DNA 서열을 나타내는데, 이는 본 발명의 세포주에서의 발현에 적합하다. 특히, 서열 번호 50은 항-FcRn 항체 경쇄 1519gH20의 경쇄 가변 영역의 아미노산 서열이며, 서열 번호 58은 항-FcRn 항체 중쇄 1519gH20의 중쇄 가변 영역의 아미노산 서열이다.

본 발명자는 관심의 재조합 단백질의 발현에 적합한 개선된 재조합 그람 음성 박테리아 세포를 제공하였다.

일 실시 양태에서, 단백질은 항체 또는 이의 결합 단편, 특히 치료용 항체이다.

특히, 본 발명자는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 그람 음성 박테리아 세포 내에, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 하나 이상의 유전자(들)를 포함시킴으로써 관심의 재조합 단백질의 발현에 적합한 개선된 재조합 그람 음성 박테리아 세포를 제공하였다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 예를 들어 안정한 세포주를 제공하도록 세포 게놈 내에 통합된다. 일 실시 양태에서, 발현용의 재조합 단백질(예컨대, 치료용 단백질)로 안정한 세포주를 형질감염시켜서 요망되는 재조합 단백질의 발현을 제공한다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)가 하나 이상의 플라스미드 상에 제공되며, 예를 들어, 플라스미드로 세포를 일시적으로 형질감염시켜서 본 발명의 세포주를 제공한다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 관심의 재조합 단백질의 코딩 서열을 또한 함유하는 플라스미드 상에 제공된다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 관심의 재조합 단백질의 코딩 서열을 함유하지 않는 플라스미드 상에 제공된다.

일 실시 양태에서, 본 발명은 야생형 박테리아 세포 및 단지 돌연변이된 Tsp 유전자 또는 돌연변이된 Tsp 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 개선된 세포 성장 표현형을 갖는 새로운 균주를 제공한다.

본 발명의 세포는 많은 이점을 보유한다. 놀랍게도, 본 발명자는 본 발명에 따른 세포가 야생형 세포 또는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포와 비교하여 증가된 세포 생존율을 나타낸다는 것을 알아냈다.

세포 생존율은 실제적인 면에 있어서 특히 중요하며, 그 이유는 생존가능하지 않은 세포는 배양 중 용해되어 DNA 잔사를 생성하는 경향이 있기 때문이다. 이러한 DNA 잔사는 요망되는 단백질의 정제의 어려움, 비용 및 경비를 증가시킨다. 따라서, 용해된 생존가능하지 않은 세포로부터의 DNA 잔사의 최소화는 재조합 단백질을 효율적으로 제조하는 데 있어서 상당한 쟁점인데, 예를 들어 미국 특허 제6,258,560호를 참조한다.

세포 생존율은 다수의 일상적인 기술 중 임의의 것에 의해, 예를 들어 형광 염료 및 FACS 분석 또는 이와 유사한 것을 이용하여 측정될 수 있다.

구체적으로, 일반적으로 본 발명에 따른 세포는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 감소된 세포 용해 표현형을 나타낸다.

더욱이, 본 발명의 새로운 균주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자와 비교하여 세포로부터의 단백질의 누출을 감소시키고 장시간의 주변 세포질 축적을 허용할 수 있다. 이것은, 예를 들어 당해 균주가 덜 누출성이기 때문에 표적 단백질의 전체 발현 수준은 유사하지만 더 많은 단백질이 주변 세포질 내에 축적되거나 더 적은 단백질이 상청액 중에 축적된다면 이러한 더욱 적은 누출 특성을 갖는 세포가 단백질 회수를 용이하게 하기 때문에 상기 세포가 일반적으로 플랜트(plant) 규모 생산에 더욱 적합하기 때문에, 특히 중요하다.

또한, 본 발명에 따른 세포는 FkpA와 같은 단백질을 코딩하는 유전자(들)의 부재 하에서 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포 및 야생형 세포와 비교하여 관심의 단백질의 수율의 증가를 나타낸다. 상기 향상된 단백질 수율은 주변 세포질 단백질 수율 및/또는 상청액 단백질 수율일 수 있다. 일 실시 양태에서, 본 발명의 세포는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 향상된 주변 세포질 단백질 수율을 나타내며, 이는 당해 세포로부터의 누출의 감소로 인한 것이다.

재조합 박테리아 세포는 관심의 단백질의 더욱 빠른 생성 속도를 가능하게 할 수 있으며, 따라서, 동일한 양의 관심의 단백질이 야생형 박테리아 세포 또는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포와 비교하여 더욱 짧은 시간 내에 생성될 수 있다. 관심의 단백질의 더욱 빠른 생성 속도는 세포의 초기 성장 기간에 걸쳐 , 예를 들어 단백질 발현의 유도 후 처음 5, 10, 20 또는 30시간에 걸쳐 특히 유의할 수 있다.

바람직하게는 본 발명에 따른 세포는 대략 1.0 g/L, 1.5 g/L, 1.8 g/L, 2.0 g/L, 2.4 g/L, 2.5 g/L, 3.0 g/L, 3.5 g/L 또는 4.0 g/L의 관심의 단백질의, 주변 세포질 및/또는 배지 중 최대 수율을 나타낸다.

부가적으로, 접힘을 용이하게 하는 단백질(들)의 발현은 적당한 접힘이 제공된 단백질을 최대화함으로써 발현을 추가로 최적화한다. 당업자라면, 적절한 접힘이 생물학적 기능에 필수적이며, 따라서, 요망되는 접힘을 갖는 단백질의 단리는 극도로 중요함을 잘 알고 있다. 이것은, 단백질이 그람 음성 세포에서 발현될 때 특히 중요하며, 그 이유는, 발현되는 단백질이 세포에 대하여 천연적인 것이 아니고 따라서 세포가 적절한 접힘을 갖는 단백질을 자동적으로 발현할 수 없기 때문이다. 부적절한 접힘은 그 자신을 응집체 또는 다른 불순물로서 나타낼 수 있다. 요망되는 단백질의 단리는 광범위한 정제를 필요로 할 수 있으며, 이는 비용 함축성을 갖고, 또한, 낮은 수율의 요망되는 단백질을 생성할 수 있다. 적당하게 접힌 발현 단백질의 양의 최대화는 필요한 정제의 양을 최소화하고, 이용가능한 수율을 최적화할 수 있으며, 따라서 유리하다.

접힘을 용이하게 하는 단백질의 발현과 결부된 이점은 하기 중 하나 이상을 포함한다: 더욱 높은 역가(예를 들어, 0.5 g/L의 야생형과 비교하여 약 1.05 g/L로 증가함); 수확시에 더욱 높은 생존율(예를 들어, 95% 초과); 공급량의 증가에 의한 역가의 증가(공정 개발에 있어서 더욱 우수한 전망); 20 L 규모와 같은 상업적 생산 규모에서 더욱 높은 역가 및 수확시에 더욱 높은 생존율; 및 특히 20 L 규모에서 추출물의 더욱 용이한 청징.

본 발명에 의해 제공되는 세포는 야생형 세포와 비교하여 Tsp의 감소된 프로테아제 활성을 가지며, 이는 관심의 단백질, 특히, Tsp에 대하여 단백질 분해적으로 민감한 관심의 단백질의 단백질 분해를 감소시킬 수 있다. 따라서, 본 발명에 의해 제공되는 세포는, 야생형 박테리아 세포와 비교하여 더욱 높은 수율의 온전한 단백질, 바람직하게는 관심의 단백질 및 더욱 낮은 수율의, 단백질, 바람직하게는 관심의 단백질의 단백질 분해 단편을 제공할 수 있거나, 바람직하게는 상기 단백질 분해 단편을 전혀 제공하지 않을 수 있다.

본 발명의 일 실시 양태에서, 세포는 본 발명에 따른 변형의 도입에 요구되는, 게놈에 대한 최소의 돌연변이만을 지닌다. 박테리아 세포는 단지, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 spr 유전자에 대한 하나 이상의 돌연변이에 의해 야생형 박테리아 세포와 상이한 것일 수 있으며, 그 이유는 예를 들어, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)이 플라스미드 상의 것과 같이, 세포 내에 일시적으로 도입될 수 있기 때문이다. 일 실시 양태에서, 세포는 세포의 성장 및/또는 관심의 단백질을 발현하는 능력에 해로운 영향을 줄 수 있는 임의의 다른 돌연변이는 지니지 않는다.

따라서, 본 발명의 재조합 숙주 세포 중 하나 이상은 게놈 서열에 대한 추가의 유전자 엔지니어링된(engineered) 돌연변이를 포함하는 세포와 비교하여 개선된 단백질 발현 및/또는 개선된 성장 특성을 나타낼 수 있다. 또한, 본 발명에 의해 제공되는 세포는 세포 게놈에 대한 추가의 파괴를 포함하는 세포와 비교하여 치료용 단백질을 제조하는 데 사용하기에 더욱 적합하다.

당업자라면, 발효법, ELISA 및 단백질 G HPLC를 비롯한 당업계에 공지된 방법을 이용하여 후보 세포 클론이 요망되는 수율의 관심의 단백질을 갖는지를 관찰하기 위하여 후보 세포 클론을 용이하게 테스트할 수 있다. 적합한 발효법은 문헌[Humphreys D P, et al. (1997). Formation of dimeric Fabs in E. coli: effect of hinge size and isotype, presence of interchain disulphide bond, Fab' expression levels, tail piece sequences and growth conditions. J. IMMUNOL . METH.209: 193-202]; 문헌[Backlund E. Reeks D. Markland K. Weir N. Bowering L. Larsson G. Fedbatch design for periplasmic product retention in Escherichia coli, Journal Article. Research Support, Non-U.S. Gov't Journal of Biotechnology. 135(4):358-65, 2008 Jul 31]; 문헌[Champion KM. Nishihara JC. Joly JC. Arnott D. Similarity of the Escherichia coli proteome upon completion of different biopharmaceutical fermentation processes. [Journal Article] Proteomics. 1(9):1133-48, 2001 Sep]; 및 문헌[Horn U. Strittmatter W. Krebber A. Knupfer U. Kujau M. Wenderoth R. Muller K. Matzku S. Pluckthun A. Riesenberg D. High volumetric yields of functional dimeric miniantibodies in Escherichia coli, using an optimized expression vector and high-cell-density fermentation under non-limited growth conditions, Journal Article. Research Support, Non-U.S. Gov't Applied Microbiology & Biotechnology. 46(5-6):524-32, 1996 Dec]에 기술되어 있다. 또한 당업자라면, 당업계에 공지된 방법, 예컨대 단백질 G HPLC, 원편광 이색성, NMR, X선 크리스탈로그래피 및 에피토프 친화성 측정법을 이용하여, 분비된 단백질이 올바르게 접혀 있는지를 관찰하기 위하여 분비된 단백질을 용이하게 테스트할 수 있다.

이제 본 발명을 더욱 상세하게 기술할 것이다.

"단백질" 및 "폴리펩티드"라는 용어는, 그 문맥이 달리 지시하지 않으면, 본원에서 상호교환가능하게 사용된다. "펩티드"는 10개 이하의 아미노산을 나타내는 것으로 의도된다.

"폴리뉴클레오티드"라는 용어는, 그 문맥이 달리 지시하지 않으면, 유전자, DNA, cDNA, RNA, mRNA 등을 포함한다.

본원에서 이용될 때, '감소된 활성'은 적합한 검정법에서 비견되는 조건 하에 측정될 때 야생형 균주에서의 상응하는 효소 활성과 비교하여 더욱 낮은 수준의 효소 활성, 예컨대 Tsp 효소 활성을 나타낸다. 일 실시 양태에서, 감소된 활성은 야생형 비교자의 효소 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하이다. 일 실시 양태에서, 효소 활성의 수준을 측정하는 분석법은 그 결과를 직접 비교에서 이용하려고 할 때 동시에 수행된다.

본원에서 이용될 때, 직접 비교라는 것은 본원에서 정의된 감소된 활성 또는 검정법으로부터 수득된 활성 결과들의 순위가 있는지를 평가하기 위하여 2개 이상의 결과의 수치 값을 비교하는 경우를 나타낸다.

본원에서 이용될 때, 본 명세서의 문맥에서의 "포함하는"이라는 용어는 "함유하는"이라는 것으로 해석되어야 한다.

본원에서 이용될 때, 야생형 세포는 비돌연변이 세포 또는 대조 세포와 상호교환가능하게 이용된다.

본 발명의 문맥에서 비돌연변이 세포 또는 대조 세포는 본 발명의 재조합 그람 음성 세포와 동일한 유형의 세포를 의미하며, 여기서, 상기 세포는 상기의 감소된 Tsp 단백질 활성을 지니도록, 그리고 돌연변이 spr 유전자를 지니도록 변형된 것이 아니었다. 예를 들어, 비돌연변이 세포는 야생형 세포일 수 있으며, 임의의 돌연변이를 도입하기 위한 변형 전의 본 발명의 세포와 동일한 숙주 세포 집단으로부터 유래될 수 있다.

"세포", "세포주", "세포 배양물" 및 "균주"라는 표현은 상호교환가능하게 사용된다.

본 발명의 문맥에서 "돌연변이된 Tsp 유전자를 포함하는 세포의 표현형"이라는 표현은 돌연변이 Tsp 유전자를 갖는 세포가 나타내는 표현형을 의미한다. 전형적으로, 돌연변이 Tsp 유전자를 포함하는 세포는, 특히 높은 세포 밀도에서 용해될 수 있다. 이들 세포의 용해는 임의의 재조합 단백질이 상청액 내로 누출되게 한다. 돌연변이된 Tsp 유전자를 지닌 세포는 또한 낮은 오스몰 농도에서 감열성 성장을 나타낼 수 있다. 예를 들어, 고온, 예컨대 40℃ 이상에서 세포는 저장성 배지에서 죽거나, 또는 세포는 감소된 성장 속도를 나타내거나 성장 속도를 전혀 나타내지 않는다.

본 발명의 문맥에서 "동질 유전자형"이라는 용어는 본 발명의 세포의 게놈이, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 이 세포가 유래된 야생형 세포와 비교하여 실질적으로 동일하거나 동일한 게놈 서열을 가짐을 의미한다. 이 실시 양태에서, 세포의 게놈은 추가의 천연 비발생 돌연변이 또는 유전자 엔지니어링된 돌연변이를 전혀 포함하지 않는다. 일 실시 양태에서, 본 발명에 따른 세포는 일어날 수 있는 임의의 천연 발생 돌연변이를 고려하여 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 세포와 비교하여 실질적으로 동일한 게놈 서열을 가질 수 있다. 일 실시 양태에서, 본 발명에 따른 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 세포와 비교하여 정확하게 동일한 게놈 서열을 가질 수 있다.

본 발명의 문맥에서, "야생형"이라는 용어는 자연에서 나타날 수 있는 또는 환경으로부터 단리될 수 있는 그람 음성 박테리아 세포의 균주를 의미하며, 이는 유전자 엔지니어링된 돌연변이를 전혀 지니지 않는다. 이. 콜라이의 야생형 균주의 예로는 W3110, 예컨대 W3110 K-12 균주가 있다.

임의의 적합한 그람 음성 박테리아가 본 발명의 재조합 세포의 생성을 위한 모(parental) 세포로서 사용될 수 있다. 적합한 그람 음성 박테리아는 살모넬라 타이피뮤륨(Salmonella typhimurium), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 에르위니아 카로토보라(Erwinia carotovora), 쉬겔라(Shigella), 클렙시엘라 뉴모니애(Klebsiella pneumoniae), 레지오넬라 뉴모필라(Legionella pneumophila), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 아시네토박터 바우만니이(Acinetobacter baumannii) 및 이. 콜라이를 포함한다. 바람직하게는, 모 세포는 이. 콜라이이다. 이. 콜라이의 임의의 적합한 균주가 본 발명에서 사용될 수 있지만, 바람직하게는 야생형 W3110 균주, 예컨대 K-12 W3110이 사용된다.

재조합 단백질의 발현을 위하여 이전에 생성되어 사용된 프로테아제 결실 박테리아 균주와 결부된 단점은 상기 박테리아 균주가, 예를 들어 이. 콜라이 균주에서 phoA, fhuA , lac , rec , gal , ara , arg , thi 및 pro와 같은, 세포 대사 및 DNA 복제에 연루된 유전자의 추가의 돌연변이를 포함한다는 것이다. 이들 돌연변이는 세포 성장, 안정성, 재조합 단백질 발현 수율 및 독성에 대한 영향을 비롯하여 숙주 세포에 많은 해로운 영향을 줄 수 있다. 이들 게놈 돌연변이 중 하나 이상을 갖는 균주, 특히 많은 수의 이들 돌연변이를 갖는 균주는 박테리아 성장 속도를 공업적 단백질 생산에 적합하지 않은 수준으로 감소시키는 적합성의 손실을 나타낼 수 있다. 또한, 임의의 상기 게놈 돌연변이는 시스로(in cis) 및/또는 트랜스로(in trans), 예측할 수 없는 유해한 방식으로 다른 유전자에 영향을 줌으로써 균주의 표현형, 적합성 및 단백질 프로필을 변경시킬 수 있다. 또한, 심하게 돌연변이된 세포의 사용은 상업적 용도, 특히 치료제를 위한 재조합 단백질의 생성에는 일반적으로 적합하지 않으며, 그 이유는 이러한 균주가 일반적으로 결함성 대사 경로를 갖고 따라서 최소 배지 또는 화학적 규정 배지에서 불량하게 성장하거나 전혀 성장하지 않을 수 있기 때문이다.

일 실시 양태에서, 본 발명에 따른 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 박테리아 세포와 동질 유전자형이다. 단지 최소 돌연변이를 세포의 게놈에 대하여 행하여서 돌연변이를 도입한다. 세포는 세포의 성장 및/또는 관심의 단백질을 발현하는 능력에 해로운 영향을 줄 수 있는 임의의 다른 돌연변이를 지니지 않는다. 따라서, 본 발명의 재조합 숙주 세포 중 하나 이상은 게놈 서열에 대한 추가의 유전자 엔지니어링된 돌연변이를 포함하는 세포와 비교하여 개선된 단백질 발현 및/또는 개선된 성장 특성을 나타낼 수 있다. 또한, 본 발명에 의해 제공되는 세포는 세포 게놈에 대한 추가의 파괴를 포함하는 세포와 비교하여 치료용 단백질의 제조에서 사용하기에 더욱 적합하다.

바람직한 실시 양태에서, 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 야생형 이. 콜라이 세포, 에컨대 균주 W3110에 대하여 동질 유전자형이다.

본 발명의 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드를 포함함으로써 야생형 세포와 더 상이할 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 외인성 또는 내인성일 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드는 세포를 형질전환시키고/시키거나 숙주 세포의 게놈 내에 통합되는 적합한 발현 벡터 내에 포함될 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드가 숙주의 게놈 내에 삽입되는 실시 양태에서, 본 발명의 세포는 관심의 단백질을 코딩하는 상기 삽입 폴리뉴클레오티드 서열로 인하여 야생형 세포와 또한 상이해진다. 바람직하게는, 폴리뉴클레오티드는 세포 내의 발현 벡터 내에 있음으로써 숙주 세포의 게놈에 대하여 최소의 파괴를 야기한다.

spr 단백질은 이. 콜라이 막 결합 주변 세포질 프로테아제이다.

spr 단백질의 야생형 아미노산 서열은 N-말단의 신호 서열을 포함하는 서열 번호 21의 서열로, 그리고 26개 아미노산의 신호 서열을 포함하지 않는 서열 번호 22의 서열(UniProt 등록 번호 P0AFV4에 따름)로 예시되어 있다. 본 발명에서 spr 단백질 서열의 아미노산 넘버링은 신호 서열을 포함한다. 따라서, spr 단백질의 아미노산 1은 서열 번호 21에 예시된 제1 아미노산(Met)이다.

돌연변이된 spr 유전자는 바람직하게는 세포 염색체 spr 유전자이다.

돌연변이된 spr 유전자는 돌연변이된 Tsp 유전자를 추가로 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 코딩한다. 돌연변이된 Tsp 유전자를 지닌 세포는 우수한 세포 성장 속도를 가질 수 있지만, 이러한 세포의 1가지 한계는 특히 높은 세포 밀도에서 용해되는 그의 경향이다. 따라서, 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형은 특히 높은 세포 밀도에서의 용해 경향이다. 돌연변이된 Tsp 유전자를 지닌 세포는 또한 낮은 오스몰 농도에서 감열성 성장을 나타낸다. 그러나, 본 발명의 세포가 지닌 spr 돌연변이는, 감소된 Tsp 활성을 갖는 세포 내로 도입될 때, 감소된 Tsp 표현형을 억제하며, 따라서, 세포는 특히 높은 세포 밀도에서 감소된 용해를 나타낸다. 세포의 성장 표현형은 진탕 플라스크 또는 고 세포 밀도 발효 기술 동안 당업계의 숙련자에 의해 용이하게 측정될 수 있다. 세포 용해 표현형의 억제는, 야생형 spr 및 Tsp 돌연변이체를 지닌 세포와 비교하여 감소된 Tsp 활성을 갖고 spr 돌연변이체를 지닌 세포가 나타내는, 개선된 성장 속도 및/또는 재조합 단백질 생성, 특히 주변 세포질에서의 것으로부터 관찰될 수 있다.

본 발명에 따른 세포는 N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108,Y115, D133, V135, L136,G140, R144, H145, G147 및 H157로부터 선택되는 하나 이상의 아미노산의 돌연변이, 바람직하게는 C94, S95, V98, Y115, D133, V135, H145, G147 및 H157로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자를 포함한다. 이 실시 양태에서, spr 단백질은 바람직하게는 임의의 추가의 돌연변이를 갖지 않는다.

상기 아미노산들 중 하나 이상의 돌연변이는 그 아미노산을 코딩하는 뉴클레오티드들 중 1개, 2개 또는 3개의 뉴클레오티드에 대한 임의의 적합한 미스센스(missense) 돌연변이일 수 있다. 상기 돌연변이는 아미노산 잔기를, 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 돌연변이된 spr 단백질을 생성하는 임의의 적합한 아미노산으로 변화시킨다. 미스센스 돌연변이는 아미노산을, 야생형 아미노산과 비교하여 상이한 크기이고/이거나 상이한 화학적 특성을 갖는 것으로 변화시킬 수 있다.

일 실시 양태에서, 돌연변이 spr 유전자는 C94A, S95F, V98E, Y115F, D133A, V135D 또는 G, H145A, G147C 및 H157A로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이는 C94, H145, 및 H157의 아미노산 잔기의 촉매적 세 작용기(catalytic triad) 중 1개, 2개 또는 3개에 대한 것이다(문헌[Solution NMR Structure of the NlpC/P60 Domain of Lipoprotein Spr from Escherichia coli Structural Evidence for a Novel Cysteine Peptidase Catalytic Triad, Biochemistry, 2008, 47, 9715-9717]).

따라서, 돌연변이된 spr 유전자는 하기를 포함할 수 있다: C94에 대한 돌연변이; 또는 H145에 대한 돌연변이; 또는 H157에 대한 돌연변이; 또는 C94 및 H145에 대한 돌연변이; 또는 C94 및 H157에 대한 돌연변이; 또는 H145 및 H157에 대한 돌연변이; 또는 C94, H145 및 H157에 대한 돌연변이.

이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.

C94, H145 및 H157 중 1개, 2개 또는 3개는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, C94, H145, 및 H157 중 1개, 2개 또는 3개는 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다. 따라서, spr 단백질은 돌연변이 C94A, H145A 및 H157A 중 1개, 2개 또는 3개를 가질 수 있다. 일 실시 양태에서, spr 유전자는 미스센스 돌연변이 C94A를 포함하며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 것으로 밝혀졌다. 또 다른 실시 양태에서, spr 유전자는 미스센스 돌연변이 H145A를 포함하며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 것으로 밝혀졌다.

본원에서 치환 돌연변이체의 표기는 문자, 이어서 숫자, 이어서 분자로 이루어진다. 제1 문자는 야생형 단백질에서의 아미노산을 표기한다. 숫자는 아미노산 치환이 이루어진 아미노산 위치를 나타내며, 제2 문자는 야생형 아미노산의 치환에 사용된 아미노산을 표기한다. 일 실시 양태에서, 돌연변이 spr 단백질은 N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산의 돌연변이, 바람직하게는 S95, V98, Y115, D133, V135 및 G147로부터 선택되는 하나 이상의 아미노산의 돌연변이를 포함한다. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다. 따라서, 돌연변이된 spr 유전자는 하기를 포함할 수 있다: N31에 대한 돌연변이; 또는 R62에 대한 돌연변이; 또는 I70에 대한 돌연변이; 또는 Q73에 대한 돌연변이; 또는 S95에 대한 돌연변이; 또는 V98에 대한 돌연변이; 또는 Q99에 대한 돌연변이; 또는 R100에 대한 돌연변이; 또는 L108에 대한 돌연변이; 또는 Y115에 대한 돌연변이; 또는 D133에 대한 돌연변이; 또는 V135에 대한 돌연변이; 또는 L136에 대한 돌연변이; 또는 G140에 대한 돌연변이; 또는 R144에 대한 돌연변이; 또는 G147에 대한 돌연변이. 일 실시 양태에서, 돌연변이 spr 단백질은 하기 아미노산에 대한 다중 돌연변이를 포함한다: S95 및 Y115; 또는 N31, Q73, R100 및 G140; 또는 Q73, R100 및 G140; 또는 R100 및 G140; 또는 Q73 및 G140; 또는 Q73 및 R100; 또는 R62, Q99 및 R144; 또는 Q99 및 R144.

아미노산 N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140, R144 및 G147 중 하나 이상은 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140 및 R144 중 하나 이상은 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다.

일 실시 양태에서, spr 단백질은 하기 돌연변이 중 하나 이상을 포함한다: N31Y, R62C, I70T, Q73R, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D 또는 V135G, L136P, G140C, R144C 및 G147C. 일 실시 양태에서, spr 단백질은 하기 돌연변이 중 하나 이상을 포함한다: S95F, V98E, Y115F, D133A, V135D 또는 V135G 및 G147C. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.

일 실시 양태에서, spr 단백질은 N31Y, R62C, I70T, Q73R, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D 또는 V135G, L136P, G140C, R144C 및 G147C로부터 선택되는 1개의 돌연변이를 갖는다. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.

추가의 실시 양태에서, spr 단백질은 하기로부터 선택되는 다중 돌연변이를 갖는다: S95F 및 Y115F; N31Y, Q73R, R100G 및 G140C; Q73R, R100G 및 G140C; R100G 및 G140C; Q73R 및 G140C; Q73R 및 R100G; R62C, Q99P 및 R144C; 또는 Q99P 및 R144C.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 C94A를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V103E를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 D133A를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V135D를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V135A를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 H145A를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 G147C를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 H157A를 갖는 spr 단백질을 코딩한다.

일 실시 양태에서, 돌연변이 spr 유전자는 H145A, H157A 및 D133A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩한다.

본 발명의 일 실시 양태에서, 임의의 적합한 돌연변이(들)가 spr 유전자에 대하여 이루어질 수 있으며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성한다. 바람직하게는, spr 단백질은 하기 돌연변이 중 하나 이상을 가질 수 있다: N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C, H157A 및 W174R. 일 실시 양태에서, spr 단백질은 돌연변이 W174R을 포함하지 않는다. 바람직하게는, spr 유전자는 상기에 논의된 하나 이상의 돌연변이를 포함한다.

본 발명에 따른 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는다. "야생형 세포와 비교하여 감소된 Tsp 단백질 활성"이라는 표현은, 상기 세포의 Tsp 활성이 야생형 세포의 Tsp 활성과 비교하여 감소됨을 의미한다. 본 세포는 Tsp 활성을 감소시키기 위하여 임의의 적합한 수단에 의해 변형될 수 있다.

일 실시 양태에서, 감소된 Tsp 활성은 Tsp를 코딩하는 내인성 폴리뉴클레오티드 및/또는 결부된 조절 발현 서열의 변형에 의한 것이다. 상기 변형은 Tsp 유전자의 전사 및 번역을 감소시키거나 중지시킬 수 있거나, 또는 야생형 Tsp 단백질과 비교하여 감소된 프로테아제 활성을 갖는 발현 Tsp 단백질을 제공할 수 있다.

일 실시 양태에서, 결부된 조절 발현 서열은 Tsp 발현을 감소시키도록 변형된다. 예를 들어, Tsp 유전자의 프로모터는 상기 유전자의 발현을 방지하도록 돌연변이될 수 있다.

바람직한 실시 양태에서, 본 발명에 따른 세포는 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이 Tsp 유전자를 지닌다.

바람직하게는 염색체 Tsp 유전자가 돌연변이된다.

본원에서 사용될 때, "Tsp 유전자"는 페니실린 결합 단백질-3(Penicillin-binding protein-3; PBP3) 및 파지 테일 단백질 상에 작용할 수 있는 주변 세포질 프로테아제인 프로테아제 Tsp(Prc로도 공지됨)를 코딩하는 유전자를 의미한다. 야생형 Tsp 유전자의 서열은 서열 번호 1에 예시되어 있으며, 야생형 Tsp 단백질의 서열은 서열 번호 2에 예시되어 있다.

돌연변이된 Tsp 유전자 또는 Tsp를 코딩하는 돌연변이된 Tsp 유전자라는 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이 Tsp 유전자 중 어느 하나를 나타낸다.

본 발명의 문맥에서, "감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자"라는 표현은 돌연변이된 Tsp 유전자가 야생형 비돌연변이 Tsp 유전자와 비교하여 완전한 프로테아제 활성을 갖지 않음을 의미한다.

바람직하게는, 돌연변이된 Tsp 유전자는 야생형 비돌연변이 Tsp 단백질의 프로테아제 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하를 갖는 Tsp 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 Tsp 유전자는 프로테아제 활성을 갖지 않는 Tsp 단백질을 코딩한다. 이 실시 양태에서, 세포는 염색체 Tsp에 있어서 결함을 갖지 않으며, 즉, Tsp 유전자 서열은 임의의 형태의 Tsp 단백질의 발현을 방지하도록 결실되지 않았거나 돌연변이되지 않았다.

감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 Tsp 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현된 Tsp 단백질의 프로테아제 활성은 당업계의 임의의 적합한 방법, 예컨대 Tsp의 프로테아제 활성이 테스트된 키일러(Keiler) 등의 문헌[Identification of Active Site Residues of the Tsp Protease* THE JOURNAL OF BIOLOGICAL CHEMISTRY Vol. 270, No. 48, Issue of December 1, pp. 28864-28868, 1995 Kenneth C. Keiler and Robert T. Sauer]에 기술된 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.

Tsp는 잔기 S430, D441 및 K455를 포함하는 활성 부위를 갖는 것으로 키일러 등의 상기 문헌에 보고되었으며, 잔기 G375, G376, E433 및 T452는 Tsp의 구조를 유지하는 데 중요하다. 키일러 등의 상기 문헌은 돌연변이된 Tsp 유전자, S430A, D441A, K455A, K455H, K455R, G375A, G376A, E433A 및 T452A가 검출가능한 프로테아제 활성을 전혀 갖지 않았다는 발견을 보고하고 있다. 돌연변이된 Tsp 유전자 S430C가 야생형 활성의 약 5 내지 10%를 나타냈음이 추가로 보고되어 있다. 따라서, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 Tsp 돌연변이는 잔기 S430, D441, K455, G375, G376, E433 및 T452 중 하나 이상에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다. 바람직하게는, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 Tsp 돌연변이는 활성 부위 잔기 S430, D441 및 K455 중 1개, 2개 또는 모든 3개의 잔기에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.

따라서, 돌연변이된 Tsp 유전자는 하기를 포함할 수 있다: S430에 대한 돌연변이; 또는 D441에 대한 돌연변이; 또는 K455에 대한 돌연변이; 또는 S430 및 D441에 대한 돌연변이; 또는 S430 및 K455에 대한 돌연변이; 또는 D441 및 K455에 대한 돌연변이; 또는 S430, D441 및 K455에 대한 돌연변이.

S430, D441, K455, G375, G376, E433 및 T452 중 하나 이상은, 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 적합한 돌연변이의 예로는 S430A, S430C, D441A, K455A, K455H, K455R, G375A, G376A, E433A 및 T452A가 있다. 돌연변이된 Tsp 유전자는 활성 부위 잔기에 대한 1개, 2개 또는 3개의 돌연변이를 포함할 수 있으며, 예를 들어, 유전자는 하기를 포함할 수 있다: S430A 또는 S430C; 및/또는 D441A; 및/또는 K455A 또는 K455H 또는 K455R.

바람직하게는, Tsp 유전자는 점 돌연변이 S430A 또는 S430C를 갖는다.

본 발명의 문맥에서 "넉아웃 돌연변이 Tsp 유전자"라는 표현은 상기 유전자가, Tsp 단백질에 결함이 있는 세포를 제공하도록 야생형 유전자에 의해 코딩되는 Tsp 단백질의 발현을 방지하는 하나 이상의 돌연변이를 포함함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사되지만 코딩된 단백질로 번역될 수는 없다. 넉아웃 돌연변이 Tsp 유전자는 단백질의 무발현을 야기하기 위하여, 임의의 적합한 방식으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스(nonsense) 돌연변이 및 프레임쉬프트(frameshift) 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.

바람직한 실시 양태에서, Tsp 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 돌연변이되는 것은 아니다. 이 실시 양태에서, Tsp 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함함으로써 Tsp 단백질의 발현을 방지할 수 있다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드들 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. Tsp 유전자는 코딩 서열의 5' 말단에 2개의 ATG 코돈을 포함하며, 하나 또는 둘 모두의 상기 ATG 코돈은 미스센스 돌연변이에 의해 돌연변이될 수 있다. Tsp 유전자는 제2 ATG 코돈(코돈 3)에서 TCG로 돌연변이될 수 있다. Tsp 유전자는 대안적으로 또는 추가로, 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함할 수 있다. 바람직하게는, 넉아웃 돌연변이 Tsp 유전자는 개시 코돈에 대한 미스센스 돌연변이 및 하나 이상의 삽입된 종결 코돈 둘 모두를 포함한다. 바람직한 실시 양태에서, Tsp 유전자는 제5 코돈으로부터 "T"가 결실되도록 돌연변이되며, 이에 의해 프레임쉬프트가 야기되는데 이는 코돈 11 및 16에서 종결 코돈을 생성한다. 바람직한 실시 양태에서, Tsp 유전자는 코돈 21에 제3 프레임내(in-frame) 종결 코돈이 생성되도록 Ase I 제한 부위가 삽입되게 돌연변이된다.

바람직한 실시 양태에서, 넉아웃 돌연변이 Tsp 유전자는 서열 번호 3의 DNA 서열을 가지며, 이는 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAT를 포함한다. 일 실시 양태에서, 돌연변이된 Tsp 유전자는 서열 번호 3의 뉴클레오티드 7 내지 2048의 DNA 서열을 갖는다.

본 발명에서, 세포는 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 하나 이상의 유전자를 또한 지닌다. 예는 FkpA, Skp, SurA, PPiA 및 PPiD와 같은 단백질을 포함한다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질은 FkpA, Skp 또는 이들의 조합이다.

일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질은 FkpA 또는 FkpA와 Skp의 조합으로부터 선택된다.

FkpA는 Swiss-Prot 번호가 P45523인 펩티들-프롤릴 시스-트랜스 이소머라아제이다.

Skp는 Swiss-Prot 번호가 P0AEU7인 샤페론 단백질이다.

단백질 접힘을 용이하게 하기 위한 단백질은 적절할 경우 세포 게놈 내의 유전자 또는 그 안에 일시적으로 형질감염된 것, 예를 들어 플라스미드 상의 유전자 또는 이들의 조합에 의해 코딩될 수 있다.

일 실시 양태에서, 재조합 그람 음성 박테리아 세포는 DsbC를 코딩하는 재조합 폴리뉴클레오티드를 포함하지 않는다.

본 발명의 일 실시 양태에서, 재조합 그람 음성 박테리아 세포는 샤페론 활성 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자 및/또는 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하거나 넉아웃 돌연변이 ptr 유전자인 돌연변이된 ptr 유전자 및/또는 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하거나 넉아웃 돌연변이 OmpT 유전자인 돌연변이된 OmpT 유전자를 추가로 포함한다.

바람직하게는, 이 실시 양태에서, 세포의 게놈은 상기 돌연변이를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.

본원에서 사용될 때, "DegP"는 샤페론 및 프로테아제로서의 이중 기능을 갖는 DegP 단백질(HtrA로도 공지됨)을 코딩하는 유전자를 의미한다(문헌[Families of serine peptidases; Rawlings ND, Barrett AJ. Methods Enzymol. 1994;244:19-61]). 비돌연변이 DegP 유전자의 서열은 서열 번호 7에 예시되어 있으며, 비돌연변이 DegP 단백질의 서열은 서열 번호 8에 예시되어 있다.

낮은 온도에서 DegP는 샤페론으로서의 기능을 하며, 높은 온도에서 DegP는 프로테아제로서의 기능에 대한 선호도를 갖는다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3 , Pages 339 - 347. Spiess C, Beil A, Ehrmann M] 및 문헌[The proteolytic activity of the HtrA (DegP) protein from Escherichia coli at low temperatures, Skorko-Glonek J et al Microbiology 2008, 154, 3649-3658]).

세포가 DegP 돌연변이를 포함하는 실시 양태에서, 세포에서의 DegP 돌연변이는 샤페론 활성을 갖지만 완전한 프로테아제 활성을 갖는 것은 아닌 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자를 제공한다.

본 발명의 문맥에서 "샤페론 활성을 갖는"이라는 표현은, 돌연변이된 DegP 단백질이 야생형 비돌연변이 DegP 단백질과 비교하여 동일하거나 실질적으로 동일한 샤페론 활성을 가짐을 의미한다. 바람직하게는, 돌연변이된 DegP 유전자는 야생형 비돌연변이 DegP 단백질의 샤페론 활성의 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 또는 95% 이상을 갖는 DegP 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 DegP 유전자는 야생형 DegP와 비교하여 동일한 샤페론 활성을 갖는 DegP 단백질을 코딩한다.

본 발명의 문맥에서, "감소된 프로테아제 활성을 갖는"이라는 표현은, 돌연변이된 DegP 단백질이 야생형 비돌연변이 DegP 단백질과 비교하여 완전한 프로테아제 활성을 갖는 것은 아님을 의미한다. 바람직하게는, 돌연변이된 DegP 유전자는 야생형 비돌연변이 DegP 단백질의 프로테아제 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하를 갖는 DegP 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 DegP 유전자는 프로테아제 활성을 전혀 갖지 않는 DegP 단백질을 코딩한다. 세포는 염색체 DegP에 결함이 있는 것이 아니며, 즉, DegP 유전자 서열은 임의의 형태의 DegP 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.

샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 DegP 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현되는 DegP 단백질의 프로테아제 및 샤페론 활성은, DegP의 프로테아제 및 샤페론 활성이 DegP의 천연 기질인 MalS에서 테스트된, 스피에스(Spiess) 등의 문헌에 기술된 방법(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]), 및 또한 문헌[The proteolytic activity of the HtrA (DegP) protein from Escherichia coli at low temperatures, Skorko-Glonek J et al Microbiology 2008, 154, 3649-3658]에 기술된 방법과 같은 임의의 적합한 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.

DegP는 세린 프로테아제이며, His105, Asp135 및 Ser210의 아미노산 잔기의 촉매적 세 작용기로 이루어진 활성 중심을 갖는다(문헌[Families of serine peptidases, Methods Enzymol., 1994, 244:19-61 Rawlings N and Barrett A]). 샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 DegP 돌연변이는 His105, Asp135 및 Ser210 중 1개, 2개 또는 3개에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.

따라서, 돌연변이된 DegP 유전자는 하기를 포함할 수 있다: His105에 대한 돌연변이; 또는 Asp135에 대한 돌연변이; 또는 Ser210에 대한 돌연변이; 또는 His105 및 Asp135에 대한 돌연변이; 또는 His105 및 Ser210에 대한 돌연변이; 또는 Asp135 및 Ser210에 대한 돌연변이; 또는 His105, Asp135 및 Ser210에 대한 돌연변이.

His105, Asp135 및 Ser210 중 1개, 2개 또는 3개는 샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, His105, Asp135 및 Ser210 중 1개, 2개 또는 3개는 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다. 추가의 적합한 돌연변이는 His105, Asp135 및 Ser210을 반대 특성을 갖는 아미노산으로 변화시키는 것이며, 예컨대 Asp135는 Lys 또는 Arg으로 돌연변이되고, 극성 His105는 비극성 아미노산, 예컨대 Gly, Ala, Val 또는 Leu으로 돌연변이되고, 작은 친수성 Ser210은 큰 또는 소수성 잔기, 예컨대 Val, Leu, Phe 또는 Tyr으로 돌연변이된다. 바람직하게는, DegP 유전자는 도 11c에 나타낸 바와 같이, 점 돌연변이 S210A를 포함하며, 이는 샤페론 활성을 갖지만 프로테아제 활성을 갖는 것은 아닌 단백질을 생성하는 것으로 밝혀졌다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 347. Spiess C, Beil A, Ehrmann M]).

DegP는 2개의 PDZ 도메인, PDZ1(잔기 260-358) 및 PDZ2(잔기 359-448)를 가지며, 이는 단백질-단백질 상호작용을 매개한다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]). 본 발명의 일 실시 양태에서, DegP 유전자는 PDZ1 도메인 및/또는 PDZ2 도메인이 결실되도록 돌연변이된다. PDZ1 및 PDZ2의 결실은 야생형 DegP 단백질과 비교하여 저하된 샤페론 활성 및 DegP 단백질의 프로테아제 활성의 완전한 손실로 이어지는 반면, PDZ1 또는 PDZ2 중 어느 하나의 결실은 야생형 DegP 단백질과 비교하여 유사한 샤페론 활성 및 5%의 프로테아제 활성으로 이어진다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]).

또한, 돌연변이된 DegP 유전자는, 예를 들어 도 7c에 예시된 바와 같이, 동정 및 스크리닝 방법을 돕기 위하여 Ase I과 같은 사일런트(silent) 천연 비발생 제한 부위를 포함할 수 있다.

점 돌연변이 S210A 및 Ase I 제한 표지 부위를 포함하는 돌연변이된 DegP 유전자의 바람직한 서열은 서열 번호 9에 제공되어 있으며, 코딩된 단백질 서열은 서열 번호 10에 예시되어 있다.

세포가 샤페론 활성 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자를 포함하는 본 발명의 실시 양태에서, 본 발명에 의해 제공되는 세포 중 하나 이상은 상기 세포로부터의 올바르게 접힌 단백질의 수율이, DegP 유전자가 DegP 발현을 방지하는 넉아웃 DegP, 예컨대 염색체 결함 DegP로 돌연변이된 돌연변이 세포에 비하여, 개선된 것을 제공할 수 있다. DegP 발현을 방지하는 넉아웃 돌연변이 DegP 유전자를 포함하는 세포에서, DegP의 샤페론 활성은 완전히 손실되며, 반면에, 본 발명에 따른 세포에서, DegP의 샤페론 활성은 유지되는 반면 완전한 프로테아제 활성은 손실된다. 이들 실시 양태에서, 본 발명에 따른 하나 이상의 세포는, 숙주 세포에서 상기 단백질의 올바른 접힘 및 수송을 허용하도록 샤페론 활성을 유지하면서 상기 단백질의 단백질 분해를 방지하도록 더욱 낮은 프로테아제 활성을 갖는다.

이들 실시 양태에서, 본 발명에 따른 하나 이상의 세포는 DegP 발현을 방지하는 돌연변이 넉아웃 DegP 유전자를 지닌 세포와 비교하여 세포 성장이 개선될 수 있다. 이론에 구애되고자 함이 없이, 개선된 세포 성장은 샤페론 활성을 필요로 하는 모든 단백질을 상기 세포가 프로세싱하는 능력을 증가시킬 수 있는 샤페론 활성이 유지된 DegP 프로테아제로 인하여 나타날 수 있다. 따라서, 세포의 성장 및 번식에 필요한 올바르게 접힌 단백질의 생성은 DegP 넉아웃 돌연변이를 지닌 세포와 비교하여 본 발명의 세포 중 하나 이상에서 증가됨으로써 성장을 조절하는 세포 경로가 개선될 수 있다. 또한, 공지된 DegP 프로테아제 결실 균주는 일반적으로 온도 민감성이며, 전형적으로 약 28℃보다 높은 온도에서는 성장하지 않는다. 그러나, 본 발명에 따른 세포는 온도 민감성이 아니며, 박테리아로부터의 공업적 규모의 단백질 생성에 전형적으로 사용되는 대략 30℃ 내지 대략 37℃의 온도를 비롯하여 28℃ 이상의 온도에서 성장시킬 수 있다.

본 발명의 일 실시 양태에서, 세포는 돌연변이된 ptr 유전자를 지닌다. 본원에서 사용될 때, "ptr 유전자"는 고분자량 단백질을 분해시키는 프로테아제인 프로테아제 III을 코딩하는 유전자를 의미한다. 비돌연변이 ptr 유전자의 서열은 서열 번호 4에 예시되어 있으며, 비돌연변이 프로테아제 III 단백질의 서열은 서열 번호 5에 예시되어 있다.

돌연변이된 ptr 유전자, 도는 프로테아제 III을 코딩하는 돌연변이된 ptr 유전자의 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하는 돌연변이된 ptr 유전자 또는 넉아웃 돌연변이 ptr 유전자를 나타낸다.

본 발명의 문맥에서 "감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하는 돌연변이된 ptr 유전자"라는 표현은 돌연변이된 ptr 유전자가 야생형 비돌연변이 ptr 유전자와 비교하여 완전한 프로테아제 활성을 갖지 않음을 의미한다.

바람직하게는, 돌연변이된 ptr 유전자는 야생형 비돌연변이 프로테아제 III 단백질의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하의 프로테아제 활성을 갖는 프로테아제 III을 코딩한다. 더 바람직하게는, 돌연변이된 ptr 유전자는 프로테아제 활성을 전혀 갖지 않는 프로테아제 III 단백질을 코딩한다. 이 실시 양태에서, 세포는 염색체 ptr에 결함이 있으며, 즉, ptr 유전자 서열은 임의의 형태의 프로테아제 III 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.

감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 ptr 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현된 프로테아제 III 단백질의 프로테아제 활성은 당업계의 임의의 적합한 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.

본 발명의 문맥에서 "넉아웃 돌연변이 ptr 유전자"라는 표현은 넉아웃 돌연변이 유전자에 의해 코딩되는 단백질에 결함이 있는 세포를 제공하도록 상기 유전자가 하나 이상의 돌연변이를 포함함으로써 상기 유전자에 의해 코딩되는 단백질의 무발현을 야기함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사될 수 있지만, 코딩된 단백질로 번역되는 것은 아닐 수 있다. 상기 넉아웃 돌연변이 ptr 유전자는 단백질의 무발현을 야기하기 위하여, 임의의 적합한 방식으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.

바람직한 실시 양태에서, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 돌연변이되는 것은 아니다. 바람직하게는 프로테아제 III 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함함으로써 프로테아제 III 단백질의 발현을 방지한다.

표적 넉아웃 유전자 개시 코돈에 대한 돌연변이는 개시 코돈의 기능의 손실을 야기하며, 이에 의해, 표적 유전자는 코딩 서열의 개시부에서 적합한 개시 코돈을 포함하지 않음을 보장한다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다.

바람직한 실시 양태에서, ptr 유전자는 ATG 개시 코돈이 ATT로 변화되도록 돌연변이된다.

넉아웃 돌연변이 ptr 유전자는 대안적으로 또는 추가로, 유전자 개시 코돈의 하류에 그리고 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함할 수 있다. 바람직하게는, 넉아웃 돌연변이 ptr 유전자는 개시 코돈에 대한 미스센스 돌연변이 및 하나 이상의 삽입된 종결 코돈 둘 모두를 포함한다.

상기 하나 이상의 삽입된 종결 코돈은 바람직하게는 프레임내 종결 코돈이다. 그러나, 상기 하나 이상의 삽입된 종결 코돈은 대안적으로 또는 추가로, 프레임외(out-of-frame) 종결 코돈일 수 있다. 하나 이상의 프레임외 종결 코돈은 프레임외 개시 코돈이 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 프레임내 개시 코돈으로 변화되는 경우 번역을 종결시키는 데 요구될 수 있다. 상기 하나 이상의 종결 코돈은 넌센스 점 돌연변이 및 프레임쉬프트 돌연변이를 비롯한 임의의 적합한 돌연변이에 의해 도입될 수 있다. 바람직하게는 상기 하나 이상의 종결 코돈은 프레임쉬프트 돌연변이 및/또는 삽입 돌연변이에 의해, 바람직하게는 유전자 서열의 절편을 종결 코돈을 포함하는 서열로 대체함으로써 도입된다. 예를 들어, Ase I 제한 부위가 삽입될 수 있으며, 이는 종결 코돈 TAA를 포함한다.

바람직한 실시 양태에서, ptr 유전자는 도 7a에 예시된 바와 같이, Ase I 제한 부위의 삽입에 의해 프레임내 종결 코돈이 삽입되도록 돌연변이된다. 바람직한 실시 양태에서, 넉아웃 돌연변이 ptr 유전자는 서열 번호 6의 DNA 서열을 갖는다.

상기에 기술된 넉아웃 돌연변이는, 이것이 표적 넉아웃 유전자 부위의 상류 또는 하류의 염색체 DNA에 대하여 최소의 파괴를 야기하거나 파괴를 전혀 야기하지 않고, 관심의 단백질, 특히 치료용 단백질의 발현에 대한 세포의 적합성에 영향을 줄 수 있는, 항생제 내성 마커와 같은 외래 DNA의 삽입 및 보유를 요구하지 않기 때문에 유리하다. 따라서, 본 발명에 따른 세포 중 하나 이상은, 외래 DNA를 유전자 코딩 서열 내에 삽입함으로써 프로테아제 유전자가 넉아웃된 세포와 비교하여 개선된 성장 특성 및/또는 단백질 발현을 나타낼 수 있다.

일 실시 양태에서, 본 발명에 따른 세포는 돌연변이된 OmpT 유전자를 지닌다. 본원에서 사용될 때, "OmpT 유전자"는 외막 프로테아제인 프로테아제 OmpT(외막 프로테아제 T(outer membrane protease T))를 코딩하는 유전자를 의미한다. 야생형 비돌연변이 OmpT 유전자의 서열은 SWISS-PROT P09169이다.

돌연변이된 OmpT 유전자 또는 OmpT를 코딩하는 돌연변이된 OmpT 유전자에 대한 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하는 돌연변이된 OmpT 유전자 또는 넉아웃 돌연변이 OmpT 유전자를 나타낸다.

본 발명의 문맥에서 "감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하는 돌연변이된 OmpT 유전자"라는 표현은 돌연변이된 OmpT 유전자가 야생형 비돌연변이 OmpT 유전자와 비교하여 완전한 프로테아제 활성을 갖는 것은 아님을 의미한다. 돌연변이된 OmpT 유전자는 야생형 비돌연변이 OmpT 단백질의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하의 프로테아제 활성을 갖는 OmpT 단백질을 코딩할 수 있다. 돌연변이된 OmpT 유전자는 프로테아제 활성을 전혀 갖지 않는 OmpT 단백질을 코딩할 수 있다. 이 실시 양태에서, 세포는 염색체 OmpT에 결함이 없으며, 즉, OmpT 유전자 서열은 임의의 형태의 OmpT 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.

감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 OmpT 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현되는 OmpT 단백질의 프로테아제 활성은 당업계의 숙련자에 의해, 당업계의 임의의 적합한 방법에 의해, 예컨대 문헌[Kramer et al., Identification of essential acidic residues of outer membrane protease OmpT supports a novel active site, FEBS Letters 505 (2001) 426-430] 및 문헌[Dekker et al., Substrate Specitificity of the Integral Membrane Protease OmpT Determined by Spatially Addressed Peptide Libraries, Biochemistry 2001, 40, 1694-1701]에 기술된 방법에 의해 용이하게 테스트될 수 있다.

OmpT는 문헌[Kramer et al., Identification of active site serine and histidine residues in Escherichia coli outer membrane protease OmpT FEBS Letters 2000 468, 220-224]에 보고되었으며, 이는 세린, 히스티딘 및 산성 잔기를 알라닌으로 치환하면 Glu27, Asp97, Asp208 또는 His101의 경우 대략 10배의 감소된 활성, Ser99의 경우 대략 500배의 감소된 활성 및 Asp83, Asp85, Asp210 또는 His212의 경우 대략 10000배의 감소된 활성으로 이어짐을 개시하고 있다. 문헌[Vandeputte-Rutten et al., Crystal Structure of the Outer Membrane Protease OmpT from Escherichia coli suggests a novel catalytic site, The EMBO Journal 2001, Vol 20 No 18 5033-5039)에는 Asp83-Asp85 쌍 및 His212-Asp210 쌍을 포함하는 활성 부위를 갖는 것으로 개시되어 있다. 또한, 문헌[Kramer et al., Lipopolysaccharide regions involved in the activation of Escherichia coli outer membrane protease OmpT, Eur. J. Biochem. FEBS 2002, 269, 1746-1752]에는 루프 L4 중 돌연변이 D208A, D210A, H212A, H212N, H212Q, G216K/K217G, K217T 및 R218L 모두가 효소 활성의 부분적인 또는 실질적으로 완전한 손실로 이어짐이 개시되어 있다.

따라서, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 OmpT 돌연변이는 잔기 E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.

E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상은 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상은 알라닌으로 돌연변이될 수 있다. 적합한 돌연변이의 예로는 E27A, D43A, D83A, D85A, D97A, S99A, H101A E111A, E136A, E193A, D206A, D208A, D210A, H212A, H212N, H212Q, G216K, K217G, K217T, R218L 및 E250A가 있다. 일 실시 양태에서, 돌연변이된 OmpT 유전자는 D210A 및 H212A 돌연변이를 포함한다. D210A 및 H212A 돌연변이를 포함하는 적합한 돌연변이된 OmpT 서열은 서열 번호 23에 예시되어 있다.

본 발명의 문맥에서, "넉아웃 돌연변이 OmpT 유전자"라는 표현은 상기 유전자가 하나 이상의 돌연변이를 포함함으로써 상기 유전자에 의해 코딩되는 단백질의 무발현을 야기하여서 넉아웃 돌연변이 유전자에 의해 코딩되는 단백질에 결함이 있는 세포를 제공함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사될 수 있지만, 코딩된 단백질로 번역되는 것은 아닐 수 있다. 넉아웃 돌연변이 OmpT 유전자는 단백질의 무발현을 야기하도록 임의의 적합한 방법으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.

일 실시 양태에서, OmpT 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치한 하나 이상의 종결 코돈에 대한 돌연변이를 포함함으로써 OmpT 단백질의 발현을 방지한다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 적합한 돌연변이 넉아웃 OmpT 서열은 서열 번호 24에 예시되어 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다.

일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 ompT에 결함이 있는 것과 같은 넉아웃 돌연변이 ompT 유전자를 지니지 않는다.

일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 degP에 결함이 있는 것과 같은 넉아웃 돌연변이 DegP 유전자를 지니지 않는다. 일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 돌연변이된 DegP 유전자를 지니지 않는다.

일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 ptr에 결함이 있는 것과 같은 넉아웃 돌연변이 ptr 유전자를 지니지 않는다.

넉아웃 돌연변이를 포함하는 다수의 유전자 엔지니어링된 돌연변이는 성공적으로 돌연변이된 세포의 선발 및 동정을 허용하는 항생제 내성 마커의 사용을 포함한다. 그러나, 상기에 논의된 바와 같이, 항생제 내성 마커를 사용하는 것에 대한 다수의 불리한 점이 있다.

본 발명의 추가의 실시 양태에서, 세포는 항생제 내성 마커를 포함하지 않으며, 항생제 내성 마커를 사용하는 상기의 불리한 점을 극복하고, 여기서, 돌연변이된 Tsp 유전자, 돌연변이된 spr 유전자 및 임의로, 돌연변이된 DegP 유전자 및/또는 돌연변이된 ptr 유전자 및/또는 돌연변이된 OmpT 유전자는 하나 이상의 제한 표지 부위를 포함하도록 돌연변이된다. 제한 부위는 유전자 내로 유전자 엔지니어링되며, 천연 비발생이다. 제한 표지 부위는, 이것이 요구되는 염색체 돌연변이를 포함하는 올바르게 변형된 세포의 스크리닝 및 동정을 허용하기 때문에 유리하다. 돌연변이된 프로테아제 유전자들 중 하나 이상을 지니도록 변형된 세포는 천연 비발생 제한 표지 부위를 포함하는 게놈 DNA의 영역을 증폭시키도록 설계된 올리고뉴클레오티드 쌍을 이용한 세포 용해물로부터의 게놈 DNA의 PCR에 의해 분석될 수 있다. 그 후, 증폭된 DNA는 천연 비발생 제한 표지 부위에서 DNA를 소화시킬 수 있는 적합한 제한 효소와 함께 인큐베이션하기 전 및 상기 인큐베이션 후에 아가로스 겔 전기영동에 의해 분석될 수 있다. 제한 효소와 함께 인큐베이션한 후 DNA 단편의 존재는 세포가 상기 하나 이상의 돌연변이된 유전자를 지니도록 성공적으로 변형되었음을 확인해 주는 것이다.

세포가 서열 번호 6의 DNA 서열을 갖는 넉아웃 돌연변이 ptr 유전자를 지니는 실시 양태에서, 서열 번호 17 및 서열 번호 18에 예시된 올리고뉴클레오티드 프라이머 서열을 이용하여, 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기 영동에 의해 분석하여 게놈 DNA 중 돌연변이된 ptr 유전자의 존재를 확인할 수 있다.

세포가 서열 번호 3의 DNA 서열 또는 서열 번호 3의 뉴클레오티드 7 내지 2048을 갖는 넉아웃 돌연변이 Tsp 유전자를 포함하는 실시 양태에서, 서열 번호 15 및 서열 번호 16에 예시된 올리고뉴클레오티드 프라이머 서열을 사용하여 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기영동에 의해 분석하여 게놈 DNA 중 돌연변이된 Tsp 유전자의 존재를 확인할 수 있다.

세포가 서열 번호 9의 DNA 서열을 갖는 돌연변이된 DegP 유전자를 포함하는 실시 양태에서, 서열 번호 19 및 서열 번호 20에 예시된 올리고뉴클레오티드 프라이머 서열을 사용하여 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기영동에 의해 분석하여 게놈 DNA 중 돌연변이된 DegP 유전자의 존재를 확인할 수 있다.

상기 하나 이상의 제한 부위는 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의한 것을 비롯하여 임의의 적합한 돌연변이에 의해 도입될 수 있다. 제한 부위는 개시 코돈의 돌연변이 및/또는 상기 하나 이상의 종결 코돈을 도입하기 위한 돌연변이에 의해 도입될 수 있으며, 이는 상기에 기술된 바와 같다. 이 실시 양태는, 제한 표지 부위가, 도입된 넉아웃 돌연변이의 직접적인 그리고 독특한 마커이기 때문에 유리하다.

Ase I 제한 부위와 같은 프레임내 종결 코돈을 포함하는 제한 표지 부위가 삽입될 수 있다. 이는, 삽입된 제한 부위가 제한 표지 부위 및 유전자 코딩 서열의 완전한 전사를 방지하기 위한 종결 코돈 둘 모두로서의 역할을 하기 때문에 특히 유리하다. 예를 들어, Ase I 부위의 도입에 의해 종결 코돈이 ptr 유전자에 도입된 실시 양태에서, 이것도 제한 부위를 생성하며, 이는 도 7a에 예시된 바와 같다. 예를 들어, Ase I 부위의 도입에 의해 코돈 21에서 Tsp 유전자에 종결 코돈이 도입된 실시 양태에서, 이것도 제한 부위를 생성하며, 이는 도 7b에 예시된 바와 같다.

제한 표지 부위는 개시 코돈에 대한 돌연변이 및 임의로 하나 이상의 추가의 점 돌연변이에 의해 삽입될 수 있다. 이 실시 양태에서, 제한 표지 부위는 바람직하게는 EcoR I 제한 부위이다. 이는, 개시 코돈에 대한 돌연변이도 제한 표지 부위를 생성하기 때문에 특히 유리하다. 예를 들어, ptr 유전자의 개시 코돈이 ATT로 변화된 실시 양태에서, 이는 EcoR I 마커 부위를 생성하며, 이는 도 11a에 예시된 바와 같다. 예를 들어, 도 1b에 예시된 바와 같이, Tsp 유전자의 개시 코돈(코돈 3)이 ATG로부터 TCG로 변화된 실시 양태에서, AAC로부터 AAT로의 코돈 2의 추가의 점 돌연변이 및 코돈 3의 ATG로부터의 TCG로의 돌연변이는 EcoR I 제한 표지 부위를 생성하며, 이는 도 7b에 예시된 바와 같다.

세포가 돌연변이된 OmpT 유전자를 지니는 본 발명의 실시 양태에서, 상기 하나 이상의 제한 부위는 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의한 것을 비롯하여 임의의 적합한 돌연변이에 의해 도입될 수 있다. 예를 들어, OmpT 유전자가 돌연변이 D210A 및 H212A를 포함하는 실시 양태에서, 이들 돌연변이는 선발 마커로서 사용될 수 있는 사일런트 HindIII 제한 부위를 도입한다.

DegP 유전자 또는 spr 유전자에서, 마커 제한 부위는 사일런트 코돈 변화를 이용하여 도입될 수 있다. 예를 들어, Ase I 부위는 사일런트 제한 표지 부위로서 사용될 수 있으며, 여기서, TAA 종결 코돈은 돌연변이된 DegP 유전자에 대하여 도 7c에 예시된 바와 같이, 프레임외의 것이다.

감소된 프로테아제 활성을 갖는 Tsp 또는 프로테아제 III을 코딩하도록 Tsp 유전자 및/또는 ptr 유전자가 돌연변이된 본 발명의 실시 양태에서, 하나 이상의 마커 제한 부위가 사일런트 코돈 변화를 이용하여 도입될 수 있다.

본 발명에 따른 재조합 그람 음성 박테리아 세포는 임의의 적합한 수단에 의해 생성될 수 있다. 숙련자라면, 염색체 유전자 서열을 돌연변이된 유전자 서열로 대체하는 데 사용될 수 있는 적합한 기술을 알고 있다. 상동 재조합에 의해 숙주 염색체 내로의 통합을 허용하는 적합한 벡터가 이용될 수 있다.

적합한 유전자 대체법은 예를 들어 문헌[Hamilton et al ., New Method for Generating Deletions and Gene Replacements in Escherichia coli, Hamilton C. M. et al ., Journal of Bacteriology Sept. 1989, Vol. 171, No. 9 p 4617-4622], 문헌[Skorupski et al ., Positive selection vectors for allelic exchange, Skorupski K and Taylor R. K., Gene, 1996, 169, 47-52], 문헌[Kiel et al ., A general method for the construction of Escherichia coli mutants by homologous recombination and plasmid segregation, Kiel J.A.K.W. et al, Mol Gen Genet 1987, 207:294-301], 문헌[Blomfield et al ., Allelic exchange in Escherichia coli using the Bacillus subtilis sacB gene and a temperature sensitive pSC101 replicon, Blomfield I. C. et al ., Molecular Microbiology 1991, 5(6), 1447-1457] 및 문헌[Ried et al., An nptI - sacB - sacR cartridge for constructing directed, unmarked mutations in Gram-negative bacteria by marker exchange-eviction mutagenesis, Ried J. L. and Collmer A., Gene 57 (1987) 239-246]에 기술되어 있다. 상동 재조합/대체를 가능하게 하는 적합한 플라스미드는 pKO3 플라스미드이다(문헌[Link et al., 1997, Journal of Bacteriology, 179, 6228-6237]).

성공적으로 돌연변이된 균주는 콜로니 PCR DNA 서열결정 및 콜로니 PCR 제한 효소 지도화를 비롯하여 당업계에 공지된 방법을 이용하여 동정될 수 있다.

세포가 2개 이상의 돌연변이된 염색체 유전자를 포함하는 실시 양태에서, 돌연변이된 유전자는 동일하거나 상이한 벡터 상에서 그람 음성 박테리아 내로 도입될 수 있다.

일 실시 양태에서, 본 발명에 따른 세포는 돌연변이 spr, 감소된 Tsp 및 FkpA, Skp 또는 FkpA와 Skp의 조합의 3가지의 특징적인 돌연변이를 포함한다.

일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, 및 FkpA 유전자로 이루어진다.

일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, 및 Skp 유전자로 이루어진다.

일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, FkpA 유전자 및 Skp 유전자로 이루어진다.

일 실시 양태에서, 항체 또는 이의 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 임의로 포함하는 발현 벡터 내의, FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자(들)로 세포를 일시적으로 형질감염시킨다.

일 실시 양태에서, 항체를 코딩하는 폴리뉴클레오티드 서열 및 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드는 개별 발현 벡터 내에 삽입된다.

중쇄 및 경쇄를 포함하는 생성물의 생성에 있어서, 세포주는 2개의 벡터로 형질전환될 수 있으며, 제1 벡터는 경쇄 폴리펩티드를 코딩하고 제2 벡터는 중쇄 폴리펩티드를 코딩한다. 대안적으로, 단일 벡터가 사용될 수 있으며, 상기 벡터는 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열을 포함한다.

대안적으로, 항체를 코딩하는 폴리뉴클레오티드 서열 및 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드는 1개의 벡터 내에 삽입된다. 바람직하게는, 상기 벡터는 항체의 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열들을 포함한다.

또한 본 발명은 FkpA 및/또는 Skp 및 인간 FcRn에 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 재조합 폴리뉴클레오티드를 포함하는 발현 벡터를 제공한다. 본 발현 벡터는 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 서열 및 상기 항체를 코딩하는 폴리뉴클레오티드를 포함하는 다중시스트론(multi-cistronic) 벡터이다.

다중시스트론 벡터는 벡터 내로의 폴리뉴클레오티드 서열의 반복된 순차적 클로닝을 허용하는 유리한 클로닝 방법에 의해 생성될 수 있다. 상기 방법은 제한 부위의 쌍의 양립가능한 코헤시브(cohesive) 말단, 예컨대 Ase I 및 Nde I 제한 부위의 "AT" 말단을 이용한다. AseI - NdeI 단편과 같은 양립가능한 코헤시브 말단을 갖고 코딩 서열을 포함하는 폴리뉴클레오티드 서열은 Nde I과 같은 벡터 내의 제한 부위 내에 클로닝될 수 있다. 폴리뉴클레오티드 서열의 삽입은 5' 제한 부위를 파괴하지만, 새로운 3' 제한 부위, 예컨대 Nde I을 생성하며, 이는 그 후에, 양립가능한 코헤시브 말단을 포함하는 추가의 폴리뉴클레오티드 서열의 삽입에 사용될 수 있다. 그 후, 상기 공정은 추가의 서열의 삽입을 위하여 반복될 수 있다. 벡터 내로 삽입된 각각의 폴리뉴클레오티드 서열은 개시 코돈을 코딩하는 NdeI 부위, A 풍부 스페이서(spacer), 샤인 달가노(Shine Dalgarno) 리보좀 결합 서열 및 스크리닝을 위한 Ssp I 부위를 포함할 수 있는, 종결 코돈에 대하여 3'인 비코딩 서열을 포함한다.

항체의 경쇄(LC), 항체의 중쇄(HC)를 코딩하는 폴리뉴클레오티드 서열, FkpA 폴리뉴클레오티드 서열 및 추가의 폴리뉴클레오티드 서열을 포함하는 벡터의 생성의 도해가 도 7d에 예시되어 있다.

본 발명에 따른 세포는 바람직하게는 상기에 정의된 발현 벡터를 포함한다.

세포가 하기와 같이 하나 이상의 추가의 단백질, 즉, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질; 예컨대 skp, SurA, PPiA 및 PPiD; 및 임의로, 단백질 분비 또는 전좌를 용이하게 할 수 있는 하나 이상의 단백질, 예컨대 SecY, SecE, SecG, SecYEG, SecA, SecB, FtsY 및 Lep를 또한 발현하는 실시 양태에서, 상기 하나 이상의 추가의 단백질은 FkpA를 코딩하는 폴리뉴클레오티드 및/또는 항체를 코딩하는 폴리뉴클레오티드 서열과 동일한 벡터 내로 삽입된 하나 이상의 폴리뉴클레오티드로부터 발현될 수 있다. 대안적으로, 상기 하나 이상의 폴리뉴클레오티드는 개별 벡터 내로 삽입될 수 있다.

발현 벡터는 상기에 정의된 하나 이상의 발현 카세트를 적합한 벡터 내에 삽입함으로써 생성될 수 있다. 대안적으로, 폴리뉴클레오티드 서열의 발현을 지시하기 위한 조절 발현 서열이 발현 벡터 내에 포함될 수 있으며, 따라서, 폴리뉴클레오티드의 코딩 영역만이 발현 벡터의 완성에 요구될 수 있다.

FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 및/또는 항체를 코딩하는 폴리뉴클레오티드는 세포에 적합한 프로모터의 제어 하에서의 세포에서의 발현을 위하여, 복제가능 벡터, 전형적으로 자율 복제 발현 벡터 내로 삽입되는 것이 적합하다. 다수의 벡터가 이 목적용으로 당업계에 공지되어 있으며, 적절한 벡터의 선택은 핵산의 크기 및 특히 세포 유형에 따라 달라질 수 있다.

본 발명에 따른 폴리뉴클레오티드로 숙주 세포를 형질전환시키는 데 이용될 수 있는 발현 벡터의 예는 하기를 포함한다:

● pBR322 또는 pACYC184와 같은 플라스미드, 및/또는

● 박테리아 파지와 같은 바이러스 벡터

● 트랜스포존(transposon)과 같은 전치 유전 요소

이러한 발현 벡터는 일반적으로 플라스미드의 DNA 복제 기점, 항생제 선발가능 마커, 프로모터 및 전사 종결자 - 다중 클로닝 부위(발현 카세트)에 의해 분리됨 - 및 리보좀 결합 부위를 코딩하는 DNA 서열을 포함한다.

본 발명에서 이용되는 프로모터는 관련 폴리뉴클레오티드에 직접적으로 연결되거나 대안적으로는 적절한 위치에, 예를 들어 관련 폴리펩티드가 삽입될 때 관련 프로모터가 상기 관련 폴리뉴클레오티드에 작용할 수 있도록 하는 벡터 내에 위치할 수 있다. 일 실시 양태에서, 프로모터는 이것이 작용하는 폴리뉴클레오티드의 코딩 부분 앞에 위치하며, 예를 들어, 폴리뉴클레오티드의 각각의 코딩 부분 앞에 관련 프로모터가 위치한다. 본원에서 사용될 때, "앞에"라는 것은 코딩 폴리뉴클레오티드 부분과 관련하여 5' 말단에 프로모터가 위치함을 암시하는 것으로 의도된다.

프로모터는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 프로모터는 lac, tac, trp, phoA, Ipp, Arab, tet 및 T7을 포함한다.

이용되는 하나 이상의 프로모터는 유도성 프로모터일 수 있다. FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 및 항체를 코딩하는 폴리뉴클레오티드가 1개의 벡터 내로 삽입된 실시 양태에서, FkpA 및 항체를 코딩하는 뉴클레오티드 서열들은 단일 프로모터 또는 개별 프로모터들의 제어 하에 있을 수 있다. FkpA 및/또는 Skp 및 항체를 코딩하는 뉴클레오티드 서열들이 개별 프로모터들의 제어 하에 있는 실시 양태에서, 프로모터는 독립적으로 유도성 프로모터일 수 있다.

박테리아 시스템에서 사용하기 위한 프로모터는 또한 일반적으로 샤인 달가노(S.D.) 서열이 관심의 폴리펩티드를 코딩하는 DNA에 작동가능하게 연결된 것을 포함한다. 프로모터는 제한 효소 소화에 의해 박테리아 소스 DNA로부터 제거되고, 요망되는 DNA를 포함하는 벡터 내에 삽입될 수 있다.

바람직하게는 발현 벡터는 항체 또는 이의 항원 결합 단편을 생성하기 위한 2시스트론 메시지(dicistronic message)를 또한 포함하며, 이는 국제 특허 공개 제WO03/048208호 또는 국제 특허 공개 제WO2007/039714호에 기술된 바와 같다(이의 내용은 본원에 참고로 포함됨). 바람직하게는, 상류 시스트론은 항체의 경쇄를 코딩하는 DNA를 함유하며, 하류 시스트론은 상응하는 중쇄를 코딩하는 DNA를 함유하고, 2시스트론형 유전자간 서열(IGS)은 바람직하게는 IGS1(서열 번호 23), IGS2 (서열 번호 24), IGS3 (서열 번호 25) 및 IGS4 (서열 번호 26)로부터 선택되는 서열을 포함한다.

종결자는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 종결자는 rrnB이다.

프로모터 및 종결자를 포함하는 추가의 적합한 전사 조절자 및 단백질 표적화 방법이 문헌["Strategies for Achieving High-Level Expression of Genes in Escherichia coli" Savvas C. Makrides, Microbiological Reviews, Sept 1996, p 512-538]에서 발견될 수 있다.

발현 벡터 내에 삽입된 FkpA 폴리뉴클레오티드는 바람직하게는 FkpA 신호 서열 및 FkpA 코딩 서열을 코딩하는 핵산을 포함한다. 바람직하게는 벡터는 벡터가 하나 이상의 선택된 숙주 세포에서 복제되는 것을 가능하게 하는, 바람직하게는 숙주 염색체와 관계 없이 복제되는 것을 가능하게 하는 핵산 서열을 포함한다. 이러한 서열은 다양한 박테리아에 대하여 공지되어 있다.

일 실시 양태에서, FkpA 및/또는 Skp 및/또는 관심의 단백질은 N-말단 및/또는 C-말단에 히스티딘 태그를 포함한다.

항체 분자는 적합한 신호 서열에 의해 세포로부터 분비되거나 주변 세포질로 표적화될 수 있다. 대안적으로, 항체 분자는 세포의 세포질 내에 축적될 수 있다. 바람직하게는, 항체 분자는 주변 세포질로 표적화된다.

항체를 코딩하는 폴리뉴클레오티드는 또 다른 폴리펩티드, 바람직하게는 신호 서열 또는 성숙 폴리펩티드의 N-말단에 특이적 절단 부위를 갖는 다른 폴리펩티드와의 융합물로서 발현될 수 있다. 선택된 이종성 신호 서열은 숙주 세포에 의해 인식되고 프로세싱되는 것이어야 한다. 천연 또는 진핵 폴리펩티드 신호 서열을 인식하지 못하고 프로세싱하지 못하는 원핵 숙주 세포에 있어서, 신호 서열은 원핵 신호 서열에 의해 치환된다. 적합한 신호 서열은 OmpA, PhoA, LamB, PelB, DsbA 및 DsbC를 포함한다. 세포가 항체의 중쇄 서열을 코딩하는 폴리뉴클레오티드 서열 및 항체의 경쇄를 코딩하는 폴리뉴클레오티드 서열을 포함하는 실시 양태에서, 각각의 폴리뉴클레오티드는 신호 서열, 예컨대 OmpA를 포함할 수 있다.

상기에 열거된 성분들 중 하나 이상을 포함하는 적합한 벡터의 구성은 표준 라이게이션 기술을 이용한다. 단리된 플라스미드 또는 DNA 단편은 절단되고, 테일러링되고(tailored), 요구되는 플라스미드를 생성하는 데 요구되는 형태로 재라이게이션된다. 벡터를 구성할 수 있는 일반적인 방법, 형질감염 방법 및 배양 방법은 당업계의 숙련자에게 공지되어 있다. 이와 관련하여, 문헌["Current Protocols in Molecular Biology", 1999, F. M. Ausubel (ed), Wiley Interscience, New York] 및 문헌[Maniatis Manual produced by Cold Spring Harbor Publishing]을 참조한다.

표준 분자 생물학 기술을 이용하여 항체를 코딩하는 DNA 서열을 제조할 수 있다. 요구되는 DNA 서열은 올리고뉴클레오티드 합성 기술을 이용하여 완전히 또는 부분적으로 합성될 수 있다. 적절할 경우, 부위 지정 돌연변이 유발 및 폴리머라아제 연쇄 반응(PCR) 기술이 사용될 수 있다.

폴리뉴클레오티드와 관련하여 본원에 기술된 본 발명의 실시 양태는, 본 발명의 대안적인 실시 양태, 예를 들어, 본원에서 이용된 성분을 포함하는 숙주 세포, 발현 카세트 및/또는 벡터에 동일하게 적용되는데, 이는 관련 측면이 상기에 적용될 수 있는 한 그러하다.

본 발명에 따른 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열을 추가로 포함할 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 외인성 또는 내인성일 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 숙주의 염색체 내에 통합될 수 있거나, 벡터, 전형적으로 플라스미드 내에 비통합될 수 있다.

일 실시 양태에서, 본 발명에 따른 세포는 관심의 단백질을 발현한다. 본 명세서의 문맥에서 "관심의 단백질"은 발현용 폴리펩티드, 일반적으로 재조합 폴리펩티드를 나타내는 것으로 의도된다. 그러나, 관심의 단백질은 숙주 세포에서 내인성 유전자로부터 발현되는 내인성 단백질일 수 있다.

본원에서 사용될 때, "재조합 폴리펩티드"는 재조합 DNA 기술을 이용하여 구성되거나 생성되는 단백질을 나타낸다. 관심의 단백질은 내인성 단백질과 동일한 외인성 서열 또는 이의 돌연변이된 버전, 예를 들어 약화된 생물학적 활성을 갖는 것, 또는 이의 단편으로서 외인성 벡터로부터 발현된 것일 수 있다. 대안적으로, 관심의 단백질은 숙주 세포에 의해 보통은 발현되지 않는 이종성 단백질일 수 있다.

관심의 단백질은 치료용, 예방용 또는 진단용 단백질을 포함하는 임의의 적합한 단백질일 수 있다.

당업자라면, 당업계에 공지된 방법, 예컨대 단백질 G HPLC, 원편광 이색성, NMR, X선 크리스탈로그래피 및 에피토프 친화성 측정 방법을 이용하여 단백질이 올바르게 접혀져 있는지를 관찰하기 위하여 분비된 단백질을 용이하게 테스트할 수 있다.

일 실시 양태에서, 관심의 단백질은 면역 장애 및/또는 자가면역 질환을 포함하는 질환 또는 장애의 치료에 유용하다.

일 실시 양태에서, 자가면역 질환은 급성 파종성 뇌척수염(Acute Disseminated Encephalomyelitis; ADEM), 급성 괴사성 출혈성 백질뇌염, 애디슨병(Addison's disease), 무감마글로불린혈증, 원형 탈모증, 아밀로이드증, ANCA 연관 혈관염, 강직성 척추염, 항-GBM/항-TBM 신염, 항인지질 증후군(Antiphospholipid syndrome; APS), 자가면역성 혈관 부종, 자가면역성 재생 불량성 빈혈, 자가면역성 자율 신경 실조증, 자가면역성 간염, 자가면역성 고지혈증, 자가면역성 면역 결핍, 자가면역성 내이 질환(Autoimmune inner ear disease; AIED), 자가면역성 심근염, 자가면역성 췌장염, 자가면역성 망막증, 자가면역성 혈소판 감소성 자반 (Autoimmune thrombocytopenic purpura; ATP), 자가면역성 갑상선 질환, 자가면역성 두드러기, 축삭 및 뉴런 신경병증, 발로병(Balo disease), 베체트병(Behcet's disease), 수포성 유사천포창, 심근병증, 캐슬만병(Castleman disease), 셀리악병(Celiac disease), 차가스병(Chagas disease), 만성 피로 증후군, 만성 염증성 탈수초성 다발성 신경병증(CIDP), 만성 재발성 다발성 골수염(Chronic recurrent multifocal osteomyelitis; CRMO), 처그-스트라우스 증후군(Churg-Strauss syndrome), 반흔성 유사천포창/양성 점막성 유사천포창, 크론병(Crohn's disease), 코간 증후군(Cogan's syndrome), 한랭 응집소병, 선천성 심차단, 콕사키성(Coxsackie) 심근염, CREST 질환, 본태성 혼합 한랭 글로불린혈증, 탈수초 신경병증, 포진상 피부염, 피부근염, 데빅병(Devic's disease)(시신경 척수염), 확장성 심근병증, 원판상 루푸스, 드레슬러 증후군(Dressler's syndrome), 자궁내막증, 호산구성 혈관중심성 섬유증, 호산구성 근막염, 결절성 홍반, 실험적 알러지성 뇌척수염, 에반스 증후군(Evans syndrome), 섬유근통, 섬유화성 폐포염, 거대 세포 동맥염(측두 동맥염), 사구체신염, 굿파스튜어 증후군(Goodpasture's syndrome), 육아종 다발혈관염(Granulomatosis with Polyangiitis; GPA)(베게너 육아종증 참조), 그레이브스병(Graves' disease), 길랑-바레 증후군(Guillain-Barre syndrome), 하시모토 뇌척수염(Hashimoto's encephalitis), 하시모토 갑상선염, 용혈성 빈혈, 헤노크-쉔레인 자반증(Henoch-Schonlein purpura), 임신성 포진, 저감마글로불린혈증, 특발성 저보체혈성 세뇨관간질 신염, 특발성 혈소판 감소성 자반(ITP), IgA 신병증, IgG4-연관 질환, IgG4-연관 경화성 질환, 면역조절 리포단백질, 염증성 대동맥류, 염증성 가성 종양, 봉입체 근염, 인슐린 의존성 당뇨병(제1형), 간질성 방광염, 연소성 관절염, 연소성 당뇨병, 카와사키 증후군(Kawasaki syndrome), 쿠트너 종양(Kuttner's tumour), 램버트-이튼 증후군(Lambert-Eaton syndrome), 백혈구파괴 혈관염, 편평 태선, 경화성 태선, 목질 결막염, 선상 IgA 질환(Linear IgA disease; LAD), 루푸스(SLE), 라임병(Lyme disease), 만성, 종격 섬유증, 메니에르병(Meniere's disease), 현미경적 다발성 혈관염, 미쿨리츠 증후군(Mikulicz's syndrome), 혼합성 결합 조직 질환(Mixed connective tissue disease; MCTD), 무렌 궤양(Mooren's ulcer), 무카-하베르만병(Mucha-Habermann disease), 다발성 섬유경화증, 다발성 경화증, 중증 근무력증, 근염, 발작수면, 시신경 척수염(데빅병), 호중구 감소증, 안반흔성 유사천포창, 시신경염, 오르몬드병(Ormond's disease)(후복막 섬유증), 재발성 류마티즘, PANDAS(연쇄상구균과 연관된 소아 자가면역성 신경정신 장애(Autoimmune Neuropsychiatric Disorders Associated with Streptococcus)), 부종양성 소뇌 변성, 파라단백질혈증성 다발성 신경병증, 발작성 야간 혈색소뇨증 (Paroxysmal nocturnal hemoglobinuria; PNH), 패리 롬버그 증후군(Parry Romberg syndrome), 파르소니지-터너 증후군(Parsonnage-Turner syndrome), 평면 부염(주변 포도막염), 심상성 천포창, 대동맥 주위염, 동맥 주위염, 말초 신경병증, 정맥 주위성 뇌척수염, 악성 빈혈, POEMS 증후군, 결절성 다발성 동맥염, 제I형, 제II형 및 제III형 자가면역성 다선 증후군, 류마티스성 다발성 근육통, 다발성 근염, 심근경색 후 증후군, 심낭막 절개술 후 증후군, 프로게스테론 피부염, 원발성 담즙성 간경변증, 원발성 경화성 담관염, 건선, 건선 관절염, 특발성 폐 섬유증, 괴저성 농피증, 순수 적혈구 무형성증, 레이노 현상(Raynaud's phenomenon), 반사성 교감 신경 이영양증, 라이터 증후군(Reiter's syndrome), 재발성 다발성 연골염, 하지 불안 증후군, 후복막 섬유증(오르몬드병), 류마티스열, 류마티스 관절염, 라이델 갑상선염(Riedel thyroiditis), 사르코이드증, 슈미트 증후군(Schmidt syndrome), 공막염, 경피증, 쇼그렌 증후군(Sjogren's syndrome), 정자 및 고환 자가면역, 강직 인간 증후군, 아급성 세균성 심내막염(Subacute bacterial endocarditis; SBE), 수삭 증후군(Susac's syndrome), 교감성 안염, 타카야스 동맥염(Takayasu's arteritis), 측두 동맥염/거대 세포 동맥염, 혈전성, 혈소판 감소성 자반 (TTP), 톨로사-헌트 증후군(Tolosa-Hunt syndrome), 횡단성 척수염, 궤양성 대장염, 미분화 결합 조직 질환(Undifferentiated connective tissue disease; UCTD), 포도막염, 맥관염, 소수포 수포성 피부병, 백반, 발덴스트롬 마크로글로불린혈증(Waldenstrom Macroglobulinaemia), 온형 특발성 용혈성 빈혈 및 베게너 육아종증(현재, 육아종 다발혈관염(GPA)으로 칭해짐)으로부터 선택된다.

일 실시 양태에서, 신경학적 장애는 만성 염증성 탈수초성 다발성 신경병증(CIDP), 길랑-바레 증후군, 파라단백질혈증성 다발성 신경병증, 시신경 척수염(NMO, NMO 스펙트럼 장애 또는 NMO 스펙트럼 질환), 및 중증 근무력증으로부터 선택된다.

일 실시 양태에서, 면역학적 혈액학적 장애는 특발성 혈소판 감소성 자반(ITP), 혈전성 혈소판 감소성 자반(TTP), 온형 특발성 용혈성 빈혈, 굿파스튜어 증후군, 및 항-HLA 항체로 인한 이식 공여자 미스매치(mismatch)로부터 선택된다.

일 실시 양태에서, 질환은 중증 근무력증, 시신경 척수염, CIDP, 길랑-바레 증후군, 파라단백질혈증성 다발성 신경병증, 난치성 간질, ITP/TTP, 용혈성 빈혈, 굿파스튜어 증후군, ABO 미스매치, 루푸스 신염, 신장 맥관염, 경피증, 섬유화성 폐포염, 확장성 심근병증, 그레이브스병, 제I형 당뇨병, 자가면역성 당뇨병, 천포창, 경피증, 루푸스, ANCA 맥관염, 피부근염, 쇼그렌병 및 류마티스 관절염으로부터 선택된다.

일 실시 양태에서, 피부과적 장애는 수포성 유사천포창, 심상성 천포창, ANCA 연관 혈관염 및 확장성 심근병증으로부터 선택된다.

일 실시 양태에서, 본 발명에 따른 항체 또는 단편은 동종이형 기관 또는 조직 이식과 연관된 동종면역 질환 또는 특정한 신생아 병태의 예방 또는 치료에 이용될 수 있다.

단백질은 천연 상태에서 또는 분비 동안, 단백질 분해적으로 민감한 폴리펩티드, 즉, 절단되기 쉽거나, 절단에 민감하거나, 하나 이상의 그람 음성 박테리아, 예컨대 이. 콜라이의 프로테아제에 의해 절단되는 단백질일 수 있다. 일 실시 양태에서, 관심의 단백질은 DegP, 프로테아제 III 및 Tsp로부터 선택되는 프로테아제에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제 Tsp에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP 및 프로테아제 III에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP 및 Tsp에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 Tsp 및 프로테아제 III에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP, 프로테아제 III 및 Tsp에 대하여 단백질 분해적으로 민감하다.

바람직하게는 단백질은 진핵 폴리펩티드이다.

본 발명에 따른 세포에 의해 발현되는 관심의 단백질은 예를 들어 면역원, 2가지의 이종성 단백질을 포함하는 융합 단백질 또는 항체일 수 있다. 관심의 단백질로서 사용하기 위한 항체는 모노클로날(monoclonal) 항체, 다가 항체, 다중 특이성 항체, 인간화 항체, 완전 인간 항체 또는 키메라 항체를 포함한다. 항체는 임의의 종 유래의 것일 수 있지만, 바람직하게는 모노클로날 항체, 인간 항체 또는 인간화 단편으로부터 유래된다. 항체는 임의의 클래스(예를 들어, IgG, IgE, IgM, IgD 또는 IgA) 또는 하위클래스의 면역글로불린 분자로부터 유래될 수 있으며, 예를 들어 마우스, 래트, 상어, 토끼, 돼지, 햄스터, 낙타, 라마, 염소 또는 인간을 포함하는 임의의 종으로부터 수득될 수 있다. 항체 단편의 일부는 1가지 초과의 종으로부터 수득될 수 있으며, 예를 들어, 항체 단편은 키메라 단편일 수 있다. 일 실시예에서, 불변 영역은 한 종으로부터 유래되며, 가변 영역은 또 다른 것으로부터 유래된다.

항체는 전장 중쇄 및 경쇄를 갖는 완전 항체 분자 또는 이의 단편, 예를 들어 VH, VL, VHH, Fab, 변형 Fab, Fab', F(ab')₂, Fv, scFv 단편, 또는 이중 특이성 항체, 예컨대 Fab-dAb 또는 Fab-Fv일 수 있으며, 이는 국제 특허 공개 제WO2009/040562호 및 국제 특허 공개 제WO2010/035012호에 기술된 바와 같다.

일 실시 양태에서, 단백질은 Fab'이다.

항체는 임의의 v적 항원에 대하여 특이적일 수 있다. 항원은 세포 결부된 단백질, 예를 들어 박테리아 세포, 효모 세포, T 세포, 내피 세포 또는 종양 세포와 같은 세포 상의 표면 단백질일 수 있거나, 항원은 용해성 단백질일 수 있다. 관심의 항원은 또한 임의의 의학적 관련 단백질, 예컨대 질환 또는 감염 동안 상향조절되는 단백질, 예를 들어 수용체 및/또는 그의 상응하는 리간드일 수 있다. 세포 표면 단백질의 특별한 예는 유착 분자, 예를 들어 인테그린, 예컨대 β1 인테그린, 예를 들어 VLA-4, E-셀렉틴(selectin), P 셀렉틴 또는 L-셀렉틴, CD2, CD3, CD4, CD5, CD7, CD8, CD11a, CD11b, CD18, CD19, CD20, CD23, CD25, CD33, CD38, CD40, CD40L, CD45, CDW52, CD69, CD134 (OX40), ICOS, BCMP7, CD137, CD27L, CDCP1, CSF1 또는 CSF1-수용체, DPCR1, DPCR1, 두둘린2(dudulin2), FLJ20584, FLJ40787, HEK2, KIAA0634, KIAA0659, KIAA1246, KIAA1455, LTBP2, LTK, MAL2, MRP2, 넥틴-유사2(nectin-like2), NKCC1, PTK7, RAIG1, TCAM1, SC6, BCMP101, BCMP84, BCMP11, DTD, 암배아 항원(carcinoembryonic antigen; CEA), 인간 유지 글로불린(human milk fat globulin; HMFG1 및 2), MHC 클래스 I 및 MHC 클래스 II 항원, KDR 및 VEGF, 및 적절할 경우, 이들의 수용체를 포함한다.

용해성 항원은 인터류킨, 예컨대 IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-8, IL-12, IL-13, IL-14, IL-16 또는 IL-17, 예컨대 IL17A 및/또는 IL17F, 바이러스 항원, 예를 들어 호흡기 세포융합 바이러스 또는 시토메갈로바이러스(cytomegalovirus) 항원, 면역글로불린, 예컨대 IgE, 인터페론, 예컨대 인터페론 α, 인터페론 β 또는 인터페론 γ, 종양 괴사 인자 TNF(이전에는 종양 괴사 인자-α로 공지됨), 종양 괴사 인자-β, 콜로니 자극 인자, 예컨대 G-CSF 또는 GM-CSF, 및 혈소판 유래 성장 인자, 예컨대 PDGF-α 및 PDGF-β 및 적절할 경우 이들의 수용체를 포함한다. 다른 항원은 박테리아 세포 표면 항원, 박테리아 독소, 바이러스, 예컨대 인플루엔자, EBV, HepA, B 및 C, 바이오테러 에이전트(bioterrorism agent), 방사성 핵종 및 중금속, 및 뱀 및 거미 독 및 독소를 포함한다.

일 실시 양태에서, 항원은 FcRn이다.

본 발명에서 사용하기 위한 항체는 당업계에 공지된 임의의 적합한 방법을 이용하여 수득될 수 있다. 폴리펩티드를 (재조합적으로 또는 천연적으로) 발현하는 세포(예컨대 활성화 T 세포)를 포함하는, 융합 단백질을 포함하는 FcRn 폴리펩티드/단백질 및 이의 돌연변이체를 사용하여 항체를 생성할 수 있으며, 이 항체는 FcRn을 특이적으로 인식한다. 폴리펩티드는 '성숙' 폴리펩티드 또는 이의 생물학적 활성 단편 또는 유도체일 수 있다. 인간 단백질은 Swiss-Prot에 번호 P55899로 등록되어 있다. 일 실시 양태에서, 면역원은 FcRn 알파 사슬 또는 이의 단편이다.

숙주의 면역화에 사용하기 위한 폴리펩티드는 발현 시스템을 포함하는 유전자 엔지니어링된 숙주 세포로부터, 당업계에 공지된 방법에 의해 제조될 수 있거나, 상기 폴리펩티드는 천연 생물 소스로부터 회수될 수 있다. 본 출원에서, "폴리펩티드"라는 용어는 펩티드, 폴리펩티드 및 단백질을 포함한다. 이들은 달리 특정되지 않으면, 상호교환가능하게 사용된다. FcRn 폴리펩티드는 일부의 경우에, 예를 들어 친화성 태그에 융합된 융합 단백질과 같은 더욱 큰 단백질의 일부일 수 있다.

FcRn 폴리펩티드에 대하여 생성되는 항체는, 동물의 면역화가 필요한 경우, 공지된 그리고 일상적인 프로토콜을 이용하여, 동물, 바람직하게는 비인간 동물에게 상기 폴리펩티드를 투여함으로써 수득될 수 있으며, 예를 들어, 문헌[Handbook of Experimental Immunology, D. M. Weir (ed.), Vol 4, Blackwell Scientific Publishers, Oxford, England, 1986]을 참조한다. 다수의 온혈 동물, 예컨대 토끼, 마우스, 래트, 양, 소, 낙타 또는 돼지가 면역화될 수 있다. 그러나, 마우스, 토끼, 돼지 및 래트가 일반적으로 가장 적합하다.

일 실시 양태에서, 관심의 항원의 활성을 기능적으로 변경시키는 데 사용될 수 있다. 예를 들어, 항체는 상기 항원의 활성을 직접적으로 또는 간접적으로 중화시키거나, 길항시키거나, 작동시킬 수 있거나, 단순히 정상 리간드가 그에 결합하는 것을 차단한다.

또한 본 발명은 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하거나 넉아웃 돌연변이 Tsp 유전자인 돌연변이된 Tsp 유전자, 돌연변이 spr을 코딩하는 돌연변이 spr 유전자, 단백질 접힘을 용이하게 할 수 있는 것 또는 단백질을 발현 또는 과발현시킬 수 있는 유전자 및 FcRn에 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 그람 음성 박테리아 세포를 제공한다.

다양한 항-FcRn 항체 및 단편이 서열 36 내지 서열 74에 예시되어 있다.

일 실시 양태에서, 중쇄는 서열 번호 36, 37 및 38의 서열로부터 독립적으로 선택되는 1개, 2개 또는 3개의 CDR을 포함한다.

일 실시 양태에서, 경쇄는 서열 번호 39, 40 및 41의 서열로부터 독립적으로 선택되는 1개, 2개 또는 3개의 CDR을 포함한다.

일 실시 양태에서, 항체 중쇄는 CDR-H1에 대하여 서열 번호 36에 주어진 서열, CDR-H2에 대하여 서열 번호 37에 주어진 서열 및 CDRH3에 대하여 서열 번호 38에 주어진 서열을 포함한다.

일 실시 양태에서, 항체 경쇄는 CDR-L1에 대하여 서열 번호 39에 주어진 서열, CDR-L2에 대하여 서열 번호 40에 주어진 서열 및 CDRL3에 대하여 서열 번호 41에 주어진 서열을 포함한다.

일 실시 양태에서, 항체 중쇄는 CDR-H1에 대하여 서열 번호 36에 주어진 서열, CDR-H2에 대하여 서열 번호 37에 주어진 서열, CDRH3에 대하여 서열 번호 38에 주어진 서열, CDR-L1에 대하여 서열 번호 39에 주어진 서열, CDR-L2에 대하여 서열 번호 40에 주어진 서열 및 CDRL3에 대하여 서열 번호 41에 주어진 서열을 포함한다.

일 실시 양태에서, 세포는 본원에 개시된 서열을 갖는 항체 분자를 발현한다.

항체 분자는 항체 및 이의 결합 단편을 포함한다.

적합하게는, 본 발명에 따른 인간화 항체는 본원에 구체적으로 제공된 CDR 중 하나 이상 뿐만 아니라 인간 수용 프레임워크(acceptor framework) 영역을 포함하는 가변 도메인도 갖는다. 따라서, 일 실시 양태에서 제공되는 것은 인간 FcRn에 결합하는 인간화 항체이며, 여기서, 가변 도메인은 인간 수용 프레임워크 영역 및 비인간 공여(donor) CDR을 포함한다. 일 실시예에서, 경쇄 가변 도메인은 서열 번호 50에 주어진 서열을 포함하며, 중쇄 가변 도메인은 서열 번호 58에 주어진 서열을 포함한다. 일 실시예에서, 경쇄는 서열 번호 54에 주어진 서열을 포함하며, 중쇄는 서열 번호 62에 주어진 서열을 포함한다.

발현 후, 항체 단편은 예를 들어 또 다른 개체(entity), 예컨대 작용체 분자에의 콘쥬게이션(conjugation)에 의해 추가로 처리될 수 있다.

본원에서 사용될 때, 작용체 분자라는 용어는 예를 들어 항신생물제, 약물, 독소(예컨대 박테리아 또는 식물 기원의 효소 활성 독소 및 이의 단편, 예를 들어 리신 및 이의 단편), 생물학적 활성 단백질, 예를 들어 효소, 다른 항체 또는 항체 단편, 합성 또는 천연 발생 중합체, 핵산 및 이의 단편, 예를 들어 DNA, RNA 및 이들의 단편, 방사성 핵종, 특히 방사성 요오다이드, 방사성 동위 원소, 킬레이팅 금속, 나노입자 및 리포터 그룹(reporter group), 예컨대 형광 화합물 또는 NMR 또는 ESR 분광법에 의해 검출될 수 있는 화합물을 포함한다. 작용체 분자는 임의의 적합한 방법에 의해 항체 또는 이의 단편에 부착될 수 있으며, 예를 들어 항체 단편은 국제 특허 공개 제WO05/003171호 또는 국제 특허 공개 제WO05/003170호(이들의 내용은 본원에 참고로 포함됨)에 기술된 바와 같이 하나 이상의 작용체 분자에 부착하도록 변형될 수 있다. 국제 특허 공개 제WO05/003171호 또는 국제 특허 공개 제WO05/003170호에는 적합한 작용체 분자가 또한 기술되어 있다.

일 실시 양태에서, 요구될 경우, 항체 또는 이의 단편, 예컨대 Fab는 요구되는 특성, 예를 들어 전체 항체와 유사한 특성을 갖는 생성물을 생성하도록 페길화된다(PEGylated). 예를 들어, 항체는 국제 특허 공개 제WO01/094585호에 기술된 바와 같이 페길화 항-TNF-α Fab', 바람직하게는 중쇄의 C-말단의 시스테인 잔기들 중 하나에 라이실-말레이미드 유도된 기가 부착된 것일 수 있으며, 여기서, 라이실 잔기의 2개의 아미노기 각각에는 분자량이 약 20,000 Da인 메톡시폴리(에틸렌글리콜)잔기가 공유 결합되어서, 메톡시폴리(에틸렌글리콜)잔기의 전체 평균 분자량은 약 40,000 Da이 되며, 더 바람직하게는 라이실-말레이미드 유도된 기는 [1-[[[2-[[3-(2,5-디옥소-1-피롤리디닐)-1-옥소프로필]아미노]에틸]아미노]-카르보닐]-1,5-펜탄디일]비스(이미노카르보닐)이다.

일 실시 양태에서, 본 발명에 따른 Fab 또는 Fab'는 인간 혈청 알부민 분자 또는 전분 분자에 콘쥬게이션된다.

세포는 또한 관심의 하나 이상의 추가의 단백질을 코딩하는 추가의 폴리뉴클레오티드 서열을 포함할 수 있다.

일 실시 양태에서, 야생형 형태에서 정제 동안 관심의 재조합 단백질과 동시 정제되는 것으로 공지된 하나 이상의 이. 콜라이 숙주 단백질이 유전자 변형용으로 선택되며, 이는 문헌[Humphreys et al. "Engineering of Escherichia coli to improve the purification of periplasmic Fab' fragments: changing the pI of the chromosomally encoded PhoS/PstS protein", Protein Expression and Purification 37 (2004) 109-118] 및 국제 특허 공개 제WO04/035792호(이들의 내용은 본원에 참고로 포함됨)에 기술된 바와 같다. 이러한 변형된 숙주 단백질의 사용은, 선택된 이. 콜라이 단백질의 물리적 특성의 변경에 의한 이. 콜라이에서 생성된 관심의 단백질, 특히 항체의 정제 공정을 개선시켜서, 상기 숙주 단백질은 더 이상 재조합 항체와 동시 정제되지 않게 된다. 바람직하게는, 변경되는 이. 콜라이 단백질은 포스페이트 결합 단백질(PhoS/PstS), 디펩티드 결합 단백질(DppA), 말토스 결합 단백질(MBP) 및 티오레독신(Thioredoxin) 중 하나 이상으로부터 선택된다.

일 실시 양태에서, 오염 숙주 단백질의 물리적 특성은 아미노산 태그를 C-말단 또는 N-말단에 부가함으로써 변경된다. 바람직한 실시 양태에서, 변경되는 물리적 특성은 등전점이며, 아미노산 태그는 C-말단에 부착되는 폴리아스파르트산 태그이다. 일 실시 양태에서, 상기 태그의 부가에 의해 변경되는 이. 콜라이 단백질은 디펩티드 결합 단백질(DppA), 말토스 결합 단백질(MBP), 티오레독신 및 포스페이트 결합 단백질(PhoS/PstS)이다. 구체적인 일 실시 양태에서, 이. 콜라이 포스페이트 결합 단백질(PhoS/PstS)의 pI는 6개의 아스파르트산 잔기를 포함하는 폴리아스파르트산 태그(폴리D)를 C-말단에 부가함으로써 7.2로부터 5.1까지 감소된다.

또한 바람직한 것은 오염 이. 콜라이 단백질의 특정 잔기를 그의 물리적 특성이 변경되도록 변형시키는 것이며, 이는 단독으로 또는 N 또는 C 말단 태그의 부가와 조합하여 그렇게 한다. 이러한 변화는 단백질의 크기 또는 아미노산 치환을 변경시켜서 pI 또는 소수성을 변경시키기 위한 삽입 또는 결실을 포함할 수 있다. 일 실시 양태에서, 이들 잔기는 단백질의 표면 상에 위치한다. 바람직한 실시 양태에서, PhoS 단백질의 표면 잔기는 단백질의 pI를 감소시키기 위하여 변경된다. 바람직하게는, 포스페이트 결합에 중요한 것으로 시사된 잔기(바스(Bass), 미국 특허 제5,304,472호)는 기능성 PhoS 단백질을 유지하기 위하여 회피된다. 바람직하게는, 단백질의 표면 밖으로 멀리 돌출된 또는 염기성 잔기의 큰 기 내에 또는 그 가까이에 있는 라이신 잔기 가 표적화된다. 일 실시 양태에서, PhoS 단백질은 헥사 폴리아스파르트산 태그가 C-말단에 부착된 것을 갖는 반면, 상기 분자의 반대쪽 말단의 표면 잔기는 치환용으로 표적화된다. 바람직하게는 선택된 라이신 잔기는, 중성 잔기를 산성인 것으로 변화시킬 때보다 더욱 큰 잠재적 pI 변화를 부여하기 위하여 글루탐산 또는 아스파르트산으로 치환된다. 본원에서 치환 돌연변이체의 표기는 문자, 이어서 숫자, 이어서 문자로 이루어진다. 제1 문자는 야생형 단백질 중의 아미노산을 표기한다. 숫자는 아미노산 치환이 이루어지고 있는 아미노산 위치를 나타내며, 제2 문자는 야생형 아미노산의 대체에 사용되는 아미노산을 표기한다. 본 발명에서 PhoS의 바람직한 돌연변이에서, 라이신 잔기(K) 275, 107, 109, 110, 262, 265, 266, 309, 313은 단일 돌연변이 또는 조합된 돌연변이로서 글루탐산(E) 또는 글루타민(Q)으로 치환되며, 게다가, 라이신(K)318은 단일 돌연변이 또는 조합된 돌연변이로서 아스파르트산(D)으로 치환될 수 있다. 바람직하게는 단일 돌연변이로는 K262E, K265E 및 K266E가 있다. 바람직하게는 조합된 돌연변이로는 K265/266E 및 K110/265/266E가 있다. 더 바람직하게는, 모든 돌연변이는 C-말단에 부착된 폴리아스파르트산(폴리D), 및 임의로 또한 K318D 치환과 조합된다. 바람직한 실시 양태에서, 돌연변이는 pI를 2 이상의 단위로 감소시킨다. 바람직하게는, 본 발명의 돌연변이는 PhoS의 pI를 7.2로부터 약 4 내지 약 5.5까지 감소시킨다. 본 발명의 일 실시 양태에서, 이. 콜라이의 PhoS 단백질의 pI는 각각 돌연변이 폴리D K318D, 폴리D K265/266E 및 폴리D K110/265/266E를 이용하여 7.2로부터 약 4.9까지, 약 4.8까지 그리고 약 4.5까지 감소된다.

관심의 단백질을 코딩하는 폴리뉴클레오티드는 또 다른 폴리펩티드, 바람직하게는 신호 서열 또는 성숙 폴리펩티드의 N-말단에 특이적 절단 부위를 갖는 다른 폴리펩티드와의 융합물로서 발현될 수 있다. 선택된 이종성 신호 서열은 숙주 세포에 의해 인식되고 프로세싱되는 것이어야 한다. 천연 또는 진핵 폴리펩티드 신호 서열을 인식하지 못하고 프로세싱하지 못하는 원핵 숙주 세포에 있어서, 신호 서열은 원핵 신호 서열에 의해 치환된다. 적합한 신호 서열은 OmpA, PhoA, LamB, PelB, DsbA 및 DsbC를 포함한다.

상기에 열거된 성분들 중 하나 이상을 포함하는 적합한 벡터의 구성은 표준 라이게이션 기술을 이용한다. 단리된 플라스미드 또는 DNA 단편은 절단되고, 테일러링되고, 요구되는 플라스미드를 생성하는 데 요구되는 형태로 재라이게이션된다.

일 실시 양태에서, 전형적으로 관심의 하나 이상의 단백질을 코딩하는 하나 이상의 단백질 코딩 서열 및 하나 이상의 조절 발현 서열을 포함하는, 관심의 단백질을 코딩하는 폴리뉴클레오티드를 지니는 발현 카세트가 본 발명에서 이용된다. 상기 하나 이상의 조절 발현 서열은 프로모터를 포함할 수 있다. 상기 하나 이상의 조절 발현 서열은 또한 3' 비번역 영역, 예컨대 종결 서열을 포함할 수 있다. 적합한 프로모터는 하기에 더욱 상세하게 논의된다.

일 실시 양태에서, 본 발명에 따른 세포는 벡터, 예컨대 플라스미드를 포함한다. 벡터는 바람직하게는 상기에 정의된 발현 카세트들 중 하나 이상을 포함한다.

관심의 단백질이 중쇄 및 경쇄 둘 모두를 포함하는 항체인 실시 양태에서, 세포주는 2개의 벡터로 형질감염될 수 있는데, 제1 벡터는 경쇄 폴리펩티드를 코딩하고 제2 벡터는 중쇄 폴리펩티드를 코딩한다. 대안적으로, 단일 벡터가 사용될 수 있으며, 이 벡터는 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열을 포함한다.

본 발명에서 사용하기 위한 벡터는 상기에 정의된 발현 카세트를 적합한 벡터 내에 삽입함으로써 제조될 수 있다. 대안적으로, 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열의 발현을 지시하기 위한 조절 발현 서열이 벡터 내에 함유될 수 있으며, 따라서, 상기 폴리뉴클레오티드의 코딩 영역만이 벡터를 완성하는 데 요구될 수 있다.

본 발명에 따른 폴리뉴클레오티드로 숙주 세포를 형질감염시키는 데 이용될 수 있는 벡터의 예는 하기를 포함한다: 플라스미드, 예컨대 pBR322 또는 pACYC184, 및/또는 바이러스 벡터, 예컨대 박테리아 파지, 전치 유전 요소, 예컨대 트랜스포존.

많은 형태의 발현 벡터가 이용가능하다. 이러한 벡터는 일반적으로 플라스미드의 DNA 복제 기점, 항생제 선발가능 마커, 프로모터 및 전사 종결자 - 다중 클로닝 부위(발현 카세트)에 의해 분리됨 - 및 리보좀 결합 부위를 코딩하는 DNA 서열을 포함한다.

이용되는 하나 이상의 프로모터는 유도성 프로모터일 수 있다.

박테리아 시스템에서 사용하기 위한 발현 단위는 또한 일반적으로 샤인 달가노(S.D.) 리보좀 서열이 관심의 폴리펩티드를 코딩하는 DNA에 작동가능하게 연결된 것을 포함한다.

바람직하게는 발현 벡터는 항체 또는 이의 항원 결합 단편을 생성하기 위한 2시스트론 메시지를 또한 포함하며, 이는 국제 특허 공개 제WO03/048208호 또는 국제 특허 공개 제WO2007/039714호에 기술된 바와 같다(이의 내용은 본원에 참고로 포함됨). 바람직하게는, 상류 시스트론은 항체의 경쇄를 코딩하는 DNA를 함유하며, 하류 시스트론은 상응하는 중쇄를 코딩하는 DNA를 함유하고, 2시스트론형 유전자간 서열(IGS)은 바람직하게는 IGS1(서열 번호 38), IGS2 (서열 번호 39), IGS3 (서열 번호 40) 및 IGS4(서열 번호 41)로부터 선택되는 서열을 포함한다.

본 발명은 또한, 본 발명의 제1 또는 제2 측면에서 상기에 기술된 바와 같이 재조합 그람 음성 박테리아 세포에서 관심의 재조합 단백질을 발현시키는 단계를 포함하는, 관심의 재조합 단백질을 제조하는 방법을 제공한다.

본 발명의 방법에서 바람직하게 이용되는 관심의 단백질 및 그람 음성 박테리아 세포는 상기에 상세하게 기술되어 있다.

관심의 단백질을 코딩하는 폴리뉴클레오티드가 외인성일 때, 폴리뉴클레오티드는 당업계에 공지된 임의의 적합한 수단을 이용하여 숙주 세포 내에 포함될 수 있다. 전형적으로, 폴리뉴클레오티드는 세포를 형질전환시키는 발현 벡터의 일부로서 포함된다. 따라서, 일 측면에서, 본 발명에 따른 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함한다.

표준 기술을 이용하여, 예를 들어 염화루비듐, PEG 또는 전기천공을 이용하여 세포를 폴리뉴클레오티드 서열로 형질전환시킬 수 있다.

또한 본 발명에 따른 방법은 관심의 단백질을 코딩하는 폴리뉴클레오티드로 성공적으로 형질전환된 안정한 세포의 선발을 용이하게 하기 위하여 선발 시스템을 이용할 수 있다. 선발 시스템은 전형적으로, 선발 마커를 코딩하는 폴리뉴클레오티드 서열의 동시 형질전환을 이용한다. 일 실시 양태에서, 세포를 형질전환시키는 각각의 폴리뉴클레오티드는 하나 이상의 선발 마커를 코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다. 따라서, 관심의 단백질을 코딩하는 폴리뉴클레오티드 및 마커를 코딩하는 상기 하나 이상의 폴리뉴클레오티드의 형질전환은 함께 일어나며, 선발 시스템은 요망되는 단백질을 생성하는 세포를 선발하는 데 이용될 수 있다.

상기 하나 이상의 마커를 발현할 수 있는 세포는 특정한 인공적 부과 조건 하에서, 예를 들어 독소 또는 항생제의 첨가 하에서 생존/성장/증대가 가능하며, 그 이유는 그 안에 포함된 선발 시스템의 폴리펩티드/유전자 또는 폴리펩티드 성분에 의해 부여되는 특성(예를 들어, 항생제 내성) 때문이다. 상기 하나 이상의 마커를 발현할 수 없는 세포는 인공적 부과 조건에서 생존/성장/증대가 가능하지 않다. 인공적 부과 조건은 요구될 경우, 다소 격렬하도록 선택될 수 있다.

임의의 적합한 선발 시스템이 본 발명에서 이용될 수 있다. 전형적으로, 선발 시스템은 공지된 항생제에 대한 내성을 제공하는 하나 이상의 유전자, 예를 들어 테트라사이클린, 클로람페니콜, 카나마이신 또는 암피실린 내성 유전자를 벡터 내에 포함시키는 것을 기반으로 할 수 있다. 관련 항생제의 존재 하에 성장하는 세포는, 상기 세포가 항생제에 대한 내성을 제공하는 유전자 및 요망되는 단백질 둘 모두를 발현함에 따라 선발될 수 있다.

일 실시 양태에서, 본 발명에 따른 방법은 형질전환된 세포를 배지 중에서 배양함으로써 관심의 단백질을 발현시키는 단계를 추가로 포함한다.

유도성 발현 시스템 또는 구성적(constitutive) 프로모터를 본 발명에서 사용하여 관심의 단백질을 발현시킬 수 있다. 적합한 유도성 발현 시스템 및 구성적 프로모터는 당업계에 공지되어 있다.

임의의 적합한 배지를 사용하여 형질전환 세포를 배양할 수 있다. 배지는 특정한 선발 시스템용으로 개조될 수 있으며, 예를 들어 배지는 성공적으로 형질전환된 세포만이 배지 중에서 성장시키기 위하여 항생제를 포함할 수 있다.

배지로부터 수득된 세포는 요구될 경우 추가로 스크리닝되고/되거나 정제될 수 있다. 본 방법은 요구될 경우, 관심의 단백질을 추출 및 정제하는 하나 이상의 단계를 추가로 포함할 수 있다.

폴리펩티드는 세포질, 주변 세포질 또는 상청액으로부터 회수되는 것을 비롯하여, 균주로부터 회수될 수 있다.

일 실시 양태에서, 항체는 주변 세포질로부터 단리된다.

일 실시 양태에서, 유도 후 공급량은 5 내지 7.5 g/h의 범위, 예컨대 약 7 g/h이다.

단백질 정제에 사용되는 특정한 방법(들)은 단백질의 유형에 따라 달라진다. 적합한 방법은 면역 친화성 또는 이온 교환 컬럼에서의 분획화; 에탄올 침전; 역상 HPLC; 소수성 상호작용 크로마토그래피; 실리카에서의 크로마토그래피; 이온 교환 수지, 예컨대 S-세파로스(SEPHAROSE) 및 DEAE에서의 크로마토그래피; 크로마토포커싱(chromatofocusing); 황산암모늄 침전; 및 겔 여과를 포함한다.

적합하게는 항체는 예를 들어 단백질 A-세파로스, 단백질 G 크로마토그래피, 단백질 L 크로마토그래피, 티오필릭(thiophilic), 혼합 모드 수지, His 태그, FLAGTag, 히드록실아파타이트 크로마토그래피, 겔 전기영동, 투석, 친화성 크로마토그래피, 황산암모늄, 에탄올 또는 PEG 분획화/침전, 이온 교환 막, 확장 층 흡착 크로마토그래피(expanded bed adsorption chromatography; EBA) 또는 시뮬레이션 이동 층 크로마토그래피와 같은 통상적인 항체 정제 절차에 의해 배양 배지 및/또는 세포질 추출물 및/또는 주변 세포질 추출물로부터 분리될 수 있다.

또한 본 방법은 관심의 단백질의 발현량을 측정하고 높은 발현 수준의 관심의 단백질을 갖는 세포를 선발하는 추가의 단계를 포함할 수 있다.

또한 본 방법은 관심의 단백질, 예컨대 항체 또는 항체 단편의 페길화와 같은 하나 이상의 추가의 하류 프로세싱 단계를 포함할 수 있다.

본원에 기술된 하나 이상의 방법 단계들은 적합한 용기, 예컨대 생물반응기에서 조합되어 수행될 수 있다.

본 발명에 따른 항체 및 단편은 치료 또는 예방에서 이용될 수 있다.

기술적으로 적절할 경우 본 발명의 실시 양태들은 조합될 수 있다. 실시 양태는 특정한 특징/요소를 포함하는 것으로 본원에 기술된다. 또한 본 발명은 상기 특징/요소로 이루어지거나 실질적으로 이루어진 개별 실시 양태들까지 연장된다. 본원의 기술적 참고 문헌, 예컨대 특허 및 특허 출원은 본원에 참고로 포함된다.

본 발명은 하기 실시예에서 단지 에시로서 추가로 기술되는데, 실시예는 첨부된 도면을 참조한다.

실시예

실시예 1: 세포주의 생성

MXE016 및 MXE017은 국제 특허 공개 제WO2011/086136호에 제시되어 있다.

항-FcRn Fab' 발현용 플라스미드 및 FkpA를 포함하는 항-FcRn Fab', skp를 포함하는 항-FcRn Fab' 및 FkpA와 skp 둘 모두를 포함하는 항-FcRn Fab 발현용 플라스미드의 생성

항-FcRn Fabdml 중쇄 및 경쇄 서열(각각 서열 번호 63 및 55) 둘 모두를 포함하는 플라스미드를 구성하였다. 문헌[Sambrook et al 1989, Molecular cloning: a laboratory manual. CSHL press, N.Y.]에서 발견될 수 있는 통상적인 제한효소 클로닝 방법을 이용하여 플라스미드 pTTOD 1519.g57 Fab'를 구성하였다. 플라스미드 pTTOD 1519.g57 Fab'는 하기 특징을 포함하였다: 강력한 tac 프로모터 및 lac 오퍼레이터 서열. 상기 플라스미드는 Fab' 중쇄의 코딩 영역 후에 독특한 EcoRI 제한 부위, 이어서 강력한 리보좀 결합 부위를 포함하는 비코딩 서열 및 그 후 독특한 NdeI 제한 부위를 포함하였다.

Fab 경쇄, 중쇄 유전자를 단일 폴리시스트론 메시지로서 전사시켰다. 이. 콜라이 OmpA 단백질로부터의 신호 펩티드를 코딩하는 DNA를 경쇄 및 중쇄 유전자 서열 둘 모두의 5' 말단에 융합시켰는데, 이는 상기 폴리펩티드의 이. 콜라이 주변 세포질로의 전좌를 지시하였다. 이중 전사 종결자 rrnB t1t2를 사용하여 전사를 종결시켰다. lacIq 유전자는 구성적으로 발현되는 Lac I 리프레서 단백질을 코딩하였다. 이는 알로락토스 또는 IPTG의 존재에 의해 탈억제가 유도될 때까지 tac 프로모터로부터의 전사를 억제하였다. 사용한 복제 기점은 p15A였으며, 이는 낮은 카피수(copy number)를 유지하였다. 상기 플라스미드는 항생제 선발을 위하여 테트라사이클린 내성 유전자를 포함하였다.

항-FcRn Fab 및 FkpA(주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' FkpA는 EcoRI 및 NdeI 부위를 이용하여 pTTOD 1519.g57 Fab'의 Fab' 서열의 3' 말단에 FkpA를 라이게이션시킴으로써 구성하였다(도 7d 참조). FkpA(서열 번호 30)를 2개의 Puv II 부위, 1개의 SfuI 부위, 1개의 BamHI 부위 및 1개의 EcoRI이 제거되도록 합성에 의해 구성하여서, 새로운 구성물이 5' EcoRI 부위, 이어서 강력한 리보좀 결합 부위, 이어서 FkpA의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 및 마지막으로 강력한 리보좀 결합 부위, 이어서 비코딩 NdeI 부위를 코딩하게 하였다. EcoRI-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 3개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄 및 FkpA가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.

항-FcRn Fab 및 Skp(주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' Skp는 EcoRI 및 NdeI 부위를 이용하여 플라스미드 pTTOD 1519.g57 Fab'의 Fab' 서열의 3' 말단에 skp를 라이게이션시킴으로써 구성하였다. skp(서열 번호 34)를 4개의 Pst I 부위 및 1개의 EcoR V 부위가 제거되도록 합성에 의해 구성하여서, 새로운 구성물이 5' EcoRI 부위, 이어서 강력한 리보좀 결합 부위, 이어서 Skp의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 및 마지막으로 강력한 리보좀 결합 부위, 이어서 비코딩 NdeI 부위를 코딩하게 하였다. EcoRI-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 3개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄 및 skp가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.

항-FcRn Fab, FkpA 및 Skp(둘 모두 주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' FkpA Skp는 NdeI 부위를 이용하여 FkpA 서열의 3' 말단에서, Skp를 플라스미드 pTTOD 1519.g57 Fab' FkpA 내로 라이게이션시킴으로써 구성하였다. Skp(서열 번호 34)를 4개의 Pst I 부위 및 1개의 EcoR V 부위가 제거되도록 합성에 의해 구성하여서, 구성물이 skp의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 을 포함하는 5' Ase I 부위 및 마지막으로 비코딩 NdeI 부위를 코딩하게 하였다. Ase I-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 4개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄, FkpA 및 Skp가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.

이. 콜라이 W3110, MXE012(이. 콜라이 W3110 spr H145A), MXE016(이. 콜라이 W3110 ΔTsp, spr C94A) 및 MXE017(이. 콜라이 W3110 ΔTsp, spr H145A)에서의 pTTOD 1519.g57 Fab', pTTOD 1519.g57 Fab' FkpA, pTTOD 1519.g57 Fab' Skp 및 pTTOD 1519.g57 Fab' FkpA skp의 발효

이. 콜라이 균주 W3110, MXE012, MXE016 및 MXE017을 실시예 1에서 생성한 플라스미드 pTTOD 1519.g57 Fab', pTTOD 1519.g57 Fab' FkpA, pTTOD 1519.g57 Fab' Skp 및 pTTOD 1519.g57 Fab' FkpA skp로 형질전환시켰다. 상기 균주들의 형질전환은 문헌[Chung C.T et al Transformation and storage of bacterial cells in the same solution. PNAS 86:2172-2175 (1989)]에서 발견되는 방법을 이용하여 실시하였다. 이들 형질전환된 균주를 발효에 의해 발현에 대하여 테스트하였다.

실시예 2: Fab' 발현에 대한 샤페론의 영향: 도 1에 나타낸 균주를 1 L 및 2.5 L 발효 실험에서 테스트하여 Fab'의 발현을 비교하였다.

성장 배지, 접종 및 발효 단계. 발효 공정은 세포 은행의 바이알로부터 접종물을 준비하고, 몇몇 사전 배양 단계(플라스크 및 반응기)를 통하여 증폭시킨 후 생산 발효기에 접종함으로써 개시하였다. 생산 발효기에서, 세포를 규정 배지에서 배치식 및 유가식으로 고밀도로 성장시켰다. 요망되는 세포 밀도에 도달했을 때, Fab'의 발현을 IPTG의 첨가에 의해 유도하였다. Fab' 발현은 이. 콜라이 주변 세포질 공간으로 표적화되는데, 여기서 Fab'는 유도기의 코스 내내 축적된다. 탄소원 공급물을 유도기 동안 적용하여 발현 및 세포 성장을 제어하였다. 온도, 용존 산소(pO₂) 및 pH를 제어하여 배양을 최적 배양 조건 내에서 유지하였다.

바이오매스 ( biomass ) 농도 및 성장 속도의 측정. 바이오매스를 600 nm에서의 배양물의 광학 밀도의 측정에 의해 결정하였다.

주변 세포질 추출. 세포를 원심분리에 의해 배양 샘플로부터 수집하였다. 상청액 분획물을 추가의 분석용으로 보유하였다(-20℃). 세포 펠렛 분획물을 추출 완충제(100 mM 트리스(Tris)-HCl, 10 mM EDTA; pH 7.4) 중에 원래 배양 부피로 재현탁하였다. 60℃에서 대략 10 내지 12시간 동안 인큐베이션한 후, 추출물을 원심분리에 의해 청징화하고, 상청액 분획물을 신선하게 사용하거나 분석용으로 보유하였다(-20℃).

Fab' 정량화. 주변 세포질 추출물 및 배양 상청액 중 Fab'의 농도를 단백질 G HPLC를 이용하여 측정하였다. 하이트랩(HiTrap) 단백질-G HP 1 ml 컬럼(지이-헬스케어(GE-Healthcare), 또는 등가물)에 2 ml/min으로 분석물을 로딩하고(대략 중성 pH, 30℃, 0.2 ㎛ 여과), 컬럼을 20 mM 포스페이트, 50 mM NaCl(pH 7.4)로 세척하고, 그 후, Fab'를 50 mM 글리신/HCl(pH 2.7)의 주입을 이용하여 용출시켰다. 용출된 Fab'를 애질런트(Agilent) 1100 또는 1200 HPLC 시스템에서 A280에 의해 측정하고, 공지된 농도의 정제된 Fab' 단백질의 표준 곡선을 참고로 하여 정량화하였다.

도 1은 숙주 세포와 "샤페론"의 다양한 조합을 이용하여 수행한 5 L 규모의 46가지의 발효의 결과를 나타낸다. W3110은 야생형 이. 콜라이 균주이다. 다양한 조합은 다음과 같았다: 샤페론을 포함하지 않는 야생형, FkpA 및 Skp를 포함하는 야생형, 국제 특허 공개 제WO2011/086136호에 공개된 MXE016 돌연변이 spr 및 Δ Tsp, MXE016 및 FkpA, MXE016 및 Skp, MXE016 및 FkpA 및 Skp, 국제 특허 공개 제WO2011/086136호에 개시된 MXE017, MXE017 및 FkpA 및 Skp.

그 결과는, MXE016, MXE016 및 FkpA, MXE016 및 FkpA 및 Skp, 및 MXE017 및 FkpA 및 Skp가 최상의 발현 수준을 보여 주었음을 나타낸다.

실시예 3: 유도 후 공급량의 영향

3가지의 상이한 유도 후 공급량, 5.4, 6.0 및 7.0 g/h의 영향을 MXE016 및 MXE016 + FkpA에서 테스트하였다.

성장 배지, 접종 및 발효 단계. 발효 공정은 세포 은행의 바이알로부터 접종물을 준비하고, 몇몇 사전 배양 단계(플라스크 및 반응기)를 통하여 증폭시킨 후 생산 발효기에 접종함으로써 개시하였다. 생산 발효기에서, 세포를 규정 배지에서 배치식 및 유가식으로 고밀도로 성장시켰다. 요망되는 세포 밀도에 도달했을 때, Fab'의 발현을 IPTG의 첨가에 의해 유도하였다. Fab' 발현은 이. 콜라이 주변 세포질 공간으로 표적화되는데, 여기서 Fab'는 유도기의 코스 내내 축적된다. 탄소원 공급물을 유도기 동안 적용하여 발현 및 세포 성장을 제어하였는데, 이 실험에서, 공급량을 3가지의 개별 설정점으로 설정하였다(도면에 예시되어 있음). 온도, 용존 산소(pO₂) 및 pH를 제어하여 배양을 최적 배양 조건 내에서 유지하였다.

도 2는 샤페론을 발현하지 않는 플라스미드 또는 FkpA를 발현하는 플라스미드로 형질전환시킨 균주 MXE016을 나타낸다. 도 2는 FkpA를 포함하거나 포함하지 않는 경우, Fab'의 생성 및 주변 세포질에서의 보유에 대한 유도 후 공급량의 증가의 영향을 나타낸다. 상기 데이터는, FkpA의 발현 없이 공급량을 증가시킬 경우, 생성된 추가의 Fab'는 상청액 쪽으로 손실됨을 나타낸다. 이는 FkpA의 발현에서는 그렇지 않은데, 여기서, 더욱 높은 공급량에서 생성된 추가의 Fab'는 주변 세포질 내에 보유되어서 더욱 높은 역가를 생성한다.

실시예 4: 수율 및 세포 생존율의 분석

도 3a 및 도 3b는 20 L 규모에서, 샤페론을 발현하지 않는 플라스미드 또는 FkpA를 발현하는 플라스미드로 형질전환시킨 MXE016에서 세포 생존율 및 Fab' 역가에 대한 영향을 나타낸다. 도 3a는 FkpA가 존재하지 않을 경우 세포 생존율이 더욱 낮음을 나타낸다. 도 3b는 Fab' 역가가 MXE016 + FkpA의 경우 더욱 높고 덜 가변적이었음을 나타낸다.

도 4는 일차 Fab 생성물 회수 후 MXE016+FkpA에서의 더욱 높은 역가가 30% 더 많은 Fab'로 이어짐을 나타낸다.

도 5 및 도 6은 샤페론을 포함하지 않는 MXE016 및 FkpA 발현이 있는 MXE016의 일차 회수에 의한 샘플의 SDS-PAGE 및 항-his-태그 웨스턴 블롯(western blot)을 나타낸다.

샘플을 Fab' 농도에 따라 로딩하였으며, 이때 레인당 1 □g의 Fab'를 로딩하였다. 겔은 4-20% 트리스-글리신 노벡스(Novex)였으며, 비환원 조건 하에서 125 V에서 2시간 동안 러닝시켰다(run). 겔을 사이프로 루비(Sypro Ruby) 염료로 염색시키고, 영상화하였다. 웨스턴 블롯을 인비트로겐(Invitrogen) 아이블롯(iBlot) 시스템을 이용하여 PVDF 막으로 옮기고, 그 후 1% 카제인 용액으로 차단시켰다. 그 후, 상기 막을 항-his HRP 콘쥬게이트 항체(노바젠(Novagen))로 프로빙하였다. 그 후, 상기 블롯을 ECL 용액으로 현상시키고, 애머샴 라이프 사이언시즈 하이퍼프로세서(Amersham Life Sciences HyperProcesser)를 이용하여 영상화하였다.

본 발명을 바람직한 실시 양태를 참고로 하여 구체적으로 예시하고 기술하였지만, 당업계의 숙련자라면, 첨부된 특허청구범위에 의해 정의된 본 발명의 범주로부터 벗어나지 않고서 형태 및 상세 사항에서의 다양한 변화가 이루어질 수 있음을 이해할 것이다.

SEQUENCE LISTING <110> UCB Pharma S.A <120> Recombinant Bacterial Host Cell for Protein Expression <130> G0164-WO <150> GB1208367.1 <151> 2012-05-14 <160> 82 <170> PatentIn version 3.5 <210> 1 <211> 2049 <212> DNA <213> Escherichia coli <400> 1 atgaacatgt tttttaggct taccgcgtta gctggcctgc ttgcaatagc aggccagacc 60 ttcgctgtag aagatatcac gcgtgctgat caaattccgg tattaaagga agagacgcag 120 catgcgacgg taagtgagcg cgtaacgtcg cgcttcaccc gttctcatta tcgccagttc 180 gacctcgatc aggcattttc ggccaaaatc tttgaccgct acctgaatct gctcgattac 240 agccacaacg tgctgctggc aagcgatgtt gaacagttcg cgaaaaagaa aaccgagtta 300 ggcgatgaac tgcgttcagg caaactcgac gttttctacg atctctacaa tctggcgcaa 360 aagcgccgtt ttgagcgtta ccagtacgct ttgtcggtac tggaaaagcc gatggatttc 420 accggcaacg acacttataa ccttgaccgc agcaaagcgc cctggccgaa aaacgaggct 480 gagttgaacg cgctgtggga cagtaaagtc aaattcgacg agttaagcct gaagctgaca 540 ggaaaaacgg ataaagaaat tcgtgaaacc ctgactcgcc gctacaaatt tgccattcgt 600 cgtctggcgc aaaccaacag cgaagatgtt ttctcgctgg caatgacggc gtttgcgcgt 660 gaaatcgacc cgcataccaa ctatctttcc ccgcgtaata ccgaacagtt caacactgaa 720 atgagtttgt cgctggaagg tattggcgca gtgctgcaaa tggatgatga ctacaccgtt 780 atcaattcga tggtggcagg tggtccggca gcgaagagta aagctatcag cgttggtgac 840 aaaattgtcg gtgttggtca aacaggcaag ccgatggttg acgtgattgg ctggcgtctt 900 gatgatgtgg ttgccttaat taaagggccg aagggcagta aagttcgtct ggaaatttta 960 cctgctggta aagggaccaa gacccgtact gtaacgttga cccgtgaacg tattcgtctc 1020 gaagaccgcg cggttaaaat gtcggtgaag accgtcggta aagagaaagt cggcgtgctg 1080 gatattccgg gcttctatgt gggtttgaca gacgatgtca aagtgcaact gcagaaactg 1140 gaaaaacaga atgtcagcag cgtcatcatc gacctgcgta gcaatggcgg tggggcgtta 1200 actgaagccg tatcgctctc cggtctgttt attcctgcgg gtcccattgt tcaggtccgc 1260 gataacaacg gcaaggttcg tgaagatagc gataccgacg gacaggtttt ctataaaggc 1320 ccgctggtgg tgctggttga ccgcttcagt gcttcggctt cagaaatctt tgccgcggca 1380 atgcaggatt acggtcgtgc gctggttgtg ggtgaaccga cgtttggtaa aggcaccgtt 1440 cagcaatacc gttcattgaa ccgtatttac gatcagatgt tacgtcctga atggccagcg 1500 ctgggttctg tgcagtacac gatccagaaa ttctatcgcg ttaacggcgg cagtacgcaa 1560 cgtaaaggcg taacgccaga catcatcatg ccgacgggta atgaagaaac ggaaacgggt 1620 gagaaattcg aagataacgc gctgccgtgg gatagcattg atgccgcgac ttatgtgaaa 1680 tcaggagatt taacggcctt tgaaccggag ctgctgaagg aacataatgc gcgtatcgcg 1740 aaagatcctg agttccagaa catcatgaag gatatcgcgc gcttcaacgc tatgaaggac 1800 aagcgcaata tcgtttctct gaattacgct gtgcgtgaga aagagaataa tgaagatgat 1860 gcgacgcgtc tggcgcgttt gaacgaacgc tttaaacgcg aaggtaaacc ggagttgaag 1920 aaactggatg atctaccgaa agattaccag gagccggatc cttatctgga tgagacggtg 1980 aatatcgcac tcgatctggc gaagcttgaa aaagccagac ccgcggaaca acccgctccc 2040 gtcaagtaa 2049 <210> 2 <211> 680 <212> PRT <213> Escherichia coli <400> 2 Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile Ala Gly 1 5 10 15 Gln Thr Phe Ala Val Glu Asp Ile Thr Arg Ala Asp Gln Ile Pro Val 20 25 30 Leu Lys Glu Glu Thr Gln His Ala Thr Val Ser Glu Arg Val Thr Ser 35 40 45 Arg Phe Thr Arg Ser His Tyr Arg Gln Phe Asp Leu Asp Gln Ala Phe 50 55 60 Ser Ala Lys Ile Phe Asp Arg Tyr Leu Asn Leu Leu Asp Tyr Ser His 65 70 75 80 Asn Val Leu Leu Ala Ser Asp Val Glu Gln Phe Ala Lys Lys Lys Thr 85 90 95 Glu Leu Gly Asp Glu Leu Arg Ser Gly Lys Leu Asp Val Phe Tyr Asp 100 105 110 Leu Tyr Asn Leu Ala Gln Lys Arg Arg Phe Glu Arg Tyr Gln Tyr Ala 115 120 125 Leu Ser Val Leu Glu Lys Pro Met Asp Phe Thr Gly Asn Asp Thr Tyr 130 135 140 Asn Leu Asp Arg Ser Lys Ala Pro Trp Pro Lys Asn Glu Ala Glu Leu 145 150 155 160 Asn Ala Leu Trp Asp Ser Lys Val Lys Phe Asp Glu Leu Ser Leu Lys 165 170 175 Leu Thr Gly Lys Thr Asp Lys Glu Ile Arg Glu Thr Leu Thr Arg Arg 180 185 190 Tyr Lys Phe Ala Ile Arg Arg Leu Ala Gln Thr Asn Ser Glu Asp Val 195 200 205 Phe Ser Leu Ala Met Thr Ala Phe Ala Arg Glu Ile Asp Pro His Thr 210 215 220 Asn Tyr Leu Ser Pro Arg Asn Thr Glu Gln Phe Asn Thr Glu Met Ser 225 230 235 240 Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Met Asp Asp Asp Tyr 245 250 255 Thr Val Ile Asn Ser Met Val Ala Gly Gly Pro Ala Ala Lys Ser Lys 260 265 270 Ala Ile Ser Val Gly Asp Lys Ile Val Gly Val Gly Gln Thr Gly Lys 275 280 285 Pro Met Val Asp Val Ile Gly Trp Arg Leu Asp Asp Val Val Ala Leu 290 295 300 Ile Lys Gly Pro Lys Gly Ser Lys Val Arg Leu Glu Ile Leu Pro Ala 305 310 315 320 Gly Lys Gly Thr Lys Thr Arg Thr Val Thr Leu Thr Arg Glu Arg Ile 325 330 335 Arg Leu Glu Asp Arg Ala Val Lys Met Ser Val Lys Thr Val Gly Lys 340 345 350 Glu Lys Val Gly Val Leu Asp Ile Pro Gly Phe Tyr Val Gly Leu Thr 355 360 365 Asp Asp Val Lys Val Gln Leu Gln Lys Leu Glu Lys Gln Asn Val Ser 370 375 380 Ser Val Ile Ile Asp Leu Arg Ser Asn Gly Gly Gly Ala Leu Thr Glu 385 390 395 400 Ala Val Ser Leu Ser Gly Leu Phe Ile Pro Ala Gly Pro Ile Val Gln 405 410 415 Val Arg Asp Asn Asn Gly Lys Val Arg Glu Asp Ser Asp Thr Asp Gly 420 425 430 Gln Val Phe Tyr Lys Gly Pro Leu Val Val Leu Val Asp Arg Phe Ser 435 440 445 Ala Ser Ala Ser Glu Ile Phe Ala Ala Ala Met Gln Asp Tyr Gly Arg 450 455 460 Ala Leu Val Val Gly Glu Pro Thr Phe Gly Lys Gly Thr Val Gln Gln 465 470 475 480 Tyr Arg Ser Leu Asn Arg Ile Tyr Asp Gln Met Leu Arg Pro Glu Trp 485 490 495 Pro Ala Leu Gly Ser Val Gln Tyr Thr Ile Gln Lys Phe Tyr Arg Val 500 505 510 Asn Gly Gly Ser Thr Gln Arg Lys Gly Val Thr Pro Asp Ile Ile Met 515 520 525 Pro Thr Gly Asn Glu Glu Thr Glu Thr Gly Glu Lys Phe Glu Asp Asn 530 535 540 Ala Leu Pro Trp Asp Ser Ile Asp Ala Ala Thr Tyr Val Lys Ser Gly 545 550 555 560 Asp Leu Thr Ala Phe Glu Pro Glu Leu Leu Lys Glu His Asn Ala Arg 565 570 575 Ile Ala Lys Asp Pro Glu Phe Gln Asn Ile Met Lys Asp Ile Ala Arg 580 585 590 Phe Asn Ala Met Lys Asp Lys Arg Asn Ile Val Ser Leu Asn Tyr Ala 595 600 605 Val Arg Glu Lys Glu Asn Asn Glu Asp Asp Ala Thr Arg Leu Ala Arg 610 615 620 Leu Asn Glu Arg Phe Lys Arg Glu Gly Lys Pro Glu Leu Lys Lys Leu 625 630 635 640 Asp Asp Leu Pro Lys Asp Tyr Gln Glu Pro Asp Pro Tyr Leu Asp Glu 645 650 655 Thr Val Asn Ile Ala Leu Asp Leu Ala Lys Leu Glu Lys Ala Arg Pro 660 665 670 Ala Glu Gln Pro Ala Pro Val Lys 675 680 <210> 3 <211> 2048 <212> DNA <213> Artificial Sequence <220> <223> mutated knockout Tsp gene <400> 3 atgaattcgt ttttaggctt accgcgttag ctggcctgct tgcaatagca ggccagacat 60 taattgtaga agatatcacg cgtgctgatc aaattccggt attaaaggaa gagacgcagc 120 atgcgacggt aagtgagcgc gtaacgtcgc gcttcacccg ttctcattat cgccagttcg 180 acctcgatca ggcattttcg gccaaaatct ttgaccgcta cctgaatctg ctcgattaca 240 gccacaacgt gctgctggca agcgatgttg aacagttcgc gaaaaagaaa accgagttag 300 gcgatgaact gcgttcaggc aaactcgacg ttttctacga tctctacaat ctggcgcaaa 360 agcgccgttt tgagcgttac cagtacgctt tgtcggtact ggaaaagccg atggatttca 420 ccggcaacga cacttataac cttgaccgca gcaaagcgcc ctggccgaaa aacgaggctg 480 agttgaacgc gctgtgggac agtaaagtca aattcgacga gttaagcctg aagctgacag 540 gaaaaacgga taaagaaatt cgtgaaaccc tgactcgccg ctacaaattt gccattcgtc 600 gtctggcgca aaccaacagc gaagatgttt tctcgctggc aatgacggcg tttgcgcgtg 660 aaatcgaccc gcataccaac tatctttccc cgcgtaatac cgaacagttc aacactgaaa 720 tgagtttgtc gctggaaggt attggcgcag tgctgcaaat ggatgatgac tacaccgtta 780 tcaattcgat ggtggcaggt ggtccggcag cgaagagtaa agctatcagc gttggtgaca 840 aaattgtcgg tgttggtcaa acaggcaagc cgatggttga cgtgattggc tggcgtcttg 900 atgatgtggt tgccttaatt aaagggccga agggcagtaa agttcgtctg gaaattttac 960 ctgctggtaa agggaccaag acccgtactg taacgttgac ccgtgaacgt attcgtctcg 1020 aagaccgcgc ggttaaaatg tcggtgaaga ccgtcggtaa agagaaagtc ggcgtgctgg 1080 atattccggg cttctatgtg ggtttgacag acgatgtcaa agtgcaactg cagaaactgg 1140 aaaaacagaa tgtcagcagc gtcatcatcg acctgcgtag caatggcggt ggggcgttaa 1200 ctgaagccgt atcgctctcc ggtctgttta ttcctgcggg tcccattgtt caggtccgcg 1260 ataacaacgg caaggttcgt gaagatagcg ataccgacgg acaggttttc tataaaggcc 1320 cgctggtggt gctggttgac cgcttcagtg cttcggcttc agaaatcttt gccgcggcaa 1380 tgcaggatta cggtcgtgcg ctggttgtgg gtgaaccgac gtttggtaaa ggcaccgttc 1440 agcaataccg ttcattgaac cgtatttacg atcagatgtt acgtcctgaa tggccagcgc 1500 tgggttctgt gcagtacacg atccagaaat tctatcgcgt taacggcggc agtacgcaac 1560 gtaaaggcgt aacgccagac atcatcatgc cgacgggtaa tgaagaaacg gaaacgggtg 1620 agaaattcga agataacgcg ctgccgtggg atagcattga tgccgcgact tatgtgaaat 1680 caggagattt aacggccttt gaaccggagc tgctgaagga acataatgcg cgtatcgcga 1740 aagatcctga gttccagaac atcatgaagg atatcgcgcg cttcaacgct atgaaggaca 1800 agcgcaatat cgtttctctg aattacgctg tgcgtgagaa agagaataat gaagatgatg 1860 cgacgcgtct ggcgcgtttg aacgaacgct ttaaacgcga aggtaaaccg gagttgaaga 1920 aactggatga tctaccgaaa gattaccagg agccggatcc ttatctggat gagacggtga 1980 atatcgcact cgatctggcg aagcttgaaa aagccagacc cgcggaacaa cccgctcccg 2040 tcaagtaa 2048 <210> 4 <211> 2889 <212> DNA <213> Escherichia coli <400> 4 atgccccgca gcacctggtt caaagcatta ttgttgttag ttgccctttg ggcaccctta 60 agtcaggcag aaacgggatg gcagccgatt caggaaacca tccgtaaaag tgataaagat 120 aaccgccagt atcaggctat acgtctggat aacggtatgg tggtcttgct ggtttctgat 180 ccgcaggcag ttaaatcgct ctcggcgctg gtggtgcccg ttgggtcgct ggaagatccc 240 gaggcgtacc aggggctggc acattacctt gaacatatga gtctgatggg gtcgaaaaag 300 tacccgcagg ctgacagtct ggccgaatat ctcaaaatgc acggcggtag tcacaatgcc 360 agcactgcgc cgtatcgcac ggctttctat ctggaagttg agaacgacgc cttgcctggt 420 gcggtagacc gcctggccga tgctattgct gaacctttgc tcgacaagaa atatgccgaa 480 cgtgagcgta atgcggtgaa cgctgaatta accatggcgc gtacgcgtga cgggatgcgc 540 atggcacagg tcagcgcaga aaccattaac ccggcacacc ccggttcaaa gttttctggt 600 ggtaacctcg aaactttaag cgacaaacct ggtaatccgg tgcagcaggc gctgaaagat 660 ttccacgaga agtactattc cgccaatttg atgaaggcgg ttatttacag taataaaccg 720 ctgccggagt tggcaaaaat ggcggcggac acctttggtc gcgtgccgaa caaagagagc 780 aaaaaaccgg aaatcaccgt gccggtagtc accgacgcgc aaaagggcat tatcattcat 840 tacgtccctg cgctgccgcg taaagtgttg cgcgttgagt ttcgcatcga taacaactca 900 gcgaagttcc gtagtaaaac cgatgaattg attacctatc tgattggcaa tcgcagccca 960 ggtacacttt ctgactggct gcaaaagcag ggattagttg agggcattag cgccaactcc 1020 gatcctatcg tcaacggcaa cagcggcgta ttagcgatct ctgcgtcttt aaccgataaa 1080 ggcctggcta atcgcgatca ggttgtggcg gcaattttta gctatctcaa tctgttacgt 1140 gaaaaaggca ttgataaaca atacttcgat gaactggcga atgtgctgga tatcgacttc 1200 cgttatccgt cgatcacccg tgatatggat tacgtcgaat ggctggcaga taccatgatt 1260 cgcgttcctg ttgagcatac gctggatgca gtcaatattg ccgatcggta cgatgctaaa 1320 gcagtaaagg aacgtctggc gatgatgacg ccgcagaatg cgcgtatctg gtatatcagc 1380 ccgaaagagc cgcacaacaa aacggcttac tttgtcgatg cgccgtatca ggtcgataaa 1440 atcagcgcac aaactttcgc cgactggcag aaaaaagccg ccgacattgc gctctctttg 1500 ccagagctta acccttatat tcctgatgat ttctcgctga ttaagtcaga gaagaaatac 1560 gaccatccag agctgattgt tgatgagtcg aatctgcgcg tggtgtatgc gccaagccgt 1620 tattttgcca gcgagcccaa agctgatgtc agcctgattt tgcgtaatcc gaaagccatg 1680 gacagcgccc gcaatcaggt gatgtttgcg ctcaatgatt atctcgcagg gctggcgctt 1740 gatcagttaa gcaaccaggc gtcggttggt ggcataagtt tttccaccaa cgctaacaac 1800 ggccttatgg ttaatgctaa tggttacacc cagcgtctgc cgcagctgtt ccaggcattg 1860 ctcgaggggt actttagcta taccgctacg gaagatcagc ttgagcaggc gaagtcctgg 1920 tataaccaga tgatggattc cgcagaaaag ggtaaagcgt ttgagcaggc gattatgccc 1980 gcgcagatgc tctcgcaagt gccgtacttc tcgcgagatg aacggcgtaa aattttgccc 2040 tccattacgt tgaaagaggt gctggcctat cgcgacgcct taaaatcagg ggctcgacca 2100 gagtttatgg ttatcggcaa catgaccgag gcccaggcaa caacgctggc acgcgatgtg 2160 caaaaacagt tgggcgctga tggttcagag tggtgtcgaa acaaagatgt agtggtcgat 2220 aaaaaacaat ccgtcatctt tgaaaaagcc ggtaacagca ccgactccgc actggcagcg 2280 gtatttgtac cgactggcta cgatgaatac accagctcag cctatagctc tctgttgggg 2340 cagatcgtac agccgtggtt ctacaatcag ttgcgtaccg aagaacaatt gggctatgcc 2400 gtgtttgcgt ttccaatgag cgtggggcgt cagtggggca tgggcttcct tttgcaaagc 2460 aatgataaac agccttcatt cttgtgggag cgttacaagg cgtttttccc aaccgcagag 2520 gcaaaattgc gagcgatgaa gccagatgag tttgcgcaaa tccagcaggc ggtaattacc 2580 cagatgctgc aggcaccgca aacgctcggc gaagaagcat cgaagttaag taaagatttc 2640 gatcgcggca atatgcgctt cgattcgcgt gataaaatcg tggcccagat aaaactgctg 2700 acgccgcaaa aacttgctga tttcttccat caggcggtgg tcgagccgca aggcatggct 2760 attctgtcgc agatttccgg cagccagaac gggaaagccg aatatgtaca ccctgaaggc 2820 tggaaagtgt gggagaacgt cagcgcgttg cagcaaacaa tgcccctgat gagtgaaaag 2880 aatgagtga 2889 <210> 5 <211> 962 <212> PRT <213> Escherichia coli <400> 5 Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu 1 5 10 15 Trp Ala Pro Leu Ser Gln Ala Glu Thr Gly Trp Gln Pro Ile Gln Glu 20 25 30 Thr Ile Arg Lys Ser Asp Lys Asp Asn Arg Gln Tyr Gln Ala Ile Arg 35 40 45 Leu Asp Asn Gly Met Val Val Leu Leu Val Ser Asp Pro Gln Ala Val 50 55 60 Lys Ser Leu Ser Ala Leu Val Val Pro Val Gly Ser Leu Glu Asp Pro 65 70 75 80 Glu Ala Tyr Gln Gly Leu Ala His Tyr Leu Glu His Met Ser Leu Met 85 90 95 Gly Ser Lys Lys Tyr Pro Gln Ala Asp Ser Leu Ala Glu Tyr Leu Lys 100 105 110 Met His Gly Gly Ser His Asn Ala Ser Thr Ala Pro Tyr Arg Thr Ala 115 120 125 Phe Tyr Leu Glu Val Glu Asn Asp Ala Leu Pro Gly Ala Val Asp Arg 130 135 140 Leu Ala Asp Ala Ile Ala Glu Pro Leu Leu Asp Lys Lys Tyr Ala Glu 145 150 155 160 Arg Glu Arg Asn Ala Val Asn Ala Glu Leu Thr Met Ala Arg Thr Arg 165 170 175 Asp Gly Met Arg Met Ala Gln Val Ser Ala Glu Thr Ile Asn Pro Ala 180 185 190 His Pro Gly Ser Lys Phe Ser Gly Gly Asn Leu Glu Thr Leu Ser Asp 195 200 205 Lys Pro Gly Asn Pro Val Gln Gln Ala Leu Lys Asp Phe His Glu Lys 210 215 220 Tyr Tyr Ser Ala Asn Leu Met Lys Ala Val Ile Tyr Ser Asn Lys Pro 225 230 235 240 Leu Pro Glu Leu Ala Lys Met Ala Ala Asp Thr Phe Gly Arg Val Pro 245 250 255 Asn Lys Glu Ser Lys Lys Pro Glu Ile Thr Val Pro Val Val Thr Asp 260 265 270 Ala Gln Lys Gly Ile Ile Ile His Tyr Val Pro Ala Leu Pro Arg Lys 275 280 285 Val Leu Arg Val Glu Phe Arg Ile Asp Asn Asn Ser Ala Lys Phe Arg 290 295 300 Ser Lys Thr Asp Glu Leu Ile Thr Tyr Leu Ile Gly Asn Arg Ser Pro 305 310 315 320 Gly Thr Leu Ser Asp Trp Leu Gln Lys Gln Gly Leu Val Glu Gly Ile 325 330 335 Ser Ala Asn Ser Asp Pro Ile Val Asn Gly Asn Ser Gly Val Leu Ala 340 345 350 Ile Ser Ala Ser Leu Thr Asp Lys Gly Leu Ala Asn Arg Asp Gln Val 355 360 365 Val Ala Ala Ile Phe Ser Tyr Leu Asn Leu Leu Arg Glu Lys Gly Ile 370 375 380 Asp Lys Gln Tyr Phe Asp Glu Leu Ala Asn Val Leu Asp Ile Asp Phe 385 390 395 400 Arg Tyr Pro Ser Ile Thr Arg Asp Met Asp Tyr Val Glu Trp Leu Ala 405 410 415 Asp Thr Met Ile Arg Val Pro Val Glu His Thr Leu Asp Ala Val Asn 420 425 430 Ile Ala Asp Arg Tyr Asp Ala Lys Ala Val Lys Glu Arg Leu Ala Met 435 440 445 Met Thr Pro Gln Asn Ala Arg Ile Trp Tyr Ile Ser Pro Lys Glu Pro 450 455 460 His Asn Lys Thr Ala Tyr Phe Val Asp Ala Pro Tyr Gln Val Asp Lys 465 470 475 480 Ile Ser Ala Gln Thr Phe Ala Asp Trp Gln Lys Lys Ala Ala Asp Ile 485 490 495 Ala Leu Ser Leu Pro Glu Leu Asn Pro Tyr Ile Pro Asp Asp Phe Ser 500 505 510 Leu Ile Lys Ser Glu Lys Lys Tyr Asp His Pro Glu Leu Ile Val Asp 515 520 525 Glu Ser Asn Leu Arg Val Val Tyr Ala Pro Ser Arg Tyr Phe Ala Ser 530 535 540 Glu Pro Lys Ala Asp Val Ser Leu Ile Leu Arg Asn Pro Lys Ala Met 545 550 555 560 Asp Ser Ala Arg Asn Gln Val Met Phe Ala Leu Asn Asp Tyr Leu Ala 565 570 575 Gly Leu Ala Leu Asp Gln Leu Ser Asn Gln Ala Ser Val Gly Gly Ile 580 585 590 Ser Phe Ser Thr Asn Ala Asn Asn Gly Leu Met Val Asn Ala Asn Gly 595 600 605 Tyr Thr Gln Arg Leu Pro Gln Leu Phe Gln Ala Leu Leu Glu Gly Tyr 610 615 620 Phe Ser Tyr Thr Ala Thr Glu Asp Gln Leu Glu Gln Ala Lys Ser Trp 625 630 635 640 Tyr Asn Gln Met Met Asp Ser Ala Glu Lys Gly Lys Ala Phe Glu Gln 645 650 655 Ala Ile Met Pro Ala Gln Met Leu Ser Gln Val Pro Tyr Phe Ser Arg 660 665 670 Asp Glu Arg Arg Lys Ile Leu Pro Ser Ile Thr Leu Lys Glu Val Leu 675 680 685 Ala Tyr Arg Asp Ala Leu Lys Ser Gly Ala Arg Pro Glu Phe Met Val 690 695 700 Ile Gly Asn Met Thr Glu Ala Gln Ala Thr Thr Leu Ala Arg Asp Val 705 710 715 720 Gln Lys Gln Leu Gly Ala Asp Gly Ser Glu Trp Cys Arg Asn Lys Asp 725 730 735 Val Val Val Asp Lys Lys Gln Ser Val Ile Phe Glu Lys Ala Gly Asn 740 745 750 Ser Thr Asp Ser Ala Leu Ala Ala Val Phe Val Pro Thr Gly Tyr Asp 755 760 765 Glu Tyr Thr Ser Ser Ala Tyr Ser Ser Leu Leu Gly Gln Ile Val Gln 770 775 780 Pro Trp Phe Tyr Asn Gln Leu Arg Thr Glu Glu Gln Leu Gly Tyr Ala 785 790 795 800 Val Phe Ala Phe Pro Met Ser Val Gly Arg Gln Trp Gly Met Gly Phe 805 810 815 Leu Leu Gln Ser Asn Asp Lys Gln Pro Ser Phe Leu Trp Glu Arg Tyr 820 825 830 Lys Ala Phe Phe Pro Thr Ala Glu Ala Lys Leu Arg Ala Met Lys Pro 835 840 845 Asp Glu Phe Ala Gln Ile Gln Gln Ala Val Ile Thr Gln Met Leu Gln 850 855 860 Ala Pro Gln Thr Leu Gly Glu Glu Ala Ser Lys Leu Ser Lys Asp Phe 865 870 875 880 Asp Arg Gly Asn Met Arg Phe Asp Ser Arg Asp Lys Ile Val Ala Gln 885 890 895 Ile Lys Leu Leu Thr Pro Gln Lys Leu Ala Asp Phe Phe His Gln Ala 900 905 910 Val Val Glu Pro Gln Gly Met Ala Ile Leu Ser Gln Ile Ser Gly Ser 915 920 925 Gln Asn Gly Lys Ala Glu Tyr Val His Pro Glu Gly Trp Lys Val Trp 930 935 940 Glu Asn Val Ser Ala Leu Gln Gln Thr Met Pro Leu Met Ser Glu Lys 945 950 955 960 Asn Glu <210> 6 <211> 2889 <212> DNA <213> Artificial Sequence <220> <223> mutated knockout Protease III gene <400> 6 attccccgca gcacctggtt caaagcatta ttgttgttag ttgccctttg ggcacattaa 60 tgtcaggcag aaacgggatg gcagccgatt caggaaacca tccgtaaaag tgataaagat 120 aaccgccagt atcaggctat acgtctggat aacggtatgg tggtcttgct ggtttctgat 180 ccgcaggcag ttaaatcgct ctcggcgctg gtggtgcccg ttgggtcgct ggaagatccc 240 gaggcgtacc aggggctggc acattacctt gaacatatga gtctgatggg gtcgaaaaag 300 tacccgcagg ctgacagtct ggccgaatat ctcaaaatgc acggcggtag tcacaatgcc 360 agcactgcgc cgtatcgcac ggctttctat ctggaagttg agaacgacgc cttgcctggt 420 gcggtagacc gcctggccga tgctattgct gaacctttgc tcgacaagaa atatgccgaa 480 cgtgagcgta atgcggtgaa cgctgaatta accatggcgc gtacgcgtga cgggatgcgc 540 atggcacagg tcagcgcaga aaccattaac ccggcacacc ccggttcaaa gttttctggt 600 ggtaacctcg aaactttaag cgacaaacct ggtaatccgg tgcagcaggc gctgaaagat 660 ttccacgaga agtactattc cgccaatttg atgaaggcgg ttatttacag taataaaccg 720 ctgccggagt tggcaaaaat ggcggcggac acctttggtc gcgtgccgaa caaagagagc 780 aaaaaaccgg aaatcaccgt gccggtagtc accgacgcgc aaaagggcat tatcattcat 840 tacgtccctg cgctgccgcg taaagtgttg cgcgttgagt ttcgcatcga taacaactca 900 gcgaagttcc gtagtaaaac cgatgaattg attacctatc tgattggcaa tcgcagccca 960 ggtacacttt ctgactggct gcaaaagcag ggattagttg agggcattag cgccaactcc 1020 gatcctatcg tcaacggcaa cagcggcgta ttagcgatct ctgcgtcttt aaccgataaa 1080 ggcctggcta atcgcgatca ggttgtggcg gcaattttta gctatctcaa tctgttacgt 1140 gaaaaaggca ttgataaaca atacttcgat gaactggcga atgtgctgga tatcgacttc 1200 cgttatccgt cgatcacccg tgatatggat tacgtcgaat ggctggcaga taccatgatt 1260 cgcgttcctg ttgagcatac gctggatgca gtcaatattg ccgatcggta cgatgctaaa 1320 gcagtaaagg aacgtctggc gatgatgacg ccgcagaatg cgcgtatctg gtatatcagc 1380 ccgaaagagc cgcacaacaa aacggcttac tttgtcgatg cgccgtatca ggtcgataaa 1440 atcagcgcac aaactttcgc cgactggcag aaaaaagccg ccgacattgc gctctctttg 1500 ccagagctta acccttatat tcctgatgat ttctcgctga ttaagtcaga gaagaaatac 1560 gaccatccag agctgattgt tgatgagtcg aatctgcgcg tggtgtatgc gccaagccgt 1620 tattttgcca gcgagcccaa agctgatgtc agcctgattt tgcgtaatcc gaaagccatg 1680 gacagcgccc gcaatcaggt gatgtttgcg ctcaatgatt atctcgcagg gctggcgctt 1740 gatcagttaa gcaaccaggc gtcggttggt ggcataagtt tttccaccaa cgctaacaac 1800 ggccttatgg ttaatgctaa tggttacacc cagcgtctgc cgcagctgtt ccaggcattg 1860 ctcgaggggt actttagcta taccgctacg gaagatcagc ttgagcaggc gaagtcctgg 1920 tataaccaga tgatggattc cgcagaaaag ggtaaagcgt ttgagcaggc gattatgccc 1980 gcgcagatgc tctcgcaagt gccgtacttc tcgcgagatg aacggcgtaa aattttgccc 2040 tccattacgt tgaaagaggt gctggcctat cgcgacgcct taaaatcagg ggctcgacca 2100 gagtttatgg ttatcggcaa catgaccgag gcccaggcaa caacgctggc acgcgatgtg 2160 caaaaacagt tgggcgctga tggttcagag tggtgtcgaa acaaagatgt agtggtcgat 2220 aaaaaacaat ccgtcatctt tgaaaaagcc ggtaacagca ccgactccgc actggcagcg 2280 gtatttgtac cgactggcta cgatgaatac accagctcag cctatagctc tctgttgggg 2340 cagatcgtac agccgtggtt ctacaatcag ttgcgtaccg aagaacaatt gggctatgcc 2400 gtgtttgcgt ttccaatgag cgtggggcgt cagtggggca tgggcttcct tttgcaaagc 2460 aatgataaac agccttcatt cttgtgggag cgttacaagg cgtttttccc aaccgcagag 2520 gcaaaattgc gagcgatgaa gccagatgag tttgcgcaaa tccagcaggc ggtaattacc 2580 cagatgctgc aggcaccgca aacgctcggc gaagaagcat cgaagttaag taaagatttc 2640 gatcgcggca atatgcgctt cgattcgcgt gataaaatcg tggcccagat aaaactgctg 2700 acgccgcaaa aacttgctga tttcttccat caggcggtgg tcgagccgca aggcatggct 2760 attctgtcgc agatttccgg cagccagaac gggaaagccg aatatgtaca ccctgaaggc 2820 tggaaagtgt gggagaacgt cagcgcgttg cagcaaacaa tgcccctgat gagtgaaaag 2880 aatgagtga 2889 <210> 7 <211> 1425 <212> DNA <213> Escherichia coli <400> 7 atgaaaaaaa ccacattagc actgagtgca ctggctctga gtttaggttt ggcgttatct 60 ccgctctctg caacggcggc tgagacttct tcagcaacga cagcccagca gatgccaagc 120 cttgcaccga tgctcgaaaa ggtgatgcct tcagtggtca gcattaacgt agaaggtagc 180 acaaccgtta atacgccgcg tatgccgcgt aatttccagc agttcttcgg tgatgattct 240 ccgttctgcc aggaaggttc tccgttccag agctctccgt tctgccaggg tggccagggc 300 ggtaatggtg gcggccagca acagaaattc atggcgctgg gttccggcgt catcattgat 360 gccgataaag gctatgtcgt caccaacaac cacgttgttg ataacgcgac ggtcattaaa 420 gttcaactga gcgatggccg taagttcgac gcgaagatgg ttggcaaaga tccgcgctct 480 gatatcgcgc tgatccaaat ccagaacccg aaaaacctga ccgcaattaa gatggcggat 540 tctgatgcac tgcgcgtggg tgattacacc gtagcgattg gtaacccgtt tggtctgggc 600 gagacggtaa cttccgggat tgtctctgcg ctggggcgta gcggcctgaa tgccgaaaac 660 tacgaaaact tcatccagac cgatgcagcg atcaaccgtg gtaactccgg tggtgcgctg 720 gttaacctga acggcgaact gatcggtatc aacaccgcga tcctcgcacc ggacggcggc 780 aacatcggta tcggttttgc tatcccgagt aacatggtga aaaacctgac ctcgcagatg 840 gtggaatacg gccaggtgaa acgcggtgag ctgggtatta tggggactga gctgaactcc 900 gaactggcga aagcgatgaa agttgacgcc cagcgcggtg ctttcgtaag ccaggttctg 960 cctaattcct ccgctgcaaa agcgggcatt aaagcgggtg atgtgatcac ctcactgaac 1020 ggtaagccga tcagcagctt tgccgcactg cgtgctcagg tgggtactat gccggtaggc 1080 agcaaactga ccctgggctt actgcgcgac ggtaagcagg ttaacgtgaa cctggaactg 1140 cagcagagca gccagaatca ggttgattcc agctccatct tcaacggcat tgaaggcgct 1200 gagatgagca acaaaggcaa agatcagggc gtggtagtga acaacgtgaa aacgggcact 1260 ccggctgcgc agatcggcct gaagaaaggt gatgtgatta ttggcgcgaa ccagcaggca 1320 gtgaaaaaca tcgctgaact gcgtaaagtt ctcgacagca aaccgtctgt gctggcactc 1380 aacattcagc gcggcgacag caccatctac ctgttaatgc agtaa 1425 <210> 8 <211> 474 <212> PRT <213> Escherichia coli <400> 8 Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly 1 5 10 15 Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala 20 25 30 Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val 35 40 45 Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn 50 55 60 Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser 65 70 75 80 Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln 85 90 95 Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala 100 105 110 Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr 115 120 125 Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser 130 135 140 Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser 145 150 155 160 Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile 165 170 175 Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala 180 185 190 Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val 195 200 205 Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe 210 215 220 Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ser Gly Gly Ala Leu 225 230 235 240 Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala 245 250 255 Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met 260 265 270 Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg 275 280 285 Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys 290 295 300 Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu 305 310 315 320 Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile 325 330 335 Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala 340 345 350 Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu 355 360 365 Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser 370 375 380 Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala 385 390 395 400 Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val 405 410 415 Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val 420 425 430 Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg 435 440 445 Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg 450 455 460 Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln 465 470 <210> 9 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> mutated DegP <400> 9 atgaaaaaaa ccacattagc actgagtgca ctggctctga gtttaggttt ggcgttatct 60 ccgctctctg caacggcggc tgagacttct tcagcaacga cagcccagca gatgccaagc 120 cttgcaccga tgctcgaaaa ggtgatgcct tcagtggtca gcattaacgt agaaggtagc 180 acaaccgtta atacgccgcg tatgccgcgt aatttccagc agttcttcgg tgatgattct 240 ccgttctgcc aggaaggttc tccgttccag agctctccgt tctgccaggg tggccagggc 300 ggtaatggtg gcggccagca acagaaattc atggcgctgg gttccggcgt catcattgat 360 gccgataaag gctatgtcgt caccaacaac cacgttgttg ataacgcgac ggtcattaaa 420 gttcaactga gcgatggccg taagttcgac gcgaagatgg ttggcaaaga tccgcgctct 480 gatatcgcgc tgatccaaat ccagaacccg aaaaacctga ccgcaattaa gatggcggat 540 tctgatgcac tgcgcgtggg tgattacacc gtagcgattg gtaacccgtt tggtctgggc 600 gagacggtaa cttccgggat tgtctctgcg ctggggcgta gcggcctgaa tgccgaaaac 660 tacgaaaact tcatccagac cgatgcagcg attaatcgtg gtaacgccgg tggtgcgctg 720 gttaacctga acggcgaact gatcggtatc aacaccgcga tcctcgcacc ggacggcggc 780 aacatcggta tcggttttgc tatcccgagt aacatggtga aaaacctgac ctcgcagatg 840 gtggaatacg gccaggtgaa acgcggtgag ctgggtatta tggggactga gctgaactcc 900 gaactggcga aagcgatgaa agttgacgcc cagcgcggtg ctttcgtaag ccaggttctg 960 cctaattcct ccgctgcaaa agcgggcatt aaagcgggtg atgtgatcac ctcactgaac 1020 ggtaagccga tcagcagctt tgccgcactg cgtgctcagg tgggtactat gccggtaggc 1080 agcaaactga ccctgggctt actgcgcgac ggtaagcagg ttaacgtgaa cctggaactg 1140 cagcagagca gccagaatca ggttgattcc agctccatct tcaacggcat tgaaggcgct 1200 gagatgagca acaaaggcaa agatcagggc gtggtagtga acaacgtgaa aacgggcact 1260 ccggctgcgc agatcggcct gaagaaaggt gatgtgatta ttggcgcgaa ccagcaggca 1320 gtgaaaaaca tcgctgaact gcgtaaagtt ctcgacagca aaccgtctgt gctggcactc 1380 aacattcagc gcggcgacag caccatctac ctgttaatgc agtaa 1425 <210> 10 <211> 474 <212> PRT <213> Artificial Sequence <220> <223> mutated DegP <400> 10 Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly 1 5 10 15 Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala 20 25 30 Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val 35 40 45 Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn 50 55 60 Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser 65 70 75 80 Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln 85 90 95 Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala 100 105 110 Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr 115 120 125 Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser 130 135 140 Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser 145 150 155 160 Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile 165 170 175 Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala 180 185 190 Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val 195 200 205 Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe 210 215 220 Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ala Gly Gly Ala Leu 225 230 235 240 Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala 245 250 255 Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met 260 265 270 Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg 275 280 285 Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys 290 295 300 Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu 305 310 315 320 Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile 325 330 335 Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala 340 345 350 Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu 355 360 365 Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser 370 375 380 Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala 385 390 395 400 Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val 405 410 415 Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val 420 425 430 Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg 435 440 445 Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg 450 455 460 Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln 465 470 <210> 11 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 5' oligonucleotide primer for the region of the mutated DegP gene comprising the Ase I restriction site <400> 11 ctgcctgcga ttttcgccgg aacg 24 <210> 12 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 3' oligonucleotide primer for the region of the mutated DegP gene comprising the Ase I restriction site <400> 12 cgcatggtac gtgccacgat atcc 24 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> the 5' oligonucleotide primer for the region of the mutated Tsp gene comprising the Ase I restriction site <400> 13 gggaaatgaa cctgagcaaa acgc 24 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 3' oligonucleotide primer for the region of the mutated Protease III gene comprising the Ase I restriction site <400> 14 gggaaaggcg gcggaaccgc ctag 24 <210> 15 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 5' oligonucleotide primer for the region of the mutated Protease III gene comprising the Ase I restriction site <400> 15 ctactgtgcc agcggtggta atgg 24 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 3' oligonucleotide primer for the region of the mutated Tsp gene comprising the Ase I restriction site <400> 16 gcatcataat tttcttttta cctc 24 <210> 17 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> wild-type spr gene <400> 17 atggtcaaat ctcaaccgat tttgagatat atcttgcgcg ggattcccgc gattgcagta 60 gcggttctgc tttctgcatg tagtgcaaat aacaccgcaa agaatatgca tcctgagaca 120 cgtgcagtgg gtagtgaaac atcatcactg caagcttctc aggatgaatt tgaaaacctg 180 gttcgtaatg tcgacgtaaa atcgcgaatt atggatcagt atgctgactg gaaaggcgta 240 cgttatcgtc tgggcggcag cactaaaaaa ggtatcgatt gttctggttt cgtacagcgt 300 acattccgtg agcaatttgg cttagaactt ccgcgttcga cttacgaaca gcaggaaatg 360 ggtaaatctg tttcccgcag taatttgcgt acgggtgatt tagttctgtt ccgtgccggt 420 tcaacgggac gccatgtcgg tatttatatc ggcaacaatc agtttgtcca tgcttccacc 480 agcagtggtg ttattatttc cagcatgaat gaaccgtact ggaagaagcg ttacaacgaa 540 gcacgccggg ttctcagccg cagc 564 <210> 18 <211> 188 <212> PRT <213> Escherichia coli <400> 18 Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Gly Ile Pro 1 5 10 15 Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ala Asn Asn Thr 20 25 30 Ala Lys Asn Met His Pro Glu Thr Arg Ala Val Gly Ser Glu Thr Ser 35 40 45 Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Asn Leu Val Arg Asn Val 50 55 60 Asp Val Lys Ser Arg Ile Met Asp Gln Tyr Ala Asp Trp Lys Gly Val 65 70 75 80 Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys Gly Ile Asp Cys Ser Gly 85 90 95 Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro Arg 100 105 110 Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys Ser Val Ser Arg Ser Asn 115 120 125 Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly Arg 130 135 140 His Val Gly Ile Tyr Ile Gly Asn Asn Gln Phe Val His Ala Ser Thr 145 150 155 160 Ser Ser Gly Val Ile Ile Ser Ser Met Asn Glu Pro Tyr Trp Lys Lys 165 170 175 Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser 180 185 <210> 19 <211> 162 <212> PRT <213> Escherichia coli <400> 19 Cys Ser Ala Asn Asn Thr Ala Lys Asn Met His Pro Glu Thr Arg Ala 1 5 10 15 Val Gly Ser Glu Thr Ser Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu 20 25 30 Asn Leu Val Arg Asn Val Asp Val Lys Ser Arg Ile Met Asp Gln Tyr 35 40 45 Ala Asp Trp Lys Gly Val Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys 50 55 60 Gly Ile Asp Cys Ser Gly Phe Val Gln Arg Thr Phe Arg Glu Gln Phe 65 70 75 80 Gly Leu Glu Leu Pro Arg Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys 85 90 95 Ser Val Ser Arg Ser Asn Leu Arg Thr Gly Asp Leu Val Leu Phe Arg 100 105 110 Ala Gly Ser Thr Gly Arg His Val Gly Ile Tyr Ile Gly Asn Asn Gln 115 120 125 Phe Val His Ala Ser Thr Ser Ser Gly Val Ile Ile Ser Ser Met Asn 130 135 140 Glu Pro Tyr Trp Lys Lys Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser 145 150 155 160 Arg Ser <210> 20 <211> 954 <212> DNA <213> Artificial Sequence <220> <223> nucleotide sequence of a mutated OmpT sequence comprising D210A and H212A mutations <400> 20 atgcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60 tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120 ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180 caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240 atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300 atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360 caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420 ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480 tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540 ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600 attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660 agcggctggg tggaatcatc tgataacgct gaagcttatg acccgggaaa aagaatcact 720 tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780 gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840 ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900 ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954 <210> 21 <211> 317 <212> PRT <213> Artificial Sequence <220> <223> mutated OmpT sequence comprising D210A and H212A mutations <400> 21 Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile 1 5 10 15 Ser Ser Phe Ala Ser Thr Glu Thr Leu Ser Phe Thr Pro Asp Asn Ile 20 25 30 Asn Ala Asp Ile Ser Leu Gly Thr Leu Ser Gly Lys Thr Lys Glu Arg 35 40 45 Val Tyr Leu Ala Glu Glu Gly Gly Arg Lys Val Ser Gln Leu Asp Trp 50 55 60 Lys Phe Asn Asn Ala Ala Ile Ile Lys Gly Ala Ile Asn Trp Asp Leu 65 70 75 80 Met Pro Gln Ile Ser Ile Gly Ala Ala Gly Trp Thr Thr Leu Gly Ser 85 90 95 Arg Gly Gly Asn Met Val Asp Gln Asp Trp Met Asp Ser Ser Asn Pro 100 105 110 Gly Thr Trp Thr Asp Glu Ser Arg His Pro Asp Thr Gln Leu Asn Tyr 115 120 125 Ala Asn Glu Phe Asp Leu Asn Ile Lys Gly Trp Leu Leu Asn Glu Pro 130 135 140 Asn Tyr Arg Leu Gly Leu Met Ala Gly Tyr Gln Glu Ser Arg Tyr Ser 145 150 155 160 Phe Thr Ala Arg Gly Gly Ser Tyr Ile Tyr Ser Ser Glu Glu Gly Phe 165 170 175 Arg Asp Asp Ile Gly Ser Phe Pro Asn Gly Glu Arg Ala Ile Gly Tyr 180 185 190 Lys Gln Arg Phe Lys Met Pro Tyr Ile Gly Leu Thr Gly Ser Tyr Arg 195 200 205 Tyr Glu Asp Phe Glu Leu Gly Gly Thr Phe Lys Tyr Ser Gly Trp Val 210 215 220 Glu Ser Ser Asp Asn Ala Glu Ala Tyr Asp Pro Gly Lys Arg Ile Thr 225 230 235 240 Tyr Arg Ser Lys Val Lys Asp Gln Asn Tyr Tyr Ser Val Ala Val Asn 245 250 255 Ala Gly Tyr Tyr Val Thr Pro Asn Ala Lys Val Tyr Val Glu Gly Ala 260 265 270 Trp Asn Arg Val Thr Asn Lys Lys Gly Asn Thr Ser Leu Tyr Asp His 275 280 285 Asn Asn Asn Thr Ser Asp Tyr Ser Lys Asn Gly Ala Gly Ile Glu Asn 290 295 300 Tyr Asn Phe Ile Thr Thr Ala Gly Leu Lys Tyr Thr Phe 305 310 315 <210> 22 <211> 954 <212> DNA <213> Artificial Sequence <220> <223> mutated knockout OmpT sequence <400> 22 attcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60 tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120 ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180 caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240 atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300 atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360 caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420 ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480 tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540 ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600 attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660 agcggctggg tggaatcatc tgataacgat gaacactatg acccgggaaa aagaatcact 720 tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780 gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840 ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900 ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954 <210> 23 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> OmpA oligonucleotide adapter <400> 23 cgattgaatg gagaacttga attcgggcga aacttctggg aatag 45 <210> 24 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide cassette encoding intergenic sequence 1 (IGS1) for E. coli Fab expression <400> 24 aagttttaat agaggagagt gttaatgaag aag 33 <210> 25 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> the oligonucleotide cassette encoding intergenic sequence 2 (IGS2) for E. coli Fab expression. <400> 25 aagttttaat agaggggagt gttaaaatga agaag 35 <210> 26 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide cassette encoding intergenic sequence 3 (IGS3) for E. coli Fab expression <400> 26 aagctttaat agaggagagt gttgaggagg aaaaaaaaat gaagaaa 47 <210> 27 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide cassette encoding intergenic sequence 4 (IGS4) for E. coli Fab expression <400> 27 aagctttaat agaggagagt gttgacgagg attatataat gaagaaa 47 <210> 28 <211> 810 <212> DNA <213> Escherichia coli <400> 28 atgaaatcac tgtttaaagt aacgctgctg gcgaccacaa tggccgttgc cctgcatgca 60 ccaatcactt ttgctgctga agctgcaaaa cctgctacag ctgctgacag caaagcagcg 120 ttcaaaaatg acgatcagaa atcagcttat gcactgggtg cctcgctggg tcgttacatg 180 gaaaactctc taaaagaaca agaaaaactg ggcatcaaac tggataaaga tcagctgatc 240 gctggtgttc aggatgcatt tgctgataag agcaaactct ccgaccaaga gatcgaacag 300 actctacaag cattcgaagc tcgcgtgaag tcttctgctc aggcgaagat ggaaaaagac 360 gcggctgata acgaagcaaa aggtaaagag taccgcgaga aatttgccaa agagaaaggt 420 gtgaaaacct cttcaactgg tctggtttat caggtagtag aagccggtaa aggcgaagca 480 ccgaaagaca gcgatactgt tgtagtgaac tacaaaggta cgctgatcga cggtaaagag 540 ttcgacaact cttacacccg tggtgaaccg ctttctttcc gtctggacgg tgttatcccg 600 ggttggacag aaggtctgaa gaacatcaag aaaggcggta agatcaaact ggttattcca 660 ccagaactgg cttacggcaa agcgggtgtt ccggggatcc caccgaattc taccctggtg 720 tttgacgtag agctgctgga tgtgaaacca gcgccgaagg ctgatgcaaa gccggaagct 780 gatgcgaaag ccgcagattc tgctaaaaaa 810 <210> 29 <211> 270 <212> PRT <213> Escherichia coli <400> 29 Met Lys Ser Leu Phe Lys Val Thr Leu Leu Ala Thr Thr Met Ala Val 1 5 10 15 Ala Leu His Ala Pro Ile Thr Phe Ala Ala Glu Ala Ala Lys Pro Ala 20 25 30 Thr Ala Ala Asp Ser Lys Ala Ala Phe Lys Asn Asp Asp Gln Lys Ser 35 40 45 Ala Tyr Ala Leu Gly Ala Ser Leu Gly Arg Tyr Met Glu Asn Ser Leu 50 55 60 Lys Glu Gln Glu Lys Leu Gly Ile Lys Leu Asp Lys Asp Gln Leu Ile 65 70 75 80 Ala Gly Val Gln Asp Ala Phe Ala Asp Lys Ser Lys Leu Ser Asp Gln 85 90 95 Glu Ile Glu Gln Thr Leu Gln Ala Phe Glu Ala Arg Val Lys Ser Ser 100 105 110 Ala Gln Ala Lys Met Glu Lys Asp Ala Ala Asp Asn Glu Ala Lys Gly 115 120 125 Lys Glu Tyr Arg Glu Lys Phe Ala Lys Glu Lys Gly Val Lys Thr Ser 130 135 140 Ser Thr Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala 145 150 155 160 Pro Lys Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile 165 170 175 Asp Gly Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser 180 185 190 Phe Arg Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn 195 200 205 Ile Lys Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala 210 215 220 Tyr Gly Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val 225 230 235 240 Phe Asp Val Glu Leu Leu Asp Val Lys Pro Ala Pro Lys Ala Asp Ala 245 250 255 Lys Pro Glu Ala Asp Ala Lys Ala Ala Asp Ser Ala Lys Lys 260 265 270 <210> 30 <211> 828 <212> DNA <213> Artificial Sequence <220> <223> the FkpA tagged gene <400> 30 atgaaatcac tgtttaaagt aacgctgctg gcgaccacaa tggccgttgc cctgcacgca 60 ccaatcactt ttgctgctga agctgcaaaa cctgctactg ctgctgacag caaagcagcg 120 ttcaaaaatg acgatcagaa atcagcttat gcactgggtg cctcgctggg tcgttacatg 180 gaaaactctc taaaagaaca agaaaaactg ggcatcaaac tggataaaga tcaactgatc 240 gctggtgttc aggatgcatt tgctgataag agcaaactct ccgaccaaga gatcgaacag 300 actctacaag catttgaagc tcgcgtgaag tcttctgctc aggcgaagat ggaaaaagac 360 gcggctgata acgaagcaaa aggtaaagag taccgcgaga aatttgccaa agagaaaggt 420 gtgaaaacct cttcaactgg tctggtttat caggtagtag aagccggtaa aggcgaagca 480 ccgaaagaca gcgatactgt tgtagtgaac tacaaaggta cgctgatcga cggtaaagag 540 ttcgacaact cttacacccg tggtgaaccg ctttctttcc gtctggacgg tgttatcccg 600 ggttggacag aaggtctgaa gaacatcaag aaaggcggta agataaaact ggttattcca 660 ccagaactgg cttacggcaa agcgggtgtt ccggggattc caccaaattc taccctggtg 720 tttgacgtag agctgctgga tgtgaaacca gcgccgaagg ctgatgcaaa gccggaagct 780 gatgcgaaag ccgcagattc tgctaaaaaa caccatcacc atcaccac 828 <210> 31 <211> 276 <212> PRT <213> Artificial Sequence <220> <223> FkpA his tagged gene <400> 31 Met Lys Ser Leu Phe Lys Val Thr Leu Leu Ala Thr Thr Met Ala Val 1 5 10 15 Ala Leu His Ala Pro Ile Thr Phe Ala Ala Glu Ala Ala Lys Pro Ala 20 25 30 Thr Ala Ala Asp Ser Lys Ala Ala Phe Lys Asn Asp Asp Gln Lys Ser 35 40 45 Ala Tyr Ala Leu Gly Ala Ser Leu Gly Arg Tyr Met Glu Asn Ser Leu 50 55 60 Lys Glu Gln Glu Lys Leu Gly Ile Lys Leu Asp Lys Asp Gln Leu Ile 65 70 75 80 Ala Gly Val Gln Asp Ala Phe Ala Asp Lys Ser Lys Leu Ser Asp Gln 85 90 95 Glu Ile Glu Gln Thr Leu Gln Ala Phe Glu Ala Arg Val Lys Ser Ser 100 105 110 Ala Gln Ala Lys Met Glu Lys Asp Ala Ala Asp Asn Glu Ala Lys Gly 115 120 125 Lys Glu Tyr Arg Glu Lys Phe Ala Lys Glu Lys Gly Val Lys Thr Ser 130 135 140 Ser Thr Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala 145 150 155 160 Pro Lys Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile 165 170 175 Asp Gly Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser 180 185 190 Phe Arg Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn 195 200 205 Ile Lys Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala 210 215 220 Tyr Gly Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val 225 230 235 240 Phe Asp Val Glu Leu Leu Asp Val Lys Pro Ala Pro Lys Ala Asp Ala 245 250 255 Lys Pro Glu Ala Asp Ala Lys Ala Ala Asp Ser Ala Lys Lys His His 260 265 270 His His His His 275 <210> 32 <211> 486 <212> DNA <213> Escherichia coli <400> 32 gtgaaaaagt ggttattagc tgcaggtctc ggtttagcac tggcaacttc tgctcaggcg 60 gctgacaaaa ttgcaatcgt caacatgggc agcctgttcc agcaggtagc gcagaaaacc 120 ggtgtttcta acacgctgga aaatgagttc aaaggccgtg ccagcgaact gcagcgtatg 180 gaaaccgatc tgcaggctaa aatgaaaaag ctgcagtcca tgaaagcggg cagcgatcgc 240 actaagctgg aaaaagacgt gatggctcag cgccagactt ttgctcagaa agcgcaggct 300 tttgagcagg atcgcgcacg tcgttccaac gaagaacgcg gcaaactggt tactcgtatc 360 cagactgctg tgaaatccgt tgccaacagc caggatatcg atctggttgt tgatgcaaac 420 gccgttgctt acaacagcag cgatgtaaaa gacatcactg ccgacgtact gaaacaggtt 480 aaataa 486 <210> 33 <211> 161 <212> PRT <213> Escherichia coli <400> 33 Met Lys Lys Trp Leu Leu Ala Ala Gly Leu Gly Leu Ala Leu Ala Thr 1 5 10 15 Ser Ala Gln Ala Ala Asp Lys Ile Ala Ile Val Asn Met Gly Ser Leu 20 25 30 Phe Gln Gln Val Ala Gln Lys Thr Gly Val Ser Asn Thr Leu Glu Asn 35 40 45 Glu Phe Lys Gly Arg Ala Ser Glu Leu Gln Arg Met Glu Thr Asp Leu 50 55 60 Gln Ala Lys Met Lys Lys Leu Gln Ser Met Lys Ala Gly Ser Asp Arg 65 70 75 80 Thr Lys Leu Glu Lys Asp Val Met Ala Gln Arg Gln Thr Phe Ala Gln 85 90 95 Lys Ala Gln Ala Phe Glu Gln Asp Arg Ala Arg Arg Ser Asn Glu Glu 100 105 110 Arg Gly Lys Leu Val Thr Arg Ile Gln Thr Ala Val Lys Ser Val Ala 115 120 125 Asn Ser Gln Asp Ile Asp Leu Val Val Asp Ala Asn Ala Val Ala Tyr 130 135 140 Asn Ser Ser Asp Val Lys Asp Ile Thr Ala Asp Val Leu Lys Gln Val 145 150 155 160 Lys <210> 34 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> skp his tagged gene <400> 34 atgaaaaagt ggttattagc cgcaggtctc ggtttagcac tggcaacttc tgctcaggcg 60 gctgacaaaa ttgcaatcgt caacatgggc agcctgttcc agcaggtagc gcagaaaacc 120 ggtgtttcta acacgctgga aaatgagttc aaaggccgtg ccagcgaact ccagcgtatg 180 gaaaccgatc tccaggctaa aatgaaaaag ctgcaatcca tgaaagcggg cagcgatcgc 240 actaagctgg aaaaagacgt gatggctcag cgccagactt ttgctcagaa agcgcaggct 300 tttgagcagg atcgcgcacg tcgttccaac gaagaacgcg gcaaactggt tactcgtatc 360 cagactgctg tgaaatccgt tgccaacagc caggaaatcg atctggttgt tgatgcaaac 420 gccgttgctt acaacagcag cgatgtaaaa gacatcactg ccgacgtact gaaacaggtt 480 aaacaccatc accatcacca c 501 <210> 35 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> skp his tagged gene <400> 35 Met Lys Lys Trp Leu Leu Ala Ala Gly Leu Gly Leu Ala Leu Ala Thr 1 5 10 15 Ser Ala Gln Ala Ala Asp Lys Ile Ala Ile Val Asn Met Gly Ser Leu 20 25 30 Phe Gln Gln Val Ala Gln Lys Thr Gly Val Ser Asn Thr Leu Glu Asn 35 40 45 Glu Phe Lys Gly Arg Ala Ser Glu Leu Gln Arg Met Glu Thr Asp Leu 50 55 60 Gln Ala Lys Met Lys Lys Leu Gln Ser Met Lys Ala Gly Ser Asp Arg 65 70 75 80 Thr Lys Leu Glu Lys Asp Val Met Ala Gln Arg Gln Thr Phe Ala Gln 85 90 95 Lys Ala Gln Ala Phe Glu Gln Asp Arg Ala Arg Arg Ser Asn Glu Glu 100 105 110 Arg Gly Lys Leu Val Thr Arg Ile Gln Thr Ala Val Lys Ser Val Ala 115 120 125 Asn Ser Gln Glu Ile Asp Leu Val Val Asp Ala Asn Ala Val Ala Tyr 130 135 140 Asn Ser Ser Asp Val Lys Asp Ile Thr Ala Asp Val Leu Lys Gln Val 145 150 155 160 Lys His His His His His His 165 <210> 36 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> CA170 1519 Ab CDRH1 <400> 36 Gly Phe Thr Phe Ser Asn Tyr Gly Met Val 1 5 10 <210> 37 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> CA170_1519 Ab CDRH2 <400> 37 Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val Lys 1 5 10 15 Gly <210> 38 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> CA170_1519 Ab CDRH3 <400> 38 Gly Ile Val Arg Pro Phe Leu Tyr 1 5 <210> 39 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> CA170_1519 Ab CDRL1 <400> 39 Lys Ser Ser Gln Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr 1 5 10 15 <210> 40 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CA170_1519 Ab CDRL2 <400> 40 Leu Val Ser Thr Leu Asp Ser 1 5 <210> 41 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CA170_1519 Ab CDRL3 <400> 41 Leu Gln Gly Thr His Phe Pro His Thr 1 5 <210> 42 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> Rat Ab 1519 VL region <400> 42 Asp Val Val Met Thr Gln Thr Pro Leu Ser Leu Ser Val Ala Leu Gly 1 5 10 15 Gln Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser Leu Val Gly Ala 20 25 30 Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Arg Ser Gly Gln Ser 35 40 45 Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro 50 55 60 Asp Arg Phe Ser Gly Ser Gly Ala Glu Thr Asp Phe Thr Leu Lys Ile 65 70 75 80 Arg Arg Val Glu Ala Asp Asp Leu Gly Val Tyr Tyr Cys Leu Gln Gly 85 90 95 Thr His Phe Pro His Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys 100 105 110 <210> 43 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> Rat Ab 1519 VL region <400> 43 gatgttgtga tgacccagac tccactgtct ttgtcggttg cccttggaca accagcctcc 60 atctcttgca agtcaagtca gagcctcgta ggtgctagtg gaaagacata tttgtattgg 120 ttatttcaga ggtccggcca gtctccaaag cgactaatct atctggtgtc cacactggac 180 tctggaattc ctgataggtt cagtggcagt ggagcagaga cagattttac tcttaaaatc 240 cgcagagtgg aagccgatga tttgggagtt tattactgct tgcaaggtac acattttcct 300 cacacgtttg gagctgggac caagctggaa ttgaaa 336 <210> 44 <211> 132 <212> PRT <213> Artificial Sequence <220> <223> Rat Ab 1519 VL region <400> 44 Met Met Ser Pro Ala Gln Phe Leu Phe Leu Leu Met Leu Trp Ile Gln 1 5 10 15 Gly Thr Ser Gly Asp Val Val Met Thr Gln Thr Pro Leu Ser Leu Ser 20 25 30 Val Ala Leu Gly Gln Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser 35 40 45 Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Arg 50 55 60 Ser Gly Gln Ser Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp 65 70 75 80 Ser Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ala Glu Thr Asp Phe 85 90 95 Thr Leu Lys Ile Arg Arg Val Glu Ala Asp Asp Leu Gly Val Tyr Tyr 100 105 110 Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Ala Gly Thr Lys 115 120 125 Leu Glu Leu Lys 130 <210> 45 <211> 396 <212> DNA <213> Artificial Sequence <220> <223> Rat Ab 1519 VL region <400> 45 atgatgagtc ctgcccagtt cctgtttctg ctgatgctct ggattcaggg aaccagtggt 60 gatgttgtga tgacccagac tccactgtct ttgtcggttg cccttggaca accagcctcc 120 atctcttgca agtcaagtca gagcctcgta ggtgctagtg gaaagacata tttgtattgg 180 ttatttcaga ggtccggcca gtctccaaag cgactaatct atctggtgtc cacactggac 240 tctggaattc ctgataggtt cagtggcagt ggagcagaga cagattttac tcttaaaatc 300 cgcagagtgg aagccgatga tttgggagtt tattactgct tgcaaggtac acattttcct 360 cacacgtttg gagctgggac caagctggaa ttgaaa 396 <210> 46 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> Rat Ab 1519 VH region <400> 46 Glu Val Pro Leu Val Glu Ser Gly Gly Gly Ser Val Gln Pro Gly Arg 1 5 10 15 Ser Met Lys Leu Ser Cys Val Val Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Gly Met Val Trp Val Arg Gln Ala Pro Lys Lys Gly Leu Glu Trp Val 35 40 45 Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asn Asn Ala Lys Ser Thr Leu Tyr 65 70 75 80 Leu Gln Met Asp Ser Leu Arg Ser Glu Asp Thr Ala Thr Tyr Tyr Cys 85 90 95 Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Thr 100 105 110 Val Thr Val Ser 115 <210> 47 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> Rat Ab 1519 VH region <400> 47 gaggtgccgc tggtggagtc tgggggcggc tcagtgcagc ctgggaggtc catgaaactc 60 tcctgtgtag tctcaggatt cactttcagt aattatggca tggtctgggt ccgccaggct 120 ccaaagaagg gtctggagtg ggtcgcatat attgattctg atggtgataa tacttactac 180 cgagattccg tgaagggccg attcactatc tccagaaata atgcaaaaag caccctatat 240 ttgcaaatgg acagtctgag gtctgaggac acggccactt attactgtac aacagggatt 300 gtccggccct ttctctattg gggccaagga accacggtca ccgtctcg 348 <210> 48 <211> 135 <212> PRT <213> Artificial Sequence <220> <223> Rat Ab 1519 VH region <400> 48 Met Asp Ile Ser Leu Ser Leu Ala Phe Leu Val Leu Phe Ile Lys Gly 1 5 10 15 Val Arg Cys Glu Val Pro Leu Val Glu Ser Gly Gly Gly Ser Val Gln 20 25 30 Pro Gly Arg Ser Met Lys Leu Ser Cys Val Val Ser Gly Phe Thr Phe 35 40 45 Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Lys Lys Gly Leu 50 55 60 Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg 65 70 75 80 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asn Asn Ala Lys Ser 85 90 95 Thr Leu Tyr Leu Gln Met Asp Ser Leu Arg Ser Glu Asp Thr Ala Thr 100 105 110 Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln 115 120 125 Gly Thr Thr Val Thr Val Ser 130 135 <210> 49 <211> 405 <212> DNA <213> Artificial Sequence <220> <223> Rat Ab 1519 VH region <400> 49 atggacatca gtctcagctt ggctttcctt gtccttttca taaaaggtgt ccggtgtgag 60 gtgccgctgg tggagtctgg gggcggctca gtgcagcctg ggaggtccat gaaactctcc 120 tgtgtagtct caggattcac tttcagtaat tatggcatgg tctgggtccg ccaggctcca 180 aagaagggtc tggagtgggt cgcatatatt gattctgatg gtgataatac ttactaccga 240 gattccgtga agggccgatt cactatctcc agaaataatg caaaaagcac cctatatttg 300 caaatggaca gtctgaggtc tgaggacacg gccacttatt actgtacaac agggattgtc 360 cggccctttc tctattgggg ccaaggaacc acggtcaccg tctcg 405 <210> 50 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> 1519 gL20 V-region <400> 50 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala 20 25 30 Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala 35 40 45 Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro 50 55 60 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile 65 70 75 80 Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly 85 90 95 Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 100 105 110 <210> 51 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> 1519 gL20 V-region <400> 51 gatatccaga tgacccagag tccaagcagt ctctccgcca gcgtaggcga tcgtgtgact 60 attacctgta aaagctccca gtccctggtg ggtgcaagcg gcaaaaccta cctgtactgg 120 ctcttccaga aaccgggcaa agctccgaaa cgcctgatct atctggtgtc taccctggat 180 agcggtattc cgtctcgttt ctccggtagc ggtagcggta ccgaattcac gctgaccatt 240 agctccctcc agccggagga ctttgctacc tattactgcc tccagggcac tcattttccg 300 cacactttcg gccagggtac caaactggaa atcaaa 336 <210> 52 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> 1519 gL20 V-region <400> 52 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 20 25 30 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln 35 40 45 Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln 50 55 60 Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu 65 70 75 80 Asp Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu 85 90 95 Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr 100 105 110 Tyr Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr 115 120 125 Lys Leu Glu Ile Lys 130 <210> 53 <211> 399 <212> DNA <213> Artificial Sequence <220> <223> 1519 gL20 V-region <400> 53 atgaaaaaga cagctatcgc aattgcagtg gccttggctg gtttcgctac cgtagcgcaa 60 gctgatatcc agatgaccca gagtccaagc agtctctccg ccagcgtagg cgatcgtgtg 120 actattacct gtaaaagctc ccagtccctg gtgggtgcaa gcggcaaaac ctacctgtac 180 tggctcttcc agaaaccggg caaagctccg aaacgcctga tctatctggt gtctaccctg 240 gatagcggta ttccgtctcg tttctccggt agcggtagcg gtaccgaatt cacgctgacc 300 attagctccc tccagccgga ggactttgct acctattact gcctccaggg cactcatttt 360 ccgcacactt tcggccaggg taccaaactg gaaatcaaa 399 <210> 54 <211> 219 <212> PRT <213> Artificial Sequence <220> <223> 1519 gL20 light chain (V + constant) <400> 54 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala 20 25 30 Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala 35 40 45 Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro 50 55 60 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile 65 70 75 80 Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly 85 90 95 Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 100 105 110 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 115 120 125 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 130 135 140 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 145 150 155 160 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 165 170 175 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 180 185 190 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 195 200 205 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 210 215 <210> 55 <211> 657 <212> DNA <213> Artificial Sequence <220> <223> 1519 gL20 light chain (V + constant) <400> 55 gatatccaga tgacccagag tccaagcagt ctctccgcca gcgtaggcga tcgtgtgact 60 attacctgta aaagctccca gtccctggtg ggtgcaagcg gcaaaaccta cctgtactgg 120 ctcttccaga aaccgggcaa agctccgaaa cgcctgatct atctggtgtc taccctggat 180 agcggtattc cgtctcgttt ctccggtagc ggtagcggta ccgaattcac gctgaccatt 240 agctccctcc agccggagga ctttgctacc tattactgcc tccagggcac tcattttccg 300 cacactttcg gccagggtac caaactggaa atcaaacgta cggtagcggc cccatctgtc 360 ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 420 ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 480 tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctc 540 agcagcaccc tgacgctgag caaagcagac tacgagaaac acaaagtcta cgcctgcgaa 600 gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgt 657 <210> 56 <211> 240 <212> PRT <213> Artificial Sequence <220> <223> 1519 gL20 light chain <400> 56 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu 20 25 30 Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln 35 40 45 Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln 50 55 60 Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu 65 70 75 80 Asp Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu 85 90 95 Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr 100 105 110 Tyr Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr 115 120 125 Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe 130 135 140 Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys 145 150 155 160 Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val 165 170 175 Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln 180 185 190 Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser 195 200 205 Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His 210 215 220 Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 225 230 235 240 <210> 57 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> 1519 gL20 light chain <400> 57 atgaaaaaga cagctatcgc aattgcagtg gccttggctg gtttcgctac cgtagcgcaa 60 gctgatatcc agatgaccca gagtccaagc agtctctccg ccagcgtagg cgatcgtgtg 120 actattacct gtaaaagctc ccagtccctg gtgggtgcaa gcggcaaaac ctacctgtac 180 tggctcttcc agaaaccggg caaagctccg aaacgcctga tctatctggt gtctaccctg 240 gatagcggta ttccgtctcg tttctccggt agcggtagcg gtaccgaatt cacgctgacc 300 attagctccc tccagccgga ggactttgct acctattact gcctccaggg cactcatttt 360 ccgcacactt tcggccaggg taccaaactg gaaatcaaac gtacggtagc ggccccatct 420 gtcttcatct tcccgccatc tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc 480 ctgctgaata acttctatcc cagagaggcc aaagtacagt ggaaggtgga taacgccctc 540 caatcgggta actcccagga gagtgtcaca gagcaggaca gcaaggacag cacctacagc 600 ctcagcagca ccctgacgct gagcaaagca gactacgaga aacacaaagt ctacgcctgc 660 gaagtcaccc atcagggcct gagctcacca gtaacaaaaa gttttaatag aggggagtgt 720 <210> 58 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> 1519 gH20 V-region <400> 58 Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu 100 105 110 Val Thr Val Ser 115 <210> 59 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> 1519 gH20 V-region <400> 59 gaggttccgc tggtcgagtc tggaggcggg cttgtccagc ctggagggag cctgcgtctc 60 tcttgtgcag tatctggctt cacgttctcc aactacggta tggtgtgggt tcgtcaggct 120 ccaggtaaag gtctggaatg ggtggcgtat attgactccg acggcgacaa cacctactat 180 cgcgactctg tgaaaggtcg cttcaccatt tcccgcgata acgccaaatc cagcctgtac 240 ctgcagatga acagcctgcg tgctgaagat actgcggtgt actattgcac cactggcatc 300 gtgcgtccgt ttctgtattg gggtcagggt accctcgtta ctgtctcg 348 <210> 60 <211> 137 <212> PRT <213> Artificial Sequence <220> <223> 1519 gH20 V-region <400> 60 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu 20 25 30 Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe 35 40 45 Thr Phe Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys 50 55 60 Gly Leu Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr 65 70 75 80 Tyr Arg Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 85 90 95 Lys Ser Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr 100 105 110 Ala Val Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp 115 120 125 Gly Gln Gly Thr Leu Val Thr Val Ser 130 135 <210> 61 <211> 411 <212> DNA <213> Artificial Sequence <220> <223> 1519 gH20 V-region <400> 61 atgaagaaga ctgctatagc aattgcagtg gcgctagctg gtttcgccac cgtggcgcaa 60 gctgaggttc cgctggtcga gtctggaggc gggcttgtcc agcctggagg gagcctgcgt 120 ctctcttgtg cagtatctgg cttcacgttc tccaactacg gtatggtgtg ggttcgtcag 180 gctccaggta aaggtctgga atgggtggcg tatattgact ccgacggcga caacacctac 240 tatcgcgact ctgtgaaagg tcgcttcacc atttcccgcg ataacgccaa atccagcctg 300 tacctgcaga tgaacagcct gcgtgctgaa gatactgcgg tgtactattg caccactggc 360 atcgtgcgtc cgtttctgta ttggggtcag ggtaccctcg ttactgtctc g 411 <210> 62 <211> 228 <212> PRT <213> Artificial Sequence <220> <223> 1519gH20 Fab' heavy chain (V + human gamma-1 CH1 + hinge) <400> 62 Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu 100 105 110 Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu 115 120 125 Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys 130 135 140 Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser 145 150 155 160 Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser 165 170 175 Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser 180 185 190 Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn 195 200 205 Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His 210 215 220 Thr Cys Ala Ala 225 <210> 63 <211> 684 <212> DNA <213> Artificial Sequence <220> <223> 1519gH20 Fab' heavy chain (V + human gamma-1 CH1 + hinge) <400> 63 gaggttccgc tggtcgagtc tggaggcggg cttgtccagc ctggagggag cctgcgtctc 60 tcttgtgcag tatctggctt cacgttctcc aactacggta tggtgtgggt tcgtcaggct 120 ccaggtaaag gtctggaatg ggtggcgtat attgactccg acggcgacaa cacctactat 180 cgcgactctg tgaaaggtcg cttcaccatt tcccgcgata acgccaaatc cagcctgtac 240 ctgcagatga acagcctgcg tgctgaagat actgcggtgt actattgcac cactggcatc 300 gtgcgtccgt ttctgtattg gggtcagggt accctcgtta ctgtctcgag cgcttctaca 360 aagggcccat cggtcttccc cctggcaccc tcctccaaga gcacctctgg gggcacagcg 420 gccctgggct gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca 480 ggcgccctga ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac 540 tccctcagca gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc 600 aacgtgaatc acaagcccag caacaccaag gtcgacaaga aagttgagcc caaatcttgt 660 gacaaaactc acacatgcgc cgcg 684 <210> 64 <211> 249 <212> PRT <213> Artificial Sequence <220> <223> 1519 gH20 Fab' heavy chain <400> 64 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu 20 25 30 Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe 35 40 45 Thr Phe Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys 50 55 60 Gly Leu Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr 65 70 75 80 Tyr Arg Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala 85 90 95 Lys Ser Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr 100 105 110 Ala Val Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp 115 120 125 Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro 130 135 140 Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr 145 150 155 160 Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr 165 170 175 Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro 180 185 190 Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr 195 200 205 Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn 210 215 220 His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser 225 230 235 240 Cys Asp Lys Thr His Thr Cys Ala Ala 245 <210> 65 <211> 747 <212> DNA <213> Artificial Sequence <220> <223> 1519 gH20 Fab' heavy chain <400> 65 atgaagaaga ctgctatagc aattgcagtg gcgctagctg gtttcgccac cgtggcgcaa 60 gctgaggttc cgctggtcga gtctggaggc gggcttgtcc agcctggagg gagcctgcgt 120 ctctcttgtg cagtatctgg cttcacgttc tccaactacg gtatggtgtg ggttcgtcag 180 gctccaggta aaggtctgga atgggtggcg tatattgact ccgacggcga caacacctac 240 tatcgcgact ctgtgaaagg tcgcttcacc atttcccgcg ataacgccaa atccagcctg 300 tacctgcaga tgaacagcct gcgtgctgaa gatactgcgg tgtactattg caccactggc 360 atcgtgcgtc cgtttctgta ttggggtcag ggtaccctcg ttactgtctc gagcgcttct 420 acaaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 480 gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 540 tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 600 tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 660 tgcaacgtga atcacaagcc cagcaacacc aaggtcgaca agaaagttga gcccaaatct 720 tgtgacaaaa ctcacacatg cgccgcg 747 <210> 66 <211> 444 <212> PRT <213> Artificial Sequence <220> <223> 1519gH20 IgG4 heavy chain (V + human gamma-4P constant) <400> 66 Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu 100 105 110 Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu 115 120 125 Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys 130 135 140 Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser 145 150 155 160 Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser 165 170 175 Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser 180 185 190 Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn 195 200 205 Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro 210 215 220 Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe 225 230 235 240 Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val 245 250 255 Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe 260 265 270 Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro 275 280 285 Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr 290 295 300 Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val 305 310 315 320 Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala 325 330 335 Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln 340 345 350 Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly 355 360 365 Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro 370 375 380 Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser 385 390 395 400 Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu 405 410 415 Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His 420 425 430 Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys 435 440 <210> 67 <211> 1939 <212> DNA <213> Artificial Sequence <220> <223> 1519gH20 IgG4 heavy chain (V + human gamma-4P constant, exons) <400> 67 gaggtaccac ttgtggaaag cggaggaggt cttgtgcagc ctggaggaag tttacgtctc 60 tcttgtgctg tgtctggctt caccttctcc aattacggaa tggtctgggt cagacaagca 120 cctggaaagg gtcttgaatg ggtggcctat attgactctg acggggacaa cacctactat 180 cgggattccg tgaaaggacg cttcacaatc tcccgagata acgccaagag ctcactgtac 240 ctgcagatga atagcctgag agccgaggat actgccgtgt actattgcac aacgggaatc 300 gttaggcctt ttctgtactg gggacagggc accttggtta ctgtctcgag cgcttctaca 360 aagggcccat ccgtcttccc cctggcgccc tgctccagga gcacctccga gagcacagcc 420 gccctgggct gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca 480 ggcgccctga ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac 540 tccctcagca gcgtggtgac cgtgccctcc agcagcttgg gcacgaagac ctacacctgc 600 aacgtagatc acaagcccag caacaccaag gtggacaaga gagttggtga gaggccagca 660 cagggaggga gggtgtctgc tggaagccag gctcagccct cctgcctgga cgcaccccgg 720 ctgtgcagcc ccagcccagg gcagcaaggc atgccccatc tgtctcctca cccggaggcc 780 tctgaccacc ccactcatgc ccagggagag ggtcttctgg atttttccac caggctccgg 840 gcagccacag gctggatgcc cctaccccag gccctgcgca tacaggggca ggtgctgcgc 900 tcagacctgc caagagccat atccgggagg accctgcccc tgacctaagc ccaccccaaa 960 ggccaaactc tccactccct cagctcagac accttctctc ctcccagatc tgagtaactc 1020 ccaatcttct ctctgcagag tccaaatatg gtcccccatg cccaccatgc ccaggtaagc 1080 caacccaggc ctcgccctcc agctcaaggc gggacaggtg ccctagagta gcctgcatcc 1140 agggacaggc cccagccggg tgctgacgca tccacctcca tctcttcctc agcacctgag 1200 ttcctggggg gaccatcagt cttcctgttc cccccaaaac ccaaggacac tctcatgatc 1260 tcccggaccc ctgaggtcac gtgcgtggtg gtggacgtga gccaggaaga ccccgaggtc 1320 cagttcaact ggtacgtgga tggcgtggag gtgcataatg ccaagacaaa gccgcgggag 1380 gagcagttca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca ccaggactgg 1440 ctgaacggca aggagtacaa gtgcaaggtc tccaacaaag gcctcccgtc ctccatcgag 1500 aaaaccatct ccaaagccaa aggtgggacc cacggggtgc gagggccaca tggacagagg 1560 tcagctcggc ccaccctctg ccctgggagt gaccgctgtg ccaacctctg tccctacagg 1620 gcagccccga gagccacagg tgtacaccct gcccccatcc caggaggaga tgaccaagaa 1680 ccaggtcagc ctgacctgcc tggtcaaagg cttctacccc agcgacatcg ccgtggagtg 1740 ggagagcaat gggcagccgg agaacaacta caagaccacg cctcccgtgc tggactccga 1800 cggctccttc ttcctctaca gcaggctaac cgtggacaag agcaggtggc aggaggggaa 1860 tgtcttctca tgctccgtga tgcatgaggc tctgcacaac cactacacac agaagagcct 1920 ctccctgtct ctgggtaaa 1939 <210> 68 <211> 347 <212> PRT <213> Artificial Sequence <220> <223> 1519gL20 FabFv light chain <400> 68 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala 20 25 30 Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala 35 40 45 Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro 50 55 60 Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile 65 70 75 80 Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly 85 90 95 Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys 100 105 110 Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu 115 120 125 Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe 130 135 140 Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln 145 150 155 160 Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser 165 170 175 Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu 180 185 190 Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser 195 200 205 Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys Ser Gly Gly Gly Gly 210 215 220 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr 225 230 235 240 Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly Asp Arg Val Thr Ile 245 250 255 Thr Cys Gln Ser Ser Pro Ser Val Trp Ser Asn Phe Leu Ser Trp Tyr 260 265 270 Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Glu Ala Ser 275 280 285 Lys Leu Thr Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly 290 295 300 Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala 305 310 315 320 Thr Tyr Tyr Cys Gly Gly Gly Tyr Ser Ser Ile Ser Asp Thr Thr Phe 325 330 335 Gly Cys Gly Thr Lys Val Glu Ile Lys Arg Thr 340 345 <210> 69 <211> 1041 <212> DNA <213> Artificial Sequence <220> <223> 1519gL20 FabFv light chain <400> 69 gatatccaga tgacccagag cccatctagc ttatccgctt ccgttggtga tcgcgtgaca 60 attacgtgta agagctccca atctctcgtg ggtgcaagtg gcaagaccta tctgtactgg 120 ctctttcaga agcctggcaa ggcaccaaaa cggctgatct atctggtgtc tacccttgac 180 tctgggatac cgtcacgatt ttccggatct gggagcggaa ctgagttcac actcacgatt 240 tcatcgctgc aacccgagga ctttgctacc tactactgcc tgcaaggcac tcatttccct 300 cacactttcg gccaggggac aaaactcgaa atcaaacgta cggtagcggc cccatctgtc 360 ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 420 ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 480 tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctg 540 agcagcaccc tgacgctgtc taaagcagac tacgagaaac acaaagtgta cgcctgcgaa 600 gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgtagc 660 ggtggcggtg gcagtggtgg gggaggctcc ggaggtggcg gttcagacat acaaatgacc 720 cagagtcctt catcggtatc cgcgtccgtt ggcgataggg tgactattac atgtcaaagc 780 tctcctagcg tctggagcaa ttttctatcc tggtatcaac agaaaccggg gaaggctcca 840 aaacttctga tttatgaagc ctcgaaactc accagtggag ttccgtcaag attcagtggc 900 tctggatcag ggacagactt cacgttgaca atcagttcgc tgcaaccaga ggactttgcg 960 acctactatt gtggtggagg ttacagtagc ataagtgata cgacatttgg gtgcggtact 1020 aaggtggaaa tcaaacgtac c 1041 <210> 70 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> 1519gL20 FabFv light chain <400> 70 Met Ser Val Pro Thr Gln Val Leu Gly Leu Leu Leu Leu Trp Leu Thr 1 5 10 15 Asp Ala Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser 20 25 30 Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser 35 40 45 Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys 50 55 60 Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp 65 70 75 80 Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe 85 90 95 Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr 100 105 110 Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys 115 120 125 Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro 130 135 140 Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu 145 150 155 160 Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp 165 170 175 Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp 180 185 190 Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys 195 200 205 Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln 210 215 220 Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys Ser 225 230 235 240 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp 245 250 255 Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly Asp 260 265 270 Arg Val Thr Ile Thr Cys Gln Ser Ser Pro Ser Val Trp Ser Asn Phe 275 280 285 Leu Ser Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 290 295 300 Tyr Glu Ala Ser Lys Leu Thr Ser Gly Val Pro Ser Arg Phe Ser Gly 305 310 315 320 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 325 330 335 Glu Asp Phe Ala Thr Tyr Tyr Cys Gly Gly Gly Tyr Ser Ser Ile Ser 340 345 350 Asp Thr Thr Phe Gly Cys Gly Thr Lys Val Glu Ile Lys Arg Thr 355 360 365 <210> 71 <211> 1101 <212> DNA <213> Artificial Sequence <220> <223> 1519gL20 FabFv light chain <400> 71 atgtctgtcc ccacccaagt cctcggactc ctgctactct ggcttacaga tgccagatgc 60 gatatccaga tgacccagag cccatctagc ttatccgctt ccgttggtga tcgcgtgaca 120 attacgtgta agagctccca atctctcgtg ggtgcaagtg gcaagaccta tctgtactgg 180 ctctttcaga agcctggcaa ggcaccaaaa cggctgatct atctggtgtc tacccttgac 240 tctgggatac cgtcacgatt ttccggatct gggagcggaa ctgagttcac actcacgatt 300 tcatcgctgc aacccgagga ctttgctacc tactactgcc tgcaaggcac tcatttccct 360 cacactttcg gccaggggac aaaactcgaa atcaaacgta cggtagcggc cccatctgtc 420 ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 480 ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 540 tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctg 600 agcagcaccc tgacgctgtc taaagcagac tacgagaaac acaaagtgta cgcctgcgaa 660 gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgtagc 720 ggtggcggtg gcagtggtgg gggaggctcc ggaggtggcg gttcagacat acaaatgacc 780 cagagtcctt catcggtatc cgcgtccgtt ggcgataggg tgactattac atgtcaaagc 840 tctcctagcg tctggagcaa ttttctatcc tggtatcaac agaaaccggg gaaggctcca 900 aaacttctga tttatgaagc ctcgaaactc accagtggag ttccgtcaag attcagtggc 960 tctggatcag ggacagactt cacgttgaca atcagttcgc tgcaaccaga ggactttgcg 1020 acctactatt gtggtggagg ttacagtagc ataagtgata cgacatttgg gtgcggtact 1080 aaggtggaaa tcaaacgtac c 1101 <210> 72 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> 1519gH20 FabFv heavy chain <400> 72 Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu 100 105 110 Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu 115 120 125 Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys 130 135 140 Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser 145 150 155 160 Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser 165 170 175 Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser 180 185 190 Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn 195 200 205 Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Ser Gly Gly Gly 210 215 220 Gly Ser Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser Glu Val Gln Leu 225 230 235 240 Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu 245 250 255 Ser Cys Ala Val Ser Gly Ile Asp Leu Ser Asn Tyr Ala Ile Asn Trp 260 265 270 Val Arg Gln Ala Pro Gly Lys Cys Leu Glu Trp Ile Gly Ile Ile Trp 275 280 285 Ala Ser Gly Thr Thr Phe Tyr Ala Thr Trp Ala Lys Gly Arg Phe Thr 290 295 300 Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser 305 310 315 320 Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Thr Val Pro 325 330 335 Gly Tyr Ser Thr Ala Pro Tyr Phe Asp Leu Trp Gly Gln Gly Thr Leu 340 345 350 Val Thr Val Ser Ser 355 <210> 73 <211> 1071 <212> DNA <213> Artificial Sequence <220> <223> 1519gH20 FabFv heavy chain <400> 73 gaggtaccac ttgtggaaag cggaggaggt cttgtgcagc ctggaggaag tttacgtctc 60 tcttgtgctg tgtctggctt caccttctcc aattacggaa tggtctgggt cagacaagca 120 cctggaaagg gtcttgaatg ggtggcctat attgactctg acggggacaa cacctactat 180 cgggattccg tgaaaggacg cttcacaatc tcccgagata acgccaagag ctcactgtac 240 ctgcagatga atagcctgag agccgaggat actgccgtgt actattgcac aacgggaatc 300 gttaggcctt ttctgtactg gggacagggc accttggtta ctgtctcgag cgcgtccaca 360 aagggcccat cggtcttccc cctggcaccc tcctccaaga gcacctctgg gggcacagcg 420 gccctgggct gcctggtcaa ggactacttc cccgaaccag tgacggtgtc gtggaactca 480 ggtgccctga ccagcggcgt tcacaccttc ccggctgtcc tacagtcttc aggactctac 540 tccctgagca gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc 600 aacgtgaatc acaagcccag caacaccaag gtcgataaga aagttgagcc caaatcttgt 660 agtggaggtg ggggctcagg tggaggcggg accggtggag gtggcagcga ggttcaactg 720 cttgagtctg gaggaggcct agtccagcct ggagggagcc tgcgtctctc ttgtgcagta 780 agcggcatcg acctgagcaa ttacgccatc aactgggtga gacaagctcc ggggaagtgt 840 ttagaatgga tcggtataat atgggccagt gggacgacct tttatgctac atgggcgaaa 900 ggaaggttta caattagccg ggacaatagc aaaaacaccg tgtatctcca aatgaactcc 960 ttgcgagcag aggacacggc ggtgtactat tgtgctcgca ctgtcccagg ttatagcact 1020 gcaccctact tcgatctgtg gggacaaggg accctggtga ctgtttcaag t 1071 <210> 74 <211> 376 <212> PRT <213> Artificial Sequence <220> <223> 1519gH20 FabFv heavy chain <400> 74 Met Glu Trp Ser Trp Val Phe Leu Phe Phe Leu Ser Val Thr Thr Gly 1 5 10 15 Val His Ser Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln 20 25 30 Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe 35 40 45 Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu 50 55 60 Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg 65 70 75 80 Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser 85 90 95 Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val 100 105 110 Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln 115 120 125 Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val 130 135 140 Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala 145 150 155 160 Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser 165 170 175 Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val 180 185 190 Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro 195 200 205 Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys 210 215 220 Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Ser 225 230 235 240 Gly Gly Gly Gly Ser Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser Glu 245 250 255 Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser 260 265 270 Leu Arg Leu Ser Cys Ala Val Ser Gly Ile Asp Leu Ser Asn Tyr Ala 275 280 285 Ile Asn Trp Val Arg Gln Ala Pro Gly Lys Cys Leu Glu Trp Ile Gly 290 295 300 Ile Ile Trp Ala Ser Gly Thr Thr Phe Tyr Ala Thr Trp Ala Lys Gly 305 310 315 320 Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln 325 330 335 Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg 340 345 350 Thr Val Pro Gly Tyr Ser Thr Ala Pro Tyr Phe Asp Leu Trp Gly Gln 355 360 365 Gly Thr Leu Val Thr Val Ser Ser 370 375 <210> 75 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Wild type Tsp 5' <400> 75 Met Asn Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile 1 5 10 15 Ala Gly Gln Thr Phe Ala 20 <210> 76 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Wild type Tsp 5' <400> 76 atgaacatgt tttttaggct taccgcgtta gctggcctgc ttgcaatagc aggccagacc 60 ttcgct 66 <210> 77 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Mutated Tsp 5' fragment <400> 77 Met Asn Ser Phe Leu Gly Leu Pro Arg Leu Ala Cys Leu Gln Gln Ala 1 5 10 15 Arg His Leu <210> 78 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Mutated Tsp 5' fragment <400> 78 atgaattcgt ttttaggctt accgcgttag ctggcctgct tgcaatagca ggccagacat 60 taattg 66 <210> 79 <211> 20 <212> PRT <213> Artificial <220> <223> Mutated delta ptr (protease III) 5' <400> 79 Ile Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu 1 5 10 15 Trp Ala His Cys 20 <210> 80 <211> 66 <212> DNA <213> Artificial <220> <223> Mutated delta ptr (protease III) 5' <400> 80 tgaattcccc gcagcacctg gttcaaagca ttattgttgt tagttgccct ttgggcacat 60 taatgt 66 <210> 81 <211> 21 <212> PRT <213> Artificial <220> <223> Wild-type ptr (protease III) 5' <400> 81 Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu 1 5 10 15 Trp Ala Pro Leu Ser 20 <210> 82 <211> 66 <212> DNA <213> Artificial <220> <223> Wild-type ptr (protease III) 5' <400> 82 tgaatgcccc gcagcacctg gttcaaagca ttattgttgt tagttgccct ttgggcaccc 60 ttaagt 66

Claims

재조합 그람(gram) 음성 박테리아 세포로서,
a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및
b. FkpA, Skp, 또는 FkpA와 Skp의 조합으로부터 선택되는, 단백질 접힘(folding)을 용이하게 할 수 있는 하나 이상의 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터
를 포함하며, 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고, DsbC를 코딩하는 재조합 폴리뉴클레오티드를 포함하지 않는, 재조합 그람 음성 박테리아 세포.
제1항에 있어서, 돌연변이 spr 유전자가 D133A, H145A, H157A, N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, V135D, V135G, L136P, G140C, R144C 및 G147C로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제2항에 있어서, 돌연변이 spr 유전자가 S95F, V98E, Y115F, D133A, V135D, V135G 및 G147C로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제3항에 있어서, 돌연변이 spr 유전자가 돌연변이 C94 및 H145A를 갖는 spr 단백질을 코딩하는 것인 세포.
제2항에 있어서, 돌연변이 spr 유전자가 D133A, H145A 및 H157A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제1항에 있어서, 돌연변이 spr 유전자가 C94A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 돌연변이 spr 유전자가 세포의 게놈 내에 통합되는 것인 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 단백질 접힘을 용이하게 할 수 있는 단백질을 코딩하는 유전자가 세포 내로 일시적으로 형질감염되는 것인 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 하기 돌연변이된 유전자 중 하나 이상을 추가로 포함하는 것인 세포:
a. 샤페론 활성(chaperone activity) 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자;
b. 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하거나 넉아웃(knockout) 돌연변이된 ptr 유전자인, 돌연변이된 ptr 유전자; 및
c. 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하거나 넉아웃 돌연변이된 OmpT 유전자인, 돌연변이된 OmpT 유전자.
제1항 내지 제6항 중 어느 한 항에 있어서, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하거나 넉아웃 돌연변이된 Tsp 유전자인, 돌연변이된 Tsp 유전자를 포함하는 세포.
제9항에 있어서, 세포의 게놈은, 돌연변이된 spr 유전자 및 돌연변이된 Tsp 유전자를 제외하고는, 야생형 박테리아 세포에 대하여 동질 유전자형인 세포.
재조합 그람 음성 박테리아 세포로서,
야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고,
돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및
단백질 접힘을 용이하게 할 수 있는 단백질의 발현에 적합한, FkpA, Skp 또는 FkpA와 Skp의 조합을 코딩하는 유전자
를 가지며, 세포의 게놈이, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 야생형 박테리아 세포에 대하여 동질 유전자형인 재조합 그람 음성 박테리아 세포.
제12항에 있어서, 돌연변이 spr 유전자가 N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C, H157A 및 W174R로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제12항에 있어서, 돌연변이 spr 유전자가 제1항 내지 제6항 중 어느 한 항에 정의된 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
제1항 또는 제12항에 있어서, 유전자 개시 코돈, 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈, 또는 이들의 조합에 대한 돌연변이를 포함하는 넉아웃 돌연변이된 Tsp 유전자를 갖는 세포.
제15항에 있어서, 넉아웃 돌연변이된 Tsp 유전자는 유전자 개시 코돈에 대한 미스센스(missense) 돌연변이 및 하나 이상의 추가의 점 돌연변이에 의해 생성된 제한 표지 부위를 포함하는 것인 세포.
제16항에 있어서, 넉아웃 돌연변이된 Tsp 유전자가 서열 번호 3을 포함하는 것인 세포.
제1항 또는 제12항에 있어서, 세포가 이. 콜라이(E. coli) 인 세포.
제1항 또는 제12항에 있어서, 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 세포.
제19항에 있어서, 관심의 단백질이 항체 또는 이의 항원 결합 단편인 세포.
제20항에 있어서, 항체 또는 이의 항원 결합 단편이 FcRn에 대하여 특이적인 것인 세포.
재조합 그람 음성 박테리아 세포로서,
야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고,
돌연변이 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및 FkpA, Skp, 또는 FkpA와 Skp의 조합으로부터 선택되는, 단백질 접힘을 용이하게 할 수 있는 단백질의 발현에 적합한 유전자를 코딩하는 유전자를 포함하며,
FcRn에 대하여 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 그람 음성 박테리아 세포.
제22항에 있어서, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이된 Tsp 유전자를 포함하는 세포.
배양 배지에서, 관심의 재조합 단백질을 발현시키기에 효과적인 조건 하에, 제1항, 제12항 및 제22항 중 어느 한 항에 정의된 재조합 그람 음성 박테리아 세포를 배양하는 단계, 및
관심의 재조합 단백질을 재조합 그람 음성 박테리아 세포의 주변 세포질, 배양 배지 또는 이들의 조합으로부터 회수하는 단계를 포함하는, 관심의 단백질의 제조 방법.
제24항에 있어서, 관심의 단백질을 상기 세포로부터 회수하는 단계를 추가로 포함하는 제조 방법.
제25항에 있어서, 관심의 단백질을 주변 세포질, 상청액 또는 이들의 조합으로부터 회수하는 것인 제조 방법.
삭제
삭제
삭제