KR102036399B1 - 단백질 발현용 재조합 박테리아 숙주 세포 - Google Patents
단백질 발현용 재조합 박테리아 숙주 세포 Download PDFInfo
- Publication number
- KR102036399B1 KR102036399B1 KR1020147032673A KR20147032673A KR102036399B1 KR 102036399 B1 KR102036399 B1 KR 102036399B1 KR 1020147032673 A KR1020147032673 A KR 1020147032673A KR 20147032673 A KR20147032673 A KR 20147032673A KR 102036399 B1 KR102036399 B1 KR 102036399B1
- Authority
- KR
- South Korea
- Prior art keywords
- ser
- leu
- gly
- ala
- val
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2803—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
- C07K16/283—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against Fc-receptors, e.g. CD16, CD32, CD64
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/10—Immunoglobulins specific features characterized by their source of isolation or production
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 발명은 a.) D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자 및 b.) FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘(folding)을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자를 포함하는 재조합 그람(gram) 음성 박테리아 세포로서, 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는 것인 세포, 이 세포의 이용 방법, 단백질, 특히 항체, 예컨대 항 FcRn 항체의 발현에 있어서의 이 세포의 용도 및 본원에 기술된 방법에 의해 제조된 단백질에 관한 것이다.
Description
본 발명은 재조합 박테리아 숙주 균주, 특히 이. 콜라이(E. coli)에 관한 것이다. 또한 본 발명은 이러한 세포에서 관심의 단백질을 생성하는 방법에 관한 것이다.
박테리아 세포, 예컨대 이. 콜라이는 재조합 단백질의 제조에 일반적으로 사용된다. 재조합 단백질의 생성용으로 박테리아 세포, 예컨대 이. 콜라이를 사용하는 것에 대한 많은 이점이 있으며, 이는 특히 플라스미드를 통한 유전자 삽입을 허용하는 숙주 세포로서의 박테리아 세포의 다재다능한 성질로 인한 것이다. 이. 콜라이는 인간 인슐린을 비롯하여 다수의 재조합 단백질의 제조에 사용되어 왔다.
재조합 단백질을 제조하기 위하여 박테리아 세포를 사용하는 것에 대한 많은 이점에도 불구하고, 프로테아제 민감성 단백질을 생성하는 것에 대한 어려움을 비롯하여 여전히 상당한 제한이 있다. 프로테아제는 이. 콜라이 주변 세포질(periplasm) 및 세포질에 있어서 오래되거나, 손상되거나, 잘못 접힌(mis-folded) 단백질을 턴오버(turn over)시키는 데 중요한 역할을 한다. 박테리아 프로테아제는 관심의 재조합 단백질을 분해시키는 작용을 하며, 이에 의해 활성 단백질의 수율이 흔히 유의하게 감소된다.
다수의 박테리아 프로테아제가 동정되었다. 이. 콜라이에서 프로테아제 III(ptr), DegP, OmpT, Tsp, prlC, ptrA, ptrB, pepA-T, tsh, espc, eatA, clpP 및 lon을 비롯한 프로테아제가 동정되었다.
Tsp(Prc로도 공지됨)는 60 kDa의 주변 세포질 프로테아제이다. Tsp의 첫 번째의 공지된 기질은 페니실린 결합 단백질-3(Penicillin-binding protein-3; PBP3)이었지만(문헌[Determination of the cleavage site involved in C-terminal processing of penicillin-binding protein 3 of Escherichia coli; Nagasawa H, Sakagami Y, Suzuki A, Suzuki H, Hara H, Hirota Y. J Bacteriol. 1989 Nov;171(11):5890-3] 및 문헌[Cloning, mapping and characterization of the Escherichia coli Tsp gene which is involved in C-terminal processing of penicillin-binding protein 3; Hara H, Yamamoto Y, Higashitani A, Suzuki H, Nishimura Y. J Bacteriol. 1991 Aug;173 (15):4799-813], Tsp는 파지 테일(phage tail) 단백질을 또한 절단할 수 있음이 나중에 발견되었으며, 따라서, 이것은 테일 특이적 프로테아제(Tail Specific Protease; Tsp)로 개명되었다(문헌[Silber et al., Proc. Natl. Acad. Sci. USA, 89: 295-299 (1992)]). 실버(Silber) 등의 문헌[Deletion of the prc(tsp) gene provides evidence for additional tail-specific proteolytic activity in Escherichia coli K-12; Silber, K.R., Sauer, R.T.; Mol Gen Genet 1994 242:237-240]에는 prc 결실 균주(KS1000)가 기술되어 있으며, 여기서, 돌연변이는 Kanr 마커를 포함하는 단편으로 prc 유전자의 절편을 대체함으로써 생성되었다.
Tsp(prc) 활성의 감소는 관심의 단백질의 단백질 분해를 감소시키는 데 바람직하다. 그러나, 프로테아제 prc가 결여된 세포는 낮은 오스몰 농도에서 감열적 성장을 나타낸다는 것이 밝혀졌다. 하라(Hara)등은 유전자외 억제(spr) 돌연변이를 함유하는 내열성 복귀 돌연변이체를 단리하였다(문헌[Hara et al., Microbial Drug Resistance, 2: 63-72 (1996)]). Spr은 18 kDa의 막 결합 주변 세포질 프로테아제이며, spr의 기질은 세포 분열 동안 세포벽 가수분해에 연루된 외막의 펩티도글리칸 및 Tsp이다. spr 유전자는 UniProtKB/Swiss-Prot P0AFV4(SPR_ECOLI)로 표기된다.
돌연변이 spr 유전자를 포함하는 개선된 프로테아제 결실 균주가 기술되었다. 첸(Chen) 등은 prc(Tsp)의 돌연변이와 또 다른 프로테아제, DegP의 돌연변이의 상이한 조합을 지닌 이. 콜라이 균주의 구성을 기술하고 있는데, 이는 상기 유전자의 상류 및 하류 영역을 증폭시키고 이들을 선발 마커 및 sprW174R 돌연변이를 포함하는 벡터에서 함께 라이게이션시킴으로써 생성된다(문헌[High-level accumulation of a recombinant antibody fragment in the periplasm of Escherichia coli requires a triple-mutant, (ΔDegP Δprc sprW174R) host strain, Chen C, Snedecor B, Nishihara JC, Joly JC, McFarland N, Andersen DC, Battersby JE, Champion KM. Biotechnol Bioeng. 2004 Mar 5;85(5):463-74]). ΔDegP, Δprc 및 sprW174R 돌연변이는 최고 수준의 항체 경쇄, 항체 중쇄 및 F(ab')2-LZ를 제공하는 것으로 밝혀졌다. 유럽 특허 제1341899호에는 각각 프로테아제 DegP 및 Prc를 코딩하는 염색체 DegP 및 prc에 결함이 있으며, prc 돌연변이체를 보유하고 있는 균주가 나타내는 성장 표현형을 억제하는 단백질을 코딩하는 돌연변이 spr 유전자를 보유한 이. 콜라이 균주가 개시되어 있다.
Tsp 및 spr 둘 모두에 돌연변이를 함유하는 다른 개선된 프로테아제 결실 균주가 국제 특허 공개 제WO2011/086136호에 기술되어 있다.
국제 특허 공개 제WO02/48376호에 개시된 균주는 lac-이며, 티미딘, 푸코스 또는 말토스가 탄소원으로 이용되는 배양에서는 성장할 수 없다. 이는 상업적 규모로서의 사용용으로 의도된 균주에 있어서 심하게 불리할 수 있다. 상기 균주와 결부된 추가의 불리한 점, 예를 들어 알칼리 포스파타아제의 생성의 결여가 있을 수 있다. 후자는 배양 배지로부터의 포스페이트의 이용에 연루된 주변 세포질 단백질이다.
특정 단백질은 펩티딜-프롤릴 이소머라아제 및/또는 이소머라아제 활성 및/또는 샤페론 활성을 나타내며, 재조합 단백질 발현에 이용되는 세포주에서 이용될 때 유리한 특성을 제공하는 것으로 밝혀졌다.
본 발명은 Tsp 및 spr 둘 모두의 돌연변이와, 재조합 단백질의 유리한 제조 수단을 제공하는, 단백질 접힘을 용이하게 할 수 있는 단백질(들)을 코딩하는 하나 이상의 유전자를 지닌 새로운 박테리아 균주를 제공한다.
본 발명의 제1 측면에서, 하기를 포함하는 재조합 그람(gram) 음성 박테리아 세포가 제공되며, 여기서, 이 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는다:
a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자 및
b. FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자(들).
본 발명의 일 실시 양태에서, 하기를 코딩하는 재조합 그람 음성 박테리아 세포가 제공되며, 여기서, 이 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 가지며, 세포 게놈 DNA의 나머지는 재조합 세포가 유래된 야생형 세포와 동질 유전자형이다:
a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자,
b. FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상이 단백질을 발현 또는 과발현시킬 수 있는 유전자(들),
c. 관심의 단백질, 예를 들어 항체 또는 이의 결합 단편을 발현할 수 있는 유전자.
일 실시 양태에서, 세포의 게놈은 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형, 돌연변이된 spr 유전자, 및 단백질 접힘을 용이하게 할 수 있는 단백질을 발현하는 유전자(들)를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.
제2 측면에서, 본 발명은 야생형 세포와 비교하여 Tsp 단백질 활성을 갖고, spr 단백질을 코딩하는 돌연변이 spr 유전자를 포함하는 재조합 그람 음성 박테리아 세포를 제공하며, 여기서, 세포의 게놈은 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형, 돌연변이된 spr 유전자 및 단백질 및 단백질 접힘을 용이하게 할 수 있는 단백질의 발현용으로 도입된 유전자(들)를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.
본 발명의 제1 및 제2 측면에 의해 제공된 세포는 유리한 성장 및 단백질 생성 표현형을 나타낸다.
제3 측면에서, 본 발명은 상기에 정의된 재조합 그람 음성 박테리아 세포에서 관심의 단백질을 발현시키는 것을 포함하는, 관심의 단백질을 제조하는 방법을 제공한다.
제4 측면에서, 본 발명은 또한 본원에 기술된 방법에 의해 발현된 단백질까지 연장된다.
도 1은 숙주 세포 및 "샤페론"의 다양한 조합을 이용하여 수행된 5 L 규모의 발효의 결과를 나타낸다. W3110은 야생형 이. 콜라이 균주이다. 다양한 조합은 다음과 같았다: 샤페론을 포함하지 않는 야생형; FkpA 및 Skp를 포함하는 야생형; 국제 특허 공개 제WO2011/086136호에 공개된 바와 같이 MXE016 돌연변이 spr 및 Δ Tsp; MXE016 및 FkpA; MXE016 및 Skp; MXE016 및 FkpA 및 Skp; 국제 특허 공개 제WO2011/086136호에 개시된 MXE017; MXE017 및 FkpA 및 Skp.
도 2는 5.4, 6.0 및 7.0 g/h의 유도 후 공급량에서의 공급량 변화 실험의 결과를 나타내며, MXE016에 있어서, 더욱 높은 공급량에서 만들어진 추가의 Fab' 중 대다수는 상청액에서 손실되었다.
도 3a, 도 3b는 MXE016 +/- FkpA의 생존율(도 3a) 및 Fab' 역가(도 3b)를 나타낸다.
도 4는 20 L 파일럿(pilot) 규모의 생산에 있어서의 일차 회수 데이터를 나타낸다.
도 5는 20 L 파일럿 규모 생산의 비환원 조건 하에서의 SDS-PAGE 염색 겔 상에서의 일차 회수를 나타낸다. FkpA 관련 밴드 이외에는, 단백질 프로필은 두 균주 사이에서 매우 유사한 것으로 보인다.
도 6은 20 L 파일럿 규보 공정에 있어서 비환원 조건 하에서의 His-태그 웨스턴 블롯(western blot)을 나타낸다. 전장 FkpA가 검출되었으며, 이는 대략 30 kDa의 밴드에 상응하고, 신호는 MXE016 단독에서는 검출되지 않았는데, 이는 예상된 바와 같다.
도 7a 내지 도 7c는 다양한 유전자에서의 다양한 돌연변이를 나타낸다.
도 7d는 항체의 경쇄(LC), 항체의 중쇄(HC)를 코딩하는 폴리뉴클레오티드 서열, FkpA 폴리뉴클레오티드 서열 및/또는 Skp 폴리뉴클레오티드를 포함하는 벡터의 생성의 도해를 나타낸다.
도 8은 다양한 폴리뉴클레오티드 및 아미노산 서열을 나타낸다.
서열의 간단한 설명
서열 번호 1은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAC를 포함하는 야생형 Tsp 유전자의 DNA 서열이다.
서열 번호 2는 야생형 Tsp 단백질의 아미노산 서열이다.
서열 번호 3은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAT를 포함하는 돌연변이된 넉아웃(knockout) Tsp 유전자의 DNA 서열이다.
서열 번호 4는 야생형 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 5는 야생형 프로테아제 III 단백질의 아미노산 서열이다.
서열 번호 6은 돌연변이된 넉아웃 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 7은 야생형 DegP 유전자의 DNA 서열이다.
서열 번호 8은 야생형 DegP 단백질의 아미노산 서열이다.
서열 번호 9는 돌연변이된 DegP 유전자의 DNA 서열이다.
서열 번호 10은 돌연변이된 DegP 단백질의 아미노산 서열이다.
서열 번호 11은 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 12는 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 13은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 14는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 15는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 16은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 17은 야생형 spr 유전자의 DNA 서열이다.
서열 번호 18은 처음 26개 아미노산 잔기인 신호 서열을 포함하는 야생형 spr 유전자의 서열이다.
서열 번호 19는 신호 서열을 포함하지 않는 비돌연변이 spr 유전자의 서열이다.
서열 번호 20은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 21은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 아미노산 서열이다.
서열 번호 22는 돌연변이 넉아웃 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 23은 OmpA 올리고뉴클레오티드 어댑터의 서열을 나타낸다.
서열 번호 24는 이. 콜라이 Fab 발현을 위한 유전자간 서열 1(intergenic sequence 1; IGS1)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 25는 이. 콜라이 Fab 발현을 위한 유전자간 서열 2(IGS2)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 26은 이. 콜라이 Fab 발현을 위한 유전자간 서열 3(IGS3)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 27은 이. 콜라이 Fab 발현을 위한 유전자간 서열 4(IGS4)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 28은 야생형 FkpA 유전자의 DNA 서열이다.
서열 번호 29는 야생형 FkpA 유전자의 단백질 서열이다.
서열 번호 30은 FkpA his 태그 유전자의 DNA 서열이다.
서열 번호 31은 FkpA his 태그 유전자의 단백질 서열이다.
서열 번호 32는 야생형 skp 유전자의 DNA 서열이다.
서열 번호 33은 야생형 skp 유전자의 단백질 서열이다.
서열 번호 34는 skp his 태그 유전자의 DNA 서열이다.
서열 번호 35는 skp his 태그 유전자의 단백질 서열이다.
서열 번호 36 내지 74는 FcRn 항체 또는 이의 단편의 다양한 아미노산 및 DNA 서열을 나타내는데, 이는 본 발명의 세포주에서의 발현에 적합하다. 특히, 서열 번호 50은 항-FcRn 항체 경쇄 1519gH20의 경쇄 가변 영역의 아미노산 서열이며, 서열 번호 58은 항-FcRn 항체 중쇄 1519gH20의 중쇄 가변 영역의 아미노산 서열이다.
도 2는 5.4, 6.0 및 7.0 g/h의 유도 후 공급량에서의 공급량 변화 실험의 결과를 나타내며, MXE016에 있어서, 더욱 높은 공급량에서 만들어진 추가의 Fab' 중 대다수는 상청액에서 손실되었다.
도 3a, 도 3b는 MXE016 +/- FkpA의 생존율(도 3a) 및 Fab' 역가(도 3b)를 나타낸다.
도 4는 20 L 파일럿(pilot) 규모의 생산에 있어서의 일차 회수 데이터를 나타낸다.
도 5는 20 L 파일럿 규모 생산의 비환원 조건 하에서의 SDS-PAGE 염색 겔 상에서의 일차 회수를 나타낸다. FkpA 관련 밴드 이외에는, 단백질 프로필은 두 균주 사이에서 매우 유사한 것으로 보인다.
도 6은 20 L 파일럿 규보 공정에 있어서 비환원 조건 하에서의 His-태그 웨스턴 블롯(western blot)을 나타낸다. 전장 FkpA가 검출되었으며, 이는 대략 30 kDa의 밴드에 상응하고, 신호는 MXE016 단독에서는 검출되지 않았는데, 이는 예상된 바와 같다.
도 7a 내지 도 7c는 다양한 유전자에서의 다양한 돌연변이를 나타낸다.
도 7d는 항체의 경쇄(LC), 항체의 중쇄(HC)를 코딩하는 폴리뉴클레오티드 서열, FkpA 폴리뉴클레오티드 서열 및/또는 Skp 폴리뉴클레오티드를 포함하는 벡터의 생성의 도해를 나타낸다.
도 8은 다양한 폴리뉴클레오티드 및 아미노산 서열을 나타낸다.
서열의 간단한 설명
서열 번호 1은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAC를 포함하는 야생형 Tsp 유전자의 DNA 서열이다.
서열 번호 2는 야생형 Tsp 단백질의 아미노산 서열이다.
서열 번호 3은 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAT를 포함하는 돌연변이된 넉아웃(knockout) Tsp 유전자의 DNA 서열이다.
서열 번호 4는 야생형 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 5는 야생형 프로테아제 III 단백질의 아미노산 서열이다.
서열 번호 6은 돌연변이된 넉아웃 프로테아제 III 유전자의 DNA 서열이다.
서열 번호 7은 야생형 DegP 유전자의 DNA 서열이다.
서열 번호 8은 야생형 DegP 단백질의 아미노산 서열이다.
서열 번호 9는 돌연변이된 DegP 유전자의 DNA 서열이다.
서열 번호 10은 돌연변이된 DegP 단백질의 아미노산 서열이다.
서열 번호 11은 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 12는 Ase I 제한 부위를 포함하는 돌연변이된 DegP 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 13은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 14는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 15는 Ase I 제한 부위를 포함하는 돌연변이된 프로테아제 III 유전자의 영역을 위한 5' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 16은 Ase I 제한 부위를 포함하는 돌연변이된 Tsp 유전자의 영역을 위한 3' 올리고뉴클레오티드 프라이머의 서열이다.
서열 번호 17은 야생형 spr 유전자의 DNA 서열이다.
서열 번호 18은 처음 26개 아미노산 잔기인 신호 서열을 포함하는 야생형 spr 유전자의 서열이다.
서열 번호 19는 신호 서열을 포함하지 않는 비돌연변이 spr 유전자의 서열이다.
서열 번호 20은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 21은 D210A 및 H212A 돌연변이를 포함하는 돌연변이 OmpT 서열의 아미노산 서열이다.
서열 번호 22는 돌연변이 넉아웃 OmpT 서열의 뉴클레오티드 서열이다.
서열 번호 23은 OmpA 올리고뉴클레오티드 어댑터의 서열을 나타낸다.
서열 번호 24는 이. 콜라이 Fab 발현을 위한 유전자간 서열 1(intergenic sequence 1; IGS1)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 25는 이. 콜라이 Fab 발현을 위한 유전자간 서열 2(IGS2)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 26은 이. 콜라이 Fab 발현을 위한 유전자간 서열 3(IGS3)을 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 27은 이. 콜라이 Fab 발현을 위한 유전자간 서열 4(IGS4)를 코딩하는 올리고뉴클레오티드 카세트를 나타낸다.
서열 번호 28은 야생형 FkpA 유전자의 DNA 서열이다.
서열 번호 29는 야생형 FkpA 유전자의 단백질 서열이다.
서열 번호 30은 FkpA his 태그 유전자의 DNA 서열이다.
서열 번호 31은 FkpA his 태그 유전자의 단백질 서열이다.
서열 번호 32는 야생형 skp 유전자의 DNA 서열이다.
서열 번호 33은 야생형 skp 유전자의 단백질 서열이다.
서열 번호 34는 skp his 태그 유전자의 DNA 서열이다.
서열 번호 35는 skp his 태그 유전자의 단백질 서열이다.
서열 번호 36 내지 74는 FcRn 항체 또는 이의 단편의 다양한 아미노산 및 DNA 서열을 나타내는데, 이는 본 발명의 세포주에서의 발현에 적합하다. 특히, 서열 번호 50은 항-FcRn 항체 경쇄 1519gH20의 경쇄 가변 영역의 아미노산 서열이며, 서열 번호 58은 항-FcRn 항체 중쇄 1519gH20의 중쇄 가변 영역의 아미노산 서열이다.
본 발명자는 관심의 재조합 단백질의 발현에 적합한 개선된 재조합 그람 음성 박테리아 세포를 제공하였다.
일 실시 양태에서, 단백질은 항체 또는 이의 결합 단편, 특히 치료용 항체이다.
특히, 본 발명자는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 그람 음성 박테리아 세포 내에, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 하나 이상의 유전자(들)를 포함시킴으로써 관심의 재조합 단백질의 발현에 적합한 개선된 재조합 그람 음성 박테리아 세포를 제공하였다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 예를 들어 안정한 세포주를 제공하도록 세포 게놈 내에 통합된다. 일 실시 양태에서, 발현용의 재조합 단백질(예컨대, 치료용 단백질)로 안정한 세포주를 형질감염시켜서 요망되는 재조합 단백질의 발현을 제공한다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)가 하나 이상의 플라스미드 상에 제공되며, 예를 들어, 플라스미드로 세포를 일시적으로 형질감염시켜서 본 발명의 세포주를 제공한다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 관심의 재조합 단백질의 코딩 서열을 또한 함유하는 플라스미드 상에 제공된다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)는 관심의 재조합 단백질의 코딩 서열을 함유하지 않는 플라스미드 상에 제공된다.
일 실시 양태에서, 본 발명은 야생형 박테리아 세포 및 단지 돌연변이된 Tsp 유전자 또는 돌연변이된 Tsp 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 개선된 세포 성장 표현형을 갖는 새로운 균주를 제공한다.
본 발명의 세포는 많은 이점을 보유한다. 놀랍게도, 본 발명자는 본 발명에 따른 세포가 야생형 세포 또는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포와 비교하여 증가된 세포 생존율을 나타낸다는 것을 알아냈다.
세포 생존율은 실제적인 면에 있어서 특히 중요하며, 그 이유는 생존가능하지 않은 세포는 배양 중 용해되어 DNA 잔사를 생성하는 경향이 있기 때문이다. 이러한 DNA 잔사는 요망되는 단백질의 정제의 어려움, 비용 및 경비를 증가시킨다. 따라서, 용해된 생존가능하지 않은 세포로부터의 DNA 잔사의 최소화는 재조합 단백질을 효율적으로 제조하는 데 있어서 상당한 쟁점인데, 예를 들어 미국 특허 제6,258,560호를 참조한다.
세포 생존율은 다수의 일상적인 기술 중 임의의 것에 의해, 예를 들어 형광 염료 및 FACS 분석 또는 이와 유사한 것을 이용하여 측정될 수 있다.
구체적으로, 일반적으로 본 발명에 따른 세포는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 감소된 세포 용해 표현형을 나타낸다.
더욱이, 본 발명의 새로운 균주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자와 비교하여 세포로부터의 단백질의 누출을 감소시키고 장시간의 주변 세포질 축적을 허용할 수 있다. 이것은, 예를 들어 당해 균주가 덜 누출성이기 때문에 표적 단백질의 전체 발현 수준은 유사하지만 더 많은 단백질이 주변 세포질 내에 축적되거나 더 적은 단백질이 상청액 중에 축적된다면 이러한 더욱 적은 누출 특성을 갖는 세포가 단백질 회수를 용이하게 하기 때문에 상기 세포가 일반적으로 플랜트(plant) 규모 생산에 더욱 적합하기 때문에, 특히 중요하다.
또한, 본 발명에 따른 세포는 FkpA와 같은 단백질을 코딩하는 유전자(들)의 부재 하에서 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포 및 야생형 세포와 비교하여 관심의 단백질의 수율의 증가를 나타낸다. 상기 향상된 단백질 수율은 주변 세포질 단백질 수율 및/또는 상청액 단백질 수율일 수 있다. 일 실시 양태에서, 본 발명의 세포는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 지닌 세포와 비교하여 향상된 주변 세포질 단백질 수율을 나타내며, 이는 당해 세포로부터의 누출의 감소로 인한 것이다.
재조합 박테리아 세포는 관심의 단백질의 더욱 빠른 생성 속도를 가능하게 할 수 있으며, 따라서, 동일한 양의 관심의 단백질이 야생형 박테리아 세포 또는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자를 포함하는 세포와 비교하여 더욱 짧은 시간 내에 생성될 수 있다. 관심의 단백질의 더욱 빠른 생성 속도는 세포의 초기 성장 기간에 걸쳐 , 예를 들어 단백질 발현의 유도 후 처음 5, 10, 20 또는 30시간에 걸쳐 특히 유의할 수 있다.
바람직하게는 본 발명에 따른 세포는 대략 1.0 g/L, 1.5 g/L, 1.8 g/L, 2.0 g/L, 2.4 g/L, 2.5 g/L, 3.0 g/L, 3.5 g/L 또는 4.0 g/L의 관심의 단백질의, 주변 세포질 및/또는 배지 중 최대 수율을 나타낸다.
부가적으로, 접힘을 용이하게 하는 단백질(들)의 발현은 적당한 접힘이 제공된 단백질을 최대화함으로써 발현을 추가로 최적화한다. 당업자라면, 적절한 접힘이 생물학적 기능에 필수적이며, 따라서, 요망되는 접힘을 갖는 단백질의 단리는 극도로 중요함을 잘 알고 있다. 이것은, 단백질이 그람 음성 세포에서 발현될 때 특히 중요하며, 그 이유는, 발현되는 단백질이 세포에 대하여 천연적인 것이 아니고 따라서 세포가 적절한 접힘을 갖는 단백질을 자동적으로 발현할 수 없기 때문이다. 부적절한 접힘은 그 자신을 응집체 또는 다른 불순물로서 나타낼 수 있다. 요망되는 단백질의 단리는 광범위한 정제를 필요로 할 수 있으며, 이는 비용 함축성을 갖고, 또한, 낮은 수율의 요망되는 단백질을 생성할 수 있다. 적당하게 접힌 발현 단백질의 양의 최대화는 필요한 정제의 양을 최소화하고, 이용가능한 수율을 최적화할 수 있으며, 따라서 유리하다.
접힘을 용이하게 하는 단백질의 발현과 결부된 이점은 하기 중 하나 이상을 포함한다: 더욱 높은 역가(예를 들어, 0.5 g/L의 야생형과 비교하여 약 1.05 g/L로 증가함); 수확시에 더욱 높은 생존율(예를 들어, 95% 초과); 공급량의 증가에 의한 역가의 증가(공정 개발에 있어서 더욱 우수한 전망); 20 L 규모와 같은 상업적 생산 규모에서 더욱 높은 역가 및 수확시에 더욱 높은 생존율; 및 특히 20 L 규모에서 추출물의 더욱 용이한 청징.
본 발명에 의해 제공되는 세포는 야생형 세포와 비교하여 Tsp의 감소된 프로테아제 활성을 가지며, 이는 관심의 단백질, 특히, Tsp에 대하여 단백질 분해적으로 민감한 관심의 단백질의 단백질 분해를 감소시킬 수 있다. 따라서, 본 발명에 의해 제공되는 세포는, 야생형 박테리아 세포와 비교하여 더욱 높은 수율의 온전한 단백질, 바람직하게는 관심의 단백질 및 더욱 낮은 수율의, 단백질, 바람직하게는 관심의 단백질의 단백질 분해 단편을 제공할 수 있거나, 바람직하게는 상기 단백질 분해 단편을 전혀 제공하지 않을 수 있다.
본 발명의 일 실시 양태에서, 세포는 본 발명에 따른 변형의 도입에 요구되는, 게놈에 대한 최소의 돌연변이만을 지닌다. 박테리아 세포는 단지, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 spr 유전자에 대한 하나 이상의 돌연변이에 의해 야생형 박테리아 세포와 상이한 것일 수 있으며, 그 이유는 예를 들어, 단백질 접힘을 용이하게 하기 위한 단백질을 코딩하는 유전자(들)이 플라스미드 상의 것과 같이, 세포 내에 일시적으로 도입될 수 있기 때문이다. 일 실시 양태에서, 세포는 세포의 성장 및/또는 관심의 단백질을 발현하는 능력에 해로운 영향을 줄 수 있는 임의의 다른 돌연변이는 지니지 않는다.
따라서, 본 발명의 재조합 숙주 세포 중 하나 이상은 게놈 서열에 대한 추가의 유전자 엔지니어링된(engineered) 돌연변이를 포함하는 세포와 비교하여 개선된 단백질 발현 및/또는 개선된 성장 특성을 나타낼 수 있다. 또한, 본 발명에 의해 제공되는 세포는 세포 게놈에 대한 추가의 파괴를 포함하는 세포와 비교하여 치료용 단백질을 제조하는 데 사용하기에 더욱 적합하다.
당업자라면, 발효법, ELISA 및 단백질 G HPLC를 비롯한 당업계에 공지된 방법을 이용하여 후보 세포 클론이 요망되는 수율의 관심의 단백질을 갖는지를 관찰하기 위하여 후보 세포 클론을 용이하게 테스트할 수 있다. 적합한 발효법은 문헌[Humphreys D P, et al. (1997). Formation of dimeric Fabs in E. coli: effect of hinge size and isotype, presence of interchain disulphide bond, Fab' expression levels, tail piece sequences and growth conditions. J. IMMUNOL . METH.209: 193-202]; 문헌[Backlund E. Reeks D. Markland K. Weir N. Bowering L. Larsson G. Fedbatch design for periplasmic product retention in Escherichia coli, Journal Article. Research Support, Non-U.S. Gov't Journal of Biotechnology. 135(4):358-65, 2008 Jul 31]; 문헌[Champion KM. Nishihara JC. Joly JC. Arnott D. Similarity of the Escherichia coli proteome upon completion of different biopharmaceutical fermentation processes. [Journal Article] Proteomics. 1(9):1133-48, 2001 Sep]; 및 문헌[Horn U. Strittmatter W. Krebber A. Knupfer U. Kujau M. Wenderoth R. Muller K. Matzku S. Pluckthun A. Riesenberg D. High volumetric yields of functional dimeric miniantibodies in Escherichia coli, using an optimized expression vector and high-cell-density fermentation under non-limited growth conditions, Journal Article. Research Support, Non-U.S. Gov't Applied Microbiology & Biotechnology. 46(5-6):524-32, 1996 Dec]에 기술되어 있다. 또한 당업자라면, 당업계에 공지된 방법, 예컨대 단백질 G HPLC, 원편광 이색성, NMR, X선 크리스탈로그래피 및 에피토프 친화성 측정법을 이용하여, 분비된 단백질이 올바르게 접혀 있는지를 관찰하기 위하여 분비된 단백질을 용이하게 테스트할 수 있다.
이제 본 발명을 더욱 상세하게 기술할 것이다.
"단백질" 및 "폴리펩티드"라는 용어는, 그 문맥이 달리 지시하지 않으면, 본원에서 상호교환가능하게 사용된다. "펩티드"는 10개 이하의 아미노산을 나타내는 것으로 의도된다.
"폴리뉴클레오티드"라는 용어는, 그 문맥이 달리 지시하지 않으면, 유전자, DNA, cDNA, RNA, mRNA 등을 포함한다.
본원에서 이용될 때, '감소된 활성'은 적합한 검정법에서 비견되는 조건 하에 측정될 때 야생형 균주에서의 상응하는 효소 활성과 비교하여 더욱 낮은 수준의 효소 활성, 예컨대 Tsp 효소 활성을 나타낸다. 일 실시 양태에서, 감소된 활성은 야생형 비교자의 효소 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하이다. 일 실시 양태에서, 효소 활성의 수준을 측정하는 분석법은 그 결과를 직접 비교에서 이용하려고 할 때 동시에 수행된다.
본원에서 이용될 때, 직접 비교라는 것은 본원에서 정의된 감소된 활성 또는 검정법으로부터 수득된 활성 결과들의 순위가 있는지를 평가하기 위하여 2개 이상의 결과의 수치 값을 비교하는 경우를 나타낸다.
본원에서 이용될 때, 본 명세서의 문맥에서의 "포함하는"이라는 용어는 "함유하는"이라는 것으로 해석되어야 한다.
본원에서 이용될 때, 야생형 세포는 비돌연변이 세포 또는 대조 세포와 상호교환가능하게 이용된다.
본 발명의 문맥에서 비돌연변이 세포 또는 대조 세포는 본 발명의 재조합 그람 음성 세포와 동일한 유형의 세포를 의미하며, 여기서, 상기 세포는 상기의 감소된 Tsp 단백질 활성을 지니도록, 그리고 돌연변이 spr 유전자를 지니도록 변형된 것이 아니었다. 예를 들어, 비돌연변이 세포는 야생형 세포일 수 있으며, 임의의 돌연변이를 도입하기 위한 변형 전의 본 발명의 세포와 동일한 숙주 세포 집단으로부터 유래될 수 있다.
"세포", "세포주", "세포 배양물" 및 "균주"라는 표현은 상호교환가능하게 사용된다.
본 발명의 문맥에서 "돌연변이된 Tsp 유전자를 포함하는 세포의 표현형"이라는 표현은 돌연변이 Tsp 유전자를 갖는 세포가 나타내는 표현형을 의미한다. 전형적으로, 돌연변이 Tsp 유전자를 포함하는 세포는, 특히 높은 세포 밀도에서 용해될 수 있다. 이들 세포의 용해는 임의의 재조합 단백질이 상청액 내로 누출되게 한다. 돌연변이된 Tsp 유전자를 지닌 세포는 또한 낮은 오스몰 농도에서 감열성 성장을 나타낼 수 있다. 예를 들어, 고온, 예컨대 40℃ 이상에서 세포는 저장성 배지에서 죽거나, 또는 세포는 감소된 성장 속도를 나타내거나 성장 속도를 전혀 나타내지 않는다.
본 발명의 문맥에서 "동질 유전자형"이라는 용어는 본 발명의 세포의 게놈이, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 이 세포가 유래된 야생형 세포와 비교하여 실질적으로 동일하거나 동일한 게놈 서열을 가짐을 의미한다. 이 실시 양태에서, 세포의 게놈은 추가의 천연 비발생 돌연변이 또는 유전자 엔지니어링된 돌연변이를 전혀 포함하지 않는다. 일 실시 양태에서, 본 발명에 따른 세포는 일어날 수 있는 임의의 천연 발생 돌연변이를 고려하여 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 세포와 비교하여 실질적으로 동일한 게놈 서열을 가질 수 있다. 일 실시 양태에서, 본 발명에 따른 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 세포와 비교하여 정확하게 동일한 게놈 서열을 가질 수 있다.
본 발명의 문맥에서, "야생형"이라는 용어는 자연에서 나타날 수 있는 또는 환경으로부터 단리될 수 있는 그람 음성 박테리아 세포의 균주를 의미하며, 이는 유전자 엔지니어링된 돌연변이를 전혀 지니지 않는다. 이. 콜라이의 야생형 균주의 예로는 W3110, 예컨대 W3110 K-12 균주가 있다.
임의의 적합한 그람 음성 박테리아가 본 발명의 재조합 세포의 생성을 위한 모(parental) 세포로서 사용될 수 있다. 적합한 그람 음성 박테리아는 살모넬라 타이피뮤륨(Salmonella typhimurium), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 에르위니아 카로토보라(Erwinia carotovora), 쉬겔라(Shigella), 클렙시엘라 뉴모니애(Klebsiella pneumoniae), 레지오넬라 뉴모필라(Legionella pneumophila), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 아시네토박터 바우만니이(Acinetobacter baumannii) 및 이. 콜라이를 포함한다. 바람직하게는, 모 세포는 이. 콜라이이다. 이. 콜라이의 임의의 적합한 균주가 본 발명에서 사용될 수 있지만, 바람직하게는 야생형 W3110 균주, 예컨대 K-12 W3110이 사용된다.
재조합 단백질의 발현을 위하여 이전에 생성되어 사용된 프로테아제 결실 박테리아 균주와 결부된 단점은 상기 박테리아 균주가, 예를 들어 이. 콜라이 균주에서 phoA, fhuA , lac , rec , gal , ara , arg , thi 및 pro와 같은, 세포 대사 및 DNA 복제에 연루된 유전자의 추가의 돌연변이를 포함한다는 것이다. 이들 돌연변이는 세포 성장, 안정성, 재조합 단백질 발현 수율 및 독성에 대한 영향을 비롯하여 숙주 세포에 많은 해로운 영향을 줄 수 있다. 이들 게놈 돌연변이 중 하나 이상을 갖는 균주, 특히 많은 수의 이들 돌연변이를 갖는 균주는 박테리아 성장 속도를 공업적 단백질 생산에 적합하지 않은 수준으로 감소시키는 적합성의 손실을 나타낼 수 있다. 또한, 임의의 상기 게놈 돌연변이는 시스로(in cis) 및/또는 트랜스로(in trans), 예측할 수 없는 유해한 방식으로 다른 유전자에 영향을 줌으로써 균주의 표현형, 적합성 및 단백질 프로필을 변경시킬 수 있다. 또한, 심하게 돌연변이된 세포의 사용은 상업적 용도, 특히 치료제를 위한 재조합 단백질의 생성에는 일반적으로 적합하지 않으며, 그 이유는 이러한 균주가 일반적으로 결함성 대사 경로를 갖고 따라서 최소 배지 또는 화학적 규정 배지에서 불량하게 성장하거나 전혀 성장하지 않을 수 있기 때문이다.
일 실시 양태에서, 본 발명에 따른 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는 야생형 박테리아 세포와 동질 유전자형이다. 단지 최소 돌연변이를 세포의 게놈에 대하여 행하여서 돌연변이를 도입한다. 세포는 세포의 성장 및/또는 관심의 단백질을 발현하는 능력에 해로운 영향을 줄 수 있는 임의의 다른 돌연변이를 지니지 않는다. 따라서, 본 발명의 재조합 숙주 세포 중 하나 이상은 게놈 서열에 대한 추가의 유전자 엔지니어링된 돌연변이를 포함하는 세포와 비교하여 개선된 단백질 발현 및/또는 개선된 성장 특성을 나타낼 수 있다. 또한, 본 발명에 의해 제공되는 세포는 세포 게놈에 대한 추가의 파괴를 포함하는 세포와 비교하여 치료용 단백질의 제조에서 사용하기에 더욱 적합하다.
바람직한 실시 양태에서, 세포는 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 야생형 이. 콜라이 세포, 에컨대 균주 W3110에 대하여 동질 유전자형이다.
본 발명의 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드를 포함함으로써 야생형 세포와 더 상이할 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 외인성 또는 내인성일 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드는 세포를 형질전환시키고/시키거나 숙주 세포의 게놈 내에 통합되는 적합한 발현 벡터 내에 포함될 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드가 숙주의 게놈 내에 삽입되는 실시 양태에서, 본 발명의 세포는 관심의 단백질을 코딩하는 상기 삽입 폴리뉴클레오티드 서열로 인하여 야생형 세포와 또한 상이해진다. 바람직하게는, 폴리뉴클레오티드는 세포 내의 발현 벡터 내에 있음으로써 숙주 세포의 게놈에 대하여 최소의 파괴를 야기한다.
spr 단백질은 이. 콜라이 막 결합 주변 세포질 프로테아제이다.
spr 단백질의 야생형 아미노산 서열은 N-말단의 신호 서열을 포함하는 서열 번호 21의 서열로, 그리고 26개 아미노산의 신호 서열을 포함하지 않는 서열 번호 22의 서열(UniProt 등록 번호 P0AFV4에 따름)로 예시되어 있다. 본 발명에서 spr 단백질 서열의 아미노산 넘버링은 신호 서열을 포함한다. 따라서, spr 단백질의 아미노산 1은 서열 번호 21에 예시된 제1 아미노산(Met)이다.
돌연변이된 spr 유전자는 바람직하게는 세포 염색체 spr 유전자이다.
돌연변이된 spr 유전자는 돌연변이된 Tsp 유전자를 추가로 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 코딩한다. 돌연변이된 Tsp 유전자를 지닌 세포는 우수한 세포 성장 속도를 가질 수 있지만, 이러한 세포의 1가지 한계는 특히 높은 세포 밀도에서 용해되는 그의 경향이다. 따라서, 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형은 특히 높은 세포 밀도에서의 용해 경향이다. 돌연변이된 Tsp 유전자를 지닌 세포는 또한 낮은 오스몰 농도에서 감열성 성장을 나타낸다. 그러나, 본 발명의 세포가 지닌 spr 돌연변이는, 감소된 Tsp 활성을 갖는 세포 내로 도입될 때, 감소된 Tsp 표현형을 억제하며, 따라서, 세포는 특히 높은 세포 밀도에서 감소된 용해를 나타낸다. 세포의 성장 표현형은 진탕 플라스크 또는 고 세포 밀도 발효 기술 동안 당업계의 숙련자에 의해 용이하게 측정될 수 있다. 세포 용해 표현형의 억제는, 야생형 spr 및 Tsp 돌연변이체를 지닌 세포와 비교하여 감소된 Tsp 활성을 갖고 spr 돌연변이체를 지닌 세포가 나타내는, 개선된 성장 속도 및/또는 재조합 단백질 생성, 특히 주변 세포질에서의 것으로부터 관찰될 수 있다.
본 발명에 따른 세포는 N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108,Y115, D133, V135, L136,G140, R144, H145, G147 및 H157로부터 선택되는 하나 이상의 아미노산의 돌연변이, 바람직하게는 C94, S95, V98, Y115, D133, V135, H145, G147 및 H157로부터 선택되는 하나 이상의 아미노산에서의 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자를 포함한다. 이 실시 양태에서, spr 단백질은 바람직하게는 임의의 추가의 돌연변이를 갖지 않는다.
상기 아미노산들 중 하나 이상의 돌연변이는 그 아미노산을 코딩하는 뉴클레오티드들 중 1개, 2개 또는 3개의 뉴클레오티드에 대한 임의의 적합한 미스센스(missense) 돌연변이일 수 있다. 상기 돌연변이는 아미노산 잔기를, 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 돌연변이된 spr 단백질을 생성하는 임의의 적합한 아미노산으로 변화시킨다. 미스센스 돌연변이는 아미노산을, 야생형 아미노산과 비교하여 상이한 크기이고/이거나 상이한 화학적 특성을 갖는 것으로 변화시킬 수 있다.
일 실시 양태에서, 돌연변이 spr 유전자는 C94A, S95F, V98E, Y115F, D133A, V135D 또는 G, H145A, G147C 및 H157A로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이는 C94, H145, 및 H157의 아미노산 잔기의 촉매적 세 작용기(catalytic triad) 중 1개, 2개 또는 3개에 대한 것이다(문헌[Solution NMR Structure of the NlpC/P60 Domain of Lipoprotein Spr from Escherichia coli Structural Evidence for a Novel Cysteine Peptidase Catalytic Triad, Biochemistry, 2008, 47, 9715-9717]).
따라서, 돌연변이된 spr 유전자는 하기를 포함할 수 있다: C94에 대한 돌연변이; 또는 H145에 대한 돌연변이; 또는 H157에 대한 돌연변이; 또는 C94 및 H145에 대한 돌연변이; 또는 C94 및 H157에 대한 돌연변이; 또는 H145 및 H157에 대한 돌연변이; 또는 C94, H145 및 H157에 대한 돌연변이.
이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.
C94, H145 및 H157 중 1개, 2개 또는 3개는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, C94, H145, 및 H157 중 1개, 2개 또는 3개는 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다. 따라서, spr 단백질은 돌연변이 C94A, H145A 및 H157A 중 1개, 2개 또는 3개를 가질 수 있다. 일 실시 양태에서, spr 유전자는 미스센스 돌연변이 C94A를 포함하며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 것으로 밝혀졌다. 또 다른 실시 양태에서, spr 유전자는 미스센스 돌연변이 H145A를 포함하며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 것으로 밝혀졌다.
본원에서 치환 돌연변이체의 표기는 문자, 이어서 숫자, 이어서 분자로 이루어진다. 제1 문자는 야생형 단백질에서의 아미노산을 표기한다. 숫자는 아미노산 치환이 이루어진 아미노산 위치를 나타내며, 제2 문자는 야생형 아미노산의 치환에 사용된 아미노산을 표기한다. 일 실시 양태에서, 돌연변이 spr 단백질은 N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산의 돌연변이, 바람직하게는 S95, V98, Y115, D133, V135 및 G147로부터 선택되는 하나 이상의 아미노산의 돌연변이를 포함한다. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다. 따라서, 돌연변이된 spr 유전자는 하기를 포함할 수 있다: N31에 대한 돌연변이; 또는 R62에 대한 돌연변이; 또는 I70에 대한 돌연변이; 또는 Q73에 대한 돌연변이; 또는 S95에 대한 돌연변이; 또는 V98에 대한 돌연변이; 또는 Q99에 대한 돌연변이; 또는 R100에 대한 돌연변이; 또는 L108에 대한 돌연변이; 또는 Y115에 대한 돌연변이; 또는 D133에 대한 돌연변이; 또는 V135에 대한 돌연변이; 또는 L136에 대한 돌연변이; 또는 G140에 대한 돌연변이; 또는 R144에 대한 돌연변이; 또는 G147에 대한 돌연변이. 일 실시 양태에서, 돌연변이 spr 단백질은 하기 아미노산에 대한 다중 돌연변이를 포함한다: S95 및 Y115; 또는 N31, Q73, R100 및 G140; 또는 Q73, R100 및 G140; 또는 R100 및 G140; 또는 Q73 및 G140; 또는 Q73 및 R100; 또는 R62, Q99 및 R144; 또는 Q99 및 R144.
아미노산 N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140, R144 및 G147 중 하나 이상은 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, N31, R62, I70, Q73, S95, V98, Q99, R100, L108, Y115, D133, V135, L136, G140 및 R144 중 하나 이상은 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다.
일 실시 양태에서, spr 단백질은 하기 돌연변이 중 하나 이상을 포함한다: N31Y, R62C, I70T, Q73R, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D 또는 V135G, L136P, G140C, R144C 및 G147C. 일 실시 양태에서, spr 단백질은 하기 돌연변이 중 하나 이상을 포함한다: S95F, V98E, Y115F, D133A, V135D 또는 V135G 및 G147C. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.
일 실시 양태에서, spr 단백질은 N31Y, R62C, I70T, Q73R, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D 또는 V135G, L136P, G140C, R144C 및 G147C로부터 선택되는 1개의 돌연변이를 갖는다. 이 실시 양태에서, spr 단백질은 바람직하게는 추가의 돌연변이를 전혀 갖지 않는다.
추가의 실시 양태에서, spr 단백질은 하기로부터 선택되는 다중 돌연변이를 갖는다: S95F 및 Y115F; N31Y, Q73R, R100G 및 G140C; Q73R, R100G 및 G140C; R100G 및 G140C; Q73R 및 G140C; Q73R 및 R100G; R62C, Q99P 및 R144C; 또는 Q99P 및 R144C.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 C94A를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V103E를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 D133A를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V135D를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 V135A를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 H145A를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 G147C를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이된 spr 유전자는 돌연변이 H157A를 갖는 spr 단백질을 코딩한다.
일 실시 양태에서, 돌연변이 spr 유전자는 H145A, H157A 및 D133A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩한다.
본 발명의 일 실시 양태에서, 임의의 적합한 돌연변이(들)가 spr 유전자에 대하여 이루어질 수 있으며, 이는 돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 생성한다. 바람직하게는, spr 단백질은 하기 돌연변이 중 하나 이상을 가질 수 있다: N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C, H157A 및 W174R. 일 실시 양태에서, spr 단백질은 돌연변이 W174R을 포함하지 않는다. 바람직하게는, spr 유전자는 상기에 논의된 하나 이상의 돌연변이를 포함한다.
본 발명에 따른 세포는 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖는다. "야생형 세포와 비교하여 감소된 Tsp 단백질 활성"이라는 표현은, 상기 세포의 Tsp 활성이 야생형 세포의 Tsp 활성과 비교하여 감소됨을 의미한다. 본 세포는 Tsp 활성을 감소시키기 위하여 임의의 적합한 수단에 의해 변형될 수 있다.
일 실시 양태에서, 감소된 Tsp 활성은 Tsp를 코딩하는 내인성 폴리뉴클레오티드 및/또는 결부된 조절 발현 서열의 변형에 의한 것이다. 상기 변형은 Tsp 유전자의 전사 및 번역을 감소시키거나 중지시킬 수 있거나, 또는 야생형 Tsp 단백질과 비교하여 감소된 프로테아제 활성을 갖는 발현 Tsp 단백질을 제공할 수 있다.
일 실시 양태에서, 결부된 조절 발현 서열은 Tsp 발현을 감소시키도록 변형된다. 예를 들어, Tsp 유전자의 프로모터는 상기 유전자의 발현을 방지하도록 돌연변이될 수 있다.
바람직한 실시 양태에서, 본 발명에 따른 세포는 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이 Tsp 유전자를 지닌다.
바람직하게는 염색체 Tsp 유전자가 돌연변이된다.
본원에서 사용될 때, "Tsp 유전자"는 페니실린 결합 단백질-3(Penicillin-binding protein-3; PBP3) 및 파지 테일 단백질 상에 작용할 수 있는 주변 세포질 프로테아제인 프로테아제 Tsp(Prc로도 공지됨)를 코딩하는 유전자를 의미한다. 야생형 Tsp 유전자의 서열은 서열 번호 1에 예시되어 있으며, 야생형 Tsp 단백질의 서열은 서열 번호 2에 예시되어 있다.
돌연변이된 Tsp 유전자 또는 Tsp를 코딩하는 돌연변이된 Tsp 유전자라는 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이 Tsp 유전자 중 어느 하나를 나타낸다.
본 발명의 문맥에서, "감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자"라는 표현은 돌연변이된 Tsp 유전자가 야생형 비돌연변이 Tsp 유전자와 비교하여 완전한 프로테아제 활성을 갖지 않음을 의미한다.
바람직하게는, 돌연변이된 Tsp 유전자는 야생형 비돌연변이 Tsp 단백질의 프로테아제 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하를 갖는 Tsp 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 Tsp 유전자는 프로테아제 활성을 갖지 않는 Tsp 단백질을 코딩한다. 이 실시 양태에서, 세포는 염색체 Tsp에 있어서 결함을 갖지 않으며, 즉, Tsp 유전자 서열은 임의의 형태의 Tsp 단백질의 발현을 방지하도록 결실되지 않았거나 돌연변이되지 않았다.
감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 Tsp 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현된 Tsp 단백질의 프로테아제 활성은 당업계의 임의의 적합한 방법, 예컨대 Tsp의 프로테아제 활성이 테스트된 키일러(Keiler) 등의 문헌[Identification of Active Site Residues of the Tsp Protease* THE JOURNAL OF BIOLOGICAL CHEMISTRY Vol. 270, No. 48, Issue of December 1, pp. 28864-28868, 1995 Kenneth C. Keiler and Robert T. Sauer]에 기술된 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.
Tsp는 잔기 S430, D441 및 K455를 포함하는 활성 부위를 갖는 것으로 키일러 등의 상기 문헌에 보고되었으며, 잔기 G375, G376, E433 및 T452는 Tsp의 구조를 유지하는 데 중요하다. 키일러 등의 상기 문헌은 돌연변이된 Tsp 유전자, S430A, D441A, K455A, K455H, K455R, G375A, G376A, E433A 및 T452A가 검출가능한 프로테아제 활성을 전혀 갖지 않았다는 발견을 보고하고 있다. 돌연변이된 Tsp 유전자 S430C가 야생형 활성의 약 5 내지 10%를 나타냈음이 추가로 보고되어 있다. 따라서, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 Tsp 돌연변이는 잔기 S430, D441, K455, G375, G376, E433 및 T452 중 하나 이상에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다. 바람직하게는, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 Tsp 돌연변이는 활성 부위 잔기 S430, D441 및 K455 중 1개, 2개 또는 모든 3개의 잔기에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.
따라서, 돌연변이된 Tsp 유전자는 하기를 포함할 수 있다: S430에 대한 돌연변이; 또는 D441에 대한 돌연변이; 또는 K455에 대한 돌연변이; 또는 S430 및 D441에 대한 돌연변이; 또는 S430 및 K455에 대한 돌연변이; 또는 D441 및 K455에 대한 돌연변이; 또는 S430, D441 및 K455에 대한 돌연변이.
S430, D441, K455, G375, G376, E433 및 T452 중 하나 이상은, 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 적합한 돌연변이의 예로는 S430A, S430C, D441A, K455A, K455H, K455R, G375A, G376A, E433A 및 T452A가 있다. 돌연변이된 Tsp 유전자는 활성 부위 잔기에 대한 1개, 2개 또는 3개의 돌연변이를 포함할 수 있으며, 예를 들어, 유전자는 하기를 포함할 수 있다: S430A 또는 S430C; 및/또는 D441A; 및/또는 K455A 또는 K455H 또는 K455R.
바람직하게는, Tsp 유전자는 점 돌연변이 S430A 또는 S430C를 갖는다.
본 발명의 문맥에서 "넉아웃 돌연변이 Tsp 유전자"라는 표현은 상기 유전자가, Tsp 단백질에 결함이 있는 세포를 제공하도록 야생형 유전자에 의해 코딩되는 Tsp 단백질의 발현을 방지하는 하나 이상의 돌연변이를 포함함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사되지만 코딩된 단백질로 번역될 수는 없다. 넉아웃 돌연변이 Tsp 유전자는 단백질의 무발현을 야기하기 위하여, 임의의 적합한 방식으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스(nonsense) 돌연변이 및 프레임쉬프트(frameshift) 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.
바람직한 실시 양태에서, Tsp 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 돌연변이되는 것은 아니다. 이 실시 양태에서, Tsp 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함함으로써 Tsp 단백질의 발현을 방지할 수 있다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드들 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. Tsp 유전자는 코딩 서열의 5' 말단에 2개의 ATG 코돈을 포함하며, 하나 또는 둘 모두의 상기 ATG 코돈은 미스센스 돌연변이에 의해 돌연변이될 수 있다. Tsp 유전자는 제2 ATG 코돈(코돈 3)에서 TCG로 돌연변이될 수 있다. Tsp 유전자는 대안적으로 또는 추가로, 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함할 수 있다. 바람직하게는, 넉아웃 돌연변이 Tsp 유전자는 개시 코돈에 대한 미스센스 돌연변이 및 하나 이상의 삽입된 종결 코돈 둘 모두를 포함한다. 바람직한 실시 양태에서, Tsp 유전자는 제5 코돈으로부터 "T"가 결실되도록 돌연변이되며, 이에 의해 프레임쉬프트가 야기되는데 이는 코돈 11 및 16에서 종결 코돈을 생성한다. 바람직한 실시 양태에서, Tsp 유전자는 코돈 21에 제3 프레임내(in-frame) 종결 코돈이 생성되도록 Ase I 제한 부위가 삽입되게 돌연변이된다.
바람직한 실시 양태에서, 넉아웃 돌연변이 Tsp 유전자는 서열 번호 3의 DNA 서열을 가지며, 이는 개시 코돈의 상류에 6개 뉴클레오티드 ATGAAT를 포함한다. 일 실시 양태에서, 돌연변이된 Tsp 유전자는 서열 번호 3의 뉴클레오티드 7 내지 2048의 DNA 서열을 갖는다.
본 발명에서, 세포는 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 하나 이상의 유전자를 또한 지닌다. 예는 FkpA, Skp, SurA, PPiA 및 PPiD와 같은 단백질을 포함한다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질은 FkpA, Skp 또는 이들의 조합이다.
일 실시 양태에서, 단백질 접힘을 용이하게 하기 위한 단백질은 FkpA 또는 FkpA와 Skp의 조합으로부터 선택된다.
FkpA는 Swiss-Prot 번호가 P45523인 펩티들-프롤릴 시스-트랜스 이소머라아제이다.
Skp는 Swiss-Prot 번호가 P0AEU7인 샤페론 단백질이다.
단백질 접힘을 용이하게 하기 위한 단백질은 적절할 경우 세포 게놈 내의 유전자 또는 그 안에 일시적으로 형질감염된 것, 예를 들어 플라스미드 상의 유전자 또는 이들의 조합에 의해 코딩될 수 있다.
일 실시 양태에서, 재조합 그람 음성 박테리아 세포는 DsbC를 코딩하는 재조합 폴리뉴클레오티드를 포함하지 않는다.
본 발명의 일 실시 양태에서, 재조합 그람 음성 박테리아 세포는 샤페론 활성 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자 및/또는 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하거나 넉아웃 돌연변이 ptr 유전자인 돌연변이된 ptr 유전자 및/또는 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하거나 넉아웃 돌연변이 OmpT 유전자인 돌연변이된 OmpT 유전자를 추가로 포함한다.
바람직하게는, 이 실시 양태에서, 세포의 게놈은 상기 돌연변이를 제외하고는 야생형 박테리아 세포에 대하여 동질 유전자형이다.
본원에서 사용될 때, "DegP"는 샤페론 및 프로테아제로서의 이중 기능을 갖는 DegP 단백질(HtrA로도 공지됨)을 코딩하는 유전자를 의미한다(문헌[Families of serine peptidases; Rawlings ND, Barrett AJ. Methods Enzymol. 1994;244:19-61]). 비돌연변이 DegP 유전자의 서열은 서열 번호 7에 예시되어 있으며, 비돌연변이 DegP 단백질의 서열은 서열 번호 8에 예시되어 있다.
낮은 온도에서 DegP는 샤페론으로서의 기능을 하며, 높은 온도에서 DegP는 프로테아제로서의 기능에 대한 선호도를 갖는다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3 , Pages 339 - 347. Spiess C, Beil A, Ehrmann M] 및 문헌[The proteolytic activity of the HtrA (DegP) protein from Escherichia coli at low temperatures, Skorko-Glonek J et al Microbiology 2008, 154, 3649-3658]).
세포가 DegP 돌연변이를 포함하는 실시 양태에서, 세포에서의 DegP 돌연변이는 샤페론 활성을 갖지만 완전한 프로테아제 활성을 갖는 것은 아닌 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자를 제공한다.
본 발명의 문맥에서 "샤페론 활성을 갖는"이라는 표현은, 돌연변이된 DegP 단백질이 야생형 비돌연변이 DegP 단백질과 비교하여 동일하거나 실질적으로 동일한 샤페론 활성을 가짐을 의미한다. 바람직하게는, 돌연변이된 DegP 유전자는 야생형 비돌연변이 DegP 단백질의 샤페론 활성의 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 또는 95% 이상을 갖는 DegP 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 DegP 유전자는 야생형 DegP와 비교하여 동일한 샤페론 활성을 갖는 DegP 단백질을 코딩한다.
본 발명의 문맥에서, "감소된 프로테아제 활성을 갖는"이라는 표현은, 돌연변이된 DegP 단백질이 야생형 비돌연변이 DegP 단백질과 비교하여 완전한 프로테아제 활성을 갖는 것은 아님을 의미한다. 바람직하게는, 돌연변이된 DegP 유전자는 야생형 비돌연변이 DegP 단백질의 프로테아제 활성의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하를 갖는 DegP 단백질을 코딩한다. 더 바람직하게는, 돌연변이된 DegP 유전자는 프로테아제 활성을 전혀 갖지 않는 DegP 단백질을 코딩한다. 세포는 염색체 DegP에 결함이 있는 것이 아니며, 즉, DegP 유전자 서열은 임의의 형태의 DegP 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.
샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 DegP 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현되는 DegP 단백질의 프로테아제 및 샤페론 활성은, DegP의 프로테아제 및 샤페론 활성이 DegP의 천연 기질인 MalS에서 테스트된, 스피에스(Spiess) 등의 문헌에 기술된 방법(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]), 및 또한 문헌[The proteolytic activity of the HtrA (DegP) protein from Escherichia coli at low temperatures, Skorko-Glonek J et al Microbiology 2008, 154, 3649-3658]에 기술된 방법과 같은 임의의 적합한 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.
DegP는 세린 프로테아제이며, His105, Asp135 및 Ser210의 아미노산 잔기의 촉매적 세 작용기로 이루어진 활성 중심을 갖는다(문헌[Families of serine peptidases, Methods Enzymol., 1994, 244:19-61 Rawlings N and Barrett A]). 샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 DegP 돌연변이는 His105, Asp135 및 Ser210 중 1개, 2개 또는 3개에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.
따라서, 돌연변이된 DegP 유전자는 하기를 포함할 수 있다: His105에 대한 돌연변이; 또는 Asp135에 대한 돌연변이; 또는 Ser210에 대한 돌연변이; 또는 His105 및 Asp135에 대한 돌연변이; 또는 His105 및 Ser210에 대한 돌연변이; 또는 Asp135 및 Ser210에 대한 돌연변이; 또는 His105, Asp135 및 Ser210에 대한 돌연변이.
His105, Asp135 및 Ser210 중 1개, 2개 또는 3개는 샤페론 활성 및 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, His105, Asp135 및 Ser210 중 1개, 2개 또는 3개는 Gly 또는 Ala과 같은 작은 아미노산으로 돌연변이될 수 있다. 추가의 적합한 돌연변이는 His105, Asp135 및 Ser210을 반대 특성을 갖는 아미노산으로 변화시키는 것이며, 예컨대 Asp135는 Lys 또는 Arg으로 돌연변이되고, 극성 His105는 비극성 아미노산, 예컨대 Gly, Ala, Val 또는 Leu으로 돌연변이되고, 작은 친수성 Ser210은 큰 또는 소수성 잔기, 예컨대 Val, Leu, Phe 또는 Tyr으로 돌연변이된다. 바람직하게는, DegP 유전자는 도 11c에 나타낸 바와 같이, 점 돌연변이 S210A를 포함하며, 이는 샤페론 활성을 갖지만 프로테아제 활성을 갖는 것은 아닌 단백질을 생성하는 것으로 밝혀졌다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 347. Spiess C, Beil A, Ehrmann M]).
DegP는 2개의 PDZ 도메인, PDZ1(잔기 260-358) 및 PDZ2(잔기 359-448)를 가지며, 이는 단백질-단백질 상호작용을 매개한다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]). 본 발명의 일 실시 양태에서, DegP 유전자는 PDZ1 도메인 및/또는 PDZ2 도메인이 결실되도록 돌연변이된다. PDZ1 및 PDZ2의 결실은 야생형 DegP 단백질과 비교하여 저하된 샤페론 활성 및 DegP 단백질의 프로테아제 활성의 완전한 손실로 이어지는 반면, PDZ1 또는 PDZ2 중 어느 하나의 결실은 야생형 DegP 단백질과 비교하여 유사한 샤페론 활성 및 5%의 프로테아제 활성으로 이어진다(문헌[A Temperature-Dependent Switch from Chaperone to Protease in a Widely Conserved Heat Shock Protein. Cell, Volume 97, Issue 3, Pages 339 - 347. Spiess C, Beil A, Ehrmann M]).
또한, 돌연변이된 DegP 유전자는, 예를 들어 도 7c에 예시된 바와 같이, 동정 및 스크리닝 방법을 돕기 위하여 Ase I과 같은 사일런트(silent) 천연 비발생 제한 부위를 포함할 수 있다.
점 돌연변이 S210A 및 Ase I 제한 표지 부위를 포함하는 돌연변이된 DegP 유전자의 바람직한 서열은 서열 번호 9에 제공되어 있으며, 코딩된 단백질 서열은 서열 번호 10에 예시되어 있다.
세포가 샤페론 활성 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자를 포함하는 본 발명의 실시 양태에서, 본 발명에 의해 제공되는 세포 중 하나 이상은 상기 세포로부터의 올바르게 접힌 단백질의 수율이, DegP 유전자가 DegP 발현을 방지하는 넉아웃 DegP, 예컨대 염색체 결함 DegP로 돌연변이된 돌연변이 세포에 비하여, 개선된 것을 제공할 수 있다. DegP 발현을 방지하는 넉아웃 돌연변이 DegP 유전자를 포함하는 세포에서, DegP의 샤페론 활성은 완전히 손실되며, 반면에, 본 발명에 따른 세포에서, DegP의 샤페론 활성은 유지되는 반면 완전한 프로테아제 활성은 손실된다. 이들 실시 양태에서, 본 발명에 따른 하나 이상의 세포는, 숙주 세포에서 상기 단백질의 올바른 접힘 및 수송을 허용하도록 샤페론 활성을 유지하면서 상기 단백질의 단백질 분해를 방지하도록 더욱 낮은 프로테아제 활성을 갖는다.
이들 실시 양태에서, 본 발명에 따른 하나 이상의 세포는 DegP 발현을 방지하는 돌연변이 넉아웃 DegP 유전자를 지닌 세포와 비교하여 세포 성장이 개선될 수 있다. 이론에 구애되고자 함이 없이, 개선된 세포 성장은 샤페론 활성을 필요로 하는 모든 단백질을 상기 세포가 프로세싱하는 능력을 증가시킬 수 있는 샤페론 활성이 유지된 DegP 프로테아제로 인하여 나타날 수 있다. 따라서, 세포의 성장 및 번식에 필요한 올바르게 접힌 단백질의 생성은 DegP 넉아웃 돌연변이를 지닌 세포와 비교하여 본 발명의 세포 중 하나 이상에서 증가됨으로써 성장을 조절하는 세포 경로가 개선될 수 있다. 또한, 공지된 DegP 프로테아제 결실 균주는 일반적으로 온도 민감성이며, 전형적으로 약 28℃보다 높은 온도에서는 성장하지 않는다. 그러나, 본 발명에 따른 세포는 온도 민감성이 아니며, 박테리아로부터의 공업적 규모의 단백질 생성에 전형적으로 사용되는 대략 30℃ 내지 대략 37℃의 온도를 비롯하여 28℃ 이상의 온도에서 성장시킬 수 있다.
본 발명의 일 실시 양태에서, 세포는 돌연변이된 ptr 유전자를 지닌다. 본원에서 사용될 때, "ptr 유전자"는 고분자량 단백질을 분해시키는 프로테아제인 프로테아제 III을 코딩하는 유전자를 의미한다. 비돌연변이 ptr 유전자의 서열은 서열 번호 4에 예시되어 있으며, 비돌연변이 프로테아제 III 단백질의 서열은 서열 번호 5에 예시되어 있다.
돌연변이된 ptr 유전자, 도는 프로테아제 III을 코딩하는 돌연변이된 ptr 유전자의 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하는 돌연변이된 ptr 유전자 또는 넉아웃 돌연변이 ptr 유전자를 나타낸다.
본 발명의 문맥에서 "감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하는 돌연변이된 ptr 유전자"라는 표현은 돌연변이된 ptr 유전자가 야생형 비돌연변이 ptr 유전자와 비교하여 완전한 프로테아제 활성을 갖지 않음을 의미한다.
바람직하게는, 돌연변이된 ptr 유전자는 야생형 비돌연변이 프로테아제 III 단백질의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하의 프로테아제 활성을 갖는 프로테아제 III을 코딩한다. 더 바람직하게는, 돌연변이된 ptr 유전자는 프로테아제 활성을 전혀 갖지 않는 프로테아제 III 단백질을 코딩한다. 이 실시 양태에서, 세포는 염색체 ptr에 결함이 있으며, 즉, ptr 유전자 서열은 임의의 형태의 프로테아제 III 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.
감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 ptr 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현된 프로테아제 III 단백질의 프로테아제 활성은 당업계의 임의의 적합한 방법에 의해 당업계의 숙련자에 의해 용이하게 테스트될 수 있다.
본 발명의 문맥에서 "넉아웃 돌연변이 ptr 유전자"라는 표현은 넉아웃 돌연변이 유전자에 의해 코딩되는 단백질에 결함이 있는 세포를 제공하도록 상기 유전자가 하나 이상의 돌연변이를 포함함으로써 상기 유전자에 의해 코딩되는 단백질의 무발현을 야기함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사될 수 있지만, 코딩된 단백질로 번역되는 것은 아닐 수 있다. 상기 넉아웃 돌연변이 ptr 유전자는 단백질의 무발현을 야기하기 위하여, 임의의 적합한 방식으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.
바람직한 실시 양태에서, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 돌연변이되는 것은 아니다. 바람직하게는 프로테아제 III 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함함으로써 프로테아제 III 단백질의 발현을 방지한다.
표적 넉아웃 유전자 개시 코돈에 대한 돌연변이는 개시 코돈의 기능의 손실을 야기하며, 이에 의해, 표적 유전자는 코딩 서열의 개시부에서 적합한 개시 코돈을 포함하지 않음을 보장한다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다.
바람직한 실시 양태에서, ptr 유전자는 ATG 개시 코돈이 ATT로 변화되도록 돌연변이된다.
넉아웃 돌연변이 ptr 유전자는 대안적으로 또는 추가로, 유전자 개시 코돈의 하류에 그리고 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈을 포함할 수 있다. 바람직하게는, 넉아웃 돌연변이 ptr 유전자는 개시 코돈에 대한 미스센스 돌연변이 및 하나 이상의 삽입된 종결 코돈 둘 모두를 포함한다.
상기 하나 이상의 삽입된 종결 코돈은 바람직하게는 프레임내 종결 코돈이다. 그러나, 상기 하나 이상의 삽입된 종결 코돈은 대안적으로 또는 추가로, 프레임외(out-of-frame) 종결 코돈일 수 있다. 하나 이상의 프레임외 종결 코돈은 프레임외 개시 코돈이 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 프레임내 개시 코돈으로 변화되는 경우 번역을 종결시키는 데 요구될 수 있다. 상기 하나 이상의 종결 코돈은 넌센스 점 돌연변이 및 프레임쉬프트 돌연변이를 비롯한 임의의 적합한 돌연변이에 의해 도입될 수 있다. 바람직하게는 상기 하나 이상의 종결 코돈은 프레임쉬프트 돌연변이 및/또는 삽입 돌연변이에 의해, 바람직하게는 유전자 서열의 절편을 종결 코돈을 포함하는 서열로 대체함으로써 도입된다. 예를 들어, Ase I 제한 부위가 삽입될 수 있으며, 이는 종결 코돈 TAA를 포함한다.
바람직한 실시 양태에서, ptr 유전자는 도 7a에 예시된 바와 같이, Ase I 제한 부위의 삽입에 의해 프레임내 종결 코돈이 삽입되도록 돌연변이된다. 바람직한 실시 양태에서, 넉아웃 돌연변이 ptr 유전자는 서열 번호 6의 DNA 서열을 갖는다.
상기에 기술된 넉아웃 돌연변이는, 이것이 표적 넉아웃 유전자 부위의 상류 또는 하류의 염색체 DNA에 대하여 최소의 파괴를 야기하거나 파괴를 전혀 야기하지 않고, 관심의 단백질, 특히 치료용 단백질의 발현에 대한 세포의 적합성에 영향을 줄 수 있는, 항생제 내성 마커와 같은 외래 DNA의 삽입 및 보유를 요구하지 않기 때문에 유리하다. 따라서, 본 발명에 따른 세포 중 하나 이상은, 외래 DNA를 유전자 코딩 서열 내에 삽입함으로써 프로테아제 유전자가 넉아웃된 세포와 비교하여 개선된 성장 특성 및/또는 단백질 발현을 나타낼 수 있다.
일 실시 양태에서, 본 발명에 따른 세포는 돌연변이된 OmpT 유전자를 지닌다. 본원에서 사용될 때, "OmpT 유전자"는 외막 프로테아제인 프로테아제 OmpT(외막 프로테아제 T(outer membrane protease T))를 코딩하는 유전자를 의미한다. 야생형 비돌연변이 OmpT 유전자의 서열은 SWISS-PROT P09169이다.
돌연변이된 OmpT 유전자 또는 OmpT를 코딩하는 돌연변이된 OmpT 유전자에 대한 언급은, 달리 지시되지 않으면, 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하는 돌연변이된 OmpT 유전자 또는 넉아웃 돌연변이 OmpT 유전자를 나타낸다.
본 발명의 문맥에서 "감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하는 돌연변이된 OmpT 유전자"라는 표현은 돌연변이된 OmpT 유전자가 야생형 비돌연변이 OmpT 유전자와 비교하여 완전한 프로테아제 활성을 갖는 것은 아님을 의미한다. 돌연변이된 OmpT 유전자는 야생형 비돌연변이 OmpT 단백질의 50% 이하, 40% 이하, 30% 이하, 20% 이하, 10% 이하 또는 5% 이하의 프로테아제 활성을 갖는 OmpT 단백질을 코딩할 수 있다. 돌연변이된 OmpT 유전자는 프로테아제 활성을 전혀 갖지 않는 OmpT 단백질을 코딩할 수 있다. 이 실시 양태에서, 세포는 염색체 OmpT에 결함이 없으며, 즉, OmpT 유전자 서열은 임의의 형태의 OmpT 단백질의 발현을 방지하도록 결실 또는 돌연변이된 것이 아니었다.
감소된 프로테아제 활성을 갖는 단백질을 생성하기 위하여 임의의 적합한 돌연변이가 OmpT 유전자 내에 도입될 수 있다. 그람 음성 박테리아로부터 발현되는 OmpT 단백질의 프로테아제 활성은 당업계의 숙련자에 의해, 당업계의 임의의 적합한 방법에 의해, 예컨대 문헌[Kramer et al., Identification of essential acidic residues of outer membrane protease OmpT supports a novel active site, FEBS Letters 505 (2001) 426-430] 및 문헌[Dekker et al., Substrate Specitificity of the Integral Membrane Protease OmpT Determined by Spatially Addressed Peptide Libraries, Biochemistry 2001, 40, 1694-1701]에 기술된 방법에 의해 용이하게 테스트될 수 있다.
OmpT는 문헌[Kramer et al., Identification of active site serine and histidine residues in Escherichia coli outer membrane protease OmpT FEBS Letters 2000 468, 220-224]에 보고되었으며, 이는 세린, 히스티딘 및 산성 잔기를 알라닌으로 치환하면 Glu27, Asp97, Asp208 또는 His101의 경우 대략 10배의 감소된 활성, Ser99의 경우 대략 500배의 감소된 활성 및 Asp83, Asp85, Asp210 또는 His212의 경우 대략 10000배의 감소된 활성으로 이어짐을 개시하고 있다. 문헌[Vandeputte-Rutten et al., Crystal Structure of the Outer Membrane Protease OmpT from Escherichia coli suggests a novel catalytic site, The EMBO Journal 2001, Vol 20 No 18 5033-5039)에는 Asp83-Asp85 쌍 및 His212-Asp210 쌍을 포함하는 활성 부위를 갖는 것으로 개시되어 있다. 또한, 문헌[Kramer et al., Lipopolysaccharide regions involved in the activation of Escherichia coli outer membrane protease OmpT, Eur. J. Biochem. FEBS 2002, 269, 1746-1752]에는 루프 L4 중 돌연변이 D208A, D210A, H212A, H212N, H212Q, G216K/K217G, K217T 및 R218L 모두가 효소 활성의 부분적인 또는 실질적으로 완전한 손실로 이어짐이 개시되어 있다.
따라서, 감소된 프로테아제 활성을 갖는 단백질을 생성하기 위한 OmpT 돌연변이는 잔기 E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상에 대한 미스센스 돌연변이와 같은 돌연변이를 포함할 수 있다.
E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상은 감소된 프로테아제 활성을 갖는 단백질을 생성하는 임의의 적합한 아미노산으로 돌연변이될 수 있다. 예를 들어, E27, D43, D83, D85, D97, S99, H101 E111, E136, E193, D206, D208, D210, H212 G216, K217, R218 및 E250 중 하나 이상은 알라닌으로 돌연변이될 수 있다. 적합한 돌연변이의 예로는 E27A, D43A, D83A, D85A, D97A, S99A, H101A E111A, E136A, E193A, D206A, D208A, D210A, H212A, H212N, H212Q, G216K, K217G, K217T, R218L 및 E250A가 있다. 일 실시 양태에서, 돌연변이된 OmpT 유전자는 D210A 및 H212A 돌연변이를 포함한다. D210A 및 H212A 돌연변이를 포함하는 적합한 돌연변이된 OmpT 서열은 서열 번호 23에 예시되어 있다.
본 발명의 문맥에서, "넉아웃 돌연변이 OmpT 유전자"라는 표현은 상기 유전자가 하나 이상의 돌연변이를 포함함으로써 상기 유전자에 의해 코딩되는 단백질의 무발현을 야기하여서 넉아웃 돌연변이 유전자에 의해 코딩되는 단백질에 결함이 있는 세포를 제공함을 의미한다. 상기 넉아웃 유전자는 부분적으로 또는 완전히 전사될 수 있지만, 코딩된 단백질로 번역되는 것은 아닐 수 있다. 넉아웃 돌연변이 OmpT 유전자는 단백질의 무발현을 야기하도록 임의의 적합한 방법으로, 예를 들어 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다. 예를 들어, 유전자는 외래 DNA 서열, 예컨대 항생제 내성 마커를 유전자 코딩 서열 내에 삽입함으로써 넉아웃될 수 있다.
일 실시 양태에서, OmpT 유전자는 유전자 개시 코돈 및/또는 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치한 하나 이상의 종결 코돈에 대한 돌연변이를 포함함으로써 OmpT 단백질의 발현을 방지한다. 개시 코돈에 대한 돌연변이는 개시 코돈의 뉴클레오티드 중 1개, 2개 또는 모든 3개의 뉴클레오티드의 미스센스 돌연변이일 수 있다. 적합한 돌연변이 넉아웃 OmpT 서열은 서열 번호 24에 예시되어 있다. 대안적으로 또는 추가로, 개시 코돈은 삽입 또는 결실 프레임쉬프트 돌연변이에 의해 돌연변이될 수 있다.
일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 ompT에 결함이 있는 것과 같은 넉아웃 돌연변이 ompT 유전자를 지니지 않는다.
일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 degP에 결함이 있는 것과 같은 넉아웃 돌연변이 DegP 유전자를 지니지 않는다. 일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 돌연변이된 DegP 유전자를 지니지 않는다.
일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 ptr에 결함이 있는 것과 같은 넉아웃 돌연변이 ptr 유전자를 지니지 않는다.
넉아웃 돌연변이를 포함하는 다수의 유전자 엔지니어링된 돌연변이는 성공적으로 돌연변이된 세포의 선발 및 동정을 허용하는 항생제 내성 마커의 사용을 포함한다. 그러나, 상기에 논의된 바와 같이, 항생제 내성 마커를 사용하는 것에 대한 다수의 불리한 점이 있다.
본 발명의 추가의 실시 양태에서, 세포는 항생제 내성 마커를 포함하지 않으며, 항생제 내성 마커를 사용하는 상기의 불리한 점을 극복하고, 여기서, 돌연변이된 Tsp 유전자, 돌연변이된 spr 유전자 및 임의로, 돌연변이된 DegP 유전자 및/또는 돌연변이된 ptr 유전자 및/또는 돌연변이된 OmpT 유전자는 하나 이상의 제한 표지 부위를 포함하도록 돌연변이된다. 제한 부위는 유전자 내로 유전자 엔지니어링되며, 천연 비발생이다. 제한 표지 부위는, 이것이 요구되는 염색체 돌연변이를 포함하는 올바르게 변형된 세포의 스크리닝 및 동정을 허용하기 때문에 유리하다. 돌연변이된 프로테아제 유전자들 중 하나 이상을 지니도록 변형된 세포는 천연 비발생 제한 표지 부위를 포함하는 게놈 DNA의 영역을 증폭시키도록 설계된 올리고뉴클레오티드 쌍을 이용한 세포 용해물로부터의 게놈 DNA의 PCR에 의해 분석될 수 있다. 그 후, 증폭된 DNA는 천연 비발생 제한 표지 부위에서 DNA를 소화시킬 수 있는 적합한 제한 효소와 함께 인큐베이션하기 전 및 상기 인큐베이션 후에 아가로스 겔 전기영동에 의해 분석될 수 있다. 제한 효소와 함께 인큐베이션한 후 DNA 단편의 존재는 세포가 상기 하나 이상의 돌연변이된 유전자를 지니도록 성공적으로 변형되었음을 확인해 주는 것이다.
세포가 서열 번호 6의 DNA 서열을 갖는 넉아웃 돌연변이 ptr 유전자를 지니는 실시 양태에서, 서열 번호 17 및 서열 번호 18에 예시된 올리고뉴클레오티드 프라이머 서열을 이용하여, 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기 영동에 의해 분석하여 게놈 DNA 중 돌연변이된 ptr 유전자의 존재를 확인할 수 있다.
세포가 서열 번호 3의 DNA 서열 또는 서열 번호 3의 뉴클레오티드 7 내지 2048을 갖는 넉아웃 돌연변이 Tsp 유전자를 포함하는 실시 양태에서, 서열 번호 15 및 서열 번호 16에 예시된 올리고뉴클레오티드 프라이머 서열을 사용하여 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기영동에 의해 분석하여 게놈 DNA 중 돌연변이된 Tsp 유전자의 존재를 확인할 수 있다.
세포가 서열 번호 9의 DNA 서열을 갖는 돌연변이된 DegP 유전자를 포함하는 실시 양태에서, 서열 번호 19 및 서열 번호 20에 예시된 올리고뉴클레오티드 프라이머 서열을 사용하여 천연 비발생 Ase I 제한 부위를 포함하는 DNA의 영역을 형질전환 세포의 게놈 DNA로부터 증폭시킬 수 있다. 그 후, 증폭된 게놈 DNA를 Ase I 제한 효소와 함께 인큐베이션하고, 겔 전기영동에 의해 분석하여 게놈 DNA 중 돌연변이된 DegP 유전자의 존재를 확인할 수 있다.
상기 하나 이상의 제한 부위는 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의한 것을 비롯하여 임의의 적합한 돌연변이에 의해 도입될 수 있다. 제한 부위는 개시 코돈의 돌연변이 및/또는 상기 하나 이상의 종결 코돈을 도입하기 위한 돌연변이에 의해 도입될 수 있으며, 이는 상기에 기술된 바와 같다. 이 실시 양태는, 제한 표지 부위가, 도입된 넉아웃 돌연변이의 직접적인 그리고 독특한 마커이기 때문에 유리하다.
Ase I 제한 부위와 같은 프레임내 종결 코돈을 포함하는 제한 표지 부위가 삽입될 수 있다. 이는, 삽입된 제한 부위가 제한 표지 부위 및 유전자 코딩 서열의 완전한 전사를 방지하기 위한 종결 코돈 둘 모두로서의 역할을 하기 때문에 특히 유리하다. 예를 들어, Ase I 부위의 도입에 의해 종결 코돈이 ptr 유전자에 도입된 실시 양태에서, 이것도 제한 부위를 생성하며, 이는 도 7a에 예시된 바와 같다. 예를 들어, Ase I 부위의 도입에 의해 코돈 21에서 Tsp 유전자에 종결 코돈이 도입된 실시 양태에서, 이것도 제한 부위를 생성하며, 이는 도 7b에 예시된 바와 같다.
제한 표지 부위는 개시 코돈에 대한 돌연변이 및 임의로 하나 이상의 추가의 점 돌연변이에 의해 삽입될 수 있다. 이 실시 양태에서, 제한 표지 부위는 바람직하게는 EcoR I 제한 부위이다. 이는, 개시 코돈에 대한 돌연변이도 제한 표지 부위를 생성하기 때문에 특히 유리하다. 예를 들어, ptr 유전자의 개시 코돈이 ATT로 변화된 실시 양태에서, 이는 EcoR I 마커 부위를 생성하며, 이는 도 11a에 예시된 바와 같다. 예를 들어, 도 1b에 예시된 바와 같이, Tsp 유전자의 개시 코돈(코돈 3)이 ATG로부터 TCG로 변화된 실시 양태에서, AAC로부터 AAT로의 코돈 2의 추가의 점 돌연변이 및 코돈 3의 ATG로부터의 TCG로의 돌연변이는 EcoR I 제한 표지 부위를 생성하며, 이는 도 7b에 예시된 바와 같다.
세포가 돌연변이된 OmpT 유전자를 지니는 본 발명의 실시 양태에서, 상기 하나 이상의 제한 부위는 하나 이상의 결실 돌연변이, 삽입 돌연변이, 점 돌연변이, 미스센스 돌연변이, 넌센스 돌연변이 및 프레임쉬프트 돌연변이에 의한 것을 비롯하여 임의의 적합한 돌연변이에 의해 도입될 수 있다. 예를 들어, OmpT 유전자가 돌연변이 D210A 및 H212A를 포함하는 실시 양태에서, 이들 돌연변이는 선발 마커로서 사용될 수 있는 사일런트 HindIII 제한 부위를 도입한다.
DegP 유전자 또는 spr 유전자에서, 마커 제한 부위는 사일런트 코돈 변화를 이용하여 도입될 수 있다. 예를 들어, Ase I 부위는 사일런트 제한 표지 부위로서 사용될 수 있으며, 여기서, TAA 종결 코돈은 돌연변이된 DegP 유전자에 대하여 도 7c에 예시된 바와 같이, 프레임외의 것이다.
감소된 프로테아제 활성을 갖는 Tsp 또는 프로테아제 III을 코딩하도록 Tsp 유전자 및/또는 ptr 유전자가 돌연변이된 본 발명의 실시 양태에서, 하나 이상의 마커 제한 부위가 사일런트 코돈 변화를 이용하여 도입될 수 있다.
본 발명에 따른 재조합 그람 음성 박테리아 세포는 임의의 적합한 수단에 의해 생성될 수 있다. 숙련자라면, 염색체 유전자 서열을 돌연변이된 유전자 서열로 대체하는 데 사용될 수 있는 적합한 기술을 알고 있다. 상동 재조합에 의해 숙주 염색체 내로의 통합을 허용하는 적합한 벡터가 이용될 수 있다.
적합한 유전자 대체법은 예를 들어 문헌[Hamilton et al ., New Method for Generating Deletions and Gene Replacements in Escherichia coli, Hamilton C. M. et al ., Journal of Bacteriology Sept. 1989, Vol. 171, No. 9 p 4617-4622], 문헌[Skorupski et al ., Positive selection vectors for allelic exchange, Skorupski K and Taylor R. K., Gene, 1996, 169, 47-52], 문헌[Kiel et al ., A general method for the construction of Escherichia coli mutants by homologous recombination and plasmid segregation, Kiel J.A.K.W. et al, Mol Gen Genet 1987, 207:294-301], 문헌[Blomfield et al ., Allelic exchange in Escherichia coli using the Bacillus subtilis sacB gene and a temperature sensitive pSC101 replicon, Blomfield I. C. et al ., Molecular Microbiology 1991, 5(6), 1447-1457] 및 문헌[Ried et al., An nptI - sacB - sacR cartridge for constructing directed, unmarked mutations in Gram-negative bacteria by marker exchange-eviction mutagenesis, Ried J. L. and Collmer A., Gene 57 (1987) 239-246]에 기술되어 있다. 상동 재조합/대체를 가능하게 하는 적합한 플라스미드는 pKO3 플라스미드이다(문헌[Link et al., 1997, Journal of Bacteriology, 179, 6228-6237]).
성공적으로 돌연변이된 균주는 콜로니 PCR DNA 서열결정 및 콜로니 PCR 제한 효소 지도화를 비롯하여 당업계에 공지된 방법을 이용하여 동정될 수 있다.
세포가 2개 이상의 돌연변이된 염색체 유전자를 포함하는 실시 양태에서, 돌연변이된 유전자는 동일하거나 상이한 벡터 상에서 그람 음성 박테리아 내로 도입될 수 있다.
일 실시 양태에서, 본 발명에 따른 그람 음성 박테리아 세포는 염색체 ompT에 결함이 있는 것과 같은 넉아웃 돌연변이 ompT 유전자를 지니지 않는다.
일 실시 양태에서, 본 발명에 따른 세포는 돌연변이 spr, 감소된 Tsp 및 FkpA, Skp 또는 FkpA와 Skp의 조합의 3가지의 특징적인 돌연변이를 포함한다.
일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, 및 FkpA 유전자로 이루어진다.
일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, 및 Skp 유전자로 이루어진다.
일 실시 양태에서, 본 발명에 따른 세포주는 돌연변이된 Tsp 유전자 및 돌연변이된 spr 유전자, FkpA 유전자 및 Skp 유전자로 이루어진다.
일 실시 양태에서, 항체 또는 이의 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 임의로 포함하는 발현 벡터 내의, FkpA, Skp, SurA, PPiA 및 PPiD와 같은, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질을 발현 또는 과발현시킬 수 있는 유전자(들)로 세포를 일시적으로 형질감염시킨다.
일 실시 양태에서, 항체를 코딩하는 폴리뉴클레오티드 서열 및 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드는 개별 발현 벡터 내에 삽입된다.
중쇄 및 경쇄를 포함하는 생성물의 생성에 있어서, 세포주는 2개의 벡터로 형질전환될 수 있으며, 제1 벡터는 경쇄 폴리펩티드를 코딩하고 제2 벡터는 중쇄 폴리펩티드를 코딩한다. 대안적으로, 단일 벡터가 사용될 수 있으며, 상기 벡터는 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열을 포함한다.
대안적으로, 항체를 코딩하는 폴리뉴클레오티드 서열 및 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드는 1개의 벡터 내에 삽입된다. 바람직하게는, 상기 벡터는 항체의 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열들을 포함한다.
또한 본 발명은 FkpA 및/또는 Skp 및 인간 FcRn에 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 재조합 폴리뉴클레오티드를 포함하는 발현 벡터를 제공한다. 본 발현 벡터는 FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 서열 및 상기 항체를 코딩하는 폴리뉴클레오티드를 포함하는 다중시스트론(multi-cistronic) 벡터이다.
다중시스트론 벡터는 벡터 내로의 폴리뉴클레오티드 서열의 반복된 순차적 클로닝을 허용하는 유리한 클로닝 방법에 의해 생성될 수 있다. 상기 방법은 제한 부위의 쌍의 양립가능한 코헤시브(cohesive) 말단, 예컨대 Ase I 및 Nde I 제한 부위의 "AT" 말단을 이용한다. AseI - NdeI 단편과 같은 양립가능한 코헤시브 말단을 갖고 코딩 서열을 포함하는 폴리뉴클레오티드 서열은 Nde I과 같은 벡터 내의 제한 부위 내에 클로닝될 수 있다. 폴리뉴클레오티드 서열의 삽입은 5' 제한 부위를 파괴하지만, 새로운 3' 제한 부위, 예컨대 Nde I을 생성하며, 이는 그 후에, 양립가능한 코헤시브 말단을 포함하는 추가의 폴리뉴클레오티드 서열의 삽입에 사용될 수 있다. 그 후, 상기 공정은 추가의 서열의 삽입을 위하여 반복될 수 있다. 벡터 내로 삽입된 각각의 폴리뉴클레오티드 서열은 개시 코돈을 코딩하는 NdeI 부위, A 풍부 스페이서(spacer), 샤인 달가노(Shine Dalgarno) 리보좀 결합 서열 및 스크리닝을 위한 Ssp I 부위를 포함할 수 있는, 종결 코돈에 대하여 3'인 비코딩 서열을 포함한다.
항체의 경쇄(LC), 항체의 중쇄(HC)를 코딩하는 폴리뉴클레오티드 서열, FkpA 폴리뉴클레오티드 서열 및 추가의 폴리뉴클레오티드 서열을 포함하는 벡터의 생성의 도해가 도 7d에 예시되어 있다.
본 발명에 따른 세포는 바람직하게는 상기에 정의된 발현 벡터를 포함한다.
세포가 하기와 같이 하나 이상의 추가의 단백질, 즉, 단백질 접힘을 용이하게 할 수 있는 하나 이상의 단백질; 예컨대 skp, SurA, PPiA 및 PPiD; 및 임의로, 단백질 분비 또는 전좌를 용이하게 할 수 있는 하나 이상의 단백질, 예컨대 SecY, SecE, SecG, SecYEG, SecA, SecB, FtsY 및 Lep를 또한 발현하는 실시 양태에서, 상기 하나 이상의 추가의 단백질은 FkpA를 코딩하는 폴리뉴클레오티드 및/또는 항체를 코딩하는 폴리뉴클레오티드 서열과 동일한 벡터 내로 삽입된 하나 이상의 폴리뉴클레오티드로부터 발현될 수 있다. 대안적으로, 상기 하나 이상의 폴리뉴클레오티드는 개별 벡터 내로 삽입될 수 있다.
발현 벡터는 상기에 정의된 하나 이상의 발현 카세트를 적합한 벡터 내에 삽입함으로써 생성될 수 있다. 대안적으로, 폴리뉴클레오티드 서열의 발현을 지시하기 위한 조절 발현 서열이 발현 벡터 내에 포함될 수 있으며, 따라서, 폴리뉴클레오티드의 코딩 영역만이 발현 벡터의 완성에 요구될 수 있다.
FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 및/또는 항체를 코딩하는 폴리뉴클레오티드는 세포에 적합한 프로모터의 제어 하에서의 세포에서의 발현을 위하여, 복제가능 벡터, 전형적으로 자율 복제 발현 벡터 내로 삽입되는 것이 적합하다. 다수의 벡터가 이 목적용으로 당업계에 공지되어 있으며, 적절한 벡터의 선택은 핵산의 크기 및 특히 세포 유형에 따라 달라질 수 있다.
본 발명에 따른 폴리뉴클레오티드로 숙주 세포를 형질전환시키는 데 이용될 수 있는 발현 벡터의 예는 하기를 포함한다:
● pBR322 또는 pACYC184와 같은 플라스미드, 및/또는
● 박테리아 파지와 같은 바이러스 벡터
● 트랜스포존(transposon)과 같은 전치 유전 요소
이러한 발현 벡터는 일반적으로 플라스미드의 DNA 복제 기점, 항생제 선발가능 마커, 프로모터 및 전사 종결자 - 다중 클로닝 부위(발현 카세트)에 의해 분리됨 - 및 리보좀 결합 부위를 코딩하는 DNA 서열을 포함한다.
본 발명에서 이용되는 프로모터는 관련 폴리뉴클레오티드에 직접적으로 연결되거나 대안적으로는 적절한 위치에, 예를 들어 관련 폴리펩티드가 삽입될 때 관련 프로모터가 상기 관련 폴리뉴클레오티드에 작용할 수 있도록 하는 벡터 내에 위치할 수 있다. 일 실시 양태에서, 프로모터는 이것이 작용하는 폴리뉴클레오티드의 코딩 부분 앞에 위치하며, 예를 들어, 폴리뉴클레오티드의 각각의 코딩 부분 앞에 관련 프로모터가 위치한다. 본원에서 사용될 때, "앞에"라는 것은 코딩 폴리뉴클레오티드 부분과 관련하여 5' 말단에 프로모터가 위치함을 암시하는 것으로 의도된다.
프로모터는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 프로모터는 lac, tac, trp, phoA, Ipp, Arab, tet 및 T7을 포함한다.
이용되는 하나 이상의 프로모터는 유도성 프로모터일 수 있다. FkpA 및/또는 Skp를 코딩하는 폴리뉴클레오티드 및 항체를 코딩하는 폴리뉴클레오티드가 1개의 벡터 내로 삽입된 실시 양태에서, FkpA 및 항체를 코딩하는 뉴클레오티드 서열들은 단일 프로모터 또는 개별 프로모터들의 제어 하에 있을 수 있다. FkpA 및/또는 Skp 및 항체를 코딩하는 뉴클레오티드 서열들이 개별 프로모터들의 제어 하에 있는 실시 양태에서, 프로모터는 독립적으로 유도성 프로모터일 수 있다.
박테리아 시스템에서 사용하기 위한 프로모터는 또한 일반적으로 샤인 달가노(S.D.) 서열이 관심의 폴리펩티드를 코딩하는 DNA에 작동가능하게 연결된 것을 포함한다. 프로모터는 제한 효소 소화에 의해 박테리아 소스 DNA로부터 제거되고, 요망되는 DNA를 포함하는 벡터 내에 삽입될 수 있다.
바람직하게는 발현 벡터는 항체 또는 이의 항원 결합 단편을 생성하기 위한 2시스트론 메시지(dicistronic message)를 또한 포함하며, 이는 국제 특허 공개 제WO03/048208호 또는 국제 특허 공개 제WO2007/039714호에 기술된 바와 같다(이의 내용은 본원에 참고로 포함됨). 바람직하게는, 상류 시스트론은 항체의 경쇄를 코딩하는 DNA를 함유하며, 하류 시스트론은 상응하는 중쇄를 코딩하는 DNA를 함유하고, 2시스트론형 유전자간 서열(IGS)은 바람직하게는 IGS1(서열 번호 23), IGS2 (서열 번호 24), IGS3 (서열 번호 25) 및 IGS4 (서열 번호 26)로부터 선택되는 서열을 포함한다.
종결자는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 종결자는 rrnB이다.
프로모터 및 종결자를 포함하는 추가의 적합한 전사 조절자 및 단백질 표적화 방법이 문헌["Strategies for Achieving High-Level Expression of Genes in Escherichia coli" Savvas C. Makrides, Microbiological Reviews, Sept 1996, p 512-538]에서 발견될 수 있다.
발현 벡터 내에 삽입된 FkpA 폴리뉴클레오티드는 바람직하게는 FkpA 신호 서열 및 FkpA 코딩 서열을 코딩하는 핵산을 포함한다. 바람직하게는 벡터는 벡터가 하나 이상의 선택된 숙주 세포에서 복제되는 것을 가능하게 하는, 바람직하게는 숙주 염색체와 관계 없이 복제되는 것을 가능하게 하는 핵산 서열을 포함한다. 이러한 서열은 다양한 박테리아에 대하여 공지되어 있다.
일 실시 양태에서, FkpA 및/또는 Skp 및/또는 관심의 단백질은 N-말단 및/또는 C-말단에 히스티딘 태그를 포함한다.
항체 분자는 적합한 신호 서열에 의해 세포로부터 분비되거나 주변 세포질로 표적화될 수 있다. 대안적으로, 항체 분자는 세포의 세포질 내에 축적될 수 있다. 바람직하게는, 항체 분자는 주변 세포질로 표적화된다.
항체를 코딩하는 폴리뉴클레오티드는 또 다른 폴리펩티드, 바람직하게는 신호 서열 또는 성숙 폴리펩티드의 N-말단에 특이적 절단 부위를 갖는 다른 폴리펩티드와의 융합물로서 발현될 수 있다. 선택된 이종성 신호 서열은 숙주 세포에 의해 인식되고 프로세싱되는 것이어야 한다. 천연 또는 진핵 폴리펩티드 신호 서열을 인식하지 못하고 프로세싱하지 못하는 원핵 숙주 세포에 있어서, 신호 서열은 원핵 신호 서열에 의해 치환된다. 적합한 신호 서열은 OmpA, PhoA, LamB, PelB, DsbA 및 DsbC를 포함한다. 세포가 항체의 중쇄 서열을 코딩하는 폴리뉴클레오티드 서열 및 항체의 경쇄를 코딩하는 폴리뉴클레오티드 서열을 포함하는 실시 양태에서, 각각의 폴리뉴클레오티드는 신호 서열, 예컨대 OmpA를 포함할 수 있다.
상기에 열거된 성분들 중 하나 이상을 포함하는 적합한 벡터의 구성은 표준 라이게이션 기술을 이용한다. 단리된 플라스미드 또는 DNA 단편은 절단되고, 테일러링되고(tailored), 요구되는 플라스미드를 생성하는 데 요구되는 형태로 재라이게이션된다. 벡터를 구성할 수 있는 일반적인 방법, 형질감염 방법 및 배양 방법은 당업계의 숙련자에게 공지되어 있다. 이와 관련하여, 문헌["Current Protocols in Molecular Biology", 1999, F. M. Ausubel (ed), Wiley Interscience, New York] 및 문헌[Maniatis Manual produced by Cold Spring Harbor Publishing]을 참조한다.
표준 분자 생물학 기술을 이용하여 항체를 코딩하는 DNA 서열을 제조할 수 있다. 요구되는 DNA 서열은 올리고뉴클레오티드 합성 기술을 이용하여 완전히 또는 부분적으로 합성될 수 있다. 적절할 경우, 부위 지정 돌연변이 유발 및 폴리머라아제 연쇄 반응(PCR) 기술이 사용될 수 있다.
폴리뉴클레오티드와 관련하여 본원에 기술된 본 발명의 실시 양태는, 본 발명의 대안적인 실시 양태, 예를 들어, 본원에서 이용된 성분을 포함하는 숙주 세포, 발현 카세트 및/또는 벡터에 동일하게 적용되는데, 이는 관련 측면이 상기에 적용될 수 있는 한 그러하다.
본 발명에 따른 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열을 추가로 포함할 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 외인성 또는 내인성일 수 있다. 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열은 숙주의 염색체 내에 통합될 수 있거나, 벡터, 전형적으로 플라스미드 내에 비통합될 수 있다.
일 실시 양태에서, 본 발명에 따른 세포는 관심의 단백질을 발현한다. 본 명세서의 문맥에서 "관심의 단백질"은 발현용 폴리펩티드, 일반적으로 재조합 폴리펩티드를 나타내는 것으로 의도된다. 그러나, 관심의 단백질은 숙주 세포에서 내인성 유전자로부터 발현되는 내인성 단백질일 수 있다.
본원에서 사용될 때, "재조합 폴리펩티드"는 재조합 DNA 기술을 이용하여 구성되거나 생성되는 단백질을 나타낸다. 관심의 단백질은 내인성 단백질과 동일한 외인성 서열 또는 이의 돌연변이된 버전, 예를 들어 약화된 생물학적 활성을 갖는 것, 또는 이의 단편으로서 외인성 벡터로부터 발현된 것일 수 있다. 대안적으로, 관심의 단백질은 숙주 세포에 의해 보통은 발현되지 않는 이종성 단백질일 수 있다.
관심의 단백질은 치료용, 예방용 또는 진단용 단백질을 포함하는 임의의 적합한 단백질일 수 있다.
당업자라면, 당업계에 공지된 방법, 예컨대 단백질 G HPLC, 원편광 이색성, NMR, X선 크리스탈로그래피 및 에피토프 친화성 측정 방법을 이용하여 단백질이 올바르게 접혀져 있는지를 관찰하기 위하여 분비된 단백질을 용이하게 테스트할 수 있다.
일 실시 양태에서, 관심의 단백질은 면역 장애 및/또는 자가면역 질환을 포함하는 질환 또는 장애의 치료에 유용하다.
일 실시 양태에서, 자가면역 질환은 급성 파종성 뇌척수염(Acute Disseminated Encephalomyelitis; ADEM), 급성 괴사성 출혈성 백질뇌염, 애디슨병(Addison's disease), 무감마글로불린혈증, 원형 탈모증, 아밀로이드증, ANCA 연관 혈관염, 강직성 척추염, 항-GBM/항-TBM 신염, 항인지질 증후군(Antiphospholipid syndrome; APS), 자가면역성 혈관 부종, 자가면역성 재생 불량성 빈혈, 자가면역성 자율 신경 실조증, 자가면역성 간염, 자가면역성 고지혈증, 자가면역성 면역 결핍, 자가면역성 내이 질환(Autoimmune inner ear disease; AIED), 자가면역성 심근염, 자가면역성 췌장염, 자가면역성 망막증, 자가면역성 혈소판 감소성 자반 (Autoimmune thrombocytopenic purpura; ATP), 자가면역성 갑상선 질환, 자가면역성 두드러기, 축삭 및 뉴런 신경병증, 발로병(Balo disease), 베체트병(Behcet's disease), 수포성 유사천포창, 심근병증, 캐슬만병(Castleman disease), 셀리악병(Celiac disease), 차가스병(Chagas disease), 만성 피로 증후군, 만성 염증성 탈수초성 다발성 신경병증(CIDP), 만성 재발성 다발성 골수염(Chronic recurrent multifocal osteomyelitis; CRMO), 처그-스트라우스 증후군(Churg-Strauss syndrome), 반흔성 유사천포창/양성 점막성 유사천포창, 크론병(Crohn's disease), 코간 증후군(Cogan's syndrome), 한랭 응집소병, 선천성 심차단, 콕사키성(Coxsackie) 심근염, CREST 질환, 본태성 혼합 한랭 글로불린혈증, 탈수초 신경병증, 포진상 피부염, 피부근염, 데빅병(Devic's disease)(시신경 척수염), 확장성 심근병증, 원판상 루푸스, 드레슬러 증후군(Dressler's syndrome), 자궁내막증, 호산구성 혈관중심성 섬유증, 호산구성 근막염, 결절성 홍반, 실험적 알러지성 뇌척수염, 에반스 증후군(Evans syndrome), 섬유근통, 섬유화성 폐포염, 거대 세포 동맥염(측두 동맥염), 사구체신염, 굿파스튜어 증후군(Goodpasture's syndrome), 육아종 다발혈관염(Granulomatosis with Polyangiitis; GPA)(베게너 육아종증 참조), 그레이브스병(Graves' disease), 길랑-바레 증후군(Guillain-Barre syndrome), 하시모토 뇌척수염(Hashimoto's encephalitis), 하시모토 갑상선염, 용혈성 빈혈, 헤노크-쉔레인 자반증(Henoch-Schonlein purpura), 임신성 포진, 저감마글로불린혈증, 특발성 저보체혈성 세뇨관간질 신염, 특발성 혈소판 감소성 자반(ITP), IgA 신병증, IgG4-연관 질환, IgG4-연관 경화성 질환, 면역조절 리포단백질, 염증성 대동맥류, 염증성 가성 종양, 봉입체 근염, 인슐린 의존성 당뇨병(제1형), 간질성 방광염, 연소성 관절염, 연소성 당뇨병, 카와사키 증후군(Kawasaki syndrome), 쿠트너 종양(Kuttner's tumour), 램버트-이튼 증후군(Lambert-Eaton syndrome), 백혈구파괴 혈관염, 편평 태선, 경화성 태선, 목질 결막염, 선상 IgA 질환(Linear IgA disease; LAD), 루푸스(SLE), 라임병(Lyme disease), 만성, 종격 섬유증, 메니에르병(Meniere's disease), 현미경적 다발성 혈관염, 미쿨리츠 증후군(Mikulicz's syndrome), 혼합성 결합 조직 질환(Mixed connective tissue disease; MCTD), 무렌 궤양(Mooren's ulcer), 무카-하베르만병(Mucha-Habermann disease), 다발성 섬유경화증, 다발성 경화증, 중증 근무력증, 근염, 발작수면, 시신경 척수염(데빅병), 호중구 감소증, 안반흔성 유사천포창, 시신경염, 오르몬드병(Ormond's disease)(후복막 섬유증), 재발성 류마티즘, PANDAS(연쇄상구균과 연관된 소아 자가면역성 신경정신 장애(Autoimmune Neuropsychiatric Disorders Associated with Streptococcus)), 부종양성 소뇌 변성, 파라단백질혈증성 다발성 신경병증, 발작성 야간 혈색소뇨증 (Paroxysmal nocturnal hemoglobinuria; PNH), 패리 롬버그 증후군(Parry Romberg syndrome), 파르소니지-터너 증후군(Parsonnage-Turner syndrome), 평면 부염(주변 포도막염), 심상성 천포창, 대동맥 주위염, 동맥 주위염, 말초 신경병증, 정맥 주위성 뇌척수염, 악성 빈혈, POEMS 증후군, 결절성 다발성 동맥염, 제I형, 제II형 및 제III형 자가면역성 다선 증후군, 류마티스성 다발성 근육통, 다발성 근염, 심근경색 후 증후군, 심낭막 절개술 후 증후군, 프로게스테론 피부염, 원발성 담즙성 간경변증, 원발성 경화성 담관염, 건선, 건선 관절염, 특발성 폐 섬유증, 괴저성 농피증, 순수 적혈구 무형성증, 레이노 현상(Raynaud's phenomenon), 반사성 교감 신경 이영양증, 라이터 증후군(Reiter's syndrome), 재발성 다발성 연골염, 하지 불안 증후군, 후복막 섬유증(오르몬드병), 류마티스열, 류마티스 관절염, 라이델 갑상선염(Riedel thyroiditis), 사르코이드증, 슈미트 증후군(Schmidt syndrome), 공막염, 경피증, 쇼그렌 증후군(Sjogren's syndrome), 정자 및 고환 자가면역, 강직 인간 증후군, 아급성 세균성 심내막염(Subacute bacterial endocarditis; SBE), 수삭 증후군(Susac's syndrome), 교감성 안염, 타카야스 동맥염(Takayasu's arteritis), 측두 동맥염/거대 세포 동맥염, 혈전성, 혈소판 감소성 자반 (TTP), 톨로사-헌트 증후군(Tolosa-Hunt syndrome), 횡단성 척수염, 궤양성 대장염, 미분화 결합 조직 질환(Undifferentiated connective tissue disease; UCTD), 포도막염, 맥관염, 소수포 수포성 피부병, 백반, 발덴스트롬 마크로글로불린혈증(Waldenstrom Macroglobulinaemia), 온형 특발성 용혈성 빈혈 및 베게너 육아종증(현재, 육아종 다발혈관염(GPA)으로 칭해짐)으로부터 선택된다.
일 실시 양태에서, 신경학적 장애는 만성 염증성 탈수초성 다발성 신경병증(CIDP), 길랑-바레 증후군, 파라단백질혈증성 다발성 신경병증, 시신경 척수염(NMO, NMO 스펙트럼 장애 또는 NMO 스펙트럼 질환), 및 중증 근무력증으로부터 선택된다.
일 실시 양태에서, 면역학적 혈액학적 장애는 특발성 혈소판 감소성 자반(ITP), 혈전성 혈소판 감소성 자반(TTP), 온형 특발성 용혈성 빈혈, 굿파스튜어 증후군, 및 항-HLA 항체로 인한 이식 공여자 미스매치(mismatch)로부터 선택된다.
일 실시 양태에서, 질환은 중증 근무력증, 시신경 척수염, CIDP, 길랑-바레 증후군, 파라단백질혈증성 다발성 신경병증, 난치성 간질, ITP/TTP, 용혈성 빈혈, 굿파스튜어 증후군, ABO 미스매치, 루푸스 신염, 신장 맥관염, 경피증, 섬유화성 폐포염, 확장성 심근병증, 그레이브스병, 제I형 당뇨병, 자가면역성 당뇨병, 천포창, 경피증, 루푸스, ANCA 맥관염, 피부근염, 쇼그렌병 및 류마티스 관절염으로부터 선택된다.
일 실시 양태에서, 피부과적 장애는 수포성 유사천포창, 심상성 천포창, ANCA 연관 혈관염 및 확장성 심근병증으로부터 선택된다.
일 실시 양태에서, 본 발명에 따른 항체 또는 단편은 동종이형 기관 또는 조직 이식과 연관된 동종면역 질환 또는 특정한 신생아 병태의 예방 또는 치료에 이용될 수 있다.
단백질은 천연 상태에서 또는 분비 동안, 단백질 분해적으로 민감한 폴리펩티드, 즉, 절단되기 쉽거나, 절단에 민감하거나, 하나 이상의 그람 음성 박테리아, 예컨대 이. 콜라이의 프로테아제에 의해 절단되는 단백질일 수 있다. 일 실시 양태에서, 관심의 단백질은 DegP, 프로테아제 III 및 Tsp로부터 선택되는 프로테아제에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제 Tsp에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP 및 프로테아제 III에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP 및 Tsp에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 Tsp 및 프로테아제 III에 대하여 단백질 분해적으로 민감하다. 일 실시 양태에서, 관심의 단백질은 프로테아제인 DegP, 프로테아제 III 및 Tsp에 대하여 단백질 분해적으로 민감하다.
바람직하게는 단백질은 진핵 폴리펩티드이다.
본 발명에 따른 세포에 의해 발현되는 관심의 단백질은 예를 들어 면역원, 2가지의 이종성 단백질을 포함하는 융합 단백질 또는 항체일 수 있다. 관심의 단백질로서 사용하기 위한 항체는 모노클로날(monoclonal) 항체, 다가 항체, 다중 특이성 항체, 인간화 항체, 완전 인간 항체 또는 키메라 항체를 포함한다. 항체는 임의의 종 유래의 것일 수 있지만, 바람직하게는 모노클로날 항체, 인간 항체 또는 인간화 단편으로부터 유래된다. 항체는 임의의 클래스(예를 들어, IgG, IgE, IgM, IgD 또는 IgA) 또는 하위클래스의 면역글로불린 분자로부터 유래될 수 있으며, 예를 들어 마우스, 래트, 상어, 토끼, 돼지, 햄스터, 낙타, 라마, 염소 또는 인간을 포함하는 임의의 종으로부터 수득될 수 있다. 항체 단편의 일부는 1가지 초과의 종으로부터 수득될 수 있으며, 예를 들어, 항체 단편은 키메라 단편일 수 있다. 일 실시예에서, 불변 영역은 한 종으로부터 유래되며, 가변 영역은 또 다른 것으로부터 유래된다.
항체는 전장 중쇄 및 경쇄를 갖는 완전 항체 분자 또는 이의 단편, 예를 들어 VH, VL, VHH, Fab, 변형 Fab, Fab', F(ab')2, Fv, scFv 단편, 또는 이중 특이성 항체, 예컨대 Fab-dAb 또는 Fab-Fv일 수 있으며, 이는 국제 특허 공개 제WO2009/040562호 및 국제 특허 공개 제WO2010/035012호에 기술된 바와 같다.
일 실시 양태에서, 단백질은 Fab'이다.
항체는 임의의 v적 항원에 대하여 특이적일 수 있다. 항원은 세포 결부된 단백질, 예를 들어 박테리아 세포, 효모 세포, T 세포, 내피 세포 또는 종양 세포와 같은 세포 상의 표면 단백질일 수 있거나, 항원은 용해성 단백질일 수 있다. 관심의 항원은 또한 임의의 의학적 관련 단백질, 예컨대 질환 또는 감염 동안 상향조절되는 단백질, 예를 들어 수용체 및/또는 그의 상응하는 리간드일 수 있다. 세포 표면 단백질의 특별한 예는 유착 분자, 예를 들어 인테그린, 예컨대 β1 인테그린, 예를 들어 VLA-4, E-셀렉틴(selectin), P 셀렉틴 또는 L-셀렉틴, CD2, CD3, CD4, CD5, CD7, CD8, CD11a, CD11b, CD18, CD19, CD20, CD23, CD25, CD33, CD38, CD40, CD40L, CD45, CDW52, CD69, CD134 (OX40), ICOS, BCMP7, CD137, CD27L, CDCP1, CSF1 또는 CSF1-수용체, DPCR1, DPCR1, 두둘린2(dudulin2), FLJ20584, FLJ40787, HEK2, KIAA0634, KIAA0659, KIAA1246, KIAA1455, LTBP2, LTK, MAL2, MRP2, 넥틴-유사2(nectin-like2), NKCC1, PTK7, RAIG1, TCAM1, SC6, BCMP101, BCMP84, BCMP11, DTD, 암배아 항원(carcinoembryonic antigen; CEA), 인간 유지 글로불린(human milk fat globulin; HMFG1 및 2), MHC 클래스 I 및 MHC 클래스 II 항원, KDR 및 VEGF, 및 적절할 경우, 이들의 수용체를 포함한다.
용해성 항원은 인터류킨, 예컨대 IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-8, IL-12, IL-13, IL-14, IL-16 또는 IL-17, 예컨대 IL17A 및/또는 IL17F, 바이러스 항원, 예를 들어 호흡기 세포융합 바이러스 또는 시토메갈로바이러스(cytomegalovirus) 항원, 면역글로불린, 예컨대 IgE, 인터페론, 예컨대 인터페론 α, 인터페론 β 또는 인터페론 γ, 종양 괴사 인자 TNF(이전에는 종양 괴사 인자-α로 공지됨), 종양 괴사 인자-β, 콜로니 자극 인자, 예컨대 G-CSF 또는 GM-CSF, 및 혈소판 유래 성장 인자, 예컨대 PDGF-α 및 PDGF-β 및 적절할 경우 이들의 수용체를 포함한다. 다른 항원은 박테리아 세포 표면 항원, 박테리아 독소, 바이러스, 예컨대 인플루엔자, EBV, HepA, B 및 C, 바이오테러 에이전트(bioterrorism agent), 방사성 핵종 및 중금속, 및 뱀 및 거미 독 및 독소를 포함한다.
일 실시 양태에서, 항원은 FcRn이다.
본 발명에서 사용하기 위한 항체는 당업계에 공지된 임의의 적합한 방법을 이용하여 수득될 수 있다. 폴리펩티드를 (재조합적으로 또는 천연적으로) 발현하는 세포(예컨대 활성화 T 세포)를 포함하는, 융합 단백질을 포함하는 FcRn 폴리펩티드/단백질 및 이의 돌연변이체를 사용하여 항체를 생성할 수 있으며, 이 항체는 FcRn을 특이적으로 인식한다. 폴리펩티드는 '성숙' 폴리펩티드 또는 이의 생물학적 활성 단편 또는 유도체일 수 있다. 인간 단백질은 Swiss-Prot에 번호 P55899로 등록되어 있다. 일 실시 양태에서, 면역원은 FcRn 알파 사슬 또는 이의 단편이다.
숙주의 면역화에 사용하기 위한 폴리펩티드는 발현 시스템을 포함하는 유전자 엔지니어링된 숙주 세포로부터, 당업계에 공지된 방법에 의해 제조될 수 있거나, 상기 폴리펩티드는 천연 생물 소스로부터 회수될 수 있다. 본 출원에서, "폴리펩티드"라는 용어는 펩티드, 폴리펩티드 및 단백질을 포함한다. 이들은 달리 특정되지 않으면, 상호교환가능하게 사용된다. FcRn 폴리펩티드는 일부의 경우에, 예를 들어 친화성 태그에 융합된 융합 단백질과 같은 더욱 큰 단백질의 일부일 수 있다.
FcRn 폴리펩티드에 대하여 생성되는 항체는, 동물의 면역화가 필요한 경우, 공지된 그리고 일상적인 프로토콜을 이용하여, 동물, 바람직하게는 비인간 동물에게 상기 폴리펩티드를 투여함으로써 수득될 수 있으며, 예를 들어, 문헌[Handbook of Experimental Immunology, D. M. Weir (ed.), Vol 4, Blackwell Scientific Publishers, Oxford, England, 1986]을 참조한다. 다수의 온혈 동물, 예컨대 토끼, 마우스, 래트, 양, 소, 낙타 또는 돼지가 면역화될 수 있다. 그러나, 마우스, 토끼, 돼지 및 래트가 일반적으로 가장 적합하다.
일 실시 양태에서, 관심의 항원의 활성을 기능적으로 변경시키는 데 사용될 수 있다. 예를 들어, 항체는 상기 항원의 활성을 직접적으로 또는 간접적으로 중화시키거나, 길항시키거나, 작동시킬 수 있거나, 단순히 정상 리간드가 그에 결합하는 것을 차단한다.
또한 본 발명은 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하거나 넉아웃 돌연변이 Tsp 유전자인 돌연변이된 Tsp 유전자, 돌연변이 spr을 코딩하는 돌연변이 spr 유전자, 단백질 접힘을 용이하게 할 수 있는 것 또는 단백질을 발현 또는 과발현시킬 수 있는 유전자 및 FcRn에 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 그람 음성 박테리아 세포를 제공한다.
다양한 항-FcRn 항체 및 단편이 서열 36 내지 서열 74에 예시되어 있다.
일 실시 양태에서, 중쇄는 서열 번호 36, 37 및 38의 서열로부터 독립적으로 선택되는 1개, 2개 또는 3개의 CDR을 포함한다.
일 실시 양태에서, 경쇄는 서열 번호 39, 40 및 41의 서열로부터 독립적으로 선택되는 1개, 2개 또는 3개의 CDR을 포함한다.
일 실시 양태에서, 항체 중쇄는 CDR-H1에 대하여 서열 번호 36에 주어진 서열, CDR-H2에 대하여 서열 번호 37에 주어진 서열 및 CDRH3에 대하여 서열 번호 38에 주어진 서열을 포함한다.
일 실시 양태에서, 항체 경쇄는 CDR-L1에 대하여 서열 번호 39에 주어진 서열, CDR-L2에 대하여 서열 번호 40에 주어진 서열 및 CDRL3에 대하여 서열 번호 41에 주어진 서열을 포함한다.
일 실시 양태에서, 항체 중쇄는 CDR-H1에 대하여 서열 번호 36에 주어진 서열, CDR-H2에 대하여 서열 번호 37에 주어진 서열, CDRH3에 대하여 서열 번호 38에 주어진 서열, CDR-L1에 대하여 서열 번호 39에 주어진 서열, CDR-L2에 대하여 서열 번호 40에 주어진 서열 및 CDRL3에 대하여 서열 번호 41에 주어진 서열을 포함한다.
일 실시 양태에서, 세포는 본원에 개시된 서열을 갖는 항체 분자를 발현한다.
항체 분자는 항체 및 이의 결합 단편을 포함한다.
적합하게는, 본 발명에 따른 인간화 항체는 본원에 구체적으로 제공된 CDR 중 하나 이상 뿐만 아니라 인간 수용 프레임워크(acceptor framework) 영역을 포함하는 가변 도메인도 갖는다. 따라서, 일 실시 양태에서 제공되는 것은 인간 FcRn에 결합하는 인간화 항체이며, 여기서, 가변 도메인은 인간 수용 프레임워크 영역 및 비인간 공여(donor) CDR을 포함한다. 일 실시예에서, 경쇄 가변 도메인은 서열 번호 50에 주어진 서열을 포함하며, 중쇄 가변 도메인은 서열 번호 58에 주어진 서열을 포함한다. 일 실시예에서, 경쇄는 서열 번호 54에 주어진 서열을 포함하며, 중쇄는 서열 번호 62에 주어진 서열을 포함한다.
발현 후, 항체 단편은 예를 들어 또 다른 개체(entity), 예컨대 작용체 분자에의 콘쥬게이션(conjugation)에 의해 추가로 처리될 수 있다.
본원에서 사용될 때, 작용체 분자라는 용어는 예를 들어 항신생물제, 약물, 독소(예컨대 박테리아 또는 식물 기원의 효소 활성 독소 및 이의 단편, 예를 들어 리신 및 이의 단편), 생물학적 활성 단백질, 예를 들어 효소, 다른 항체 또는 항체 단편, 합성 또는 천연 발생 중합체, 핵산 및 이의 단편, 예를 들어 DNA, RNA 및 이들의 단편, 방사성 핵종, 특히 방사성 요오다이드, 방사성 동위 원소, 킬레이팅 금속, 나노입자 및 리포터 그룹(reporter group), 예컨대 형광 화합물 또는 NMR 또는 ESR 분광법에 의해 검출될 수 있는 화합물을 포함한다. 작용체 분자는 임의의 적합한 방법에 의해 항체 또는 이의 단편에 부착될 수 있으며, 예를 들어 항체 단편은 국제 특허 공개 제WO05/003171호 또는 국제 특허 공개 제WO05/003170호(이들의 내용은 본원에 참고로 포함됨)에 기술된 바와 같이 하나 이상의 작용체 분자에 부착하도록 변형될 수 있다. 국제 특허 공개 제WO05/003171호 또는 국제 특허 공개 제WO05/003170호에는 적합한 작용체 분자가 또한 기술되어 있다.
일 실시 양태에서, 요구될 경우, 항체 또는 이의 단편, 예컨대 Fab는 요구되는 특성, 예를 들어 전체 항체와 유사한 특성을 갖는 생성물을 생성하도록 페길화된다(PEGylated). 예를 들어, 항체는 국제 특허 공개 제WO01/094585호에 기술된 바와 같이 페길화 항-TNF-α Fab', 바람직하게는 중쇄의 C-말단의 시스테인 잔기들 중 하나에 라이실-말레이미드 유도된 기가 부착된 것일 수 있으며, 여기서, 라이실 잔기의 2개의 아미노기 각각에는 분자량이 약 20,000 Da인 메톡시폴리(에틸렌글리콜)잔기가 공유 결합되어서, 메톡시폴리(에틸렌글리콜)잔기의 전체 평균 분자량은 약 40,000 Da이 되며, 더 바람직하게는 라이실-말레이미드 유도된 기는 [1-[[[2-[[3-(2,5-디옥소-1-피롤리디닐)-1-옥소프로필]아미노]에틸]아미노]-카르보닐]-1,5-펜탄디일]비스(이미노카르보닐)이다.
일 실시 양태에서, 본 발명에 따른 Fab 또는 Fab'는 인간 혈청 알부민 분자 또는 전분 분자에 콘쥬게이션된다.
세포는 또한 관심의 하나 이상의 추가의 단백질을 코딩하는 추가의 폴리뉴클레오티드 서열을 포함할 수 있다.
일 실시 양태에서, 야생형 형태에서 정제 동안 관심의 재조합 단백질과 동시 정제되는 것으로 공지된 하나 이상의 이. 콜라이 숙주 단백질이 유전자 변형용으로 선택되며, 이는 문헌[Humphreys et al. "Engineering of Escherichia coli to improve the purification of periplasmic Fab' fragments: changing the pI of the chromosomally encoded PhoS/PstS protein", Protein Expression and Purification 37 (2004) 109-118] 및 국제 특허 공개 제WO04/035792호(이들의 내용은 본원에 참고로 포함됨)에 기술된 바와 같다. 이러한 변형된 숙주 단백질의 사용은, 선택된 이. 콜라이 단백질의 물리적 특성의 변경에 의한 이. 콜라이에서 생성된 관심의 단백질, 특히 항체의 정제 공정을 개선시켜서, 상기 숙주 단백질은 더 이상 재조합 항체와 동시 정제되지 않게 된다. 바람직하게는, 변경되는 이. 콜라이 단백질은 포스페이트 결합 단백질(PhoS/PstS), 디펩티드 결합 단백질(DppA), 말토스 결합 단백질(MBP) 및 티오레독신(Thioredoxin) 중 하나 이상으로부터 선택된다.
일 실시 양태에서, 오염 숙주 단백질의 물리적 특성은 아미노산 태그를 C-말단 또는 N-말단에 부가함으로써 변경된다. 바람직한 실시 양태에서, 변경되는 물리적 특성은 등전점이며, 아미노산 태그는 C-말단에 부착되는 폴리아스파르트산 태그이다. 일 실시 양태에서, 상기 태그의 부가에 의해 변경되는 이. 콜라이 단백질은 디펩티드 결합 단백질(DppA), 말토스 결합 단백질(MBP), 티오레독신 및 포스페이트 결합 단백질(PhoS/PstS)이다. 구체적인 일 실시 양태에서, 이. 콜라이 포스페이트 결합 단백질(PhoS/PstS)의 pI는 6개의 아스파르트산 잔기를 포함하는 폴리아스파르트산 태그(폴리D)를 C-말단에 부가함으로써 7.2로부터 5.1까지 감소된다.
또한 바람직한 것은 오염 이. 콜라이 단백질의 특정 잔기를 그의 물리적 특성이 변경되도록 변형시키는 것이며, 이는 단독으로 또는 N 또는 C 말단 태그의 부가와 조합하여 그렇게 한다. 이러한 변화는 단백질의 크기 또는 아미노산 치환을 변경시켜서 pI 또는 소수성을 변경시키기 위한 삽입 또는 결실을 포함할 수 있다. 일 실시 양태에서, 이들 잔기는 단백질의 표면 상에 위치한다. 바람직한 실시 양태에서, PhoS 단백질의 표면 잔기는 단백질의 pI를 감소시키기 위하여 변경된다. 바람직하게는, 포스페이트 결합에 중요한 것으로 시사된 잔기(바스(Bass), 미국 특허 제5,304,472호)는 기능성 PhoS 단백질을 유지하기 위하여 회피된다. 바람직하게는, 단백질의 표면 밖으로 멀리 돌출된 또는 염기성 잔기의 큰 기 내에 또는 그 가까이에 있는 라이신 잔기 가 표적화된다. 일 실시 양태에서, PhoS 단백질은 헥사 폴리아스파르트산 태그가 C-말단에 부착된 것을 갖는 반면, 상기 분자의 반대쪽 말단의 표면 잔기는 치환용으로 표적화된다. 바람직하게는 선택된 라이신 잔기는, 중성 잔기를 산성인 것으로 변화시킬 때보다 더욱 큰 잠재적 pI 변화를 부여하기 위하여 글루탐산 또는 아스파르트산으로 치환된다. 본원에서 치환 돌연변이체의 표기는 문자, 이어서 숫자, 이어서 문자로 이루어진다. 제1 문자는 야생형 단백질 중의 아미노산을 표기한다. 숫자는 아미노산 치환이 이루어지고 있는 아미노산 위치를 나타내며, 제2 문자는 야생형 아미노산의 대체에 사용되는 아미노산을 표기한다. 본 발명에서 PhoS의 바람직한 돌연변이에서, 라이신 잔기(K) 275, 107, 109, 110, 262, 265, 266, 309, 313은 단일 돌연변이 또는 조합된 돌연변이로서 글루탐산(E) 또는 글루타민(Q)으로 치환되며, 게다가, 라이신(K)318은 단일 돌연변이 또는 조합된 돌연변이로서 아스파르트산(D)으로 치환될 수 있다. 바람직하게는 단일 돌연변이로는 K262E, K265E 및 K266E가 있다. 바람직하게는 조합된 돌연변이로는 K265/266E 및 K110/265/266E가 있다. 더 바람직하게는, 모든 돌연변이는 C-말단에 부착된 폴리아스파르트산(폴리D), 및 임의로 또한 K318D 치환과 조합된다. 바람직한 실시 양태에서, 돌연변이는 pI를 2 이상의 단위로 감소시킨다. 바람직하게는, 본 발명의 돌연변이는 PhoS의 pI를 7.2로부터 약 4 내지 약 5.5까지 감소시킨다. 본 발명의 일 실시 양태에서, 이. 콜라이의 PhoS 단백질의 pI는 각각 돌연변이 폴리D K318D, 폴리D K265/266E 및 폴리D K110/265/266E를 이용하여 7.2로부터 약 4.9까지, 약 4.8까지 그리고 약 4.5까지 감소된다.
관심의 단백질을 코딩하는 폴리뉴클레오티드는 또 다른 폴리펩티드, 바람직하게는 신호 서열 또는 성숙 폴리펩티드의 N-말단에 특이적 절단 부위를 갖는 다른 폴리펩티드와의 융합물로서 발현될 수 있다. 선택된 이종성 신호 서열은 숙주 세포에 의해 인식되고 프로세싱되는 것이어야 한다. 천연 또는 진핵 폴리펩티드 신호 서열을 인식하지 못하고 프로세싱하지 못하는 원핵 숙주 세포에 있어서, 신호 서열은 원핵 신호 서열에 의해 치환된다. 적합한 신호 서열은 OmpA, PhoA, LamB, PelB, DsbA 및 DsbC를 포함한다.
상기에 열거된 성분들 중 하나 이상을 포함하는 적합한 벡터의 구성은 표준 라이게이션 기술을 이용한다. 단리된 플라스미드 또는 DNA 단편은 절단되고, 테일러링되고, 요구되는 플라스미드를 생성하는 데 요구되는 형태로 재라이게이션된다.
일 실시 양태에서, 전형적으로 관심의 하나 이상의 단백질을 코딩하는 하나 이상의 단백질 코딩 서열 및 하나 이상의 조절 발현 서열을 포함하는, 관심의 단백질을 코딩하는 폴리뉴클레오티드를 지니는 발현 카세트가 본 발명에서 이용된다. 상기 하나 이상의 조절 발현 서열은 프로모터를 포함할 수 있다. 상기 하나 이상의 조절 발현 서열은 또한 3' 비번역 영역, 예컨대 종결 서열을 포함할 수 있다. 적합한 프로모터는 하기에 더욱 상세하게 논의된다.
일 실시 양태에서, 본 발명에 따른 세포는 벡터, 예컨대 플라스미드를 포함한다. 벡터는 바람직하게는 상기에 정의된 발현 카세트들 중 하나 이상을 포함한다.
관심의 단백질이 중쇄 및 경쇄 둘 모두를 포함하는 항체인 실시 양태에서, 세포주는 2개의 벡터로 형질감염될 수 있는데, 제1 벡터는 경쇄 폴리펩티드를 코딩하고 제2 벡터는 중쇄 폴리펩티드를 코딩한다. 대안적으로, 단일 벡터가 사용될 수 있으며, 이 벡터는 경쇄 및 중쇄 폴리펩티드를 코딩하는 서열을 포함한다.
본 발명에서 사용하기 위한 벡터는 상기에 정의된 발현 카세트를 적합한 벡터 내에 삽입함으로써 제조될 수 있다. 대안적으로, 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열의 발현을 지시하기 위한 조절 발현 서열이 벡터 내에 함유될 수 있으며, 따라서, 상기 폴리뉴클레오티드의 코딩 영역만이 벡터를 완성하는 데 요구될 수 있다.
본 발명에 따른 폴리뉴클레오티드로 숙주 세포를 형질감염시키는 데 이용될 수 있는 벡터의 예는 하기를 포함한다: 플라스미드, 예컨대 pBR322 또는 pACYC184, 및/또는 바이러스 벡터, 예컨대 박테리아 파지, 전치 유전 요소, 예컨대 트랜스포존.
많은 형태의 발현 벡터가 이용가능하다. 이러한 벡터는 일반적으로 플라스미드의 DNA 복제 기점, 항생제 선발가능 마커, 프로모터 및 전사 종결자 - 다중 클로닝 부위(발현 카세트)에 의해 분리됨 - 및 리보좀 결합 부위를 코딩하는 DNA 서열을 포함한다.
본 발명에서 이용되는 프로모터는 관련 폴리뉴클레오티드에 직접적으로 연결되거나 대안적으로는 적절한 위치에, 예를 들어 관련 폴리펩티드가 삽입될 때 관련 프로모터가 상기 관련 폴리뉴클레오티드에 작용할 수 있도록 하는 벡터 내에 위치할 수 있다. 일 실시 양태에서, 프로모터는 이것이 작용하는 폴리뉴클레오티드의 코딩 부분 앞에 위치하며, 예를 들어, 폴리뉴클레오티드의 각각의 코딩 부분 앞에 관련 프로모터가 위치한다. 본원에서 사용될 때, "앞에"라는 것은 코딩 폴리뉴클레오티드 부분과 관련하여 5' 말단에 프로모터가 위치함을 암시하는 것으로 의도된다.
프로모터는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 프로모터는 lac, tac, trp, phoA, Ipp, Arab, tet 및 T7을 포함한다.
이용되는 하나 이상의 프로모터는 유도성 프로모터일 수 있다.
박테리아 시스템에서 사용하기 위한 발현 단위는 또한 일반적으로 샤인 달가노(S.D.) 리보좀 서열이 관심의 폴리펩티드를 코딩하는 DNA에 작동가능하게 연결된 것을 포함한다.
바람직하게는 발현 벡터는 항체 또는 이의 항원 결합 단편을 생성하기 위한 2시스트론 메시지를 또한 포함하며, 이는 국제 특허 공개 제WO03/048208호 또는 국제 특허 공개 제WO2007/039714호에 기술된 바와 같다(이의 내용은 본원에 참고로 포함됨). 바람직하게는, 상류 시스트론은 항체의 경쇄를 코딩하는 DNA를 함유하며, 하류 시스트론은 상응하는 중쇄를 코딩하는 DNA를 함유하고, 2시스트론형 유전자간 서열(IGS)은 바람직하게는 IGS1(서열 번호 38), IGS2 (서열 번호 39), IGS3 (서열 번호 40) 및 IGS4(서열 번호 41)로부터 선택되는 서열을 포함한다.
종결자는 숙주 세포에 대하여 내인성 또는 외인성일 수 있다. 적합한 종결자는 rrnB이다.
프로모터 및 종결자를 포함하는 추가의 적합한 전사 조절자 및 단백질 표적화 방법이 문헌["Strategies for Achieving High-Level Expression of Genes in Escherichia coli" Savvas C. Makrides, Microbiological Reviews, Sept 1996, p 512-538]에서 발견될 수 있다.
항체 분자는 적합한 신호 서열에 의해 세포로부터 분비되거나 주변 세포질로 표적화될 수 있다. 대안적으로, 항체 분자는 세포의 세포질 내에 축적될 수 있다. 바람직하게는, 항체 분자는 주변 세포질로 표적화된다.
폴리뉴클레오티드와 관련하여 본원에 기술된 본 발명의 실시 양태는, 본 발명의 대안적인 실시 양태, 예를 들어, 본원에서 이용된 성분을 포함하는 숙주 세포, 발현 카세트 및/또는 벡터에 동일하게 적용되는데, 이는 관련 측면이 상기에 적용될 수 있는 한 그러하다.
본 발명은 또한, 본 발명의 제1 또는 제2 측면에서 상기에 기술된 바와 같이 재조합 그람 음성 박테리아 세포에서 관심의 재조합 단백질을 발현시키는 단계를 포함하는, 관심의 재조합 단백질을 제조하는 방법을 제공한다.
본 발명의 방법에서 바람직하게 이용되는 관심의 단백질 및 그람 음성 박테리아 세포는 상기에 상세하게 기술되어 있다.
관심의 단백질을 코딩하는 폴리뉴클레오티드가 외인성일 때, 폴리뉴클레오티드는 당업계에 공지된 임의의 적합한 수단을 이용하여 숙주 세포 내에 포함될 수 있다. 전형적으로, 폴리뉴클레오티드는 세포를 형질전환시키는 발현 벡터의 일부로서 포함된다. 따라서, 일 측면에서, 본 발명에 따른 세포는 관심의 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 발현 카세트를 포함한다.
표준 기술을 이용하여, 예를 들어 염화루비듐, PEG 또는 전기천공을 이용하여 세포를 폴리뉴클레오티드 서열로 형질전환시킬 수 있다.
또한 본 발명에 따른 방법은 관심의 단백질을 코딩하는 폴리뉴클레오티드로 성공적으로 형질전환된 안정한 세포의 선발을 용이하게 하기 위하여 선발 시스템을 이용할 수 있다. 선발 시스템은 전형적으로, 선발 마커를 코딩하는 폴리뉴클레오티드 서열의 동시 형질전환을 이용한다. 일 실시 양태에서, 세포를 형질전환시키는 각각의 폴리뉴클레오티드는 하나 이상의 선발 마커를 코딩하는 폴리뉴클레오티드 서열을 추가로 포함한다. 따라서, 관심의 단백질을 코딩하는 폴리뉴클레오티드 및 마커를 코딩하는 상기 하나 이상의 폴리뉴클레오티드의 형질전환은 함께 일어나며, 선발 시스템은 요망되는 단백질을 생성하는 세포를 선발하는 데 이용될 수 있다.
상기 하나 이상의 마커를 발현할 수 있는 세포는 특정한 인공적 부과 조건 하에서, 예를 들어 독소 또는 항생제의 첨가 하에서 생존/성장/증대가 가능하며, 그 이유는 그 안에 포함된 선발 시스템의 폴리펩티드/유전자 또는 폴리펩티드 성분에 의해 부여되는 특성(예를 들어, 항생제 내성) 때문이다. 상기 하나 이상의 마커를 발현할 수 없는 세포는 인공적 부과 조건에서 생존/성장/증대가 가능하지 않다. 인공적 부과 조건은 요구될 경우, 다소 격렬하도록 선택될 수 있다.
임의의 적합한 선발 시스템이 본 발명에서 이용될 수 있다. 전형적으로, 선발 시스템은 공지된 항생제에 대한 내성을 제공하는 하나 이상의 유전자, 예를 들어 테트라사이클린, 클로람페니콜, 카나마이신 또는 암피실린 내성 유전자를 벡터 내에 포함시키는 것을 기반으로 할 수 있다. 관련 항생제의 존재 하에 성장하는 세포는, 상기 세포가 항생제에 대한 내성을 제공하는 유전자 및 요망되는 단백질 둘 모두를 발현함에 따라 선발될 수 있다.
일 실시 양태에서, 본 발명에 따른 방법은 형질전환된 세포를 배지 중에서 배양함으로써 관심의 단백질을 발현시키는 단계를 추가로 포함한다.
유도성 발현 시스템 또는 구성적(constitutive) 프로모터를 본 발명에서 사용하여 관심의 단백질을 발현시킬 수 있다. 적합한 유도성 발현 시스템 및 구성적 프로모터는 당업계에 공지되어 있다.
임의의 적합한 배지를 사용하여 형질전환 세포를 배양할 수 있다. 배지는 특정한 선발 시스템용으로 개조될 수 있으며, 예를 들어 배지는 성공적으로 형질전환된 세포만이 배지 중에서 성장시키기 위하여 항생제를 포함할 수 있다.
배지로부터 수득된 세포는 요구될 경우 추가로 스크리닝되고/되거나 정제될 수 있다. 본 방법은 요구될 경우, 관심의 단백질을 추출 및 정제하는 하나 이상의 단계를 추가로 포함할 수 있다.
폴리펩티드는 세포질, 주변 세포질 또는 상청액으로부터 회수되는 것을 비롯하여, 균주로부터 회수될 수 있다.
일 실시 양태에서, 항체는 주변 세포질로부터 단리된다.
일 실시 양태에서, 유도 후 공급량은 5 내지 7.5 g/h의 범위, 예컨대 약 7 g/h이다.
단백질 정제에 사용되는 특정한 방법(들)은 단백질의 유형에 따라 달라진다. 적합한 방법은 면역 친화성 또는 이온 교환 컬럼에서의 분획화; 에탄올 침전; 역상 HPLC; 소수성 상호작용 크로마토그래피; 실리카에서의 크로마토그래피; 이온 교환 수지, 예컨대 S-세파로스(SEPHAROSE) 및 DEAE에서의 크로마토그래피; 크로마토포커싱(chromatofocusing); 황산암모늄 침전; 및 겔 여과를 포함한다.
적합하게는 항체는 예를 들어 단백질 A-세파로스, 단백질 G 크로마토그래피, 단백질 L 크로마토그래피, 티오필릭(thiophilic), 혼합 모드 수지, His 태그, FLAGTag, 히드록실아파타이트 크로마토그래피, 겔 전기영동, 투석, 친화성 크로마토그래피, 황산암모늄, 에탄올 또는 PEG 분획화/침전, 이온 교환 막, 확장 층 흡착 크로마토그래피(expanded bed adsorption chromatography; EBA) 또는 시뮬레이션 이동 층 크로마토그래피와 같은 통상적인 항체 정제 절차에 의해 배양 배지 및/또는 세포질 추출물 및/또는 주변 세포질 추출물로부터 분리될 수 있다.
또한 본 방법은 관심의 단백질의 발현량을 측정하고 높은 발현 수준의 관심의 단백질을 갖는 세포를 선발하는 추가의 단계를 포함할 수 있다.
또한 본 방법은 관심의 단백질, 예컨대 항체 또는 항체 단편의 페길화와 같은 하나 이상의 추가의 하류 프로세싱 단계를 포함할 수 있다.
본원에 기술된 하나 이상의 방법 단계들은 적합한 용기, 예컨대 생물반응기에서 조합되어 수행될 수 있다.
본 발명에 따른 항체 및 단편은 치료 또는 예방에서 이용될 수 있다.
기술적으로 적절할 경우 본 발명의 실시 양태들은 조합될 수 있다. 실시 양태는 특정한 특징/요소를 포함하는 것으로 본원에 기술된다. 또한 본 발명은 상기 특징/요소로 이루어지거나 실질적으로 이루어진 개별 실시 양태들까지 연장된다. 본원의 기술적 참고 문헌, 예컨대 특허 및 특허 출원은 본원에 참고로 포함된다.
본 발명은 하기 실시예에서 단지 에시로서 추가로 기술되는데, 실시예는 첨부된 도면을 참조한다.
실시예
실시예
1: 세포주의 생성
MXE016 및 MXE017은 국제 특허 공개 제WO2011/086136호에 제시되어 있다.
항-FcRn Fab' 발현용 플라스미드 및 FkpA를 포함하는 항-FcRn Fab', skp를 포함하는 항-FcRn Fab' 및 FkpA와 skp 둘 모두를 포함하는 항-FcRn Fab 발현용 플라스미드의 생성
항-FcRn Fabdml 중쇄 및 경쇄 서열(각각 서열 번호 63 및 55) 둘 모두를 포함하는 플라스미드를 구성하였다. 문헌[Sambrook et al 1989, Molecular cloning: a laboratory manual. CSHL press, N.Y.]에서 발견될 수 있는 통상적인 제한효소 클로닝 방법을 이용하여 플라스미드 pTTOD 1519.g57 Fab'를 구성하였다. 플라스미드 pTTOD 1519.g57 Fab'는 하기 특징을 포함하였다: 강력한 tac 프로모터 및 lac 오퍼레이터 서열. 상기 플라스미드는 Fab' 중쇄의 코딩 영역 후에 독특한 EcoRI 제한 부위, 이어서 강력한 리보좀 결합 부위를 포함하는 비코딩 서열 및 그 후 독특한 NdeI 제한 부위를 포함하였다.
Fab 경쇄, 중쇄 유전자를 단일 폴리시스트론 메시지로서 전사시켰다. 이. 콜라이 OmpA 단백질로부터의 신호 펩티드를 코딩하는 DNA를 경쇄 및 중쇄 유전자 서열 둘 모두의 5' 말단에 융합시켰는데, 이는 상기 폴리펩티드의 이. 콜라이 주변 세포질로의 전좌를 지시하였다. 이중 전사 종결자 rrnB t1t2를 사용하여 전사를 종결시켰다. lacIq 유전자는 구성적으로 발현되는 Lac I 리프레서 단백질을 코딩하였다. 이는 알로락토스 또는 IPTG의 존재에 의해 탈억제가 유도될 때까지 tac 프로모터로부터의 전사를 억제하였다. 사용한 복제 기점은 p15A였으며, 이는 낮은 카피수(copy number)를 유지하였다. 상기 플라스미드는 항생제 선발을 위하여 테트라사이클린 내성 유전자를 포함하였다.
항-FcRn Fab 및 FkpA(주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' FkpA는 EcoRI 및 NdeI 부위를 이용하여 pTTOD 1519.g57 Fab'의 Fab' 서열의 3' 말단에 FkpA를 라이게이션시킴으로써 구성하였다(도 7d 참조). FkpA(서열 번호 30)를 2개의 Puv II 부위, 1개의 SfuI 부위, 1개의 BamHI 부위 및 1개의 EcoRI이 제거되도록 합성에 의해 구성하여서, 새로운 구성물이 5' EcoRI 부위, 이어서 강력한 리보좀 결합 부위, 이어서 FkpA의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 및 마지막으로 강력한 리보좀 결합 부위, 이어서 비코딩 NdeI 부위를 코딩하게 하였다. EcoRI-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 3개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄 및 FkpA가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.
항-FcRn Fab 및 Skp(주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' Skp는 EcoRI 및 NdeI 부위를 이용하여 플라스미드 pTTOD 1519.g57 Fab'의 Fab' 서열의 3' 말단에 skp를 라이게이션시킴으로써 구성하였다. skp(서열 번호 34)를 4개의 Pst I 부위 및 1개의 EcoR V 부위가 제거되도록 합성에 의해 구성하여서, 새로운 구성물이 5' EcoRI 부위, 이어서 강력한 리보좀 결합 부위, 이어서 Skp의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 및 마지막으로 강력한 리보좀 결합 부위, 이어서 비코딩 NdeI 부위를 코딩하게 하였다. EcoRI-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 3개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄 및 skp가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.
항-FcRn Fab, FkpA 및 Skp(둘 모두 주변 세포질 폴리펩티드)용 발현 벡터인 플라스미드 pTTOD 1519.g57 Fab' FkpA Skp는 NdeI 부위를 이용하여 FkpA 서열의 3' 말단에서, Skp를 플라스미드 pTTOD 1519.g57 Fab' FkpA 내로 라이게이션시킴으로써 구성하였다. Skp(서열 번호 34)를 4개의 Pst I 부위 및 1개의 EcoR V 부위가 제거되도록 합성에 의해 구성하여서, 구성물이 skp의 천연 개시 코돈, 신호 서열 및 성숙 서열 - 이는 C-말단 His 태그로 끝남 - 을 포함하는 5' Ase I 부위 및 마지막으로 비코딩 NdeI 부위를 코딩하게 하였다. Ase I-NdeI 제한효소 단편을 제한효소 처리하여 발현 벡터 내에 라이게이션하여서, 모든 4개의 폴리펩티드, 즉, Fab' 경쇄, Fab' 중쇄, FkpA 및 Skp가 단일 폴리시스트론 mRNA 상에 코딩되게 하였다.
이. 콜라이 W3110, MXE012(이. 콜라이 W3110 spr H145A), MXE016(이. 콜라이 W3110 ΔTsp, spr C94A) 및 MXE017(이. 콜라이 W3110 ΔTsp, spr H145A)에서의 pTTOD 1519.g57 Fab', pTTOD 1519.g57 Fab' FkpA, pTTOD 1519.g57 Fab' Skp 및 pTTOD 1519.g57 Fab' FkpA skp의 발효
이. 콜라이 균주 W3110, MXE012, MXE016 및 MXE017을 실시예 1에서 생성한 플라스미드 pTTOD 1519.g57 Fab', pTTOD 1519.g57 Fab' FkpA, pTTOD 1519.g57 Fab' Skp 및 pTTOD 1519.g57 Fab' FkpA skp로 형질전환시켰다. 상기 균주들의 형질전환은 문헌[Chung C.T et al Transformation and storage of bacterial cells in the same solution. PNAS 86:2172-2175 (1989)]에서 발견되는 방법을 이용하여 실시하였다. 이들 형질전환된 균주를 발효에 의해 발현에 대하여 테스트하였다.
실시예 2: Fab' 발현에 대한 샤페론의 영향: 도 1에 나타낸 균주를 1 L 및 2.5 L 발효 실험에서 테스트하여 Fab'의 발현을 비교하였다.
성장 배지, 접종 및 발효 단계. 발효 공정은 세포 은행의 바이알로부터 접종물을 준비하고, 몇몇 사전 배양 단계(플라스크 및 반응기)를 통하여 증폭시킨 후 생산 발효기에 접종함으로써 개시하였다. 생산 발효기에서, 세포를 규정 배지에서 배치식 및 유가식으로 고밀도로 성장시켰다. 요망되는 세포 밀도에 도달했을 때, Fab'의 발현을 IPTG의 첨가에 의해 유도하였다. Fab' 발현은 이. 콜라이 주변 세포질 공간으로 표적화되는데, 여기서 Fab'는 유도기의 코스 내내 축적된다. 탄소원 공급물을 유도기 동안 적용하여 발현 및 세포 성장을 제어하였다. 온도, 용존 산소(pO2) 및 pH를 제어하여 배양을 최적 배양 조건 내에서 유지하였다.
바이오매스 ( biomass ) 농도 및 성장 속도의 측정. 바이오매스를 600 nm에서의 배양물의 광학 밀도의 측정에 의해 결정하였다.
주변 세포질 추출. 세포를 원심분리에 의해 배양 샘플로부터 수집하였다. 상청액 분획물을 추가의 분석용으로 보유하였다(-20℃). 세포 펠렛 분획물을 추출 완충제(100 mM 트리스(Tris)-HCl, 10 mM EDTA; pH 7.4) 중에 원래 배양 부피로 재현탁하였다. 60℃에서 대략 10 내지 12시간 동안 인큐베이션한 후, 추출물을 원심분리에 의해 청징화하고, 상청액 분획물을 신선하게 사용하거나 분석용으로 보유하였다(-20℃).
Fab' 정량화. 주변 세포질 추출물 및 배양 상청액 중 Fab'의 농도를 단백질 G HPLC를 이용하여 측정하였다. 하이트랩(HiTrap) 단백질-G HP 1 ml 컬럼(지이-헬스케어(GE-Healthcare), 또는 등가물)에 2 ml/min으로 분석물을 로딩하고(대략 중성 pH, 30℃, 0.2 ㎛ 여과), 컬럼을 20 mM 포스페이트, 50 mM NaCl(pH 7.4)로 세척하고, 그 후, Fab'를 50 mM 글리신/HCl(pH 2.7)의 주입을 이용하여 용출시켰다. 용출된 Fab'를 애질런트(Agilent) 1100 또는 1200 HPLC 시스템에서 A280에 의해 측정하고, 공지된 농도의 정제된 Fab' 단백질의 표준 곡선을 참고로 하여 정량화하였다.
도 1은 숙주 세포와 "샤페론"의 다양한 조합을 이용하여 수행한 5 L 규모의 46가지의 발효의 결과를 나타낸다. W3110은 야생형 이. 콜라이 균주이다. 다양한 조합은 다음과 같았다: 샤페론을 포함하지 않는 야생형, FkpA 및 Skp를 포함하는 야생형, 국제 특허 공개 제WO2011/086136호에 공개된 MXE016 돌연변이 spr 및 Δ Tsp, MXE016 및 FkpA, MXE016 및 Skp, MXE016 및 FkpA 및 Skp, 국제 특허 공개 제WO2011/086136호에 개시된 MXE017, MXE017 및 FkpA 및 Skp.
그 결과는, MXE016, MXE016 및 FkpA, MXE016 및 FkpA 및 Skp, 및 MXE017 및 FkpA 및 Skp가 최상의 발현 수준을 보여 주었음을 나타낸다.
실시예
3: 유도 후 공급량의 영향
3가지의 상이한 유도 후 공급량, 5.4, 6.0 및 7.0 g/h의 영향을 MXE016 및 MXE016 + FkpA에서 테스트하였다.
성장 배지, 접종 및 발효 단계. 발효 공정은 세포 은행의 바이알로부터 접종물을 준비하고, 몇몇 사전 배양 단계(플라스크 및 반응기)를 통하여 증폭시킨 후 생산 발효기에 접종함으로써 개시하였다. 생산 발효기에서, 세포를 규정 배지에서 배치식 및 유가식으로 고밀도로 성장시켰다. 요망되는 세포 밀도에 도달했을 때, Fab'의 발현을 IPTG의 첨가에 의해 유도하였다. Fab' 발현은 이. 콜라이 주변 세포질 공간으로 표적화되는데, 여기서 Fab'는 유도기의 코스 내내 축적된다. 탄소원 공급물을 유도기 동안 적용하여 발현 및 세포 성장을 제어하였는데, 이 실험에서, 공급량을 3가지의 개별 설정점으로 설정하였다(도면에 예시되어 있음). 온도, 용존 산소(pO2) 및 pH를 제어하여 배양을 최적 배양 조건 내에서 유지하였다.
도 2는 샤페론을 발현하지 않는 플라스미드 또는 FkpA를 발현하는 플라스미드로 형질전환시킨 균주 MXE016을 나타낸다. 도 2는 FkpA를 포함하거나 포함하지 않는 경우, Fab'의 생성 및 주변 세포질에서의 보유에 대한 유도 후 공급량의 증가의 영향을 나타낸다. 상기 데이터는, FkpA의 발현 없이 공급량을 증가시킬 경우, 생성된 추가의 Fab'는 상청액 쪽으로 손실됨을 나타낸다. 이는 FkpA의 발현에서는 그렇지 않은데, 여기서, 더욱 높은 공급량에서 생성된 추가의 Fab'는 주변 세포질 내에 보유되어서 더욱 높은 역가를 생성한다.
실시예
4: 수율 및 세포
생존율의
분석
도 3a 및 도 3b는 20 L 규모에서, 샤페론을 발현하지 않는 플라스미드 또는 FkpA를 발현하는 플라스미드로 형질전환시킨 MXE016에서 세포 생존율 및 Fab' 역가에 대한 영향을 나타낸다. 도 3a는 FkpA가 존재하지 않을 경우 세포 생존율이 더욱 낮음을 나타낸다. 도 3b는 Fab' 역가가 MXE016 + FkpA의 경우 더욱 높고 덜 가변적이었음을 나타낸다.
도 4는 일차 Fab 생성물 회수 후 MXE016+FkpA에서의 더욱 높은 역가가 30% 더 많은 Fab'로 이어짐을 나타낸다.
도 5 및 도 6은 샤페론을 포함하지 않는 MXE016 및 FkpA 발현이 있는 MXE016의 일차 회수에 의한 샘플의 SDS-PAGE 및 항-his-태그 웨스턴 블롯(western blot)을 나타낸다.
샘플을 Fab' 농도에 따라 로딩하였으며, 이때 레인당 1 □g의 Fab'를 로딩하였다. 겔은 4-20% 트리스-글리신 노벡스(Novex)였으며, 비환원 조건 하에서 125 V에서 2시간 동안 러닝시켰다(run). 겔을 사이프로 루비(Sypro Ruby) 염료로 염색시키고, 영상화하였다. 웨스턴 블롯을 인비트로겐(Invitrogen) 아이블롯(iBlot) 시스템을 이용하여 PVDF 막으로 옮기고, 그 후 1% 카제인 용액으로 차단시켰다. 그 후, 상기 막을 항-his HRP 콘쥬게이트 항체(노바젠(Novagen))로 프로빙하였다. 그 후, 상기 블롯을 ECL 용액으로 현상시키고, 애머샴 라이프 사이언시즈 하이퍼프로세서(Amersham Life Sciences HyperProcesser)를 이용하여 영상화하였다.
본 발명을 바람직한 실시 양태를 참고로 하여 구체적으로 예시하고 기술하였지만, 당업계의 숙련자라면, 첨부된 특허청구범위에 의해 정의된 본 발명의 범주로부터 벗어나지 않고서 형태 및 상세 사항에서의 다양한 변화가 이루어질 수 있음을 이해할 것이다.
SEQUENCE LISTING
<110> UCB Pharma S.A
<120> Recombinant Bacterial Host Cell for Protein Expression
<130> G0164-WO
<150> GB1208367.1
<151> 2012-05-14
<160> 82
<170> PatentIn version 3.5
<210> 1
<211> 2049
<212> DNA
<213> Escherichia coli
<400> 1
atgaacatgt tttttaggct taccgcgtta gctggcctgc ttgcaatagc aggccagacc 60
ttcgctgtag aagatatcac gcgtgctgat caaattccgg tattaaagga agagacgcag 120
catgcgacgg taagtgagcg cgtaacgtcg cgcttcaccc gttctcatta tcgccagttc 180
gacctcgatc aggcattttc ggccaaaatc tttgaccgct acctgaatct gctcgattac 240
agccacaacg tgctgctggc aagcgatgtt gaacagttcg cgaaaaagaa aaccgagtta 300
ggcgatgaac tgcgttcagg caaactcgac gttttctacg atctctacaa tctggcgcaa 360
aagcgccgtt ttgagcgtta ccagtacgct ttgtcggtac tggaaaagcc gatggatttc 420
accggcaacg acacttataa ccttgaccgc agcaaagcgc cctggccgaa aaacgaggct 480
gagttgaacg cgctgtggga cagtaaagtc aaattcgacg agttaagcct gaagctgaca 540
ggaaaaacgg ataaagaaat tcgtgaaacc ctgactcgcc gctacaaatt tgccattcgt 600
cgtctggcgc aaaccaacag cgaagatgtt ttctcgctgg caatgacggc gtttgcgcgt 660
gaaatcgacc cgcataccaa ctatctttcc ccgcgtaata ccgaacagtt caacactgaa 720
atgagtttgt cgctggaagg tattggcgca gtgctgcaaa tggatgatga ctacaccgtt 780
atcaattcga tggtggcagg tggtccggca gcgaagagta aagctatcag cgttggtgac 840
aaaattgtcg gtgttggtca aacaggcaag ccgatggttg acgtgattgg ctggcgtctt 900
gatgatgtgg ttgccttaat taaagggccg aagggcagta aagttcgtct ggaaatttta 960
cctgctggta aagggaccaa gacccgtact gtaacgttga cccgtgaacg tattcgtctc 1020
gaagaccgcg cggttaaaat gtcggtgaag accgtcggta aagagaaagt cggcgtgctg 1080
gatattccgg gcttctatgt gggtttgaca gacgatgtca aagtgcaact gcagaaactg 1140
gaaaaacaga atgtcagcag cgtcatcatc gacctgcgta gcaatggcgg tggggcgtta 1200
actgaagccg tatcgctctc cggtctgttt attcctgcgg gtcccattgt tcaggtccgc 1260
gataacaacg gcaaggttcg tgaagatagc gataccgacg gacaggtttt ctataaaggc 1320
ccgctggtgg tgctggttga ccgcttcagt gcttcggctt cagaaatctt tgccgcggca 1380
atgcaggatt acggtcgtgc gctggttgtg ggtgaaccga cgtttggtaa aggcaccgtt 1440
cagcaatacc gttcattgaa ccgtatttac gatcagatgt tacgtcctga atggccagcg 1500
ctgggttctg tgcagtacac gatccagaaa ttctatcgcg ttaacggcgg cagtacgcaa 1560
cgtaaaggcg taacgccaga catcatcatg ccgacgggta atgaagaaac ggaaacgggt 1620
gagaaattcg aagataacgc gctgccgtgg gatagcattg atgccgcgac ttatgtgaaa 1680
tcaggagatt taacggcctt tgaaccggag ctgctgaagg aacataatgc gcgtatcgcg 1740
aaagatcctg agttccagaa catcatgaag gatatcgcgc gcttcaacgc tatgaaggac 1800
aagcgcaata tcgtttctct gaattacgct gtgcgtgaga aagagaataa tgaagatgat 1860
gcgacgcgtc tggcgcgttt gaacgaacgc tttaaacgcg aaggtaaacc ggagttgaag 1920
aaactggatg atctaccgaa agattaccag gagccggatc cttatctgga tgagacggtg 1980
aatatcgcac tcgatctggc gaagcttgaa aaagccagac ccgcggaaca acccgctccc 2040
gtcaagtaa 2049
<210> 2
<211> 680
<212> PRT
<213> Escherichia coli
<400> 2
Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile Ala Gly
1 5 10 15
Gln Thr Phe Ala Val Glu Asp Ile Thr Arg Ala Asp Gln Ile Pro Val
20 25 30
Leu Lys Glu Glu Thr Gln His Ala Thr Val Ser Glu Arg Val Thr Ser
35 40 45
Arg Phe Thr Arg Ser His Tyr Arg Gln Phe Asp Leu Asp Gln Ala Phe
50 55 60
Ser Ala Lys Ile Phe Asp Arg Tyr Leu Asn Leu Leu Asp Tyr Ser His
65 70 75 80
Asn Val Leu Leu Ala Ser Asp Val Glu Gln Phe Ala Lys Lys Lys Thr
85 90 95
Glu Leu Gly Asp Glu Leu Arg Ser Gly Lys Leu Asp Val Phe Tyr Asp
100 105 110
Leu Tyr Asn Leu Ala Gln Lys Arg Arg Phe Glu Arg Tyr Gln Tyr Ala
115 120 125
Leu Ser Val Leu Glu Lys Pro Met Asp Phe Thr Gly Asn Asp Thr Tyr
130 135 140
Asn Leu Asp Arg Ser Lys Ala Pro Trp Pro Lys Asn Glu Ala Glu Leu
145 150 155 160
Asn Ala Leu Trp Asp Ser Lys Val Lys Phe Asp Glu Leu Ser Leu Lys
165 170 175
Leu Thr Gly Lys Thr Asp Lys Glu Ile Arg Glu Thr Leu Thr Arg Arg
180 185 190
Tyr Lys Phe Ala Ile Arg Arg Leu Ala Gln Thr Asn Ser Glu Asp Val
195 200 205
Phe Ser Leu Ala Met Thr Ala Phe Ala Arg Glu Ile Asp Pro His Thr
210 215 220
Asn Tyr Leu Ser Pro Arg Asn Thr Glu Gln Phe Asn Thr Glu Met Ser
225 230 235 240
Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Met Asp Asp Asp Tyr
245 250 255
Thr Val Ile Asn Ser Met Val Ala Gly Gly Pro Ala Ala Lys Ser Lys
260 265 270
Ala Ile Ser Val Gly Asp Lys Ile Val Gly Val Gly Gln Thr Gly Lys
275 280 285
Pro Met Val Asp Val Ile Gly Trp Arg Leu Asp Asp Val Val Ala Leu
290 295 300
Ile Lys Gly Pro Lys Gly Ser Lys Val Arg Leu Glu Ile Leu Pro Ala
305 310 315 320
Gly Lys Gly Thr Lys Thr Arg Thr Val Thr Leu Thr Arg Glu Arg Ile
325 330 335
Arg Leu Glu Asp Arg Ala Val Lys Met Ser Val Lys Thr Val Gly Lys
340 345 350
Glu Lys Val Gly Val Leu Asp Ile Pro Gly Phe Tyr Val Gly Leu Thr
355 360 365
Asp Asp Val Lys Val Gln Leu Gln Lys Leu Glu Lys Gln Asn Val Ser
370 375 380
Ser Val Ile Ile Asp Leu Arg Ser Asn Gly Gly Gly Ala Leu Thr Glu
385 390 395 400
Ala Val Ser Leu Ser Gly Leu Phe Ile Pro Ala Gly Pro Ile Val Gln
405 410 415
Val Arg Asp Asn Asn Gly Lys Val Arg Glu Asp Ser Asp Thr Asp Gly
420 425 430
Gln Val Phe Tyr Lys Gly Pro Leu Val Val Leu Val Asp Arg Phe Ser
435 440 445
Ala Ser Ala Ser Glu Ile Phe Ala Ala Ala Met Gln Asp Tyr Gly Arg
450 455 460
Ala Leu Val Val Gly Glu Pro Thr Phe Gly Lys Gly Thr Val Gln Gln
465 470 475 480
Tyr Arg Ser Leu Asn Arg Ile Tyr Asp Gln Met Leu Arg Pro Glu Trp
485 490 495
Pro Ala Leu Gly Ser Val Gln Tyr Thr Ile Gln Lys Phe Tyr Arg Val
500 505 510
Asn Gly Gly Ser Thr Gln Arg Lys Gly Val Thr Pro Asp Ile Ile Met
515 520 525
Pro Thr Gly Asn Glu Glu Thr Glu Thr Gly Glu Lys Phe Glu Asp Asn
530 535 540
Ala Leu Pro Trp Asp Ser Ile Asp Ala Ala Thr Tyr Val Lys Ser Gly
545 550 555 560
Asp Leu Thr Ala Phe Glu Pro Glu Leu Leu Lys Glu His Asn Ala Arg
565 570 575
Ile Ala Lys Asp Pro Glu Phe Gln Asn Ile Met Lys Asp Ile Ala Arg
580 585 590
Phe Asn Ala Met Lys Asp Lys Arg Asn Ile Val Ser Leu Asn Tyr Ala
595 600 605
Val Arg Glu Lys Glu Asn Asn Glu Asp Asp Ala Thr Arg Leu Ala Arg
610 615 620
Leu Asn Glu Arg Phe Lys Arg Glu Gly Lys Pro Glu Leu Lys Lys Leu
625 630 635 640
Asp Asp Leu Pro Lys Asp Tyr Gln Glu Pro Asp Pro Tyr Leu Asp Glu
645 650 655
Thr Val Asn Ile Ala Leu Asp Leu Ala Lys Leu Glu Lys Ala Arg Pro
660 665 670
Ala Glu Gln Pro Ala Pro Val Lys
675 680
<210> 3
<211> 2048
<212> DNA
<213> Artificial Sequence
<220>
<223> mutated knockout Tsp gene
<400> 3
atgaattcgt ttttaggctt accgcgttag ctggcctgct tgcaatagca ggccagacat 60
taattgtaga agatatcacg cgtgctgatc aaattccggt attaaaggaa gagacgcagc 120
atgcgacggt aagtgagcgc gtaacgtcgc gcttcacccg ttctcattat cgccagttcg 180
acctcgatca ggcattttcg gccaaaatct ttgaccgcta cctgaatctg ctcgattaca 240
gccacaacgt gctgctggca agcgatgttg aacagttcgc gaaaaagaaa accgagttag 300
gcgatgaact gcgttcaggc aaactcgacg ttttctacga tctctacaat ctggcgcaaa 360
agcgccgttt tgagcgttac cagtacgctt tgtcggtact ggaaaagccg atggatttca 420
ccggcaacga cacttataac cttgaccgca gcaaagcgcc ctggccgaaa aacgaggctg 480
agttgaacgc gctgtgggac agtaaagtca aattcgacga gttaagcctg aagctgacag 540
gaaaaacgga taaagaaatt cgtgaaaccc tgactcgccg ctacaaattt gccattcgtc 600
gtctggcgca aaccaacagc gaagatgttt tctcgctggc aatgacggcg tttgcgcgtg 660
aaatcgaccc gcataccaac tatctttccc cgcgtaatac cgaacagttc aacactgaaa 720
tgagtttgtc gctggaaggt attggcgcag tgctgcaaat ggatgatgac tacaccgtta 780
tcaattcgat ggtggcaggt ggtccggcag cgaagagtaa agctatcagc gttggtgaca 840
aaattgtcgg tgttggtcaa acaggcaagc cgatggttga cgtgattggc tggcgtcttg 900
atgatgtggt tgccttaatt aaagggccga agggcagtaa agttcgtctg gaaattttac 960
ctgctggtaa agggaccaag acccgtactg taacgttgac ccgtgaacgt attcgtctcg 1020
aagaccgcgc ggttaaaatg tcggtgaaga ccgtcggtaa agagaaagtc ggcgtgctgg 1080
atattccggg cttctatgtg ggtttgacag acgatgtcaa agtgcaactg cagaaactgg 1140
aaaaacagaa tgtcagcagc gtcatcatcg acctgcgtag caatggcggt ggggcgttaa 1200
ctgaagccgt atcgctctcc ggtctgttta ttcctgcggg tcccattgtt caggtccgcg 1260
ataacaacgg caaggttcgt gaagatagcg ataccgacgg acaggttttc tataaaggcc 1320
cgctggtggt gctggttgac cgcttcagtg cttcggcttc agaaatcttt gccgcggcaa 1380
tgcaggatta cggtcgtgcg ctggttgtgg gtgaaccgac gtttggtaaa ggcaccgttc 1440
agcaataccg ttcattgaac cgtatttacg atcagatgtt acgtcctgaa tggccagcgc 1500
tgggttctgt gcagtacacg atccagaaat tctatcgcgt taacggcggc agtacgcaac 1560
gtaaaggcgt aacgccagac atcatcatgc cgacgggtaa tgaagaaacg gaaacgggtg 1620
agaaattcga agataacgcg ctgccgtggg atagcattga tgccgcgact tatgtgaaat 1680
caggagattt aacggccttt gaaccggagc tgctgaagga acataatgcg cgtatcgcga 1740
aagatcctga gttccagaac atcatgaagg atatcgcgcg cttcaacgct atgaaggaca 1800
agcgcaatat cgtttctctg aattacgctg tgcgtgagaa agagaataat gaagatgatg 1860
cgacgcgtct ggcgcgtttg aacgaacgct ttaaacgcga aggtaaaccg gagttgaaga 1920
aactggatga tctaccgaaa gattaccagg agccggatcc ttatctggat gagacggtga 1980
atatcgcact cgatctggcg aagcttgaaa aagccagacc cgcggaacaa cccgctcccg 2040
tcaagtaa 2048
<210> 4
<211> 2889
<212> DNA
<213> Escherichia coli
<400> 4
atgccccgca gcacctggtt caaagcatta ttgttgttag ttgccctttg ggcaccctta 60
agtcaggcag aaacgggatg gcagccgatt caggaaacca tccgtaaaag tgataaagat 120
aaccgccagt atcaggctat acgtctggat aacggtatgg tggtcttgct ggtttctgat 180
ccgcaggcag ttaaatcgct ctcggcgctg gtggtgcccg ttgggtcgct ggaagatccc 240
gaggcgtacc aggggctggc acattacctt gaacatatga gtctgatggg gtcgaaaaag 300
tacccgcagg ctgacagtct ggccgaatat ctcaaaatgc acggcggtag tcacaatgcc 360
agcactgcgc cgtatcgcac ggctttctat ctggaagttg agaacgacgc cttgcctggt 420
gcggtagacc gcctggccga tgctattgct gaacctttgc tcgacaagaa atatgccgaa 480
cgtgagcgta atgcggtgaa cgctgaatta accatggcgc gtacgcgtga cgggatgcgc 540
atggcacagg tcagcgcaga aaccattaac ccggcacacc ccggttcaaa gttttctggt 600
ggtaacctcg aaactttaag cgacaaacct ggtaatccgg tgcagcaggc gctgaaagat 660
ttccacgaga agtactattc cgccaatttg atgaaggcgg ttatttacag taataaaccg 720
ctgccggagt tggcaaaaat ggcggcggac acctttggtc gcgtgccgaa caaagagagc 780
aaaaaaccgg aaatcaccgt gccggtagtc accgacgcgc aaaagggcat tatcattcat 840
tacgtccctg cgctgccgcg taaagtgttg cgcgttgagt ttcgcatcga taacaactca 900
gcgaagttcc gtagtaaaac cgatgaattg attacctatc tgattggcaa tcgcagccca 960
ggtacacttt ctgactggct gcaaaagcag ggattagttg agggcattag cgccaactcc 1020
gatcctatcg tcaacggcaa cagcggcgta ttagcgatct ctgcgtcttt aaccgataaa 1080
ggcctggcta atcgcgatca ggttgtggcg gcaattttta gctatctcaa tctgttacgt 1140
gaaaaaggca ttgataaaca atacttcgat gaactggcga atgtgctgga tatcgacttc 1200
cgttatccgt cgatcacccg tgatatggat tacgtcgaat ggctggcaga taccatgatt 1260
cgcgttcctg ttgagcatac gctggatgca gtcaatattg ccgatcggta cgatgctaaa 1320
gcagtaaagg aacgtctggc gatgatgacg ccgcagaatg cgcgtatctg gtatatcagc 1380
ccgaaagagc cgcacaacaa aacggcttac tttgtcgatg cgccgtatca ggtcgataaa 1440
atcagcgcac aaactttcgc cgactggcag aaaaaagccg ccgacattgc gctctctttg 1500
ccagagctta acccttatat tcctgatgat ttctcgctga ttaagtcaga gaagaaatac 1560
gaccatccag agctgattgt tgatgagtcg aatctgcgcg tggtgtatgc gccaagccgt 1620
tattttgcca gcgagcccaa agctgatgtc agcctgattt tgcgtaatcc gaaagccatg 1680
gacagcgccc gcaatcaggt gatgtttgcg ctcaatgatt atctcgcagg gctggcgctt 1740
gatcagttaa gcaaccaggc gtcggttggt ggcataagtt tttccaccaa cgctaacaac 1800
ggccttatgg ttaatgctaa tggttacacc cagcgtctgc cgcagctgtt ccaggcattg 1860
ctcgaggggt actttagcta taccgctacg gaagatcagc ttgagcaggc gaagtcctgg 1920
tataaccaga tgatggattc cgcagaaaag ggtaaagcgt ttgagcaggc gattatgccc 1980
gcgcagatgc tctcgcaagt gccgtacttc tcgcgagatg aacggcgtaa aattttgccc 2040
tccattacgt tgaaagaggt gctggcctat cgcgacgcct taaaatcagg ggctcgacca 2100
gagtttatgg ttatcggcaa catgaccgag gcccaggcaa caacgctggc acgcgatgtg 2160
caaaaacagt tgggcgctga tggttcagag tggtgtcgaa acaaagatgt agtggtcgat 2220
aaaaaacaat ccgtcatctt tgaaaaagcc ggtaacagca ccgactccgc actggcagcg 2280
gtatttgtac cgactggcta cgatgaatac accagctcag cctatagctc tctgttgggg 2340
cagatcgtac agccgtggtt ctacaatcag ttgcgtaccg aagaacaatt gggctatgcc 2400
gtgtttgcgt ttccaatgag cgtggggcgt cagtggggca tgggcttcct tttgcaaagc 2460
aatgataaac agccttcatt cttgtgggag cgttacaagg cgtttttccc aaccgcagag 2520
gcaaaattgc gagcgatgaa gccagatgag tttgcgcaaa tccagcaggc ggtaattacc 2580
cagatgctgc aggcaccgca aacgctcggc gaagaagcat cgaagttaag taaagatttc 2640
gatcgcggca atatgcgctt cgattcgcgt gataaaatcg tggcccagat aaaactgctg 2700
acgccgcaaa aacttgctga tttcttccat caggcggtgg tcgagccgca aggcatggct 2760
attctgtcgc agatttccgg cagccagaac gggaaagccg aatatgtaca ccctgaaggc 2820
tggaaagtgt gggagaacgt cagcgcgttg cagcaaacaa tgcccctgat gagtgaaaag 2880
aatgagtga 2889
<210> 5
<211> 962
<212> PRT
<213> Escherichia coli
<400> 5
Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu
1 5 10 15
Trp Ala Pro Leu Ser Gln Ala Glu Thr Gly Trp Gln Pro Ile Gln Glu
20 25 30
Thr Ile Arg Lys Ser Asp Lys Asp Asn Arg Gln Tyr Gln Ala Ile Arg
35 40 45
Leu Asp Asn Gly Met Val Val Leu Leu Val Ser Asp Pro Gln Ala Val
50 55 60
Lys Ser Leu Ser Ala Leu Val Val Pro Val Gly Ser Leu Glu Asp Pro
65 70 75 80
Glu Ala Tyr Gln Gly Leu Ala His Tyr Leu Glu His Met Ser Leu Met
85 90 95
Gly Ser Lys Lys Tyr Pro Gln Ala Asp Ser Leu Ala Glu Tyr Leu Lys
100 105 110
Met His Gly Gly Ser His Asn Ala Ser Thr Ala Pro Tyr Arg Thr Ala
115 120 125
Phe Tyr Leu Glu Val Glu Asn Asp Ala Leu Pro Gly Ala Val Asp Arg
130 135 140
Leu Ala Asp Ala Ile Ala Glu Pro Leu Leu Asp Lys Lys Tyr Ala Glu
145 150 155 160
Arg Glu Arg Asn Ala Val Asn Ala Glu Leu Thr Met Ala Arg Thr Arg
165 170 175
Asp Gly Met Arg Met Ala Gln Val Ser Ala Glu Thr Ile Asn Pro Ala
180 185 190
His Pro Gly Ser Lys Phe Ser Gly Gly Asn Leu Glu Thr Leu Ser Asp
195 200 205
Lys Pro Gly Asn Pro Val Gln Gln Ala Leu Lys Asp Phe His Glu Lys
210 215 220
Tyr Tyr Ser Ala Asn Leu Met Lys Ala Val Ile Tyr Ser Asn Lys Pro
225 230 235 240
Leu Pro Glu Leu Ala Lys Met Ala Ala Asp Thr Phe Gly Arg Val Pro
245 250 255
Asn Lys Glu Ser Lys Lys Pro Glu Ile Thr Val Pro Val Val Thr Asp
260 265 270
Ala Gln Lys Gly Ile Ile Ile His Tyr Val Pro Ala Leu Pro Arg Lys
275 280 285
Val Leu Arg Val Glu Phe Arg Ile Asp Asn Asn Ser Ala Lys Phe Arg
290 295 300
Ser Lys Thr Asp Glu Leu Ile Thr Tyr Leu Ile Gly Asn Arg Ser Pro
305 310 315 320
Gly Thr Leu Ser Asp Trp Leu Gln Lys Gln Gly Leu Val Glu Gly Ile
325 330 335
Ser Ala Asn Ser Asp Pro Ile Val Asn Gly Asn Ser Gly Val Leu Ala
340 345 350
Ile Ser Ala Ser Leu Thr Asp Lys Gly Leu Ala Asn Arg Asp Gln Val
355 360 365
Val Ala Ala Ile Phe Ser Tyr Leu Asn Leu Leu Arg Glu Lys Gly Ile
370 375 380
Asp Lys Gln Tyr Phe Asp Glu Leu Ala Asn Val Leu Asp Ile Asp Phe
385 390 395 400
Arg Tyr Pro Ser Ile Thr Arg Asp Met Asp Tyr Val Glu Trp Leu Ala
405 410 415
Asp Thr Met Ile Arg Val Pro Val Glu His Thr Leu Asp Ala Val Asn
420 425 430
Ile Ala Asp Arg Tyr Asp Ala Lys Ala Val Lys Glu Arg Leu Ala Met
435 440 445
Met Thr Pro Gln Asn Ala Arg Ile Trp Tyr Ile Ser Pro Lys Glu Pro
450 455 460
His Asn Lys Thr Ala Tyr Phe Val Asp Ala Pro Tyr Gln Val Asp Lys
465 470 475 480
Ile Ser Ala Gln Thr Phe Ala Asp Trp Gln Lys Lys Ala Ala Asp Ile
485 490 495
Ala Leu Ser Leu Pro Glu Leu Asn Pro Tyr Ile Pro Asp Asp Phe Ser
500 505 510
Leu Ile Lys Ser Glu Lys Lys Tyr Asp His Pro Glu Leu Ile Val Asp
515 520 525
Glu Ser Asn Leu Arg Val Val Tyr Ala Pro Ser Arg Tyr Phe Ala Ser
530 535 540
Glu Pro Lys Ala Asp Val Ser Leu Ile Leu Arg Asn Pro Lys Ala Met
545 550 555 560
Asp Ser Ala Arg Asn Gln Val Met Phe Ala Leu Asn Asp Tyr Leu Ala
565 570 575
Gly Leu Ala Leu Asp Gln Leu Ser Asn Gln Ala Ser Val Gly Gly Ile
580 585 590
Ser Phe Ser Thr Asn Ala Asn Asn Gly Leu Met Val Asn Ala Asn Gly
595 600 605
Tyr Thr Gln Arg Leu Pro Gln Leu Phe Gln Ala Leu Leu Glu Gly Tyr
610 615 620
Phe Ser Tyr Thr Ala Thr Glu Asp Gln Leu Glu Gln Ala Lys Ser Trp
625 630 635 640
Tyr Asn Gln Met Met Asp Ser Ala Glu Lys Gly Lys Ala Phe Glu Gln
645 650 655
Ala Ile Met Pro Ala Gln Met Leu Ser Gln Val Pro Tyr Phe Ser Arg
660 665 670
Asp Glu Arg Arg Lys Ile Leu Pro Ser Ile Thr Leu Lys Glu Val Leu
675 680 685
Ala Tyr Arg Asp Ala Leu Lys Ser Gly Ala Arg Pro Glu Phe Met Val
690 695 700
Ile Gly Asn Met Thr Glu Ala Gln Ala Thr Thr Leu Ala Arg Asp Val
705 710 715 720
Gln Lys Gln Leu Gly Ala Asp Gly Ser Glu Trp Cys Arg Asn Lys Asp
725 730 735
Val Val Val Asp Lys Lys Gln Ser Val Ile Phe Glu Lys Ala Gly Asn
740 745 750
Ser Thr Asp Ser Ala Leu Ala Ala Val Phe Val Pro Thr Gly Tyr Asp
755 760 765
Glu Tyr Thr Ser Ser Ala Tyr Ser Ser Leu Leu Gly Gln Ile Val Gln
770 775 780
Pro Trp Phe Tyr Asn Gln Leu Arg Thr Glu Glu Gln Leu Gly Tyr Ala
785 790 795 800
Val Phe Ala Phe Pro Met Ser Val Gly Arg Gln Trp Gly Met Gly Phe
805 810 815
Leu Leu Gln Ser Asn Asp Lys Gln Pro Ser Phe Leu Trp Glu Arg Tyr
820 825 830
Lys Ala Phe Phe Pro Thr Ala Glu Ala Lys Leu Arg Ala Met Lys Pro
835 840 845
Asp Glu Phe Ala Gln Ile Gln Gln Ala Val Ile Thr Gln Met Leu Gln
850 855 860
Ala Pro Gln Thr Leu Gly Glu Glu Ala Ser Lys Leu Ser Lys Asp Phe
865 870 875 880
Asp Arg Gly Asn Met Arg Phe Asp Ser Arg Asp Lys Ile Val Ala Gln
885 890 895
Ile Lys Leu Leu Thr Pro Gln Lys Leu Ala Asp Phe Phe His Gln Ala
900 905 910
Val Val Glu Pro Gln Gly Met Ala Ile Leu Ser Gln Ile Ser Gly Ser
915 920 925
Gln Asn Gly Lys Ala Glu Tyr Val His Pro Glu Gly Trp Lys Val Trp
930 935 940
Glu Asn Val Ser Ala Leu Gln Gln Thr Met Pro Leu Met Ser Glu Lys
945 950 955 960
Asn Glu
<210> 6
<211> 2889
<212> DNA
<213> Artificial Sequence
<220>
<223> mutated knockout Protease III gene
<400> 6
attccccgca gcacctggtt caaagcatta ttgttgttag ttgccctttg ggcacattaa 60
tgtcaggcag aaacgggatg gcagccgatt caggaaacca tccgtaaaag tgataaagat 120
aaccgccagt atcaggctat acgtctggat aacggtatgg tggtcttgct ggtttctgat 180
ccgcaggcag ttaaatcgct ctcggcgctg gtggtgcccg ttgggtcgct ggaagatccc 240
gaggcgtacc aggggctggc acattacctt gaacatatga gtctgatggg gtcgaaaaag 300
tacccgcagg ctgacagtct ggccgaatat ctcaaaatgc acggcggtag tcacaatgcc 360
agcactgcgc cgtatcgcac ggctttctat ctggaagttg agaacgacgc cttgcctggt 420
gcggtagacc gcctggccga tgctattgct gaacctttgc tcgacaagaa atatgccgaa 480
cgtgagcgta atgcggtgaa cgctgaatta accatggcgc gtacgcgtga cgggatgcgc 540
atggcacagg tcagcgcaga aaccattaac ccggcacacc ccggttcaaa gttttctggt 600
ggtaacctcg aaactttaag cgacaaacct ggtaatccgg tgcagcaggc gctgaaagat 660
ttccacgaga agtactattc cgccaatttg atgaaggcgg ttatttacag taataaaccg 720
ctgccggagt tggcaaaaat ggcggcggac acctttggtc gcgtgccgaa caaagagagc 780
aaaaaaccgg aaatcaccgt gccggtagtc accgacgcgc aaaagggcat tatcattcat 840
tacgtccctg cgctgccgcg taaagtgttg cgcgttgagt ttcgcatcga taacaactca 900
gcgaagttcc gtagtaaaac cgatgaattg attacctatc tgattggcaa tcgcagccca 960
ggtacacttt ctgactggct gcaaaagcag ggattagttg agggcattag cgccaactcc 1020
gatcctatcg tcaacggcaa cagcggcgta ttagcgatct ctgcgtcttt aaccgataaa 1080
ggcctggcta atcgcgatca ggttgtggcg gcaattttta gctatctcaa tctgttacgt 1140
gaaaaaggca ttgataaaca atacttcgat gaactggcga atgtgctgga tatcgacttc 1200
cgttatccgt cgatcacccg tgatatggat tacgtcgaat ggctggcaga taccatgatt 1260
cgcgttcctg ttgagcatac gctggatgca gtcaatattg ccgatcggta cgatgctaaa 1320
gcagtaaagg aacgtctggc gatgatgacg ccgcagaatg cgcgtatctg gtatatcagc 1380
ccgaaagagc cgcacaacaa aacggcttac tttgtcgatg cgccgtatca ggtcgataaa 1440
atcagcgcac aaactttcgc cgactggcag aaaaaagccg ccgacattgc gctctctttg 1500
ccagagctta acccttatat tcctgatgat ttctcgctga ttaagtcaga gaagaaatac 1560
gaccatccag agctgattgt tgatgagtcg aatctgcgcg tggtgtatgc gccaagccgt 1620
tattttgcca gcgagcccaa agctgatgtc agcctgattt tgcgtaatcc gaaagccatg 1680
gacagcgccc gcaatcaggt gatgtttgcg ctcaatgatt atctcgcagg gctggcgctt 1740
gatcagttaa gcaaccaggc gtcggttggt ggcataagtt tttccaccaa cgctaacaac 1800
ggccttatgg ttaatgctaa tggttacacc cagcgtctgc cgcagctgtt ccaggcattg 1860
ctcgaggggt actttagcta taccgctacg gaagatcagc ttgagcaggc gaagtcctgg 1920
tataaccaga tgatggattc cgcagaaaag ggtaaagcgt ttgagcaggc gattatgccc 1980
gcgcagatgc tctcgcaagt gccgtacttc tcgcgagatg aacggcgtaa aattttgccc 2040
tccattacgt tgaaagaggt gctggcctat cgcgacgcct taaaatcagg ggctcgacca 2100
gagtttatgg ttatcggcaa catgaccgag gcccaggcaa caacgctggc acgcgatgtg 2160
caaaaacagt tgggcgctga tggttcagag tggtgtcgaa acaaagatgt agtggtcgat 2220
aaaaaacaat ccgtcatctt tgaaaaagcc ggtaacagca ccgactccgc actggcagcg 2280
gtatttgtac cgactggcta cgatgaatac accagctcag cctatagctc tctgttgggg 2340
cagatcgtac agccgtggtt ctacaatcag ttgcgtaccg aagaacaatt gggctatgcc 2400
gtgtttgcgt ttccaatgag cgtggggcgt cagtggggca tgggcttcct tttgcaaagc 2460
aatgataaac agccttcatt cttgtgggag cgttacaagg cgtttttccc aaccgcagag 2520
gcaaaattgc gagcgatgaa gccagatgag tttgcgcaaa tccagcaggc ggtaattacc 2580
cagatgctgc aggcaccgca aacgctcggc gaagaagcat cgaagttaag taaagatttc 2640
gatcgcggca atatgcgctt cgattcgcgt gataaaatcg tggcccagat aaaactgctg 2700
acgccgcaaa aacttgctga tttcttccat caggcggtgg tcgagccgca aggcatggct 2760
attctgtcgc agatttccgg cagccagaac gggaaagccg aatatgtaca ccctgaaggc 2820
tggaaagtgt gggagaacgt cagcgcgttg cagcaaacaa tgcccctgat gagtgaaaag 2880
aatgagtga 2889
<210> 7
<211> 1425
<212> DNA
<213> Escherichia coli
<400> 7
atgaaaaaaa ccacattagc actgagtgca ctggctctga gtttaggttt ggcgttatct 60
ccgctctctg caacggcggc tgagacttct tcagcaacga cagcccagca gatgccaagc 120
cttgcaccga tgctcgaaaa ggtgatgcct tcagtggtca gcattaacgt agaaggtagc 180
acaaccgtta atacgccgcg tatgccgcgt aatttccagc agttcttcgg tgatgattct 240
ccgttctgcc aggaaggttc tccgttccag agctctccgt tctgccaggg tggccagggc 300
ggtaatggtg gcggccagca acagaaattc atggcgctgg gttccggcgt catcattgat 360
gccgataaag gctatgtcgt caccaacaac cacgttgttg ataacgcgac ggtcattaaa 420
gttcaactga gcgatggccg taagttcgac gcgaagatgg ttggcaaaga tccgcgctct 480
gatatcgcgc tgatccaaat ccagaacccg aaaaacctga ccgcaattaa gatggcggat 540
tctgatgcac tgcgcgtggg tgattacacc gtagcgattg gtaacccgtt tggtctgggc 600
gagacggtaa cttccgggat tgtctctgcg ctggggcgta gcggcctgaa tgccgaaaac 660
tacgaaaact tcatccagac cgatgcagcg atcaaccgtg gtaactccgg tggtgcgctg 720
gttaacctga acggcgaact gatcggtatc aacaccgcga tcctcgcacc ggacggcggc 780
aacatcggta tcggttttgc tatcccgagt aacatggtga aaaacctgac ctcgcagatg 840
gtggaatacg gccaggtgaa acgcggtgag ctgggtatta tggggactga gctgaactcc 900
gaactggcga aagcgatgaa agttgacgcc cagcgcggtg ctttcgtaag ccaggttctg 960
cctaattcct ccgctgcaaa agcgggcatt aaagcgggtg atgtgatcac ctcactgaac 1020
ggtaagccga tcagcagctt tgccgcactg cgtgctcagg tgggtactat gccggtaggc 1080
agcaaactga ccctgggctt actgcgcgac ggtaagcagg ttaacgtgaa cctggaactg 1140
cagcagagca gccagaatca ggttgattcc agctccatct tcaacggcat tgaaggcgct 1200
gagatgagca acaaaggcaa agatcagggc gtggtagtga acaacgtgaa aacgggcact 1260
ccggctgcgc agatcggcct gaagaaaggt gatgtgatta ttggcgcgaa ccagcaggca 1320
gtgaaaaaca tcgctgaact gcgtaaagtt ctcgacagca aaccgtctgt gctggcactc 1380
aacattcagc gcggcgacag caccatctac ctgttaatgc agtaa 1425
<210> 8
<211> 474
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly
1 5 10 15
Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala
20 25 30
Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val
35 40 45
Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn
50 55 60
Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser
65 70 75 80
Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln
85 90 95
Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala
100 105 110
Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr
115 120 125
Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser
130 135 140
Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser
145 150 155 160
Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile
165 170 175
Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala
180 185 190
Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val
195 200 205
Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe
210 215 220
Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ser Gly Gly Ala Leu
225 230 235 240
Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala
245 250 255
Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met
260 265 270
Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg
275 280 285
Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys
290 295 300
Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu
305 310 315 320
Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile
325 330 335
Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala
340 345 350
Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu
355 360 365
Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser
370 375 380
Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala
385 390 395 400
Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val
405 410 415
Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val
420 425 430
Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg
435 440 445
Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg
450 455 460
Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln
465 470
<210> 9
<211> 1425
<212> DNA
<213> Artificial Sequence
<220>
<223> mutated DegP
<400> 9
atgaaaaaaa ccacattagc actgagtgca ctggctctga gtttaggttt ggcgttatct 60
ccgctctctg caacggcggc tgagacttct tcagcaacga cagcccagca gatgccaagc 120
cttgcaccga tgctcgaaaa ggtgatgcct tcagtggtca gcattaacgt agaaggtagc 180
acaaccgtta atacgccgcg tatgccgcgt aatttccagc agttcttcgg tgatgattct 240
ccgttctgcc aggaaggttc tccgttccag agctctccgt tctgccaggg tggccagggc 300
ggtaatggtg gcggccagca acagaaattc atggcgctgg gttccggcgt catcattgat 360
gccgataaag gctatgtcgt caccaacaac cacgttgttg ataacgcgac ggtcattaaa 420
gttcaactga gcgatggccg taagttcgac gcgaagatgg ttggcaaaga tccgcgctct 480
gatatcgcgc tgatccaaat ccagaacccg aaaaacctga ccgcaattaa gatggcggat 540
tctgatgcac tgcgcgtggg tgattacacc gtagcgattg gtaacccgtt tggtctgggc 600
gagacggtaa cttccgggat tgtctctgcg ctggggcgta gcggcctgaa tgccgaaaac 660
tacgaaaact tcatccagac cgatgcagcg attaatcgtg gtaacgccgg tggtgcgctg 720
gttaacctga acggcgaact gatcggtatc aacaccgcga tcctcgcacc ggacggcggc 780
aacatcggta tcggttttgc tatcccgagt aacatggtga aaaacctgac ctcgcagatg 840
gtggaatacg gccaggtgaa acgcggtgag ctgggtatta tggggactga gctgaactcc 900
gaactggcga aagcgatgaa agttgacgcc cagcgcggtg ctttcgtaag ccaggttctg 960
cctaattcct ccgctgcaaa agcgggcatt aaagcgggtg atgtgatcac ctcactgaac 1020
ggtaagccga tcagcagctt tgccgcactg cgtgctcagg tgggtactat gccggtaggc 1080
agcaaactga ccctgggctt actgcgcgac ggtaagcagg ttaacgtgaa cctggaactg 1140
cagcagagca gccagaatca ggttgattcc agctccatct tcaacggcat tgaaggcgct 1200
gagatgagca acaaaggcaa agatcagggc gtggtagtga acaacgtgaa aacgggcact 1260
ccggctgcgc agatcggcct gaagaaaggt gatgtgatta ttggcgcgaa ccagcaggca 1320
gtgaaaaaca tcgctgaact gcgtaaagtt ctcgacagca aaccgtctgt gctggcactc 1380
aacattcagc gcggcgacag caccatctac ctgttaatgc agtaa 1425
<210> 10
<211> 474
<212> PRT
<213> Artificial Sequence
<220>
<223> mutated DegP
<400> 10
Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly
1 5 10 15
Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala
20 25 30
Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val
35 40 45
Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn
50 55 60
Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser
65 70 75 80
Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln
85 90 95
Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala
100 105 110
Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr
115 120 125
Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser
130 135 140
Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser
145 150 155 160
Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile
165 170 175
Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala
180 185 190
Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val
195 200 205
Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe
210 215 220
Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ala Gly Gly Ala Leu
225 230 235 240
Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala
245 250 255
Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met
260 265 270
Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg
275 280 285
Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys
290 295 300
Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu
305 310 315 320
Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile
325 330 335
Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala
340 345 350
Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu
355 360 365
Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser
370 375 380
Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala
385 390 395 400
Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val
405 410 415
Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val
420 425 430
Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg
435 440 445
Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg
450 455 460
Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln
465 470
<210> 11
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' oligonucleotide primer for the region of the mutated DegP gene
comprising the Ase I restriction site
<400> 11
ctgcctgcga ttttcgccgg aacg 24
<210> 12
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' oligonucleotide primer for the region of the mutated DegP gene
comprising the Ase I restriction site
<400> 12
cgcatggtac gtgccacgat atcc 24
<210> 13
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> the 5' oligonucleotide primer for the region of the mutated Tsp
gene comprising the Ase I restriction site
<400> 13
gggaaatgaa cctgagcaaa acgc 24
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' oligonucleotide primer for the region of the mutated Protease
III gene comprising the Ase I restriction site
<400> 14
gggaaaggcg gcggaaccgc ctag 24
<210> 15
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 5' oligonucleotide primer for the region of the mutated Protease
III gene comprising the Ase I restriction site
<400> 15
ctactgtgcc agcggtggta atgg 24
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 3' oligonucleotide primer for the region of the mutated Tsp gene
comprising the Ase I restriction site
<400> 16
gcatcataat tttcttttta cctc 24
<210> 17
<211> 564
<212> DNA
<213> Artificial Sequence
<220>
<223> wild-type spr gene
<400> 17
atggtcaaat ctcaaccgat tttgagatat atcttgcgcg ggattcccgc gattgcagta 60
gcggttctgc tttctgcatg tagtgcaaat aacaccgcaa agaatatgca tcctgagaca 120
cgtgcagtgg gtagtgaaac atcatcactg caagcttctc aggatgaatt tgaaaacctg 180
gttcgtaatg tcgacgtaaa atcgcgaatt atggatcagt atgctgactg gaaaggcgta 240
cgttatcgtc tgggcggcag cactaaaaaa ggtatcgatt gttctggttt cgtacagcgt 300
acattccgtg agcaatttgg cttagaactt ccgcgttcga cttacgaaca gcaggaaatg 360
ggtaaatctg tttcccgcag taatttgcgt acgggtgatt tagttctgtt ccgtgccggt 420
tcaacgggac gccatgtcgg tatttatatc ggcaacaatc agtttgtcca tgcttccacc 480
agcagtggtg ttattatttc cagcatgaat gaaccgtact ggaagaagcg ttacaacgaa 540
gcacgccggg ttctcagccg cagc 564
<210> 18
<211> 188
<212> PRT
<213> Escherichia coli
<400> 18
Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Gly Ile Pro
1 5 10 15
Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ala Asn Asn Thr
20 25 30
Ala Lys Asn Met His Pro Glu Thr Arg Ala Val Gly Ser Glu Thr Ser
35 40 45
Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Asn Leu Val Arg Asn Val
50 55 60
Asp Val Lys Ser Arg Ile Met Asp Gln Tyr Ala Asp Trp Lys Gly Val
65 70 75 80
Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys Gly Ile Asp Cys Ser Gly
85 90 95
Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro Arg
100 105 110
Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys Ser Val Ser Arg Ser Asn
115 120 125
Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly Arg
130 135 140
His Val Gly Ile Tyr Ile Gly Asn Asn Gln Phe Val His Ala Ser Thr
145 150 155 160
Ser Ser Gly Val Ile Ile Ser Ser Met Asn Glu Pro Tyr Trp Lys Lys
165 170 175
Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser
180 185
<210> 19
<211> 162
<212> PRT
<213> Escherichia coli
<400> 19
Cys Ser Ala Asn Asn Thr Ala Lys Asn Met His Pro Glu Thr Arg Ala
1 5 10 15
Val Gly Ser Glu Thr Ser Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu
20 25 30
Asn Leu Val Arg Asn Val Asp Val Lys Ser Arg Ile Met Asp Gln Tyr
35 40 45
Ala Asp Trp Lys Gly Val Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys
50 55 60
Gly Ile Asp Cys Ser Gly Phe Val Gln Arg Thr Phe Arg Glu Gln Phe
65 70 75 80
Gly Leu Glu Leu Pro Arg Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys
85 90 95
Ser Val Ser Arg Ser Asn Leu Arg Thr Gly Asp Leu Val Leu Phe Arg
100 105 110
Ala Gly Ser Thr Gly Arg His Val Gly Ile Tyr Ile Gly Asn Asn Gln
115 120 125
Phe Val His Ala Ser Thr Ser Ser Gly Val Ile Ile Ser Ser Met Asn
130 135 140
Glu Pro Tyr Trp Lys Lys Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser
145 150 155 160
Arg Ser
<210> 20
<211> 954
<212> DNA
<213> Artificial Sequence
<220>
<223> nucleotide sequence of a mutated OmpT sequence comprising D210A
and H212A mutations
<400> 20
atgcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60
tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120
ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180
caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240
atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300
atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360
caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420
ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480
tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540
ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600
attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660
agcggctggg tggaatcatc tgataacgct gaagcttatg acccgggaaa aagaatcact 720
tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780
gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840
ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900
ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954
<210> 21
<211> 317
<212> PRT
<213> Artificial Sequence
<220>
<223> mutated OmpT sequence comprising D210A and H212A mutations
<400> 21
Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile
1 5 10 15
Ser Ser Phe Ala Ser Thr Glu Thr Leu Ser Phe Thr Pro Asp Asn Ile
20 25 30
Asn Ala Asp Ile Ser Leu Gly Thr Leu Ser Gly Lys Thr Lys Glu Arg
35 40 45
Val Tyr Leu Ala Glu Glu Gly Gly Arg Lys Val Ser Gln Leu Asp Trp
50 55 60
Lys Phe Asn Asn Ala Ala Ile Ile Lys Gly Ala Ile Asn Trp Asp Leu
65 70 75 80
Met Pro Gln Ile Ser Ile Gly Ala Ala Gly Trp Thr Thr Leu Gly Ser
85 90 95
Arg Gly Gly Asn Met Val Asp Gln Asp Trp Met Asp Ser Ser Asn Pro
100 105 110
Gly Thr Trp Thr Asp Glu Ser Arg His Pro Asp Thr Gln Leu Asn Tyr
115 120 125
Ala Asn Glu Phe Asp Leu Asn Ile Lys Gly Trp Leu Leu Asn Glu Pro
130 135 140
Asn Tyr Arg Leu Gly Leu Met Ala Gly Tyr Gln Glu Ser Arg Tyr Ser
145 150 155 160
Phe Thr Ala Arg Gly Gly Ser Tyr Ile Tyr Ser Ser Glu Glu Gly Phe
165 170 175
Arg Asp Asp Ile Gly Ser Phe Pro Asn Gly Glu Arg Ala Ile Gly Tyr
180 185 190
Lys Gln Arg Phe Lys Met Pro Tyr Ile Gly Leu Thr Gly Ser Tyr Arg
195 200 205
Tyr Glu Asp Phe Glu Leu Gly Gly Thr Phe Lys Tyr Ser Gly Trp Val
210 215 220
Glu Ser Ser Asp Asn Ala Glu Ala Tyr Asp Pro Gly Lys Arg Ile Thr
225 230 235 240
Tyr Arg Ser Lys Val Lys Asp Gln Asn Tyr Tyr Ser Val Ala Val Asn
245 250 255
Ala Gly Tyr Tyr Val Thr Pro Asn Ala Lys Val Tyr Val Glu Gly Ala
260 265 270
Trp Asn Arg Val Thr Asn Lys Lys Gly Asn Thr Ser Leu Tyr Asp His
275 280 285
Asn Asn Asn Thr Ser Asp Tyr Ser Lys Asn Gly Ala Gly Ile Glu Asn
290 295 300
Tyr Asn Phe Ile Thr Thr Ala Gly Leu Lys Tyr Thr Phe
305 310 315
<210> 22
<211> 954
<212> DNA
<213> Artificial Sequence
<220>
<223> mutated knockout OmpT sequence
<400> 22
attcgggcga aacttctggg aatagtcctg acaaccccta ttgcgatcag ctcttttgct 60
tctaccgaga ctttatcgtt tactcctgac aacataaatg cggacattag tcttggaact 120
ctgagcggaa aaacaaaaga gcgtgtttat ctagccgaag aaggaggccg aaaagtcagt 180
caactcgact ggaaattcaa taacgctgca attattaaag gtgcaattaa ttgggatttg 240
atgccccaga tatctatcgg ggctgctggc tggacaactc tcggcagccg aggtggcaat 300
atggtcgatc aggactggat ggattccagt aaccccggaa cctggacgga tgaaagtaga 360
caccctgata cacaactcaa ttatgccaac gaatttgatc tgaatatcaa aggctggctc 420
ctcaacgaac ccaattaccg cctgggactc atggccggat atcaggaaag ccgttatagc 480
tttacagcca gaggtggttc ctatatctac agttctgagg agggattcag agatgatatc 540
ggctccttcc cgaatggaga aagagcaatc ggctacaaac aacgttttaa aatgccctac 600
attggcttga ctggaagtta tcgttatgaa gattttgaac tcggtggcac atttaaatac 660
agcggctggg tggaatcatc tgataacgat gaacactatg acccgggaaa aagaatcact 720
tatcgcagta aggtcaaaga ccaaaattac tattctgttg cagtcaatgc aggttattac 780
gtcacaccta acgcaaaagt ttatgttgaa ggcgcatgga atcgggttac gaataaaaaa 840
ggtaatactt cactttatga tcacaataat aacacttcag actacagcaa aaatggagca 900
ggtatagaaa actataactt catcactact gctggtctta agtacacatt ttaa 954
<210> 23
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> OmpA oligonucleotide adapter
<400> 23
cgattgaatg gagaacttga attcgggcga aacttctggg aatag 45
<210> 24
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide cassette encoding intergenic sequence 1 (IGS1)
for E. coli Fab expression
<400> 24
aagttttaat agaggagagt gttaatgaag aag 33
<210> 25
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> the oligonucleotide cassette encoding intergenic sequence 2
(IGS2) for E. coli Fab expression.
<400> 25
aagttttaat agaggggagt gttaaaatga agaag 35
<210> 26
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide cassette encoding intergenic sequence 3 (IGS3)
for E. coli Fab expression
<400> 26
aagctttaat agaggagagt gttgaggagg aaaaaaaaat gaagaaa 47
<210> 27
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> oligonucleotide cassette encoding intergenic sequence 4 (IGS4)
for E. coli Fab expression
<400> 27
aagctttaat agaggagagt gttgacgagg attatataat gaagaaa 47
<210> 28
<211> 810
<212> DNA
<213> Escherichia coli
<400> 28
atgaaatcac tgtttaaagt aacgctgctg gcgaccacaa tggccgttgc cctgcatgca 60
ccaatcactt ttgctgctga agctgcaaaa cctgctacag ctgctgacag caaagcagcg 120
ttcaaaaatg acgatcagaa atcagcttat gcactgggtg cctcgctggg tcgttacatg 180
gaaaactctc taaaagaaca agaaaaactg ggcatcaaac tggataaaga tcagctgatc 240
gctggtgttc aggatgcatt tgctgataag agcaaactct ccgaccaaga gatcgaacag 300
actctacaag cattcgaagc tcgcgtgaag tcttctgctc aggcgaagat ggaaaaagac 360
gcggctgata acgaagcaaa aggtaaagag taccgcgaga aatttgccaa agagaaaggt 420
gtgaaaacct cttcaactgg tctggtttat caggtagtag aagccggtaa aggcgaagca 480
ccgaaagaca gcgatactgt tgtagtgaac tacaaaggta cgctgatcga cggtaaagag 540
ttcgacaact cttacacccg tggtgaaccg ctttctttcc gtctggacgg tgttatcccg 600
ggttggacag aaggtctgaa gaacatcaag aaaggcggta agatcaaact ggttattcca 660
ccagaactgg cttacggcaa agcgggtgtt ccggggatcc caccgaattc taccctggtg 720
tttgacgtag agctgctgga tgtgaaacca gcgccgaagg ctgatgcaaa gccggaagct 780
gatgcgaaag ccgcagattc tgctaaaaaa 810
<210> 29
<211> 270
<212> PRT
<213> Escherichia coli
<400> 29
Met Lys Ser Leu Phe Lys Val Thr Leu Leu Ala Thr Thr Met Ala Val
1 5 10 15
Ala Leu His Ala Pro Ile Thr Phe Ala Ala Glu Ala Ala Lys Pro Ala
20 25 30
Thr Ala Ala Asp Ser Lys Ala Ala Phe Lys Asn Asp Asp Gln Lys Ser
35 40 45
Ala Tyr Ala Leu Gly Ala Ser Leu Gly Arg Tyr Met Glu Asn Ser Leu
50 55 60
Lys Glu Gln Glu Lys Leu Gly Ile Lys Leu Asp Lys Asp Gln Leu Ile
65 70 75 80
Ala Gly Val Gln Asp Ala Phe Ala Asp Lys Ser Lys Leu Ser Asp Gln
85 90 95
Glu Ile Glu Gln Thr Leu Gln Ala Phe Glu Ala Arg Val Lys Ser Ser
100 105 110
Ala Gln Ala Lys Met Glu Lys Asp Ala Ala Asp Asn Glu Ala Lys Gly
115 120 125
Lys Glu Tyr Arg Glu Lys Phe Ala Lys Glu Lys Gly Val Lys Thr Ser
130 135 140
Ser Thr Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala
145 150 155 160
Pro Lys Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile
165 170 175
Asp Gly Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser
180 185 190
Phe Arg Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn
195 200 205
Ile Lys Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala
210 215 220
Tyr Gly Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val
225 230 235 240
Phe Asp Val Glu Leu Leu Asp Val Lys Pro Ala Pro Lys Ala Asp Ala
245 250 255
Lys Pro Glu Ala Asp Ala Lys Ala Ala Asp Ser Ala Lys Lys
260 265 270
<210> 30
<211> 828
<212> DNA
<213> Artificial Sequence
<220>
<223> the FkpA tagged gene
<400> 30
atgaaatcac tgtttaaagt aacgctgctg gcgaccacaa tggccgttgc cctgcacgca 60
ccaatcactt ttgctgctga agctgcaaaa cctgctactg ctgctgacag caaagcagcg 120
ttcaaaaatg acgatcagaa atcagcttat gcactgggtg cctcgctggg tcgttacatg 180
gaaaactctc taaaagaaca agaaaaactg ggcatcaaac tggataaaga tcaactgatc 240
gctggtgttc aggatgcatt tgctgataag agcaaactct ccgaccaaga gatcgaacag 300
actctacaag catttgaagc tcgcgtgaag tcttctgctc aggcgaagat ggaaaaagac 360
gcggctgata acgaagcaaa aggtaaagag taccgcgaga aatttgccaa agagaaaggt 420
gtgaaaacct cttcaactgg tctggtttat caggtagtag aagccggtaa aggcgaagca 480
ccgaaagaca gcgatactgt tgtagtgaac tacaaaggta cgctgatcga cggtaaagag 540
ttcgacaact cttacacccg tggtgaaccg ctttctttcc gtctggacgg tgttatcccg 600
ggttggacag aaggtctgaa gaacatcaag aaaggcggta agataaaact ggttattcca 660
ccagaactgg cttacggcaa agcgggtgtt ccggggattc caccaaattc taccctggtg 720
tttgacgtag agctgctgga tgtgaaacca gcgccgaagg ctgatgcaaa gccggaagct 780
gatgcgaaag ccgcagattc tgctaaaaaa caccatcacc atcaccac 828
<210> 31
<211> 276
<212> PRT
<213> Artificial Sequence
<220>
<223> FkpA his tagged gene
<400> 31
Met Lys Ser Leu Phe Lys Val Thr Leu Leu Ala Thr Thr Met Ala Val
1 5 10 15
Ala Leu His Ala Pro Ile Thr Phe Ala Ala Glu Ala Ala Lys Pro Ala
20 25 30
Thr Ala Ala Asp Ser Lys Ala Ala Phe Lys Asn Asp Asp Gln Lys Ser
35 40 45
Ala Tyr Ala Leu Gly Ala Ser Leu Gly Arg Tyr Met Glu Asn Ser Leu
50 55 60
Lys Glu Gln Glu Lys Leu Gly Ile Lys Leu Asp Lys Asp Gln Leu Ile
65 70 75 80
Ala Gly Val Gln Asp Ala Phe Ala Asp Lys Ser Lys Leu Ser Asp Gln
85 90 95
Glu Ile Glu Gln Thr Leu Gln Ala Phe Glu Ala Arg Val Lys Ser Ser
100 105 110
Ala Gln Ala Lys Met Glu Lys Asp Ala Ala Asp Asn Glu Ala Lys Gly
115 120 125
Lys Glu Tyr Arg Glu Lys Phe Ala Lys Glu Lys Gly Val Lys Thr Ser
130 135 140
Ser Thr Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala
145 150 155 160
Pro Lys Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile
165 170 175
Asp Gly Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser
180 185 190
Phe Arg Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn
195 200 205
Ile Lys Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala
210 215 220
Tyr Gly Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val
225 230 235 240
Phe Asp Val Glu Leu Leu Asp Val Lys Pro Ala Pro Lys Ala Asp Ala
245 250 255
Lys Pro Glu Ala Asp Ala Lys Ala Ala Asp Ser Ala Lys Lys His His
260 265 270
His His His His
275
<210> 32
<211> 486
<212> DNA
<213> Escherichia coli
<400> 32
gtgaaaaagt ggttattagc tgcaggtctc ggtttagcac tggcaacttc tgctcaggcg 60
gctgacaaaa ttgcaatcgt caacatgggc agcctgttcc agcaggtagc gcagaaaacc 120
ggtgtttcta acacgctgga aaatgagttc aaaggccgtg ccagcgaact gcagcgtatg 180
gaaaccgatc tgcaggctaa aatgaaaaag ctgcagtcca tgaaagcggg cagcgatcgc 240
actaagctgg aaaaagacgt gatggctcag cgccagactt ttgctcagaa agcgcaggct 300
tttgagcagg atcgcgcacg tcgttccaac gaagaacgcg gcaaactggt tactcgtatc 360
cagactgctg tgaaatccgt tgccaacagc caggatatcg atctggttgt tgatgcaaac 420
gccgttgctt acaacagcag cgatgtaaaa gacatcactg ccgacgtact gaaacaggtt 480
aaataa 486
<210> 33
<211> 161
<212> PRT
<213> Escherichia coli
<400> 33
Met Lys Lys Trp Leu Leu Ala Ala Gly Leu Gly Leu Ala Leu Ala Thr
1 5 10 15
Ser Ala Gln Ala Ala Asp Lys Ile Ala Ile Val Asn Met Gly Ser Leu
20 25 30
Phe Gln Gln Val Ala Gln Lys Thr Gly Val Ser Asn Thr Leu Glu Asn
35 40 45
Glu Phe Lys Gly Arg Ala Ser Glu Leu Gln Arg Met Glu Thr Asp Leu
50 55 60
Gln Ala Lys Met Lys Lys Leu Gln Ser Met Lys Ala Gly Ser Asp Arg
65 70 75 80
Thr Lys Leu Glu Lys Asp Val Met Ala Gln Arg Gln Thr Phe Ala Gln
85 90 95
Lys Ala Gln Ala Phe Glu Gln Asp Arg Ala Arg Arg Ser Asn Glu Glu
100 105 110
Arg Gly Lys Leu Val Thr Arg Ile Gln Thr Ala Val Lys Ser Val Ala
115 120 125
Asn Ser Gln Asp Ile Asp Leu Val Val Asp Ala Asn Ala Val Ala Tyr
130 135 140
Asn Ser Ser Asp Val Lys Asp Ile Thr Ala Asp Val Leu Lys Gln Val
145 150 155 160
Lys
<210> 34
<211> 501
<212> DNA
<213> Artificial Sequence
<220>
<223> skp his tagged gene
<400> 34
atgaaaaagt ggttattagc cgcaggtctc ggtttagcac tggcaacttc tgctcaggcg 60
gctgacaaaa ttgcaatcgt caacatgggc agcctgttcc agcaggtagc gcagaaaacc 120
ggtgtttcta acacgctgga aaatgagttc aaaggccgtg ccagcgaact ccagcgtatg 180
gaaaccgatc tccaggctaa aatgaaaaag ctgcaatcca tgaaagcggg cagcgatcgc 240
actaagctgg aaaaagacgt gatggctcag cgccagactt ttgctcagaa agcgcaggct 300
tttgagcagg atcgcgcacg tcgttccaac gaagaacgcg gcaaactggt tactcgtatc 360
cagactgctg tgaaatccgt tgccaacagc caggaaatcg atctggttgt tgatgcaaac 420
gccgttgctt acaacagcag cgatgtaaaa gacatcactg ccgacgtact gaaacaggtt 480
aaacaccatc accatcacca c 501
<210> 35
<211> 167
<212> PRT
<213> Artificial Sequence
<220>
<223> skp his tagged gene
<400> 35
Met Lys Lys Trp Leu Leu Ala Ala Gly Leu Gly Leu Ala Leu Ala Thr
1 5 10 15
Ser Ala Gln Ala Ala Asp Lys Ile Ala Ile Val Asn Met Gly Ser Leu
20 25 30
Phe Gln Gln Val Ala Gln Lys Thr Gly Val Ser Asn Thr Leu Glu Asn
35 40 45
Glu Phe Lys Gly Arg Ala Ser Glu Leu Gln Arg Met Glu Thr Asp Leu
50 55 60
Gln Ala Lys Met Lys Lys Leu Gln Ser Met Lys Ala Gly Ser Asp Arg
65 70 75 80
Thr Lys Leu Glu Lys Asp Val Met Ala Gln Arg Gln Thr Phe Ala Gln
85 90 95
Lys Ala Gln Ala Phe Glu Gln Asp Arg Ala Arg Arg Ser Asn Glu Glu
100 105 110
Arg Gly Lys Leu Val Thr Arg Ile Gln Thr Ala Val Lys Ser Val Ala
115 120 125
Asn Ser Gln Glu Ile Asp Leu Val Val Asp Ala Asn Ala Val Ala Tyr
130 135 140
Asn Ser Ser Asp Val Lys Asp Ile Thr Ala Asp Val Leu Lys Gln Val
145 150 155 160
Lys His His His His His His
165
<210> 36
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170 1519 Ab CDRH1
<400> 36
Gly Phe Thr Phe Ser Asn Tyr Gly Met Val
1 5 10
<210> 37
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170_1519 Ab CDRH2
<400> 37
Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val Lys
1 5 10 15
Gly
<210> 38
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170_1519 Ab CDRH3
<400> 38
Gly Ile Val Arg Pro Phe Leu Tyr
1 5
<210> 39
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170_1519 Ab CDRL1
<400> 39
Lys Ser Ser Gln Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr
1 5 10 15
<210> 40
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170_1519 Ab CDRL2
<400> 40
Leu Val Ser Thr Leu Asp Ser
1 5
<210> 41
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> CA170_1519 Ab CDRL3
<400> 41
Leu Gln Gly Thr His Phe Pro His Thr
1 5
<210> 42
<211> 112
<212> PRT
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VL region
<400> 42
Asp Val Val Met Thr Gln Thr Pro Leu Ser Leu Ser Val Ala Leu Gly
1 5 10 15
Gln Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser Leu Val Gly Ala
20 25 30
Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Arg Ser Gly Gln Ser
35 40 45
Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro
50 55 60
Asp Arg Phe Ser Gly Ser Gly Ala Glu Thr Asp Phe Thr Leu Lys Ile
65 70 75 80
Arg Arg Val Glu Ala Asp Asp Leu Gly Val Tyr Tyr Cys Leu Gln Gly
85 90 95
Thr His Phe Pro His Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys
100 105 110
<210> 43
<211> 336
<212> DNA
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VL region
<400> 43
gatgttgtga tgacccagac tccactgtct ttgtcggttg cccttggaca accagcctcc 60
atctcttgca agtcaagtca gagcctcgta ggtgctagtg gaaagacata tttgtattgg 120
ttatttcaga ggtccggcca gtctccaaag cgactaatct atctggtgtc cacactggac 180
tctggaattc ctgataggtt cagtggcagt ggagcagaga cagattttac tcttaaaatc 240
cgcagagtgg aagccgatga tttgggagtt tattactgct tgcaaggtac acattttcct 300
cacacgtttg gagctgggac caagctggaa ttgaaa 336
<210> 44
<211> 132
<212> PRT
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VL region
<400> 44
Met Met Ser Pro Ala Gln Phe Leu Phe Leu Leu Met Leu Trp Ile Gln
1 5 10 15
Gly Thr Ser Gly Asp Val Val Met Thr Gln Thr Pro Leu Ser Leu Ser
20 25 30
Val Ala Leu Gly Gln Pro Ala Ser Ile Ser Cys Lys Ser Ser Gln Ser
35 40 45
Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Arg
50 55 60
Ser Gly Gln Ser Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp
65 70 75 80
Ser Gly Ile Pro Asp Arg Phe Ser Gly Ser Gly Ala Glu Thr Asp Phe
85 90 95
Thr Leu Lys Ile Arg Arg Val Glu Ala Asp Asp Leu Gly Val Tyr Tyr
100 105 110
Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Ala Gly Thr Lys
115 120 125
Leu Glu Leu Lys
130
<210> 45
<211> 396
<212> DNA
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VL region
<400> 45
atgatgagtc ctgcccagtt cctgtttctg ctgatgctct ggattcaggg aaccagtggt 60
gatgttgtga tgacccagac tccactgtct ttgtcggttg cccttggaca accagcctcc 120
atctcttgca agtcaagtca gagcctcgta ggtgctagtg gaaagacata tttgtattgg 180
ttatttcaga ggtccggcca gtctccaaag cgactaatct atctggtgtc cacactggac 240
tctggaattc ctgataggtt cagtggcagt ggagcagaga cagattttac tcttaaaatc 300
cgcagagtgg aagccgatga tttgggagtt tattactgct tgcaaggtac acattttcct 360
cacacgtttg gagctgggac caagctggaa ttgaaa 396
<210> 46
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VH region
<400> 46
Glu Val Pro Leu Val Glu Ser Gly Gly Gly Ser Val Gln Pro Gly Arg
1 5 10 15
Ser Met Lys Leu Ser Cys Val Val Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Gly Met Val Trp Val Arg Gln Ala Pro Lys Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asn Asn Ala Lys Ser Thr Leu Tyr
65 70 75 80
Leu Gln Met Asp Ser Leu Arg Ser Glu Asp Thr Ala Thr Tyr Tyr Cys
85 90 95
Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Thr
100 105 110
Val Thr Val Ser
115
<210> 47
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VH region
<400> 47
gaggtgccgc tggtggagtc tgggggcggc tcagtgcagc ctgggaggtc catgaaactc 60
tcctgtgtag tctcaggatt cactttcagt aattatggca tggtctgggt ccgccaggct 120
ccaaagaagg gtctggagtg ggtcgcatat attgattctg atggtgataa tacttactac 180
cgagattccg tgaagggccg attcactatc tccagaaata atgcaaaaag caccctatat 240
ttgcaaatgg acagtctgag gtctgaggac acggccactt attactgtac aacagggatt 300
gtccggccct ttctctattg gggccaagga accacggtca ccgtctcg 348
<210> 48
<211> 135
<212> PRT
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VH region
<400> 48
Met Asp Ile Ser Leu Ser Leu Ala Phe Leu Val Leu Phe Ile Lys Gly
1 5 10 15
Val Arg Cys Glu Val Pro Leu Val Glu Ser Gly Gly Gly Ser Val Gln
20 25 30
Pro Gly Arg Ser Met Lys Leu Ser Cys Val Val Ser Gly Phe Thr Phe
35 40 45
Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Lys Lys Gly Leu
50 55 60
Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asn Asn Ala Lys Ser
85 90 95
Thr Leu Tyr Leu Gln Met Asp Ser Leu Arg Ser Glu Asp Thr Ala Thr
100 105 110
Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln
115 120 125
Gly Thr Thr Val Thr Val Ser
130 135
<210> 49
<211> 405
<212> DNA
<213> Artificial Sequence
<220>
<223> Rat Ab 1519 VH region
<400> 49
atggacatca gtctcagctt ggctttcctt gtccttttca taaaaggtgt ccggtgtgag 60
gtgccgctgg tggagtctgg gggcggctca gtgcagcctg ggaggtccat gaaactctcc 120
tgtgtagtct caggattcac tttcagtaat tatggcatgg tctgggtccg ccaggctcca 180
aagaagggtc tggagtgggt cgcatatatt gattctgatg gtgataatac ttactaccga 240
gattccgtga agggccgatt cactatctcc agaaataatg caaaaagcac cctatatttg 300
caaatggaca gtctgaggtc tgaggacacg gccacttatt actgtacaac agggattgtc 360
cggccctttc tctattgggg ccaaggaacc acggtcaccg tctcg 405
<210> 50
<211> 112
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gL20 V-region
<400> 50
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala
20 25 30
Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala
35 40 45
Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro
50 55 60
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile
65 70 75 80
Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly
85 90 95
Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105 110
<210> 51
<211> 336
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gL20 V-region
<400> 51
gatatccaga tgacccagag tccaagcagt ctctccgcca gcgtaggcga tcgtgtgact 60
attacctgta aaagctccca gtccctggtg ggtgcaagcg gcaaaaccta cctgtactgg 120
ctcttccaga aaccgggcaa agctccgaaa cgcctgatct atctggtgtc taccctggat 180
agcggtattc cgtctcgttt ctccggtagc ggtagcggta ccgaattcac gctgaccatt 240
agctccctcc agccggagga ctttgctacc tattactgcc tccagggcac tcattttccg 300
cacactttcg gccagggtac caaactggaa atcaaa 336
<210> 52
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gL20 V-region
<400> 52
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
20 25 30
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln
35 40 45
Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln
50 55 60
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu
65 70 75 80
Asp Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
85 90 95
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
100 105 110
Tyr Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr
115 120 125
Lys Leu Glu Ile Lys
130
<210> 53
<211> 399
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gL20 V-region
<400> 53
atgaaaaaga cagctatcgc aattgcagtg gccttggctg gtttcgctac cgtagcgcaa 60
gctgatatcc agatgaccca gagtccaagc agtctctccg ccagcgtagg cgatcgtgtg 120
actattacct gtaaaagctc ccagtccctg gtgggtgcaa gcggcaaaac ctacctgtac 180
tggctcttcc agaaaccggg caaagctccg aaacgcctga tctatctggt gtctaccctg 240
gatagcggta ttccgtctcg tttctccggt agcggtagcg gtaccgaatt cacgctgacc 300
attagctccc tccagccgga ggactttgct acctattact gcctccaggg cactcatttt 360
ccgcacactt tcggccaggg taccaaactg gaaatcaaa 399
<210> 54
<211> 219
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gL20 light chain (V + constant)
<400> 54
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala
20 25 30
Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala
35 40 45
Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro
50 55 60
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile
65 70 75 80
Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly
85 90 95
Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105 110
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
115 120 125
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
130 135 140
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
145 150 155 160
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
165 170 175
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
180 185 190
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
195 200 205
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
210 215
<210> 55
<211> 657
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gL20 light chain (V + constant)
<400> 55
gatatccaga tgacccagag tccaagcagt ctctccgcca gcgtaggcga tcgtgtgact 60
attacctgta aaagctccca gtccctggtg ggtgcaagcg gcaaaaccta cctgtactgg 120
ctcttccaga aaccgggcaa agctccgaaa cgcctgatct atctggtgtc taccctggat 180
agcggtattc cgtctcgttt ctccggtagc ggtagcggta ccgaattcac gctgaccatt 240
agctccctcc agccggagga ctttgctacc tattactgcc tccagggcac tcattttccg 300
cacactttcg gccagggtac caaactggaa atcaaacgta cggtagcggc cccatctgtc 360
ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 420
ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 480
tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctc 540
agcagcaccc tgacgctgag caaagcagac tacgagaaac acaaagtcta cgcctgcgaa 600
gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgt 657
<210> 56
<211> 240
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gL20 light chain
<400> 56
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
20 25 30
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln
35 40 45
Ser Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln
50 55 60
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu
65 70 75 80
Asp Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
85 90 95
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
100 105 110
Tyr Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr
115 120 125
Lys Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe
130 135 140
Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys
145 150 155 160
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val
165 170 175
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln
180 185 190
Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser
195 200 205
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His
210 215 220
Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230 235 240
<210> 57
<211> 720
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gL20 light chain
<400> 57
atgaaaaaga cagctatcgc aattgcagtg gccttggctg gtttcgctac cgtagcgcaa 60
gctgatatcc agatgaccca gagtccaagc agtctctccg ccagcgtagg cgatcgtgtg 120
actattacct gtaaaagctc ccagtccctg gtgggtgcaa gcggcaaaac ctacctgtac 180
tggctcttcc agaaaccggg caaagctccg aaacgcctga tctatctggt gtctaccctg 240
gatagcggta ttccgtctcg tttctccggt agcggtagcg gtaccgaatt cacgctgacc 300
attagctccc tccagccgga ggactttgct acctattact gcctccaggg cactcatttt 360
ccgcacactt tcggccaggg taccaaactg gaaatcaaac gtacggtagc ggccccatct 420
gtcttcatct tcccgccatc tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc 480
ctgctgaata acttctatcc cagagaggcc aaagtacagt ggaaggtgga taacgccctc 540
caatcgggta actcccagga gagtgtcaca gagcaggaca gcaaggacag cacctacagc 600
ctcagcagca ccctgacgct gagcaaagca gactacgaga aacacaaagt ctacgcctgc 660
gaagtcaccc atcagggcct gagctcacca gtaacaaaaa gttttaatag aggggagtgt 720
<210> 58
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gH20 V-region
<400> 58
Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu
100 105 110
Val Thr Val Ser
115
<210> 59
<211> 348
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gH20 V-region
<400> 59
gaggttccgc tggtcgagtc tggaggcggg cttgtccagc ctggagggag cctgcgtctc 60
tcttgtgcag tatctggctt cacgttctcc aactacggta tggtgtgggt tcgtcaggct 120
ccaggtaaag gtctggaatg ggtggcgtat attgactccg acggcgacaa cacctactat 180
cgcgactctg tgaaaggtcg cttcaccatt tcccgcgata acgccaaatc cagcctgtac 240
ctgcagatga acagcctgcg tgctgaagat actgcggtgt actattgcac cactggcatc 300
gtgcgtccgt ttctgtattg gggtcagggt accctcgtta ctgtctcg 348
<210> 60
<211> 137
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gH20 V-region
<400> 60
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu
20 25 30
Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe
35 40 45
Thr Phe Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys
50 55 60
Gly Leu Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr
65 70 75 80
Tyr Arg Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
85 90 95
Lys Ser Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp
115 120 125
Gly Gln Gly Thr Leu Val Thr Val Ser
130 135
<210> 61
<211> 411
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gH20 V-region
<400> 61
atgaagaaga ctgctatagc aattgcagtg gcgctagctg gtttcgccac cgtggcgcaa 60
gctgaggttc cgctggtcga gtctggaggc gggcttgtcc agcctggagg gagcctgcgt 120
ctctcttgtg cagtatctgg cttcacgttc tccaactacg gtatggtgtg ggttcgtcag 180
gctccaggta aaggtctgga atgggtggcg tatattgact ccgacggcga caacacctac 240
tatcgcgact ctgtgaaagg tcgcttcacc atttcccgcg ataacgccaa atccagcctg 300
tacctgcaga tgaacagcct gcgtgctgaa gatactgcgg tgtactattg caccactggc 360
atcgtgcgtc cgtttctgta ttggggtcag ggtaccctcg ttactgtctc g 411
<210> 62
<211> 228
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gH20 Fab' heavy chain (V + human gamma-1 CH1 + hinge)
<400> 62
Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu
100 105 110
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
115 120 125
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
130 135 140
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
145 150 155 160
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
165 170 175
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
180 185 190
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
195 200 205
Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His
210 215 220
Thr Cys Ala Ala
225
<210> 63
<211> 684
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519gH20 Fab' heavy chain (V + human gamma-1 CH1 + hinge)
<400> 63
gaggttccgc tggtcgagtc tggaggcggg cttgtccagc ctggagggag cctgcgtctc 60
tcttgtgcag tatctggctt cacgttctcc aactacggta tggtgtgggt tcgtcaggct 120
ccaggtaaag gtctggaatg ggtggcgtat attgactccg acggcgacaa cacctactat 180
cgcgactctg tgaaaggtcg cttcaccatt tcccgcgata acgccaaatc cagcctgtac 240
ctgcagatga acagcctgcg tgctgaagat actgcggtgt actattgcac cactggcatc 300
gtgcgtccgt ttctgtattg gggtcagggt accctcgtta ctgtctcgag cgcttctaca 360
aagggcccat cggtcttccc cctggcaccc tcctccaaga gcacctctgg gggcacagcg 420
gccctgggct gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca 480
ggcgccctga ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac 540
tccctcagca gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc 600
aacgtgaatc acaagcccag caacaccaag gtcgacaaga aagttgagcc caaatcttgt 660
gacaaaactc acacatgcgc cgcg 684
<210> 64
<211> 249
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519 gH20 Fab' heavy chain
<400> 64
Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala
1 5 10 15
Thr Val Ala Gln Ala Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu
20 25 30
Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe
35 40 45
Thr Phe Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys
50 55 60
Gly Leu Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr
65 70 75 80
Tyr Arg Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
85 90 95
Lys Ser Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr
100 105 110
Ala Val Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp
115 120 125
Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro
130 135 140
Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr
145 150 155 160
Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr
165 170 175
Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro
180 185 190
Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr
195 200 205
Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn
210 215 220
His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser
225 230 235 240
Cys Asp Lys Thr His Thr Cys Ala Ala
245
<210> 65
<211> 747
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519 gH20 Fab' heavy chain
<400> 65
atgaagaaga ctgctatagc aattgcagtg gcgctagctg gtttcgccac cgtggcgcaa 60
gctgaggttc cgctggtcga gtctggaggc gggcttgtcc agcctggagg gagcctgcgt 120
ctctcttgtg cagtatctgg cttcacgttc tccaactacg gtatggtgtg ggttcgtcag 180
gctccaggta aaggtctgga atgggtggcg tatattgact ccgacggcga caacacctac 240
tatcgcgact ctgtgaaagg tcgcttcacc atttcccgcg ataacgccaa atccagcctg 300
tacctgcaga tgaacagcct gcgtgctgaa gatactgcgg tgtactattg caccactggc 360
atcgtgcgtc cgtttctgta ttggggtcag ggtaccctcg ttactgtctc gagcgcttct 420
acaaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 480
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 540
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 600
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 660
tgcaacgtga atcacaagcc cagcaacacc aaggtcgaca agaaagttga gcccaaatct 720
tgtgacaaaa ctcacacatg cgccgcg 747
<210> 66
<211> 444
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gH20 IgG4 heavy chain (V + human gamma-4P constant)
<400> 66
Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu
100 105 110
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
115 120 125
Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys
130 135 140
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
145 150 155 160
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
165 170 175
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
180 185 190
Leu Gly Thr Lys Thr Tyr Thr Cys Asn Val Asp His Lys Pro Ser Asn
195 200 205
Thr Lys Val Asp Lys Arg Val Glu Ser Lys Tyr Gly Pro Pro Cys Pro
210 215 220
Pro Cys Pro Ala Pro Glu Phe Leu Gly Gly Pro Ser Val Phe Leu Phe
225 230 235 240
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
245 250 255
Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln Phe
260 265 270
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
275 280 285
Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
290 295 300
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
305 310 315 320
Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala
325 330 335
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln
340 345 350
Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
355 360 365
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
370 375 380
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
385 390 395 400
Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg Trp Gln Glu
405 410 415
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
420 425 430
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly Lys
435 440
<210> 67
<211> 1939
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519gH20 IgG4 heavy chain (V + human gamma-4P constant, exons)
<400> 67
gaggtaccac ttgtggaaag cggaggaggt cttgtgcagc ctggaggaag tttacgtctc 60
tcttgtgctg tgtctggctt caccttctcc aattacggaa tggtctgggt cagacaagca 120
cctggaaagg gtcttgaatg ggtggcctat attgactctg acggggacaa cacctactat 180
cgggattccg tgaaaggacg cttcacaatc tcccgagata acgccaagag ctcactgtac 240
ctgcagatga atagcctgag agccgaggat actgccgtgt actattgcac aacgggaatc 300
gttaggcctt ttctgtactg gggacagggc accttggtta ctgtctcgag cgcttctaca 360
aagggcccat ccgtcttccc cctggcgccc tgctccagga gcacctccga gagcacagcc 420
gccctgggct gcctggtcaa ggactacttc cccgaaccgg tgacggtgtc gtggaactca 480
ggcgccctga ccagcggcgt gcacaccttc ccggctgtcc tacagtcctc aggactctac 540
tccctcagca gcgtggtgac cgtgccctcc agcagcttgg gcacgaagac ctacacctgc 600
aacgtagatc acaagcccag caacaccaag gtggacaaga gagttggtga gaggccagca 660
cagggaggga gggtgtctgc tggaagccag gctcagccct cctgcctgga cgcaccccgg 720
ctgtgcagcc ccagcccagg gcagcaaggc atgccccatc tgtctcctca cccggaggcc 780
tctgaccacc ccactcatgc ccagggagag ggtcttctgg atttttccac caggctccgg 840
gcagccacag gctggatgcc cctaccccag gccctgcgca tacaggggca ggtgctgcgc 900
tcagacctgc caagagccat atccgggagg accctgcccc tgacctaagc ccaccccaaa 960
ggccaaactc tccactccct cagctcagac accttctctc ctcccagatc tgagtaactc 1020
ccaatcttct ctctgcagag tccaaatatg gtcccccatg cccaccatgc ccaggtaagc 1080
caacccaggc ctcgccctcc agctcaaggc gggacaggtg ccctagagta gcctgcatcc 1140
agggacaggc cccagccggg tgctgacgca tccacctcca tctcttcctc agcacctgag 1200
ttcctggggg gaccatcagt cttcctgttc cccccaaaac ccaaggacac tctcatgatc 1260
tcccggaccc ctgaggtcac gtgcgtggtg gtggacgtga gccaggaaga ccccgaggtc 1320
cagttcaact ggtacgtgga tggcgtggag gtgcataatg ccaagacaaa gccgcgggag 1380
gagcagttca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca ccaggactgg 1440
ctgaacggca aggagtacaa gtgcaaggtc tccaacaaag gcctcccgtc ctccatcgag 1500
aaaaccatct ccaaagccaa aggtgggacc cacggggtgc gagggccaca tggacagagg 1560
tcagctcggc ccaccctctg ccctgggagt gaccgctgtg ccaacctctg tccctacagg 1620
gcagccccga gagccacagg tgtacaccct gcccccatcc caggaggaga tgaccaagaa 1680
ccaggtcagc ctgacctgcc tggtcaaagg cttctacccc agcgacatcg ccgtggagtg 1740
ggagagcaat gggcagccgg agaacaacta caagaccacg cctcccgtgc tggactccga 1800
cggctccttc ttcctctaca gcaggctaac cgtggacaag agcaggtggc aggaggggaa 1860
tgtcttctca tgctccgtga tgcatgaggc tctgcacaac cactacacac agaagagcct 1920
ctccctgtct ctgggtaaa 1939
<210> 68
<211> 347
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gL20 FabFv light chain
<400> 68
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser Leu Val Gly Ala
20 25 30
Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys Pro Gly Lys Ala
35 40 45
Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp Ser Gly Ile Pro
50 55 60
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile
65 70 75 80
Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Leu Gln Gly
85 90 95
Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys
100 105 110
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
115 120 125
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
130 135 140
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
145 150 155 160
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
165 170 175
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
180 185 190
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
195 200 205
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys Ser Gly Gly Gly Gly
210 215 220
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp Ile Gln Met Thr
225 230 235 240
Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly Asp Arg Val Thr Ile
245 250 255
Thr Cys Gln Ser Ser Pro Ser Val Trp Ser Asn Phe Leu Ser Trp Tyr
260 265 270
Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Glu Ala Ser
275 280 285
Lys Leu Thr Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly
290 295 300
Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala
305 310 315 320
Thr Tyr Tyr Cys Gly Gly Gly Tyr Ser Ser Ile Ser Asp Thr Thr Phe
325 330 335
Gly Cys Gly Thr Lys Val Glu Ile Lys Arg Thr
340 345
<210> 69
<211> 1041
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519gL20 FabFv light chain
<400> 69
gatatccaga tgacccagag cccatctagc ttatccgctt ccgttggtga tcgcgtgaca 60
attacgtgta agagctccca atctctcgtg ggtgcaagtg gcaagaccta tctgtactgg 120
ctctttcaga agcctggcaa ggcaccaaaa cggctgatct atctggtgtc tacccttgac 180
tctgggatac cgtcacgatt ttccggatct gggagcggaa ctgagttcac actcacgatt 240
tcatcgctgc aacccgagga ctttgctacc tactactgcc tgcaaggcac tcatttccct 300
cacactttcg gccaggggac aaaactcgaa atcaaacgta cggtagcggc cccatctgtc 360
ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 420
ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 480
tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctg 540
agcagcaccc tgacgctgtc taaagcagac tacgagaaac acaaagtgta cgcctgcgaa 600
gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgtagc 660
ggtggcggtg gcagtggtgg gggaggctcc ggaggtggcg gttcagacat acaaatgacc 720
cagagtcctt catcggtatc cgcgtccgtt ggcgataggg tgactattac atgtcaaagc 780
tctcctagcg tctggagcaa ttttctatcc tggtatcaac agaaaccggg gaaggctcca 840
aaacttctga tttatgaagc ctcgaaactc accagtggag ttccgtcaag attcagtggc 900
tctggatcag ggacagactt cacgttgaca atcagttcgc tgcaaccaga ggactttgcg 960
acctactatt gtggtggagg ttacagtagc ataagtgata cgacatttgg gtgcggtact 1020
aaggtggaaa tcaaacgtac c 1041
<210> 70
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gL20 FabFv light chain
<400> 70
Met Ser Val Pro Thr Gln Val Leu Gly Leu Leu Leu Leu Trp Leu Thr
1 5 10 15
Asp Ala Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser
20 25 30
Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ser Ser Gln Ser
35 40 45
Leu Val Gly Ala Ser Gly Lys Thr Tyr Leu Tyr Trp Leu Phe Gln Lys
50 55 60
Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Leu Val Ser Thr Leu Asp
65 70 75 80
Ser Gly Ile Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe
85 90 95
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr
100 105 110
Cys Leu Gln Gly Thr His Phe Pro His Thr Phe Gly Gln Gly Thr Lys
115 120 125
Leu Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro
130 135 140
Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu
145 150 155 160
Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp
165 170 175
Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp
180 185 190
Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys
195 200 205
Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
210 215 220
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys Ser
225 230 235 240
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Asp
245 250 255
Ile Gln Met Thr Gln Ser Pro Ser Ser Val Ser Ala Ser Val Gly Asp
260 265 270
Arg Val Thr Ile Thr Cys Gln Ser Ser Pro Ser Val Trp Ser Asn Phe
275 280 285
Leu Ser Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
290 295 300
Tyr Glu Ala Ser Lys Leu Thr Ser Gly Val Pro Ser Arg Phe Ser Gly
305 310 315 320
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
325 330 335
Glu Asp Phe Ala Thr Tyr Tyr Cys Gly Gly Gly Tyr Ser Ser Ile Ser
340 345 350
Asp Thr Thr Phe Gly Cys Gly Thr Lys Val Glu Ile Lys Arg Thr
355 360 365
<210> 71
<211> 1101
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519gL20 FabFv light chain
<400> 71
atgtctgtcc ccacccaagt cctcggactc ctgctactct ggcttacaga tgccagatgc 60
gatatccaga tgacccagag cccatctagc ttatccgctt ccgttggtga tcgcgtgaca 120
attacgtgta agagctccca atctctcgtg ggtgcaagtg gcaagaccta tctgtactgg 180
ctctttcaga agcctggcaa ggcaccaaaa cggctgatct atctggtgtc tacccttgac 240
tctgggatac cgtcacgatt ttccggatct gggagcggaa ctgagttcac actcacgatt 300
tcatcgctgc aacccgagga ctttgctacc tactactgcc tgcaaggcac tcatttccct 360
cacactttcg gccaggggac aaaactcgaa atcaaacgta cggtagcggc cccatctgtc 420
ttcatcttcc cgccatctga tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg 480
ctgaataact tctatcccag agaggccaaa gtacagtgga aggtggataa cgccctccaa 540
tcgggtaact cccaggagag tgtcacagag caggacagca aggacagcac ctacagcctg 600
agcagcaccc tgacgctgtc taaagcagac tacgagaaac acaaagtgta cgcctgcgaa 660
gtcacccatc agggcctgag ctcaccagta acaaaaagtt ttaatagagg ggagtgtagc 720
ggtggcggtg gcagtggtgg gggaggctcc ggaggtggcg gttcagacat acaaatgacc 780
cagagtcctt catcggtatc cgcgtccgtt ggcgataggg tgactattac atgtcaaagc 840
tctcctagcg tctggagcaa ttttctatcc tggtatcaac agaaaccggg gaaggctcca 900
aaacttctga tttatgaagc ctcgaaactc accagtggag ttccgtcaag attcagtggc 960
tctggatcag ggacagactt cacgttgaca atcagttcgc tgcaaccaga ggactttgcg 1020
acctactatt gtggtggagg ttacagtagc ataagtgata cgacatttgg gtgcggtact 1080
aaggtggaaa tcaaacgtac c 1101
<210> 72
<211> 357
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gH20 FabFv heavy chain
<400> 72
Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser Ser Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln Gly Thr Leu
100 105 110
Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu
115 120 125
Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys
130 135 140
Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser
145 150 155 160
Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser
165 170 175
Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser
180 185 190
Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn
195 200 205
Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Ser Gly Gly Gly
210 215 220
Gly Ser Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser Glu Val Gln Leu
225 230 235 240
Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu
245 250 255
Ser Cys Ala Val Ser Gly Ile Asp Leu Ser Asn Tyr Ala Ile Asn Trp
260 265 270
Val Arg Gln Ala Pro Gly Lys Cys Leu Glu Trp Ile Gly Ile Ile Trp
275 280 285
Ala Ser Gly Thr Thr Phe Tyr Ala Thr Trp Ala Lys Gly Arg Phe Thr
290 295 300
Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln Met Asn Ser
305 310 315 320
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Thr Val Pro
325 330 335
Gly Tyr Ser Thr Ala Pro Tyr Phe Asp Leu Trp Gly Gln Gly Thr Leu
340 345 350
Val Thr Val Ser Ser
355
<210> 73
<211> 1071
<212> DNA
<213> Artificial Sequence
<220>
<223> 1519gH20 FabFv heavy chain
<400> 73
gaggtaccac ttgtggaaag cggaggaggt cttgtgcagc ctggaggaag tttacgtctc 60
tcttgtgctg tgtctggctt caccttctcc aattacggaa tggtctgggt cagacaagca 120
cctggaaagg gtcttgaatg ggtggcctat attgactctg acggggacaa cacctactat 180
cgggattccg tgaaaggacg cttcacaatc tcccgagata acgccaagag ctcactgtac 240
ctgcagatga atagcctgag agccgaggat actgccgtgt actattgcac aacgggaatc 300
gttaggcctt ttctgtactg gggacagggc accttggtta ctgtctcgag cgcgtccaca 360
aagggcccat cggtcttccc cctggcaccc tcctccaaga gcacctctgg gggcacagcg 420
gccctgggct gcctggtcaa ggactacttc cccgaaccag tgacggtgtc gtggaactca 480
ggtgccctga ccagcggcgt tcacaccttc ccggctgtcc tacagtcttc aggactctac 540
tccctgagca gcgtggtgac cgtgccctcc agcagcttgg gcacccagac ctacatctgc 600
aacgtgaatc acaagcccag caacaccaag gtcgataaga aagttgagcc caaatcttgt 660
agtggaggtg ggggctcagg tggaggcggg accggtggag gtggcagcga ggttcaactg 720
cttgagtctg gaggaggcct agtccagcct ggagggagcc tgcgtctctc ttgtgcagta 780
agcggcatcg acctgagcaa ttacgccatc aactgggtga gacaagctcc ggggaagtgt 840
ttagaatgga tcggtataat atgggccagt gggacgacct tttatgctac atgggcgaaa 900
ggaaggttta caattagccg ggacaatagc aaaaacaccg tgtatctcca aatgaactcc 960
ttgcgagcag aggacacggc ggtgtactat tgtgctcgca ctgtcccagg ttatagcact 1020
gcaccctact tcgatctgtg gggacaaggg accctggtga ctgtttcaag t 1071
<210> 74
<211> 376
<212> PRT
<213> Artificial Sequence
<220>
<223> 1519gH20 FabFv heavy chain
<400> 74
Met Glu Trp Ser Trp Val Phe Leu Phe Phe Leu Ser Val Thr Thr Gly
1 5 10 15
Val His Ser Glu Val Pro Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Val Ser Gly Phe Thr Phe
35 40 45
Ser Asn Tyr Gly Met Val Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Tyr Ile Asp Ser Asp Gly Asp Asn Thr Tyr Tyr Arg
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Ser
85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Thr Thr Gly Ile Val Arg Pro Phe Leu Tyr Trp Gly Gln
115 120 125
Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val
130 135 140
Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala
145 150 155 160
Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser
165 170 175
Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val
180 185 190
Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro
195 200 205
Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys
210 215 220
Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Ser
225 230 235 240
Gly Gly Gly Gly Ser Gly Gly Gly Gly Thr Gly Gly Gly Gly Ser Glu
245 250 255
Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Val Ser Gly Ile Asp Leu Ser Asn Tyr Ala
275 280 285
Ile Asn Trp Val Arg Gln Ala Pro Gly Lys Cys Leu Glu Trp Ile Gly
290 295 300
Ile Ile Trp Ala Ser Gly Thr Thr Phe Tyr Ala Thr Trp Ala Lys Gly
305 310 315 320
Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Val Tyr Leu Gln
325 330 335
Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg
340 345 350
Thr Val Pro Gly Tyr Ser Thr Ala Pro Tyr Phe Asp Leu Trp Gly Gln
355 360 365
Gly Thr Leu Val Thr Val Ser Ser
370 375
<210> 75
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type Tsp 5'
<400> 75
Met Asn Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile
1 5 10 15
Ala Gly Gln Thr Phe Ala
20
<210> 76
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Wild type Tsp 5'
<400> 76
atgaacatgt tttttaggct taccgcgtta gctggcctgc ttgcaatagc aggccagacc 60
ttcgct 66
<210> 77
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Mutated Tsp 5' fragment
<400> 77
Met Asn Ser Phe Leu Gly Leu Pro Arg Leu Ala Cys Leu Gln Gln Ala
1 5 10 15
Arg His Leu
<210> 78
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Mutated Tsp 5' fragment
<400> 78
atgaattcgt ttttaggctt accgcgttag ctggcctgct tgcaatagca ggccagacat 60
taattg 66
<210> 79
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Mutated delta ptr (protease III) 5'
<400> 79
Ile Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu
1 5 10 15
Trp Ala His Cys
20
<210> 80
<211> 66
<212> DNA
<213> Artificial
<220>
<223> Mutated delta ptr (protease III) 5'
<400> 80
tgaattcccc gcagcacctg gttcaaagca ttattgttgt tagttgccct ttgggcacat 60
taatgt 66
<210> 81
<211> 21
<212> PRT
<213> Artificial
<220>
<223> Wild-type ptr (protease III) 5'
<400> 81
Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu
1 5 10 15
Trp Ala Pro Leu Ser
20
<210> 82
<211> 66
<212> DNA
<213> Artificial
<220>
<223> Wild-type ptr (protease III) 5'
<400> 82
tgaatgcccc gcagcacctg gttcaaagca ttattgttgt tagttgccct ttgggcaccc 60
ttaagt 66
Claims (29)
- 재조합 그람(gram) 음성 박테리아 세포로서,
a. D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택되는 하나 이상의 아미노산에서 돌연변이를 갖는 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및
b. FkpA, Skp, 또는 FkpA와 Skp의 조합으로부터 선택되는, 단백질 접힘(folding)을 용이하게 할 수 있는 하나 이상의 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 발현 벡터
를 포함하며, 야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고, DsbC를 코딩하는 재조합 폴리뉴클레오티드를 포함하지 않는, 재조합 그람 음성 박테리아 세포. - 제1항에 있어서, 돌연변이 spr 유전자가 D133A, H145A, H157A, N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, V135D, V135G, L136P, G140C, R144C 및 G147C로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제2항에 있어서, 돌연변이 spr 유전자가 S95F, V98E, Y115F, D133A, V135D, V135G 및 G147C로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제3항에 있어서, 돌연변이 spr 유전자가 돌연변이 C94 및 H145A를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제2항에 있어서, 돌연변이 spr 유전자가 D133A, H145A 및 H157A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제1항에 있어서, 돌연변이 spr 유전자가 C94A로부터 선택되는 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 돌연변이 spr 유전자가 세포의 게놈 내에 통합되는 것인 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 단백질 접힘을 용이하게 할 수 있는 단백질을 코딩하는 유전자가 세포 내로 일시적으로 형질감염되는 것인 세포.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 하기 돌연변이된 유전자 중 하나 이상을 추가로 포함하는 것인 세포:
a. 샤페론 활성(chaperone activity) 및 감소된 프로테아제 활성을 갖는 DegP 단백질을 코딩하는 돌연변이된 DegP 유전자;
b. 감소된 프로테아제 활성을 갖는 프로테아제 III 단백질을 코딩하거나 넉아웃(knockout) 돌연변이된 ptr 유전자인, 돌연변이된 ptr 유전자; 및
c. 감소된 프로테아제 활성을 갖는 OmpT 단백질을 코딩하거나 넉아웃 돌연변이된 OmpT 유전자인, 돌연변이된 OmpT 유전자. - 제1항 내지 제6항 중 어느 한 항에 있어서, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하거나 넉아웃 돌연변이된 Tsp 유전자인, 돌연변이된 Tsp 유전자를 포함하는 세포.
- 제9항에 있어서, 세포의 게놈은, 돌연변이된 spr 유전자 및 돌연변이된 Tsp 유전자를 제외하고는, 야생형 박테리아 세포에 대하여 동질 유전자형인 세포.
- 재조합 그람 음성 박테리아 세포로서,
야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고,
돌연변이된 Tsp 유전자를 포함하는 세포의 표현형을 억제할 수 있는 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및
단백질 접힘을 용이하게 할 수 있는 단백질의 발현에 적합한, FkpA, Skp 또는 FkpA와 Skp의 조합을 코딩하는 유전자
를 가지며, 세포의 게놈이, 야생형 세포와 비교하여 Tsp 단백질 활성을 감소시키는 데 요구되는 변형 및 돌연변이된 spr 유전자를 제외하고는, 야생형 박테리아 세포에 대하여 동질 유전자형인 재조합 그람 음성 박테리아 세포. - 제12항에 있어서, 돌연변이 spr 유전자가 N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C, H157A 및 W174R로부터 선택되는 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제12항에 있어서, 돌연변이 spr 유전자가 제1항 내지 제6항 중 어느 한 항에 정의된 하나 이상의 돌연변이를 갖는 spr 단백질을 코딩하는 것인 세포.
- 제1항 또는 제12항에 있어서, 유전자 개시 코돈, 유전자 개시 코돈의 하류 및 유전자 종결 코돈의 상류에 위치하는 하나 이상의 종결 코돈, 또는 이들의 조합에 대한 돌연변이를 포함하는 넉아웃 돌연변이된 Tsp 유전자를 갖는 세포.
- 제15항에 있어서, 넉아웃 돌연변이된 Tsp 유전자는 유전자 개시 코돈에 대한 미스센스(missense) 돌연변이 및 하나 이상의 추가의 점 돌연변이에 의해 생성된 제한 표지 부위를 포함하는 것인 세포.
- 제16항에 있어서, 넉아웃 돌연변이된 Tsp 유전자가 서열 번호 3을 포함하는 것인 세포.
- 제1항 또는 제12항에 있어서, 세포가 이. 콜라이(E. coli) 인 세포.
- 제1항 또는 제12항에 있어서, 관심의 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 세포.
- 제19항에 있어서, 관심의 단백질이 항체 또는 이의 항원 결합 단편인 세포.
- 제20항에 있어서, 항체 또는 이의 항원 결합 단편이 FcRn에 대하여 특이적인 것인 세포.
- 재조합 그람 음성 박테리아 세포로서,
야생형 세포와 비교하여 감소된 Tsp 단백질 활성을 갖고,
돌연변이 spr 단백질을 코딩하는 돌연변이 spr 유전자, 및 FkpA, Skp, 또는 FkpA와 Skp의 조합으로부터 선택되는, 단백질 접힘을 용이하게 할 수 있는 단백질의 발현에 적합한 유전자를 코딩하는 유전자를 포함하며,
FcRn에 대하여 특이적인 항체 또는 이의 항원 결합 단편을 코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 그람 음성 박테리아 세포. - 제22항에 있어서, 감소된 프로테아제 활성을 갖는 Tsp 단백질을 코딩하는 돌연변이된 Tsp 유전자 또는 넉아웃 돌연변이된 Tsp 유전자를 포함하는 세포.
- 배양 배지에서, 관심의 재조합 단백질을 발현시키기에 효과적인 조건 하에, 제1항, 제12항 및 제22항 중 어느 한 항에 정의된 재조합 그람 음성 박테리아 세포를 배양하는 단계, 및
관심의 재조합 단백질을 재조합 그람 음성 박테리아 세포의 주변 세포질, 배양 배지 또는 이들의 조합으로부터 회수하는 단계를 포함하는, 관심의 단백질의 제조 방법. - 제24항에 있어서, 관심의 단백질을 상기 세포로부터 회수하는 단계를 추가로 포함하는 제조 방법.
- 제25항에 있어서, 관심의 단백질을 주변 세포질, 상청액 또는 이들의 조합으로부터 회수하는 것인 제조 방법.
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB201208367A GB201208367D0 (en) | 2012-05-14 | 2012-05-14 | Biological product |
GB1208367.1 | 2012-05-14 | ||
PCT/EP2013/059803 WO2013171156A1 (en) | 2012-05-14 | 2013-05-13 | Recombinant bacterial host cell for protein expression |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150014936A KR20150014936A (ko) | 2015-02-09 |
KR102036399B1 true KR102036399B1 (ko) | 2019-10-24 |
Family
ID=46458730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147032673A KR102036399B1 (ko) | 2012-05-14 | 2013-05-13 | 단백질 발현용 재조합 박테리아 숙주 세포 |
Country Status (29)
Country | Link |
---|---|
US (2) | US9951365B2 (ko) |
EP (1) | EP2850100B1 (ko) |
JP (2) | JP6420759B2 (ko) |
KR (1) | KR102036399B1 (ko) |
CN (2) | CN110591991A (ko) |
AU (1) | AU2013261915B2 (ko) |
BR (1) | BR112014027357A2 (ko) |
CA (1) | CA2872328C (ko) |
CL (1) | CL2014003112A1 (ko) |
CO (1) | CO7240426A2 (ko) |
CY (1) | CY1121192T1 (ko) |
DK (1) | DK2850100T3 (ko) |
EA (1) | EA201492100A1 (ko) |
ES (1) | ES2704425T3 (ko) |
GB (1) | GB201208367D0 (ko) |
HR (1) | HRP20190025T1 (ko) |
HU (1) | HUE040624T2 (ko) |
IL (1) | IL235041B (ko) |
LT (1) | LT2850100T (ko) |
ME (1) | ME03309B (ko) |
MX (1) | MX353066B (ko) |
MY (1) | MY166223A (ko) |
PL (1) | PL2850100T3 (ko) |
PT (1) | PT2850100T (ko) |
RS (1) | RS58219B1 (ko) |
SG (1) | SG11201406474RA (ko) |
SI (1) | SI2850100T1 (ko) |
TR (1) | TR201900073T4 (ko) |
WO (1) | WO2013171156A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9109216B2 (en) | 2009-09-24 | 2015-08-18 | Ucb Pharma, S.A. | Bacterial host strain |
GB201000587D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial hoist strain |
GB201000590D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial host strain |
GB201000591D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial hoist strain |
GB201012599D0 (en) | 2010-07-27 | 2010-09-08 | Ucb Pharma Sa | Process for purifying proteins |
LT2731973T (lt) | 2011-07-13 | 2018-02-26 | Ucb Biopharma Sprl | Bakterijų padermė, ekspresuojanti rekombinantinį dsbc |
GB201208367D0 (en) * | 2012-05-14 | 2012-06-27 | Ucb Pharma Sa | Biological product |
GB201708655D0 (en) * | 2017-05-31 | 2017-07-12 | Ucb Biopharma Sprl | Cell culture methods |
EP3492582A1 (en) | 2017-12-01 | 2019-06-05 | UCB Biopharma SPRL | Cell culture methods |
EP3774926A1 (en) | 2018-04-05 | 2021-02-17 | Bio-Rad ABD Serotec GmbH | Display systems for proteins of interest |
JP2021522785A (ja) * | 2018-05-01 | 2021-09-02 | アンブルックス, インコーポレイテッドAmbrx, Inc. | 抗体発現を最適化するための方法 |
EP3877407A1 (en) * | 2018-11-05 | 2021-09-15 | F. Hoffmann-La Roche AG | Methods of producing two chain proteins in prokaryotic host cells |
EP3942079A1 (en) | 2019-03-18 | 2022-01-26 | Bio-Rad ABD Serotec GmbH | Protection of spytag-containing periplasmic fusion proteins from protease tsp and ompt degradation |
US11926669B2 (en) | 2022-05-30 | 2024-03-12 | Hanall Biopharma Co., Ltd. | Anti-FcRn antibody or antigen binding fragment thereof with improved stability |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011086136A1 (en) * | 2010-01-14 | 2011-07-21 | Ucb Pharma S.A. | Bacterial host strain comprising a mutant spr gene and having reduced tsp activity |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5264365A (en) | 1990-11-09 | 1993-11-23 | Board Of Regents, The University Of Texas System | Protease-deficient bacterial strains for production of proteolytically sensitive polypeptides |
US5508192A (en) | 1990-11-09 | 1996-04-16 | Board Of Regents, The University Of Texas System | Bacterial host strains for producing proteolytically sensitive polypeptides |
GB9215540D0 (en) | 1992-07-22 | 1992-09-02 | Celltech Ltd | Protein expression system |
US5304472A (en) | 1992-11-20 | 1994-04-19 | Genentech, Inc. | Method of controlling polypeptide production in bacterial cells |
AU2660397A (en) | 1996-04-05 | 1997-10-29 | Board Of Regents, The University Of Texas System | Methods for producing soluble, biologically-active disulfide bond-containing eukaryotic proteins in bacterial cells |
US6083715A (en) | 1997-06-09 | 2000-07-04 | Board Of Regents, The University Of Texas System | Methods for producing heterologous disulfide bond-containing polypeptides in bacterial cells |
CA2346797C (en) | 1998-10-28 | 2008-09-23 | Genentech, Inc. | Process for recovering heterologous polypeptides from bacterial cells |
WO2001001147A1 (en) | 1999-06-29 | 2001-01-04 | Siga Technologies, Inc. | Assay for degp protease inhibitors |
GB0006398D0 (en) | 2000-03-16 | 2000-05-03 | Novartis Ag | Organic compounds |
GB0013810D0 (en) | 2000-06-06 | 2000-07-26 | Celltech Chiroscience Ltd | Biological products |
AU8867501A (en) | 2000-09-01 | 2002-03-13 | Biogen Inc | Co-crystal structure of monoclonal antibody 5c8 and cd154, and use thereof in drug design |
EP1314037A2 (en) | 2000-09-01 | 2003-05-28 | Biogen, Inc. | Methods of designing and producing compounds having improved binding affinity for cd154 or other trimeric proteins |
US7041479B2 (en) | 2000-09-06 | 2006-05-09 | The Board Of Trustess Of The Leland Stanford Junior University | Enhanced in vitro synthesis of active proteins containing disulfide bonds |
JP4309656B2 (ja) * | 2000-12-14 | 2009-08-05 | ジェネンテック・インコーポレーテッド | 原核生物で生成させた抗体とその用途 |
DK1341899T3 (da) | 2000-12-14 | 2006-04-10 | Genentech Inc | Bakterieværtsstammer |
TWI327597B (en) | 2001-08-01 | 2010-07-21 | Centocor Inc | Anti-tnf antibodies, compositions, methods and uses |
ATE382053T1 (de) | 2001-08-27 | 2008-01-15 | Genentech Inc | System zur antikörperexpression und- synthese |
GB0124317D0 (en) | 2001-10-10 | 2001-11-28 | Celltech R&D Ltd | Biological products |
CN1585822A (zh) | 2001-11-16 | 2005-02-23 | 拜奥根Idec公司 | 抗体的多顺反子表达 |
GB0129105D0 (en) | 2001-12-05 | 2002-01-23 | Celltech R&D Ltd | Expression control using variable intergenic sequences |
CN1678634A (zh) | 2002-06-28 | 2005-10-05 | 多曼蒂斯有限公司 | 免疫球蛋白单个变体抗原结合区及其特异性构建体 |
GB0224082D0 (en) | 2002-10-16 | 2002-11-27 | Celltech R&D Ltd | Biological products |
AU2003287345A1 (en) | 2002-10-31 | 2004-06-07 | Genentech, Inc. | Methods and compositions for increasing antibody production |
ES2374068T3 (es) | 2002-12-03 | 2012-02-13 | Ucb Pharma, S.A. | Ensayo para identificar células productoras de anticuerpos. |
GB0303337D0 (en) | 2003-02-13 | 2003-03-19 | Celltech R&D Ltd | Biological products |
NZ544486A (en) | 2003-06-13 | 2009-04-30 | Biogen Idec Inc | Aglycosyl anti-cd154 (cd40 ligand) antibodies and uses thereof |
ES2315664T3 (es) | 2003-06-30 | 2009-04-01 | Domantis Limited | Anticuerpos de dominio unico (dab) pegilados. |
GB0315457D0 (en) | 2003-07-01 | 2003-08-06 | Celltech R&D Ltd | Biological products |
GB0315450D0 (en) | 2003-07-01 | 2003-08-06 | Celltech R&D Ltd | Biological products |
EP1653801A4 (en) | 2003-07-26 | 2007-05-30 | Biogen Idec Inc | MODIFIED ANTIBODIES HAVING IMPROVED ANTIGEN BINDING AFFINITY |
WO2006078273A2 (en) * | 2004-04-26 | 2006-07-27 | The United States Of America As Represented By Teh Secretary Of Health And Human Services, Nih | Methods and compositions for producing recombinant proteins |
CN101072587B (zh) | 2004-07-26 | 2012-12-26 | 比奥根艾迪克Ma公司 | 抗-cd154抗体 |
US20060204493A1 (en) | 2004-09-02 | 2006-09-14 | Genentech, Inc. | Heteromultimeric molecules |
US7563443B2 (en) | 2004-09-17 | 2009-07-21 | Domantis Limited | Monovalent anti-CD40L antibody polypeptides and compositions thereof |
GB0425534D0 (en) | 2004-11-19 | 2004-12-22 | Celltech R&D Ltd | Process for obtaining antibodies |
GB0520169D0 (en) | 2005-10-04 | 2005-11-09 | Celltech R&D Ltd | Biological products |
BRPI0809042B1 (pt) | 2007-03-22 | 2021-08-31 | Biogen Ma Inc. | Proteína de ligação a cd154 isolada, seu uso, e composição |
EP2535350B1 (en) | 2007-09-26 | 2018-01-24 | UCB Biopharma SPRL | Dual specificity antibody fusions |
PL2334705T3 (pl) | 2008-09-26 | 2017-06-30 | Ucb Biopharma Sprl | Produkty biologiczne |
US7662587B1 (en) | 2009-03-05 | 2010-02-16 | E. I. Du Pont De Nemours And Company | Gene knockout mutations that increase peptide production |
US9109216B2 (en) | 2009-09-24 | 2015-08-18 | Ucb Pharma, S.A. | Bacterial host strain |
US8470552B2 (en) | 2009-10-12 | 2013-06-25 | Keck Graduate Institute | Strategy to reduce lactic acid production and control PH in animal cell culture |
US8361744B2 (en) | 2009-11-05 | 2013-01-29 | Genentech, Inc. | Methods and composition for secretion of heterologous polypeptides |
GB201000590D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial host strain |
GB201000591D0 (en) * | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial hoist strain |
GB201000588D0 (en) | 2010-01-14 | 2010-03-03 | Ucb Pharma Sa | Bacterial host strain |
GB201001791D0 (en) | 2010-02-03 | 2010-03-24 | Ucb Pharma Sa | Process for obtaining antibodies |
GB201012599D0 (en) * | 2010-07-27 | 2010-09-08 | Ucb Pharma Sa | Process for purifying proteins |
EP2546267A1 (en) | 2011-07-13 | 2013-01-16 | UCB Pharma S.A. | Bacterial host strain expressing recombinant DsbC |
LT2731973T (lt) | 2011-07-13 | 2018-02-26 | Ucb Biopharma Sprl | Bakterijų padermė, ekspresuojanti rekombinantinį dsbc |
GB201208367D0 (en) * | 2012-05-14 | 2012-06-27 | Ucb Pharma Sa | Biological product |
-
2012
- 2012-05-14 GB GB201208367A patent/GB201208367D0/en not_active Ceased
-
2013
- 2013-05-13 PT PT13723086T patent/PT2850100T/pt unknown
- 2013-05-13 ES ES13723086T patent/ES2704425T3/es active Active
- 2013-05-13 CN CN201910693072.1A patent/CN110591991A/zh active Pending
- 2013-05-13 BR BR112014027357A patent/BR112014027357A2/pt active Search and Examination
- 2013-05-13 CN CN201380025191.0A patent/CN104487454A/zh active Pending
- 2013-05-13 SI SI201331318T patent/SI2850100T1/sl unknown
- 2013-05-13 JP JP2015512012A patent/JP6420759B2/ja not_active Expired - Fee Related
- 2013-05-13 CA CA2872328A patent/CA2872328C/en active Active
- 2013-05-13 RS RS20190013A patent/RS58219B1/sr unknown
- 2013-05-13 MX MX2014012623A patent/MX353066B/es active IP Right Grant
- 2013-05-13 US US14/400,068 patent/US9951365B2/en active Active
- 2013-05-13 DK DK13723086.8T patent/DK2850100T3/en active
- 2013-05-13 AU AU2013261915A patent/AU2013261915B2/en not_active Ceased
- 2013-05-13 EP EP13723086.8A patent/EP2850100B1/en active Active
- 2013-05-13 SG SG11201406474RA patent/SG11201406474RA/en unknown
- 2013-05-13 TR TR2019/00073T patent/TR201900073T4/tr unknown
- 2013-05-13 EA EA201492100A patent/EA201492100A1/ru unknown
- 2013-05-13 HU HUE13723086A patent/HUE040624T2/hu unknown
- 2013-05-13 ME MEP-2019-3A patent/ME03309B/me unknown
- 2013-05-13 KR KR1020147032673A patent/KR102036399B1/ko active IP Right Grant
- 2013-05-13 MY MYPI2014703261A patent/MY166223A/en unknown
- 2013-05-13 LT LTEP13723086.8T patent/LT2850100T/lt unknown
- 2013-05-13 PL PL13723086T patent/PL2850100T3/pl unknown
- 2013-05-13 WO PCT/EP2013/059803 patent/WO2013171156A1/en active Application Filing
-
2014
- 2014-10-07 IL IL23504114A patent/IL235041B/en active IP Right Grant
- 2014-11-14 CL CL2014003112A patent/CL2014003112A1/es unknown
- 2014-12-11 CO CO14272157A patent/CO7240426A2/es unknown
-
2018
- 2018-04-23 US US15/959,498 patent/US11261470B2/en active Active
- 2018-07-12 JP JP2018132619A patent/JP2018198597A/ja not_active Abandoned
-
2019
- 2019-01-03 HR HRP20190025TT patent/HRP20190025T1/hr unknown
- 2019-01-10 CY CY20191100022T patent/CY1121192T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011086136A1 (en) * | 2010-01-14 | 2011-07-21 | Ucb Pharma S.A. | Bacterial host strain comprising a mutant spr gene and having reduced tsp activity |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102036399B1 (ko) | 단백질 발현용 재조합 박테리아 숙주 세포 | |
JP7062626B2 (ja) | 組換えDsbCを発現する細菌宿主系統 | |
DK2523969T3 (en) | Bacterial host strain that expresses recombinant DsbC and has decreased Tsp activity | |
US8969037B2 (en) | Bacterial host strain comprising a mutant spr gene and a wild-type Tsp gene | |
KR20130030247A (ko) | 돌연변이체 spr 유전자를 포함하고 저하된 tsp 활성을 갖는 박테리아 숙주 균주 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |