KR20240021234A - 재조합 단백질 발현을 위한 박테리아 숙주 - Google Patents

재조합 단백질 발현을 위한 박테리아 숙주 Download PDF

Info

Publication number
KR20240021234A
KR20240021234A KR1020247000858A KR20247000858A KR20240021234A KR 20240021234 A KR20240021234 A KR 20240021234A KR 1020247000858 A KR1020247000858 A KR 1020247000858A KR 20247000858 A KR20247000858 A KR 20247000858A KR 20240021234 A KR20240021234 A KR 20240021234A
Authority
KR
South Korea
Prior art keywords
acid sequence
seq
amino acid
set forth
host cell
Prior art date
Application number
KR1020247000858A
Other languages
English (en)
Inventor
앤서니 파리나
코리 엠 슈워츠
토르벤 브룩
러셀 콜맨
다이앤 엠 리탈락
Original Assignee
펠리칸 테크놀로지 홀딩스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 펠리칸 테크놀로지 홀딩스, 인크. filed Critical 펠리칸 테크놀로지 홀딩스, 인크.
Publication of KR20240021234A publication Critical patent/KR20240021234A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/78Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/24Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against cytokines, lymphokines or interferons
    • C07K16/241Tumor Necrosis Factors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/55Fab or Fab'
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/38Pseudomonas
    • C12R2001/39Pseudomonas fluorescens

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 프로테아제 민감성 재조합 단백질을 분해하지 않으면서 높은 세포 밀도까지 생장하는 재조합 그람 음성 숙주 세포, 항체 및 항체 단편을 비롯한 고품질 재조합 단백질을 고수율로 생성하기 위해 이 숙주 세포를 사용하는 방법, 및 숙주 세포에서 관심 있는 재조합 단백질 또는 폴리펩티드의 주변세포질 발현에 관한 조성물 및 방법을 제공한다.

Description

재조합 단백질 발현을 위한 박테리아 숙주
상호참조
본원은 2021년 6월 10일에 출원된 미국 가출원 제63/209,239호의 이익을 주장하고, 이 출원의 내용은 그 전체가 본원에 참고로 포함된다.
발명의 배경
미생물 숙주 세포 발현 시스템은 다양한 정도의 성공으로 재조합 단백질의 제조에 사용된다. 재조합 단백질 분해 및 낮은 수율은 과제로 남아 있다. 고품질 단백질의 생성을 최적화하기 위한 숙주 세포 게놈의 변경은 종종 숙주 세포 생장 및 생성 수율을 실망스러울 정도로 낮춘다. 재조합 단백질의 고품질 및 고수율 둘 다를 달성하는 재조합 숙주 세포가 여전히 필요하다.
본 발명은 재조합 박테리아 숙주 세포, 및 고수율로 고품질 재조합 단백질을 생성하기 위해 이를 사용하는 방법을 제공한다. 구체적으로, 본 발명에 의해 제공된 조성물 및 방법은 항체 및 항체 단편을 포함하는, 단백질용해에 민감한 재조합 단백질을 생성하는 데 유용하다. 본 발명은 높은 세포 밀도까지 생장을 허용하면서 재조합 단백질의 분해를 감소시키는 유전적 변형의 조합을 포함하는 재조합 그람 음성 박테리아 숙주 세포를 포함한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고 제2 프로테아제 활성은 뮤레인(murein) DD-엔도펩티다제 활성이다. 일부 실시양태에서, 본 발명은 꼬리 특이적 프로테아제 활성 및 뮤레인 DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포에 관한 것으로, 이때 상기 숙주 세포는 고품질의 분해되지 않은 재조합 단백질을 생성하고 높은 세포 밀도까지 생장한다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 활성은 MepM 활성이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 MepS 활성이 결핍되어 있지 않다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포는 적어도 하나의 추가 프로테아제 활성, 적어도 하나의 자가용해 인자 활성, 또는 이들 둘 다가 추가로 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제2 프로테아제 활성은 MepM 뮤레인 DD-엔도펩티다제 활성이다. 일부 실시양태에서, 적어도 하나의 추가 프로테아제 활성은 세랄라이신(serralysin) 전구체 활성이다. 단백질 활성, 예를 들어, 제1 프로테아제, 제2 프로테아제, 추가 프로테아제 또는 자가용해 인자의 결핍은 하나 이상의 유전자의 돌연변이로부터 비롯될 수 있다. 본 발명은 본 발명의 재조합 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질을 고수율로 제조하는 방법도 제공한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 Fab'이다. 일부 실시양태에서, Fab'는 TNF-α에 결합한다.
본 발명은 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포를 포함하는 것으로, 이때 상기 숙주 세포는 (a) 제1 프로테아제 활성이 결핍되어 있고; (b) 제2 프로테아제 활성이 결핍되어 있으며, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍은 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 제2 프로테아제 활성은 뮤레인 DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍은 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 추가로 (c) 적어도 하나의 추가 프로테아제 활성이 결핍되어 있거나; (d) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (e) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (f) 하나 이상의 폴딩 조절인자를 과발현하거나; (g) (c), (d), (e) 및 (f)의 임의의 조합을 나타내고, 이때 추가 프로테아제 활성의 결핍은 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 추가 프로테아제는 (a) 및 (b)의 프로테아제와 상이하고; 자가용해 인자 활성의 결핍은 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 활성의 결핍은 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 활성의 결핍은 (i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; (ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; (iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및 (iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, (c)의 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있고; (d)의 숙주 세포는 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있고; (e)의 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하며, 이때 각각의 불활성화된 프로테아제는 상이하고; (f)의 숙주 세포는 1개 내지 10개의 상이한 폴딩 조절인자, 또는 이들의 임의의 조합을 과발현한다. 일부 실시양태에서, (c)의 하나 이상의 추가 프로테아제 활성의 결핍은 세랄라이신 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제(transpeptidase), 헤모라이신(hemolysin) 전구체, D-알라닐-D-알라닌 카르복시펩티다제(carboxypeptidase)/엔도펩티다제 AmpH 전구체, 주변세포질(periplasmic) 세린 엔도프로테아제(endoprotease), AAA+ 패밀리 단백질용해 기구, 및 (a)와 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (d)의 하나 이상의 자가용해 인자 활성의 결핍은 S형 피오신(pyocin), 선형 그라미시딘(gramicidin) 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 및 포린(porin)으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (e)의 하나 이상의 불활성화된 프로테아제는 돌연변이체 주변세포질 세린 엔도프로테아제이고; (f)의 하나 이상의 폴딩 조절인자는 디설파이드 이소머라제이다. 일부 실시양태에서, 세랄라이신 전구체는 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질로부터 선택되고; 막 국소화 프로테아제는 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고; 뮤레인 L,D 트랜스펩티다제는 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고; 헤모라이신 전구체는 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고; D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체는 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고; 주변세포질 세린 엔도프로테아제는 서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질로부터 선택되고; AAA+ 패밀리 단백질용해 기구는 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고; 뮤레인 DD-엔도펩티다제는 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 또는 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질로부터 선택되고; S형 피오신은 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고; 선형 그라미시딘 합성효소는 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고; 류코톡신은 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고; ShlB 헤모라이신 수송체는 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고; 하나 이상의 과발현된 불활성화된 프로테아제 각각은 슈도모나스 플루오레센스(P. fluorescens) DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이(E. coli) Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고; 하나 이상의 폴딩 조절인자 각각은 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 76 내지 81 중 어느 한 서열번호로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택된다.
일부 실시양태에서, 돌연변이는 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이는 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된다. 일부 실시양태에서, (iii)의 미스센스 돌연변이는 보존적 또는 비보존적 아미노산 치환을 야기한다. 일부 실시양태에서, 비코딩 서열은 조절 서열이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 기능성 프로테아제 활성을 추가로 포함하며, 이때 기능성 프로테아제 활성은 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 기능성 프로테아제 활성을 추가로 포함하고, 이때 기능성 프로테아제 활성은 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 슈도모나드(Pseudomonad)이다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 슈도모나드이고, 제1 프로테아제 활성의 결핍은 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이, 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된다. 일부 실시양태에서, 제2 프로테아제 활성은 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된다. 일부 실시양태에서, 제2 프로테아제 활성의 결핍은 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이는 (i) 서열번호 1의 잔기 134 내지 411 중 어느 하나 이상의 잔기; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상의 잔기; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상의 잔기; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기한다. 일부 실시양태에서, 박테리아 숙주 세포는 슈도모나스 플루오레센스이고, 제2 프로테아제 활성의 결핍은 Y248stop, G332S, D334N, A337T, H411Y, P410L, 및 R319, H330, D334, H378 및 H411 중 어느 한 잔기의 임의의 보존적 또는 비보존적 아미노산 치환으로부터 선택된 서열번호 1의 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 배양물에서 고밀도 세포 생장을 할 수 있다. 일부 실시양태에서, 배양물에서의 고밀도 세포 생장은 약 80 내지 약 300의 OD575까지의 생장을 포함한다. 일부 실시양태에서, 배양물에서의 고밀도 세포 생장은 대조군 세포에 비해 약 2배 내지 약 15배 증가된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 상기 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다. 일부 실시양태에서, 2(c)의 추가 프로테아제 활성은 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성이다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 적어도 하나의 발현 구축물을 추가로 포함하고, 이때 각각의 발현 구축물은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 단백질 또는 이종 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비-항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류(camelid), 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디(bibody); 트리바디(tribody); 인트라바디(intrabody); 나노바디(nanobody); 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택된다. 일부 실시양태에서, VHH 함유 항체는 VHH 연쇄(concatenated) 항체이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 Fab'이다. 일부 실시양태에서, Fab'는 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄는 전체 길이 또는 중쇄 단편이고, 경쇄는 전체 길이 또는 경쇄 단편이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄는 동일한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄는 상이한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다. 일부 실시양태에서, 주변세포질 분비 신호는 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 발현 구축물은 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체는 인간화된다. 일부 실시양태에서, Fab'는 세르톨리주맙(certolizumab)이다. 일부 실시양태에서, Fab' 중쇄는 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄는 서열번호 23으로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 중쇄를 코딩하는 핵산 서열은 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열은 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 (i) 제1 프로테아제 활성; (ii) 제2 프로테아제 활성; (iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성; (iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 (v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진HslV 관련 단백질이 결핍되어 있다. 일부 실시양태에서, 상기 숙주 세포는 외인성 불활성화된 DegP를 추가로 과발현하고, 이때 불활성화된 DegP는 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 잔기 116, 146, 219, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 잔기의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제, 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오(Vibrio) 숙주 세포로부터 선택된다. 일부 실시양태에서, 숙주 세포는 그람 양성 숙주 세포, 예를 들어, 바실러스(Bacillus) 숙주 세포이다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스(Pseudomonas) 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다(P. putida), 또는 슈도모나스 에루기노사(P. aeruginosa)이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1-; (ii) Prc2-; (iii) HslU-; (iv) HslV-; (v) MepM1-; (vi) PyrF-; 및 (vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍을 나타내고; 이때 세랄라이신 전구체 결핍은 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 슈도모나스 플루오레센스이고, Prc1은 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2는 서열번호 35로 제시된 아미노산 서열을 갖고, HslU는 서열번호 37로 제시된 아미노산 서열을 갖고, HslV는 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1은 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체는 서열번호 9로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 숙주 세포는 DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 숙주 세포는 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함한다. 일부 실시양태에서, 발현 벡터는 Fab'를 코딩한다. 일부 실시양태에서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터는 Fab'를 코딩하는 핵산 서열을 추가로 포함한다. 일부 실시양태에서, Fab' 중쇄는 서열번호 21에 의해 코딩되고, Fab' 경쇄는 서열번호 23에 의해 코딩된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 플라스미드에 포함된 발현 구축물 또는 구축물들을 추가로 포함한다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이가 아니다.
본 발명은 (a) 적합한 발효 조건 하에서 배양된 본 발명의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하는, 관심 있는 재조합 단백질을 제조하는 방법을 추가로 포함하고, 이때 상기 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드에 의해 형질전환된다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사는 유도성 프로모터에 의해 조절된다. 일부 실시양태에서, 유도성 프로모터는 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 높은 세포 밀도까지 생장할 수 있다. 일부 실시양태에서, 높은 세포 밀도는 약 80 내지 약 300의 OD575를 포함한다. 일부 실시양태에서, 적합한 발효 조건은 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함한다. 일부 실시양태에서, 유도성 프로모터는 IPTG에 의해 유도되고, 이때 IPTG는 약 0.08 내지 0.3 mM의 최종 농도로 첨가된다. 일부 실시양태에서, IPTG는 약 0.2 mM의 최종 농도로 첨가된다. 일부 실시양태에서, 유도는 약 6.0 내지 약 6.5의 배양 pH에서 수행된다. 일부 실시양태에서, 유도는 약 28℃ 내지 33℃의 온도에서 수행된다. 일부 실시양태에서, 유도는 약 32℃의 온도에서 수행된다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도까지 생장한다. 일부 실시양태에서, 세포 밀도의 증가는 약 2배 내지 약 15배이다. 일부 실시양태에서, 상기 방법은 (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함한다. 일부 실시양태에서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율은 약 0.1 내지 약 10 g/ℓ이다. 일부 실시양태에서, 상기 방법은 (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합 형태인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함한다. 일부 실시양태에서, 상기 방법은 (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함한다. 일부 실시양태에서, 단계 (b)에서 측정된 수율은 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이가 아니다.
본 발명은 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드도 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11로 제시된 아미노산 서열을 가진다. 관심 있는 단백질 또는 폴리펩티드는 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원일 수 있다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머(concatemer); F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택된다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 인간화된다. 일부 실시양태에서, 효소는 치료 효소이다. 일부 실시양태에서, 치료 효소는 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제(uricase); 로다나제(rhodanase); 유로키나제(urokinase); 스트렙토키나제(streptokinase); 스타필로키나제(staphylokinase); 페닐라제(phenylase); 사크로시다제(sacrosidase); 라이소자임(lysozyme); 키티나제(chitinase); 리보뉴클레아제(ribonuclease); 글루타미나제(glutaminase); 아르기나제(arginase); 비브릴라제(vibrilase); 콘드로이티나제(chondroitinase); 히알루로니다제(hyaluronidase); 갈락토시다제(galactosidase); 글루쿠로니다제(glucuronidase); 글루코세레브로시다제(glucocerebrosidase); 티미딘 포스포릴라제(phosphorylase); 카보닉 안하이드라제(carbonic anhydrase); 유리카제(uricase) 티오설페이트-시아나이드; 설퍼트랜스퍼라제(sulfurtransferase); 포스포티오에스터라제(phosphothioesterase); 알코올 산화효소; 알코올 데하이드로게나제(dehydrogenase); 아스파라기나제(asparaginase); 글루타민 합성효소; 아데노신 데아미나제(deaminase); 소 페가데마제(pegademase); 알글루세라제(alglucerase); 도르나제(dornase) 알파; 이미글루세라제(imiglucerase); 사크로시다제(sacrosidase); 라스부리카제(rasburicase); 아갈시다제(agalsidase) 베타; 및 낫토키나제(nattokinase)로부터 선택된다. 일부 실시양태에서, 융합 단백질은 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 결합 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택된다. 일부 실시양태에서, 폴리펩티드는 링커를 추가로 포함한다. 일부 실시양태에서, 폴리펩티드는 절단 도메인을 추가로 포함한다. 일부 실시양태에서, 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 주변세포질에서 발현되고 분비 신호 펩티드로부터 적절하게 절단된다. 일부 실시양태에서, 분비 신호 펩티드는 적절하게 절단된 형태, 가용성 형태, 활성 형태 또는 이들의 임의의 조합 형태의 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 온전한 또는 실질적으로 온전한 N-말단을 가질 수 있다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함한다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함하지 않는다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 실질적인 활성을 위해 실질적으로 온전한 N-말단을 필요로 한다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 온전한 N-말단을 가진 동일한 관심 있는 단백질 또는 폴리펩티드와 비교될 때 그의 활성의 약 90% 내지 100%를 가진다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주 세포는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스(V. natriegens), 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움(Corynebacterium) 또는 바실러스일 수 있다. 본 발명은 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터를 포함한다. 본 발명은 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터를 포함하는 원핵 숙주 세포를 포함한다. 일부 실시양태에서, 재조합 폴리펩티드를 코딩하는 발현 벡터 및/또는 핵산 구축물은 관심 있는 이종 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11의 분비 신호 펩티드를 코딩하는 핵산 서열을 포함한다. 일부 실시양태에서, 분비 신호 펩티드 아미노산 서열은 서열번호 12와 85% 내지 100% 서열 동일성을 가진 핵산 서열에 의해 코딩된다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움 또는 바실러스일 수 있다. 일부 실시양태에서, 재조합 폴리펩티드를 코딩하는 핵산 서열은 원핵 숙주 세포에서 발현되도록 최적화된다. 본 발명은 또한 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 본원에 기재된 바와 같은 재조합 폴리펩티드, 발현 벡터 또는 원핵 숙주 세포의 용도를 포함한다.
본 발명은 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법을 추가로 포함하고, 이때 상기 원핵 숙주 세포는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11로 제시된 아미노산 서열을 포함하고, 상기 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아니다. 이 방법은 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함할 수 있다. 관심 있는 단백질 또는 폴리펩티드는 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택될 수 있다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택된다. 일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체는 인간화된다. 일부 실시양태에서, 효소는 치료 효소이다. 일부 실시양태에서, 치료 효소는 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택된다. 일부 실시양태에서, 융합 단백질은 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택된다. 일부 실시양태에서, 핵산은 링커를 코딩한다. 일부 실시양태에서, 링커는 절단 도메인을 포함한다. 원핵 숙주 세포는 그람 음성 박테리아일 수 있다. 원핵 숙주 세포는 그람 양성 박테리아일 수 있다. 그람 음성 박테리아는 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이일 수 있다. 그람 양성 박테리아는 코리네박테리움 또는 바실러스일 수 있다.
참고에 의한 포함
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적 및 개별적으로 표시된 것과 동일한 정도로 본원에 참고로 포함된다.
본 발명의 신규 특징은 첨부된 청구범위에 구체적으로 기재되어 있다. 본 발명의 특징과 이점은 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 하기 상세한 설명 및 첨부된 도면을 참고함으로써 더 잘 이해될 것이다.
도 1. 0.5 ㎖ 규모에서 프로테아제 결핍 숙주 세포에서의 재조합 단백질 생성. DC1032 및 시험된 4가지 다른 프로테아제 결핍 슈도모나스 플루오레센스 균주에 의해 생성된 Fab' 단백질의 비환원 SDS-CGE 분석이 제시되어 있다. 각각의 균주에 대한 12개의 레인은 왼쪽에서 오른쪽으로 다음을 보여준다: 가장 왼쪽 레인 - MW가 16, 20, 29, 48 및 68 kD인 MW 래더; 1 내지 10으로 넘버링된 레인 - Fab' 중쇄 및 경쇄를 각각 코딩하는 구축물 1 내지 10을 사용함으로써 발현된 단백질. 구축물 1 내지 9 각각은 중쇄 유전자에 작동 가능하게 연결된 상이한 주변세포질 분비 신호를 코딩하는 핵산 서열을 갖고, 이들 각각은 경쇄 유전자에 작동 가능하게 연결된 Azu 분비 신호를 코딩하는 핵산 서열을 가졌다. 구축물 10은 구축물 3과 동일한 중쇄 분비 신호를 가졌다. 구축물 1 내지 9 각각은 슈도모나스 플루오레센스 유래 DsbC를 공-발현한 반면, 구축물 10은 공-발현하지 않았다. 레인 12(각각의 세트에서 가장 오른쪽 레인) - null 숙주 균주(null 발현 플라스미드를 가짐). 왼쪽에서 오른쪽으로, 처음 12개의 레인은 숙주 균주 DC1084에서의 Fab' 발현을 보여주고; 두 번째 12개의 레인은 DC977에서의 Fab' 단백질 발현을 보여주며; 세 번째 12개의 레인은 DC441에서의 Fab' 단백질 발현을 보여주고; 네 번째 12개의 레인은 DC1032에서의 Fab' 단백질 발현을 보여주고; 다섯 번째 12개의 레인은 DC509에서의 Fab' 단백질 발현을 보여준다. DC1032 레인 아래의 화살표는 Fab' 분해 생성물에 대한 이동 면적을 표시한다.
도 2. 준최적 조건 하에서 2 ℓ 규모에서 Prc null 숙주 균주의 생장. Y-축: OD575, X-축: 36℃에서 경과된 발효 시간(시). 격자선은 4시간 간격을 표시하며, 이때 마지막 시점은 62시간이다.
닫힌 원: STR36306(Fab' 발현 플라스미드; 약 27의 최대 OD575까지 생장)
다이아몬드: STR94998(DC1032 + null 플라스미드; 약 50의 최대 OD575까지 생장)
삼각형: STR94994(DC1032 MepS1 결실 + p688-048; 약 23의 최대 OD575까지 생장)
사각형: STR94995(DC1032 MepS2 결실 + p688-048; 약 33의 최대 OD575까지 생장)
열린 원: STR94996(DC1032 MepS1 결실 및 MepS2 결실 + p688-048; 약 22의 최대 OD575까지 생장).
도 3a 및 3b. 준최적 조건에서 Prc1 및 Prc2 결핍 숙주 균주 생장. 도 3a. 36℃에서 (pyrF 결실을 고려하여 생장을 허용하기 위해) NaCl의 부재 및 우라실의 존재 하에 1X LB 한천 배지에서 DC954 콜로니의 생장. 배경 생장이 있는 콜로니가 보인다. 도 3b. 왼쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC454(프로테아제 결실 없음)의 생장을 보여준다. 생장은 1X LB에서의 생장보다 더 느렸으나, 이 생장 조건은 치명적이지 않았다. 오른쪽 플레이트는 36℃에서 NaCl의 부재 및 우라실의 존재 하에 0.5X LB 한천 배지에서 DC954의 생장을 보여준다. 적응된(진화한) 세포는 생장할 수 있다.
도 4. 2 ℓ 규모에서 진화된 숙주 균주의 생장. Y-축: OD575, X-축: 발효 시간(시). 격자선은 4시간 간격을 표시하고, 이때 마지막 시점은 74시간이다(25.5시간에서의 유도). 각각의 균주 #에 대한 2개의 곡선에 상응하는, 각각의 균주의 두 배양물이 생장되었다.
삼각형: MepM1 결핍을 포함하도록 숙주 DC954로부터 진화된 PF1550, 생성된 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + p688-48(Fab')
열린 원: STR36306, 유전형 Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1 + p688-48(Fab')을 가진 숙주 DC1032
사각형: 유전형 Δprc1, Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1 + pDOW1169(빈 발현 벡터)를 가진 진화된 PF1557
닫힌 원: DC432, 유전형 ΔpyrF + pDOW1169(빈 발현 벡터)를 가진 숙주 DC454.
도 5. 생장+ 조합적 MepM 및 MepS 돌연변이체. 선택된 조합적 돌연변이에 의한 생장의 예. 왼쪽에서 오른쪽으로, 하기 돌연변이체 균주(DC454 대조군을 제외한 모든 Δprc1, Δprc2; 유전형에 대해서는 표 6 참조) 각각을 NaCl의 부재 하에 0.5X LB + 250 ㎍/㎖ 우라실 한천 배지에 점적하고 36℃에서 48시간 동안 인큐베이션하였다. 도면에 표시된 방향으로 플레이트의 위에서 아래로 농도가 낮아지면서 5개의 10배 연속 희석액이 각각의 행에 점적되었다.
제1열: DC1032(Prc-)
제2열: PF1559
제3열: PF1588
제4열: PF1560
제5열: PF1590
제6열: PF1572
제7열: PF1577
제8열: PF1573
제9열: PF1575
제10열: DC454(Prc+)
도 6. 프로테아제 결핍 숙주 균주에서의 경쇄 단백질용해. STR87639, STR92557, STR92567, STR94974 및 STR94976을 생장시키고 y-축에 표시된 유도 후 시간(시)에서 수거하였고, 재조합 단백질을 Capto-L 농후화하고 NR-SDS-CGE로 분석하였다. x-축은 각각의 레인에서 단백질용해된 경쇄 종의 퍼센트를 보여준다.
도 7. 다양한 발효 조건 하에서 프로테아제 결핍 숙주 균주에 의해 생성된 재조합 Fab'의 역가. 2 ℓ 발효기 규모에서 다양한 pH 및 온도 조건 하에서 유도된 균주 STR94974, STR94975 및 STR4977로부터의 Fab' 역가(Y-축)를, Fab'와 TNF-알파의 결합을 측정하는 BLI로 평가하였다. 생장을 32℃ 및 pH 6.5에서 2 ℓ 생물반응기 규모로 수행하였고 다양한 pH 및 온도 값에서 OD575에서 0.2 mM IPTG +/- 5 g/ℓ 만니톨로 유도하였다. 발효 유닛 식별기호는 X-축을 따라 표시되어 있다. DG3_U1(STR94974, 28℃ 및 pH 6.5에서 유도됨), DG3_U2(STR94974, 25℃ 및 pH 6), DG3_U3(STR94974, 32℃ 및 pH 6), DG3_U4(STR94974, 25℃ 및 pH 7), DG3_U5(STR94975, 28℃, pH 6.5, 5 g/ℓ 만니톨), DG3_u6(STR94975, 25℃, pH 6.0, 5 g/ℓ 만니톨), DG3_u7(STR94975, 32℃, pH 6.0 및 5 g/ℓ 만니톨), DG3_u8(STR94975, 25℃, pH 7.0), DG5_u1(STR94977, 28℃, pH 6.5), DG5_u2(STR94977, 25℃, pH 6.0), DG5_u3(STR94977, 32℃ pH 6.0), DG5_u4(STR94977, 25℃, pH 7.0), DG5_u5(STR94974, 32℃, pH 6.0), DG5_u6(STR94975, 32℃, pH 6.0, 5 g/ℓ 만니톨), DG5_u7(STR94975, 25℃, pH 7, 5 g/ℓ 만니톨), DG3_u8(STR94977, 32℃, pH 6.0). 유도 후 시간인 24시간, 48시간 및 72시간에서 전체 세포 브로쓰의 샘플을 처리하고 분석하였다. 72시간에서, 세포를 배지로부터 분리하여 무세포 브로쓰(CFB)에서 Fab' 역가를 평가하였다.
도 8a 및 8b. 균주 STR87639와 STR92557, STR92567, STR94974 및 STR94976의 생장 비교. 32℃ 및 pH 6.5에서 생장된 Fab' 발현 균주의 생장을 비교하는 그래프. 배양물을 경과된 발효 시간(EFT) 19.5시간, 32℃ 및 pH 6.0에서 0.2 mM IPTG로 유도하였다. OD575는 Y-축에 표시되어 있고 EFT는 X-축에 표시되어 있다. 도 8a. 유도 후 24시간까지 균주의 대표적인 생장 곡선. 도 8b. 유도 후 48시간까지 균주의 생장 곡선. 도 8a 및 8b 둘 다에서:
닫힌 사각형, 실선: STR87639 I24
삼각형, 실선: STR94974 #1
삼각형, 점선: STR94974 #2
삼각형, 파선: STR94974 #3
원, 실선: STR94976 I24
원, 점선: STR94976 #2
원, 파선: STR94976 #3
열린 다이아몬드, 실선: STR92557 #1
열린 다이아몬드, 점선: STR92557 #2
열린 다이아몬드, 파선: STR92557 #3
열린 사각형, 실선: STR92567 I24.
도 9. 균주 STR87639와 STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장 비교.
그래프는 Prc 결핍 Fab' 발현 균주 STR87639, STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장을 비교한다. 생장기를 32℃ 및 pH 6.5에서 수행하였다.
닫힌 원, 실선: STR87639
삼각형, 실선: STR92473
다이아몬드, 실선: STR94995
원, 파선: STR94998
열린 원, 실선: STR94996
사각형, 실선: STR94994
도 10. 뮤레인 DD-엔도펩티다제 보존된 아미노산 잔기를 보여주는 정렬. 보존된 잔기는 어두운 배경에 흰색 글자로 표시되어 있다. 제1행(상단 행) = 슈도모나스 플루오레센스 MepM1(서열번호 1); 제2행(위에서 두 번째) = 이. 콜라이 MepM(서열번호 63, YebA로서도 알려짐); 제3행 = 슈도모나스 에루기노사 MepM1(서열번호 66); 제4행(하단 행): 슈도모나스 푸티다 MepM1(서열번호 65).
본원은 고수율로 고품질 재조합 단백질을 제조하는 조성물 및 방법을 제공한다.
본 명세서 및 청구범위(들)에서 사용된 바와 같이, 용어 "포함하는"(및 "포함하는"의 임의의 형태, 예컨대, "포함한다" 및 "포함하고"), "가진"(및 "가진"의 임의의 형태, 예컨대, "가진다" 및 "갖고"), "포괄하는"(및 "포괄하는"의 임의의 형태, 예컨대, "포괄한다" 및 "포괄하고") 또는 "함유하는"(및 "함유하는"의 임의의 형태, 예컨대, "함유한다" 및 "함유하고")은 포괄적이거나 제한되지 않으며, 언급되지 않은 추가 요소 또는 방법 단계를 배제하지 않는다. 본원에서 제공된 임의의 조성물 및 방법의 일부 실시양태에서, "포함하는"은 "본질적으로 ~로 구성되는" 또는 "~로 구성되는"으로 대체될 수 있다. 어구 "본질적으로 ~로 구성되는"은 특정된 특징(들)뿐만 아니라, 청구된 발명의 특성 또는 기능에 실질적으로 영향을 미치지 않는 특징도 요구하기 위해 본원에서 사용된다. 본원에서 사용된 바와 같이, 용어 "구성되는"은 언급된 특징만의 존재를 표시하기 위해 사용된다. 본 명세서에서 논의된 임의의 실시양태는 본 개시내용의 임의의 방법 또는 조성물과 관련하여 구현될 수 있고, 그 반대도 가능하다는 것이 예상된다. 나아가, 본 개시내용의 조성물은 본 개시내용의 방법을 달성하는 데 사용될 수 있다.
본 명세서에서 "실시양태", "특정 실시양태", "바람직한 실시양태", "구체적인 실시양태", "일부 실시양태", "실시양태", "한 실시양태" 또는 "다른 실시양태"의 언급은 해당 실시양태와 관련하여 설명된 특정 특징, 구조 또는 특성이 본 개시내용의 적어도 일부 실시양태에 포함되지만 반드시 모든 실시양태에 포함되는 것이 아님을 의미한다.
박테리아 숙주 세포에서의 재조합 단백질 발현
박테리아 숙주 세포에서 발현된 재조합 단백질은 수십 개의 숙주 세포 프로테아제들 중 임의의 숙주 세포 프로테아제에 의해 분해된다. 분해는 단백질 품질과 수율을 낮추어, 종종 단백질용해에 민감한 단백질을 유용한 양으로 생성할 수 없게 만든다. 숙주 세포 내로의 프로테아제 결핍의 도입은 재조합 단백질 분해를 감소시킬 수 있지만, 이러한 결핍은 숙주 세포가 높은 밀도까지 생장하는 것을 방해할 수 있다. 좋지 않은 세포 생장은 재조합 단백질 수율을 감소시켜, 프로테아제 유전자 돌연변이의 이점을 무효화한다. 예를 들어, 본원에 기재된 바와 같이, 재조합 단백질의 감소된 분해를 보임에도 불구하고, 꼬리 특이적 프로테아제 활성이 결핍된 박테리아는 잘 생장하지 않는다.
본 발명은 세포 생장을 손상시키지 않으면서 고품질 재조합 단백질을 생성하도록 유전적으로 조작된 재조합 그람 음성 박테리아 숙주 세포에 관한 것이다. 일부 실시양태에서, 본 발명은 높은 세포 밀도까지 생장을 회복시키도록 추가로 변형된, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포에 관한 것이다. 꼬리 특이적 프로테아제 활성의 결핍으로 인한 생장 억제는 프로테아제 활성의 결핍을 야기하는 하나 이상의 추가 유전적 변형을 도입함으로써 극복된다. 종종 하나 초과의 숙주 세포 프로테아제 활성이 원치 않는 재조합 단백질 분해를 야기한다. 이를 해결하기 위해, 본 발명은 재조합 단백질 품질을 더 향상시키는 것으로 발견된 추가 단백질 결핍을 가진 숙주 세포도 제공한다. 고수율로 관심 있는 고품질(예를 들어, 활성, 가용성 및/또는 온전한) 재조합 단백질을 생성하기 위해 본 발명의 숙주 세포를 사용하는 방법도 제공한다.
재조합 단백질 생성을 향상시키는 숙주 세포 단백질 결핍
본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포를 제공한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 또는 폴딩 조절인자 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타낸다. 일부 실시양태에서, 추가 프로테아제, 자가용해 인자, 불활성화된 프로테아제, 샤페론 또는 폴딩 조절인자, 제1 프로테아제 및 제2 프로테아제는 각각 상이하다. 일부 실시양태에서, 추가 프로테아제, 자가용해 인자, 불활성화된 프로테아제, 또는 샤페론 또는 폴딩 조절인자는 제1 프로테아제 및/또는 제2 프로테아제와 동일하다. 일부 실시양태에서, 불활성화된 프로테아제는 추가 프로테아제와 동일하다. (c)의 과발현된 불활성화된 프로테아제 및 (d)의 과발현된 샤페론 또는 폴딩 조절인자 단백질은 숙주 세포에서 과발현될 관심 있는 재조합 단백질과 상이한 것으로 이해된다. 따라서, (c)의 과발현된 불활성화된 프로테아제 및/또는 (d)의 과발현된 샤페론 또는 폴딩 조절인자 단백질은 관심 있는 재조합 단백질과 함께 공-과발현될 수 있다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현하고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 샤페론을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 하나 이상의 추가 프로테아제 활성이 결핍되어 있고, 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 하나 이상의 불활성화된 프로테아제를 과발현하고, 하나 이상의 샤페론을 과발현한다.
일부 실시양태에서, 추가 프로테아제 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 추가 프로테아제 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 추가 결핍 프로테아제 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 추가 프로테아제 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 과발현된 불활성화된 프로테아제의 정상 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 과발현된 샤페론의 활성과 상이하다. 일부 실시양태에서, 자가용해 인자 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제1 프로테아제 활성과 동일하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 제2 프로테아제 활성과 동일하다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제의 정상 활성은 추가 결핍 프로테아제 활성과 동일하다.
일부 실시양태에서, 과발현된 샤페론의 활성은 제1 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 제1 프로테아제 활성 및 제2 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 추가 프로테아제 활성과 상이하다. 일부 실시양태에서, 과발현된 샤페론의 활성은 과발현된 불활성화된 프로테아제 활성과 상이하다.
일부 실시양태에서, 숙주 세포 단백질 활성, 예를 들어, 프로테아제 활성 또는 자가용해 인자 활성의 결핍은 이러한 활성을 가진 단백질을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 단백질 활성의 결핍은 이러한 활성을 가진 단백질을 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯되고, 이때 상기 적어도 2개의 유전자 각각은 본원에 기재된 바와 같은 관련 단백질을 코딩한다. 관련 단백질은 상동체일 수 있거나, 최소 서열 유사성 또는 동일성을 공유할 수 있거나, 이들 둘 다일 수도 있다. 일부 실시양태에서, 단백질 활성의 결핍은 임의의 관련 단백질 또는 임의의 단백질 상동체에 상응하는 임의의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 프로테아제 활성의 결핍은 임의의 관련 프로테아제 및/또는 프로테아제 상동체에 상응하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 임의의 관련 자가용해 인자 및/또는 자가용해 인자 상동체에 상응하는 유전자의 돌연변이로부터 비롯된다.
박테리아 꼬리 특이적 프로테아제
본 발명은 제1 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이다. 꼬리 특이적 프로테아제(Prc/Tsp)는 예를 들어, 본원에 참고로 포함되는 문헌[Expasy enzyme EC 3.4.21.102]에 기재되어 있다. Prc는 예를 들어, 본원에 참고로 포함되는 문헌[Kerr, C.H., et al., 2014, "Salinity-Dependent Impacts of ProQ, Prc, and Spr Deficiencies on Escherichia coli Cell Structure, J. Bact. 196(6):1286-1296]에 기재된 바와 같이 서열 의존적 방식으로 단백질 C-말단을 절단하기 때문에 꼬리 특이적 프로테아제(Tsp)로 명명된 ATP 의존적 주변세포질 프로테아제이다. 이. 콜라이에서 prc 유전자의 불활성화는 낮은 오스몰농도 하에 감열성 세포 생장을 부여한다(예를 들어, 본원에 참고로 포함되는 문헌[Hara H., et al., 1991, "Cloning, mapping, and characterization of the Escherichia coli prc gene, which is involved in C-terminal processing of penicillin-binding protein 3," J. Bact. 173(15):4799-813] 참조). 일부 그람 음성 박테리아는 2개 이상의 Prc 관련 단백질 또는 상동체, 예를 들어, 슈도모나스 플루오레센스 Prc1 및 Prc2를 코딩하는 유전자를 가진다. 꼬리 특이적 프로테아제는 에스케리키아(Escherichia), 비브리오(Vibrio), 에르위니아(Erwinia), 살모넬라(Salmonella), 클렙시엘라(Klebsiella), 레지오넬라(Legionella) 및 슈도모나드를 비롯한 많은 그람 음성 박테리아에서 발견된다.
꼬리 특이적 프로테아제는 박테리아 숙주 세포에서 발현된 재조합 단백질을 분해할 수 있다. 따라서, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 숙주 세포는 기능성 꼬리 특이적 프로테아제를 가진 상응하는 숙주 세포보다 더 높은 품질의 관심 있는 재조합 단백질을 생성할 수 있다. 예를 들어, 꼬리 특이적 프로테아제 활성이 결핍된 박테리아에서 생성된 항체 단편은 덜 분해된다(예를 들어, 본원의 실시예, 및 전체가 본원에 참고로 포함되는 미국 특허 제9,493,559호("Bacterial host strain expressing recombinant DsbC and having reduced Tsp activity") 참조). 그러나, 마찬가지로 확인된 바와 같이, 꼬리 특이적 프로테아제 활성이 결핍된 재조합 박테리아 숙주 세포는 높은 세포 밀도까지 생장하지 못한다. 결과적으로, 좋지 않은 세포 생장은 재조합 단백질의 수율의 감소로 이어진다. 본 발명은 꼬리 특이적 프로테아제 활성이 결핍된 재조합 숙주 세포를 더 변형시켜 제2 프로테아제 결핍을 도입하여, 높은 세포 밀도까지 생장할 수 있게 함으로써 이 문제를 극복한다. 추가 전략적 변형으로 재조합 단백질 수율을 증가시키는 방법도 제공한다.
일부 실시양태에서, 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이다. 꼬리 특이적 프로테아제 활성이 결핍된 숙주 세포는 꼬리 특이적 프로테아제, 꼬리 특이적 프로테아제 관련 단백질 및/또는 꼬리 특이적 프로테아제 상동체를 코딩하는 유전자의 돌연변이에 의해 달성될 수 있다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 슈도모나드 Prc를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc1, Prc1 관련 단백질 또는 Prc1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Prc1은 서열번호 33의 아미노산 서열을 가진다. 일부 실시양태에서, Prc1 관련 단백질은 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc2, Prc2 관련 단백질 또는 Prc2 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Prc2는 서열번호 35의 아미노산 서열을 가진다. 일부 실시양태에서, Prc2 관련 단백질은 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 Prc1, Prc1 관련 단백질 또는 Prc1 상동체를 코딩하는 유전자의 돌연변이, 및 Prc2, Prc2 관련 단백질 또는 Prc2 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 이. 콜라이 Prc(Tsp)를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 이. 콜라이 Tsp, Tsp 관련 단백질 또는 Tsp 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, Tsp는 이. 콜라이 Tsp의 아미노산 서열(서열번호 71)을 가진다. 일부 실시양태에서, Tsp 관련 단백질은 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, Tsp 관련 단백질은 서열번호 71의 상동체이다.
일부 실시양태에서, 꼬리 특이적 프로테아제 결핍은 서열번호 33의 아미노산 서열을 가진 Prc1, 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 33의 아미노산 서열을 가진 Prc1의 상동체, 서열번호 35의 아미노산 서열을 가진 Prc2, 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 35의 아미노산 서열을 가진 Prc2의 상동체, 서열번호 71의 아미노산 서열을 가진 Tsp, 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Tsp 관련 단백질, 및 서열번호 71의 아미노산 서열을 가진 Tsp의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다.
박테리아 펩티도글리칸 가수분해효소
박테리아 펩티도글리칸 가수분해효소는 펩티도글리칸 소낭 및/또는 이의 단편에서 결합을 절단한다. 펩티도글리칸 가수분해효소 활성은 세포벽 생장의 조절, 생장 동안 펩티도글리칸의 전환, 및 세포 분열과 자가용해 동안 딸세포의 분리에 중요하다. 펩티도글리칸 가수분해효소는 박테리아 집단에서 발생하는 용해 현상에도 관여한다.
펩티도글리칸 소낭은 짧은 펩티드에 의해 가교결합된 글리칸 가닥으로 구성되고, 대다수의 박테리아의 세포질막을 둘러싸는 폐쇄된 주머니 모양의 구조를 형성한다. 상기 소낭의 글리칸 가닥은 β1-4 결합에 의해 연결된 교대하는 N-아세틸글루코사민(GlcNAc)과 N-아세틸뮤람산(MurNAc) 잔기로 구성된다. 각각의 MurNAc 잔기의 D-락토일 기는 신생 펩티도글리칸에서 전형적으로 조성 L-Ala-γ-D-Glu-meso-A2pm(또는 L-Lys)-D-Ala-D-Ala(A2pm, 2,6-디아미노피멜산)을 가진 펩티드 줄기로 치환되고, 마지막 D-Ala 잔기는 성숙 거대분자에 존재하지 않는다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Vollmer, W. et al., 2008, "Peptidoglycan structure and architecture," FEMS Micro. Rev. 32:149-167]을 참조한다.
뮤레인 DD-엔도펩티다제
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성은 뮤레인 DD-엔도펩티다제 활성이다. 뮤레인 DD-엔도펩티다제는 소낭 글리칸 가닥의 줄기 펩티드에서 DD-결합을 절단한다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Vollmer, W. et al., 2008, "Bacterial peptidoglycan (murein) hydrolases," FEMS Micro. Rev. 32:259-286]을 참조한다. 에스케리키아, 비브리오, 에르위니아, 살모넬라, 클렙시엘라, 레지오넬라 및 슈도모나드를 비롯한 많은 박테리아로부터의 뮤레인 DD-엔도펩티다제가 상기 문헌에 설명되어 있다.
뮤레인 DD-엔도펩티다제 활성이 결핍된 숙주 세포는 뮤레인 DD-엔도펩티다제, 뮤레인 DD-엔도펩티다제 관련 단백질 및/또는 뮤레인 DD-엔도펩티다제 상동체를 코딩하는 하나 이상의 유전자의 돌연변이에 의해 달성될 수 있다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 유전자는 슈도모나스 플루오레센스 MepM1(서열번호 1), 이. 콜라이 MepM(YebA로서도 지칭됨)(서열번호 63), 슈도모나스 에루기노사 MepM1(서열번호 66) 및 슈도모나스 푸티다 MepM1(서열번호 65) 중 어느 하나의 아미노산 서열을 가진 프로테아제를 코딩한다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 플루오레센스 MepM1의 아미노산 서열(서열번호 1)을 가진 프로테아제, 슈도모나스 플루오레센스 MepM1 관련 단백질, 또는 슈도모나스 플루오레센스 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 이. 콜라이 MepM(YebA로서도 지칭됨)의 아미노산 서열(서열번호 63)을 가진 프로테아제, 이. 콜라이 MepM 관련 단백질, 또는 이. 콜라이 MepM 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제는 서열번호 63의 아미노산 서열을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 에루기노사 MepM1의 아미노산 서열(서열번호 66)을 가진 프로테아제, 슈도모나스 에루기노사 MepM1 관련 단백질 또는 슈도모나스 에루기노사 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 슈도모나스 푸티다 MepM1의 아미노산 서열(서열번호 65)을 가진 프로테아제, 슈도모나스 푸티다 MepM1 관련 단백질, 또는 슈도모나스 푸티다 MepM1 상동체를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제 관련 단백질은 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진다.
일부 실시양태에서, 뮤레인 DD-엔도펩티다제 결핍은 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제, 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다.
뮤레인 DD-엔도펩티다제 결핍은 본원의 다른 곳에 기재된 바와 같이 뮤레인 DD-엔도펩티다제를 코딩하는 숙주 세포 유전자의 어느 하나 이상의 돌연변이, 예를 들어, (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 또는 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 비롯될 수 있다. 일부 실시양태에서, 프로테아제 결핍은 서열번호 1로 제시된 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 보존된 영역, 또는 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제의 유사한 보존된 영역에서 아미노산을 변경시키는 돌연변이로부터 비롯된다. 도 10은 뮤레인 DD-엔도펩티다제 서열번호 1(슈도모나스 플루오레센스 MepM1), 서열번호 63(YebA로서도 지칭되는 이. 콜라이 MepM), 서열번호 66(슈도모나스 에루기노사 MepM1), 및/또는 서열번호 65(슈도모나스 푸티다 MepM1) 전체에 걸쳐 보존된 잔기를 표시하는 예시적인 아미노산 정렬을 보여준다. 일부 실시양태에서, 뮤레인 DD-엔도펩티다제의 결핍은 보존된 위치에서 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴하는 돌연변이로부터 비롯된다. 보존된 위치는 임의의 알려져 있는 방법에 의해 당업자에 의해 확인될 수 있다. 일부 실시양태에서, 보존된 위치는 뮤레인 DD-엔도펩티다제 아미노산 서열을 서열번호 1, 63, 66 및 65 중 어느 하나 이상의 서열과 비교함으로써 확인된다. 예를 들어, 아미노산 서열은 지니어스 프라임 소프트웨어(Genious Prime Software)를 사용함으로써 CLUSTAL Omega에 의해 도 10에 표시된 바와 같이 비교될 수 있다. 도 10은 어두운 음영과 함께 흰색 글자로 표시된 상응하는 보존된 아미노산 위치를 포함하는, 비교된 뮤레인 DD-엔도펩티다제 사이에서 정렬된 상응하는 아미노산 위치를 보여준다. 일부 실시양태에서, 돌연변이는 비보존적 아미노산 치환이다. 본원에 기재된 바와 같이, 아미노산 치환은 보존적 또는 비보존적 치환일 수 있다. 보존적 아미노산 치환 및 비보존적 아미노산 치환은 문헌에 기재되어 있으며, 당업자에게 잘 알려져 있고 본원에 기재되어 있는 방법에 의해 쉽게 확인될 수 있다(예를 들어, 보존적 아미노산 치환을 나열하는 표 2 참조). 일부 실시양태에서, 돌연변이, 예를 들어, 비보존적 아미노산 치환은 다음 위치들 중 임의의 위치에 상응하는 위치에서 뮤레인 DD-엔도펩티다제 아미노산 서열의 아미노산 잔기를 대체하거나 다른 방식으로 파괴한다: 표 1의 제2열에 나열된 서열번호 1 위치; 표 1의 제4열에 나열된 서열번호 63 위치; 표 1의 제8열에 나열된 서열번호 65 위치; 및 표 1의 제6열에 나열된 서열번호 66 위치. 일부 실시양태에서, 돌연변이, 예를 들어, 비보존적 아미노산 치환은 뮤레인 DD-엔도펩티다제 아미노산 서열의 아미노산 잔기를 대체하거나 다른 방식으로 파괴하고, 이때 대체되거나 파괴된 아미노산 잔기는 표 1의 제3열에 나열된 서열번호 1 잔기; 표 1의 제5열에 나열된 서열번호 63 잔기; 표 1의 제9열에 나열된 서열번호 65 잔기; 및 표 1의 제7열에 나열된 서열번호 66 잔기로부터 선택된 아미노산 잔기이다. 볼드체 텍스트는 서열번호 1, 63, 66 및 65 각각에서 활성 부위 보존된 위치를 표시한다.
비브리오 콜레라(Vibrio Cholera)에서, 주요 엔도펩티다제 ShyA(이. 콜라이 MepM의 상동체)의 활성은 촉매 부위의 접근성에 영향을 미치는 돌연변이에 의해 조절되는 것으로 보고되었다(특히 ShyA 활성 부위 및 알로스테릭 부위 아미노산 및 위치와 관련하여 본원에 참고로 포함되는 문헌[Shin, J-H et al., "Structural basis of peptidoglycan endopeptidase regulation," PNAS 117(21): 11692-11702, 2020]). 상기 문헌[Shin, et al.]은 ShyA가 잠재적으로 기질 결합을 위한 활성 부위의 노출을 허용하는 열린 입체구조, 및 닫힌 입체구조를 형성한다고 보고하였다. 구조적 예측을 기반으로, 상기 문헌[Shin, et al.]의 저자들은 ShyA 결합 도메인 1과 3(링커 도메인 2에 의해 분리됨) 사이의 소수성 상호작용 및 정전기적 상호작용이 이들을 근접하게 만들어 닫힌 입체구조를 형성한다고 추정하였다. 상기 문헌의 저자들은 불활성 입체구조를 안정화시키는, 도메인 2 돌연변이를 포함하는 알로스테릭 부위 돌연변이가 ShyA 활성을 낮춘다는 것을 발견하였다. 슈도모나스 플루오레센스 MepM1은 비브리오 콜레라 ShyA(서열번호 58)와 65% 유사성을 가진다.
일부 실시양태에서, 뮤레인 DD-엔도펩티다제, 이의 상동체, 또는 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤린 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 알로스테릭 부위 아미노산을 변경시키거나 다른 방식으로 파괴한다.
일부 실시양태에서, 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 활성 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 활성 부위 위치는 서열번호 1의 영역 319 내지 411 내의 임의의 위치에 상응한다.
일부 실시양태에서, 서열번호 1, 63, 66 또는 65로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 보존된 촉매(활성) 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 파괴된 보존된 활성 부위 위치는 영역 319 내지 411 내의 임의의 보존된 위치에 상응한다(표 1의 제54행 내지 제91행에 나열됨). 일부 실시양태에서, 활성 부위 아미노산 잔기는 서열번호 1의 촉매 아미노산 잔기 R319, H330, D334, H378 및 H411 중 어느 하나에 상응한다. 일부 실시양태에서, 돌연변이는 서열번호 1의 촉매 부위 아미노산 잔기 R319, H330, D334, H378 및 H411, 및 이들의 임의의 조합에 상응하는 아미노산 잔기의 결실을 야기한다. 일부 실시양태에서, 돌연변이는 서열번호 1의 Y248에 상응하는 위치에 있는 넌센스 돌연변이이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 332에 상응하는 위치에 있는 G에서 S로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 334에 상응하는 위치에 있는 D에서 N으로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 337에 상응하는 위치에 있는 A에서 T로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 411에 상응하는 위치에 있는 H에서 Y로의 치환이다. 일부 실시양태에서, 돌연변이는 서열번호 1의 410에 상응하는 위치에 있는 P에서 L로의 치환이다.
일부 실시양태에서, 서열번호 1, 63, 66, 65 및/또는 71로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 알로스테릭 부위 위치에서 아미노산을 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 알로스테릭 부위 위치는 서열번호 1의 영역 134 내지 145, 및 361 내지 378 내의 임의의 위치에 상응한다.
일부 실시양태에서, 서열번호 1, 63, 66, 65 및/또는 71로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 보존된 알로스테릭 부위 위치에서 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 파괴된 보존된 알로스테릭 부위 위치는 서열번호 1의 영역 134 내지 145(표 1의 제11행 및 제12행에 나열됨), 및 361 내지 378(표 1의 제71행 내지 제79행에 나열됨) 내의 임의의 보존된 위치에 상응한다.
일부 실시양태에서, 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 서열번호 1의 영역 134 내지 145, 361 내지 378, 및 319 내지 411 내의 임의의 위치에 상응하는 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 상기 돌연변이는 서열번호 1의 영역 134 내지 145, 361 내지 378, 및 319 내지 411 내의 임의의 위치에 있는 아미노산에 상응하는 아미노산의 비보존적 치환을 야기한다.
일부 실시양태에서, 서열번호 1로 제시된 뮤레인 DD-엔도펩티다제 아미노산 서열과 적어도 60% 유사성을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이는 서열번호 1의 K140, L145, Y248, R319, P322, H330, G332, V333, D334, A336, A337, P338, G340, T341, P342, G347, D348, G349, A354, R356, G358, G361, V364, I366, H368, G369, Y372, T374, Y376, H378, G389, V392, K393, G395, I398, G402, T404, G405, T408, G409, P410 및 H411 중 어느 하나 이상에 상응하는 아미노산을 (예를 들어, 치환, 결실, 삽입 또는 절단으로) 변경시키거나 다른 방식으로 파괴한다. 일부 실시양태에서, 상기 돌연변이는 서열번호 1의 K140, L145, Y248, R319, P322, H330, G332, V333, D334, A336, A337, P338, G340, T341, P342, G347, D348, G349, A354, R356, G358, G361, V364, I366, H368, G369, Y372, T374, Y376, H378, G389, V392, K393, G395, I398, G402, T404, G405, T408, G409, P410 및 H411 중 어느 하나 이상에 상응하는 아미노산의 비보존적 치환을 야기한다.
MepS/Spr
중요한 그람 음성 박테리아 뮤레인 DD-엔도펩티다제는 이. 콜라이에서 Spr로서도 알려진 MepS이다(예를 들어, 본원에 참고로 포함되는 문헌[Expasy enzyme EC 3.4.17.13] 및 문헌[Singh, S. K. et al., 2012, "Three redundant murein endopeptidases catalyse an essential cleavage step in peptidoglycan synthesis of Escherichia coli K12," Mol. Microbiol. 86(5): 1036-1051] 참조). 본원에 참고로 포함되는 문헌[Truong, T.T. et al., 2020, "Cell division is antagonized by the activity of peptidoglycan endopeptidases that promote cell elongation," Mol. Microbiol. 114: 966-978]은 (예를 들어, Prc/Tsp의 부재 하에) 꼬리 특이적 프로테아제 분해에 의한 확인되지 않은 MepS 단백질 전환이 세포 생장 억제, 및 세포 분열 동안 형태학적 결함의 발생을 초래한다고 보고하였다.
이. 콜라이와 관련하여, prc의 결실이 고밀도 발효에서 생장을 억제하고 아미노산 치환에 의한 MepS의 불활성화가 575 nm에서 광학 밀도(OD) >= 200까지 생장을 회복시키는 데 필요한 것으로 보고되었다(본원에 각각 참고로 포함되는 미국 특허 제9,493,559호(Hara, H. et al. 1996) 및 유럽 특허 제1341899B1호). 유사하게, 슈도모나드에서 두 Prc 유전자들의 완전한 불활성화는 생물반응기에서 높은 세포 밀도 생장을 방해하고, 배양물은 2 ℓ 생물반응기에서 최대 180의 OD575에 도달하는, 두 Prc 유전자들을 발현하는 균주와 비교될 때 20 내지 50의 OD575를 넘어 생장하지 못한다(본원의 실시예 참조). 그러나, 실시예에 나타낸 바와 같이, 슈도모나스 플루오레센스에서 MepS 상동체의 완전한 제거는 Prc 활성의 결핍으로부터 비롯된 생장 결함을 레스큐하지 못한다. 오히려, MepM1 활성의 결핍은 고밀도 세포 생장을 회복시키는 것으로 밝혀졌다. 더욱이, Prc 및 MepM1 활성이 결핍된 슈도모나드 숙주 세포에서 MepS1의 결핍은 세포 생장에 악영향을 미쳐, MepM1 활성 결핍의 도입 시 관찰된 생장의 회복을 무효화하였다.
일부 실시양태에서, 본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 임의로 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로; 이때 상기 숙주 세포는 기능성 MepS 뮤레인 DD-엔도펩티다제를 생성한다. 일부 실시양태에서, 본 발명은 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 임의로 추가로 (a) 하나 이상의 추가 프로테아제 활성이 결핍되어 있거나; (b) 하나 이상의 자가용해 인자 활성이 결핍되어 있거나; (c) 하나 이상의 불활성화된 프로테아제를 과발현하거나; (d) 하나 이상의 샤페론 단백질을 과발현하거나; (e) (a), (b), (c) 및 (d)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포를 제공하는 것으로; 이때 상기 숙주 세포는 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 기능성 MepS 뮤레인 DD-엔도펩티다제를 갖고/갖거나 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않은 재조합 숙주 세포는 슈도모나드이다. 일부 실시양태에서, 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 기능성 MepS 뮤레인 DD-엔도펩티다제를 갖고/갖거나 MepS 뮤레인 DD-엔도펩티다제가 결핍되어 있지 않은 재조합 숙주 세포는 이. 콜라이가 아니다. 일부 실시양태에서, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73으로 제시된 아미노산 서열; 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73과 적어도 60% 유사하거나 적어도 60% 동일한 아미노산 서열; 또는 서열번호 5, 서열번호 7, 서열번호 72 또는 서열번호 73의 상동체를 가진다. 일부 실시양태에서, 숙주 세포는 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이고, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 MepS1(서열번호 5)이다. 일부 실시양태에서, 숙주 세포는 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이고, 기능성 및/또는 결핍되지 않은 MepS 뮤레인 DD-엔도펩티다제는 MepS2(서열번호 7)이다. 일부 실시양태에서, 재조합 숙주 세포는 기능성 및/또는 결핍되지 않은 MepS1(서열번호 5) 및 MepS2(서열번호 7)를 가진 슈도모나드, 예를 들어, 슈도모나스 플루오레센스이다.
추가 결핍 단백질 활성
본원에 제시된 바와 같이, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포는 추가로 적어도 하나의 추가 단백질 활성이 결핍될 수 있다. 하나 이상의 추가 단백질 활성의 결핍은 재조합 단백질의 더 높은 품질과 수율을 제공하는 것으로 밝혀졌다. 이 추가 단백질은 추가 프로테아제 및 자가용해 인자를 포함한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 하나 이상의 추가 단백질 활성이 결핍되어 있다. 일부 실시양태에서, 추가 단백질 활성은 프로테아제 활성 또는 자가용해 인자 활성이다.
일부 실시양태에서, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 추가로 결핍되어 있다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 추가 프로테아제 활성을 가진 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 추가 프로테아제 활성을 가진 추가 프로테아제(들)를 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 1개 내지 10개의 상이한 추가 프로테아제 활성은 상응하는 추가 프로테아제(들)를 코딩하는 1개 내지 30개의 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 추가 프로테아제는 세랄라이신 전구체(예를 들어, 세포외 알칼리 메탈로프로테아제, 예를 들어, RXF04495.2, 또는 자가용해 세랄라이신 전구체, 예를 들어, RXF4500), 막 국소화 프로테아제(예를 들어, HtpX, FtsH, OmpT), 뮤레인 L,D 트랜스펩티다제, 헤모라이신 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제(예를 들어, DegP 또는 DegP2), AAA+ 패밀리 단백질용해 기구(예를 들어, HslU/HslV) 또는 뮤레인 DD-엔도펩티다제(예를 들어, MepM, 예를 들어, 슈도모나드 MepM2)이다.
일부 실시양태에서, 추가 프로테아제는 다음으로부터 선택된다:
서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 39로 제시된 아미노산 서열을 가진 HtpX인 막 국소화 프로테아제; 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체; 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질;
서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제; 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체; 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질;
서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체; 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체; 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질;
서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체; 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체; 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질;
서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP2의 상동체; 또는 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질인 주변세포질 세린 엔도프로테아제;
서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제; 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체; 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질, 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제; 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체; 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하는 AAA+ 패밀리 단백질용해 기구;
서열번호 3으로 제시된 아미노산 서열을 가진 프로테아제(슈도모나스 플루오레센스 MepM2), 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제;
서열번호 64로 제시된 아미노산 서열을 가진 프로테아제(이. 콜라이 MepM2), 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제;
서열번호 67로 제시된 아미노산 서열을 가진 프로테아제(슈도모나스 푸티다 MepM2), 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제; 및
서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제(슈도모나스 에루기노사), 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체, 또는 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 60% 서열 동일성을 가진 MepM2 관련 단백질인 뮤레인 DD-엔도펩티다제.
추가 프로테아제 활성의 결핍은 아미노펩티다제; 디펩티다제; 디펩티딜-펩티다제; 트리펩티딜 펩티다제; 펩티딜-디펩티다제; 세린형 카르복시펩티다제; 메탈로카르복시펩티다제; 시스테인형 카르복시펩티다제; 오메가펩티다제; 세린 프로테이나제; 시스테인 프로테이나제; 아스파르트산 프로테이나제; 메탈로프로테이나제; 또는 알려지지 않은 기작의 프로테이나제의 돌연변이로부터 비롯될 수 있다.
아미노펩티다제는 세포질 아미노펩티다제(류실 아미노펩티다제), 막 알라닐 아미노펩티다제, 시스티닐 아미노펩티다제, 트리펩티드 아미노펩티다제, 프롤릴 아미노펩티다제, 아르기닐 아미노펩티다제, 글루타밀 아미노펩티다제, x-pro 아미노펩티다제, 박테리아 류실 아미노펩티다제, 호열성 아미노펩티다제, 클로스트리디움 아미노펩티다제, 세포질 알라닐 아미노펩티다제, 라이실 아미노펩티다제, x-trp 아미노펩티다제, 트립토파닐 아미노펩티다제, 메티오닐 아미노펩티다제, d-입체특이적 아미노펩티다제, 아미노펩티다제 등을 포함한다. 디펩티다제는 x-his 디펩티다제, x-arg 디펩티다제, x-메틸-his 디펩티다제, cys-gly 디펩티다제, glu-glu 디펩티다제, pro-x 디펩티다제, x-pro 디펩티다제, met-x 디펩티다제, 비입체특이적 디펩티다제, 세포질 비특이적 디펩티다제, 막 디펩티다제, 베타-ala-his 디펩티다제를 포함한다. 디펩티딜-펩티다제 및 트리펩티딜 펩티다제는 디펩티딜-펩티다제 i, 디펩티딜-펩티다제 ii, 디펩티딜-펩티다제 iii, 디펩티딜-펩티다제 iv, 디펩티딜-디펩티다제, 트리펩티딜-펩티다제 I, 트리펩티딜-펩티다제 II를 포함한다. 펩티딜-디펩티다제는 펩티딜-디펩티다제 a 및 펩티딜-디펩티다제 b를 포함한다. 세린형 카르복시펩티다제는 라이소좀 pro-x 카르복시펩티다제, 세린형 D-ala-D-ala 카르복시펩티다제, 카르복시펩티다제 C, 카르복시펩티다제 D를 포함한다. 메탈로카르복시펩티다제는 카르복시펩티다제 a, 카르복시펩티다제 B, 라이신(아르기닌) 카르복시펩티다제, gly-X 카르복시펩티다제, 알라닌 카르복시펩티다제, 뮤라모일펜타펩티드 카르복시펩티다제, 카르복시펩티다제 h, 글루타메이트 카르복시펩티다제, 카르복시펩티다제 M, 뮤라모일테트라펩티드 카르복시펩티다제, 아연 d-ala-d-ala 카르복시펩티다제, 카르복시펩티다제 A2, 막 pro-x 카르복시펩티다제, 튜불리닐-tyr 카르복시펩티다제, 카르복시펩티다제 t를 포함한다. 오메가펩티다제는 아실아미노아실-펩티다제, 펩티딜-글리신아미다제, 피로글루타밀-펩티다제 I, 베타-아스파르틸-펩티다제, 피로글루타밀-펩티다제 II, n-포르밀메티오닐-펩티다제, 프테로일폴리-[감마]-글루타메이트 카르복시펩티다제, 감마-glu-X 카르복시펩티다제, 아실뮤라모일-ala 펩티다제를 포함한다. 세린 프로테이나제는 카이모트립신, 카이모트립신 c, 메트리딘, 트립신, 트롬빈, 응고 인자 Xa, 플라스민, 엔테로펩티다제, 아크로신, 알파 용해성 프로테아제, 글루타밀, 엔도펩티다제, 카텝신 G, 응고 인자 viia, 응고 인자 ixa, 쿠쿠미시(cucumisi), 프롤릴 올리고펩티다제, 응고 인자 xia, 브라큐린(brachyurin), 혈장 칼리크레인(kallikrein), 조직 칼리크레인, 췌장 엘라스타제, 백혈구 엘라스타제, 응고 인자 xia, 키마제(chymase), 보체 성분 c1r55, 보체 성분 c1s55, 고전적 보체 경로 c3/c5 전환효소, 보체 인자 I, 보체 인자 D, 대안적 보체 경로 c3/c5 전환효소, 세레비신(cerevisin), 하이포더민(hypodermin) C, 라이실 엔도펩티다제, 엔도펩티다제 1a, 감마-레니(reni), 베놈빈(venombin) ab, 류실 엔도펩티다제, 트립타제, 스쿠텔라린(scutelarin), 켁신(kexin), 서브틸리신(subtilisin), 오리진(oryzin), 엔도펩티다제 k, 써모마이콜린(thermomycolin), 테르미타제(thermitase), 엔도펩티다제 SO, T-플라스미노겐 활성화제, 단백질 C, 췌장 엔도펩티다제 E, 췌장 엘라스타제 ii, IGA 특이적 세린 엔도펩티다제, U-플라스미노겐, 활성화제, 베놈빈 A, 푸린(furin), 미엘로블라스틴(myeloblastin), 세메노겔라제(semenogelase), 그랜자임(granzyme) A 또는 세포독성 T 림프구 프로테이나제 1, 그랜자임 B 또는 세포독성 T 림프구 프로테이나제 2, 스트렙토그리신(streptogrisin) A, 트렙토그리신(treptogrisin) B, 글루타밀 엔도펩티다제 II, 올리고펩티다제 B, 리물루스(limulus) 응고 인자 c, 리물루스 응고 인자, 리물루스 응고 효소, 옴틴(omptin), 억제제 렉사(lexa), 박테리아 리더 펩티다제 I, 토가비린(togavirin), 플라비린(flavirin)을 포함한다. 시스테인 프로테이나제는 카텝신(cathepsin) B, 파파인(papain), 피신(ficin), 카이모파파인(chymopapain), 아스클레파인(asclepain), 클로스트리파인(clostripain), 스트렙토파인(streptopain), 악티나이드(actinide), 카텝신 1, 카텝신 H, 칼파인(calpain), 카텝신 t, 글리실, 엔도펩티다제, 암 응고촉진제, 카텝신 S, 피코르나인(picornain) 3C, 피코르나인 2A, 카리카인(caricain), 아나나인(ananain), 줄기 브로멜라인(bromelain), 과일 브로멜라인, 레구마인(legumain), 히스토라이세인(histolysain), 인터류킨 1-베타 전환 효소를 포함한다. 아스파르트 프로테이나제는 펩신 A, 펩신 B, 가스트리신(gastricsin), 카이모신, 카텝신 D, 네오펜테신, 레닌(renin), 레트로펩신, 프로-오피오멜라노코르틴(pro-opiomelanocortin) 전환 효소, 아스퍼길로펩신(aspergillopepsin) I, 아스퍼길로펩신 II, 페니실로펩신, 리조푸스펩신, 엔도티아펩신, 뮤코로펩신, 칸디다펩신, 사카로펩신, 로도토룰라펩신(rhodotorulapepsin), 파이사로펩신(physaropepsin), 아크로실린드로펩신(acrocylindropepsin), 폴리포로펩신(polyporopepsin), 피크노포로펩신(pycnoporopepsin), 스키탈리도펩신(scytalidopepsin) a, 스키탈리도펩신 b, 크산토모나펩신(xanthomonapepsin), 카텝신 e, 배리어펩신(barrierpepsin), 박테리아 리더 펩티다제 I, 슈도모나펩신, 플라스멥신(plasmepsin)을 포함한다. 메탈로프로테이나제는 아트로라이신(atrolysin) a, 미생물 콜라게나제, 류코라이신, 간질 콜라게나제, 네프릴라이신(neprilysin), 엔벨라이신(envelysin), iga 특이적 메탈로엔도펩티다제, 프로콜라겐 N-엔도펩티다제, 티메트(thimet) 올리고펩티다제, 뉴로라이신(neurolysin), 스트로멜라이신(stromelysin) 1, 메프린(meprin) A, 프로콜라겐 C-엔도펩티다제, 펩티딜-lys 메탈로엔도펩티다제, 아스타신(astacin), 스트로멜라이신 2, 매트릴라이신 젤라티나제, 에로모노라이신(aeromonolysin), 슈도라이신(pseudolysin), 써모라이신(thermolysin), 바실로라이신(bacillolysin), 아우레오라이신(aureolysin), 코코라이신(coccolysin), 마이코라이신(mycolysin), 베타-용해성 메탈로엔도펩티다제, 펩티딜-asp 메탈로엔도펩티다제, 호중구 콜라게나제, 젤라티나제 B, 레이슈마놀라이신(leishmanolysin), 사카로라이신(saccharolysin), 오토라이신(autolysin), 듀테로라이신(deuterolysin), 세랄라이신, 아트로라이신(atrolysin) B, 아트로라이신 C, 아트록사제(atroxase), 아트로라이신 E, 아트로라이신 F, 아다마라이신(adamalysin), 호릴라이신(horrilysin), 루버라이신(ruberlysin), 보쓰로파신(bothropasin), 보쓰로라이신, 오피오라이신(ophiolysin), 트리메레라이신(trimerelysin) I, 트리메레라이신 II, 뮤크로라이신(mucrolysin), 피트릴라이신(pitrilysin), 인슐라이신(insulysin), O-시알로당단백질 엔도펩티다제, 루셀라이신(russellysin), 미토콘드리아, 중간체, 펩티다제, 닥틸라이신(dactylysin), 나르딜라이신(nardilysin), 마그놀라이신(magnolysin), 메프린(meprin) B, 미토콘드리아 처리 펩티다제, 대식세포 엘라스타제, 코리오라이신(choriolysin), 톡실라이신(toxilysin)을 포함한다. 알려지지 않은 기작의 프로테이나제는 써몹신(thermopsin) 및 다중촉매성 엔도펩티다제 복합체를 포함한다.
특정 프로테아제들은 프로테아제 및 샤페론 유사 활성 둘 다를 가진다. 이 프로테아제들은 단백질 수율 및/또는 품질에 부정적인 영향을 미칠 때, 이들의 프로테아제 활성을 특이적으로 결실시키는 것이 종종 유용하며, 이들은 이들의 샤페론 활성이 단백질 수율 및/또는 품질에 긍정적인 영향을 미칠 수 있을 때 과발현된다. 이 프로테아제들은 Hsp100(Clp/Hsl) 계열 구성원 RXF04587.1(clpA), RXF08347.1, RXF04654.2(clpX), RXF04663.1, RXF01957.2(hslU), RXF01961.2(hslV); 펩티딜-프롤릴 시스-트랜스 이소머라제 계열 구성원 RXF05345.2(ppiB); 메탈로펩티다제 M20 계열 구성원 RXF04892.1(아미노가수분해효소); 메탈로펩티다제 M24 계열 구성원 RXF04693.1(메티오닌 아미노펩티다제) 및 RXF03364.1(메티오닌 아미노펩티다제); 및 세린 펩티다제 S26 신호 펩티다제 I 계열 구성원 RXF01181.1(신호 펩티다제)을 포함하나 이들로 제한되지 않는다.
이들 및 다른 프로테아제와 폴딩 조절인자는 당분야에 알려져 있으며, 전체가 참고로 포함되는 문헌, 예를 들어, 미국 특허 제8,603,824호("Process for improved protein expression by strain engineering")에 기재되어 있다. 예를 들어, '824 특허의 표 D는 Tig(tig, 유발제 인자, FKBP형 피아제(ppiase)(ec 5.2.1.8) RXF04655, UniProtKB - P0A850(TIG_ECOLI))를 설명한다. 미국 특허 제9,394,571호 및 제9,580,719호(둘 다 발명의 명칭이 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임)는 Tig(RXF04655.2, 이 특허들에서 서열번호 34), LepB(RXF01181.1, 이 특허들에서 서열번호 56), DegP1(RXF01250, 이 특허들에서 서열번호 57), AprA(RXF04304.1, 이 특허들에서 서열번호 86), Prc1(RXF06586.1, 이 특허들에서 서열번호 120), DegP2(RXF07210.1, 이 특허들에서 서열번호 124), Lon(RXF04653, 이 특허들에서 서열번호 92); DsbA(RXF01002.1, 이 특허들에서 서열번호 25) 및 DsbC(RXF03307.1, 이 특허들에서 서열번호 26)를 설명한다. 이 서열들, 및 다른 프로테아제와 폴딩 조절인자에 대한 서열도 전체가 본원에 참고로 포함되는 미국 특허 제9,580,719호(이 특허의 컬럼 93 내지 98의 서열번호 표)에 제시되어 있다. 예를 들어, 미국 특허 제9,580,719호는 HslU(RXF01957.2) 및 HslV(RXF01961.2)를 코딩하는 서열을 각각 서열번호 18 및 19로서 제공한다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성 내지 2개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 3개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 1개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 3의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 4개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 5개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 6개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 7개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 8개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성 내지 9개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성, 또는 9개의 추가 프로테아제 활성 내지 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 9개의 추가 프로테아제 활성, 또는 10개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 추가 프로테아제 활성, 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 또는 9개의 추가 프로테아제 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 추가 프로테아제 활성, 3개의 추가 프로테아제 활성, 4개의 추가 프로테아제 활성, 5개의 추가 프로테아제 활성, 6개의 추가 프로테아제 활성, 7개의 추가 프로테아제 활성, 8개의 추가 프로테아제 활성, 9개의 추가 프로테아제 활성 또는 10개의 추가 프로테아제 활성이 결핍되어 있다.
일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자 내지 2개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 3개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 1개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 3개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 4개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 5개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 6개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 8개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 10개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 15개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 20개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자 내지 25개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자, 또는 25개의 추가 프로테아제 유전자 내지 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 25개의 추가 프로테아제 유전자 또는 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 적어도 1개의 추가 프로테아제 유전자, 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 또는 25개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 최대 2개의 추가 프로테아제 유전자, 3개의 추가 프로테아제 유전자, 4개의 추가 프로테아제 유전자, 5개의 추가 프로테아제 유전자, 6개의 추가 프로테아제 유전자, 8개의 추가 프로테아제 유전자, 10개의 추가 프로테아제 유전자, 15개의 추가 프로테아제 유전자, 20개의 추가 프로테아제 유전자, 25개의 추가 프로테아제 유전자 또는 30개의 추가 프로테아제 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 예를 들어, 이. 콜라이에서, 추가 프로테아제 활성은 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 (슈도모나드 MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 또는 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 하나 이상을 코딩하는 뮤레인 DD-엔도펩티다제 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 꼬리 특이적 프로테아제 활성 및 뮤레인-DD-엔도펩티다제 활성이 결핍된 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 자가용해 인자 활성이 추가로 결핍되어 있다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 상응하는 자가용해 인자 활성을 가진 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 자가용해 인자 활성의 결핍은 자가용해 인자 활성을 가진 자가용해 인자(들)를 코딩하는 적어도 2개의 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 1개 내지 10개의 상이한 자가용해 인자 활성은 상응하는 자가용해 인자(들)를 코딩하는 1개 내지 30개의 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 자가용해 인자는 S형 피오신(pyocin), 선형 그라미시딘 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 또는 포린이다.
일부 실시양태에서, 자가용해 인자는 다음으로부터 선택된다:
서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신; 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체; 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질;
서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소; 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체; 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질;
서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신; 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체; 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질; 및
서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체; 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체; 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성 내지 2개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 3개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 1개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 3개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 2개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 4개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 3개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 5개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 4개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 6개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 5개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 7개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 6개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 8개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 7개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 8개의 자가용해 인자 활성 내지 9개의 자가용해 인자 활성, 8개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성, 또는 9개의 자가용해 인자 활성 내지 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 자가용해 인자 활성, 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 9개의 자가용해 인자 활성, 또는 10개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 자가용해 인자 활성, 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 또는 9개의 자가용해 인자 활성이 결핍되어 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 자가용해 인자 활성, 3개의 자가용해 인자 활성, 4개의 자가용해 인자 활성, 5개의 자가용해 인자 활성, 6개의 자가용해 인자 활성, 7개의 자가용해 인자 활성, 8개의 자가용해 인자 활성, 9개의 자가용해 인자 활성, 또는 10개의 자가용해 인자 활성이 결핍되어 있다.
일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자 내지 2개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 3개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 1개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 3개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 4개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 5개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 6개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 8개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 10개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 15개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 20개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자 내지 25개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자, 또는 25개의 자가용해 인자 유전자 내지 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 1개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 25개의 자가용해 인자 유전자 또는 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 적어도 1개의 자가용해 인자 유전자, 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 또는 25개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 프로테아제 활성의 결핍은 최대 2개의 자가용해 인자 유전자, 3개의 자가용해 인자 유전자, 4개의 자가용해 인자 유전자, 5개의 자가용해 인자 유전자, 6개의 자가용해 인자 유전자, 8개의 자가용해 인자 유전자, 10개의 자가용해 인자 유전자, 15개의 자가용해 인자 유전자, 20개의 자가용해 인자 유전자, 25개의 자가용해 인자 유전자 또는 30개의 자가용해 인자 유전자의 돌연변이로부터 비롯된다.
일부 실시양태에서, 추가 단백질 활성의 결핍은 제1 프로테아제 및/또는 제2 프로테아제와 상이한 추가 단백질을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 상기 돌연변이는 꼬리 특이적 프로테아제를 코딩하는 유전자에 존재하지 않는다. 일부 실시양태에서, 추가 단백질 결핍은 서열번호 33의 아미노산 서열을 가진 Prc1, 서열번호 33의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 33의 아미노산 서열을 가진 Prc1의 상동체, 서열번호 35의 아미노산 서열을 가진 Prc2, 서열번호 35의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Prc1 관련 단백질, 서열번호 35의 아미노산 서열을 가진 Prc2의 상동체, 서열번호 71의 아미노산 서열을 가진 Tsp, 서열번호 71의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 Tsp 관련 단백질, 및 서열번호 71의 아미노산 서열을 가진 Tsp의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯되지 않는다. 일부 실시양태에서, 돌연변이는 서열번호 33, 35 및 71 중 어느 한 서열번호의 아미노산 서열과 60% 미만의 유사성 또는 동일성, 50% 미만의 유사성 또는 동일성, 40% 미만의 유사성 또는 동일성, 또는 30% 미만의 유사성 또는 동일성을 가진 아미노산 서열을 가진 단백질을 코딩하는 유전자에 존재한다.
일부 실시양태에서, 추가 단백질(예를 들어, 프로테아제 또는 자가용해 인자) 활성의 결핍은 제1 프로테아제 및/또는 제2 프로테아제를 코딩하는 유전자와 상이한 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 추가 단백질 활성의 결핍은 MepM1 뮤레인 DD-엔도펩티다제를 코딩하는 유전자의 돌연변이로부터 비롯되지 않는다. 일부 실시양태에서, 어느 하나 이상의 그람 음성 박테리아 숙주 세포에서, 돌연변이는 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 1의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 1의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 63의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 63의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 65의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 65의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepM), 서열번호 66의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 66의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 또는 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자에 존재하지 않는다. 이 실시양태들에서, 돌연변이는 서열번호 1, 63, 65, 66, 5, 7, 72, 73 및 32 중 어느 한 서열번호의 아미노산 서열과 60% 미만의 유사성 또는 동일성, 50% 미만의 유사성 또는 동일성, 40% 미만의 유사성 또는 동일성, 또는 30% 미만의 유사성 또는 동일성을 가진 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제를 코딩하는 유전자에 있을 수 있다.
일부 실시양태에서, 어느 하나 이상의 그람 음성 박테리아 숙주 세포, 예를 들어, 이. 콜라이 또는 슈도모나드에서, 추가 단백질 활성(예를 들어, 프로테아제)의 결핍은 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS1), 서열번호 5의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 5의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS2), 서열번호 7의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 7의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 72의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 72의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(슈도모나드 MepS), 서열번호 73의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 서열번호 73의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체, 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(이. 콜라이 MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체 중 어느 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된다. 일부 실시양태에서, 그람 음성 박테리아 숙주 세포는 이. 콜라이이고, 추가 단백질 활성의 결핍은 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제(MepS), 서열번호 32의 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 DD-엔도펩티다제 관련 단백질, 및 서열번호 32의 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제의 상동체를 코딩하는 유전자의 돌연변이로부터 비롯되고, 이때 돌연변이는 D133, H145, H157, N31, R62, I70, Q73, C94, S95, V98, Q99, R100, L108, Y115, V135, L136, G140, R144 및 G147로부터 선택된 아미노산이거나 이 아미노산에 상응하는 아미노산에 존재하지 않는다. 관련 실시양태에서, 돌연변이는 N31Y, R62C, I70T, Q73R, C94A, S95F, V98E, Q99P, R100G, L108S, Y115F, D133A, V135D, V135G, L136P, G140C, R144C, H145A, G147C 또는 H157A를 발생시키는 돌연변이이거나 이 돌연변이에 상응하는 돌연변이가 아니다.
과발현된 단백질
본 발명의 재조합 그람 음성 박테리아 숙주 세포는 하나 이상의 단백질, 예를 들어, 불활성화된 프로테아제 또는 폴딩 조절인자, 예를 들어, 샤페론을 과발현할 수 있다. 숙주 세포에서 관심 있는 재조합 단백질과 함께 공-과발현될 때, 과발현된 단백질은 생성된 관심 있는 재조합 단백질의 품질 및/또는 수율을 개선할 수 있다. 일부 실시양태에서, 공-과발현된 단백질은 외인성 발현 구축물로부터 발현된다. 일부 실시양태에서, 발현 구축물은 플라스미드 또는 발현 벡터에 있다. 일부 실시양태에서, 관심 있는 재조합 단백질도 과발현하는 숙주 세포에서 과발현될 때, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 상이한 플라스미드로부터 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 동일한 플라스미드로부터 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 동일한 플라스미드 상의 상이한 프로모터로부터의 전사에 의해 발현된다. 일부 실시양태에서, 공-과발현된 단백질 및 관심 있는 재조합 단백질은 공-전사된다, 즉 이들은 동일한 플라스미드 상의 동일한 프로모터로부터의 전사에 의해 발현된다. 일부 실시양태에서, 공-과발현된 단백질은 박테리아 염색체로부터 발현되지 않는다. 일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 불활성화된 프로테아제이다. 일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 샤페론 또는 단백질 폴딩 조절인자이다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질 내지 2개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 3개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 1개의 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 3개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 4개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 3개 상이한 공-과발현된 단백질 내지 20개 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 5개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질내지 20개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 6개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 7개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 8개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 9개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 10개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질 내지 15개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질, 또는 15개의 상이한 공-과발현된 단백질 내지 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 15개의 상이한 공-과발현된 단백질, 또는 20개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 공-과발현된 단백질, 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 또는 15개의 상이한 공-과발현된 단백질을 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 상이한 공-과발현된 단백질, 3개의 상이한 공-과발현된 단백질, 4개의 상이한 공-과발현된 단백질, 5개의 상이한 공-과발현된 단백질, 6개의 상이한 공-과발현된 단백질, 7개의 상이한 공-과발현된 단백질, 8개의 상이한 공-과발현된 단백질, 9개의 상이한 공-과발현된 단백질, 10개의 상이한 공-과발현된 단백질, 15개의 상이한 공-과발현된 단백질, 또는 20개의 상이한 공-과발현된 단백질을 과발현한다.
불활성화된 프로테아제
일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 불활성화된 프로테아제이다. 숙주 세포에 존재하는 기능성 프로테아제로부터 유래한 불활성화된 프로테아제는 숙주 세포에서 기능성 프로테아제 활성을 감소시키도록 숙주 세포에 의해 과발현될 수 있다. 불활성화된 프로테아제 돌연변이체는 우성 음성 프로테아제로서 작용할 수 있다. 과발현된 불활성화된 프로테아제는 예를 들어, 플라스미드 상의 발현 구축물로부터 외인적으로 생성될 수 있다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 상응하는 기능성 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 불활성화된 프로테아제는 EC 3.4.21.107 효소 계열로부터의 그람 음성 박테리아 세린 프로테아제 유전자의 불활성 형태이다. 일부 실시양태에서, 불활성화된 프로테아제는 DegP 프로테아제(HtrA로서도 알려짐)이다. DegP 프로테아제는 예를 들어, DegP2 프로테아제 또는 DegP 유사 프로테아제일 수 있다. DegP 프로테아제는 주변세포질 세린 엔도프로테아제이다. 이들의 구조는 예를 들어, 본원에 참고로 포함되는 문헌[Pallen, M.J. and Wren, B.W., 1997, "The HtrA family of serine proteases," Molecular Microbiology 26(2): 209-221]에 기재되어 있다. 일부 실시양태에서, DegP 프로테아제는 슈도모나스 플루오레센스 DegP2(서열번호 31); 슈도모나스 플루오레센스 DegP(서열번호 69); 이. 콜라이 DegP/HtrA(서열번호 62); 또는 슈도모나스 푸티다 DegP(예를 들어, UniProtKB - A5W8F5 균주, 슈도모나스 푸티다 F1 또는 B0KV30, 균주 슈도모나스 푸티다 GB1)로부터 선택된 DegP 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 과발현된 불활성화된 프로테아제는 DegP, DegP 관련 단백질 또는 DegP 상동체를 코딩하는 유전자의 돌연변이에 의해 불활성화된다. 일부 실시양태에서, 하나 이상의 불활성화된 프로테아제 각각은 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 서열번호 62의 위치 131, 134 및 236 위치(또는 26개 아미노산 리더를 제외할 때, 위치 105, 108 및 210) 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 서열번호 31의 108 내지 122, 146 내지 152, 및 217 내지 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택된다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 116(His), 120(Asp), 122(Asp) 및 219(Ser) 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진다.
일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 상응하는 DegP, DegP 관련 단백질 또는 DegP 상동체의 촉매 부위에서 아미노산 치환 또는 파괴를 포함한다. 본원에 참고로 포함되는 문헌[Pallen and Wren, 1997, and Skorko-Glonek, J. et al., 1995, "Site-directed mutagenesis of the HtrA(DegP) serine protease, whose proteolytic activity is indispensable for Escherichia coli survival at elevated temperatures," Gene 163:47-52]은 DegP/HtrA 및 관련 단백질의 촉매 부위를 설명한다. 구체적으로, 아미노산 잔기 S210과 H105는 프로테아제 활성에 중요하다. 아미노산 치환 S210A 및 H105R은 단백질용해 활성을 제거한다. 상기 문헌[Pallen and Wren]은 "촉매 트리아드(catalytic triad)"인 아미노산 His, Asp 및 Ser을 포함하는 촉매 도메인을 설명한다. 이. 콜라이 Htr에서 이 중요한 잔기들은 위치 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210에 존재한다. 슈도모나스 플루오레센스 DegP2(서열번호 31)에서, 촉매 트리아드 잔기는 리더 서열 1-27을 포함하는 넘버링을 이용할 때 위치 116(His), 120(Asp) 및 219(Ser)에 존재하고; 리더 서열을 제외할 때, 촉매 트리아드 잔기는 위치 89(His), 93(Asp) 및 192(Ser)에 존재한다. 당업자는 임의의 DegP, DegP 관련 단백질 또는 DegP 상동체에서 상응하는 활성 부위 및 촉매 트리아드를 확인할 수 있다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 위치 116(His), 120(Asp) 및 219(Ser) 중 어느 한 위치에 상응하는 어느 하나 이상의 촉매 트리아드 아미노산의 아미노산 치환 또는 파괴를 포함한다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 위치 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링 참조), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 어느 하나 이상의 촉매 트리아드 아미노산의 아미노산 치환 또는 파괴를 포함한다. 일부 실시양태에서, 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체는 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 어느 하나 이상의 아미노산의 아미노산 치환 또는 파괴를 포함한다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제 내지 2개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 3개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 1개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 3개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 4개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 5개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 6개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 7개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 8개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제 내지 9개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제, 또는 9개의 불활성화된 프로테아제 내지 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 9개의 불활성화된 프로테아제 또는 10개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 불활성화된 프로테아제, 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 또는 9개의 불활성화된 프로테아제를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 불활성화된 프로테아제, 3개의 불활성화된 프로테아제, 4개의 불활성화된 프로테아제, 5개의 불활성화된 프로테아제, 6개의 불활성화된 프로테아제, 7개의 불활성화된 프로테아제, 8개의 불활성화된 프로테아제, 9개의 불활성화된 프로테아제 또는 10개의 불활성화된 프로테아제를 과발현한다.
단백질 폴딩 조절인자
일부 실시양태에서, 하나 이상의 공-과발현된 단백질은 관심 있는 재조합 단백질의 품질 및/또는 수율을 개선하는 단백질 폴딩 조절인자이다. 샤페론, 디설파이드 결합 이소머라제, 펩티딜-프롤릴 시스-트랜스 이소머라제(PPIase)를 포함하는 단백질 폴딩 조절인자는 신생 폴리펩티드의 폴딩, 언폴딩 및 분해를 돕는, 모든 세포에 존재하는 한 부류의 단백질이다. 과발현된 단백질 폴딩 조절인자는 예를 들어, 플라스미드 상의 발현 구축물로부터 외인적으로 생성될 수 있다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포는 어느 하나 이상의 상이한 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포는 1개 내지 10개의 상이한 단백질 폴딩 조절인자를 과발현한다.
일부 실시양태에서, 단백질 폴딩 조절인자는 미생물이다. 일부 실시양태에서, 미생물 단백질 폴딩 조절인자는 박테리아, 포유동물, 진균(예를 들어, 효모 또는 사상 진균), 절지동물(예를 들어, 거미류 또는 곤충), 또는 플라스모듐(Plasmodium)으로부터 유래한다. 일부 실시양태에서, 박테리아 단백질 폴딩 조절인자는 그람 음성 박테리아로부터 유래한다. 일부 실시양태에서, 포유동물 단백질 폴딩 조절인자는 설치류, 예를 들어, 마우스, 래트 또는 햄스터, 예를 들어, 골든 햄스터로부터 유래한다. 일부 실시양태에서, 포유동물 단백질 폴딩 조절인자는 유인원, 예를 들어, 오랑우탄, 인간, 말, 돼지, 새, 예를 들어, 딱새로부터 유래한다. 일부 실시양태에서, 그람 음성 박테리아 단백질 폴딩 조절인자는 이. 콜라이 또는 슈도모나드 폴딩 조절인자 단백질이다. 일부 실시양태에서, 단백질 폴딩 조절인자 또는 샤페론은 슈도모나스 플루오레센스 단백질 폴딩 조절인자이다. 과발현된 단백질 폴딩 조절인자는 예를 들어, 미국 특허 제10,118,956호("Fusion Partners for Peptide Production")(예를 들어, 표 1), 미국 특허 제9,580,719호(예를 들어, 미국 특허 제10,118,956호의 표 1에 나열된 RXF로 각각의 폴딩 조절인자에 대한 서열을 제공함) 및 미국 특허 제8,603,824호(예를 들어, 이 특허의 표 A 내지 F)에 기재된 임의의 단백질 폴딩 조절인자일 수 있다. 본원에서 사용된 바와 같이, RXF 번호는 오픈 리딩 프레임 번호이고, PROKKA 번호는 예를 들어, 본원에 참고로 포함되는 문헌[Seemann, T., 2014, "Prokka: rapid prokaryotic genome annotation," Bioinformatics 30 (14): 2068-2069]에 기재된 바와 같이 Prokka 도구를 사용함으로써 확인된 표기이다.
일부 실시양태에서, 단백질 폴딩 조절인자는 당업자에게 알려져 있거나 문헌, 예를 들어, 본원에 참고로 포함되는 문헌["Guidebook to Molecular Chaperones and Protein-Folding Catalysts," 1997, ed. M. Gething, Melbourne University, Australia]에 기재되어 있는 임의의 단백질 폴딩 조절인자이다. 일부 실시양태에서, 하나 이상의 단백질 폴딩 조절인자 각각은 GroES/EL, DnaKJ, Clp, Hsp90, SecB, HSP70, HSP110/SSE, HSP40(DnaJ 관련), GRPE 유사, HSP90, CPN60, CPN10, 세포질 샤페론, HSP100, 작은 HSP, 칼넥신(calnexin), 칼레티쿨린(calreticulin), 단백질 디설파이드 이소머라제(PDI), 티오레독신 관련 단백질, 디설파이드 결합 이소머라제, 단백질 디설파이드 이소머라제, 펩티딜-프롤릴 이소머라제, 사이클로필린(cyclophilin) PPIase, FK-506 결합 단백질, 파르불린(parvulin) PPIase, 개별 샤페론, 단백질 특이적 샤페론 또는 분자내 샤페론으로부터 독립적으로 선택된다.
일부 실시양태에서, 과발현된 폴딩 조절인자 단백질은 디설파이드 결합 이소머라제이다. 일부 실시양태에서, 디설파이드 결합 이소머라제는 그람 음성 박테리아 DsbA, DsbB, DsbC, DsbD 또는 DsbG이다. 일부 실시양태에서, 디설파이드 결합 이소머라제는 서열번호 60(DsbC), 76(추정 세포질 디설파이드 이소머라제 DsbA), 77(DsbA), 78(DsbB), 80(DsbD) 또는 81(DsbG)로부터 선택된다. 일부 실시양태에서, 과발현된 폴딩 조절인자 단백질은 단백질 디설파이드 이소머라제이다. 일부 실시양태에서, 단백질 디설파이드 이소머라제는 PDIA6이다. 일부 실시양태에서, PDIA6은 서열번호 27 및 82 내지 98로부터 선택된 아미노산 서열을 가진다. 일부 실시양태에서, 과발현된 단백질 폴딩 조절인자는 서열번호 27, 57, 60, 76 내지 78, 및 80 내지 98로부터 선택된 아미노산 서열을 가진다.
일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자 내지 2개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 3개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 1개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 3개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 4개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 5개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 6개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 7개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 8개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 내지 9개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자, 또는 9개의 단백질 폴딩 조절인자 내지 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 1개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자, 9개의 단백질 폴딩 조절인자 또는 10개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 적어도 1개의 단백질 폴딩 조절인자, 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자 또는 9개의 단백질 폴딩 조절인자를 과발현한다. 일부 실시양태에서, 재조합 그람 음성 숙주 세포는 최대 2개의 단백질 폴딩 조절인자, 3개의 단백질 폴딩 조절인자, 4개의 단백질 폴딩 조절인자, 5개의 단백질 폴딩 조절인자, 6개의 단백질 폴딩 조절인자, 7개의 단백질 폴딩 조절인자, 8개의 단백질 폴딩 조절인자, 9개의 단백질 폴딩 조절인자 또는 10개의 단백질 폴딩 조절인자를 과발현한다.
관련 단백질
본 발명에 따라 변형되기 전에, 예를 들어, 돌연변이를 유전자에 도입하여 단백질 활성을 결핍시키기 위해, 박테리아 숙주 세포는 동일한 단백질을 코딩하거나, 동일하거나 유사한 활성, 예를 들어, 프로테아제 활성 또는 자가용해 인자 활성을 가진 다수의 단백질들을 코딩하는 다수의 유전자들을 가질 수 있다. 이러한 상황에서, 재조합 박테리아 숙주 세포의 단백질 결핍은 하나 초과의 유전자의 돌연변이로부터 비롯될 수 있다.
2개의 상이한 그람 음성 박테리아 숙주 세포, 예를 들어, 상이한 속 또는 종의 숙주 세포는 다수의 관련 단백질들을 가질 수 있다. 이 관련 단백질들은 유사한 서열, 구조, 기능 및/또는 활성을 가질 수 있다. 이 상황 하에서, 제1 숙주 세포의 단백질 활성 결핍 및 제2 숙주 세포의 단백질 활성 결핍은 높은 수준의 아미노산 서열 유사성 또는 동일성을 가진 유전자의 돌연변이로부터 비롯될 수 있다. (예를 들어, 상이한 종들의) 상이한 숙주 세포들 사이에서, 그리고 동일한 숙주 세포 내에서, 이러한 특정 단백질은 조상 연관성의 지식 또는 가정을 기반으로 상동체로서 문헌에 기재되어 있다.
본 발명과 관련하여, 조상 연관성과 관계없이, 당업자는 당분야에 알려져 있고 본원에 기재된 방법을 이용하여 (동일한 숙주 세포, 예를 들어, 동일한 숙주 세포 종 내에서, 또는 2개의 상이한 숙주 세포들 사이에서) 2개의 단백질들을 관련 단백질로서 식별할 수 있다.
일부 실시양태에서, 본원에 언급된 바와 같이, 관련 단백질, 예를 들어, 관련 프로테아제 또는 관련 자가용해 인자는 정의된 아미노산 서열 유사성 또는 동일성을 가진다. 본원의 다른 곳에서 제공된 임의의 아미노산 서열 유사성 또는 동일성 범위는 그 범위 내에 속하는 더 좁은 범위로 대체될 수 있으며, 본원에서 제공된 임의의 최소 아미노산 서열 유사성 또는 동일성은 더 높은 최소값으로 대체될 수 있는 것으로 이해된다. 일부 실시양태에서, 본원에서 사용된 "관련 단백질"은 약 30% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성/촉매 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가질 수 있다. 본원에 기재된 핵산 또는 아미노산 서열의 서열 유사성 또는 동일성은 당업자에게 알려진 방법에 의해 측정될 수 있다. 일부 실시양태에서, 아미노산은 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성이 유사하다. 예를 들어, 음으로 하전된 아미노산은 아스파르트산 및 글루탐산을 포함하고; 양으로 하전된 아미노산안 라이신 및 아르기닌을 포함하고; 유사한 친수성 값을 가진 비하전 극성 헤드 기 또는 비극성 헤드 기를 가진 아미노산은 류신, 이소류신, 발린; 글리신, 알라닌; 아스파라긴, 글루타민; 세린, 트레오닌; 페닐알라닌, 티로신을 포함한다. 따라서, 유사한 아미노산은 예를 들어, 문헌에 기재되어 있는 보존적 아미노산 치환에 적합한 것으로서 확인된 아미노산일 수 있고, 예를 들어, 보존적 아미노산 치환을 나열하는 표 2에 나타낸 바와 같이 당업자에게 알려진 방법에 의해 용이하게 확인될 수 있다. 일부 실시양태에서, 유사한 아미노산은 표 2에서 원래 아미노산에 상응하는 행의 제2열("I. 보존적 치환"이라는 제목)에 나열된 아미노산이다. 일부 실시양태에서, 유사한 아미노산은 표 2에서 원래 아미노산에 상응하는 행의 제3열("II. 대안적 치환"이라는 제목)에 나열된 아미노산이다.
일부 실시양태에서, 관련 단백질은 약 30% 내지 약 35%, 약 30% 내지 약 40%, 약 30% 내지 약 45%, 약 30% 내지 약 50%, 약 30% 내지 약 55%, 약 30% 내지 약 60%, 약 30% 내지 약 65%, 약 30% 내지 약 70%, 약 30% 내지 약 80%, 약 30% 내지 약 90%, 약 30% 내지 약 100%, 약 35% 내지 약 40%, 약 35% 내지 약 45%, 약 35% 내지 약 50%, 약 35% 내지 약 55%, 약 35% 내지 약 60%, 약 35% 내지 약 65%, 약 35% 내지 약 70%, 약 35% 내지 약 80%, 약 35% 내지 약 90%, 약 35% 내지 약 100%, 약 40% 내지 약 45%, 약 40% 내지 약 50%, 약 40% 내지 약 55%, 약 40% 내지 약 60%, 약 40% 내지 약 65%, 약 40% 내지 약 70%, 약 40% 내지 약 80%, 약 40% 내지 약 90%, 약 40% 내지 약 100%, 약 45% 내지 약 50%, 약 45% 내지 약 55%, 약 45% 내지 약 60%, 약 45% 내지 약 65%, 약 45% 내지 약 70%, 약 45% 내지 약 80%, 약 45% 내지 약 90%, 약 45% 내지 약 100%, 약 50% 내지 약 55%, 약 50% 내지 약 60%, 약 50% 내지 약 65%, 약 50% 내지 약 70%, 약 50% 내지 약 80%, 약 50% 내지 약 90%, 약 50% 내지 약 100%, 약 55% 내지 약 60%, 약 55% 내지 약 65%, 약 55% 내지 약 70%, 약 55% 내지 약 80%, 약 55% 내지 약 90%, 약 55% 내지 약 100%, 약 60% 내지 약 65%, 약 60% 내지 약 70%, 약 60% 내지 약 80%, 약 60% 내지 약 90%, 약 60% 내지 약 100%, 약 65% 내지 약 70%, 약 65% 내지 약 80%, 약 65% 내지 약 90%, 약 65% 내지 약 100%, 약 70% 내지 약 80%, 약 70% 내지 약 90%, 약 70% 내지 약 100%, 약 80% 내지 약 90%, 약 80% 내지 약 100%, 또는 약 90% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80%, 약 90% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 적어도 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80% 또는 약 90%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 최대 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 80%, 약 90% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 45% 내지 약 50%, 약 45% 내지 약 55%, 약 45% 내지 약 60%, 약 45% 내지 약 65%, 약 45% 내지 약 70%, 약 45% 내지 약 75%, 약 45% 내지 약 80%, 약 45% 내지 약 85%, 약 45% 내지 약 90%, 약 45% 내지 약 95%, 약 45% 내지 약 100%, 약 50% 내지 약 55%, 약 50% 내지 약 60%, 약 50% 내지 약 65%, 약 50% 내지 약 70%, 약 50% 내지 약 75%, 약 50% 내지 약 80%, 약 50% 내지 약 85%, 약 50% 내지 약 90%, 약 50% 내지 약 95%, 약 50% 내지 약 100%, 약 55% 내지 약 60%, 약 55% 내지 약 65%, 약 55% 내지 약 70%, 약 55% 내지 약 75%, 약 55% 내지 약 80%, 약 55% 내지 약 85%, 약 55% 내지 약 90%, 약 55% 내지 약 95%, 약 55% 내지 약 100%, 약 60% 내지 약 65%, 약 60% 내지 약 70%, 약 60% 내지 약 75%, 약 60% 내지 약 80%, 약 60% 내지 약 85%, 약 60% 내지 약 90%, 약 60% 내지 약 95%, 약 60% 내지 약 100%, 약 65% 내지 약 70%, 약 65% 내지 약 75%, 약 65% 내지 약 80%, 약 65% 내지 약 85%, 약 65% 내지 약 90%, 약 65% 내지 약 95%, 약 65% 내지 약 100%, 약 70% 내지 약 75%, 약 70% 내지 약 80%, 약 70% 내지 약 85%, 약 70% 내지 약 90%, 약 70% 내지 약 95%, 약 70% 내지 약 100%, 약 75% 내지 약 80%, 약 75% 내지 약 85%, 약 75% 내지 약 90%, 약 75% 내지 약 95%, 약 75% 내지 약 100%, 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 95%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 95%, 약 85% 내지 약 100%, 약 90% 내지 약 95%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 적어도 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다. 일부 실시양태에서, 관련 단백질은 최대 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 100%의 아미노산 서열 유사성 또는 동일성, 활성 부위 아미노산 서열 유사성 또는 동일성, 또는 알로스테릭 영역 아미노산 서열 유사성 또는 동일성을 가진다.
관련 단백질은 상동체일 수 있거나 상동체가 아닐 수 있다. 일부 실시양태에서, 주어진 단백질의 상동체인 관련 단백질은 디폴트 설정에서 NCBI 데이터베이스에 기탁된 숙주 세포(예를 들어, 이. 콜라이) 프로테옴 서열로부터의 모든 비중복(nr) 단백질 서열들의 PSI-BLAST(위치 특이적 반복적 기본 국소 정렬 검색 도구) 검색에서 조회(query) 서열로서 단백질 서열을 사용함으로써 확인된다. PSI-BLAST 검색 방법은 당업자에게 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 문헌[Bhagwat, M., and Aravind, L., 2007, "PSI-BLAST Tutorial," Ch. 10 in Comparative Genomics: Volumes 1 and 2, Bergman NH, ed., Totowa (NJ): Humana Press]에 기재되어 있다. 상동체를 확인하는 접근법은 문헌, 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Pearson, W.R., 2014, "BLAST and FASTA similarity searching for multiple sequence alignment," Methods Mol. Biol. 1079:75-101]에 기재되어 있다.
핵산 및 아미노산 서열 유사성 동일성은 본원에 기재된 방법들을 포함하나 이들로 제한되지 않는, 당분야에 알려진 임의의 적합한 방법에 따라 측정될 수 있다. 예를 들어, 유사한 서열에 대한 정렬 및 검색은 미국 국립 생명공학 정보 센터(NCBI, 메릴랜드주 베데스다) 프로그램인 MegaBLAST를 사용함으로써 수행될 수 있다. 아미노산 서열의 경우 예를 들어, 70%로 설정되거나 뉴클레오타이드 서열의 경우 예를 들어, 90%로 설정된 퍼센트 동일성에 대한 옵션을 가진 이 프로그램의 사용은 조회 서열과 70% 또는 90% 이상의 서열 동일성을 가진 서열을 확인할 수 있다. 유사한 서열, 예를 들어, 본원의 분비 신호 서열을 함유하는 정보 스트링과 적어도 70% 또는 90% 동일한 서열을 정렬하고/하거나 검색하기 위해 당분야에 알려진 다른 소프트웨어도 이용 가능하다. 예를 들어, 조회 서열과 적어도 70% 또는 90% 동일한 서열을 확인하는 비교를 위한 서열 정렬은 예를 들어, GCG 서열 분석 소프트웨어 팩키지(위스콘신주 53705 매디슨 유니버시티 애비뉴 1710 위스콘신 대학 생명공학 센터에 소재하는 제네틱스 컴퓨터 그룹(Genetics Computer Group)으로부터 입수 가능함)에서 이용 가능한 GAP, BESTFIT, BLAST, FASTA 및 TFASTA 프로그램을, 이들에 특정된 디폴트 파라미터 및 원하는 퍼센트로 설정된 서열 동일성의 정도에 대한 파라미터와 함께 사용함으로써 종종 수행된다. 또한, 예를 들어, CLUSTAL 프로그램(캘리포니아주 마운틴뷰에 소재하는 인텔리제네틱스(Intelligenetics)의 PC/유전자 소프트웨어 팩키지에서 이용 가능함)이 사용될 수 있다.
이들 및 다른 서열 정렬 방법은 당분야에 잘 알려져 있으며, 수동 정렬, 육안 검사, 또는 서열 정렬 알고리즘의 수동 또는 자동 적용, 예컨대, 전술된 프로그램에 의해 구현된 정렬들 중 임의의 정렬에 의해 수행될 수 있다. 다양한 유용한 알고리즘들은 예를 들어, 문헌[W. R. Pearson & D. J. Lipman, Proc. Natl. Acad. Sci. USA 85:2444-48 (April 1988)]에 기재된 유사성 검색 방법; 문헌[T. F. Smith & M. S. Waterman, Adv. Appl. Math. 2:482-89 (1981) and J. Molec. Biol. 147:195-97 (1981)]에 기재된 국소 상동성 방법; 문헌[S. B. Needleman & C. D. Wunsch, J. Molec. Biol. 48(3):443-53 (March 1970)]에 기재된 상동성 정렬 방법; 및, 예를 들어, 문헌[W. R. Pearson, Genomics 11(3):635-50 (November 1991)], 문헌[W. R. Pearson, Methods Molec. Biol. 24:307-31 and 25:365-89 (1994)], 및 문헌[D. G. Higgins & P. M. Sharp, Comp. Appl'ns in Biosci. 5:151-53 (1989) and Gene 73(1):237-44 (15 Dec. 1988)]에 기재된 다양한 방법들을 포함한다.
상기 니들만(Needleman)과 분슈(Wunsch)(1970)의 알고리즘을 사용하는 GAP 버전 10은 하기 파라미터를 사용하여 서열 동일성 또는 유사성을 측정하는 데 사용될 수 있다: GAP 가중치 50과 길이 가중치 3, 및 nwsgapdna.cmp 점수화 매트릭스를 사용하여 뉴클레오타이드 서열에 대한 % 동일성 및 % 유사성; GAP 가중치 8과 길이 가중치 2, 및 BLOSUM62 점수화 프로그램을 사용하여 아미노산 서열에 대한 % 동일성 또는 % 유사성. 당업자가 이해할 바와 같이, 동등하거나 유사한 프로그램도 사용될 수 있다. 예를 들어, 해당 임의의 두 서열에 대해 GAP 버전 10에 의해 생성된 상응하는 정렬과 비교될 때 동일한 뉴클레오타이드 잔기 일치 및 동일한 퍼센트 서열 동일성을 가진 정렬을 생성하는 서열 비교 프로그램이 사용될 수 있다. 실시양태에서, 조회 또는 대상체 서열의 전체, 또는 이들 둘 다에 걸쳐 서열 비교를 수행한다.
재조합 숙주 세포 단백질의 결핍 또는 불활성화된 프로테아제 과발현을 야기하는 돌연변이
단백질 활성이 결핍된 본 발명의 재조합 박테리아 숙주 세포는 임의의 알려진 방법으로 단백질 활성을 가진 단백질을 코딩하는 하나 이상의 유전자를 변경시킴으로써 생성될 수 있다. 본 설명 전체에 걸쳐 사용된 "결핍된" 단백질 활성 또는 단백질 활성의 "결핍"은 부분적 결핍, 실질적인 결핍 또는 완전한 결핍을 포함할 수 있다. 본 설명 전체에 걸쳐 사용된 "결핍된" 단백질 활성 또는 단백질 활성의 "결핍"은 단백질 활성의 감소 또는 제거를 포함할 수 있다. 따라서, 일부 실시양태에서, 재조합 숙주 세포 단백질 활성은 숙주 세포에서 대조군 세포에 비해 결핍되어 있다. 일부 실시양태에서, 대조군 세포는 단백질의 야생형 활성을 가진 상응하는 숙주 세포이다. 일부 실시양태에서, 대조군 세포는 상응하는 야생형 세포이다. 일부 실시양태에서, 대조군 세포는 단백질의 야생형 활성을 갖지만 야생형 세포에 비해 다른 차이점을 가진다. 본 발명의 재조합 숙주 세포는 단백질의 활성을 감소시키거나 제거하기 위해, 예를 들어, 본원에 기재된 바와 같이 임의의 적합한 수단에 의해 변형될 수 있다. 본 발명의 재조합 박테리아 숙주 세포는 본원에 기재된 바와 같이 불활성화된 프로테아제를 과발현할 수도 있다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 프로테아제 활성이 부분적으로 불활성화되거나, 실질적으로 불활성화되거나, 완전히 불활성화된다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 프로테아제 활성이 부분적으로 불활성화되거나, 실질적으로 불활성화되거나, 완전히 불활성화되고, 또 다른 성질, 예를 들어, 샤페론 활성이 활성을 띤다. 일부 실시양태에서, 불활성화된 프로테아제는 돌연변이, 예를 들어, (프로테아제 활성을 가진) 활성 프로테아제를 코딩하는 유전자의 돌연변이에 의해 불활성화된다.
일부 실시양태에서, 재조합 숙주 세포의 단백질 활성의 결핍 또는 감소는 예를 들어, 아미노산 치환, 하나 이상의 아미노산의 결실, 하나 이상의 아미노산의 삽입 또는 단백질 절단에 의해 아미노산 변화 또는 다른 파괴를 야기하는 돌연변이로부터 비롯된다. 일부 실시양태에서, 돌연변이는 불활성화 돌연변이이다. 일부 실시양태에서, 돌연변이는 부분적 불활성화 돌연변이이다. 일부 실시양태에서, 단백질, 예를 들어, 프로테아제 또는 자가용해 인자의 활성 결핍은 (i) 완전한 유전자 결실(유전자 녹아웃), (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 돌연변이로부터 비롯된다. 일부 실시양태에서, 과발현된 불활성화된 프로테아제는 (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택된 하나 이상의 돌연변이에 의해 불활성화된다. 일부 실시양태에서, 단백질 활성의 결핍 또는 프로테아제의 불활성화를 야기하는 돌연변이는 단백질 또는 불활성화된 프로테아제를 코딩하는 유전자의 코딩 영역에 있다. 일부 실시양태에서, 단백질 활성의 결핍을 야기하는 돌연변이는 단백질을 코딩하는 유전자의 비코딩 영역에 있다. 일부 실시양태에서, 유전자의 비코딩 영역은 조절 영역이다. 일부 실시양태에서, 유전자의 조절 영역에서의 돌연변이는 단백질의 생성에 필요한 조절 요소, 예를 들어, 상응하는 RNA의 전사 또는 단백질로의 mRNA의 번역에 필요한 요소를 파괴한다. 예를 들어, 비코딩 영역 조절 요소는 프로모터, 인핸서, 조절 단백질 결합 부위, 리보좀 결합 부위, 또는 당업자에게 알려진 임의의 다른 조절 요소일 수 있다.
일부 실시양태에서, 돌연변이는 예를 들어, 프로테아제 활성 부위에서 하나 이상의 아미노산을 변경시키거나 결실시킴으로써 단백질의 중요 부위를 파괴하여, 재조합 숙주 세포에서 단백질의 결핍을 야기하거나 과발현된 프로테아제의 불활성화를 야기한다. 일부 실시양태에서, 돌연변이는 예를 들어, 알로스테릭 영역에서 하나 이상의 아미노산을 변경시킴으로써 단백질의 알로스테릭 영역을 파괴한다. 알로스테릭 영역은 또 다른 영역과 상호작용하여 활성 단백질 입체구조를 형성하는 영역일 수 있다. 일부 실시양태에서, 돌연변이는 아미노산을 임의의 다른 아미노산으로 치환시킨다. 일부 실시양태에서, 치환은 비보존적 아미노산 치환이다. 비보존적 아미노산 치환은 당업자에 의해 용이하게 선택될 수 있다. 표 2는 보존적 아미노산 치환(제I열) 및 대안적 보존적 아미노산 치환(II)의 예를 제공한다. 일부 실시양태에서, 원래 아미노산(예를 들어, 야생형 단백질의 아미노산)의 비보존적 치환은 원래 아미노산을 (I)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다. 일부 실시양태에서, 원래 아미노산의 비보존적 치환은 원래 아미노산을 (II)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다. 일부 실시양태에서, 비보존적 아미노산 치환은 원래 아미노산을 (I) 또는 (II)에 나열되지 않은 임의의 아미노산으로 치환하는 것이다.
관심 있는 재조합 단백질
본 발명은 고품질 및 고수율로 관심 있는 재조합 단백질을 생성하는 그람 음성 박테리아 숙주 세포 및 이를 사용하는 방법을 제공한다. 일부 실시양태에서, 기재된 숙주 세포 및 방법을 이용하여 생성한 관심 있는 재조합 단백질은 그람 음성 박테리아 숙주 세포에서 재조합적으로 발현될 때 분해되기 쉬운 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 야생형 또는 기능성 꼬리 특이적 프로테아제를 생성하는 숙주 세포에서 분해되고, 꼬리 특이적 프로테아제 활성이 결핍된 숙주 세포에서는 덜 분해되는 것으로 관찰된다. 본원에 기재된 바와 같이, 관심 있는 재조합 단백질은 관심 있는 재조합 단백질을 코딩하고 재조합 단백질을 발현할 수 있는 핵산 발현 구축물을 포함하는 하나 이상의 발현 플라스미드 또는 벡터로부터 재조합 그람 음성 박테리아 숙주 세포에 의해 생성될 수 있다.
분자유전학 및 유전공학 기법에 필요한 광범위한 서열 정보는 널리 공개적으로 입수될 수 있다. 포유동물 및 인간의 완전한 뉴클레오타이드 서열, 유전자, cDNA 서열, 아미노산 서열 및 게놈에의 접근은 웹사이트 www.ncbi.nlm.nih.gov/Entrez에서 진뱅크(GenBank)로부터 종종 수득된다. 추가 정보는 와이즈만 과학 게놈 및 생물정보학 연구소(Weizmann Institute of Science Genome and Bioinformatics)로부터 유전자와 이의 생성물 및 생물의학적 적용에 관한 정보를 통합한 전자 백과사전인 진카드(GeneCards)로부터 수득될 수 있다. 뉴클레오타이드 서열 정보는 EMBL 뉴클레오타이드 서열 데이터베이스 또는 DNA 데이터뱅크 또는 일본(DDBJ)으로부터 수득될 수 있다. 아미노산 서열에 대한 추가 정보 출처는 조지타운의 단백질 정보 자원 웹사이트 및 Swiss-Prot를 포함한다.
일부 실시양태에서, 관심 있는 단백질은 포유동물 단백질 또는 폴리펩티드이거나 포유동물 단백질 또는 폴리펩티드로부터 유래한다. 문맥이 달리 표시하지 않는 한, 용어 "단백질" 및 "폴리펩티드"는 본원에서 교환 가능하게 사용된다. 실시양태에서, 관심 있는 단백질은 인간 단백질이거나 인간 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 원핵생물 단백질이거나 원핵생물 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 미생물 단백질이거나 미생물 단백질로부터 유래한다. 실시양태에서, 관심 있는 단백질은 박테리아 단백질이거나 박테리아 단백질로부터 유래한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아이거나, 이들로부터 유래한다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 관심 있는 재조합 단백질은 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체(항체, 항체 단편 또는 이의 유도체); 항체 기반 약물, 비-항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택된다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 관심 있는 재조합 단백질은 포유동물, 설치류, 조류, 연골어류, 진균 또는 박테리아 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 닭, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 단백질이다. 일부 실시양태에서, 관심 있는 재조합 단백질은 재조합 그람 음성 박테리아 숙주 세포에 대한 이종 단백질이다, 즉 관심 있는 단백질은 발현 숙주 세포 이외의 유기체로부터 유래한다. 일부 실시양태에서, 생성되는 관심 있는 재조합 단백질은 발현시키기 어려운 재조합 단백질, 예를 들어, 분해에 취약한 N-말단을 가진 단백질 및 전형적으로 미생물 또는 박테리아 발현 시스템에서 불용성 형태로 생성되는 단백질을 포함하는, 세포내 박테리아 프로테아제에 의해 빠른 단백질용해적 분해를 겪는 단백질이다.
일부 실시양태에서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체(항체, 항체 단편 또는 이의 유도체)는 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 트리바디; 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP), 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; VHH; 또는 당분야, 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제5,648,237호("Expression of Functional Antibody Fragments")에 기재된 임의의 다른 항체 단편으로부터 선택된다. 일부 실시양태에서, VHH 함유 항체는 VHH 연쇄 항체이다. 일부 실시양태에서, 비인간 동물 종으로부터 유래한 항체 또는 항체 단편은 인간화된다.
일부 실시양태에서, 본 발명의 조성물 및 방법을 이용함으로써 생성되는 항체, 항체 단편 또는 이의 유도체는 치료 항체, 항체 단편 또는 이의 유도체이다. 일부 실시양태에서, 치료 항체, 항체 단편 또는 이의 유도체는 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자; 및 혈액 인자로부터 선택된 표적에 결합한다. 일부 실시양태에서, 사이토카인은 TNF-알파이다. 일부 실시양태에서, 약물은 혈소판 응집 억제제이다. 일부 실시양태에서, 혈소판 응집 억제제는 티카그렐로르(ticagrelor)이다.
일부 실시양태에서, 관심 있는 재조합 단백질은 Fab, Fab' 또는 F(ab')2로부터 선택된 항체 단편이다. Fab는 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 포함하고, 항체 힌지 영역을 결여한다. 일부 실시양태에서, 관심 있는 재조합 단백질은 Fab'이다. Fab'도 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 포함하고, 중쇄의 항체 힌지 영역도 포함함으로써, 유리 설프하이드릴을 가진다. F(ab')2는 중쇄 및 경쇄 각각의 1개의 불변 영역 도메인 및 1개의 가변 영역 도메인을 각각 가진 2개의 항원 결합 영역, 및 힌지 영역을 가진 두 중쇄를 포함한다. 이것은 디설파이드 결합이 2개의 결합 영역을 연결할 수 있게 한다.
일부 실시양태에서, 관심 있는 재조합 단백질은 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 Fab'이다. 일부 실시양태에서, Fab'는 아르시투모맙(Arcitumomab); 벡투모맙(Bectumomab); 비시로맙(Biciromab); 세르톨리주맙 페골(Certolizumab pegol)의 Fab' 모이어티; 및 술레소맙(Sulesomab)으로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 EpCAM, 보체 인자 D(CFD), C242 항원, 5T4, 인간 산란 인자 수용체 키나제, VEGF-A 및 인테그린 αIIbβ3으로부터 선택된 표적에 결합하는 Fab이다. 일부 실시양태에서, Fab는 압식시맙(Abciximab); 아브레제키맙(Abrezekimab); 아나투모맙 마페나톡스(Anatumomab mafenatox); 시타투주맙 보가톡스(Citatuzumab bogatox); 람팔리주맙(Lampalizumab); 나콜로맙 타페나톡스(Nacolomab tafenatox); 나프투모맙 에스타페나톡스(Naptumomab estafenatox); 노페투모맙 메르펜탄(Nofetumomab merpentan); 오나르투주맙(Onartuzumab); 라니비주맙(Ranibizumab); 타도시주맙(Tadocizumab); 및 텔리모맙 아리톡스(Telimomab aritox)로부터 선택된다. 일부 실시양태에서, 관심 있는 재조합 단백질은 TNF-알파; VEGFR2; ITGB2(CD18); 및 CA-125로부터 선택된 표적에 결합하는 F(ab')2이다. 일부 실시양태에서, F(ab')2는 아펠리모맙(Afelimomab); 알라시주맙 페골(Alacizumab pegol); 도를리모맙 아리톡스(Dorlimomab aritox); 에를리주맙(Erlizumab); 및 이고보맙(Igovomab)으로부터 선택된다.
일부 실시양태에서, 인간 종양 괴사 인자 알파(인간 TNF-알파)에 결합하는 Fab'는 세르톨리주맙의 Fab' 모이어티이다. 세르톨리주맙은 약 40 kDa 폴리에틸렌 글리콜(PEG2MAL40K)에 접합된, 인간 TNF-알파에 대한 특이성을 가진 재조합 인간화 항체 Fab' 단편이다. 세르톨리주맙은 Cimzia 처방 정보(전체가 참고로 포함되는, 2019년 9월에 개정된 Cimzia 처방 정보)에 상세히 기재된 바와 같이 크론병, 류마티스 관절염, 건선 관절염, 강직 척추염, 비방사선학적 축성 척추관절염, 및 중등도 내지 중증 플라크 건선을 비롯한 자가면역 질환의 치료용으로 미국에서 Cimzia®라는 명칭으로 승인되었다. 일부 실시양태에서, 본원에 기재된 재조합 그람 음성 박테리아 숙주 세포 및 관련 방법은 크론병, 류마티스 관절염, 건선 관절염, 강직성 척추염, 비방사선학적 축성 척추관절염, 및 중등도 내지 중증 플라크 건선의 치료에 사용하기 위해 인간 TNF-알파에 결합하는 재조합 Fab'를 생성하는 데 사용된다.
일부 실시양태에서, 관심 있는 재조합 단백질은 하나 이상의 발현 구축물을 각각 포함하는 하나 이상의 발현 벡터로부터 재조합 그람 음성 박테리아 숙주 세포에서 발현되고, 상기 발현 구축물 각각은 관심 있는 재조합 단백질을 발현하고 코딩하는 핵산 서열을 포함한다. 당업자가 이해하는 바와 같이, 관심 있는 재조합 단백질에 포함된 각각의 폴리펩티드 쇄를 코딩하는 데 필요한 경우, 하나 이상의 발현 구축물이 단일 발현 벡터에 포함될 수 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 관심 있는 재조합 단백질에 따라 필요한 경우 하나 이상의 발현 구축물을 각각 포함하는 적어도 2개의 발현 벡터를 포함한다. 당업자가 이해하는 바와 같이, 항체, 항체 단편 또는 이의 유도체는 하나 이상의 발현 구축물로부터 생성된 하나 이상의 폴리펩티드로 구성될 수 있다. 예를 들어, 항체는 4개의 폴리펩티드, 즉 적어도 2개의 유전자에 의해 코딩된 2개의 동일한 중쇄와 2개의 동일한 경쇄로 구성될 수 있다. 항체는 적어도 4개의 상이한 유전자에 의해 코딩된 2개의 동일하지 않은 중쇄와 2개의 동일하지 않은 경쇄로 구성될 수 있다. 항체 단편은 예를 들어, 1개의 중쇄와 1개의 경쇄(예를 들어, Fab 또는 Fab'), 2개의 중쇄와 2개의 경쇄(예를 들어, F(ab')2), 1개의 중쇄(예를 들어, VHH, VH 또는 VL), 또는 VH 및 VL 둘 다를 포함하는 단일 폴리펩티드(scFv)로 구성될 수 있다. 일부 실시양태에서, 재조합 숙주 세포 내의 하나 이상의 발현 벡터는 동일한 발현 구축물의 다수의 카피를 포함할 수 있다.
일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄는 전체 길이 또는 중쇄 단편이고, 경쇄는 전체 길이 또는 경쇄 단편이다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄 및 경쇄는 동일한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물은 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄 및 경쇄는 상이한 mRNA 전사물로부터 발현된다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다.
추가로, 본원에 기재된 바와 같이, 본 발명의 재조합 그람 음성 숙주 세포는 공-과발현된 단백질, 예를 들어, 불활성화된 프로테아제, 폴딩 조절인자, 샤페론 또는 이들의 임의의 조합의 생성을 위해 하나 이상의 발현 구축물을 함유하는 하나 이상의 발현 벡터를 포함할 수 있다. 관심 있는 재조합 단백질 및 공-과발현된 단백질 발현은 동일한 발현 벡터로부터 발현될 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질 및 공-과발현된 단백질은 동일한 프로모터로부터 공-전사된다. 일부 실시양태에서, 관심 있는 재조합 단백질 및 공-과발현된 단백질은 상이한 프로모터로부터 전사된다. 관심 있는 재조합 단백질 및 공-과발현된 단백질은 재조합 숙주 세포에서 상이한 발현 벡터로부터 발현될 수 있다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 1개 내지 5개의 발현 벡터를 포함한다. 일부 실시양태에서, 발현 벡터 각각은 1개 내지 5개의 발현 구축물을 포함한다. 일부 실시양태에서, 발현 구축물 각각은 상이한 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터(들)에 존재하는 하나 초과의 발현 구축물은 동일한 단백질을 코딩한다.
재조합 단백질을 제조하는 방법
본 발명은 본원에 기재된 재조합 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 재조합 단백질을 제조하는 방법을 포함한다. 본 발명의 조성물 및 방법은 고품질, 고수율 또는 이들 둘 다의 관심 있는 재조합 단백질을 제조하는 데 사용될 수 있다. 관심 있는 고품질 재조합 단백질은 가용성 재조합 단백질, 활성 재조합 단백질, 온전한 재조합 단백질 또는 이들의 임의의 조합일 수 있다. 일부 실시양태에서, 본 발명의 조성물 및 방법은 가용성, 활성 또는 온전한 재조합 단백질, 고수율로 존재하는 재조합 단백질, 또는 이들의 임의의 조합을 제조하는 데 사용된다.
일부 실시양태에서, 관심 있는 재조합 단백질을 제조하는 방법은 본원에 제시된 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하고, 이때 재조합 그람 음성 숙주 세포는 적합한 발효 조건 하에서 배양되었고, 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 벡터로 형질전환되었다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계는 적어도 하나의 정제 단계를 포함한다. 일부 실시양태에서, 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질이 측정된다. 일부 실시양태에서, 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질은 대조군 세포로부터 회수된 관심 있는 재조합 단백질의 수율 및/또는 품질과 비교된다.
본원에 기재된 본 발명의 그람 음성 박테리아 숙주 세포를 사용하여 관심 있는 재조합 단백질을 제조하고 평가하는 것은 박테리아 숙주 세포에서 재조합 단백질을 제조하는 알려진 수단 및 방법과 함께, 본원에 기재된 바와 같이 수행될 수 있다.
그람 음성 박테리아 숙주 세포
본 발명의 그람 음성 박테리아 숙주 세포는 슈도모나드(즉, 슈도모나달레스(Pseudomonadales) 목의 숙주 세포) 및 당분야에 알려진 관련 박테리아 유기체, 예를 들어, 에스케리키아(Escherichia), 에르위니아(Erwinia), 살모넬라(Salmonella), 시겔라(Shigella), 모락셀라(Moraxella), 헬리코박터(Helicobacter), 레지오넬라(Legionella), 네이세리아(Neisseria), 헤모필루스(Haemophilus), 아시네토박터(Acinetobacter), 자일렐라(Xylella), 박테로이데스(Bacteroides), 시트로박터(Citrobacter), 엔테로박터(Enterobacter), 클렙시엘라(Klebsiella), 프로테우스(Proteus), 세라티아(Serratia), 시겔라(Shigella), 예르시니아(Yersinia) 및 비브리오(Vibrio)를 포함하고, 슈도모나스 플루오레센스, 슈도모나스 에루기노사, 슈도모나스 푸티다, 에스케리키아 콜라이, 에르위니아 크라이산테미(E. chrysanthemi), 살모넬라 타이피무륨(S. typhimurium), 헬리코박터 파일로리(Helicobacter pylori), 레지오넬라 뉴모필라(L. pneumophila), 네이세리아 메닝기티디스(N. meningitidis), 네이세리아 고노로에아(N. gonorrhoeae), 헤모필루스 인플루엔자(Haemophilus influenzae), 비브리오 콜레라(V. cholerae), 자일렐라 파스티디오사(X. fastidiosa) 및 아시네토박터 베이일리(A. baylyi)를 포함하나 이들로 제한되지 않는 임의의 종 또는 아종을 포함한다.
일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 플루오레센스이다.
실시양태에서, 숙주 세포는 슈도모나달레스 목(본원에서 "슈도모나드"로서 지칭됨)의 세포이다. 숙주 세포가 슈도모나달레스 목의 세포인 경우, 숙주 세포는 슈도모나스 속을 포함하는 슈도모나다세아(Pseudomonadaceae) 과의 구성원일 수 있다.
감마 프로테오박테리아 숙주는 에스케리키아 콜라이 종의 구성원 및 슈도모나스 플루오레센스 종의 구성원을 포함한다. 다른 슈도모나스 유기체도 유용할 수 있다. 슈도모나드 및 밀접하게 관련된 종은 전체가 본원에 참고로 포함되는 문헌[R. E. Buchanan and N. E. Gibbons (eds.), Bergey's Manual of Determinative Bacteriology, pp. 217-289 (8th ed., 1974) (The Williams & Wilkins Co., Baltimore, Md., USA)]에 "그람 음성 호기성 간균 및 구균"으로서 기재된 과 및/또는 속에 속하는 프로테오박테리아 군을 포함하는 그람 음성 프로테오박테리아 하위군 1을 포함한다. 표 3은 유기체의 이러한 과 및 속을 제시한다.
슈도모나스 및 밀접하게 관련된 박테리아는 일반적으로 "그람(-) 프로테오박테리아 하위군 1" 또는 "그람 음성 호기성 간균 및 구균"으로서 정의된 군의 일부이다(Buchanan and Gibbons (eds.) (1974) Bergey's Manual of Determinative Bacteriology, pp. 217-289). 슈도모나스 숙주 균주는 문헌, 예를 들어, 본원에 각각 참고로 포함되는 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호(둘 다 발명의 명칭이 "Expression of mammalian proteins in Pseudomonas fluorescens"임)에 기재되어 있다.
"그람 음성 프로테오박테리아 하위군 1"은 분류에 사용된 기준에 따라 이 제목에 분류될 프로테오박테리아도 포함한다. 이 제목은 이전에 이 단락에서 분류되었으나 더 이상 분류되지 않은 군, 예컨대, 악시도보락스(Acidovorax), 브레분디모나스(Brevundimonas), 부르크홀데리아(Burkholderia), 하이드로제노파가(Hydrogenophaga), 오세아니모나스(Oceanimonas), 랄스토니아(Ralstonia) 및 스테노트로포모나스(Stenotrophomonas) 속; 잔토모나스(Xanthomonas) 속에 속하는(그리고 이전에 이의 종으로서 지칭된) 유기체의 재분류에 의해 생성된 스핑고모나스(Sphingomonas) 속(및 이로부터 유래한 블라스토모나스(Blastomonas) 속); 상기 문헌[Bergey (1974)]에서 정의된 아세토박터(Acetobacter) 속에 속하는 유기체의 재분류에 의해 생성된 악시도모나스(Acidomonas) 속도 포함한다. 또한, 숙주는 각각 알테로모나스 할로플란크티스(Alteromonas haloplanktis), 알테로모나스 니그리파시엔스(Alteromonas nigrifaciens) 및 알테로모나스 푸트레파시엔스(Alteromonas putrefaciens)로서 재분류된 슈도모나스 속의 슈도모나스 에날리아(Pseudomonas enalia)(ATCC 14393), 슈도모나스 니그리파시엔시(Pseudomonas nigrifaciensi)(ATCC 19375) 및 슈도모나스 푸트레파시엔스(Pseudomonas putrefaciens)(ATCC 8071)로부터의 세포를 포함할 수 있다. 유사하게, 예를 들어, 슈도모나스 악시도보란스(Pseudomonas acidovorans)(ATCC 15668) 및 슈도모나스 테스토스테로니(Pseudomonas testosteroni)(ATCC 11996)는 나중에 각각 코마모나스 악시도보란스(Comamonas acidovorans) 및 코마모나스 테스토스테로니(Comamonas testosteroni)로서 재분류되었고, 슈도모나스 니그리파시엔스(Pseudomonas nigrifaciens)(ATCC 19375) 및 슈도모나스 피시시다(Pseudomonas piscicida)(ATCC 15057)는 각각 슈도알테로모나스 니그리파시엔스(Pseudoalteromonas nigrifaciens) 및 슈도알테로모나스 피시시다(Pseudoalteromonas piscicida)로서 재분류되었다. "그람 음성 프로테오박테리아 하위군 1"은 슈도모나다세아, 아조토박테라세아(Azotobacteraceae)(현재는 동의어인 슈도모나다세아의 "아조토박터 군"으로 종종 지칭됨), 리조비아세아(Rhizobiaceae) 및 메틸로모나다세아(Methylomonadaceae)(현재는 동의어인 "메틸로코카세아(Methylococcaceae)"로 종종 지칭됨) 과들 중 임의의 과에 속하는 것으로서 분류된 프로테오박테리아도 포함한다. 결과적으로, 본원에 달리 기재된 속들 이외에, "그람 음성 프로테오박테리아 하위군 1"에 속하는 추가 프로테오박테리아 속은 1) 아조리조필루스(Azorhizophilus) 속의 아조토박터 군 박테리아; 2) 셀비브리오(Cellvibrio), 올리겔라(Oligella) 및 테레디니박터(Teredinibacter) 속의 슈도모나다세아 과 박테리아; 3) 켈라토박터(Chelatobacter), 엔시퍼(Ensifer), 리베리박터(Liberibacter)("칸디다투스 리베리박터(Candidatus Liberibacter)"로서도 지칭됨) 및 시노리조비움(Sinorhizobium) 속의 리조비아세아 과 박테리아; 및 4) 메틸로박터(Methylobacter), 메틸로칼둠(Methylocaldum), 메틸로마이크로비움(Methylomicrobium), 메틸로사르시나(Methylosarcina) 및 메틸로스패라(Methylosphaera) 속의 메틸로코카세아 과 박테리아를 포함한다.
숙주 세포는 "그람 음성 프로테오박테리아 하위군 16"으로부터 선택될 수 있다. "그람 음성 프로테오박테리아 하위군 16"은 하기 슈도모나스 종의 프로테오박테리아 군으로서 정의된다(예시적인 균주(들)의 ATCC 또는 다른 수탁번호는 가로 안에 표시됨): 슈도모나스 아비에타니필라(Pseudomonas abietaniphila)(ATCC 700689); 슈도모나스 에루기노사(ATCC 10145); 슈도모나스 알칼리제네스(Pseudomonas alcaligenes)(ATCC 14909); 슈도모나스 안귈리셉티카(Pseudomonas anguilliseptica)(ATCC 33660); 슈도모나스 시트로넬로리스(Pseudomonas citronellolis)(ATCC 13674); 슈도모나스 플라베센스(Pseudomonas flavescens)(ATCC 51555); 슈도모나스 멘도시나(Pseudomonas mendocina)(ATCC 25411); 슈도모나스 니트로리덕센스(Pseudomonas nitroreducens)(ATCC 33634); 슈도모나스 올레오보란스(Pseudomonas oleovorans)(ATCC 8062); 슈도모나스 슈도알칼리제네스(Pseudomonas pseudoalcaligenes)(ATCC 17440); 슈도모나스 레시노보란스(Pseudomonas resinovorans)(ATCC 14235); 슈도모나스 스트라미네아(Pseudomonas straminea)(ATCC 33636); 슈도모나스 아가리시(Pseudomonas agarici)(ATCC 25941); 슈도모나스 알칼리필라(Pseudomonas alcaliphila); 슈도모나스 알기노보라(Pseudomonas alginovora); 슈도모나스 안데르소니(Pseudomonas andersonii); 슈도모나스 아스플레니(Pseudomonas asplenii)(ATCC 23835); 슈도모나스 아젤라이카(Pseudomonas azelaica)(ATCC 27162); 슈도모나스 베예린키(Pseudomonas beyerinckii)(ATCC 19372); 슈도모나스 보레알리스(Pseudomonas borealis); 슈도모나스 보레오폴리스(Pseudomonas boreopolis)(ATCC 33662); 슈도모나스 브라시카세아룸(Pseudomonas brassicacearum); 슈도모나스 부타노보라(Pseudomonas butanovora)(ATCC 43655); 슈도모나스 셀룰로사(Pseudomonas cellulosa)(ATCC 55703); 슈도모나스 아우란티아카(Pseudomonas aurantiaca)(ATCC 33663); 슈도모나스 클로로라피스(Pseudomonas chlororaphis)(ATCC 9446, ATCC 13985, ATCC 17418, ATCC 17461); 슈도모나스 프라기(Pseudomonas fragi)(ATCC 4973); 슈도모나스 룬덴시스(Pseudomonas lundensis)(ATCC 49968); 슈도모나스 테트롤렌스(Pseudomonas taetrolens)(ATCC 4683); 슈도모나스 시시콜라(Pseudomonas cissicola)(ATCC 33616); 슈도모나스 코로나파시엔스(Pseudomonas coronafaciens); 슈도모나스 디테르페니필라(Pseudomonas diterpeniphila); 슈도모나스 엘롱가타(Pseudomonas elongata)(ATCC 10144); 슈도모나스 플렉텐스(Pseudomonas flectens)(ATCC 12775); 슈도모나스 아조토포르만스(Pseudomonas azotoformans); 슈도모나스 브레네리(Pseudomonas brenneri); 슈도모나스 세드렐라(Pseudomonas cedrella); 슈도모나스 코루가타(Pseudomonas corrugata)(ATCC 29736); 슈도모나스 엑스트레모리엔탈리스(Pseudomonas extremorientalis); 슈도모나스 플루오레센스(ATCC 35858); 슈도모나스 게사르디(Pseudomonas gessardii); 슈도모나스 리바넨시스(Pseudomonas libanensis); 슈도모나스 만델리(Pseudomonas mandelii)(ATCC 700871); 슈도모나스 마르기날리스(Pseudomonas marginalis)(ATCC 10844); 슈도모나스 미굴라(Pseudomonas migulae); 슈도모나스 뮤시돌렌스(Pseudomonas mucidolens)(ATCC 4685); 슈도모나스 오리엔탈리스(Pseudomonas orientalis); 슈도모나스 로데시아(Pseudomonas rhodesiae); 슈도모나스 신잔타(Pseudomonas synxantha)(ATCC 9890); 슈도모나스 톨라시(Pseudomonas tolaasii)(ATCC 33618); 슈도모나스 베로니(Pseudomonas veronii)(ATCC 700474); 슈도모나스 프레데릭스베르겐시스(Pseudomonas frederiksbergensis); 슈도모나스 제니쿨라타(Pseudomonas geniculata)(ATCC 19374); 슈도모나스 진저리(Pseudomonas gingeri); 슈도모나스 그라미니스(Pseudomonas graminis); 슈도모나스 그리몬티(Pseudomonas grimontii); 슈도모나스 할로데니트리피칸스(Pseudomonas halodenitrificans); 슈도모나스 할로필라(Pseudomonas halophila); 슈도모나스 히비스시콜라(Pseudomonas hibiscicola)(ATCC 19867); 슈도모나스 후티엔시스(Pseudomonas huttiensis)(ATCC 14670); 슈도모나스 하이드로게노보라(Pseudomonas hydrogenovora); 슈도모나스 제세니(Pseudomonas jessenii)(ATCC 700870); 슈도모나스 킬로넨시스(Pseudomonas kilonensis); 슈도모나스 란세올라타(Pseudomonas lanceolata)(ATCC 14669); 슈도모나스 리니(Pseudomonas lini); 슈도모나스 마르기네이트(Pseudomonas marginate)(ATCC 25417); 슈도모나스 메피티카(Pseudomonas mephitica)(ATCC 33665); 슈도모나스 데니트리피칸스(Pseudomonas denitrificans)(ATCC 19244); 슈도모나스 퍼투시노제나(Pseudomonas pertucinogena)(ATCC 190); 슈도모나스 픽토룸(Pseudomonas pictorum)(ATCC 23328); 슈도모나스 사이크로필라(Pseudomonas psychrophila); 슈도모나스 필바(Pseudomonas filva)(ATCC 31418); 슈도모나스 몬테일리(Pseudomonas monteilii)(ATCC 700476); 슈도모나스 모셀리(Pseudomonas mosselii); 슈도모나스 오리지하비탄스(Pseudomonas oryzihabitans)(ATCC 43272); 슈도모나스 플레코글로시시다(Pseudomonas plecoglossicida)(ATCC 700383); 슈도모나스 푸티다(ATCC 12633); 슈도모나스 리액탄스(Pseudomonas reactans); 슈도모나스 스피노사(Pseudomonas spinosa)(ATCC 14606); 슈도모나스 발레아리카(Pseudomonas balearica); 슈도모나스 루테올라(Pseudomonas luteola)(ATCC 43273); 슈도모나스 스투제리(Pseudomonas stutzeri)(ATCC 17588); 슈도모나스 아미그달리(Pseudomonas amygdali)(ATCC 33614); 슈도모나스 아벨라나(Pseudomonas avellanae)(ATCC 700331); 슈도모나스 카리카파파예(Pseudomonas caricapapayae)(ATCC 33615); 슈도모나스 시코리(Pseudomonas cichorii)(ATCC 10857); 슈도모나스 피쿠세렉타(Pseudomonas ficuserectae)(ATCC 35104); 슈도모나스 푸스코바기나(Pseudomonas fuscovaginae); 슈도모나스 멜리아(Pseudomonas meliae)(ATCC 33050); 슈도모나스 시링가(Pseudomonas syringae)(ATCC 19310); 슈도모나스 비리디플라바(Pseudomonas viridiflava)(ATCC 13223); 슈도모나스 써모카르복시도보란스(Pseudomonas thermocarboxydovorans)(ATCC 35961); 슈도모나스 써모톨레란스(Pseudomonas thermotolerans); 슈도모나스 티버발렌시스(Pseudomonas thivervalensis); 슈도모나스 반쿠버렌시스(Pseudomonas vancouverensis)(ATCC 700688); 슈도모나스 위스콘시넨시스(Pseudomonas wisconsinensis); 및 슈도모나스 샤메넨시스(Pseudomonas xiamenensis). 한 실시양태에서, 숙주 세포는 슈도모나스 플루오레센스이다.
숙주 세포는 "그람 음성 프로테오박테리아 하위군 17"로부터 선택될 수도 있다. "그람 음성 프로테오박테리아 하위군 17"은 예를 들어, 하기 슈도모나스 종에 속하는 프로테오박테리아를 포함하는 "형광 슈도모나드"로서 당분야에 알려진 프로테오박테리아 군으로서 정의된다: 슈도모나스 아조토포르만스; 슈도모나스 브레네리; 슈도모나스 세드렐라; 슈도모나스 코루가타; 슈도모나스 엑스트레모리엔탈리스; 슈도모나스 플루오레센스; 슈도모나스 게사르디; 슈도모나스 리바넨시스; 슈도모나스 만델리; 슈도모나스 마르기날리스; 슈도모나스 미굴라; 슈도모나스 뮤시돌렌스; 슈도모나스 오리엔탈리스; 슈도모나스 로데시아; 슈도모나스 신잔타; 슈도모나스 톨라시; 및 슈도모나스 베로니.
숙주 균주 배경
본 발명의 방법을 실시하는 데 유용한 숙주 세포, 균주 및 발현 구축물은 당업자에게 알려져 있고 문헌에 기재되어 있는 시약 및 방법을 사용함으로써 확인될 수 있거나 제조될 수 있다. 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제8,288,127호("Protein Expression Systems")는 염색체 lacI 유전자 삽입물(예를 들어, lsc::lacIQ1)을 포함하는 영양요구성 슈도모나스 플루오레센스 숙주 세포 내로 핵산 구축물을 도입함으로써 재조합 폴리펩티드를 제조하는 것을 설명한다. 상기 핵산 구축물은 숙주 세포에서 핵산의 발현을 유도할 수 있는 프로모터에 작동 가능하게 연결된 재조합 폴리펩티드를 코딩하는 뉴클레오타이드 서열을 포함하고, 영양요구성 선택 마커를 코딩하는 뉴클레오타이드 서열도 포함한다. 영양요구성 선택 마커는 영양요구성 숙주 세포에 대한 원영양성(prototrophy)을 회복시키는 폴리펩티드이다. 실시양태에서, 세포는 프롤린, 우라실, 또는 이들의 조합에 대해 영양요구성을 나타낸다. 실시양태에서, 숙주 세포는 MB101(ATCC 수탁번호 PTA-7841)로부터 유래한다. 전체가 본원에 참고로 포함되는 미국 특허 제8,288,127호("Protein Expression Systems") 및 문헌[Schneider, et al., 2005, "Auxotrophic markers pyrF and proC can replace antibiotic markers on protein production plasmids in high-cell-density Pseudomonas fluorescens fermentation," Biotechnol. Progress 21(2): 343-8]은 균주 MB101에서 pyrF 유전자를 결실시킴으로써 구축된, 우라실에 대한 영양요구성을 가진 생산 숙주 균주를 설명한다. pyrF 유전자를 균주 MB214(ATCC 수탁번호 PTA-7840)로부터 클로닝하여, pyrF 결실을 보완하여 원영양성을 회복시키는 플라스미드를 생성하였다. 특정 실시양태에서, 슈도모나스 플루오레센스 숙주 세포에서 이중 pyrF-proC 이중 영양요구성 선택 마커 시스템이 사용된다. 공개된 문헌을 고려하면, 기재된 pyrF 결실 생산 숙주 균주는 알려진 방법을 이용함으로써 당업자에 의해 제조될 수 있고, 본 발명의 방법을 실시하는 데 유용한 것으로서 본원에 기재된 게놈 변화를 비롯한 다른 원하는 게놈 변화를 도입하기 위한 배경으로서 사용될 수 있다. 당업자는 당분야에 알려져 있고 문헌에 기재되어 있는 많은 적합한 방법들 중 임의의 방법을 이용하여, 예를 들어, PyrF, Prc1, Prc2, MepM1을 코딩하는 유전자, 및 임의로 추가 프로테아제 또는 자가용해 인자를 코딩하는 유전자를 불활성화시킴으로써, 공개적으로 입수 가능한 숙주 세포, 예를 들어, 슈도모나스 플루오레센스 MB101을 사용하여 본 발명의 방법에 유용한 생산 숙주 균주를 생성할 수 있음을 이해할 것이다. 또한, 당분야에 알려져 있고 문헌에 기재되어 있는 임의의 적합한 방법을 이용하여 원영양성 회복 플라스미드, 예를 들어, 균주 MB214의 pyrF 유전자를 운반하는 플라스미드를 균주 내로 형질전환시킬 수 있다는 것도 이해된다. 추가로, 당분야에 잘 알려져 있는 방법을 이용하여 불활성화된 프로테아제 및 폴딩 조절인자 과발현 구축물을 이러한 균주에 도입할 수 있다.
실시양태에서, 본 발명의 방법에 사용되는 슈도모나스 플루오레센스 숙주 균주는 유전자 pyrF가 결실되어 있고 이. 콜라이 lacI 전사 억제제가 삽입되고 레반수크라제(levansucrase) 유전자(lsc)와 융합되어 있는 기탁된 균주 MB101의 유도체인 DC1032(Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1)이다. 이 유전자들의 서열 및 이들을 사용하는 방법은 당분야에 알려져 있으며 문헌, 예를 들어, 본원에 각각 참고로 포함되는 미국 특허 제8,288,127호, 제8,017,355호("Mannitol induced promoter systems in bacterial host cells") 및 제7,794,972호("Benzoate-and anthranilate-inducible promoters")에 기재되어 있다.
표 4에 나열된 숙주 세포, 예를 들어, DC1032, DC954 또는 DC454와 동등한 슈도모나스 숙주 세포, 또는 본원에 기재된 임의의 숙주 세포 또는 발현 균주는 본원 및 공개된 문헌에 기재된 방법을 이용함으로써 MB101로부터 구축될 수 있다. 실시양태에서, DC1032 또는 DC954와 동등한 숙주 세포가 사용된다. 숙주 세포 DC454는 전체가 본원에 참고로 포함되는 문헌[Schneider, et al., 2005](여기서, 이 세포는 DC206으로서 지칭됨) 및 미국 특허 제8,569,015호("rPA Optimization")에 기재되어 있다. DC206은 DC454와 동일한 균주이고; 동물 성분 무함유 배지에서 3회 계대배양된 후 DC454로서 재명명되었다. DC454는 DC1032 및 DC954의 모 균주이다.
당분야에서 통상의 기술을 가진 자는 실시양태에서, 숙주 세포 게놈 결실 또는 돌연변이(예를 들어, 불활성화 또는 쇠약화 돌연변이)가 예를 들어, 슈도모나스 플루오레센스에서 복제되지 않는, 결실될 유전자를 플랭킹하는 영역을 운반하는 결실 플라스미드를 사용한 대립유전자 교환에 의해 달성될 수 있음을 이해할 것이다. 결실 플라스미드는 결실될 유전자의 업스트림 및 다운스트림 영역을 포함하는, 결실될 유전자를 PCR 증폭함으로써 구축될 수 있다. 결실은 아가로스 슬래브 겔에서 전기영동으로 분리한 후에 관찰된, 분석용 프라이머를 사용하여 게놈 DNA로부터 증폭시킨 PCR 생성물을 시퀀싱한 다음, 단편을 DNA 시퀀싱함으로써 확인될 수 있다. 실시양태에서, 유전자는 완전한 결실, 부분적 결실 또는 돌연변이, 예를 들어, 프레임시프트, 점 또는 삽입 돌연변이에 의해 불활성화된다.
실시양태에서, 본 발명과 관련하여 사용된 균주를 당분야에 알려진 방법에 따라 FMO 플라스미드로 형질전환시켰다. 본 발명의 방법에 따라 재조합 단백질을 발현시키는 데 유용한 재조합 단백질 발현 균주 및 상응하는 숙주 세포의 특정 예에 대한 유전형은 표 10에 제시되어 있다. 실시양태에서, 본 발명의 방법을 이용하여 관심 있는 재조합 단백질을 발현시키기 위해 표 4에 기재된 임의의 숙주 세포와 동등한 숙주 세포를 본원에 기재된 발현 벡터로 형질전환시켜, 본원에 기재된 발현 균주와 동등한 발현 균주를 수득하였다. 기재된 바와 같이, 적절한 발현 균주는 본원 및 문헌에 제시된 방법에 따라 유사하게 유도될 수 있다.
발현 시스템
당업자는 본원의 교시를 기반으로 본 방법에 따라 관심 있는 재조합 단백질을 제조하는 데 유용한 적절한 박테리아 발현 시스템을 확인할 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 뉴클레오타이드 서열을 포함하는 발현 구축물은 유도성 발현 벡터의 일부로서 제공된다. 실시양태에서, 발현 벡터로 형질전환시킨 숙주 세포를 배양하고, 발현 벡터로부터 관심 있는 재조합 단백질의 발현을 유도한다. 발현 벡터는 예를 들어, 플라스미드일 수 있다. 실시양태에서, 발현 벡터는 선택 마커를 추가로 포함하는 재조합 단백질 코딩 서열을 코딩하는 플라스미드이고, 숙주 세포는 플라스미드의 유지를 허용하는 선택 조건 하에서 생장된다. 실시양태에서, 발현 구축물은 숙주 세포 게놈에 통합된다. 실시양태에서, 발현 구축물은 관심 있는 재조합 단백질을 주변세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다.
본 발명의 방법에 유용한 숙주 세포에서 유용한 조절 서열(예를 들어, 프로모터, 분비 신호 및 리보좀 결합 부위)을 포함하는 이종 단백질을 발현시키는 방법은 문헌, 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,458,487호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호, 미국 특허 제8,530,171호("High level expression of recombinant toxin proteins"), 미국 특허 제10,118,956호, 미국 특허 제5,888,808호("Bacterial polypeptide expression employing tryptophan promoter-operator"), 미국 특허 제9,534,217호("Method of creating a library of bacterial clones with varying levels of gene expression") 및 문헌[Vellanoweth, R.L., and Rabinowitz, J. C., May 1992, "The influence of ribosome-binding-site elements on translational efficiency in Bacillus subtilis and Escherichia coli in vivo," Molecular Microbiology 6(9):1105-1114]에 기재되어 있다. 실시양태에서, 본 발명과 관련하여 사용된 분비 리더는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호, 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호, 미국 특허 제8,530,171호 및 미국 특허 제10,118,956호 중 임의의 특허에 개시된 분비 리더이다. 이 특허들은 이종 단백질 발현을 증가시키기 위해 폴딩 조절인자를 과발현하도록 조작되었거나 프로테아제 돌연변이가 도입되어 있는, 본원의 방법을 실시하는 데 유용한 박테리아 숙주 균주도 설명한다.
본 발명에 따라 사용되는 프로모터는 항시성 프로모터 또는 조절 프로모터일 수 있다. 유도성 프로모터의 예는 lac 프로모터(즉, lacZ 프로모터)로부터 유래한 계열의 프로모터, 예를 들어, 본원에 참고로 포함되는 미국 특허 제4,551,433호("Microbial Hybrid Promoters")에 기재된 tac trc 프로모터뿐만 아니라, Ptac16, Ptac17, PtacII, PlacUV5 및 T7lac 프로모터도 포함한다. 실시양태에서, 프로모터는 숙주 세포 유기체로부터 유래하지 않는다. 실시양태에서, 프로모터는 이. 콜라이 유기체로부터 유래한다. 실시양태에서, lac 프로모터는 플라스미드로부터 관심 있는 재조합 단백질의 발현을 조절하는 데 사용된다. lac 프로모터 유도체 또는 계열 구성원, 예를 들어, tac 프로모터의 경우, 유도제는 IPTG(이소프로필-β-D-1-티오갈락토피라노사이드, "이소프로필티오갈락토사이드")이다. 실시양태에서, IPTG는 당분야에 알려져 있고 문헌, 예를 들어, 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호에 기재되어 있는 방법에 따라 슈도모나스 숙주 세포에서 lac 프로모터로부터 관심 있는 재조합 단백질의 발현을 유도하기 위해 숙주 세포 배양물에 첨가된다.
본 발명에 따른 발현 시스템에 유용한 비-lac 프로모터의 예는 예를 들어, 문헌[J. Sanchez-Romero & V. De Lorenzo (1999) Manual of Industrial Microbiology and Biotechnology (A. Demain & J. Davies, eds.) pp. 460-74 (ASM Press, Washington, D.C.)]; 문헌[H. Schweizer (2001) Current Opinion in Biotechnology, 12:439-445]; 및 문헌[R. Slater & R. Williams (2000 Molecular Biology and Biotechnology (J. Walker & R. Rapley, eds.) pp. 125-54 (The Royal Society of Chemistry, Cambridge, UK)]에 기재된 PR(고온에 의해 유도됨), PL(고온에 의해 유도됨), Pm(알킬벤조에이트 또는 할로벤조에이트에 의해 유도됨), Pu(알킬톨루엔 또는 할로톨루엔에 의해 유도됨), 또는 Psal(살리실레이트에 의해 유도됨)을 포함한다. 선택된 박테리아 숙주 세포에 대한 천연 프로모터의 뉴클레오타이드 서열을 가진 프로모터, 예를 들어, 슈도모나스 안트라닐레이트 또는 벤조에이트 오페론 프로모터(Pant, Pben)를 사용하여 관심 있는 폴리펩티드를 코딩하는 발현 구축물의 발현을 조절할 수도 있다. 서열이 동일하든 아니면 상이하든 관계없이, 하나 초과의 프로모터가 또 다른 프로모터에 공유부착되어 있는 탠덤 프로모터, 예를 들어, 동일하거나 상이한 유기체로부터 유래한 Pant-Pben 탠덤 프로모터(프로모터간 하이브리드) 또는 Plac-Plac 탠덤 프로모터도 사용될 수 있다. 일부 실시양태에서, 프로모터는 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 제7,476,532호 및 제8,017,355호(둘 다 발명의 명칭이 "Mannitol induced promoter systems in bacterial host cells"임)에 기재된 바와 같은 Pmtl이다.
조절(유도성) 프로모터는 프로모터가 유전자의 일부인 유전자의 전사를 조절하기 위해 프로모터 조절 단백질을 사용한다. 조절 프로모터가 본원에서 사용되는 경우, 상응하는 프로모터 조절 단백질도 본 발명에 따른 발현 시스템의 일부일 것이다. 프로모터 조절 단백질의 예는 활성화제 단백질, 예를 들어, 이. 콜라이 이화물질 활성화제 단백질, MalT 단백질; AraC 계열 전사 활성화제; 억제제 단백질, 예를 들어, 이. 콜라이 Lad 단백질; 및 이중 기능 조절 단백질, 예를 들어, 이. 콜라이 NagC 단백질을 포함한다. 많은 조절 프로모터/프로모터 조절 단백질 쌍이 당분야에 알려져 있다. 일부 실시양태에서, 본 조성물 및 방법을 이용함으로써 생성된 관심 있는 재조합 단백질을 코딩하는 유전자를 전사하는 데 사용되는 프로모터는 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터, Trp 프로모터 및 아라비노스 프로모터로부터 선택된다. 관심 있는 재조합 단백질을 생성하기 위해 하나 초과의 발현 구축물이 사용되는 경우, 하나 초과의 상이한 프로모터가 사용될 수 있다.
프로모터 조절 단백질은 이펙터 화합물, 즉 조절 단백질과 가역적으로 또는 비가역적으로 결합하여, 상기 단백질이 프로모터의 조절 하에 있는 유전자의 적어도 하나의 DNA 전사 조절 영역으로부터 방출될 수 있게 하거나 이 영역에 결합할 수 있게 함으로써, 유전자의 전사를 시작하는 데 있어서 전사효소의 작용을 허용하거나 차단하는 화합물과 상호작용한다. 이펙터 화합물은 유도제 또는 공-억제제로서 분류되며, 이러한 화합물은 천연 이펙터 화합물 및 무료 유도제 화합물을 포함한다. 많은 조절 프로모터/프로모터 조절 단백질/이펙터 화합물 트리오가 당분야에 알려져 있다. 이펙터 화합물은 세포 배양 또는 발효 전반에 걸쳐 사용될 수 있지만, 조절 프로모터가 사용되는 바람직한 실시양태에서, 원하는 양 또는 밀도의 숙주 세포 바이오매스의 성장 후에, 적절한 이펙터 화합물을 배양물에 첨가하여, 관심 있는 재조합 단백질을 코딩하는 원하는 유전자(들)의 발현을 직접적으로 또는 간접적으로 야기한다.
lac 계열 프로모터가 사용되는 실시양태에서, lacI 유전자도 시스템에 존재할 수 있다. 일반적으로 항시적으로 발현되는 유전자인 lacI 유전자는 lac 계열 프로모터의 lac 오퍼레이터에 결합하는 Lac 억제제 단백질인 LacI 단백질을 코딩한다. 따라서, lac 계열 프로모터가 사용되는 경우, lac 유전자도 발현 시스템에 포함되어 발현될 수 있다.
발현 벡터
관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 적합한 발현 벡터(들)에 도입하여, 본원에 기재된 바와 같이 관심 있는 재조합 단백질, 과발현된 단백질, 예를 들어, 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 생성할 수 있거나, 동일한 발현 벡터를 사용하여 관심 있는 재조합 단백질 및 과발현된 단백질 둘 다를 생성할 수 있다. 발현 벡터는 플라스미드일 수 있다. 요구되고 적절한 경우, 당업자는 본 발명과 관련하여 사용할 발현 벡터를 시판되는 발현 벡터로부터 선택할 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 플라스미드는 선택 마커를 포함할 수 있고, 플라스미드를 유지하는 숙주 세포는 선택 조건 하에서 생장될 수 있다. 일부 실시양태에서, 플라스미드는 선택 마커를 포함하지 않는다. 일부 실시양태에서, 발현 벡터는 숙주 세포 게놈에 통합된다. 일부 실시양태에서, 발현 벡터는 발현된 관심 있는 재조합 단백질을 주변세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터는 발현된 관심 있는 재조합 단백질을 세포질로 유도할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 일부 실시양태에서, 발현 벡터는 발현된 Fab'를 주변세포질로 유도할 수 있는 주변세포질 분비 신호에 융합된 Fab', 예를 들어, 항-TNF-알파 Fab'를 코딩한다.
본 조성물 및 방법을 이용하여 생성할 수 있는 관심 있는 재조합 단백질은 본원에 기재되어 있다. 당업자는 관심 있는 재조합 단백질의 아미노산 서열 및 잠재적인 코딩 서열을 용이하게 수득할 수 있다. 항-TNF-알파 Fab'의 중쇄 및 경쇄의 아미노산 서열, 및 Fab'를 코딩하는 뉴클레오타이드 서열의 예는 본원의 서열 표인 표 14에 제공되어 있다.
다른 조절 요소
일부 실시양태에서, 다른 조절 요소가 관심 있는 재조합 단백질을 코딩하는 발현 구축물에 존재한다. 실시양태에서, 관심 있는 가용성 재조합 단백질은 생성 동안 세포의 세포질 또는 주변세포질에 존재한다. 관심 있는 재조합 단백질을 어느 한 구획으로 표적화하는 데 유용한 분비 리더는 본원에 기재되어 있다. 실시양태에서, 본 발명의 발현 구축물은 관심 있는 재조합 단백질을 슈도모나드 세포의 세포질로 수송할 수 있는 분비 신호에 융합된 관심 있는 재조합 단백질을 코딩한다. 실시양태에서, 발현 구축물은 관심 있는 재조합 단백질을 슈도모나드 세포의 주변세포질로 수송할 수 있는 분비 리더에 융합된 관심 있는 재조합 단백질을 코딩한다. 실시양태에서, 분비 리더는 관심 있는 재조합 단백질로부터 절단된다.
다른 요소는 전사 인핸서 서열, 번역 인핸서 서열, 다른 프로모터, 활성화제, 번역 시작 및 정지 신호, 전사 종결요소, 시스트론 조절인자, 폴리시스트론 조절인자, 태그 서열, 예컨대, 전술된 바와 같이 발현된 폴리펩티드의 식별, 분리, 정제 및/또는 단리를 용이하게 하는 뉴클레오타이드 서열 태그 및 태그 폴리펩티드 코딩 서열을 포함하나 이들로 제한되지 않는다. 일부 실시양태에서, 발현 구축물은 단백질 코딩 서열 이외에, 이에 작동 가능하게 연결된 하기 조절 요소들 중 임의의 조절 요소를 포함한다: 프로모터, 리보좀 결합 부위(RBS), 전사 종결요소, 및 번역 시작 및 정지 신호. 유용한 RBS는 예를 들어, 앞서 인용된 미국 특허 제10,118,956호 및 제9,580,719호에 따른 발현 시스템에서 숙주 세포로서 유용한 종들 중 임의의 종으로부터 수득될 수 있다. 많은 RBS가 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 문헌[D. Frishman et al., Gene 234(2):257-65 (8 Jul. 1999)]; 및 문헌[B. E. Suzek et al., Bioinformatics 17(12):1123-30 (December 2001)]에 설명되어 있고 언급되어 있다. 추가로, 천연 또는 합성 RBS, 예를 들어, 유럽 특허 제0207459호(합성 RBS); 및 문헌[O. Ikehata et al., Eur. J. Biochem. 181(3):563-70 (1989)]에 기재된 RBS가 사용될 수 있다. 일부 실시양태에서, "Hi" 리보좀 결합 부위인 aggagg(서열번호 59)가 구축물에 사용된다. RBS와 번역 개시 코돈 사이의 간격의 최적화를 포함하는 리보좀 결합 부위는 문헌, 예를 들어, 본원에 참고로 포함되는 문헌[Chen, et al., 1994, "Determination of the optimal aligned spacing between the Shine-Dalgarno sequence and the translation initiation codon of Escherichia coli mRNAs," Nucleic Acids Research 22(23):4953-4957] 및 문헌[Ma, et al., 2002, "Correlations between Shine-Dalgarno Sequences and Gene Features Such as Predicted Expression Levels and Operon Structures," J. Bact. 184(20): 5733-45]에 기재되어 있다.
본 발명에 유용한 방법, 벡터, 번역과 전사 요소, 및 다른 요소의 추가 예는 당분야에 잘 알려져 있으며, 예를 들어, 본원에 참고로 포함되는 미국 특허 제5,055,294호(Gilroy) 및 미국 특허 제5,128,130호(Gilroy et al.); 미국 특허 제5,281,532호(Rammler et al.); 미국 특허 제4,695,455호 및 미국 특허 제4,861,595호(Barnes et al.); 미국 특허 제4,755,465호(Gray et al.); 및 미국 특허 제5,169,760호(Wilcox)뿐만 아니라, 본원에 참고로 포함되는 다른 문헌에도 기재되어 있다.
분비 리더 서열
실시양태에서, 분비 신호 또는 리더 코딩 서열은 관심 있는 재조합 단백질을 코딩하는 서열의 N-말단에 융합된다. 분비 신호 서열의 사용은 박테리아에서 재조합 단백질의 생성을 증가시킬 수 있다. 추가로, 많은 유형의 단백질은 알려진 방법을 이용함으로써 비효율적으로 달성되는 2차 변형을 요구한다. 분비 리더 사용은 세포내 환경으로부터 단백질을 분비함으로써 적절하게 폴딩된 단백질의 수거를 증가시킬 수 있다. 그람 음성 박테리아에서, 세포질로부터 분비된 단백질은 외막에 부착된 주변세포질 공간 또는 세포외 브로쓰로 들어갈 수 있다. 이 방법은 봉입체의 형성을 피할 수 있다. 주변세포질 공간 내로의 단백질의 분비는 적절한 디설파이드 결합 형성을 용이하게 하는 효과도 가진다(Bardwell et al., 1994, Phosphate Microorg, Chapter 45, 270-5, and Manoil, 2000, Methods in Enzymol. 326:35-47). 재조합 단백질 분비의 다른 이점은 단백질의 보다 효율적인 단리; 예를 들어, 활성 형태의 단백질의 퍼센트로 표시되는 수율의 증가로 이어지는 단백질의 적절한 폴딩과 디설파이드 결합 형성; 봉입체 형성의 감소와 숙주 세포에 대한 독성의 감소; 및 가용성 형태의 재조합 단백질의 퍼센트 증가를 포함한다. 관심 있는 단백질이 배양 배지 내로 배출될 가능성은 또한 잠재적으로 단백질 생성을 위해 회분식 배양보다는 연속식 배양을 촉진할 수 있다. 분비 신호는 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호 및 미국 특허 출원 공개 제2019/0127744호("Bacterial leader sequences for periplasmic protein expression")뿐만 아니라 미국 특허 제10,118,956호에도 기재되어 있다.
일부 실시양태에서, 관심 있는 재조합 단백질은 숙주 세포의 주변세포질 또는 세포외 공간으로 표적화된다. 일부 실시양태에서, 발현 벡터는 관심 있는 재조합 단백질을 코딩하는 뉴클레오타이드 서열에 작동 가능하게 연결된 분비 신호 폴리펩티드를 코딩하는 뉴클레오타이드 서열을 추가로 포함한다.
코돈 최적화
본 발명은 사용되는 숙주 세포에서 발현되도록 최적화된 임의의 서열을 포함하는, 관심 있는 재조합 단백질에 대한 임의의 적절한 코딩 서열의 사용을 예상한다. 당업자가 이해하는 바와 같이, 관심 있는 재조합 단백질을 코딩하는 핵산 서열은 재조합 그람 음성 박테리아 숙주 세포에서의 발현을 개선하도록 코돈 최적화될 수 있다. 예를 들어, 슈도모나스 숙주 균주에서의 발현을 위한 코돈의 최적화는 예를 들어, 전체가 본원에 참고로 포함되는 미국 특허 출원 공개 제2007/0292918호("Codon Optimization Method")에 기재되어 있다. 이. 콜라이에서의 발현을 위한 코돈 최적화는 예를 들어, 본원에 참고로 포함되는 문헌[Welch, et al., 2009, PLoS One, "Design Parameters to Control Synthetic Gene Expression in Escherichia coli, 4(9): e7002]에 기재되어 있다. 관심 있는 재조합 단백질을 코딩하는 임의의 적합한 서열은 당업자에 의해 널리 알려진 방법에 따라 요구된 바와 같이 생성될 수 있는 것으로 이해된다.
발현 구축물
당업자는 본 개시내용을 고려하여 본 발명의 방법에 따라 관심 있는 재조합 단백질을 생성하는 데 적절한 발현 구축물을 선택할 수 있다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성되는 관심 있는 재조합 단백질은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되고, 이때 상기 발현 구축물은 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열을 코딩하는 적어도 2개의 핵산 서열 각각은 동일한 발현 벡터 또는 별도의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열은 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 2개의 핵산 서열 각각은 동일하거나 상이한 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결된다. 일부 실시양태에서, 숙주 세포에서 관심 있는 재조합 단백질을 코딩하는 핵산 서열 각각은 서열번호 11, 13, 25, 또는 26으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호로부터 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다.
일부 실시양태에서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; 및 (vi) PyrF 결핍이고; 이때 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주인 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형(게놈 변형)을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성될 항체는 이 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되며, 이때 상기 발현 구축물은 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열을 포함한다. 일부 실시양태에서, 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열 중 2개 이상은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 경쇄를 코딩하는 적어도 2개의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, 항체 중쇄를 코딩하는 적어도 2개의 핵산 서열 및 항체 경쇄를 코딩하는 적어도 2개의 핵산 서열 각각은 동일한 발현 벡터 또는 다수의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결되어, 분비 신호-중쇄 융합체 및 분비 신호-경쇄 융합체를 생성한다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각은 서열번호 11로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 경쇄 코딩 핵산 서열 각각은 서열번호 13으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 이. 콜라이 숙주 세포가 아니다.
일부 실시양태에서, 항체를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; (vi) PyrF 결핍이고; 이때 상기 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 항체는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주인 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 항체는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형을 갖고/갖거나, 이 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다. 일부 실시양태에서, 항체는 STR94975, STR94976 및 STR94977의 유전형을 갖고/갖거나, 이 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에서 생성될 Fab 또는 Fab', 예를 들어, 인간 TNF-알파 Fab'는 Fab 또는 Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터에 의해 코딩되고, 이때 상기 발현 구축물은 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열을 포함한다. 일부 실시양태에서, 중쇄는 서열번호 21로 제시된 아미노산 서열을 갖고, 경쇄는 서열번호 23으로 제시된 아미노산 서열을 가진다. 일부 실시양태에서, 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열은 동일한 프로모터로부터 전사된다(공-전사된다). 일부 실시양태에서, 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 경쇄를 코딩하는 적어도 하나의 핵산 서열은 상이한 프로모터로부터 전사된다(공-전사되지 않는다). 공-전사되지 않는 경우, Fab 또는 Fab' 중쇄를 코딩하는 적어도 하나의 핵산 서열 및 Fab 또는 Fab' 경쇄를 코딩하는 적어도 하나의 핵산 서열은 동일한 발현 벡터 또는 별도의 발현 벡터로부터 생성될 수 있다. 일부 실시양태에서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각은 주변세포질 분비 신호를 코딩하는 핵산 서열에 개별적으로 작동 가능하게 연결되어, 분비 신호-중쇄 융합체 및 분비 신호-경쇄 융합체를 생성한다. 일부 실시양태에서, Fab 또는 Fab' 중쇄 코딩 핵산 서열 각각은 서열번호 11로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, Fab 또는 Fb' 경쇄 코딩 핵산 서열 각각은 서열번호 13으로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된다. 일부 실시양태에서, 인간 TNF-알파 Fab' 분비 신호-중쇄 융합체는 서열번호 25로 제시된 아미노산 서열을 갖고, 인간 TNF-알파 Fab' 분비 신호-경쇄 융합체는 서열번호 26으로 제시된 아미노산 서열을 가진다.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 하기 유전형을 가진 재조합 그람 음성 박테리아 숙주 세포에서 생성된다: Δprc1, Δprc2, ΔhslU, ΔhslV, ΔmepM1, ΔRXF04495.2, ΔpyrF, 및 lsc::lacIQ1 . 일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 항-TNF-알파 Fab'이고, 숙주 세포는 하기 a) 내지 d)로부터 선택된 발현 구축물을 포함하는 플라스미드를 추가로 포함한다:
a) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' 중쇄(HC)를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' 경쇄(LC)를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC와 항-TNF-알파 Fab' LC는 공-전사됨;
b) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC와 항-TNF-알파 Fab' LC는 공-전사됨;
c) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC, 항-TNF-알파 Fab' LC 및 DegP2 S219A는 공-전사됨; 및
d) 서열번호 21로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' HC를 코딩하는 핵산 서열, 서열번호 23으로 제시된 아미노산 서열을 가진 항-TNF-알파 Fab' LC를 코딩하는 핵산 서열, 서열번호 27로 제시된 아미노산 서열을 가진 PDIA6을 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 항-TNF-알파 Fab' HC, 항-TNF-알파 Fab' LC 및 PDIA6은 공-전사됨.
일부 실시양태에서, 관심 있는 재조합 단백질 또는 폴리펩티드는 항-TNF-알파 Fab'이고, 숙주 세포는 하기 a) 내지 d)로부터 선택된 발현 구축물을 포함하는 플라스미드를 추가로 포함한다:
a) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' 중쇄(HC) 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' 경쇄(LC) 융합체를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체와 분비 리더-항-TNF-알파 Fab' LC 융합체는 공-전사됨;
b) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체와 분비 리더-항-TNF-알파 Fab' LC 융합체는 공-전사됨;
c) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 29로 제시된 아미노산 서열을 가진 DegP2 S219A를 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체, 분비 리더-항-TNF-알파 Fab' LC 융합체 및 DegP2 S219A는 공-전사됨; 및
d) 서열번호 25로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' HC 융합체를 코딩하는 핵산 서열, 서열번호 26으로 제시된 아미노산 서열을 가진 분비 리더-항-TNF-알파 Fab' LC 융합체를 코딩하는 핵산 서열, 서열번호 27로 제시된 아미노산 서열을 가진 PDIA6을 코딩하는 핵산 서열, 및 PyrF를 코딩하는 핵산 서열, 이때 분비 리더-항-TNF-알파 Fab' HC 융합체, 분비 리더-항-TNF-알파 Fab' LC 융합체 및 PDIA6은 공-전사됨.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 Fab 또는 Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 꼬리 특이적 프로테아제 활성 및 Mep1 엔도펩티다제 활성이 결핍되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 추가로, 임의로 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 임의로 적어도 하나의 자가용해 인자 활성이 결핍되어 있고, 임의로 하나 이상의 불활성화된 프로테아제를 과발현하고, 임의로 하나 이상의 샤페론 또는 폴딩 조절인자를 과발현하고, 임의로 기능성 MepS1 프로테아제를 갖고, 임의로 기능성 MepS2 프로테아제를 갖고, 이들 각각은 본원의 다른 곳에 상세하게 기재되어 있다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 슈도모나드 숙주 세포, 이. 콜라이 숙주 세포, 에르위니아 숙주 세포, 살모넬라 숙주 세포, 시겔라 숙주 세포, 모락셀라 숙주 세포, 헬리코박터 숙주 세포, 레지오넬라 숙주 세포, 네이세리아 숙주 세포, 헤모필루스 숙주 세포, 아시네토박터 숙주 세포, 박테로이데스 숙주 세포, 자일렐라 숙주 세포, 시트로박터 숙주 세포, 엔테로박터 숙주 세포, 클렙시엘라 숙주 세포, 예르시니아 숙주 세포, 세라티아 숙주 세포, 프로테우스 숙주 세포 및 비브리오 숙주 세포로부터 선택된다. 일부 실시양태에서, 슈도모나드 숙주 세포는 슈도모나스 숙주 세포이다. 일부 실시양태에서, 슈도모나스 숙주 세포는 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사이다. 일부 실시양태에서, 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 이. 콜라이 숙주 세포가 아니다.
일부 실시양태에서, Fab 또는 Fab', 예를 들어, 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 발현 벡터(들)에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포는 (i) lsc::lacIQ1; (ii) Prc1 결핍; (ii) Prc2 결핍; (iii) HslU 결핍; (iv) HslV 결핍; (v) MepM1 결핍; (vi) PyrF 결핍이고; 이때 상기 숙주 세포는 임의로 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체가 결핍되어 있고; 임의로 DsbC를 과발현하고; 임의로 불활성화된 DegP2를 과발현하고; 임의로 PDIA6을 과발현한다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주이다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977 중 어느 한 균주의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진다.
일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 발현 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 또는 STR94977의 유전형을 갖고, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고, 이러한 균주의 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함한다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포는 발현 균주 STR94975, STR94976 또는 STR94977의 유전형을 갖고, 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고, 이러한 균주의 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함한다.
일부 실시양태에서, 관심 있는 재조합 단백질, 항체, Fab 또는 Fab', 또는 항-TNF Fab'는 발현 균주 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 또는 STR94977의 유전형을 갖고/갖거나 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 가진 재조합 그람 음성 박테리아 숙주 세포에서 본원에 기재된 방법에 따라 생성된다. 일부 실시양태에서, 항-TNF Fab'는 발현 균주 STR94975, STR94976 또는 STR94977의 유전형을 갖고 이러한 균주의 프로테아제 결핍, 불활성화된 프로테아제 및 폴딩 조절인자 과발현 프로파일을 갖고 항-TNF Fab', 예를 들어, 서열번호 25로 제시된 중쇄 서열 및 서열번호 26으로 제시된 경쇄 서열을 가진 항-TNF Fab'를 코딩하는 적어도 하나의 발현 구축물을 포함하는 재조합 그람 음성 박테리아 숙주 세포에서 본원에 기재된 방법에 따라 생성된다. 일부 실시양태에서, Fab' 발현 구축물은 STR92557, STR87639, STR92567, STR94974, STR94975, STR94976 및 STR94977로부터 선택된 발현 균주의 발현 구축물이다. 일부 실시양태에서, 본 발명의 숙주 균주로부터 생성된 항-TNF Fab'는 약 0.2 내지 약 5 g/ℓ의 역가로 가용성, 활성 및/또는 온전한 형태로 생성된다.
발효 형식
적합한 발효 조건 하에서 관심 있는 재조합 단백질을 코딩하는 플라스미드에 의해 형질전환된 재조합 그람 음성 박테리아 숙주 세포(발현 균주)를 배양함으로써 본원에 기재된 방법을 이용하여 관심 있는 재조합 단백질을 생성할 수 있다. 임의의 발효 형식, 예를 들어, 회분식, 유가식, 반연속식 또는 연속식 발효 방식이 이용될 수 있다.
발효 배지는 풍부 배지, 최소 배지 및 무기염 배지로부터 선택될 수 있다. 일부 실시양태에서, 최소 배지 또는 무기염 배지가 선택된다. 일부 실시양태에서, 무기염 배지가 선택된다.
무기염 배지는 무기염 및 탄소원, 예를 들어, 글루코스, 수크로스 또는 글리세롤로 구성된다. 무기염 배지의 예는 예를 들어, M9 배지, 슈도모나스 배지(ATCC 179), 및 (Davis)와 밍기올리(Mingioli) 배지를 포함한다(문헌[Davis, B.D., and Mingioli, E.S., 1950, J. Bact. 60:17-28] 참조). 무기염 배지를 제조하는 데 사용되는 무기염은 예를 들어, 인산칼륨, 황산암모늄 또는 염화암모늄, 황산마그네슘 또는 염화마그네슘, 및 미량 무기물, 예컨대, 염화칼슘, 붕산염, 및 철, 구리, 망간 및 아연의 황산염으로부터 선택된 무기염을 포함한다. 전형적으로, 무기염 배지에는 유기 질소원, 예컨대, 펩톤, 트립톤, 아미노산 또는 효모 추출물이 포함되지 않는다. 그 대신, 무기 질소원이 사용되며, 이것은 예를 들어, 암모늄염, 수성 암모니아 및 기체 암모니아로부터 선택될 수 있다. 무기염 배지는 전형적으로 탄소원으로서 글루코스 또는 글리세롤을 함유할 것이다. 무기염 배지에 비해, 최소 배지는 무기염 및 탄소원을 함유할 수도 있으나, 예를 들어, 낮은 수준의 아미노산, 비타민, 펩톤 또는 다른 성분으로 보충될 수 있지만, 이들은 매우 최소한의 수준으로 첨가된다. 본 발명의 방법에 사용하기에 적합한 배지는 문헌, 예를 들어, 미국 특허 제9,458,487호 및 미국 특허 제9,453,251호에 기재된 방법을 이용함으로써 제조될 수 있다. 본 발명의 방법에 유용한 배양 절차 및 무기염 배지의 세부사항은 본원에 참고로 포함되는 문헌[Riesenberg, D et al., 1991, "High cell density cultivation of Escherichia coli at controlled specific growth rate," J. Biotechnol. 20 (1):17-27]에 기재되어 있다.
실시양태에서, 제조는 생물반응기 배양물에서 달성될 수 있다. 배양물은 예를 들어, 무기염 배지를 함유하는 최대 2 ℓ 생물반응기에서 생장될 수 있으며, 암모니아의 첨가를 통해 32℃ 및 pH 6.5에서 유지될 수 있다. 용존 산소는 교반의 증가 및 발효기 내로의 분사된 공기와 산소의 유동을 통해 과량으로 유지될 수 있다. 글리세롤은 과량의 수준을 유지하기 위해 발효 전반에 걸쳐 배양물에 전달될 수 있다. 실시양태에서, 이러한 조건은 유도를 위한 목표 배양 세포 밀도, 예를 들어, 575 nm의 광학 밀도(A575)에 도달될 때까지 유지되고, IPTG는 표적 단백질 생성을 시작하기 위해 첨가된다. 유도 시 세포 밀도, IPTG의 농도, pH, 온도, CaCl2 농도, 용존 산소 유속 각각을 변경시켜 발현을 위한 최적 조건을 확인할 수 있음이 이해된다. 실시양태에서, 유도 시 세포 밀도는 40 내지 200 흡광도 단위(AU)의 A575 범위 내에서 변경될 수 있다. IPTG 농도는 0.02 내지 1.0 mM의 범위 내에서 변경될 수 있고, pH는 5 내지 7.5의 범위 내에서 변경될 수 있고, 온도는 20℃ 내지 35℃의 범위 내에서 변경될 수 있고, CaCl2 농도는 0 내지 0.5 g/ℓ의 범위 내에서 변경될 수 있고, 용존 산소 유속은 1 LPM(분당 리터) 내지 10 LPM의 범위 내에서 변경될 수 있다. 6시간 내지 96시간 후, 각각의 생물반응기로부터의 배양물은 원심분리에 의해 수거될 수 있고, 세포 펠릿은 -80℃에서 냉동될 수 있다. 그 다음, 샘플은 예를 들어, SDS-CGE에 의해 생성물 형성에 대해 분석될 수 있다.
발효는 임의의 규모로 수행될 수 있다. 본 발명에 따른 발현 시스템은 임의의 규모로 재조합 단백질을 발현시키는 데 유용하다. 따라서, 예를 들어, 마이크로리터 규모, 밀리리터 규모, 센티리터 규모 및 데시리터 규모 발효 부피가 사용될 수 있으며, 1 리터 규모 및 더 큰 발효 부피도 사용될 수 있다.
실시양태에서, 발효 부피는 약 1 리터 이상이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 100 리터이다. 실시양태에서, 발효 부피는 약 1 리터, 약 2 리터, 약 3 리터, 약 4 리터, 약 5 리터, 약 6 리터, 약 7 리터, 약 8 리터, 약 9 리터 또는 약 10 리터이다. 실시양태에서, 발효 부피는 약 1 리터 내지 약 5 리터, 약 1 리터 내지 약 10 리터, 약 1 리터 내지 약 25 리터, 약 1 리터 내지 약 50 리터, 약 1 리터 내지 약 75 리터, 약 10 리터 내지 약 25 리터, 약 25 리터 내지 약 50 리터, 또는 약 50 리터 내지 약 100 리터이다. 다른 실시양태에서, 발효 부피는 5 리터, 10 리터, 15 리터, 20 리터, 25 리터, 50 리터, 75 리터, 100 리터, 200 리터, 250 리터, 300 리터, 500 리터, 1,000 리터, 2,000 리터, 5,000 리터, 10,000 리터 또는 50,000 리터 이상이다.
일반적으로, 더 큰 배양 부피, 예를 들어, 50 ㎖ 진탕 플라스크 배양, 1 리터 배양 또는 더 큰 부피의 배양에 의해 생성된 재조합 단백질의 양은 더 작은 배양 부피, 예를 들어, 0.5 ㎖ 고처리량 스크리닝 배양에서 관찰된 양에 비해 증가된다. 이것은 배양 크기의 증가에 기인할 수 있을뿐만 아니라, 예를 들어, 대규모 발효에서 세포를 더 높은 밀도까지 생장시키는 능력(예를 들어, 배양 흡광도에 의해 반영됨)에도 기인할 수 있다. 예를 들어, 동일한 균주로부터의 부피 수율은 HTP 규모부터 대규모 발효까지 최대 10배 증가할 수 있다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 부피 수율은 HTP 규모 생장보다 대규모 발효 후 2배 내지 10배 더 크다. 실시양태에서, 동일한 발현 균주에 대해 관찰된 수율은 HTP 규모 생장 후보다 대규모 발효 후에 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 2배 내지 10배, 2배 내지 9배, 2배 내지 8배, 2배 내지 7배, 2배 내지 6배, 2배 내지 5배, 2배 내지 4배, 2배 내지 3배, 3배 내지 10배, 3배 내지 9배, 3배 내지 8배, 3배 내지 7배, 3배 내지 6배, 3배 내지 5배, 3배 내지 4배, 4배 내지 10배, 4배 내지 9배, 4배 내지 8배, 4배 내지 7배, 4배 내지 6배, 4배 내지 5배, 5배 내지 10배, 5배 내지 9배, 5배 내지 8배, 5배 내지 7배, 5배 내지 6배, 6배 내지 10배, 6배 내지 9배, 6배 내지 8배, 6배 내지 7배, 7배 내지 10배, 7배 내지 9배, 7배 내지 8배, 8배 내지 10배, 8배 내지 9배, 9배 내지 10배 더 크다. 예를 들어, 전체가 본원에 참고로 포함되는 문헌[Retallack, et al., 2012, "Reliable protein production in a Pseudomonas fluorescens expression system," Prot. Exp. and Purif. 81:157-165]을 참조한다.
박테리아 생장 조건
제공된 발명의 방법에 유용한 적합한 발효 조건은 약 4℃ 내지 약 42℃의 온도 및 약 5.7 내지 약 8.8의 pH에서의 생장을 포함할 수 있다. lacZ 프로모터를 가진 발현 구축물이 사용될 때, 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 IPTG를 배양물에 첨가함으로써 발현을 유도할 수 있다. 일부 실시양태에서, 발효 조건은 약 40 내지 약 200의 OD575, 약 5.5 내지 약 7.2의 배양 pH, 및 약 20℃ 내지 약 34℃의 온도에서 유가식으로 유도성 프로모터를 유도하는 것을 포함한다. 일부 실시양태에서, 발효 조건은 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 약 33℃의 온도에서 유가식으로 유도성 프로모터를 유도하는 것을 포함한다. 일부 실시양태에서, 생성된 재조합 단백질 역가는 세포 배양액의 약 0.2 내지 약 5 g/ℓ이다.
배양물의 pH는 당업자에게 알려진 pH 완충제 및 방법을 이용함으로써 유지될 수 있다. 배양 동안 pH의 조절은 수성 암모니아를 사용함으로써 달성될 수도 있다. 실시양태에서, 생장기, 유도기 및/또는 생성기 동안 배양물의 pH는 약 5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5.0, 5.1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.0, 8.1, 8.2, 8.3, 8.4, 8.5, 8.6, 8.7, 8.8, 또는 이들 사이의 임의의 범위이다. 실시양태에서, 배양물 pH는 약 5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5 내지 약 5.5, 약 5 내지 약 6, 약 5 내지 약 6.5, 약 5 내지 약 7, 약 5 내지 약 7.5, 약 5 내지 약 8, 약 5 내지 약 8.5, 약 5 내지 약 8.8, 약 5.5 내지 약 6, 약 5.5 내지 약 6.5, 약 5.5 내지 약 7, 약 5.5 내지 약 7.5, 약 5.5 내지 약 8, 약 5.5 내지 약 8.5, 약 5.5 내지 약 8.8, 약 6 내지 약 6.5, 약 6 내지 약 7, 약 6 내지 약 7.5, 약 6 내지 약 8, 약 6 내지 약 8.5, 약 6 내지 약 8.8, 약 6.5 내지 약 7, 약 6.5 내지 약 7.5, 약 6.5 내지 약 8, 약 6.5 내지 약 8.5, 약 6.5 내지 약 8.8, 약 7 내지 약 7.5, 약 7 내지 약 8, 약 7 내지 약 8.5, 약 7 내지 약 8.8, 약 7.5 내지 약 8, 약 7.5 내지 약 8.5, 약 7.5 내지 약 8.8, 약 8 내지 약 8.5, 약 8 내지 약 8.8, 또는 약 8.5 내지 약 8.8이다. 실시양태에서, 배양물 pH는 약 5, 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8, 약 8.5 또는 약 8.8이다. 실시양태에서, 배양물 pH는 적어도 약 5, 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8 또는 약 8.5이다. 실시양태에서, 배양물 pH는 최대 약 5.5, 약 6, 약 6.5, 약 7, 약 7.5, 약 8, 약 8.5 또는 약 8.8이다. 실시양태에서, 배양물 pH는 약 5.8 내지 약 7이다. 실시양태에서, 배양물 pH는 약 5.8 내지 약 5.9, 약 5.8 내지 약 6, 약 5.8 내지 약 6.1, 약 5.8 내지 약 6.2, 약 5.8 내지 약 6.2, 약 5.8 내지 약 6.4, 약 5.8 내지 약 6.5, 약 5.8 내지 약 6.6, 약 5.8 내지 약 6.7, 약 5.8 내지 약 6.8, 약 5.8 내지 약 7, 약 5.9 내지 약 6, 약 5.9 내지 약 6.1, 약 5.9 내지 약 6.2, 약 5.9 내지 약 6.2, 약 5.9 내지 약 6.4, 약 5.9 내지 약 6.5, 약 5.9 내지 약 6.6, 약 5.9 내지 약 6.7, 약 5.9 내지 약 6.8, 약 5.9 내지 약 7, 약 6 내지 약 6.1, 약 6 내지 약 6.2, 약 6 내지 약 6.2, 약 6 내지 약 6.4, 약 6 내지 약 6.5, 약 6 내지 약 6.6, 약 6 내지 약 6.7, 약 6 내지 약 6.8, 약 6 내지 약 7, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.4, 약 6.1 내지 약 6.5, 약 6.1 내지 약 6.6, 약 6.1 내지 약 6.7, 약 6.1 내지 약 6.8, 약 6.1 내지 약 7, 약 6.2 약 6.2, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.2 내지 약 6.6, 약 6.2 내지 약 6.7, 약 6.2 내지 약 6.8, 약 6.2 내지 약 7, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.2 내지 약 6.6, 약 6.2 내지 약 6.7, 약 6.2 내지 약 6.8, 약 6.2 내지 약 7, 약 6.4 내지 약 6.5, 약 6.4 내지 약 6.6, 약 6.4 내지 약 6.7, 약 6.4 내지 약 6.8, 약 6.4 내지 약 7, 약 6.5 내지 약 6.6, 약 6.5 내지 약 6.7, 약 6.5 내지 약 6.8, 약 6.5 내지 약 7, 약 6.6 내지 약 6.7, 약 6.6 내지 약 6.8, 약 6.6 내지 약 7, 약 6.7 내지 약 6.8, 약 6.7 내지 약 7, 또는 약 6.8 내지 약 7이다. 실시양태에서, 배양물 pH는 약 5.8, 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7, 약 6.8 또는 약 7이다. 실시양태에서, 배양물 pH는 적어도 약 5.8, 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7 또는 약 6.8이다. 실시양태에서, 배양물 pH는 최대 약 5.9, 약 6, 약 6.1, 약 6.2, 약 6.2, 약 6.4, 약 6.5, 약 6.6, 약 6.7, 약 6.8 또는 약 7이다. 일부 실시양태에서, pH는 약 6 내지 6.5이다. 일부 실시양태에서, 배양물 pH는 약 6 내지 약 6.1, 약 6 내지 약 6.2, 약 6 내지 약 6.3, 약 6 내지 약 6.4, 약 6 내지 약 6.5, 약 6.1 내지 약 6.2, 약 6.1 내지 약 6.3, 약 6.1 내지 약 6.4, 약 6.1 내지 약 6.5, 약 6.2 내지 약 6.3, 약 6.2 내지 약 6.4, 약 6.2 내지 약 6.5, 약 6.3 내지 약 6.4, 약 6.3 내지 약 6.5, 또는 약 6.4 내지 약 6.5이다. 일부 실시양태에서, 배양물 pH는 약 6, 약 6.1, 약 6.2, 약 6.3, 약 6.4 또는 약 6.5이다. 일부 실시양태에서, 배양물 pH는 적어도 약 6, 약 6.1, 약 6.2, 약 6.3 또는 약 6.4이다. 일부 실시양태에서, 배양물 pH는 최대 약 6.1, 약 6.2, 약 6.3, 약 6.4 또는 약 6.5이다.
실시양태에서, 생장기, 유도기 및/또는 생성기 동안 배양물의 생장 온도는 약 4℃ 내지 약 42℃로 유지된다. 실시양태에서, 생장 온도는 약 4℃, 약 5℃, 약 6℃, 약 7℃, 약 8℃, 약 9℃, 약 10℃, 약 11℃, 약 12℃, 약 13℃, 약 14℃, 약 15℃, 약 16℃, 약 17℃, 약 18℃, 약 19℃, 약 20℃, 약 21℃, 약 22℃, 약 23℃, 약 24℃, 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃, 약 35℃, 약 36℃, 약 37℃, 약 38℃, 약 39℃, 약 40℃, 약 41℃, 약 42℃, 또는 이들 사이의 임의의 범위이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃ 내지 약 26℃, 약 25℃ 내지 약 27℃, 약 25℃ 내지 약 28℃, 약 25℃ 내지 약 29℃, 약 25℃ 내지 약 30℃, 약 25℃ 내지 약 31℃, 약 25℃ 내지 약 32℃, 약 25℃ 내지 약 33℃, 약 25℃ 내지 약 34℃, 약 25℃ 내지 약 35℃, 약 26℃ 내지 약 27℃, 약 26℃ 내지 약 28℃, 약 26℃ 내지 약 29℃, 약 26℃ 내지 약 30℃, 약 26℃ 내지 약 31℃, 약 26℃ 내지 약 32℃, 약 26℃ 내지 약 33℃, 약 26℃ 내지 약 34℃, 약 26℃ 내지 약 35℃, 약 27℃ 내지 약 28℃, 약 27℃ 내지 약 29℃, 약 27℃ 내지 약 30℃, 약 27℃ 내지 약 31℃, 약 27℃ 내지 약 32℃, 약 27℃ 내지 약 33℃, 약 27℃ 내지 약 34℃, 약 27℃ 내지 약 35℃, 약 28℃ 내지 약 29℃, 약 28℃ 내지 약 30℃, 약 28℃ 내지 약 31℃, 약 28℃ 내지 약 32℃, 약 28℃ 내지 약 33℃, 약 28℃ 내지 약 34℃, 약 28℃ 내지 약 35℃, 약 29℃ 내지 약 30℃, 약 29℃ 내지 약 31℃, 약 29℃ 내지 약 32℃, 약 29℃ 내지 약 33℃, 약 29℃ 내지 약 34℃, 약 29℃ 내지 약 35℃, 약 30℃ 내지 약 31℃, 약 30℃ 내지 약 32℃, 약 30℃ 내지 약 33℃, 약 30℃ 내지 약 34℃, 약 30℃ 내지 약 35℃, 약 31℃ 내지 약 32℃, 약 31℃ 내지 약 33℃, 약 31℃ 내지 약 34℃, 약 31℃ 내지 약 35℃, 약 32℃ 내지 약 33℃, 약 32℃ 내지 약 34℃, 약 32℃ 내지 약 35℃, 약 33℃ 내지 약 34℃, 약 33℃ 내지 약 35℃, 또는 약 34℃ 내지 약 35℃이다. 실시양태에서, 생장 온도는 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃ 또는 약 35℃이다. 실시양태에서, 생장 온도는 적어도 약 25℃, 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃ 또는 약 34℃이다. 실시양태에서, 생장 온도는 최대 약 26℃, 약 27℃, 약 28℃, 약 29℃, 약 30℃, 약 31℃, 약 32℃, 약 33℃, 약 34℃ 또는 약 35℃이다.
실시양태에서, 온도는 배양 동안 변경된다. 실시양태에서, 작용제, 예를 들어, IPTG를 배양물에 첨가하여 구축물로부터 발현을 유도하기 전에는 온도를 약 30℃ 내지 약 32℃로 유지하고, 유도제를 첨가한 후에는 온도를 약 25℃ 내지 약 28℃로 감소시킨다. 실시양태에서, 작용제, 예를 들어, IPTG를 배양물에 첨가하여 구축물로부터 발현을 유도하기 전에는 온도를 약 30℃로 유지하고, 유도제를 첨가한 후에는 온도를 약 25℃로 감소시킨다.
본원의 다른 곳에 기재된 바와 같이, 유도성 프로모터, 예를 들어, lac 프로모터는 관심 있는 재조합 단백질의 발현을 조절하기 위해 발현 구축물에 사용될 수 있다. lac 프로모터 유도체 또는 계열 구성원, 예를 들어, tac 프로모터의 경우, 이펙터 화합물은 유도제, 예컨대, IPTG와 같은 무상 유도제이다. 실시양태에서, lac 프로모터 유도체가 사용되고, 세포 밀도가 약 80 내지 약 300의 OD575에 의해 확인된 수준에 도달하였을 때, IPTG를 약 0.01 mM 내지 약 1.0 mM의 최종 농도로 첨가하여 재조합 단백질 발현을 유도한다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 100, 약 80 내지 약 120, 약 80 내지 약 140, 약 80 내지 약 160, 약 80 내지 약 180, 약 80 내지 약 200, 약 80 내지 약 220, 약 80 내지 약 240, 약 80 내지 약 260, 약 80 내지 약 280, 약 80 내지 약 300, 약 100 내지 약 120, 약 100 내지 약 140, 약 100 내지 약 160, 약 100 내지 약 180, 약 100 내지 약 200, 약 100 내지 약 220, 약 100 내지 약 240, 약 100 내지 약 260, 약 100 내지 약 280, 약 100 내지 약 300, 약 120 내지 약 140, 약 120 내지 약 160, 약 120 내지 약 180, 약 120 내지 약 200, 약 120 내지 약 220, 약 120 내지 약 240, 약 120 내지 약 260, 약 120 내지 약 280, 약 120 내지 약 300, 약 140 내지 약 160, 약 140 내지 약 180, 약 140 내지 약 200, 약 140 내지 약 220, 약 140 내지 약 240, 약 140 내지 약 260, 약 140 내지 약 280, 약 140 내지 약 300, 약 160 내지 약 180, 약 160 내지 약 200, 약 160 내지 약 220, 약 160 내지 약 240, 약 160 내지 약 260, 약 160 내지 약 280, 약 160 내지 약 300, 약 180 내지 약 200, 약 180 내지 약 220, 약 180 내지 약 240, 약 180 내지 약 260, 약 180 내지 약 280, 약 180 내지 약 300, 약 200 내지 약 220, 약 200 내지 약 240, 약 200 내지 약 260, 약 200 내지 약 280, 약 200 내지 약 300, 약 220 내지 약 240, 약 220 내지 약 260, 약 220 내지 약 280, 약 220 내지 약 300, 약 240 내지 약 260, 약 240 내지 약 280, 약 240 내지 약 300, 약 260 내지 약 280, 약 260 내지 약 300, 또는 약 280 내지 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80, 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260, 약 280 또는 약 300이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 적어도 약 80, 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260 또는 약 280이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 최대 약 100, 약 120, 약 140, 약 160, 약 180, 약 200, 약 220, 약 240, 약 260, 약 280 또는 약 300이다. 일부 실시양태에서, 유도 OD575는 약 80 내지 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80 내지 약 90, 약 80 내지 약 100, 약 80 내지 약 110, 약 80 내지 약 120, 약 80 내지 약 130, 약 80 내지 약 140, 약 80 내지 약 150, 약 80 내지 약 160, 약 90 내지 약 100, 약 90 내지 약 110, 약 90 내지 약 120, 약 90 내지 약 130, 약 90 내지 약 140, 약 90 내지 약 150, 약 90 내지 약 160, 약 100 내지 약 110, 약 100 내지 약 120, 약 100 내지 약 130, 약 100 약 140, 약 100 내지 약 150, 약 100 내지 약 160, 약 110 내지 약 120, 약 110 내지 약 130, 약 110 내지 약 140, 약 110 내지 약 150, 약 110 내지 약 160, 약 120 내지 약 130, 약 120 내지 약 140, 약 120 내지 약 150, 약 120 내지 약 160, 약 130 내지 약 140, 약 130 내지 약 150, 약 130 내지 약 160, 약 140 내지 약 150, 약 140 내지 약 160, 또는 약 150 내지 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 약 80, 약 90, 약 100, 약 110, 약 120, 약 130, 약 140, 약 150 또는 약 160이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 적어도 약 80, 약 90, 약 100, 약 110, 약 120, 약 130, 약 140 또는 약 150이다. 일부 실시양태에서, 재조합 단백질에 대한 배양 유도 시 OD575는 최대 약 90, 약 100, 약 110, 약 120, 약 130, 약 140, 약 150 또는 약 160이다.
세포 밀도는 다른 방법에 의해 측정될 수 있으며, 다른 단위, 예를 들어, 단위 부피당 세포로 표현될 수 있다. 예를 들어, 슈도모나스 플루오레센스 배양물의 약 40 내지 약 160의 OD575는 ㎖당 약 4 x 1010 내지 약 1.6 x 1011 콜로니 형성 유닛 또는 ℓ당 17.5 내지 70 g 건조 세포 중량에 해당한다. 실시양태에서, 배양 유도 시 세포 밀도는 세포 밀도 측정에 이용된 방법 또는 측정 단위와 관계없이 OD575에서의 흡광도로 본원에 특정된 세포 밀도에 해당한다. 당업자는 임의의 세포 배양물에 대해 적절한 전환을 수행하는 방법을 알 것이다.
일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM 내지 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM 내지 약 0.02 mM, 약 0.01 mM 내지 약 0.03 mM, 약 0.01 mM 내지 약 0.05 mM, 약 0.01 mM 내지 약 0.06 mM, 약 0.01 mM 내지 약 0.07 mM, 약 0.01 mM 내지 약 0.08 mM, 약 0.01 mM 내지 약 0.09 mM, 약 0.01 mM 내지 약 0.1 mM, 약 0.01 mM 내지 약 0.2 mM, 약 0.01 mM 내지 약 0.5 mM, 약 0.01 mM 내지 약 1 mM, 약 0.02 mM 내지 약 0.03 mM, 약 0.02 mM 내지 약 0.05 mM, 약 0.02 mM 내지 약 0.06 mM, 약 0.02 mM 내지 약 0.07 mM, 약 0.02 mM 내지 약 0.08 mM, 약 0.02 mM 내지 약 0.09 mM, 약 0.02 mM 내지 약 0.1 mM, 약 0.02 mM 내지 약 0.2 mM, 약 0.02 mM 내지 약 0.5 mM, 약 0.02 mM 내지 약 1 mM, 약 0.03 mM 내지 약 0.05 mM, 약 0.03 mM 내지 약 0.06 mM, 약 0.03 mM 내지 약 0.07 mM, 약 0.03 mM 내지 약 0.08 mM, 약 0.03 mM 내지 약 0.09 mM, 약 0.03 mM 내지 약 0.1 mM, 약 0.03 mM 내지 약 0.2 mM, 약 0.03 mM 내지 약 0.5 mM, 약 0.03 mM 내지 약 1 mM, 약 0.05 mM 내지 약 0.06 mM, 약 0.05 mM 내지 약 0.07 mM, 약 0.05 mM 내지 약 0.08 mM, 약 0.05 mM 내지 약 0.09 mM, 약 0.05 mM 내지 약 0.1 mM, 약 0.05 mM 내지 약 0.2 mM, 약 0.05 mM 내지 약 0.5 mM, 약 0.05 mM 내지 약 1 mM, 약 0.06 mM 내지 약 0.07 mM, 약 0.06 mM 내지 약 0.08 mM, 약 0.06 mM 내지 약 0.09 mM, 약 0.06 mM 내지 약 0.1 mM, 약 0.06 mM 내지 약 0.2 mM, 약 0.06 mM 내지 약 0.5 mM, 약 0.06 mM 내지 약 1 mM, 약 0.07 mM 내지 약 0.08 mM, 약 0.07 mM 내지 약 0.09 mM, 약 0.07 mM 내지 약 0.1 mM, 약 0.07 mM 내지 약 0.2 mM, 약 0.07 mM 내지 약 0.5 mM, 약 0.07 mM 내지 약 1 mM, 약 0.08 mM 내지 약 0.09 mM, 약 0.08 mM 내지 약 0.1 mM, 약 0.08 mM 내지 약 0.2 mM, 약 0.08 mM 내지 약 0.5 mM, 약 0.08 mM 내지 약 1 mM, 약 0.09 mM 내지 약 0.1 mM, 약 0.09 mM 내지 약 0.2 mM, 약 0.09 mM 내지 약 0.5 mM, 약 0.09 mM 내지 약 1 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.1 mM 내지 약 0.5 mM, 약 0.1 mM 내지 약 1 mM, 약 0.2 mM 내지 약 0.5 mM, 약 0.2 mM 내지 약 1 mM, 또는 약 0.5 mM 내지 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.5 mM 또는 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 적어도 약 0.01 mM, 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM 또는 약 0.5 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 최대 약 0.02 mM, 약 0.03 mM, 약 0.05 mM, 약 0.06 mM, 약 0.07 mM, 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.2 mM, 약 0.5 mM, 또는 약 1 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM 내지 약 0.09 mM, 약 0.08 mM 내지 약 0.1 mM, 약 0.08 mM 내지 약 0.125 mM, 약 0.08 mM 내지 약 0.15 mM, 약 0.08 mM 내지 약 0.175 mM, 약 0.08 mM 내지 약 0.2 mM, 약 0.08 mM 내지 약 0.225 mM, 약 0.08 mM 내지 약 0.25 mM, 약 0.08 mM 내지 약 0.275 mM, 약 0.08 mM 내지 약 0.3 mM, 약 0.09 mM 내지 약 0.1 mM, 약 0.09 mM 내지 약 0.125 mM, 약 0.09 mM 내지 약 0.15 mM, 약 0.09 mM 내지 약 0.175 mM, 약 0.09 mM 내지 약 0.2 mM, 약 0.09 mM 내지 약 0.225 mM, 약 0.09 mM 내지 약 0.25 mM, 약 0.09 mM 내지 약 0.275 mM, 약 0.09 mM 내지 약 0.3 mM, 약 0.1 mM 내지 약 0.125 mM, 약 0.1 mM 내지 약 0.15 mM, 약 0.1 mM 내지 약 0.175 mM, 약 0.1 mM 내지 약 0.2 mM, 약 0.1 mM 내지 약 0.225 mM, 약 0.1 mM 내지 약 0.25 mM, 약 0.1 mM 내지 약 0.275 mM, 약 0.1 mM 내지 약 0.3 mM, 약 0.125 mM 내지 약 0.15 mM, 약 0.125 mM 내지 약 0.175 mM, 약 0.125 mM 내지 약 0.2 mM, 약 0.125 mM 내지 약 0.225 mM, 약 0.125 mM 내지 약 0.25 mM, 약 0.125 mM 내지 약 0.275 mM, 약 0.125 mM 내지 약 0.3 mM, 약 0.15 mM 내지 약 0.175 mM, 약 0.15 mM 내지 약 0.2 mM, 약 0.15 mM 내지 약 0.225 mM, 약 0.15 mM 내지 약 0.25 mM, 약 0.15 mM 내지 약 0.275 mM, 약 0.15 mM 내지 약 0.3 mM, 약 0.175 mM 내지 약 0.2 mM, 약 0.175 mM 내지 약 0.225 mM, 약 0.175 mM 내지 약 0.25 mM, 약 0.175 mM 내지 약 0.275 mM, 약 0.175 mM 내지 약 0.3 mM, 약 0.2 mM 내지 약 0.225 mM, 약 0.2 mM 내지 약 0.25 mM, 약 0.2 mM 내지 약 0.275 mM, 약 0.2 mM 내지 약 0.3 mM, 약 0.225 mM 내지 약 0.25 mM, 약 0.225 mM 내지 약 0.275 mM, 약 0.225 mM 내지 약 0.3 mM, 약 0.25 mM 내지 약 0.275 mM, 약 0.25 mM 내지 약 0.3 mM, 또는 약 0.275 mM 내지 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM, 약 0.275 mM 또는 약 0.3 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 적어도 약 0.08 mM, 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM 또는 약 0.275 mM이다. 일부 실시양태에서, 배양물의 최종 IPTG 농도는 최대 약 0.09 mM, 약 0.1 mM, 약 0.125 mM, 약 0.15 mM, 약 0.175 mM, 약 0.2 mM, 약 0.225 mM, 약 0.25 mM, 약 0.275 mM 또는 약 0.3 mM이다.
본원 및 문헌에 기재된 바와 같이 비-lac 유형 프로모터가 사용되는 실시양태에서, 다른 유도제 또는 이펙터가 사용될 수 있다. 한 실시양태에서, 프로모터는 항시성 프로모터이다.
유도제를 첨가한 후, 배양물은 일정 시간, 예를 들어, 약 24시간 동안 생장될 수 있으며, 이 시간 동안 재조합 단백질이 발현된다(생성기). 유도제를 첨가한 후, 배양물은 약 1시간, 약 2시간, 약 3시간, 약 4시간, 약 5시간, 약 6시간, 약 7시간, 약 8시간, 약 9시간, 약 10시간, 약 11시간, 약 12시간, 약 13시간, 약 14시간, 약 15시간, 약 16시간, 약 17시간, 약 18시간, 약 19시간, 약 20시간, 약 21시간, 약 22시간, 약 23시간, 약 24시간, 약 36시간 또는 약 48시간 동안 생장될 수 있다. 유도제를 배양물에 첨가한 후, 배양물은 약 1시간 내지 48시간, 약 1시간 내지 24시간, 약 1시간 내지 8시간, 약 10시간 내지 24시간, 약 15시간 내지 24시간, 또는 약 20시간 내지 24시간 동안 생장될 수 있다. 세포 배양물은 원심분리에 의해 농축될 수 있으며, 배양 펠릿은 후속 용해 절차에 적합한 완충제 또는 용액에 재현탁될 수 있다.
일부 실시양태에서, 일정한 공급물이 사용된다. 일부 실시양태에서, 유가식 형식이 이용된다. 일부 실시양태에서, 공급물은 글리세롤 또는 글루코스이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ 내지 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 35 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 45 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 35 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 45 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 35 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 45 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 35 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 45 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 35 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ내지 약 45 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 약 35 g/ℓ 내지 약 40 g/ℓ, 약 35 g/ℓ 내지 약 45 g/ℓ, 약 35 g/ℓ 내지 약 50 g/ℓ, 약 40 g/ℓ 내지 약 45 g/ℓ, 약 40 g/ℓ 내지 약 50 g/ℓ, 또는 약 45 g/ℓ 내지 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 적어도 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ 또는 약 45 g/ℓ이다. 일부 실시양태에서, 공급물 볼루스는 최대 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ이다.
실시양태에서, 고압 기계적 세포 파괴를 위한 장치(예를 들어, 시판되는 장치, 예를 들어, 마이크로플루이딕스 미세유동화기(Microfluidics Microfluidizer), 불변 세포 파괴기(Constant Cell Disruptor), 니로-소아비(Niro-Soavi) 균질화기 또는 APV-가울린(Gaulin) 균질화기)를 이용하여 세포를 파괴한다. 예를 들어, 초음파처리를 이용하여 재조합 단백질을 발현하는 세포를 파괴할 수 있다. 당분야에 알려진 임의의 적절한 세포 용해 방법을 이용하여 가용성 분획을 방출할 수 있다. 예를 들어, 실시양태에서, 세포벽 용해 효소 및 EDTA와 같은 화학적 및/또는 효소적 세포 용해 시약을 사용할 수 있다. 냉동되거나 미리 저장된 배양물의 사용도 본 발명의 방법에서 예상된다. 용해 전에 배양물을 OD 정규화할 수 있다. 예를 들어, 세포를 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19 또는 약 20의 OD600으로 정규화할 수 있다.
임의의 적절한 장치 및 방법을 이용하여 원심분리를 수행할 수 있다. 불용성 분획으로부터 가용성 분획을 분리할 목적의 세포 배양물 또는 용해물의 원심분리는 당분야에 잘 알려져 있다. 예를 들어, 용해된 세포를 20,800xg에서 20분 동안 (4℃에서) 원심분리할 수 있고 수동 또는 자동 액체 처리를 이용하여 상청액을 제거할 수 있다. 세포 배양물의 원심분리에 의해 수득된 세포 펠렛, 또는 세포 용해물의 원심분리에 의해 수득된 불용성 분획을 완충 용액에 재현탁할 수 있다. 예를 들어, 오버헤드 혼합기에 연결된 임펠러, 자기 교반 막대, 락킹 진탕기 등과 같은 장치를 이용하여 세포 펠릿 또는 불용성 분획의 재현탁을 수행할 수 있다.
"가용성 분획", 즉 용해물의 원심분리 후 수득된 가용성 상청액, 및 "불용성 분획", 즉 용해물의 원심분리 후 수득된 펠릿은 배양물을 용해하고 원심분리한 결과이다.
고처리량 스크린
실시양태에서, 관심 있는 재조합 단백질을 발현시키기 위한 최적 조건을 확인하기 위해 고처리량 스크린을 수행한다. 스크린에서 변경될 수 있는 조건은 예를 들어, 숙주 세포, 숙주 세포의 유전적 배경(예를 들어, 본원에 상세히 설명된 바와 같음), 발현 구축물의 프로모터의 유형, 코딩된 관심 있는 폴리펩티드 또는 단백질에 융합된 분비 리더의 유형, 생장 온도, 유도성 프로모터가 사용될 때 유도의 OD, 첨가된 유도제의 양(예를 들어, lacZ 프로모터 또는 이의 유도체가 사용될 때 유도에 사용된 IPTG의 양), 단백질 유도의 지속시간, 유도제를 배양물에 첨가한 후 생장 온도, 배양물의 교반 속도, 플라스미드 유지를 위한 선택 방법, 용기 내의 배양물의 부피 및 세포 용해 방법을 포함한다.
일부 실시양태에서, 숙주 균주의 라이브러리(또는 "어레이")를 제공하고, 이때 상기 라이브러리 내의 각각의 균주(또는 "숙주 세포의 집단")는 숙주 세포에서 하나 이상의 표적 유전자의 발현을 조절하도록 유전적으로 변형되었다. 어레이에서 표현형적으로 구별되는 숙주 세포의 다른 집단에 비해 관심 있는 발현된 단백질의 양, 품질 및/또는 위치를 기반으로 "최적 숙주 균주" 또는 "최적 발현 시스템"을 확인할 수 있거나 선택할 수 있다. 따라서, 최적 숙주 균주는 원하는 세부요건에 따라 관심 있는 재조합 단백질을 생성하는 균주이다. 원하는 세부요건은 생성되는 폴리펩티드에 따라 달라질 것이지만, 세부요건은 단백질의 품질 및/또는 양, 단백질이 격리되는지 아니면 분비되는지 여부, 단백질 폴딩 등을 포함한다. 예를 들어, 최적 숙주 균주 또는 최적 발현 시스템은 특정 절대적인 수준, 또는 대조군 또는 지표 균주, 즉 비교에 사용된 균주에 의해 생성된 수준에 상대적인 특정 수준의 수율을 생성하고, 이 수율은 가용성 재조합 단백질의 양, 회수 가능한 재조합 단백질의 양, 적절히 처리된 재조합 단백질의 양, 적절하게 폴딩된 재조합 단백질의 양, 활성 재조합 단백질의 양, 및/또는 관심 있는 재조합 단백질의 총량으로 특징져진다. 재조합 단백질의 발현에 있어서 개선된 수율 및/또는 품질을 가진 균주를 확인하기 위해 미생물 숙주를 스크리닝하는 방법은 예를 들어, 미국 특허 제9,394,571호 및 제9,580,719호에 기재되어 있다.
단백질 분석
본 발명의 방법에 따라 생성된 관심 있는 재조합 단백질은 고품질의 재조합 단백질, 예를 들어, 활성, 가용성 및/또는 온전한 재조합 단백질; 높은 수율 또는 역가로 생성되는 재조합 단백질; 또는 이들의 조합일 수 있다. 일부 실시양태에서, 관심 있는 재조합 단백질은 대조군 숙주 세포의 사용 시 관찰된 품질 및/또는 수율과 비교될 때 더 높은 품질 및/또는 더 높은 수율로 본 발명의 방법에 따른 재조합 그람 음성 박테리아 숙주 세포에 의해 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 대조군 숙주 세포보다 더 높은 세포 밀도까지 생장한다.
실시양태에서, 본원에서 제공된 방법에 의해 생성된 관심 있는 재조합 단백질은 (예를 들어, 온전한 단백질을 측정함으로써) 수율, 용해도, 활성 및 분해와 관련하여 분석된다. 관심 있는 재조합 단백질은 당업자에게 알려진 임의의 적절한 방법에 의해 분석될 수 있다. 단백질의 "용해도" 및 "활성"은 관련된 품질이지만 일반적으로 상이한 수단에 의해 측정된다. 단백질, 특히 소수성 단백질의 용해도는 소수성 아미노산 잔기가 폴딩된 단백질의 내부에 적절하게 위치한다는 것을 표시한다. 예를 들어, 아래에 설명된 바와 같이, 다양한 방법을 이용하여 종종 평가하는 단백질 활성은 적절한 단백질 입체구조의 또 다른 지표이다.
일부 실시양태에서, 관심 있는 재조합 단백질은 생물층 간섭측정, SDS-PAGE, 웨스턴 블롯, 파 웨스턴 블롯, ELISA, 흡광도 또는 질량 분광측정(예를 들어, 탠덤 질량 분광측정)에 의해 분석된다. 일부 실시양태에서, 생성된 관심 있는 폴리펩티드 또는 단백질의 농도 및/또는 양은 예를 들어, 브래드포드 어세이, 흡광도, 쿠마시 염색, 질량 분광측정 등에 의해 측정된다. 불용성 분획 및 가용성 분획에서의 단백질 수율 및 단편화는 당업자에게 알려진 방법, 예를 들어, 모세관 겔 전기영동(CGE), SDS-PAGE 및 웨스턴 블롯 분석에 의해 분석될 수 있다. 예를 들어, 생물층 간섭측정을 이용하여 가용성 분획을 평가할 수도 있다. 단백질 활성은 관심 있는 재조합 단백질에 적합한 임의의 알려진 방법에 의해 측정될 수 있다. 결합 단백질인 관심 있는 재조합 단백질의 경우, 이것은 임의의 알려진 방법으로 이 단백질과 표적 리간드, 예를 들어, TNF-알파, 또는 임의의 다른 표적의 결합을 측정하는 단계를 포함할 수 있다.
단백질 수율의 유용한 측정치는 예를 들어, 배양물 부피당 재조합 단백질의 양(예를 들어, 배양물 리터당 단백질의 그램 또는 밀리그램으로 표현될 수 있는 농도), 용해 후 수득된 불용성 펠릿에서 측정된 재조합 단백질의 퍼센트 또는 분율(예를 들어, 추출물 상청액 중의 재조합 단백질의 양/불용성 분획 중의 단백질의 양), 활성 단백질의 퍼센트 또는 분율(예를 들어, 활성 단백질의 양/어세이에 사용된 단백질의 양), 총 세포 단백질(tcp)의 퍼센트 또는 분율, 단백질/세포의 양, 및 퍼센트 건조 바이오매스를 포함한다. 본원에서 사용된 측정치는 대규모 발효 배양물에 대해 측정된 측정치를 의미할 수 있다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 실질적으로 동일한 생장 조건 하에서 대조군 세포보다 배양물에서 증가된 세포 밀도까지 생장한다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배 내지 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배 내지 약 3배, 약 2배 내지 약 4배, 약 2배 내지 약 5배, 약 2배 내지 약 6배, 약 2배 내지 약 7배, 약 2배 내지 약 8배, 약 2배 내지 약 9배, 약 2배 내지 약 10배, 약 2배 내지 약 11배, 약 2배 내지 약 12배, 약 2배 내지 약 15배, 약 3배 내지 약 4배, 약 3배 내지 약 5배, 약 3배 내지 약 6배, 약 3배 내지 약 7배, 약 3배 내지 약 8배, 약 3배 내지 약 9배, 약 3배 내지 약 10배, 약 3배 내지 약 11배, 약 3배 내지 약 12배, 약 3배 내지 약 15배, 약 4배 내지 약 5배, 약 4배 내지 약 6배, 약 4배 내지 약 7배, 약 4배 내지 약 8배, 약 4배 내지 약 9배, 약 4배 내지 약 10배, 약 4배 내지 약 11배, 약 4배 내지 약 12배, 약 4배 내지 약 15배, 약 5배 내지 약 6배, 약 5배 내지 약 7배, 약 5배 내지 약 8배, 약 5배 내지 약 9배, 약 5배 내지 약 10배, 약 5배 내지 약 11배, 약 5배 내지 약 12배, 약 5배 내지 약 15배, 약 6배 내지 약 7배, 약 6배 내지 약 8배, 약 6배 내지 약 9배, 약 6배 내지 약 10배, 약 6배 내지 약 11배, 약 6배 내지 약 12배, 약 6배 내지 약 15배, 약 7배 내지 약 8배, 약 7배 내지 약 9배, 약 7배 내지 약 10배, 약 7배 내지 약 11배, 약 7배 내지 약 12배, 약 7배 내지 약 15배, 약 8배 내지 약 9배, 약 8배 내지 약 10배, 약 8배 내지 약 11배, 약 8배 내지 약 12배, 약 8배 내지 약 15배, 약 9배 내지 약 10배, 약 9배 내지 약 11배, 약 9배 내지 약 12배, 약 9배 내지 약 15배, 약 10배 내지 약 11배, 약 10배 내지 약 12배, 약 10배 내지 약 15배, 약 11배 내지 약 12배, 약 11배 내지 약 15배, 또는 약 12배 내지 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배 또는 약 15배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배 또는 약 12배이다. 일부 실시양태에서, 대조군 세포에 비해 세포 밀도의 증가는 최대 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 11배, 약 12배 또는 약 15배이다.
일부 실시양태에서, 본 발명의 재조합 그람 음성 박테리아 숙주 세포는 대조군 세포에 비해 증가된 수율의 고품질 재조합 단백질을 생성한다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배 내지 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배 내지 약 5배, 약 2배 내지 약 10배, 약 2배 내지 약 20배, 약 2배 내지 약 30배, 약 2배 내지 약 40배, 약 2배 내지 약 50배, 약 2배 내지 약 60배, 약 2배 내지 약 70배, 약 2배 내지 약 80배, 약 2배 내지 약 90배, 약 2배 내지 약 100배, 약 5배 내지 약 10배, 약 5배 내지 약 20배, 약 5배 내지 약 30배, 약 5배 내지 약 40배, 약 5배 내지 약 50배, 약 5배 내지 약 60배, 약 5배 내지 약 70배, 약 5배 내지 약 80배, 약 5배 내지 약 90배, 약 5배 내지 약 100배, 약 10배 내지 약 20배, 약 10배 내지 약 30배, 약 10배 내지 약 40배, 약 10배 내지 약 50배, 약 10배 내지 약 60배, 약 10배 내지 약 70배, 약 10배 내지 약 80배, 약 10배 내지 약 90배, 약 10배 내지 약 100배, 약 20배 내지 약 30배, 약 20배 내지 약 40배, 약 20배 내지 약 50배, 약 20배 내지 약 60배, 약 20배 내지 약 70배, 약 20배 내지 약 80배, 약 20배 내지 약 90배, 약 20배 내지 약 100배, 약 30배 내지 약 40배, 약 30배 내지 약 50배, 약 30배 내지 약 60배, 약 30배 내지 약 70배, 약 30배 내지 약 80배, 약 30배 내지 약 90배, 약 30배 내지 약 100배, 약 40배 내지 약 50배, 약 40배 내지 약 60배, 약 40배 내지 약 70배, 약 40배 내지 약 80배, 약 40배 내지 약 90배, 약 40배 내지 약 100배, 약 50배 내지 약 60배, 약 50배 내지 약 70배, 약 50배 내지 약 80배, 약 50배 내지 약 90배, 약 50배 내지 약 100배, 약 60배 내지 약 70배, 약 60배 내지 약 80배, 약 60배 내지 약 90배, 약 60배 내지 약 100배, 약 70배 내지 약 80배, 약 70배 내지 약 90배, 약 70배 내지 약 100배, 약 80배 내지 약 90배, 약 80배 내지 약 100배, 또는 약 90배 내지 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 약 2배, 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배 또는 약 100배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 적어도 약 2배, 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배 또는 약 90배이다. 일부 실시양태에서, 대조군 세포에 비해 증가된 수율은 최대 약 5배, 약 10배, 약 20배, 약 30배, 약 40배, 약 50배, 약 60배, 약 70배, 약 80배, 약 90배 또는 약 100배이다.
재조합 그람 음성 박테리아 숙주 세포와 비교하기 위한 임의의 적합한 대조군 세포는 당업자에 의해 선택될 수 있다. 일부 실시양태에서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포는 각각 (i) 본원에 기재된 바와 같이 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포; (ii) 본원에 기재된 바와 같이 제1 프로테아제 활성, 제2 프로테아제 활성 및 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및 (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포로부터 선택된다.
실시양태에서, 본원의 방법을 이용하여 총 세포 단백질의 약 20% 내지 약 90%의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 특정 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 폴리펩티드 또는 단백질의 수율은 총 세포 단백질의 약 20%, 총 세포 단백질의 약 25%, 총 세포 단백질의 약 30%, 총 세포 단백질의 약 31%, 총 세포 단백질의 약 32%, 총 세포 단백질의 약 33%, 총 세포 단백질의 약 34%, 총 세포 단백질의 약 35%, 총 세포 단백질의 약 36%, 총 세포 단백질의 약 37%, 총 세포 단백질의 약 38%, 총 세포 단백질의 약 39%, 총 세포 단백질의 약 40%, 총 세포 단백질의 약 41%, 총 세포 단백질의 약 42%, 총 세포 단백질의 약 43%, 총 세포 단백질의 약 44%, 총 세포 단백질의 약 45%, 총 세포 단백질의 약 46%, 총 세포 단백질의 약 47%, 총 세포 단백질의 약 48%, 총 세포 단백질의 약 49%, 총 세포 단백질의 약 50%, 총 세포 단백질의 약 51%, 총 세포 단백질의 약 52%, 총 세포 단백질의 약 53%, 총 세포 단백질의 약 54%, 총 세포 단백질의 약 55%, 총 세포 단백질의 약 56%, 총 세포 단백질의 약 57%, 총 세포 단백질의 약 58%, 총 세포 단백질의 약 59%, 총 세포 단백질의 약 60%, 총 세포 단백질의 약 65%, 총 세포 단백질의 약 70%, 총 세포 단백질의 약 75%, 총 세포 단백질의 약 80%, 총 세포 단백질의 약 85% 또는 총 세포 단백질의 약 90%이다. 일부 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 수율은 총 세포 단백질의 약 20% 내지 약 25%, 총 세포 단백질의 약 20% 내지 약 30%, 총 세포 단백질의 약 20% 내지 약 35%, 총 세포 단백질의 약 20% 내지 약 40%, 총 세포 단백질의 약 20% 내지 약 45%, 총 세포 단백질의 약 20% 내지 약 50%, 총 세포 단백질의 약 20% 내지 약 55%, 총 세포 단백질의 약 20% 내지 약 60%, 총 세포 단백질의 약 20% 내지 약 65%, 총 세포 단백질의 약 20% 내지 약 70%, 총 세포 단백질의 약 20% 내지 약 75%, 총 세포 단백질의 약 20% 내지 약 80%, 총 세포 단백질의 약 20% 내지 약 85%, 총 세포 단백질의 약 20% 내지 약 90%, 총 세포 단백질의 약 25% 내지 약 90%, 총 세포 단백질의 약 30% 내지 약 90%, 총 세포 단백질의 약 35% 내지 약 90%, 총 세포 단백질의 약 40% 내지 약 90%, 총 세포 단백질의 약 45% 내지 약 90%, 총 세포 단백질의 약 50% 내지 약 90%, 총 세포 단백질의 약 55% 내지 약 90%, 총 세포 단백질의 약 60% 내지 약 90%, 총 세포 단백질의 약 65% 내지 약 90%, 총 세포 단백질의 약 70% 내지 약 90%, 총 세포 단백질의 약 75% 내지 약 90%, 총 세포 단백질의 약 80% 내지 약 90%, 총 세포 단백질의 약 85% 내지 약 90%, 총 세포 단백질의 약 31% 내지 약 60%, 총 세포 단백질의 약 35% 내지 약 60%, 총 세포 단백질의 약 40% 내지 약 60%, 총 세포 단백질의 약 45% 내지 약 60%, 총 세포 단백질의 약 50% 내지 약 60%, 총 세포 단백질의 약 55% 내지 약 60%, 총 세포 단백질의 약 31% 내지 약 55%, 총 세포 단백질의 약 31% 내지 약 50%, 총 세포 단백질의 약 31% 내지 약 45%, 총 세포 단백질의 약 31% 내지 약 40%, 총 세포 단백질의 약 31% 내지 약 35%, 총 세포 단백질의 약 35% 내지 약 55%, 또는 총 세포 단백질의 약 40% 내지 약 50%이다.
실시양태에서, 본원의 방법을 이용하여 리터당 약 1 그램 내지 리터당 약 50 그램의 수율(농도로서 표현되는 경우 역가로서 지칭될 수 있음)로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ 내지 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.1 g/ℓ 내지 약 15 g/ℓ, 약 0.1 g/ℓ 내지 약 20 g/ℓ, 약 0.1 g/ℓ 내지 약 25 g/ℓ, 약 0.1 g/ℓ 내지 약 30 g/ℓ, 약 0.1 g/ℓ 내지 약 35 g/ℓ, 약 0.1 g/ℓ 내지 약 40 g/ℓ, 약 0.1 g/ℓ 내지 약 45 g/ℓ, 약 0.1 g/ℓ 내지 약 50 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 15 g/ℓ, 약 1 g/ℓ 내지 약 20 g/ℓ, 약 1 g/ℓ 내지 약 25 g/ℓ, 약 1 g/ℓ 내지 약 30 g/ℓ, 약 1 g/ℓ 내지 약 35 g/ℓ, 약 1 g/ℓ 내지 약 40 g/ℓ, 약 1 g/ℓ 내지 약 45 g/ℓ, 약 1 g/ℓ 내지 약 50 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 15 g/ℓ, 약 5 g/ℓ 내지 약 20 g/ℓ, 약 5 g/ℓ 내지 약 25 g/ℓ, 약 5 g/ℓ 내지 약 30 g/ℓ, 약 5 g/ℓ 내지 약 35 g/ℓ, 약 5 g/ℓ 내지 약 40 g/ℓ, 약 5 g/ℓ 내지 약 45 g/ℓ, 약 5 g/ℓ 내지 약 50 g/ℓ, 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 35 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 45 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 35 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 45 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 35 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 45 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 35 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 45 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 35 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ 내지 약 45 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 약 35 g/ℓ 내지 약 40 g/ℓ, 약 35 g/ℓ 내지 약 45 g/ℓ, 약 35 g/ℓ 내지 약 50 g/ℓ, 약 40 g/ℓ 내지 약 45 g/ℓ, 약 40 g/ℓ 내지 약 50 g/ℓ, 또는 약 45 g/ℓ 내지 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ, 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.1 g/ℓ, 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ 또는 약 45 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 1 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 35 g/ℓ, 약 40 g/ℓ, 약 45 g/ℓ 또는 약 50 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ 내지 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 3 g/ℓ, 약 0.1 g/ℓ 내지 약 4 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 6 g/ℓ, 약 0.1 g/ℓ 내지 약 7 g/ℓ, 약 0.1 g/ℓ 내지 약 8 g/ℓ, 약 0.1 g/ℓ 내지 약 9 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 4 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 6 g/ℓ, 약 0.5 g/ℓ 내지 약 7 g/ℓ, 약 0.5 g/ℓ 내지 약 8 g/ℓ, 약 0.5 g/ℓ 내지 약 9 g/ℓ, 약 0.5 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 4 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 6 g/ℓ, 약 1 g/ℓ 내지 약 7 g/ℓ, 약 1 g/ℓ 내지 약 8 g/ℓ, 약 1 g/ℓ 내지 약 9 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 2 g/ℓ 내지 약 3 g/ℓ, 약 2 g/ℓ 내지 약 4 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 6 g/ℓ, 약 2 g/ℓ 내지 약 7 g/ℓ, 약 2 g/ℓ 내지 약 8 g/ℓ, 약 2 g/ℓ 내지 약 9 g/ℓ, 약 2 g/ℓ 내지 약 10 g/ℓ, 약 3 g/ℓ 내지 약 4 g/ℓ, 약 3 g/ℓ 내지 약 5 g/ℓ, 약 3 g/ℓ 내지 약 6 g/ℓ, 약 3 g/ℓ 내지 약 7 g/ℓ, 약 3 g/ℓ 내지 약 8 g/ℓ, 약 3 g/ℓ 내지 약 9 g/ℓ, 약 3 g/ℓ 내지 약 10 g/ℓ, 약 4 g/ℓ 내지 약 5 g/ℓ, 약 4 g/ℓ 내지 약 6 g/ℓ, 약 4 g/ℓ 내지 약 7 g/ℓ, 약 4 g/ℓ 내지 약 8 g/ℓ, 약 4 g/ℓ 내지 약 9 g/ℓ, 약 4 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 6 g/ℓ, 약 5 g/ℓ 내지 약 7 g/ℓ, 약 5 g/ℓ 내지 약 8 g/ℓ, 약 5 g/ℓ 내지 약 9 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 6 g/ℓ 내지 약 7 g/ℓ, 약 6 g/ℓ 내지 약 8 g/ℓ, 약 6 g/ℓ 내지 약 9 g/ℓ, 약 6 g/ℓ 내지 약 10 g/ℓ, 약 7 g/ℓ 내지 약 8 g/ℓ, 약 7 g/ℓ 내지 약 9 g/ℓ, 약 7 g/ℓ 내지 약 10 g/ℓ, 약 8 g/ℓ 내지 약 9 g/ℓ, 약 8 g/ℓ 내지 약 10 g/ℓ, 또는 약 9 g/ℓ 내지 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/L, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ, 약 9 g/ℓ 또는 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ 또는 약 9 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ, 약 5 g/ℓ, 약 6 g/ℓ, 약 7 g/ℓ, 약 8 g/ℓ, 약 9 g/ℓ 또는 약 10 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여, 약 0.2 g/ℓ 내지 약 0.3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.4 g/ℓ, 약 0.2 g/ℓ 내지 약 0.5 g/ℓ, 약 0.2 g/ℓ 내지 약 0.75 g/ℓ, 약 0.2 g/ℓ 내지 약 1 g/ℓ, 약 0.2 g/ℓ 내지 약 1.25 g/ℓ, 약 0.2 g/ℓ 내지 약 1.5 g/ℓ, 약 0.2 g/ℓ 내지 약 2 g/ℓ, 약 0.2 g/ℓ 내지 약 3 g/ℓ, 약 0.2 g/ℓ 내지 약 4 g/ℓ, 약 0.2 g/ℓ 내지 약 5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.4 g/ℓ, 약 0.3 g/ℓ 내지 약 0.5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.75 g/ℓ, 약 0.3 g/ℓ 내지 약 1 g/ℓ, 약 0.3 g/ℓ 내지 약 1.25 g/ℓ, 약 0.3 g/ℓ 내지 약 1.5 g/ℓ, 약 0.3 g/ℓ 내지 약 2 g/ℓ, 약 0.3 g/ℓ 내지 약 3 g/ℓ, 약 0.3 g/ℓ 내지 약 4 g/ℓ, 약 0.3 g/ℓ 내지 약 5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.75 g/ℓ, 약 0.4 g/ℓ 내지 약 1 g/ℓ, 약 0.4 g/ℓ 내지 약 1.25 g/ℓ, 약 0.4 g/ℓ 내지 약 1.5 g/ℓ, 약 0.4 g/ℓ 내지 약 2 g/ℓ, 약 0.4 g/ℓ 내지 약 3 g/ℓ, 약 0.4 g/ℓ 내지 약 4 g/ℓ, 약 0.4 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 0.75 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 1.25 g/ℓ, 약 0.5 g/ℓ 내지 약 1.5 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 4 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.75 g/ℓ 내지 약 1 g/ℓ, 약 0.75 g/ℓ 내지 약 1.25 g/ℓ, 약 0.75 g/ℓ 내지 약 1.5 g/ℓ, 약 0.75 g/ℓ 내지 약 2 g/ℓ, 약 0.75 g/ℓ 내지 약 3 g/ℓ, 약 0.75 g/ℓ 내지 약 4 g/ℓ, 약 0.75 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 1.25 g/ℓ, 약 1 g/ℓ 내지 약 1.5 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 4 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1.25 g/ℓ 내지 약 1.5 g/ℓ, 약 1.25 g/ℓ 내지 약 2 g/ℓ, 약 1.25 g/ℓ 내지 약 3 g/ℓ, 약 1.25 g/ℓ 내지 약 4 g/ℓ, 약 1.25 g/ℓ 내지 약 5 g/ℓ, 약 1.5 g/ℓ 내지 약 2 g/ℓ, 약 1.5 g/ℓ 내지 약 3 g/ℓ, 약 1.5 g/ℓ 내지 약 4 g/ℓ, 약 1.5 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 3 g/ℓ, 약 2 g/ℓ 내지 약 4 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 3 g/ℓ 내지 약 4 g/ℓ, 약 3 g/ℓ 내지 약 5 g/ℓ, 또는 약 4 g/ℓ 내지 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ 또는 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 적어도 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ 또는 약 4 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다. 일부 실시양태에서, 본원의 방법을 이용하여 최대 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.75 g/ℓ, 약 1 g/ℓ, 약 1.25 g/ℓ, 약 1.5 g/ℓ, 약 2 g/ℓ, 약 3 g/ℓ, 약 4 g/ℓ 또는 약 5 g/ℓ의 수율로 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질을 수득한다.
실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 생성된 관심 있는 총 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10% 내지 약 100%이다. 실시양태에서, 이 양은 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 99%, 또는 약 100%이다. 실시양태에서, 이 양은 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양의 약 10% 내지 약 20%, 20% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 50%, 약 25% 내지 약 95%, 약 30% 내지 약 50%, 약 30% 내지 약 40%, 약 30% 내지 약 60%, 약 30% 내지 약 70%, 약 35% 내지 약 50%, 약 35% 내지 약 70%, 약 35% 내지 약 75%, 약 35% 내지 약 95%, 약 40% 내지 약 50%, 약 40% 내지 약 95%, 약 50% 내지 약 75%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 또는 약 80% 내지 약 100%이다.
일부 실시양태에서, 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 퍼센트로서 표현된다. 주어진 세포 밀도에서 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질 중량/세포 배양물 부피의 관점에서 표현된 데이터는 총 세포 단백질 중 재조합 단백질의 퍼센트로서 표현된 데이터로 전환될 수 있다. 예를 들어, 주어진 세포 밀도에서 세포 배양물의 부피당 총 세포 단백질의 양을 파악하여, 부피 단백질 수율을 % 총 세포 단백질로 전환하는 것은 숙련된 당업자의 능력 내에 있다. 이 숫자는 1) 주어진 세포 밀도에서 세포 중량/배양물 부피, 및 2) 총 단백질을 구성하는 세포 중량의 퍼센트를 파악하는 경우 결정될 수 있다. 예를 들어, 1.0의 OD550에서, 이. 콜라이의 건조 세포 중량은 0.5 그램/리터인 것으로 보고되어 있다("Production of Heterologous Proteins from Recombinant DNA Escherichia coli in Bench Fermentors," Lin, N.S., and Swartz, J.R., 1992, METHODS: A Companion to Methods in Enzymology 4: 159-168). 박테리아 세포는 단백질뿐만 아니라 다당류, 지질 및 핵산으로도 구성된다. 이. 콜라이 세포는 단백질이 이. 콜라이 세포의 52.4 중량%를 차지한다고 추정하는 문헌[Da Silva, N.A., et al., 1986, "Theoretical Growth Yield Estimates for Recombinant Cells," Biotechnology and Bioengineering, Vol. XXVIII: 741-746], 및 이. 콜라이의 단백질 함량을 55% 건조 세포 중량으로서 보고하는 문헌["Escherichia coli and Salmonella typhimurium Cellular and Molecular Biology," 1987, Ed. in Chief Frederick C. Neidhardt, Vol. 1, pp. 3-6]을 포함하나 이들로 제한되지 않는 참고문헌에 의해 약 52.4% 내지 55% 단백질인 것으로 보고되어 있다. 상기 측정치(즉, 0.5 그램/리터의 건조 세포 중량, 및 55% 세포 중량로서 단백질)을 사용하여, 이. 콜라이의 경우 1.0의 A550에서 세포 배양물의 부피당 총 세포 단백질의 양을 275 ㎍ 총 세포 단백질/㎖/A550으로서 계산한다. 습윤 세포 중량을 기준으로 세포 배양물의 부피당 총 세포 단백질의 계산은 예를 들어, 이. 콜라이의 경우 1.0의 A600이 1.7 그램/리터의 습윤 세포 중량 및 0.39 그램/리터의 건조 세포 중량을 야기한다는 글라지리나 연구진(Glazyrina, et al.)(본원에 참고로 포함되는 문헌[Microbial Cell Factories 2010, 9:42])에 의한 확인을 이용할 수 있다. 예를 들어, 이 습윤 세포 중량과 건조 세포 중량의 비교를 이용하고 전술된 바와 같이 단백질을 55% 건조 세포 중량으로서 사용하여, 이. 콜라이의 경우 1.0의 A600에서 세포 배양물의 부피당 총 세포 단백질의 양을 215 ㎍ 총 세포 단백질/㎖/A600으로서 계산할 수 있다. 슈도모나스 플루오레센스의 경우, 주어진 세포 밀도에서 세포 배양물의 부피당 총 세포 단백질의 양은 이. 콜라이에 대해 발견된 양과 유사하다. 슈도모나스 플루오레센스는 이. 콜라이처럼 그람 음성 막대 모양 박테리아이다. 문헌[Edwards, et al., 1972, "Continuous Culture of Pseudomonas fluorescens with Sodium Maleate as a Carbon Source," Biotechnology and Bioengineering, Vol. XIV, pages 123-147]에 의해 보고된 슈도모나스 플루오레센스 ATCC 11150의 건조 세포 중량은 0.5 그램/리터/A500이다. 이것은 1.0의 A550에서 이. 콜라이에 대해 상기 문헌[Lin, et al.]에 의해 보고된 중량과 동일한 중량이다. 500 nm 및 550 nm에서 얻은 광산란 측정치는 매우 유사할 것으로 예상된다. 슈도모나스 플루오레센스 HK44에 대한 총 세포 단백질을 구성하는 세포 중량의 퍼센트는 예를 들어, 문헌[Yarwood, et al., July 2002, "Noninvasive Quantitative Measurement of Bacterial Growth in Porous Media under Unsaturated-Flow Conditions," Applied and Environmental Microbiology 68(7):3597-3605]에 의해 55%로서 기재되어 있다. 이 퍼센트는 전술된 참고문헌들에 의해 이. 콜라이의 경우 주어진 퍼센트와 유사하거나 동일하다.
실시양태에서, 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1% 내지 약 95%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%를 초과한다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 5% 내지 약 95%, 약 10% 내지 약 85%, 약 20% 내지 약 75%, 약 30% 내지 약 65%, 약 40% 내지 약 55%, 약 1% 내지 약 95%, 약 5% 내지 약 30%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 또는 약 80% 내지 약 90%이다.
실시양태에서, 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 건조 세포 중량(DCW)의 약 0.1% 내지 약 50%이다. 실시양태에서, 이 양은 DCW의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45% 또는 50%를 초과한다. 실시양태에서, 이 양은 DCW의 약 0.1%, 0.5%, 1%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45% 또는 50%이다. 실시양태에서, 이 양은 배양물에서 생성된 총 활성, 가용성 및/또는 온전한 단백질의 약 5% 내지 약 50%, 약 10% 내지 약 40%, 약 20% 내지 약 30%, 약 1% 내지 약 20%, 약 5% 내지 약 25%, 약 1% 내지 약 10%, 약 10% 내지 약 20%, 약 20% 내지 약 30%, 약 30% 내지 약 40%, 또는 약 40% 내지 약 50%이다.
실시양태에서, 본 발명의 방법을 이용함으로써 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질의 양은 실질적으로 유사한 조건, 예를 들어, 동일한 생장 조건 하에서 대조군 숙주 세포에 의해 생성된 단백질의 양보다 더 크다. 대조군 숙주 세포는 재조합 그람 음성 숙주 세포와 모든 면에서 동일하지만, (a) 재조합 그람 음성 숙주 세포에 결핍된 하나 이상의 활성이 결핍되어 있지 않거나, (b) 재조합 그람 음성 숙주 세포에서 과발현되는 하나 이상의 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 과발현하지 않거나, (c) (a)와 (b)의 임의의 조합을 나타내는 숙주 세포일 수 있다. 대조군 숙주 세포는 재조합 그람 음성 숙주 세포의 야생형 배경을 갖지만, (a) 재조합 그람 음성 숙주 세포에 결핍된 하나 이상의 활성이 결핍되어 있지 않거나, (b) 재조합 그람 음성 숙주 세포에서 과발현되는 하나 이상의 샤페론, 폴딩 조절인자 또는 불활성화된 프로테아제를 과발현하지 않거나, (c) (a)와 (b)의 임의의 조합을 나타내는 숙주 세포일 수 있다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포를 사용하는 본 방법에 따라 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 더 큰 양으로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 약 1.5배 내지 약 10배인 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 약 1.5배 내지 약 2배, 약 1.5배 내지 약 2.5배, 약 1.5배 내지 약 3배, 약 1.5배 내지 약 3.5배, 약 1.5배 내지 약 4배, 약 1.5배 내지 약 5배, 약 1.5배 내지 약 6배, 약 1.5배 내지 약 7배, 약 1.5배 내지 약 8배, 약 1.5배 내지 약 9배, 약 1.5배 내지 약 10배, 약 2배 내지 약 2.5배, 약 2배 내지 약 3배, 약 2배 내지 약 3.5배, 약 2배 내지 약 4배, 약 2배 내지 약 5배, 약 2배 내지 약 6배, 약 2배 내지 약 7배, 약 2배 내지 약 8배, 약 2배 내지 약 9배, 약 2배 내지 약 10배, 약 2.5배 내지 약 3배, 약 2.5배 내지 약 3.5배, 약 2.5배 내지 약 4배, 약 2.5배 내지 약 5배, 약 2.5배 내지 약 6배, 약 2.5배 내지 약 7배, 약 2.5배 내지 약 8배, 약 2.5배 내지 약 9배, 약 2.5배 내지 약 10배, 약 3배 내지 약 3.5배, 약 3배 내지 약 4배, 약 3배 내지 약 5배, 약 3배 내지 약 6배, 약 3배 내지 약 7배, 약 3배 내지 약 8배, 약 3배 내지 약 9배, 약 3배 내지 약 10배, 약 3.5배 내지 약 4배, 약 3.5배 내지 약 5배, 약 3.5배 내지 약 6배, 약 3.5배 내지 약 7배, 약 3.5배 내지 약 8배, 약 3.5배 내지 약 9배, 약 3.5배 내지 약 10배, 약 4배 내지 약 5배, 약 4배 내지 약 6배, 약 4배 내지 약 7배, 약 4배 내지 약 8배, 약 4배 내지 약 9배, 약 4배 내지 약 10배, 약 5배 내지 약 6배, 약 5배 내지 약 7배, 약 5배 내지 약 8배, 약 5배 내지 약 9배, 약 5배 내지 약 10배, 약 6배 내지 약 7배, 약 6배 내지 약 8배, 약 6배 내지 약 9배, 약 6배 내지 약 10배, 약 7배 내지 약 8배, 약 7배 내지 약 9배, 약 7배 내지 약 10배, 약 8배 내지 약 9배, 약 8배 내지 약 10배, 또는 약 9배 내지 약 10배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배 또는 약 10배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 적어도 약 1.5배, 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배 또는 약 9배 더 큰 수율로 생성된다. 일부 실시양태에서, 본 발명의 재조합 그람 음성 숙주 세포에 의해 생성된 관심 있는 활성, 가용성 및/또는 온전한 재조합 단백질은 대조군 숙주 세포에 의해 생성된 단백질의 양보다 최대 약 2배, 약 2.5배, 약 3배, 약 3.5배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배 또는 약 10배 더 큰 수율로 생성된다.
활성 어세이
관심 있는 재조합 단백질의 활성을 평가하는 어세이는 당분야에 알려져 있으며, 형광측정, 비색측정, 화학발광, 분광광도측정, 및 당업자에 의해 이용될 수 있는 다른 효소 어세이를 포함하나 이들로 제한되지 않는다. 항체, 항체 단편 또는 이의 유도체와 같은 결합 단백질은 당분야에 알려져 있는 임의의 적절한 표적 결합 어세이에 의해 평가될 수 있다. 이 어세이를 이용하여 관심 있는 재조합 단백질 제제의 활성을 시판되는 또는 다른 재조합 단백질 제제와 비교할 수 있다.
실시양태에서, 활성은 어세이된 총량과 비교된 추출물 상청액 중의 퍼센트 활성 단백질로 표시된다. 이것은 어세이에 사용된 단백질의 총량에 비해 어세이에 의해 활성을 띠는 것으로 확인된 단백질의 양을 기반으로 한다. 다른 실시양태에서, 활성은 표준물, 예를 들어, 천연 단백질과 비교된 단백질의 % 활성 수준으로 표시된다. 이것은 표준 샘플 중의 활성 단백질의 양에 비해 상청액 추출물 샘플 중의 활성 단백질의 양을 기반으로 한다(이때 각각의 샘플로부터 동일한 양의 단백질이 어세이에 사용됨).
실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40% 내지 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 40% 내지 약 50%, 약 50% 내지 약 60%, 약 60% 내지 약 70%, 약 70% 내지 약 80%, 약 80% 내지 약 90%, 약 90% 내지 약 100%, 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 40% 내지 약 90%, 약 40% 내지 약 95%, 약 50% 내지 약 90%, 약 50% 내지 약 95%, 약 50% 내지 약 100%, 약 60% 내지 약 90%, 약 60% 내지 약 95%, 약 60% 내지 약 100%, 약 70% 내지 약 90%, 약 70% 내지 약 95%, 약 70% 내지 약 100%, 또는 약 70% 내지 약 100%가 활성을 띠는 것으로 확인된다.
다른 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 75% 내지 약 100%가 활성을 띠는 것으로 확인된다. 실시양태에서, 관심 있는 펩티드, 폴리펩티드 또는 단백질의 약 75% 내지 약 80%, 약 75% 내지 약 85%, 약 75% 내지 약 90%, 약 75% 내지 약 95%, 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 95%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 95%, 약 85% 내지 약 100%, 약 90% 내지 약 95%, 약 90% 내지 약 100%, 또는 약 95% 내지 약 100%가 활성을 띠는 것으로 확인된다.
SlmT 분비 신호 펩티드
숙주 세포에서 높은 수준의 적절하게 처리된 재조합 단백질 또는 폴리펩티드를 생성하는 조성물 및 방법을 제공한다. 일부 측면에서, 그람 음성 박테리아의 주변세포질 또는 세포외 환경 내로의 관심 있는 재조합 단백질 또는 폴리펩티드의 표적화를 촉진하는 신규 분비 신호인 Slmt를 제공한다. 본원에 개시된 Slmt 주변세포질 분비 신호 펩티드는 그람 음성 박테리아에서 내부 막을 가로질러 단백질을 주변세포질 공간으로 수송할 수 있게 한다. 일부 측면에서, 본원에서 제공된 Slmt 주변세포질 분비 신호 펩티드는 그람 양성 박테리아에서 관심 있는 단백질 또는 폴리펩티드를 세포외 공간으로 표적화하는 것을 촉진한다. 주변세포질 단백질 발현은 주변세포질에서 디설파이드 결합의 적절한 형성을 허용하고 높은 수준의 재조합 단백질 발현을 야기할 수 있다. 주변세포질 공간으로의 발현은 재조합 단백질의 보다 더 효율적인 회수/정제를 가능하게 할 수 있다. 본 개시내용의 목적을 위해, "분비 신호", "분비 리더", "분비 신호 폴리펩티드", "신호 펩티드", "리더 펩티드" 또는 "리더 서열"은 관심 있는 단백질 또는 폴리펩티드를 세포 구획, 예를 들어, 그람 음성 박테리아의 주변세포질 또는 세포외 공간으로 표적화하는 데 유용한 펩티드 서열(또는 이 펩티드 서열을 코딩하는 폴리뉴클레오타이드)을 지칭하기 위한 것이다. 분비 신호 서열은 Slmt 분비 신호(서열번호 11로 제시된 아미노산 서열), 및 이의 단편 및 변이체를 포함한다. 서열번호 11을 코딩하고 본 방법에 유용한 뉴클레오타이드 서열의 한 예는 서열번호 12로 제공된다. 당업자에게 알려져 있는 바와 같이, 아미노산 서열은 유전자 코드의 중복성으로 인해 상이한 뉴클레오타이드 서열에 의해 코딩될 수 있다. 따라서, 본 발명의 조성물 및 방법은 상이한 뉴클레오타이드 서열에 의해 코딩될 수 있지만 동일한 분비 신호 아미노산 서열을 포함할 수 있다. 본원은 작동 가능하게 연결된 관심 있는 재조합 단백질 또는 폴리펩티드의 주변세포질 발현을 유도할 수 있는 분비 신호 펩티드 서열의 단편 및 변이체도 제공한다.
서열번호 11로 제시된 아미노산 서열을 코딩하는 분비 신호 코딩 서열은 발현되어 숙주 세포 주변세포질 또는 세포외 공간으로 표적화될 관심 있는 이종 재조합 단백질 또는 폴리펩티드를 코딩하는 서열의 N-말단에 융합될 수 있다. 이종 분비 신호 및 관심 있는 단백질 또는 폴리펩티드와 관련하여 본원에서 사용된 바와 같이, "이종" 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호가 아니다. 반대로, 분비 신호 펩티드와 관련하여, 관심 있는 "이종" 단백질 또는 폴리펩티드는 분비 신호에 대한 천연 단백질 또는 폴리펩티드가 아니다. 서열번호 11과 관련하여, 관심 있는 이종 단백질 또는 폴리펩티드는 슈도모나스 플루오레센스 가용성 용해성 뮤레인 트랜스글리코실라제(SlmT)가 아닌 이종 단백질 또는 폴리펩티드이다. 서열번호 11로 제시된 아미노산 서열을 코딩하는 분비 신호 코딩 서열을 포함하는 구축물과 관련하여, 관심 있는 이종 단백질 또는 폴리펩티드를 코딩하는 서열은 슈도모나스 플루오레센스 가용성 용해성 뮤레인 트랜스글리코실라제(SlmT)를 코딩하지 않는 서열이다. 숙주 세포와 관련하여, 용어 이종은 특정 숙주 세포에 대한 천연 단백질 또는 폴리펩티드가 아닌 관심 있는 단백질 또는 폴리펩티드를 의미할 수 있다.
본 발명은 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법을 포함하고, 이때 원핵 숙주 세포는 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 이때 상기 분비 신호 펩티드는 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드는 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아니다.
일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 주변세포질에서 발현되고 분비 신호 펩티드, 예를 들어, 서열번호 11로부터 적절하게 절단된다. 일부 실시양태에서, 분비 신호 펩티드는 적절하게 절단된 형태, 가용성 형태, 활성 형태 또는 이들의 임의의 조합으로 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도한다. 정확하게 또는 적절히 절단되거나 처리된 관심 있는 단백질 또는 폴리펩티드는 온전한 또는 실질적으로 온전한 N-말단을 가질 수 있다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함한다. 일부 실시양태에서, 온전한 또는 실질적으로 온전한 N-말단을 가진 적절하게 절단된 관심 있는 단백질 또는 폴리펩티드는 N-말단 메티오닌을 포함하지 않는다. 관심 있는 단백질 또는 폴리펩티드는 활성, 용해도 또는 이들 둘 다를 위해 실질적으로 온전한 N-말단을 요구할 수 있다. 일부 실시양태에서, 관심 있는 단백질 또는 폴리펩티드는 대조군과 비교될 때 약 80% 내지 100% 활성을 가진다. 일부 실시양태에서, 대조군은 N-말단 메티오닌을 포함하는 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 대조군은 N-말단 메티오닌을 포함하지 않는 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 대조군은 실질적으로 온전한 N-말단을 가진 동일한 관심 있는 단백질 또는 폴리펩티드이다. 일부 실시양태에서, 발현되거나 생성된 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80% 내지 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80% 내지 약 85%, 약 80% 내지 약 90%, 약 80% 내지 약 92%, 약 80% 내지 약 94%, 약 80% 내지 약 95%, 약 80% 내지 약 96%, 약 80% 내지 약 97%, 약 80% 내지 약 98%, 약 80% 내지 약 99%, 약 80% 내지 약 100%, 약 85% 내지 약 90%, 약 85% 내지 약 92%, 약 85% 내지 약 94%, 약 85% 내지 약 95%, 약 85% 내지 약 96%, 약 85% 내지 약 97%, 약 85% 내지 약 98%, 약 85% 내지 약 99%, 약 85% 내지 약 100%, 약 90% 내지 약 92%, 약 90% 내지 약 94%, 약 90% 내지 약 95%, 약 90% 내지 약 96%, 약 90% 내지 약 97%, 약 90% 내지 약 98%, 약 90% 내지 약 99%, 약 90% 내지 약 100%, 약 92% 내지 약 94%, 약 92% 내지 약 95%, 약 92% 내지 약 96%, 약 92% 내지 약 97%, 약 92% 내지 약 98%, 약 92% 내지 약 99%, 약 92% 내지 약 100%, 약 94% 내지 약 95%, 약 94% 내지 약 96%, 약 94% 내지 약 97%, 약 94% 내지 약 98%, 약 94% 내지 약 99%, 약 94% 내지 약 100%, 약 95% 내지 약 96%, 약 95% 내지 약 97%, 약 95% 내지 약 98%, 약 95% 내지 약 99%, 약 95% 내지 약 100%, 약 96% 내지 약 97%, 약 96% 내지 약 98%, 약 96% 내지 약 99%, 약 96% 내지 약 100%, 약 97% 내지 약 98%, 약 97% 내지 약 99%, 약 97% 내지 약 100%, 약 98% 내지 약 99%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 약 80%, 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 약 100%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 적어도 약 80%, 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99%의 활성을 가진다. 일부 실시양태에서, 실질적으로 온전한 N-말단을 가진 관심 있는 단백질 또는 폴리펩티드는 대조군에 비해 최대 약 85%, 약 90%, 약 92%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99% 또는 약 100%의 활성을 가진다.
일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 5 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 0.2 g/ℓ, 약 0.1 g/ℓ 내지 약 0.3 g/ℓ, 약 0.1 g/ℓ 내지 약 0.4 g/ℓ, 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 0.6 g/ℓ, 약 0.1 g/ℓ 내지 약 0.7 g/ℓ, 약 0.1 g/ℓ 내지 약 0.8 g/ℓ, 약 0.1 g/ℓ 내지 약 0.9 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.3 g/ℓ, 약 0.2 g/ℓ 내지 약 0.4 g/ℓ, 약 0.2 g/ℓ 내지 약 0.5 g/ℓ, 약 0.2 g/ℓ 내지 약 0.6 g/ℓ, 약 0.2 g/ℓ 내지 약 0.7 g/ℓ, 약 0.2 g/ℓ 내지 약 0.8 g/ℓ, 약 0.2 g/ℓ 내지 약 0.9 g/ℓ, 약 0.2 g/ℓ 내지 약 1 g/ℓ, 약 0.2 g/ℓ 내지 약 2 g/ℓ, 약 0.2 g/ℓ 내지 약 3 g/ℓ, 약 0.3 g/ℓ 내지 약 0.4 g/ℓ, 약 0.3 g/ℓ 내지 약 0.5 g/ℓ, 약 0.3 g/ℓ 내지 약 0.6 g/ℓ, 약 0.3 g/ℓ 내지 약 0.7 g/ℓ, 약 0.3 g/ℓ 내지 약 0.8 g/ℓ, 약 0.3 g/ℓ 내지 약 0.9 g/ℓ, 약 0.3 g/ℓ 내지 약 1 g/ℓ, 약 0.3 g/ℓ 내지 약 2 g/ℓ, 약 0.3 g/ℓ 내지 약 3 g/ℓ, 약 0.4 g/ℓ 내지 약 0.5 g/ℓ, 약 0.4 g/ℓ 내지 약 0.6 g/ℓ, 약 0.4 g/ℓ 내지 약 0.7 g/ℓ, 약 0.4 g/ℓ 내지 약 0.8 g/ℓ, 약 0.4 g/ℓ 내지 약 0.9 g/ℓ, 약 0.4 g/ℓ 내지 약 1 g/ℓ, 약 0.4 g/ℓ 내지 약 2 g/ℓ, 약 0.4 g/ℓ 내지 약 3 g/ℓ, 약 0.5 g/ℓ 내지 약 0.6 g/ℓ, 약 0.5 g/ℓ 내지 약 0.7 g/ℓ, 약 0.5 g/ℓ 내지 약 0.8 g/ℓ, 약 0.5 g/ℓ 내지 약 0.9 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 3 g/ℓ, 약 0.6 g/ℓ 내지 약 0.7 g/ℓ, 약 0.6 g/ℓ 내지 약 0.8 g/ℓ, 약 0.6 g/ℓ 내지 약 0.9 g/ℓ, 약 0.6 g/ℓ 내지 약 1 g/ℓ, 약 0.6 g/ℓ 내지 약 2 g/ℓ, 약 0.6 g/ℓ 내지 약 3 g/ℓ, 약 0.7 g/ℓ 내지 약 0.8 g/ℓ, 약 0.7 g/ℓ 내지 약 0.9 g/ℓ, 약 0.7 g/ℓ 내지 약 1 g/ℓ, 약 0.7 g/ℓ 내지 약 2 g/ℓ, 약 0.7 g/ℓ 내지 약 3 g/ℓ, 약 0.8 g/ℓ 내지 약 0.9 g/ℓ, 약 0.8 g/ℓ 내지 약 1 g/ℓ, 약 0.8 g/ℓ 내지 약 2 g/ℓ, 약 0.8 g/ℓ 내지 약 3 g/ℓ, 약 0.9 g/ℓ 내지 약 1 g/ℓ, 약 0.9 g/ℓ 내지 약 2 g/ℓ, 약 0.9 g/ℓ 내지 약 3 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 3 g/ℓ, 또는 약 2 g/ℓ 내지 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ, 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ 또는 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 적어도 약 0.1 g/ℓ, 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ 또는 약 2 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 최대 약 0.2 g/ℓ, 약 0.3 g/ℓ, 약 0.4 g/ℓ, 약 0.5 g/ℓ, 약 0.6 g/ℓ, 약 0.7 g/ℓ, 약 0.8 g/ℓ, 약 0.9 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ 또는 약 3 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ 내지 약 0.5 g/ℓ, 약 0.1 g/ℓ 내지 약 1 g/ℓ, 약 0.1 g/ℓ 내지 약 2 g/ℓ, 약 0.1 g/ℓ 내지 약 5 g/ℓ, 약 0.1 g/ℓ 내지 약 10 g/ℓ, 약 0.1 g/ℓ 내지 약 15 g/ℓ, 약 0.1 g/ℓ 내지 약 20 g/ℓ, 약 0.1 g/ℓ 내지 약 25 g/ℓ, 약 0.1 g/ℓ 내지 약 30 g/ℓ, 약 0.1 g/ℓ 내지 약 40 g/ℓ, 약 0.1 g/ℓ 내지 약 50 g/ℓ, 약 0.5 g/ℓ 내지 약 1 g/ℓ, 약 0.5 g/ℓ 내지 약 2 g/ℓ, 약 0.5 g/ℓ 내지 약 5 g/ℓ, 약 0.5 g/ℓ 내지 약 10 g/ℓ, 약 0.5 g/ℓ 내지 약 15 g/ℓ, 약 0.5 g/ℓ 내지 약 20 g/ℓ, 약 0.5 g/ℓ 내지 약 25 g/ℓ, 약 0.5 g/ℓ 내지 약 30 g/ℓ, 약 0.5 g/ℓ 내지 약 40 g/ℓ, 약 0.5 g/ℓ 내지 약 50 g/ℓ, 약 1 g/ℓ 내지 약 2 g/ℓ, 약 1 g/ℓ 내지 약 5 g/ℓ, 약 1 g/ℓ 내지 약 10 g/ℓ, 약 1 g/ℓ 내지 약 15 g/ℓ, 약 1 g/ℓ 내지 약 20 g/ℓ, 약 1 g/ℓ 내지 약 25 g/ℓ, 약 1 g/ℓ 내지 약 30 g/ℓ, 약 1 g/ℓ 내지 약 40 g/ℓ, 약 1 g/ℓ 내지 약 50 g/ℓ, 약 2 g/ℓ 내지 약 5 g/ℓ, 약 2 g/ℓ 내지 약 10 g/ℓ, 약 2 g/ℓ 내지 약 15 g/ℓ, 약 2 g/ℓ 내지 약 20 g/ℓ, 약 2 g/ℓ 내지 약 25 g/ℓ, 약 2 g/ℓ 내지 약 30 g/ℓ, 약 2 g/ℓ 내지 약 40 g/ℓ, 약 2 g/ℓ 내지 약 50 g/ℓ, 약 5 g/ℓ 내지 약 10 g/ℓ, 약 5 g/ℓ 내지 약 15 g/ℓ, 약 5 g/ℓ 내지 약 20 g/ℓ, 약 5 g/ℓ 내지 약 25 g/ℓ, 약 5 g/ℓ 내지 약 30 g/ℓ, 약 5 g/ℓ 내지 약 40 g/ℓ, 약 5 g/ℓ 내지 약 50 g/ℓ, 약 10 g/ℓ 내지 약 15 g/ℓ, 약 10 g/ℓ 내지 약 20 g/ℓ, 약 10 g/ℓ 내지 약 25 g/ℓ, 약 10 g/ℓ 내지 약 30 g/ℓ, 약 10 g/ℓ 내지 약 40 g/ℓ, 약 10 g/ℓ 내지 약 50 g/ℓ, 약 15 g/ℓ 내지 약 20 g/ℓ, 약 15 g/ℓ 내지 약 25 g/ℓ, 약 15 g/ℓ 내지 약 30 g/ℓ, 약 15 g/ℓ 내지 약 40 g/ℓ, 약 15 g/ℓ 내지 약 50 g/ℓ, 약 20 g/ℓ 내지 약 25 g/ℓ, 약 20 g/ℓ 내지 약 30 g/ℓ, 약 20 g/ℓ 내지 약 40 g/ℓ, 약 20 g/ℓ 내지 약 50 g/ℓ, 약 25 g/ℓ 내지 약 30 g/ℓ, 약 25 g/ℓ 내지 약 40 g/ℓ, 약 25 g/ℓ 내지 약 50 g/ℓ, 약 30 g/ℓ 내지 약 40 g/ℓ, 약 30 g/ℓ 내지 약 50 g/ℓ, 또는 약 40 g/ℓ 내지 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 공정은 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 40 g/ℓ 또는 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 상기 공정은 적어도 약 0.1 g/ℓ, 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ 또는 약 40 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다. 일부 실시양태에서, 상기 공정은 최대 약 0.5 g/ℓ, 약 1 g/ℓ, 약 2 g/ℓ, 약 5 g/ℓ, 약 10 g/ℓ, 약 15 g/ℓ, 약 20 g/ℓ, 약 25 g/ℓ, 약 30 g/ℓ, 약 40 g/ℓ 또는 약 50 g/ℓ의 정확하게 처리된 주변세포질 또는 세포외 단백질을 생성한다.
일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5 내지 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5 내지 약 10, 약 5 내지 약 20, 약 5 내지 약 30, 약 5 내지 약 40, 약 5 내지 약 50, 약 5 내지 약 60, 약 5 내지 약 70, 약 5 내지 약 80, 약 5 내지 약 90, 약 5 내지 약 95, 약 5 내지 약 100, 약 10 내지 약 20, 약 10 내지 약 30, 약 10 내지 약 40, 약 10 내지 약 50, 약 10 내지 약 60, 약 10 내지 약 70, 약 10 내지 약 80, 약 10 내지 약 90, 약 10 내지 약 95, 약 10 내지 약 100, 약 20 내지 약 30, 약 20 내지 약 40, 약 20 내지 약 50, 약 20 내지 약 60, 약 20 내지 약 70, 약 20 내지 약 80, 약 20 내지 약 90, 약 20 내지 약 95, 약 20 내지 약 100, 약 30 내지 약 40, 약 30 내지 약 50, 약 30 내지 약 60, 약 30 내지 약 70, 약 30 내지 약 80, 약 30 내지 약 90, 약 30 내지 약 95, 약 30 내지 약 100, 약 40 내지 약 50, 약 40 내지 약 60, 약 40 내지 약 70, 약 40 내지 약 80, 약 40 내지 약 90, 약 40 내지 약 95, 약 40 내지 약 100, 약 50 내지 약 60, 약 50 내지 약 70, 약 50 내지 약 80, 약 50 내지 약 90, 약 50 내지 약 95, 약 50 내지 약 100, 약 60 내지 약 70, 약 60 내지 약 80, 약 60 내지 약 90, 약 60 내지 약 95, 약 60 내지 약 100, 약 70 내지 약 80, 약 70 내지 약 90, 약 70 내지 약 95, 약 70 내지 약 100, 약 80 내지 약 90, 약 80 내지 약 95, 약 80 내지 약 100, 약 90 내지 약 95, 약 90 내지 약 100, 또는 약 95 내지 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 약 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 95 또는 약 100이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 적어도 약 5, 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90 또는 약 95이다. 일부 실시양태에서, 정확하게 처리된 형태로 생성된 총 재조합 단백질 또는 폴리펩티드의 %는 최대 약 10, 약 20, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 약 95 또는 약 100이다.
분비 신호 펩티드에 융합된 재조합 단백질 및 폴리펩티드의 처리/절단 및 주변세포질 발현에 관한 참고문헌을 포함하는, 하기 특허 및 특허 출원은 그 전체가 본원에 참고로 포함된다: 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호 및 제9,580,719호(둘 다 발명의 명칭이 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임), 미국 특허 제9,453,251호("Expression of Mammalian Proteins in Pseudomonas fluorescens"), 미국 특허 제8,603,824호("Process for Improved Protein Expression by Strain Engineering"), 미국 특허 제8,530,171호("High Level Expression of Recombinant Toxin Proteins"), 및 미국 특허 출원 공개 제2019/0127744호("Bacterial Leader Sequences for Periplasmic Protein Expression").
실시양태에서, 분비 신호 서열은 서열번호 11로 제시된 분비 신호 펩티드와 동일하거나 실질적으로 동일하고/하거나, 서열번호 12로 제시된 폴리뉴클레오타이드 서열에 의해 코딩된다. 또 다른 실시양태에서, 분비 신호 서열은 서열번호 11의 적어도 아미노산 2-29를 포함한다. 또 다른 실시양태에서, 분비 신호 서열은 아미노 말단으로부터 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 10개의 아미노산이 절단되어 있으나 생물학적 활성, 즉 분비 신호 활성을 보유하는, 서열번호 11의 단편을 포함한다.
한 실시양태에서, 펩티드의 아미노산 서열은 주어진 원래 펩티드의 변이체이고, 이때 변이체의 서열은, 변이체가 원래 펩티드의 원하는 기능을 보유하는 한, 최대 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29% 또는 30% 포함하는, 원래 펩티드의 아미노산 잔기의 최대 또는 약 30%를 다른 아미노산 잔기(들)로 대체함으로써 수득될 수 있다. 실질적인 상동성을 가진 변이체 아미노산은 원래 펩티드와 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 적어도 약 99% 상동할 것이다. 변이체 아미노산 서열은 서열번호 11의 하나 이상의 아미노산의 아미노산 치환, 결실, 절단 및 삽입을 포함하는 다양한 방식으로 수득될 수 있다. 일부 실시양태에서, 변이체 아미노산 서열은 1개 내지 9개의 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합을 포함한다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1 내지 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 1 내지 6, 1 내지 7, 1 내지 8, 1 내지 9, 1 내지 10, 2 내지 3, 2 내지 4, 2 내지 5, 2 내지 6, 2 내지 7, 2 내지 8, 2 내지 9, 2 내지 10, 3 내지 4, 3 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 4 내지 5, 4 내지 6, 4 내지 7, 4 내지 8, 4 내지 9, 4 내지 10, 5 내지 6, 5 내지 7, 5 내지 8, 5 내지 9, 5 내지 10, 6 내지 7, 6 내지 8, 6 내지 9, 6 내지 10, 7 내지 8, 7 내지 9, 7 내지 10, 8 내지 9, 8 내지 10, 또는 9 내지 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 적어도 1, 2, 3, 4, 5, 6, 7, 8 또는 9이다. 일부 실시양태에서, 서열번호 11의 변이체에서 아미노산 치환, 결실, 삽입 또는 이들의 임의의 조합의 수는 최대 2, 3, 4, 5, 6, 7, 8, 9 또는 10이다.
"실질적으로 상동한", "실질적으로 동일한" 또는 "실질적으로 유사한"은 표준 파라미터를 사용하는, 본원에 기재되어 있거나 당분야에 알려져 있는 적합한 정렬 프로그램을 사용하여 기준 서열과 비교하였을 때 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 또는 더 큰 퍼센트의 서열 동일성을 가진 아미노산 또는 뉴클레오타이드 서열을 의미한다. 당업자는 코돈 축퇴성, 아미노산 유사성, 리딩 프레임 위치선정 등을 고려하여 2개의 뉴클레오타이드 서열에 의해 코딩된 단백질의 상응하는 동일성을 측정하기 위해 이들 값을 적절하게 조절할 수 있음을 인식할 것이다.
실시양태에서, 본 발명에 사용되는 분비 신호 펩티드는 "비필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "비필수" 아미노산 잔기는 원래 분비 신호 펩티드("유사체" 또는 "기준" 펩티드로서도 지칭됨)의 활성(예를 들어, 아고니스트 활성)을 제거하거나 실질적으로 감소시키지 않으면서 신규 아미노산 서열에서 변경, 예를 들어, 결실, 치환 또는 유도체화될 수 있는 잔기이다. 일부 실시양태에서, 분비 신호 펩티드는 "필수" 아미노산 잔기의 하나 이상의 변형을 포함할 수 있다. 이와 관련하여, "필수" 아미노산 잔기는 신규 아미노산 서열에서 변경, 예를 들어, 결실, 치환 또는 유도체화될 때 기준 펩티드의 활성을 실질적으로 감소시키거나 제거하는 잔기이다. 필수 아미노산 잔기가 변경되는 이러한 실시양태에서, 변형된 분비 신호 펩티드는 원래 분비 신호의 활성을 가질 수 있다. 치환, 삽입 및 결실은 N-말단 또는 C-말단에 있을 수 있거나, 분비 신호의 내부 부분에 있을 수 있다. 예를 들어, 분비 신호 펩티드는 분비 신호 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 치환을 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환과 함께, 마찬가지로 분비 신호 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 삽입을 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환 및/또는 삽입과 함께, 펩티드 전체에 걸쳐 연속적인 방식으로 또는 간격을 두고 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 결실도 포함할 수 있다. 분비 신호 펩티드는 단독으로 또는 치환, 삽입 및/또는 결실과 함께, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 아미노산 추가도 포함할 수 있다.
치환은 보존적 아미노산 치환을 포함한다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄 또는 물리화학적 특성(예를 들어, 정전기적, 수소 결합, 등배체, 소수성 특징)을 가진 아미노산 잔기로 대체되는 치환이다. 아미노산은 천연 생성 아미노산 또는 비천연 아미노산일 수 있다. 유사한 측쇄를 가진 아미노산 잔기의 계열이 당분야에 알려져 있다. 이 계열은 염기성 측쇄를 가진 아미노산(예를 들어, 라이신, 아르기닌, 히스티딘), 산성 측쇄를 가진 아미노산(예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄를 가진 아미노산(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 메티오닌, 시스테인), 비극성 측쇄를 가진 아미노산(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 트립토판), β-분지된 측쇄를 가진 아미노산(예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄를 가진 아미노산(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다. 치환은 비보존적 변경도 포함할 수 있다.
본원에 포함된 관심 있는 변이체 단백질 또는 폴리펩티드는 생물학적 활성을 가진다. 즉, 이들은 관심 있는 원래 단백질 또는 폴리펩티드의 원하는 생물학적 활성을 계속 보유하며; 예를 들어, 변이체 분비 리더 펩티드는 분비 신호 활성을 보유한다. "활성을 보유한다"는 변이체가 원래 펩티드, 단백질 또는 폴리펩티드의 약 또는 적어도 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200%, 또는 더 큰 퍼센트의 활성, 예를 들어, 분비 신호 활성을 가질 것임을 의미한다.
폴리뉴클레오타이드
본 개시내용은 관심 있는 단백질 또는 폴리펩티드를 그람 음성 박테리아의 주변세포질 또는 세포외 공간으로 표적화하는 데 유용한 신규 분비 신호를 코딩하는 서열을 가진 핵산도 포함한다. 한 실시양태에서, 단리된 폴리뉴클레오타이드는 Slmt 분비 신호 펩티드와 실질적으로 상동한 펩티드 서열을 코딩한다. 또 다른 실시양태에서, 본 개시내용은 서열번호 11의 적어도 아미노산 2-29와 실질적인 서열 동일성을 가진 펩티드 서열을 코딩하는 핵산을 제공하거나, 서열번호 12로 제시된 뉴클레오타이드 서열과 실질적인 서열 동일성을 가진 핵산을 제공하고, 이들의 생물학적 활성 변이체 및 단편을 포함한다. 또 다른 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 또는 약 또는 적어도 약 99%, 또는 더 큰 퍼센트의 동일성을 가진다.
실시양태에서, 본원의 분비 신호 펩티드는 서열번호 12로 제시된 뉴클레오타이드 서열과 실질적으로 동일한 뉴클레오타이드 서열에 의해 코딩된다. 본 발명의 분비 신호 서열과 실질적인 동일성을 가진 상응하는 분비 신호 펩티드 서열은 당분야에 알려져 있거나 문헌에 기재되어 있는 임의의 적절한 방법, 예를 들어, PCR, 하이브리드화 방법을 이용함으로써 확인될 수 있다. 예를 들어, 문헌[Sambrook J., and Russell, D.W., 2001, Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY; and Innis, et al., 1990, PCR Protocols: A Guide to Methods and Applications; Academic Press, NY]을 참조한다. 변이체 뉴클레오타이드 서열은 예를 들어, 부위 지정 돌연변이유발을 이용함으로써 생성된 합성 유래 뉴클레오타이드 서열을 포함할 수 있다. 실시양태에서, 돌연변이된 서열은 본원에 개시된 분비 신호 펩티드를 여전히 코딩한다. 변이체 분비 신호 펩티드는 생물학적 활성을 갖고 있다. 즉, 이 펩티드는 천연 단백질의 원하는 생물학적 활성을 계속 보유한다. 즉, 이 펩티드는 분비 신호전달 활성을 보유한다. "활성을 보유한다"는 변이체가 원래 분비 신호 펩티드의 약 30%, 약 또는 적어도 약 35%, 약 또는 적어도 약 40%, 약 또는 적어도 약 45%, 약 또는 적어도 약 50%, 약 또는 적어도 약 55%, 약 또는 적어도 약 60%, 약 또는 적어도 약 65%, 약 또는 적어도 약 70%, 약 또는 적어도 약 75%, 약 또는 적어도 약 80%, 약 또는 적어도 약 85%, 약 또는 적어도 약 81%, 약 또는 적어도 약 82%, 약 또는 적어도 약 83%, 약 또는 적어도 약 84%, 약 또는 적어도 약 85%, 약 또는 적어도 약 86%, 약 또는 적어도 약 87%, 약 또는 적어도 약 88%, 약 또는 적어도 약 89%, 약 또는 적어도 약 90%, 약 또는 적어도 약 91%, 약 또는 적어도 약 92%, 약 또는 적어도 약 93%, 약 또는 적어도 약 94%, 약 또는 적어도 약 95%, 약 또는 적어도 약 96%, 약 또는 적어도 약 97%, 약 또는 적어도 약 98%, 약 또는 적어도 약 99%, 약 또는 적어도 약 100%, 약 또는 적어도 약 110%, 약 또는 적어도 약 125%, 약 또는 적어도 약 150%, 약 또는 적어도 약 200%, 또는 더 큰 퍼센트의 활성을 가질 것임을 의미한다. 임의의 적절한 방법을 이용하여 펩티드, 단백질 또는 폴리펩티드 활성, 예를 들어, 분비 신호 활성을 측정할 수 있다. 이러한 방법은 당분야에 잘 알려져 있고, 이의 예는 본원에 논의되어 있다.
숙련된 당업자는 일부 경우 변화가 돌연변이에 의해 본원에서 제공된 뉴클레오타이드 서열에 도입됨으로써, 분비 신호 펩티드의 생물학적 활성을 변경시키지 않으면서, 코딩된 분비 신호 펩티드의 아미노산 서열의 변화로 이어진다는 것도 인식할 것이다. 따라서, 변이체 단리된 핵산 분자는 하나 이상의 아미노산 치환, 추가 또는 결실이 코딩된 단백질에 도입되도록 하나 이상의 뉴클레오타이드 치환, 추가 또는 결실을 본원에 개시된 상응하는 뉴클레오타이드 서열에 도입함으로써 종종 생성된다. 돌연변이는 당업자에게 알려져 있는 임의의 표준 기법, 예를 들어, 부위 지정 돌연변이유발 및 PCR 매개 돌연변이유발에 의해 도입될 수 있다.
핵산 및 아미노산 서열 동일성 또는 상동성은 본원에 기재된 방법들을 포함하나 이들로 제한되지 않는, 당분야에 알려져 있는 임의의 적합한 방법에 따라 측정될 수 있다.
일부 경우, 본원의 방법은 Slmt 분비 신호 서열, 또는 서열번호 11로서 본원에 개시된 분비 신호 펩티드 서열과 실질적으로 상동하거나 유사한 서열로 구성된 군으로부터 선택된 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 폴리펩티드를 발현시키는 단계를 포함한다. 실시양태에서, 분비 신호 펩티드 서열은 서열번호 12로 제시된 뉴클레오타이드 서열에 의해 코딩된다. 일부 실시양태에서, 발현 구축물은 슈도모나드 숙주 세포에 존재한다. 일부 경우, 발현 구축물은 플라스미드이다. 일부 실시양태에서, 관심 있는 폴리펩티드 또는 단백질을 코딩하는 플라스미드는 선택 마커를 포함하고, 플라스미드를 유지하는 숙주 세포는 선택 조건 하에서 생장한다. 일부 실시양태에서, 플라스미드는 선택 마커를 포함하지 않는다. 일부 실시양태에서, 발현 구축물은 숙주 세포 게놈에 통합된다.
본 발명은 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드를 생성하기 위한 발현 구축물을 포함한다. 발현 구축물은 관심 있는 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열을 포함할 수 있다. 일부 실시양태에서, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열은 서열번호 12로 제시된 핵산 서열과 동일하거나 실질적으로 동일한 서열을 가진다. 일부 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 가진다.
발현 벡터는 관심 있는 단백질 또는 폴리펩티드를 코딩하는 핵산 서열에 작동 가능하게 연결된, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열을 포함하는 발현 구축물을 포함할 수 있다. 일부 실시양태에서, 서열번호 11로 제시된 아미노산 서열과 동일하거나 실질적으로 동일한 분비 신호 펩티드를 코딩하는 핵산 서열은 서열번호 12로 제시된 핵산 서열과 동일하거나 실질적으로 동일한 서열을 가진다. 일부 실시양태에서, 핵산 서열은 서열번호 12로 제시된 핵산 서열과 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 가진다.
슈도모나스 숙주 균주를 비롯한 숙주 균주에서 본 발명의 방법에 유용한 조절 서열(예를 들어, 프로모터, 분비 리더 및 리보좀 결합 부위)을 포함하는 이종 단백질을 발현시키는 방법은 본원 전체에 개시된 바와 같이 이용될 수 있다. 이러한 방법은 당분야에 알려져 있으며, 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제7,618,799호("Bacterial leader sequences for increased expression"), 미국 특허 제7,985,564호("Expression systems with Sec-system secretion"), 미국 특허 제9,394,571호 및 제9,580,719호(이들 둘 다의 발명의 명칭은 "Method for Rapidly Screening Microbial Hosts to Identify Certain Strains with Improved Yield and/or Quality in the Expression of Heterologous Proteins"임), 미국 특허 제9,458,487호 및 제9,453,251호(이들 둘 다의 발명의 명칭은 "Expression of mammalian proteins in Pseudomonas fluorescens"임), 미국 특허 제8,603,824호("Process for Improved Protein Expression by Strain Engineering"), 및 미국 특허 제8,530,171호("High Level Expression of Recombinant Toxin Proteins")에 기재되어 있다. 실시양태에서, 본 발명과 관련하여 사용된 분비 리더는 미국 특허 제7,618,799호, 미국 특허 제7,985,564호, 미국 특허 제9,394,571호, 미국 특허 제9,580,719호, 미국 특허 제9,453,251호, 미국 특허 제8,603,824호 및 미국 특허 제8,530,171호 중 임의의 특허에 개시된 바와 같은 분비 리더이다. 이 특허들은 또한 이종 단백질 발현을 증가시키기 위해 폴딩 조절인자를 과발현하도록 조작되었거나 프로테아제 돌연변이가 도입되어 있는, 본원의 방법을 실시하는 데 유용한 박테리아 숙주 균주도 설명한다. 실시양태에서, 본 발명의 방법에 사용되는 발현 숙주 세포는 본원에 기재된 임의의 발현 숙주 세포이다.
예시적인 실시양태
1. 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포로서,
(a) 제1 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성이 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍이 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
(b) 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성이 뮤레인 DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍이 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되는 것인 재조합 그람 음성 박테리아 숙주 세포.
2. 실시양태 1에 있어서, 추가로
(c) 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 이때 추가 프로테아제 활성의 결핍이 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 상기 추가 프로테아제가 (a) 및 (b)의 프로테아제와 상이하거나;
(d) 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 이때 자가용해 인자 활성의 결핍이 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되거나;
(e) 하나 이상의 불활성화된 프로테아제를 과발현하거나;
(f) 하나 이상의 폴딩 조절인자를 과발현하거나;
(g) (c), (d), (e) 및 (f)의 임의의 조합을 나타내는 재조합 그람 음성 박테리아 숙주 세포.
3. 실시양태 1 또는 2에 있어서, 꼬리 특이적 프로테아제 활성의 결핍이 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
4. 실시양태 1 내지 3 중 어느 한 실시양태에 있어서, 뮤레인 DD-엔도펩티다제 활성의 결핍이
(i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
(iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및
(iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질
중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
5. 실시양태 2 내지 4 중 어느 한 실시양태에 있어서, (c)의 숙주 세포는 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있거나; (d)의 숙주 세포는 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있거나; (e)의 숙주 세포는 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하고, 이때 각각의 불활성화된 프로테아제는 상이하거나; (f)의 숙주 세포는 1개 내지 10개의 상이한 폴딩 조절인자를 과발현하거나, 이들의 임의의 조합이 이루어진 것인 재조합 그람 음성 박테리아 숙주 세포.
6. 실시양태 2 내지 5 중 어느 한 실시양태에 있어서,
(c)의 하나 이상의 추가 프로테아제 활성의 결핍이 세랄라이신 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제, 헤모라이신 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제, AAA+ 패밀리 단백질용해 기구, 및 (a)와 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (d)의 하나 이상의 자가용해 인자 활성의 결핍이 S형 피오신, 선형 그라미시딘 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신 및 포린으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고; (e)의 하나 이상의 불활성화된 프로테아제가 돌연변이체 주변세포질 세린 엔도프로테아제이고; (f)의 하나 이상의 폴딩 조절인자가 디설파이드 이소머라제인 재조합 그람 음성 박테리아 숙주 세포.
7. 실시양태 6에 있어서, 세랄라이신 전구체가
서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 및 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질
로부터 선택되고;
막 국소화 프로테아제가 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고;
뮤레인 L,D 트랜스펩티다제가 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고;
헤모라이신 전구체가 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고;
D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체가 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고;
주변세포질 세린 엔도프로테아제가
서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질;
서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질;
서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질
로부터 선택되고;
AAA+ 패밀리 단백질용해 기구가 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고;
뮤레인 DD-엔도펩티다제가
서열번호 3으로 제시된 아미노산 서열을 가진 슈도모나스 플루오레센스 MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질
로부터 선택되고;
S형 피오신이 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고;
선형 그라미시딘 합성효소가 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고;
류코톡신이 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고;
ShlB 헤모라이신 수송체가 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고;
하나 이상의 과발현된 불활성화된 프로테아제 각각이 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고;
하나 이상의 폴딩 조절인자 각각이 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 한 서열번호로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 한 서열번호로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
8. 상기 실시양태들 중 임의의 실시양태에 있어서, 돌연변이가 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이가 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
9. 실시양태 8에 있어서, (iii)의 미스센스 돌연변이가 보존적 또는 비보존적 아미노산 치환을 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
10. 실시양태 8 또는 9에 있어서, 비코딩 서열이 조절 서열인 재조합 그람 음성 박테리아 숙주 세포.
11. 상기 실시양태들 중 임의의 실시양태에 있어서, 기능성 프로테아제 활성을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포로서, 기능성 프로테아제 활성이 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
12. 상기 실시양태들 중 임의의 실시양태에 있어서, 기능성 프로테아제 활성을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포로서, 기능성 프로테아제 활성이 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질인 재조합 그람 음성 박테리아 숙주 세포.
13. 실시양태 11 또는 12에 있어서, 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
14. 상기 실시양태들 중 임의의 실시양태에 있어서, 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포로서, 제1 프로테아제 활성의 결핍이 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
15. 상기 실시양태들 중 임의의 실시양태에 있어서, 제2 프로테아제 활성이 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된 것인 재조합 그람 음성 박테리아 숙주 세포.
16. 상기 실시양태들 중 임의의 실시양태에 있어서, 제2 프로테아제 활성의 결핍이 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이가 (i) 서열번호 1의 잔기 134 내지 145 중 어느 하나 이상의 잔기; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상의 잔기; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상의 잔기; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
17. 상기 실시양태들 중 임의의 실시양태에 있어서, 슈도모나스 플루오레센스인 재조합 그람 음성 박테리아 숙주 세포로서, 제2 프로테아제 활성의 결핍이 Y248stop, G332S, D334N, A337T, H411Y, P410L로부터 선택된 서열번호 1의 아미노산 치환, 및 R319, H330, D334, H378 및 H411 중 어느 하나의 임의의 보존적 또는 비보존적 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
18. 상기 실시양태들 중 임의의 실시양태에 있어서, 배양물에서 고밀도 세포 생장을 할 수 있는 재조합 그람 음성 박테리아 숙주 세포.
19. 실시양태 18에 있어서, 배양물에서의 고밀도 세포 생장이 약 80 내지 약 300의 OD575까지의 생장을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
20. 실시양태 18 또는 19에 있어서, 배양물에서의 고밀도 세포 생장이 대조군 세포에 비해 약 2배 내지 약 15배 증가되는 것인 재조합 그람 음성 박테리아 숙주 세포.
21. 실시양태 20에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
22. 실시양태 21에 있어서, 2(c)의 추가 프로테아제 활성이 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
23. 상기 실시양태들 중 임의의 실시양태에 있어서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 각각 포함하는 적어도 하나의 발현 구축물을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
24. 실시양태 23에 있어서, 관심 있는 재조합 단백질이 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 또는 이종 단백질인 재조합 그람 음성 박테리아 숙주 세포.
25. 실시양태 23에 있어서, 관심 있는 재조합 단백질이 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
26. 실시양태 23 내지 25 중 어느 한 실시양태에 있어서, 관심 있는 재조합 단백질이 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질인 재조합 그람 음성 박테리아 숙주 세포.
27. 실시양태 25 또는 26에 있어서, 항체, 항체 단편 또는 이의 유도체가 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 트리바디; 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
28. 실시양태 27에 있어서, VHH 함유 항체가 VHH 연쇄 항체인 재조합 그람 음성 박테리아 숙주 세포.
29. 실시양태 25 내지 28 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
30. 실시양태 25 내지 29 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 Fab'인 재조합 그람 음성 박테리아 숙주 세포.
31. 실시양태 30에 있어서, Fab'가 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
32. 실시양태 25 내지 31 중 어느 한 실시양태에 있어서, 항체, 항체 단편, 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄가 전체 길이 또는 중쇄 단편이고, 경쇄가 전체 길이 또는 경쇄 단편인 재조합 그람 음성 박테리아 숙주 세포.
33. 실시양태 32에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
34. 실시양태 32 또는 33에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 동일한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
35. 실시양태 32 또는 33에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 상이한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
36. 실시양태 34 또는 35에 있어서, 중쇄 코딩 핵산 서열 각각 및 경쇄 코딩 핵산 서열 각각이 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
37. 실시양태 36에 있어서, 주변세포질 분비 신호가 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
38. 실시양태 34 내지 37 중 어느 한 실시양태에 있어서, 발현 구축물이 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
39. 실시양태 25 내지 38 중 어느 한 실시양태에 있어서, 항체, 항체 단편 또는 이의 유도체가 인간화된 것인 재조합 그람 음성 박테리아 숙주 세포.
40. 실시양태 30 내지 39 중 어느 한 실시양태에 있어서, Fab'가 세르톨리주맙인 재조합 그람 음성 박테리아 숙주 세포.
41. 실시양태 40에 있어서, Fab' 중쇄가 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄가 서열번호 23으로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
42. 실시양태 32 내지 41 중 어느 한 실시양태에 있어서, 중쇄를 코딩하는 핵산 서열이 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열이 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
43. 실시양태 1 내지 42 중 어느 한 실시양태에 있어서,
(i) 제1 프로테아제 활성;
(ii) 제2 프로테아제 활성;
(iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성;
(iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및
(v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질
이 결핍된 재조합 그람 음성 박테리아 숙주 세포.
44. 실시양태 43에 있어서, 외인성 불활성화된 DegP를 추가로 과발현하는 재조합 그람 음성 박테리아 숙주 세포로서, 불활성화된 DegP가 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 위치 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 위치의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
45. 실시양태 43 또는 44에 있어서, 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제; 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현하는 재조합 그람 음성 박테리아 숙주 세포.
46. 실시양태 1 내지 45 중 어느 한 실시양태에 있어서, 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오 숙주 세포로부터 선택된 재조합 그람 음성 박테리아 숙주 세포.
47. 실시양태 46에 있어서, 슈도모나스 숙주 세포가 슈도모나스 숙주 세포인 재조합 그람 음성 박테리아 숙주 세포.
48. 실시양태 47에 있어서, 슈도모나스 숙주 세포가 슈도모나스 플루오레센스, 슈도모나스 푸티다 또는 슈도모나스 에루기노사인 재조합 그람 음성 박테리아 숙주 세포.
49. 실시양태 47 또는 48에 있어서,
(i) lsc::lacIQ1;
(ii) Prc1-;
(ii) Prc2-;
(iii) HslU-;
(iv) HslV-;
(v) MepM1-;
(vi) PyrF-; 및
(vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍
을 나타내는 재조합 그람 음성 박테리아 숙주 세포로서, 세랄라이신 전구체 결핍이 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
50. 실시양태 49에 있어서, 슈도모나스 플루오레센스인 재조합 그람 음성 박테리아 숙주 세포로서, Prc1이 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2가 서열번호 35로 제시된 아미노산 서열을 갖고, HslU가 서열번호 37로 제시된 아미노산 서열을 갖고, HslV가 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1이 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체가 서열번호 9로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
51. 실시양태 50에 있어서, DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
52. 실시양태 50 또는 51에 있어서, 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
53. 실시양태 1 내지 52 중 어느 한 실시양태에 있어서, 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
54. 실시양태 53에 있어서, 발현 벡터가 Fab'를 코딩하는 것인 재조합 그람 음성 박테리아 숙주 세포.
55. 실시양태 54에 있어서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터가 Fab'를 코딩하는 핵산 서열을 추가로 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
56. 실시양태 54 또는 55에 있어서, Fab' 중쇄가 서열번호 21에 의해 코딩되고, Fab' 경쇄가 서열번호 23에 의해 코딩되는 것인 재조합 그람 음성 박테리아 숙주 세포.
57. 실시양태 1에 있어서, 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
58. 실시양태 57에 있어서, 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 발현 구축물 또는 구축물들을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
59. (a) 적합한 발효 조건 하에서 배양된 실시양태 1 내지 57 중 어느 한 실시양태의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하는 관심 있는 재조합 단백질의 제조 방법으로서, 상기 재조합 그람 음성 숙주 세포가 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드에 의해 형질전환된 것인 방법.
60. 실시양태 59에 있어서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사가 유도성 프로모터에 의해 조절되는 것인 방법.
61. 실시양태 60에 있어서, 유도성 프로모터가 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택되는 것인 방법.
62. 실시양태 59 내지 61 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 높은 세포 밀도까지 생장할 수 있는 것인 방법.
63. 실시양태 62에 있어서, 높은 세포 밀도가 약 80 내지 약 300의 OD575를 포함하는 것인 방법.
64. 실시양태 58 내지 63 중 어느 한 실시양태에 있어서, 적합한 발효 조건이 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함하는 것인 방법.
65. 실시양태 64에 있어서, 유도성 프로모터를 IPTG로 유도하고, IPTG를 약 0.08 내지 0.3 mM의 최종 농도로 첨가하는 것인 방법.
66. 실시양태 65에 있어서, IPTG를 약 0.2 mM의 최종 농도로 첨가하는 것인 방법.
67. 실시양태 63 내지 66 중 어느 한 실시양태에 있어서, 유도를 약 6.0 내지 약 6.5의 배양 pH에서 수행하는 것인 방법.
68. 실시양태 63 내지 67 중 어느 한 실시양태에 있어서, 유도를 약 28℃ 내지 33℃의 온도에서 수행하는 것인 방법.
69. 실시양태 68에 있어서, 유도를 약 32℃의 온도에서 수행하는 것인 방법.
70. 실시양태 59 내지 69 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도까지 생장하는 것인 방법.
71. 실시양태 70에 있어서, 세포 밀도의 증가가 약 2배 내지 약 15배인 방법.
72. 실시양태 59 내지 71 중 어느 한 실시양태에 있어서, (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
73. 실시양태 72에 있어서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율이 약 0.1 내지 약 10 g/ℓ인 방법.
74. 실시양태 72 또는 73에 있어서, (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합 형태인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
75. 실시양태 74에 있어서, (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함하는 방법.
76. 실시양태 75에 있어서, 단계 (b)에서 측정된 수율이 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높은 것인 방법.
77. 실시양태 70 내지 76 중 어느 한 실시양태에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
(i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
(ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
(iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
로부터 선택되는 것인 방법.
78. 실시양태 1 내지 45 중 어느 한 실시양태, 또는 실시양태 47 내지 77 중 어느 한 실시양태에 있어서, 이. 콜라이가 아닌 재조합 그람 음성 박테리아 숙주 세포.
79. 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드로서, 상기 분비 신호 펩티드가 서열번호 11로 제시된 아미노산 서열을 가진 것인 재조합 폴리펩티드.
80. 실시양태 79에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 재조합 폴리펩티드.
81. 실시양태 79 또는 80에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 재조합 폴리펩티드.
82. 실시양태 80 또는 81에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 재조합 폴리펩티드.
83. 실시양태 80에 있어서, 효소가 치료 효소인 재조합 폴리펩티드.
84. 실시양태 83에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 재조합 폴리펩티드.
85. 실시양태 80에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 재조합 폴리펩티드.
86. 실시양태 79 내지 85 중 어느 한 실시양태에 있어서, 링커를 추가로 포함하는 재조합 폴리펩티드.
87. 실시양태 79 내지 86 중 어느 한 실시양태에 있어서, 절단 도메인을 추가로 포함하는 재조합 폴리펩티드.
88. 실시양태 79 내지 87 중 어느 한 실시양태에 있어서, 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도하는 것인 재조합 폴리펩티드.
89. 실시양태 88에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 재조합 폴리펩티드.
90. 실시양태 88에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 재조합 폴리펩티드.
91. 실시양태 89에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 재조합 폴리펩티드.
92. 실시양태 90에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 재조합 폴리펩티드.
93. 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 단계를 포함하는, 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 방법으로서, 상기 원핵 숙주 세포가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 상기 분비 신호 펩티드가 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아닌 것인 방법.
94. 실시양태 93에 있어서, 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함하는 방법.
95. 실시양태 94에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 방법.
96. 실시양태 95에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 방법.
97. 실시양태 95 또는 96에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 방법.
98. 실시양태 95에 있어서, 효소가 치료 효소인 방법.
99. 실시양태 98에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 방법.
100. 실시양태 95에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 방법.
101. 실시양태 93 내지 100 중 어느 한 실시양태에 있어서, 핵산이 링커를 코딩하는 것인 방법.
102. 실시양태 101에 있어서, 링커가 절단 도메인을 포함하는 것인 방법.
103. 실시양태 93 내지 102 중 어느 한 실시양태에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 방법.
104. 실시양태 93 내지 102 중 어느 한 실시양태에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 방법.
105. 실시양태 93에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 방법.
106. 실시양태 94에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 방법.
107. 실시양태 79 내지 92 중 어느 한 실시양태의 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터.
108. 실시양태 107의 발현 벡터를 포함하는 원핵 숙주 세포.
109. 실시양태 108에 있어서, 그람 음성 박테리아인 원핵 숙주 세포.
110. 실시양태 108에 있어서, 그람 양성 박테리아인 원핵 숙주 세포.
111. 실시양태 109에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 원핵 숙주 세포.
112. 실시양태 110에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 원핵 숙주 세포.
113. 실시양태 108 내지 112 중 어느 한 실시양태에 있어서, 재조합 폴리펩티드를 코딩하는 핵산 서열이 원핵 숙주 세포에서 발현되도록 최적화된 것인 원핵 숙주 세포.
114. 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 실시양태 79 내지 92 중 어느 한 실시양태의 재조합 폴리펩티드, 실시양태 107의 발현 벡터, 또는 실시양태 108 내지 113 중 어느 한 실시양태의 원핵 숙주 세포의 용도.
본 발명의 바람직한 실시양태가 본원에 제시되고 설명되었지만, 이러한 실시양태가 단지 예로서 제공된다는 것은 당업자에게 자명할 것이다. 다수의 변경, 변화 및 치환이 본 발명을 벗어나지 않으면서 당업자에게 인식될 것이다. 본원에 기재된 본 발명의 실시양태의 다양한 대안이 본 발명을 실시하는 데 사용될 수 있다는 것을 이해해야 한다. 하기 청구범위는 본 발명의 범위를 정의하고, 이 청구범위 내의 방법과 구조 및 이들의 등가물은 이에 의해 커버된다.
실시예
하기 실시예는 본 개시내용의 다양한 실시양태를 예시할 목적으로 제공되며 어떤 방식으로든 본 개시내용을 제한하기 위한 것이 아니다. 본원에 기재된 방법과 함께 본 실시예는 현재 대표적인 실시양태이고, 예시하는 것이며, 범위를 제한하고자 하는 것이 아니다. 청구범위에 의해 정의된 본 개시내용의 사상 내에 포함되는 변경 및 다른 용도는 당업자에게 인식될 것이다.
실시예 1. 프로테아제 결핍 박테리아 숙주 세포에서의 재조합 단백질 발현
온전한 재조합 단백질의 생성을 위한 프로테아제 결핍 숙주 세포 균주의 스크리닝을 0.5 ㎖ 규모로 수행하였다. 15개의 상이한 프로테아제 결핍 슈도모나스 플루오레센스 균주들 각각에서, 10개의 항-TNF Fab'(세르톨리주맙) 과발현 플라스미드 각각을 시험하였다. 10개의 과발현 플라스미드(구축물 1 내지 10) 각각은 동일한 프로모터인 Ptac의 조절 하에 항-TNF-알파 Fab' 중쇄(HC, 서열번호 22에 의해 코딩되는 서열번호 21) 및 항-TNF-알파 Fab' 경쇄(LC, 서열번호 24에 의해 코딩되는 서열번호 23)를 코딩하는 발현 구축물을 함유하였다. 구축물 1 내지 9 각각은 5'에서 3'으로, 리더 1(L1) - HC(서열번호 22에 의해 코딩되는 서열번호 21) - 리더 2(L2) - LC(서열번호 24에 의해 코딩되는 서열번호 23) - DsbC(서열번호 79에 의해 코딩되는 서열번호 60)(공-전사 슈도모나스 플루오레센스 DsbC 단백질 디설파이드 이소머라제)를 코딩하는 서열을 가진 발현 구축물을 포함하는 플라스미드를 함유하였다. 구축물 10은 DsbC를 공-발현하지 않는 p688-005를 함유하였다. 구축물 1 내지 9처럼, 구축물 10은 5'에서 3'으로, 리더 1(L1) - HC(HC, 서열번호 22에 의해 코딩되는 서열번호 21) - 리더 2(L2) - LC(서열번호 24에 의해 코딩되는 서열번호 23)를 코딩하는 서열을 포함하였다. 상기 10개의 플라스미드는 분비 신호 서열의 차이와 구축물 10에 대해 언급된 차이를 제외하고는 동일하였다. 구축물 1 내지 9 각각에서, L1은 상이한 분비 신호이었고; 구축물 3과 10은 동일한 분비 신호를 가졌다. 구축물 1 내지 10 각각에서, L2는 Azu 주변세포질 분비 신호(서열번호 14에 의해 코딩되는 서열번호 13)이었다. 구축물 8에서, L1은 Slmt 분비 신호(서열번호 12에 의해 코딩되는 서열번호 11)이었다. 경쇄 및 중쇄 유전자 각각은 시작 코돈의 업스트림에서 높은 번역 효율의 리보좀 결합 서열(정규 샤인-달가노(Shine-Dalgarno) 서열의 활성의 100%를 가짐, 서열번호 59)을 포함하였다.
발현 플라스미드를 어레이 형식으로 슈도모나스 플루오레센스 숙주 균주에 형질전환시켰다. 슈도모나스 플루오레센스 형질전환능 세포와 플라스미드 DNA를 혼합함으로써 형질전환 반응을 시작하였다. 혼합물의 25 ㎕ 분취액을 96-멀티웰 Nucleovette® 플레이트(Lonza)로 옮겼다. Nucleofector™ 96-웰 Shuttle™ 시스템(Lonza AG)을 사용하여 전기천공을 수행한 후, 전기천공된 세포를, 1% 글루코스 배지로 보충된 500 ㎕ M9 염 및 미량 원소가 함유된 새로운 96-웰 딥 웰 플레이트로 옮겼다. 플레이트를 48시간 동안 진탕시키면서 30℃에서 인큐베이션하여, 시드(seed) 배양물을 생성하였다.
시드 배양물의 10 ㎕ 분취액을 96-웰 딥 웰 플레이트에 이중으로 옮겼다. 각각의 웰은 미량 원소 및 5% 글리세롤로 보충된 500 ㎕의 HTP-YE 배지(Teknova)를 함유하였다. 글리세롤로 보충된 HTP 배지에 플레이팅된 시드 배양물을 30℃의 진탕기에서 24시간 동안 인큐베이션하였다. 이소프로필-β-D-1-티오갈락토피라노사이드(IPTG)를 0.3 mM의 최종 농도로 각각의 웰에 첨가하여 Fab'의 발현을 유도하였다. 24시간의 유도 후, 600 nm에서 광학 밀도(OD600)를 측정하여 세포 밀도를 계산하였다. 그 후, 세포를 수거하고 400 ㎕의 최종 부피까지 1X 인산염 완충 식염수(PBS)로 1:3 희석하고, 추후 처리를 위해 냉동시켰다.
분석적 특징규명을 위한 가용성 용해물 샘플 준비 : 수거된 세포 샘플을 희석하고 24 프로브 팁 호른(tip horn)을 사용하여 세포 용해 자동화 초음파처리 시스템(CLASS, Scinomix)으로 초음파처리함으로써 용해시켰다. 용해물을 8℃에서 5,500 x g로 15분 동안 원심분리하였다. 상청액을 모아 가용성 분획으로서 표지하였다. 펠릿을 모으고, 또 다른 라운드의 초음파처리로 400 ㎕의 1X PBS(pH 7.4)에 재현탁하고 불용성 분획으로서 표지하였다.
비환원 SDS-CGE 분석 : HT 단백질 익스프레스(Protein Express) v2 칩 및 상응하는 시약(각각 제품 번호 760499 및 760328, Caliper LifeSciences)과 함께 LabChip GXII 기기(Caliper LifeSciences)를 사용하여 HTP 마이크로칩 SDS 모세관 겔 전기영동으로 가용성 분획 및 불용성 분획을 분석하였다. 샘플을 제조업체의 프로토콜(단백질 사용자 가이드 문서 번호 450589, Rev. 3)에 따라 준비하였다. 요약하건대, 가용성 또는 불용성 분획 샘플의 4 ㎕ 분취액을 95℃에서 5분 동안 가열된 96-웰 폴리프로필렌 원뿔형 웰 PCR 플레이트에서 14 ㎕의 완충제와 혼합하고 70 ㎕ 탈이온수로 희석하였다. Fab' 발현 플라스미드로 형질전환시키지 않은 null 숙주 균주의 용해물뿐만 아니라, 구축물 10로 형질전환시킨 숙주 균주의 용해물도 시험 샘플과 함께 대조군으로서 실행하였고, 시스템 내부 표준물을 사용하여 정량하였다.
도 1은 DC1032 및 시험된 4개의 다른 프로테아제 결핍 슈도모나스 플루오레센스 균주들에 의해 생성된 Fab' 단백질의 비환원 SDS-CGE 분석을 보여준다. 각각의 균주에 대한 12개의 레인은 왼쪽에서 오른쪽으로 다음을 보여준다: 가장 왼쪽 레인 - MW가 16, 20, 29, 48 및 68 kD인 MW 래더; 1 내지 10으로 넘버링된 레인 - Fab' 중쇄 및 경쇄를 각각 코딩하고 중쇄 유전자에 작동 가능하게 연결된 상이한 주변세포질 분비 신호를 코딩하는 핵산 서열을 각각 갖고 경쇄 유전자에 작동 가능하게 연결된 Azu 분비 신호를 코딩하는 핵산 서열을 각각 가진 구축물 1 내지 10을 사용함으로써 발현된 단백질. 구축물 1 내지 9 각각은 각각 슈도모나스 플루오레센스 유래 DsbC를 공-발현하는 반면, 구축물 10은 공-발현하지 않는다. 레인 12(각각의 세트에서 가장 오른쪽 레인) - null 숙주 균주(null 발현 플라스미드를 가짐). 왼쪽에서 오른쪽으로, 처음 12개의 레인은 숙주 균주 DC1084에서의 Fab' 발현을 보여주고; 두 번째 12개의 레인은 DC977에서의 Fab' 단백질 발현을 보여주며; 세 번째 12개의 레인은 DC441에서의 Fab' 단백질 발현을 보여주고; 네 번째 12개의 레인은 DC1032에서의 Fab' 단백질 발현을 보여주고; 다섯 번째 12개의 레인은 DC509에서의 Fab' 단백질 발현을 보여준다. DC1032 레인 아래의 화살표는 Fab' 분해 생성물에 대한 이동 면적을 표시한다. 단백질 L 농후화 Fab'의 HPLC 및 LC-MS 분석은 관찰된 단편이 Fab'로부터 유래하였음을 확인시켜주었다.
결론 : 시험된 다른 14개 숙주 균주들과 대조적으로, (유전자 녹아웃에 의한) Prc1, Prc2 및 HslUV 프로테아제 결핍을 가진 DC1032는 분해를 감소시키면서(Fab'를 표시하는 오른쪽 화살표 참조) 고수율의 조립된 Fab'(최대 130 mg/ℓ)를 생성하였다. 구축물 8은 중쇄 유전자에 작동 가능하게 연결된 분비 신호 Slmt(서열번호 11)를 코딩하는 핵산 서열, 및 경쇄 유전자에 작동 가능하게 연결된 분비 신호 Azu(서열번호 13)를 코딩하는 핵산 서열을 포함하였고, 가장 높은 조립된 Fab' 수율을 생성하였고 분해를 감소시켰다.
실시예 2. 프로테아제 결핍 박테리아 숙주 세포 생장의 회복
확인된 숙주 균주의 대규모 생장
0.5 ㎖ 규모에서 실시예 1에 기재된 바와 같이 확인된 슈도모나스 플루오레센스 숙주 균주를 2 리터(2 ℓ) 규모(통상적인 생물반응기, CBR)에서 생장시켰다. 슈도모나스 플루오레센스에서 두 꼬리 특이적 단백질 유전자들(Prc)의 완전한 불활성화는 생물반응기에서 높은 세포 밀도 생장을 방해하였다. 유사한 효과가 예를 들어, 전체가 각각 본원에 참고로 포함되는 미국 특허 제9,493,559호, 유럽 특허 제1341899B1호("Bacterial host strains"), 및 문헌[Hara, H. et al., 1991]에 의해 이. 콜라이 꼬리 특이적 프로테아제 돌연변이체에 관해 보고되었다.
도 2는 2 ℓ 규모에서 DC1032 숙주 세포 균주에 대한 생장 곡선(OD575 대 발효 시간(시))을 보여준다. 세포를 32℃ 및 pH 6.5에서 생장시키고 25.5시간에서 IPTG로 유도하였고, 유도기를 36시간 동안 진행시켰다. 균주 STR36306(DC1032 + p688-048(Fab' 발현 플라스미드))은 약 27의 최대 OD575까지 생장하였고, STR94998(DC1032 + null 플라스미드)은 약 50의 최대 OD575까지 생장하였다. 이러한 Prc 결핍 균주들은 20 내지 50의 OD575를 넘어 생장하지 못하였고 세포 용해의 증거를 보였다. 대조적으로, Prc의 기능성 카피(Prc1 및 Prc2) 둘 다를 발현하는 균주는 18시간 내지 26시간 이내에 2 ℓ 생물반응기에서 최대 130의 OD575까지 생장하였다(데이터는 제시되지 않음).
이. 콜라이 전략은 슈도모나스 숙주 균주의 고밀도 세포 생장을 회복시키지 못한다 .
선행 연구는 이. 콜라이에서 꼬리 특이적 프로테아제 Tsp/Prc(슈도모나스 Prc의 오르톨로그)를 코딩하는 유전자의 결실이 고밀도 발효에서 생장을 억제하고, 아미노산 치환에 의한 Spr(슈도모나스 MepS1의 이. 콜라이 유사체)의 불활성화가 이. 콜라이 생장을 575 nm에서 200 이상의 OD까지 회복시켰음을 보여주었다(예를 들어, 미국 특허 제9,493,559호, 유럽 특허 제1341899B1호, 및 문헌[Hara, H. et al., 1991]). 이 전략은 슈도모나스 플루오레센스 Prc null 균주에서는 성공적이지 못한 것으로 입증되었다. 도 2에 나타낸 바와 같이, Prc null 균주의 생장은 MepS1, MepS2 또는 이들 둘 다의 결핍에 의해 회복되지 않았다. 확인된 바와 같이, MepS1 결실을 추가로 가진 DC1032인 균주 STR94994는 약 23의 최대 OD575까지 생장하였고, MepS2 결실을 가진 DC1032인 균주 STR94995는 약 33의 최대 OD575까지 생장하였고, MepS1 및 MepS2 둘 다의 결실을 가진 DC1032인 균주 STR94996은 약 23의 최대 OD575까지 생장하였다. (균주 STR94994, STR94995 및 STR94996 각각은 p688-048을 함유하였다).
Prc1 및 Prc2 결핍 숙주 세포의 적응 실험실 진화
높은 세포 밀도 생장이 회복된 Prc 결핍 숙주 균주를 개발하였다.
DC954는 Prc null 균주에 치명적인 생장 조건 하에서 적응 실험실 진화(ALE)를 거쳤다. 예를 들어, 이. 콜라이에서의 ALE 및 유사한 전략은 문헌, 예를 들어, 문헌[Hara, H. et al., 1991]에 기재되어 있다. ALE에서, 스트레스에 대한 내성이 감소된 박테리아 균주(프로테아제 결핍 돌연변이체를 포함함)는, 추가 염색체 돌연변이가 발생하지 않는 한, 생장을 방해하는 준최적 생장 조건(여기서, 낮은 염 및 고온)에 노출된다.
DC954를 문헌[Hara et al., 1991]에 기재된 것과 유사한 변형된 저장성 루리아-버타니(Luria-Bertani)(LB) 배지 한천 레시피 상에서 고온(30℃ 내지 32℃의 세포 최적 생장 온도와 대조적으로 36℃)에서 생장시켰다. 도 3a는 36℃에서 NaCl이 존재하지 않고 pyrF 결실을 고려하여 생장을 허용하기 위해 첨가된 우라실이 존재하는 1X LB 한천 배지에서 DC954 콜로니의 생장을 보여준다. 확인된 바와 같이, 이 조건 하에서 DC954는 배경 생장이 있는 콜로니를 형성하였다. 도 3b에서, 왼쪽 플레이트는 36℃에서 NaCl의 부재 하에 우라실을 함유하는 1/2X LB 한천 배지에서만 DC454(본질적으로 야생형)의 생장을 보여준다. 생장은 1X LB에서의 생장보다 더 느렸으나, 이 생장 조건은 DC454에 치명적이지 않았다. 도 3b에서 오른쪽 플레이트는 36℃에서 NaCl의 부재 하에 우라실을 함유하는 1/2X LB 한천 배지에서 DC954의 생장을 보여준다. 이 생장 조건 하에서, 배경 생장은 크게 감소되었거나 제거되었으나, 몇몇 강력한 단일 콜로니가 생존하였다. 표시된 바와 같이, 상기 단일 콜로니는 추가 돌연변이에 의해 준최적 생장 조건에 적응(진화)한 세포를 암시하였다. 추가 특징규명을 위해 이 콜로니를 선택하였다.
진화된 세포에서 염색체 MepS, MepM 및 MepH 오르톨로그를 시퀀싱하였다. MepM1은 그의 불활성화와 일치하는 돌연변이를 획득한 것으로 밝혀졌다. 확인된 돌연변이는 Y248stop, D334N, G332S, A337T, H411Y 및 P410L이었다. 이 돌연변이들은 우라실에 대한 영양요구성을 레스큐하는 빈 벡터와 함께 공-발현되었을 때 2 ℓ 규모에서 생장을 회복시켰다. 따라서, MepM1의 불활성화는 DC954의 높은 세포 밀도 생장을 회복시켰다.
도 4는 진화된 Prc null 균주 #1 및 #3이 진화되지 않은 Prc+ 균주 #4와 마찬가지로 높은 세포 밀도(132 내지 150의 OD575)까지 생장하였음을 보여준다. 그러나, 진화되지 않은 Prc null 균주 2는 50 미만의 OD575까지 생장하였다(표 5 참조), 생성기를 32℃ 및 pH 6.5에서 48시간 동안 수행하였다.
Prc null 배경에서 조합적 MepS 및 MepM 결핍의 생성
Prc 결핍 슈도모나스 플루오레센스(Δprc1Δprc2,ΔpyrF)에서의 체계적인 시험을 위해 일련의 MepS 및 MepM 녹아웃 돌연변이체들을 생성하였다. MepS1, MepS2, MepM1 및 MepM2에 대한 상동 영역을 합성하고 블런트 말단 제한 분해로 비-슈도모나스 복제 벡터에 서브클로닝하고 우라실에 대한 레스큐된 원영양성으로 선택하였다.
1 ㎍의 플라스미드 DNA를 전기 형질전환능 prc 녹아웃 슈도모나스 플루오레센스 세포주에 전기천공함으로써 형질전환을 수행하였다. 형질전환된 세포를 M9 최소 배지 + 1 mM MgCl2 + 1.5% 한천에 플레이팅함으로써 통합을 위한 선택을 수행하였고 30℃에서 2일 내지 3일 동안 선택하였다. 단일 콜로니를 LB 배지 + 250 ㎍/㎖ 우라실에 떼어 넣음으로써 하룻밤 동안 두 번째 재조합 단계를 선택하였다. 다음날, 포화된 배양물의 여러 희석액을 0.5X LB, 500 ㎍/㎖ 5-FOA + 250 ㎍/㎖ 우라실 1.5% 한천 플레이트에 도말하였다. 이 두 번째 재조합 사건은 오픈 리딩 프레임을 녹아웃시키고, 비복제 플라스미드는 pyrF 유전자의 5-FOA 역선택을 통해 세포로부터 제거된다. 단일 콜로니를 액체 0.5X LB, 500 ㎍/㎖ 5-FOA + 250 ㎍/㎖ 우라실에 떼어 넣고 30℃에서 밤새 생장시켰다. 콜로니 PCR을 위해, 상기 상동성 아암 영역 외부에서 프라이머를 설계하였고, PCR에 의한 증폭 후 브롬화에티듐 염색 아가로스에서 크기 분석으로 녹아웃을 확인하였다.
조합적 돌연변이체의 스크리닝
생장 표현형 분석을 위해, pyrF 결실을 고려하여 생장을 허용하기 위해 녹아웃 균주를 M9 배지 + 1 mM MgCl2 + 250 ㎍/㎖ 우라실(M9/Ura)에서 밤새 생장시켰다. 다음날, 포화된 액체 배양물을 M9/Ura로 1:100 희석한 후, M9/Ura로 5회 10배 연속 희석하였다. 그 다음, 배양물을 0.5X LB(NaCl 없음, 250 ㎍/㎖ 우라실) 1.5% 한천 플레이트에 점적하고(5 ㎕) 36℃에서 48시간 동안 인큐베이션함으로써 준최적 조건 하에서 인큐베이션하였다.
표 6은 스크리닝된 조합적 Mep 결핍 돌연변이체를 보여준다. 이. 콜라이에서 보고된 Spr 돌연변이에 의한 Tsp 돌연변이체의 레스큐와 달리, 슈도모나스 플루오레센스의 MepS1 결핍은 예상외로 Prc 결핍 돌연변이체의 고밀도 생장을 회복시키지 못하였다. 도 5는 스크리닝 결과를 보여준다. 순차적으로 더 낮은 희석액을 도면에 표시된 방향대로 플레이트 상에서 각각의 행의 위에서 아래로 적용하였다. 제1열은 준최적 조건 하에서 생장하지 못하는 Prc 결핍 돌연변이체 DC1032를 함유하고, 제10행은 동일한 조건 하에서 Prc+ ΔpyrF 균주(야생형 대조군)의 생장을 보여준다. 다른 행에서 관찰된 바와 같이:
제2열 - MepM1 결핍의 존재는 모든 역가에서 Prc 결핍 돌연변이체의 생장을 성공적으로 회복시킨다.
제3열 - MepS1 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력을 제거한다.
제4열 - MepS2 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력에 영향을 미치지 않는다.
제5열 - MepS1 및 MepS2 결핍의 존재는 생장을 회복시키는 MepM1 결핍의 능력을 제거한다.
제6열 - MepM2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 못한다.
제7열 - MepM2 및 MepS1 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
제8열 - MepM2 및 MepS2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
제9열 - MepM2, MepS1 및 MepS2 결핍의 존재는 Prc 결핍 돌연변이체의 생장을 회복시키지 않는다.
4가지 결핍(MepM1, MepM2, MepS1 및 MepS2) 모두를 가진 숙주 세포는 성공적으로 단리되지 않았으며, 이는 Prc 결핍 돌연변이체의 치사성을 암시한다.
도 5에서 관찰된 생장은 표 6의 제4열에 기재되어 있다.
결론 : MepM1 결핍은 Prc 결핍 슈도모나스 균주의 생장을 회복시킨다. MepS1, MepS2 및 MepM2 활성 중 어느 하나 이상의 활성의 결핍은 슈도모나스 Prc 결핍 돌연변이체의 생장을 회복시키지 못한다. 예상외로, MepM1 결핍에 의해 부여된 생장 이점은 MepS1 결핍의 존재 하에 제거된다. Prc 결핍 슈도모나스 플루오레센스의 높은 세포 밀도 생장을 회복시키기 위해서는 MepS1의 기능성 카피를 남기면서 MepM1을 불활성화시킬 필요가 있다.
실시예 3. 재조합 숙주 균주에 의한 강력한 생장 및 Fab' 생성을 위한 최적 조건
조합적 녹아웃 데이터를 기반으로, 상이한 프로테아제 녹아웃을 갖고 항-TNF-알파 Fab' 발현 플라스미드인 p688-48을 함유하는 2개의 숙주 균주를 생성하였고 두 온도(25℃ 및 32℃), pH(6 및 7.2) 및 유도 OD575(60 및 120)를 포함하는 다양한 유도 조건 하에서 생장 및 재조합 단백질 생성에 대해 시험하였다. 표 7은 상기 2개의 균주인 STR87639(ΔprcΔ1prc2, ΔhslUV, ΔmepM1, ΔpyrF, lsc::lacIQ1) + p688-048 및 STR87640(Δprc1Δprc2, ΔhslUV, ΔmepM1, ΔmepS2, ΔpyrF, lsc::lacIQ1) + p688-048 각각에 대해 유도 후 24시간, 48시간, 72시간 및 120시간에서 pH, 온도, 유도 OD575 및 Fab' 역가를 보여준다. 유도 후 24시간, 48시간 및 72시간에서 수거된 전체 발효 브로쓰의 가용성 분획으로부터 분석 샘플을 준비하였다. 희석된 전체 발효물을 초음파처리한 후 원심분리하여 가용성 분획과 불용성 분획을 분리함으로써 가용성 분획을 준비하였다. 유도 후 120시간에서, 세포 펠릿과 무세포 브로쓰를 분리하기 위한 전체 브로쓰의 원심분리 후 무세포 배양 상청액(무세포 브로쓰)으로부터 분석 샘플을 준비하였다. 시스템 내부 질량 래더를 사용하는 비환원 SDS-CGE 분석을 이용하여 조립된 Fab의 역가를 측정하였다.
STR87639 용해물을 LC-MS로 분석하였고, 이 용해물이 HC/LC/LC 이량체, HC 및 LC 둘 다의 단편, 및 HC 및 LC 단편을 포함하는 조립체를 포함하는, 비환원된 온전한 질량의 여러 종을 함유한다는 것을 발견하였다. 정확한 Fab 질량(47,761)은 낮은 존재도로 관찰되었다.
결론 : STR87639 및 STR87640 둘 다가 pH 6.0 및 32℃에서 60의 OD575에서 유도되었을 때 가장 높은 Fab' 수율을 생성하였다. STR87639는 가장 높은 수율을 생성하였으나, Fab' 중쇄 및 경쇄의 단백질용해 단편을 축적시켰다.
실시예 4. 재조합 단백질 생성을 위한 숙주 균주의 최적화 I: 재조합 단백질 품질에 영향을 미치는 추가 프로테아제의 확인
프로테아제의 확인
항-TNF-알파 Fab' 단편의 단백질용해에 영향을 미치는 다른 인자를 확인하기 위해, 항-TNF-알파 Fab' 중쇄와 경쇄, 및 공-전사 슈도모나스 플루오레센스 DsbC 단백질 디설파이드 이소머라제의 오픈 리딩 프레임을 함유하는 플라스미드 p688-048을 숙주 배경 DC1032: Δprc1, Δprc2, ΔhslUV, ΔpyrF, lsc::lacIQ1(STR36036 생성), 및 DC867: Δprc1Δprc2, MepM1(P410L), ΔpyrF, lsc::lacIQ1(PF1558 생성)에 도입함으로써 2개의 중간 균주를 생성하였다. 생물학적 복제물을 이중으로 생장시켰고, 낮은 세포 밀도에서 시딩된 초기 배양물, 중간 대수기 생장, 12시간 및 48시간의 유도 후 시간(I)을 나타내는 생장 곡선을 따라 샘플링하였다. 제네위즈(Genewiz)(캘리포니아주 샌디에고)에서 전체 전사물 RNA 시퀀싱을 위해 샘플을 처리하였다. 품질 트리밍된 Fastq 파일을 돌려받았고, 소스 코드로부터 컴파일링되고 하기 파라미터를 사용함으로써 실행된 오픈 소스 소프트웨어 STAR 정렬기를 사용하여 상기 파일을 처리하였다: outSAMtype BAM SortedByCoordinate and quantMode GeneCounts. (예를 들어. 본원에 참고로 포함되는 문헌[Dobin A, Davis CA, Schlesinger F, Drenkow J, Zaleski C, Jha S, Batut P, Chaisson M, Gingeras TR. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan 1;29(1):15-21. doi: 10.1093/bioinformatics/bts635. Epub 2012 Oct 25. PMID: 23104886; PMCID: PMC3530905] 참조). 소스 코드로부터 컴파일링된 오픈 소스 피쳐카운트(featurecounts) 소프트웨어를 사용하여, 정량된 유전자를 데이터 프레임에 주석달았고(본원에 참고로 포함되는 문헌[Liao Y, Smyth GK and Shi W. featureCounts: an efficient general-purpose program for assigning sequence reads to genomic features. Bioinformatics, 30(7):923-30, 2014]에 기재됨), 데이터를 정규화하고, 상호작용을 가진 선형 회귀 모델에 피팅하였다. STR36306(기능성 MepM1)과 PF1558(결핍 MepM1) 사이의 평균 정규화된 유전자 수의 Wald 검정을 기반으로 p 값을 계산함으로써, 유전자 수의 통계적 유의성을 수행하였다. 시드와 I12 사이에서 시간 경과에 따라 누적적으로 평균 정규화된 전사물 수의 log2배 변화와 대비하여 통계적 유의성(p 값)을 작도함으로써, 상향조절에 영향을 미치는 유전자를 화산 플롯(volcano plot)으로 가시화하였다. 주성분 분석을 통해 가장 큰 변화를 나타내는 샘플로부터 비교에 사용된 시점을 얻었다. 결과는 표 8 및 9에 제시되어 있다.
결론 : 이 비교 분석은 매트릭스 메탈로프로테아제 클래스 EC 3.4.24.40(서열번호 9)에 속하는 세포외 알칼리 메탈로프로테아제 RXF04495.2가 Prc 결핍 MepM1+ 숙주 세포와 비교되었을 때 MepM1 결핍을 가진 Prc 결핍 숙주 세포에서 발효 시간 전체에 걸쳐 누적적 및 일시적으로 상향조절된다는 것을 보여주었다.
실시예 5. 재조합 단백질 생성를 위한 숙주 균주의 최적화 II: 추가 프로테아제 돌연변이의 도입 및 균주 평가
세포외 알칼리 메탈로프로테아제 RXF04495.2 결핍
유전형 Δprc1, Δprc2, ΔhslUV, ΔmepM1의 슈도모나스 플루오레센스 숙주를 사용하여, 실시예 2에 기재된 유전자의 조합적 녹아웃을 생성하는 데 이용된 방법과 유사한 방법으로 RXF04495.2 결핍 숙주를 제조하였다(이 경우, RXF04495.2 상동성 아암(서열번호 61)을 사용함). 콜로니 PCR 검증된 녹아웃을 사용하여, 하기 유전형을 가진 PF1596 숙주 배경을 생성하였다: Δprc1, Δprc2, ΔhslUV, ΔmepM1, ΔRXF04495.2 메탈로프로테아제, ΔpyrF, lsc::lacIQ1. 이어서, Slmt 분비 신호에 작동 가능하게 연결된 Fab' 중쇄(서열번호 25) 및 Azu 분비 신호에 작동 가능하게 연결된 Fab' 경쇄(서열번호 26)를 코딩하는 Fab' 단독 발현 카세트를 함유하는 플라스미드 pFNX7800을 사용하여 생성된 숙주 PF1596을 형질전환시켰다. 이들 중쇄 및 경쇄는 IPTG 유도성 발현을 위한 tac 프로모터의 조절 하에 다양한 숙주 배경에서 공-전사적으로 발현되었다.
추가 프로테아제 결핍 및 과발현된 단백질
재조합 단백질 발현을 위해 숙주 균주에서 불활성화시키고 시험할 추가 프로테아제로서 DegP2를 선택하였다. 그러나, 2000개 이상의 클론의 스크리닝에도 불구하고, 후보 프로테아제 결핍 숙주 배경에서는 DegP2 불활성화가 얻어지지 않았다. 대안적인 접근법으로서, 내인성 프로테아제를 능가하는, 촉매 활성이 없는 DegP2 프로테아제(DegP2 S219A, 서열번호 29)를 만니톨 프로모터(Pmtl)의 조절 하에 별도의 플라스미드, 또는 Pmtl의 조절 하에 동일한 플라스미드에서 발현시켰거나, Fab' HC 및 LC와 함께 공-전사적으로 발현시켰다. 폴딩 조절인자 PDIA6(서열번호 27)을 공-전사적으로 발현시켰다.
프로테아제 결핍 숙주 균주의 평가
표 10에 기재된 재조합 숙주 균주에 의해 생성된 항-TNF-알파 Fab'를 경쇄 단백질용해 및/또는 중쇄 클립핑(clipping)에 대해 평가하였다.
상기 표 10의 숙주 균주를 하기 표 11에 제시된 설계에 따라 배양하고 유도하였다.
균주를 탄소원으로서 글리세롤을 함유하는 무기염 배지에서 pH 6.0 및 32℃에서 생장시키고 표시된 OD575에서 유도하고 유도 후 24시간, 36시간 또는 48시간에서 수거하였다. 수거된 세포를 75 mM 인산염 및 100 mM 염화나트륨(pH 7)에 25% 고체로 현탁시켰다. 이어서, 세포 현탁액을 용해/균질화시키고 15,000 x g에서 30분 동안 원심분리하였다. 그 다음, 정화된 용해물을 75 mM 인산염 및 100 mM NaCl(pH 7.4)에 의해 사전평형화된 단백질 L 수지에 로딩하였다. 친화성 포획된 Fab'를 3 컬럼 부피(CV)의 50 mM BisTris 및 1 M NaCl(pH 7.0)으로 세척한 후, 3 CV의 50 mM Tris(pH 7.2)로 세척하였다. Fab'를 3 내지 10 CV의 용출 완충제(75 mM 아세테이트, pH 3.4)로 용출하고 2.4 M Tris 염기로 pH 7 내지 8까지 즉시 중화시켰다. 환원 SDS-CGE 및 비환원 SDS-CGE로 Fab'의 순도를 평가하였다.
프로테아제 결핍 숙주 균주에서의 경쇄 단백질용해
Capto-L 친화성 크로마토그래피를 이용하여 Fab'를 농후화한 후, 농후화된 단편의 NR-SDS-CGE로 영상화하고 정량함으로써 Fab' 단편의 단백질용해를 정량하였다. 결과는 도 6에 제시되어 있다. 균주를 생장시키고 y-축에 표시된 유도 후 시간(시)에서 수거하였고, 재조합 단백질을 Capto-L 농후화하고 NR-SDS-CGE로 분석하였다. x-축은 각각의 레인에서 단백질용해된 경쇄 종의 퍼센트를 보여준다. 시험된 균주의 간략한 요약은 아래 표 12에 제시되어 있다.
도 6에 나타낸 바와 같이, MepM1 및 RXF04495.2 메탈로프로테아제가 결핍된 STR94974에 의해 생성된 재조합 Fab' 경쇄는 가장 적게 단백질용해되었다. 단백질용해는 I24 및 I36에서 크게 감소되었다. I24에서는 RXF04495.2의 결실을 함유하는 배경에서 단백질용해가 사실상 관찰되지 않았다. PF1596에서의 Fab' 발현은 I36에서 단백질용해가 절반으로 추가 감소함을 보여준다. RXF04495.2 결핍은 Fab의 경쇄(LC)의 분해를 현저히 감소시켰다.
프로테아제 결핍 숙주 균주에 의해 생성된 재조합 Fab'의 역가
TNF-α 결합 활성을 측정하는 옥테트 레드(Octet Red) 96 시스템을 사용하는 생물층 간섭측정을 통해 항-TNF-알파 Fab' 샘플 역가를 수득하였다. 데이터를 데이터 획득 소프트웨어 버전 11.0에서 수집하였다. 모든 실험을 1X 동역학 완충제(Sartorius, 제품 번호 18-1105)에서 수행하였다. 고정밀 스트렙트아비딘 바이오센서(Sartorius, 제품 번호 18-5117)를 115 nM 바이오티닐화된 TNF-α(Acro Biosystem, 제품 번호 TNA-H8211)와 함께 60초 동안 인큐베이션한 후, 어세이 완충제에서 60초 동안 인큐베이션하여 기준선을 확립하였다. 그 다음, 샘플의 결합을 측정하여 활성 Fab'를 검출하였다. 가장 높은 역가의 활성 Fab'를 생성한 발현 균주에 대한 결과는 아래에 요약되어 있다.
도 7은 숙주 균주 STR94974, STR94975 및 STR94977에서 항-TNF-알파 Fab' 단편이 NR-SDS-CGE, 또는 고정된 TNF-알파를 사용한 생물층 간섭측정(BLI)에 의해 평가되었을 때 24시간에서 최대 1 g/ℓ 및 72시간에서 4 g/ℓ의 역가로 생성되었음을 보여준다. 숙주 세포주 PF1596도 DsbA 및 Azu 분비 신호와 각각 중쇄 및 경쇄 아미노산 서열의 융합체를 함유하는 발현 카세트에 의해 형질전환될 수 있으며, 이것은 NR-CGE에 의해 분석될 때 MepM KO prc null 세포주에서 2 ℓ 규모에서 최대 1 g/ℓ의 Fab' 역가를 생성할 수 있다(데이터는 제시되지 않음).
프로테아제 결핍 숙주 균주의 생장 비교
도 8a 및 8b는 각각 유도 후 24시간 및 48시간 동안 Prc 및 MepM1이 결핍된 STR87639의 생장을 STR92557, STR92567, STR94974 및 STR94976과 비교한다. 생장기를 32℃ 및 pH 6.5에서 수행하였고 유도 목표는 OD575=80이었다. 세포를 IPTG로 유도하였고 생성기를 32℃ 및 pH 6.5에서 24시간 또는 48시간 동안 수행하였다. 다양한 폴딩 조절인자의 과발현은 생장에 유의미한 영향을 미치는 것으로 보이지 않았고, 메탈로프로테아제 결실(STR94974 및 STR94976)의 중복도 생장에 유의미한 영향을 미치는 것으로 보이지 않았다. STR87639를 제외한 모든 균주들이 유도 후 일정 시간 동안 세포 밀도를 계속 증가시켰다.
도 9는 슈도모나스 플루오레센스 Prc 결핍 Fab' 발현 균주 STR87639, STR92473, STR94994, STR94995, STR94996 및 STR94998의 생장을 비교한다(표 13 참조). 생장기를 32℃ 및 pH 6.5에서 수행하였다. 유도 목표 OD575는 32℃ 및 pH 6에서 수행하였을 때(STR87639, STR92473) 100이었거나, 32℃ 및 pH 6.5에서 수행하였을 때(다른 균주들) 80이었다.
선, 위에서 아래로:
닫힌 원, 실선: STR87639(MepM1 결핍)
삼각형, 실선: STR92473(MepM1 및 MepM2 결핍)
다이아몬드, 실선: STR94995(MepS2 결핍)
원, 파선: STR94998(MepM 또는 MepS가 결핍되지 않음; 발현 구축물 없음)
열린 원, 실선: STR94996(MepS1 및 MepS2 결핍)
사각형, 실선: STR94994(MepS1 결핍)
결과는 MepS1, MepS2, 또는 MepS1과 MepS2 둘 다의 결핍이 Prc 결핍 숙주 세포의 생장을 회복시키지 못하였음을 보여주었다. MepM1, 또는 MepM1과 MepM2 둘 다의 결핍은 Prc 결핍 숙주 세포의 생장을 회복시켰다.
Figure pct00027
SEQUENCE LISTING <110> PFENEX INC. <120> BACTERIAL HOSTS FOR RECOMBINANT PROTEIN EXPRESSION <130> 94931-0628.757601WO <140> PCT/US2022/032911 <141> 2022-06-09 <150> 63/209,239 <151> 2021-06-10 <160> 98 <170> PatentIn version 3.5 <210> 1 <211> 468 <212> PRT <213> Pseudomonas fluorescens <400> 1 Met Thr Thr Glu Pro Ser Lys Ala Pro Pro Leu Tyr Pro Lys Thr His 1 5 10 15 Leu Leu Ala Ala Ser Gly Ile Ala Ala Leu Leu Ser Leu Ala Leu Leu 20 25 30 Val Phe Pro Ser Ser Asp Val Glu Ala Lys Arg Thr Ser Leu Ser Leu 35 40 45 Asp Leu Glu Ser Pro Val Glu Gln Leu Thr Gln Asp Gln Asp Ala Ser 50 55 60 Asp Ala Gln Gln Ala Thr Asn Thr Ala Thr Glu Ser Pro Phe Ala Gln 65 70 75 80 Ile Glu Ser Thr Pro Glu Asp Thr Gln Gln Ala Ala Gln Glu Ala Pro 85 90 95 Ala Ala Ala Lys Ser Pro Gln His Arg Glu Val Ile Val Gly Lys Gly 100 105 110 Asp Thr Leu Ser Thr Leu Phe Glu Lys Val Gly Leu Pro Ala Ala Ala 115 120 125 Val Asn Asp Val Leu Ala Ser Asp Lys Gln Ala Lys Gln Phe Thr Gln 130 135 140 Leu Lys Arg Gly Gln Lys Leu Glu Phe Glu Leu Thr Pro Asp Gly Gln 145 150 155 160 Leu Asn Asn Leu Tyr Thr Ser Ile Ser Asp Leu Glu Ser Ile Ser Leu 165 170 175 Ser Lys Gly Ala Lys Gly Phe Ala Phe Asn Arg Ile Thr Thr Lys Pro 180 185 190 Val Met Arg Ser Ala Tyr Val His Gly Val Ile Asn Ser Ser Leu Ser 195 200 205 Gln Ser Ala Ala Arg Ala Gly Leu Ser His Ser Met Thr Met Asp Met 210 215 220 Ala Ser Val Phe Gly Tyr Asp Ile Asp Phe Ala Gln Asp Ile Arg Gln 225 230 235 240 Gly Asp Glu Phe Asp Val Ile Tyr Glu Gln Lys Val Ala Asn Gly Lys 245 250 255 Val Val Gly Thr Gly Asn Ile Leu Ser Ala Arg Phe Thr Asn Arg Gly 260 265 270 Lys Thr Tyr Thr Ala Val Arg Tyr Thr Asn Lys Gln Gly Asn Ser Ser 275 280 285 Tyr Tyr Thr Ala Asp Gly Asn Ser Met Arg Lys Ala Phe Ile Arg Thr 290 295 300 Pro Val Asp Phe Ala Arg Ile Ser Ser Arg Phe Ser Met Gly Arg Lys 305 310 315 320 His Pro Ile Leu Asn Lys Ile Arg Ala His Lys Gly Val Asp Tyr Ala 325 330 335 Ala Pro Arg Gly Thr Pro Ile Lys Ala Ala Gly Asp Gly Lys Val Leu 340 345 350 Leu Ala Gly Arg Arg Gly Gly Tyr Gly Asn Thr Val Ile Ile Gln His 355 360 365 Gly Asn Thr Tyr Arg Thr Leu Tyr Gly His Met Gln Gly Phe Ala Lys 370 375 380 Gly Val Lys Thr Gly Gly Asn Val Lys Gln Gly Gln Val Ile Gly Tyr 385 390 395 400 Ile Gly Thr Thr Gly Leu Ser Thr Gly Pro His Leu His Tyr Glu Phe 405 410 415 Gln Val Asn Gly Val His Val Asp Pro Leu Gly Gln Lys Leu Pro Met 420 425 430 Ala Asp Pro Ile Ala Lys Ala Glu Arg Ala Arg Phe Met Gln Gln Ser 435 440 445 Gln Pro Leu Met Ala Arg Met Asp Gln Glu Arg Ser Thr Leu Leu Ala 450 455 460 Ser Ala Lys Arg 465 <210> 2 <211> 1407 <212> DNA <213> Pseudomonas fluorescens <400> 2 atgaccactg aaccgtctaa agcgccgccg ctttacccga agacccacct gctcgccgca 60 agtggtatcg ccgcccttct cagcctggca ctgctggtat tcccttccag tgacgttgaa 120 gccaaacgaa catccctgag ccttgatctg gaaagcccag ttgaacaact gacacaagat 180 caagacgctt ccgacgctca acaagccaca aacactgcaa ctgaatcacc tttcgcccag 240 atcgaaagca cacccgaaga cacccagcaa gccgcccagg aagcacctgc agcagccaag 300 agtccccagc atcgcgaagt catcgtgggc aaaggcgaca cactctcgac cctgttcgaa 360 aaagttgggt tgcctgccgc cgctgtaaat gacgtgctcg ccagcgataa gcaagccaag 420 caattcactc agctcaaacg tggtcaaaag cttgaatttg agctgacgcc agacggccag 480 ttgaacaacc tgtacaccag catcagtgac ttggaaagca tcagcctgag caaaggcgcc 540 aaaggcttcg cattcaacag aatcaccacc aaacccgtca tgcgttccgc ctacgtacat 600 ggcgtgatca acagctccct gtcgcagtcg gccgcgcgtg cgggcctgtc gcatagcatg 660 accatggaca tggccagcgt atttggctac gacatcgact tcgcccagga catccgtcaa 720 ggcgacgaat tcgacgtgat ctacgaacag aaagtagcca acggaaaagt ggtcggcact 780 ggcaacattc tttctgcacg cttcacaaac cgtggcaaaa cctacaccgc cgtgcgctac 840 accaacaaac aaggcaacag cagctactac acggctgatg gcaacagcat gcgtaaggcc 900 ttcatccgta cacccgttga ctttgcccgt attagctcgc gtttctccat gggccgcaag 960 catccaattc tgaacaaaat tcgcgcacac aagggcgtcg actatgccgc gccgcgtggc 1020 acgccaatca aagcagcggg cgacggcaag gtcttgttgg cggggcgccg tggtggttac 1080 ggcaatacgg tgatcatcca gcacggcaac acttaccgca cgctgtacgg ccacatgcaa 1140 gggttcgcca agggcgtcaa gacaggcggc aacgtgaaac agggccaagt gatcggctac 1200 atcggtacca ccggcctctc caccggcccg cacttgcact acgagttcca ggtcaacggc 1260 gtacacgtcg acccattggg ccagaagctg ccgatggccg acccgattgc caaggccgaa 1320 cgcgcgcgct tcatgcaaca gagccagccg ctgatggcac ggatggatca agagcgctcc 1380 accttgctgg cttcggcgaa gcgttaa 1407 <210> 3 <211> 273 <212> PRT <213> Pseudomonas fluorescens <400> 3 Met Pro Arg Leu Leu Ser Leu Leu Met Leu Leu Cys Leu Thr Phe Asn 1 5 10 15 Ala His Ala Asp Ser Tyr Ile Thr Arg Thr Leu Asn Lys Pro Val Pro 20 25 30 Gly Gly Val Ala Val Val Glu Leu Gly Pro Ser Ala Thr Ala Pro Lys 35 40 45 Ala Thr Tyr Gln Gly Lys Pro Val Leu Val Val Lys Glu Gln Asp Asn 50 55 60 Trp Leu Ala Ile Val Gly Ile Pro Leu Thr Val Lys Pro Gly Asn Glu 65 70 75 80 Arg Ile Ser Ser Gly Gly Arg Asn Leu Pro Phe Ile Val Gly Tyr Lys 85 90 95 Lys Tyr Pro Glu Gln Arg Ile Thr Leu Lys Asn Lys Ser Gln Val Asn 100 105 110 Pro Asp Pro Ala Gln Leu Lys Arg Ile Glu Gly Glu Leu Ala Val Gln 115 120 125 Leu Lys Ala Tyr Arg Ser Phe Ser Pro Asn Leu Pro Ser Asn Leu Val 130 135 140 Leu Asp Lys Pro Val Asn Gly Pro Leu Ser Ser Lys Phe Gly Val Arg 145 150 155 160 Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ser Gly Leu Asp Phe 165 170 175 Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Asn Gly Lys Val 180 185 190 Ile Leu Val Gly Asn Tyr Phe Phe Asn Gly Asn Thr Val Phe Val Asp 195 200 205 His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys Ile Asp 210 215 220 Val Arg Val Gly Gln Gln Leu Val Arg Gly Ala Val Val Gly Lys Val 225 230 235 240 Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn Val Ser 245 250 255 Leu Asn Asp Ala Arg Val Asp Pro Ala Ile Phe Ile Gly Ala Phe Gln 260 265 270 Pro <210> 4 <211> 822 <212> DNA <213> Pseudomonas fluorescens <400> 4 atgccacgcc tactgagcct gttgatgctg ttgtgcctca cgtttaacgc ccacgccgac 60 agctacatca cgcgaaccct gaacaaaccc gtgcctggcg gcgtggccgt cgtcgaacta 120 ggcccttcgg ccacagcgcc gaaagccacc taccagggca agccggtgct ggtggtcaag 180 gagcaggaca actggctggc gattgtcggc atcccgttga cggtcaagcc tggcaacgag 240 cgcatcagca gcggggggcg caacctgccg tttatcgtcg gctacaagaa gtatccggaa 300 caacgcatca ccttgaagaa caaaagccag gtcaaccccg acccggccca gctcaagcgc 360 atcgaaggcg aattggcagt gcagctcaag gcttaccgca gcttcagccc gaatttgccg 420 agcaatctgg tgctggataa accggtgaac gggccgctgt cgagcaagtt cggggtgcga 480 cgcttcttca acggcgaaga gcgcaacccg cactcgggcc tggacttcgc cgtaccggcc 540 ggcacaccga tcaagacacc cgccaatggc aaggtgattc tggtcggcaa ttacttcttc 600 aacggcaata ccgtgtttgt cgaccatggc caggggttta tcagcatgtt ctgccatatg 660 tcgaagatcg atgtgagggt gggtcagcaa ctggtgcgcg gtgcggtagt cggcaaagta 720 ggctcgacag gccgggccac tgggccgcat atgcactgga acgtcagcct gaacgatgca 780 cgggtagatc cggcgatttt tatcggcgcg tttcaaccct ga 822 <210> 5 <211> 209 <212> PRT <213> Pseudomonas fluorescens <400> 5 Met Leu Asn Arg Phe Ala Pro Leu Val Pro Leu Ala Leu Val Thr Leu 1 5 10 15 Leu Phe Gly Cys Ala Ser His Pro Gln Gln Val Ala Glu Gln Gln Lys 20 25 30 Pro Gln Val Gln Asn Gln Ala Lys Phe Val Ala Ala Gln Ser Ala Ser 35 40 45 Val Tyr Glu Glu Glu Val Ala Thr Glu Lys Glu Leu Ala Glu Phe Ser 50 55 60 Asp Ser Lys Pro Tyr Gln Leu Pro Leu Leu Ala Asp Ser Ile Leu Glu 65 70 75 80 Arg Gly Met Ser Leu Ile Gly Thr Arg Tyr Arg Phe Gly Gly Thr Ser 85 90 95 Glu Ala Gly Phe Asp Cys Ser Gly Phe Ile Gly Tyr Leu Phe Arg Glu 100 105 110 Glu Ala Gly Met Asn Leu Pro Arg Ser Thr Arg Glu Met Ile Asn Val 115 120 125 Asn Ala Pro Leu Val Ala Arg Asn Asn Leu Lys Pro Gly Asp Leu Leu 130 135 140 Phe Phe Ser Thr Ser Gly Arg Gly Arg Val Ser His Ala Gly Ile Tyr 145 150 155 160 Leu Gly Asp Asn Gln Phe Ile His Ser Ser Ser Arg Arg Ser Gly Gly 165 170 175 Val Arg Val Asp Asn Leu Gly Asp Ser Tyr Trp Ser Lys Thr Phe Ile 180 185 190 Glu Ala Lys Arg Ala Leu Ala Met Ala Pro Thr Thr Val Thr Ala Ser 195 200 205 Lys <210> 6 <211> 630 <212> DNA <213> Pseudomonas fluorescens <400> 6 atgctaaatc gcttcgcacc cctcgtgcct ctcgcactcg ttaccctgtt gtttggttgc 60 gcctcccacc ctcagcaggt ggcagaacag caaaaaccac aggttcaaaa tcaggcaaag 120 ttcgttgctg cacagtctgc ttctgtttat gaagaagagg tggcaaccga aaaagaactc 180 gccgagttct ccgacagcaa gccttaccag ctgccacttc tggccgacag catccttgag 240 cgcggcatgt ccttgatcgg tacccgttac cgtttcggcg gcacctcgga agccggtttt 300 gattgcagcg gtttcattgg ctacctgttt cgtgaagaag ccggtatgaa cctgccgcgc 360 tccacgcgcg agatgatcaa cgtgaatgca ccgttggtcg cacgaaacaa cctcaagccc 420 ggtgatctgc ttttctttag taccagtggc cgcggtcgtg tcagccacgc cggtatctac 480 ctgggcgata accagtttat tcattccagc agccgccgca gtggtggtgt tcgggtcgat 540 aacctcggtg acagctactg gagcaaaacc ttcatcgaag ccaagcgcgc actcgccatg 600 gccccgacga cggttaccgc tagtaagtaa 630 <210> 7 <211> 179 <212> PRT <213> Pseudomonas fluorescens <400> 7 Met Ser Thr Ser Ala Arg Leu Met Leu Ile Val Cys Ala Ala Leu Leu 1 5 10 15 Ser Ala Cys Ala Ser Arg Thr Pro Pro Pro Ala Pro Val Ala Val Lys 20 25 30 Pro Lys Pro Val Phe Asn Tyr Ala Thr Gln Asn Phe Ser Pro Ala Ala 35 40 45 Glu Asp Val Leu Phe Arg Ala Leu Gly Leu Val Gly Thr Pro Tyr Arg 50 55 60 Trp Gly Gly Asn Thr Pro Asp Ser Gly Phe Asp Cys Ser Gly Leu Ile 65 70 75 80 Gly Phe Val Phe Arg Asp Ala Ala Gly Ile Ser Leu Pro Arg Thr Thr 85 90 95 Arg Glu Leu Ile Val Met Arg Ala Gln Asp Val Ser Glu Gln Asn Leu 100 105 110 Gln Thr Gly Asp Leu Leu Phe Phe Ala Thr Gly Gly Gly Ser Arg Val 115 120 125 Ser His Ala Gly Ile Tyr Val Gly Glu Gly Arg Phe Val His Ala Pro 130 135 140 Gln Thr Gly Gly Thr Val Lys Leu Asp Thr Leu Ser Lys Ala Tyr Trp 145 150 155 160 Gln Asn Ala Tyr Leu Ser Ala Lys Arg Val Leu Pro Gly Asn Leu Ala 165 170 175 Arg Asn Pro <210> 8 <211> 540 <212> DNA <213> Pseudomonas fluorescens <400> 8 atgtcgacct cggcccgcct gatgcttatt gtttgcgccg cgctgctcag cgcctgcgcc 60 agtcgcacac cgccgcccgc gcccgtcgcg gtcaagccta agccggtgtt caactatgcc 120 acccagaatt tctcgccagc tgccgaagac gtgctctttc gtgcgctggg cctggtcggc 180 acgccttatc gctggggcgg caacacaccg gactcgggtt ttgattgcag cggcctgatc 240 ggctttgtat tccgcgacgc tgctggcatc tcattgccgc gcaccacccg tgaactgatc 300 gtgatgcgtg cccaggacgt cagcgaacaa aacctgcaga ccggcgacct gctgttcttc 360 gccaccggtg gtggttcgcg ggtcagccat gcgggtattt atgtggggga ggggcgcttc 420 gtacacgcgc cgcaaaccgg cggtacggtg aagctggata cgctatccaa agcgtattgg 480 cagaatgcct acctgagtgc caaacgcgtg ttgccaggga atctggcgcg taacccctga 540 <210> 9 <211> 509 <212> PRT <213> Pseudomonas fluorescens <400> 9 Met His Ile Pro Val Arg Gln Ser Ser Tyr Ser Arg Pro Ser Asp Lys 1 5 10 15 Leu Gln Pro Asp Leu Ser Pro Asp Glu His Gln Val Val Leu Trp Ala 20 25 30 Asn Asn Lys Lys Ser Phe Thr Thr Asp Gln Ala Ala Lys His Ile Thr 35 40 45 Arg Gly Gly Phe Lys Phe His Asp Arg Asn Asn Asp Gly Lys Ile Val 50 55 60 Val Gly Tyr Asn Phe Ala Gly Gly Phe Asn Ala Ala Gln Lys Glu Arg 65 70 75 80 Ala Arg Gln Ala Leu Gln Tyr Trp Ala Asp Val Ala Asn Ile Glu Phe 85 90 95 Val Glu Asn Gly Pro Asn Thr Asp Gly Thr Ile Ser Ile Lys Gly Val 100 105 110 Pro Gly Ser Ala Gly Val Ala Gly Leu Pro Asn Lys Tyr Asn Ser Asn 115 120 125 Val Gln Ala Asn Ile Gly Thr Gln Gly Gly Gln Asn Pro Ala Met Gly 130 135 140 Ser His Phe Leu Gly Leu Leu Ile His Glu Leu Gly His Thr Leu Gly 145 150 155 160 Leu Ser His Pro Gly Lys Tyr Asp Gly Gln Gly Phe Asn Tyr Asp Arg 165 170 175 Ala Ala Glu Tyr Ala Gln Asp Thr Lys Ala Arg Ser Val Met Ser Tyr 180 185 190 Trp Thr Glu Thr His Gln Pro Gly His Asn Phe Ala Gly Arg Ser Pro 195 200 205 Gly Ala Pro Met Met Asp Asp Ile Ala Ala Ala Gln Arg Leu Tyr Gly 210 215 220 Ala Asn Thr Lys Thr Arg Asn Thr Asp Thr Thr Tyr Gly Phe Asn Ser 225 230 235 240 Asn Ser Gly Arg Glu Ala Tyr Ser Leu Lys Gln Gly Ser Asp Lys Pro 245 250 255 Ile Phe Thr Val Trp Asp Gly Gly Gly Asn Asp Thr Leu Asp Phe Ser 260 265 270 Gly Phe Thr Gln Asn Gln Thr Ile Asn Leu Lys Ala Glu Ser Phe Ser 275 280 285 Asp Val Gly Gly Leu Arg Gly Asn Val Ser Ile Ala Lys Gly Val Ser 290 295 300 Val Glu Asn Ala Ile Gly Gly Thr Gly Asn Asp Thr Leu Thr Gly Asn 305 310 315 320 Glu Gly Asn Asn Arg Leu Thr Gly Gly Lys Gly Ala Asp Lys Leu His 325 330 335 Gly Gly Ala Gly Ala Asp Thr Phe Val Tyr Arg Arg Ala Ser Asp Ser 340 345 350 Thr Pro Gln Ala Pro Asp Ile Ile Gln Asp Phe Gln Ser Gly Ser Asp 355 360 365 Lys Ile Asp Leu Thr Gly Val Val Gln Glu Ala Gly Leu Lys Ser Leu 370 375 380 Ser Phe Val Glu Lys Phe Ser Gly Lys Ala Gly Glu Ala Val Leu Gly 385 390 395 400 Gln Asp Ala Lys Thr Gly Arg Phe Thr Leu Ala Val Asp Thr Thr Gly 405 410 415 Asn Gly Thr Ala Asp Leu Leu Val Ala Ser Gln Ser Gln Ile Lys Gln 420 425 430 Ala Asp Val Ile Trp Asn Gly Gln Ala Pro Thr Val Thr Pro Thr Pro 435 440 445 Glu Pro Thr Val Val Pro Val Ser Asp Pro Val Pro Thr Pro Thr Ser 450 455 460 Glu Pro Thr Glu Pro Glu Pro Thr Pro Glu Pro Ala Pro Leu Pro Val 465 470 475 480 Pro Thr Pro Arg Pro Gly Gly Gly Phe Ile Gly Lys Ile Phe Ser Ser 485 490 495 Phe Lys Gly Phe Ile Lys Lys Val Trp Ser Ile Phe Arg 500 505 <210> 10 <211> 1530 <212> DNA <213> Pseudomonas fluorescens <400> 10 atgcatatcc ctgttaggca gtcttcttac tcgcgtcctt cagataagtt acagcccgat 60 ctttcacccg atgaacacca agttgttctc tgggccaaca ataaaaaatc tttcaccacg 120 gatcaggccg cgaaacacat cacccgcggt ggcttcaagt ttcatgatcg caacaatgat 180 ggaaaaatcg tcgtgggtta taactttgcg ggcggcttca atgcggctca gaaagaacgg 240 gccaggcaag cccttcagta ctgggcggat gttgctaata tcgaatttgt tgaaaatggc 300 ccgaacacgg atggcacaat aagcatcaag ggtgttccgg gttcggcagg cgtcgcgggg 360 ttgcccaaca aatataattc gaacgtccag gccaatatag gcacccaggg tgggcaaaac 420 ccggcgatgg gcagtcactt cctgggctta ttgatccatg aactggggca taccctgggg 480 ctgagtcatc caggtaaata cgacggccag ggtttcaatt acgatcgggc tgccgaatat 540 gcccaggaca ccaaggctcg cagtgtcatg agctattgga cggagactca tcagccgggg 600 cacaattttg ccgggcgcag cccgggtgcc ccgatgatgg acgatatcgc cgccgcccag 660 cggctctacg gcgccaacac caaaacccgg aataccgaca ccacctacgg cttcaattcc 720 aattcaggcc gggaggctta tagcctcaag caggggagcg acaagccgat cttcaccgtc 780 tgggacggtg gaggtaatga cacgctcgac ttctccgggt tcacccagaa ccaaaccatc 840 aacctcaagg ctgagtcatt ctcggacgtg gggggcttgc gaggaaatgt gtcgattgcc 900 aagggtgtga gtgtggaaaa cgccattggc ggtacaggca acgatacctt gacggggaac 960 gagggcaaca atcggctcac gggcggcaag ggggccgata agctgcacgg cggagctgga 1020 gcagacacgt ttgtttaccg ccgcgccagc gattcaacgc cgcaggcacc ggacatcatc 1080 caggacttcc agagcgggag cgacaagatc gacctgaccg gtgttgttca ggaggcgggg 1140 ctcaagtcgc tgagcttcgt cgagaaattc agcggcaagg cgggcgaggc cgtgctcggc 1200 caagacgcga aaaccggccg tttcacgttg gcggtggaca caacgggaaa tggtacggcg 1260 gatctactgg ttgccagcca aagccagatc aaacaggcgg atgtgatctg gaacggtcag 1320 gcgccgacag tgacgccaac gcctgaaccc actgtggtgc ctgtgtcaga tcccgtgccg 1380 acccctactt cagagccgac tgaacctgaa cccacgcctg agcccgcccc tttgcccgtc 1440 ccgactccac ggcctggagg agggtttatc gggaaaattt tttcatcatt caaggggttc 1500 ataaaaaaag tgtggtcgat attcaggtga 1530 <210> 11 <211> 24 <212> PRT <213> Pseudomonas fluorescens <400> 11 Met Arg Ser Arg Leu Phe Asn Phe Leu Ser Cys Leu Leu Leu Ser Ala 1 5 10 15 Thr Ala Val Gln Ser Ala Gln Ala 20 <210> 12 <211> 69 <212> DNA <213> Pseudomonas fluorescens <400> 12 atgcgcagtc gccttttcaa ctttttatct tgtctgcttc tttccgccac tgccgttcaa 60 tccgcccag 69 <210> 13 <211> 20 <212> PRT <213> Pseudomonas fluorescens <400> 13 Met Phe Ala Lys Leu Val Ala Val Ser Leu Leu Thr Leu Ala Ser Gly 1 5 10 15 Gln Leu Leu Ala 20 <210> 14 <211> 57 <212> DNA <213> Pseudomonas fluorescens <400> 14 atgtttgcca aactcgttgc tgtttccctg ctgactctgg cgagcggcca gttgctt 57 <210> 15 <211> 22 <212> PRT <213> Pseudomonas fluorescens <400> 15 Met Arg Asn Leu Ile Leu Ser Ala Ala Leu Val Thr Ala Ser Leu Phe 1 5 10 15 Gly Met Thr Ala Gln Ala 20 <210> 16 <211> 63 <212> DNA <213> Pseudomonas fluorescens <400> 16 atgcgtaatc tgatcctcag cgccgctctc gtcactgcca gcctcttcgg catgaccgca 60 caa 63 <210> 17 <211> 25 <212> PRT <213> Pseudomonas fluorescens <400> 17 Met Lys Ser Ala Leu Lys Asn Val Ile Pro Gly Ala Leu Ala Leu Leu 1 5 10 15 Leu Leu Phe Pro Val Ala Ala Gln Ala 20 25 <210> 18 <211> 75 <212> DNA <213> Pseudomonas fluorescens <400> 18 atgaaatctg cattgaagaa cgttattccg ggcgccctgg cccttctgct gctattcccc 60 gtcgccgccc aggcc 75 <210> 19 <211> 21 <212> PRT <213> Pseudomonas fluorescens <400> 19 Met Lys Lys Ser Thr Leu Ala Val Ala Val Thr Leu Gly Ala Ile Ala 1 5 10 15 Gln Gln Ala Gly Ala 20 <210> 20 <211> 63 <212> DNA <213> Pseudomonas fluorescens <400> 20 atgaagaagt ccaccttggc tgtggctgta acgttgggcg caatcgccca gcaagcaggc 60 gcc 63 <210> 21 <211> 229 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 21 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Val Phe Thr Asp Tyr 20 25 30 Gly Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Met 35 40 45 Gly Trp Ile Asn Thr Tyr Ile Gly Glu Pro Ile Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Phe Ser Leu Asp Thr Ser Lys Ser Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Gly Tyr Arg Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro 115 120 125 Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly 130 135 140 Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn 145 150 155 160 Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln 165 170 175 Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser 180 185 190 Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser 195 200 205 Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr 210 215 220 His Thr Cys Ala Ala 225 <210> 22 <211> 687 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 22 gaagtgcaac tggtggagag cggcggtggc ttggttcagc cgggtggctc cctgcgtctg 60 tcgtgtgcgg cctccgggta cgtgttcacc gactacggca tgaactgggt ccgccaggcc 120 ccagggaagg gtctggaatg gatgggctgg atcaacacgt atatcggcga accgatttat 180 gcggacagcg taaaagggcg cttcaccttt agcttggata cctccaaaag tacggcctac 240 ctgcagatga attccctgcg ggcagaggat accgcggtgt attactgcgc tcgcggctac 300 cgcagctacg cgatggacta ctggggccaa ggcaccctgg tgacggtgag ttcggccagc 360 accaagggcc ctagcgtgtt cccactcgcc cccagcagca aatcgacctc gggcggtacg 420 gccgcactcg gctgcctggt gaaggactat ttcccggagc cggtgaccgt cagttggaac 480 agtggtgccc tgactagcgg cgtgcacacc tttcccgccg ttctgcagag ctcgggcttg 540 tactccttgt cgtccgtcgt aactgtgccc agcagctcgc tcggcaccca gacctacatc 600 tgcaatgtca accacaagcc gagcaacacc aaagtggata agaaggtcga accgaagtcc 660 tgcgacaaga cccatacctg tgcggcc 687 <210> 23 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 23 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Asn Val Gly Thr Asn 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Ala Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Tyr Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn Ile Tyr Pro Leu 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala 100 105 110 Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly 115 120 125 Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala 130 135 140 Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln 145 150 155 160 Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser 165 170 175 Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr 180 185 190 Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser 195 200 205 Phe Asn Arg Gly Glu Cys 210 <210> 24 <211> 642 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 gacattcaga tgacccagag ccccagcagc ctgagcgcca gcgtagggga ccgcgtgacc 60 atcacctgta aagccagtca aaacgtcggt accaacgtgg catggtatca acaaaaaccg 120 ggtaaagccc ccaaagcgtt gatctactcc gccagtttcc tgtatagcgg cgtgccgtac 180 cgcttcagcg gctccggcag cggtaccgac tttaccctga ccatttcctc gctgcaaccc 240 gaggactttg cgacctacta ttgccagcag tataacatct acccgctgac gttcgggcag 300 ggcacgaagg tcgaaatcaa acggaccgta gcggcaccga gtgtgttcat cttccctccg 360 agcgacgaac agttgaagtc cggcaccgcc tcggtcgtgt gcctgctcaa taacttctac 420 ccacgcgagg ctaaggtgca atggaaggtg gacaacgccc tgcagtcggg caatagtcag 480 gaatcggtga ctgaacagga ttccaaggat agcacctact cgctcagcag cacgctgacc 540 ttgtcgaagg ccgattacga gaagcataag gtctacgcgt gcgaagtgac gcaccagggc 600 ctgtcctcgc cggttactaa gagctttaac cgtggcgagt gc 642 <210> 25 <211> 253 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Arg Ser Arg Leu Phe Asn Phe Leu Ser Cys Leu Leu Leu Ser Ala 1 5 10 15 Thr Ala Val Gln Ser Ala Gln Ala Glu Val Gln Leu Val Glu Ser Gly 20 25 30 Gly Gly Leu Val Gln Pro Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala 35 40 45 Ser Gly Tyr Val Phe Thr Asp Tyr Gly Met Asn Trp Val Arg Gln Ala 50 55 60 Pro Gly Lys Gly Leu Glu Trp Met Gly Trp Ile Asn Thr Tyr Ile Gly 65 70 75 80 Glu Pro Ile Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Phe Ser Leu 85 90 95 Asp Thr Ser Lys Ser Thr Ala Tyr Leu Gln Met Asn Ser Leu Arg Ala 100 105 110 Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Gly Tyr Arg Ser Tyr Ala 115 120 125 Met Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser 130 135 140 Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr 145 150 155 160 Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro 165 170 175 Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val 180 185 190 His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser 195 200 205 Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile 210 215 220 Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val 225 230 235 240 Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Ala Ala 245 250 <210> 26 <211> 234 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Phe Ala Lys Leu Val Ala Val Ser Leu Leu Thr Leu Ala Ser Gly 1 5 10 15 Gln Leu Leu Ala Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser 20 25 30 Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Lys Ala Ser Gln Asn 35 40 45 Val Gly Thr Asn Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro 50 55 60 Lys Ala Leu Ile Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Tyr 65 70 75 80 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser 85 90 95 Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Asn 100 105 110 Ile Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg 115 120 125 Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln 130 135 140 Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr 145 150 155 160 Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser 165 170 175 Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr 180 185 190 Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys 195 200 205 His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro 210 215 220 Val Thr Lys Ser Phe Asn Arg Gly Glu Cys 225 230 <210> 27 <211> 421 <212> PRT <213> Homo sapiens <400> 27 Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro Ser Asn Phe 1 5 10 15 Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val Glu Phe Tyr 20 25 30 Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys 35 40 45 Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala Val Asp Ala 50 55 60 Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly Val Gln Gly Phe Pro 65 70 75 80 Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu Asp Tyr Gln 85 90 95 Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu Ser Ala Leu 100 105 110 Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly Gly Tyr Ser 115 120 125 Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser Lys Lys Asp Val Ile 130 135 140 Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Leu Asp Ser Glu Asp 145 150 155 160 Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Asn 165 170 175 Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu Val Lys Glu Gln Thr 180 185 190 Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val Asn Gln Val 195 200 205 Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile Phe 210 215 220 Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg Ser 225 230 235 240 Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro Pro 245 250 255 Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys Arg Thr Cys 260 265 270 Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His Ile Leu Asp 275 280 285 Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu Leu Lys Leu 290 295 300 Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr Glu Ala 305 310 315 320 Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly Ile Gly Gly Phe Gly 325 330 335 Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys Phe Ala Leu 340 345 350 Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg Glu 355 360 365 Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly Gly Ala Phe 370 375 380 Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly Arg Asp Gly Glu Leu 385 390 395 400 Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu Asp Asp Leu 405 410 415 Gly Lys Asp Glu Leu 420 <210> 28 <211> 442 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Lys Lys Ser Thr Leu Ala Val Ala Val Thr Leu Gly Ala Ile Ala 1 5 10 15 Gln Gln Ala Gly Ala Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu 20 25 30 Thr Pro Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp 35 40 45 Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr 50 55 60 Pro Glu Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val 65 70 75 80 Gly Ala Val Asp Ala Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly 85 90 95 Val Gln Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg 100 105 110 Pro Glu Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala 115 120 125 Ala Leu Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg 130 135 140 Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser 145 150 155 160 Lys Lys Asp Val Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val 165 170 175 Leu Asp Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys 180 185 190 Gly His Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu 195 200 205 Val Lys Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala 210 215 220 Thr Val Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro 225 230 235 240 Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly 245 250 255 Gly Arg Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser 260 265 270 Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile 275 280 285 Ala Lys Arg Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu 290 295 300 Pro His Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu 305 310 315 320 Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp 325 330 335 Leu Trp Thr Glu Ala Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly 340 345 350 Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys 355 360 365 Met Lys Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn 370 375 380 Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val 385 390 395 400 Gly Gly Gly Ala Phe Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly 405 410 415 Arg Asp Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val 420 425 430 Glu Leu Asp Asp Leu Gly Lys Asp Glu Leu 435 440 <210> 29 <211> 478 <212> PRT <213> Pseudomonas fluorescens <400> 29 Met Ser Ile Pro Arg Leu Lys Ser Tyr Leu Ser Ile Val Ala Thr Val 1 5 10 15 Leu Val Leu Gly Gln Ala Leu Pro Ala Gln Ala Val Glu Leu Pro Asp 20 25 30 Phe Thr Gln Leu Val Glu Gln Ala Ser Pro Ala Val Val Asn Ile Ser 35 40 45 Thr Thr Gln Lys Leu Pro Asp Arg Lys Val Ser Asn Gln Gln Met Pro 50 55 60 Asp Leu Glu Gly Leu Pro Pro Met Leu Arg Glu Phe Phe Glu Arg Gly 65 70 75 80 Met Pro Gln Pro Arg Ser Pro Arg Gly Gly Gly Gly Gln Arg Glu Ala 85 90 95 Gln Ser Leu Gly Ser Gly Phe Ile Ile Ser Pro Asp Gly Tyr Ile Leu 100 105 110 Thr Asn Asn His Val Ile Ala Asp Ala Asp Glu Ile Leu Val Arg Leu 115 120 125 Ala Asp Arg Ser Glu Leu Lys Ala Lys Leu Ile Gly Thr Asp Pro Arg 130 135 140 Ser Asp Val Ala Leu Leu Lys Ile Glu Gly Lys Asp Leu Pro Val Leu 145 150 155 160 Lys Leu Gly Lys Ser Gln Asp Leu Lys Ala Gly Gln Trp Val Val Ala 165 170 175 Ile Gly Ser Pro Phe Gly Phe Asp His Thr Val Thr Gln Gly Ile Val 180 185 190 Ser Ala Ile Gly Arg Ser Leu Pro Asn Glu Asn Tyr Val Pro Phe Ile 195 200 205 Gln Thr Asp Val Pro Ile Asn Pro Gly Asn Ala Gly Gly Pro Leu Phe 210 215 220 Asn Leu Ala Gly Glu Val Val Gly Ile Asn Ser Gln Ile Tyr Thr Arg 225 230 235 240 Ser Gly Gly Phe Met Gly Val Ser Phe Ala Ile Pro Ile Asp Val Ala 245 250 255 Met Asp Val Ser Asn Gln Leu Lys Ser Gly Gly Lys Val Ser Arg Gly 260 265 270 Trp Leu Gly Val Val Ile Gln Glu Val Asn Lys Asp Leu Ala Glu Ser 275 280 285 Phe Gly Leu Asp Lys Pro Ala Gly Ala Leu Val Ala Gln Ile Gln Asp 290 295 300 Asn Gly Pro Ala Ala Lys Gly Gly Leu Lys Val Gly Asp Val Ile Leu 305 310 315 320 Ser Met Asn Gly Gln Pro Ile Ile Met Ser Ala Asp Leu Pro His Leu 325 330 335 Val Gly Ala Leu Lys Ala Gly Gly Lys Ala Lys Leu Glu Val Ile Arg 340 345 350 Asp Gly Lys Arg Gln Asn Val Glu Leu Thr Val Gly Ala Ile Pro Glu 355 360 365 Glu Gly Ala Thr Leu Asp Ala Leu Gly Asn Ala Lys Pro Gly Ala Glu 370 375 380 Arg Ser Ser Asn Arg Leu Gly Ile Ala Val Val Glu Leu Thr Ala Glu 385 390 395 400 Gln Lys Lys Thr Phe Asp Leu Gln Ser Gly Val Val Ile Lys Glu Val 405 410 415 Gln Asp Gly Pro Ala Ala Leu Ile Gly Leu Gln Pro Gly Asp Val Ile 420 425 430 Thr His Leu Asn Asn Gln Ala Ile Asp Thr Thr Lys Glu Phe Ala Asp 435 440 445 Ile Ala Lys Ala Leu Pro Lys Asn Arg Ser Val Ser Met Arg Val Leu 450 455 460 Arg Gln Gly Arg Ala Ser Phe Ile Thr Phe Lys Leu Ala Glu 465 470 475 <210> 30 <211> 1434 <212> DNA <213> Pseudomonas fluorescens <400> 30 atgtcgatac cacgtttgaa gtcttactta tccatagtcg ccacagtgct ggtgctgggt 60 caggccttac ctgcgcaagc ggtcgagttg cctgacttca cccaactggt ggagcaggcc 120 tcgcctgccg tggtgaacat cagtaccacg cagaagctgc cggatcgcaa agtctcgaac 180 cagcagatgc ccgacctgga aggcttgccg cccatgctgc gcgagttctt cgaacgaggg 240 atgccgcaac cacgctcccc ccgtggcggc ggtggccagc gcgaagccca atccctgggc 300 tccggcttca tcatttcgcc tgacggctat atcctcacca acaaccacgt gattgccgat 360 gccgacgaga ttctcgtgcg cctggccgac cgcagtgaac tcaaggccaa gctgattggc 420 accgatccac gttccgacgt ggccttgctt aaaatcgagg gcaaggactt gccggtgctt 480 aagctgggca agtcccagga cctgaaggcc ggtcagtggg tggtcgcgat cggttcgccg 540 ttcggctttg accacaccgt tacccaaggc atcgtcagcg ccatcggtcg cagcctgccg 600 aacgaaaact acgtaccgtt catccagacc gacgtgccga tcaacccggg taacgccggt 660 ggcccgctgt tcaacctggc cggcgaagtg gtggggatca actcgcagat ctacacccgc 720 tccggcggct tcatgggcgt gtctttcgcg atcccaatcg atgtggccat ggacgtctcc 780 aatcagctca aaagcggcgg caaggtcagc cgcggctggt tgggcgtggt aatccaggaa 840 gtgaacaagg acctggctga gtccttcggt ctcgacaagc cggccggtgc cctggttgcg 900 cagattcagg acaatggccc tgcggccaaa ggcggcctga aagtcggtga cgtcatcctg 960 agcatgaacg gccagccgat catcatgtcg gcagacttgc ctcatttggt cggcgcgctc 1020 aaggccggcg gcaaagccaa gctggaagtg attcgtgatg gcaagcgcca gaacgtcgaa 1080 ctgaccgtag gtgccatccc ggaagaaggc gcgaccctgg atgccctggg caacgccaag 1140 cccggtgccg agcgcagcag taaccgcctg ggtatcgccg tggttgaact gaccgccgag 1200 cagaagaaaa ccttcgacct gcaaagcggt gtggtgatca aggaagttca ggacggccca 1260 gccgccttga tcggcctgca accgggtgac gtgatcactc acttgaacaa ccaggcaatc 1320 gataccacca aggaattcgc cgacatcgcc aaggcgttgc cgaagaatcg ctcggtgtcg 1380 atgcgcgtcc tgcgtcaagg ccgtgccagc ttcattacct tcaagctggc tgag 1434 <210> 31 <211> 478 <212> PRT <213> Pseudomonas fluorescens <400> 31 Met Ser Ile Pro Arg Leu Lys Ser Tyr Leu Ser Ile Val Ala Thr Val 1 5 10 15 Leu Val Leu Gly Gln Ala Leu Pro Ala Gln Ala Val Glu Leu Pro Asp 20 25 30 Phe Thr Gln Leu Val Glu Gln Ala Ser Pro Ala Val Val Asn Ile Ser 35 40 45 Thr Thr Gln Lys Leu Pro Asp Arg Lys Val Ser Asn Gln Gln Met Pro 50 55 60 Asp Leu Glu Gly Leu Pro Pro Met Leu Arg Glu Phe Phe Glu Arg Gly 65 70 75 80 Met Pro Gln Pro Arg Ser Pro Arg Gly Gly Gly Gly Gln Arg Glu Ala 85 90 95 Gln Ser Leu Gly Ser Gly Phe Ile Ile Ser Pro Asp Gly Tyr Ile Leu 100 105 110 Thr Asn Asn His Val Ile Ala Asp Ala Asp Glu Ile Leu Val Arg Leu 115 120 125 Ala Asp Arg Ser Glu Leu Lys Ala Lys Leu Ile Gly Thr Asp Pro Arg 130 135 140 Ser Asp Val Ala Leu Leu Lys Ile Glu Gly Lys Asp Leu Pro Val Leu 145 150 155 160 Lys Leu Gly Lys Ser Gln Asp Leu Lys Ala Gly Gln Trp Val Val Ala 165 170 175 Ile Gly Ser Pro Phe Gly Phe Asp His Thr Val Thr Gln Gly Ile Val 180 185 190 Ser Ala Ile Gly Arg Ser Leu Pro Asn Glu Asn Tyr Val Pro Phe Ile 195 200 205 Gln Thr Asp Val Pro Ile Asn Pro Gly Asn Ser Gly Gly Pro Leu Phe 210 215 220 Asn Leu Ala Gly Glu Val Val Gly Ile Asn Ser Gln Ile Tyr Thr Arg 225 230 235 240 Ser Gly Gly Phe Met Gly Val Ser Phe Ala Ile Pro Ile Asp Val Ala 245 250 255 Met Asp Val Ser Asn Gln Leu Lys Ser Gly Gly Lys Val Ser Arg Gly 260 265 270 Trp Leu Gly Val Val Ile Gln Glu Val Asn Lys Asp Leu Ala Glu Ser 275 280 285 Phe Gly Leu Asp Lys Pro Ala Gly Ala Leu Val Ala Gln Ile Gln Asp 290 295 300 Asn Gly Pro Ala Ala Lys Gly Gly Leu Lys Val Gly Asp Val Ile Leu 305 310 315 320 Ser Met Asn Gly Gln Pro Ile Ile Met Ser Ala Asp Leu Pro His Leu 325 330 335 Val Gly Ala Leu Lys Ala Gly Gly Lys Ala Lys Leu Glu Val Ile Arg 340 345 350 Asp Gly Lys Arg Gln Asn Val Glu Leu Thr Val Gly Ala Ile Pro Glu 355 360 365 Glu Gly Ala Thr Leu Asp Ala Leu Gly Asn Ala Lys Pro Gly Ala Glu 370 375 380 Arg Ser Ser Asn Arg Leu Gly Ile Ala Val Val Glu Leu Thr Ala Glu 385 390 395 400 Gln Lys Lys Thr Phe Asp Leu Gln Ser Gly Val Val Ile Lys Glu Val 405 410 415 Gln Asp Gly Pro Ala Ala Leu Ile Gly Leu Gln Pro Gly Asp Val Ile 420 425 430 Thr His Leu Asn Asn Gln Ala Ile Asp Thr Thr Lys Glu Phe Ala Asp 435 440 445 Ile Ala Lys Ala Leu Pro Lys Asn Arg Ser Val Ser Met Arg Val Leu 450 455 460 Arg Gln Gly Arg Ala Ser Phe Ile Thr Phe Lys Leu Ala Glu 465 470 475 <210> 32 <211> 188 <212> PRT <213> Escherichia coli <400> 32 Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Gly Ile Pro 1 5 10 15 Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ala Asn Asn Thr 20 25 30 Ala Lys Asn Met His Pro Glu Thr Arg Ala Val Gly Ser Glu Thr Ser 35 40 45 Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Asn Leu Val Arg Asn Val 50 55 60 Asp Val Lys Ser Arg Ile Met Asp Gln Tyr Ala Asp Trp Lys Gly Val 65 70 75 80 Arg Tyr Arg Leu Gly Gly Ser Thr Lys Lys Gly Ile Asp Cys Ser Gly 85 90 95 Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro Arg 100 105 110 Ser Thr Tyr Glu Gln Gln Glu Met Gly Lys Ser Val Ser Arg Ser Asn 115 120 125 Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly Arg 130 135 140 His Val Gly Ile Tyr Ile Gly Asn Asn Gln Phe Val His Ala Ser Thr 145 150 155 160 Ser Ser Gly Val Ile Ile Ser Ser Met Asn Glu Pro Tyr Trp Lys Lys 165 170 175 Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser 180 185 <210> 33 <211> 693 <212> PRT <213> Pseudomonas fluorescens <400> 33 Met Lys His Leu Phe Pro Ser Thr Ala Leu Ala Phe Phe Ile Gly Leu 1 5 10 15 Gly Phe Ala Ser Met Ser Thr Asn Thr Phe Ala Ala Asn Ser Trp Asp 20 25 30 Asn Leu Gln Pro Asp Arg Asp Glu Val Ile Ala Ser Leu Asn Val Val 35 40 45 Glu Leu Leu Lys Arg His His Tyr Ser Lys Pro Pro Leu Asp Asp Ala 50 55 60 Arg Ser Val Ile Ile Tyr Asp Ser Tyr Leu Lys Leu Leu Asp Pro Ser 65 70 75 80 Arg Ser Tyr Phe Leu Ala Ser Asp Ile Ala Glu Phe Asp Lys Trp Lys 85 90 95 Thr Gln Phe Asp Asp Phe Leu Lys Ser Gly Asp Leu Gln Pro Gly Phe 100 105 110 Thr Ile Tyr Lys Arg Tyr Leu Asp Arg Val Lys Ala Arg Leu Asp Phe 115 120 125 Ala Leu Gly Glu Leu Asn Lys Gly Val Asp Lys Leu Asp Phe Thr Gln 130 135 140 Lys Glu Thr Leu Leu Val Asp Arg Lys Asp Ala Pro Trp Leu Thr Ser 145 150 155 160 Thr Ala Ala Leu Asp Asp Leu Trp Arg Lys Arg Val Lys Asp Glu Val 165 170 175 Leu Arg Leu Lys Ile Ala Gly Lys Glu Pro Lys Ala Ile Gln Glu Leu 180 185 190 Leu Thr Lys Arg Tyr Lys Asn Gln Leu Ala Arg Leu Asp Gln Thr Arg 195 200 205 Ala Glu Asp Ile Phe Gln Ala Tyr Ile Asn Thr Phe Ala Met Ser Tyr 210 215 220 Asp Pro His Thr Asn Tyr Leu Ser Pro Asp Asn Ala Glu Asn Phe Asp 225 230 235 240 Ile Asn Met Ser Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Ser 245 250 255 Asp Asn Asp Gln Val Lys Ile Val Arg Leu Val Pro Ala Gly Pro Ala 260 265 270 Asp Lys Thr Lys Gln Val Ala Pro Ala Asp Lys Ile Ile Gly Val Ala 275 280 285 Gln Ala Asp Lys Glu Met Val Asp Val Val Gly Trp Arg Leu Asp Glu 290 295 300 Val Val Lys Leu Ile Arg Gly Pro Lys Gly Ser Val Val Arg Leu Glu 305 310 315 320 Val Ile Pro His Thr Asn Ala Pro Asn Asp Gln Thr Ser Lys Ile Val 325 330 335 Ser Ile Thr Arg Glu Ala Val Lys Leu Glu Asp Gln Ala Val Gln Lys 340 345 350 Lys Val Leu Asn Leu Lys Gln Asp Gly Lys Asp Tyr Lys Leu Gly Val 355 360 365 Ile Glu Ile Pro Ala Phe Tyr Leu Asp Phe Lys Ala Phe Arg Ala Gly 370 375 380 Asp Pro Asp Tyr Lys Ser Thr Thr Arg Asp Val Lys Lys Ile Leu Thr 385 390 395 400 Glu Leu Gln Lys Glu Lys Val Asp Gly Val Val Ile Asp Leu Arg Asn 405 410 415 Asn Gly Gly Gly Ser Leu Gln Glu Ala Thr Glu Leu Thr Ser Leu Phe 420 425 430 Ile Asp Lys Gly Pro Thr Val Leu Val Arg Asn Ala Asp Gly Arg Val 435 440 445 Asp Val Leu Glu Asp Glu Asn Pro Gly Ala Phe Tyr Lys Gly Pro Met 450 455 460 Ala Leu Leu Val Asn Arg Leu Ser Ala Ser Ala Ser Glu Ile Phe Ala 465 470 475 480 Gly Ala Met Gln Asp Tyr His Arg Ala Leu Ile Ile Gly Gly Gln Thr 485 490 495 Phe Gly Lys Gly Thr Val Gln Thr Ile Gln Pro Leu Asn His Gly Glu 500 505 510 Leu Lys Leu Thr Leu Ala Lys Phe Tyr Arg Val Ser Gly Gln Ser Thr 515 520 525 Gln His Gln Gly Val Leu Pro Asp Ile Asp Phe Pro Ser Ile Ile Asp 530 535 540 Thr Lys Glu Ile Gly Glu Ser Ala Leu Pro Glu Ala Met Pro Trp Asp 545 550 555 560 Thr Ile Arg Pro Ala Ile Lys Pro Ala Ser Asp Pro Phe Lys Pro Phe 565 570 575 Leu Ala Gln Leu Lys Ala Asp His Asp Thr Arg Ser Ala Lys Asp Ala 580 585 590 Glu Phe Val Phe Ile Arg Asp Lys Leu Ala Leu Ala Lys Lys Leu Met 595 600 605 Glu Glu Lys Thr Val Ser Leu Asn Glu Ala Asp Arg Arg Ala Gln His 610 615 620 Ser Ser Ile Glu Asn Gln Gln Leu Val Leu Glu Asn Thr Arg Arg Lys 625 630 635 640 Ala Lys Gly Glu Asp Pro Leu Lys Glu Leu Lys Lys Glu Asp Glu Asp 645 650 655 Ala Leu Pro Thr Glu Ala Asp Lys Thr Lys Pro Glu Asp Asp Ala Tyr 660 665 670 Leu Ala Glu Thr Gly Arg Ile Leu Leu Asp Tyr Leu Lys Ile Thr Lys 675 680 685 Gln Val Ala Lys Gln 690 <210> 34 <211> 2082 <212> DNA <213> Pseudomonas fluorescens <400> 34 atgaagcatc tgttccccag caccgccctc gcttttttca ttggtctcgg cttcgcgtcg 60 atgtcgacca atacgttcgc agccaatagc tgggacaacc ttcagcctga tcgcgatgag 120 gtgattgcca gccttaacgt cgtcgagttg cttaagcgcc atcactacag caagccgccg 180 ctggacgacg ctcgctcagt gatcatctac gacagctacc tcaagctgct ggacccgtcg 240 cgcagctact tcctggccag cgatatcgct gagttcgaca agtggaagac gcaattcgac 300 gacttcctca agagcggcga cctgcagcct ggcttcacca tctacaagcg ctacctagac 360 cgcgtcaaag cgcgtctgga cttcgccctg ggtgagctga acaaaggcgt cgacaagctc 420 gatttcaccc agaaagaaac ccttctggtg gaccgcaagg acgccccttg gctgaccagc 480 accgcagccc tagacgacct gtggcgcaaa cgcgtcaagg acgaagtgct gcgcttgaag 540 atcgccggca aagagcccaa ggccattcaa gagctgttga ccaagcgcta caaaaaccag 600 ctggcgcgcc tggaccagac ccgtgccgag gatatcttcc aggcctacat caacaccttt 660 gcgatgtcct acgacccgca caccaattat ctgtcgccag ataacgcgga aaatttcgat 720 atcaatatga gtctgtccct ggaaggcatc ggtgccgtcc tgcaaagcga caatgaccag 780 gtgaagattg tacgtctggt gccggcaggc ccggctgaca aaaccaagca agtggcaccg 840 gccgacaaga tcatcggcgt ggcccaggcc gacaaagaga tggtcgatgt ggtcggctgg 900 cgcctggacg aagtggtcaa gctgatccgt gggcctaaag gcagcgtggt gcgcctggaa 960 gtgattccgc acaccaatgc accgaacgac cagaccagca agatcgtgtc catcacccgt 1020 gaagcggtga agctcgaaga ccaggccgtg cagaagaaag tcctcaacct caagcaggat 1080 ggcaaggact acaagctggg ggtgattgaa atcccggcct tctacctgga cttcaaggcg 1140 ttccgtgccg gtgatccgga ctacaagtcc accacccgcg acgtgaagaa aatcctcaca 1200 gaactgcaga aagagaaagt cgacggcgtg gtcatcgacc tgcgcaacaa cggcggcggc 1260 tccctgcagg aagccaccga gctgaccagc ctgtttatcg acaagggccc gaccgtgttg 1320 gtacgcaacg ctgacggccg tgtcgacgtg ctcgaagacg agaacccggg ggccttctac 1380 aaagggccga tggcgctgct ggtcaaccgc ctctcggcct cggcctcgga gattttcgcc 1440 ggtgccatgc aggactacca ccgtgcactg atcatcggcg gccagacctt cggcaaaggc 1500 accgtgcaga ccatccagcc gctgaaccat ggcgagctta agctgacact ggccaagttc 1560 taccgggtct ccgggcagag cacccagcat cagggcgtac tgccggatat cgatttcccg 1620 tcgatcatcg acaccaagga aattggcgaa agcgccctgc ctgaagccat gccgtgggac 1680 accatccgcc ctgcgatcaa gccggcgtcg gatccgttca agccgttcct ggcacagctg 1740 aaggctgacc acgacacccg ctctgccaag gatgccgagt tcgtgtttat ccgcgacaag 1800 ctggccctgg ccaagaagct gatggaagag aagaccgtca gcctcaacga agcggatcgc 1860 cgtgcacagc actccagcat cgagaatcag caactggtgc tggaaaacac ccgccgcaag 1920 gccaaaggtg aagacccgct caaagagctg aagaaagaag atgaagacgc gctgccgacc 1980 gaggcggata aaaccaagcc ggaagacgac gcctacttgg ccgagactgg ccggatcctg 2040 ctggattacc tgaagatcac caagcaggtg gccaagcagt aa 2082 <210> 35 <211> 437 <212> PRT <213> Pseudomonas fluorescens <400> 35 Met Leu His Leu Ser Arg Leu Thr Ser Leu Ala Leu Thr Ile Ala Leu 1 5 10 15 Val Ile Gly Ala Pro Leu Ala Phe Ala Asp Gln Ala Ala Pro Ala Ala 20 25 30 Pro Ala Thr Ala Ala Thr Thr Lys Ala Pro Leu Pro Leu Asp Glu Leu 35 40 45 Arg Thr Phe Ala Glu Val Met Asp Arg Ile Lys Ala Ala Tyr Val Glu 50 55 60 Pro Val Asp Asp Lys Ala Leu Leu Glu Asn Ala Ile Lys Gly Met Leu 65 70 75 80 Ser Asn Leu Asp Pro His Ser Ala Tyr Leu Gly Pro Glu Asp Phe Ala 85 90 95 Glu Leu Gln Glu Ser Thr Ser Gly Glu Phe Gly Gly Leu Gly Ile Glu 100 105 110 Val Gly Ser Glu Asp Gly Gln Ile Lys Val Val Ser Pro Ile Asp Asp 115 120 125 Thr Pro Ala Ser Lys Ala Gly Ile Gln Ala Gly Asp Leu Ile Val Lys 130 135 140 Ile Asn Gly Gln Pro Thr Arg Gly Gln Thr Met Thr Glu Ala Val Asp 145 150 155 160 Lys Met Arg Gly Lys Leu Gly Gln Lys Ile Thr Leu Thr Leu Val Arg 165 170 175 Asp Gly Gly Asn Pro Phe Asp Val Thr Leu Ala Arg Ala Thr Ile Thr 180 185 190 Val Lys Ser Val Lys Ser Gln Leu Leu Glu Ser Gly Tyr Gly Tyr Ile 195 200 205 Arg Ile Thr Gln Phe Gln Val Lys Thr Gly Asp Glu Val Ala Lys Ala 210 215 220 Leu Ala Lys Leu Arg Lys Asp Asn Gly Lys Lys Leu Asn Gly Ile Val 225 230 235 240 Leu Asp Leu Arg Asn Asn Pro Gly Gly Val Leu Gln Ser Ala Val Glu 245 250 255 Val Val Asp His Phe Val Thr Lys Gly Leu Ile Val Tyr Thr Lys Gly 260 265 270 Arg Ile Ala Asn Ser Glu Leu Arg Phe Ser Ala Thr Gly Asn Asp Leu 275 280 285 Ser Glu Asn Val Pro Leu Ala Val Leu Ile Asn Gly Gly Ser Ala Ser 290 295 300 Ala Ser Glu Ile Val Ala Gly Ala Leu Gln Asp Leu Lys Arg Gly Val 305 310 315 320 Leu Met Gly Thr Thr Ser Phe Gly Lys Gly Ser Val Gln Thr Val Leu 325 330 335 Pro Leu Asn Asn Glu Arg Ala Leu Lys Ile Thr Thr Ala Leu Tyr Tyr 340 345 350 Thr Pro Asn Gly Arg Ser Ile Gln Ala Gln Gly Ile Val Pro Asp Ile 355 360 365 Glu Val Arg Arg Ala Lys Ile Thr Asn Glu Ile Asp Gly Glu Tyr Tyr 370 375 380 Lys Glu Ala Asp Leu Gln Gly His Leu Gly Asn Gly Asn Gly Gly Ala 385 390 395 400 Asp Gln Pro Thr Gly Ser Arg Ala Lys Ala Lys Pro Met Pro Gln Asp 405 410 415 Asp Asp Tyr Gln Leu Ala Gln Ala Leu Ser Leu Leu Lys Gly Leu Ser 420 425 430 Ile Thr Arg Ser Arg 435 <210> 36 <211> 1314 <212> DNA <213> Pseudomonas fluorescens <400> 36 atgctgcatt tgtcccgcct cacttcgctg gccctgacga tcgccctggt gatcggcgcg 60 cctctggctt ttgccgacca ggccgcaccg gctgcacccg ccacggctgc gacgaccaag 120 gcgccattgc cgctggacga gctgcgtacc tttgccgagg tcatggaccg gatcaaggca 180 gcgtatgtcg aacccgtaga cgacaaggcc ctgctggaaa atgccatcaa gggcatgctc 240 agcaacctcg acccgcactc cgcctacctg ggcccggaag atttcgccga gctgcaggaa 300 agcaccagcg gtgagttcgg cggcctgggc atcgaagtgg gctccgaaga cggccagatc 360 aaagtggtct cgcctatcga cgacaccccg gcgtccaagg ccggtatcca ggccggcgac 420 ctgatcgtga agatcaacgg ccagccaacc cgcggccaga ccatgaccga agccgtcgac 480 aagatgcgcg gcaagctcgg ccagaagatc accctgaccc tggtacgcga cggcggcaac 540 ccgtttgacg tgaccctggc ccgcgcgacc atcacggtca agagcgtgaa aagccagctg 600 ctggagtcgg gctacggtta tatccgtatc acccagttcc aggtcaagac cggcgacgaa 660 gtggccaagg ccctggccaa gctgcgcaaa gacaacggca agaagctcaa cggcatcgtg 720 cttgacctgc gcaacaaccc aggcggcgtg ttgcagtcgg cggtcgaggt ggtcgaccac 780 ttcgtcacca agggcctgat cgtctacacc aagggccgta tcgccaactc agagttgcgc 840 ttctcggcca ccggcaacga cctcagcgag aacgtgccac tggcggtatt gatcaacggt 900 ggcagcgcct cggcttcgga aatcgtcgcc ggtgccctgc aagacctcaa gcgcggcgtg 960 ctgatgggca ccaccagctt cggcaaaggc tcggtgcaga ccgtattgcc gctgaacaac 1020 gagcgtgcgc tgaagatcac cacggcgctg tactacacgc ccaacggccg ctcgatccag 1080 gcccagggca tcgtgccgga catcgaagta cgccgcgcca agatcaccaa cgagatcgac 1140 ggcgaatact acaaagaggc cgacctgcaa ggtcacctgg gcaatggcaa cggcggtgcc 1200 gaccagccaa ccggcagccg cgccaaggcc aagccgatgc cgcaggacga tgactaccaa 1260 ctggcccagg cactcagcct gctcaagggc ttgagcatca cccgcagccg ttga 1314 <210> 37 <211> 445 <212> PRT <213> Pseudomonas fluorescens <400> 37 Met Ser Met Thr Pro Arg Glu Ile Val His Glu Leu Asn Arg His Ile 1 5 10 15 Ile Gly Gln Asp Asp Ala Lys Arg Ala Val Ala Ile Ala Leu Arg Asn 20 25 30 Arg Trp Arg Arg Met Gln Leu Pro Glu Glu Leu Arg Val Glu Val Thr 35 40 45 Pro Lys Asn Ile Leu Met Ile Gly Pro Thr Gly Val Gly Lys Thr Glu 50 55 60 Ile Ala Arg Arg Leu Ala Lys Leu Ala Asn Ala Pro Phe Ile Lys Val 65 70 75 80 Glu Ala Thr Lys Phe Thr Glu Val Gly Tyr Val Gly Arg Asp Val Glu 85 90 95 Ser Ile Ile Arg Asp Leu Ala Asp Ala Ala Leu Lys Met Leu Arg Glu 100 105 110 Gln Glu Val Thr Lys Val Ser His Arg Ala Glu Asp Ala Ala Glu Glu 115 120 125 Arg Ile Leu Asp Ala Leu Leu Pro Pro Ala Arg Met Gly Phe Asn Glu 130 135 140 Asp Ala Ala Pro Ala Thr Asp Ser Asn Thr Arg Gln Leu Phe Arg Lys 145 150 155 160 Arg Leu Arg Glu Gly Gln Leu Asp Asp Lys Glu Ile Glu Ile Glu Val 165 170 175 Ala Glu Val Ser Gly Val Asp Ile Ser Ala Pro Pro Gly Met Glu Glu 180 185 190 Met Thr Ser Gln Leu Gln Asn Leu Phe Ala Asn Met Gly Lys Gly Lys 195 200 205 Lys Lys Ser Arg Lys Leu Lys Val Lys Glu Ala Leu Lys Leu Val Arg 210 215 220 Asp Glu Glu Ala Gly Arg Leu Val Asn Glu Glu Glu Leu Lys Ala Lys 225 230 235 240 Ala Leu Glu Ala Val Glu Gln His Gly Ile Val Phe Ile Asp Glu Ile 245 250 255 Asp Lys Val Ala Lys Arg Gly Asn Ser Gly Gly Val Asp Val Ser Arg 260 265 270 Glu Gly Val Gln Arg Asp Leu Leu Pro Leu Ile Glu Gly Cys Thr Val 275 280 285 Asn Thr Lys Leu Gly Met Val Lys Thr Asp His Ile Leu Phe Ile Ala 290 295 300 Ser Gly Ala Phe His Leu Ser Lys Pro Ser Asp Leu Val Pro Glu Leu 305 310 315 320 Gln Gly Arg Leu Pro Ile Arg Val Glu Leu Lys Ala Leu Thr Pro Gly 325 330 335 Asp Phe Glu Arg Ile Leu Ser Glu Pro His Ala Ser Leu Thr Glu Gln 340 345 350 Tyr Arg Glu Leu Leu Lys Thr Glu Gly Leu Gly Ile Glu Phe Gln Ala 355 360 365 Asp Gly Ile Lys Arg Leu Ala Glu Ile Ala Trp Gln Val Asn Glu Lys 370 375 380 Thr Glu Asn Ile Gly Ala Arg Arg Leu His Thr Leu Leu Glu Arg Leu 385 390 395 400 Leu Glu Glu Val Ser Phe Ser Ala Gly Asp Met Ala Gly Ala Gln Asn 405 410 415 Gly Glu Ala Ile Lys Ile Asp Ala Asp Tyr Val Asn Ser His Leu Gly 420 425 430 Glu Leu Ala Gln Asn Glu Asp Leu Ser Arg Tyr Ile Leu 435 440 445 <210> 38 <211> 176 <212> PRT <213> Pseudomonas fluorescens <400> 38 Met Thr Thr Ile Val Ser Val Arg Arg His Gly Lys Val Val Met Gly 1 5 10 15 Gly Asp Gly Gln Val Ser Leu Gly Asn Thr Val Met Lys Gly Asn Ala 20 25 30 Lys Lys Val Arg Arg Leu Tyr His Gly Gln Val Leu Ala Gly Phe Ala 35 40 45 Gly Ala Thr Ala Asp Ala Phe Thr Leu Phe Glu Arg Phe Glu Gly Gln 50 55 60 Leu Glu Lys His Gln Gly His Leu Val Arg Ala Ala Val Glu Leu Ala 65 70 75 80 Lys Glu Trp Arg Thr Asp Arg Ser Leu Ser Arg Leu Glu Ala Met Leu 85 90 95 Ala Val Ala Asn Lys Asp Ala Ser Leu Ile Ile Thr Gly Asn Gly Asp 100 105 110 Val Val Glu Pro Glu His Gly Leu Ile Ala Met Gly Ser Gly Gly Gly 115 120 125 Tyr Ala Gln Ala Ala Ala Ser Ala Leu Leu Lys Lys Thr Asp Leu Ser 130 135 140 Ala Arg Glu Ile Val Glu Thr Ala Leu Gly Ile Ala Gly Asp Ile Cys 145 150 155 160 Val Phe Thr Asn His Asn Gln Thr Ile Glu Glu Gln Asp Leu Ala Glu 165 170 175 <210> 39 <211> 295 <212> PRT <213> Pseudomonas fluorescens <400> 39 Met Met Arg Ile Leu Leu Phe Leu Ala Thr Asn Leu Ala Val Val Leu 1 5 10 15 Ile Ala Ser Val Thr Leu Ser Leu Phe Gly Phe Asn Gly Phe Met Ala 20 25 30 Ala Asn Gly Val Asp Leu Asn Leu Asn Gln Leu Leu Ile Phe Cys Ala 35 40 45 Val Phe Gly Phe Ala Gly Ser Leu Phe Ser Leu Phe Ile Ser Lys Trp 50 55 60 Met Ala Lys Met Ser Thr Ser Thr Gln Ile Ile Thr Gln Pro Arg Thr 65 70 75 80 Arg His Glu Gln Trp Leu Met Gln Thr Val Glu Gln Leu Ser Gln Glu 85 90 95 Ala Gly Ile Lys Met Pro Glu Val Gly Ile Phe Pro Ala Tyr Glu Ala 100 105 110 Asn Ala Phe Ala Thr Gly Trp Asn Lys Asn Asp Ala Leu Val Ala Val 115 120 125 Ser Gln Gly Leu Leu Glu Arg Phe Ser Pro Asp Glu Val Lys Ala Val 130 135 140 Leu Ala His Glu Ile Gly His Val Ala Asn Gly Asp Met Val Thr Leu 145 150 155 160 Ala Leu Val Gln Gly Val Val Asn Thr Phe Val Met Phe Phe Ala Arg 165 170 175 Ile Ile Gly Asn Phe Val Asp Lys Val Ile Phe Lys Asn Glu Glu Gly 180 185 190 Arg Gly Ile Ala Tyr Phe Val Ala Thr Ile Phe Ala Glu Leu Val Leu 195 200 205 Gly Phe Leu Ala Ser Ala Ile Val Met Trp Phe Ser Arg Lys Arg Glu 210 215 220 Phe Arg Ala Asp Glu Ala Gly Ala Arg Leu Ala Gly Thr Ser Ala Met 225 230 235 240 Ile Gly Ala Leu Gln Arg Leu Arg Ser Glu Gln Gly Leu Pro Val His 245 250 255 Met Pro Asp Ser Leu Thr Ala Phe Gly Ile Asn Gly Gly Ile Lys Gln 260 265 270 Gly Leu Ala Arg Leu Phe Met Ser His Pro Pro Leu Glu Glu Arg Ile 275 280 285 Asp Ala Leu Arg Arg Arg Gly 290 295 <210> 40 <211> 888 <212> DNA <213> Pseudomonas fluorescens <400> 40 atgatgcgca tcctgctgtt cttggccact aacctggcgg tcgtactgat tgccagcgtc 60 accctgagcc tttttggctt caacgggttc atggcggcca atggggttga tctgaacctc 120 aatcagctgc tgattttctg tgcggtcttt ggttttgccg gctcgctgtt ctcgctgttc 180 atctccaagt ggatggcgaa gatgagcacc agcacccaga tcatcactca accccgcact 240 cgccatgaac aatggctgat gcaaaccgtg gagcagttgt ctcaagaagc aggcatcaaa 300 atgcccgaag tggggatttt tcctgcttat gaggccaacg cctttgccac cggctggaac 360 aagaacgacg cactggtggc tgtgagccag ggcctgctgg agcggttttc gcccgatgaa 420 gtcaaggcgg tgctggccca cgagatcggc cacgtagcca acggcgacat ggtcaccctg 480 gcactggtac agggcgtggt gaacaccttc gtgatgttct ttgcgcggat catcggcaac 540 tttgtcgaca aggtcatctt caagaacgaa gaaggccgtg gcattgccta cttcgtggcg 600 accattttcg ccgagttggt cctgggcttc ctggccagcg ccatcgtgat gtggttctcg 660 cgcaaacgcg agttccgcgc agatgaagcc ggcgcacgcc tggcgggcac cagcgcaatg 720 atcggcgcgc tgcaacgcct gcgctccgaa cagggcctgc cggtgcatat gccggacagc 780 ctgaccgcct tcggcatcaa cggcggcatc aagcagggcc tggctcgctt gttcatgagc 840 cacccgccgc tggaagagcg gattgacgca ctgcgtcgcc ggggctga 888 <210> 41 <211> 533 <212> PRT <213> Pseudomonas fluorescens <400> 41 Met Phe Lys Lys His Ala Cys Tyr Leu Ser Ile Cys Leu Leu Val Ala 1 5 10 15 Pro Leu Val Ala Thr Ala Glu Thr Leu Pro Leu Glu Pro Leu Pro Val 20 25 30 Thr Thr Pro Ala Pro Val Ala Leu Ala Pro Leu Gln Gln Ala Leu Ala 35 40 45 Gln Leu Thr Ser Val Cys Pro His Leu Ala Pro Arg Ile Asp Ala Ala 50 55 60 Ala Leu Ala Arg Leu Gln Thr Phe Tyr Gln Gln Gln Gly Asp Ala Pro 65 70 75 80 Leu Trp Ala Ala Asp Glu Arg Arg Gln Ala Leu His Ala Gln Leu Leu 85 90 95 Met Leu Ala Asp Asp Gly Leu Asp Pro Thr His Tyr Ser Leu Pro Ala 100 105 110 Val Asp Ala Thr Ala Asn Val Leu Cys Ser Asp Ile Ala Asn Ser Gln 115 120 125 Gln Tyr Leu Gln Ala Leu Gln Asp Leu His Tyr Gly Arg Leu Gln Gln 130 135 140 Ser Arg Phe Glu Pro Leu Trp His Ser Gln Pro Pro Ser Gly Asp Pro 145 150 155 160 Asn Thr Glu Val Leu Ala Phe Ala Ala Thr Gly Leu His Asp Met Ala 165 170 175 Gln Ala Phe Asp Gln Ala Arg Pro Ser Ala Asp Leu Tyr Arg Ser Leu 180 185 190 Arg Asn Ala Tyr Ala Gly Val Arg Gln Gln Pro Leu Pro His Trp Asp 195 200 205 Pro Val Ala Glu Gly Thr Leu Leu Arg Pro Gly Met Asn Asp Pro Arg 210 215 220 Val Pro Glu Leu Ala Arg Arg Leu His Ser Gly Gly Tyr Leu Ala Gln 225 230 235 240 Leu Pro Ser Gly Asn Gly Lys Gln Tyr Gln Gly Glu Leu Val Lys Ala 245 250 255 Val Lys Ala Phe Gln Leu Ser His Ser Leu Gln Ala Asp Gly Val Ile 260 265 270 Gly Ala Gly Thr Val Ala Glu Leu Asn Ile Ser Pro Ala Met Arg Arg 275 280 285 Glu Gln Leu Arg Ile Asn Leu Glu Arg Phe Arg Trp Leu Ala Gln Asp 290 295 300 Leu Glu Pro Glu Gly Val Val Val Asn Val Ala Ala Ala Gln Leu Ser 305 310 315 320 Val Tyr Gln Ser Gly Ile Pro Val Trp Gln Thr Arg Leu Gln Val Gly 325 330 335 Arg Ala Glu Arg Gln Thr Pro Leu Leu Lys Ser Arg Ile Thr Arg Leu 340 345 350 Thr Leu Asn Pro Thr Trp Thr Ile Pro Pro Thr Ile Met Arg Glu Asp 355 360 365 Lys Leu Pro Ala Ile Arg Leu Asn Pro Glu Tyr Leu Arg Gln Gln Asn 370 375 380 Leu Gln Val Leu Asp Ala Glu Gly His Pro Leu Thr Pro Asp Gln Val 385 390 395 400 Asp Trp Ala Arg Pro Gly Asn Ile Leu Leu Arg Gln Gln Ala Gly Pro 405 410 415 Arg Asn Pro Leu Gly Lys Ile Val Met Arg Phe Pro Asn Pro Tyr Ser 420 425 430 Val Tyr Leu His Asp Thr Pro Ser Gln Pro Leu Phe Thr Lys Gly Pro 435 440 445 Arg Ala Phe Ser Ser Gly Cys Val Arg Val Glu Gln Pro Leu Leu Leu 450 455 460 Arg Asp Leu Leu Val Thr Pro Ala Glu Arg Thr Arg Thr Asp Glu Leu 465 470 475 480 Leu Ala Thr Gly Glu Thr His Glu Phe Arg Leu Ala Thr Pro Val Pro 485 490 495 Val Leu Leu Gly Tyr Trp Thr Val Glu Val Asp Arg Gln Gly Glu Leu 500 505 510 Val Tyr Ala Pro Asp Ile Tyr Ala Arg Asp Pro Ala Leu Ile Lys Ala 515 520 525 Met Gly Ser Val Leu 530 <210> 42 <211> 1602 <212> DNA <213> Pseudomonas fluorescens <400> 42 atgttcaaaa aacacgcatg ttacttgagc atttgcctgc tcgttgcacc attggtcgct 60 acagccgaaa cgctgccgtt agaaccactg cccgtcacca cccctgcacc ggtcgcgctc 120 gcgccgctgc aacaggcctt ggcgcagttg accagtgtct gcccgcacct tgcgccgcgt 180 atcgatgccg ccgcgttggc gcgcctgcaa accttttacc agcagcaggg cgatgccccg 240 ctatgggcgg ctgacgaacg ccggcaagcc ttgcatgccc agttgctgat gcttgccgac 300 gatggcctgg accccaccca ctatagcttg cctgcggtgg atgccacggc caacgtgctg 360 tgcagcgata tcgccaacag ccagcagtac ctgcaagctc tgcaggattt gcactacggg 420 cgcctgcagc aatcgcgctt tgagcccctc tggcattccc agccacccag tggcgatccg 480 aataccgagg tgctggcgtt cgccgccacc ggcctgcacg acatggccca agccttcgat 540 caggcccggc ccagcgccga tttgtaccgc agcctgcgca atgcctatgc cggcgtgcgc 600 cagcaaccgc tgccccattg ggacccggtc gccgagggca cgttgttgcg tcctgggatg 660 aatgaccctc gcgtgccgga actggcgcgg cgcctgcaca gcggcggcta cctggcccag 720 ttacccagcg gcaacggcaa gcagtaccag ggcgaactgg tcaaggcggt gaaagccttc 780 cagctcagcc actcgttgca ggccgacggc gtgatcggcg ccggcaccgt ggccgaactc 840 aatatcagcc cggcgatgcg tcgtgaacaa ctgcgcatca acctcgagcg tttccgctgg 900 ctggcccagg acctggagcc tgaaggcgtc gtggtcaatg tggccgccgc gcaactgagc 960 gtgtaccaga gcggcatccc agtgtggcaa acccgcctgc aagtgggccg ggccgaacgc 1020 cagacgccgt tgctcaagtc gcgcatcacc cggctgaccc tcaaccccac ctggaccatc 1080 ccgccgacca tcatgcgcga ggacaaactg ccggccatcc gcctcaaccc tgaatacctg 1140 cgccagcaaa acctgcaagt gctcgacgcc gaaggtcacc cgttgacccc cgaccaggtc 1200 gactgggcgc gccccggcaa tatcctgctg cgccagcagg ccggcccgcg taacccgctg 1260 ggcaagattg tgatgcgttt ccccaatccg tattccgtat atctgcacga cacccccagc 1320 caacccttgt tcaccaaggg gccgcgggcg ttcagttcgg gatgcgtgcg ggtcgagcaa 1380 ccgttgttat tgcgcgacct gctggtaacg ccggccgaac gcactcgcac cgatgagctg 1440 ctggcgaccg gcgaaaccca tgaattcagg ttggccacgc cggtaccggt gctgttgggg 1500 tattggaccg tggaagtgga tcgccagggc gagctggtgt acgcgccgga tatttatgcg 1560 cgtgacccgg cgttgatcaa ggccatgggt agcgtgttat ag 1602 <210> 43 <211> 2665 <212> PRT <213> Pseudomonas fluorescens <400> 43 Met Asp Val Arg Gln Phe Ala Phe Leu Ala Arg Gln Pro Ser Ala Ala 1 5 10 15 Leu Lys Arg Arg Asp Ala Phe Phe Gly Leu Pro Lys Arg Gly Leu Ala 20 25 30 Leu Ile Leu Ala Asn Ala Leu Phe Trp Gln Pro Leu Leu Ala Gln Ala 35 40 45 Glu Gly Ile Val Val Ser Ala Pro Gly Thr Thr Val Gly Ala Ala Gly 50 55 60 Asn Gly Val Pro Val Val Asn Ile Ala Thr Pro Asn Gly Ala Gly Leu 65 70 75 80 Ser His Asn Gln Phe Lys Asp Tyr Asn Val Gly Pro Asn Gly Val Ile 85 90 95 Leu Asn Asn Gly Asn Gly Ala Met Val Asn Thr Gln Leu Gly Gly Ile 100 105 110 Ile Val Gly Asn Pro Asn Leu Lys Gly Gly Ala Ala Asn Val Ile Leu 115 120 125 Asn Glu Val Asn Gly Gly Ser Pro Ser Gln Leu Arg Gly Tyr Thr Glu 130 135 140 Val Ala Gly Gln Ser Ala Lys Val Ile Val Ala Asn Pro Tyr Gly Val 145 150 155 160 Thr Cys Ser Gly Cys Gly Phe Ile Asn Thr Pro Asn Val Thr Leu Thr 165 170 175 Thr Gly Lys Pro Val Leu Asp Ala Ser Gly Gln Leu Gln Arg Tyr Glu 180 185 190 Val Asp Gly Gly Ala Val Thr Ile Asp Gly Gln Gly Leu Asn Ala Ser 195 200 205 Asn Val Glu Arg Phe Asp Ile Ile Thr Arg Ser Ala Lys Ile Asn Ala 210 215 220 Gln Ile Asn Ala Arg Glu Leu Asn Val Ile Ala Gly Arg Asn Asp Val 225 230 235 240 Asp Ala Gln Ser Leu Lys Thr Thr Ala Arg Ala Asp Asp Gly Ser Ala 245 250 255 Lys Pro Glu Leu Ala Ile Asp Ser Ser Ala Leu Gly Gly Met Tyr Ala 260 265 270 Gly Ala Ile Lys Leu Val Gly Thr Glu Ala Gly Val Gly Val Lys Leu 275 280 285 Asp Gly Thr Leu Ala Ala Ser Gly Gly Asp Ile Gln Leu Asp Ala Asn 290 295 300 Gly Arg Leu Ser Met Ala Gln Ala Ala Ala Thr Gly Asn Val Lys Val 305 310 315 320 Thr Ala Gln Asn Val Asp Leu Thr Asp Lys Val Tyr Ala Asn Gly Asn 325 330 335 Val Gln Val Thr Ser Ala Gln Ala Leu Val Asn Arg Lys Ser Ile Ala 340 345 350 Ala Gly Gln Arg Ile Glu Ile Asn Ala Ala Ser Val Asn Asn Pro Gly 355 360 365 Ile Ile Glu Ala Gly Val Ala Ala Asp Asn Ser Arg Asn Thr Thr Gly 370 375 380 Asp Leu Val Val Asn Ala Gln Thr Val Thr Thr Ser Gly Asn Leu Leu 385 390 395 400 Ala Ser Arg Ala Leu Ala Ile Thr Ala Ala Gln Ala Leu Thr Asn Gln 405 410 415 Gly Ala Ile Ile Gln Ala Lys Thr Val Glu Val Ser Ser Ala Lys Leu 420 425 430 Thr Asn Gln Gly Ala Ser Ala Arg Leu Phe Gly Glu Gln Ser Leu Ala 435 440 445 Ile Asn Ser Pro Ala Ile Val Asn Leu Gly Gly Leu Ile Arg Phe Gly 450 455 460 Glu Gly Gln Ala Ala Thr Leu Asn Ser Ala Ser Leu Asp Asn Arg Gln 465 470 475 480 Gly Arg Ile Glu Met Ala Gly Gly Ser Leu Val Leu Thr Ser Ala Asp 485 490 495 Leu Asn Asn Ser Gly Gly Gln Val Ile Ala Asn Asp Leu Thr Val Asn 500 505 510 Ala Gly Asn Leu Asn Asn Gln Asn Gly Val Leu Val Ala Lys Thr Ala 515 520 525 Thr Val Thr Ala Ser Asn Leu Asp Asn Ser Leu Lys Gly Leu Ile Gln 530 535 540 Ala Asp Gly Gly Ala Leu Asn Leu Ala Val Ser Asn Thr Phe Asn Asn 545 550 555 560 Asn Gln Gly Phe Ala Gln Ala Ser Thr Asp Leu Asn Val Thr Ala Gly 565 570 575 Thr Leu Ser Ser Asn Ala Gly Gly Val Leu Ser Ala Asp Thr Gly Lys 580 585 590 Leu Thr Leu Thr Ala Ala Gln Gln Leu Asn Asn Ala Gln Gly Arg Leu 595 600 605 Gln Ala Gly Gln Gly Asp Ile Glu Leu His Ala Ala Asn Leu Asp Asn 610 615 620 Gln Ser Gly Thr Ile Val Gly Lys Gln Leu Leu Leu Asp Val Ala Gly 625 630 635 640 Gly Asp Ile Asp Asn Arg Ala Gly Arg Val Leu Gly Asp His Leu Asp 645 650 655 Val Arg Ala Ser Gly Leu Asp Asn Arg Asn Ala Gly Leu Leu Ala Gly 660 665 670 Gly Ala Gln Gly Val Ser Leu Leu Leu Lys Gly Pro Gly Gln Leu Leu 675 680 685 Asn Ala Gln Gly Arg Ile Gln Ser Glu Gly Leu Leu Gln Leu Gln Gly 690 695 700 Glu Arg Phe Asp Asn Ser Ala Gly Ile Leu Leu Gly Gln Thr Val Asp 705 710 715 720 Val Thr Ala Gln Thr Phe Asn Asn Ser Asn Lys Gly Ala Leu Val Ser 725 730 735 Asp Gly Gly Asp Val Val Phe Lys Val Ser Asp Leu Leu Thr Asn Val 740 745 750 Gly Gly Gln Ile Asp Ala Gly Glu Arg Ser Val Leu Val Lys Gln Leu 755 760 765 Thr Thr Leu Asn Asn Asp Gly Gly Thr Leu Arg Gly Lys Arg Leu Asp 770 775 780 Ile Ala Ala Gln His Leu Asn Asn Asp Asn Gly Gln Leu Leu Ala Gly 785 790 795 800 Ala Glu Gly Leu Ser Tyr Ser Gly Gln Asp Val Ser Asn Arg Lys Gly 805 810 815 Leu Ile Leu Ser Gly Gly Ala Leu Thr Glu Leu Asn Thr Thr Arg Leu 820 825 830 Asp Asn Gln Gly Gly Thr Val Gln Gly Asp Ser Leu Thr Val Thr Ala 835 840 845 Asn Asn Val Asp Asn Gly Ser Gly Gly Leu Met Ala Ser Leu Val Gly 850 855 860 Asn Leu Gln Leu Thr Val Glu Ala Leu Ala Asn Arg Gly Gly Lys Leu 865 870 875 880 Phe Gly Lys Glu Gln Val Thr Val Ser Gly Ala Ser Leu Asp Asn Ser 885 890 895 Ala Gly Gln Ile Ser Gly Asn Gln Ile Asn Leu Thr Ser Arg Asp Thr 900 905 910 Leu Thr Asn Gln Gly Gly Leu Val Glu Ala Asn Gln Gly Leu Thr Leu 915 920 925 Thr Gly Gly Asn Leu Asp Asn Ser Ala Asn Gly Gln Leu Arg Ala Leu 930 935 940 Gly Gly Ala Ser Ser Arg Val Asn Leu Ser Gly Ala Leu Asn Asn Gln 945 950 955 960 Asn Gly Thr Leu Glu Phe Gly Ser Gln Ala Phe Ser Leu Asp Ala Ala 965 970 975 Ser Leu Asn Asn Gln Asn Gly Met Leu Gln His Ala Gly Thr Gly Leu 980 985 990 Phe His Leu Asn Ile Ala Ser Leu Glu Gly Ser Gln Gly Asn Ile Gln 995 1000 1005 Gly Met Gly Ser Ala Asp Trp Ala Phe Gly Lys Val Asp Gly Leu 1010 1015 1020 Gly Arg Val Gln Leu Asn Asp Val Leu Thr Tyr Lys Ser Asp Gln 1025 1030 1035 Gly Leu Ala Leu Gln Ala Gly Asp Arg Met Ala Ser Ala Lys Gly 1040 1045 1050 Leu Ile Leu Asn Val Ala Ser Leu Asp Asn Gly Gly Glu Leu Leu 1055 1060 1065 Ser Asp Gly Asp Ile Ser Ile Thr Thr Gly Asp Ile Thr Asn Ser 1070 1075 1080 Gly Arg Val Ser Ala Leu Gln Thr Leu Thr Val Ala Ala Asn Asn 1085 1090 1095 Leu Ser Gln Asn Gly Gly Arg Leu Ala Ala Thr Asn Ala Arg Leu 1100 1105 1110 Thr Leu Gly Gly Thr Leu Asp Asn Leu Gly Phe Leu Thr Ala Arg 1115 1120 1125 Gln Gln Leu Asp Ile Ala Ala Ala Gln Ile Asn Asn Arg Gly Thr 1130 1135 1140 Leu Gly Ala Gln Gly Ala Val Asn Leu Thr Ala Val Asn Gly Ile 1145 1150 1155 Thr Asn Ala Ala Asp Thr Leu Leu Phe Ser Gly Gly Asp Met Thr 1160 1165 1170 Leu Arg Ser Asn Gly Phe Ser Asn Ser Tyr Gly Asp Val Tyr Ser 1175 1180 1185 Lys Gly Asn Leu Ser Phe Ala Ala Arg Asp Gly Gly Arg Ala Val 1190 1195 1200 Leu Phe Ser Asn Arg Ser Gly Thr Val Glu Ser Glu Gly Ser Ile 1205 1210 1215 Gly Ile Asn Ala Gly Phe Ile Glu Asn Ala Lys Asp Glu Phe Glu 1220 1225 1230 Leu Gly Gln Thr Leu Thr Thr Gly Ser Leu Ser Trp Ile Cys Gly 1235 1240 1245 Gln His Cys Gly Glu Ser Asp Asn Trp Glu Arg Gly Glu Ile Thr 1250 1255 1260 Ile Tyr Glu Thr Tyr Leu Glu Ala Ala Thr Lys Asp Ser Val Ala 1265 1270 1275 Ala Arg Leu Val Ala Gly Lys Asn Met Leu Leu Gln Gly Asp Thr 1280 1285 1290 Val Gln Asn Arg Tyr Ser Leu Met Ala Ala Asn Gly Asp Leu Ser 1295 1300 1305 Ile Thr Ala Gly Asp Leu Leu Asn Gln Gly Ala Ala Thr Arg Thr 1310 1315 1320 Gly Gln Arg Lys Leu Val Ile Gly Thr Pro Gly His Val Ser Asp 1325 1330 1335 Asp Leu Phe Glu Arg Met Gln Tyr Val Asp Val Pro Ala Phe Asn 1340 1345 1350 Ala Ala Thr Ala Ala Gly Asn Phe Asp Lys Ala Arg Phe Glu Glu 1355 1360 1365 Leu Lys Ser Arg Ser Pro Asn Ser Leu Pro Phe Ala Tyr Ala Ser 1370 1375 1380 Asp Val Thr Thr Trp Thr Asn Asn Ser Gly Pro Gly Tyr Asp Ala 1385 1390 1395 Thr Leu Gln Ala Gly Gly Thr Val Asn Leu Asn Val Ala Arg Thr 1400 1405 1410 Leu Gln Asn Gly Thr Leu His Asn Asn Thr Leu Ala Gln Leu Thr 1415 1420 1425 Gly Thr Leu Gly Asp Asp Gln Thr Gly Ile Pro Val Gly Gly Ile 1430 1435 1440 Asn Ile Asn Leu Ser Lys His Ala Asn Asp Pro Ser Ala Gln Ala 1445 1450 1455 Pro Gly Ser Val Leu Pro Val Val Gly Val Ala Pro Gly Gly Gly 1460 1465 1470 Phe Val Pro Val Asp Tyr Thr Gly Thr Ala Phe Ala Pro Val Asp 1475 1480 1485 Pro Thr Thr Ser Pro Thr Phe Gln Leu Pro Lys Gly Glu Tyr Gly 1490 1495 1500 Leu Phe Val Lys Asn Ala Asp Pro Thr Ser His Tyr Leu Ile Glu 1505 1510 1515 Thr Asn Pro Glu Phe Thr Ser Val Ser Gly Phe Phe Ser Ser Asp 1520 1525 1530 Tyr Met Leu Gly Lys Leu Gly Phe Thr Ala Asp Asn Ala Trp Arg 1535 1540 1545 Arg Leu Gly Asp Gly Gln Tyr Glu Thr Arg Leu Ile Arg Asp Ala 1550 1555 1560 Val Leu Ala Gln Thr Gly Gln Arg Phe Leu Ala Gly Gly Leu Tyr 1565 1570 1575 Ser Asp Ala Asp Gln Phe Arg Tyr Leu Met Asp Asn Gly Leu Ala 1580 1585 1590 Ser Lys Asp Ala Leu Arg Leu Ser Leu Gly Val Ala Leu Thr Asp 1595 1600 1605 Gln Gln Val Gly Ala Leu Thr His Asp Ile Val Trp Met Glu Asn 1610 1615 1620 Arg Val Ile Glu Gly Gln Thr Val Leu Val Pro Val Leu Tyr Leu 1625 1630 1635 Ala Gln Ala Asp Ser Arg Asn Val Arg Gly Asn Ser Leu Ile Gln 1640 1645 1650 Gly Arg Asp Leu Asn Leu Val Thr Gly Gly Asp Leu Ile Asn Val 1655 1660 1665 Gly Thr Leu Arg Ala Ser Asn Asn Leu Ser Ala Ile Ser Ser Gly 1670 1675 1680 Ser Ile Tyr Thr Gly Gly Leu Val Glu Ala Gly Asn Asn Leu Ser 1685 1690 1695 Leu Leu Ala Gln Asp Ser Ile Arg Asn Ala Met Ala Gly Glu Ile 1700 1705 1710 Arg Gly Lys Gln Val Ser Leu Thr Ala Leu Lys Gly Asp Ile Thr 1715 1720 1725 Asn Glu Thr Thr Ala Ile Gln Val Arg Asp Gly Ala Gly Met Arg 1730 1735 1740 Thr Leu Thr Asp Thr Ser Ala Gly Thr Ile Val Ala Arg Glu Asn 1745 1750 1755 Leu Ala Ile Asp Ala Gly Arg Asp Leu Thr Asn Arg Gly Ala Leu 1760 1765 1770 Val Ala Gly Asn Asp Ala Asn Leu Thr Ala Gly Arg Asp Leu Asn 1775 1780 1785 Leu Ile Ala Ala Ser Asp Thr Arg Val Lys His Glu Thr Arg Asp 1790 1795 1800 Gly Gly Glu Lys Ser Ser Ile Thr Thr Asp Val Lys Asn Leu Ala 1805 1810 1815 Ala Ser Val Thr Ala Gly Gly Asn Leu Asn Met Gln Ala Gly Gln 1820 1825 1830 Asp Val Asn Ile Ile Gly Ser Asn Ala Thr Ala Gly Lys Asp Leu 1835 1840 1845 Asn Ile Ala Ala Gly Arg Asp Leu Asn Val Ala Ser Val Ser Asp 1850 1855 1860 Met His Asn Val Glu Gly Lys Glu Lys Asp Gly Lys Lys Arg Ile 1865 1870 1875 Arg Thr Ser Asp Asp Gln Thr Thr Gln Val Ala Ser Val Leu Thr 1880 1885 1890 Ala Gly Gly Asp Phe Val Ser Gln Ala Gly Arg Asp Thr Thr Ile 1895 1900 1905 Val Ala Ser Met Ile Ser Ala Gly Asn Glu Ala Tyr Leu Tyr Ser 1910 1915 1920 Gly Asp Lys Leu Ser Leu Leu Ala Ala Glu Asn Ser Thr His Thr 1925 1930 1935 Leu Tyr Asp Met Lys Glu Lys Gly Ser Trp Gly Ala Lys Lys Ala 1940 1945 1950 Gln Met Asp Glu Val Thr Arg Thr Thr Gln Val Gly Thr Glu Ile 1955 1960 1965 Lys Thr Gly Gly Asn Leu Val Leu Lys Ser Asp Gly Asp Gln Leu 1970 1975 1980 Tyr Gln Val Ala Lys Leu Asn Ser Gly Lys Asp Ile Ile Leu Asp 1985 1990 1995 Ser Gly Gly Ala Ile Val Phe Glu Gly Val Lys Asp Leu His Asp 2000 2005 2010 Glu Ser His Thr Lys Ser Lys Ser Asp Leu Ser Trp Phe Ser Ala 2015 2020 2025 Lys Gly Lys Gly Asn Thr Asp Glu Thr Leu Arg Gln Ser Glu Leu 2030 2035 2040 Val Ala Gln Gly Gln Leu Val Ile Lys Ala Ala Glu Gly Ile Arg 2045 2050 2055 Ile Asp Val Lys Gln Val Asp Gln Gln Thr Val Ser Gln Thr Val 2060 2065 2070 Asp Ala Met Val Lys Ala Asp Pro Asn Leu Ala Trp Leu Lys Gln 2075 2080 2085 Ala Glu Ala Arg Gly Asp Ile Asp Trp Arg Gln Val Lys Glu Ile 2090 2095 2100 His Glu Ser Phe Lys Tyr Asp Asn Ser Gly Leu Gly Ala Gly Ala 2105 2110 2115 Lys Ile Ala Ile Ala Ile Met Met Ala Ala Ile Met Gly Pro Val 2120 2125 2130 Gly Phe Gly Leu Gln Gly Ala Thr Leu Ala Val Ser Thr Ser Leu 2135 2140 2145 Ser Thr Thr Ala Val Thr Ser Thr Ile Asn Asn Lys Gly Asn Leu 2150 2155 2160 Gly Ala Ala Leu Lys Glu Thr Val Ser Ala Asn Ser Leu Lys Ser 2165 2170 2175 Ala Ala Val Ala Gly Phe Thr Ala Gly Ala Leu Glu Tyr Ala Asp 2180 2185 2190 Thr Asn Trp Phe Ala Gly Ala Asp Gly Ala Gly Ala Gly Ala Gly 2195 2200 2205 Thr Ser Thr Ser Thr Val Gln Gly Val Thr Pro Ser Thr Gly Ser 2210 2215 2220 Thr Leu Ala Val Thr Asn Ser Ser Lys Asp Ile Phe Thr Trp Thr 2225 2230 2235 Ser Ala Gly Asp Ile Ala Leu Arg Thr Gly Gly Arg Ala Val Ile 2240 2245 2250 Ser Ser Gly Ile Ser Thr Ala Ile Gln Gly Gly Ser Phe Gly Asp 2255 2260 2265 Asn Phe Asn Ala Ala Leu Leu Gly Glu Ala Gly Asn Val Ala Met 2270 2275 2280 Ala Thr Gly Phe Asn Trp Val Gly Asp Tyr Val Thr Phe Pro Asn 2285 2290 2295 Gly Ser Pro Gln Lys Ile Ile Ala His Ala Leu Met Gly Gly Leu 2300 2305 2310 Leu Ala Glu Ala Thr Gly Ser Asp Phe Lys Thr Gly Ala Ala Ala 2315 2320 2325 Ala Gly Leu Asn Glu Ala Leu Ile Asn Gln Leu Val Trp Ala Ala 2330 2335 2340 Gln Gly Asn Asp Asp Ile Thr Leu Met Leu Ser Gln Leu Thr Gly 2345 2350 2355 Leu Leu Ala Ala Ala Ala Val Asp Gly Asp Leu Glu Lys Gly Ser 2360 2365 2370 Gln Ile Ala Gln Lys Ala Thr Thr Phe Asn Tyr Leu Tyr His Glu 2375 2380 2385 Glu Val Glu Glu Met Leu Arg Glu Val Asp Ser Lys Thr Thr Glu 2390 2395 2400 Gln Glu Lys Arg Glu Val Arg Gln Arg Tyr Ala Glu Leu Asp Gln 2405 2410 2415 Gln Arg Asn Asp Glu Leu Asp Ala Leu Cys Ala Arg Asp Pro Gln 2420 2425 2430 Arg Cys Arg Gly Ile Ala Thr Ser Leu Ala Asn Asp Asp Gln Lys 2435 2440 2445 Leu Val Asp Leu Val Gly Arg Leu Arg Ser Gln Gly Gln Gly Gly 2450 2455 2460 Ala Ala Ser Ala Val Gly Phe Val Ile Gly Asn Asn Leu Asp Ala 2465 2470 2475 Ser Ser Gln Ile Ala Ala Asp Ile Ser Ser Ala Gly Gly Gly Pro 2480 2485 2490 Leu Val Lys Leu Gly Ala Glu Ala Ile Lys Ala Gly Val Gly Ile 2495 2500 2505 Thr Leu Pro Ser Arg Ser Ser Ser Gly Lys Gly Lys Gly Ser Gln 2510 2515 2520 Val Gly Ala Gly Ser Leu Glu Glu Ala Ala Gly Pro Lys Ala Thr 2525 2530 2535 Gly Glu Val Val Pro Pro Ala Pro Ile Val Thr Ser Gly Ala Thr 2540 2545 2550 Arg Thr Gly Val Val Arg Thr Asn Ala Ala Asp Trp Arg Ala Leu 2555 2560 2565 Arg Asn Asn Trp Asp Asp Leu Gly Tyr Gly Gln Ile Leu Ser Thr 2570 2575 2580 Glu Asn Arg Ala Ala Ile Ala Lys Gly Arg Thr Pro Lys Val Asp 2585 2590 2595 Asp Ala Trp Val Lys Val Phe Pro Glu Asp Ala Gly Leu Lys Gly 2600 2605 2610 Glu Arg Ile Pro Met His His Val Gln Gly Ser Pro Leu Thr Val 2615 2620 2625 Pro Leu Pro Asp Thr Arg His Leu Asp Ala His Met Pro Gly Gly 2630 2635 2640 Phe Arg Tyr Asn Pro Gly Gly Pro Gly Ser Ala Leu Pro Ala Tyr 2645 2650 2655 Pro Pro Lys Lys Gly Ala Glu 2660 2665 <210> 44 <211> 7998 <212> DNA <213> Pseudomonas fluorescens <400> 44 atggatgttc gccaattcgc cttcctggcc cgccaacctt ctgccgccct gaagcgccgg 60 gacgcgttct tcggcctgcc caagcgcggg ctggccttga tccttgccaa cgcactgttc 120 tggcagccgc tgctggccca ggccgagggc attgtggtca gtgcgccggg caccaccgtg 180 ggcgcggcag gcaatggcgt gccggtggta aacattgcca cccccaatgg cgcgggcttg 240 tcccataacc agttcaagga ctacaacgtc ggccccaacg gcgtgattct caacaatggc 300 aacggcgcca tggtcaacac ccagctgggc gggatcatcg tcggcaaccc caacctcaag 360 ggcggcgcgg cgaacgtcat cctcaacgaa gtcaacggcg gcagccccag ccagttgcgc 420 ggctataccg aagtggcggg gcagtcggcc aaggtcatcg tggccaaccc gtacggcgtg 480 acgtgcagcg gttgcggctt tatcaacacc cccaacgtca ccctcaccac cggcaaaccg 540 gtgctcgacg ccagcggtca attgcagcgc tatgaagtgg atggcggcgc ggtgaccatc 600 gacggccaag gcttgaacgc cagcaacgtc gaacgcttcg acatcatcac ccgctcggcc 660 aagatcaacg cacaaatcaa cgcccgcgaa ctcaacgtga tcgccgggcg caacgacgtc 720 gatgcgcaaa gcctgaaaac caccgcccgc gccgatgacg gcagcgccaa gcccgagctg 780 gcgatcgact cgtcggccct gggcggcatg tatgccggcg cgatcaaact ggtgggcacc 840 gaggccggtg tgggcgtgaa gctcgacggc accctggccg ccagtggcgg cgatattcag 900 ctcgacgcca acgggcgcct gagcatggcg caggcggcgg ccaccggtaa cgtcaaggtc 960 accgcgcaaa acgtcgacct caccgacaag gtctacgcca acggcaacgt gcaggtcacc 1020 agcgcccagg ctttggtcaa ccgcaagagc atcgccgccg gccagcgcat cgagatcaac 1080 gcggccagcg tgaacaaccc cggcatcatc gaagccggcg tcgccgccga taacagccgc 1140 aacaccacgg gcgacctggt ggtgaacgcg caaaccgtca ccaccagcgg caacctgttg 1200 gccagccgcg ccctggcgat cactgccgcg caagcgctga ccaaccaggg cgcgatcatc 1260 caggccaaga ccgtcgaggt cagcagcgcc aaactcacca accagggcgc cagcgctcgc 1320 ctgtttggcg agcagagcct ggcgatcaac tcgccggcca tcgtcaacct cggcggcttg 1380 atccgcttcg gcgaaggcca ggccgccacg ctcaacagcg cctccctgga caaccgccaa 1440 ggccgtatcg aaatggccgg tggcagcctg gtgctcacca gtgccgacct gaacaacagc 1500 ggcgggcaag tcatcgccaa cgacctgacc gtcaacgccg gcaacctgaa caaccagaac 1560 ggcgtgctgg tggccaagac cgcgaccgtc actgccagca accttgacaa cagcctcaag 1620 ggtttgatcc aggctgacgg tggcgcgctc aacctcgccg tttccaacac cttcaacaac 1680 aaccagggtt tcgcccaggc cagcaccgat ctgaacgtta cggccggcac cctcagcagc 1740 aacgcaggcg gcgtactgag cgccgacacc ggcaagctca ccctcaccgc cgcacaacaa 1800 ctcaacaacg cccagggccg cttgcaggcc gggcagggcg atatcgaact gcacgccgcg 1860 aacctggata accagagcgg cacgatcgtc ggcaagcaac tgctgctcga cgtggccggc 1920 ggcgacatcg acaaccgtgc cgggcgcgtg ttgggtgacc acctcgacgt gcgcgcctcg 1980 ggcctggaca accgcaacgc cggcctgctg gccggtggtg cccagggcgt aagcctgctg 2040 ctcaaaggcc cgggccagtt gctcaacgcc cagggccgca tccagagcga gggcctgctg 2100 caactgcaag gcgagcgctt cgacaacagc gccggcatcc tgctgggcca gaccgtcgac 2160 gtgaccgcgc agaccttcaa caacagcaac aaaggcgcgc tggtcagcga tggcggtgat 2220 gtggtgttca aggtcagcga cctgctcacc aacgtcggtg gccagatcga cgcgggcgaa 2280 cgcagcgtgt tggtcaagca gctcaccacc ctcaacaacg acggcggcac cctgcgcggc 2340 aagcgcctgg acatcgccgc ccagcacctg aacaacgaca acggccaact gctggccggc 2400 gccgaaggcc tgagctacag cggccaggat gtgagcaacc gcaagggcct gatcctcagc 2460 ggcggcgccc tcaccgaact gaacaccacc cgcctggata atcagggcgg cactgtgcag 2520 ggcgacagcc tgaccgtcac cgccaacaac gtcgacaacg gcagcggcgg cctgatggca 2580 agcctggtcg gcaacctgca gctcactgtc gaagccctgg ccaaccgtgg cggcaagctg 2640 ttcggcaaag aacaagtgac cgtcagcggc gccagcctcg acaacagcgc gggccagatc 2700 agcggcaatc agatcaacct gacctcacgc gacacgctca ccaaccaggg cggtttggtt 2760 gaagccaacc agggcctgac cctcactggt ggcaacctcg ataacagcgc caacggccaa 2820 ctgcgtgccc tgggcggcgc cagcagccgc gtcaacctca gcggtgcgtt gaacaaccag 2880 aacggcaccc tcgaattcgg tagccaggcc ttcagccttg acgcggccag cctcaacaac 2940 cagaacggga tgctgcaaca cgccggcacc ggcctgttcc acctcaacat cgccagcctc 3000 gaaggcagcc agggcaatat ccagggcatg ggcagcgccg actgggcatt cggcaaggtc 3060 gacggcctgg gccgcgtgca actcaacgat gtgctcacct acaagagcga ccaagggctg 3120 gccctccagg ccggcgaccg catggccagc gccaagggct tgatcctcaa cgtggccagc 3180 ctggacaacg gcggcgaact gctcagcgac ggtgacatca gcatcaccac cggcgatatc 3240 accaacagcg gccgcgtctc ggccctgcaa acactcaccg tcgccgccaa caacctcagc 3300 cagaacggcg gccgcctggc cgcaaccaat gcccgcctga ccctgggcgg caccctggac 3360 aacctcggtt tcctcaccgc ccgccagcaa ctggacatcg ccgccgcgca aatcaacaac 3420 cgtggcaccc tcggtgccca gggcgcagtg aacctcacgg cggtcaacgg catcaccaac 3480 gccgccgaca cgctgctgtt cagcggcggc gacatgaccc tgcgcagcaa tggcttcagc 3540 aacagctatg gcgatgtcta cagcaaaggc aacctgagtt tcgccgcccg cgatggcgga 3600 cgtgccgtgc tgttcagcaa ccgctccggc accgtggaaa gcgaaggctc aattggcatc 3660 aatgcaggct ttatcgaaaa cgccaaagac gaattcgaac tcgggcagac actgaccacc 3720 ggtagcttga gctggatctg tggccagcac tgcggcgaga gcgacaactg ggaacgtggc 3780 gagatcacca tctacgaaac gtacctcgag gcggcgacca aggactcggt agcggcgcgc 3840 ctggtggcgg gcaaaaacat gctgctgcaa ggcgacacgg tgcagaaccg ctacagcctg 3900 atggccgcca atggcgacct gagcatcact gccggagacc tgctcaacca gggcgccgcc 3960 acgcgcacgg gccagcgcaa gcttgtcatc ggcacgccag gtcacgtctc cgacgatttg 4020 tttgaacgca tgcaatatgt tgatgtgccc gcgttcaatg cggccacggc ggctgggaat 4080 ttcgacaagg cgcgcttcga agaactcaaa agccgctcac ccaatagcct gccgttcgcc 4140 tacgccagtg acgtcaccac ctggaccaac aacagcggcc ccggctacga cgccaccctg 4200 caagcgggcg gcacggtcaa cctcaacgtc gcccgcaccc tgcaaaacgg cacgctgcac 4260 aacaacaccc tggcccagtt gaccggcacc ctcggcgacg accagaccgg catccccgtc 4320 ggcggcatca acatcaacct gagcaaacac gccaacgacc cgagcgccca ggcgcccggc 4380 agtgtcttgc ccgtcgtggg cgtggcccct ggtggcggct tcgtgcccgt ggattacacc 4440 ggcaccgcgt ttgccccggt cgaccccacc acctcgccca ccttccaact gcccaagggc 4500 gaatacggcc tgttcgtcaa aaacgccgac cccaccagcc actacctgat cgagaccaac 4560 cccgagttca cctcggtgtc gggcttcttc agctccgact acatgctcgg caaactcggt 4620 ttcaccgccg acaacgcctg gcgccgcctc ggtgacggcc agtacgaaac ccgcctgatc 4680 cgcgacgccg tcctcgcgca aaccggccag cgcttcctcg ccggcggcct gtacagcgac 4740 gccgaccagt tccgctacct gatggacaac ggcctcgcca gcaaagacgc cctgcgcctg 4800 agcctgggcg tggccctcac cgaccagcaa gtcggcgccc tgacccacga catcgtgtgg 4860 atggaaaacc gcgtcatcga aggccagacc gtgctcgtgc cggtgctgta cctggcccag 4920 gccgactcgc gcaacgtgcg cggcaacagc ctcatccagg gccgcgacct caacctggtc 4980 accggcggcg acctgatcaa cgtcggcacc ctgcgcgcca gcaacaacct ctccgccatc 5040 agtagcggca gcatttatac cggcggcctg gtcgaagccg gcaacaatct cagcctgctg 5100 gcccaggaca gcatccgcaa cgccatggcc ggcgaaatcc gcggcaagca agtcagcctc 5160 acggcgctca aaggcgatat caccaacgaa accaccgcca tccaggtgcg tgacggcgcc 5220 ggtatgcgca ccctcaccga caccagcgcc ggcaccatcg tcgcccgcga aaacctcgcc 5280 atcgacgctg gccgcgacct caccaaccga ggcgcgctgg tagcgggcaa cgacgccaac 5340 ctcaccgccg gccgcgacct caacctcatc gccgccagcg acacccgcgt caaacacgag 5400 acccgcgacg gcggcgagaa atccagcatc accaccgacg tcaaaaacct cgccgccagc 5460 gtcacggcgg gcggcaacct caacatgcag gccgggcaag acgtcaacat catcggcagc 5520 aatgccacgg ccggcaaaga cctcaacatc gccgccggcc gcgacctcaa cgtcgcctcg 5580 gtcagcgaca tgcacaacgt cgagggcaag gaaaaggacg gcaaaaaacg catcaggacc 5640 tcggacgacc agaccactca agtggcaagc gtgctgacgg cgggtgggga ttttgtcagc 5700 caggcggggc gtgataccac gattgtggcg agcatgatca gtgcggggaa tgaggcttat 5760 ctgtatagcg gggataagtt gagtttgttg gcggctgaga acagtacgca tacgttgtat 5820 gacatgaagg agaagggaag ctggggcgct aaaaaggcgc agatggatga agtgacccgc 5880 accacccagg tagggaccga gatcaagaca ggtggcaacc tagtccttaa aagcgacggc 5940 gaccagctgt atcaagttgc gaagcttaat agcggcaagg acatcatcct tgatagcggt 6000 ggtgcaattg tctttgaagg cgtcaaggac ctgcacgatg agagccacac taagagcaaa 6060 agcgacctct cgtggttcag cgctaagggc aaaggtaata cagacgaaac cttgcgtcag 6120 agcgagttgg ttgcccaagg acagcttgtc atcaaggccg ccgaaggcat tcgtatcgac 6180 gtcaaacagg tcgatcagca gactgtaagc cagaccgttg atgcgatggt caaggctgat 6240 cctaatttgg cctggctcaa gcaagctgag gcacgtggcg acattgattg gcgccaggta 6300 aaggagattc acgagagctt caagtacgac aactcagggt tgggcgccgg tgccaagatt 6360 gcgattgcga tcatgatggc ggcgatcatg gggccggtag gattcgggtt gcagggagcc 6420 acccttgcgg tgagcaccag cctgagtacg acggcagtca ctagcaccat caacaacaaa 6480 ggcaatttgg gtgcagcgct taaggaaacg gtcagcgcca atagcctgaa aagcgcagca 6540 gtcgccgggt tcacggcggg ggctcttgag tatgccgaca ccaattggtt cgctggtgct 6600 gacggtgcag gtgcaggtgc aggcacaagt acaagcacag tccaaggtgt taccccgagt 6660 acgggttcaa ccttggcggt tacgaactcc tccaaagata ttttcacctg gacgtcagca 6720 ggcgatatcg cgctgcgtac cggtggccgg gcggtaatct ctagcggaat atcgacggcc 6780 attcaagggg gaagcttcgg cgacaacttc aatgcggccc tgttgggaga ggctggcaac 6840 gttgcaatgg ctaccggttt taattgggtg ggtgactacg tcacgttccc caatggcagc 6900 cctcaaaaga ttattgcgca cgctttgatg gggggattgc tggctgaagc cacaggtagc 6960 gatttcaaaa ccggggctgc cgctgccggg ctgaatgagg cactcatcaa tcagttggtg 7020 tgggctgctc aaggcaatga cgacatcacg ctgatgcttt cacagctgac aggcttgtta 7080 gcagctgcgg cggtcgatgg agatttggaa aaaggctctc agattgctca gaaggcgacg 7140 acgttcaact atctttacca cgaagaagtc gaggaaatgc ttcgggaggt agatagcaag 7200 actacggagc aagagaagcg tgaggtcagg cagcgctatg cggaacttga tcagcagaga 7260 aatgacgagt tggatgcgct ttgcgcacgc gatccgcaac gctgccgagg tattgccact 7320 tccttggcga acgatgatca gaaactcgtt gatctggtag gtaggttgag atcccaaggg 7380 cagggcggtg ctgcttctgc ggttggtttt gtgataggga acaacctaga cgcgtccagc 7440 caaattgcag cagatatcag ctctgcgggc ggtgggccat tagttaagct cggtgcggag 7500 gcaattaagg ccggagttgg gatcacactg ccttcacgtt caagctctgg taaggggaaa 7560 ggaagccaag tcggcgcggg ttcccttgaa gaggcggcgg gtccaaaggc gacaggcgaa 7620 gtagtgcctc ccgcgcctat tgtgacttct ggtgcgacta ggacaggtgt tgttcgtaca 7680 aatgccgcag attggagagc actgcgtaat aattgggatg accttgggta tggtcaaatc 7740 ttaagtactg aaaatcgggc cgcgattgct aaaggacgga ctccaaaagt cgacgatgca 7800 tgggttaagg tttttcctga agatgcaggg ctaaagggcg agagaattcc tatgcaccat 7860 gttcagggtt cgccacttac tgtgccactg cctgatacac ggcatttgga tgcgcatatg 7920 ccaggagggt ttagatataa tccaggcggt ccagggtcgg ctctcccggc ataccctcca 7980 aaaaaaggag ctgaataa 7998 <210> 45 <211> 607 <212> PRT <213> Pseudomonas fluorescens <400> 45 Met Phe Arg Arg Leu Arg Gly Ile Pro Leu Leu Gly Cys Leu Met Gly 1 5 10 15 Ser Ile Gly Cys His Ser Gln Pro Pro Ala Pro Pro Pro Ile Gln Lys 20 25 30 Gly Asp Tyr Gly Ala Ile Ile Arg Tyr Leu Gln Thr Arg Ile Pro Arg 35 40 45 Glu Met Ala Arg Asp Asn Val Ala Gly Leu Ser Ile Ala Leu Val Asn 50 55 60 Gly Gln Glu Leu Ile Trp Ala Arg Gly Phe Gly Leu Ala Asp Lys Asp 65 70 75 80 Gln Gly Val Pro Val Thr Pro Asn Thr Ala Phe Arg Ala Gly Gly Ile 85 90 95 Ser Lys Leu Leu Ser Ala Thr Ala Ala Leu Gln Leu Val Glu Gln His 100 105 110 His Leu Ala Leu Asp Ala Pro Ile Gln Gln Thr Leu Arg Glu Phe Tyr 115 120 125 Val Arg Ser Arg Phe His Ser Asp Gln Ala Glu Ala Asp Arg Ala Ile 130 135 140 Thr Leu Arg Arg Leu Leu Ser His Gln Ser Gly Leu Pro Ser Glu His 145 150 155 160 Leu Arg Asp Leu Arg Ser Thr Tyr Ala Met Gly Gln Met Pro Met Arg 165 170 175 Val Ser Gly Val Trp Leu Ser Ser Leu Pro Gly Ser Gln Val Ala Tyr 180 185 190 Ser Asn Leu Gly Tyr Ser Leu Val Gly Ala Ala Ile Glu Arg Ser Ser 195 200 205 Gly Lys Ser Phe Glu Ala Gln Leu Gln Ser Ser Leu Leu Thr Pro Leu 210 215 220 Arg Met Asn Gln Ser Ser Phe Val Gly Thr Gly Ala Gln Met Gly Phe 225 230 235 240 Arg Ala His Gly Tyr Glu Asp Gly Lys Ala Ser Thr Asp Ala Gln Val 245 250 255 Arg Asp Leu Ala Ala Gly Gly Leu Trp Thr Ser Pro Lys Asp Leu Ser 260 265 270 Arg Tyr Val Arg Met Leu Phe Ala Asn Gly Thr Tyr Lys Gly Ser Gln 275 280 285 Ile Leu Gly Ser Ala Ser Ile Asp Ala Met Phe Thr Gln Gln Asn Thr 290 295 300 Gly Asn Ala Leu Asp Phe Asp Cys Gln Ile Gly Leu Gly Trp Phe Leu 305 310 315 320 Ala Pro Cys Gly Asp Glu Pro Ile Gly Pro Gly Val Arg Thr Tyr Gln 325 330 335 His Ser Gly Gly Gly Asp Asp Phe Val Ala Gln Leu Thr Leu Leu Pro 340 345 350 Asp Gln Gln Leu Ala Val Ile Ile Met Ala Asn Asp Ser Asn Ala Glu 355 360 365 Asp Met Val Val Ser Leu Thr Thr Asp Ser Leu Arg Leu Met Leu Gln 370 375 380 Ala Gln Thr Gly Gln Pro Val Cys Ala Asp Asp Cys Gln Ala Pro Ser 385 390 395 400 His Gly Leu Lys Leu Arg His Val Pro Ala Ala Val Asp Arg Lys Arg 405 410 415 Leu Ala Gly Phe Tyr Ala Thr Ala Trp Gly Val Phe Arg Ile Arg Asp 420 425 430 Tyr His Ala Arg Leu Thr Gly Glu Leu Ala Gly Tyr Asp Phe Glu Leu 435 440 445 Leu Arg Asp Glu Gln Gly Trp Leu Arg Ala Gln Lys Lys Ile Leu Gly 450 455 460 Phe Trp Arg Lys Asp Leu Gly Glu Leu Gly Arg Val Gln Leu Asp Val 465 470 475 480 Ile Gln Val Gln Gly Arg Gln Met Leu Thr Ala Arg Ser His Gly Gln 485 490 495 Arg Ile Ala Ile Gly Glu Arg Ile Glu Pro Pro Pro Leu Pro Ala Ala 500 505 510 Trp Ala Asn Thr Val Gly Thr Tyr Gln Val Leu Ser Ser His Glu Pro 515 520 525 Asp Ala Pro Leu Ser Gly Ile Ser Val Arg Gln Glu Asp Gly Phe Leu 530 535 540 Val Ile Arg Gly Gln Leu His Gly Glu Pro Leu Thr Asp Tyr Ile Leu 545 550 555 560 Leu Pro Ile Asp Asn Ala His Ala Val Leu Ala Gly Asn Gly Tyr Gly 565 570 575 Leu Gly Asp Thr Val Ser Arg Gln Val Asn Gly Leu Ser Ala Ser Gly 580 585 590 Tyr Ser Phe Lys Arg Thr Gln Ser Pro His Ile Pro Ser Asn Phe 595 600 605 <210> 46 <211> 1824 <212> DNA <213> Pseudomonas fluorescens <400> 46 atgtttcgca ggttgcgcgg tattccgctc ttgggttgcc tgatgggcag tatcggttgc 60 cactcgcaac cgcctgcccc gccgccgatt caaaaaggcg attacggcgc aatcatccgc 120 tacttgcaaa cccgcattcc ccgggagatg gctcgggaca atgtggcagg tttgtcgatt 180 gcgctggtca atggccagga gctgatctgg gctcgtggct ttggcctggc tgacaaagac 240 cagggggtgc cggtcacgcc caataccgcg tttcgcgccg gtggcatttc caaactgctg 300 agcgccacgg cggcgctgca gctggtggag cagcaccacc tggcgctgga tgcaccgatc 360 cagcagaccc tgcgtgagtt ctacgtacgt tcacgctttc acagcgacca ggccgaggcg 420 gatcgagcga tcactttgcg gcgcttgctc agccatcaat ccggcttgcc cagcgagcac 480 ctgcgcgacc tgcgcagcac ctacgccatg gggcaaatgc caatgcgcgt gtcgggtgtg 540 tggctgagca gcctgccggg gtcccaggtg gcgtactcca accttggtta ttcactggtg 600 ggcgcggcca tcgagcgcag cagcggtaaa agctttgaag cccagttgca aagcagcctg 660 ctcacgcccc tgcgaatgaa ccagtccagc ttcgtaggca ccggtgcaca aatgggcttt 720 cgcgcccatg gttacgagga cggcaaggcc agcaccgacg cccaagtgcg tgacctcgcc 780 gccggtggcc tgtggaccag ccccaaagac ctcagccgct acgtacgcat gctgtttgcc 840 aacggcacct acaagggcag ccagatcctc ggcagcgctt ctatcgacgc catgtttacc 900 cagcaaaaca ccggcaacgc cctggatttc gactgccaga tcggcctggg ctggtttctg 960 gcgccctgcg gtgacgagcc catcggcccc ggtgtgcgca cctaccagca cagcggtggc 1020 ggcgatgact tcgtcgccca attgaccctg ctaccggatc agcagctggc ggtgatcatc 1080 atggccaacg acagcaacgc cgaagacatg gtggtgtcac tgaccaccga cagcctgcgc 1140 ctgatgctcc aggcacagac tggccagccc gtgtgcgccg atgactgcca ggcgccgagc 1200 cacggcctca agctgcgcca tgtgccggcg gcggtggatc gcaagcgcct ggctggtttc 1260 tatgcgaccg cctggggcgt gttccgcatc agggattacc atgcacgctt gaccggcgaa 1320 ctggccggct acgatttcga gctgttacgt gatgaacaag gctggctgcg cgcgcagaaa 1380 aagatcctcg gcttctggcg caaggacctg ggcgagttgg gccgcgtgca gttggatgta 1440 atccaggtac aaggccgcca aatgctcacc gcgcgcagcc acggccaacg cattgccatc 1500 ggtgaacgca tcgagccacc gcccttgcct gccgcctggg ccaacacggt cggcacctat 1560 caggtgctca gcagccatga acccgacgcg ccattgagtg gcatcagcgt gcgtcaggag 1620 gacggctttc tggtgattcg tggccaattg cacggcgagc cgctgaccga ctacatcctg 1680 ctacccatcg acaacgccca tgcggtactg gccggcaacg gttacggctt gggcgatacc 1740 gtcagccgcc aggtcaacgg gctgagcgct tcgggttatt ccttcaaacg tacccaatca 1800 ccccacatac cctcgaattt ctaa 1824 <210> 47 <211> 814 <212> PRT <213> Pseudomonas fluorescens <400> 47 Met Arg Val Pro Gly Pro Thr Ala Thr Asn Ser Asn Ala Gly Gln Val 1 5 10 15 Pro Asp Pro Arg Ser Gly Ile Ser Pro Glu Gly Pro Thr Gln Val Tyr 20 25 30 Thr Leu Asn Ser Lys Lys Thr Val Phe Thr Thr Glu Gln Ala Gly Lys 35 40 45 His Ile Thr Arg Ser Gly Phe Lys Phe His Asp Ser Asn Gly Asp Gly 50 55 60 Lys Thr Thr Leu Ser Tyr Arg Val Ser Lys Gly Phe Thr Pro Gln Gln 65 70 75 80 Ala Asp Gln Ala Arg Gln Ala Leu Gln Ser Trp Gln Asp Val Ala Asn 85 90 95 Val Thr Phe Thr Glu Lys Arg Gln Gly Ala Asp Gly His Ile Asp Ile 100 105 110 Asn Glu Met His Gly Thr Ser Gly Gly Met Ala Ser Leu Pro Asn Arg 115 120 125 Tyr Met Ser Gln Thr Phe Ala Asn Val Gly Thr Ala Asn Ala Gly Ala 130 135 140 Asn Pro Pro Arg Gly His Tyr Phe Arg Glu Val Leu Val His Glu Ile 145 150 155 160 Gly His Thr Ile Gly Leu Glu His Pro Gly Asp Tyr Asp Gly Ser Gly 165 170 175 Asn Tyr Gly Arg Asp Ala Ala Tyr Ala Gly Asp Thr Arg Ala Arg Ser 180 185 190 Val Met Ser Tyr Tyr Ser Glu Lys Asn Gln Pro Gly His Asp Phe Lys 195 200 205 Ser Leu Asn Pro Ser Ala Pro Met Met Asp Asp Ile Ser Ala Val Gln 210 215 220 Lys Leu Tyr Gly Ala Asn Thr Lys Thr Arg Asn Thr Asp Thr Thr Tyr 225 230 235 240 Gly Phe Asn Ser Asn Thr Asn Arg Glu Ala Tyr Ser Leu Lys Ser Ala 245 250 255 Asn Asp Thr Pro Ile Phe Cys Val Trp Asp Gly Gly Gly Asn Asp Thr 260 265 270 Leu Asp Phe Ser Gly Tyr Ser His His Gln Lys Ile Asn Leu Asn Ala 275 280 285 Glu Ser Phe Ser Asp Val Gly Ala Leu Lys Gly Asn Val Ser Val Ala 290 295 300 Lys Gly Val Thr Leu Glu Asn Ala Val Gly Gly Lys Gly Asp Asp Thr 305 310 315 320 Leu Ile Gly Asn His Val Ala Asn Arg Leu Lys Gly Gly Ala Gly Ala 325 330 335 Asp Arg Leu Ser Gly Gly Gly Gly Ala Asp Thr Phe Val Tyr Asp His 340 345 350 Ala Ser Asp Ser Thr Pro Asp Asn Pro Asp Val Ile Leu Asp Phe Ala 355 360 365 Ser Gly Ala Asp Lys Ile Asp Val Ser Ala Val Leu Lys Arg Ala Asn 370 375 380 Val Ser Ala Leu Lys Phe Val Asp Arg Leu Thr Gly Gln Pro Gly Gln 385 390 395 400 Ala Val Met Ser Tyr Asp Glu Gly Arg Asn Glu Gly Gly Leu Ala Leu 405 410 415 Asp Leu Thr Gly Asn Gly Lys Ala Asp Leu Leu Ile Lys Ser Ile Gly 420 425 430 Gln Ile Lys Ala Ala Asp Ile Leu Ala His Gly Asp Thr Thr Ala Pro 435 440 445 Asn Pro Glu Pro Lys Asp Pro Lys Pro Gln Pro Arg Pro Gln Pro Glu 450 455 460 Glu Pro Lys Pro Lys Pro Glu Ser Lys Pro Lys Glu Pro Lys Pro Glu 465 470 475 480 Glu Pro Lys Pro Arg Pro Asp Ser Cys Glu Pro Lys Pro Arg Pro Asp 485 490 495 Pro Cys Glu Pro Lys Pro Arg Pro Asp Pro Cys Glu Pro Lys Pro Arg 500 505 510 Pro Asp Ser Cys Glu Pro Lys Pro Arg Pro Asp Pro Cys Glu Pro Lys 515 520 525 Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro Arg Glu 530 535 540 Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro 545 550 555 560 Arg Glu Pro Gln Pro Cys Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro 565 570 575 Asp Pro Cys Glu Pro Gln Pro Arg Pro Asp Pro Cys Glu Pro Gln Pro 580 585 590 Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro Arg Glu Pro 595 600 605 Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Gln Pro Arg Pro Asp 610 615 620 Pro Arg Glu Pro Tyr Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg 625 630 635 640 Pro Asn Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro Arg Glu Pro Gln 645 650 655 Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asp Pro Cys Glu 660 665 670 Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Arg Pro Arg Pro Asn Pro 675 680 685 Arg Glu Pro Gln Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro Arg Pro 690 695 700 Asp Pro Arg Glu Pro Arg Pro Arg Pro Asp Pro Arg Glu Pro Gln Pro 705 710 715 720 Arg Pro Asp Pro Cys Glu Pro Gln Pro Arg Pro Glu Pro Cys Glu Pro 725 730 735 Arg Pro Arg Pro Asn Pro Arg Glu Pro Gln Pro Arg Pro Asp Pro Cys 740 745 750 Glu Pro Lys Pro Thr Pro Arg Thr Asp Pro Cys Glu Pro Lys Ala Val 755 760 765 Thr Arg Asn Val Arg Pro Ala Tyr Gly Leu Ser Ala His Ser Gly Glu 770 775 780 Tyr Arg Ala Met Gln Ala Pro Ala Phe Asp Ser Arg His Phe Gln Gly 785 790 795 800 Gly Leu Ala Gly Glu Phe Ile Arg Arg Gln Lys Arg Ala Glu 805 810 <210> 48 <211> 2445 <212> DNA <213> Pseudomonas fluorescens <400> 48 atgagagtgc caggaccaac cgcaacgaat tctaatgcag ggcaggtgcc agatccgagg 60 agtggcatca gcccggaggg ccctacgcag gtatatacac taaacagcaa aaaaaccgtc 120 ttcactacgg aacaggccgg gaaacatatc acccgcagcg gtttcaagtt tcatgacagt 180 aacggtgatg gcaaaaccac gttgtcctat cgtgtttcca agggctttac cccacagcag 240 gcagatcaag ccaggcaggc actgcaatcc tggcaggatg tcgctaacgt cacattcact 300 gaaaaaaggc agggggctga cggccatata gatatcaatg agatgcacgg aacctctggg 360 ggtatggcct cactccccaa ccgctatatg agtcaaactt tcgcaaatgt cggaacagcg 420 aatgcaggtg caaaccctcc acggggtcat tattttcgcg aagttctagt tcacgaaata 480 ggccacacca ttgggctgga acacccgggg gactatgatg gctctggtaa ctatggacgg 540 gacgcagcgt atgccgggga tactcgagcg cgttctgtga tgagttacta ttcggaaaaa 600 aaccagccgg gacatgattt caaatcattg aacccctctg cgccgatgat ggatgatata 660 tcggccgttc agaaactcta tggggcgaat actaaaacgc gtaataccga tacgacgtat 720 ggatttaatt ccaatacaaa ccgtgaagcc tatagtttga agtcggctaa cgacacaccc 780 attttctgtg tgtgggatgg tggtggtaat gacacattgg atttctctgg gtattcacac 840 catcagaaaa tcaacctcaa tgccgagtcc ttttcggatg taggggcgtt gaaaggtaac 900 gtttccgttg ccaagggcgt cacgctggaa aatgcagtgg gcggtaaggg cgacgacaca 960 cttatcggta atcatgttgc caatcgcctc aaaggggggg cgggagccga cagactgtct 1020 ggggggggcg gcgcagatac ctttgtttac gaccatgcca gtgattccac cccggataac 1080 cctgatgtca tcctggattt tgcgagtggc gcagataaga ttgatgtatc cgcagtcctt 1140 aaaagagcga atgtcagtgc tctcaagttc gtcgatcgct taactggcca acccggccag 1200 gctgtgatga gttatgacga gggccgcaac gagggggggc tggccctgga tctgacaggc 1260 aacggcaagg ctgatctatt aataaaaagc attggccaga taaaagctgc tgatatcttg 1320 gcgcacggcg atacaaccgc gccaaaccct gaacccaaag atcccaagcc gcagccgcgt 1380 cctcaacccg aggagcccaa acccaagcct gaatccaaac cgaaggagcc aaaaccggag 1440 gaaccaaaac cgcgtccgga ctcgtgtgaa ccaaagccgc gtccggatcc gtgtgagccg 1500 aagccgcgtc cggatccgtg cgagccgaag ccgcgtccgg attcgtgtga gccaaagccg 1560 cgtccggatc cgtgcgagcc gaagccgcgt ccagatccac gcgaaccgca gccacgtccg 1620 gacccgcgcg agccgcagcc gcgtccagat ccacgcgaac cgcagccacg tccagaccca 1680 cgtgaaccgc agccatgtcc ggatccacgc gaaccgcagc cgcgtccgga cccgtgtgag 1740 ccgcagccgc gtccggaccc gtgtgagcca cagccgcgtc cagacccacg tgaaccgagg 1800 ccgcgtccga acccacgtga accgcagcca cgtccggacc cacgcgagcc gcagccgcag 1860 ccgcgtccgg acccacgtga accgtaccca cgtccagacc cacgtgaacc gaggccgcgc 1920 ccgaacccac gtgagccgag gccgcgtccg aacccacgtg aaccacagcc gcgtccagac 1980 ccacgtgagc cgaggccgcg tccggacccg tgtgagccac agccgcgtcc agacccacgt 2040 gagccgaggc cgcgtccgaa cccacgtgaa ccacagccgc gtccagaccc acgtgaaccg 2100 cagccacgcc cggacccgcg tgagccgagg ccgcgtccgg acccacgtga accgcagcca 2160 cgcccggacc cgtgtgagcc acagccgcgt ccggaaccat gtgagccgag accgcgtccg 2220 aacccacgtg aaccgcaacc acgtccggac ccgtgcgagc ctaaaccaac ccctcgcaca 2280 gatccttgcg agccgaaagc tgtcactcga aacgtaaggc cagcctatgg cttgagtgcc 2340 cattcaggcg agtaccgggc gatgcaggcg ccagcctttg atagtcgtca tttccagggc 2400 gggcttgcag gggaattcat tcgacgtcag aagcgcgctg aatag 2445 <210> 49 <211> 262 <212> PRT <213> Pseudomonas fluorescens <400> 49 Met Ala Ser Thr Arg Val Arg Phe Gln Phe Arg Gln Asp Glu Ser Gly 1 5 10 15 Glu Leu Arg Val Tyr Gly Leu His Thr Gln Pro Gly Ser Gly Ala Asp 20 25 30 Arg Val Pro Val Ala Gln Ala Arg Trp Asn Val Asp Lys Ser Ala Met 35 40 45 Val Ala Val Leu Asp Gly Ile Ser Ile Thr Trp Thr Pro Asn Leu Gly 50 55 60 Pro Val Val Ser Val Pro Ser Pro Tyr Pro Gly Thr Pro Glu Arg Leu 65 70 75 80 Asp Asn Met Phe Val His Pro Ile Ala Val Gly Gln Asp Ser Ala Ile 85 90 95 Ser His Tyr Pro Gly Arg Asp Ala Glu Asn Ile Thr Trp Gln Asp Thr 100 105 110 Ile Ile Ser Phe Pro Ala Asp Ser Gly Val Pro Pro Leu Tyr Leu Val 115 120 125 Phe Ala Lys Pro Ala Val Arg Pro Leu Glu Val Asp Ile Tyr Gly Ala 130 135 140 Phe Ser Gly Arg Leu Arg Asn Gly Leu His Val Asp His Ile Pro Ser 145 150 155 160 Gln Ala Ala Ile Arg Arg His Leu Glu Arg Tyr Ala Ile Ser Phe Thr 165 170 175 Glu Lys Gln Leu Lys Glu Ala Leu Asn Asn Ala Ala Ser Ile Ala Ile 180 185 190 Pro Ser Tyr Ile His Gln Lys Phe Ser Glu Thr Tyr Gly Trp Arg Asn 195 200 205 Thr Glu Lys Lys Gln Thr Leu Asp Ala Asp Asp Leu Arg Gln Ala Ala 210 215 220 Asp Asn Asn Phe Asp Ala Ile Lys Pro Tyr Leu Leu Asp His Gly Phe 225 230 235 240 Ala Glu Thr Asp Leu Glu Met Ala Arg Thr Arg Met His Lys Val Asn 245 250 255 Glu Asn Gln Gly Trp Tyr 260 <210> 50 <211> 789 <212> DNA <213> Pseudomonas fluorescens <400> 50 atggccagca cgcgagtgcg tttccagttt cgccaggatg agtccggtga actgcgtgtt 60 tacggcctac atacccaacc tggcagtggc gccgaccgtg tgccggttgc acaagcccgg 120 tggaatgtgg acaaaagcgc gatggtcgcg gtgctggatg gcatcagcat cacatggacg 180 ccgaacctcg gcccggttgt cagcgtgccg agcccgtatc ccggaacacc ggaacgcttg 240 gataacatgt ttgttcatcc gattgcggtg gggcaagatt cggcgatcag tcactatcca 300 gggcgggatg cagaaaacat cacctggcag gatacgatca tttcgtttcc ggctgattcg 360 ggtgtgccgc cgttgtattt ggtgtttgcc aagccggcgg tcaggccgtt ggaagttgat 420 atttacggtg cgttcagtgg acgactgcgc aacgggttgc acgtggatca cataccctcg 480 caggcagcga taagacgtca tctcgaacgc tatgcaataa gctttacaga gaagcagctc 540 aaggaagcgt taaataatgc tgcgagcatt gctattccgt cttacatcca tcaaaagttt 600 agtgagactt acggttggcg aaacacggag aaaaagcaga cgttagatgc cgacgatctt 660 cgtcaggcgg cagacaacaa ttttgatgct atcaagccat acctcctgga tcacggcttc 720 gctgagactg atctcgagat ggcacgcacc cgaatgcata aggtcaacga aaaccagggg 780 tggtactag 789 <210> 51 <211> 4677 <212> PRT <213> Pseudomonas fluorescens <400> 51 Met Asn Ala Glu Asp Ser Leu Lys Leu Ala Arg Arg Phe Ile Gly Leu 1 5 10 15 Pro Leu Glu Lys Arg Gln Leu Phe Leu Gln Ala Leu Gln Lys Glu Gly 20 25 30 Val Asp Phe Ser Arg Phe Pro Ile Pro Ala Gly Val Glu Val Glu Asp 35 40 45 Arg Gln Ala Leu Ser Tyr Ala Gln Gln Arg Met Trp Phe Leu Trp Gln 50 55 60 Leu Asp Pro Ala Ser Gly Ala Tyr Asn Leu Pro Gly Ala Val Arg Leu 65 70 75 80 Ser Gly Val Leu Ser Leu Pro Ala Leu Glu Gln Ala Phe Ala Ser Leu 85 90 95 Val Ala Arg His Glu Thr Leu Arg Thr Val Phe Gln Arg Gln Ala Asp 100 105 110 Glu Arg Leu Ala Gln Val Ala Val Glu Pro Ser Val Ala Val Glu His 115 120 125 Leu Asp Phe Thr Ala Leu Ala Phe Asp Ala Arg Glu Gln Ala Val Asn 130 135 140 Ala Ala Ala Thr Arg Gln Ser Leu Leu Pro Phe Asp Leu Glu His Gly 145 150 155 160 Pro Leu Leu Arg Val Gln Leu Leu Lys Leu Ala Glu Gln Glu His Val 165 170 175 Leu Leu Leu Thr Leu His His Ile Val Ser Asp Gly Trp Ser Met Asn 180 185 190 Val Leu Ile Asp Glu Phe Ile Arg Cys Tyr Asp Ala His Glu Arg Asp 195 200 205 Glu Ala Pro Gln Leu Pro Ala Leu Pro Ile Gln Tyr Ser Asp Tyr Ala 210 215 220 Leu Trp Gln Arg Arg Trp Leu Glu Ala Gly Glu Gln Ala Arg Gln Leu 225 230 235 240 Glu Tyr Trp Gln Ala Arg Leu Gly Asp Glu His Pro Val Leu Glu Leu 245 250 255 Pro Thr Asp His Pro Arg Pro Ala Met Pro Ser Tyr Gln Gly Thr Arg 260 265 270 His Asn Phe Ala Ile Glu Pro Ala Leu Ala Ala Gln Leu Arg Ser Cys 275 280 285 Ala Gln Lys His Asn Val Thr Leu Phe Met Leu Leu Leu Gly Ala Phe 290 295 300 Asn Val Leu Leu His Arg Tyr Thr Gly Gln Gly Asp Ile Arg Val Gly 305 310 315 320 Val Pro Ile Ala Asn Arg Asn Arg Thr Glu Val Glu Gly Leu Ile Gly 325 330 335 Phe Phe Val Asn Thr Gln Val Leu Arg Thr Glu Leu Ser Gly Gln Thr 340 345 350 Arg Val Ala Glu Leu Leu Gln Gly Ile Lys Glu His Ala Leu Gly Ala 355 360 365 Gln Ala His Gln Glu Leu Pro Phe Glu Arg Leu Val Glu Ala Leu Lys 370 375 380 Ile Glu Arg Ser Leu Ser His Thr Pro Leu Phe Gln Val Met Tyr Asn 385 390 395 400 His Gln Pro Val Val Ala Asp Ile Ala Ser Val Ser Thr Ala Ser Gly 405 410 415 Leu Glu Leu Ala Leu Val Glu Trp Gln Gly Arg Thr Thr Gln Phe Asp 420 425 430 Leu Thr Leu Asp Thr Tyr Glu Lys Ser Gly Thr Leu His Ala Ala Leu 435 440 445 Thr Tyr Ala Asn Asp Leu Phe Asp Thr Pro Thr Ile Glu Arg Met Ala 450 455 460 Arg His Trp Thr Arg Leu Leu Gln Ala Met Val Leu Asp Gly Glu Gln 465 470 475 480 Arg Ile Gly Glu Leu Pro Met Leu Asp Ala Ala Glu Gln Gln Arg Leu 485 490 495 Leu His Thr Trp Asn His Thr Ala Glu Ala Tyr Pro Thr Glu Arg Gly 500 505 510 Ile His His Leu Ile Glu Asp Gln Ala Arg Arg Ser Pro Asp Ala Pro 515 520 525 Ala Leu Val Phe Gly Thr Thr Thr Leu Thr Tyr Ala Gln Leu Asp Ala 530 535 540 Arg Ala Asn Gln Leu Ala His Ala Leu Gly Glu Gln Gly Val Gly Pro 545 550 555 560 Asp Val Leu Val Gly Ile Cys Ile Glu Arg Ser Ile Glu Met Val Val 565 570 575 Gly Leu Leu Ala Ile Leu Lys Ala Gly Gly Ala Tyr Val Pro Leu Asp 580 585 590 Pro Glu Tyr Pro Gln Glu Arg Leu Ala Tyr Met Ile Glu Asp Ser Gly 595 600 605 Ile Gln Leu Leu Leu Ser Gln Gln Ser Leu Leu Ala Ser Leu Pro Val 610 615 620 Ala Gly Ile Gln Val Ile Ala Leu Asp Gln Pro Ala Leu Trp Leu Asp 625 630 635 640 Gly Tyr Ser Ser Glu Ser Pro Asn Val Ala Leu His Ala Leu Asn Leu 645 650 655 Ala Tyr Val Ile Tyr Thr Ser Gly Ser Thr Gly Lys Pro Lys Gly Ala 660 665 670 Gly Asn Ser His Arg Ala Leu Val Asn Arg Leu Ser Trp Met Gln Gln 675 680 685 Ala Tyr Gly Leu Gly Ala Asn Asp Ala Val Leu Gln Lys Thr Pro Phe 690 695 700 Ser Phe Asp Val Ser Val Trp Glu Phe Phe Trp Pro Leu Met Ser Gly 705 710 715 720 Ala Arg Leu Val Val Ala Ala Pro Gly Glu His Arg Glu Pro Ala Arg 725 730 735 Leu Ile Asp Thr Ile Gly Arg His Ala Ile Thr Thr Leu His Phe Val 740 745 750 Pro Ser Met Leu Gln Ala Phe Ile His Glu Pro Gly Val Gln Ala Cys 755 760 765 Ala Ser Leu Thr Arg Ile Val Cys Ser Gly Glu Ala Leu Pro Leu Asp 770 775 780 Ala Gln Gln Gln Val Phe Ala Lys Leu Pro Ala Ala Ala Leu Tyr Asn 785 790 795 800 Leu Tyr Gly Pro Thr Glu Ala Ala Ile Asp Val Thr His Trp Thr Cys 805 810 815 Ile Asp Glu Gly Val Asp Ser Val Pro Ile Gly Arg Pro Ile Ala Asn 820 825 830 Leu Gly Thr Tyr Val Leu Asp Ala Gln Leu Asn Pro Val Pro Ala Gly 835 840 845 Val Ser Gly Glu Leu Tyr Leu Gly Gly Val Gly Leu Ala Arg Ser Tyr 850 855 860 His Arg Arg Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Ser Pro Phe 865 870 875 880 Val Thr Gly Glu Arg Leu Tyr Arg Thr Gly Asp Arg Val Arg Gln Arg 885 890 895 Ala Asp Gly Val Ile Glu Tyr Leu Gly Arg Leu Asp His Gln Val Lys 900 905 910 Leu Arg Gly Leu Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg Leu Met 915 920 925 Gln His Pro His Val Arg Glu Ala Val Val Leu Val His Gly Gly Lys 930 935 940 Gln Leu Val Ala Tyr Leu Val His Pro Gly Glu Ala Pro Thr Asp Leu 945 950 955 960 Lys Ala Trp Leu Leu Ser Ser Leu Pro Glu Tyr Met Val Pro Thr His 965 970 975 Phe Ile Ala Leu Pro Lys Leu Pro Val Thr Ala Asn Gly Lys Leu Asp 980 985 990 Arg Lys Ala Leu Pro Val Pro Asp Ala Ala Leu Gln Gln Ala Phe Val 995 1000 1005 Ala Pro Gln Gly Asp Leu Gln Thr Ala Leu Ala Ala Ile Trp Ser 1010 1015 1020 Asp Val Leu Gly Val Glu Glu Val Gly Gln Asp Asp Asn Phe Phe 1025 1030 1035 Glu Leu Gly Gly Asp Ser Ile Ile Ser Ile Gln Val Val Ser Arg 1040 1045 1050 Ala Arg Gln Ala Gly Ile Arg Leu Ser Pro Arg Asp Leu Phe Gln 1055 1060 1065 Tyr Gln Ser Ile Arg Ser Leu Ala Leu Val Ala Arg Phe Glu Gln 1070 1075 1080 Val Ser Leu Ile Asp Gln Gly Pro Val Ser Gly Glu Val Met Leu 1085 1090 1095 Thr Pro Val Gln His Ser Phe Phe Asp Gln Pro Ile Pro Ala Arg 1100 1105 1110 His His Trp Asn Gln Ser Leu Leu Leu Val Pro Gly Glu Val Leu 1115 1120 1125 Glu Pro Ala Arg Leu Glu Ala Thr Leu Ala Arg Leu Ile Glu His 1130 1135 1140 His Asp Ala Leu Arg Leu Arg Phe Val Gln Gln Ala Asp Gly Trp 1145 1150 1155 Gln Gln Ser His Ala Ala Tyr Val Ser Glu Pro Leu Leu Trp Gln 1160 1165 1170 Cys Gln Ala Ser Thr Asp Ala Glu Leu Ala Ala Leu Cys Asp Glu 1175 1180 1185 Ala Gln Arg Ser Leu Asp Leu Ala Gln Gly Pro Leu Leu Arg Ala 1190 1195 1200 Ala Leu Val Asn Leu Ala Asp Gly Ser Gln Arg Val Leu Leu Val 1205 1210 1215 Ile His His Leu Val Val Asp Gly Val Ser Trp Arg Ile Leu Leu 1220 1225 1230 Glu Asp Leu Gln Gln Ala Tyr Arg Asp Gln Ala Leu Pro Ala Lys 1235 1240 1245 Thr Ser Ala Tyr Gln Arg Trp Ala Gln Gln Leu His Arg His Ala 1250 1255 1260 Gln Ser Leu Asp Gln Gln Leu Pro Tyr Trp Gln Ala Gln Ser Ile 1265 1270 1275 Asp Ala Glu Leu Pro Cys Asp His Pro Glu Gly Gly Leu Gln Asn 1280 1285 1290 Arg Leu Gly Ala Lys Leu Glu Thr Arg Leu Asp Val Glu His Thr 1295 1300 1305 Arg Arg Leu Leu Gln Asp Ala Pro Ala Ala Tyr Arg Thr Gln Val 1310 1315 1320 Asn Asp Leu Leu Leu Thr Ala Leu Ala Arg Val Ile Ser Arg Trp 1325 1330 1335 Ser Glu Gln Pro Ala Ala Leu Ile Gln Leu Glu Gly His Gly Arg 1340 1345 1350 Glu Asp Leu Phe Asp Asp Ile Asp Leu Ser Arg Thr Val Gly Trp 1355 1360 1365 Phe Thr Ser Leu Tyr Pro Val Arg Leu His Ala Glu Gly Glu Leu 1370 1375 1380 Ser Ala Ala Ile Lys Ser Val Lys Glu Gln Leu Arg Ala Val Pro 1385 1390 1395 Asn Lys Gly Ile Gly Tyr Gly Leu Leu Arg Tyr Leu Gly Thr Pro 1400 1405 1410 Asp Thr Arg Glu Ala Leu Ser Thr Leu Ala Ala Pro Arg Ile Thr 1415 1420 1425 Phe Asn Tyr Leu Gly Gln Phe Asp Arg Gln Phe Asn Asp Ser Ala 1430 1435 1440 Leu Phe Val Pro Ala Arg Gln Gly Ser Gly Gln Ala Gln Asp Ala 1445 1450 1455 Glu Ala Pro Leu Ala Asn Trp Leu Thr Val Glu Gly Gln Val Tyr 1460 1465 1470 Gly Gly Glu Leu Ser Leu Gln Trp Gly Phe Ser Arg Glu Met Phe 1475 1480 1485 Glu Ala Ala Thr Val Gln Arg Leu Ala Asp Glu Tyr Ala Ala Glu 1490 1495 1500 Leu Asn Ala Leu Ile Glu His Cys Cys Ala Thr Pro Ala Gly Gln 1505 1510 1515 Val Ser Pro Ser Asp Phe Pro Leu Ala Arg Leu Thr Gln Gln Gln 1520 1525 1530 Leu Asp Ala Leu Pro Val Ala Gly Pro Ala Ile Ala Asp Leu Tyr 1535 1540 1545 Pro Leu Ser Pro Met Gln Gln Gly Met Leu Phe His Thr Leu Leu 1550 1555 1560 Glu Pro Glu Ala Gln Ala Tyr Ile Asn Gln Leu Arg Leu Asp Ile 1565 1570 1575 Glu Gly Leu Asp Val Leu Ala Phe Gly Arg Ala Trp Gln Ala Ala 1580 1585 1590 Leu Asp Arg His Asp Ile Leu Arg Ser Ser Phe His Trp Leu Gly 1595 1600 1605 Leu Asp Ser Ala His Gln Leu Ile Gln Arg Gln Val Asp Leu Gln 1610 1615 1620 Leu Gln Val Ile Glu Asp Pro Asn Ala Asp Phe Asp Thr Leu Ala 1625 1630 1635 His Ala Glu Arg Glu Arg Gly Phe Ala Leu Asn Ala Ala Pro Leu 1640 1645 1650 Phe Arg Leu Thr Leu Val Arg Gly Ala Gly Ala Ala Trp His Phe 1655 1660 1665 Ile Phe Thr Ser His His Ile Leu Met Asp Gly Trp Ser Asn Ala 1670 1675 1680 Gln Leu Leu Ala Glu Val Ile Ala His Tyr Ala Gly Gln Ala Val 1685 1690 1695 Pro Ala Pro Leu Gly Gln Phe Arg Asp Tyr Leu Ala Trp Leu Gln 1700 1705 1710 Gln Gln Ser Ser Gly Glu Ala Phe Trp Lys Thr Ala Leu Ala Ala 1715 1720 1725 Leu Pro Ala Pro Thr Leu Leu Ala Gln Ala Leu Arg Thr Pro Val 1730 1735 1740 Asp Gly Val Gly Met Ala Asp His His Val Ala Leu Glu Ser Asn 1745 1750 1755 Phe Thr Arg Arg Leu Gly Glu Phe Ala Arg Gln His Lys Val Thr 1760 1765 1770 Leu Asn Thr Leu Leu Gln Gly Ala Trp Ser Leu Leu Leu Gln Arg 1775 1780 1785 Tyr Thr Gly Gln Asp Cys Val Ala Phe Gly Ala Thr Val Ala Gly 1790 1795 1800 Arg Ser Ala Pro Leu Pro Gly Ile Glu Gln Gln Leu Gly Leu Phe 1805 1810 1815 Ile Asn Thr Leu Pro Ile Ile Ser Ala Ala Ser Pro Ala Gln Ser 1820 1825 1830 Ala Ala Thr Trp Leu Ser Glu Leu Gln Val Leu Asn Leu Ser Leu 1835 1840 1845 Arg Asp His Glu His Val Pro Leu Tyr Asp Ile Gln Gly Trp Ala 1850 1855 1860 Gly Gln Gln Gly Ala Leu Phe Asp Thr Leu Leu Val Phe Glu Asn 1865 1870 1875 Phe Pro Val Ala Glu Ala Leu Lys Gln Gly Ala Pro Ala Gly Leu 1880 1885 1890 Thr Phe Gly Arg Leu His Asn His Glu Arg Thr His Tyr Pro Leu 1895 1900 1905 Thr Leu Gly Ile Glu Leu Gly Ala Ser Leu Arg Leu Glu Phe Ser 1910 1915 1920 Tyr Asp Arg Ala Gln Phe Ser Glu Ala Gln Val Ala Gln Leu Ser 1925 1930 1935 Ala Asn Leu Gln His Leu Leu Ala Gln Leu Leu Ala Asp Ala His 1940 1945 1950 Met Pro Leu Gly Asn Leu Arg Leu Leu Asp Ala Pro Ala Gln Gln 1955 1960 1965 Gln Met Leu Ala Leu Ser Arg Ser Ala Ala Ala Pro Gln Ala Asn 1970 1975 1980 Glu Arg Val His Gln Arg Ile Ala Ala Gln Ala Glu Ala Thr Pro 1985 1990 1995 Asp Ala Leu Ala Val Gln Ala Gly Asp Ala Ser Val Ser Tyr Ala 2000 2005 2010 Gln Leu Asn Gln Arg Ala Asn Arg Leu Ala His Arg Leu Leu Ala 2015 2020 2025 Leu Gly Val Gly Pro Gly Gln Arg Val Gly Leu Ala Ser Arg Arg 2030 2035 2040 Gly Pro Gln Leu Ile Val Ser Leu Leu Ala Val Leu Lys Ser Gly 2045 2050 2055 Ala Ala Tyr Val Pro Leu Asp Pro Glu Tyr Pro Ala Glu Arg Leu 2060 2065 2070 Ala Tyr Met Leu Ala Asp Ser Arg Leu Asp Leu Leu Leu Ser Glu 2075 2080 2085 Thr Gly Leu Leu Ala Asp Leu Pro Leu Pro Arg Gly Leu Thr Arg 2090 2095 2100 Val Asp Phe Ser Ala Cys Gly Glu Glu Leu Thr Gly Tyr Pro Thr 2105 2110 2115 Thr Asn Pro Pro Asn His Ala Ala Ala Ala Asp Leu Ala Tyr Val 2120 2125 2130 Ile Tyr Thr Ser Gly Ser Thr Gly Gln Pro Lys Gly Val Ala Ile 2135 2140 2145 Asp His Ala Ala Leu Gly Gln Phe Cys Asp Ser Ala Thr Leu Tyr 2150 2155 2160 Ser Arg Leu Ser Ala Glu Asp Arg Val Leu Gln Phe Ala Thr Phe 2165 2170 2175 Ser Phe Asp Gly Phe Val Glu Gln Cys Phe Pro Pro Leu Cys Ala 2180 2185 2190 Gly Ala Ala Leu Ile Met Arg Gly Asp Glu Leu Trp Asp Ala Gly 2195 2200 2205 Gln Leu Ala Arg Glu Ile Val Glu Gln Gly Val Thr Leu Ala Asp 2210 2215 2220 Leu Pro Ala Ala Tyr Trp Tyr Leu Leu Ala Gln Glu Cys Ala Glu 2225 2230 2235 His Arg Arg Ser Leu Gly Lys Leu Arg Gln Val His Val Gly Gly 2240 2245 2250 Glu Ala Met Ser Val Glu Gly Val Arg Ala Trp Tyr Ala Ala Gly 2255 2260 2265 Leu Gly Asn Val Arg Leu Val Asn Thr Tyr Gly Pro Thr Glu Ala 2270 2275 2280 Thr Val Val Ser Ser Val His Glu Cys Gln Leu Ala Asp Ala Asn 2285 2290 2295 Asp Ala Tyr Gly Val Pro Ile Gly Gln Ala Ile Ala Gly Arg Ala 2300 2305 2310 Leu Tyr Val Leu Asp Asn Gly Phe Glu Leu Leu Ala Thr Asp Gly 2315 2320 2325 Val Gly Glu Leu Cys Ile Gly Ala Glu Val Gly Leu Ala Gln Arg 2330 2335 2340 Tyr Phe Asp Arg Pro Ala Leu Thr Ala Glu Arg Phe Leu Pro Asp 2345 2350 2355 Pro Ile Ser Ala Thr Pro Gly Ala Arg Leu Tyr Arg Ser Gly Asp 2360 2365 2370 Leu Ala Arg Tyr Asn Pro Ala Gly Ala Leu Glu Tyr Val Gly Arg 2375 2380 2385 Ile Asp His Gln Val Lys Ile Arg Gly Leu Arg Ile Glu Met Gly 2390 2395 2400 Glu Ile Glu Ala Ser Leu Gln Ala Leu Ser Asn Val Arg Glu Ala 2405 2410 2415 Ala Val Leu Ala Gln Pro Ser Ala Thr Gly Val Gln Leu Val Ala 2420 2425 2430 Tyr Val Val Pro Ala Glu Gly Gln Ala Leu Ala Thr Gln Ala Leu 2435 2440 2445 Ala Ala Arg Leu Arg Gln Thr Leu Pro Asp Tyr Met Val Pro Gly 2450 2455 2460 His Trp Val Ala Leu Asp Ala Leu Pro Leu Asn His Asn Gly Lys 2465 2470 2475 Leu Asp Arg Arg Ala Leu Pro Thr Pro Asp Leu Asn Gln Ala Ser 2480 2485 2490 Thr Thr Tyr Val Ala Pro Gln Ser Pro Leu Gln Ile Gln Leu Ala 2495 2500 2505 Ala Ile Trp Gln Ala Val Leu Gln Val Glu Gln Val Gly Leu Glu 2510 2515 2520 Asp His Phe Phe Glu Arg Gly Gly His Ser Leu Leu Ala Thr Gln 2525 2530 2535 Val Ile Ser Arg Val Arg His Asp Leu Lys Leu Glu Val Pro Leu 2540 2545 2550 Arg Ala Leu Phe Glu Gln Pro Thr Leu Ala Ala Phe Ala Ala Ala 2555 2560 2565 Cys Ala Gly Val Gln Val Asp Thr Ala Pro Val Ile Gln Ala Val 2570 2575 2580 Gly Arg Asp Gln Pro Leu Ala Leu Ser Phe Ala Gln Glu Arg Gln 2585 2590 2595 Trp Phe Leu Trp Gln Leu Asp Pro Thr Ser Ala Ala Tyr His Val 2600 2605 2610 Pro Thr Ala Leu His Leu Arg Gly Glu Leu Asp Ile Ala Ala Leu 2615 2620 2625 Glu Arg Ala Val Glu Ala Leu Val Gln Arg His Glu Pro Leu Arg 2630 2635 2640 Thr Thr Phe Val Glu Ser Gly Glu His Thr Val Gln Val Ile His 2645 2650 2655 Pro Ser Leu Ala Val Pro Val Glu Gln Gln Lys Val Asp Ala Gly 2660 2665 2670 Thr Ile Glu Gln Ala Val Ile Glu Glu Ile Gln Arg Pro Phe Asp 2675 2680 2685 Leu Arg Asn Gly Pro Leu Met Arg Val Lys Leu Leu Ile Val Ala 2690 2695 2700 Pro Asp His His Val Leu Val Ile Thr Gln His His Ile Ile Ser 2705 2710 2715 Asp Gly Trp Ser Met Gln Val Met Ile Asp Glu Trp Val Ala Leu 2720 2725 2730 Tyr Gln Gly Asp Val Gly Leu Pro Ala Leu Pro Ile Gln Tyr Ala 2735 2740 2745 Asp Tyr Ala Gln Trp Gln Arg Asp Trp Met Ala Ala Gly Glu Gln 2750 2755 2760 Gln Arg Gln Leu Asp Tyr Trp Cys Ala Arg Leu Gly His Glu His 2765 2770 2775 Ser Leu Leu Asp Leu Pro Leu Asp His Pro Arg Pro Ala Val Gln 2780 2785 2790 Ser His Arg Gly Ala Arg Arg Gln Ile His Leu Glu Arg Val Leu 2795 2800 2805 Leu Thr Glu Leu Lys Ala Leu Ala Gln Arg Gln Asp Val Thr Leu 2810 2815 2820 Phe Met Leu Leu Leu Ala Ser Phe Gln Thr Leu Leu His Arg Tyr 2825 2830 2835 Ser Gly Gln Ala Gln Val Arg Val Gly Val Pro Val Ala Asn Arg 2840 2845 2850 Asn Arg Phe Glu Thr Glu Arg Leu Leu Gly Phe Phe Val Asn Thr 2855 2860 2865 Gln Val Leu Gln Ala Asp Val His Gly Gln Met Pro Phe Asp Gln 2870 2875 2880 Leu Leu Ala Gln Val Lys Leu Arg Ala Leu Glu Ala Gln Ala His 2885 2890 2895 Gln Asp Leu Pro Phe Glu Gln Leu Val Gln Val Leu Gln Pro Glu 2900 2905 2910 Arg Ser Leu Ser His Asn Pro Leu Phe Gln Val Met Phe Asn His 2915 2920 2925 Gln Asp Ser Leu Arg Ser Ala Pro Val Gln Leu Pro Gly Leu Ala 2930 2935 2940 Leu Gln Pro Val Asp Trp Ala Gly His Ser Thr Gln Phe Asp Leu 2945 2950 2955 Asn Leu Glu Thr Glu Glu Ser Val Asp Gly Leu Trp Ala Ser Leu 2960 2965 2970 Thr Tyr Ala Thr Asp Leu Phe Asp Ala Ala Thr Ala Glu Arg Leu 2975 2980 2985 Ala Glu His Trp Gln Asn Leu Leu Arg Ala Val Leu Gln Asp Ala 2990 2995 3000 Ser Val Ala Leu Asp Asp Leu Ala Met Leu Ser Pro Ser Gln Ser 3005 3010 3015 Gln Gln Met Val His Asp Trp Asn Arg Ser Asp Thr Asp Tyr Pro 3020 3025 3030 Arg Glu Arg Cys Val His Gln Leu Phe Glu Ala Gln Ala Ala Ala 3035 3040 3045 Gln Pro Asp Ala Ile Ala Leu His Phe Asn Asp Glu Arg Leu Ser 3050 3055 3060 Tyr Gly Glu Leu Asn Arg Arg Ala Asn Arg Leu Ala His Arg Leu 3065 3070 3075 Ile Asp Met Gly Val Gly Pro Asp Val Leu Val Ala Val His Val 3080 3085 3090 Glu Arg Ser Leu Asp Met Val Val Gly Leu Leu Ala Thr Leu Lys 3095 3100 3105 Ala Gly Gly Ala Tyr Val Pro Leu Asp Pro Gln Phe Pro Ala Glu 3110 3115 3120 Arg Leu Ala Tyr Met Leu Glu Asp Ser Arg Ala Arg Val Leu Leu 3125 3130 3135 Thr Gln Pro His Leu Leu Gly His Leu Ala Gln Pro His Gly Val 3140 3145 3150 Gln Val Leu Met Val Glu Glu Ala Gly Thr Ala Gln His Asn Pro 3155 3160 3165 Gln Val Ala Val Thr Pro Glu His Leu Ala Tyr Val Ile Tyr Thr 3170 3175 3180 Ser Gly Ser Thr Gly Lys Pro Lys Gly Val Met Val Arg His Lys 3185 3190 3195 Ala Leu Cys Ser Phe Thr Ser Ala Met Ala Gly Thr Leu Ser Ile 3200 3205 3210 Gly Gln Asp Ala Arg Leu Leu Ser Leu Thr Thr Phe Ser Phe Asp 3215 3220 3225 Ile Phe Ala Leu Glu Leu Tyr Val Pro Leu Ser Val Gly Gly Thr 3230 3235 3240 Val Leu Leu Ser Ala Gln Ala Met Ala Leu Asp Pro Glu Ala Ile 3245 3250 3255 Leu Asp Leu Ala Gln Arg Gln Ala Ala Asn Val Leu Gln Ala Thr 3260 3265 3270 Pro Ser Thr Trp Arg Met Leu Leu Asp Ser Pro Arg Ala His Ala 3275 3280 3285 Leu Arg Gly Ile Ala Cys Leu Cys Gly Gly Glu Ala Leu Pro Val 3290 3295 3300 Asp Leu Ala Gln Arg Met Leu Asp Leu Gln Gly Pro Leu Trp Asn 3305 3310 3315 Leu Tyr Gly Pro Thr Glu Thr Thr Ile Trp Ser Ala Ala His Arg 3320 3325 3330 Leu His Gln Ala Leu Pro Phe Val Gly Arg Pro Ile Ala Asn Thr 3335 3340 3345 Arg Leu Phe Ile Leu Asn Ala Gly Leu Thr Pro Cys Pro Gln Gly 3350 3355 3360 Val Ser Gly Glu Leu Leu Ile Gly Gly Val Gly Leu Ala Arg Gly 3365 3370 3375 Tyr His Gly Gln Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Asn 3380 3385 3390 Pro Phe Gly Ala Ser Gly Glu Arg Leu Tyr Arg Thr Gly Asp Leu 3395 3400 3405 Ala Arg Tyr Gln Ala Asp Gly Val Val Glu Tyr Ile Gly Arg Val 3410 3415 3420 Asp His Gln Val Lys Val Arg Gly Phe Arg Ile Glu Leu Gly Glu 3425 3430 3435 Ile Glu Ala Cys Leu Arg Glu Phe Asp Gly Val Arg Glu Ala Val 3440 3445 3450 Val Leu Ala Asp Asn Asp Arg Leu Ile Ala Tyr Leu Val Ser Thr 3455 3460 3465 Ala Pro Gln Ala Pro Gln Val Tyr Lys Ala Ala Leu Arg Glu Arg 3470 3475 3480 Leu Pro Asp Tyr Met Val Pro Ala Gln Trp Leu Phe Leu Asp Ser 3485 3490 3495 Leu Pro Leu Thr Pro Asn Gly Lys Leu Asp Arg Lys Ala Leu Pro 3500 3505 3510 Lys Pro Asp Ala Ser Leu Ser Leu Lys Gly His Val Ala Pro Val 3515 3520 3525 Thr Pro Arg Glu Gln Gln Val Ala Ala Ile Trp Ala Glu Val Leu 3530 3535 3540 Glu Leu Pro Arg Val Gly Leu Asp Asp His Phe Phe Glu Leu Gly 3545 3550 3555 Gly His Ser Leu Leu Ala Thr Arg Val Val Ser Arg Val Arg Gln 3560 3565 3570 Ala Leu Ala Leu Glu Val Pro Leu Lys Ala Leu Phe Glu Gln Pro 3575 3580 3585 Leu Leu Gly Asp Phe Val Arg Ala Leu Gly Glu Glu Gly Val Thr 3590 3595 3600 Ala Pro Ala Leu Ile Lys Ala Asp Arg Thr Gln Pro Leu Pro Leu 3605 3610 3615 Ser Tyr Ala Gln Glu Arg Gln Trp Phe Leu Trp Gln Leu Asp Pro 3620 3625 3630 Ala Gly Ala Ala Tyr His Ile Pro Ser Ala Leu Arg Leu Gln Gly 3635 3640 3645 Pro Leu Asp Leu Thr Ala Leu Gln Glu Ser Phe Asp Ser Leu Leu 3650 3655 3660 Ala Arg His Glu Ser Leu Arg Thr Tyr Phe Arg Gln Asp Ala Thr 3665 3670 3675 Gly Ala Val Gln Val Ile Asp Ala Gln Ser Arg Val Asp Ile Glu 3680 3685 3690 Gln Val Asp Ser Asp Tyr Ala Gly Leu Lys Ala Arg Val Ala Gln 3695 3700 3705 Val Val Ala Gln Pro Phe Asp Leu Leu Arg Gly Pro Leu Leu Arg 3710 3715 3720 Val Thr Leu Leu Arg Leu Ala Glu Asp Asp His Val Leu Val Leu 3725 3730 3735 Val Gln His His Ile Val Ser Asp Gly Trp Ser Met Gln Leu Met 3740 3745 3750 Val Glu Glu Leu Val Gln Ala Tyr Ala Ala Asn Ser Gln Gly Gln 3755 3760 3765 Asp Val Gln Leu Pro Thr Leu Pro Ile Gln Tyr Ala Asp Tyr Ala 3770 3775 3780 Val Trp Gln Arg Asp Trp Met Glu Ala Gly Glu Gln Ala Arg Gln 3785 3790 3795 Leu Ala Tyr Trp Arg Glu Gln Leu Ser Gly Glu Gln Pro Val Leu 3800 3805 3810 Glu Leu Pro Phe Asp His Pro Arg Pro Ala Gln Pro Ser His Arg 3815 3820 3825 Gly Ala Arg Leu Gly Ile Glu Leu His Pro Glu Leu Leu Gly Ser 3830 3835 3840 Leu Arg Ala Leu Ala Gln His Ala Gly Val Thr Leu Pro Met Leu 3845 3850 3855 Leu Leu Ala Ser Tyr Gln Ala Leu Leu His Arg Tyr Ser Gly Gln 3860 3865 3870 Glu Asp Val Arg Val Gly Val Pro Ile Ala Asn Arg Asn Arg Leu 3875 3880 3885 Glu Thr Glu Gly Leu Ile Gly Phe Phe Val Asn Thr Gln Val Leu 3890 3895 3900 Lys Ala Asp Ile His Gly Gln Met Ser Thr Glu Gln Leu Leu His 3905 3910 3915 Gln Val Arg Gln Arg Ser Leu Glu Ala Gln Ala His Gln Asp Leu 3920 3925 3930 Pro Phe Glu Gln Leu Val Gln Ala Leu Gln Pro Glu Arg Ser Leu 3935 3940 3945 Ser Leu Ser Pro Leu Phe Gln Val Leu Phe Asn His Arg Val Ser 3950 3955 3960 Ala Ala Asp Ser His Leu His Arg Leu Ala Asp Leu His Val Glu 3965 3970 3975 Val Leu Asp Leu Asp Glu Gly Val Ala Gln Phe Asp Leu Ala Leu 3980 3985 3990 Asp Val Glu Glu Ser Pro Thr Ala Leu Arg Ala Ser Leu Ser Tyr 3995 4000 4005 Ala Thr Asp Leu Phe Ala Val Ala Thr Ile Glu Arg Met Ala Gly 4010 4015 4020 His Trp Gln Asn Leu Leu Arg Ala Met Val Val Asp Pro Gln Gln 4025 4030 4035 Pro Ile Ser Gln Leu Ser Leu Leu Gly Glu Asp Glu Gln Gln Gln 4040 4045 4050 Ile Leu Glu Leu Trp Asn Gln Thr Asp Ala Gly Phe Ser Ala Glu 4055 4060 4065 Arg Leu Val His Glu Leu Val Gly Asp Arg Ala Arg Glu Thr Pro 4070 4075 4080 Asp Ala Val Ala Val Lys Phe Asp Ala Gln Thr Leu Ser Tyr Gly 4085 4090 4095 Glu Leu Asp Arg Gln Ala Asn Arg Leu Ala His Ala Leu Ile Ala 4100 4105 4110 Arg Gly Val Gly Arg Glu Val Arg Val Ala Ile Ala Met Pro Arg 4115 4120 4125 Ser Ala Glu Ser Met Val Ala Phe Leu Ala Val Met Lys Ala Gly 4130 4135 4140 Gly Val Tyr Val Pro Leu Asp Ile Glu Tyr Pro Arg Asp Arg Leu 4145 4150 4155 Leu Tyr Met Met Gln Asp Ser Arg Ala Gln Leu Leu Leu Thr His 4160 4165 4170 Ser Arg Ala Leu Gln Gln Leu Pro Val Pro Glu Gly Leu Glu Thr 4175 4180 4185 Leu Ala Ile Asp Arg Thr Glu Glu Trp Ala Gly Tyr Ser Asp Thr 4190 4195 4200 Ala Pro Asp Val Ala Leu Asp Gly Asp Asn Leu Ala Tyr Val Ile 4205 4210 4215 Tyr Thr Ser Gly Ser Thr Gly Leu Pro Lys Gly Val Ala Val Ser 4220 4225 4230 His Gly Pro Leu Val Ala His Ile Ile Ala Thr Gly Glu Arg Tyr 4235 4240 4245 Glu Thr Ser Pro Ala Asp Cys Glu Leu His Phe Met Ser Phe Ala 4250 4255 4260 Phe Asp Gly Ser His Glu Gly Trp Met His Pro Leu Ile Asn Gly 4265 4270 4275 Ala Ser Val Leu Ile Arg Asp Asp Ser Leu Trp Leu Pro Glu Tyr 4280 4285 4290 Thr Tyr Glu Gln Met His Arg His Asn Val Thr Met Ala Val Phe 4295 4300 4305 Pro Pro Val Tyr Leu Gln Gln Leu Ala Glu His Ala Glu Arg Asp 4310 4315 4320 Gly Asn Pro Pro Ala Val Arg Val Tyr Cys Phe Gly Gly Asp Ala 4325 4330 4335 Val Ala Gln Ala Ser Tyr Asp Leu Ala Trp Arg Ala Leu Lys Pro 4340 4345 4350 Lys Tyr Leu Phe Asn Gly Tyr Gly Pro Thr Glu Thr Val Val Thr 4355 4360 4365 Pro Leu Leu Trp Lys Ala Arg Lys Gly Asp Pro Cys Gly Ala Val 4370 4375 4380 Tyr Ala Pro Ile Gly Thr Leu Leu Gly Asn Arg Ser Gly Tyr Val 4385 4390 4395 Leu Asp Ala Gln Leu Asn Leu Gln Pro Ile Gly Val Ala Gly Glu 4400 4405 4410 Leu Tyr Leu Gly Gly Glu Gly Val Ala Arg Gly Tyr Leu Glu Arg 4415 4420 4425 Pro Ala Leu Thr Ala Glu Arg Phe Val Pro Asp Pro Phe Gly Lys 4430 4435 4440 Pro Gly Ser Arg Val Tyr Arg Ser Gly Asp Leu Thr Arg Gly Arg 4445 4450 4455 Pro Asp Gly Val Val Asp Tyr Leu Gly Arg Val Asp His Gln Val 4460 4465 4470 Lys Ile Arg Gly Phe Arg Ile Glu Leu Gly Glu Ile Glu Ala Arg 4475 4480 4485 Leu Arg Glu Gln Ala Ser Val Gly Glu Thr Val Val Val Ala Gln 4490 4495 4500 Glu Gly Pro Thr Gly Lys Gln Leu Val Ala Tyr Val Val Pro Ala 4505 4510 4515 Asp Ala Ser Leu Ala Asp Pro Val Glu Phe Arg Asp Ala Leu Arg 4520 4525 4530 Arg Ala Leu Lys Ala Asp Leu Pro Asp Tyr Met Val Pro Ser His 4535 4540 4545 Phe Val Phe Leu Ala Gln Met Pro Leu Thr Pro Asn Gly Lys Leu 4550 4555 4560 Asp Arg Lys Gly Leu Pro Leu Pro Asp Ala Ser Gln Met Gln Gln 4565 4570 4575 Gln Tyr Leu Ala Pro Gln Thr Glu Leu Glu Gln Gln Ile Ala Thr 4580 4585 4590 Ile Trp Ala Asp Ile Leu His Leu Pro Gln Val Gly Leu Asn Asp 4595 4600 4605 Asn Phe Phe Asp Val Gly Gly His Ser Leu Leu Ala Ile Gln Ile 4610 4615 4620 Thr Ser Arg Val Gln Ala Glu Leu Gly Leu Asp Val Pro Leu Met 4625 4630 4635 Glu Leu Phe Gln Thr Glu Ser Leu Arg Ala Tyr Val Gln Ala Ala 4640 4645 4650 Ala Thr Phe Arg Ala Gly Ser Val Glu Asp Phe Asp Asp Leu Arg 4655 4660 4665 Asp Phe Leu Ser Glu Leu Glu Ala Ile 4670 4675 <210> 52 <211> 14034 <212> DNA <213> Pseudomonas fluorescens <400> 52 atgaatgctg aagactcctt gaaacttgct cgccggttta tcgggctgcc cctggaaaaa 60 cgccaattgt tcctgcaagc cttgcagaaa gaaggcgtgg atttttcaag gtttccgatt 120 ccggcagggg tggaggtgga ggaccgccag gcgctgtcct acgcacagca gcgcatgtgg 180 tttctatggc agttggaccc ggccagtggc gcctacaatt tgcccggcgc ggtgcgttta 240 agtggcgtgt tgagcctgcc agcgctggag caagcgttcg ccagcctggt ggcgcgtcac 300 gaaaccctgc gcacagtgtt ccagcgtcag gccgatgagc ggctggcgca ggtggcggtg 360 gagccgtcgg tggccgtcga gcacctggac ttcaccgcct tggcctttga tgcgcgggag 420 caggccgtca acgccgccgc cacccgtcaa tcgctgttgc cgttcgacct ggaacatggg 480 ccactgctgc gcgtgcaact gctcaagctt gccgagcagg aacacgtgct gctgctgacc 540 ctgcaccaca tcgtctccga cggttggtcg atgaatgtgc tgatcgacga attcatccgt 600 tgctatgacg cccacgagcg cgacgaagcg ccccaactgc cggcgctgcc catccaatac 660 agcgactacg ccctgtggca gcgccgctgg ctggaagcgg gcgagcaggc gcgccaattg 720 gaatattggc aggcccgcct gggtgatgag catccggtgc tggaactgcc cactgatcac 780 ccacgccccg cgatgcccag ctaccagggc acacggcata acttcgcgat tgagccggca 840 ctggccgcgc aactgcgcag ttgcgcgcaa aaacacaacg ttaccctgtt catgctgctg 900 ctcggtgcct tcaatgtgct gttgcaccgc tataccggcc agggcgacat tcgcgtcggt 960 gtgccgattg ccaatcgcaa tcgcaccgaa gtcgagggcc tgatcggttt cttcgtcaac 1020 acccaggtgt tgcgcaccga actgagcggg caaacccggg ttgccgagtt gctgcaaggt 1080 atcaaggagc atgccctggg cgcccaggct catcaggaat tgccctttga acgtctggtg 1140 gaagcgctga aaatcgagcg cagcctgagc cacacgccgc tgtttcaggt gatgtataac 1200 catcagccgg tagtcgccga catcgcctcg gtcagtaccg catcgggtct ggaattggcc 1260 ctggtggaat ggcaaggccg taccacccag ttcgacctga ccctggacac ctatgaaaag 1320 tccggcaccc tgcatgccgc gctgacctac gccaatgact tgttcgatac gcccaccatc 1380 gagcgcatgg cccggcactg gacccgcctg ctgcaagcta tggtgctcga tggcgaacag 1440 cgcattggcg aattgcccat gcttgacgcg gctgaacagc aacggttgct ccacacctgg 1500 aaccacaccg ccgaggcgta cccgaccgag cgcggcattc atcacctgat cgaagaccag 1560 gcacggcgca gccccgatgc tccggcactg gtgttcggta ccaccacctt gacctacgcc 1620 caactggatg cgcgcgccaa ccaattggcc catgccctgg gcgagcaggg cgtagggccc 1680 gacgtattgg tgggtatctg catcgagcgc tccatcgaaa tggtggttgg cctgctggcg 1740 attctcaagg ccggtggcgc ctacgtgccc ctcgaccctg agtaccccca ggaacgcctg 1800 gcctacatga tcgaagacag tggcattcag ttgttactca gccagcagag cctgctggcg 1860 tcgctgcccg tcgccggtat ccaggtgatt gccctggacc agccggcgct atggctcgac 1920 ggatacagca gcgaatcgcc gaacgtggcc ctgcatgccc tgaacctggc ctatgtgatc 1980 tacacctcgg gctccaccgg caagcccaaa ggcgctggca acagccatcg cgcgttggtc 2040 aaccgcttga gctggatgca acaggcgtat ggcctgggtg ccaatgacgc ggtcttgcag 2100 aaaaccccat tcagctttga tgtgtcggtg tgggagttct tctggccgct gatgagcggc 2160 gcacgcctgg tggtcgcggc gcctggcgag caccgtgaac cggcgcgcct gattgacacc 2220 attggccggc acgccatcac caccttgcac ttcgtgccgt cgatgttgca ggcgtttatc 2280 catgagccgg gcgtacaggc gtgcgcgagc ctcacgcgta tcgtctgcag cggcgaagcc 2340 ttgcccctgg atgcgcaaca gcaagtgttc gccaagttgc ccgctgcggc gctgtacaac 2400 ctctatggcc cgaccgaggc ggccatcgac gtcacgcact ggacctgcat tgacgaaggc 2460 gtcgacagcg tgcccatcgg ccgccccatc gccaacctcg gcacctacgt gctggacgca 2520 caactcaacc cggtgccggc tggcgtcagc ggcgaactct atctcggcgg cgttggcctg 2580 gcgcgcagtt accaccgacg cccggcgctg accgccgaac gttttgtgcc cagcccgttc 2640 gtgacgggcg agcgcctgta tcgcaccggt gaccgcgtgc gccaacgtgc cgatggggtg 2700 atcgaatacc tcggccgtct cgatcatcag gtcaagttgc gcggcttgcg tatcgagctg 2760 ggcgaaatcg aagcacgcct gatgcagcat ccacacgtgc gcgaagccgt ggtactggta 2820 catggcggca agcagttggt cgcctatctg gtgcacccag gcgaggcgcc aacggacctc 2880 aaggcctggt tgctcagcag cttgccggaa tacatggtgc cgacgcattt catcgcgctg 2940 cccaagctgc cggtgaccgc caatggcaag ctcgatcgca aggcgttgcc agtgccagac 3000 gcggcactgc aacaggcgtt tgtcgccccc caaggcgacc tgcaaacagc cctggctgcc 3060 atctggagcg acgtactggg cgttgaggag gtcggccagg acgataactt cttcgagctg 3120 ggcggcgatt cgatcatctc catccaagta gtcagccgcg cccgtcaggc cggcattcgc 3180 ctgagcccgc gtgacctgtt ccagtaccag agcatccgca gcctggccct ggtggcgcgc 3240 tttgagcagg tcagcctgat cgaccagggc ccggtcagcg gcgaggtcat gctgacgccc 3300 gtgcaacaca gctttttcga ccagccgatc ccggcgcggc atcactggaa tcaatccttg 3360 ttgctggtgc ccggcgaggt gcttgagcct gcacggttgg aggcaacgct ggcgcggttg 3420 atcgagcatc acgacgcctt gcgcctgcgt tttgtgcagc aggctgacgg ctggcagcag 3480 agccatgccg cctacgtcag cgaaccgctg ttgtggcaat gccaggccag caccgacgcc 3540 gaactggcgg cgctgtgtga tgaagcccag cgcagccttg accttgccca aggcccgctg 3600 ctgcgcgccg cgttggtgaa tttggccgat ggcagccaac gtgtgctgct ggtgatccac 3660 cacctggtgg tggatggcgt gtcctggcgc atcctgcttg aagacctgca acaggcctac 3720 cgcgaccagg cgctgccggc gaaaaccagt gcctaccagc gctgggcgca acagttgcac 3780 cgccacgcgc agtccctcga ccagcaactg ccgtactggc aagcccaatc catcgacgcc 3840 gagctgccgt gtgatcaccc cgaaggcggc ctgcaaaacc gcctgggtgc caagctggaa 3900 acacgcctcg acgtcgagca cacccgccga ctgctgcaag acgcgccagc ggcctatcgc 3960 acccaggtca acgacctgct gttgaccgcc ctggcgcggg tgatcagccg ttggagcgag 4020 caacctgctg cgctcattca attggaaggt catggtcggg aagacctgtt tgacgacatc 4080 gacctgagcc gcaccgtcgg ctggttcacc agcctgtacc cggtgcgcct gcacgccgaa 4140 ggggaactgt cggcggcgat caagtcggtg aaggagcaac tgcgcgccgt gccgaacaaa 4200 ggcattggct acggcctgtt gcgttacctc ggcacgcctg acacccgcga agcgttgtcg 4260 accctggccg cgccgcgcat cacgttcaac tacctgggcc agttcgaccg ccagttcaat 4320 gactcggcac tgttcgtgcc ggcccgccag ggcagtgggc aggctcagga tgcagaggca 4380 ccgctggcca actggttgac ggtggaaggg caggtgtatg gcggtgagct gtcgcttcaa 4440 tggggcttca gtcgagagat gttcgaggcg gcaactgtgc agcgtctggc ggatgagtac 4500 gcagccgaac tcaatgcgct gatcgagcat tgctgtgcca cgccggcagg ccaggtgagc 4560 ccgtcggatt tcccgctggc acgcctcacc cagcagcaac tggatgcgtt gcccgtggcc 4620 gggccggcga ttgccgacct ttatccgctg tcgccgatgc agcaaggcat gctgttccac 4680 accctgttgg aacccgaggc ccaggcctac atcaaccagt tgcgcctcga catcgagggc 4740 ctcgatgtgc tcgctttcgg gcgtgcctgg caggctgcac tggatcgtca tgacatcctg 4800 cgcagcagct tccattggct gggcctggac agtgctcatc agctgatcca gcgccaggtc 4860 gacctgcaac tgcaagtgat cgaagaccca aacgccgact tcgacaccct ggcccacgcc 4920 gaacgcgaac gtggttttgc cctgaatgcc gcgccgctgt ttcgcctgac gctggtgcgt 4980 ggtgccggtg cggcctggca ctttatcttt accagccacc acatcctcat ggacggctgg 5040 agtaacgcgc agttgctcgc cgaggtcatc gcgcattatg cggggcaggc agtaccggcg 5100 ccgctcgggc agttccgcga ttacctcgcc tggctgcaac aacagtcctc gggcgaggcg 5160 ttctggaaaa ccgccctggc ggcattgccg gcgccgactc tgctggcgca agcgctgcgc 5220 acgccggtcg acggggtggg catggctgac catcacgtgg cactggagag caactttacc 5280 cgccgcctcg gcgagttcgc acgccagcac aaagtcaccc tcaataccct gttgcaaggg 5340 gcttggagcc tgttgctgca acgctacacc ggccaggact gcgtcgcctt cggtgccacg 5400 gtggccgggc gttccgcgcc gctgccgggg atcgagcagc aactgggcct gttcatcaac 5460 accttgccga tcatcagcgc agcctcgcca gcccagtcgg ctgcgacttg gctcagcgaa 5520 ctgcaagtgc tcaacctcag cctgcgcgac catgaacatg tgccgctcta cgacatccag 5580 ggctgggccg gccagcaagg cgcgctgttc gacaccttgc tggtgttcga gaacttcccg 5640 gtcgccgagg cgctcaagca aggcgcgccg gccggcctga ccttcggtcg cctgcacaac 5700 catgagcgca cgcactatcc attaaccctg ggcatcgaac tgggcgccag cctgcgcctg 5760 gagttcagct atgaccgtgc ccagttcagc gaggcgcaag tggcgcagtt gagcgccaac 5820 ctgcaacacc tgctggcgca attgctcgca gacgctcaca tgccgctggg caacctgcgc 5880 cttctcgacg cccctgcgca acagcagatg ctcgcgctga gccgctcagc cgcagcgcca 5940 caggccaacg agcgcgtgca tcagcgtata gccgcccagg ccgaggcgac gccggacgcc 6000 ctggctgtgc aggccggtga cgccagcgtg agctacgccc agttgaacca gcgcgccaac 6060 cgcctggccc atcgcctgtt ggcgctgggt gtcggccccg gccaacgggt gggcctggct 6120 tcgcggcgtg gcccgcagtt gatcgtcagc ctgctggcag tgctcaaaag cggggcggcc 6180 tacgtaccgc tggaccctga atacccggcg gagcgtttgg cctacatgct cgccgacagc 6240 cgcctggacc tgctgctcag cgaaaccggc ttgctcgccg acttgccttt gccccgcggc 6300 ctgacccgcg tggatttcag cgcctgtggc gaggagctca ccggctaccc gacgaccaat 6360 ccgcctaatc acgcagcggc ggctgacctg gcctacgtga tctacacctc tggctccacc 6420 ggccagccca agggtgtggc catcgaccat gccgccctcg gccagttctg cgacagcgcc 6480 acgctgtaca gccgactgag cgccgaggac cgcgtgttgc agtttgcgac cttcagtttc 6540 gatggttttg tcgaacagtg cttcccgccc ctgtgtgcgg gtgcggcgtt gatcatgcgt 6600 ggcgatgaac tctgggacgc cgggcaactg gcgcgagaaa tcgttgagca gggcgtgact 6660 ctggccgatt tgcccgccgc ctactggtac ctgttggcgc aggaatgcgc cgagcaccgt 6720 cgctccctgg gcaagctgcg ccaggtgcat gtgggtggtg aagccatgtc agtggaaggc 6780 gtgcgtgcgt ggtacgccgc gggcttgggc aatgtgcgcc tggtcaacac ctacgggccc 6840 accgaagcca cggttgtgtc cagtgtgcat gagtgccaat tggccgatgc caacgacgcc 6900 tacggcgtgc caatcgggca ggcgattgcc gggcgcgcgc tgtatgtact cgacaacggt 6960 ttcgaactgt tggccaccga tggcgtgggc gagctgtgca ttggcgccga ggttggcttg 7020 gcgcaacgct acttcgaccg cccggcgctg accgccgagc gcttcttgcc ggacccgatt 7080 tccgccacgc ccggtgcgcg gctttatcgc agtggcgacc tggcccggta caacccggcg 7140 ggtgcgctgg agtacgtcgg gcgtatcgac catcaagtga agattcgtgg cctgcgtatc 7200 gaaatgggcg aaatcgaagc cagcctgcaa gccttgtcca atgtgcgcga agccgccgtg 7260 cttgcgcagc cgagcgcgac cggcgtgcag ttggtggcgt acgtggtgcc agccgaaggc 7320 caagcgctgg cgacccaggc actggcagcg cgcttgcgcc agacattgcc ggactacatg 7380 gtgccgggcc attgggtggc ccttgatgcc ttgccgttga accacaacgg caagctcgac 7440 cgccgtgcac tgcccacacc cgacctgaac caagccagca ccacctacgt ggcgccgcag 7500 agtccattgc aaatccagtt ggcggcgatc tggcaagcag tgttgcaggt cgagcaggtt 7560 ggcctggaag atcacttctt cgaacgcggc ggccactctt tgttggctac ccaagtgatc 7620 tcccgggtgc gccacgacct caagctggaa gtgccgttgc gggcgctgtt cgaacagccg 7680 acgctggcag cctttgctgc ggcgtgcgca ggcgtgcagg tcgatacggc gcccgtgatc 7740 caggcagttg gccgtgacca gccactggcg ttgtcatttg ctcaggaacg gcagtggttt 7800 ctctggcaat tggatcccac cagcgcggcc tatcatgtgc ccaccgcttt gcacctgcgc 7860 ggtgaactcg acatcgcggc gctggagcgc gccgtcgagg ccctggtgca gcgccatgaa 7920 ccgctgcgca ccacctttgt ggagtcgggc gagcacactg tgcaagtcat ccacccaagc 7980 ctggcagtgc cggttgagca acaaaaggtc gacgccggca ctatcgagca ggctgtcatc 8040 gaagagatcc agcgcccgtt cgacctgcgc aacggcccgc tgatgcgcgt caagttgctg 8100 atcgtcgcgc ctgatcacca tgtgctggtt atcacccagc accacatcat ctctgacggc 8160 tggtcgatgc aagtgatgat cgacgagtgg gtggcgctgt accaaggcga cgttggcttg 8220 ccggccttgc cgatccagta cgccgactac gcccagtggc agcgcgactg gatggcggct 8280 ggggaacaac aacgccagct cgattactgg tgcgctcgtc tgggtcacga acattcgctg 8340 ctggacctgc ccctcgacca tccgcgcccc gcagtgcaga gccatcgtgg cgcgcgccgc 8400 cagattcatc tggaacgtgt gctgttgact gaactcaagg ccctggccca gcgtcaggac 8460 gtgacgctgt tcatgctgtt gctggcctcg ttccagacct tgctgcaccg ctacagcggc 8520 caggcgcagg tgcgtgtcgg cgtgccggtc gccaaccgta atcgcttcga aaccgaacga 8580 ctgctgggct ttttcgtcaa cacccaggtg ctgcaagctg acgtgcacgg acagatgccg 8640 ttcgaccagt tgctggccca ggtcaagctg cgtgccctgg aggcgcaggc ccatcaggac 8700 ctgccgttcg agcagctcgt gcaagtgttg cagcccgagc gcagcctgag ccataacccg 8760 ctgttccagg tgatgttcaa ccatcaggac agcctgcgtt cagcgccggt gcaattgccc 8820 ggcctggctt tgcagcccgt ggattgggcc ggtcacagca cgcagttcga cctgaacctg 8880 gaaaccgagg aatcggtgga cggtctctgg gcctcgctga cttacgccac ggatctgttt 8940 gacgcggcga ccgcggaacg cctggccgag cattggcaaa acctgctgcg cgcggtcctg 9000 caggatgcct cggtggcctt ggacgacctg gcgatgctca gcccgtcgca atcgcagcaa 9060 atggtgcacg actggaaccg cagcgacact gactacccgc gcgaacgctg cgtacaccag 9120 ttgtttgagg cccaggccgc ggcgcaaccc gacgccattg cgctgcactt caatgacgag 9180 cgcctgagct acggcgaact caaccgccgc gccaatcggc tggcccatcg tctgatcgac 9240 atgggcgtcg gcccggacgt gctggtggcg gtgcacgtgg agcgttccct ggacatggtg 9300 gttggcttgc tcgcgaccct caaggccggt ggcgcctatg tgccgctcga cccacaattc 9360 ccggcagagc gcctggccta catgcttgaa gacagccgcg cccgggtatt gctgacgcaa 9420 ccgcacctgc tggggcacct ggcgcagccg cacggcgtgc aggtgctgat ggtggaggag 9480 gccggcacag cgcagcacaa tccccaggtt gccgtgacac cggagcatct ggcctacgtg 9540 atctacacct ctggctccac tggcaagccc aaaggggtga tggttcgtca caaggcgctg 9600 tgcagcttca ccagcgccat ggccggcacg ttgagtatcg gccaggatgc gcggctgttg 9660 tcgctgacca ccttctcgtt cgacattttc gccctggagc tgtatgtgcc gctgagtgtc 9720 ggcggtaccg tgttgctgag cgcccaggca atggccctcg acccggaggc gatcctcgat 9780 ctggcccagc gccaggcggc gaatgtgctg caagccacgc cctcgacctg gcgcatgttg 9840 ctcgacagcc cacgggctca tgcactgcgt ggcatcgcct gcctctgcgg tggcgaagcg 9900 ctgcccgtcg atttggccca gcgcatgctc gatctgcaag gcccgttgtg gaacctctat 9960 ggtccgacgg aaaccaccat ctggtcggcg gctcatcgtt tgcaccaggc attgccgttc 10020 gtggggcggc ccatcgccaa tacccgcttg ttcattctca atgccggtct cacgccatgc 10080 ccccaaggtg tgtccggtga gctgctgatc ggcggtgtcg gcctggcgcg cggttaccac 10140 gggcagccgg cgctgaccgc cgaacgcttc gtgcctaacc cgtttggggc atcgggcgaa 10200 cgcctgtacc gtaccggcga cctggcacgc tatcaggcgg acggcgtggt ggaatacatc 10260 ggccgtgtcg accatcaggt caaggtccgg ggtttccgta tcgagctggg tgaaatcgaa 10320 gcctgcctgc gtgagttcga cggcgtacgt gaagccgtgg tgctggccga taacgaccgg 10380 ctgatcgctt acctggtcag caccgcgccg caggcaccgc aggtgtataa agccgcgctg 10440 cgcgagcgtc tgccggacta catggtgcca gcgcagtggc tgttcctcga cagcctgccg 10500 ctgaccccca acggtaagct cgaccgcaag gcactgccca aaccggatgc cagcctgtcg 10560 ctcaaaggcc atgtagcgcc cgtcaccccg cgcgagcagc aggtggcggc gatctgggcc 10620 gaggtactgg aattgccccg tgtgggcctc gacgatcatt tcttcgagtt gggcgggcat 10680 tcattgctgg ccacgcgggt ggtgtcacgg gtgcgtcagg ccctggcgct ggaggtccca 10740 ctcaaagcct tgttcgaaca gccgctactg ggtgatttcg tgcgggcctt gggcgaggag 10800 ggcgtcaccg cgcctgcgct gatcaaggcc gaccgcacgc aacctctacc gctgtcttat 10860 gcccaggagc gccaatggtt cctttggcaa ctggacccgg ccggcgccgc gtatcacatc 10920 cccagcgcct tgcgtttgca ggggccgttg gacctgaccg cgctgcaaga gagcttcgat 10980 agcttgctgg ctcgccatga aagcctgcgc acgtatttcc gtcaggacgc caccggcgcg 11040 gttcaagtca ttgacgcgca gagccgggtc gatatcgagc aggtcgacag cgactatgcc 11100 ggcctcaagg cgcgggtcgc gcaggtggtc gcccagcctt tcgacctgct gcgtgggccg 11160 ctgctgcggg ttaccttgct gcgcctggcc gaggacgacc atgtgctggt gctggtgcag 11220 catcacatcg tctctgacgg ctggtcgatg cagttgatgg tcgaggaact ggtgcaggcg 11280 tatgccgcta acagccaagg ccaggacgtg caattgccga cgctgccgat ccagtacgcc 11340 gattatgccg tgtggcagcg cgattggatg gaggcgggtg agcaggcgcg tcaattggcc 11400 tactggcgtg agcaattgag cggcgagcaa ccggtgctgg agttgccgtt cgaccacccg 11460 cgcccggcac agccaagcca tcgcggcgca cgcttgggta tcgagttgca tccggagttg 11520 ttgggcagtt tgcgcgcgct ggcgcagcac gctggcgtca cgctgccgat gctgctgctg 11580 gcgtcttacc aggcattgct gcatcgctac agcggccagg aagatgtgcg cgtgggcgtg 11640 ccgattgcca accgtaatcg cctggaaacc gaggggttga tcggcttctt cgtcaacacc 11700 caagtgctca aggccgatat ccacgggcaa atgagcaccg agcaattgct gcaccaggtg 11760 cgtcagcgtt ccctcgaggc ccaggctcac caggacctgc cgttcgaaca gcttgtgcag 11820 gcattgcaac cggagcgcag cctgagcctg agcccgttgt tccaagtgtt gttcaaccac 11880 cgtgtgagcg ctgccgacag ccacctgcat cgcctggccg acctgcacgt cgaagtcctg 11940 gatttggacg agggcgtggc ccagttcgac ctggcgctgg atgtggaaga aagcccgacg 12000 gccctgcgtg cctccctgag ttatgccacc gacctgttcg ccgtggcgac catcgagcgc 12060 atggccgggc attggcagaa cctgttgcgg gcaatggtgg tcgacccaca gcagcccatt 12120 agccaattga gcctgctggg cgaggatgag caacagcaga ttcttgaatt gtggaaccag 12180 accgacgccg gtttttcagc cgagcgcctg gtgcacgaat tggtcggtga tcgcgcccgg 12240 gaaaccccgg acgcggtggc ggtgaaattc gatgctcaaa ccctgagtta cggcgagctg 12300 gatcgtcagg ccaaccgcct ggcccatgcc ttgatcgccc gtggcgtcgg cagggaagtg 12360 cgggtggcca tcgccatgcc gcgcagtgcc gagagcatgg tggcgttcct ggcggtgatg 12420 aaagccggcg gtgtgtatgt gccgctggat atcgaatacc cacgtgatcg cctgctgtac 12480 atgatgcaag acagccgtgc gcaactgctg ctgactcaca gccgggcgct gcagcaactg 12540 ccagtccccg agggcctgga gaccctggcg attgatcgca ccgaagagtg ggccggttac 12600 agcgatacgg caccggatgt ggcgctggac ggcgacaacc ttgcctacgt gatctatacc 12660 tccggctcca ccggtttgcc caagggcgtg gcggtgtcac acgggccgct ggtggcgcat 12720 atcatcgcta ccggcgagcg ctatgaaacc tcaccggccg attgcgaact gcacttcatg 12780 tccttcgcct tcgacggttc ccacgaaggc tggatgcacc cgctgatcaa cggcgccagc 12840 gtgttgatcc gtgacgacag cctgtggctg ccggaataca cctacgagca gatgcaccgc 12900 cacaacgtga ccatggcggt gttcccaccg gtgtacttgc aacagttggc cgaacatgcc 12960 gagcgcgacg gcaacccgcc ggcggtgcgg gtgtattgct tcggcggtga tgccgttgct 13020 caagccagct atgacctggc ctggcgcgcg ctgaaaccca agtacctgtt caacggctat 13080 ggcccgacgg aaaccgtggt tacaccgttg ttgtggaagg cccgcaaagg cgatccctgc 13140 ggcgctgtct atgcgcccat cggcaccttg ctgggcaacc gcagtggcta cgtgctggat 13200 gcgcaactga atctgcaacc catcggcgtg gccggcgagt tgtacctggg cggcgagggc 13260 gtggcccggg gttacctgga gcgtccggca ctgactgccg agcgtttcgt accggacccg 13320 ttcggcaaac cgggcagccg cgtgtatcgc agcggcgacc tgacccgtgg gcgtccggat 13380 ggcgtggtgg attacctggg gcgtgtggac catcaagtga agatccgcgg ttttcgtatc 13440 gaactggggg aaatcgaagc gcgtctgcgt gagcaagcca gtgtcggtga aaccgtggtg 13500 gtggcccagg aggggccgac cggtaagcaa ctggtggcct atgtggtacc ggccgacgcc 13560 agcctggccg acccggttga gttccgtgac gccctgcgtc gtgccctgaa agccgacctg 13620 ccggactaca tggtgcccag ccacttcgta ttcctggcgc agatgccgct gacccccaac 13680 ggcaagctcg accgcaaggg cctgccgctg ccggatgcga gccagatgca gcagcagtac 13740 ctggctccgc aaaccgagct tgagcagcag atcgccacga tctgggccga catcctgcac 13800 ctgccgcaag tgggcctgaa cgacaacttc tttgacgtcg gtggccactc cttgctggcg 13860 atccagatta cctcgcgggt gcaggccgag ctcggcctgg acgtaccgtt gatggaactg 13920 ttccagaccg aatcgctgcg cgcctacgtg caggccgcag ccactttccg cgccggcagc 13980 gtggaagatt ttgatgacct tcgtgacttt ttgagcgaac tagaggcgat ttga 14034 <210> 53 <211> 2321 <212> PRT <213> Pseudomonas fluorescens <400> 53 Met Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro Gly Thr Thr Pro 1 5 10 15 Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp Asn Thr Thr Thr 20 25 30 Val Thr Leu Thr Ala Pro Ser Ala Val Asn Glu Gly Gly Gln Ile Thr 35 40 45 Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp Val Thr Leu Lys 50 55 60 Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly Glu Thr Val Gly 65 70 75 80 Thr Val Thr Val Pro Ala Pro Thr Asp Asp Val Phe Ile Asp Lys Ser 85 90 95 Thr Gln Thr Val Lys Ile Thr Glu Thr Thr Gly Gly Asn Phe Glu Lys 100 105 110 Leu Glu Val Ala Gly Asn Gly Ala Thr Thr Thr Ile Asn Asp Thr Ile 115 120 125 Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr Val Gly Glu Gly 130 135 140 Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys Asn Gly Ala Pro 145 150 155 160 Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu Asp Asn Gly Gln 165 170 175 Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser Ile Thr Thr Ile 180 185 190 Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val Thr Thr Ala Ile 195 200 205 Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro Gly Thr 210 215 220 Thr Pro Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp Asn Thr 225 230 235 240 Thr Thr Val Thr Leu Thr Ala Pro Ala Glu Ala Asn Glu Gly Gly Gln 245 250 255 Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp Val Thr 260 265 270 Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly Asp Thr 275 280 285 Val Gly Thr Val Thr Val Pro Ala Pro Ser Asp Asp Val Phe Ile Asp 290 295 300 Lys Ser Thr Gln Thr Val Lys Ile Thr Asp Ala Ser Gly Gly Asn Phe 305 310 315 320 Glu Lys Leu Glu Val Ala Gly Asn Gly Ala Thr Thr Thr Ile Asn Asp 325 330 335 Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr Val Gly 340 345 350 Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys Asn Gly 355 360 365 Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu Asp Asn 370 375 380 Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser Val Ser 385 390 395 400 Val Leu Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val Thr Thr 405 410 415 Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu Val Pro 420 425 430 Gly Thr Thr Ala Val Asn Thr Thr Val Thr Asp Thr Pro Gly Thr Asp 435 440 445 Asn Thr Thr Thr Val Thr Leu Thr Ala Pro Ser Ala Val Asn Glu Gly 450 455 460 Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly Thr Asp 465 470 475 480 Val Thr Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys Ala Gly 485 490 495 Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr Asp Asp Val Phe 500 505 510 Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Asp Ala Ser Gly Gly 515 520 525 Asn Phe Glu Lys Leu Glu Val Ala Gly Ser Gly Ala Thr Thr Thr Ile 530 535 540 Asn Asp Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr Thr Thr 545 550 555 560 Val Gly Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val Asp Lys 565 570 575 Asn Gly Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val Thr Leu 580 585 590 Asp Asn Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser Gly Ser 595 600 605 Val Ser Val Leu Ala Pro Asp Asp Val Tyr Lys Gly Asp Gln Thr Val 610 615 620 Thr Thr Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu Asn Leu 625 630 635 640 Val Pro Gly Thr Thr Pro Val Asn Thr Thr Val Thr Asp Thr Pro Gly 645 650 655 Thr Asp Asn Thr Thr Thr Val Thr Leu Thr Ala Pro Ser Ala Val Asn 660 665 670 Glu Gly Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys Ala Gly 675 680 685 Thr Asp Val Thr Leu Lys Leu Asp Asn Gly Ser Ser Ile Thr Ile Lys 690 695 700 Ala Gly Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr Asp Asp 705 710 715 720 Val Phe Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Glu Thr Thr 725 730 735 Gly Gly Asn Phe Glu Lys Leu Glu Val Ala Gly Asn Gly Ala Thr Thr 740 745 750 Thr Ile Asn Asp Thr Ile Asp Lys Val Asp Val Val Leu Thr Ala Thr 755 760 765 Thr Thr Val Gly Glu Gly Gly Asn Ile Val Tyr Thr Ala Ser Leu Val 770 775 780 Asp Lys Asn Gly Ala Pro Val Thr Asn Ile Thr Asn Pro Leu Thr Val 785 790 795 800 Thr Leu Asp Asn Gly Lys Thr Ile Thr Ile Gly Val Asn Gln Ser Ser 805 810 815 Gly Ser Ile Thr Thr Val Ala Pro Asn Asp Val Tyr Lys Gly Asp Gln 820 825 830 Thr Val Thr Thr Ala Ile Lys Gly Val Thr Gly Gly Glu His Phe Glu 835 840 845 Asn Leu Val Pro Gly Thr Thr Ala Val Asn Thr Thr Val Thr Asp Thr 850 855 860 Pro Gly Ser Thr Asp Leu Thr Thr Val Thr Leu Thr Ala Pro Thr Ala 865 870 875 880 Val Asn Glu Gly Gly Gln Ile Thr Tyr Thr Ala Thr Leu Ser Asn Lys 885 890 895 Ala Gly Ser Asp Met Leu Val Gln Leu Asp Asn Gly Ser Ser Ile Thr 900 905 910 Ile Lys Gln Gly Glu Thr Val Gly Thr Val Thr Val Pro Ala Pro Thr 915 920 925 Asp Asp Val Phe Ile Asp Lys Ser Thr Gln Thr Val Lys Ile Thr Gly 930 935 940 Thr Thr Gly Gly Asn Phe Glu Gly Val Thr Ile Thr Pro Ala Gly Ala 945 950 955 960 Thr Thr Thr Ile Asn Asp Thr Ile Asp Asp Val Thr Val Val Leu Lys 965 970 975 Ala Thr Gly Ser Val Ser Glu Gly Gly Gln Ile Val Tyr Thr Ala Ser 980 985 990 Leu Val Asp Lys Asn Gly Val Ala Val Asn Asn Val Gly Ser Asp Leu 995 1000 1005 Val Val Lys Leu Asp Asn Gly Ser Thr Ile Thr Ile Gly Asn Gly 1010 1015 1020 Lys Ser Thr Ser Phe Thr Thr Ala Thr Ala Pro Asn Asp Ala Tyr 1025 1030 1035 Val Gly Ala Asn Asp Val Thr Thr Lys Ile Thr Gly Val Val Ser 1040 1045 1050 Gly Gly Asp Lys Tyr Glu His Leu Ile Val Asp Gly Ser Thr Val 1055 1060 1065 Val Thr Lys Val Thr Asp Val Val Ser Asn Thr Thr Ile Ser Ile 1070 1075 1080 Thr Gly Asp Ala Ser Val Thr Glu Gly Gly Thr Ala His Tyr Thr 1085 1090 1095 Leu Thr Leu Ser Asn Pro Pro Gln Thr Asp Val Thr Val Thr Leu 1100 1105 1110 Lys Tyr Ser Gly Thr Ala Thr Asp Gly Ser Asp Phe Asn Gly Val 1115 1120 1125 Tyr Thr Val Lys Ile Pro Ala Gly Ser Ser Ser Val Pro Phe Asp 1130 1135 1140 Ile Arg Thr Leu Asp Asp Lys Ile Thr Glu Pro Thr Glu Asn Ile 1145 1150 1155 Val Ile Thr Ile Asp Lys Thr Thr Gly Gly Asn Phe Glu Asn Leu 1160 1165 1170 Val Val Gly Asn Gly Ser Val Thr Thr Asn Ile Ile Asp Asn Asp 1175 1180 1185 Ala Pro Pro Val Ile Asp Leu Asp Ala Asn Asn Ser Ser Gly Ala 1190 1195 1200 Ser Gly Ala Asp Phe Lys Thr Thr Phe Thr Glu Gly Gly Thr Gly 1205 1210 1215 Val Ser Ile Ala Asp Thr Asp Ile Lys Ile Thr Asp Pro Asp Ser 1220 1225 1230 Thr Gln Leu Thr Gly Ala Thr Val Val Leu Thr Asn Ser Gln Pro 1235 1240 1245 Gly Asp Ser Leu Asn Phe Ser Gly Val Ser Gly Ile Thr Val Thr 1250 1255 1260 Pro Thr Thr Asp Pro Val Thr Gly Lys Ile Thr Leu Thr Leu Thr 1265 1270 1275 Gly Thr Ala Ser Leu Ala Asp Tyr Met Gln Gln Ile Lys Asn Ile 1280 1285 1290 Thr Phe Thr Asn Asn Ser His Asp Pro Ser Thr Thr Pro Arg Thr 1295 1300 1305 Ile Thr Val Thr Val Thr Asp Gly Gly Asn Tyr Ser Asn Val Ala 1310 1315 1320 Thr Thr Thr Val Asn Val Val Ala Val Asn Asp Ala Pro Val Ala 1325 1330 1335 Thr Gly Gly Ala Val Thr Gly Thr Glu Asp Thr Ala Leu Ala Leu 1340 1345 1350 Thr Trp Ala Asn Phe Gly Val Ser Asp Val Asp Ser Pro Gln Ala 1355 1360 1365 Ser Leu Gly Val Lys Ile Thr Glu Leu Pro Val Ala Gly Lys Leu 1370 1375 1380 Gln Tyr Leu Ala Ala Asp Gly Ser Thr Trp Thr Asn Val Thr Ser 1385 1390 1395 Gly Gln Thr Phe Thr Lys Ala Gln Ile Asp Gly Gly Gln Leu Arg 1400 1405 1410 Phe Thr Pro Asn Ala Asn Glu Ser Gly Ala Asp Gly Tyr Gly Gly 1415 1420 1425 Thr Gly Val Gly Asn Lys Gln Ala Asp Tyr Ala Gln Phe Lys Phe 1430 1435 1440 Gln Pro Thr Asp Gly Lys Asp Leu Gly Thr Ser Ala Thr Val Lys 1445 1450 1455 Val Asp Ile Thr Pro Val Ala Asp Ala Pro Thr Leu Ser Val Ala 1460 1465 1470 Asp Asn Asn Val Ala Ser Thr Gly Leu Val Lys Gln Gly Trp Asn 1475 1480 1485 Ser Ile Ala Gly Leu Gly Asn Asn Gly Asn Gly Ala Ala Pro Asp 1490 1495 1500 Val Leu Lys Lys Ala Ile Asp Asn Ala Gly Thr Pro Asn Asn Thr 1505 1510 1515 Ser Val Val Thr Asn Val Glu Ser Val Asp Asn Val Ala Ala Gly 1520 1525 1530 Ser Gly Ser Lys Ile Ser Gly Leu Ile Tyr Met Glu Ala Gly Lys 1535 1540 1545 Ser Tyr Thr Phe Ser Gly Ile Ala Asp Asp Ser Val Val Val Asn 1550 1555 1560 Val Gly Gly Lys Asp Val Ala Ser Gly Leu Trp Gly Thr Asn Ser 1565 1570 1575 Gly Lys Phe Ser Gly Ser Phe Thr Pro Thr Thr Thr Gly Tyr Tyr 1580 1585 1590 Ser Leu Glu Ile Tyr Gln Ala Asn Gln Ala Gly Pro Gly Ser Phe 1595 1600 1605 Asp Val Asn Leu Ser Ile Asn Gly Gly Ala Val Gln Asn Leu Ser 1610 1615 1620 Thr Ser Thr Val Pro Leu Tyr Thr Gly Leu Thr Asp Leu Thr Asn 1625 1630 1635 Ala Gly Val Thr Val Ser Asp Leu His Gly Ser Asn Gly Asp Gly 1640 1645 1650 Tyr Tyr Val Gly Tyr Lys Leu Asn Glu Gly Gln Glu Asn Gly Thr 1655 1660 1665 Val Lys Leu Ser Lys Val Thr Thr Ala Leu Thr Asp Thr Asp Gly 1670 1675 1680 Ser Glu Thr Leu Ser Val Lys Ile Ser Gly Ile Pro Ala Gly Ser 1685 1690 1695 Val Leu Thr Asp Ala Ser Gly His Thr Phe Thr Ala Gly Lys Thr 1700 1705 1710 Val Gly Glu Val Asn Val Thr Gly Trp Asp Leu Asn Thr Leu Thr 1715 1720 1725 Ile Lys Pro Pro Thr Tyr Tyr Ser Gly Gln Phe Asn Leu Thr Val 1730 1735 1740 Thr Ser Thr Ser Thr Glu Ser Ile Gly Gly Ser Ala Thr Thr Thr 1745 1750 1755 Ala Gln Leu Pro Val Thr Val His Pro Ala Thr Tyr Asn Ser Val 1760 1765 1770 Thr Gly Thr Ser Gly Ser Asp Thr Ile Asn Gly Ser Asp Gly Asn 1775 1780 1785 Asp Ile Val Val Ala Asp Ile Ala Gly Leu Asn Val Val Gln Gly 1790 1795 1800 Lys Asn Tyr Asn Ile Ala Phe Met Val Asp Ser Ser Gly Ser Met 1805 1810 1815 Ser Val Ala Ser Leu Asp Ala Ala Lys Ala Ser Leu Thr Ser Val 1820 1825 1830 Phe Asn Ser Leu Lys Asp Ser Leu Gly Ala Asn Thr Ser Gly Thr 1835 1840 1845 Val Asn Ile Phe Leu Ala Asp Phe Asp Ser Gln Val Lys Lys Ser 1850 1855 1860 Val Ala Ile Asn Leu Asn Asp Pro Asn Ala Leu Thr Gln Leu Lys 1865 1870 1875 Ala Val Leu Asp Ser Met Ala Ser Gly Gly Gly Thr Asn Tyr Glu 1880 1885 1890 Asp Val Phe Lys Ala Thr Ala Asn Phe Phe Gln Ser Asp Leu Ala 1895 1900 1905 Thr Lys Asn Thr Gly Ala Thr Asn Leu Thr Tyr Phe Ile Thr Asp 1910 1915 1920 Gly Lys Pro Thr Tyr His Gln Ser Gly Glu Gln Ile Asn Pro Val 1925 1930 1935 Val Thr Asp Phe Tyr Asp Phe Arg Thr Thr Asp Gly Arg Leu Asp 1940 1945 1950 Asp Tyr Ile Ser Ala Asn Asn Tyr Val Leu Gly Asn Thr Phe Ser 1955 1960 1965 Ile Asn Val Asn Gly Ala Asn Leu Gln Leu Ile Asp Ser Gln Gly 1970 1975 1980 Gln Leu His Gln Trp Lys Gln Thr Phe Leu Gly Gly Trp Tyr Asp 1985 1990 1995 Asn Gly Val Ile Gly Thr Val His Ala Gln Gly Asp Gly Thr Phe 2000 2005 2010 Glu Val Ser Tyr Leu Asp Gly Ser Gly Ser Ser Thr Thr Thr Ala 2015 2020 2025 Thr Ile Asn Asn Ala Asn Ser Gly Phe Ala Leu Leu Lys Gly Leu 2030 2035 2040 Ser Ala Val Glu Ala Ile Gly Ile Asn Gly Asp Ile Ser Leu Asp 2045 2050 2055 Asp Leu Lys Pro Tyr Asp Thr Asp Gly Lys Pro Gln Thr Asn Ile 2060 2065 2070 Asp Pro Lys Asp Leu Ala Asn Ala Ile Leu Gly His Thr Glu Ala 2075 2080 2085 Thr Leu Pro Gly Ala Asp Thr Val Ser Gly Gly Asp Gly Asn Asp 2090 2095 2100 Ile Leu Phe Gly Asp Leu Val Ser Phe Ser Gly Ile Asn Gly Glu 2105 2110 2115 Gly Tyr Asn Ala Leu Gln Ala Phe Val Ala Gln Lys Thr Gly Val 2120 2125 2130 Ala Val Ser Ala Val Thr Ala Ser Asn Val His Gln Tyr Val Thr 2135 2140 2145 Glu His Tyr Val Asp Phe Asp Val Ser Gly Ala Lys Asp Ala Gly 2150 2155 2160 Asp Thr Leu Leu Gly Gly Ala Gly Asp Asp Ile Leu Phe Gly Gln 2165 2170 2175 Gly Gly Asn Asp Thr Leu Asp Gly Gly Lys Gly Asn Asp Ile Leu 2180 2185 2190 Leu Gly Gly Thr Gly Asn Asp Thr Leu Ile Gly Gly Gln Gly Asn 2195 2200 2205 Asp Ile Leu Ile Gly Gly Ser Gly Ala Asp Thr Phe Val Trp Lys 2210 2215 2220 Ser Gly Asp Ile Gly Asn Asp Val Ile Lys Asp Phe Lys Ala Ser 2225 2230 2235 Glu Gly Asp Arg Ile Asp Leu Arg Asp Leu Leu Lys Gly Glu Thr 2240 2245 2250 Asp Ser Thr Ile Asp Asn Tyr Leu Lys Ile Thr Thr Val Asp Gly 2255 2260 2265 Val Ser Thr Leu Gln Val Ser Ser Glu Gly Lys Leu Asn Ala Ala 2270 2275 2280 Gly Gly Leu Ala Asn Ala Asp Val Thr Ile Lys Leu Glu Gly Asn 2285 2290 2295 Asp Trp Ser His Thr Ser Ile Asn Ser Leu Ile Ser Gly Ala Asp 2300 2305 2310 Pro Thr Ile Lys Ile Asp His Thr 2315 2320 <210> 54 <211> 6966 <212> DNA <213> Pseudomonas fluorescens <400> 54 atgaccggcg gcgagcactt tgaaaatctg gttccaggta ctaccccggt taacaccacc 60 gttacggaca caccgggtac cgataacacc accaccgtta cgctgacagc gccaagtgcc 120 gttaacgaag gtgggcagat tacgtacacc gcaacgcttt ccaataaagc gggcactgat 180 gtcacgctga agttagataa cggttcgtcg atcaccatca aggccggcga aaccgtcggc 240 accgtgactg tccctgcgcc taccgatgac gtgtttatcg ataagagcac ccagaccgtc 300 aagatcaccg aaaccactgg cggcaacttc gaaaaactcg aagtggcagg aaacggcgca 360 accaccacga tcaacgacac catcgacaaa gtcgatgtgg tcctgaccgc cactaccacc 420 gtcggcgaag gcggcaatat cgtctacacc gccagccttg tggataagaa cggcgcaccg 480 gtgaccaaca tcaccaatcc gctgaccgtg acattggata acggccagac catcactatt 540 ggcgtaaacc agtcgagcgg ttctatcacc accatcgcgc cagacgatgt ctacaaaggc 600 gaccagaccg tcactaccgc catcaaaggc gtgaccggcg gcgagcactt tgaaaatctg 660 gttccaggta ctaccccggt taataccacc gttacggata caccaggcac tgacaacacc 720 actacggtga cgctgaccgc tccggccgag gcaaacgaag gtgggcagat cacgtacacc 780 gccacgcttt ccaacaaagc gggcactgac gtaacgctga aactcgacaa cggttcttcg 840 atcaccatca aggctggcga cactgttggc actgtgactg tgcccgctcc aagcgatgac 900 gtgttcatcg ataaaagtac ccagaccgtc aagattactg acgcttccgg cggcaacttc 960 gaaaaactcg aagtcgcagg taacggcgca acgaccacga tcaacgacac catcgacaag 1020 gtggatgtag ttctaactgc taccactacc gtcggcgaag gcggcaacat cgtctacacc 1080 gccagccttg tggataagaa cggcgcgccg gtgaccaaca tcaccaaccc gctgaccgtg 1140 acattggata acggtaaaac catcaccatc ggcgtaaacc aatcgagcgg tagcgtttcg 1200 gttcttgctc ctgatgatgt gtacaagggc gaccaaactg tcaccaccgc tataaagggt 1260 gtgaccggcg gcgagcattt cgagaacctg gtgcctggca ctacggcagt gaacaccact 1320 gtcaccgata cccccggtac cgacaacacc accactgtga cgctgacagc gccaagtgcc 1380 gttaacgaag gtggtcagat cacttacacc gcgaccttga gcaacaaggc cggtactgac 1440 gtcaccttga agctggataa cggctcttcg atcaccatca aagctggcga gaccgtcggt 1500 actgtgaccg tgcctgcgcc taccgatgac gtgttcatcg ataagagcac tcagaccgtc 1560 aagatcaccg acgcttcggg cggtaacttc gaaaaactgg aagttgcagg cagcggcgcg 1620 accactacga tcaacgacac tatcgacaag gtcgatgtgg tcctgaccgc caccaccacc 1680 gtcggcgaag gcggcaacat cgtttacacc gccagcctcg tggataaaaa cggcgcaccg 1740 gtgaccaaca tcaccaatcc gctgaccgtg accctggata acggcaagac catcaccatc 1800 ggcgtaaacc aatcgagcgg tagcgtttcg gttcttgctc cggatgatgt gtacaagggc 1860 gaccaaactg tcaccaccgc tatcaagggt gtgaccggcg gcgagcactt tgaaaatctg 1920 gttccaggta ctaccccggt taacaccacc gttacggaca caccgggtac cgataacacc 1980 accaccgtta cgctgacagc gccaagtgcc gttaacgaag gtgggcagat tacgtacacc 2040 gcaacgcttt ccaataaagc gggcactgat gtcacgctga agttagataa cggttcgtcg 2100 atcaccatca aggccggcga aaccgtcggc accgtgactg tccctgcgcc taccgatgac 2160 gtgtttatcg ataagagcac ccagaccgtc aagatcaccg aaaccactgg cggcaacttc 2220 gaaaaactcg aagtggcagg aaacggcgca accaccacga tcaacgacac catcgacaaa 2280 gtcgatgtgg tcctgaccgc cactaccacc gtcggcgaag gcggcaacat cgtctacacc 2340 gccagccttg tggataagaa cggcgcaccg gtgaccaaca tcaccaatcc gctgaccgtg 2400 accctggata acggcaagac catcaccatc ggtgtgaatc agtcgagcgg ttccatcacc 2460 accgtagcgc caaacgacgt ctacaaaggc gaccaaaccg tcaccaccgc catcaaaggc 2520 gtgaccggcg gcgagcactt cgagaacctg gtgccgggca cgacggcggt gaacaccacc 2580 gtcaccgaca caccaggctc caccgacctg accaccgtta ccctgactgc cccgaccgcg 2640 gtcaacgaag gcggccagat cacctacacc gccaccttga gcaacaaggc cggtagcgac 2700 atgctggtcc agctcgacaa cggttcgagc atcactatca agcaaggtga gaccgtgggc 2760 acggtgaccg tcccggcgcc taccgatgac gtgttcatcg acaagagcac ccagaccgtc 2820 aagatcaccg gcaccaccgg cggcaatttc gagggcgtga ccatcacacc tgcgggcgcc 2880 acgaccacca tcaacgacac catcgatgac gtgaccgtgg tactcaaggc cactggctcg 2940 gtcagcgaag gcgggcagat cgtgtacacc gcgtccctgg tcgacaagaa cggtgtggcg 3000 gtgaacaacg ttggctcaga cctggtcgtc aagctggata acggctcgac cattaccatc 3060 ggcaatggca agtccaccag cttcaccacc gccaccgcac ctaacgatgc gtatgtcggc 3120 gccaatgacg tcaccactaa aatcacgggt gtggtcagcg gtggcgacaa gtacgaacac 3180 ttgatcgtcg acggcagcac cgtggttacc aaagtgaccg atgtggtcag caacaccacc 3240 atcagcatta ccggcgatgc gtcggtgact gaaggcggta cggcgcacta cacgctgacc 3300 ctgagcaacc cgccgcaaac cgacgtgacc gtgacgctca agtacagcgg caccgctacc 3360 gacggttcag acttcaatgg cgtgtacacc gtgaagattc cggcaggctc cagcagcgta 3420 ccgtttgata tccgcacgct cgacgacaag atcaccgagc cgacggaaaa tatcgtcatc 3480 accatcgaca agaccactgg cggcaacttc gaaaacctgg tggtcggcaa tggcagtgtt 3540 accaccaaca tcatcgacaa tgatgcgccg ccggtcatcg atctggatgc caacaactcc 3600 agcggcgcca gcggtgcgga cttcaagacc accttcaccg aaggcggcac cggtgtgtca 3660 attgctgaca ctgacattaa gatcaccgac ccggacagca cccaactgac cggcgccacc 3720 gtggtattga ccaacagcca gccaggcgac tcgctgaact tcagcggcgt gagcggcatc 3780 accgtgaccc cgactaccga ccctgtgacc ggtaaaatca ccttgaccct gaccgggacg 3840 gcgtcgctgg ccgactacat gcagcagatc aagaacatca cgttcaccaa caacagccac 3900 gacccgagca ccacgccgcg caccatcacc gtgacggtga ccgatggcgg caactactcc 3960 aacgtggcta ccaccaccgt caacgtggta gcagtcaacg atgcaccagt ggccactggc 4020 ggtgccgtga ccggtacgga agacaccgcg ctggccctga cctgggccaa cttcggcgtg 4080 agcgatgtgg actcgccaca agccagcctc ggggtgaaaa tcaccgagct gccggtagcc 4140 ggcaagctgc aatacctggc ggcggacggc agcacctgga ccaacgtgac cagcggccag 4200 acctttacca aggctcagat cgatggcggc caactgcgct ttacgccgaa cgccaacgag 4260 tccggcgccg acggttatgg cggcactggc gtgggtaaca agcaggcgga ttacgcgcag 4320 ttcaagttcc aaccaaccga tggcaaggac ctgggtacca gcgccacggt gaaagtcgat 4380 atcacgccgg tagccgacgc gccgaccctg agcgtggcag acaacaacgt tgcctccacc 4440 ggcctggtca aacagggctg gaacagcatt gccggcctcg gcaacaacgg caacggcgct 4500 gcaccggacg tgctgaaaaa agccatcgat aacgcgggca cgccgaacaa cacctcggtg 4560 gtgaccaacg tcgagtctgt cgacaatgtc gccgccggct ctggctcaaa aatctccggc 4620 ctgatctaca tggaagccgg caagagctac accttcagcg gcatcgccga tgacagcgtg 4680 gtggtcaacg ttggcggtaa agatgttgcc agcggtttgt ggggcaccaa cagcggcaag 4740 ttcagcggct cgttcacgcc aacgaccacc ggttactaca gccttgagat ctaccaggcc 4800 aaccaggcgg gcccaggcag cttcgacgtt aacctgtcga tcaacggcgg ggcggtgcag 4860 aacctgagca ccagcaccgt gccgttgtac accggcctta ccgacctgac caacgccggc 4920 gtcaccgtat ccgacctgca tggcagcaac ggtgacggct actacgtggg ctacaagctc 4980 aacgaaggcc aggaaaacgg cacggtcaaa ctgtccaagg tcaccaccgc gctgaccgat 5040 accgacggct ccgaaaccct gagcgtaaag atcagcggca ttccggcagg ctcggtgctt 5100 accgacgcgt cggggcacac ctttactgcg ggtaaaaccg tgggcgaagt gaatgtcacc 5160 ggctgggacc tgaacaccct gaccatcaag ccgccgacct actacagcgg ccagttcaac 5220 ctgacggtca cctcgacttc caccgagagc atcggcggtt cagcgaccac caccgcgcaa 5280 ttgccagtca cggtgcatcc ggcgacctac aattcggtca ccggcacctc gggcagcgac 5340 accatcaatg gcagcgatgg caacgacatc gtcgtggccg acatcgccgg cctgaacgtg 5400 gtgcagggta agaactacaa catcgcgttc atggtggaca gctccggcag tatgagcgtc 5460 gcctcgctcg acgcggcgaa ggcctcgttg acttcggtgt tcaactcgct caaggacagc 5520 ctgggcgcca acacatcggg gaccgtgaat atcttcctgg cggactttga tagccaagtg 5580 aaaaagtcgg tggctatcaa cctcaacgat cctaatgcat tgactcagct gaaagcggtg 5640 ctggactcga tggcatcggg aggaggtact aactacgaag acgtgttcaa ggccactgcc 5700 aacttcttcc agagcgacct ggcgaccaaa aacaccggtg caaccaactt gacgtacttc 5760 atcaccgacg gcaagccgac ctaccaccag agcggcgagc agatcaaccc ggtagtgact 5820 gacttctacg acttccgcac caccgatggg cgcttggacg actacatcag tgcgaacaac 5880 tatgtgctgg gtaacacgtt cagcatcaac gtcaatggcg ctaacctgca gttgatcgac 5940 agccagggcc aactgcacca atggaagcag acgttcctgg gtggctggta cgacaacggc 6000 gtcataggta ccgtgcacgc ccagggtgac gggacttttg aagtctccta cctcgacggc 6060 tccggtagta gcaccaccac cgcgaccatt aacaacgcca acagcggttt tgcactgctc 6120 aaaggtttgt cggcggtgga agcaatcggc atcaacggcg acatcagtct cgacgatctc 6180 aagccgtacg ataccgatgg caagccgcaa accaacatcg atccgaagga cctggccaac 6240 gctatcctcg gccacaccga ggcgacgttg ccgggcgcgg acaccgtcag cggtggcgac 6300 ggcaacgaca tcctgttcgg cgacctggtg agtttcagcg ggatcaatgg cgagggttac 6360 aacgcactgc aggcctttgt cgcacagaag accggcgtgg ctgtctcggc agtgactgcc 6420 tctaacgttc accagtacgt caccgagcac tatgtggact tcgacgtctc cggcgccaaa 6480 gatgccggcg acacactgtt gggcggcgct ggcgatgaca tcttgttcgg ccaaggcggc 6540 aacgacacgc tcgatggcgg caaaggcaat gacatcctgc tgggtggcac gggtaacgac 6600 acgttgattg gcggccaggg caacgacatc ctgatcggtg gctcgggtgc cgacaccttt 6660 gtgtggaagt ctggcgacat cggcaacgat gtgatcaagg acttcaaggc gtccgaaggc 6720 gaccgcattg acctgcgtga tttgttgaaa ggtgaaaccg acagcaccat cgacaactac 6780 ctcaagatca ccacggtaga cggcgtgtcg accctgcaag tgagcagtga aggcaagctc 6840 aacgccgccg gtggcttggc caatgccgat gtgacgatca agctggaagg caacgactgg 6900 tcccacacca gcatcaactc gctgatcagt ggtgccgacc cgaccatcaa gatcgaccac 6960 acttaa 6966 <210> 55 <211> 574 <212> PRT <213> Pseudomonas fluorescens <400> 55 Met Ser Leu Phe Leu Pro Arg Thr Trp Leu Leu Leu Gly Val Cys Leu 1 5 10 15 Leu Thr Gly Phe Ala Leu Asn Ser Ala Ser Ala Ala Pro Thr Pro Gly 20 25 30 Asp Gln Asp Leu Ile Arg Asp Arg Gln Asn Arg Leu Leu Glu Glu Gln 35 40 45 Gln Arg Arg Leu Glu Glu Leu Lys Asp Leu Pro Gly Asn Glu Ala Lys 50 55 60 Pro Val Ala Pro Ala Ala Pro Val Asn Thr Arg Cys Phe Pro Ile Lys 65 70 75 80 Asp Ile Glu Leu Lys Gly Ala Asp Ser Leu Pro Ala Ala Asp Arg Glu 85 90 95 Arg Leu Leu Lys Pro Tyr Ile Gly Gln Cys Leu Gly Val Ser Gln Leu 100 105 110 Asn Glu Leu Leu Lys Ala Ile Thr Asp Tyr Tyr Ile Asp Lys Gly Leu 115 120 125 Val Thr Ser Arg Ala Tyr Leu Pro Gln Gln Asp Leu Ser Lys Gly His 130 135 140 Leu Gln Val Leu Val Val Glu Gly Lys Leu Glu Gly Leu Lys Gly Ala 145 150 155 160 Asp Asn Ser Lys Leu Ser Asp Arg Glu Leu Ala Met Ala Phe Pro Gly 165 170 175 Lys Asn Gly Asp Leu Leu Asn Leu Arg Glu Ile Glu Gln Ala Ile Asp 180 185 190 Gln Leu Asn Arg Leu Pro Ser Asn Gln Ala Gln Met Glu Leu Thr Pro 195 200 205 Gly Asp Ala Val Gly Gly Ser Ser Val Leu Val Lys Asn Asn Pro Gln 210 215 220 Lys Pro Trp Arg Ala Ser Leu Ser Arg Asn Asn Asp Gly Gln Lys Ser 225 230 235 240 Thr Gly Glu Gln Gln Trp Gly Thr Gly Phe Glu Trp Asp Ser Pro Leu 245 250 255 Gly Leu Ala Asp Gln Leu Ile Leu Arg Gly Gly His Asp Ala Ile Ser 260 265 270 Asp His Gln Lys Thr Ser Lys Asn Val Leu Leu Tyr Tyr Asn Val Pro 275 280 285 Trp Gly Trp Trp Asn Phe Ser Tyr Ser Tyr Asn Gln Ser Asp Tyr Arg 290 295 300 Ser Val Ala Gln Ala Asp Thr Tyr Asn Phe Lys Gln Ser Gly Asp Ser 305 310 315 320 Gln Asn His Gln Leu Arg Ala Glu Arg Val Ile His Arg Asp Ala Val 325 330 335 Ser Lys Thr Ser Val Asn Val Gly Leu Ser His Leu Arg Thr Asn Asn 340 345 350 Tyr Ile Glu Asp Ser Arg Leu Asp Val Ser Ser Asn Arg Leu Ser Glu 355 360 365 Leu Gln Leu Gly Ile Asn His Gly Arg Arg Ile Gly Ser Ala Phe Val 370 375 380 Asn Ile Asp Leu Gly Val Gln Asn Gly Ile Gly Ala Phe Asp Ala Gln 385 390 395 400 Arg Asn Asp Gln Gln Arg Asp Gln Arg Gly Asn Leu Thr Pro Thr Pro 405 410 415 Asp Tyr Arg Lys Tyr Thr Ala Thr Val Ser Tyr Leu Gln Pro Phe Thr 420 425 430 Leu Trp Gly Glu Ser Phe Ser Phe Thr Ser Leu Ala Thr Gly Gln Arg 435 440 445 Ser Glu Asp Val Leu Phe Ser Pro Gln Arg Met Ser Leu Gly Gly Ser 450 455 460 Ser Ser Ile Arg Gly Phe Lys Asp Gln Gln Leu Thr Gly Asp Ser Gly 465 470 475 480 Gly Tyr Trp Arg Asn Asp Leu Arg Trp Ala Arg Pro Val Thr Trp Asp 485 490 495 Trp Met Arg Pro Val Phe Ala Glu Tyr Gly Ala Ser Val Gly Tyr Asp 500 505 510 Gln Gly Val Ile Arg Asn Asp Arg Tyr Asn Gly Glu Val His Gly Arg 515 520 525 Val Ser Ser Asn Ser Leu Glu Leu Phe Ala Arg Gly Lys Tyr Val Ser 530 535 540 Thr Ser Val Thr Phe Ala His Ser Leu Glu Arg Pro Ala Val Leu Thr 545 550 555 560 Glu Arg Glu Ala Pro Ile Tyr Phe Arg Met Gly Phe Phe Leu 565 570 <210> 56 <211> 1725 <212> DNA <213> Pseudomonas fluorescens <400> 56 atgtctttat tcctgccacg gacttggctg ctacttggcg tctgcctgct gactggcttc 60 gcgctgaaca gcgcgtcggc tgcacctacg cccggcgatc aggacttgat ccgcgaccgg 120 caaaatcgcc tgctggaaga acaacagcgg cgtcttgaag agctcaagga tttgcccggc 180 aacgaggcca agcccgtcgc tcccgccgct ccagtgaaca cccgttgctt ccccatcaaa 240 gacatcgagc tcaaaggcgc cgacagcctg cctgccgctg accgcgagcg cttgctcaag 300 ccctatatcg gccagtgcct gggtgtgtcc cagctcaatg aactgctcaa ggccatcacc 360 gattactaca tcgacaaagg cctggtcacc agccgagctt acttgccgca acaggacctg 420 tccaaggggc acctgcaagt gttggtggtg gaaggcaaac tcgaaggttt gaaaggcgcc 480 gacaacagca agctctcgga ccgcgaattg gccatggcct ttcccgggaa aaacggcgac 540 ttgctgaacc tgcgagaaat cgagcaagcc atcgaccaac tcaaccgctt gccatccaac 600 caggcgcaaa tggagctgac gccaggtgat gccgttggcg gcagttcggt gctggtgaaa 660 aacaacccac agaagccttg gcgcgccagc ttgtcgcgca ataacgacgg ccagaaaagc 720 accggcgaac agcaatgggg taccgggttt gaatgggaca gcccattggg cctggccgat 780 caactgattc tgcgcggcgg ccacgacgcc atcagtgacc accagaaaac ctcgaaaaac 840 gtgttgcttt actacaacgt gccctggggc tggtggaact tcagctacag ctacaaccag 900 agcgattacc gctcggttgc tcaggccgac acctacaact tcaagcaaag cggcgacagc 960 cagaaccacc aactgcgcgc cgaacgtgtg atccaccgcg acgctgtaag taagacctcg 1020 gttaacgtcg gcctatccca cctgcgcacc aacaactaca tcgaagacag ccgtctggac 1080 gtcagcagca atcgcttgag cgaactgcaa ctgggcatca accacgggcg acggatcggc 1140 agtgccttcg tcaacatcga cctcggtgtg cagaacggca taggtgcctt cgatgcccag 1200 cgcaacgatc agcagcgcga ccagcgtggc aacctcaccc ccaccccgga ctaccgcaaa 1260 tacaccgcga ccgtcagcta tttgcagccg ttcacgttgt ggggcgagtc cttcagcttt 1320 accagcctgg ccaccgggca gcgcagtgaa gacgtgctgt tcagccctca gcgcatgagc 1380 ctgggtggtt cgtcgtcgat acgcggtttc aaggaccagc aactgaccgg cgacagcggc 1440 ggctactggc gcaacgacct gcgctgggcg cgcccggtga cctgggattg gatgcgtccg 1500 gtttttgccg aatacggtgc cagtgtcggt tacgaccagg gtgtgattcg caatgaccgc 1560 tacaacgggg aagtgcacgg tcgggtgtcg agcaactcgc tggagctatt tgcccgcggc 1620 aaatacgtca gcaccagcgt gacctttgcc cattccctgg aacgaccggc agtgctgacc 1680 gagcgcgaag cgccgatcta cttccgcatg ggtttcttcc tgtaa 1725 <210> 57 <211> 1437 <212> DNA <213> Pseudomonas fluorescens <400> 57 atgtcgatac cacgtttgaa gtcttactta tccatagtcg ccacagtgct ggtgctgggt 60 caggccttac ctgcgcaagc ggtcgagttg cctgacttca cccaactggt ggagcaggcc 120 tcgcctgccg tggtgaacat cagtaccacg cagaagctgc cggatcgcaa agtctcgaac 180 cagcagatgc ccgacctgga aggcttgccg cccatgctgc gcgagttctt cgaacgaggg 240 atgccgcaac cacgctcccc ccgtggcggc ggtggccagc gcgaagccca atccctgggc 300 tccggcttca tcatttcgcc tgacggctat atcctcacca acaaccacgt gattgccgat 360 gccgacgaga ttctcgtgcg cctggccgac cgcagtgaac tcaaggccaa gctgattggc 420 accgatccac gttccgacgt ggccttgctt aaaatcgagg gcaaggactt gccggtgctt 480 aagctgggca agtcccagga cctgaaggcc ggtcagtggg tggtcgcgat cggttcgccg 540 ttcggctttg accacaccgt tacccaaggc atcgtcagcg ccatcggtcg cagcctgccg 600 aacgaaaact acgtaccgtt catccagacc gacgtgccga tcaacccggg taactccggt 660 ggcccgctgt tcaacctggc cggcgaagtg gtggggatca actcgcagat ctacacccgc 720 tccggcggct tcatgggcgt gtctttcgcg atcccaatcg atgtggccat ggacgtctcc 780 aatcagctca aaagcggcgg caaggtcagc cgcggctggt tgggcgtggt aatccaggaa 840 gtgaacaagg acctggctga gtccttcggt ctcgacaagc cggccggtgc cctggttgcg 900 cagattcagg acaatggccc tgcggccaaa ggcggcctga aagtcggtga cgtcatcctg 960 agcatgaacg gccagccgat catcatgtcg gcagacttgc ctcatttggt cggcgcgctc 1020 aaggccggcg gcaaagccaa gctggaagtg attcgtgatg gcaagcgcca gaacgtcgaa 1080 ctgaccgtag gtgccatccc ggaagaaggc gcgaccctgg atgccctggg caacgccaag 1140 cccggtgccg agcgcagcag taaccgcctg ggtatcgccg tggttgaact gaccgccgag 1200 cagaagaaaa ccttcgacct gcaaagcggt gtggtgatca aggaagttca ggacggccca 1260 gccgccttga tcggcctgca accgggtgac gtgatcactc acttgaacaa ccaggcaatc 1320 gataccacca aggaattcgc cgacatcgcc aaggcgttgc cgaagaatcg ctcggtgtcg 1380 atgcgcgtcc tgcgtcaagg ccgtgccagc ttcattacct tcaagctggc tgagtaa 1437 <210> 58 <211> 430 <212> PRT <213> Vibrio cholera <400> 58 Met Ile Ser Lys Ser Ile Ile Leu Arg Phe Ser Glu Leu Ser Met Arg 1 5 10 15 Lys Lys Val Thr Leu Val Gly Leu Pro Leu Leu Ala Val Ala Ala Ile 20 25 30 Ser Ser Ser Leu Asn Ser Pro Thr Arg Gln Gln Arg Ile Glu Leu Ser 35 40 45 Leu Pro Glu Ser Pro Leu Val Gln Phe Ser Ser Ala Glu His Thr Val 50 55 60 Glu Val Val Lys Val Gly His Pro Asp Tyr Glu Tyr Glu Ile Lys Pro 65 70 75 80 Gly Asp Asn Leu Ser Thr Ile Phe Asn Gln Leu Gly Phe Ala Tyr Thr 85 90 95 Glu Leu Met Lys Val Met Glu Thr Asp Leu Asn Tyr Leu Ala Leu Asp 100 105 110 Thr Leu Arg Pro Gly Asn Val Leu Arg Phe Trp Lys Gly Ser Asp Asn 115 120 125 Thr Leu Ala Lys Met Glu Leu Glu Phe Ser Leu Val Asp Arg Ala Val 130 135 140 Tyr Thr Arg Leu Asn Asp Gly Ser Tyr Glu Phe Glu Glu Arg Lys Ile 145 150 155 160 Pro Gly Thr Trp Lys Val Glu Pro Leu Ile Gly Glu Val Asp Gly Ser 165 170 175 Phe Ser Leu Ser Ala Asn Arg Ala Gly Leu Gly Ala Ala Asp Val Asp 180 185 190 Gln Ile Val Thr Leu Leu Lys Asp Lys Ile Asn Phe Gly Arg Asp Leu 195 200 205 Arg Arg Gly Asp Arg Phe Glu Val Val Leu Ser Arg Gln Leu Val Gly 210 215 220 Glu Lys Leu Thr Gly Asn Ser Glu Ile Gln Ala Ile Lys Ile Phe Asn 225 230 235 240 Arg Gly Lys Glu Ile Thr Ala Tyr Leu His Gln Asp Gly Gln Tyr Tyr 245 250 255 Asp Lys Asn Gly Asp Ser Leu Gln Arg Ala Phe Gln Arg Tyr Pro Val 260 265 270 Asp Ser Lys Trp Arg Ile Ser Ser Asn Phe Asp Pro Arg Arg Leu His 275 280 285 Pro Val Thr Lys Arg Val Ala Pro His Asn Gly Thr Asp Phe Ala Met 290 295 300 Pro Ile Gly Thr Pro Val Tyr Thr Ser Gly Asp Gly Val Val Val Met 305 310 315 320 Thr Arg Asn His Pro Tyr Ala Gly Asn Tyr Val Val Ile Gln His Gly 325 330 335 Asn Thr Tyr Met Thr Arg Tyr Leu His Leu Ser Lys Ile Leu Val Lys 340 345 350 Lys Gly Gln Lys Val Ser Arg Gly Gln Arg Ile Gly Leu Ser Gly Asn 355 360 365 Thr Gly Arg Val Thr Gly Pro His Leu His Tyr Glu Leu Ile Val Arg 370 375 380 Gly Arg Pro Val Asn Ala Met Lys Ala Asn Ile Pro Met Ala Ser Ser 385 390 395 400 Val Pro Lys Lys Glu Met Ala Gln Phe Ile Ala Lys Arg Lys Glu Leu 405 410 415 Asp Gln Met Leu Ala Arg Gln Glu Ser Met Leu Ala Ala Gln 420 425 430 <210> 59 <211> 6 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 aggagg 6 <210> 60 <211> 243 <212> PRT <213> Pseudomonas fluorescens <400> 60 Met Arg Leu Thr Gln Ile Ile Ala Ala Ala Ala Ile Ala Leu Val Ser 1 5 10 15 Thr Phe Ala Leu Ala Asp Asp Ala Ala Glu Gln Thr Ile Arg Lys Ser 20 25 30 Leu Ala Asn Leu Ala Leu Asp Thr Pro Ile Glu Ser Ile Ser Ala Ser 35 40 45 Pro Met Ala Gly Leu Tyr Glu Val Lys Leu Lys Gly Ser Arg Val Leu 50 55 60 Tyr Ala Ser Ala Asp Gly Gln Tyr Ile Val Gln Gly Tyr Leu Phe Gln 65 70 75 80 Leu Lys Asp Gly Lys Pro Val Asn Leu Thr Glu Lys Ala Glu Arg Leu 85 90 95 Gly Val Ser Lys Leu Ile Asn Gly Ile Pro Val Ala Glu Thr Val Val 100 105 110 Tyr Pro Ala Ile Gly Glu Thr Lys Thr His Ile Thr Val Phe Thr Asp 115 120 125 Thr Thr Cys Pro Tyr Cys His Lys Leu His Ala Glu Ile Pro Ala Leu 130 135 140 Asn Lys Leu Gly Val Glu Val Arg Tyr Val Ala Phe Pro Arg Gln Gly 145 150 155 160 Leu Gly Ser Pro Gly Asp Glu Gln Leu Gln Ala Val Trp Cys Ser Ala 165 170 175 Asp Lys Lys Ala Ala Met Asp Lys Met Val Asp Gly Lys Glu Ile Lys 180 185 190 Ser Ala Lys Cys Ala Asn Pro Val Ser Lys Gln Phe Ala Leu Gly Gln 195 200 205 Ser Ile Gly Val Asn Gly Thr Pro Ala Ile Val Leu Ala Asp Gly Gln 210 215 220 Val Ile Pro Gly Tyr Gln Pro Ala Pro Gln Val Ala Lys Leu Ala Leu 225 230 235 240 Gly Ala Lys <210> 61 <211> 1038 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 61 gcttgacgct gctgggcacc ggtgatgcgc ggcaggttcc ggtgcatggc tgcgagtgtg 60 ctgcgtgcgg gttggcgcgc agtgatcaaa gccgccccag ccgcaggtgc cgcgtaatca 120 caatgacctg acgctggcgc tgcagagcat cgaagacacc ggggcgcagt tggggggggc 180 tgacccatgt ggggcatacg ttggatacgt ggttgctggc gcatcgtcat gagttgcccc 240 gacatgtctc ggtaggttgg gacaatcgag tcgtgtaagg cgtggccttg ttagcaatca 300 gacaagaagc ttgatgttca gtttgttttt tccagtgtgt ttgattgttt ttctggatgt 360 ttgaagcgtg tcgcttgatt gagtcaagtt tgttgtttgc actttttttt cttcggtggc 420 atcaaggttt gagagtgctt gggggatgcg agtattccac ctcgaataaa acatgtgtgg 480 ttttattact gccatgttta atggtgggtt gttgaaatga aatgtgagcc cagtcactat 540 tcgctaaccc cccccgacaa gcctgcccag gcaggcgtct gtgtgccagg caacgacctc 600 ccgtggggtt ctcagtccag ggaaccccac gattgcacta gaacctttct cttacttctg 660 accgtatacg cgtgcggcgc tgcgtgcctg cttatcaagt gagcatggct actttcaagc 720 cacgttcatg tcgtgttttt ttcaccaaac tatcaggggt tggtgatgcc ttccggtttt 780 ttcagttatt caaaactccc gttgactcac tcactgggtt tattgcctgt gcgttattca 840 tgttcccgtt tcagaggtgt cggactgatc gcctgttgca gtgcattgaa tgactcatgt 900 gcggcagacg gaagtcgctg tatgtggaat gctgattttt tccttcatgt tctattctat 960 tgttcgccat tcaagttggt agtcgcctgg gggacgtgaa aaatatgagg gtggatgcat 1020 attcaattgc gtctcagg 1038 <210> 62 <211> 474 <212> PRT <213> Escherichia coli <400> 62 Met Lys Lys Thr Thr Leu Ala Leu Ser Ala Leu Ala Leu Ser Leu Gly 1 5 10 15 Leu Ala Leu Ser Pro Leu Ser Ala Thr Ala Ala Glu Thr Ser Ser Ala 20 25 30 Thr Thr Ala Gln Gln Met Pro Ser Leu Ala Pro Met Leu Glu Lys Val 35 40 45 Met Pro Ser Val Val Ser Ile Asn Val Glu Gly Ser Thr Thr Val Asn 50 55 60 Thr Pro Arg Met Pro Arg Asn Phe Gln Gln Phe Phe Gly Asp Asp Ser 65 70 75 80 Pro Phe Cys Gln Glu Gly Ser Pro Phe Gln Ser Ser Pro Phe Cys Gln 85 90 95 Gly Gly Gln Gly Gly Asn Gly Gly Gly Gln Gln Gln Lys Phe Met Ala 100 105 110 Leu Gly Ser Gly Val Ile Ile Asp Ala Asp Lys Gly Tyr Val Val Thr 115 120 125 Asn Asn His Val Val Asp Asn Ala Thr Val Ile Lys Val Gln Leu Ser 130 135 140 Asp Gly Arg Lys Phe Asp Ala Lys Met Val Gly Lys Asp Pro Arg Ser 145 150 155 160 Asp Ile Ala Leu Ile Gln Ile Gln Asn Pro Lys Asn Leu Thr Ala Ile 165 170 175 Lys Met Ala Asp Ser Asp Ala Leu Arg Val Gly Asp Tyr Thr Val Ala 180 185 190 Ile Gly Asn Pro Phe Gly Leu Gly Glu Thr Val Thr Ser Gly Ile Val 195 200 205 Ser Ala Leu Gly Arg Ser Gly Leu Asn Ala Glu Asn Tyr Glu Asn Phe 210 215 220 Ile Gln Thr Asp Ala Ala Ile Asn Arg Gly Asn Ser Gly Gly Ala Leu 225 230 235 240 Val Asn Leu Asn Gly Glu Leu Ile Gly Ile Asn Thr Ala Ile Leu Ala 245 250 255 Pro Asp Gly Gly Asn Ile Gly Ile Gly Phe Ala Ile Pro Ser Asn Met 260 265 270 Val Lys Asn Leu Thr Ser Gln Met Val Glu Tyr Gly Gln Val Lys Arg 275 280 285 Gly Glu Leu Gly Ile Met Gly Thr Glu Leu Asn Ser Glu Leu Ala Lys 290 295 300 Ala Met Lys Val Asp Ala Gln Arg Gly Ala Phe Val Ser Gln Val Leu 305 310 315 320 Pro Asn Ser Ser Ala Ala Lys Ala Gly Ile Lys Ala Gly Asp Val Ile 325 330 335 Thr Ser Leu Asn Gly Lys Pro Ile Ser Ser Phe Ala Ala Leu Arg Ala 340 345 350 Gln Val Gly Thr Met Pro Val Gly Ser Lys Leu Thr Leu Gly Leu Leu 355 360 365 Arg Asp Gly Lys Gln Val Asn Val Asn Leu Glu Leu Gln Gln Ser Ser 370 375 380 Gln Asn Gln Val Asp Ser Ser Ser Ile Phe Asn Gly Ile Glu Gly Ala 385 390 395 400 Glu Met Ser Asn Lys Gly Lys Asp Gln Gly Val Val Val Asn Asn Val 405 410 415 Lys Thr Gly Thr Pro Ala Ala Gln Ile Gly Leu Lys Lys Gly Asp Val 420 425 430 Ile Ile Gly Ala Asn Gln Gln Ala Val Lys Asn Ile Ala Glu Leu Arg 435 440 445 Lys Val Leu Asp Ser Lys Pro Ser Val Leu Ala Leu Asn Ile Gln Arg 450 455 460 Gly Asp Ser Thr Ile Tyr Leu Leu Met Gln 465 470 <210> 63 <211> 440 <212> PRT <213> Escherichia coli <400> 63 Met Gln Gln Ile Ala Arg Ser Val Ala Leu Ala Phe Asn Asn Leu Pro 1 5 10 15 Arg Pro His Arg Val Met Leu Gly Ser Leu Thr Val Leu Thr Leu Ala 20 25 30 Val Ala Val Trp Arg Pro Tyr Val Tyr His Arg Asp Ala Thr Pro Ile 35 40 45 Val Lys Thr Ile Glu Leu Glu Gln Asn Glu Ile Arg Ser Leu Leu Pro 50 55 60 Glu Ala Ser Glu Pro Ile Asp Gln Ala Ala Gln Glu Asp Glu Ala Ile 65 70 75 80 Pro Gln Asp Glu Leu Asp Asp Lys Ile Ala Gly Glu Ala Gly Val His 85 90 95 Glu Tyr Val Val Ser Thr Gly Asp Thr Leu Ser Ser Ile Leu Asn Gln 100 105 110 Tyr Gly Ile Asp Met Gly Asp Ile Thr Gln Leu Ala Ala Ala Asp Lys 115 120 125 Glu Leu Arg Asn Leu Lys Ile Gly Gln Gln Leu Ser Trp Thr Leu Thr 130 135 140 Ala Asp Gly Glu Leu Gln Arg Leu Thr Trp Glu Val Ser Arg Arg Glu 145 150 155 160 Thr Arg Thr Tyr Asp Arg Thr Ala Ala Asn Gly Phe Lys Met Thr Ser 165 170 175 Glu Met Gln Gln Gly Glu Trp Val Asn Asn Leu Leu Lys Gly Thr Val 180 185 190 Gly Gly Ser Phe Val Ala Ser Ala Arg Asn Ala Gly Leu Thr Ser Ala 195 200 205 Glu Val Ser Ala Val Ile Lys Ala Met Gln Trp Gln Met Asp Phe Arg 210 215 220 Lys Leu Lys Lys Gly Asp Glu Phe Ala Val Leu Met Ser Arg Glu Met 225 230 235 240 Leu Asp Gly Lys Arg Glu Gln Ser Gln Leu Leu Gly Val Arg Leu Arg 245 250 255 Ser Glu Gly Lys Asp Tyr Tyr Ala Ile Arg Ala Glu Asp Gly Lys Phe 260 265 270 Tyr Asp Arg Asn Gly Thr Gly Leu Ala Lys Gly Phe Leu Arg Phe Pro 275 280 285 Thr Ala Lys Gln Phe Arg Ile Ser Ser Asn Phe Asn Pro Arg Arg Thr 290 295 300 Asn Pro Val Thr Gly Arg Val Ala Pro His Arg Gly Val Asp Phe Ala 305 310 315 320 Met Pro Gln Gly Thr Pro Val Leu Ser Val Gly Asp Gly Glu Val Val 325 330 335 Val Ala Lys Arg Ser Gly Ala Ala Gly Tyr Tyr Val Ala Ile Arg His 340 345 350 Gly Arg Ser Tyr Thr Thr Arg Tyr Met His Leu Arg Lys Ile Leu Val 355 360 365 Lys Pro Gly Gln Lys Val Lys Arg Gly Asp Arg Ile Ala Leu Ser Gly 370 375 380 Asn Thr Gly Arg Ser Thr Gly Pro His Leu His Tyr Glu Val Trp Ile 385 390 395 400 Asn Gln Gln Ala Val Asn Pro Leu Thr Ala Lys Leu Pro Arg Thr Glu 405 410 415 Gly Leu Thr Gly Ser Asp Arg Arg Glu Phe Leu Ala Gln Ala Lys Glu 420 425 430 Ile Val Pro Gln Leu Arg Phe Asp 435 440 <210> 64 <211> 267 <212> PRT <213> Escherichia coli <400> 64 Met Pro Arg Leu Leu Ala Pro Leu Leu Ala Leu Ser Leu Leu Leu Leu 1 5 10 15 Ala Gly Gly Ala Gln Ala Ser Tyr Ile Thr Arg Thr Leu Asn Lys Pro 20 25 30 Val Pro Gly Gly Val Ala Val Val Asp Leu Gly Pro Ala Ala Ser Ala 35 40 45 Pro Ser Ala Arg Phe Asp Gly Lys Pro Val Leu Val Val Lys Glu Gln 50 55 60 Asp Asn Trp Leu Ala Ile Val Gly Ile Pro Leu Thr Gln Lys Pro Gly 65 70 75 80 Thr Ala Val Leu Ser Gln Gly Gly Arg Thr Leu Pro Phe Thr Val Gly 85 90 95 Ser Lys Lys Tyr Pro Glu Gln Arg Ile Thr Leu Lys Asn Thr Arg Gln 100 105 110 Val Asn Pro Asn Pro Ala Asp Leu Lys Arg Ile Asp Arg Glu Leu Ala 115 120 125 Glu Gln Ile Lys Ala Tyr Arg Ser Phe Ser Pro Thr Leu Pro Ser Asn 130 135 140 Leu Ile Leu Asp Lys Pro Val Ser Gly Pro Leu Ser Ser Lys Phe Gly 145 150 155 160 Val Arg Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ala Gly Leu 165 170 175 Asp Phe Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Asn Gly 180 185 190 Lys Val Ile Leu Val Gly Asp Tyr Phe Phe Asn Gly Arg Thr Val Phe 195 200 205 Val Asp His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys 210 215 220 Ile Asp Val Gln Val Gly Gln Gln Leu Arg Arg Gly Glu Val Val Gly 225 230 235 240 Arg Val Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn 245 250 255 Val Ser Leu Asn Asp Ala Arg Val Asp Pro Ala 260 265 <210> 65 <211> 470 <212> PRT <213> Pseudomonas putida <400> 65 Met Thr Asn Glu Pro Thr Lys Ala Pro Pro Leu Tyr Pro Lys Ser His 1 5 10 15 Leu Leu Ala Ala Ser Gly Ile Ala Ala Leu Leu Ser Leu Ala Leu Leu 20 25 30 Val Phe Pro Ser Ser Glu Val Glu Ala Lys Lys Thr Thr Leu Asn Leu 35 40 45 Glu Leu Glu Ser Pro Ala Glu Gln Leu Lys Gln Gln Glu Thr Thr Gln 50 55 60 Ala Asp Val Arg Glu Glu Thr Thr Ala Ser Pro Phe Ala Gln Ile Asp 65 70 75 80 Thr Ala Pro Ala Pro Thr Glu Glu Thr Ala Lys Thr Glu Pro Thr Pro 85 90 95 Thr Ala Glu Pro Ala Lys Asp Pro Ser His Arg Glu Val Thr Val Ala 100 105 110 Arg Gly Asp Thr Leu Ser Thr Leu Phe Ala Lys Val Gly Leu Pro Ala 115 120 125 Asn Val Val His Glu Val Leu Ala Ser Asn Lys Gln Ala Lys Gln Phe 130 135 140 Ser Gln Leu Lys His Gly Gln Val Leu Glu Ile Glu Leu Asp Lys Asp 145 150 155 160 Gly Gln Leu Ala Ser Leu His Ser Lys Val Ser Asp Leu Glu Thr Ile 165 170 175 Arg Leu Thr Lys Gly Asp Lys Gly Tyr Ala Phe Asn Arg Glu Ile Thr 180 185 190 Lys Pro Val Val Arg Ser Ala Tyr Val His Gly Val Ile Lys Ser Ser 195 200 205 Leu Ser Ala Ser Ala Gln Arg Ala Gly Leu Asn His Ser Leu Thr Met 210 215 220 Asp Met Ala Arg Ile Phe Gly Tyr Asp Ile Asp Phe Ala Gln Asp Ile 225 230 235 240 Arg Gln Gly Asp Glu Phe Asp Val Ile Tyr Glu Gln Lys Val Val Asn 245 250 255 Gly Lys Val Val Gly Asn Gly Asn Ile Leu Ser Ala Arg Phe Thr Asn 260 265 270 Arg Gly Lys Ser Phe Thr Ala Val Arg Tyr Thr Asn Lys Gln Gly Asn 275 280 285 Thr Ser Tyr Tyr Thr Ala Asp Gly Asn Ser Met Arg Lys Ala Phe Ile 290 295 300 Arg Thr Pro Val Asp Phe Ala Arg Ile Ser Ser Arg Phe Ser Ala Gly 305 310 315 320 Arg Lys His Pro Ile Leu Asn Lys Ile Arg Ala His Lys Gly Val Asp 325 330 335 Tyr Ala Ala Pro Arg Gly Thr Pro Ile Lys Ala Ala Gly Asp Gly Lys 340 345 350 Val Leu Leu Ala Gly Arg Arg Gly Gly Tyr Gly Asn Thr Val Ile Ile 355 360 365 Lys His Gly Asn Thr Tyr Gln Thr Leu Tyr Gly His Met Gln Gly Phe 370 375 380 Ala Lys Gly Ile Lys Thr Gly Gly Thr Val Lys Gln Gly Gln Val Ile 385 390 395 400 Gly Tyr Ile Gly Thr Thr Gly Leu Ser Thr Gly Pro His Leu His Tyr 405 410 415 Glu Phe Gln Val Asn Gly Val His Val Asp Pro Leu Gly Gln Lys Leu 420 425 430 Pro Met Ala Asp Pro Ile Ala Lys Ala Glu Arg Gln Arg Phe Leu Gln 435 440 445 Gln Ser Gln Pro Leu Met Ala Arg Met Glu Gln Glu Lys Ala Thr Met 450 455 460 Leu Ala Ser Ala Lys Arg 465 470 <210> 66 <211> 447 <212> PRT <213> Pseudomonas aeruginosa <400> 66 Met Phe Pro Ser Ser Glu Val Glu Ala Lys Arg Thr Thr Leu Asn Leu 1 5 10 15 Glu Leu Glu Ser Asn Thr Asp Arg Leu Leu Gln Glu Lys Asp Asp Leu 20 25 30 Leu Pro Gln Ser Val Thr Asn Ser Ser Asp Glu Gly Thr Pro Phe Ala 35 40 45 Gln Val Glu Gly Ala Ser Asp Asp Asn Thr Ala Glu Gln Asp Ser Asp 50 55 60 Lys Pro Gly Ala Ser Val Ala Asp Ala Asp Thr Lys Pro Val Asp Pro 65 70 75 80 Glu Trp Lys Thr Ile Thr Val Ala Ser Gly Asp Thr Leu Ser Thr Val 85 90 95 Phe Thr Lys Ala Gly Leu Ser Thr Ser Ala Met His Asp Met Leu Thr 100 105 110 Ser Ser Lys Asp Ala Lys Arg Phe Thr His Leu Lys Val Gly Gln Glu 115 120 125 Val Lys Leu Lys Leu Asp Pro Lys Gly Glu Leu Gln Ala Leu Arg Val 130 135 140 Lys Gln Ser Glu Leu Glu Thr Ile Gly Leu Asp Lys Thr Asp Lys Gly 145 150 155 160 Tyr Ser Phe Lys Arg Glu Lys Ala Gln Ile Asp Leu His Thr Ala Tyr 165 170 175 Ala His Gly Arg Ile Thr Ser Ser Leu Phe Val Ala Gly Arg Asn Ala 180 185 190 Gly Leu Pro Tyr Asn Leu Val Thr Ser Leu Ser Asn Ile Phe Gly Tyr 195 200 205 Asp Ile Asp Phe Ala Leu Asp Leu Arg Glu Gly Asp Glu Phe Asp Val 210 215 220 Ile Tyr Glu Gln His Lys Val Asn Gly Lys Gln Val Ala Thr Gly Asn 225 230 235 240 Ile Leu Ala Ala Arg Phe Val Asn Arg Gly Lys Thr Tyr Thr Ala Val 245 250 255 Arg Tyr Thr Asn Lys Gln Gly Asn Thr Ser Tyr Tyr Arg Ala Asp Gly 260 265 270 Ser Ser Met Arg Lys Ala Phe Ile Arg Thr Pro Val Asp Phe Ala Arg 275 280 285 Ile Ser Ser Arg Phe Ser Leu Gly Arg Arg His Pro Ile Leu Asn Lys 290 295 300 Ile Arg Ala His Lys Gly Val Asp Tyr Ala Ala Pro Ile Gly Thr Pro 305 310 315 320 Ile Lys Ala Thr Gly Asp Gly Lys Ile Leu Glu Ala Gly Arg Lys Gly 325 330 335 Gly Tyr Gly Asn Ala Val Val Ile Gln His Gly Gln Arg Tyr Arg Thr 340 345 350 Ile Tyr Gly His Met Ser Arg Phe Ala Lys Gly Ile Arg Ala Gly Thr 355 360 365 Ser Val Lys Gln Gly Gln Ile Ile Gly Tyr Val Gly Met Thr Gly Leu 370 375 380 Ala Thr Gly Pro His Leu His Tyr Glu Phe Gln Ile Asn Gly Arg His 385 390 395 400 Val Asp Pro Leu Ser Ala Lys Leu Pro Met Ala Asp Pro Leu Gly Gly 405 410 415 Ala Asp Arg Lys Arg Phe Met Ala Gln Thr Gln Pro Met Ile Ala Arg 420 425 430 Met Asp Gln Glu Lys Lys Thr Leu Leu Ala Leu Asn Lys Gln Arg 435 440 445 <210> 67 <211> 274 <212> PRT <213> Pseudomonas putida <400> 67 Met Pro Arg Phe Phe Ala Pro Leu Leu Leu Leu Cys Leu Thr Ser Phe 1 5 10 15 Asn Ala His Ala Asp Ser Tyr Ile Thr Arg Leu Leu Asn Lys Pro Val 20 25 30 Pro Gly Gly Val Ala Val Val Asp Leu Gly Ser Ala Thr Gln Ala Ser 35 40 45 Lys Ala Thr Tyr Gln Gly Lys Pro Val Leu Val Val Lys Glu Gln Asn 50 55 60 Asn Trp Leu Ala Ile Val Gly Val Pro Leu Thr Val Lys Pro Gly Ser 65 70 75 80 Gln Gln Ile Ser Ser Gly Gly Arg Asn Leu Pro Phe Thr Val Gly Asn 85 90 95 Lys Lys Tyr Pro Glu Gln His Ile Thr Leu Lys Asn Thr Gln Gln Val 100 105 110 Asn Pro Asn Pro Ala Asn Leu Lys Arg Ile Glu Gly Glu Leu Ala Glu 115 120 125 Gln Ile Lys Ala Tyr Arg Ser Phe Ser Pro Asn Thr Pro Ser Asn Leu 130 135 140 Leu Leu Asp Lys Pro Val Asn Gly Pro Leu Ser Ser Lys Phe Gly Val 145 150 155 160 Arg Arg Phe Phe Asn Gly Glu Glu Arg Asn Pro His Ala Gly Leu Asp 165 170 175 Phe Ala Val Pro Ala Gly Thr Pro Ile Lys Thr Pro Ala Ala Gly Lys 180 185 190 Val Ile Leu Thr Gly Asn Tyr Phe Phe Asn Gly Asn Thr Val Phe Val 195 200 205 Asp His Gly Gln Gly Phe Ile Ser Met Phe Cys His Met Ser Lys Ile 210 215 220 Asp Val Lys Val Gly Asp Gln Leu Ala Arg Gly Ala Val Val Gly Lys 225 230 235 240 Val Gly Ser Thr Gly Arg Ala Thr Gly Pro His Met His Trp Asn Ile 245 250 255 Ser Leu Asn Asp Ala Arg Val Asp Pro Ala Ile Phe Ile Gly Ala Phe 260 265 270 Gln Pro <210> 68 <211> 282 <212> PRT <213> Pseudomonas aeruginosa <400> 68 Met Pro Arg Thr Leu Ala Phe Val Ser Thr Leu Leu Leu Ala Ala Phe 1 5 10 15 Cys Ala Leu Pro Thr Gln Ala Asp Ser Phe Ile Met Arg Leu Leu Asn 20 25 30 Lys Pro Val Pro Gly Gly Val Ala Val Val Asp Leu Gly Glu Glu Gly 35 40 45 Pro Pro Pro Arg Ala Phe Tyr Gln Gly Lys Pro Val Leu Val Val Arg 50 55 60 Glu Glu Gly Arg Arg Trp Ile Ala Val Val Gly Ile Pro Leu Ser Thr 65 70 75 80 Lys Pro Gly Pro Gln Lys Leu Glu Val Arg Ala Ala Thr Gly Asn His 85 90 95 Glu Glu Arg Phe Ser Val Gly Ser Lys His Tyr Arg Glu Gln Arg Ile 100 105 110 Thr Leu Lys Asn Lys Arg Gln Val Asn Pro Leu Pro Glu Asp Leu Lys 115 120 125 Arg Ile Glu Arg Glu Leu Ala Glu Gln Thr Ala Ala Tyr Arg Arg Phe 130 135 140 Ser Pro Gly Leu Pro Ser Asn Leu Met Leu Asp Lys Pro Val Asp Gly 145 150 155 160 Pro Leu Ser Ser Pro Phe Gly Leu Arg Arg Phe Phe Asn Gly Glu Glu 165 170 175 Arg Asn Pro His Ser Gly Leu Asp Phe Ala Val Pro Ala Gly Thr Pro 180 185 190 Ile Lys Ala Pro Ala Ala Gly Lys Val Ile Leu Ile Gly Asp Tyr Phe 195 200 205 Phe Asn Gly Lys Thr Val Phe Val Asp His Gly Gln Gly Phe Ile Ser 210 215 220 Met Phe Cys His Leu Ser Lys Ile Asp Val Lys Leu Gly Gln Gln Val 225 230 235 240 Pro Arg Gly Gly Val Leu Gly Lys Val Gly Ala Thr Gly Arg Ala Thr 245 250 255 Gly Pro His Met His Trp Asn Val Ser Leu Asn Asp Ala Arg Val Asp 260 265 270 Pro Ala Ile Phe Ile Gly Ala Phe Gln Pro 275 280 <210> 69 <211> 386 <212> PRT <213> Pseudomonas fluorescens <400> 69 Met Leu Lys Ala Leu Arg Phe Phe Gly Trp Pro Leu Leu Ala Gly Val 1 5 10 15 Leu Ile Ala Met Leu Ile Ile Gln Arg Tyr Pro Gln Trp Val Gly Leu 20 25 30 Pro Thr Leu Asp Val Asn Leu Gln Gln Ala Pro Gln Thr Asn Thr Val 35 40 45 Val Gln Gly Pro Val Thr Tyr Ala Asp Ala Val Val Ile Ala Ala Pro 50 55 60 Ala Val Val Asn Leu Tyr Thr Thr Lys Val Ile Asn Lys Pro Ala His 65 70 75 80 Pro Leu Phe Glu Asp Pro Gln Phe Arg Arg Tyr Phe Gly Asp Asn Gly 85 90 95 Pro Lys Gln Arg Arg Met Glu Ser Ser Leu Gly Ser Gly Val Ile Met 100 105 110 Ser Pro Glu Gly Tyr Ile Leu Thr Asn Asn His Val Thr Thr Gly Ala 115 120 125 Asp Gln Ile Val Val Ala Leu Arg Asp Gly Arg Glu Thr Leu Ala Arg 130 135 140 Val Val Gly Ser Asp Pro Glu Thr Asp Leu Ala Val Leu Lys Ile Asp 145 150 155 160 Leu Lys Asn Leu Pro Ala Ile Thr Leu Gly Arg Ser Asp Gly Leu Arg 165 170 175 Val Gly Asp Val Ala Leu Ala Ile Gly Asn Pro Phe Gly Val Gly Gln 180 185 190 Thr Val Thr Met Gly Ile Ile Ser Ala Thr Gly Arg Asn Gln Leu Gly 195 200 205 Leu Asn Ser Tyr Glu Asp Phe Ile Gln Thr Asp Ala Ala Ile Asn Pro 210 215 220 Gly Asn Ser Gly Gly Ala Leu Val Asp Ala Asn Gly Asn Leu Thr Gly 225 230 235 240 Ile Asn Thr Ala Ile Phe Ser Lys Ser Gly Gly Ser Gln Gly Ile Gly 245 250 255 Phe Ala Ile Pro Val Lys Leu Ala Met Glu Val Met Lys Ser Ile Ile 260 265 270 Glu His Gly Gln Val Ile Arg Gly Trp Leu Gly Ile Glu Val Gln Pro 275 280 285 Leu Thr Lys Glu Leu Ala Glu Ser Phe Gly Leu Thr Gly Arg Pro Gly 290 295 300 Ile Val Val Ala Gly Ile Phe Arg Asp Gly Pro Ala Gln Lys Ala Gly 305 310 315 320 Leu Gln Leu Gly Asp Val Ile Leu Ser Ile Asp Gly Ala Pro Ala Gly 325 330 335 Asp Gly Arg Lys Ser Met Asn Gln Val Ala Arg Ile Lys Pro Thr Asp 340 345 350 Lys Val Ala Ile Leu Val Met Arg Asn Gly Lys Glu Ile Lys Leu Ser 355 360 365 Ala Glu Ile Gly Leu Arg Pro Pro Pro Ala Thr Ala Pro Val Lys Glu 370 375 380 Glu Gln 385 <210> 70 <211> 293 <212> PRT <213> Escherichia coli <400> 70 Met Met Arg Ile Ala Leu Phe Leu Leu Thr Asn Leu Ala Val Met Val 1 5 10 15 Val Phe Gly Leu Val Leu Ser Leu Thr Gly Ile Gln Ser Ser Ser Val 20 25 30 Gln Gly Leu Met Ile Met Ala Leu Leu Phe Gly Phe Gly Gly Ser Phe 35 40 45 Val Ser Leu Leu Met Ser Lys Trp Met Ala Leu Arg Ser Val Gly Gly 50 55 60 Glu Val Ile Glu Gln Pro Arg Asn Glu Arg Glu Arg Trp Leu Val Asn 65 70 75 80 Thr Val Ala Thr Gln Ala Arg Gln Ala Gly Ile Ala Met Pro Gln Val 85 90 95 Ala Ile Tyr His Ala Pro Asp Ile Asn Ala Phe Ala Thr Gly Ala Arg 100 105 110 Arg Asp Ala Ser Leu Val Ala Val Ser Thr Gly Leu Leu Gln Asn Met 115 120 125 Ser Pro Asp Glu Ala Glu Ala Val Ile Ala His Glu Ile Ser His Ile 130 135 140 Ala Asn Gly Asp Met Val Thr Met Thr Leu Ile Gln Gly Val Val Asn 145 150 155 160 Thr Phe Val Ile Phe Ile Ser Arg Ile Leu Ala Gln Leu Ala Ala Gly 165 170 175 Phe Met Gly Gly Asn Arg Asp Glu Gly Glu Glu Ser Asn Gly Asn Pro 180 185 190 Leu Ile Tyr Phe Ala Val Ala Thr Val Leu Glu Leu Val Phe Gly Ile 195 200 205 Leu Ala Ser Ile Ile Thr Met Trp Phe Ser Arg His Arg Glu Phe His 210 215 220 Ala Asp Ala Gly Ser Ala Lys Leu Val Gly Arg Glu Lys Met Ile Ala 225 230 235 240 Ala Leu Gln Arg Leu Lys Thr Ser Tyr Glu Pro Gln Glu Ala Thr Ser 245 250 255 Met Met Ala Leu Cys Ile Asn Gly Lys Ser Lys Ser Leu Ser Glu Leu 260 265 270 Phe Met Thr His Pro Pro Leu Asp Lys Arg Ile Glu Ala Leu Arg Thr 275 280 285 Gly Glu Tyr Leu Lys 290 <210> 71 <211> 682 <212> PRT <213> Escherichia coli <400> 71 Met Asn Met Phe Phe Arg Leu Thr Ala Leu Ala Gly Leu Leu Ala Ile 1 5 10 15 Ala Gly Gln Thr Phe Ala Val Glu Asp Ile Thr Arg Ala Asp Gln Ile 20 25 30 Pro Val Leu Lys Glu Glu Thr Gln His Ala Thr Val Ser Glu Arg Val 35 40 45 Thr Ser Arg Phe Thr Arg Ser His Tyr Arg Gln Phe Asp Leu Asp Gln 50 55 60 Ala Phe Ser Ala Lys Ile Phe Asp Arg Tyr Leu Asn Leu Leu Asp Tyr 65 70 75 80 Ser His Asn Val Leu Leu Ala Ser Asp Val Glu Gln Phe Ala Lys Lys 85 90 95 Lys Thr Glu Leu Gly Asp Glu Leu Arg Ser Gly Lys Leu Asp Val Phe 100 105 110 Tyr Asp Leu Tyr Asn Leu Ala Gln Lys Arg Arg Phe Glu Arg Tyr Gln 115 120 125 Tyr Ala Leu Ser Val Leu Glu Lys Pro Met Asp Phe Thr Gly Asn Asp 130 135 140 Thr Tyr Asn Leu Asp Arg Ser Lys Ala Pro Trp Pro Lys Asn Glu Ala 145 150 155 160 Glu Leu Asn Ala Leu Trp Asp Ser Lys Val Lys Phe Asp Glu Leu Ser 165 170 175 Leu Lys Leu Thr Gly Lys Thr Asp Lys Glu Ile Arg Glu Thr Leu Thr 180 185 190 Arg Arg Tyr Lys Phe Ala Ile Arg Arg Leu Ala Gln Thr Asn Ser Glu 195 200 205 Asp Val Phe Ser Leu Ala Met Thr Ala Phe Ala Arg Glu Ile Asp Pro 210 215 220 His Thr Asn Tyr Leu Ser Pro Arg Asn Thr Glu Gln Phe Asn Thr Glu 225 230 235 240 Met Ser Leu Ser Leu Glu Gly Ile Gly Ala Val Leu Gln Met Asp Asp 245 250 255 Asp Tyr Thr Val Ile Asn Ser Met Val Ala Gly Gly Pro Ala Ala Lys 260 265 270 Ser Lys Ala Ile Ser Val Gly Asp Lys Ile Val Gly Val Gly Gln Thr 275 280 285 Gly Lys Pro Met Val Asp Val Ile Gly Trp Arg Leu Asp Asp Val Val 290 295 300 Ala Leu Ile Lys Gly Pro Lys Gly Ser Lys Val Arg Leu Glu Ile Leu 305 310 315 320 Pro Ala Gly Lys Gly Thr Lys Thr Arg Thr Val Thr Leu Thr Arg Glu 325 330 335 Arg Ile Arg Leu Glu Asp Arg Ala Val Lys Met Ser Val Lys Thr Val 340 345 350 Gly Lys Glu Lys Val Gly Val Leu Asp Ile Pro Gly Phe Tyr Val Gly 355 360 365 Leu Thr Asp Asp Val Lys Val Gln Leu Gln Lys Leu Glu Lys Gln Asn 370 375 380 Val Ser Ser Val Ile Ile Asp Leu Arg Ser Asn Gly Gly Gly Ala Leu 385 390 395 400 Thr Glu Ala Val Ser Leu Ser Gly Leu Phe Ile Pro Ala Gly Pro Ile 405 410 415 Val Gln Val Arg Asp Asn Asn Gly Lys Val Arg Glu Asp Ser Asp Thr 420 425 430 Asp Gly Gln Val Phe Tyr Lys Gly Pro Leu Val Val Leu Val Asp Arg 435 440 445 Phe Ser Ala Ser Ala Ser Glu Ile Phe Ala Ala Ala Met Gln Asp Tyr 450 455 460 Gly Arg Ala Leu Val Val Gly Glu Pro Thr Phe Gly Lys Gly Thr Val 465 470 475 480 Gln Gln Tyr Arg Ser Leu Asn Arg Ile Tyr Asp Gln Met Leu Arg Pro 485 490 495 Glu Trp Pro Ala Leu Gly Ser Val Gln Tyr Thr Ile Gln Lys Phe Tyr 500 505 510 Arg Val Asn Gly Gly Ser Thr Gln Arg Lys Gly Val Thr Pro Asp Ile 515 520 525 Ile Met Pro Thr Gly Asn Glu Glu Thr Glu Thr Gly Glu Lys Phe Glu 530 535 540 Asp Asn Ala Leu Pro Trp Asp Ser Ile Asp Ala Ala Thr Tyr Val Lys 545 550 555 560 Ser Gly Asp Leu Thr Ala Phe Glu Pro Glu Leu Leu Lys Glu His Asn 565 570 575 Ala Arg Ile Ala Lys Asp Pro Glu Phe Gln Asn Ile Met Lys Asp Ile 580 585 590 Ala Arg Phe Asn Ala Met Lys Asp Lys Arg Asn Ile Val Ser Leu Asn 595 600 605 Tyr Ala Val Arg Glu Lys Glu Asn Asn Glu Asp Asp Ala Thr Arg Leu 610 615 620 Ala Arg Leu Asn Glu Arg Phe Lys Arg Glu Gly Lys Pro Glu Leu Lys 625 630 635 640 Lys Leu Asp Asp Leu Pro Lys Asp Tyr Gln Glu Pro Asp Pro Tyr Leu 645 650 655 Asp Glu Thr Val Asn Ile Ala Leu Asp Leu Ala Lys Leu Glu Lys Ala 660 665 670 Arg Pro Ala Glu Gln Pro Ala Pro Val Lys 675 680 <210> 72 <211> 214 <212> PRT <213> Pseudomonas putida <400> 72 Met Pro Met Leu Lys Arg Phe Ala Pro Leu Val Pro Leu Ala Leu Val 1 5 10 15 Thr Leu Leu Phe Gly Cys Ala Ala Gln Gly Pro Val Ser Gln Pro Gln 20 25 30 Asp His Thr Pro Ile Thr Ala Gln Ser Ala Ile Asn Ala Lys Ala Ser 35 40 45 Ser Ser Ser Val Phe Gly Glu Pro Glu Glu Leu Ala Thr Glu Asp Asp 50 55 60 Leu Ala Ser Phe Ser Gly Gly Lys Pro Tyr Gln Leu Pro Val Leu Ala 65 70 75 80 Asp Ser Ile Leu Glu Arg Gly Met Ser Leu Ile Gly Thr Arg Tyr Arg 85 90 95 Phe Gly Gly Thr Ser Glu Lys Ser Gly Phe Asp Cys Ser Gly Phe Ile 100 105 110 Gly Tyr Leu Phe Arg Glu Glu Ala Gly Met Thr Leu Pro Arg Ser Thr 115 120 125 Arg Glu Met Ile Asn Val Asp Ala Pro Lys Val Ala Arg Asn Lys Leu 130 135 140 Lys Pro Gly Asp Leu Leu Phe Phe Ser Thr Asn Gly Arg Gly Arg Val 145 150 155 160 Ser His Ala Gly Ile Tyr Leu Gly Asp Asn Gln Phe Ile His Ser Ser 165 170 175 Ser Arg Arg Ser Gly Gly Val Arg Ile Asp Ser Leu Gly Asp Arg Tyr 180 185 190 Trp Ser Lys Thr Phe Ile Glu Ala Lys Arg Ala Leu Ala Met Ala Pro 195 200 205 Thr Asn Ile Ala Arg Asn 210 <210> 73 <211> 189 <212> PRT <213> Pseudomonas aeruginosa <400> 73 Met Val Lys Ser Gln Pro Ile Leu Arg Tyr Ile Leu Arg Val Ala Pro 1 5 10 15 Ala Ile Ala Val Ala Val Leu Leu Ser Ala Cys Ser Ser Thr Ser Thr 20 25 30 Ala Arg Asn Met His Ser Glu Thr His Ala Val Gly Ser Gly Asp Leu 35 40 45 Ser Ser Leu Gln Ala Ser Gln Asp Glu Phe Glu Thr Met Val Arg Asn 50 55 60 Leu Asp Val Lys Ser Arg Leu Met Asp Gln Tyr Ala Ser Trp Lys Gly 65 70 75 80 Val Arg Tyr Arg Leu Gly Gly Ser Thr Arg Lys Gly Ile Asp Cys Ser 85 90 95 Ala Phe Val Gln Arg Thr Phe Arg Glu Gln Phe Gly Leu Glu Leu Pro 100 105 110 Arg Ser Thr Ser Glu Gln Gln Glu Thr Gly Lys Ser Ile Ser Arg Thr 115 120 125 Gln Leu Arg Thr Gly Asp Leu Val Leu Phe Arg Ala Gly Ser Thr Gly 130 135 140 Arg His Val Gly Ile Tyr Leu Gly Asn Asn Gln Phe Val His Ala Ser 145 150 155 160 Thr Ser Ser Gly Val Thr Ile Ser Ser Met Asp Glu Pro Tyr Trp Lys 165 170 175 Lys Arg Tyr Asn Glu Ala Arg Arg Val Leu Ser Arg Ser 180 185 <210> 74 <211> 1338 <212> DNA <213> Pseudomonas fluorescens <400> 74 atgtccatga ctccccgcga aatcgtccat gaactcaatc gccatatcat cggccaggac 60 gatgccaagc gcgccgttgc cattgcgctg cgtaaccgct ggcgccggat gcaactgccg 120 gaagaactgc gcgttgaagt aacgcccaag aacatcctga tgatcggccc caccggcgtg 180 ggtaaaaccg agatcgcccg gcgcctggcc aaactggcca atgcaccgtt catcaaggtc 240 gaagcgacca agttcaccga agtcggctat gtgggccgcg atgtcgagtc gatcattcgt 300 gacctggctg acgccgccct gaagatgctg cgcgaacagg aagtaaccaa ggtcagccac 360 cgcgccgaag acgccgctga agagcgcatc ctcgacgccc tgttgccacc ggcacgcatg 420 ggtttcaacg aagacgccgc accggctacc gattccaaca ctcgccagct gttccgcaag 480 cgcctgcgtg aaggccagct ggatgacaag gaaatcgaga tcgaagtggc tgaagtgtcc 540 ggcgtggata tttctgcccc gcctggcatg gaagaaatga ccagccagct gcagaacctg 600 ttcgccaaca tgggcaaggg caagaagaaa agccgcaagc tcaaggtgaa agaggcgctc 660 aagctcgtgc gcgacgaaga agccgggcgc ctggtcaatg aggaagaact caaggccaag 720 gccctggaag cggtcgagca acatggcatc gtgtttatcg acgagatcga caaagtggcc 780 aagcgaggca actcaggcgg cgtggatgtg tcccgcgaag gcgtgcagcg cgatttgctg 840 ccgctgatcg agggctgcac ggtcaacacc aagctgggca tggtcaagac tgaccacatc 900 ctgtttatcg cttccggtgc tttccacctg agcaagccca gcgacctggt gcccgagctg 960 caaggccgct tgccgattcg ggtggagctc aaggcgctga cgccgggcga cttcgagcgc 1020 atcctcagcg agccgcatgc ctcgctcacc gagcagtacc gcgagttgct gaaaaccgaa 1080 gggctgggta tcgaattcca ggcagacggg atcaagcgcc tggcggagat cgcctggcag 1140 gtcaacgaga agaccgagaa catcggtgcc cgtcgcctgc ataccttgct tgagcgcctg 1200 ctggaggaag tgtccttcag tgccggcgac atggccggtg cgcagaatgg cgaagcgatc 1260 aagatcgatg ctgattacgt caacagccac ttgggcgaat tggcgcagaa cgaagatctg 1320 tctcgttata tcctgtaa 1338 <210> 75 <211> 531 <212> DNA <213> Pseudomonas fluorescens <400> 75 atgaccacca tcgtttcagt acgtcgccac ggcaaagttg tcatgggcgg cgacggccag 60 gtttccctgg gcaacaccgt gatgaaaggc aacgccaaga aagtgcgccg cctgtaccac 120 ggccaggtgc ttgccggctt cgcaggcgca accgccgacg cctttaccct gttcgagcgt 180 ttcgaaggcc agcttgagaa acaccagggc cacctggtgc gcgccgctgt ggaactagcc 240 aaagaatggc gcaccgaccg ctccctcagc cgcctggagg ccatgctcgc ggttgcgaac 300 aaagacgctt ccctgatcat cactggcaac ggcgacgtgg ttgaacccga gcatggcctg 360 atcgccatgg gttccggcgg cggctacgcc caggctgcgg ccagcgcgct gttgaagaaa 420 accgacctgt cggcccgtga aatcgtcgag accgccctgg gtatcgctgg cgatatctgc 480 gtgttcacca accacaacca gaccattgag gagcaggacc tcgccgagta a 531 <210> 76 <211> 196 <212> PRT <213> Pseudomonas fluorescens <400> 76 Met Ser Lys Thr Leu Glu Phe Phe Phe Asp Leu Gly Ser Pro Ala Thr 1 5 10 15 Tyr Leu Ala Tyr Thr Arg Leu Pro Ala Leu Cys Ala Glu Thr Gly Ala 20 25 30 Gln Val Val Tyr Gln Pro Met Leu Leu Gly Gly Val Phe Lys Ala Thr 35 40 45 Gly Asn Ala Ser Pro Ile Thr Val Pro Ala Lys Gly Arg Tyr Met Leu 50 55 60 Asp Asp Leu Ala Arg Tyr Ala Lys Arg Tyr Asn Val Pro Leu Arg Phe 65 70 75 80 Asn Pro His Phe Pro Ile Asn Thr Leu Leu Leu Met Arg Ala Val Thr 85 90 95 Gly Ile Gln Ile His Gln Pro Glu Arg Phe Leu Asp Phe Ile Gly Cys 100 105 110 Leu Phe Arg Ala Leu Trp Val Glu Gly Arg His Leu Gly Asp Pro Glu 115 120 125 Val Val Ala Asn Val Leu Thr Glu Gln Gly Phe Asp Pro Glu Gln Val 130 135 140 Leu Ala Leu Ser Asn Asp Ala Ala Val Lys Asp Ala Leu Lys Asp Lys 145 150 155 160 Thr Glu Gln Ala Ile Lys Arg Gly Val Phe Gly Ala Pro Ser Phe Phe 165 170 175 Val Gly Asn Gln Leu Phe Phe Gly Gln Asp Arg Leu Asp Phe Val Arg 180 185 190 Glu Ala Leu Ser 195 <210> 77 <211> 211 <212> PRT <213> Pseudomonas fluorescens <400> 77 Met Arg Asn Leu Ile Leu Ser Ala Ala Leu Val Thr Ala Ser Leu Phe 1 5 10 15 Gly Met Thr Ala Gln Ala Ala Asp Val Pro Leu Glu Ala Gly Lys Thr 20 25 30 Tyr Val Glu Leu Ala Asn Pro Val Pro Val Ala Val Pro Gly Lys Ile 35 40 45 Glu Val Val Glu Leu Phe Trp Tyr Gly Cys Pro His Cys Tyr Ala Phe 50 55 60 Glu Pro Thr Ile Asn Pro Trp Ala Glu Lys Leu Pro Lys Asp Val Asn 65 70 75 80 Phe Arg Arg Ile Pro Ala Met Phe Gly Gly Pro Trp Asp Ala His Gly 85 90 95 Gln Leu Phe Leu Thr Leu Glu Ala Met Gly Val Glu His Lys Val His 100 105 110 Asn Ala Val Phe Glu Ala Ile Gln Lys Gln Gly Lys Arg Leu Thr Lys 115 120 125 Pro Asp Glu Met Ala Asp Phe Val Ala Thr Gln Gly Val Asp Lys Asp 130 135 140 Lys Phe Leu Ala Thr Phe Asn Ser Phe Ala Ile Gln Gly Gln Ile Lys 145 150 155 160 Gln Ala Lys Glu Leu Ala Gln Lys Tyr Gly Val Gln Gly Val Pro Thr 165 170 175 Leu Ile Val Asn Gly Lys Tyr Arg Phe Asp Leu Gly Ser Thr Gly Gly 180 185 190 Pro Glu Ala Thr Leu Asn Val Ala Asp Gln Leu Ile Ala Lys Glu Arg 195 200 205 Ala Ala Lys 210 <210> 78 <211> 168 <212> PRT <213> Pseudomonas fluorescens <400> 78 Met Ile Asp Asp Met Arg Leu Gly Arg Glu Arg Arg Phe Leu Val Leu 1 5 10 15 Leu Gly Ile Ile Cys Leu Ala Leu Ile Gly Gly Ala Leu Tyr Met Gln 20 25 30 Val Val Leu Gly Glu Ala Pro Cys Pro Leu Cys Ile Leu Gln Arg Tyr 35 40 45 Ala Leu Leu Leu Ile Ala Leu Phe Ala Phe Ile Gly Ala Ala Met Arg 50 55 60 Thr Lys Gly Ala Leu Thr Phe Phe Glu Gly Leu Val Val Leu Ser Ala 65 70 75 80 Leu Gly Gly Val Ala Ala Ala Gly His His Val Tyr Thr Gln Phe Phe 85 90 95 Pro Gln Val Ser Cys Gly Ile Asp Val Leu Gln Pro Ile Val Asp Asp 100 105 110 Leu Pro Leu Ala Lys Val Phe Pro Leu Gly Phe Gln Val Asp Gly Phe 115 120 125 Cys Ser Thr Pro Tyr Pro Pro Ile Leu Gly Leu Ser Leu Ala Gln Trp 130 135 140 Ala Leu Val Ala Phe Val Leu Thr Ala Ile Leu Val Pro Leu Cys Ile 145 150 155 160 Tyr Arg Asn Arg His Pro Lys Ala 165 <210> 79 <211> 729 <212> DNA <213> Pseudomonas fluorescens <400> 79 atgcgcttga cccagattat tgccgccgca gccattgcgt tggtttccac ctttgcgctc 60 gccgatgatg cggccgagca gaccatccgc aagagcctgg ccaacctggc gctcgacacg 120 cctatcgaaa gcattagcgc cagccccatg gccggcctgt acgaagtcaa gctcaagggc 180 agccgcgtgc tgtacgccag tgccgatggc cagtacatcg tccagggcta cctgttccag 240 ctcaaggacg gcaagccggt caacctgacc gagaaggccg agcgcctggg cgtgtccaag 300 ctgatcaacg gcatcccggt ggctgaaacc gtggtttacc cggccattgg cgaaaccaag 360 acccacatca ccgtgttcac cgacaccacc tgcccgtact gccacaagct gcacgctgaa 420 atcccggcac tgaacaagct gggcgtggaa gtgcgctacg tcgcgttccc gcgccagggc 480 ctgggttcgc cgggtgacga gcagttgcaa gccgtatggt gttcggccga caaaaaggcg 540 gccatggaca agatggtcga cggcaaggaa atcaaatcgg ccaaatgcgc caacccggtt 600 tccaagcagt tcgccctggg ccagtccatt ggtgtgaacg gtacaccggc catcgttttg 660 gccgacggcc aggtgattcc gggctaccag ccggcgccgc aagttgccaa actggcactg 720 ggtgccaag 729 <210> 80 <211> 575 <212> PRT <213> Pseudomonas fluorescens <400> 80 Met Arg His Leu Phe Thr Phe Leu Leu Val Leu Phe Ala Gly Phe Ala 1 5 10 15 Gln Ala Ala Pro Gly Ser Pro Phe Glu Thr Lys Pro Asp Phe Leu Pro 20 25 30 Val Gly Lys Ala Phe Ala Phe Thr Ser Glu Arg Leu Glu Ser Gly Glu 35 40 45 Thr Gln Leu Phe Trp Gln Ile Ala Asp Gly Tyr Tyr Leu Tyr Gln Gln 50 55 60 Arg Met Lys Phe Asp Gly Leu Ala Glu Lys Pro Val Leu Pro Glu Gly 65 70 75 80 Glu Ala His Ser Asp Glu Phe Phe Gly Glu Gln Gln Val Tyr Arg Gln 85 90 95 Gly Leu Glu Val Lys Ile Pro Ala Gly Thr Thr Gly Gln Val Lys Leu 100 105 110 Gly Trp Gln Gly Cys Ala Asp Ala Gly Leu Cys Tyr Pro Pro Gln Ser 115 120 125 Ile Thr Val Asp Leu Gly Gly Asn Pro Ala Val Ala Ala Thr Ala Gln 130 135 140 Ala Gln Asp Gln Ser Leu Ala Ser Gly Leu Gln Gln Arg Ser Leu Gly 145 150 155 160 Trp Ser Leu Leu Val Phe Phe Gly Leu Gly Leu Leu Leu Ala Phe Ala 165 170 175 Pro Cys Ser Leu Pro Met Leu Pro Ile Leu Ala Gly Leu Val Val Gly 180 185 190 Ser Gly Ala Ser Pro Arg Arg Gly Phe Ala Leu Ala Gly Ser Tyr Val 195 200 205 Val Cys Met Ala Leu Val Tyr Ala Ala Leu Gly Val Met Ala Ala Leu 210 215 220 Leu Gly Ala Asn Leu Ala Ala Leu Leu Gln Thr Pro Trp Ile Leu Gly 225 230 235 240 Ser Phe Ala Ala Leu Phe Val Leu Leu Ala Leu Pro Met Phe Gly Phe 245 250 255 Phe Glu Leu Gln Leu Pro Ala Phe Leu Arg Asp Arg Leu Asp Asn Val 260 265 270 Ser Arg Gln Gln Ser Gly Gly Ser Leu Val Gly Ala Gly Val Leu Gly 275 280 285 Ala Leu Ser Gly Leu Leu Val Gly Pro Cys Met Thr Ala Pro Leu Ala 290 295 300 Gly Ala Leu Leu Tyr Ile Ala Gln Ser Gly Asn Ala Leu His Gly Gly 305 310 315 320 Leu Ile Leu Phe Ala Met Gly Ile Gly Ile Gly Ile Pro Leu Leu Leu 325 330 335 Leu Val Thr Val Gly Asn Arg Phe Leu Pro Lys Pro Gly Thr Trp Met 340 345 350 Asn Val Leu Lys Gly Ile Phe Gly Phe Leu Phe Leu Gly Thr Ala Val 355 360 365 Leu Met Ile Arg Pro Val Val Gly Asp Ser Leu Trp Ile Gly Leu Trp 370 375 380 Gly Ala Leu Ala Leu Val Met Ala Tyr Cys Gly Trp Ala Leu Ala Arg 385 390 395 400 Glu Ser Gly Leu Ala Ala Lys Val Phe Gly Ala Gly Ser Leu Val Leu 405 410 415 Gly Leu Trp Gly Ala Val Leu Val Val Gly Ala Ala Gly Gly Ser Asp 420 425 430 Glu Leu Trp Gln Pro Leu Lys Val Tyr Ser Gly Ser Arg Val Ala Asp 435 440 445 Ala Pro Ser Ala His Asp Ala Phe Thr Thr Val Ser Asp Pro Ala Val 450 455 460 Leu Gln Ser Gln Leu Asp Ser Ala Lys Ala Gln Gly Gln Trp Val Leu 465 470 475 480 Leu Asp Tyr Tyr Ala Asp Trp Cys Val Ser Cys Lys Ile Met Glu Lys 485 490 495 Gln Val Phe Gly Lys Pro Glu Val Met Asp Ala Leu Lys Asp Val Arg 500 505 510 Leu Leu Arg Leu Asp Val Thr Ala Asp Asn Ala Ala Ser Arg Glu Leu 515 520 525 Leu Gly Arg Tyr Lys Val Pro Gly Pro Pro Ser Phe Val Trp Ile Gly 530 535 540 Pro Asp Gly Glu Glu Arg Arg Ala Gln Arg Ile Thr Gly Glu Val Asp 545 550 555 560 Ala Ala Ala Phe Leu Gln Arg Trp Thr Gln Thr Arg Asp Ala Arg 565 570 575 <210> 81 <211> 253 <212> PRT <213> Pseudomonas fluorescens <400> 81 Met Pro Arg Leu Arg His Leu Leu Thr Leu Leu Pro Leu Thr Leu Ala 1 5 10 15 Ala Ala Leu Ala Gln Ala Glu Asp Leu Pro Ala Pro Ile Lys Gln Ile 20 25 30 Glu Ala Lys Gly Ala Lys Ile Ile Gly Lys Phe Asp Ala Pro Ser Gly 35 40 45 Leu Thr Gly Tyr Ala Ala Gln Tyr Gln Asn Arg Gly Met Ala Leu Tyr 50 55 60 Leu Thr Ala Asp Gly Lys Asn Val Ile Ala Gly Asn Leu Tyr Asp Ala 65 70 75 80 Gln Gly Asn Asp Leu Ser Thr Ala Pro Leu Glu Lys Leu Val Tyr Ala 85 90 95 Pro Met Ala Lys Glu Val Trp Ala Lys Met Glu Asn Ser Ser Trp Ile 100 105 110 Gln Asp Gly Asp Lys Asn Ala Pro Arg Thr Ile Tyr Leu Phe Ser Asp 115 120 125 Pro Asn Cys Pro Tyr Cys Asn Met Phe Trp Glu Gln Ala Arg Pro Trp 130 135 140 Val Lys Ala Gly Lys Val Gln Leu Arg His Ile Met Val Gly Ile Ile 145 150 155 160 Arg Glu Asp Ser Pro Gly Lys Ser Ala Ala Leu Leu Ala Ala Lys Asp 165 170 175 Pro Gln Lys Ala Leu Gln Asp His Glu Ala Ala Gly Lys Gly Ser Lys 180 185 190 Leu Lys Ala Leu Glu Lys Ile Pro Ala Glu Val Glu Ala Lys Leu Asp 195 200 205 Ala Asn Met Lys Leu Met Asp Glu Leu Glu Leu Ser Ala Thr Pro Ala 210 215 220 Ile Phe Tyr Leu Asp Asp Lys Gly Gly Leu Gln Gln Gln Gln Gly Ala 225 230 235 240 Pro Ser Pro Asp Lys Leu Val Lys Ile Leu Gly Pro Lys 245 250 <210> 82 <211> 440 <212> PRT <213> Mus musculus <400> 82 Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys Thr Phe Phe Leu Ala 1 5 10 15 Val Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro 20 25 30 Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Gly Leu Trp Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu 50 55 60 Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala 65 70 75 80 Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln 85 90 95 Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu 100 105 110 Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu 115 120 125 Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly 130 135 140 Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys 145 150 155 160 Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp 165 170 175 Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His 180 185 190 Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys 195 200 205 Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val 210 215 220 Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys Gly Phe Pro Thr Ile 225 230 235 240 Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg 245 250 255 Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn 260 265 270 Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys 275 280 285 Lys Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His 290 295 300 Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu 305 310 315 320 Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp 325 330 335 Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn Ala Leu Gly Ile Gly 340 345 350 Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys 355 360 365 Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe 370 375 380 Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly 385 390 395 400 Gly Ser Phe Pro Thr Ile Thr Pro Arg Glu Pro Trp Asp Gly Lys Asp 405 410 415 Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu 420 425 430 Asp Asp Leu Glu Lys Asp Glu Leu 435 440 <210> 83 <211> 445 <212> PRT <213> Mus musculus <400> 83 Met Arg Val Ile Gly Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys 1 5 10 15 Thr Phe Phe Leu Ala Val Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val 20 25 30 Ile Glu Leu Thr Pro Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp 35 40 45 Gly Leu Trp Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln 50 55 60 Arg Leu Thr Pro Glu Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val 65 70 75 80 Val Lys Val Gly Ala Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly 85 90 95 Gln Tyr Gly Val Gln Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn 100 105 110 Lys Asn Lys Pro Glu Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile 115 120 125 Val Asp Ala Ala Leu Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu 130 135 140 Gly Gly Arg Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp 145 150 155 160 Ser Ser Ser Lys Lys Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp 165 170 175 Lys Asn Val Leu Asp Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala 180 185 190 Pro Trp Cys Gly His Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala 195 200 205 Ala Thr Glu Val Lys Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala 210 215 220 Val Asp Ala Thr Met Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys 225 230 235 240 Gly Phe Pro Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp 245 250 255 Tyr Asp Gly Gly Arg Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp 260 265 270 Leu Phe Ser Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn 275 280 285 Glu Asp Ile Ala Lys Lys Thr Cys Glu Glu His Gln Leu Cys Val Val 290 295 300 Ala Val Leu Pro His Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser 305 310 315 320 Tyr Leu Glu Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met 325 330 335 Trp Gly Trp Leu Trp Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn 340 345 350 Ala Leu Gly Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn 355 360 365 Ala Arg Lys Met Lys Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln 370 375 380 Gly Ile Asn Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr 385 390 395 400 Ala Pro Val Gly Gly Gly Ser Phe Pro Thr Ile Thr Pro Arg Glu Pro 405 410 415 Trp Asp Gly Lys Asp Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu 420 425 430 Ser Asp Val Glu Leu Asp Asp Leu Glu Lys Asp Glu Leu 435 440 445 <210> 84 <211> 440 <212> PRT <213> Rattus norvegicus <400> 84 Met Ala Arg Leu Val Leu Gly Leu Val Ser Cys Thr Phe Phe Leu Ala 1 5 10 15 Val Ser Ala Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro 20 25 30 Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu 50 55 60 Trp Lys Lys Ala Ala Ser Ala Leu Lys Asp Val Val Lys Val Gly Ala 65 70 75 80 Val Asn Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln 85 90 95 Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu 100 105 110 Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu 115 120 125 Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Ser Gly 130 135 140 Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys 145 150 155 160 Asp Val Val Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp 165 170 175 Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His 180 185 190 Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys 195 200 205 Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val 210 215 220 Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Lys Gly Phe Pro Thr Ile 225 230 235 240 Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg 245 250 255 Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn 260 265 270 Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Ile Ala Lys 275 280 285 Lys Thr Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His 290 295 300 Ile Leu Asp Thr Gly Ala Thr Gly Arg Asn Ser Tyr Leu Glu Val Leu 305 310 315 320 Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp 325 330 335 Thr Glu Ala Gly Ala Gln Tyr Glu Leu Glu Asn Ala Leu Gly Ile Gly 340 345 350 Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys 355 360 365 Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe 370 375 380 Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly 385 390 395 400 Gly Ser Phe Pro Asn Ile Thr Pro Arg Glu Pro Trp Asp Gly Lys Asp 405 410 415 Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu 420 425 430 Asp Asp Leu Glu Lys Asp Glu Leu 435 440 <210> 85 <211> 448 <212> PRT <213> Equus caballus <400> 85 Met Lys Pro Ala Ile Asn Gly Val Leu Phe Val Val Ser Pro Gly Leu 1 5 10 15 Met Ser Cys Thr Leu Phe Leu Ala Val Asn Gly Leu Tyr Ser Ser Ser 20 25 30 Asp Asp Val Ile Glu Leu Thr Pro Ser Asn Phe Asn Arg Glu Val Ile 35 40 45 Gln Ser Asp Ser Leu Trp Leu Val Glu Phe Tyr Ala Pro Trp Cys Gly 50 55 60 His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys Val Ala Thr Ala Leu 65 70 75 80 Lys Asp Val Val Lys Val Gly Ala Val Asp Ala Asp Lys His Gln Ser 85 90 95 Leu Gly Gly Gln Tyr Gly Val Gln Gly Phe Pro Thr Ile Lys Ile Phe 100 105 110 Gly Ala Asn Lys Asn Arg Pro Glu Asp Tyr Gln Gly Gly Arg Ser Gly 115 120 125 Glu Ala Ile Val Asp Ala Ala Leu Ser Ala Leu Arg Gln Leu Val Lys 130 135 140 Asp Arg Leu Gly Gly Arg Ser Gly Gly Tyr Ser Ser Gly Lys Gln Gly 145 150 155 160 Arg Ser Glu Ser Ser Ser Lys Lys Asp Val Ile Glu Leu Thr Asp Asp 165 170 175 Ser Phe Asp Lys Asn Val Leu Asp Ser Glu Asp Val Trp Met Val Glu 180 185 190 Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Asn Leu Glu Pro Glu Trp 195 200 205 Ala Ala Ala Ala Thr Glu Val Lys Glu Gln Thr Lys Gly Lys Val Lys 210 215 220 Leu Ala Ala Val Asp Ala Thr Val Asn Gln Val Leu Ala Ser Arg Tyr 225 230 235 240 Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile Phe Gln Lys Gly Glu Ser 245 250 255 Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg Ser Asp Ile Ile Ser Arg 260 265 270 Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro Pro Pro Glu Leu Leu Glu 275 280 285 Ile Ile Asn Glu Asp Ile Ala Lys Lys Thr Cys Glu Glu His Gln Leu 290 295 300 Cys Val Val Ala Val Leu Pro His Ile Leu Asp Thr Gly Ala Ala Gly 305 310 315 320 Arg Asn Ser Tyr Leu Glu Val Leu Leu Lys Leu Ala Asp Lys Tyr Lys 325 330 335 Lys Lys Met Trp Gly Trp Leu Trp Thr Glu Ala Gly Ala Gln Ser Glu 340 345 350 Leu Glu Thr Ala Leu Gly Ile Gly Gly Phe Gly Tyr Pro Ala Met Ala 355 360 365 Ala Ile Asn Ala Arg Lys Met Lys Phe Ala Leu Leu Lys Gly Ser Phe 370 375 380 Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg Glu Leu Ser Phe Gly Arg 385 390 395 400 Gly Ser Thr Ala Pro Val Gly Gly Gly Ala Phe Pro Ala Ile Ser Thr 405 410 415 Arg Glu Pro Trp Asp Gly Lys Asp Gly Glu Leu Pro Val Glu Asp Asp 420 425 430 Ile Asp Leu Ser Asp Val Glu Leu Asp Asp Leu Glu Lys Asp Glu Leu 435 440 445 <210> 86 <211> 590 <212> PRT <213> Sus scrofa <400> 86 Met Ala Arg Leu Val Leu Gly Leu Met Ser Cys Thr Leu Phe Val Ala 1 5 10 15 Val Asn Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro 20 25 30 Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu 50 55 60 Trp Lys Lys Val Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala 65 70 75 80 Val Asp Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln 85 90 95 Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu 100 105 110 Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu 115 120 125 Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Arg Gly Gly 130 135 140 Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Glu Gly Ser Gly Lys Lys 145 150 155 160 Asp Val Ile Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp 165 170 175 Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His 180 185 190 Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys 195 200 205 Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val 210 215 220 Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile 225 230 235 240 Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg 245 250 255 Thr Arg Ser Asp Ile Val Thr Arg Ala Leu Asp Leu Phe Ser Asp Asn 260 265 270 Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Val Ala Lys 275 280 285 Lys Ser Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His 290 295 300 Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu 305 310 315 320 Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp 325 330 335 Thr Glu Ala Gly Ala Gln Thr Glu Leu Glu His Ala Leu Gly Ile Gly 340 345 350 Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys 355 360 365 Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe 370 375 380 Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly 385 390 395 400 Gly Ala Phe Pro Ala Ile Ser Thr Arg Glu Pro Trp Asp Gly Lys Asp 405 410 415 Gly Glu Val Ser Pro Ala Thr Arg Glu Pro Gly Asp Gly Lys Asp Gly 420 425 430 Gln Ala Ser Pro Ala Thr Arg Glu Pro Trp Asp Gly Lys Asp Gly Gln 435 440 445 Ala Ser Pro Ala Thr Arg Glu Pro Gly Asp Gly Lys Asp Gly Glu Ala 450 455 460 Ser Pro Ala Glu Pro Arg Gly Gln Asp Ala Ser Arg Leu Trp Leu Ser 465 470 475 480 Phe Leu Ala Ser Leu Gly Pro Glu Ala Gly Cys Glu Pro Gly Leu Cys 485 490 495 Ile Arg Ala Ala Pro Arg Ala Gly Pro Ala Val Ala Pro Pro Gly Pro 500 505 510 Arg Gly Leu Leu Leu Ser Ser Ser Ser Ala Pro Leu Pro Pro Ala Thr 515 520 525 Pro Gln Ala Lys Ala Pro Gly Ser Cys Ser Pro Gly His Ser Pro Gln 530 535 540 Ala Glu Arg Phe Ser Thr Trp Arg Glu Ala Gln Arg Gly His Phe Glu 545 550 555 560 Val Ser Leu Asp Ser Arg Thr Leu Pro Ser Gly Leu Glu Arg Pro Thr 565 570 575 Ser Val Ala Pro Gly Val Cys Pro Arg Asp Asp Gly Arg Ser 580 585 590 <210> 87 <211> 439 <212> PRT <213> Mesocricetus auratus <400> 87 Met Ala Arg Leu Gly Phe Gly Leu Val Ser Cys Thr Phe Phe Leu Ala 1 5 10 15 Ala Ser Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro 20 25 30 Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asn Ser Leu Trp Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu 50 55 60 Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala 65 70 75 80 Val Asp Ala Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Gln 85 90 95 Gly Phe Pro Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Pro Glu 100 105 110 Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu 115 120 125 Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Ser Gly Arg Ser Gly 130 135 140 Gly Tyr Ser Ser Gly Lys Gln Gly Arg Gly Asp Ser Ser Ser Lys Lys 145 150 155 160 Asp Val Ile Glu Leu Thr Asp Asp Thr Phe Asp Lys Asn Val Leu Asp 165 170 175 Ser Asp Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His 180 185 190 Cys Lys Asn Leu Glu Pro Glu Trp Ala Thr Ala Ala Thr Glu Val Lys 195 200 205 Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val 210 215 220 Asn Gln Val Leu Ala Asn Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile 225 230 235 240 Lys Ile Phe Gln Lys Gly Glu Ala Pro Val Asp Tyr Asp Gly Gly Arg 245 250 255 Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn 260 265 270 Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Asn Glu Asp Val Ala Lys 275 280 285 Lys Met Cys Glu Glu His Gln Leu Cys Val Val Ala Val Leu Pro His 290 295 300 Ile Leu Asp Thr Gly Ala Ala Arg Asn Ser Tyr Leu Glu Ile Leu Leu 305 310 315 320 Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr 325 330 335 Glu Ala Gly Ala Gln Ser Glu Leu Glu Asn Ala Leu Gly Ile Gly Gly 340 345 350 Phe Gly Tyr Pro Ala Met Ala Arg Ile Asn Ala Arg Lys Met Lys Phe 355 360 365 Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu 370 375 380 Arg Glu Leu Ser Phe Gly Arg Ala Ser Thr Ala Pro Val Gly Gly Gly 385 390 395 400 Ser Phe Pro Ala Ile Thr Ala Arg Glu Pro Trp Asp Gly Arg Asp Gly 405 410 415 Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu Asp 420 425 430 Asp Leu Glu Lys Asp Glu Leu 435 <210> 88 <211> 440 <212> PRT <213> Pongo abelii <400> 88 Met Ala Leu Leu Val Leu Gly Leu Val Ser Cys Ala Phe Phe Leu Glu 1 5 10 15 Val Asn Gly Leu Tyr Ser Ser Ser Asp Asp Val Ile Glu Leu Thr Pro 20 25 30 Ser Asn Phe Asn Arg Glu Val Ile Gln Ser Asp Ser Leu Trp Leu Val 35 40 45 Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu 50 55 60 Trp Lys Lys Ala Ala Thr Ala Leu Lys Asp Val Val Lys Val Gly Ala 65 70 75 80 Val Asp Ala Asp Lys His His Ser Leu Gly Gly Gln Tyr Gly Val Gln 85 90 95 Gly Phe Pro Thr Ile Lys Ile Phe Gly Ser Asn Lys Asn Arg Pro Glu 100 105 110 Asp Tyr Gln Gly Gly Arg Thr Gly Glu Ala Ile Val Asp Ala Ala Leu 115 120 125 Ser Ala Leu Arg Gln Leu Val Lys Asp Arg Leu Gly Gly Gln Ser Gly 130 135 140 Gly Tyr Ser Ser Gly Lys Gln Gly Arg Ser Asp Ser Ser Ser Lys Lys 145 150 155 160 Asp Val Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Leu Asp 165 170 175 Ser Glu Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His 180 185 190 Cys Lys Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Ser Glu Val Lys 195 200 205 Glu Gln Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val 210 215 220 Asn Gln Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile 225 230 235 240 Lys Ile Phe Gln Lys Gly Glu Ser Pro Val Asp Tyr Asp Gly Gly Arg 245 250 255 Thr Arg Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn 260 265 270 Ala Pro Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Ile Ala Lys 275 280 285 Arg Thr Cys Glu Glu His Gln Leu Cys Val Val Ser Val Leu Pro His 290 295 300 Ile Leu Asp Thr Gly Ala Ala Gly Arg Asn Ser Tyr Leu Glu Val Leu 305 310 315 320 Leu Lys Leu Ala Asp Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp 325 330 335 Thr Glu Ala Gly Ala Gln Ser Glu Leu Glu Thr Ala Leu Gly Ile Gly 340 345 350 Gly Phe Gly Tyr Pro Ala Met Ala Ala Ile Asn Ala Arg Lys Met Lys 355 360 365 Phe Ala Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe 370 375 380 Leu Arg Glu Leu Ser Phe Gly Arg Gly Ser Thr Ala Pro Val Gly Gly 385 390 395 400 Gly Ala Phe Pro Thr Ile Val Glu Arg Glu Pro Trp Asp Gly Arg Asp 405 410 415 Gly Glu Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Glu Leu 420 425 430 Asp Asp Leu Gly Lys Asp Glu Leu 435 440 <210> 89 <211> 454 <212> PRT <213> Ficedula albicollis <400> 89 Met Arg Glu Ser His Lys Cys Ser Thr Gly Gln Leu Met Ser Leu Leu 1 5 10 15 Phe Leu Val Gly Thr Val Ser Cys Thr Leu Phe Leu Ala Val Asn Gly 20 25 30 Leu Tyr Ser Ala Ser Asp Asp Val Ile Glu Leu Thr Pro Thr Asn Phe 35 40 45 Asn Lys Glu Val Ile Gln Ser Glu Ser Leu Trp Leu Val Glu Phe Tyr 50 55 60 Ala Pro Trp Cys Gly His Cys Gln Arg Leu Thr Pro Glu Trp Lys Lys 65 70 75 80 Ala Ala Thr Ala Leu Lys Gly Val Val Lys Val Gly Ala Val Asp Ala 85 90 95 Asp Lys His Gln Ser Leu Gly Gly Gln Tyr Gly Val Arg Gly Phe Pro 100 105 110 Thr Ile Lys Ile Phe Gly Ala Asn Lys Asn Lys Ala Glu Asp Tyr Gln 115 120 125 Gly Gly Arg Thr Ser Asp Ala Ile Val Asp Ala Ala Leu Ser Ala Leu 130 135 140 Arg Ser Leu Val Lys Glu Arg Leu Ser Gly Arg Ser Gly Gly Tyr Ser 145 150 155 160 Ser Gly Lys Gln Ser Arg Gly Ser Gly Gly Gly Asp Lys Lys Asp Val 165 170 175 Ile Glu Leu Thr Asp Asp Ser Phe Asp Lys Asn Val Ile Asn Ser Asp 180 185 190 Asp Val Trp Met Val Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys 195 200 205 Asn Leu Glu Pro Glu Trp Ala Ala Ala Ala Thr Glu Val Lys Glu Gln 210 215 220 Thr Lys Gly Lys Val Lys Leu Ala Ala Val Asp Ala Thr Val Asn Gln 225 230 235 240 Val Leu Ala Ser Arg Tyr Gly Ile Arg Gly Phe Pro Thr Ile Lys Ile 245 250 255 Phe Gln Lys Gly Glu Asp Pro Val Asp Tyr Asp Gly Gly Arg Thr Arg 260 265 270 Ser Asp Ile Val Ser Arg Ala Leu Asp Leu Phe Ser Asp Asn Ala Pro 275 280 285 Pro Pro Glu Leu Leu Glu Ile Ile Ser Glu Asp Val Leu Lys Ser Thr 290 295 300 Cys Asp Ala His Gln Leu Cys Ile Ile Ser Val Leu Pro His Ile Leu 305 310 315 320 Asp Thr Gly Ala Ser Gly Arg Asn Ser Tyr Leu Asp Val Met Leu Lys 325 330 335 Met Ala Glu Lys Tyr Lys Lys Lys Met Trp Gly Trp Leu Trp Thr Glu 340 345 350 Ala Gly Ala Gln Pro Asp Leu Glu Ser Ser Leu Gly Ile Gly Gly Phe 355 360 365 Gly Tyr Pro Ala Met Ala Ala Val Asn Ala Arg Lys Met Lys Phe Ala 370 375 380 Leu Leu Lys Gly Ser Phe Ser Glu Gln Gly Ile Asn Glu Phe Leu Arg 385 390 395 400 Glu Leu Ser Val Gly Arg Gly Ser Thr Ala Pro Val Gly Gly Gly Ala 405 410 415 Phe Pro Lys Ile His Ser Val Glu Pro Trp Asp Gly Lys Asp Gly Glu 420 425 430 Leu Pro Val Glu Asp Asp Ile Asp Leu Ser Asp Val Asp Leu Asp Asp 435 440 445 Phe Gly Lys Asp Glu Leu 450 <210> 90 <211> 505 <212> PRT <213> Homo sapiens <400> 90 Met His Lys Ala Gln Lys Phe Ala Leu Gly Leu Leu Ala Ala Ala Ala 1 5 10 15 Val Ala Thr Ala Ser Asp Val Val Gln Leu Lys Lys Asp Thr Phe Asp 20 25 30 Asp Phe Ile Lys Thr Asn Asp Leu Val Leu Ala Glu Phe Phe Ala Pro 35 40 45 Trp Cys Gly His Cys Lys Ala Leu Ala Pro Glu Tyr Glu Glu Ala Ala 50 55 60 Thr Thr Leu Lys Glu Lys Asn Ile Lys Leu Ala Lys Val Asp Cys Thr 65 70 75 80 Glu Glu Thr Asp Leu Cys Gln Gln His Gly Val Glu Gly Tyr Pro Thr 85 90 95 Leu Lys Val Phe Arg Gly Leu Asp Asn Val Ser Pro Tyr Lys Gly Gln 100 105 110 Arg Lys Ala Ala Ala Ile Thr Ser Tyr Met Ile Lys Gln Ser Leu Pro 115 120 125 Ala Val Ser Glu Val Thr Lys Asp Asn Leu Glu Glu Phe Lys Lys Ala 130 135 140 Asp Lys Ala Val Leu Val Ala Tyr Val Asp Ala Ser Asp Lys Ala Ser 145 150 155 160 Ser Glu Val Phe Thr Gln Val Ala Glu Lys Leu Arg Asp Asn Tyr Pro 165 170 175 Phe Gly Ser Ser Ser Asp Ala Ala Leu Ala Glu Ala Glu Gly Val Lys 180 185 190 Ala Pro Ala Ile Val Leu Tyr Lys Asp Phe Asp Glu Gly Lys Ala Val 195 200 205 Phe Ser Glu Lys Phe Glu Val Glu Ala Ile Glu Lys Phe Ala Lys Thr 210 215 220 Gly Ala Thr Pro Leu Ile Gly Glu Ile Gly Pro Glu Thr Tyr Ser Asp 225 230 235 240 Tyr Met Ser Ala Gly Ile Pro Leu Ala Tyr Ile Phe Ala Glu Thr Ala 245 250 255 Glu Glu Arg Lys Glu Leu Ser Asp Lys Leu Lys Pro Ile Ala Glu Ala 260 265 270 Gln Arg Gly Val Ile Asn Phe Gly Thr Ile Asp Ala Lys Ala Phe Gly 275 280 285 Ala His Ala Gly Asn Leu Asn Leu Lys Thr Asp Lys Phe Pro Ala Phe 290 295 300 Ala Ile Gln Glu Val Ala Lys Asn Gln Lys Phe Pro Phe Asp Gln Glu 305 310 315 320 Lys Glu Ile Thr Phe Glu Ala Ile Lys Ala Phe Val Asp Asp Phe Val 325 330 335 Ala Gly Lys Ile Glu Pro Ser Ile Lys Ser Glu Pro Ile Pro Glu Lys 340 345 350 Gln Glu Gly Pro Val Thr Val Val Val Ala Lys Asn Tyr Asn Glu Ile 355 360 365 Val Leu Asp Asp Thr Lys Asp Val Leu Ile Glu Phe Tyr Ala Pro Trp 370 375 380 Cys Gly His Cys Lys Ala Leu Ala Pro Lys Tyr Glu Glu Leu Gly Ala 385 390 395 400 Leu Tyr Ala Lys Ser Glu Phe Lys Asp Arg Val Val Ile Ala Lys Val 405 410 415 Asp Ala Thr Ala Asn Asp Val Pro Asp Glu Ile Gln Gly Phe Pro Thr 420 425 430 Ile Lys Leu Tyr Pro Ala Gly Ala Lys Gly Gln Pro Val Thr Tyr Ser 435 440 445 Gly Ser Arg Thr Val Glu Asp Leu Ile Lys Phe Ile Ala Glu Asn Gly 450 455 460 Lys Tyr Lys Ala Ala Ile Ser Glu Asp Ala Glu Glu Thr Ser Ser Ala 465 470 475 480 Thr Glu Thr Thr Thr Glu Thr Ala Thr Lys Ser Glu Glu Ala Ala Lys 485 490 495 Glu Thr Ala Thr Glu His Asp Glu Leu 500 505 <210> 91 <211> 359 <212> PRT <213> Schizosaccharomyces pombe <400> 91 Met Arg Leu Pro Leu Leu Ser Phe Val Ile Phe Ala Leu Phe Ala Leu 1 5 10 15 Val Phe Ala Ser Gly Val Val Glu Leu Gln Ser Leu Asn Glu Leu Glu 20 25 30 Asn Thr Ile Arg Ala Ser Lys Lys Gly Ala Leu Ile Glu Phe Tyr Ala 35 40 45 Thr Trp Cys Gly His Cys Lys Ser Leu Ala Pro Val Tyr Glu Glu Leu 50 55 60 Gly Ala Leu Phe Glu Asp His Asn Asp Val Leu Ile Gly Lys Ile Asp 65 70 75 80 Ala Asp Thr His Ser Asp Val Ala Asp Lys Tyr His Ile Thr Gly Phe 85 90 95 Pro Thr Leu Ile Trp Phe Pro Pro Asp Gly Ser Glu Pro Val Gln Tyr 100 105 110 Ser Asn Ala Arg Asp Val Asp Ser Leu Thr Gln Phe Val Ser Glu Lys 115 120 125 Thr Gly Ile Lys Lys Arg Lys Ile Val Leu Pro Ser Asn Val Val Glu 130 135 140 Leu Asp Ser Leu Asn Phe Asp Lys Val Val Met Asp Asp Lys Lys Asp 145 150 155 160 Val Leu Val Glu Phe Tyr Ala Asp Trp Cys Gly Tyr Cys Lys Arg Leu 165 170 175 Ala Pro Thr Tyr Glu Thr Leu Gly Lys Val Phe Lys Asn Glu Pro Asn 180 185 190 Val Glu Ile Val Lys Ile Asn Ala Asp Val Phe Ala Asp Ile Gly Arg 195 200 205 Leu His Glu Val Ala Ser Phe Pro Thr Ile Lys Phe Phe Pro Lys Asp 210 215 220 Asp Lys Asp Lys Pro Glu Leu Tyr Glu Gly Asp Arg Ser Leu Glu Ser 225 230 235 240 Leu Ile Glu Tyr Ile Asn Lys Lys Ser Gly Thr Gln Arg Ser Pro Asp 245 250 255 Gly Thr Leu Leu Ser Thr Ala Gly Arg Ile Pro Thr Phe Asp Glu Phe 260 265 270 Ala Ala Glu Phe Leu Asp Met Ser Asn Ala Ala Lys Glu Val Val Leu 275 280 285 Glu Lys Val Lys Gln Leu Ala Leu Glu Asp Ser Ser Arg Trp Thr Lys 290 295 300 Tyr Tyr Lys Lys Val Phe Glu Lys Ile Leu Asn Asp Glu Asn Trp Val 305 310 315 320 His Lys Glu Ala Lys Arg Leu Ser Lys Leu Leu Arg Gln Lys Ser Ile 325 330 335 Ala Leu Ala Ser Ala Asp Asp Phe Lys Thr Arg Leu Asn Ile Leu Asn 340 345 350 Ser Phe Leu Pro Gly Asn His 355 <210> 92 <211> 435 <212> PRT <213> Haemaphysalis longicornis <220> <221> MOD_RES <222> (241)..(241) <223> Any amino acid <400> 92 Met Ala Thr Ala Leu Leu Ala Val Leu Ala Ala Leu Ser Pro Met Ala 1 5 10 15 Leu Ala Met Tyr Gly Pro His Thr Glu Val Val Asp Leu Ser Pro Ala 20 25 30 Asn Phe Lys Asn Arg Val Val Asp Ser Asp Glu Val Trp Ile Val Glu 35 40 45 Phe Tyr Ala Pro Trp Cys Gly His Cys Gln Ser Phe Ala Pro Glu Tyr 50 55 60 Thr Lys Ala Ala Ala Ala Leu Lys Gly Ile Val Lys Val Gly Ala Val 65 70 75 80 Asp Ala Asp Lys Asp Lys Ser Leu Gly Gly Gln Tyr Gly Val Arg Gly 85 90 95 Phe Pro Thr Val Lys Ile Phe Gly Ala Asn Lys His Asn Pro Thr Asp 100 105 110 Tyr Ser Gly Pro Arg Thr Ala Asp Gly Val Ala Ser Ala Ala Leu Gln 115 120 125 Glu Ala Arg Lys Val Val Asp Gln Arg Leu Gly Arg Lys Thr Ser Gly 130 135 140 Gly Ser Ser Gly Gly Lys Ser Asp Val Val Glu Leu Asp Glu Ser Asn 145 150 155 160 Phe Glu Glu Leu Val Leu Lys Ser Asp Asp Leu Trp Leu Val Glu Phe 165 170 175 Phe Ala Pro Trp Cys Gly His Cys Lys Asn Leu Ala Pro His Trp Ala 180 185 190 Lys Ala Ala Thr Glu Leu Lys Gly Lys Val Lys Leu Gly Ala Val Asp 195 200 205 Ala Thr Val His Gln Gly Leu Ala Ser Gln Phe Asp Val Lys Gly Tyr 210 215 220 Pro Thr Ile Lys Phe Phe Pro Gly Gly Lys Lys Asp Arg His Ser Ala 225 230 235 240 Xaa Glu Tyr Asn Gly Gly Arg Thr Ala Asp Asp Ile Val Gln Trp Gly 245 250 255 Leu Asp Lys Ala Ala Glu Ser Ala Pro Ala Pro Glu Leu His Gln Val 260 265 270 Thr Ser Pro Ser Val Leu Lys Asp Ala Cys Glu Glu Ser Gln Leu Cys 275 280 285 Val Val Ser Val Leu Pro His Ile Tyr Asp Cys Gln Ser Glu Cys Arg 290 295 300 Gln Gly Tyr Leu Asp Val Leu Lys Arg Leu Gly Glu Lys Tyr Lys Arg 305 310 315 320 Asn Arg Trp Gly Trp Leu Trp Ser Glu Ala Leu Ala Gln Pro Lys Leu 325 330 335 Glu Glu Ala Leu Glu Ile Gly Gly Phe Gly Tyr Pro Ala Leu Ala Val 340 345 350 Leu Asn Ser Arg Lys Met Lys Tyr Ser Leu Leu Arg Gly Ser Phe Ser 355 360 365 Tyr Asp Gly Ile Asn Glu Phe Leu Arg Glu Leu Ala Val Gly Arg Gly 370 375 380 Ser Ser Val Pro Val Lys Gly Ala Lys Leu Pro Glu Val Gln Thr Val 385 390 395 400 Glu Pro Trp Asp Gly Lys Asp Ala Lys Leu Glu Glu Pro Glu Asp Ile 405 410 415 Asp Leu Ser Asp Val Glu Leu Glu Pro Glu Glu Pro Gly Lys Lys His 420 425 430 Val Glu Leu 435 <210> 93 <211> 482 <212> PRT <213> Plasmodium chabaudi <400> 93 Met Asn Ser Lys Tyr Phe Ser Phe Leu Leu Phe Leu Ile Pro Phe Leu 1 5 10 15 Phe Gln Asn Cys Val Arg Ser His Glu Asp Leu Phe Asn Glu His Val 20 25 30 Thr Ser Ile His Asp Gly Glu Leu Thr Asn Phe Ile Thr Lys Asn Asp 35 40 45 Ile Val Leu Val Met Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Arg 50 55 60 Leu Ile Pro Glu Tyr Asn Asp Ala Ala Ile Met Leu Ala Glu Lys Lys 65 70 75 80 Ser Glu Ile Lys Leu Ala Ser Val Asp Ala Thr Ile Glu Arg Gly Leu 85 90 95 Ser Gln Glu Tyr Gly Ile Thr Gly Tyr Pro Thr Met Ile Leu Phe Asn 100 105 110 Lys Lys Asn Arg Ile Asn Tyr Gly Gly Gly Arg Thr Ala Gln Thr Ile 115 120 125 Val Asp Trp Ile Leu Gln Met Thr Gly Pro Val Ser Thr Glu Ile Thr 130 135 140 Gly Asn Ile Glu Asp Val Leu Lys Glu Lys Asn Ile Asn Val Ala Phe 145 150 155 160 Tyr Ile Glu Tyr Thr Ser Glu Asp His Glu Leu Phe Lys Lys Phe Asn 165 170 175 Glu Val Gly Asp Lys Asn Arg Glu Ile Ala Lys Tyr Phe Met Lys Lys 180 185 190 Asn Asp Lys His Asn Lys Ile Tyr Cys Tyr Arg Lys Asp Glu Lys Thr 195 200 205 Val Glu Tyr Asp Glu Lys Thr Pro Leu Ser Asp Phe Ile Thr Ile Glu 210 215 220 Ser Phe Pro Leu Phe Gly Glu Ile Asn Thr Glu Asn Tyr Arg Phe Tyr 225 230 235 240 Ala Glu Ser Pro Lys Glu Leu Val Trp Val Cys Ala Thr Ile Glu Gln 245 250 255 Tyr Asn Glu Ile Lys Glu Glu Val Arg Leu Ala Ala Ala Glu Leu Arg 260 265 270 Asn Lys Thr His Phe Val Leu Leu Asn Ile Pro Glu Tyr Ala Asp His 275 280 285 Ala Lys Ala Ser Leu Gly Ile Asn Glu Phe Pro Gly Leu Ala Tyr Gln 290 295 300 Ser Ser Glu Gly Arg Tyr Val Leu Thr Asn Pro Lys Gln Ser Leu Lys 305 310 315 320 Asn His Lys Asp Ile Ile Thr Phe Phe Lys Asp Val Glu Ala Gly Lys 325 330 335 Ile Glu Lys Ser Leu Lys Ser Glu Pro Ile Pro Glu Glu Asp Lys Asp 340 345 350 Ala Pro Val Lys Val Val Val Gly Asn Ser Phe Ile Asp Val Val Leu 355 360 365 Lys Ser Gly Lys Asp Val Leu Ile Glu Ile Tyr Ala Pro Trp Cys Gly 370 375 380 His Cys Lys Lys Leu Glu Pro Val Tyr Glu Glu Leu Gly Arg Lys Leu 385 390 395 400 Lys Lys Tyr Asp His Ile Ile Val Ala Lys Met Asp Gly Thr Leu Asn 405 410 415 Glu Thr Ala Leu Lys Glu Phe Glu Trp Ser Gly Phe Pro Thr Ile Phe 420 425 430 Phe Val Lys Ala Gly Ser Lys Ile Pro Leu Pro Tyr Glu Gly Glu Arg 435 440 445 Ser Leu Lys Gly Phe Val Asp Phe Leu Asn Lys His Ser Thr Lys Thr 450 455 460 Pro Ile Thr Ile Asp Gly Val Ser Gln Ser Asp Asp Gly Ala Ser Glu 465 470 475 480 Glu Leu <210> 94 <211> 514 <212> PRT <213> Aspergillus steynii <400> 94 Met Arg Ser Phe Thr Pro Trp Val Leu Gly Leu Leu Gly Ala Ser Ala 1 5 10 15 Val Val Ser Ala Gly Asp Ala Gln Ala Asp Val Pro Ser Asp Val Lys 20 25 30 Ser Leu Thr Gln Asp Thr Phe Asn Asp Phe Ile Lys Glu His Asp Leu 35 40 45 Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys Lys Ala Leu 50 55 60 Ala Pro Lys Tyr Glu Glu Ala Ala Ser Gln Leu Lys Asp Lys Asn Ile 65 70 75 80 Pro Leu Val Lys Ile Asp Cys Thr Glu Glu Glu Glu Leu Cys Arg Asp 85 90 95 Gln Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Val Asp 100 105 110 Ser Ser Lys Pro Tyr Gln Gly Ala Arg Gln Thr Glu Ser Leu Val Ser 115 120 125 Tyr Met Ile Lys Gln Ser Leu Pro Ala Val Ser Ser Val Asn Glu Glu 130 135 140 Asn Leu Glu Asp Thr Lys Thr Met Asp Lys Ile Val Val Ile Gly Tyr 145 150 155 160 Phe Ser Ser Asp Asp Gln Ala Ala Asn Asp Ala Phe Asn Ala Leu Ala 165 170 175 Glu Ala Gln Arg Asp Asn Tyr Leu Phe Ala Ala Thr Asp Asp Ala Ala 180 185 190 Ile Ala Lys Ala Glu Gly Val Glu Gln Pro Ser Leu Val Leu Tyr Lys 195 200 205 Asp Phe Asp Glu Lys Lys Ala Ile Tyr Thr Gly Glu Ile Glu Gln Asp 210 215 220 Ala Val Leu Thr Trp Val Lys Thr Ala Ser Thr Pro Leu Val Gly Glu 225 230 235 240 Ile Gly Pro Glu Thr Tyr Ser Ser Tyr Ile Thr Ala Gly Ile Pro Leu 245 250 255 Ala Tyr Ile Phe Ala Glu Thr Ser Glu Glu Arg Glu Lys Phe Thr Glu 260 265 270 Asp Phe Lys Pro Ile Ala Glu Lys His Lys Gly Leu Ile Asn Ile Ala 275 280 285 Thr Ile Asp Ala Lys Met Phe Gly Ala His Ala Gly Asn Leu Asn Leu 290 295 300 Asp Pro Gln Thr Phe Pro Ala Phe Ala Ile Gln Asp Pro Glu Lys Lys 305 310 315 320 Ala Lys Tyr Pro Tyr Asp Gln Ser Lys Glu Ile Thr Ala Lys Asp Val 325 330 335 Gly Lys Phe Ile Gln Asp Val Leu Gly Gly Lys Val Glu Pro Ser Ile 340 345 350 Lys Ser Glu Pro Ile Pro Glu Ser Gln Glu Gly Pro Val Thr Val Val 355 360 365 Val Ala His Ser Tyr Lys Glu Leu Val Val Asp Asn Glu Lys Asp Val 370 375 380 Leu Leu Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala 385 390 395 400 Pro Lys Tyr Glu Glu Leu Ala Ser Leu Tyr Ala Asp Val Pro Asp Leu 405 410 415 Ala Ser Lys Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val 420 425 430 Pro Asp Ser Ile Thr Gly Phe Pro Thr Ile Lys Leu Tyr Pro Ala Gly 435 440 445 Gly Lys Asp Ala Pro Val Glu Tyr Ala Gly Ser Arg Thr Val Glu Asp 450 455 460 Leu Val Asn Phe Val Lys Glu Asn Gly Gln His Lys Val Asp Ala Leu 465 470 475 480 Ala Asn Thr Gln Glu Gly Gly Asp Ala Thr Glu Ser Pro Ser Ala Ser 485 490 495 Ser Glu Thr Glu Ala Pro Ala Ala Thr Asp Asp Lys Ala Asp His Asp 500 505 510 Glu Leu <210> 95 <211> 530 <212> PRT <213> Emmonsia crescens <400> 95 Met Arg Gln Phe Arg Asp Phe Ala Phe Gly Leu Ala Ala Leu Gly Leu 1 5 10 15 Thr Ala Leu Ala Ser Ala Thr Glu Ala Glu Ala Glu Ser Asp Val His 20 25 30 Val Leu Lys Lys Asp Thr Phe Asn Asp Phe Met Asn Ser His Asp Leu 35 40 45 Val Leu Ala Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu 50 55 60 Ala Pro Glu Tyr Glu Val Ala Ala Thr Glu Leu Lys Glu Lys Asn Ile 65 70 75 80 His Leu Ala Lys Ile Asp Cys Thr Glu Glu Ala Asp Leu Cys Gln Glu 85 90 95 His Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Leu Glu 100 105 110 Asn Val Lys Pro Tyr Thr Gly Pro Arg Lys Ser Gly Pro Ile Ala Ser 115 120 125 Phe Met Val Lys Gln Ser Leu Pro Pro Val Thr Thr Val Thr Ala Asp 130 135 140 Asn Ile Glu Asp Val Lys Thr Leu Asp Lys Ile Val Val Ile Gly Tyr 145 150 155 160 Phe Ala Glu Asp Asp Lys Ala Ser Asn Glu Thr Phe Thr Ala Val Ala 165 170 175 Glu Ala Leu Arg Asp Asp Tyr Leu Phe Ala Gly Thr Asn Asp Ala Lys 180 185 190 Leu Ala Ala Ala Glu Asp Val Lys Gln Pro Ala Ile Val Leu Tyr Lys 195 200 205 Glu Phe Asp Glu Arg Lys Ala Val Phe Lys Asn Lys Phe Val Gln Asp 210 215 220 Asp Ile Ser Lys Phe Val Lys Thr Ala Ser Ile Pro Leu Val Gly Glu 225 230 235 240 Val Gly Pro Asp Thr Tyr Ala Gly Tyr Met Ala Ser Gly Leu Pro Leu 245 250 255 Ala Tyr Val Phe Ala Glu Thr Pro Glu Glu Arg Glu Glu Phe Ala Ala 260 265 270 Met Leu Lys Pro Ile Ala Gln Lys Gln Lys Gly Ser Ile Asn Ile Ala 275 280 285 Thr Ile Asp Ala Lys Ala Phe Gly Ala His Ala Gly Asn Leu Asn Leu 290 295 300 Asp Pro Glu Lys Phe Pro Ala Phe Ala Ile Gln Asp Thr Thr Asn Asn 305 310 315 320 Lys Lys Tyr Pro Phe Asp Gln Thr Lys Lys Ile Thr His Asp Asp Ile 325 330 335 Ala Lys Phe Val Gln Asp Val Leu Asp Gly Lys Val Glu Pro Ser Ile 340 345 350 Lys Ser Glu Pro Ile Pro Glu Ser Gln Asp Ala Ala Val Thr Val Val 355 360 365 Val Ala His Ser Phe Gln Glu Ile Val Ile Asp Asn Asp Lys Asp Val 370 375 380 Leu Val Glu Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala 385 390 395 400 Pro Lys Tyr Glu Gln Leu Gly Gln Leu Tyr Ala Asp Val Pro Glu Phe 405 410 415 Ala Ser Lys Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val 420 425 430 Pro Glu Asp Ile Gln Gly Phe Pro Thr Ile Lys Leu Tyr Ala Ala Gly 435 440 445 Ser Lys Gly Ser Pro Val Asp Tyr Asp Gly Ser Arg Thr Ile Glu Asp 450 455 460 Leu Ala Lys Phe Val Arg Asp Asn Gly Lys His Gly Val Asp Ala Tyr 465 470 475 480 Val Ala Glu Lys Val Val Glu Asp Gly Gly Asp Val Thr Asn Ser Pro 485 490 495 Ala Ala Ala Ser Pro Ser Ser Thr Ala Ala Asp Lys Glu Ser Glu Thr 500 505 510 Ser Ser Ser Asp Asp Ala Glu Glu Thr Ala Glu Ala Pro Arg His Glu 515 520 525 Glu Leu 530 <210> 96 <400> 96 000 <210> 97 <211> 517 <212> PRT <213> Aspergillus fumigatus <400> 97 Met Arg Ser Phe Ala Pro Leu Val Leu Ser Leu Leu Gly Ala Ser Ala 1 5 10 15 Val Ala Ser Ala Asp Ala Thr Ala Asp Thr Thr Ser Asp Val Val Ser 20 25 30 Leu Thr Lys Asp Ser Phe Lys Asp Phe Met Lys Glu His Asp Leu Val 35 40 45 Leu Ala Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala 50 55 60 Pro Lys Tyr Glu Glu Ala Ala Thr Glu Leu Lys Gly Lys Asn Ile Pro 65 70 75 80 Leu Val Lys Val Asp Cys Thr Glu Glu Glu Asp Leu Cys Lys Glu Asn 85 90 95 Gly Val Glu Gly Tyr Pro Thr Leu Lys Ile Phe Arg Gly Pro Asp Ser 100 105 110 Ser Lys Pro Tyr Gln Gly Ala Arg Gln Ala Asp Ser Ile Val Ser Tyr 115 120 125 Met Ile Lys Gln Ser Leu Pro Ala Val Ser Ala Val Thr Glu Glu Asn 130 135 140 Leu Glu Glu Ile Lys Thr Met Asp Lys Ile Val Val Ile Gly Tyr Phe 145 150 155 160 Ala Ser Asp Asp Lys Ala Ala Asn Asp Val Phe Thr Ser Phe Ala Glu 165 170 175 Ser Gln Arg Asp Asn Tyr Leu Phe Ala Ala Thr Ser Asp Ser Ala Ile 180 185 190 Ala Lys Ala Glu Gly Val Lys Gln Pro Ser Ile Val Leu Tyr Lys Asp 195 200 205 Phe Asp Glu Lys Lys Ala Val Tyr Asp Gly Ala Ile Glu Gln Glu Ala 210 215 220 Ile Leu Ser Trp Val Lys Thr Ala Ser Thr Pro Leu Val Gly Glu Ile 225 230 235 240 Gly Pro Glu Thr Tyr Ser Ser Tyr Ile Thr Ala Gly Ile Pro Leu Ala 245 250 255 Tyr Ile Phe Ala Glu Thr Lys Glu Glu Arg Asp Gln Tyr Ala Glu Asp 260 265 270 Phe Lys Pro Val Ala Glu Lys His Lys Gly Ala Ile Asn Ile Ala Thr 275 280 285 Ile Asp Ala Lys Met Phe Gly Ala His Ala Gly Asn Leu Asn Leu Asp 290 295 300 Pro Gln Thr Phe Pro Ala Phe Ala Ile Gln Asp Pro Glu Lys Asn Ala 305 310 315 320 Lys Tyr Pro Tyr Asp Gln Ser Arg Glu Phe Asn Ala Lys Glu Ile Gly 325 330 335 Lys Phe Ile Gln Asp Val Leu Asp Gly Lys Val Glu Pro Ser Ile Lys 340 345 350 Ser Glu Pro Ile Pro Glu Thr Gln Glu Gly Pro Val Thr Val Val Val 355 360 365 Ala His Ser Tyr Gln Asp Ile Val Ile Asn Asn Asp Lys Asp Val Leu 370 375 380 Leu Glu Phe Tyr Ala Pro Trp Cys Gly His Cys Lys Ala Leu Ala Pro 385 390 395 400 Lys Tyr Glu Glu Leu Ala Ala Leu Tyr Ala Gly Asp Phe Lys Asp Lys 405 410 415 Val Thr Ile Ala Lys Ile Asp Ala Thr Ala Asn Asp Val Pro Asp Ser 420 425 430 Ile Thr Gly Phe Pro Thr Ile Lys Leu Tyr Pro Ala Gly Ala Lys Asp 435 440 445 Ser Pro Val Glu Tyr Ser Gly Ser Arg Thr Val Glu Asp Leu Ala Asn 450 455 460 Phe Ile Lys Glu Asn Gly Lys Tyr Lys Val Asp Ala Leu Val Ala Ala 465 470 475 480 Ser Glu Lys Val Glu Glu Gly Pro Asp Val Thr Ala Ser Pro Ser Ala 485 490 495 Thr Ser Thr Glu Ala Glu Ala Pro Ala Ala Thr Gly Asp Glu Lys Gly 500 505 510 Asp His Asp Glu Leu 515 <210> 98 <211> 217 <212> PRT <213> Pseudomonas fluorescens <400> 98 Met Ser Thr Pro Leu Lys Ile Asp Phe Val Ser Asp Val Ser Cys Pro 1 5 10 15 Trp Cys Ile Ile Gly Leu Arg Gly Leu Thr Glu Ala Leu Asp Gln Leu 20 25 30 Gly Ser Glu Val Gln Ala Glu Ile His Phe Gln Pro Phe Glu Leu Asn 35 40 45 Pro Asn Met Pro Ala Glu Gly Gln Asn Ile Val Glu His Ile Thr Glu 50 55 60 Lys Tyr Gly Ser Thr Ala Glu Glu Ser Gln Ala Asn Arg Ala Arg Ile 65 70 75 80 Arg Asp Met Gly Ala Ala Leu Gly Phe Ala Phe Arg Thr Asp Gly Gln 85 90 95 Ser Arg Ile Tyr Asn Thr Phe Asp Ala His Arg Leu Leu His Trp Ala 100 105 110 Gly Leu Glu Gly Leu Gln Tyr Asn Leu Lys Glu Ala Leu Phe Lys Ala 115 120 125 Tyr Phe Ser Asp Gly Gln Asp Pro Ser Asp His Ala Thr Leu Ala Ile 130 135 140 Ile Ala Glu Ser Val Gly Leu Asp Leu Ala Arg Ala Ala Glu Ile Leu 145 150 155 160 Ala Ser Asp Glu Tyr Ala Ala Glu Val Arg Glu Gln Glu Gln Leu Trp 165 170 175 Val Ser Arg Gly Val Ser Ser Val Pro Thr Ile Val Phe Asn Asp Gln 180 185 190 Tyr Ala Val Ser Gly Gly Gln Pro Ala Glu Ala Phe Val Gly Ala Ile 195 200 205 Arg Gln Ile Ile Asn Glu Ser Lys Ser 210 215

Claims (114)

  1. 재조합 단백질 발현을 위한 재조합 그람 음성 박테리아 숙주 세포로서,
    (a) 숙주 세포가 제1 프로테아제 활성이 결핍되어 있고, 이때 제1 프로테아제 활성은 꼬리 특이적 프로테아제 활성이고, 제1 프로테아제 활성의 결핍이 꼬리 특이적 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
    (b) 숙주 세포가 제2 프로테아제 활성이 결핍되어 있고, 이때 제2 프로테아제 활성은 뮤레인(murein) DD-엔도펩티다제 활성이고, 제2 프로테아제 활성의 결핍이 뮤레인 DD-엔도펩티다제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  2. 제1항에 있어서, 추가로
    (c) 숙주 세포가 적어도 하나의 추가 프로테아제 활성이 결핍되어 있고, 이때 추가 프로테아제 활성의 결핍이 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고, 상기 추가 프로테아제가 (a) 및 (b)의 프로테아제와 상이하거나;
    (d) 숙주 세포가 하나 이상의 자가용해 인자 활성이 결핍되어 있고, 이때 자가용해 인자 활성의 결핍이 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되거나;
    (e) 숙주 세포가 하나 이상의 불활성화된 프로테아제를 과발현하거나;
    (f) 숙주 세포가 하나 이상의 폴딩 조절인자를 과발현하거나; 또는
    (g) (c), (d), (e) 및 (f)의 임의의 조합인 재조합 그람 음성 박테리아 숙주 세포.
  3. 제1항 또는 제2항에 있어서, 꼬리 특이적 프로테아제 활성의 결핍이 (i) 서열번호 33으로 제시된 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제, 서열번호 33의 상동체, 또는 서열번호 33과 적어도 30% 유사한 아미노산 서열을 가진 Prc1 꼬리 특이적 프로테아제 관련 단백질; (ii) 서열번호 35로 제시된 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제, 서열번호 35의 상동체, 또는 서열번호 35와 적어도 30% 유사한 아미노산 서열을 가진 Prc2 꼬리 특이적 프로테아제 관련 단백질; 또는 (iii) 서열번호 71로 제시된 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제, 서열번호 71의 상동체, 또는 서열번호 71과 적어도 30% 유사한 아미노산 서열을 가진 Tsp 꼬리 특이적 프로테아제 관련 단백질 중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 뮤레인 DD-엔도펩티다제 활성의 결핍이
    (i) 서열번호 1로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 1의 상동체, 또는 서열번호 1과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
    (ii) 서열번호 63으로 제시된 아미노산 서열을 가진 MepM 뮤레인 DD-엔도펩티다제, 서열번호 63의 상동체, 또는 서열번호 63과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질;
    (iii) 서열번호 65로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 65의 상동체, 또는 서열번호 65와 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질; 및
    (iv) 서열번호 66으로 제시된 아미노산 서열을 가진 MepM1 뮤레인 DD-엔도펩티다제, 서열번호 66의 상동체, 또는 서열번호 66과 적어도 30% 유사한 아미노산 서열을 가진 뮤레인 DD-엔도펩티다제 관련 단백질
    중 하나 이상을 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
  5. 제2항 내지 제4항 중 어느 한 항에 있어서, (c)의 숙주 세포가 1개 내지 10개의 상이한 추가 프로테아제 활성이 결핍되어 있거나; (d)의 숙주 세포가 1개 내지 5개의 상이한 자가용해 인자 활성이 결핍되어 있거나; (e)의 숙주 세포가 1개 내지 10개의 상이한 불활성화된 프로테아제를 과발현하고, 이때 각각의 불활성화된 프로테아제가 상이하거나; (f)의 숙주 세포가 1개 내지 10개의 상이한 폴딩 조절인자를 과발현하거나; 또는 이들의 임의의 조합인 재조합 그람 음성 박테리아 숙주 세포.
  6. 제2항 내지 제5항 중 어느 한 항에 있어서,
    (c)의 하나 이상의 추가 프로테아제 활성의 결핍이 세랄라이신(serralysin) 전구체, 막 국소화 프로테아제, 뮤레인 L,D 트랜스펩티다제, 헤모라이신(hemolysin) 전구체, D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 주변세포질 세린 엔도프로테아제, AAA+ 패밀리 단백질용해 기구, 및 (a)의 것과 상이한 뮤레인 DD-엔도펩티다제로부터 독립적으로 선택된 추가 프로테아제를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
    (d)의 하나 이상의 자가용해 인자 활성의 결핍이 S형 피오신(pyocin), 선형 그라미시딘(gramicidin) 합성효소 서브유닛 D, 헤모라이신 전구체, 류코톡신(leukotoxin) 및 포린(porin)으로부터 독립적으로 선택된 자가용해 인자를 코딩하는 적어도 하나의 유전자의 돌연변이로부터 비롯되고;
    (e)의 하나 이상의 불활성화된 프로테아제가 돌연변이체 주변세포질 세린 엔도프로테아제이고;
    (f)의 하나 이상의 폴딩 조절인자가 디설파이드 이소머라제인 재조합 그람 음성 박테리아 숙주 세포.
  7. 제6항에 있어서, 세랄라이신 전구체가
    서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질;
    서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 47로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 및 서열번호 47로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질
    로부터 선택되고;
    막 국소화 프로테아제가 서열번호 39로 제시된 아미노산 서열을 가진 HtpX, 서열번호 39로 제시된 아미노산 서열을 가진 HtpX의 상동체, 또는 서열번호 39로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HtpX 관련 단백질이고;
    뮤레인 L,D 트랜스펩티다제가 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제, 서열번호 41로 제시된 아미노산 서열을 가진 뮤레인 L,D 트랜스펩티다제의 상동체, 또는 서열번호 41로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 뮤레인 L,D 트랜스펩티다제 관련 단백질이고;
    헤모라이신 전구체가 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체, 서열번호 43으로 제시된 아미노산 서열을 가진 헤모라이신 전구체의 상동체, 또는 서열번호 43으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 헤모라이신 전구체 관련 단백질이고;
    D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체가 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체, 서열번호 45로 제시된 아미노산 서열을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체의 상동체, 또는 서열번호 45로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 D-알라닐-D-알라닌 카르복시펩티다제/엔도펩티다제 AmpH 전구체 관련 단백질이고;
    주변세포질 세린 엔도프로테아제가
    서열번호 31로 제시된 아미노산 서열을 가진 DegP2; 서열번호 31로 제시된 아미노산 서열을 가진 DegP2의 상동체; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2 관련 단백질;
    서열번호 69로 제시된 아미노산 서열을 가진 DegP; 서열번호 69로 제시된 아미노산 서열을 가진 DegP의 상동체; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질;
    서열번호 62로 제시된 아미노산 서열을 가진 DegP; 서열번호 62로 제시된 아미노산 서열을 가진 DegP의 상동체; 및 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP 관련 단백질
    로부터 선택되고;
    AAA+ 패밀리 단백질용해 기구가 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질을 포함하고;
    뮤레인 DD-엔도펩티다제가
    서열번호 3으로 제시된 아미노산 서열을 가진 슈도모나스 플루오레센스(P. fluorescens) MepM2 프로테아제; 서열번호 3으로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 3으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
    서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 64로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 64로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
    서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 67로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 서열번호 67로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질;
    서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제; 서열번호 68로 제시된 아미노산 서열을 가진 MepM2 프로테아제의 상동체; 및 서열번호 68로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 MepM2 관련 단백질
    로부터 선택되고;
    S형 피오신이 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신, 서열번호 49로 제시된 아미노산 서열을 가진 S형 피오신의 상동체, 또는 서열번호 49로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 S형 피오신 관련 단백질이고;
    선형 그라미시딘 합성효소가 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소, 서열번호 51로 제시된 아미노산 서열을 가진 선형 그라미시딘 합성효소의 상동체, 또는 서열번호 51로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 선형 그라미시딘 합성효소 관련 단백질이고;
    류코톡신이 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신, 서열번호 53으로 제시된 아미노산 서열을 가진 류코톡신의 상동체, 또는 서열번호 53으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 류코톡신 관련 단백질이고;
    ShlB 헤모라이신 수송체가 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체, 서열번호 55로 제시된 아미노산 서열을 가진 ShlB 헤모라이신 수송체의 상동체, 또는 서열번호 55로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 ShlB 헤모라이신 수송체 관련 단백질이고;
    하나 이상의 과발현된 불활성화된 프로테아제 각각이 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP2의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP2 관련 단백질; 서열번호 69로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP; 서열번호 69로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP 관련 단백질; 서열번호 62로 제시된 아미노산 서열의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열의 상동체의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 35% 동일성을 가진 DegP의 아미노산 치환 또는 파괴를 포함하는 불활성화된 DegP/HtrA 관련 단백질; 131(His), 134(Asp) 및 236(Ser)(서열번호 62, 리더 서열 1-26을 포함하는 넘버링), 또는 리더 서열을 제외할 때 각각 위치 105, 108 및 210 중 어느 한 위치에 상응하는 위치에서 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이(E. coli) Htr S210A에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 이. 콜라이 Htr H105R에 상응하는 아미노산 치환을 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체; 및 서열번호 31의 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 한 위치에 상응하는 위치에서 어느 하나 이상의 아미노산의 치환 또는 파괴를 가진 불활성화된 DegP, DegP 관련 단백질 또는 DegP 상동체로부터 독립적으로 선택되고;
    하나 이상의 폴딩 조절인자 각각이 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열을 가진 디설파이드 결합 이소머라제의 상동체; 서열번호 60, 76, 77, 78, 80 및 81 중 어느 하나로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 결합 이소머라제 관련 단백질; 서열번호 27 및 82 내지 98 중 어느 하나로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제; 서열번호 27 및 82 내지 98 중 어느 하나로 제시된 아미노산 서열을 가진 단백질 디설파이드 이소머라제의 상동체; 및 서열번호 27 및 82 내지 98로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 단백질 디설파이드 이소머라제 관련 단백질로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 돌연변이가 상응하는 유전자의 코딩 서열 또는 비코딩 서열에 있고, 돌연변이가 (i) 완전한 유전자 결실, (ii) 부분적 유전자 결실, (iii) 미스센스 돌연변이, (iv) 넌센스 돌연변이, (v) 프레임시프트 돌연변이, (vi) 삽입, 및 (vii) (ii), (iii), (iv), (v) 및 (vi)의 임의의 조합으로부터 독립적으로 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  9. 제8항에 있어서, (iii)의 미스센스 돌연변이가 보존적 또는 비보존적 아미노산 치환을 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  10. 제8항 또는 제9항에 있어서, 비코딩 서열이 조절 서열인 재조합 그람 음성 박테리아 숙주 세포.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 기능성 프로테아제 활성을 추가로 포함하고, 상기 기능성 프로테아제 활성은 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 기능성 프로테아제 활성을 추가로 포함하고, 상기 기능성 프로테아제 활성은 서열번호 7로 제시된 아미노산 서열을 가진 MepS2; 서열번호 7로 제시된 아미노산 서열을 가진 MepS2의 상동체; 또는 서열번호 7로 제시된 슈도모나스 플루오레센스 MepS2 프로테아제 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS2 관련 단백질인 재조합 그람 음성 박테리아 숙주 세포.
  13. 제11항 또는 제12항에 있어서, 슈도모나드(Pseudomonad)인 재조합 그람 음성 박테리아 숙주 세포.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 그람 음성 박테리아 숙주 세포가 슈도모나드이고, 제1 프로테아제 활성의 결핍이 슈도모나스 플루오레센스 Prc1을 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이, 및/또는 슈도모나스 플루오레센스 Prc2를 코딩하는 유전자의 코딩 서열 및/또는 비코딩 서열의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 제2 프로테아제 활성이 제2 프로테아제 활성을 가진 프로테아제의 활성 부위 아미노산 또는 알로스테릭 부위 아미노산의 보존적 또는 비보존적 치환을 야기하는 돌연변이로 인해 결핍된 것인 재조합 그람 음성 박테리아 숙주 세포.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 제2 프로테아제 활성의 결핍이 제2 프로테아제 유전자의 적어도 하나의 돌연변이로부터 비롯되고, 이때 돌연변이가 (i) 서열번호 1의 잔기 134 내지 145 중 어느 하나 이상; (ii) 서열번호 1의 잔기 319 내지 411 중 어느 하나 이상; (iii) 서열번호 1의 잔기 361 내지 378 중 어느 하나 이상; (iv) 서열번호 1의 248, 319, 330, 332, 334, 337, 378, 410 및 411로부터 선택된 어느 하나 이상의 잔기; 또는 (i), (ii), (iii) 및 (iv)의 임의의 조합에 상응하는 위치에서 아미노산 서열의 파괴를 야기하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 박테리아 숙주 세포가 슈도모나스 플루오레센스이고, 제2 프로테아제 활성의 결핍이 Y248stop, G332S, D334N, A337T, H411Y, P410L로부터 선택된 서열번호 1의 아미노산 치환, 및 R319, H330, D334, H378 및 H411 중 어느 하나의 임의의 보존적 또는 비보존적 아미노산 치환을 야기하는 유전자 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 배양물에서 고밀도 세포 생장을 할 수 있는 재조합 그람 음성 박테리아 숙주 세포.
  19. 제18항에 있어서, 배양물에서의 고밀도 세포 생장이 약 80 내지 약 300의 OD575까지의 생장을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  20. 제18항 또는 제19항에 있어서, 배양물에서의 고밀도 세포 생장이 대조군 세포에 비해 약 2배 내지 약 15배 증가되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  21. 제20항에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
    (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
    (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(c)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(c)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
    (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
    로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  22. 제21항에 있어서, 2(c)의 추가 프로테아제 활성이 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성인 재조합 그람 음성 박테리아 숙주 세포.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 관심 있는 재조합 단백질을 코딩하는 적어도 하나의 핵산 서열을 각각 포함하는 적어도 하나의 발현 구축물을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
  24. 제23항에 있어서, 관심 있는 재조합 단백질이 재조합 그람 음성 박테리아 숙주 세포에 대한 천연 또는 이종인 재조합 그람 음성 박테리아 숙주 세포.
  25. 제23항에 있어서, 관심 있는 재조합 단백질이 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 항체 기반 약물, 비항체 결합 단백질(예를 들어, 알파바디, iBody, 아피바디, 아필린, 아피틴 또는 안티칼린을 포함하나 이들로 제한되지 않는 항체 모방체), 시약 단백질; 백신 항원; 치료 단백질 또는 효소; 비천연 단백질; 병원체 단백질 또는 이의 유도체; 미생물 독소, 지단백질; 세포외 수용체 또는 리간드; 프로테아제; 키나제; 혈액 단백질; 케모카인; 사이토카인; 골 형태형성 단백질; 항응고제; 혈액 인자; 골 형태발생 단백질; 조작된 단백질 스캐폴드; 효소, 예를 들어, 생체촉매 효소; 성장 인자; 인터페론; 인터류킨; 혈전용해제; 호르몬; 및 TGF-베타 패밀리 구성원 단백질로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 관심 있는 재조합 단백질이 인간, 뮤린, 래트, 토끼, 기니피그, 낙타류, 상어, 조류, 효모, 진균, 그람 음성 박테리아 또는 그람 양성 박테리아 단백질인 재조합 그람 음성 박테리아 숙주 세포.
  27. 제25항 또는 제26항에 있어서, 항체, 항체 단편 또는 이의 유도체가 단일클론 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체, 이중특이적 항체, 키메라 항체; 디아바디; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디(bibody); 트리바디(tribody); 인트라바디; 나노바디; 소형 모듈식 면역약제(SMIP); 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체, 조류 항체(예를 들어, 닭 항체), VHH 함유 항체; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편(예를 들어, IgG의 힌지 영역 디설파이드 결합의 환원에 의해 생성됨); Fc 융합 단백질(예를 들어, 관심 있는 단백질 또는 펩티드와 함께 융합된 IgG의 Fc 도메인을 포함함); 도메인 항체; VL; VNAR; VH; 및 VHH로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  28. 제27항에 있어서, VHH 함유 항체가 VHH 연쇄(concatenated) 항체인 재조합 그람 음성 박테리아 숙주 세포.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 사이토카인; 케모카인; 약물; 세포 표면 단백질, 예를 들어, 수용체, 세포 표면 마커, 병원체 표면 단백질 등; 성장 인자; 성장 인자 수용체; 면역 체크포인트 분자, 및 혈액 인자로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  30. 제25항 내지 제29항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 Fab'인 재조합 그람 음성 박테리아 숙주 세포.
  31. 제30항에 있어서, Fab'가 암배아 항원(CEA); CD22; 피브린 II, 베타 쇄; TNF-알파; 및 NCA-90(과립구 항원)으로부터 선택된 표적에 결합하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  32. 제25항 내지 제31항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 적어도 하나의 핵산 서열, 경쇄를 코딩하는 적어도 하나의 핵산 서열, 또는 이들 둘 다를 포함하고, 이때 중쇄가 전체 길이 또는 중쇄 단편이고, 경쇄가 전체 길이 또는 경쇄 단편인 재조합 그람 음성 박테리아 숙주 세포.
  33. 제32항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 각각 코딩하는 적어도 2개의 핵산 서열을 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  34. 제32항 또는 제33항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 동일한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  35. 제32항 또는 제33항에 있어서, 항체, 항체 단편 또는 이의 유도체를 코딩하는 적어도 하나의 발현 구축물이 중쇄를 코딩하는 핵산 서열 및 경쇄를 코딩하는 핵산 서열을 포함하고, 이때 중쇄와 경쇄가 상이한 mRNA 전사물로부터 발현되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  36. 제34항 또는 제35항에 있어서, 각각의 중쇄 코딩 핵산 서열 및 각각의 경쇄 코딩 핵산 서열이 주변세포질 분비 신호를 코딩하는 독립적으로 선택된 핵산 서열에 개별적으로 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
  37. 제36항에 있어서, 주변세포질 분비 신호가 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
  38. 제34항 내지 제37항 중 어느 한 항에 있어서, 발현 구축물이, 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 항체 중쇄를 코딩하는 핵산 서열; 서열번호 11, 13, 15 또는 17로 제시된 아미노산 서열을 가진 주변세포질 분비 신호를 코딩하는 핵산 서열에 작동 가능하게 연결된, 경쇄를 코딩하는 핵산 서열; 또는 이들 둘 다를 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  39. 제25항 내지 제38항 중 어느 한 항에 있어서, 항체, 항체 단편 또는 이의 유도체가 인간화된 것인 재조합 그람 음성 박테리아 숙주 세포.
  40. 제30항 내지 제39항 중 어느 한 항에 있어서, Fab'가 세르톨리주맙(certolizumab)인 재조합 그람 음성 박테리아 숙주 세포.
  41. 제40항에 있어서, Fab' 중쇄가 서열번호 21로 제시된 아미노산 서열을 갖고, Fab' 경쇄가 서열번호 23으로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
  42. 제32항 내지 제41항 중 어느 한 항에 있어서, 중쇄를 코딩하는 핵산 서열이 서열번호 11로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결되고, 경쇄를 코딩하는 핵산 서열이 서열번호 13으로 제시된 아미노산 서열을 가진 분비 리더를 코딩하는 핵산 서열에 작동 가능하게 연결된 것인 재조합 그람 음성 박테리아 숙주 세포.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서,
    (i) 제1 프로테아제 활성;
    (ii) 제2 프로테아제 활성;
    (iii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체, 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체, 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질의 활성;
    (iv) 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제, 서열번호 37로 제시된 아미노산 서열을 가진 HslU 프로테아제의 상동체, 또는 서열번호 37로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslU 관련 단백질; 및
    (v) 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제, 서열번호 38로 제시된 아미노산 서열을 가진 HslV 프로테아제의 상동체, 또는 서열번호 38로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 HslV 관련 단백질
    이 결핍된 재조합 그람 음성 박테리아 숙주 세포.
  44. 제43항에 있어서, 숙주 세포가 외인성 불활성화된 DegP를 추가로 과발현하고, 불활성화된 DegP는 슈도모나스 플루오레센스 DegP2 S219A; 서열번호 31로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열의 상동체로부터 유래한 불활성화된 DegP2; 서열번호 31로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 서열번호 62로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 DegP2로부터 유래한 불활성화된 DegP2; 및 위치 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 146, 147, 148, 149, 150, 151, 152, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 231, 232, 233 및 234 중 어느 하나 이상의 위치의 보존적 또는 비보존적 아미노산 치환 또는 파괴를 포함하는 서열번호 31로 제시된 아미노산 서열을 가진 각각의 프로테아제로부터 선택되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  45. 제43항 또는 제44항에 있어서, 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 또는 73으로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 디설파이드 이소머라제; 및 서열번호 27, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72 및 73으로 제시된 아미노산 서열을 가진 디설파이드 이소머라제의 상동체 중 어느 하나로부터 선택된 외인성 디설파이드 이소머라제를 과발현하는 재조합 그람 음성 박테리아 숙주 세포.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 슈도모나드 숙주 세포; 이. 콜라이 숙주 세포; 및 비브리오 숙주 세포로부터 선택된 재조합 그람 음성 박테리아 숙주 세포.
  47. 제46항에 있어서, 슈도모나스 숙주 세포가 슈도모나스 숙주 세포인 재조합 그람 음성 박테리아 숙주 세포.
  48. 제47항에 있어서, 슈도모나스 숙주 세포가 슈도모나스 플루오레센스, 슈도모나스 푸티다(P. putid) 또는 슈도모나스 에루기노사(P. aeruginosa)인 재조합 그람 음성 박테리아 숙주 세포.
  49. 제47항 또는 제48항에 있어서, 세포가
    (i) lsc::lacIQ1;
    (ii) Prc1-;
    (ii) Prc2-;
    (iii) HslU-;
    (iv) HslV-;
    (v) MepM1-;
    (vi) PyrF-; 및
    (vii) 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체; 서열번호 9로 제시된 아미노산 서열을 가진 세랄라이신 전구체의 상동체; 또는 서열번호 9로 제시된 아미노산 서열과 적어도 60% 유사성 또는 적어도 60% 동일성을 가진 세랄라이신 전구체 관련 단백질인 세랄라이신 전구체의 결핍
    을 나타내고, 세랄라이신 전구체 결핍이 세랄라이신 전구체를 코딩하는 유전자의 돌연변이로부터 비롯된 것인 재조합 그람 음성 박테리아 숙주 세포.
  50. 제49항에 있어서, 세포가 슈도모나스 플루오레센스이고, Prc1이 서열번호 33으로 제시된 아미노산 서열을 갖고, Prc2가 서열번호 35로 제시된 아미노산 서열을 갖고, HslU가 서열번호 37로 제시된 아미노산 서열을 갖고, HslV가 서열번호 38로 제시된 아미노산 서열을 갖고, MepM1이 서열번호 1로 제시된 아미노산 서열을 갖고, 세랄라이신 전구체가 서열번호 9로 제시된 아미노산 서열을 가진 것인 재조합 그람 음성 박테리아 숙주 세포.
  51. 제50항에 있어서, DegP2 S219A(서열번호 29)를 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
  52. 제50항 또는 제51항에 있어서, 디설파이드 이소머라제 PDIA6(서열번호 27)을 코딩하는 핵산 서열을 포함하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
  53. 제1항 내지 제52항 중 어느 한 항에 있어서, 재조합 단백질을 코딩하는 발현 벡터를 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
  54. 제53항에 있어서, 발현 벡터가 Fab'를 코딩하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  55. 제54항에 있어서, DegP2 S219A 또는 디설파이드 이소머라제 PDIA6을 코딩하는 핵산 서열을 포함하는 발현 벡터가 Fab'를 코딩하는 핵산 서열을 추가로 포함하는 것인 재조합 그람 음성 박테리아 숙주 세포.
  56. 제54항 또는 제55항에 있어서, Fab' 중쇄가 서열번호 21에 의해 코딩되고, Fab' 경쇄가 서열번호 23에 의해 코딩되는 것인 재조합 그람 음성 박테리아 숙주 세포.
  57. 제1항에 있어서, 균주 STR94975, STR94976 또는 STR94977의 유전형을 가진 슈도모나드인 재조합 그람 음성 박테리아 숙주 세포.
  58. 제57항에 있어서, 재조합 항-TNF-알파 Fab'를 생성하는 데 사용하기 위한, STR94975, STR94976 또는 STR94977의 발현 구축물 또는 구축물들을 추가로 포함하는 재조합 그람 음성 박테리아 숙주 세포.
  59. 관심 있는 재조합 단백질의 제조 방법으로서, (a) 적합한 발효 조건 하에서 배양된 제1항 내지 제57항 중 어느 한 항의 재조합 그람 음성 박테리아 숙주 세포로부터 관심 있는 재조합 단백질을 회수하는 단계를 포함하고, 상기 재조합 그람 음성 숙주 세포는 관심 있는 재조합 단백질을 코딩하는 핵산을 포함하는 플라스미드로 형질전환된 것인 관심 있는 재조합 단백질의 제조 방법.
  60. 제59항에 있어서, 관심 있는 재조합 단백질을 코딩하는 핵산 서열의 전사가 유도성 프로모터에 의해 조절되는 것인 방법.
  61. 제60항에 있어서, 유도성 프로모터가 tac 프로모터, 만니톨 프로모터, Pben, T7 프로모터, lac 프로모터, T5 프로모터, 자일로스 프로모터 및 아라비노스 프로모터로부터 선택되는 것인 방법.
  62. 제59항 내지 제61항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 높은 세포 밀도까지 생장할 수 있는 것인 방법.
  63. 제62항에 있어서, 높은 세포 밀도가 약 80 내지 약 300의 OD575를 포함하는 것인 방법.
  64. 제58항 내지 제63항 중 어느 한 항에 있어서, 적합한 발효 조건이 약 80 내지 약 160의 OD575, 약 5.8 내지 약 7.0의 배양 pH, 약 28℃ 내지 33℃의 온도, 유가식, 및 약 0.2 내지 약 5 g/ℓ의 역가 범위에서 유도성 프로모터의 유도를 포함하는 것인 방법.
  65. 제64항에 있어서, 유도성 프로모터를 IPTG로 유도하고, IPTG를 약 0.08 내지 0.3 mM의 최종 농도로 첨가하는 것인 방법.
  66. 제65항에 있어서, IPTG를 약 0.2 mM의 최종 농도로 첨가하는 것인 방법.
  67. 제63항 내지 제66항 중 어느 한 항에 있어서, 유도를 약 6.0 내지 약 6.5의 배양 pH에서 수행하는 것인 방법.
  68. 제63항 내지 제67항 중 어느 한 항에 있어서, 유도를 약 28℃ 내지 33℃의 온도에서 수행하는 것인 방법.
  69. 제68항에 있어서, 유도를 약 32℃의 온도에서 수행하는 것인 방법.
  70. 제59항 내지 제69항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포가 동일한 발효 조건 하에서 생장된 대조군 세포에 비해 증가된 세포 밀도로 생장하는 것인 방법.
  71. 제70항에 있어서, 세포 밀도의 증가가 약 2배 내지 약 15배인 방법.
  72. 제59항 내지 제71항 중 어느 한 항에 있어서, (b) 재조합 그람 음성 박테리아 숙주 세포로부터 회수된 관심 있는 온전한, 가용성 및/또는 활성 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
  73. 제72항에 있어서, 온전한, 가용성 및/또는 활성 재조합 단백질의 측정된 수율이 약 0.1 내지 약 10 g/ℓ인 방법.
  74. 제72항 또는 제73항에 있어서, (c) 대조군 세포로부터 회수된 온전한, 가용성, 활성 또는 이들의 조합인 관심 있는 재조합 단백질의 수율을 측정하는 단계를 추가로 포함하는 방법.
  75. 제74항에 있어서, (d) 단계 (b)에서 측정된 수율을 단계 (c)에서 측정된 수율과 비교하는 단계를 추가로 포함하는 방법.
  76. 제75항에 있어서, 단계 (b)에서 측정된 수율이 단계 (c)에서 측정된 수율보다 약 2배 내지 약 100배 더 높은 것인 방법.
  77. 제70항 내지 제76항 중 어느 한 항에 있어서, 재조합 그람 음성 박테리아 숙주 세포 및 대조군 세포가 각각
    (i) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성이 결핍되어 있고 제2 프로테아제가 기능적인 상응하는 그람 음성 박테리아 숙주 세포;
    (ii) 제1 프로테아제 활성, 제2 프로테아제 활성 및 2(a)에 언급된 추가 프로테아제 활성이 결핍된 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포에 결핍된 2(a)의 추가 프로테아제 활성이 기능적인 상응하는 그람 음성 박테리아 숙주 세포; 및
    (iii) 제1 프로테아제 활성 및 제2 프로테아제 활성이 결핍되어 있고, 서열번호 5로 제시된 아미노산 서열을 가진 MepS1; 서열번호 5로 제시된 아미노산 서열을 가진 MepS1의 상동체; 또는 서열번호 5로 제시된 슈도모나스 플루오레센스 MepS1 아미노산 서열과 적어도 50% 서열 유사성을 가진 MepS1 관련 단백질인 기능성 프로테아제를 포함하는 재조합 그람 음성 박테리아 숙주 세포, 및 제1 프로테아제 및 제2 프로테아제의 활성이 결핍되어 있고 비교된 재조합 그람 음성 박테리아 숙주 세포의 기능성 프로테아제가 결핍된 상응하는 그람 음성 박테리아 숙주 세포
    로부터 선택되는 것인 방법.
  78. 제1항 내지 제45항 및 제47항 내지 제77항 중 어느 한 항에 있어서, 이. 콜라이가 아닌 재조합 그람 음성 박테리아 숙주 세포.
  79. 관심 있는 이종 단백질 또는 폴리펩티드에 작동 가능하게 연결된 분비 신호 펩티드를 포함하는 재조합 폴리펩티드로서, 분비 신호 펩티드가 서열번호 11로 제시된 아미노산 서열을 가진 것인 재조합 폴리펩티드.
  80. 제79항에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 재조합 폴리펩티드.
  81. 제79항 또는 제80항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머(concatemer); F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 재조합 폴리펩티드.
  82. 제80항 또는 제81항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 재조합 폴리펩티드.
  83. 제80항에 있어서, 효소가 치료 효소인 재조합 폴리펩티드.
  84. 제83항에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제(uricase); 로다나제(rhodanase); 유로키나제(urokinase); 스트렙토키나제(streptokinase); 스타필로키나제(staphylokinase); 페닐라제(phenylase); 사크로시다제(sacrosidase); 라이소자임(lysozyme); 키티나제(chitinase); 리보뉴클레아제(ribonuclease); 글루타미나제(glutaminase); 아르기나제(arginase); 비브릴라제(vibrilase); 콘드로이티나제(chondroitinase); 히알루로니다제(hyaluronidase); 갈락토시다제(galactosidase); 글루쿠로니다제(glucuronidase); 글루코세레브로시다제(glucocerebrosidase); 티미딘 포스포릴라제(phosphorylase); 카보닉 안하이드라제(carbonic anhydrase); 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제(sulfurtransferase); 포스포티오에스터라제(phosphothioesterase); 알코올 산화효소; 알코올 데하이드로게나제(dehydrogenase); 아스파라기나제(asparaginase); 글루타민 합성효소; 아데노신 데아미나제(deaminase); 소 페가데마제(pegademase); 알글루세라제(alglucerase); 도르나제(dornase) 알파; 이미글루세라제(imiglucerase); 사크로시다제(sacrosidase); 라스부리카제(rasburicase); 아갈시다제(agalsidase) 베타; 및 낫토키나제(nattokinase)로부터 선택되는 것인 재조합 폴리펩티드.
  85. 제80항에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 재조합 폴리펩티드.
  86. 제79항 내지 제85항 중 어느 한 항에 있어서, 링커를 추가로 포함하는 재조합 폴리펩티드.
  87. 제79항 내지 제86항 중 어느 한 항에 있어서, 절단 도메인을 추가로 포함하는 재조합 폴리펩티드.
  88. 제79항 내지 제87항 중 어느 한 항에 있어서, 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질 또는 세포외 공간으로 유도하는 것인 재조합 폴리펩티드.
  89. 제88항에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 재조합 폴리펩티드.
  90. 제88항에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 재조합 폴리펩티드.
  91. 제89항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스(V. natriegens) 또는 이. 콜라이인 재조합 폴리펩티드.
  92. 제90항에 있어서, 그람 양성 박테리아가 코리네박테리움(Corynebacterium) 또는 바실러스(Bacillus)인 재조합 폴리펩티드.
  93. 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법으로서, 세포 배양 생장 배지에서 배양된 원핵 숙주 세포의 주변세포질에서 관심 있는 단백질 또는 폴리펩티드를 생성하는 단계를 포함하고, 상기 원핵 숙주 세포가 관심 있는 단백질 또는 폴리펩티드의 발현을 원핵 숙주 세포의 주변세포질로 유도하는 분비 신호 펩티드에 작동 가능하게 연결된 관심 있는 단백질 또는 폴리펩티드를 포함하는 재조합 폴리펩티드를 코딩하는 핵산을 포함하는 발현 구축물을 포함하고, 상기 분비 신호 펩티드가 서열번호 11의 아미노산 서열을 포함하고, 상기 분비 신호 펩티드가 관심 있는 단백질 또는 폴리펩티드에 대한 천연 분비 신호 펩티드가 아닌 것인 원핵 숙주 세포에서 관심 있는 단백질 또는 폴리펩티드를 제조하는 방법.
  94. 제93항에 있어서, 생성된 관심 있는 단백질 또는 폴리펩티드를 단리하는 단계를 추가로 포함하는 방법.
  95. 제94항에 있어서, 관심 있는 단백질 또는 폴리펩티드가 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체; 효소; 사이토카인; 케모카인; 성장 인자; 융합 단백질; 및 백신 항원으로부터 선택되는 것인 방법.
  96. 제95항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 단일클론 항체; 전체 쇄 항체; 상보성 결정 영역(CDR) 단편; CDR 이식 항체; 단일 쇄 항체; 단일 쇄 항체 단편; 변형된 항체; 가변 영역 단독 항체 단편; 이중특이적 항체, 키메라 항체; 트리아바디; 테트라바디; 미니바디; 선형 항체; 킬레이팅 재조합 항체; 비바디; 디바디; 인트라바디; 나노바디; 소형 모듈식 면역약제; 항원 결합 도메인 면역글로불린 융합 단백질; 낙타류 항체; 상어 단일 도메인 항체(VNAR); 조류 항체; VHH; VHH 함유 항체; VHH 콘카타머; F(ab); F(ab)'; F(ab)'2; scFv; 항체의 중쇄 불변 영역으로부터 생성된 Fc 단편; 환원된 IgG 단편; Fc 융합 단백질; 도메인 항체; VL; 및 VH로부터 선택되는 것인 방법.
  97. 제95항 또는 제96항에 있어서, 항체, 항체 단편, 또는 항체 또는 항체 단편의 유도체가 인간화된 것인 방법.
  98. 제95항에 있어서, 효소가 치료 효소인 방법.
  99. 제98항에 있어서, 치료 효소가 펩티다제; 락타제; 아밀라제; PEP; 소화 효소; 유리카제; 로다나제; 유로키나제; 스트렙토키나제; 스타필로키나제; 페닐라제; 사크로시다제; 라이소자임; 키티나제; 리보뉴클레아제; 글루타미나제; 아르기나제; 비브릴라제; 콘드로이티나제; 히알루로니다제; 갈락토시다제; 글루쿠로니다제; 글루코세레브로시다제; 티미딘 포스포릴라제; 카보닉 안하이드라제; 유리카제 티오설페이트-시아나이드; 설퍼트랜스퍼라제; 포스포티오에스터라제; 알코올 산화효소; 알코올 데하이드로게나제; 아스파라기나제; 글루타민 합성효소; 아데노신 데아미나제; 소 페가데마제; 알글루세라제; 도르나제 알파; 이미글루세라제; 사크로시다제; 라스부리카제; 아갈시다제 베타; 및 낫토키나제로부터 선택되는 것인 방법.
  100. 제95항에 있어서, 융합 단백질이 효소 융합 단백질; 단백질 A 융합 단백질; 알부민 융합 단백질; 티오레독신 융합 단백질; 유비퀴틴 융합 단백질; 스트렙트아비딘 융합 단백질; 말토스 결합 단백질 융합 단백질; 키틴 단백질 융합 단백질; SUMO 융합 단백질; 및 글루타티온-S-트랜스퍼라제 융합 단백질로부터 선택되는 것인 방법.
  101. 제93항 내지 제100항 중 어느 한 항에 있어서, 핵산이 링커를 코딩하는 것인 방법.
  102. 제101항에 있어서, 링커가 절단 도메인을 포함하는 것인 방법.
  103. 제93항 내지 제102항 중 어느 한 항에 있어서, 원핵 숙주 세포가 그람 음성 박테리아인 방법.
  104. 제93항 내지 제102항 중 어느 한 항에 있어서, 원핵 숙주 세포가 그람 양성 박테리아인 방법.
  105. 제93항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스, 또는 이. 콜라이인 방법.
  106. 제94항에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 방법.
  107. 제79항 내지 제92항 중 어느 한 항의 재조합 폴리펩티드를 코딩하는 핵산 서열을 포함하는 발현 벡터.
  108. 제107항의 발현 벡터를 포함하는 원핵 숙주 세포.
  109. 제108항에 있어서, 그람 음성 박테리아인 원핵 숙주 세포.
  110. 제108항에 있어서, 그람 양성 박테리아인 원핵 숙주 세포.
  111. 제109항에 있어서, 그람 음성 박테리아가 슈도모나드, 비브리오 나트리겐스 또는 이. 콜라이인 원핵 숙주 세포.
  112. 제110항에 있어서, 그람 양성 박테리아가 코리네박테리움 또는 바실러스인 원핵 숙주 세포.
  113. 제108항 내지 제112항 중 어느 한 항에 있어서, 재조합 폴리펩티드를 코딩하는 핵산 서열이 원핵 숙주 세포에서 발현되도록 최적화된 것인 원핵 숙주 세포.
  114. 원핵 숙주 세포의 주변세포질 또는 세포외 공간에서 관심 있는 단백질 또는 폴리펩티드를 발현시키기 위한, 제79항 내지 제92항 중 어느 한 항의 재조합 폴리펩티드, 제107항의 발현 벡터, 또는 제108항 내지 제113항 중 어느 한 항의 원핵 숙주 세포의 용도.
KR1020247000858A 2021-06-10 2022-06-09 재조합 단백질 발현을 위한 박테리아 숙주 KR20240021234A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163209239P 2021-06-10 2021-06-10
US63/209,239 2021-06-10
PCT/US2022/032911 WO2022261377A1 (en) 2021-06-10 2022-06-09 Bacterial hosts for recombinant protein expression

Publications (1)

Publication Number Publication Date
KR20240021234A true KR20240021234A (ko) 2024-02-16

Family

ID=84425490

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247000858A KR20240021234A (ko) 2021-06-10 2022-06-09 재조합 단백질 발현을 위한 박테리아 숙주

Country Status (4)

Country Link
US (1) US20230100757A1 (ko)
EP (1) EP4352219A1 (ko)
KR (1) KR20240021234A (ko)
WO (1) WO2022261377A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6551795B1 (en) * 1998-02-18 2003-04-22 Genome Therapeutics Corporation Nucleic acid and amino acid sequences relating to pseudomonas aeruginosa for diagnostics and therapeutics
AU2005269527B2 (en) * 2004-07-26 2011-12-01 Pfenex Inc. Process for improved protein expression by strain engineering
DK3227455T3 (da) * 2014-12-01 2023-08-21 Pfenex Inc Fusionspartnere til peptidfremstilling
AU2017260277A1 (en) * 2016-05-06 2018-11-22 Glaxosmithkline Intellectual Property Development Limited Method of producing a recombinant protein
CA3168586A1 (en) * 2017-09-28 2019-04-04 Lanzatech, Inc. Genetic knockouts in wood-ljungdahl microorganisms

Also Published As

Publication number Publication date
US20230100757A1 (en) 2023-03-30
EP4352219A1 (en) 2024-04-17
WO2022261377A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
EP2553102B1 (en) High level expression of recombinant toxin proteins
KR101530395B1 (ko) 향상된 수율 및(또는) 품질로 이종 단백질을 발현하는 특정 균주를 동정하기 위해 미생물 숙주를 신속히 스크리닝하는 방법
US11377661B2 (en) Method for production of recombinant Erwinia asparaginase
AU2010201410B2 (en) High level expression of recombinant CRM197
US11046964B2 (en) Method for production of recombinant E. coli asparaginase
KR20200073280A (ko) 주변세포질 단백질 발현을 위한 박테리아 리더 서열
KR20240021234A (ko) 재조합 단백질 발현을 위한 박테리아 숙주
CN111278979B (zh) 重组大肠杆菌天冬酰胺酶的生产方法