KR20210096175A - 거미 실크 단백질의 알칼리 정제 - Google Patents

거미 실크 단백질의 알칼리 정제 Download PDF

Info

Publication number
KR20210096175A
KR20210096175A KR1020217019694A KR20217019694A KR20210096175A KR 20210096175 A KR20210096175 A KR 20210096175A KR 1020217019694 A KR1020217019694 A KR 1020217019694A KR 20217019694 A KR20217019694 A KR 20217019694A KR 20210096175 A KR20210096175 A KR 20210096175A
Authority
KR
South Korea
Prior art keywords
gly
ala
ser
gln
spider silk
Prior art date
Application number
KR1020217019694A
Other languages
English (en)
Inventor
필립 무이
리투 반살 무탈리크
시몬 리
스콧 찬
Original Assignee
볼트 쓰레즈, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 볼트 쓰레즈, 인크. filed Critical 볼트 쓰레즈, 인크.
Publication of KR20210096175A publication Critical patent/KR20210096175A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/145Extraction; Separation; Purification by extraction or solubilisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/34Extraction; Separation; Purification by filtration, ultrafiltration or reverse osmosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/36Extraction; Separation; Purification by a combination of two or more processes of different types
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08HDERIVATIVES OF NATURAL MACROMOLECULAR COMPOUNDS
    • C08H1/00Macromolecular products derived from proteins
    • C08H1/06Macromolecular products derived from proteins derived from horn, hoofs, hair, skin or leather
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L89/00Compositions of proteins; Compositions of derivatives thereof
    • C08L89/04Products derived from waste materials, e.g. horn, hoof or hair
    • C08L89/06Products derived from waste materials, e.g. horn, hoof or hair derived from leather or skin, e.g. gelatin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Insects & Arthropods (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Water Supply & Treatment (AREA)
  • Microbiology (AREA)
  • Polymers & Plastics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Dermatology (AREA)
  • Materials Engineering (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Artificial Filaments (AREA)

Abstract

본 명세서는 합성 블록 공중합체 단백질, 이들의 분비를 위한 발현 구조체, 이들의 생산을 위한 재조합 미생물, 그리고 천연 실크의 많은 속성을 되풀이하는 이들 단백질을 포함하는 합성 섬유를 생산 및 정제하는 방법에 관한 것이다.

Description

거미 실크 단백질의 알칼리 정제
관련된 출원
본 출원은 2018년 11월 28일 출원된 미국 가특허 출원 제 62/772,588에 대한 우선권 및 이익을 주장하며, 이 출원의 내용은 본 명세서에 그 전문이 참고문헌에 편입된다.
서열 목록
본 출원은 EFS-Web을 통하여 제출된 서열 목록을 함유하며, 이의 전문이 본 명세서의 참고자료에 편입된다. 20XX년 XX월 XX일자로 생성된 전술한 ASCII 복사본의 파일명은 XXXXXUS_sequencelisting.txt이며, X,XXX,XXX 바이트 크기이다.
발명의 배경
거미의 실크 폴리펩티드는 큰 (>150kDa, >1000개의 아미노산) 폴리펩티드로써, 이는 다음과 같이 3개의 도메인으로 분류될 수 있다: N-말단 비-반복성 도메인 (NTD), 반복 도메인 (REP), 그리고 C-말단 비-반복성 도메인 (CTD). 상기 NTD 및 CTD는 상대적으로 작고 (차례로 ~150개, ~100개의 아미노산), 잘-연구된, 그리고 응집(aggregation)될 때, 해당 폴리펩티드에게 수성 안정성, pH 민감도, 및 분자 정렬을 부여하는 것으로 간주된다. NTD는 또한 강력하게 예측되는 분비 태그 (tag)를 보유하며, 이 태그는 이종성(heterologous) 발현 동안 대개 제거된다. 상기 반복성 영역은 천연 폴리펩티드 ~90%를 포함하며, 결정질 영역과 무정형 영역으로 폴딩되는데, 이들은 차례로 해당 실크 섬유에 강도 및 유연성을 부여한다.
실크 폴리펩티드는 벌, 나방, 거미, 진드기 및 기타 절지 동물을 비롯한 다양한 공급원으로부터 유래된다. 일부 유기체는 독특한 서열, 구조적 요소 및 기계적 속성을 가진 다양한 실크 섬유를 만든다. 예를 들면, 무당거미(orb weaving spiders)에는 환경 또는 라이프 사이클에 맞게 조정된 섬유로 중합되는 상이한 실크 폴리펩티드 서열을 생성하는 6 가지 독특한 유형의 선(glands)이 있다. 섬유는 이 섬유의 공급원이 되는 선(gland)의 이름으로 명명되어, 해당 폴리펩티드는 선(gland)의 약어 (예를 들면, "Ma") 및 스피드로인(spidroin: 거미 피브로인을 간단하게 부르는 말)의 경우 "Sp"로 표시된다. 무당 거미(orb weavers)에서, 이들 유형에는 메이져 엠풀레이트(Major Ampullate) (MaSp, 또한 드라글린(dragline)이라고도 불림), 마이너 엠풀레이트(Minor Ampullate) (MiSp), 플라겔리롬(Flagelliform) (Flag), 아시니폼(Aciniform) (AcSp), 튜불리폼(Tubuliform) (TuSp), 및 Pyriform (PySp)이 내포된다. 섬유 유형, 도메인 그리고 유기체의 다른 속 및 종 간의 변이에 걸친 이러한 폴리펩티드 서열의 조합은 해당 재조합 섬유의 상업적 생산에 의해 이용될 수 있는 광범위한 잠재적 특성을 이끌어낸다. 현재까지, 재조합 실크에 대한 대부분의 작업은 Major Ampullate Spidroins (MaSp)에 집중되었다.
현재, 재조합 실크 섬유는 시판되지 않으며, 몇 가지 예외를 제외하고는 대장균(Escherichia coli) 및 기타 그람-음성 원핵생물 이외의 미생물에서 생산되지 않는다. 현재까지 생산된 재조합 실크는 중합된 짧은 실크 서열 모티프 또는 토종(native) 반복 도메인의 단편들로 대개 구성되어 있으며, 때로는 NTDs 및/또는 CTDs와 복합되어 있다. 이것은 세포 내 발현, 그리고 크로마토그래피 또는 벌크(bulk) 침전에 의한 정제를 사용하여 생산된 (실험실 규모에서 밀리그램으로, 생물공정 규모에서 킬로그램으로) 소규모의 재조합 실크 폴리펩티드를 생산하게 되었다. 이러한 방법들은 기존의 기술 섬유 및 직물 섬유의 가격과 경쟁할 수 있는 상업적으로 성공적인 확장성을 이끌지 못한다. 실크 폴리펩티드를 만드는 데 사용된 추가 생산 숙주에는 유전자삽입된(transgenic) 염소, 유전자삽입된 누에 및 식물이 내포된다. 이러한 숙주로는 아마도 느린 공작 주기와 열악한 확장 성으로 인해, 아직 상업적 규모의 실크 생산이 요원하다.
추가적으로, 재조합 실크 폴리펩티드는 생산 및 정제 동안 바람직하지 않은 불용성 응집체(aggregates)를 형성한다. 정제 과정에서 펩티드를 재-가용화시키는 방법은 해당 단백질을 대개 분해시키고, 이로 인하여 수율은 낮아지고, 점착력(tenacity)이 낮고, 촉감이 나쁜 섬유가 만들어지게 된다. 또한, 표준 단백질 가용화 방법은 우레아, 구아니딘-HCl 또는 구아니딘 티오시아네이트와 같은 카오트로프(chaotropes)를 사용해야 하며, 이것은 단백질 단리 후 반드시 수거해야 하고, 적절하게 폐기되어야 한다. 따라서, 지속 가능하고 환경-친화적인 공정으로 이러한 폴리펩티드를 정제시키는 개선된 방법이 필요하다.
본 발명의 요약
한 측면에서, 숙주 세포 배양물로부터 재조합 거미 실크 단백질을 단리하는 방법들이 본원에 제공되며, 이 방법은 세포 배양물을 수득하고 (이때 전술한 세포 배양물은 숙주 세포와 정상 배지를 포함하며, 전술한 숙주 세포는 재조합 거미 실크 단백질을 발현시키고), 전술한 재조합 거미 실크 단백질이 포함된 전술한 세포 배양물의 일부를 수거하고, 알칼리 조건 하에 수성 용액에서 전술한 세포 배양물의 전술한 일부분을 항온처리하고, 이로 인하여 전술한 수성 용액에 전술한 재조합 거미 실크 단백질이 가용화되고, 그리고 전술한 수성 용액으로부터 해당 재조합 거미 실크 단백질을 단리해내고, 이로 인하여 단리된 재조합 거미 실크 단백질 샘플이 만들어진다.
일부 구체예들에서, 상기 알칼리 조건은 알칼리 pH 9 ~ 14를 포함한다. 한 구체예에서, 상기 알칼리 pH는 11 ~ 12이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질이다. 한 구체예에서, 상기 단리된 재조합 거미 실크 단백질 샘플은 단리된 전체 재조합 거미 실크 단백질과 비교하였을 때, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95%의 전장의 재조합 거미 실크 단백질을 포함한다. 한 구체예에서, 전장의 재조합 거미 실크 단백질의 상기 백분율은 웨스턴(Western) 블랏에 의해 측정된다. 또다른 구체예에서, 전장의 재조합 거미 실크 단백질의 상기 백분율은 크기 압출 크로마토그래피(Size Exclusion Chromatography)에 의해 측정된다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%이다. 일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 수율은 우레아 또는 구아니딘 티오시아네이트 방법에 의해 단리된 재조합 거미 실크와 비교하였을 때, 적어도 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%이다.
일부 구체예들에서, 상기 재조합 거미 실크 단백질의 단리는 전술한 수성 용액의 전술한 알칼리 조건을 변경시킴으로써, 당해 재조합 거미 실크 단백질을 침전시키는 것을 포함한다. 한 구체예에서, 전술한 알칼리 조건의 변경에는 상기 세포 배양물의 일부분의 알칼리 pH를 4 ~ 10의 낮은 pH로 조정하는 것을 포함한다. 한 구체예에서, 상기 낮아진 pH는 pH 4, 5, 6, 7, 8, 9, 또는 10이다. 한 구체예에서, 상기 낮아진 pH는 pH 6 ~ 7이다.
일부 구체예들에서, 알칼리 pH의 조정은 산을 상기 수성 용액에 첨가시키는 것을 포함한다. 한 구체예에서, 상기 산은 H2SO4이다.
일부 구체예들에서, 전술한 세포 배양물의 일부분은 상청액, 전체 세포 브로스(broth), 또는 세포 펠렛을 포함한다. 일부 구체예들에서, 전술한 세포 배양물의 전술한 일부분의 수거는 전술한 정상 배지로부터 전술한 숙주 세포를 빼내고, 그리고 전술한 수성 용액에 전술한 숙주 세포를 재구성시키는 것을 포함한다.
일부 구체예들에서, 전술한 세포 배양물의 전술한 일부분의 수거는 전술한 숙주 세포의 용해를 포함한다. 다양한 구체예들에서, 용해에는 열처리, 전단 파괴(shear disruption), 물리적 균질화, 초음파처리 또는 화학적 균질화가 포함된다.
일부 구체예들에서, 전술한 세포 배양물의 전술한 일부분은 전술한 세포 배양물로부터 유래된 전술한 숙주 세포와 전술한 정상 배지를 포함한다.
다양한 구체예들에서, 전술한 수성 용액은 희석된 정상 배지를 포함한다.
일부 구체예들에서, 이때 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 10 ~ 120 분 동안 실행된다. 일부 구체예들에서, 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 적어도 10 분, 적어도 15 분, 적어도 30 분, 적어도 45 분, 적어도 60 분, 적어도 75 분, 적어도 90 분, 적어도 105 분, 또는 적어도 120 분 동안 실행된다. 일부 구체예들에서, 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 15 분 ~ 30 분 동안 실행된다.
다양한 구체예들에서, 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 해당 세포 배양물의 일부분의 교반을 추가 포함한다.
다양한 구체예들에서, 상기 방법은 알칼리 조건 하에서 전술한 수성 용액으로부터 가용화안된 바이오메스(biomass)를 제거하는 작업을 추가 포함한다. 일부 구체예들에서, 상기 가용화안된 바이오메스의 제거에는 여과, 원심 분리, 중력에 의한 가라앉힘(gravitational settling), 흡착, 투석, 또는 상 분리가 포함된다. 일부 구체예들에서, 상기 여과는 한외여과(ultrafiltration), 정밀여과(microfiltration), 또는 투석여과이다. 일부 구체예들에서, 이때 상기 가용화안된 바이오메스의 제거는 적어도 한 번 반복된다.
다양한 구체예들에서, 상기 방법은 해당 재조합 거미 실크 단백질의 단리 전, 또는 해당 재조합 거미 실크 단백질의 단리 후 불순물을 제거하는 작업을 추가 포함한다. 일부 구체예들에서, 상기 불순물 제거는 여과, 원심분리, 중력에 의한 가라앉힘, 흡착, 투석, 또는 상 분리를 포함한다. 다양한 구체예들에서, 상기 여과는 한외여과, 정밀여과, 또는 투석여과이다. 일부 구체예들에서, 상기 원심분리는 초원심분리 또는 투석원심분리(diacentrifugation)이다. 한 구체예에서, 상기 흡착은 숯 흡착이다. 일부 구체예들에서, 불순물 제거는 적어도 한 번 반복된다.
다양한 구체예들에서, 상기 방법은 해당 단리된 재조합 거미 실크 단백질을 농축시켜 농축된 거미 실크 단백질을 만드는 작업을 추가 포함한다. 일부 구체예들에서, 농축은 침전, 여과, 한외여과, 원심분리, 투석, 증발, 또는 동결건조를 포함한다.
다양한 구체예들에서, 상기 방법은 상기 단리된 재조합 거미 실크 단백질의 건조 작업을 더 포함한다.
다양한 구체예들에서, 상기 방법은 상기 단리된 재조합 거미 실크로부터 실크 섬유를 만드는 작업을 더 포함한다. 한 구체예에서, 전술한 실크 섬유는 적어도 19 cN/tex의 점착력을 포함한다.
일부 구체예들에서, 전술한 재조합 거미 실크 단백질은 18B 또는 P0이다.
일부 구체예들에서, 상기 세포 배양물은 곰팡이 세포, 박테리아 세포 또는 효모 세포를 포함한다.
일부 구체예들에서, 상기 효모 세포는 피치아 파스토리스(pichia pastoris) 세포다.
또다른 측면에서, 숙주 세포 배양물로부터 재조합 거미 실크 단백질을 단리하는 방법들이 본원에 제공되며, 이 방법은 세포 배양물을 수득하고 (이때 전술한 세포 배양물은 숙주 세포와 정상 배지를 포함하며, 전술한 숙주 세포는 재조합 거미 실크 단백질을 발현시키고), 전술한 재조합 거미 실크 단백질이 포함된 전술한 세포 배양물의 일부를 수거하고, 알칼리 조건 하에 수성 용액에서 전술한 세포 배양물의 전술한 일부분을 항온처리하고, 이로 인하여 전술한 수성 용액에 전술한 재조합 거미 실크 단백질을 가용화시키고, 상기 수성 용액을 비-알칼리 pH로 조정하고, 이로 인하여 전술한 가용화된 재조합 거미 실크 단백질이 침전되며, 그리고 세포 배양물의 전술한 일부분으로부터 상기 재조합 거미 실크 단백질을 단리시키고, 이로 인하여 단리된 재조합 거미 실크 단백질이 만들어진다.
또다른 측면에서, 상기 기재된 방법들중 임의의 한 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 조성물이 본원에서 제공된다.
일부 구체예들에서, 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%의 전장의 재조합 거미 실크를 포함한다.
또다른 측면에서, 상기 기재된 방법들중 임의의 한 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 실크 섬유가 본원에서 제공된다.
일부 구체예들에서, 상기 실크 섬유는 적어도 19 cN/tex의 점착력을 포함한다.
또다른 측면에서, 정상 배지와 알칼리 완충 용액 안에 재조합 거미 실크 단백질을 포함하는 숙주 세포를 포함하는 새포 배양물을 포함하는 조성물이 본원에 제공된다.
한 구체예에서, 상기 알칼리 완충 용액은 pH 9 ~ 14를 갖는다. 또다른 구체예에서, 상기 pH는 11 ~ 12이다.
일부 구체예들에서, 상기 거미 실크 단백질은 18B 또는 P0이다. 일부 구체예들에서, 상기 세포 배양물은 곰팡이 세포, 박테리아 세포 또는 효모 세포를 포함한다. 한 구체예에서, 상기 박테리아 세포는 대장균(E. coli) 세포이다. 한 구체예에서, 상기 효모 세포는 피치아 파스토리스(pichia pastoris) 세포이다.
도면의 몇 가지 관점에 대한 간략한 설명
도 1에서는 세포 상청액으로부터 재조합 거미 실크 단백질을 단리시키는 예시적인 공정 흐름을 보여준다.
도 2에서는 세포 용해물로부터 재조합 거미 실크 단백질을 단리시키는 예시적인 공정 흐름을 보여준다.
도 3에서는 재조합 거미 실크 단백질을 카오트로프(chaotrope)를 이용하여 단리시키는 예시적인 공정 흐름을 보여준다.
도 4A에서는 알칼리 pH 완충제를 이용하여 세포 펠렛으로부터 단리된 18B 거미 실크 정제 단백질의 크기 압출 크로마토그래피 (SEC) 분석을 보여준다. 상기 18B 단량체 피크는 화살표로 나타낸다. 도 4B에서는 우레아 추출 방법 또는 상기 알칼리 추출 방법을 이용하여 정제된 18B 거미 실크의 양과 순도를 비교한 것을 보여준다.
도 5에서는 접선 흐름 여과 (TFF) 후 SEC에 의해 측정하였을 때, 정제된 18B 거미 실크 단량체 및 불순물의 면적 %를 보여준다.
도 6A에서는 두-단계 추출 후, 18B 거미 실크 단백질의 총 수율을 보여준다. 두 가지 상이한 실행 결과를 나타낸다. 도 6B에서는 두-단계 추출 후, SEC 면적 백분율에 의해 측정하였을 때 18B 순도를 나타낸다.
도 7A에서는 전체 세포 브로스의 알칼리 추출 후, 18B 단량체, 낮은 분자량 (LMW), 그리고 중간-분자량 (IMW) 불순물의 면적 %를 나타낸다. 상기 추출된 단백질은 접선 흐름 여과에 의해 농축되었다. 도 7B에서는 회수된 18B 거미 실크 단백질의 SEC 분석을 보여준다. 다양한 접선 흐름 여과 분취물(fractions)의 18B 단량체 피크는 화살표로 나타낸다.
도 8에서는 전체 세포 브로스의 알칼리 추출 및 pH 침전 후, 18B 단량체, 고-분자량(HMW), 낮은 분자량 (LMW), 그리고 중간-분자량 (IMW) 불순물의 면적 %를 나타낸다. 상기 추출된 단백질은 투석원심분리에 의해 농축되었다.
도 9에서는 전체 세포 브로스의 알칼리 추출 및 pH 침전 후, 18B 단량체의 수율%를 나타낸다. 상기 추출된 단백질은 투석원심분리에 의해 농축되었다.
도 10에서는 pH 6에서 산 침전 후, 정제된 18B 거미 실크 단백질의 SEC 분석을 보여준다. 상기 18B 단량체 피크는 화살표로 나타낸다. 상기 추출된 단백질은 투석원심분리에 의해 농축되었다.
도 11에서는 다양한 pH 완충제 또는 우레아를 이용하여 대장균(E. coli) 용해물로부터 추출 후, 가용성 P0 단백질의 면역블랏(immunoblot)을 보여준다.
발명의 상세한 설명
정의
본 명세서에 달리 정의되지 않는 한, 본 발명과 관련하여 사용되는 과학 및 기술 용어들은 해당 분야의 숙련된 기술자들이 통상적으로 이해하는 의미를 가져야 한다. 더욱이, 내용에서 달리 필요하지 않는 한, 단수형 용어들은 복수형을 포함하며, 복수형 용어들은 단수형을 포함한다. 일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 폴리펩티드와 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.
본원에서 제공되는 방법 및 기술은 다른 언급이 없는 한, 일반적으로 당업계에 널리 공지된 통상적인 방법에 따라 실행되며, 그리고 본 명세서 전반에 걸쳐 인용되고 논의된 다양한 일반적이고 보다 구체적인 참고 문헌에 기재된 바와 같이 수행된다. 예를 들면, Sambrook et al., Molecular Cloning: Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002); Harlow and Lane, Antibodies: Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990); Taylor and Drickamer, Introduction to Glycobiology, Oxford Univ. Press (2003); Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, N.J.; Handbook of Biochemistry: Section Proteins, Vol I, CRC Press (1976); Handbook of Biochemistry: Section Proteins, Vol II, CRC Press (1976); Essentials of Glycobiology, Cold Spring Harbor Laboratory Press (1999) 참고.
본 명세서에 언급된 모든 간행물, 특허 및 다른 참고문헌들은 그 전문이 참고문헌으로 포함된다.
달리 언급이 없는 한, 하기 용어들은 다음과 같은 의미를 가지는 것으로 이해되어야 한다:
본원에 사용된 용어 "발효시키는(fermenting)" 및 "발효(fermentation)"는 숙주 세포가 성장하는 조건을 포함 하나, 이에 국한되지 않는 원하는 생성물을 생산하기 위한 조건 하에서 숙주 세포를 배양하는 것을 기술한다.
본원에서 사용된 용어 "발효 브로스(broth)"는 발효 동안 숙주 세포를 배양하는데 사용되는 수성 배지를 지칭한다.
본원에서 사용된 용어 "접종물(inoculum)"는 발효를 시작하기 위해 발효 브로스에 추가되는 숙주 세포의 양을 지칭한다.
본원에서 사용된 용어 "정화(clarifying)"란 숙주 세포 바이오메스, 이를 테면 온전체 세포, 용해된 세포, 막, 지질, 세포기관(organelles), 핵, 거미의 것이 아닌 실크 단백질, 또는 임의의 기타 바람직하지 않은 세포의 일부분 또는 산물, 또는 세포 배양물의 임의의 기타 바람직하지 않은 부분을 제거하는 방법을 지칭한다. 정화는 부분적으로 정제된 또는 단리된 거미 실크 조성물로부터 불순물 제거를 또한 지칭한다. 불순물에는 거미의 것이 아닌 실크 단백질, 분해된 거미 실크 단백질, 큰 단백질 응집체, 정제 공정 및 단리 공정 동안 이용된 화학물질, 또는 임의의 기타 바람직하지 않은 재료가 내포될 수 있으나, 이에 국한되지 않는다.
본원에서 사용된 용어 "순도(purity)"란 단리된 모든 성분의 일부분으로써, 전장의 단리된 재조합 거미 실크 단백질, 이를 테면 부분적으로 또는 분해된 단리된 재조합 거미 실크 단백질, 지질, 단백질, 막, 또는 샘플 안에 있는 기타 분자, 이를 테면 추출된 샘플을 지칭한다.
본원에서 사용된 용어 "수율(yield)"이란 대조군 샘플에 있는 전장의 실크 단백질 또는 총 실크 단백질의 양과 비교하여, 세포 배양물로부터 단리된 전장의 재조합 거미 실크 단백질의 양을 지칭한다. 백분율은 세포 용해물, 미정제(crude) 알칼리 추출 용액, 부분적으로 정제된 또는 여과된 알칼리 추출 용액, 알칼리 추출 방법을 받게 되는 정제된 용액 또는 대조군 추출 방법 이를 테면 우레아 또는 GdSCN(본원에서 기재된 바의)를 받게 되는 정제된 용액 안에 전장의 거미 실크 단백질의 총량에 관한 것일 수 있다.
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 최소한 10개 염기 길이의 뉴클레오티드의 폴리머 형태를 지칭한다. 상기 용어는 DNA 분자 (예를 들어, cDNA 또는 게놈 또는 합성 DNA) 및 RNA 분자 (예를 들어, mRNA 또는 합성 RNA) 뿐만 아니라 비-천연 뉴클레오티드 유사체, 비-고유 뉴클레오시드간 결합, 또는 둘 모두를 포함하는 DNA 또는 RNA의 유사체를 포함한다. 핵산은 임의의 토폴로지(topological) 입체형태일 수 있다. 예를 들면, 핵산은 단일-가닥, 이중-가닥, 삼중-가닥, 사중복합된(quadruplexed), 부분적 이중-가닥, 분지형, 헤어핀, 원형 또는 자물쇠(padlocked) 입체형태일 수 있다.
달리 지시되지 않는 한, 및 일반적인 형식 "서열 식별 번호:~"로 본 명세서에 기재된 모든 서열에 대한 예로서, "서열 식별 번호: 1을 포함하는 핵산"은 최소한 일부가 (i) 서열 식별 번호: 1의 서열, 또는 (ii) 서열 식별 번호: 1에 상보적인 서열을 가짐을 지칭한다. 둘 중 선택은 내용에 따라 결정된다. 예를 들어, 핵산이 프로브로 사용되는 경우, 둘 중 하나의 선택은 프로브가 원하는 표적에 상보적이어야 한다는 요건에 의해 결정된다.
"단리된(isolated)" RNA, DNA 또는 혼합 중합체는 천연 숙주 세포에서 고유 폴리뉴클레오티드와 자연적으로 수반되는 다른 세포 성분들, 예를 들어, 리보솜, 폴리머라제 및 자연적으로 관련된 게놈 서열로부터 실질적으로 분리된 것이다.
용어 "재조합(recombinant)"이란 (1) 자연 발생 환경으로부터 제거된 상태로 있거나, (2) 당해 유전자가 자연에서 발견되는 이의 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되지 않은 폴리뉴클레오티드에 작동가능하게 연결되거나, 또는 (4) 실제로는 발생하지 않는, 생물분자, 예를 들어, 유전자 또는 폴리펩티드를 의미한다. 용어 "재조합"은 클로닝된 DNA 분리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체뿐만 아니라 이러한 핵산에 의해 인코드된 폴리펩티드 및/또는 mRNA와 관련하여 사용될 수 있다.
본원에 이용된 바와 같이, 이종 서열이 유기체 게놈 내 내인성 핵산 서열 (또는 이러한 서열의 인코드된 폴리펩티드 산물)에 인접하여 배치되어, 이러한 내인성 핵산 서열의 발현이 변형되는 경우, 이러한 내인성 핵산 서열은 "재조합"으로 간주된다. 이와 관련하여, 이종 서열은 이종 서열 자체가 내인성인지 (동일한 숙주 세포 또는 이의 자손에서 유래한 것인지) 또는 외인성인지 (다른 숙주 세포 또는 이의 자손에서 유래한 것인지)에 관계없이, 내인성 핵산 서열에 자연적으로 인접하지 않는 서열이다. 예를 들어, 프로모터 서열은 숙주 세포의 게놈 내 유전자의 토종 프로모터로 대체될 수 있고 (예를 들어, 상동 재조합에 의해), 그 결과 이 유전자는 변경된 발현 패턴을 가진다. 이 유전자는 자연적으로 연접하는 서열들 중 최소한 일부로부터 분리되기 때문에, 이제 "재조합"이 될 것이다. 한 구체예에서, 이종성 핵산 분자는 해당 유기체에 대해 내인성이 아니다. 추가 구체예들에서, 이종성 핵산 분자는 상동성 또는 랜덤(random) 통합에 의해 숙주 염색체로 통합된 플라스미드 또는 분자다.
핵산은 또한 게놈 내 상응하는 핵산에서 자연적으로 발생하지 않는 임의의 변형을 함유하는 경우 "재조합"으로 간주된다. 예를 들어, 내인성 코딩 서열은, 예를 들어, 인간의 개입에 의해 인공적으로 도입된 삽입, 결실 또는 점 돌연변이를 함유하는 경우, "재조합"으로 간주된다. "재조합 핵산"은 또한 이종 부위에서 숙주 세포 염색체에 통합된 핵산 및 에피솜으로 존재하는 핵산 구조체를 포함한다.
핵산 서열과 관련하여, 용어 "서열 동일성 백분율" 이란 최대 대응하도록 두 서열을 정렬하였을 때, 해당 서열의 잔기의 정렬의 정량적 값을 지칭한다. 서열 동일성 비교의 길이는 적어도 약 9개의 뉴클레오티드, 일반적으로 적어도 약 20개의 뉴클레오티드, 보다 일반적으로 적어도 약 24개의 뉴클레오티드, 전형적으로 적어도 약 28개의 뉴클레오티드, 보다 전형적으로 적어도 약 32개의 뉴클레오티드, 및 바람직하게는 적어도 약 36개의 뉴클레오티드의 스트레치에 걸친 것일 수 있다. 뉴클레오티드 서열 동일성을 측정하는데 사용될 수 있는 해당 분야에 공지된 다수의 상이한 알고리즘이 존재한다. 예를 들어, 폴리뉴클레오티드 서열은 Wisconsin Package Version 10.0, Genetics Computer Group (GCG), Madison, Wis.의 프로그램인 FASTA, Gap 또는 Bestfit을 사용하여 비교될 수 있다. FASTA는 문제(query) 서열과 검색 서열간의 가장 잘 겹쳐지는 영역의 정렬 및 서열 동일성 백분율을 제공한다. Pearson, Methods Enzymol. 183:63-98 (1990) (본 명세서에 그 전문이 참고문헌으로 포함됨). 예를 들어, 핵산 서열들 사이의 서열 동일성 백분율은 기본 매개변수 (점수화 행렬에 대한 NOPAM 인자 및 워드 크기 6)의 FASTA를 사용하거나 본 명세서에 참고로 포함된 GCG Version 6.1에 제공된 바와 같은 기본 매개변수를 가지는 Gap을 사용하여 결정될 수 있다. 대안적으로, 서열들은 컴퓨터 프로그램, BLAST(Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet. 3:266-272 (1993); Madden et al., Meth. Enzymol. 266:131-141 (1996); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997); Zhang and Madden, Genome Res. 7:649-656 (1997)), 구체적으로 blastp 또는 tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997))를 사용하여 비교될 수 있다.
핵산 또는 이의 단편을 지칭할 때 용어 "실질적 상동성" 또는 "실질적 유사성"은 상기 논의한 FASTA, BLAST 또는 Gap과 같은 임의의 공지된 서열 동일성 알고리즘으로 측정시, 적절한 뉴클레오티드 삽입 또는 결실과 함께 또 다른 핵산 (또는 이의 상보적 가닥)과 최적으로 정렬될 경우, 최소한 약 76%, 80%, 85%, 바람직하게는 최소한 약 90%, 그리고 더욱 바람직하게는 최소한 약 95%, 96%, 97%, 98% 또는 99%의 뉴클레오티드 염기에서 뉴클레오티드 서열 동일성이 존재함을 의미한다.
핵산 (폴리뉴클레오티드로도 지칭됨)은 RNA, cDNA, 게놈 DNA, 및 상기의 합성 형태 및 혼합 중합체의 센스 및 안티센스 가닥 둘 모두를 포함할 수 있다. 이들은 화학적으로 또는 생화학적으로 변형될 수 있거나, 비-천연 또는 유도체화된 뉴클레오티드 염기를 함유할 수 있으며, 이를 해당 분야의 숙련된 기술자는 쉽게 이해할 것이다. 이러한 변형들에는 예를 들면, 라벨, 메틸화, 하나 또는 그 이상의 자연 발생 뉴클레오티드의 유사체로의 치환, 뉴클레오티드간 변형, 가령, 비하전된 링키지 (예컨대, 메틸 포스포네이트, 포스포트라이에스터, 포스포라미데이트, 카바메이트, 등), 하전된 링키지 (예컨대, 포스포로티오에이트, 포스포로디티오에이트, ), 부속 모이어티 (예컨대, 폴리펩티드), 층간삽입물 (예컨대, 아크리딘, 소랄렌, ), 킬레이터, 알킬레이터, 및 변형된 링키지 (예컨대, 알파 아노머 핵산 )가 내포된다. 또한 수소 결합 및 다른 화학적 상호 작용을 통해 지정된 서열에 결합하는 능력에서 폴리뉴클레오티드를 모방하는 합성 분자가 내포된다. 이러한 분자는 해당 분야에 공지되어 있으며, 예를 들어, 펩티드 링키지가 분자의 골격에서 포스페이트 링키지를 대체하는 분자들이 내포된다. 다른 변형은 예를 들어, 리보스 고리가 가교 모이어티 또는 다른 구조, 가령, "잠금(locked)" 핵산에서 발견되는 변형을 함유하는 유사체가 내포될 수 있다.
핵산 서열에 적용될 때 용어 "돌연변이된"이란 핵산 서열의 뉴클레오티드가 참조 핵산 서열과 비교하여 삽입, 결실 또는 변경될 수 있음을 의미한다. 유전자좌(locus)에서 단일 변경이 이루어질 수 있거나 (점 돌연변이), 또는 단일 유전자좌에서 다수의 뉴클레오티드가 삽입, 결실 또는 변경될 수 있다. 또한, 핵산 서열 내의 임의의 수의 유전자좌에서 하나 또는 그 이상의 변형이 이루어질 수 있다. 핵산 서열은 "에러-유발 PCR" (DNA 중합효소의 복제 충실도가 낮은 조건 하에서 PCR을 수행하기 위한 공정, 그 결과 PCR 생성물의 전체 길이를 따라 높은 비율의 점 돌연변이가 수득됨; 예를 들어, Leung et al., Technique, 1: 11-15 (1989) 및 Caldwell and Joyce, PCR Methods Applic. 2: 28-33 (1992) 참고); 그리고 "올리고뉴클레오티드-지정 돌연변이유발" (관심있는 임의의 클로닝된 DNA 단편에서 부위-특이적 돌연변이의 생성을 가능하게 하는 과정; 예를 들어, Reidhaar-Olson and Sauer, Science 241: 53-57 (1988) 참조)와 같은 돌연변이유발 기술을 내포된 (그러나 이에 제한되는 것은 아님) 해당 분야에 공지된 임의의 방법에 의해 돌연변이될 수 있다.
본 명세서에서 사용되는 용어 "벡터"는 그것이 연결되어 있는 또다른 핵산을 전달할 수 있는 핵산 분자를 지칭하고자 한다. 벡터의 한 유형은 "플라스미드"로서, 이는 일반적으로 추가 DNA 분절(segments)이 결찰될 수 있는 원형 이중 가닥 DNA 루프를 지칭하지만, 또한 선형 이중-가닥 분자, 가령, 중합효소 연쇄 반응 (PCR)에 의한 증폭으로 생성된 것 또는 원형 플라스미드를 제한절단 효소로 처리하여 생성된 것도 포함한다. 다른 벡터로는 코스미드, 박테리아 인공 염색체 (BAC) 및 효모 인공 염색체 (YAC)가 내포된다. 또다른 유형의 벡터는 바이러스성 벡터이며, 여기서 추가적인 DNA 분절은 바이러스 게놈에 결찰될 수 있다 (하기에서 더 상세히 논의됨). 특정 벡터는 이들이 도입되는 숙주 세포 (예를 들어, 숙주 세포에서 기능하는 복제 원점을 가지는 벡터)에서 자율 복제 가능하다. 다른 벡터는 숙주 세포로 도입될 때 숙주 세포의 게놈에 통합 될 수 있으며, 이로써 숙주 게놈과 함께 복제된다. 또한, 특정 바람직한 벡터는 이들이 작동가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터를 본 명세서에서 "재조합 발현 벡터" (또는 간단히 "발현 벡터")"라고 지칭한다.
본원에 이용된 바와 같이, 용어 "발현 시스템"에는 숙주 세포에서 유전자 발현을 위한 비히클 또는 벡터, 뿐만 아니라 숙주 염색체로 유전자의 안정적 통합을 야기하는 비히클 또는 벡터들이 내포된다.
"작동적으로 연결된" 또는 "작동가능하게 연결된" 발현 조절 서열은 발현 제어 서열이 관심대상 유전자와 인접해 있어 관심 유전자를 제어하는 링키지(linkage), 뿐만 아니라 트랜스(in trans)로 또는 일정 거리에서 작용하여 관심대상 유전자를 제어하는 발현 제어 서열을 지칭한다.
본원에 이용된 바와 같이 용어 "발현 제어 서열"은 작동적으로 연결된 코딩 서열들의 발현에 영향을 주는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 제어 서열은 핵산 서열들의 전사, 전사-후 사건 및 해독을 제어하는 서열이다. 발현 제어 서열에는 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 신호와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열; 번역 효율을 향상시키는 서열 (예를 들어, 리보솜 결합 부위); 폴리펩티드 안정성을 향상시키는 서열; 그리고 필요한 경우, 폴리펩티드 분비를 향상시키는 서열이 내포된다. 이러한 제어 서열의 성질은 숙주 유기체에 따라 다르다; 원핵 생물에서, 이러한 제어 서열은 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열이 내포된다. "제어 서열"이라는 용어는 최소한, 그 존재가 발현에 필수적인 모든 성분을 포함하며, 그 존재가 유리한 추가 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 포함할 수 있는 것으로 한다.
본원에 이용된 바와 같이, "프로모터"란 RNA 중합 효소가 결합하여 유전자 전사를 시작하는 DNA 영역을 말하며, mRNA 전사 시작 부위의 5' 방향에 위치한다.
본 명세서에서 사용된 용어 "재조합 숙주 세포" (또는 간단히 "숙주 세포")는 재조합 벡터가 도입된 세포를 지칭하는 것으로 한다. 이러한 용어는 특정 대상 세포 뿐만 아니라 그러한 세포의 자손을 의미하는 것으로 이해되어야 한다. 돌연변이 또는 환경적 영향으로 인해 특정 변형이 후손-세대에서 발생할 수 있기 때문에, 이러한 후손은 실제로 모 세포와 동일하지 않을 수 있지만, 본 명세서에 사용된 용어 "숙주 세포"의 범위 내에 여전히 내포된다. 재조합 숙주 세포는 배양하여 성장된 분리 세포 또는 세포주일 수 있거나, 또는 살아있는 조직 또는 유기체에 존재하는 세포일 수 있다.
용어 "폴리펩티드"는 자연-발생 및 비-자연 발생 단백질 모두, 그리고 이의 단편, 돌연변이체, 유도체 및 유사체를 포괄한다. 폴리펩티드는 단량체 또는 중합체일 수 있다. 또한, 폴리펩티드는 각각 하나 이상의 별개의 활성을 가지는 다수의 상이한 도메인을 포함할 수 있다.
본원에 이용된 바와 같이, 용어 "분자"란 작은 분자, 펩티드, 폴리펩티드, 당, 뉴클레오티드, 핵산, 폴리뉴클레오티드, 지질, 등등을 포함하나, 이에 국한되지 않은 임의의 화합물을 의미하고, 이러한 화합물은 천연 또는 합성 화합물일 수 있다.
본원에 이용된 바와 같이, 용어 "블록" 또는 "반복 단위"는 천연 실크 폴리펩티드에서 반복적으로 발견되고, 아마도 대단하지 않은 수준의 변이를 갖고, 전술한 실크 폴리펩티드 서열에서 기본 반복 단위로서 기능을 하는, 천연 실크 폴리펩티드의 대략 12 개 이상의 아미노산으로된 하위서열을 의미한다. 블록에는 매우 짧은 "모티프"가 내포될 수 있지만, 반드시 내포되어야 하는 것은 아니다. 본원에 이용된 바와 같이, "모티프"란 다양한 블록으로 나타나는, 대략적으로 2-10개 아미노산 서열을 지칭한다. 예를 들면, 모티프는 아미노산 서열 GGA, GPG, 또는 AAAAA로 구성될 수 있다. 복수개의 블록 서열은 "블록 공-중합체(co-polymer)"이다.
본원에 이용된 바와 같이, 용어 "반복 도메인"이란 실크 폴리펩티드에서 연접 (실질적인 비-반복성 도메인에 의해 중단되지 않고, 공지의 실크 스페이서 요소들은 배제) 반복성 분절 세트로부터 선택된 서열을 지칭한다. 토종 실크 서열은 일반적으로 한 개의 반복 도메인을 함유한다. 본 발명의 일부 구체예들에서, 실크 분자당 한 개의 반복 도메인이 있다. 본원에 이용된 바와 같이, "매크로-반복(macro-repeat)"이란 한 개 이상의 블록을 포함하는 천연 발생적 반복성 아미노산 서열이다. 한 구체예에서, 매크로-반복은 반복 도메인에서 적어도 두 차례 반복된다. 추가 구체예에서, 이러한 두 차례 반복은 불완전하다. 본원에 이용된 바와 같이 "준(quasi)-반복"은 한 개 이상의 블록을 포함하는 아미노산 서열이나, 이 블록들은 유사하지만, 동일한 아미노산 서열은 아니다.
본원에 이용된 바와 같이, "반복 서열" 또는 "R"이란 반복성 아미노산 서열을 지칭한다. 한 구체예에서, 반복 서열에는 매크로-반복 또는 매크로-반복의 단편이 내포된다. 또다른 구체예에서, 반복 서열에는 블록이 내포된다. 추가 구체예에서, 단일 블록은 두 개의 반복 서열로 분할된다.
본 명세서 및 첨부된 청구범위에서 사용되는, 단수형 "부정관사(a, an)" 및 "정관사(the)"는 문맥에서 달리 명확히 언급이 없는 한 복수형을 포함함을 유념하여야 한다.
여기에 개시된 임의의 범위는 해당 범위를 정의하는 수치를 내포한다. 예를 들면, 2-5% 범위에는 2% 및 5%, 그리고 이들 사이에 있는 임의의 수 또는 분획, 예를 들면: 2.25%, 2.5%, 2.75%, 3%, 3.25%, 3.5%, 3.75%, 4%, 4.25%, 4.5%, 그리고 4.75%이 내포된다.
재조합 거미 실크 조성물
몇 가지 유형들의 고유 거미 실크가 확인된 바 있다. 각각의 천연 방적 실크 유형의 기계적 속성은 그 실크의 분자 조성에 밀접하게 연결되어 있는 것으로 여겨진다. 예를 들면, Garb, J.E., et al., Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol., 10:243 (2010); Bittencourt, D., et al., Protein families, natural history and biotechnological aspects of spider silk, Genet. Mol. Res., 11:3 (2012); Rising, A., et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci., 68:2, pg. 169-184 (2011); 그리고 Humenik, M., et al., Spider silk: understanding the structure-function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci., 103, pg. 131-85 (2011) 참고. 예를 들면:
아시니폼 (AcSp) 실크는 적당히 높은 강도와 적당히 높은 신장성으로 인해 상당히 질긴 경향이 있다. AcSp 실크는 종종 폴리 세린 및 GPX의 모티프가 통합된 큰 블록 ("앙상블 반복") 크기를 특징으로 한다. 튜불리폼 (TuSp 또는 원통형) 실크는 보통의 강도 및 높은 탄력성으로 인해, 큰 직경을 가지는 경향이 있다. TuSp 실크는 폴리 세린 및 폴리 트레오닌 함량 및 짧은 폴리 알라닌 트랙을 특징으로 한다. 메이저 엠풀레이트 (MaSp) 실크는 높은 강도 및 보통의 탄력성을 가지는 경향이 있다. MaSp 실크는 다음 두 가지 아형들 중 하나 일 수 있다: MaSp1 및 MaSp2. MaSp1 실크는 일반적으로 MaSp2 실크보다 탄력성이 작고, 폴리 알라닌, GX, 및 GGX 모티프로 특징된다. MaSp2 실크는 폴리 알라닌, GGX, 및 GPX 모티프로 특징된다. 마이너 엠풀레이트 (MiSp) 실크는 보통의 강도 및 보통의 탄력성을 가지는 경향이 있다. MiSp 실크는 GGX, GA, 및 폴리 A 모티프로 특징되며, 종종 대략 100개 아미노산의 스페이서 요소들을 함유한다. 플라겔리폼 (Flag) 실크는 매우 높은 탄력성과 보통의 강도를 가지는 경향이 있다. Flag 실크는 보통 GPG, GGX, 및 짧은 스페이서 모티프로 특징된다.
각 실크 유형의 특성은 종마다 다를 수 있으며, 독특한 라이프스타일 (예컨대, 앉아있는 거미줄 스피너 대 베가본드 사냥꾼)을 이끄는 거미 또는 진화적으로 오래된 거미는 위의 설명과 다른 특성을 가진 실크를 생산할 수 있다 (거미 다양성 및 분류의 설명에 관하여, Hormiga, G., and Griswold, C.E., Systematics, phylogeny, and evolution of orb-weaving spiders, Annu. Rev. Entomol. 59, pg. 487-512 (2014); 그리고 Blackedge, T.A. et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. Natl. Acad. Sci. U.S.A., 106:13, pg. 5229-5234 (2009) 참고). 그러나, 천연 실크 단백질의 반복 도메인과 서열 유사성 및/또는 아미노산 조성 유사성을 가지는 합성 블록 공중합체 폴리펩티드는 상응하는 천연 실크 섬유의 속성을 재현하는 상업적 규모의 일관된 실크-유사 섬유를 제조하는데 사용될 수 있다.
실크 뉴클레오티드 및 펩티드 서열
추정 실크 서열들의 목록은 관련 용어들, 예컨대 "스피드로인", "피브로인", "MaSp"에 관해 GenBank를 검색함으로써 컴파일 될 수 있으며, 독립적인 시퀀싱 시도를 통해 수득된 추가 서열들과 함께 풀링될 수 있다. 이어서 서열들은 아미노산으로 해독되고, 중복 엔트리에 대해 필터링되고, 수작업으로 도메인(NTD, REP, CTD)으로 분할된다. 일부 구체예들에서, 후보 아미노산 서열들은 피키아 (코마가타엘라) 파스토리스(Pichia (Komagataella) pastoris)또는 대장균(Escherichia coli)에서의 발현을 위해 최적화된 DNA 서열로 역-해독된다. DNA 서열들은 각각 발현 벡터로 클론되고, 미생물 이를 테면, 피키아 (코마가타엘라) 파스토리스 또는 대장균으로 형질전환된다. 일부 구체예들에서, 성공적인 발현 및 분비를 실증하는 다양한 실크 도메인들은 이어서 조합 방식으로 어셈블되어, 섬유 형성이 가능한 실크 분자를 형성한다.
실크 폴리펩티드는 비-반복 영역 (예를 들어, C-말단 및 N-말단 도메인)이 연접된 반복 도메인 (REP)으로 특징적으로 구성된다. 상기 반복 도메인은 계층적(hierarchical) 구조를 나타낸다. 상기 반복 도메인은 일련의 블록들 (반복 단위로도 지칭됨)을 포함한다. 상기 실크 반복 도메인 전체에 걸쳐 블록들은 때로는 완전하게 그리고 때로는 불완전하게 (준(quasi)-반복 도메인을 구성함) 반복된다. 블록들의 길이 및 조성은 상이한 실크 유형에 따라, 그리고 상이한 종들에 걸쳐 달라진다. 표 1은 선택된 종 및 실크 유형들로부터 얻은 블록 서열들의 예를 열거하며, 추가 예들은 Rising, A. et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci., 68:2, pg 169-184 (2011); 그리고 Gatesy, J. et al., Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001)에 제시되어 있다. 일부 경우들에서, 블록들은 규칙적인 패턴으로 배열되어, 해당 실크 서열의 반복 도메인에서 여러 번 (보통 2-8회) 나타나는 큰 매크로-반복을 형성할 수 있다. 반복 도메인 또는 매크로-반복 내 반복된 블록, 그리고 반복 도메인 내 반복된 매크로-반복은 스페이싱 요소에 의해 분리 될 수 있다. 블록 서열들은 폴리A 영역을 수반하는 글리신 풍부 영역을 포함한다. 짧은 (~1-10개의) 아미노산 모티프는 블록 내 여러 번 나타난다. 공통적으로 관찰되는 모티프의 하위집단은 도 1에 나타낸다. 본 발명의 목적을 위해, 상이한 천연 실크 폴리펩티드들로부터 얻은 블록들은 원 순열 (circular permutation)을 고려하지 않고 선택될 수 있다 (즉, 실크 폴리펩티드들 간에 유사한 것으로 식별된 블록들은 원 순열로 인해 정렬하지 않을 수 있다). 그러므로, 예를 들어, SGAGG의 "블록"은, 본 발명의 목적에 있어, GSGAG 및 GGSGA와 동일하며; 이들은 모두 서로 원 순열이다. 주어진 실크 서열에 대해 선택된 특정 순열은 무엇보다도 편의에 의해 지정될 수 있다 (보통 G로 시작). NCBI 데이터베이스로부터 얻은 실크 서열들은 블록과 비-반복 영역들로 구분될 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
Figure pct00007
본 발명의 특정 구체예에 따른 블록 및/또는 매크로-반복 도메인으로부터 얻은 섬유-형성 블록 공중합체 폴리펩티드는 참고문헌으로 포함된 국제 특허 공개 공보 WO/2015/042164에 기재되어 있다. GenBank와 같은 단백질 데이터베이스 또는 신생경로 (de novo) 시퀀싱을 통해 얻은 천연 실크 서열은 도메인 (N-말단 도메인, 반복 도메인 및 C-말단 도메인) 별로 분류된다. 섬유로의 합성 및 어셈블리를 위해 선택된 N-말단 도메인 및 C-말단 도메인 서열은 천연 아미노산 서열 정보 및 본 명세서에 기재된 다른 변형을 포함한다. 상기 반복 도메인은 중요한 아미노산 정보를 포착하는 동시에 아미노산을 인코드하는 DNA의 크기를 쉽게 합성가능한 단편들로 감소시키는 대표적인 블록, 일반적으로 실크의 유형에 따라 1 내지 8 개의 대표적인 블록을 함유하는 반복 서열로 분해된다. 일부 구체예들에서, 적절하게 형성된 블록 공중합체 폴리펩티드는 적어도 1 반복 서열을 포함하는 하나 이상의 반복 도메인을 포함하고, 선택적으로 N-말단 도메인 및/또는 C-말단 도메인에 연접된다.
일부 구체예들에서, 반복 도메인은 적어도 하나의 반복 서열을 포함한다. 일부 구체예들에서, 상기 반복 서열은 150-300개의 아미노산 잔기들이다. 일부 구체예들에서, 상기 반복 서열은 복수 개의 블록을 포함한다. 일부 구체예들에서, 상기 반복 서열은 복수 개의 매크로-반복을 포함한다. 일부 구체예들에서, 블록 또는 매크로-반복은 다양한 반복 서열에 걸쳐 분할된다.
일부 구체예들에서, DNA 어셈블리 요건을 충족시키기 위해, 반복 서열은 글리신으로 시작하고, 페닐알라닌 (F), 티로신 (Y), 트립토판 (W), 시스테인 (C), 히스티딘 (H), 아스파라긴 (N), 메티오닌 (M) 또는 아스파르트산 (D)으로 끝날 수 없다. 일부 구체예들에서, 상기 반복 서열들 중 일부는 천연 서열과 비교하여 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 (F, Y, W, C, H, N, M 또는 D에서 종료되는 것을 피하기 위해) 폴리펩티드의 C 말단에 세린을 추가함으로써 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 또다른 블록의 상동성 서열로 불완전 블록을 채움으로써 변형될 수 있다. 일부 구체예들에서, 상기 반복 서열은 블록들 또는 매크로반복들의 순서를 재배열함으로써 변형될 수 있다.
일부 구체예들에서, 비-반복 N-말단 도메인과 C-말단 도메인이 합성을 위해 선택될 수 있다. 일부 구체예들에서, N-말단 도메인은 신호P에 의해 확인된 바와 같이 리딩 신호 서열의 제거에 의한 것일 수 있다 (Peterson, T.N., et. Al., SignalP 4.0: discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg. 785-786 (2011).
일부 구체예들에서, 상기 N-말단 도메인, 반복 서열, 또는 C-말단 도메인 서열은 아겔레놉시스 아페르타 (Agelenopsis aperta), 알리아티푸스 굴로수스 (Aliatypus gulosus), 아포노펠마 세에만니 (Aphonopelma seemanni), 아프토스티추스 종. (Aptostichus sp.) AS217, 아프토스티추스 종(Aptostichus sp.). AS220, 아라네우스 디아데마투스 (Araneus diadematus), 아라네우스 겜모이데스 (Araneus gemmoides), 아라네우스 벤트리코수스 (Araneus ventricosus), 아르지오페 아모에나 (Argiope amoena), 아르지오페 아르젠타타 (Argiope argentata), 아르지오페 브루엔니치 (Argiope bruennichi), 아르지오페 트리파스시아타 (Argiope trifasciata), 아티포이데스 리베르시 (Atypoides riversi), 아비쿨라리아 주루엔시스 (Avicularia juruensis), 보트리오시르툼 칼리포르니쿰 (Bothriocyrtum californicum), 데이노피스 스피노사 (Deinopis Spinosa), 디구에티아 카니티에스 (Diguetia canities), 돌로메데스 테네브로수스 (Dolomedes tenebrosus), 유아그루스 치소세우스 (Euagrus chisoseus), 유프로스테놉스 아우스트랄리스 (Euprosthenops australis), 가스테라칸타 맘모사 (Gasteracantha mammosa), 히포칠루스 토렐리 (Hypochilus thorelli), 쿠쿨카니아 히베르날리스 (Kukulcania hibernalis), 라트로덱투스 헤스페루스 (Latrodectus hesperus), 메가헥수라 풀바 (Megahexura fulva), 메테페이라 그란디오사 (Metepeira grandiosa), 네필라 안티포디아나 (Nephila antipodiana), 네필라 클라바타 (Nephila clavata), 네필라 클라비페스 (Nephila clavipes), 네필라 마다가스카리엔시스 (Nephila madagascariensis), 네필라 필리페스 (Nephila pilipes), 네필렌기스 크루엔타타 (Nephilengys cruentata), 파라윅시아 비스트리아타 (Parawixia bistriata), 페우세티아 비리단스 (Peucetia viridans), 플렉트레우리스 트리스티스 (Plectreurys tristis), 포에실로테리아 레갈리스 (Poecilotheria regalis), 테트라그나타 카우아이엔시스 (Tetragnatha kauaiensis), 또는 울로보루스 디베르수스 (Uloborus diversus)에서 유래될 수 있다.
일부 구체예들에서, 상기 실크 폴리펩티드 뉴클레오티드 코딩 서열은 알파 짝짓기 인자 뉴클레오티드 코딩 서열에 작동적으로 연결될 수 있다. 일부 구체예들에서, 상기 실크 폴리펩티드 뉴클레오티드 코딩 서열은 또다른 내인성 또는 이종성 분비 신호 코딩 서열에 작동적으로 연결될 수 있다. 일부 구체예들에서, 상기 실크 폴리펩티드 뉴클레오티드 코딩 서열은 3X FLAG 뉴클레오티드 코딩 서열에 작동적으로 연결될 수 있다. 일부 구체예들에서, 상기 실크 폴리펩티드 뉴클레오티드 코딩 서열은 다른 친화성 태그, 가령, 6-8개의 His 잔기들에 작동적으로 연결된다.
분비 신호
세포에서 분비되는 단백질의 양은 단백질마다 크게 상이하며, 이의 초기 상태의 단백질에 작동 가능하게 연결된 분비 신호에 부분적으로 의존한다. 다수의 분비 신호가 당업계에 공지되어 있으며, 일부는 일반적으로 피치아 파스토리스(Pichia pastoris)사카로미세스 세레비시에(Saccharomyces cerevisiae)의 미생물 분비 신호가 내포된 분비된 재조합 단백질의 생산에 흔히 사용된다. 이들 중 눈에 띄는 것은 사카로미세스 세레비시에(Saccharomyces cerevisiae)의 α-짝짓기 인자 (αMF)의 분비 신호이며, 이는 N-말단 19개-아미노산 신호 펩티드 (본원에서 pre-αMF (sc)라고도 함)와 이어서 70개-아미노산 리더 펩티드 (본원에서 pro-αMF (sc)라고도 함)로 구성된다. 사카로미세스 세레비시에(Saccharomyces cerevisiae)의 αMF 분비 신호에 pro-αMF (sc) (본원에서 pre-αMF (sc)/pro-αMF (sc)라고도 함)를 함입은 단백질의 높은 분비 수율을 달성하는 데 중요한 것으로 입증되었다. pro-αMF (sc) 또는 이의 기능적 변이체를 pre-αMF (sc) 이외의 신호 펩티드에 추가하는 것 또한 재조합 단백질의 분비를 달성하는 수단으로 연구되었지만, 그러나 다양한 정도의 효과를 보여, 특정 재조합 숙주 세포에서의 분비 증가는 다른 재조합 단백질에 대해서는 효과가 없거나 또는 분비가 감소되었다.
다수의 별개의 분비 신호의 사용은 US 출원 15/724,196에 기술된 바와 같이 P. 파스토리스(P. pastoris) 와 같은 숙주 세포에서 생산된 재조합 단백질의 분비 수율을 향상시킬 수 있다. 오직 하나의 분비 신호 (예를 들면, pre-αMF (sc)/pro-αMF (sc))에 작동 가능하게 연결된 재조합 단백질을 인코딩하는 다수의 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포와 비교하였을 때, 적어도 2 개의 별개 분비 신호에 작동 가능하게 연결된 재조합 단백질을 인코딩하는 동일한 수의 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포는 더 높은 분비 수율의 재조합 단백질을 생성한다. 이론에 얽매이지 않고, 적어도 2 개의 별개의 분비 신호를 사용하면, 재조합 숙주 세포가 별개의 세포 분비 경로에 관여하여 재조합 단백질의 효율적인 분비를 수행하고 따라서 임의의 하나의 분비 경로의 과-포화를 방지할 수 있다.
신호 펩티드를 포함하는 하나 이상의 별개의 분비 신호는 표 2 또는 표 3에서 선택될 수 있거나, 또는 표 2 또는 표 3에서 선택된 신호 펩티드에 대해 적어도 80% 아미노산 서열 동일성을 갖는 기능적 변이체이다. 일부 구체예들에서, 기능적 변이체는 표 2 또는 3에서 선택된, 1 개 또는 2 개의 치환된 아미노산을 포함하는 신호 펩티드이다. 일부 이러한 구체예들에서, 상기 기능적 변이체는 표 2 또는 표 3에서 선택된 신호 펩티드에 대해 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 아미노산 서열 동일성을 갖는다. 일부 구체예들에서, 상기 신호 펩티드는 해독-후 발생초기(nascent) 재조합 단백질의 ER로의 전위를 매개한다 (즉, 단백질 합성은 전위에 선행하여, 발생초기 재조합 단백질이 ER로 전위되기 전에 세포 시토졸에 존재한다). 다른 구체예들에서, 상기 신호 펩티드는 발생초기 재조합 단백질의 ER로의 전위를 공동-해독적으로 매개한다 (즉, 단백질 합성과 ER로의 전위가 동시에 발생한다). ER로의 공동-해독적 전위를 매개하는 신호 펩티드를 사용하는 이점은 신속하게 폴딩되는 경향이 있는 재조합 단백질이 ER로의 전위와, 따라서 분비를 방해하는 것으로 추정되는 형태가 되는 것이 방지된다는 점이다.
Figure pct00008
Figure pct00009
발현 벡터
본 발명의 발현 벡터는 당업계에 공지된 기술의 관점에서 본 명세서의 교시에 따라 생산될 수 있다. 서열, 예를 들면, 벡터 서열 또는 형질전환유전자를 인코딩하는 서열은 Integrated DNA Technologies, Coralville, IA 또는 Atum, Menlo Park, CA와 같은 회사에서 상업적으로 얻을 수 있다. 본 명세서에서 예시된 것은 키메라 실크 폴리펩티드의 높은-수준 발현을 지시하는 발현 벡터이다.
본 발명에서 사용되는 폴리뉴클레오티드에 대한 또다른 표준 공급원은 유기체 (예를 들어, 박테리아), 세포 또는 선택된 조직으로부터 분리된 폴리뉴클레오티드이다. 선택된 공급원의 핵산은 일반적으로 연속적인 페놀 및 페놀/클로로포름 추출 후, 에탄올 침전이 전형적으로 내포된 표준 절차에 의해 분리될 수 있다. 침전 후, 상기 폴리뉴클레오티드는 핵산 분자를 단편으로 절단하는 제한 엔도뉴클레아제로 처리될 수 있다. 선택된 크기의 단편은 클로닝을 위한 적절한 크기의 출발 물질을 제공하기 위해, 아가로스 또는 폴리아크릴아미드 겔 전기 영동 또는 펄스 필드 겔 전기영동 (Care et al. (1984) Nuc. Acid Res. 12: 5647-5664; Chu et al. (1986) Science 234 : 1582; Smith et al. (1987) Methods in Enzymology 151 : 461)이 내포된 여러 기술에 의해 분리할 수 있다.
발현 벡터 또는 구조체의 뉴클레오티드 성분들을 획득하는 또다른 방법은 PCR이다. PCR의 일반적인 과정은 MacPherson et al., PCR: A PRACTICAL APPROACH, (IRL Press at Oxford University Press, (1991))에서 교시된다. 각 적용에 대한 PCR 조건은 경험적으로 결정될 수 있다. 여러 매개 변수가 반응의 성공에 영향을 준다. 이러한 매개변수 중에는 어닐링 온도 및 시간, 연장 시간, Mg2+ 및 ATP 농도, pH, 프라이머, 주형 및 데옥시리보뉴클레오티드의 상대적 농도가 있다. 예시적인 프라이머들은 하기 실시예에서 설명된다. 증폭 후, 생성된 단편은 아가로스 겔 전기 영동에 의해 검출된 다음, 에티듐 브로마이드 염색 및 자외선 조사로 시각화 할 수 있다.
폴리뉴클레오티드를 얻는 또다른 방법은 효소에 의한 절단이다. 예를 들면, 뉴클레오티드 서열은 적절한 인지 제한 효소로 적절한 벡터를 분해하여 만들 수 있다. 제한 절단된 단편은 표준 기술을 사용하여 4 개의 데옥시뉴클레오티드 트리포스페이트 (dNTPs)의 존재 하에 대장균(E. coli) DNA 중합효소 I (Klenow)의 큰 단편으로 처리함으로써 블런트(blunt) 말단화될 수 있다.
당분야에 공지된 방법을 이용하여 폴리뉴클레오티드를 적합한 백본, 예를 들면, 플라스미드 안에 삽입한다. 예를 들면, 삽입부와 벡터 DNA는 적절한 조건 하에서 제한 효소와 접촉시켜 각 분자 상에 상보적인 또는 블런트 말단을 만들고, 이들은 서로 쌍을 이루고, 리가제(ligase)와 결합될 수 있다. 대안으로, 합성 핵산 링커들을 폴리뉴클레오티드의 말단에 결찰시킬 수 있다. 이들 합성 링커는 벡터 DNA에 있는 특정 제한절단 부위에 대응하는 핵산 서열을 함유할 수 있다. 다른 수단들이 당분야에 공지되어 있고, 이용가능하다. 구성 요소 폴리뉴클레오티드를 위해 다양한 공급원이 이용될 수 있다.
일부 구체예들에서, R, N 또는 C 서열을 함유하는 발현 벡터는 발현 및 분비를 위해 숙주 유기체로 형질전환된다. 일부 구체예들에서, 상기 발현 벡터는 분비 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 종료 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 숙주 세포 게놈 안으로 통합되도록 기획되며, 벡터는 다음을 포함한다: 표적 게놈에 상동성인 영역, 프로모터, 분비 신호, 태그 (예를 들면, FLAG 태그), 종료/폴리A 신호, 피치아(Pichia)에 대한 선택성 마커, 대장균(E. coli)에 대한 선택성 마커, 대장균(E. coli)의 복제 원점, 그리고 관심대상 단편을 방출하기 위한 제한절단 부위.
숙주 세포 형질전환체
거미 실크 폴리펩티드를 발현시키는 핵산 분자 또는 벡터로 형질전환된 숙주 세포, 그리고 이의 후손들이 제공된다. 이들 세포는 또한 벡터 상에서 본 발명의 핵산 서열을 운반 할 수 있으며, 이는 자유 복제 벡터일 수 있지만, 그러나 반드시 그럴 필요는 없다. 본 발명의 다른 구체예들에서, 상기 핵산은 숙주 세포의 게놈 안으로 통합되었다.
일부 구체예들에서, 본 발명의 블록 공-중합체 폴리펩티드의 대규모-생산을 가능하게 하는 미생물 또는 숙주 세포에는 다음의 조합들이 내포된다: 1) 큰 (>40kDa) 폴리펩티드를 생산하는 능력, 2) 세포 외부로 폴리펩티드를 분비하고, 고비용의 하류 세포내 정제를 우회하는 능력, 3) 대-규모 오염 물질 (바이러스 및 박테리아 오염 등)에 대한 내성, 및/또는 4) 유기체의 성장과 처리에 대한 기존 노하우는 대규모 (1-2000m3) 생물 반응기이다.
다양한 숙주 유기체는 블록 공-중합체 폴리펩티드 발현 시스템을 포함하도록 공작/형질전환될 수 있다. 재조합 실크 폴리펩티드의 발현을 위한 바람직한 유기체에는 효모, 진균, 그람-음성 및 그람 양성 박테리아가 내포된다. 특정 구체예들에서, 상기 숙주 유기체는 아르술라 아데니니보란스(Arxula adeninivorans), 아스퍼길러스 아쿠레아투스(Aspergillus aculeatus), 아스퍼길러스 아와모리(Aspergillus awamori), 아스퍼길러스 피쿰(Aspergillus ficuum), 아스퍼길러스 푸미가투스(Aspergillus fumigatus), 아스퍼길러스 야포니쿠스(Aspergillus japonicus), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 나이져(Aspergillus niger), 아스퍼길러스 오리자에(Aspergillus oryzae), 아스퍼길러스 소자에(Aspergillus sojae), 아스퍼길러스 투비겐시스(Aspergillus tubigensis), 바실러스 알칼로필루스(Bacillus alkalophilus) 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 안트라시스(Bacillus anthracis), 바실러스 브레비스(Bacillus brevis), 바실러스 씨르쿠란스(Bacillus circulans), 바실러스 코아쿨란스(Bacillus coagulans), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리췌니포르미스(Bacillus licheniformis), 바실러스 메타놀리쿠스(Bacillus methanolicus), 바실러스 스테아로테르모필루스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis), 바실러스투린기엔시스(Bacillus thuringiensis), 칸디다 보이디니(Candida boidinii), 크리소스포리눔 루크노웬스(Chrysosporium lucknowense), 대장균(Escherichia coli), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 베네나툼(Fusarium venenatum), 클루이베로미세스 락티스(Kluyveromyces lactis), 클루이베로미세스 마르시아누스(Kluyveromyces marxianus), 미셀리오프토라 테르모필라(Myceliopthora thermophila), 뉴로스포라 크라사(Neurospora crassa), 오가테에아 폴리모르파(Ogataea polymorpha), 페니실리움 카멤베르티(Penicillium camemberti), 페니실리움 카네센스(Penicillium canescens), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 에메르소니(Penicillium emersonii), 페니실리움 펀니쿨로숨(Penicillium funiculosum), 페니실리움 그리세오로세움(Penicillium griseoroseum), 페니실루움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 로퀘프로티(Penicillium roqueforti), 파네로카에테 크리소스포리움(Phanerochaete chrysosporium), 피치아 안구스타(Pichia angusta), 피치아 메타놀리카(Pichia methanolica), 피치아(코마가테라) 파스토리스(Pichia (Komagataella) pastoris), 피치아 폴리모르파(Pichia polymorpha), 피치아 스티피티스(Pichia stipitis), 리조무코르 미에하이(Rhizomucor miehei), 리조무코르 푸실리스(Rhizomucor pusillus), 리조푸스 아르히주스(Rhizopus arrhizus), 스트렙토미세스 리비단스(Streptomyces lividans), 사카로미세스 세레비시에(Saccharomyces cerevisiae), 쉬반니오미세스 옥시덴탈리스(Schwanniomyces occidentalis), 트리코데르마 하르지아눔(Trichoderma harzianum), 트리코데르마 리세이(Trichoderma reesei), 또는 야로위아 리포티카(Yarrowia lipolytica).
바람직한 측면들에서, 상기 방법은 바이오매스를 추출할 필요없이, 쉽게 회수할 수 있도록 직접적으로 산물을 분비하는 숙주 세포의 배양을 제공한다. 일부 구체예들에서, 상기 블록 공-중합체 폴리펩티드는 수거 및 가공을 위해 배지로 직접 분비된다.
공작된 숙주 세포 계통
재조합 단백질을 생산하기 위해 임의의 적절한 숙주 세포 계통을 사용할 수 있다. 메탄올자화성(methylotrophic) 효모 피치아 파스토리스(Pichia pastoris) 가 재조합 단백질 생산에 광범위하게 이용된다. P. 파스토리스(Pichia pastoris)는 높은 세포 밀도로 성장하고, 엄격하게 제어된 메탄올-유도성 트랜스 유전자 발현을 제공하며, 특정된 배지에서 이종성 단백질을 효율적으로 분비한다. 그러나, P. 파스토리스(Pichia pastoris) 균주의 배양 동안, 재조합 발현 단백질은 수집되기 전에 분해될 수 있어, 재조합 발현 단백질의 단편이 내포된 단백질 혼합물이 만들어지게 되고, 따라서 전장-재조합 단백질 수율은 감소된다. 재조합 단백질 생산에 널리 사용되는 또다른 세포 계통은 대장균 (Escherichia coli)이다.
일부 구체예들에서, 본 명세서에 기재된 감소된 단백질분해효소 활성을 가지는 변형된 균주는 실크-유사 폴리펩티드 서열을 재조합적으로 발현시킨다. 일부 구체예들에서, 실크-유사 폴리펩티드 서열은 1) 실크 폴리펩티드 서열에서 유래한 반복 도메인들을 혼합 및 매칭시킴으로써 생성된 블록 공-중합체 폴리펩티드 조성물 및/또는 2) 산업적으로 확장가능한 미생물로부터의 분비에 의해 유용한 섬유를 형성하기에 충분히 큰 크기 (약 40kDa)를 가지는 블록 공-중합체 폴리펩티드의 재조합 발현이다. 거의 모두 공개된 거미 실크 폴리펩티드의 아미노산 서열들로부터의 서열을 비롯하여, 실크 반복 도메인 단편들로부터 공작된 큰 (대략 40 kDa ~ 대략 100 kDa) 블록 공-중합체 폴리펩티드는 본 명세서에 기재된 변형 미생물에서 발현될 수 있다. 일부 구체예에서, 실크 폴리펩티드 서열은 섬유 형성이 가능한, 상당히 발현되고, 분비된 폴리펩티드를 생성하도록 매칭되고 설계된다. 일부 구체예들에서, 숙주 변형된 균주에서 단백질분해효소 유전자의 녹-아웃 또는 단백질분해효소 활성의 감소는 실크 유사 폴리펩티드의 분해를 감소시킨다.
일부 구체예들에서, 피키아 파스토리스(Pichia pastoris)에서 단백질분해효소 활성을 약화시키기 위하여, 이들 효소를 인코드하는 유전자를 불활성화 또는 돌연변이시켜 활성을 감소시키거나 또는 제거한다. 이것은 유전자 조절 요소의 변형을 통한 유전자 자체의 돌연변이 또는 삽입을 통해 이루어질 수 있다. 이것은 표준 효모 유전학 기술을 통해 구현될 수 있다. 이러한 기술의 예는 이중 상동 재조합을 통한 유전자 대체를 포함하며, 여기서 불-활성화될 유전자에 연접하는 상동 영역들은 선택성 마커 유전자 (가령, 항생제 내성 유전자 또는 효모 균주의 영양요구성을 보충하는 유전자)에 연접하는 벡터에서 클로닝된다.
대안 적으로, 상기 상동성 영역은 PCR-증폭되고, 중첩 PCR을 통해 선택성 마커 유전자에 연계될 수 있다. 이어서, 이러한 DNA 단편들은 해당 분야에 공지된 방법들, 예컨대, 전기천공법을 통해 피치아 파스토리스(Pichia pastoris)에 형질전환된다. 이어서 선택적 조건하에서 성장하는 형질전환체들을 표준 기술, 예컨대, 게놈 DNA에 대한 PCR 또는 서던(Southern) 블롯에 의해 유전자 파괴 발생에 대해 분석하였다. 대안적인 실험에서, 유전자 불활성화는 단일 상동 재조합을 통해 구현될 수 있으며, 이때, 예를 들어, 유전자 ORF의 5' 단부는 선택성 마커 유전자를 또한 함유하는 프로모터없는 벡터 상에 클로닝된다. 표적 유전자 상동성 단편에서 벡터만을 절단하는 제한 효소에 의한 분해를 통해 이러한 벡터를 선형화할 때, 이러한 벡터는 피치아 파스토리스(Pichia pastoris) 내에 형질전환된다. 표적 유전자 부위에서의 통합은 게놈 DNA에서의 PCR 또는 서던 블롯을 통해 확인된다. 이러한 방식으로, 벡터 상에 클로닝된 유전자 단편의 복제가 게놈에서 구현되고, 다음과 같은 표적 유전자 좌위의 2개의 복제물이 생성된다: ORF가 불완전하여, 단축된 비활성 단백질을 발현시키는 제 1 복제물, 그리고 전사를 유도하는 프로모터가 없는 제 2 복제물.
대안적으로, 트랜스포존 돌연변이유발을 사용하여 표적 유전자를 불활성화시킨다. 이러한 돌연변이체의 라이브러리는 PCR을 통해 표적 유전자에서의 삽입 발생에 대해 스크리닝될 수 있다.
공작된/녹-아웃 균주의 기능적 표현형 (즉, 결핍)은 해당 분야에 공지된 기술을 사용하여 평가될 수 있다. 예를 들어, 공작된 균주에서 단백질분해효소 활성의 결핍은 해당 분야에 공지된 임의의 다양한 방법, 그 중에서도, 예컨대, 색원체(chromogenic) 단백질분해효소 기질의 가수분해 활성 분석, 선택된 단백질분해효소에 대한 기질 단백질의 밴드 이동 등을 사용하여 확인할 수 있다.
본 명세서에 기재된 단백질분해효소 활성의 감쇠는 녹-아웃 돌연변이 이외의 메커니즘을 통해 구현될 수 있다. 예를 들면, 원하는 단백질분해효소는 핵산 서열을 변경하거나, 유전자를 활성이 적은 프로모터의 제어 하에 위치시키거나, 하향 조절하거나, 또는 관심 유전자를 표적으로 하는 간섭 RNA, 리보자임 또는 안티센스 서열을 발현시킴으로써, 또는 해당 분야에 공지된 임의의 다른 기술을 통한 아미노산 서열 변화에 의해 감쇠될 수 있다. 바람직한 균주에서, PAS_chr4_0584 (YPS1-1) 및 PAS_chr3_1157 (YPS1-2)에서 인코드되는 단백질분해효소들의 단백질분해효소 활성은 상기 기재된 임의의 방법에 의해 감쇠된다. 일부 양상들에서, 본 발명은 메탄올자화 효모 균주, 특히 피치아 파스토리스(Pichia pastoris) 균주에 관한 것이며, 이 때 YPS1-1YPS1-2 유전자는 불활성화되었다. 일부 구체예에서, 균주에 의해 발현되는 원하는 단백질 생성물의 단백질분해효소 활성을 추가로 감소시키기 위해 본 명세서에 제공된 방법에 따라 추가 단백질분해효소 인코딩 유전자가 녹-아웃될 수 있다.
일부 구체예들에서, 본 발명에 개시된 P. 파스토리스(P. pastoris) 균주는 실크-유사 폴리펩티드를 발현하기 위해 변형되어 있다. 바람직한 구체예들의 실크-유사 폴리펩티드 제작 방법은 WO 2015/042164, 특히 114-134 단락에 제공되며, 이 문헌은 본 명세서에 참고자료에 편입된다. 이 문헌에는 아르지오페 브루엔니치 (Argiope bruennichi) 종과 같은 MaSp2로부터 유래한 재조합 거미 실크 단백질 단편 서열들에 기초한 합성 단백질성 공중합체가 개시되어 있다. 각각의 반복 단위의 분자량이 약 20 kDa 보다 큰, 2 내지 20개 반복 단위를 포함하는 실크-유사 폴리펩티드가 기재되어 있다. 공-중합체의 각 반복 단위 내에는 약 60개 이상의 아미노산 잔기가 있고, 이들은 다수의 "준(quasi)-반복 단위"으로 구성되게 된다. 일부 구체예들에서, 이 문헌에 기재된 폴리펩티드의 반복 단위는 MaSp2 드래그라인 실크 단백질 서열에 대해 95% 이상의 서열 동일성을 가진다.
재조합 단백질 생산 및 정제 방법
본원에서 제공된 방법은 본원에서 제공된 재조합 숙주 세포의 접종물을 적합한 발효 브로스와 적합한 발효 용기에서 원하는 누적 수율 및/또는 누적 역가를 얻고 및/또는 재조합 단백질의 누적 생산성을 얻는데 적합한 발현 조건 하에서 발효시키는 것을 포함한다.
일부 구체예들에서, 상기 재조합 숙주 세포는 상기 재조합 단백질을 분비한다. 다양한 구체예들에서, 상기 재조합 숙주 세포는 상기 재조합 단백질을 분비하지 않는 원핵생물일 수 있다. 특정 구체예에서, 상기 재조합 숙주 세포는 대장균(Escherichia coli)이다.
다양한 구체예들에서, 상기 재조합 숙주 세포는 상기 재조합 단백질을 분비하는 진핵생물, 또는 상기 재조합 단백질을 분비하는 원핵생물 이를 테면 그람-음성 또는 그람-양성 박테리아일 수 있다. 일부 구체예들에서, 상기 재조합 숙주 세포는 피치아 파스토리스(pichia pastoris)이다. 특정 구체예들에서, 상기 재조합 숙주 세포는 폐기된 (예를 들자면, 기능적 녹-아웃에 의한) 하나 또는 그 이상의 단백질분해효소 활성을 갖는 피치아 파스토리스(pichia pastoris) 균주다. 또한, 하기에서 논의되는 특정 구체예들은 재조합 소수성 또는 부분적으로-소수성 단백질, 이를 테면 실크 단백질의 생산에 적용가능하다.
US 특허 9,963,554, "Methods and Compositions for Synthesizing Improved Silk Fibers", (본원에 참고자료에 편입된)에서는 블록 공중합체를 합성하기 위한 조성물, 이를 생산하기 위한 재조합 미생물, 그리고 해당 단백질을 포함하는 합성 섬유를 교시한다. US 특허 출원 15/724,196, "Modified Strains for the Production of Recombinant Silk", (본원에 참고자료에 편입된)에서는 효모 세포에 의해 발현된 재조합 단백질의 분비를 감소시키기 위해 선택된, 또는 유전공학적으로 공작된 피치아 파스토리스(pichia pastoris) 세포, 그리고 유용한 화합물의 생산을 위해 효모 세포를 배양하는 방법을 교시한다. 대장균(Escherichia coli)을 포함한 다른 적절한 미생물 균주를 배양하여 유용한 화합물의 생산에 사용할 수 있다.
발효
일부 구체예들에서, 재조합 숙주 세포의 접종물은 씨드 트레인(seed train) (즉, 적절한 수의 재조합 숙주 세포를 생성하기 위해 부피를 증가시키는 일련의 발효)에서 유래될 수 있다. 해당 구체예에 따라, 씨드의 수는 2-7개, 3-7개, 3-6개, 또는 3-5개의 씨드 범위가 될 수 있다.
일부 구체예들에서, 상기 재조합 숙주 세포의 접종물은 배지 리터당 적어도 0.2 g/L, 적어도 0.5 g/L, 적어도 0.7 g/L, 적어도 0.8 g/L, 적어도 1 g/L, 적어도 2 g/L, 적어도 3 g/L, 적어도 4 g/L, 또는 적어도 5g/L; 0.2 g/L ~ 3 g/L, 0.2 g/L ~ 2 g/L, 또는 0.2 g/L ~ 1 g/L; 0.5 g/L ~ 3 g/L, 0.5 g/L ~ 2 g/L, 또는 0.5 g/L ~ 1 g/L; 1 g/L ~ 3 g/L, 1 g/L ~ 2 g/L, 또는 0.5 g/L ~ 1 g/L; 또는 3 g/L ~ 1 g/L의 세포 건중량 (DCW)을 갖는다. DCW는 암순응측정기 (예를 들면, Eppendorf Bio Photometer D30)를 이용하여 측정할 수 있다.
대부분 구체예들에서, 해당 접종물의 크기는 해당 발효 용기의 크기에 의존적일 것이다. 상기 발효 용기의 크기가 150L 보다 작은 구체예들에서, DCW는 0.1 g/L-0.5 g/L 범위가 될 수 있다. 상기 발효 용기의 크기가 150L 이상인 구체예들에서, DCW는 2-4 g/L 범위가 될 수 있다.
특이적 구체예들에 따라, 적합한 발효 브로스는 상기 재조합 숙주 세포들이 존속될 수 있는 (즉, 성장 및/또는 생존력을 유지하는) 임의의 발효 브로스이다. 적합한 발효 브로스의 비-제한적인 예시에는 상기 재조합 숙주 세포의 성장 및/또는 생존에 필요한 영양분이 포함된 수성 배지가 내포된다. 이러한 영양소의 비-제한적인 예에는 탄소 공급원, 질소 공급원, 인산염 공급원, 염, 미네랄, 염기, 산, 비타민 (예를 들면, 바이오틴), 아미노산 및 금속 (예를 들면, 철, 아연, 칼슘, 구리, 나트륨, 칼륨, 코발트, 마그네슘, 망간)이 내포된다.
일부 구체예들에서, 상기 영양소들중 임의의 것은 세포 성장을 억제시키고, 재조합 단백질의 생산성, 수율 또는 역가를 개선하기 위해 제한될 수 있다. 상기 탄소 공급원은 재조합 숙주 세포에 의해 발효될 수 있는 모든 탄소 공급원일 수 있다. 적합한 탄소 공급원의 비-제한적인 예로는 단당류, 이당류, 다당류, 아세테이트, 에탄올, 메탄올, 메탄 및 이들의 조합이 내포된다. 단당류의 비-제한적인 예로는 덱스트로스 (포도당), 과당, 갈락토스, 자일로스, 아라비노스 및 이들의 조합이 내포된다. 이당류의 비-제한적인 예로는 수크로스, 락토스, 말토스, 트레할로스, 셀로비오스 및 이들의 조합이 내포된다. 다당류의 비-제한적인 예로는 전분, 글리코겐, 셀룰로스 및 이들의 조합이 내포된다.
상기 질소 공급원은 재조합 숙주 세포에 의해 동화 (즉, 대사) 될 수 있는 임의의 질소 공급원일 수 있다. 적합한 질소 공급원의 비-제한적인 예로 무수 암모니아, 황산 암모늄, 질산 암모늄, 인산이 암모늄, 인산일암모늄, 폴리인산암모늄, 질산 나트륨, 우레아, 펩톤, 단백질 가수 분해물, 효모 추출물 및 공기 또는 산소가 풍부한 상기 모든 것이 내포된다.
일부 구체예들에서, 발효 브로스에 첨가하기 전에 미생물 오염을 줄이거나 또는 제거하기 위해, 열 또는 오존 처리를 사용하여 영양소의 일부 또는 전부를 살균할 수 있다. 예를 들면, 탄소 공급원을 발효 브로스에 첨가하기 전, 열을 사용하여 캐러멜화시키거나 또는 살균할 수 있다. 유사하게, 탄소 공급원을 발효 브로스에 첨가하기 전, 오존 화시킬 수 있다. 오존화를 위한 적합한 방법들은 Dziugan et al., Ozonation as an effective way to stabilize new kinds of fermentation media used in biotechnological production of liquid fuel additives, Biotechnology for Biofuels, 9:150 (2016)에서 논의된다.
상기 발효 브로스는 pH를 조정 및/또는 유지시키기 위한 산 또는 염기를 포함할 수 있다. 일부 이러한 구체예들에서, 상기 pH는 4.0 내지 8.0, 7.5, 7.0, 6.5, 6.0, 5.5, 5.0, 또는 4.5; 4.5 내지 8.0, 7.5, 7.0, 6.5, 6.0, 5.5, 또는 5.0; 5.0 내지 8.0, 7.5, 7.0, 6.5, 6.0, 또는 5.5; 5.5 내지 8.0, 7.5, 7.0, 6.5, 또는 6.0; 6.0 내지 8.0, 7.5, 7.0, 또는 6.5; 6.5 내지 8.0, 7.5, 또는 7.0; 7.0 내지 8.0, 또는 7.5; 또는 7.5 내지 8.0이다.
적합한 산의 비-제한적인 예로는 아스파르트 산, 아세트산, 염산 및 황산이 내포된다. 적합한 염기의 비-제한적인 예로는 수산화 나트륨, 수산화 칼륨, 수산화칼슘, 수산화 암모늄, 탄산 칼슘, 암모니아 및 인산이암모늄이 내포된다. 일부 구체예들에서, 강산 또는 강염기는 발효 브로스의 희석을 제한하는 데 사용된다.
일부 구체예들에서, 상기 발효 브로스는 원하는 산소 흡수율 (OUR)이 달성 및/또는 유지되도록 하는 그러한 영양소 또는 그러한 양의 영양소를 포함한다. 일부 이러한 구체예들에서, 상기 원하는 OUR은 적어도 40 mmol O2/L/hr, 적어도 80 mmol O2/L/hr, 적어도 100 mmol O2/L/hr, 적어도 105 mmol O2/L/h, 적어도 110 mmol O2/L/h, 적어도 115 mmol O2/L/h, 적어도 120 mmol O2/L/hr, or 적어도 140 mmol O2/L/hr, 적어도 160 mmol O2/L/hr, 적어도 180 mmol O2/L/hr, 적어도 200 mmol O2/L/hr, 또는 적어도 220 mmol O2/L/hr; 40 mmol O2/L/hr 내지 220 mmol O2/L/hr, 60 mmol O2/L/hr 내지 220 mmol O2/L/hr, 80 mmol O2/L/hr 내지 220 mmol O2/L/hr, 또는 100 mmol O2/L/hr 내지 220 mmol O2/L/hr; 100 mmol O2/L/hr 내지 140 mmol O2/L/hr, 100 mmol O2/L/hr 내지 135 mmol O2/L/hr, 100 mmol O2/L/hr 내지 130 mmol O2/L/hr, 또는 100 mmol O2/L/hr 내지 125 mmol O2/L/hr; 110 mmol O2/L/hr 내지 125 mmol O2/L/hr, 또는 110 mmol O2/L/hr 내지 120 mmol O2/L/hr; 또는 115 mmol O2/L/hr 내지 120 mmol O2/L/hr이다. 상기 OUR는 Bioreaction Engineering Principles 3rd Edition, 2011, Spring Science + Business Media, p. 449에서 기재된 Direct Method을 이용하여 당업자가 산출해낼 수 있다.
일부 구체예들에서, 상기 발효 브로스는 재조합 숙주 세포에 의한 재조합 단백질의 생산이 부산물의 생산과 비교하여 증가되도록 하는 그러한 영양소 또는 그러한 양의 영양소를 포함한다. 이러한 부산물의 비-제한적인 예로는 에탄올이 내포된다. 일부 구체예들에서, 발효 72 시간 안에, 상기 재조합 숙주 세포는 0.1 g/L 미만, 1 g/L 미만, 5 g/L 미만, 10 g/L 미만, 또는 15g/L 미만; 0.1 g/L 내지 15 g/L, 1 g/L 내지 15 g/L, 5 g/L 내지 15 g/L, 10 g/L 내지 15 g/L, 또는 0.5 g/L 내지 15 g/L; 또는 0.1 g/L 내지 1.5 g/L, 0.2 g/L 내지 1.5 g/L, 0.5 g/L 내지 1.5 g/L, 0.7 g/L 내지 1.5 g/L 또는 1.0 g/L 내지 1.5 g/L의 누적 수율로 에탄올을 생산한다.
일부 구체예들에서, 상기 발효 브로스는 원하는 용존 산소 (DO)에 도달 및/또는 유지되도록 하는 그러한 영양소 또는 그러한 양의 영양소를 포함한다. 일부 이러한 구체예들에서, 상기 원하는 DO 함량은 적어도 2%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% 또는 100%; 또는 2% 내지 40%, 2% 내지 5%, 5% 내지 40%, 2% 내지 20%, 5% 내지 20%, 2 내지 15%, 또는 5% 내지 15%이다.
일부 구체예들에서, 상기 발효 브로스는 원하는 호흡 지수 (RQ; 즉, 소비된 산소에 대한 생성된 이산화탄소의 비율)에 도달 및/또는 유지되도록 하는 그러한 영양소 또는 그러한 양의 영양소를 포함한다. 일부 이러한 구체예들에서, 상기 원하는 RQ는 2 미만, 1.75 미만, 1.5 미만, 또는 1.25 미만; 또는 1 내지 1.1, 1 내지 1.2, 1 내지 1.3, 1 내지 1.4, 또는 1 내지 1.5이다.
일부 구체예들에서, 상기 발효 브로스는 상기 재조합 숙주 세포의 원하는 배가(doubling) 시간에 도달 및/또는 유지되도록 하는 그러한 영양소 또는 그러한 양의 영양소를 포함한다. 일부 이러한 구체예들에서, 상기 원하는 배가 시간은 적어도 4 시간, 8 시간, 12 시간, 16 시간, 18 시간, 22 시간, 26 시간, 30 시간, 34 시간 또는 36 시간; 또는 4 시간 내지 12 시간, 4 시간 내지 10 시간, 4 시간 내지 8 시간, 6 시간 내지 12 시간, 6 시간 내지 10 시간, 또는 6 시간 내지 8 시간이다.
일부 구체예들에서, 상기 발효 브로스는 하나 또는 그 이상의 보충 단백질을 포함한다. 이러한 보충 단백질의 첨가는 재조합 숙주 세포가 재조합 단백질을 분비하는 구체예들에서 당해 재조합 숙주 세포에 의해 생성된 재조합 단백질로부터 단백질분해효소 활성을 방해하는 역할을 할 수 있다. 보충 단백질의 비-제한적인 예로는 소 혈청 알부민 (BSA) 및 카사미노산이 내포된다. 다른 보충 단백질들이 당분야에 잘 공지되어 있다.
영양소는 1회-볼루스에 의해, 점진적으로 또는 지속적으로 발효 브로스에 추가시킬 수 있다. 영양분이 지속적으로 첨가되는 구체예들에서, 이들은 빠르거나, 느리거나, 또는 기하급수적인 속도로 첨가될 수 있다.
영양소가 발효 브로스에 연속적으로 첨가되는 구체예들의 경우, 해당 영양소를 함유하는 배지를 연속적으로 첨가함으로써 영양소를 첨가시킬 수 있다. 이러한 구체예들에서, 발효 브로스의 총 부피가 동일하게 유지되도록 발효 브로스 안의 동일한 부피의 수성 배지는 발효에서 제거될 수 있다. 일부 구체예들에서, 재조합 숙주 세포는 발효 브로스로부터 제거되고, 발효 브로스에 첨가하기 전, 영양소를 함유하는 배지에 다시 첨가시킬 수 있다.
상기 적합한 발효 용기는 상기 재조합 숙주 세포들이 존속될 수 있는 (즉, 성장 및/또는 생존력을 유지하는) 임의의 발효 용기다. 적합한 발효 용기의 비-제한적 예로는 배양 플레이트, 바이알, 플라스크, 또는 발효기가 내포된다. 적합한 발효기의 비 제한적인 예로는 교반식 탱크 발효기, 공중(airlift) 발효기, 기포-탑 반응기, 고정층(fixed bed) 생물 반응기 및 이들의 임의의 조합이 내포된다.
상기은 적합한 발효 조건은 상기 재조합 숙주 세포들이 존속될 수 있는 (즉, 성장 및/또는 생존력을 유지하는) 임의의 조건이다. 이러한 발효 조건의 비-제한적인 예로는 발효 브로스의 적합한 부피, 발효 브로스의 적합한 pH, 발효 브로스 안의 적합한 DO, 적합한 온도, 적합한 산소공급, 재조합 숙주 세포의 적합한 교반 및 발효에 적합한 기간이 내포된다.
다양한 구체예들에서, 적합한 온도는 재조합 숙주 세포의 성장 및/또는 생존력 및/또는 재조합 단백질의 생산에 적합한 임의의 온도일 수 있다. 일부 구체예들에서, 상기 온도는 적어도 15℃, 20℃, 25℃, 30℃, 35℃; 15℃ ~ 35℃, 15℃ ~ 25℃, 15℃ ~ 20℃, 20℃ ~ 35℃, 20℃ ~ 30℃, 20℃ ~ 25℃, 25℃ ~ 35℃ 또는 25℃ ~ 30℃이다.
적합한 산소공급은 재조합 숙주 세포의 성장 및/또는 생존력 및/또는 재조합 숙주 세포의 생산에 적합한 임의의 산소공급일 수 있다. 이러한 산소공급은 발효 용기 및/또는 발효 브로스의 적절한 통기 및/또는 적절한 교반을 제공함으로써 달성될 수 있다. 일부 구체예들에서, 적합한 환기는 적어도 1.5 vvm, 적어도 1.6 vvm, 적어도 1.7 vvm, 적어도 1.8 vvm, 적어도 1.9 vvm, 또는 적어도 2 vvm; 1.5 vvm 내지 2 vvm, 1.5 vvm 내지 1.9 vvm, 1.5 vvm 내지 1.8 vvm, 1.5 vvm 내지 1.7 vvm, 1.5 vvm 내지 1.6 vvm, 1.6 vm 내지 2 vvm, 1.7 vvm 내지 2 vvm, 1.8 vvm 내지 2 vvm, 또는 1.7 vvm 내지 1.9 vvm이다.
발효의 구체예 및 발효 유형에 따라, 발효 브로스에서 재조합 숙주 세포의 적절한 교반이 달라질 수 있다.
구체예에 따라, 기포-탑을 환기용으로 사용할 수 있다. 기포-탑은 특정 구체예에 따라 복잡도가 달라질 수 있으며 (예를 들어, 단일 또는 다중 상일 수 있음), 다양한 가스 속도를 제공할 수 있다. 적절한 기체 속도의 비-제한적인 예로는 0.003-0.08 m/s가 내포되지만, 이에 국한되지는 않는다. Kantarci et al., Bubble Column Reactors, Process Biochemistry 40:2263-2283 (2005)의 기포 반응기가 내포되나, 이에 국한되지 않는다.
일부 구체예들에서, 상기 발효 브로스는 발효 동안 포말을 감소시키는 제제 ("소포제(antifoam agent)")를 포함한다. 본 명세서에 정의된 바와 같이, 포말은 발효 용기의 상단 내부 또는 상단 근처에 위치한 연속 액상에 있는 기체의 분산이다. 구체예에 따라, 상기 소포제는 임의의 재조합 단백질 생성물과의 상호 작용을 감소시키기 위해 선택되고 최적화될 수 있다. 소포제의 비-제한적인 예로는 실리콘-계 오일, 에멀젼 및 폴리머; 폴리프로필렌 글리콜; 폴리에틸렌 글리콜-계 소포제; 폴리알킬 렌 글리콜-계 소포제; 이기능성 에틸렌/프로필렌 옥사이드 (EO/PO) 블록 공중합체; 지방산-계 소포제; 폴리에스테르-계 소포제 유성 소포제 및 이들의 임의의 조합이 내포된다. 적합한 소포제들은 Junker, Foam and its Mitigation in Fermentation Systems, Biotechnol. Prog., 23:767-784 (2007)에서 논의된다. 상기 재조합 단백질이 소수성 단백질, 이를 테면 실크 단백질인 구체예들에서, 상기 소포제는 소수성 단백질을 가용화하거나 또는 가용화하지 않도록 선택될 수 있다.
상기 재조합 단백질의 원하는 누적 수율은 생산 단가를 낮추는데 기여하는 임의의 누적 수율일 수 있다. 본원에 이용된 바와 같이, 누적 수율은 발효 과정에 걸쳐 재조합 숙주 세포에 의해 분해된 탄소 공급원 질량에서 생성된 재조합 단백질 질량의 백분율로 산출된다 (즉, 제공된 탄소원 질량에서 발효 브로스에 남아있는 탄소원 질량을 뺀 질량; 예를 들어 100g의 포도당이 재조합 숙주 세포에 제공되고, 발효가 끝날 때 25g의 재조합 단백질이 생산되고, 10g의 포도당이 남아있는 경우, 재조합 단백질의 누적 수율은 27.7 %가 된다). 다른 모든 측정 단위(metrics)가 동일하다고 가정하면, 누적 수율이 높을수록 누적 수율이 낮은 경우와 비교하여 생산단가는 더 낮아진다. 일부 구체예들에서, 발효 72 시간 후 탄소 공급원에 대한 상기 재조합 실크 단백질의 누적 수율은 적어도 1%, 적어도 5%, 적어도 30%, 또는 적어도 100%; 1% 내지 5%, 5% 내지 10%, 10% 내지 35%, 35% 내지 50%, 또는 50% 내지 100%이다.
상기 재조합 단백질의 원하는 누적 역가는 생산 단가를 낮추는데 기여하는 임의의 누적 역가일 수 있다. 본원에 이용된 바와 같이, 누적 역가는 발효 과정에 걸쳐 발효 브로스 리터 당 생산되는 재조합 단백질의 그램 (가령, g/L)으로 산출된다. 다른 모든 측정 단위(metrics)가 동일하다고 가정하면, 누적 역가 높을수록 누적 역가가 낮은 경우와 비교하여 생산단가는 더 낮아진다. 일부 구체예들에서, 발효 72 시간 후 상기 재조합 단백질의 누적 역가는 적어도 2 g/L, 적어도 5 g/L, 적어도 15 g/L, 또는 적어도 30 g/L; 1 g/L 내지 100 g/L, 5 g/L, 15 g/L, 또는 30g/L; 10 g/L 내지 100 g/L, 80 g/L, 또는 75g/L; 또는 5 g/L 내지 30 g/L이다.
상기 재조합 단백질의 원하는 누적 생산성은 생산 단가를 낮추는데 기여하는 임의의 누적 생산성일 수 있다. 본원에 이용된 바와 같이, 누적 생산성은 발효 과정에 걸쳐 발효 브로스 리터 당 생산되는 재조합 단백질의 그램 (가령, g/L/hr)으로 산출된다. 다른 모든 측정 단위(metrics)가 동일하다고 가정하면, 누적 생산성이 높을수록 누적 생산성이 낮은 경우와 비교하여 생산단가는 더 낮아진다. 일부 구체예들에서, 상기 재조합 단백질의 누적 생산성은 적어도 0.001 g/L/hr, 적어도 0.025 g/L/hr, 적어도 0.05 g/L/hr, 적어도 0.1 g/L/hr, 또는 적어도 0.2g/L/hr; 0.001 g/L/hr 내지 0.5 g/L/hr이다.
본원에 제공된 방법은 임의의 발효 규모 및/또는 당업계에 공지된 임의의 발효 절차에 따라 수행될 수 있다. 발효 절차는 유가식(fed-batch), 배취식(batch), 연속식 또는 이들의 조합일 수 있다. 일부 구체예들에서, 상기 방법은 하나 또는 그 이상의 배취식 발효로 시작하고 이어서, 하나 또는 그 이상의 연속 발효가 진행되며, 이때 해당 재조합 숙주 세포의 접종물, 적합한 발효 브로스, 적합한 발효 용기, 및/또는 하나 또는 그 이상의 적합한 발효 조건은 하나 또는 그 이상의 배취식 발효 및/또는 하나 또는 그 이상의 연속식 발효 간에 상이할 수 있다. 일부 구체예들에서, 상기 배취식 발효 온도는 연속식 발효 온도보다 높다. 일부 이러한 구체예들에서, 상기 배취 발효 온도는 27 ℃ 이상이고, 연속식 발효 온도는 27 ℃ 미만이다.
일부 구체예들에서, 상기 발효 절차는 단계적(in phases)으로 진행된다. 이러한 단계는 성장 단계, 생산 단계 및/또는 회복 단계를 포함할 수 있다. 일부 구체예들에서, 상기 단계는 해당 재조합 숙주 세포의 접종물, 적합한 발효 브로스, 적합한 발효 용기, 및/또는 하나 또는 그 이상의 적합한 발효 조건에 있어서 서로 상이하다.
재조합 단백질을 단리시키는 방법
구체예에 따라, 관심대상 재조합 단백질을 분리 및 회수하기 위해 다양한 방법이 사용될 수 있다. 위에서 논의한 바와 같이, 이러한 방법 중 일부는 관심대상의 재조합 단백질을 분비하는 재조합 숙주 세포에 특이적이다. 또한, 이러한 방법들중 일부는 소수성인 관심대상의 재조합 단백질에 특이적이다.
도 1은 본 발명의 한 가지 구체예에 따른 재조합 단백질을 분리하기 위한 공정 흐름을 도시한다. 당업자는 도 1에 도시된 단계의 일부는 대체 순서 및/또는 반복으로 수행될 수 있음을 이해할 것이다. 당업자는 개시된 구체예들이 여기에 제공된 방법의 범위를 제한하려는 것이 아님을 인지할 것이며, 이들 방법은 사용된 재조합 숙주 세포, 원하는 누적 수율, 누적 역가 및/또는 누적 생산성 또는 기타 요인에 따라 달라질 수 있음을 인지할 것이다.
선택적 단계 A02에서, 바이오매스 (즉, 무손상 또는 파괴된 재조합 숙주 세포 및 세포 파편)는 재조합 숙주 세포를 포함하는 발효로부터 제거된다. 다양한 구체예들에서, 바이오매스 제거는 또한 불용성 발효 불순물 (예를 들어, 단백질의 가용화 동안 침전될 수 있는 소포제 및 발효 브로스의 다른 성분) 제거를 포함할 수 있다.
다양한 구체예들에서, 바이오매스 제거는 크기, 무게, 밀도 또는 이들의 조합을 기반으로 수행될 수 있다. 크기에 따른 바이오매스 제거는 예를 들어, 필터 프레스, 캔들스틱 필터 또는 재조합 숙주 세포의 크기보다 작은 분자량 컷오프가 있는 산업적으로 사용되는 기타 여과 시스템을 사용한 여과를 통해 수행될 수 있다. 중량 또는 밀도 기반으로 바이오매스 제거는 예를 들어 침전제, 낮은-관성력(g-force) 디캔터 원심 분리기, 디스크 스택 분리기, 2-상 노즐 원심 분리기, 고체 배출기 원심 분리기 또는 하이드로사이클론을 사용하여, 중력 침전 또는 원심 분리를 통해 수행할 수 있다. 본원에 개시된 바와 같이, 바이오매스를 제거하면 단백질 그리고 바이오매스와 불용성 발효 불순물을 포함하는 고형물 (무거운 상(phase))을 포함하는 농축물 (즉, 가벼운 상(phase) 또는 투명 세포 브로스)이 생성된다. 바이오매스 제거용 적절한 조건 (예를 들면, 관성력, 침전 시간, 원심 분리 시간, 원심분리 투입분에서 고형분 %, 원심 분리 공급 속도)은 투명 세포 브로스에서 바이오 매스 및 불용성 발효 불순물을 최소화하는 것을 목표로 하는 당 업계에 알려진 방법을 사용하여 결정될 수 있다. 일부 구체예들에서, 바이오매스의 제거로 5 % 미만, 1 % 미만, .5 % 미만 또는 0.1 % 미만의 습식 패킹된 고형물 부피를 갖는 투명한 세포 브로스가 제공된다. 일부 구체예들에서, 바이오매스를 제거하면 1g/L ~ 50g/L 농도의 단백질을 포함하는 투명한 세포 브로스가 제공된다. 일부 구체예들에서, 투명 세포 브로스는 연마 원심 분리를 거쳐 잔류 고형물을 제거한다. 일부 구체예들에서, 바이오매스 제거로부터 수득된 고체는 단백질을 가용화하고, 바이오매스를 제거하는 적어도 일회 이상의 라운드를 거치며, 여기서 모든 원심 분리액은 본 명세서에 제공된 방법에 따라 추가 처리를 위해 최종적으로 복합된다.
구체예들에 따라, 단계 A02는 단계 A04 전 및/또는 후에, 수행될 수 있다. 단계 A02는 여러 번 수행될 수 있다. 예를 들면, 단계 A04 전 및/또는 후, 바이오매스를 제거하기 위해 여러 라운드의 원심 분리 및/또는 여과를 수행할 수 있다.
단계 A04에서 재조합 단백질이 가용화된다. 단계 A02가 수행되지 않는 일부 구체예들에서, 재조합 숙주 세포 및 재조합 숙주 세포와 연합된 재조합 단백질을 원심분리시켜 바이오매스의 펠렛 (이하 "세포 펠렛")으로 만들고, 상층액은 폐기함으로써, 가용화 전에 해당 재조합 숙주 세포와 함께 재조합 단백질을 단리해낼 수 있다. 이 단계는 재조합 단백질이 불용성 및/또는 해당 단백질 자기들끼리 및/또는 재조합 숙주 세포와 응집되고 및/또는 재조합 숙주 세포의 표면에 달라 붙는 경우, 유리할 수 있다. 다른 구체예들에서, 상기 재조합 단백질은 전체 세포 브로스에 가용화된다. 일부 구체예들에서, 상기 재조합 단백질은 단계 A02를 수행하여 생성된 투명한 세포 브로스에 용해된다.
일부 구체예들에서, 재조합 단백질의 가용화는 가용화제를 전체 세포 브로스, 투명 세포 브로스 또는 세포 펠렛에 첨가함으로써 달성될 수 있다. 적합한 가용화제의 비-제한적 예로는 계면활성제, 하이드로트로프(hydrotropes), SDS, 우레아, 시스테인, 구아니딘 티오시아네이트, 다당류를 가수분해하는 효소 (예를 들자면, 글루카나아제, 리티카제, 만나아제, 키티나제), pH가 높은 물 (pH 11-12의 H20)이 내포된다. 상이한 유형의 재조합 단백질에 대해 상이한 가용화제가 선택될 수 있다. 단백질 가용화에 적합한 조건 (예를 들면, 추출 제의 유형 및 양, 온도, 배양 시간, 교반, pH)은 재조합 단백질의 수율을 최대화하고, 재조합 숙주 세포의 용해를 최소화시키고, 그리고 불순물의 가용화를 목표로 하는 당업계에 알려진 방법을 사용하여 결정될 수 있다. 상기 논의된 바와 같이, 재조합 단백질이 불용성이거나, 및/또는 단백질 자체끼지 및/또는 재조합 숙주 세포 안 또는 근처에서 응집되는 특정 구체예에서, 해당 재조합 숙주 세포는 원심분리될 수 있고, 상청액은 가용화제를 해당 펠렛에 첨가하기 전에 폐기될 수 있다.
일부 구체예들에서, 가용화 및/또는 침전 전에 막으로부터 잉여 단백질을 제거하기 위해, 해당 재조합 숙주 세포의 막을 천공하거나 또는 투과시키기 위해 다양한 기술이 사용될 수 있다. 이러한 방법에는 화학적 파괴, 기계적 파괴 또는 초음파 처리가 내포된다. 세포막의 기계적 파괴에는 균질화, 전단력, 동결/해동, 가열, 압력, 초음파 처리 및 여과가 내포된다. 화학적 파괴에는 트리톤, 도데실 설페이트 나트륨과 같은 세제; 또는 우레아 및 구아니딘과 같은 카오트로픽 제제가 내포된다. 다른 방법들이 당분야에 잘 공지되어 있다.
특정 구체예에서, 우레아는 재조합 단백질을 가용화하고, 재조합 숙주 세포의 파괴를 방지하기 위해 가용화제로 사용된다. 우레아의 농도는 재조합 숙주 세포의 파괴를 방지하기 위해 가변적일 수 있다. 구체예에 따라, 우레아 농도의 양은 4M 내지 10M 범위가 될 수 있다. 다양한 구체예들에서, 상기 재조합 숙주 세포 및 재조합 단백질은 우레아와 함께 1-2 시간, 1-3 시간, 또는 1-4 시간 동안 항온처리될 수 있다. 해당 구체예에 따라, 구아니딘 티오시아네이트와 같은 다른 공지된 카오트로프는 재조합 단백질을 용해시키는데 사용된다.
특정 구체예에서, 높은 pH H2O 또는 수성 완충액은 재조합 단백질을 가용화하고, 재조합 숙주 세포의 파괴를 방지하는 데 사용된다. 높은 pH H20 또는 수성 완충액의 pH는 재조합 숙주 세포의 파괴를 방지하기 위해 변경될 수 있다. 해당 구체예에 따라, 상기 높은 pH H2O의 pH는 pH 10 내지 pH 12.5, pH 10.5 내지 pH 12.5, pH 11 내지 pH 12.5, pH 11.5 내지 pH 12.5, pH 12 내지 pH 12.5, pH 10 내지 pH 12, pH 10.5 내지 pH 11.0, pH 10.5 내지 pH 11.5, pH 10.5 내지 pH 12, pH 10.5 내지 pH 12.5, pH 11 내지 pH 11.5, pH 11 내지 pH 12, pH 11.5 내지 pH 12.5, 또는 ph 12 내지 pH 12.5 범위일 수 있다. 다양한 구체예들에서, 상기 재조합 숙주 세포 및 재조합 단백질은 높은 pH의 H2O와 함께 적어도 10 분, 적어도 15 분, 적어도 30 분, 적어도 45 분, 적어도 60 분, 적어도 75 분, 적어도 90 분, 적어도 115 분 또는 적어도 120 분 동안 항온처리될 수 있다.
특정 구체예에서, 균질화(homogenization)는 숙주 세포를 용해하는데 사용된다. 균질화 압력 (psi)은 5,000-100,000 psi, 5,000-10,000 psi, 10,000-20,000 psi, 20,000-30,000 psi, 30,000-40,000 psi, 40,000-50,000 psi, 50,000-60,000 psi, 60,000-70,000 psi, 70,000-80,000 psi, 80,000-90,000 psi, 90,000-100,000 psi 일수 있다. 균질화는 한 번의 패스 또는 다중 패스(passes)일 수 있다. 일부 구체예들에서, 상기 균질화는 1 회 패스, 2 회 패스, 3 회 패스, 4 회 패스 또는 5 회 패스이다.
단계 A06에서, 발효로부터 불순물이 제거된다. 단계 A06은 단계 A04 및/또는 단계 A08 전 및/또는 후에 수행될 수 있다. 단계 A06은 임의의 횟수로 반복될 수 있다. 발효에서 불순물을 제거하려면, 여과, 흡수 (예를 들면, 목탄 또는 고체 흡수), 투석 및 코아세르베이션(coacervation)에 의해 유도된 상 분리 또는 다양한 화학 물질을 사용할 수 있다. 상 분리가 코아세르베이션에 의해 유도되는 구체예들에서, 코아세르베이션은 상 분리를 유도하기에 충분한 온도로 발효를 냉각시킴으로써 유도될 수 있다. 다른 구체예들에서, 용액으로부터 단백질을 침전시키는데 사용되는 코스모트로프(cosmotrope) 및/또는 화합물을 첨가하여 상 분리를 화학적으로 유도할 수 있다. 상 분리를 사용한 불순물 제거의 상세한 구체예는 도 C와 관련하여 아래에 설명되어 있다. 재조합 단백질이 열에 안정한 일부 구체예들에서, 다른 단백질을 변성시키기 위해 발효에 고온에 가하고, 원심분리하여 해당 변성 단백질을 용액의 단백질로부터 분리시킴으로써, 다른 단백질들이 제거될 수 있다.
일부 구체예들에서, 불순물은 여과, 정밀여과, 투석여과 및/또는 한외여과 (예를 들면, 탈이온수에 대하여)를 이용하여 제거된다. 정밀여과에 적합한 막에는 0.1 uM 내지 1 uM가 내포될 수 있다. 한외여과에 적합한 막의 비-제한적 예로는 50 kDa 내지 800 kDa, 100 kDa 내지 800 kDa, 200 kDa 내지 800 kDa, 300 kDa 내지 800 kDa, 400 kDa 내지 800 kDa, 500 kDa 내지 800 kDa, 600 kDa 내지 800 kDa, 700 kDa 내지 800 kDa, 100 kDa 내지 700 kDa, 200 kDa 내지 700 kDa, 300 kDa 내지 700 kDa, 400 kDa 내지 700 kDa, 500 kDa 내지 700 kDa, 600 kDa 내지 700 kDa, 또는 500 kDa 내지 600 kDa의 분자량 컷-오프를 갖는 소수성 막 (예를 들면, PES, PS, 셀룰로스 아세테이트)이 내포된다. 일부 구체예들에서, 한외여과는 물에 재조합 단백질 슬러리를 유지시키고, 불순물을 포함하는 투과물(permeate)을 만든다. 한외 여과 (예를 들어, 막, 온도, 부피 대체)를 위한 적합한 조건은 투과물의 밀도를 최대화하는 것을 목표로 하는 당업계에 공지된 방법을 사용하여 결정될 수 있다. 일부 구체예들에서, 상기 한외여과는 1 g/mL 내지 30 g/mL의 밀도를 갖는 잔류물(rententate)을 제공한다. 일부 구체예들에서, 한외 여과는 농축된 잔류물을 생성하는 농축 단계, 이어서 불순물을 제거하고 물에 현탁된 단백질 슬러리를 생성하는 투석여과(diafiltration) 단계를 포함한다. 일부 이러한 구체예들에서, 상기 농축된 잔류물은 시작 부피에 대해 부피가 2-배에서 12-배 감소하는 농축 인자를 갖는다. 일부 구체예들에서, 상기 투석여과는 3-배에서 10-배 사이의 일정한 부피 대체를 제공한다.
해당 구체예에 따라, 그리고 제거될 불순물의 유형에 따라, 불순물 제거 방법이 다를 수 있다. 단리된 재조합 단백질로부터 지질 불순물을 제거하는 것은 당 업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 지질에 특이적으로 결합하는 숯 또는 기타 흡착 매질에 대한 흡착이 내포된다. 단리된 재조합 단백질로부터 다당류 불순물을 제거하는 것은 당업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 다당류를 가수 분해하는 효소로 처리한 다음, 한외여과에 의해 생성된 작은 당을 제거하는 것이 내포된다. 이러한 효소의 비-제한적인 예로는 글루카나제, 리티카제, 만나제 및 키티나제가 내포된다.
단계 A08에서 상기 가용화된 재조합 단백질이 단리된다. 상기 가용화된 재조합 단백질은 추출 완충제, 크기 배제 크로마토그래피, 겔 여과, 초음파 단백질 추출 및 이온 교환 크로마토그래피 사용을 비롯한, 다양한 방법으로 분리될 수 있다. 바이오메스가 임의 선택적 단계 A02에서 제서되지 않은 일부 구체예들에서, 상기 재조합 단백질은 해당 재조합 숙주 세포와 함께 단리될 수 있다.
일부 구체예들에서, 상기 재조합 단백질은 단일 단리 단계 또는 다른 단리 단계들에 추가하여 침전된다. 상기 가용화된 재조합 단백질의 침전은 침전제의 발현에 추가하여 실행된다. 이러한 침전제의 비-제한적인 예로는 황산 이온 (예를 들면, 황산 암모늄, 황산나트륨, 황산) 또는 시트레이트 이온 (예를 들면, 시트르산 나트륨)이 내포된다. 일부 구체예들에서, 상기 침전제는 산이다. 일부 구체예들에서, 상기 침전제는 염이다. 한 구체예에서, 상기 침전제는 H2SO4이다.
상기 가용화된 재조합 단백질을 포함하는 용액의 pH를 조정하거나 또는 변경하기 위해 임의의 적절한 산이 사용될 수 있다. 적절한 산에는 염산 (HCl), 황산 (H2SO4), 질산, (HNo3), 붕산 (H3BO3), 포스프로산 (H3PO4), 불산 (HF), 브롬화 수소산 (HBr), 과염소산 (HClO4), 요오드 산 (HI); 구연산, 포름산, 아세트산, 프로피온산, 부티르산, 발레르산, 카프리 옥산, 옥살산, 젖산, 말산, 벤조산, 탄산, 요산, 타우린, p-톨루엔 설폰 산과 같은 유기산, 트리 플루오로 메탄 술폰산, 아미노 메틸포폰산 및 2,2,2,-트리클로로 아세트산 (TCA); 또는 이들의 임의의 조합 또는 당업계에 공지된 다른 적절한 산이 내포된다. 상기 개시된 임의의 산의 산성 염도 사용될 수 있다.
일부 구체예들에서, 상기 재조합 단백질은 pH 4-10에서 된다. 일부 구체예들에서, 성가 침전은 pH 4, 5, 6, 7, 8, 9, 또는 10에서 된다. 일부 구체예들에서, 상기 침전은 적어도 pH 4, 적어도 pH 4.5, 적어도 pH 5, 적어도 pH 5.5, 적어도 pH 6, 적어도 pH 6.5, 적어도 pH 7, 적어도 pH 7.5, 적어도 pH 8, 적어도 pH 8.5, 적어도 pH 9, 적어도 pH 9.5, 적어도 pH 10에서 된다. 한 구체예에서, 상기 침전은 pH 7에서 된다. 일부 구체예들에서, 상기 침전은 pH 4-5, pH 5-6, pH 6-7, pH 7-8, pH 8-9, 또는 pH 9-10에서 된다.
상기 침전은 한 번, 두 번 또는 필요한 횟수만큼 반복될 수 있다. 일부 구체예들에서, 한 번 이상의 침전 단계가 수행되며, 각 침전 pH는 동일하다. 다른 구체예들에서, 한 번 이상의 침전 단계가 수행되며, 각 침전 pH는 상이하다. 예를 들면, 첫 번째 침전은 pH 4에서 수행되고, 그 다음 두 번째 침전은 pH 7에서 수행될 수 있다.
침전된 재조합 단백질의 분리는 본원에 개시된 바와 같이 크기, 무게, 밀도 또는 이들의 조합을 기반으로 달성될 수 있다. 일부 구체예들에서, 이러한 단리에 의해 잔류물로서 현탁된 재조합 단백질 슬러리, 그리고 폐기물을 포함하는 투과물이 제공된다. 재조합 단백질을 침전시키기 위한 적합한 조건 (예를 들어, 2가 음이온의 첨가 전 희석, 2가 음이온의 유형 및 양, 배양 온도, 배양 시간), 그리고 침전된 재조합 단백질을 단리하기 위한 적절한 조건은 현탁된 재조합 단백질 슬러리에서 재조합 단백질의 수율을 최대한으로 하기 위하여 당분야에 공지된 방법에 의해 결정될 수 있다. 일부 구체예들에서, 상기 현탁된 실크 단백질 슬러리 안의 침전된 재조합 단백질의 수율은 20 %에서 99 % 사이다. 일부 구체예들에서, 상기 현탁된 실크 단백질 슬러리는 30% 내지 65%의 습식 패킹된 고체 함량을 갖는다. 일부 구체예들에서, 상기 현탁된 실크 단백질 슬러리는 10 g/L 내지 50 g/L의 상기 실크 단백질을 포함한다. 일부 구체예들에서, 상기 실크 단백질을 침전시키는 단계, 그리고 해당 침전된 실크 단백질을 단리시키는 단계는 적어도 한 번 (동일한 또는 상이한 공정 조건을 이용) 반복되어, 수성 가용성 불순물을 추가로 씻어낸다.
임의선택적 단계 A10에서 상기 단리된 재조합 단백질은 농축된다. 상기 단리된 재조합 단백질의 농축은 고온 및/또는 감압 (예를 들면, 부분 진공)에서 증발시켜 수행할 수 있다. 상기 단리된 재조합 단백질을 농축하기 위한 적합한 조건 (예를 들어, 온도, 압력, 기간)은 건조 고형물의 함량이 증가된 단리된 재조합 단백질을 얻는 것을 목표로 하는 당업계에 공지된 방법을 사용하여 결정될 수 있다. 일부 구체예들에서, 상기 농축으로 원래 부피의 20 %에서 70 % 사이의 부피가 감소된다. 일부 구체예들에서, 상기 농축으로 3% 내지 20%의 건 고체를 포함하는 농축, 단리된 재조합 단백질이 제공된다.
임의선택적 단계 A12에서, 상기 단리된 재조합 단백질은 건조된다. 실크 단백질 분말을 얻기 위한 현탁된 실크 단백질 슬러리의 건조는 분무 건조, 드럼 건조기, 동결 건조 또는 유동 상(fluid bed) 건조에 의해 달성될 수 있다. 일부 구체예들에서, 상기 분말의 수분 함량이 10 % 미만, 9 % 미만, 8 % 미만, 6 % 미만, 5 % 미만, 4 % 미만, 3 % 미만, 2 % 미만 또는 1 %미만이다.
도 2는 본 발명의 한 가지 구체예에 따른 재조합 단백질을 분리하기 위한 공정 흐름을 도시한다. 당업자는 도 2에 도시된 단계의 일부는 대체 순서 및/또는 반복으로 수행될 수 있음을 이해할 것이다. 당업자는 개시된 구체예들이 여기에 제공된 방법의 범위를 제한하려는 것이 아님을 인지할 것이며, 이들 방법은 사용된 재조합 숙주 세포, 원하는 누적 수율, 누적 역가 및/또는 누적 생산성 또는 기타 요인에 따라 달라질 수 있음을 인지할 것이다.
단계 B05에서, 상기 재조합 숙주 세포는 용해되고 및/또는 그렇지 않으면 다른 방법으로 파괴되어, 해당 재조합 숙주 세포의 내용물이 발효에 방출된다. 해당 구체예에 따라, 재조합 숙주 세포를 다양한 각종 방법을 이용하여 파괴시킬 수 있다. 숙주 세포를 용해 및/또는 파괴하는 데 적합한 방법에는 고온 단시간 (HTST) 방법, 고-전단 세포 파괴, 물리적 균질화 및 화학적 균질화와 같은 열 사용이 내포된다.
임의선택적 단계 B04에서, 상기 재조합 단백질은 단계 A04에 대해 상기에서 설명된 바와 같이, 가용화된다. 단계 B04는 단계 B05의 전 또는 이후에 실행될 수 있다. 일부 구체예들에서, 단계 B04는 단계 B05의 전과 후에 실행될 수 있다.
임의선택적 단계 B02에서, 상기 바이오메스는 단계 A02에 대해 상기에서 설명된 바와 같이, 제거된다. 또한, 용해된 및/또는 파괴된 세포로부터 바이오매스를 제거하는 다른 방법은 재조합 단백질이 용해되는 경우, 원심 분리 및 여과가 내포될 수 있다.
임의선택적 단계 B06에서, 상기 불순물은 단계 A06에 대해 상기에서 설명된 바와 같이, 제거된다. 단계 B02 및 단계 B06은 다른 단계 이전 또는 이후에 수행되고, 반복적으로 수행될 수 있다. 일부 구체예들에서, 단계 B06은 단계 B08의 전과 후에 실행될 수 있다.
단계 B08에서, 상기 재조합 단백질은 단리된다. 상기 재조합 단백질을 단리하는 적합한 방법은 단계 A08에 대해 상기에서 설명된 바와 같다. 또한, 상기 재조합 단백질의 단리 방법에는 인지질을 제거하기 위해 여과에 추가 막을 사용하거나 및/또는 탈고무(degumming)를 이용하는 것이 내포된다.
임의선택적 단계 B10에서, 상기 재조합 단백질은 단계 A10에 대해 상기에서 설명된 바와 같이, 농축된다. 임의선택적 단계 B12에서, 상기 재조합 단백질은 단계 B10에 대해 상기에서 설명된 바와 같이, 건조된다.
도 3은 본 발명의 한 가지 구체예에 따른 재조합 단백질을 정제하기 위한 공정 흐름을 도시한다. 당업자는 도 3에 도시된 단계의 일부는 대체 순서 및/또는 반복으로 수행될 수 있음을 이해할 것이다. 개시된 구체예가 본 명세서에 제공된 방법의 범위를 제한하려는 것이 아니며, 방법이 다양한 인자에 기초하여 변경 될 수 있다는 것을 당업자는 인지할 것이다.
단계 C02에서, 상기 재조합 단백질을 변성시키기 위하여 강력한 카오트로프를 사용하여 2-상(phase) 수성 용액이 만들어진다. 적합한 카오트로프에는 구아니딘 티오시아네이트 (GD-SCN), 구아니딘 염산염 (GD-HCl), 구아니딘 요오드화물, 우레아, 과염소산 리튬, 아세트산 리튬, 염화 마그네슘, 도데실 설페이트 나트륨 (SDS), 요오드화 칼륨 (KI)이 포함되나, 이에 국한되지는 않는다. 해당 구체예에 따라, 상기 카오트로프 및 단백질을 가열하여, 해당 단백질의 변형을 용이하게 할 수 있다.
일부 구체예들에서, 코스모트로프 (본원에서 "침전제"라고도 함)를 용액에 첨가하여 상-분리를 용이하게 한다. 적합한 코스모트로프는 위에서 언급한 침전제들이 내포된다. 다른 구체예들에서, 높은 시작 농도의 카오트로프를 사용하여 재조합 단백질을 변성시킨 다음, 해당 카오트로프의 농도를 천천히 희석하여 상-분리를 얻는다.
단계 C04에서, 상기 상 분리의 점성 층이 얻어진다. 상 분리 유형에 따라, 다양한 방법을 사용하여 비-점성 층을 따라내거나 또는 추출하여 점성 층을 획득하거,나 또는 Hamilton 바늘 또는 피펫을 사용하여 점성 층을 추출할 수 있다. 당업자에게 다른 방법들이 공지될 것이다.
단계 C06에서, 상기 상 분리의 점성 층은 추가 가공되어 불순물을 제거한다. 적합한 투석제는 저농도의 이중 증류된 H20 또는 GD-SCN이 내포된다. 해당 구체예에 따라, 수행될 수 있는 다양한 투석 방법에은 카세트 투석 또는 당업계에 공지된 다른 적합한 방법이 내포될 수 있다. 일부 구체예들에서, 접선 흐름 여과 (TFF)를 이용하여 점성 층을 투석한다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 전장의 재조합 거미 실크 단백질이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 90-95%, 또는 95-100%이다. 일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 100%이다.
일부 구체예들에서, 상기 전장의 재조합 거미 실크 단백질이 측정되거나 또는 정량화된다. 크기 배제 크로마토그래피 (SEC), SDS-PAGE, 면역블롯 (웨스턴 블롯), 고성능 액체 크로마토그래피 (HPLC), 액체 크로마토그래피-질량 분광법 (LC-MS), 또는 고속 단백질 액체 크로마토그래피 (FPLC), 또는 당 업계에 알려진 다른 적절한 방법, 또는 이들의 조합들이 내포된 임의의 적절한 방법을 사용하여 전장 재조합 단백질의 양을 측정하거나 정량화할 수 있지만, 이러한 방법에 국한되지는 않는다. 한 구체예에서, 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 또다른 구체예에서, 전장의 재조합 거미 실크 단백질의 양은 크기 압출 크로마토그래피 (SEC)를 이용하여 측정된다.
실시예
하기는 본 발명을 수행하기 위한 특정 구체예들의 예시이다. 실시예는 오직 설명을 위하여 제공되며, 어떤 방식으로든 본 발명의 범위를 제한하고자 하는 것이 아니다. 사용되는 값들 (예컨대, 양, 온도, 등)에 관하여 정확도를 보장하기 위하여 노력을 하였으나, 일부 실험 오차 및 편차를 물론 고려하여야 한다.
달리 지시되지 않는 한, 본 발명의 실시는 숙련된 기술자에게 통상적인 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학적 방법을 이용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다. 예를 들면, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3 rd Ed. (Plenum Press) Vols A and B(1992) 참고.
실시예 1: 일-단계 알칼리 조건을 이용한 18B 정제
재조합 단백질을 분비하는 숙주 세포를 파괴하지 않고, 해당 재조합 단백질을 용해시키기 위해 높은 pH 용액을 사용했다. pH 완충 용액 농도 및 배양 시간을 시험하여 P. 파스토리스(P. Pastoris)에서 발현되는 C 말단 3x FLAG 태그 (서열 식별 번호 40)를 사용하여 아르기오페 브루네니치(Argiope bruennichi) MaSp2 블록 ("18B", 서열 식별 번호 38)의 재조합 거미줄 단백질에 대한 용해도를 결정했다. 상기 FLAG 태그는 해당 18B 펩티드 서열의 C-말단에 글리신 잔기 (G) 링커에 의해 연계된다.
구체적으로, 세포 배양물 발효 브로스에 18B 재조합 단백질을 발현시키는 피치아 파스토리스(Pichia pastoris)를 접종시키고, 해당 18B 단백질이 발현되도록 항온처리하였다. 상기 배양물을 원심 분리하여 세포를 수확하고, 세포 펠렛을 1:1 (동량의 세포 펠렛과 물) 또는 1:3 (1 부분의 세포 펠렛과 2 부분의 물)의 비율로 증류수에 재현탁시켰다. 상기 세포 펠렛 현탁액의 pH를 2-10M NaOH를 사용하여 최종 pH 11.8-11.9로 조정하였다. 상기 세포 펠렛 현탁액을 교반하면서 실온에서 15-30 분 동안 항온처리하였다. 항온처리하는 동안 pH를 11.8-11.9로 유지하기 위해 NaOH를 사용하여 pH를 조정하였다. 상기 세포 펠렛 현탁액은 원심분리되고, 해당 재조합 단백질이 함유된 상청액이 수집되었다. 상기 상청액을 동결건조시켜, 18B 단백질을 농축시키고, 회수된 18B 단백질의 양은 하기에서 기술된 바와 같이 크기 압출 크로마토그래피 (SEC) (도 4A 및 4B)에 의해 평가되었다.
고-분자량, 저-분자량 및 중간-분자량 불순물, 단량체 18B 및 응집체 18B의 상대적인 양은 크기 배제 크로마토그래피 (SEC)를 사용하여 분석되었다. 18B 분말을 5M 구아니딘 티오시아네이트(GdSCN)에 용해시키고, Yarra SEC-3000 SEC-HPLC 컬럼에 주입하여 분자량 기반으로 성분을 분리했다. 굴절률은 검출 방식으로 사용되었다. 18B 응집체, 18B 단량체, 저-분자량 (1-8 kDa) 불순물, 중간-분자량 불순물 (8-50 kDa) 및 고-분자량 불순물 (110-150 kDa)을 정량화했다. 관련 조성은 질량 % 및 면적 %로 보고되었다. BSA는 모든 단백질의 > 90 %가 서로 ~ 7 % 이내의 dn/dc 값 (굴절률의 응답 계수)을 나타낸다는 가정 하에 일반 단백질 표준으로 사용되었다. 정체 시간 표준으로 폴리(에틸렌 옥시드)를 사용하였고, 당해 방법의 일관된 성능을 보장하기 위해 BSA 측정기(calibrator)를 점검 표준으로 사용했다. 대조군으로, 18B 단백질을 가용화시키기 위해 우레아를 이용하여 정제된 샘플은 또한 평가되었다.
pH 11.9에서 P. 파스토리스 (P. pastoris) 세포 펠렛으로부터 18B의 알칼리 추출로 5M GdSCN을 사용하여 단리된 18B 단백질의 양에 대해 정규화된 전장의 18B 단백질의 70-75 % 추출 수율을 얻었다. 추출된 18B 단백질의 SEC 면적 %를 사용하여 샘플의 순도를 산출했다. 알칼리 추출물에서 18B 단량체의 순도는 약 35 % 단량체 면적, 35 % 중간-분자량 불순물 면적 및 28 % 저-분자량 불순물 면적 %였다 (도 4A4B). 이에 비해, 10M 우레아로 18B 단백질의 가용화는 약 26 %의 단량체 면적, 27 %의 중간-분자량 불순물 면적 및 45 %의 저-분자량 불순물 면적으로, 18B 단백질의 더 낮은 수율을 얻었다. 이러한 데이터는 알칼리 가용화 및 추출 방법이 18B 수율을 높이고, 단리된 18B 단백질의 순도를 높였음을 보여준다.
실시예 2: 단리된 실크 폴리펩티드의 추가 정제
18B 거미 단백질을 추가로 정제하기 위해, 상기 알칼리 추출에서 단리된 18B 샘플을 750k MW 필터와 8 통과부피(diavolumes)의 물을 사용하여 한외여과 및 접선 흐름 여과하였다. 여과되지 않은 단백질, 한외 여과된 단백질 그리고 1, 3, 6 및 8 통과부피의 물 이후 단백질을 포함하는 샘플은 이전에 설명한대로 SEC를 통해 평가되었다. 각 샘플에서 18B 단량체, 중간-분자량 불순물, 저-분자량 불순물 및 고-분자량 불순물에 대한 SEC % 면적이 도 5에 도시되어 있다. 여과되지 않은 단백질 샘플은 맨 왼쪽에 있는 막대 ("조정되지 않은 공급물(feed)")에 표시되고, 한외 여과된 단백질 샘플은 왼쪽 두 번째 막대 ("조정되지 않은 UFR")에 표시되고, 1, 3, 6 또는 8 통과부피 샘플은 차례로 중간 좌측, 중간 우측, 우측에서 두 번째, 그리고 맨 우쪽 막대에서 표시된다 (도 5). 통과부피가 증가하면, 18B 단량체의 면적 %가 증가하고, 저-분자량 불순물의 면적 %는 감소했다.
실시예 3: 두-단계 알칼리 추출을 이용한 18B 정제
세포에서 18B 단백질의 회수율을 높이기 위해, 두-단계 추출 공정도 수행되었다. 18B를 발현하는 P. 파스포리스(P. pastoris) 세포의 온전체 세포 브로스의 pH를 2M NaOH를 사용하여 pH 11.8로 조정하고, 첫 번째 알칼리 추출 단계로서 30-60 분 동안 항온처리하였다. 18B를 발현하는 P. 파스포리스(P. pastoris) 세포의 전체 세포 브로스 대조군 샘플은 18B 단백질을 가용화시키고, 추출하기 위해 대략 15분 동안 5M GdSCN과 함께 항온처리하였다. 세포를 펠렛화시키고, 상청액을 수거하였다. 첫 번째 알칼리 추출 단계에서 남은 펠렛은 두 번째 추출 단계로 pH 11.8의 물을 1:1, 1:2 또는 1:3의 펠렛: 물의 비율로 첨가하여 재-추출했다. 재조합 18B 단백질을 함유하는 1 차 및 2 차 알칼리 추출액으로부터의 상청액을 수집하였다. 18B 단백질을 농축하기 위해 상청액을 동결 건조하고 샘플을 실시예 1에 이전에 기재된 바와 같이 SEC를 통해 평가하였다. 각 추출 조건 및 GdSCN 대조군에 대해 두 개의 개별 실험 실행을 나타낸다 (도 6A). 알칼리수 (1:2 및 1:3 비율)의 양을 늘리면, 회수된 18B 단백질의 양이 증가했다. 그러나, 이중 추출 18B 단량체 단백질의 순도는 단일 추출에서 가장 높았다. 18B 단량체의 순도는 두 번째 추출에 사용된 펠렛에 비해 알칼리수가 증가함에 따라 증가했다 (도 6B).
추출에서 얻은 샘플은 750k MW 필터와 최대 8 통과부피의 물을 사용하여 한외여과 및 접선 흐름 여과를 통해 정제되었다. 생성된 실크 폴리펩티드 조성물의 순도는 SEC를 통하여 평가되었다 (도 7A7B). 도 7A에서는 18B 단량체, 중간-MW 불순물, 그리고 저-분자량 불순물의 면적%를 보여준다. 접선 흐름 여과 동안 증가된 통과부피로 인하여 18B 단량체 피크 면적이 증가되었다. 도 7B에서는 각 샘플, 출발 재료 ("SM"), 한외여과된 잔류물 ("UF R"), 그리고 접선 흐름 여과 통과부피 샘플 1, 2, 3, 4, 6, 그리고 8 (DF 1, 2,3, 4, 6, 8)에 대한 SEC 피크를 보여준다.
실시예 4: pH를 변경하여 알칼리 추출물로부터 실크 폴리펩티드 추가 단리
알칼리 추출에서 18B 재조합 단백질은 추출의 pH를 조정하여 알칼리 추출에서 침전되었다. 본 실험에서는 온전체 세포 배양 브로스에서 NaOH를 최종 pH 11.8 ~ 11.9가 되도록 첨가하여 온전체 세포 브로스의 pH를 조절함으로써 알칼리 추출을 먼저 수행하고, 이로 인하여 알칼리 세포 현탁액이 만들어진다. 상기 세포 현탁액을 교반하면서 실온에서 15-30 분 동안 항온처리하였다. 항온처리 후, 세포 현탁액을 원심 분리하고, 가용화된 18B 단백질을 함유하는 알칼리성 상청액을 수집하여, 18B 알칼리성 추출물을 생성하였다.
18B 알칼리 추출물 샘플은 18B 단백질을 침전시키기 위해 다른 pH 조건으로 처리되었다. H2SO4를 알칼리 추출물 샘플에 최종 pH가 4, 5, 6, 7, 8, 9, 또는 10이 되도록 추가하였다. 그 다음, 18B 재조합 단백질을 포함하는 침전물은 상기 알칼리 추출물로부터 단리되었다. 상기 침전된 샘플은 이미 기술된 바와 같이 SEC를 통하여 평가되었다. 도 8에서는 각 pH 조건에 있어서 고-분자량 (HMW) 피크, 18B 단량체 및 응집체 피크, 중간-MW (IMW) 및 저-MW (LMW) 피크의 SEC % 면적 순도를 보여준다. 도 9에서는 시험된 각 침전제 pH에 대한 18B 단백질의 % 수율을 보여준다. 모든 조건 중에서, 침전 단계의 pH 7이 18B 단백질의 초기 알칼리 추출 후 단일 단계 침전 방법에 가장 효과적인 것으로 밝혀졌으며, ~ 70 % % 면적은 약 70 %의 순도를 나타낸다. 도 10은 pH 6에서 18B 침전물에 대한 SEC 프로파일을 보여준다.
투석원심분리에 추가하여, 상기 알칼리 추출물을 단리시키기 위해 TFF (접선 흐름 여과) 또한 수행되었다. 그러나, 투석원심분리는 불순물을 제거하는 데 TFF보다 더 효과적이었으며, 일반적으로 18B 단백질 순도가 >70 % 인 단백질 회수율은 60-70 %이었다.
pH 6에서 획득된 18B 단백질 침전물을 동결 건조하고, 섬유로 습식-방적시킨 후 점착력을 측정하였다. 동결건조된 18B 단백질을 포름산에 용해시켜, 최종 단백질 양이 36 중량 %가 되도록 하였다. 용해된 단백질을 100 % 에탄올 응집 조(bath)에 40 μl/분으로 압출하여 섬유를 만들었다. 이 방법으로 생산된 18B 섬유는 19.4 cN/직물(text)의 강도를 가졌다
실시예 5: 알칼리 조건 vs. 염 침전을 이용한 P0 회수.
pH 완충 용액 농도 및 배양 시간을 시험하여, 세포 배양 물로부터 추출하기 위해 대장균(E. coli) 세포 용 해물에서 P0 (서열 식별 번호: 39) 재조합 실크 단백질의 용해에 있어서 이들의 사용을 결정했다.
세포 배양물 발효 브로스에 C 말단 6x-His 태그를 갖는 P0 재조합 단백질을 발현시키는 대장균(E. coli)를 접종시키고, 해당 P0 단백질이 발현되도록 항온처리하였다. 상기 배양액을 15,000 rcf에서 원심분리하여 세포를 펠렛화했다. 상기 상청액을 제거하고, 상기 세포 펠렛은 1:4 (세포 펠렛: 완충) 또는 1:9 (세포 펠렛: 완충)의 비율에서 H2O에 재-현탁시키고, 15-60 분 동안 항온처리하였다. 상기 재-현탁된 세포 펠렛의 pH는 NaOH를 이용하여 최종 pH가 9, 10, 10.5 또는 11이 되도록 조정하였다. 대조군으로써, 재-현탁된 세포 펠렛 샘플은 5M 구아니딘 티오시아네이트 (GdSCN)와 함께 항온처리하고, 1.5 분 동안 초음파분쇄시켰다. 샘플을 볼텍싱하고, 로티세리에(rotisserie) 믹서를 사용하여 균질화시켰다. 용해물은 15,000 rcf 에서 5 분 동안 원심분리를 통해 정화되었고, P0 단백질을 함유하는 정화된 상청액이 유지되었다. 상기 상청액은 0.25 μm를 이용하여 여과시키고, BCA, ELISA, 그리고 면역블랏에 의해 분석되었다.
샘플을 1 mg/ml 단백질 농도로 정규화하고, 각 샘플에서 가용화된 P0의 양을 항-His 항체를 사용하여 웨스턴 블랏을 통해 평가했다(도 11). 라인 H1은 5M GdSCN에서 초음파처리를 통해 용해된 대조군 샘플이다. 라인 B1-B4는 pH 9, pH10, pH 10.5, 그리고 pH 11에서 1:4의 세포 펠렛:완충제 비율로 혼합된 샘플들이고, 라인 B7-B10은 pH 9, pH10, pH 10.5, 그리고 pH 11에서 1:9 세포 펠렛:완충제 비율로 혼합된 샘플들이다. 라인 C2-C4는 GdSCN과 함께 15, 30, 또는 60 분 동안 항온처리된 샘플이다.
예시적인 방법에서, 세포 배양물 발효 브로스에 P0 재조합 단백질을 발현시키는 대장균(E. coli)을 접종시키고, 해당 P0 단백질이 발현되도록 항온처리하였다. 상기 배양액을 15,000 rcf에서 원심분리하여 세포를 펠렛화했다. 상기 세포 펠렛은 1:1 또는 1:3의 세포 펠렛: 액체 비율로 H2O에 재-현탁되며, 해당 현탁액은 10,000 내지 40,000 psi에서 균질화되어, 대장균(E. coli) 세포를 용해시킨다. 상기 용해물은 원심 분리를 통해 정화되고, 불용성 P0가 있는 세포 펠렛이 유지된다. 상기 세포 펠렛은 H2O에 재-현탁되고, 해당 세포 펠렛 현탁액의 pH를 2-10M NaOH를 사용하여 최종 pH 11.5로 조정한다. 상기 세포 펠렛 현탁액을 교반하면서 실온에서 15-60 분 동안 항온처리한다. 항온처리하는 동안 pH를 11.5로 유지하기 위해 NaOH를 사용하여 pH를 조정한다. 항온처리 후, 상기 세포 현탁액을 원심 분리하고, 재조합 P0 단백질을 함유하는 상청액을 수집하였다.
추가 방법으로써, 10M 우레아를 갖는 알칼리 완충제를 이용하여 세포 펠렛으로부터 불용성 P0를 또한 추출해낼 수 있다. 상기 세포 펠렛을 H2O에 재-현탁 후, 해당 세포 펠렛 현탁액의 pH를 2-10M NaOH를 사용하여 최종 pH 11.5로 조정하고, 우레아는 10M의 최종 우레아 농도가 되도록 첨가한다. 상기 세포 펠렛 현탁액을 교반하면서 실온에서 15-60 분 동안 항온처리한다.
모든 방법에서, 상기 단리된 재조합 P0 단백질은 추가 정화 단계, 이를 테면 여과, 원심분리, 침전, 또는 크로마토그래피를 통하여 추가 정제될 수 있다.
균등예
본 발명이 특히 바람직한 구체예들과 다양한 대안적인 구체예들을 참조하여 도시되고 설명되었지만, 관련 기술 분야의 숙련자들은 본 발명의 정신 및 범위를 벗어나지 않고 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다.
본 명세서의 본문 내에 인용된 모든 참고 문헌, 등록된 특허 및 특허 출원은 모든 목적을 위해 전체적으로 참고로 포함된다.
Figure pct00010
Figure pct00011
SEQUENCE LISTING <110> BOLT THREADS, INC. <120> ALKALINE PURIFICATION OF SPIDER SILK PROTEINS <130> BTT-013WO <140> PCT/US2019/063208 <141> 2019-11-26 <150> 62/772,588 <151> 2018-11-28 <160> 46 <170> PatentIn version 3.5 <210> 1 <211> 181 <212> PRT <213> Aliatypus gulosus <400> 1 Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser 1 5 10 15 Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala 20 25 30 Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe 35 40 45 Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser 50 55 60 Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg 65 70 75 80 Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala 85 90 95 Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala 100 105 110 Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu 115 120 125 Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala 130 135 140 Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser 145 150 155 160 Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly 165 170 175 Ala Gly Ser Ala Ser 180 <210> 2 <211> 126 <212> PRT <213> Plectreurys tristis <400> 2 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser 20 25 30 Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala 35 40 45 Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly 50 55 60 Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala 65 70 75 80 Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala 85 90 95 Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala 100 105 110 Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 115 120 125 <210> 3 <211> 239 <212> PRT <213> Plectreurys tristis <400> 3 Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala 1 5 10 15 Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys 20 25 30 Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln 35 40 45 Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln 50 55 60 Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe 65 70 75 80 Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser 85 90 95 Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro 100 105 110 Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala 115 120 125 Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala 130 135 140 Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser 145 150 155 160 Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser 165 170 175 Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro 180 185 190 Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala 195 200 205 Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln 210 215 220 Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser 225 230 235 <210> 4 <211> 182 <212> PRT <213> Araneus gemmoides <400> 4 Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly 1 5 10 15 Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser 20 25 30 Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser 35 40 45 Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala 50 55 60 Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser 65 70 75 80 Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser 85 90 95 Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser 100 105 110 Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr 115 120 125 Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser 130 135 140 Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser 145 150 155 160 Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala 165 170 175 Thr Ser Ile Ser Ala Val 180 <210> 5 <211> 180 <212> PRT <213> Argiope aurantia <400> 5 Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala 1 5 10 15 Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala 20 25 30 Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser 35 40 45 Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser 50 55 60 Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser 65 70 75 80 Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala 85 90 95 Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser 100 105 110 Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn 115 120 125 Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala 130 135 140 Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala 145 150 155 160 Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn 165 170 175 Ala Ala Asn Ala 180 <210> 6 <211> 199 <212> PRT <213> Deinopis spinosa <400> 6 Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly 1 5 10 15 Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser 20 25 30 Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala 35 40 45 Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln 50 55 60 Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala 65 70 75 80 Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly 85 90 95 Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val 100 105 110 Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser 115 120 125 Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu 130 135 140 Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala 145 150 155 160 Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr 165 170 175 Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln 180 185 190 Ala Val Thr Gly Val Gly Leu 195 <210> 7 <211> 171 <212> PRT <213> Nephila clavipes <400> 7 Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala 1 5 10 15 Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala 20 25 30 Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln 35 40 45 Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln 50 55 60 Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr 65 70 75 80 Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala 85 90 95 Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala 100 105 110 Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser 115 120 125 Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu 130 135 140 Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly 145 150 155 160 Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln 165 170 <210> 8 <211> 268 <212> PRT <213> Argiope trifasciata <400> 8 Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala 1 5 10 15 Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala 20 25 30 Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly 35 40 45 Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly 50 55 60 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly 65 70 75 80 Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 85 90 95 Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val 100 105 110 Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala 115 120 125 Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly 130 135 140 Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly 145 150 155 160 Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly 165 170 175 Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly 180 185 190 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly 195 200 205 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly 210 215 220 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly 225 230 235 240 Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly 245 250 255 Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val 260 265 <210> 9 <211> 420 <212> PRT <213> Nephila clavipes <400> 9 Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly 1 5 10 15 Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro 20 25 30 Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr 35 40 45 Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 50 55 60 Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro 65 70 75 80 Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly 85 90 95 Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 100 105 110 Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr 115 120 125 Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 130 135 140 Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro 145 150 155 160 Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly 165 170 175 Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly 180 185 190 Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala 195 200 205 Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly 210 215 220 Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly 225 230 235 240 Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr 245 250 255 Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro 260 265 270 Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly 275 280 285 Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro 290 295 300 Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly 305 310 315 320 Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr 325 330 335 Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro 340 345 350 Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly 355 360 365 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro 370 375 380 Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr 385 390 395 400 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly 405 410 415 Pro Tyr Gly Pro 420 <210> 10 <211> 376 <212> PRT <213> Latrodectus hesperus <400> 10 Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu 1 5 10 15 Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu 20 25 30 Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly 35 40 45 Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala 50 55 60 Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val 65 70 75 80 Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln 85 90 95 Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp 100 105 110 Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys 115 120 125 Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser 130 135 140 Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn 145 150 155 160 Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val 165 170 175 Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val 180 185 190 Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln 195 200 205 Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly 210 215 220 Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala 225 230 235 240 Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln 245 250 255 Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr 260 265 270 Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala 275 280 285 Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser 290 295 300 Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp 305 310 315 320 Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln 325 330 335 Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile 340 345 350 Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala 355 360 365 Pro Arg Leu Gly Ile Asp Leu Ser 370 375 <210> 11 <211> 200 <212> PRT <213> Argiope trifasciata <400> 11 Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly 1 5 10 15 Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe 20 25 30 Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala 35 40 45 Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser 50 55 60 Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser 65 70 75 80 Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val 85 90 95 Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu 100 105 110 Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala 115 120 125 Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly 130 135 140 Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln 145 150 155 160 Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser 165 170 175 Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser 180 185 190 Gln Ala Ser Ala Ser Ser Thr Ser 195 200 <210> 12 <211> 357 <212> PRT <213> Uloborus diversus <400> 12 Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala 1 5 10 15 Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln 20 25 30 Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr 35 40 45 Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe 50 55 60 Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val 65 70 75 80 Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser 85 90 95 Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr 100 105 110 Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile 115 120 125 Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu 130 135 140 Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu 145 150 155 160 Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile 165 170 175 Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala 180 185 190 Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln 195 200 205 Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser 210 215 220 Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile 225 230 235 240 Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly 245 250 255 Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser 260 265 270 Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe 275 280 285 Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr 290 295 300 Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser 305 310 315 320 Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile 325 330 335 Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu 340 345 350 Leu Ser Val Ser Ala 355 <210> 13 <211> 32 <212> PRT <213> Euprosthenops australis <400> 13 Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 20 25 30 <210> 14 <211> 42 <212> PRT <213> Tetragnatha kauaiensis <400> 14 Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly 20 25 30 Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 15 <211> 42 <212> PRT <213> Argiope aurantia <400> 15 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly 1 5 10 15 Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly 20 25 30 Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 16 <211> 46 <212> PRT <213> Deinopis spinosa <400> 16 Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly 1 5 10 15 Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln 20 25 30 Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala 35 40 45 <210> 17 <211> 42 <212> PRT <213> Nephila clavata <400> 17 Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly 1 5 10 15 Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly 20 25 30 Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 18 <211> 174 <212> PRT <213> Deinopis Spinosa <400> 18 Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala 1 5 10 15 Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala 20 25 30 Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly 35 40 45 Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly 50 55 60 Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala 115 120 125 Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala 130 135 140 Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala 145 150 155 160 Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly 165 170 <210> 19 <211> 149 <212> PRT <213> Latrodectus hesperus <400> 19 Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala 1 5 10 15 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly 20 25 30 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala 35 40 45 Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala 85 90 95 Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 100 105 110 Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala 115 120 125 Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 130 135 140 Gln Gly Gln Gly Ala 145 <210> 20 <211> 161 <212> PRT <213> Nephila clavipes <400> 20 Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly 1 5 10 15 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 20 25 30 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 35 40 45 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 50 55 60 Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly 65 70 75 80 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 85 90 95 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 100 105 110 Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 115 120 125 Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 130 135 140 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala 145 150 155 160 Ala <210> 21 <211> 186 <212> PRT <213> Nephilengys cruentata <400> 21 Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala 1 5 10 15 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala 20 25 30 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr 35 40 45 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 50 55 60 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala 100 105 110 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala 130 135 140 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 165 170 175 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 180 185 <210> 22 <211> 132 <212> PRT <213> Uloborus diversus <400> 22 Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser 20 25 30 Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln 35 40 45 Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr 50 55 60 Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly 65 70 75 80 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala 85 90 95 Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 115 120 125 Gly Ala Ala Ala 130 <210> 23 <211> 198 <212> PRT <213> Uloborus diversus <400> 23 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala 195 <210> 24 <211> 190 <212> PRT <213> Araneus ventricosus <400> 24 Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 20 25 30 Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala 35 40 45 Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly 50 55 60 Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala 65 70 75 80 Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala 100 105 110 Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu 115 120 125 Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly 130 135 140 Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly 145 150 155 160 Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly 165 170 175 Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala 180 185 190 <210> 25 <211> 166 <212> PRT <213> Dolomedes tenebrosus <400> 25 Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr 1 5 10 15 Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly 20 25 30 Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly 35 40 45 Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 50 55 60 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 65 70 75 80 Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala 85 90 95 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 100 105 110 Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly 130 135 140 Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala 145 150 155 160 Ala Ser Ala Ala Ala Ala 165 <210> 26 <211> 177 <212> PRT <213> Nephilengys cruentata <400> 26 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 100 105 110 Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln 115 120 125 Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 130 135 140 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln 145 150 155 160 Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 165 170 175 Ala <210> 27 <211> 174 <212> PRT <213> Nephilengys cruentata <400> 27 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly 100 105 110 Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly 115 120 125 Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala 130 135 140 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly 145 150 155 160 Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 165 170 <210> 28 <211> 22 <212> PRT <213> Saccharomyces cerevisiae <400> 28 Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser 1 5 10 15 Ala Asn Gln Val Ala Ala 20 <210> 29 <211> 23 <212> PRT <213> Pichia pastoris <400> 29 Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu 1 5 10 15 Leu Thr Asn Ile Val Ser Gly 20 <210> 30 <211> 20 <212> PRT <213> Pichia pastoris <400> 30 Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala 1 5 10 15 Val Val Ser Ala 20 <210> 31 <211> 18 <212> PRT <213> Gallus gallus <400> 31 Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala 1 5 10 15 Leu Gly <210> 32 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Asp Lys Arg Glu Ala Glu Ala 85 <210> 33 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 <210> 34 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser 1 5 10 15 Ala Asn Gln Val Ala Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu 20 25 30 Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu 35 40 45 Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn 50 55 60 Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu 65 70 75 80 Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 35 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu 1 5 10 15 Leu Thr Asn Ile Val Ser Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 36 <211> 90 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala 1 5 10 15 Val Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala 20 25 30 Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp 35 40 45 Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu 50 55 60 Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly 65 70 75 80 Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 37 <211> 88 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala 1 5 10 15 Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile 20 25 30 Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp 35 40 45 Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe 50 55 60 Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser 65 70 75 80 Leu Glu Lys Arg Glu Ala Glu Ala 85 <210> 38 <211> 943 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gly Gly 1 5 10 15 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Ser Gly Gln Gln Gly 20 25 30 Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly 35 40 45 Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 50 55 60 Gly Ala Gly Gln Gln Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly 65 70 75 80 Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln 85 90 95 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 100 105 110 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Arg Ser Gln Gly Pro 130 135 140 Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly 145 150 155 160 Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly 165 170 175 Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 180 185 190 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 195 200 205 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala 210 215 220 Ala Ala Ala Ala Ala Ala Val Gly Gly Tyr Gly Pro Gly Ala Gly Gln 225 230 235 240 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 245 250 255 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln 275 280 285 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 290 295 300 Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 305 310 315 320 Gly Ala Gly Gln Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly 325 330 335 Gly Gln Gly Pro Tyr Gly Ser Gly Gln Gln Gly Pro Gly Gly Ala Gly 340 345 350 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala 355 360 365 Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln 370 375 380 Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Gly 385 390 395 400 Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln 405 410 415 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 420 425 430 Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly 435 440 445 Pro Gly Ala Gly Gln Arg Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr 450 455 460 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 465 470 475 480 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala 485 490 495 Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln 500 505 510 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 515 520 525 Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala 530 535 540 Val Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln 545 550 555 560 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 565 570 575 Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 580 585 590 Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly 595 600 605 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala 610 615 620 Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly 625 630 635 640 Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly 645 650 655 Ser Gly Gln Gln Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Gly 660 665 670 Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala 675 680 685 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Gly Ala Gly 690 695 700 Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly 705 710 715 720 Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly 725 730 735 Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala 740 745 750 Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln 755 760 765 Arg Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly 770 775 780 Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly 785 790 795 800 Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala 805 810 815 Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser 820 825 830 Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro 835 840 845 Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Val Gly Gly Tyr Gly 850 855 860 Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly 865 870 875 880 Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala 885 890 895 Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln 900 905 910 Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly 915 920 925 Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 930 935 940 <210> 39 <211> 800 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 39 Met Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln 1 5 10 15 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly 20 25 30 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 35 40 45 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly 50 55 60 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala 65 70 75 80 Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 85 90 95 Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 100 105 110 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala 115 120 125 Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 130 135 140 Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly 145 150 155 160 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly 165 170 175 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala 180 185 190 Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly 195 200 205 Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 210 215 220 Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 225 230 235 240 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 245 250 255 Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 260 265 270 Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala 275 280 285 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly 290 295 300 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 305 310 315 320 Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln 325 330 335 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly 340 345 350 Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 355 360 365 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 370 375 380 Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala 385 390 395 400 Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala 405 410 415 Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln 420 425 430 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala 435 440 445 Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly 450 455 460 Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala 465 470 475 480 Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 485 490 495 Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 500 505 510 Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly 515 520 525 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 530 535 540 Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly 545 550 555 560 Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly 565 570 575 Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala 580 585 590 Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr 595 600 605 Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly 610 615 620 Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 625 630 635 640 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly 645 650 655 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala 660 665 670 Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 675 680 685 Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly 690 695 700 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala 705 710 715 720 Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 725 730 735 Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln 740 745 750 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly 755 760 765 Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly 770 775 780 Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Gly Gly Gly Gly Gly 785 790 795 800 <210> 40 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 40 Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 10 15 Asp Tyr Lys Asp Asp Asp Asp Lys 20 <210> 41 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 41 Ala Ala Ala Ala Ala 1 5 <210> 42 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 42 Ser Gly Ala Gly Gly 1 5 <210> 43 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 43 Gly Ser Gly Ala Gly 1 5 <210> 44 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 44 Gly Gly Ser Gly Ala 1 5 <210> 45 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(8) <223> This sequence may encompass 6-8 residues <400> 45 His His His His His His His His 1 5 <210> 46 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 46 His His His His His His 1 5

Claims (55)

  1. 숙주 세포 배양물로부터 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법:
    a. 세포 배양물을 얻고, 이때 전술한 세포 배양물은 숙주 세포 및 정상 배지를 포함하고, 이때 전술한 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
    b. 전술한 재조합 거미 실크 단백질을 포함하는 전술한 세포 배양물의 일부분을 수집하고;
    c. 알칼리 조건 하에서 수성 용액에서 전술한 세포 배양물의 전술한 일부분을 항온처리하고, 이로 인하여 전술한 수성 용액 안의 전술한 재조합 거미 실크 단백질이 가용화되고; 그리고
    d. 전술한 수성 용액으로부터 해당 재조합 거미 실크 단백질이 단리되고, 이로 인하여 단리된 재조합 거미 실크 단백질 샘플이 생성된다.
  2. 청구항 1에 있어서, 이때 상기 알칼리 조건은 알칼리 pH 9 내지 14를 포함하는, 방법.
  3. 청구항 2에 있어서, 이때 상기 알칼리 pH는 11 내지 12인, 방법.
  4. 상기 청구항들중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질인, 방법.
  5. 청구항 4에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질 샘플은 단리된 전체 재조합 거미 실크 단백질과 비교하였을 때, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함하는, 방법.
  6. 청구항 5에 있어서, 이때 전장의 재조합 거미 실크 단백질의 상기 백분율은 웨스턴 블랏을 이용하여 측정된, 방법.
  7. 청구항 5에 있어서, 이때 전장의 재조합 거미 실크 단백질의 상기 백분율은 크기 압출 크로마토그래피를 이용하여 측정된, 방법.
  8. 상기 청구항들중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%인, 방법.
  9. 상기 청구항들중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질의 수율은 우레아 또는 구아니딘 티오시아네이트 방법에 의해 단리된 재조합 거미 실크와 비교하였을 때, 적어도 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%인, 방법.
  10. 상기 청구항들중 임의의 항에 있어서, 이때 상기 재조합 거미 실크 단백질의 단리는 전술한 수성 용액의 전술한 알칼리 조건을 변경시킴으로써, 당해 재조합 거미 실크 단백질을 침전시키는 것을 포함하는, 방법.
  11. 청구항 10에 있어서, 이때 전술한 알칼리 조건의 변경에는 상기 세포 배양물의 일부분의 알칼리 pH를 4 ~ 10의 낮은 pH로 조정하는 것을 포함하는, 방법.
  12. 청구항 11에 있어서, 이때 상기 낮아진 pH는 4, 5, 6, 7, 8, 9, 또는 10의 pH인, 방법.
  13. 청구항 11에 있어서, 이때 상기 낮아진 pH는 pH 6 내지 7인, 방법.
  14. 청구항 10-13중 임의의 한 항에 있어서, 이때 알칼리 pH의 조정은 산을 상기 수성 용액에 첨가시키는 것을 포함하는, 방법.
  15. 청구항 14에 있어서, 이때 전술한 산은 H2SO4인, 방법.
  16. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 세포 배양물의 일부분은 상청액, 전체 세포 브로스, 또는 세포 펠렛을 포함하는, 방법.
  17. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 세포 배양물의 전술한 일부분의 수거는 전술한 정상 배지로부터 전술한 숙주 세포를 빼내고, 전술한 수성 용액에 전술한 숙주 세포를 재구성시키는 것을 포함하는, 방법.
  18. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 세포 배양물의 전술한 일부분의 수거는 전술한 숙주 세포의 용해를 포함하는, 방법.
  19. 청구항 18에 있어서, 이때 용해는 열처리, 전단 파괴(shear disruption), 물리적 균질화, 초음파처리 또는 화학적 균질화를 포함하는, 방법.
  20. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 세포 배양물의 전술한 일부분은 전술한 세포 배양물로부터 유래된 전술한 숙주 세포와 전술한 정상 배지를 포함하는, 방법.
  21. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 수성 용액은 희석된 정상 배지를 포함하는, 방법.
  22. 상기 청구항들중 임의의 항에 있어서, 이때 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 10 ~ 120 분 동안 실행되는, 방법.
  23. 청구항 22에 있어서, 이때 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 적어도 10분, 적어도 15분, 적어도 30분, 적어도 45분, 적어도 60분, 적어도 75분, 적어도 90분, 적어도 105분, 또는 적어도 120 분 동안 실행되는, 방법.
  24. 청구항 22에 있어서, 이때 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 15 분 ~ 30 분 동안 실행되는, 방법.
  25. 상기 청구항들중 임의의 항에 있어서 이때 알칼리 조건 하에서 전술한 세포 배양물의 전술한 일부분의 항온처리는 해당 세포 배양물의 일부분의 교반을 추가 포함하는, 방법.
  26. 상기 청구항들중 임의의 항에 있어서, 알칼리 조건 하에서 전술한 수성 용액으로부터 가용화안된 바이오메스를 제거하는 작업을 추가 포함하는, 방법.
  27. 청구항 26에 있어서, 이때 상기 가용화안된 바이오메스의 제거는 여과, 원심분리, 중력에 의한 가라앉힘, 흡착, 투석, 또는 상 분리를 포함하는, 방법.
  28. 청구항 27에 있어서, 이때 상기 여과는 한외여과, 정밀여과, 또는 투석여과인, 방법.
  29. 청구항 26-28중 임의의 한 항에 있어서, 이때 상기 가용화안된 바이오메스의 제거 적어도 한 번 반복되는, 방법.
  30. 상기 청구항들중 임의의 항에 있어서, 해당 재조합 거미 실크 단백질의 단리 전, 또는 해당 재조합 거미 실크 단백질의 단리 후 불순물을 제거하는 작업을 추가 포함하는, 방법.
  31. 청구항 30에 있어서, 이때 상기 불순물 제거는 여과, 원심분리, 중력에 의한 가라앉힘, 흡착, 투석, 또는 상 분리를 포함하는, 방법.
  32. 청구항 31에 있어서, 이때 상기 여과는 한외여과, 정밀여과, 또는 투석여과인, 방법.
  33. 청구항 31에 있어서, 이때 상기 원심분리는 초원심분리 또는 투석원심분리인, 방법.
  34. 청구항 31에 있어서, 이때 상기 흡착은 숯 흡착인, 방법.
  35. 청구항 31-34중 임의의 한 항에 있어서, 이때 불순물 제거는 적어도 한 번 반복되는, 방법.
  36. 상기 청구항들중 임의의 항에 있어서, 해당 단리된 재조합 거미 실크 단백질을 농축시켜 농축된 거미 실크 단백질을 만드는 작업을 추가 포함하는, 방법.
  37. 청구항 36에 있어서, 이때 농축은 침전, 여과, 한외여과, 원심분리, 투석, 증발, 또는 동결건조를 포함하는, 방법.
  38. 상기 청구항들중 임의의 항에 있어서, 상기 단리된 재조합 거미 실크 단백질의 건조를 더 포함하는, 방법.
  39. 상기 청구항들중 임의의 항에 있어서, 상기 단리된 재조합 거미 실크로부터 실크 섬유를 만드는 것을 더 포함하는, 방법.
  40. 청구항 39에 있어서, 이때 전술한 실크 섬유는 적어도 19 cN/tex의 점착력을 포함하는, 방법.
  41. 상기 청구항들중 임의의 항에 있어서, 이때 전술한 재조합 거미 실크 단백질은 18B 또는 P0인, 방법.
  42. 상기 청구항들중 임의의 항에 있어서, 이때 상기 세포 배양물은 곰팡이, 박테리아 또는 효모 세포를 포함하는, 방법.
  43. 상기 청구항들중 임의의 항에 있어서, 이때 상기 효모 세포는 피치아 파스토리스(pichia pastoris) 세포인, 방법.
  44. 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법:
    a. 세포 배양물을 얻고, 이때 전술한 세포 배양물은 숙주 세포 및 정상 배지를 포함하고, 이때 전술한 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
    b. 전술한 재조합 거미 실크 단백질을 포함하는 전술한 세포 배양물의 일부분을 수집하고;
    c. 알칼리 조건 하에서 수성 용액에서 전술한 세포 배양물의 전술한 일부분을 항온처리하고, 이로 인하여 전술한 수성 용액 안의 전술한 재조합 거미 실크 단백질이 가용화되고;
    d. 상기 수성 용액을 비-알칼리 pH로 조정하고, 이로 인하여 전술한 가용화된 재조합 거미 실크 단백질이 침전되며; 그리고
    e. 세포 배양물의 전술한 일부분으로부터 상기 재조합 거미 실크 단백질이 단리되고, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성된다.
  45. 상기 청구항들중 임의의 한 항에 따른 방법에 따라 생성된 재조합 거미 실크 단백질을 포함하는 조성물.
  46. 청구항 45에 있어서, 이때 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 전장의 재조합 거미 실크를 포함하는, 조성물.
  47. 청구항 1-44중 임의의 한 항에 따라 생성된 재조합 거미 실크 단백질을 포함하는 실크 섬유.
  48. 청구항 47에 있어서, 이때 상기 실크 섬유는 적어도 19 cN/tex의 점착력을 포함하는, 실크 섬유.
  49. 정상 배지와 알칼리 완충 용액 안에 재조합 거미 실크 단백질을 포함하는 숙주 세포를 포함하는 새포 배양물을 포함하는 조성물.
  50. 청구항 45-49중 임의의 한 항에 있어서, 이때 상기 알칼리 완충 용액은 pH 9 ~ 14를 갖는, 조성물.
  51. 청구항 50에 있어서, 이때 상기 pH는 11 내지 12인, 조성물.
  52. 청구항 49-51중 임의의 한 항에 있어서, 이때 상기 거미 실크 단백질은 18B 또는 P0인, 조성물.
  53. 청구항 49-52중 임의의 한 항에 있어서, 이때 상기 세포 배양물은 곰팡이 세포, 박테리아 세포 또는 효모 세포를 포함하는, 조성물.
  54. 청구항 53에 있어서, 이때 상기 박테리아 세포는 대장균(E. coli) 세포인, 조성물.
  55. 청구항 53에 있어서, 이때 상기 효모 세포는 피치아 파스토리스(pichia pastoris) 세포인, 조성물.
KR1020217019694A 2018-11-28 2019-11-26 거미 실크 단백질의 알칼리 정제 KR20210096175A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862772588P 2018-11-28 2018-11-28
US62/772,588 2018-11-28
PCT/US2019/063208 WO2020112742A1 (en) 2018-11-28 2019-11-26 Alkaline purification of spider silk proteins

Publications (1)

Publication Number Publication Date
KR20210096175A true KR20210096175A (ko) 2021-08-04

Family

ID=70852194

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217019694A KR20210096175A (ko) 2018-11-28 2019-11-26 거미 실크 단백질의 알칼리 정제

Country Status (6)

Country Link
US (1) US20220017580A1 (ko)
EP (1) EP3887163A4 (ko)
JP (1) JP2022513628A (ko)
KR (1) KR20210096175A (ko)
CN (1) CN114401844A (ko)
WO (1) WO2020112742A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023199285A2 (en) 2022-04-15 2023-10-19 Spora Spa Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1991016351A1 (en) * 1990-04-19 1991-10-31 The United States Of America, Secretary Of The Army, The Pentagon Recombinant spider silk proteins through genetic engineering
CN1200145A (zh) * 1995-08-22 1998-11-25 阿格里科拉技术有限公司 高强度蛛丝蛋白的克隆方法
WO2002092802A1 (en) * 2001-05-14 2002-11-21 Diversa Corporation Novel methods of enzyme purification
AU2003201513A1 (en) * 2002-01-11 2003-07-24 Nexia Biotechnologies, Inc. Methods of producing silk polypeptides and products thereof
WO2003057720A2 (en) * 2002-01-11 2003-07-17 Nexia Biotechnologies, Inc. Recovery of biofilament proteins from biological fluids
US20040132978A1 (en) * 2002-11-12 2004-07-08 Fahnestock Stephen R. Method for purifying and recovering silk proteins in soluble form and uses thereof
CN1259333C (zh) * 2003-05-08 2006-06-14 福建师范大学 制备性基因重组蜘蛛拖丝蛋白的分离纯化方法
US20050261479A1 (en) * 2004-04-29 2005-11-24 Christian Hoffmann Method for purifying and recovering silk proteins using magnetic affinity separation
EP1773875B1 (en) * 2004-07-22 2014-09-10 Amsilk GmbH Recombinant spider silk proteins
ES2799431T3 (es) * 2010-03-31 2020-12-17 Amsilk Gmbh Separación de proteínas objetivo insolubles
US20150047532A1 (en) * 2013-08-13 2015-02-19 Utah State University Synthetic spider silk protein compositions and methods
EP3263593A1 (en) * 2016-07-01 2018-01-03 Anna Rising Engineered spider silk proteins and uses thereof
CN109661472A (zh) * 2016-08-10 2019-04-19 丝芭博株式会社 不溶性重组蛋白凝集体的制造方法

Also Published As

Publication number Publication date
WO2020112742A1 (en) 2020-06-04
EP3887163A1 (en) 2021-10-06
JP2022513628A (ja) 2022-02-09
US20220017580A1 (en) 2022-01-20
CN114401844A (zh) 2022-04-26
EP3887163A4 (en) 2022-08-31

Similar Documents

Publication Publication Date Title
US8741654B2 (en) Compositions and methods for improved protein production
US20220289790A1 (en) Methods for improved extraction of spider silk proteins
US9663772B2 (en) Aspergillus fumigatus cellulolytic enzyme compositions and uses thereof
EP3592800A2 (en) Compositions and methods for producing high secreted yields of recombinant proteins
WO2021178934A1 (en) Class ii, type v crispr systems
Kang et al. Enhanced production of leech hyaluronidase by optimizing secretion and cultivation in Pichia pastoris
CN101392249A (zh) 一种抗菌肽基因及其制备方法和该基因在毕赤酵母载体中的表达质粒的构建
CN103146732A (zh) 高效裂解串联基因,高效裂解质粒及构建方法和应用
KR20190127806A (ko) 재조합 단백질을 고분비 수율로 생산하기 위한 조성물 및 방법
WO2023039378A1 (en) Class ii, type v crispr systems
KR20210096175A (ko) 거미 실크 단백질의 알칼리 정제
CN103114089B (zh) 源于里氏木霉的强启动子及其表达载体和应用
EP4218843A2 (en) Methods for isolating spider silk proteins via high shear solubilization
US9714273B2 (en) Expression systems and associated methods
JP7246102B2 (ja) 組換え絹を製造するための改変株
CN107488221B (zh) 真菌来源的膨胀素蛋白及其基因和应用
CN111757939B (zh) 突变β-葡萄糖苷酶
CN114269398B (zh) 通过高剪切溶解来分离蜘蛛丝蛋白的方法
CN103993030A (zh) 一种大肠杆菌细胞内蛋白酶剪切融合蛋白的方法
JP2015518723A (ja) トリコデルマ(Trichoderma)ヒドロホビン産生
CN116984353A (zh) 一种Sp02200酶在制备羽毛降解制剂中的应用
EP2885407B1 (en) Pectin degrading enzymes from macrophomina phaseolina and uses thereof
BR102019021480A2 (pt) Polinucleotídeos codificando expansinas de cana-de-açúcar, microrganismo geneticamente modificado, processo para produzir uma expansina, preparação proteica, uso da preparação proteica, e processo para produzir um microrganismo geneticamente modificado
CN107338260A (zh) 一种重组蛛丝蛋白神经导管的制备方法