KR20220050884A - 거미 실크 단백질의 추출 개선을 위한 방법 - Google Patents

거미 실크 단백질의 추출 개선을 위한 방법 Download PDF

Info

Publication number
KR20220050884A
KR20220050884A KR1020227004065A KR20227004065A KR20220050884A KR 20220050884 A KR20220050884 A KR 20220050884A KR 1020227004065 A KR1020227004065 A KR 1020227004065A KR 20227004065 A KR20227004065 A KR 20227004065A KR 20220050884 A KR20220050884 A KR 20220050884A
Authority
KR
South Korea
Prior art keywords
gly
ala
ser
gln
tyr
Prior art date
Application number
KR1020227004065A
Other languages
English (en)
Inventor
필립 무이
시몬 리
리투 반살 무탈리크
콜 리치 피터슨
Original Assignee
볼트 쓰레즈, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 볼트 쓰레즈, 인크. filed Critical 볼트 쓰레즈, 인크.
Publication of KR20220050884A publication Critical patent/KR20220050884A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/14Extraction; Separation; Purification
    • C07K1/34Extraction; Separation; Purification by filtration, ultrafiltration or reverse osmosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/12General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by hydrolysis, i.e. solvolysis in general
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • DTEXTILES; PAPER
    • D01NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
    • D01FCHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
    • D01F1/00General methods for the manufacture of artificial filaments or the like
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • DTEXTILES; PAPER
    • D01NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
    • D01FCHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
    • D01F4/00Monocomponent artificial filaments or the like of proteins; Manufacture thereof

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Insects & Arthropods (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Urology & Nephrology (AREA)
  • Immunology (AREA)
  • Hematology (AREA)
  • Plant Pathology (AREA)
  • Water Supply & Treatment (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Textile Engineering (AREA)
  • Cell Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Manufacturing & Machinery (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)

Abstract

요약서
염과 알코올 완충액을 이용하여 재조합 거미 실크 단백질의 용해화, 추출 및 단리를 개선시키는 방법들이 본원에 제공된다. 숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는 방법이 제공되는데, 이 방법은 다음을 포함한다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하며; 그리고 상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 이 용액 안에 상기 재조합 거미 실크 단백질이 용해화된다.

Description

거미 실크 단백질의 추출 개선을 위한 방법
관련 출원에 대한 상호 참조
본 출원은 2019년 8월 22일자로 제출된 미국 가출원 번호 62/890,473를 우선권으로 주장하며, 이의 전문이 본 명세서의 참고자료에 편입된다.
서열 목록
본 출원은 EFS-Web을 통하여 제출된 서열 목록을 포함하며, 이의 전문이 본 명세서의 참고자료에 편입된다. 20XX년 XX월, 일자로 생성된 전술한 ASCII 사본은 XXXXXUS_sequencelisting.txt로 명명되며, 크기는 X,XXX,XXX 바이트이다.
배경
거미의 실크 폴리펩티드는 큰 (>150kDa, >1000개 아미노산) 폴리펩티드로써, 이는 다음의 3개 도메인으로 나뉜다: N-말단 비-반복성 도메인 (NTD), 반복 도메인 (REP), 그리고 C-말단 비-반복성 도메인 (CTD). NTD 및 CTD는 상대적으로 작고 (각각 ~150개의 아미노산, ~100개의 아미노산), 잘-연구되었으며, 폴리펩티드 수성 안정성, pH 민감성 및 응집 시 분자 정렬을 부여하는 것으로 간주된다. NTD는 강력하게 예측되는 분비 테그를 또한 보유하며, 이는 대개 이종성(heterologous) 발현 동안 제거된다. 상기 반복성 영역은 천연 폴리펩티드의 ~90%로 구성되며, 결정(crystalline) 영역과 무정형 영역으로 폴딩되는데, 차례로 실크 섬유에 강도 및 유연성을 부여한다.
재조합 거미 실크 폴리펩티드는 생산 및 정제 과정 동안 바람직하지 못한 불용성 응집체를 형성한다. 응집하여 β-쉬트 구조를 형성하는 이들의 능력으로 인하여, 실크 서열 기반의 단백질은 가용화하는 것이 어렵다. 이러한 단백질의 가용화는 생물학적 분자에 대한 가혹한 화학적 조건 (흔히 단백질을 분해하는)을 필요로 하며, 그 결과 수율이 낮고, 점착력(tenacity)이 낮고, 촉감이 좋지 않은 고체 또는 섬유가 만들어진다. 따라서, 실크 단백질의 용해도 및 회수를 증가시키는 이러한 폴리펩티드를 정제해내는 개선된 방법이 필요하다.
발명의 요약
숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는 방법이 본원에 제공되며, 이 방법은 다음을 포함한다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 재조합 거미 실크 단백질을 포함하고; 상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 해당 용액에서 상기 재조합 거미 실크 단백질이 용해화된다.
일부 구체예들에서, 상기 염은 칼슘 염을 포함한다. 일부 구체예들에서, 상기 칼슘 염은 염화칼슘, 질산칼슘, 티오시안산칼슘, 요오드화 칼슘, 또는 브롬화 칼슘 중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 칼슘 염은 염화 칼슘을 포함한다.
일부 구체예들에서, 상기 용액은 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함한다. 일부 구체예들에서, 상기 용액은 2M 염화 칼슘을 포함한다. 일부 구체예들에서, 상기 칼슘 염은 질산 칼슘을 포함한다.
일부 구체예들에서, 상기 염은 스트론튬 염 또는 바륨 염을 포함한다.
일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 또는 35% (w/v) 이다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 약 15% (w/v)이다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 최대한 많아도 약 35% (w/v)이다.
일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X, 5X 또는 7X이다. 일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X이다. 일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 약 7X이다.
일부 구체예들에서, 상기 알코올은 메탄올, 에탄올, 또는 이소프로판올중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 알코올은 메탄올을 포함한다. 일부 구체예들에서, 상기 용액은 2M 염화 칼슘 및 메탄올을 포함한다.
일부 구체예들에서, 상기 불용성 부분은 20℃ ~ 70℃ 사이의 온도에서 상기 용액과 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 실온에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 약 35℃에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 약 55℃에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 70℃를 넘지 않는 온도에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 20℃ 보다 낮지 않은 온도에서 항온처리된다.
일부 구체예들에서, 상기 불용성 부분은 상기 용액에서 15 ~ 120 분 동안 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액에서 30 분 동안 항온처리된다.
일부 구체예들에서, 상기 방법은 상기 알코올을 증발시키는 것을 더 포함한다.
일부 구체예들에서, 상기 불용성 부분은 세포 용해물 펠렛을 포함한다. 일부 구체예들에서, 상기 세포 배양물로부터 유래된 불용성 부분의 수집은 상기 숙주 세포의 용해를 포함한다. 일부 구체예들에서, 용해는 열처리, 화학적 처리, 전단 파괴, 물리적 균질화, 미세유동화, 초음파처리 또는 화학적 균질화를 포함한다.
일부 구체예들에서, 상기 세포 배양물에서 불용성 부분의 수집은 상기 용해된 세포를 원심분리시켜, 세포 용해물 펠렛을 수득하는 것을 더 포함한다.
일부 구체예들에서, 상기 방법은 상기 용액으로부터 불순물을 제거하는 것을 더 포함한다. 일부 구체예들에서, 불순물 제거는 수성을 추가하여 이들 불순물을 침전시키는 것을 포함한다. 일부 구체예들에서, 상기 수성 용액은 물을 포함한다.
일부 구체예들에서, 이들 불순물 제거는 여과, 원심분리, 중력 침전, 흡착, 투석 또는 상(phase) 분리를 포함한다. 일부 구체예들에서, 상기 여과는 한외여과, 정밀여과 또는 정용여과이다.
일부 구체예들에서, 상기 방법은 상기 용액으로부터 재조합 거미 실크 단백질을 단리시키고, 이로써 상기 용액으로부터 단리된 재조합 거미 실크 단백질을 만드는 것을 더 포함한다.
일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 ELISA를 이용하여 측정된다. 일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함한다.
일부 구체예들에서, 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 일부 구체예들에서, 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%이다.
일부 구체예들에서, 상기 재조합 거미 실크 단백질은 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질이다. 일부 구체예들에서, 상기 세포 배양물은 곰팡이 세포, 박테리아 세포 또는 효모 세포를 포함한다. 일부 구체예들에서, 상기 박테리아 세포는 대장균(Escherichia coli)이다. 일부 구체예들에서, 상기 방법은 실크 단백질 분말을 생산하기 위해, 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함한다.
또다른 측면에서, 숙주 세포로부터 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법이 본원에 제공된다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하고; 상기 숙주 세포의 불용성 부분을 2M 염화 칼슘과 메탄올을 포함하는 용액에 추가하고, 이로 인하여 이 용액에서 상기 재조합 거미 실크 단백질을 용해화시키고; 그리고 상기 용액으로부터 상기 재조합 거미 실크 단백질을 단리시키고, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성된다. 일부 구체예들에서, 상기 방법은 실크 단백질 분말을 생산하기 위해, 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함한다.
또다른 측면에서, 본원에 기술된 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 조성물이 본원에서 제공된다.
일부 구체예들에서, 상기 조성물은 재조합 거미 실크 단백질 분말을 포함한다. 일부 구체예들에서, 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 전장의 재조합 거미 실크를 포함한다.
또다른 측면에서, 본원에 기술된 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 고형 실크가 본원에서 제공된다.
도면의 몇 가지 관점에 대한 간략한 설명
본 발명의 이들 특징 및 다른 특징, 측면 및 이점은 다음의 설명 및 첨부 도면과 관련하여 더 잘 이해될 것이며: 여기에서:
도 1은 용해화 공정의 예시적인 순서도를 나타낸다.
도 2는 용해화 공정의 제 2 예시적인 순서도를 나타낸다.
도 3은 메탄올에서 칼슘 염으로 추출된 P0 거미 실크 단백질을 보여주는 면역블랏을 제공한다.
도 4는 35℃ 및 55℃에서 교반과 함께 항온처리 후, 용액내 P0 거미 실크 단백질의 그래프를 제공한다.
도 5A는 물 침전 후, P0 단백질 단편들을 제거한 후, P0 거미 실크 단백질의 SEC 피크 프로파일을 보여준다. 도 5B는 투석 및 동결건조후, SEC 피크 프로파일을 보여준다.
상세한 설명
정의
청구범위 및 명세서에 사용된 용어는 달리 명시되지 않는 한, 다음과 같이 정의된다.
본 명세서에 달리 정의되지 않는 한, 본원에서 기술된 해당 방법 및 조성물과 관련하여 사용되는 과학 및 기술 용어들은 해당 분야의 숙련된 기술자들이 통상적으로 이해하는 의미를 가져야 한다. 더욱이, 내용에서 달리 필요하지 않는 한, 단수형 용어들은 복수형을 포함하며, 복수형 용어들은 단수형을 포함한다. 일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 폴리펩티드와 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.
본원에서 기술되는 방법 및 기술은 다른 언급이 없는 한, 일반적으로 당업계에 널리 공지된 통상적인 방법에 따라 실행되며, 그리고 본 명세서 전반에 걸쳐 인용되고 논의된 다양한 일반적이고 보다 구체적인 참고 문헌에 기재된 바와 같이 수행된다. 가령, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002); Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990); Taylor and Drickamer, Introduction to Glycobiology, Oxford Univ. Press (2003); Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, N.J.; Handbook of Biochemistry: Section A Proteins, Vol I, CRC Press (1976); Handbook of Biochemistry: Section A Proteins, Vol II, CRC Press (1976); Essentials of Glycobiology, Cold Spring Harbor Laboratory Press (1999) 참고.
본 명세서에 언급된 모든 간행물, 특허 및 다른 참고문헌들은 그 전문이 본원의 참고문헌으로 편입된다.
달리 언급이 없는 한, 하기 용어들은 다음과 같은 의미를 가지는 것으로 이해되어야 한다:
"시험관내(in vitro)"라는 용어는 살아있는 유기체와는 분리되어 성장하는 세포, 예를 들어, 조직 배양에서 성장하는 세포에서 발생시키는 과정을 의미한다.
"생체내(in vivo)"라는 용어는 살아있는 유기체에서 일어나는 과정을 의미한다.
본원에 사용된 용어 "정화시키는(clarifying)"이란 숙주 세포 바이오매스, 예를 들어, 전체 세포, 용해된 세포, 막, 지질, 소기관, 핵, 비-거미 실크 단백질, 또는 임의의 기타 바람직하지 않은 세포 부분 또는 산물, 또는 세포 배양의 임의의 기타 바람직하지 않은 부분을 제거하는 방법을 지칭한다. 정화시키는다는 것은 부분적으로 정제된 또는 단리된 거미 실크 조성물로부터 불순물을 제거하는 것을 또한 지칭한다. 불순물에는 비-거미 실크 단백질, 분해된 거미 실크 단백질, 단백질의 큰 집합체, 정제 및 분리 과정에서 사용되는 화학 물질 또는 기타 바람직하지 않은 물질이 포함될 수 있지만 이에 국한되지 않는다.
본원에 사용된 용어 "순도"란 샘플, 가령, 추출된 샘플 안에 부분적 또는 분해 단리된 재조합 거미 실크 단백질, 지질, 단백질, 막 또는 기타 분자와 같은 모든 단리된 성분의 일부로서 전장 단리된 재조합 거미줄 단백질의 양을 지칭한다.
용어 "고형 실크" 또는 "재조합 고형 실크"란 단리된 재조합 거미 실크 조성물, 이를 테면, 섬유, 압출물, 분말, 또는 펠렛을 지칭한다. 압출물이란 압출된 재조합 거미 실크 조성물로써, 이것은 방적돌기(spinneret)를 통해 압출된 것이다.
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 길이가 최소한 10개 염기인 뉴클레오티드의 중합체 형태를 지칭한다. 상기 용어에는 DNA 분자 (예를 들어, cDNA 또는 게놈 또는 합성 DNA) 및 RNA 분자 (예를 들어, mRNA 또는 합성 RNA) 뿐만 아니라, 비-천연 뉴클레오티드 유사체, 비-고유 뉴클레오시드간 결합, 또는 둘 모두를 포함하는 DNA 또는 RNA의 유사체가 내포된다. 상기 핵산은 임의의 형상적(topological) 입체형태일 수 있다. 예를 들면, 상기 핵산은 단일-가닥, 이중-가닥, 삼중-가닥, 사중-가닥, 부분 이중-가닥, 분지형, 헤어핀, 원형 또는 자물쇠(padlocked) 입체형태일 수 있다.
달리 지시되지 않는 한, 및 일반적인 형식 "서열 식별 번호:~"로 본 명세서에 기재된 모든 서열에 대한 예로서, "서열 식별 번호: 1을 포함하는 핵산"은 최소한 일부가 (i) 서열 식별 번호: 1의 서열, 또는 (ii) 서열 식별 번호: 1에 상보적인 서열을 가짐을 지칭한다. 둘 중 선택은 내용에 따라 결정된다. 예를 들어, 핵산이 프로브로 사용되는 경우, 둘 중 하나의 선택은 프로브가 원하는 표적에 상보적이어야 한다는 요건에 따라 결정된다.
"단리된" RNA, DNA 또는 혼합 중합체는 자연발생적 숙주 세포에서 고유의 폴리뉴클레오티드를 자연적으로 동반하는 다른 세포 성분, 예를 들어, 자연적으로 결합된 리보솜, 중합 효소 및 게놈 서열로부터 실질적으로 분리된 것이다.
용어 "재조합(recombinant)"이란 (1) 자연 발생 환경으로부터 제거되어 있거나, (2) 당해 유전자가 자연에서 발견되는 이의 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되지 않은 폴리뉴클레오티드에 작동가능하게 연결되거나, 또는 (4) 실제로는 발생하지 않는 생물분자, 예를 들어, 유전자 또는 폴리펩티드를 의미한다. 용어 "재조합"이란 클로닝된 DNA 단리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종(heterologous) 시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체, 뿐만 아니라 이러한 핵산에 의해 인코드된 폴리펩티드 및/또는 mRNA와 관련하여 사용될 수 있다.
본원에 사용된 바와 같이, 이종 서열이 유기체 게놈 내 내인성 핵산 서열 (또는 이러한 서열의 인코드된 폴리펩티드 산물)에 인접하여 배치되어, 이러한 내인성 핵산 서열의 발현이 변형되는 경우, 이러한 내인성 핵산 서열은 "재조합"으로 간주된다. 이 문맥에서, 이종(heterologous) 서열은 이종 서열 자체가 내인성인지 (동일한 숙주 세포 또는 이의 자손에서 유래한 것인지) 또는 외인성인지 (다른 숙주 세포 또는 이의 자손에서 유래한 것인지)에 관계없이, 내인성 핵산 서열에 자연적으로 인접하지 않는 서열이다. 예를 들어, 프로모터 서열은 숙주 세포의 게놈 내 유전자의 고유 프로모터로 대체될 수 있고 (예를 들어, 상동성 재조합에 의해), 그 결과 이 유전자는 변경된 발현 패턴을 가진다. 이 유전자는 자연적으로 연접하는 서열들 중 최소한 일부로부터 분리되기 때문에, 이제부터는 "재조합" 상태가 될 것이다. 구체예에서, 이종성(heterologous) 핵산 분자는 해당 유기체에 내생적인 것이 아니다. 추가 구체예들에서, 이종성(heterologous) 핵산 분자는 플라스미드이거나, 또는 상동성 또는 무작위 통합에 의해 숙주 염색체로 통합된 분자다.
핵산은 게놈 내 상응하는 핵산에서 자연적으로 발생하지 않는 임의의 변형을 함유하는 경우, "재조합"으로 또한 간주된다. 예를 들어, 내인성 코딩 서열은, 예를 들어, 인간의 개입에 의해 인공적으로 도입된 삽입, 결실 또는 점 돌연변이를 함유하는 경우, "재조합"으로 간주된다. "재조합 핵산"은 이종성 (heterologous) 부위에서 숙주 세포 염색체에 통합된 핵산 및 에피좀으로 존재하는 핵산 구조체가 또한 내포된다.
핵산 서열과 관련하여 용어 "서열 동일성 퍼센트"란 최대 상응을 위해 정렬될 때 동일한 두 개의 서열 내 잔기들 배열의 정량적 값을 지칭한다. 서열 동일성 비교의 길이는 약 9개 이상의 뉴클레오티드, 일반적으로 약 20개 이상의 뉴클레오티드, 보다 일반적으로 약 24개 이상의 뉴클레오티드, 전형적으로 약 28개 이상의 뉴클레오티드, 보다 전형적으로 약 32개 이상의 뉴클레오티드, 그리고 바람직하게는 약 36개 이상의 뉴클레오티드의 스트레치에 걸친 것일 수 있다. 뉴클레오티드 서열 동일성을 측정하는데 사용될 수 있는 해당 분야에 공지된 다수의 상이한 알고리즘이 존재한다. 예를 들어, 폴리뉴클레오티드 서열은 Wisconsin Package Version 10.0, Genetics Computer Group (GCG), Madison, Wis의 프로그램인 FASTA, Gap 또는 Bestfit을 사용하여 비교될 수 있다. FASTA는 문제(query) 서열과 검색 서열간의 가장 잘 겹쳐지는 영역의 정렬 및 서열 동일성 백분율을 제공한다. Pearson, Methods Enzymol. 183:63-98 (1990) (본 명세서에 그 전문이 참고문헌으로 포함됨). 예를 들어, 핵산 서열들 사이의 서열 동일성 퍼센트는 기본 파라미터 (점수화 행렬에 대한 NOPAM 인자 및 워드 크기 6)의 FASTA를 사용하거나 본 명세서에 참고로 포함된 GCG 버전 6.1에 제공된 바와 같은 기본 파라미터를 가지는 갭을 사용하여 결정될 수 있다. 대안적으로, 서열들은 컴퓨터 프로그램, BLAST를 사용하여 비교될 수 있다 (Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet. 3:266-272 (1993); Madden et al., Meth. Enzymol. 266:131-141 (1996); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997); Zhang and Madden, Genome Res. 7:649-656 (1997)), 특히 blastp 또는 tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).
핵산 또는 이의 단편을 지칭할 때, 용어 "실질적 상동성" 또는 "실질적 유사성"은, 상기 논의한 FASTA, BLAST 또는 Gap과 같은 임의의 공지된 서열 동일성 알고리즘으로 측정시, 적절한 뉴클레오티드 삽입 또는 결실과 함께 또다른 핵산 (또는 이의 상보적 가닥)과 최적으로 정렬될 경우, 최소한 약 76%, 80%, 85%, 바람직하게는 최소한 약 90%, 그리고 더욱 바람직하게는 최소한 약 95%, 96%, 97%, 98% 또는 99%의 뉴클레오티드 염기에서 뉴클레오티드 서열 동일성이 존재함을 의미한다.
핵산 (폴리뉴클레오티드로도 지칭됨)은 RNA, cDNA, 게놈 DNA, 및 상기의 합성 형태 및 혼합 중합체의 센스 및 안티센스 가닥 둘 모두를 포함할 수 있다. 이들은 화학적으로 또는 생화학적으로 변형될 수 있거나, 비-천연 또는 유도체화된 뉴클레오티드 염기를 함유할 수 있으며, 이를 해당 분야의 숙련된 기술자는 쉽게 이해할 것이다. 이러한 변형들에는, 예를 들면, 표지화, 메틸화, 하나 이상의 자연 발생 뉴클레오티드의 유사체로의 치환, 뉴클레오티드간 변형, 가령, 비하전된 링키지 (예컨대, 메틸 포스포네이트, 포스포트라이에스터, 포스포라미데이트, 카바메이트, 등), 하전된 링키지 (예컨대, 포스포로티오에이트, 포스포로디티오에이트, 등), 부속 모이어티 (예컨대, 폴리펩티드), 층간삽입물 (예컨대, 아크리딘, 소랄렌, 등), 킬레이터, 알킬레이터, 및 변형된 링키지 (예컨대, 알파 아노머 핵산 등)가 포함된다. 또한 수소 결합 및 다른 화학적 상호 작용을 통해 지정된 서열에 결합하는 능력에서 폴리뉴클레오티드를 모방하는 합성 분자가 포함된다. 이러한 분자는 해당 분야에 공지되어 있으며, 예를 들어, 펩티드 링키지가 분자의 골격에서 포스페이트 링키지를 대체하는 분자들을 포함한다. 다른 변형은, 예를 들어, 리보스 고리가 가교 모이어티 또는 다른 구조, 가령, "잠금" 핵산에서 발견되는 변형을 함유하는 유사체를 포함할 수 있다.
핵산 서열에 적용될 때, 용어 "돌연변이된"이란 핵산 서열의 뉴클레오티드가 참조 핵산 서열과 비교하여 삽입, 결실 또는 변경될 수 있음을 의미한다. 유전자좌에서 단일 변경(점 돌연변이)이 이루어질 수 있거나, 또는 단일 유전자좌에서 다수의 뉴클레오티드가 삽입, 결실 또는 변경될 수 있다. 또한, 핵산 서열 내의 임의의 수의 유전자좌에서 하나 이상의 변형이 이루어질 수 있다. 핵산 서열은 "에러-유발 PCR" (DNA 중합효소의 복제 충실도가 낮은 조건 하에서 PCR을 수행하기 위한 공정, 그 결과 PCR 생성물의 전체 길이를 따라 높은 비율의 점 돌연변이가 수득됨; 예를 들어, Leung et al., Technique, 1: 11-15 (1989) 및 Caldwell and Joyce, PCR Methods Applic. 2: 28-33 참조 (1992)); 그리고 "올리고뉴클레오티드-지정 돌연변이유발" (관심있는 임의의 클로닝된 DNA 단편에서 부위-특이적 돌연변이의 생성을 가능하게 하는 과정; 예를 들어, Reidhaar-Olson and Sauer, Science 241: 53-57 (1988) 참조)와 같은 돌연변이유발 기술을 포함한 (그러나 이에 제한되는 것은 아님) 해당 분야에 공지된 임의의 방법에 의해 돌연변이될 수 있다.
본 명세서에서 사용되는 용어 "벡터"는 그것이 연결되어 있는 또다른 핵산을 전달할 수 있는 핵산 분자를 지칭하고자 한다. 벡터의 한 유형은 "플라스미드"로서, 이는 일반적으로 추가 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프를 지칭하지만, 또한 선형 이중 가닥 분자, 가령, 중합효소 연쇄 반응 (PCR)에 의한 증폭으로 생성된 것, 또는 제한 효소를 이용하여 원형 플라스미드를 처리함으로써 생성된 것들 또한 내포된다. 다른 벡터에는 코스미드, 박테리아 인공 염색체 (BAC) 및 효모 인공 염색체 (YAC)가 내포된다. 다른 유형의 벡터는 바이러스성 벡터이며, 여기서 추가적인 DNA 분절은 바이러스 게놈에 결찰될 수 있다 (하기에서 더 상세히 논의됨). 특정 벡터는 이들이 도입되는 숙주 세포 (예를 들어, 숙주 세포에서 기능하는 복제 원점을 가지는 벡터)에서 자율 복제 가능하다. 다른 벡터는 숙주 세포로 도입될 때 숙주 세포의 게놈에 통합될 수 있으며, 이로써 숙주 게놈과 함께 복제된다. 또한, 특정 바람직한 벡터는 이들이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터를 본 명세서에서 "재조합 발현 벡터" (또는 간단히 "발현 벡터")라고 지칭한다.
본원에 사용된 용어 "발현 시스템"에는 숙주 세포에서 유전자의 발현을 위한 비히클 또는 벡터, 뿐만 아니라 숙주 염색체 내로 유전자의 안정적인 통합을 초래하는 비히클 또는 벡터가 내포된다.
"작동적으로 연결된" 또는 "작동가능하게 연결된" 발현 조절 서열은 발현 조절 서열이 관심 유전자와 인접해 있어 관심 유전자를 제어하는 링키지, 뿐만 아니라 트랜스(trans)로 작용하거나, 또는 일정 거리에서 작용하여 관심 유전자를 조절하는 발현 조절 서열을 지칭한다.
용어 "발현 조절 서열"이란 작동적으로 연결된 코딩 서열들의 발현에 영향을 주는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 조절 서열은 핵산 서열들의 전사, 전사후 사건 및 해독을 제어하는 서열이다. 발현 조절 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 신호와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열; 해독 효율을 향상시키는 서열 (예를 들어, 리보솜 결합 부위); 폴리펩티드 안정성을 향상시키는 서열; 및 필요한 경우, 폴리펩티드 분비를 향상시키는 서열을 포함한다. 이러한 조절 서열의 성질은 숙주 유기체에 따라 상이한데; 원핵 생물에서, 이러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함한다. "조절 서열"이라는 용어는, 최소한, 그 존재가 발현에 필수적인 모든 성분을 포함하며, 그 존재가 유리한 추가 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 포함할 수 있는 것으로 한다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 RNA 중합효소가 유전자 전사를 개시하기 위해 결합하는 DNA 영역으로서, mRNA 전사 개시 부위의 5' 방향에 위치하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "재조합 숙주 세포" (또는 간단히 "숙주 세포")는 재조합 벡터가 도입된 세포를 지칭하는 것으로 한다. 이러한 용어는 특정 대상 세포 뿐만 아니라 그러한 세포의 자손을 의미하는 것으로 이해되어야 한다. 돌연변이 또는 환경적 영향으로 인해 특정 변형이 후속 세대에서 발생할 수 있기 때문에, 이러한 자손은 실제로 모 세포와 동일하지 않을 수 있지만, 본원에 사용된 용어 "숙주 세포"의 범위 내에 여전히 내포된다. 재조합 숙주 세포는 배양하여 성장된 분리된 세포 또는 세포주일 수 있거나 또는 살아있는 조직 또는 유기체에 존재하는 세포일 수 있다.
용어 "폴리펩티드"는 자연-발생 단백질과 비-자연 발생 단백질 모두, 그리고 이의 단편, 돌연변이체, 유도체 및 유사체를 포괄한다. 폴리펩티드는 단량체 또는 중합체일 수 있다. 더욱이, 폴리펩티드는 다수의 상이한 도메인을 포함할 수 있는데, 도메인 각각은 하나 또는 그이상의 별개의 활성을 갖는다.
본원에 사용된 바와 같이, 용어 "분자"는 소분자, 펩티드, 폴리펩티드, 당, 뉴클레오티드, 핵산, 폴리뉴클레오티드, 지질 등을 포함하나, 이에 국한되지 않는 임의의 화합물을 의미하고, 이러한 화합물은 천연 화합물이거나 또는 합성 화합물일 수 있다.
본 명세서에 사용된 바와 같이, 용어 "블록(block)" 또는 "반복 단위"는 천연 실크 폴리펩티드 서열에서 반복적으로 발견되고, 기본 반복 실크 폴리펩타이드 서열의 단위로 삼게 되는, 적당한 변형(있을 수 있음)을 갖는, 발견되는 천연 실크 폴리펩티드의 대략 12개 아미노산보다 큰 부분서열을 의미한다. 블록에는 매우 짧은 "모티프"가 내포될 수 있지만, 반드시 그런 것은 아니다. 본원에 사용된 바와 같이, "모티프"는 다중 블록으로 나타나는 대략 2-10개의 아미노산 서열을 의미한다. 예를 들면, 모티프는 아미노산 서열 GGA, GPG, 또는 AAAAA로 구성될 수 있다. 다수 블록의 서열은 "블록 공-중합체"이다.
본원에 사용된 바와 같이, 용어 "반복 도메인"이란 실크 폴리펩티드에서 연속성 (공지의 실크 스페이서 요소를 제외하고, 실질적인 비-반복성 도메인에 의해 중단되지 않은) 반복성 세그먼트 세트로부터 선택된 서열을 지칭한다. 고유 실크 서열은 일반적으로 하나의 반복 도메인을 함유한다. 일부 구체예들에서, 실크 분자 당 하나의 반복 도메인이 있다. 본원에 사용된 것과 같이, "매크로-반복"이란 하나 이상의 블록을 포함하는 자연 발생적 반복 아미노산 서열이다. 구체예에서, 매크로-반복은 반복 도메인에서 적어도 2회 반복된다. 추가 구체예에서, 두 번의 반복은 불완전하다. 본원에 사용된 바와 같이, "유사(quasi)-반복"이란 블록이 유사하지만, 아미노산 서열이 동일하지 않도록 하나 이상의 블록을 포함하는 아미노산 서열이다.
본원에 사용된 바와 같이, "반복 서열" 또는 "R"은 반복성 아미노산 서열을 지칭한다. 구체예에서, 반복 서열에는 매크로-반복 또는 매크로-반복의 단편들이 내포된다. 또다른 구체예에서, 반복 서열에는 블록이 내포된다. 추가 구체예에서, 단일 블록은 두개 반복 서열 사이에서 나뉜다.
"약(about)"이라는 용어는 지정 값 및 그 값의 위와 아래 범위를 포괄하는 것을 나타낸다. 특정 구체예들에서, 용어 "약(about)"은 지정 값 ± 10%, ± 5%, 또는 ± 1%을 나타낸다. 특정 구체예들에서, 적용가능할 경우, 용어 "약"이란 지정 값(들) ± 이 값(들)의 하나의 표준 편차를 나타낸다.
본 명세서 및 첨부된 청구범위에서 사용되는, 단수형 "하나" 및 "그것"은 문맥에서 달리 명확히 언급이 없는 한, 복수형을 포함함을 유념하여야 한다.
본원에 언급된 범위는 언급된 종점을 포함하는 범위 내의 모든 값에 대한 축약 형으로 이해된다. 예를 들면, 1 ~ 50의 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 및 50으로 구성된 군의 임의의 수의 조합 또는 이의 하위-범위가 내포되는 것으로 이해되어야 한다. 또한, 2-5%의 범위에는 2%와 5%, 그리고 그 사이에 있는 숫자 또는 분수가 내포되는데, 예를 들면 다음과 같다: 2.25%, 2.5%, 2.75%, 3%, 3.25%, 3.5%, 3.75%, 4%, 4.25%, 4.5%, 및 4.75%.
재조합 단백질을 용해화시키는 방법
세포 배양물에서 발현된 재조합 거미 실크 단백질은 이들 세포 성분으로부터 정제된 정제되어야 한다. 일부 경우들에서, 상기 실크 단백질은 불용성 세포 찌꺼리 안에 포집되거나, 또는 불용성 실크 단백질 응집체를 형성한다. 불용성 실크 단백질은 정제하기 어렵고, 재조합 실크 단백질 회수가 줄어들게 된다. 이러한 경우들에서, 상기 불용성 세포 찌꺼기 또는 응집체에 다양한 방법을 적용시켜 이 실크 단백질을 방출시키고, 정제를 위해 이를 용해화하여, 이로써 상기 재조합 실크 단백질의 회수가 증가된다.
용해화 과정
재조합 거미 실크 단백질을 용해화시켜, 숙주 세포로부터 이러한 단백질의 추출 및 정제가 개선되게 하는 방법들이 본원에서 기술된다. 일부 경우들에서, 상기 재조합 거미 실크 단백질은 결정질 실크 단백질이다. 결정질 실크 단백질은 비-결정질 실크 단백질보다 용액에서 용해도가 더 낮다.
예시적인 용해화 과정 및 정제 과정은 도 1에 나타낸다. 선택적 순서 단계들은 점선으로 표시된다. 우선, 실크 단백질은 형질전환된 숙주 세포에서 발현된다. 그 다음, 상기 숙주 세포들을 균질화시키고, 실크 단백질이 내포된 불용성 세포 물질이 원심분리를 통하여 펠렛화되며, 상청액을 버리고, 그리고 상기 불용성 물질은 염 및 알코올을 포함하는 용액에서 재현탁된다. 한 실시예에서, 상기 염은 염화 칼슘이고, 상기 알코올은 메탄올이다. 대안으로, 상기 숙주 세포를 직접적으로 염/알코올 용액에 추가하여, 세포를 용해시키고, 해당 실크 단백질을 방출시킬 수 있다. 상기 실크 단백질은 염/알코올 용액에서 항온처리되어, 해당 단백질의 용해화가 증가되며, 남아있는 불용성 물질은 원심분리를 통하여 다시 펠렛화된다. 이 시점에서, 가용성 실크 단백질을 갖는 상청액이 남아있게 되고, 비-실크 단백질 불순물을 제거하기 위한 추가 단계들을 거치게 된다. 일부 경우들에서, 상기 비-실크 단백질 불순물을 침전시키기 위해 물의 추가가 이용된다. 상기 침전된 불순물은 다시 원심분리를 통하여 제거될 수 있고, 폐기될 수 있다. 가용성 실크 단백질을 갖는 알코올 상청액이 남아있고, 상기 알코올은 증발된다. 상기 추출된 실크 단백질 상에서 추가 정제가 실시될 수 있는데, 이를 테면, 여과 또는 투석이 실시될 수 있고, 그 다음 건조시켜 분말을 만든다. 이 용해화 과정에는 용해화된 실크 단백질이 있는 상청액에 알코올이 포함되어 있기 때문에, 방폭형 원심분리기(explosion-proof centrifuge)가 필요하다.
제 2의 예시적인 용해화 과정 및 정제 과정은 도 2에 나타낸다. 선택적 순서 단계들은 점선으로 표시된다. 이 실시예에서, 상기 숙주 세포의 초기 생산 및 용해는 앞선 예시적인 용해화 공정의 것과 동일하다. 상기 실크 단백질은 숙주 세포에서 발현되고, 용해되고, 실크 단백질을 갖는 불용성 부분을 펠렛화시키고, 그 다음 염과 알코올을 포함하는 용액에 재현탁된다. 이 시점에서, 용해화안된 세포 물질은 원심분리가 아닌, 중력을 통하여 침강되도록 한다. 가용성 실크 단백질을 갖는 알코올 상청액을 수집하고, 상기 알코올은 증발된다.. 상기 가용성 실크 단백질을 갖는 상청액은 비-실크 단백질 불순물을 제거하기 위한 추가 단계들을 거치게 된다. 일부 경우들에서, 상기 비-실크 단백질 불순물을 침전시키기 위해 물의 추가가 이용된다. 상기 침전된 불순물은 다시 원심분리를 통하여 제거될 수 있고, 폐기될 수 있다. 상기 추출된 실크 단백질 상에서 추가 정제가 실시될 수 있는데, 이를 테면, 여과 또는 투석이 실시될 수 있고, 그 다음 건조시켜 분말을 만든다. 이 용해화 공정은 방폭형 원심분리기를 필요로 하지 않는다.
일부 구체예들에서, "가용성" 또는 "용해화된"이란 용액 안에 용해된 거미 실크 단백질의 부분을 지칭한다. 일부 구체예들에서, "용해화"란 용액 안에 용해된 거미 실크 단백질의 부분이 용해된 공정을 지칭한다.
일부 구체예들에서, 용해된 거미 실크 단백질의 부분은 전체 거미 실크의 약 1-100% w/w, 1-10% w/w, 1-5% w/w, 5-10% w/w, 10-15% w/w, 15-20% w/w, 20-25% w/w, 25-30% w/w, 30-35% w/w, 35-40% w/w, 40-45% w/w, 45-50% w/w, 50-55% w/w, 55-60% w/w, 60-65% w/w, 65-70% w/w, 70-75% w/w, 75-80% w/w, 80-85% w/w, 85-90% w/w, 90-95% w/w, 또는 95-100% w/w이다. 일부 구체예들에서, 용해된 거미 실크 단백질의 부분은 전체 거미 실크의 적어도 약 1% w/w, 5% w/w, 10% w/w, 15% w/w, 20, 25% w/w, 30% w/w, 35% w/w, 40% w/w, 45% w/w, 50% w/w, 55% w/w, 60% w/w, 65% w/w, 70% w/w, 75% w/w, 80% w/w, 85% w/w, 90% w/w, 95% w/w, 99% w/w, 또는 100% w/w이다. 일부 구체예들에서, 불용성이란 용액 안에 용해되지 않은 거미 실크 단백질의 부분을 지칭한다. 일부 구체예들에서, 불용성 거미 실크 단백질의 부분은 전체 거미 실크의 약 1-100% w/w, 1-10% w/w, 1-5% w/w, 5-10% w/w, 10-15% w/w, 15-20% w/w, 20-25% w/w, 25-30% w/w, 30-35% w/w, 35-40% w/w, 40-45% w/w, 45-50% w/w, 50-55% w/w, 55-60% w/w, 60-65% w/w, 65-70% w/w, 70-75% w/w, 75-80% w/w, 80-85% w/w, 85-90% w/w, 90-95% w/w, 또는 95-100% w/w이다.
일부 구체예들에서, 염을 상기 불용성 세포 부분, 펠렛, 또는 용해물에 추가하여, 상기 재조합 거미 실크 단백질을 용해시킨다. 적절한 염에는 칼슘 이온, 스트론튬 이온, 바륨 이온, 마그네슘 이온, 리튬 이온, 나트륨 이온, 칼륨 이온 또는 암모늄 이온과의 염이 내포되지만, 이에 국한되지는 않는다. 이러한 염에는 다음이 내포되나, 이에 국한되지 않는다: 염화칼슘, 질산칼슘, 티오시안산칼슘, 탄산칼슘, 불화칼슘, 요오드화칼슘, 옥살산칼슘, 인산칼슘, 황산칼슘, 브롬화칼슘, 브롬화스트론튬, 탄산스트론튬, 염화스트론, 불화스트론튬, 요오드화스트론튬, 질산스트론튬, 염화바륨, 브롬화바륨, 요오드화바륨, 아세트산바륨, 시안화바륨, 질산바륨, 황산바륨, 탄산바륨, 황화바륨, 불화바륨, 망간산바륨, 인산바륨, 탄산바륨, 질산나트륨, 염화나트륨, 브롬화나트륨, 요오드화나트륨, 나트륨 불화물, 질산칼륨, 염화칼륨, 브롬화칼륨, 불화칼륨, 요오드화칼륨, 또는 이들의 임의의 조합. 일부 구체예들에서, 염은 염화칼슘, 브롬화칼슘, 요오드화칼슘, 염화스트론튬, 브롬화스트론튬, 요오드화스트론튬, 염화바륨, 브롬화바륨, 요오드화바륨, 또는 이들의 임의의 조합이다. 일부 구체예들에서, 상기 염은 칼슘 염이다. 일부 구체예들에서, 상기 염은 염화 칼슘이다. 일부 구체예들에서, 상기 염은 요오드화 칼슘이다. 일부 구체예들에서, 상기 염은 브롬화 칼슘이다. 일부 구체예들에서, 상기 염은 질산 칼슘이다. 일부 구체예들에서, 상기 염은 티오시안산칼슘이다. 일부 구체예들에서, 상기 염은 스트론튬 염이다. 일부 구체예들에서, 상기 염은 염화스트론튬, 요오드화 스트론튬, 또는 브롬화스트론튬이다. 일부 구체예들에서, 상기 염은 바륨 염이다. 일부 구체예들에서, 상기 염은 염화바륨, 요오드화바륨, 또는 브롬화바륨이다.
알코올
일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물을 알코올을 포함하는 용액에 추가하여, 상기 재조합 거미 실크 단백질을 용해화시킨다. 메탄올, 에탄올, 이소프로판올, 이소프로필 알코올, n-프로필 알코올, 부탄올, 펜탄올, 또는 이들의 임의의 유도체, 또는 이들의 임의의 조합을 포함하나 이에 제한되지 않는 당업계에 공지된 임의의 적절한 알코올이 사용될 수 있다. 일차, 이차, 또는 삼차 알코올이 이용될 수 있다. 예시적인 일차 알코올에는 에탄올과 메탄올이 내포된다. 예시적인 이차 알코올에는 이소프로필 알코올과 n-프로필 알코올이 내포된다. 예시적인 삼차 알코올에는 tert-부탄올이 내포된다. 일부 구체예들에서, 상기 알코올은 메탄올이다. 일부 구체예들에서, 상기 알코올은 에탄올이다. 일부 구체예들에서, 상기 알코올은 이소프로판올이다.
완충 조건
염 및 산 용액에 재현탁된 불용성 세포 부분의 양은 부피 대 질량 비율로 또한 설명될 수 있다. 예시적인 부피 대 질량비는 3X, 예를 들어, 용액 300ml 및 세포 덩어리 (mass) 100g이다. 일부 구체예들에서, 상기 불용성 세포 부분 덩어리와 염 및 알코올 용액 부피 비율은 1-10X 덩어리 대 부피, 1-2X 덩어리 대 부피, 1-3X 덩어리 대 부피, 3-5X 덩어리 대 부피, 5-7X 덩어리 대 부피, 6-8X 덩어리 대 부피, 또는 8-10X 덩어리 대 부피일 수 있다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 1X, 2X, 3X, 4X, 5X, 6X, 7X, 8X, 9X, 또는 10X일 수 있다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 3X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 최대한 많아도 3X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 5X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 7X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 9X이다.
상기 세포 덩어리의 불용성 부분은 염 및 알코올 용액에 재현탁된다. 최종 재현탁액에서 세포 덩어리의 양은 용액 부피에 대한 세포 덩어리의 백분율 (부피 백분율로 중량)로 기술될 수 있다. 용액 부피에 대한 세포 덩어리의 부피 중량 백분율의 예시는 100%, 예를 들어, 100mg 세포 덩어리와 100ml 용액이다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량은 1-100%, 1-5%, 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 90-95%, 또는 95-100% w/v일 수 있다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% w/v이다.
일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 약 15% (w/v)이다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 최대한 많아도 35% (w/v)이다.
일부 구체예들에서, 상기 염 및 알코올 용액 그리고 상기 불용성 세포 부분, 펠렛, 또는 용해물을 포함하는 용액에서 염의 농도는 0.01-10 M, 0.01-0.1 M, 0.1-0.5 M, 0.5-1 M, 1-2 M, 2-3 M, 3-4 M, 4-5 M, 5-6 M, 6-7 M, 7-8 M, 8-9 M, 또는 9-10 M일 수 있다. 일부 구체예들에서, 염 및 알코올 용액 그리고 세포 용해물 또는 펠렛을 포함하는 용액에서 상기 염의 농도는 적어도 약 0.1 M, 0.15 M, 0.2 M, 0.25 M, 0.3 M, 0.35 M, 0.4 M, 0.45 M, 0.5 M, 0.55 M, 0.6 M, 0.65 M, 0.7 M, 0.75 M, 0.8 M, 0.85 M, 0.9 M, 0.95 M, 1 M, 1.5 M, 2 M, 2.5 M, 3 M, 3.5 M, 4 M, 4.5 M, 5 M, 5.5 M, 6 M, 6.5 M, 7 M, 7.5 M, 8 M, 8.5 M, 9 M, 9.5 M, 또는 10 M일 수 있다. 일부 구체예들에서, 상기 용액에서 염의 농도는 1M, 1,5M, 2M, 2.5M 또는 3M이다. 일부 구체예들에서, 상기 용액에서 염의 농도는 2M이다.
전단 보호제, 점도 조절제 및/또는 소포 구조적 속성들에 영향을 미치는 용질과 같은 추가 완충제 변형도 사용할 수 있다. 균질화 또는 미세유동화의 효율을 개선하기 위해, 부형제, 이를 테면, 막 연화제 및 분자 크라우딩제(molecular crowding agent)가 또한 첨가될 수 있다. 완충액에 대한 기타 변형에는 특정 pH 범위 및/또는 다중 농도의 염, 유기 용매, 소분자, 세제, 양쪽성 이온, 아미노산, 중합체 및/또는 상기 것들중 임의의 조합의 다중 농도가 내포될 수 있다.
항온처리 시간 및 온도
일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 정해진 시간 동안 상기 염과 알코올을 포함하는 용액과 함께 항온처리된다. 상기 세포 펠렛 또는 용해물과 상기 용액의 항온처리 시간의 양은 거미 실크 단백질의 용해화를 증가시키기 위해, 또는 이 단백질의 임의의 가능한 분해를 감소시키기 위해 변경될 수 있다. 상기 항온처리 시간은 1 분에서 3 시간 (180 분) 이상, 1 분 내지 60 분, 3 분 내지 90 분, 60 분 내지 120 분, 90 분 내지 150 분, 또는 120 분 내지 180 분일 수 있다. 상기 항온처리 시간은 적어도 1 분, 5 분, 10 분, 15 분, 20 분, 30 분, 45 분, 60 분, 75 분, 90 분, 105 분, 120 분, 135 분, 150 분, 165 분, 180 분, 또는 그 이상일 수 있다. 일부 구체예들에서, 상기 항온처리 시간은 15 분이다. 일부 구체예들에서, 상기 항온처리 시간은 30 분이다. 일부 구체예들에서, 상기 항온처리 시간은 60 분이다. 일부 구체예들에서, 상기 항온처리 시간은 75 분이다. 일부 구체예들에서, 상기 항온처리 시간은 90 분이다. 일부 구체예들에서, 상기 항온처리 시간은 105 분이다. 일부 구체예들에서, 상기 항온처리 시간은 120 분이다.
상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 10-70℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 10-20℃, 20-30℃, 20-22℃, 20-25℃, 25-20℃, 30-40℃, 30-35℃, 35-40℃, 40-55℃, 50-55℃, 55-60℃, 또는 60-70℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 20-30℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 22℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 35℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 55℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 70℃를 넘지 않은 온도에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 20℃보다 낮지 않은 온도에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 실온에서 항온처리될 수 있다.
일부 구체예들에서, 상기 재조합 거미 실크 단백질은 숙주 세포의 세포질에서 발현된다. 이 단백질을 단리하기 위해 상기 숙주 세포를 용해시켜 상기 재조합 거미 실크 단백질을 방출시켜야 한다. 상기 숙주 세포를 용해시키기 위한 임의의 적절한 방법이 이용될 수 있는데, 이 방법에는 열 처리, 화학적 처리, 전단 파괴, 물리적 균질화, 초음파처리, 또는 화학적 균질화가 내포되나, 이에 국한되지 않는다. 화학적 처리에는 원핵 및 진핵 세포의 원형질막을 파괴하는 것으로 알려진 화학 물질 또는 효소, 이를 테면, Triton X-100, Nonidet P-40, CHAPS, 나트륨 도데실 설페이트 (SDS) 또는 기타 적절한 세제와 함께 세포를 항온처리하는 것이 내포된다.
상기 재조합 거미 실크 단백질을 포함하는 불용성 부분은 상기 세포 용해물을 원심분리시키고, 이 세포 용해물에서 상기 재조합 거미 실크 단백질을 비롯한 불용성 물질의 펠렛이 형성됨으로써, 수집될 수 있다. 불용성 재조합 단백질을 펠릿화하는 원심력 또는 속도는 당업자에 의해 결정될 수 있다. 일부 구체예들에서, 상기 원심분리기 속도는 100-10,000 x g이다. 일부 구체예들에서, 상기 원심분리력은 100 x g, 200 x g, 300 x g, 400 x g, 500 x g, 600 x g, 700 x g, 800 x g, 900 x g, 1000 x g, 2000 x g, 3000 x g, 4000 x g, 5000 x g, 6000 x g, 7000 x g, 8000 x g, 9000 x g, 또는 10,000 x g이다. 대안으로, 상기 재조합 거미 실크 단백질을 포함하는 불용성 부분은 침강에 의해 수집될 수 있다.
불순물 제거
일부 구체예들에서, 용해화된 거미 실크 단백질을 포함하는 용액으로부터 비-거미 실크 단백질의 생물학적 또는 화학적 불순물이 제거될 수 있다. 이 용액에서 불순물을 제거하는 것은 여과, 흡수 (가령, 목탄 또는 고체 상태 흡수), 투석 및 코아세르베이션 또는 다양한 화학 물질의 사용에 의해 유도된 상 분리에 의해 수행될 수 있다. 다른 구체예들에서, 상(phase) 분리는 코스모트로프(cosmotrope) 및/또는 용액으로부터 단백질을 침전시키는 데 사용되는 화합물을 첨가함으로써, 화학적으로 유도될 수 있다.
일부 구체예들에서, 불순물은 여과, 정밀여과, 정용여과 및/또는 한외여과 (가령, 탈이온수에 대항하여)를 사용하여 제거된다. 정밀여과에 적합한 막에는 0.1 uM 내지 1 uM가 내포될 수 있다. 한외여과에 적합한 막의 비-제한적 예로는 50 kDa ~ 800 kDa, 100 kDa ~ 800 kDa, 200 kDa ~ 800 kDa, 300 kDa ~ 800 kDa, 400 kDa ~ 800 kDa, 500 kDa ~ 800 kDa, 600 kDa ~ 800 kDa, 700 kDa ~ 800 kDa, 100 kDa ~ 700 kDa, 200 kDa ~ 700 kDa, 300 kDa ~ 700 kDa, 400 kDa ~ 700 kDa, 500 kDa ~ 700 kDa, 600 kDa ~ 700 kDa, 또는 500 kDa ~ 600 kDa의 분자량 컷-오프를 갖는 소수성 막(가령, PES, PS, 셀룰로오스 아세테이트)이 내포된다. 일부 구체예들에서, 한외여과에 의해 농축물(retentate)로서 물 안에 재조합 단백질 슬러리, 그리고 불순물을 포함하는 투과물(permeate)이 생성된다. 한외여과에 적합한 조건 (예를 들어, 막, 온도, 부피 대체)은 투과물 밀도를 최대화하도록 맞춰진 당업계에 공지된 방법을 사용하여 결정할 수 있다. 일부 구체예들에서, 한외여과로 1g/mL ~ 30g/mL 사이의 밀도를 갖는 농축물이 제공된다. 일부 구체예들에서, 한외여과는 농축된 잔류물을 생성하는 농축 단계, 이어서 불순물을 제거하고 물에 현탁된 단백질 슬러리를 생성하는 정용여과 단계를 포함한다. 일부 이러한 구체예들에서, 상기 농축된 농축물은 출발 부피에 대해 2-배 ~ 12-배 부피 양으로 감소되는 농축 비율을 갖는다. 일부 구체예들에서, 상기 정용여과에서 3-배 ~ 10-배 사이의 일정한 부피 대체가 제공된다. 정용여과는 미세 투과성 필터를 통해, 구성 요소들의 분자 크기에 기초하여, 용액내 성분, 이를 테면, 염, 소분자, 단백질, 용매 및 이와 유사한 것들의 제거 또는 분리가 연루된 희석 공정이다.
실시예에 따라, 그리고 제거하고자 하는 불순물의 종류에 따라, 불순물 제거 방법이 달라질 수 있다. 용해화된 실크 단백질을 포함하는 용액으로부터 지질 불순물을 제거하는 방법은 당업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 목탄 또는 지질에 특이적으로 결합하는 다른 흡수 매질에 대한 흡수가 내포된다. 단리된 재조합 단백질로부터 다당류 불순물 제거는 당업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 다당류를 가수분해하는 효소로 처리한 후, 한외여과에 의해 생성된 작은 당의 제거가 내포된다. 이러한 효소의 비-제한적인 예로는 글루카나아제, 리티나아제, 만나아제 및 키티나아제가 내포된다.
정량화
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 전장의 재조합 거미 실크 단백질이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 90-95%, 또는 95-100%이다. 일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 100%이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함한다.
일부 구체예들에서, 상기 전장의 재조합 거미 실크 단백질은 측정되거나, 또는 정량화된다. 전장의 재조합 단백질의 양을 측정 또는 정량화시키는데 이용될 수 있는 임의의 적합한 방법에는 다음이 내포되나, 이에 국한되지 않는다: 크기배제 크로마토그래피 (SEC), SDS-PAGE, 면역블랏 (웨스턴 블랏), 고성능 액체 크로마토그래피 (HPLC), SEC HPLC, 액체 크로마토그래피-질량 분석법(LC-MS), 또는 고속 단백질 액체 크로마토그래피(FPLC), 또는 당업계에 공지된 임의의 기타 적절한 방법, 또는 이들의 임의의 조합. 한 구체예에서, 상기 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 또다른 구체예에서, 상기 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피 (SEC)를 이용하여 측정된다.
재조합 거미 실크 조성물
실크 폴리펩티드는 벌, 나방, 거미, 진드기 및 기타 절지 동물을 비롯한 다양한 공급원으로부터 얻는다. 일부 유기체는 특유한 서열, 구조적 요소들 및 기계적 속성들을 가진 여러 실크 섬유를 만든다. 예를 들면, 황금눈 뜨개 거미(orb weaving spiders)는 환경 또는 삶의 주기에 맞도록 맞춤 섬유로 중합되는 서로 상이한 실크 폴리펩티드 서열을 만드는 6개의 특유 유형의 선(glands)을 보유하고 있다. 상기 섬유의 이름은 이 섬유가 유래하는 선(glands)의 이름을 따서 명명되었으며, 폴리펩티드는 선(glands)의 약어(가령, "Ma"), 스피드로인(spidroin)의 경우 "Sp"(거미 피브로인의 약자)로 표시된다. 오브 위버(orb weavers)에서, 이러한 유형에는 메이저 엠풀레이트(MaSp, 드래그라인(dragline)이라고도 함), 마이너 엠풀레이(MiSp), 플라겔리폼(Flag), 아시니폼(AcSp), 튜불리폼(TuSp) 및 피리폼(PySp)이 내포된다. 유기체에서 이한 속 및 종에 걸쳐 섬유 유형, 도메인 및 변이 전반에 걸친 폴리펩티드 서열의 이러한 조합은 재조합 섬유의 상업적 생산에 의해 이용될 수 있는 광범위한 잠재적 속성들을 유도한다. 지금까지, 재조합 실크 작업의 대부분은 메이저 엠풀레이트 스피드로인 (MaSp)에 중점을 두었다.
US 특허 9,963,554, "Methods and Compositions for Synthesizing Improved Silk Fibers" (본원의 참고자료에 편입됨)에서는 합성 블록 공중합체, 이들의 생산을 위한 재조합 미생물, 그리고 이들 단백질을 포함하는 합성 섬유용 조성물이 개시되어 있다. US 특허 공개 2019/0100740 (2019년 4월 4일자로 공개됨), 제목 "Modified Strains for the Production of Recombinant Silk" (본원의 참고자료에 편입됨)에서는 효모 세포에 의해 발현되는 재조합 단백질의 분해를 감소시키기 위해, 선택되거나 또는 유전적으로 조작된 피치아 파스토리스(Pichia pastoris) 세포, 및 유용한 화합물의 생산을 위한 효모 세포를 배양하는 방법을 개시한다.
몇 가지 유형들의 고유 거미 실크가 확인된 바 있다. 각각의 천연 방적 실크 유형의 기계적 속성들은 당해 실크의 분자 조성에 밀접하게 연결되어 있는 것으로 여겨진다. 예를 들면, Garb, J.E., et al., Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol., 10:243 (2010); Bittencourt, D., et al., Protein families, natural history and biotechnological aspects of spider silk, Genet. Mol. Res., 11:3 (2012); Rising, A., et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci., 68:2, pg. 169-184 (2011); 그리고 Humenik, M., et al., Spider silk: understanding the structure-function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci., 103, pg. 131-85 (2011) 참고. 예를 들면:
아시니폼(aciniform) (AcSp) 실크는 적당히 높은 강도와 적당히 높은 탄력성이 결합된 결과, 높은 인성을 가지는 경향이 있다. AcSp 실크는 종종 폴리 세린 및 GPX의 모티프를 포함하는 큰 블록 ("앙상블 반복") 크기를 특징으로 한다. 튜불리폼(Tubuliform) (TuSp 또는 원통형) 실크는 보통의 강도 및 높은 탄력성으로 인해 큰 직경을 가지는 경향이 있다. TuSp 실크는 폴리 세린 및 폴리 트레오닌 함량 및 짧은 폴리 알라닌 트랙(tracks)을 특징으로 한다. 메이저 엠풀레이트(Major Ampullate) (MaSp) 실크는 높은 강도 및 보통의 탄력성을 가지는 경향이 있다. MaSp 실크는 다음 두 가지 아형들(subtypes) 중 하나 일 수 있다: MaSp1 및 MaSp2. MaSp1 실크는 일반적으로 MaSp2 실크보다 탄력성이 작고, 폴리 알라닌, GX, 및 GGX 모티프로 특징된다. MaSp2 실크는 폴리 알라닌, GGX, 및 GPX 모티프를 특징으로 한다. 마이너 엠풀레이트(Minor Ampullate) (MiSp) 실크는 보통의 강도 및 보통의 탄력성을 가지는 경향이 있다. MiSp 실크는 GGX, GA, 및 폴리 A 모티프로 특징되며, 종종 대략 100개 아미노산의 스페이서(spacer) 요소들을 함유한다. 플라겔리폼(Flagelliform) (Flag) 실크는 매우 높은 탄력성과 보통의 강도를 가지는 경향이 있다. 플래그(Flag) 실크는 보통 GPG, GGX, 및 짧은 스페이서 모티프를 특징으로 한다.
각 실크 유형의 속성들은 종마다 다를 수 있으며, 독특한 라이프스타일 (예컨대, 앉아있는 거미줄 스피너 대 베가본드 사냥꾼)을 이끄는 거미 또는 진화적으로 오래된 거미는 위의 설명과 다른 특성을 가진 실크를 생산할 수 있다 (거미 다양성 및 분류의 설명에 관하여, Hormiga, G., and Griswold, C.E., Systematics, phylogeny, and evolution of orb-weaving spiders, Annu. Rev. Entomol. 59, pg. 487-512 (2014); 및 Blackedge, T.A. et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. Natl. Acad. Sci. U.S.A., 106:13, pg. 5229-5234 (2009) 참고). 그러나, 천연 실크 단백질의 반복 도메인과 서열 유사성 및/또는 아미노산 조성 유사성을 가지는 합성 블록 코폴리머 폴리펩티드는 상응하는 천연 실크 섬유의 특성을 재현하는 상업적 규모의 일관된 실크-유사 섬유를 제조하는데 사용될 수 있다.
일부 구체예들에서, 상기 재조합 거미 실크는 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질이다. 일부 구체예들에서, 상기 재조합 거미 실크 단백질은 비-무질서 용매에서 90%, 80%, 70%, 60%, 또는 50% 미만의 용해도 임계치를 갖는다.
실크 뉴클레오티드 및 펩티드 서열
추정 실크 서열들의 목록은 관련 용어들, 예컨대 "스피드로인(spidroin)", "피브로인(fibroin)", "MaSp"에 관해 GenBank를 검색함으로써 컴파일될 수 있으며, 독립적인 시퀀싱 시도를 통해 수득된 추가 서열들과 함께 풀링(pooled)될 수 있다. 이어서, 서열들은 아미노산으로 해독되고, 중복 엔트리(entries)에 대해 필터링되고, 수작업을 통하여 도메인들 (NTD, REP, CTD)로 분할된다. 일부 구체예들에서, 후보 아미노산 서열들은 피치아 (코마가타엘라) 파스토리스(Pichia (Komagataella) pastoris)에서의 발현을 위해 최적화된 DNA 서열로 역-해독된다. DNA 서열들은 각각 발현 벡터로 클론되고 피치아 (코마가타엘라) 파스토리스로 형질전환된다. 일부 구체예들에서, 성공적인 발현 및 분비를 나타내는 다양한 실크 도메인들은 이어서 조합 방식으로 어셈블되어 섬유 형성이 가능한 실크 분자를 형성한다.
실크 폴리펩티드는 특징적으로 비-반복 영역 (예를 들어, C-말단 도메인 및 N-말단 도메인)이 연접된 반복 도메인 (REP)으로 구성된다. 상기 반복 도메인은 계층 구조를 나타낸다. 이러한 반복 도메인은 일련의 블록들 (반복 유닛으로도 지칭됨)을 포함한다. 실크 반복 도메인 전체에 걸쳐 블록들은, 때로는 완전하게 때로는 불완전하게 (유사(quasi)-반복 도메인을 구성함) 반복된다. 블록들의 길이 및 조성은 상이한 실크 유형에 따라, 그리고 상이한 종들에 걸쳐 달라진다. 표 1은 선택된 종 및 실크 유형들로부터 얻은 블록 서열들의 예를 열거하며, 추가 예들은 Rising, A. et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci., 68:2, pg 169-184 (2011); 및 Gatesy, J. et al., Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001)에 제시되어 있다. 일부 경우들에서, 블록들은 규칙적인 패턴으로 배열되어, 해당 실크 서열의 반복 도메인에서 여러 차례 (보통 2-8회) 나타나는 더 큰 매크로(macro)-반복을 형성할 수 있다. 반복 도메인 또는 매크로-반복 내 반복된 블록 및 반복 도메인 내 반복된 매크로-반복은 스페이싱 요소에 의해 분리될 수 있다. 블록 서열들은 폴리A 영역을 수반하는 글리신 풍부 영역을 포함할 수 있다. 짧은 (~1-10개) 아미노산 모티프는 블록 내 여러 번 나타난다. 일반적으로 관찰되는 모티프의 하위 집합이 도 1에 나와 있다. 상이한 천연 실크 폴리펩티드들로부터 얻은 블록들은 원 순열 (circular permutation)을 고려하지 않고 선택될 수 있다 (즉, 실크 폴리펩티드들 간에 다른 방식으로 유사한 식별된 블록들은 원 순열로 인해 정렬하지 않을 수 있다). 그러므로, 예를 들어, SGAGG의 "블록"은 본원의 방법 및 조성물의 목적에 있어, GSGAG과 GGSGA와 동일하며; 이들은 모두 서로 원 순열이다. 주어진 실크 서열에 대해 선택된 특정 순열은 그 무엇보다도 편의상 지정될 수 있다 (보통 G로 시작). NCBI 데이터베이스로부터 얻은 실크 서열들은 블록과 비-반복 영역들로 구분될 수 있다.
표 1: 블록 서열
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
특정 구체예에 따른 블록 및/또는 매크로-반복 도메인으로부터 얻은 섬유-형성 블록 공중합체 폴리펩티드는 참고문헌으로 포함된 국제 특허 공개 공보 WO/2015/042164에 기재되어 있다. GenBank와 같은 단백질 데이터베이스 또는 신생경로 (de novo) 시퀀싱을 통해 얻은 천연 실크 서열은 도메인 (N-말단 도메인, 반복 도메인 및 C-말단 도메인) 별로 분류된다. 섬유로의 합성 및 어셈블리를 위해 선택된 N-말단 도메인 및 C-말단 도메인 서열은 천연 아미노산 서열 정보 및 본 명세서에 기재된 다른 변형을 포함한다. 상기 반복 도메인은 중요한 아미노산 정보를 포착하는 동시에 아미노산을 인코드하는 DNA의 크기를 쉽게 합성가능한 단편들로 감소시키는 대표적인 블록, 일반적으로 실크의 유형에 따라 1 내지 8 개의 대표적인 블록을 함유하는 반복 서열로 분해된다. 일부 구체예들에서, 적절하게 형성된 블록 공중합체 폴리펩티드는 최소한 1개의 반복 서열을 포함하는 하나 이상의 반복 도메인을 포함하고, 선택적으로 N-말단 도메인 및/또는 C-말단 도메인에 연접된다.
일부 구체예들에서, 반복 도메인은 적어도 하나의 반복 서열을 포함한다. 일부 구체예들에서, 상기 반복 서열은 150-300개 아미노산 잔기이다. 일부 구체예들에서, 상기 반복 서열은 다수의 블록을 포함한다. 일부 구체예들에서, 상기 반복 서열은 다수의 매크로-반복을 포함한다. 일부 구체예들에서, 하나의 블록 또는 마크로-반복은 다수의 반복 서열들에 걸쳐 분할된다.
일부 구체예들에서, DNA 어셈블리 요건을 충족시키기 위해, 상기 반복 서열은 글리신으로 시작하고 페닐알라닌 (F), 티로신 (Y), 트립토판 (W), 시스테인 (C), 히스티딘 (H), 아스파라긴 (N), 메티오닌 (M) 또는 아스파르트산 (D)으로 끝날 수 없다. 일부 구체예들에서, 상기 반복 서열들 중 일부는 천연 서열과 비교하여 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 (F, Y, W, C, H, N, M 또는 D에서 종료되는 것을 피하기 위해) 폴리펩티드의 C 말단에 세린을 추가함으로써 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 다른 블록의 상동성 서열로 불완전 블록을 채움으로써 변형될 수 있다. 일부 구체예들에서, 상기 반복 서열은 블록들 또는 매크로반복부들의 순서를 재배열함으로써 변형될 수 있다.
일부 구체예들에서, 비-반복성 N-말단 도메인과 C-말단 도메인이 합성을 위해 선택될 수 있다. 일부 구체예들에서, N-말단 도메인은 SignalP (Peterson, T.N., et. Al., SignalP 4.0: discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg. 785-786 (2011).에 의해 확인된 바와 같이 선두(leading) 신호 서열의 제거에 의한 것일 수 있다.
일부 구체예들에서, N-말단 도메인, 반복 서열, 또는 C-말단 도메인 서열은 아겔레놉시스 아페르타 (Agelenopsis aperta), 알리아티푸스 굴로수스 (Aliatypus gulosus), 아포노펠마 세에만니 (Aphonopelma seemanni), 아프토스티추스 종. (Aptostichus sp.) AS217, 아프토스티추스 종. AS220, 아라네우스 디아데마투스 (Araneus diadematus), 아라네우스 겜모이데스 (Araneus gemmoides), 아라네우스 벤트리코수스 (Araneus ventricosus), 아르지오페 아모에나 (Argiope amoena), 아르지오페 아르젠타타 (Argiope argentata), 아르지오페 브루엔니치 (Argiope bruennichi), 아르지오페 트리파스시아타 (Argiope trifasciata), 아티포이데스 리베르시 (Atypoides riversi), 아비쿨라리아 주루엔시스 (Avicularia juruensis), 보트리오시르툼 칼리포르니쿰 (Bothriocyrtum californicum), 데이노피스 스피노사 (Deinopis Spinosa), 디구에티아 카니티에스 (Diguetia canities), 돌로메데스 테네브로수스 (Dolomedes tenebrosus), 유아그루스 치소세우스 (Euagrus chisoseus), 유프로스테놉스 아우스트랄리스 (Euprosthenops australis), 가스테라칸타 맘모사 (Gasteracantha mammosa), 히포칠루스 토렐리 (Hypochilus thorelli), 쿠쿨카니아 히베르날리스 (Kukulcania hibernalis), 라트로덱투스 헤스페루스 (Latrodectus hesperus), 메가헥수라 풀바 (Megahexura fulva), 메테페이라 그란디오사 (Metepeira grandiosa), 네필라 안티포디아나 (Nephila antipodiana), 네필라 클라바타 (Nephila clavata), 네필라 클라비페스 (Nephila clavipes), 네필라 마다가스카리엔시스 (Nephila madagascariensis), 네필라 필리페스 (Nephila pilipes), 네필렌기스 크루엔타타 (Nephilengys cruentata), 파라윅시아 비스트리아타 (Parawixia bistriata), 페우세티아 비리단스 (Peucetia viridans), 플렉트레우리스 트리스티스 (Plectreurys tristis), 포에실로테리아 레갈리스 (Poecilotheria regalis), 테트라그나타 카우아이엔시스 (Tetragnatha kauaiensis), 또는 울로보루스 디베르수스 (Uloborus diversus)에서 유래될 수 있다.
일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 알파 메이팅(mating) 인자 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 또다른 내인성 또는 이종성 분비 신호 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 3X FLAG 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 다른 친화력(affinity) 태그, 가령, 6-8개의 His 잔기들에 작동가능하도록 연결된다.
분비 신호
세포로부터 분비되는 단백질의 양은 단백질마다 상당히 가변적이며, 초기 상태에서 단백질에 작동 가능하게 연결된 분비 신호에 부분적으로 의존한다. 다수의 분비 신호가 당업계에 공지되어 있으며, 일부는 분비된 재조합 단백질의 생산에 통상적으로 사용된다. 이들 중 눈에 띄는 것은 사카로미세스 세레비시에(saccharomyces cerevisiae)의 α-메이팅 인자(αMF)의 분비 신호이며, 이는 N-말단 19개-아미노산 신호 펩티드 (본원에서 pre-αMF(sc)라고도 함), 그리고 그 뒤에 오는 70개-아미노산 리더 펩티드(본원에서 pro-αMF(sc)라고도 함)로 구성된다. 사카로미세스 세레비시에(saccharomyces cerevisiae) (pre-αMF(sc)/pro-αMF(sc)로 또한 지칭되는) αMF의 분비 신호에 pro-αMF(sc)의 함입은 단백질의 높은 분비 수율을 달성하는 데 중요한 것으로 입증되었다. pre-αMF(sc) 이외의 신호 펩티드에 pro-αMF(sc) 또는 이의 기능적 변이체를 추가하는 것 또한 재조합 단백질의 분비를 달성하는 수단으로 탐구되었지만, 특정 재조합 숙주 세포에서 특정 재조합 단백질에 대한 분비는 증가하지만 기타 재조합 단백질에 대해서는 효과가 없거나 또는 감소하는 등 다양한 정도의 효과를 나타냈다.
다수의 별개의 분비 신호의 사용은 미국 출원 15/724,196에 기재된 바와 같이, 재조합 단백질의 분비 수율을 개선시킬 수 있다. 단 하나의 분비 신호 (가령, pre-αMF(sc)/pro-αMF(sc))에 작동가능하게 연계된 재조합 단백질을 인코딩하는 다중 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포와 비교하였을 때, 적어도 2개의 별개의 분비 신호에 작동가능하게 연계된 재조합 단백질을 인코딩하는 동일한 수의 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포는 재조합 단백질의 더 높은 분비 수율을 만든다. 이론에 결부되는 것은 아니지만, 적어도 2개의 별개의 분비 신호의 사용으로 재조합 숙주 세포가 별개의 세포 분비 경로에 관여하여 재조합 단백질의 효율적인 분비에 영향을 미치고, 따라서 임의의 하나의 분비 경로의 과다-포화가 방지될 수 있다.
별개의 분비 신호 중 적어도 하나는 표 2 또는 표 3에서 선택될 수 있는 신호 펩티드를 포함하거나, 또는 표 2 또는 표 3에서 선택되는 신호 펩티드에 대해 적어도 80% 아미노산 서열 동일성을 갖는 기능적 변이체이다. 일부 구체예들에서, 상기 기능적 변이체는 1개 또는 2개의 치환된 아미노산을 포함하는 표 2 또는 표 3에서 선택된 신호 펩티드이다. 일부 이러한 구체예들에서, 상기 기능적 변이체는 표 2 또는 표 3에서 선택된 신호 펩티드에 대해 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 아미노산 서열 동일성을 갖는다. 일부 구체예들에서, 상기 신호 펩티드는 발생초기(nascent) 재조합 단백질의 해독-후 ER로의 전위를 매개한다 (즉, 단백질 합성은 발생초기 재조합 단백질이 ER로 전위되기 전, 해당 세포 세포질에 존재하도록 전위보다 선행된다). 다른 구체예들에서, 상기 신호 펩티드는 발생초기 재조합 단백질의 ER로의 전좌를 해독적으로-동시 매개한다 (즉, 단백질 합성과 ER로의 전좌가 동시에 일어난다). ER로의 동시-해독 전위를 매개하는 신호 펩티드를 사용하는 이점은 신속하게 폴딩되는 경향이 있는 재조합 단백질이 ER로의 전위와, 그리고 그에 따른 분비를 방해하는 입체형태를 취하는 것을 방지한다는 것이다.
표 2 - 분비 신호
Figure pct00005
표 3 - 재조합 분비 신호
Figure pct00006
발현 벡터
본원에 기재된 발현 벡터는 당업계에 공지된 기술의 관점에서 본 명세서의 교시에 따라 생성될 수 있다. 서열, 예를 들어, 벡터 서열 또는 이식유전자를 코딩하는 서열은 Integrated DNA Technologies, Coralville, IA 또는 DNA 2.0, Menlo Park, CA와 같은 회사로부터 상업적으로 얻을 수 있다. 키메라 실크 폴리펩티드의 높은-수준 발현을 지시하는 발현 벡터가 본원에서 예시된다.
본원에 기재된 폴리뉴클레오티드에 대한 또다른 표준 공급원은 유기체 (예를 들어, 박테리아), 세포, 또는 선택된 조직으로부터 단리된 폴리뉴클레오티드이다. 선택된 공급원으로부터의 핵산은 일반적으로 연속적인 페놀 및 페놀/클로로포름 추출 후, 에탄올 침전이 내포된 표준 절차에 의해 단리될 수 있다. 침전 후, 상기 폴리뉴클레오티드는 핵산 분자를 단편으로 절단하는 제한 엔도뉴클레아제로 처리될 수 있다. 클로닝을 위한 적절한 크기의 출발 물질을 제공하기 위해, 상기 선택된 크기의 단편들은 아가로스 또는 폴리아크릴아미드 겔 전기영동 또는 펄스장 겔 전기영동을 비롯한 다수의 기술에 의해 분리될 수 있다(Care et al.(1984) Nuc. Acid Res. 12:5647-5664; Chu et al.(1986).) Science 234:1582, Smith et al.(1987) Methods in Enzymology 151:461).
발현 벡터 또는 구조체의 뉴클레오티드 성분을 얻는 또다른 방법은 PCR이다. PCR에 대한 일반적인 절차는 MacPherson et al., PCR: A PRACTICAL APPROACH, (IRL Press at Oxford University Press, (1991))에 교시되어 있다. 각 적용 반응에 대한 PCR 조건은 경험적으로 결정할 수 있다. 다수 개변수가 반응의 성공에 영향을 미친다. 이러한 매개변수 중에는 어닐링 온도 및 시간, 연장 시간, Mg2+ 및 ATP 농도, pH, 프라이머, 주형 및 디옥시리보뉴클레오티드의 상대적 농도가 있다. 예시적인 프라이머는 하기 실시예에서 설명된다. 증폭 후, 생성된 단편은 아가로스 겔 전기영동에 의해 검출된 후 염화 에티듐 착색 및 자외선 조명으로 시각화할 수 있다.
폴리뉴클레오타이드를 얻는 또다른 방법은 효소 절단에 의한 것이다. 예를 들면, 뉴클레오티드 서열은 적절한 인지 제한 효소로 적절한 벡터를 분해하여 생성시킬 수 있다. 제한효소 절단된 단편들은 표준 기술을 사용하여, 4개의 데옥시뉴클레오티드 트리포스페이트(dNTP)의 존재 하에 대장균(E. coli) DNA 중합효소 I (Klenow)의 큰 단편으로 처리함으로써 블런트(blunt) 말단화될 수 있다.
폴리뉴클레오티드는 당업계에 잘 알려진 방법을 사용하여 적절한 골격(backbones), 예를 들어, 플라스미드에 삽입된다. 예를 들면, 삽입체 및 벡터 DNA는 적절한 조건에서 제한 효소와 접촉되어 각 분자에 상보적이거나 또는 블런트 말단을 생성할 수 있고, 이들은 서로 쌍을 이루고, 리가아제와 결합될 수 있다. 대안으로, 합성 핵산 링커는 폴리뉴클레오티드의 말단에 결찰될 수 있다. 이러한 합성 링커들은 벡터 DNA의 특정 제한 부위에 상응하는 핵산 서열을 함유할 수 있다. 기타 수단들이 공지되어 있고, 당업계에 이용가능하다. 구성성분 폴리뉴클레오티드를 위해 다양한 공급원이 사용될 수 있다.
일부 구체예들에서, R, N 또는 C 서열을 함유하는 발현 벡터는 발현 및 분비를 위해 숙주 유기체로 형질전환된다. 일부 구체예들에서, 상기 발현 벡터는 분비 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 종료 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 숙주 세포 게놈에 통합되도록 설계되었으며, 다음을 포함한다: 표적 게놈에 대한 상동성 영역, 프로모터, 분비 신호, 태그 (가령, 플래그 태그), 종결/폴리A 신호, 피치아(Pichia)에 대한 선택가능한 마커, 대장균(E. coli)에 대한 선택가능한 마커, 대장균(E. coli)에 대한 복제 기점, 그리고 관심대상의 단편을 방출하는 제한절단 부위.
숙주 세포 형질전환체
거미 실크 폴리펩티드 및 이의 후손을 발현시키는 핵산 분자 또는 벡터로 형질전환된 숙주 세포가 제공된다. 이들 세포는 자유 복제 벡터일 필요는 없지만, 벡터 상에서 핵산 서열을 또한 담아 있을 수 있다. 다른 구체예들에서, 상기 핵산은 숙주 세포의 게놈에 통합되었다.
일부 구체예들에서, 블록 공중합체 폴리펩티드의 대규모 생산을 가능하게 하는 미생물 또는 숙주 세포는 다음의 조합이 내포된다: 1) 큰 (>75kDa) 폴리펩티드를 생산하는 능력, 2) 세포 외부로 폴리펩티드를 분비하고, 값비싼 다운스트림 세포내 정제를 우회하는 능력, 3) 대규모 오염 물질 (가령, 바이러스 및 박테리아 오염)에 대한 내성, 그리고 4) 유기체를 성장시키고 처리하기 위한 기존 노하우는 대규모(1-2000m3) 생물 반응기이다.
다양한 숙주 유기체는 블록 공중합체 폴리펩티드 발현 시스템을 포함하도록 조작/형질전환될 수 있다. 재조합 실크 폴리펩티드의 발현을 위한 바람직한 유기체는 효모, 진균, 그람 양성 및 그람 음성 박테리아가 내포된다. 특정 구체예들에서, 상기 숙주 유기체는 아르술라 아데니니보란스(Arxula adeninivorans), 아스퍼길러스 아쿨레투스(Aspergillus aculeatus), 아스퍼길러스 아와모리(Aspergillus awamori), 아스퍼길러스 피쿰(Aspergillus ficuum), 아스퍼길러스 푸미가투스(Aspergillus fumigatus), 아스퍼길러스 야포니쿠스(Aspergillus japonicus), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 나이져(Aspergillus niger), 아스퍼길러스 오리제(Aspergillus oryzae), 아스퍼길러스 소야(Aspergillus sojae), 아스퍼길러스 투비겐시스(Aspergillus tubigensis), 바실러스 알카로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 안트라시스(Bacillus anthracis), 바실러스 브레비스(Bacillus brevis), 바실러스 씨르쿨란스(Bacillus circulans), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리퀘니포르미스(Bacillus licheniformis), 바실러스 메탄올리쿠스(Bacillus methanolicus), 바실러스 스테아로테르모필리스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 튜린기엔시스(Bacillus thuringiensis), 칸디다 보이디니(Candida boidinii), 크리소스포리움 럭노웬스(Chrysosporium lucknowense), 대장균(Escherichia coli), 푸사리움 그라미네룸(Fusarium graminearum), 푸사리움 베네나툼(Fusarium venenatum), 클루웨로미세스 락티스(Kluyveromyces lactis), 클루유베로미세스 마르시아누스(Kluyveromyces marxianus), 미셀리오프토라 터모필리아(Myceliopthora thermophila), 누로스포라 크라사(Neurospora crassa), 오가타에아 폴리모르파(Ogataea polymorpha), 페니실리움 카멤베르티(Penicillium camemberti), 페니실리움 카네센스(Penicillium canescens), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 에메르소니(Penicillium emersonii), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 그리세로세움(Penicillium griseoroseum), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 로퀘포르티(Penicillium roqueforti), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 피치아 앙구스타(Pichia angusta), 피치아 메탄올리카(Pichia methanolica), 피치아(코마가타에라) 파스포리스(Pichia (Komagataella) pastoris), 피치아 폴리모르파(Pichia polymorpha), 피치아 스티피티스(Pichia stipitis), 리조무코르 미에하이(Rhizomucor miehei), 리조무코르 푸실리우스(Rhizomucor pusillus), 리조푸스 아르히주스(Rhizopus arrhizus), 스트렙토미세스 리비단스(Streptomyces lividans), 사카로미세스 세레비시에(saccharomyces cerevisiae), 쉬반니오미세스 악시덴탈리스(Schwanniomyces occidentalis), 트리코데르마 하르지아눔(Trichoderma harzianum), 트리코데르마 리세이(Trichoderma reesei), 또는 야로비아 피로리티카(Yarrowia lipolytica)이다.
바람직한 측면들에서, 상기 방법들은 바이오매스를 추출할 필요 없이, 용이하게 회수하기 위해 직접적인 산물 분비를 하는 배양 숙주 세포를 제공한다. 일부 구체예들에서, 상기 블록 공중합체 폴리펩티드는 수집 및 처리를 위해 배지로 바로 분비된다.
공작된 숙주 세포 계통
메탄올자화(methylotrophic) 효모 피치아 파스토리스 (Pichia pastoris)는 재조합 단백질의 생산에 널리 사용된다. P. 파스토리스는 높은 세포 밀도로 성장하고, 엄격하게 제어된 메탄올-유도성 트랜스 유전자 발현을 제공하고, 한정된 배지로 효과적으로 이종성 단백질을 분비할 수 있다. 그러나, P. 파스토리스 (P. pastoris) 균주의 배양 동안, 재조합적으로 발현된 단백질은 이들이 분비되기 전에 세포내에서 수집될 수 있어, 재조합 발현 단백질의 단편 및 감소된 수율의 전장 재조합 단백질을 포함하는 단백질의 혼합물을 생성할 수 있다. 재조합 단백질 생산을 위해 널리 사용되는 또다른 세포주는 대장균(Escherichia coli) 박테리아다. 그러나, 대장균(Escherichia coli) 균주의 배양 동안, 재조합적으로 발현된 단백질은 불용성일 수 있으며, 그 결과 재조합 단백질의 분리가 잘 되지않고, 수율이 감소될 수 있다.
일부 구체예들에서, 본원에 기재된 프로테아제 활성이 감소된 변형 균주는 실크-유사 폴리펩티드 서열을 재조합적으로 발현시킨다. 일부 구체예들에서, 실크-유사 폴리펩티드 서열은 1) 실크 폴리펩티드 서열에서 유래한 반복 도메인들을 혼합 및 매칭시킴으로써 생성된 블록 코폴리머 폴리펩티드 조성물 및/또는 2) 산업적으로 확장가능한 미생물로부터의 분비에 의해 유용한 고체 또는 섬유를 형성하기에 충분히 큰 크기 (약 40kDa)를 가지는 블록 공중 합체 폴리펩티드의 재조합 발현이다. 거미 실크 폴리펩티드의 거의 모든 공개된 아미노산 서열의 서열을 내포하는 실크 반복 도메인 단편들로부터 공작된 큰 (대략적으로 40 kDa 내지 대략적으로 100 kDa) 블록 공중합체 폴리펩티드는 본원에서 기재된 변형된 미생물에서 발현될 수 있다. 일부 구체예에서, 실크 폴리펩티드 서열은 고체 또는 섬유 형성이 가능한 고도로 발현되고 분비된 폴리펩티드를 생성하도록 매칭되고 설계된다. 일부 구체예들에서, 숙주 변형된 균주에서 프로테아제 유전자의 녹아웃 또는 프로테아제 활성의 감소는 실크 유사 폴리펩티드의 분해를 감소시킨다.
일부 구체예들에서, 피치아 파스토리스(Pichia pastoris)에서 프로테아제 활성을 약화시키기 위하여, 이들 효소를 인코드하는 유전자를 불활성화 또는 돌연변이시켜 활성을 감소시키거나 제거한다. 이것은 유전자 조절 요소의 변형을 통한 유전자 자체의 돌연변이 또는 삽입을 통해 이루어질 수 있다. 이것은 표준 효모 유전학 기술을 통해 구현될 수 있다. 이러한 기술의 예는 이중 상동 재조합을 통한 유전자 대체를 포함하며, 여기서 불 활성화될 유전자에 연접하는 상동 영역들은 선별 마커 유전자 (가령, 항생제 내성 유전자 또는 효모 균주의 영양요구성을 보충하는 유전자)에 연접하는 벡터에서 클로닝된다.
대안적으로, 상동성 영역은 PCR-증폭되고 중첩 PCR을 통해 선별 마커 유전자에 연결될 수 있다. 이어서, 이러한 DNA 단편들은 해당 분야에 공지된 방법들, 예컨대, 전기천공법을 통해 피치아 파스토리스(Pichia pastoris)에 형질전환된다. 이어서 선택적 조건하에서 성장하는 형질전환체들을 표준 기술, 예컨대, 게놈 DNA에 대한 PCR 또는 서던 블롯에 의해 유전자 파괴 발생에 대해 분석하였다. 대안적인 실험에서, 유전자 불활성화는 단일 상동 재조합을 통해 구현될 수 있으며, 이 때, 예를 들어, 유전자 ORF의 5' 단부는 선별 마커 유전자를 또한 함유하는 프로모터없는 벡터 상에 클로닝된다. 표적 유전자 상동성 단편에서 벡터만을 절단하는 제한 효소에 의한 분해를 통해 이러한 벡터를 선형화할 때, 이러한 벡터는 피치아 파스토리스(Pichia pastoris) 내에 형질전환된다. 표적 유전자 부위에서의 통합은 게놈 DNA에서의 PCR 또는 서던 블롯을 통해 확인된다. 이러한 방식으로, 벡터 상에 클로닝된 유전자 단편의 복제가 게놈에서 구현되고, 다음과 같은 표적 유전자 좌위의 2개의 복제물이 생성된다: ORF가 불완전하여, 단축된 비활성 단백질을 발현시키는 제 1 복제물, 및 전사를 유도하는 프로모터가 없는 제 2 복제물.
대안으로, 트랜스포존 돌연변이유발을 사용하여 표적 유전자를 불활성화시킨다. 이러한 돌연변이체의 라이브러리는 PCR을 통해 표적 유전자에서의 삽입 발생에 대해 스크리닝될 수 있다.
조작된/녹아웃 균주의 기능적 표현형 (즉, 결핍)은 해당 분야에 공지된 기술을 사용하여 평가될 수 있다. 예를 들어, 프로테아제 활성에서 조작된 균주의 결핍은 해당 분야에 공지된 임의의 다양한 방법, 그 중에서도, 예컨대, 발색 프로테아제 기질의 가수분해 활성 분석, 선택된 프로테아제에 대한 기질 단백질의 밴드 이동 등을 사용하여 확인할 수 있다.
본 명세서에 기재된 프로테아제 활성의 약화는 녹아웃 돌연변이 이외의 메커니즘을 통해 구현될 수 있다. 예를 들면, 원하는 프로테아제는 핵산 서열을 변경하거나, 유전자를 활성이 덜한 프로모터의 제어하에 위치시키거나, 하향 조절하거나, 관심 유전자를 표적으로 하는 간섭 RNA, 리보자임 또는 안티센스 서열을 발현시킴으로써, 또는 해당 분야에 공지된 임의의 다른 기술을 통한 아미노산 서열 변화에 의해 약화될 수 있다. 바람직한 균주에서, PAS_chr4_0584 (YPS1-1) 및 PAS_chr3_1157 (YPS1-2)에서 인코드되는 프로테아제들의 프로테아제 활성은 상기 기재된 임의의 방법에 의해 약화된다. 일부 양상들에서, 메탄올자화 효모 균주, 특히 피치아 파스토리스(Pichia pastoris) 균주 [이때 YPS1-1YPS1-2 유전자는 불활성화되었음]에 대해 기재된다. 일부 구체예들에서, 균주에 의해 발현되는 원하는 단백질 생성물의 프로테아제 활성을 추가로 감소시키기 위해 본 명세서에 제공된 방법에 따라 추가 프로테아제 암호화 유전자가 녹아웃될 수 있다.
일부 구체예들에서, 본 발명에 개시된 P. 파스토리스(P. pastoris) 균주는 실크-유사 폴리펩티드를 발현하기 위해 변형되어 있다. 바람직한 구체예들의 실크-유사 폴리펩티드 제작 방법은 WO 2015/042164, 특히 114-134 단락에 제공되며, 이 문헌은 본 명세서에 참고문헌으로 포함된다. 이 문헌에는 아르지오페 브루엔니치 (Argiope bruennichi) 종과 같은 MaSp2로부터 유래한 재조합 거미 실크 단백질 단편 서열들에 기초한 합성 단백질성 코폴리머가 개시되어 있다. 각각의 반복 유닛의 분자량이 약 20 kDa 이상의, 2 내지 20개 반복 유닛을 포함하는 실크-유사 폴리펩티드가 기재되어 있다. 코폴리머의 각 반복 유닛 내에는 약 60개 이상의 아미노산 잔기가 있고, 이들은 다수의 "유사-반복 유닛"으로 구성되게 된다. 일부 구체예들에서, 본원에 기재된 폴리펩티드의 반복 단위는 MaSp2 드래그라인(dragline) 실크 단백질 서열에 대해 95% 이상의 서열 동일성을 가진다.
실시예
하기는 본 발명을 수행하기 위한 특정 구체예들의 예시이다. 실시예는 오직 설명을 위하여 제공되며, 어떤 방식으로든 본 발명의 범위를 제한하고자 하는 것이 아니다. 사용된 숫자 (예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만, 물론 일부 실험 오차 및 편차가 허용되어야 한다.
달리 지시되지 않는 한, 본 발명의 실시는 숙련된 기술자에게 통상적인 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학적 방법을 이용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다. 가령, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3 rd Ed. (Plenum Press) Vols A and B(1992) 참고.
실시예 1: 칼슘 염 추출
결정질이 큰 실크는 용액에서 응집체를 형성하여 용해도를 감소시키고, 생산 동안 숙주 세포로부터의 회수를 감소시킨다. 따라서, 이러한 결정질 실크를 용해화를 개선시킨 방법이 필요하다. 이들 실시예에 기술된 방법은 칼슘염 및 알코올을 사용하여 실크 단백질의 용해도를 증가시키는 것이다.
재료와 방법
다중 칼슘 염을 사용하여, 최적의 칼슘 염을 확인하기 위해 P0 (서열 식별 번호: 23에 나타낸 대표적인 블록 아미노산 서열)라고도 하는 UDMisp64k 단백질을 추출했다. P0는 예시적인 결정질이 매우 큰 실크 단백질이다. 6x His 태그에 융합된 P0 실크 유전자를 함유하는 발현 벡터로 형질전환된 대장균 (E. coli)(글리신 링커(GGGGG-HHHHHH)를 사용하여 P0의 c-말단에 추가된 6개의 히스티딘)을 클로람페니콜과 함께, 특정된 최소 염 배지인 Terrific Broth에서 성장시켰다. 발효 24시간 후, IPTG로 P0 발현을 유도하였다. 이들 대장균(E. coli)은 단백질 유도-후 16 시간 시점에 수확되었다. 이들 대장균(E. coli)은 14,0000 PSI에서 단일 패스로 미세유동화기(Microfluidics LM10)를 통해 LB 브로쓰 및 세포를 통과시켜 용해시켰다. 용해물을 Eppendorf 탁상용 원심분리기에서 15,000 x g에서 원심분리기를 통해 펠릿화했다. 불용성 P0를 함유하는 펠릿은 그대로 두었고, 상청액은 버렸다.
메탄올 안에 각각 염화칼슘(CaCl2), 질산칼슘(Ca(NO3)2 또는 CaNit) 및 티오시안산칼슘(C2CaN2S2 또는 Ca(SCN)2 또는 CaSCN)의 20%(w/v) 용액을 준비했다. 100 mg의 세포 용해물 펠렛을 1 mL의 각 칼슘 염/메탄올 (CaMeOH) 용액에 추가하였다. 상기 세포 용해물 펠렛을 실온에서 1 시간 동안 각 CaMeOH 용액에 재현탁시키고, 항온처리하였다. 용해화안된 물질은 원심분리 (15,000 x g)를 통하여 재-펠렛화하였다. 상청액을 유지하고, Bis/Tris 완충액에서 SDS-PAGE를 통해 분석하고 면역블롯팅했다. 항-His 항체를 사용하여 P0 단백질을 가시화하였다.
결과
P0 단량체는 웨스턴용 Bis/Tris Gel에서 분자량보다 약간 더 높게 나타났다. 이 실시예에서 사용된 P0는 64kDa이지만, 일반적으로 SDS-PAGE 젤의 70~100kDa 마커 사이에 나타난다. 이 경우에서, 이 단백질은 100kDa로 이동되었다. 전체 세포 배양액(WCB)은 5M 구아니딘 티오시아네이트로 추출한 반면, 정화된 세포 배양액(CCB)은 용매 없이 추출하여 대조군으로 사용했다. P0 단백질 단량체는 100 kDa에서 단백질 밴드로 표시된 것처럼 티오시안산칼슘(CaSCN) 및 염화칼슘(CaCl2)을 함유한 용액과 함께 항온처리한 후, 상층액 분획에서 관찰되었다 (도 3, 화살표로 표시됨). 그러나, 상기 질산 칼슘 (CaNit) 라인에서 밴드는 관찰되지 않았다. 특정 이론에 얽매이지 않고, Ca-SCN은 아래 또는 위의 다른 밴드가 보이지 않기 때문에, 전장의 P0에 대해 더 높은 특이성을 가질 수 있다고 제안된다. 유사한 강도의 밴드가 CaCl2 레인에서도 관찰되었으며, 더 작은 항-His 태그 종과 함께 P0 단편일 가능성이 있다 (괄호로 나타낸 바와 같이, 약 55 kDa, 50 kDa, 및 37 kDa에서 밴드).
실시예 2: 알코올 추출
최적의 추출 조건을 결정하기 위해, 알코올 선택에 대해 조사했다. 먼저, 불용성 P0를 물 또는 메탄올에서 CaCl2와 함께 항온처리하여, 알코올 용매를 포함해야 하는 요건을 결정했다. 다음으로, 일차 용매로 에탄올과 이소프로판올로 대체하였다. 마지막으로, 물을 용매로 메탄올과 함께 도입하여, 공정의 휘발성을 줄였다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 표 4와 같이 다양한 용매에 다양한 농도의 CaCl2 용액을 만들었다.
Figure pct00007
불용성 세포 물질 100 mg을 각 용액 1 ml에 첨가하였고, 피펫팅을 통해 재현탁시켰다. 용액 조건 1-6의 샘플을 실온(약 22℃)에서 1시간 동안 항온처리하였다. 용액 조건 1-6의 병렬 샘플을 만들었고, 히팅 블록(Benchmark Scientific BSH1002)에서 55℃에서 1시간 동안 항온처리했다. 용액 조건 7-10으로 처리된 샘플을 히팅 블록에서 55℃에서 1시간 동안 항온처리했다. 항온처리 후, 샘플을 원심분리를 통하여 펠렛화하였다. 용해화된 P0 단백질을 포함하는 상층액을 수집하였고, His 태그에 대한 효소 결합 면역흡착 분석(ELISA)을 통해 분석했다.
결과
용액 조건 1-6으로 처리된 샘플에 대한 ELISA 결과는 22℃ 및 55℃에서 회수된 P0의 백분율로 표 5에 나와 있다. P0 수율 정량은 다음 방정식을 사용하여 ELISA에 의해 결정되었다: (추출물에서 P0) / (WCB에서 P0) = (P0 추출 수율). * 기호는 P0 수율이 ELISA에 의해 감지되지 않았음을 나타낸다
Figure pct00008
P0는 22℃에서 수성에서 4M, 그리고 메탄올에서 2M 하에 모든 농도의 CaCl2에서 ELISA로 검출할 수 없었다. 물 속의 4M CaCl2는 1% P0를 생성했으며, 열을 가하면 3X에서 3%로 증가했다. 메탄올에서 2M CaCl2은 또한 온도가 더 높을 때, 3x의 유사한 수율 증가를 나타냈다.
용액 조건 7-10 및 열-처리된 조건 6에서 처리한 시료의 ELISA 결과를 표 6에 나타내었다.
Figure pct00009
에탄올에서 2M 염화칼슘은 메탄올 뿐만 아니라 P0도 추출하지 못했다. 수율은 동일한 추출 조건에서 10x 더 낮았다 (MeOH의 51%와 비교하여 EtOH의 5%).
특정 이론에 얽매이려는 의도 없이, 물은 P0 추출에 부정적인 영향을 미쳤다고 제안된다. 용액이 25%의 물과 75%의 메탄올만을 함유할 때, P0 수율은 4%만큼 낮았고, 수분 함량이 50% 또는 75%로 증가함에 따라 측정 가능한 수율이 없었다.
실시예 3: 항온처리 시간 및 온도
추출 시간을 최소화하면서, 한편 최대 추출을 위한 최적의 온도를 결정하기 위해, 추출 온도를 변경했다. 샘플의 교반도 또한 도입되었다. 연속 혼합과 함께, 이 온도를 낮추는 것은 보다 확장 가능한 공정 시나리오로 조사되었다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 메탄올에서 2M CaCl2 용액 1ml를 100mg의 불용성 세포 물질에 첨가하였고, 이를 피펫팅을 통해 재현탁시켰다. 12개의 분취물이 만들어졌다. 35℃에서 0, 15, 30, 60, 120, 및 240 분 동안 교반과 함께 6개의 분획이 항온처리되었다. 나머지 6개 분획은 55℃에서 0, 5, 15, 30, 60 및 120분 동안 교반하면서 항온처리했다. 각 시점에서 샘플을 제거하고 벤치탑 원심분리기 (Eppendorf 5415D)에서 15,000 xg로 원심분리했다. 용해화된 P0 단백질을 포함하는 상층액을 수집하였고, His 태그에 대한 ELISA를 통해 분석했다.
결과
추출 결과는 도 4에 나타낸다. 추출된 P0 단백질의 양은 55℃와 비교하여 35℃에서 배양된 샘플의 각 시점에서 실질적으로 유사하였다. 두 추출 온도 모두 30분에 피크 추출에 도달했다. 추출 중 연속 혼합을 추가하면 최대 수율이 약 50%에서 80%로 증가했다. 각 조건에 대한 수율 백분율은 표 7에 나와 있다.
Figure pct00010
따라서, 35℃에서의 항온처리는 55℃에서의 항온처리만큼 효과적이었다. 또한, 항온처리 동안 교반 또는 혼합은 P0 회수를 상당히 개선시켰다.
실시예 4: 추출 부피
생산 확장성을 더욱 향상시키기 위해 추출 중에 사용되는 솔루션의 양을 줄이는 방법을 모색했다. 불용성 펠렛에서 P0를 추출하기 위해, 2M 염화칼슘 용액의 부피를 절반으로 줄였다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 불용성 펠렛을 메탄올 중 0.5ml 또는 1ml의 2M CaCl2 용액에 재현탁시켰다. 샘플을 35℃에서 1 hr 동안 교반과 함께 항온처리하였다. 항온처리 후, 샘플을 원심분리를 통해 펠렛화하였고 상청액만 남겼다. 이 상청액 안의 P0는 ELISA 및 크기 배제 크로마토그래피 (SEC)를 통하여 분석하였다. SEC는 샘플에서 전장의 P0의 상대적인 양 결정하는 데 사용되었다.
결과
1ml 및 0.5ml 샘플에서 P0의 수율은 아래 표 8에 나와 있다.
Figure pct00011
두 샘플에서, 수율은 유사하였으며, 샘플 부피가 감소할 수 있고, 여전히 P0 단백질의 효율적인 추출을 초래할 수 있음을 나타낸다. 0.5ml 샘플은 1ml 샘플에서 14:1 비율과 비교하여, 7:1의 2M 칼슘 메탄올 용액 대 펠릿의 질량 비율과 대략 동일하다. 추출 용적 감소의 이점은 수율 감소의 가치가 있다.
또한, 두 샘플에서 전체 길이 P0의 양은 실질적으로 유사하여 (1ml 샘플의 약 20%에 비해 0.5ml 샘플의 약 22%), 회수된 P0의 순도는 손상되지 않았다.
실시예 5: P0 분말 회수
P0 단백질은 칼슘염과 메탄올 용액에서 회수되었다.
재료와 방법
P0의 낮은 용해도를 활용하기 위해, 물을 1:2의 질량비로 첨가하여 추출하여 침전을 촉진했다. 침전물이 형성되었고, Beckman J-6 원심분리기에서 15분 동안 4, 200 x g에서 원심분리되었다. 전장의 P0는 용액 안에 상청액으로 안정적으로 남아 있었다. SEC 및 ELISA 분석을 위해 물에-침전된 상층액의 샘플을 채취했다. 진공 하에 60℃로 설정된 회전 증발기(Buchi Rotavapor R-210)에서 잔류 상청액에서 메탄올을 증발시켰다. 일단 메탄올이 증발되면, 염화칼슘을 제거하기 위해 샘플을 20kDa 컷-오프(Slide-A-Lyzer Dialysis Cassete 20kDa)가 있는 투석 카세트의 물에 대해 투석시켰다. 투석 후, 침전물이 형성되었고, 15분 동안 4,200 x g에서 원심분리(Beckman J-6)를 통해 펠렛으로 회수하였다. 펠렛은 -80℃에서 동결되었고, 동결 건조되었다(Labconco Freezone 4.5). 용액에서, 그리고 동결건조 후의 전장의 P0의 양은 SEC를 통해 결정되었고, 전체 수율은 ELISA에 의해 결정되었다.
결과
수분 침전은 SEC를 통해 정량화하였을 때, 추출물에서 전장의 P0를 20%에서 50%로 강화시켰다 (도 5A). 동결건조된 P0는 SEC를 통해 정량화하였을 때, 51%가 전장 P0 단량체였다 (도 5B).
총 P0 수율은 ELISA를 통해 정량화하였을 때, 물 침전 및 동결건조 후 56%에서 50%로 단지 6%만 감소했다.
따라서, 물 침전은 불순물을 제거하였고, 한편으로 전체 P0 단백질 수율에 최소한으로 영향을 미쳤다.
실시예 6: MeOH 추출 스크린에서 고-처리량 CaCl 2
본원에 기술된 방법은 MeOH 분석에서 96-웰 블록 CaCl2에서 다른 실크 단백질에 대해 수행되었다.
재료와 방법
실크 단백질은 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 세포 펠렛을 초음파처리하였고, 메탄올 중 2M CaCl2 용액을 첨가했다. 샘플을 혼합하여, 세포 펠렛을 재현탁시켰다. 샘플을 35℃에서 1 hr 동안 교반과 함께 항온처리하였다. 샘플을 ELISA를 통해 분석하였고, 5M GdnSCN, pH 11 추출 대조군에 대해 상대적인 추출 효율(%)을 보고했다. 추정된 결정 부피 분율(CVF)은 먼저 결정 모티프에 잔류물을 할당하여 추정되었다. 결정 모티프는 알라닌, 글리신, 이소류신, 세린, 트레오닌 또는 발린으로만 구성된 6개 이상의 잔기의 임의의 인접 서열로 특정되며, 여기서 글리신은 또다른 글리신과 인접할 수 없다. 그런 다음, 결정질 모티프의 잔기 합을 총 잔기 수로 나누어, 추정된 결정 부피 분율을 계산했다.
결과
표 9에서는 P0 단백질을 비롯한, 다양한 실크 단백질의 MeOH 추출 효율에서 추정된 결정 부피 분율 퍼센트, 수분 함량 퍼센트, 그리고 CaCl2 퍼센트를 보여준다. 추출에 필요한 수분 함량은 실크 단백질에 의존적이었다. 물 함량에 대한 민감성 또한 실크 단백질에 의존적이었다. 최저 추출 효율은 72%이었다.
Figure pct00012
등가물(Equivalents)
본 발명이 특히 바람직한 구체예들과 다양한 대안적인 구체예들을 참조하여 도시되고 설명되었지만, 관련 기술 분야의 숙련자들은 본 발명의 정신 및 범위를 벗어나지 않고 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다.
본 명세서의 본문 내에 인용된 모든 참고 문헌, 등록된 특허 및 특허 출원은 모든 목적을 위해 전체적으로 참고로 포함된다.
서열 목록
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
SEQUENCE LISTING <110> BOLT THREADS, INC. <120> METHODS FOR IMPROVED EXTRACTION OF SPIDER SILK PROTEINS <130> BTT-034WO <140> PCT/US2020/047514 <141> 2020-08-21 <150> 62/890,473 <151> 2019-08-22 <160> 69 <170> PatentIn version 3.5 <210> 1 <211> 181 <212> PRT <213> Aliatypus gulosus <400> 1 Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser 1 5 10 15 Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala 20 25 30 Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe 35 40 45 Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser 50 55 60 Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg 65 70 75 80 Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala 85 90 95 Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala 100 105 110 Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu 115 120 125 Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala 130 135 140 Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser 145 150 155 160 Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly 165 170 175 Ala Gly Ser Ala Ser 180 <210> 2 <211> 126 <212> PRT <213> Plectreurys tristis <400> 2 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser 20 25 30 Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala 35 40 45 Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly 50 55 60 Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala 65 70 75 80 Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala 85 90 95 Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala 100 105 110 Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 115 120 125 <210> 3 <211> 239 <212> PRT <213> Plectreurys tristis <400> 3 Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala 1 5 10 15 Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys 20 25 30 Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln 35 40 45 Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln 50 55 60 Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe 65 70 75 80 Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser 85 90 95 Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro 100 105 110 Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala 115 120 125 Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala 130 135 140 Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser 145 150 155 160 Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser 165 170 175 Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro 180 185 190 Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala 195 200 205 Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln 210 215 220 Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser 225 230 235 <210> 4 <211> 182 <212> PRT <213> Araneus gemmoides <400> 4 Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly 1 5 10 15 Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser 20 25 30 Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser 35 40 45 Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala 50 55 60 Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser 65 70 75 80 Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser 85 90 95 Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser 100 105 110 Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr 115 120 125 Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser 130 135 140 Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser 145 150 155 160 Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala 165 170 175 Thr Ser Ile Ser Ala Val 180 <210> 5 <211> 180 <212> PRT <213> Argiope aurantia <400> 5 Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala 1 5 10 15 Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala 20 25 30 Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser 35 40 45 Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser 50 55 60 Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser 65 70 75 80 Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala 85 90 95 Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser 100 105 110 Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn 115 120 125 Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala 130 135 140 Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala 145 150 155 160 Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn 165 170 175 Ala Ala Asn Ala 180 <210> 6 <211> 199 <212> PRT <213> Deinopis spinosa <400> 6 Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly 1 5 10 15 Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser 20 25 30 Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala 35 40 45 Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln 50 55 60 Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala 65 70 75 80 Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly 85 90 95 Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val 100 105 110 Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser 115 120 125 Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu 130 135 140 Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala 145 150 155 160 Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr 165 170 175 Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln 180 185 190 Ala Val Thr Gly Val Gly Leu 195 <210> 7 <211> 171 <212> PRT <213> Nephila clavipes <400> 7 Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala 1 5 10 15 Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala 20 25 30 Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln 35 40 45 Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln 50 55 60 Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr 65 70 75 80 Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala 85 90 95 Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala 100 105 110 Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser 115 120 125 Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu 130 135 140 Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly 145 150 155 160 Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln 165 170 <210> 8 <211> 268 <212> PRT <213> Argiope trifasciata <400> 8 Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala 1 5 10 15 Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala 20 25 30 Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly 35 40 45 Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly 50 55 60 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly 65 70 75 80 Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 85 90 95 Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val 100 105 110 Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala 115 120 125 Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly 130 135 140 Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly 145 150 155 160 Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly 165 170 175 Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly 180 185 190 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly 195 200 205 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly 210 215 220 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly 225 230 235 240 Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly 245 250 255 Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val 260 265 <210> 9 <211> 420 <212> PRT <213> Nephila clavipes <400> 9 Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly 1 5 10 15 Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro 20 25 30 Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr 35 40 45 Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 50 55 60 Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro 65 70 75 80 Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly 85 90 95 Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 100 105 110 Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr 115 120 125 Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 130 135 140 Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro 145 150 155 160 Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly 165 170 175 Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly 180 185 190 Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala 195 200 205 Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly 210 215 220 Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly 225 230 235 240 Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr 245 250 255 Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro 260 265 270 Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly 275 280 285 Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro 290 295 300 Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly 305 310 315 320 Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr 325 330 335 Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro 340 345 350 Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly 355 360 365 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro 370 375 380 Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr 385 390 395 400 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly 405 410 415 Pro Tyr Gly Pro 420 <210> 10 <211> 376 <212> PRT <213> Latrodectus hesperus <400> 10 Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu 1 5 10 15 Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu 20 25 30 Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly 35 40 45 Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala 50 55 60 Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val 65 70 75 80 Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln 85 90 95 Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp 100 105 110 Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys 115 120 125 Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser 130 135 140 Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn 145 150 155 160 Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val 165 170 175 Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val 180 185 190 Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln 195 200 205 Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly 210 215 220 Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala 225 230 235 240 Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln 245 250 255 Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr 260 265 270 Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala 275 280 285 Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser 290 295 300 Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp 305 310 315 320 Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln 325 330 335 Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile 340 345 350 Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala 355 360 365 Pro Arg Leu Gly Ile Asp Leu Ser 370 375 <210> 11 <211> 200 <212> PRT <213> Argiope trifasciata <400> 11 Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly 1 5 10 15 Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe 20 25 30 Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala 35 40 45 Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser 50 55 60 Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser 65 70 75 80 Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val 85 90 95 Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu 100 105 110 Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala 115 120 125 Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly 130 135 140 Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln 145 150 155 160 Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser 165 170 175 Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser 180 185 190 Gln Ala Ser Ala Ser Ser Thr Ser 195 200 <210> 12 <211> 357 <212> PRT <213> Uloborus diversus <400> 12 Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala 1 5 10 15 Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln 20 25 30 Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr 35 40 45 Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe 50 55 60 Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val 65 70 75 80 Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser 85 90 95 Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr 100 105 110 Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile 115 120 125 Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu 130 135 140 Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu 145 150 155 160 Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile 165 170 175 Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala 180 185 190 Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln 195 200 205 Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser 210 215 220 Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile 225 230 235 240 Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly 245 250 255 Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser 260 265 270 Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe 275 280 285 Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr 290 295 300 Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser 305 310 315 320 Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile 325 330 335 Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu 340 345 350 Leu Ser Val Ser Ala 355 <210> 13 <211> 32 <212> PRT <213> Euprosthenops australis <400> 13 Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 20 25 30 <210> 14 <211> 42 <212> PRT <213> Tetragnatha kauaiensis <400> 14 Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly 20 25 30 Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 15 <211> 42 <212> PRT <213> Argiope aurantia <400> 15 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly 1 5 10 15 Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly 20 25 30 Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 16 <211> 46 <212> PRT <213> Deinopis spinosa <400> 16 Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly 1 5 10 15 Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln 20 25 30 Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala 35 40 45 <210> 17 <211> 42 <212> PRT <213> Nephila clavata <400> 17 Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly 1 5 10 15 Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly 20 25 30 Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 18 <211> 174 <212> PRT <213> Deinopis spinosa <400> 18 Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala 1 5 10 15 Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala 20 25 30 Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly 35 40 45 Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly 50 55 60 Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala 115 120 125 Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala 130 135 140 Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala 145 150 155 160 Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly 165 170 <210> 19 <211> 149 <212> PRT <213> Latrodectus hesperus <400> 19 Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala 1 5 10 15 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly 20 25 30 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala 35 40 45 Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala 85 90 95 Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 100 105 110 Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala 115 120 125 Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 130 135 140 Gln Gly Gln Gly Ala 145 <210> 20 <211> 161 <212> PRT <213> Nephila clavipes <400> 20 Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly 1 5 10 15 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 20 25 30 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 35 40 45 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 50 55 60 Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly 65 70 75 80 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 85 90 95 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 100 105 110 Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 115 120 125 Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 130 135 140 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala 145 150 155 160 Ala <210> 21 <211> 186 <212> PRT <213> Nephilengys cruentata <400> 21 Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala 1 5 10 15 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala 20 25 30 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr 35 40 45 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 50 55 60 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala 100 105 110 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala 130 135 140 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 165 170 175 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 180 185 <210> 22 <211> 132 <212> PRT <213> Uloborus diversus <400> 22 Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser 20 25 30 Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln 35 40 45 Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr 50 55 60 Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly 65 70 75 80 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala 85 90 95 Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 115 120 125 Gly Ala Ala Ala 130 <210> 23 <211> 198 <212> PRT <213> Uloborus diversus <400> 23 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala 195 <210> 24 <211> 190 <212> PRT <213> Araneus ventricosus <400> 24 Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 20 25 30 Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala 35 40 45 Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly 50 55 60 Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala 65 70 75 80 Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala 100 105 110 Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu 115 120 125 Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly 130 135 140 Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly 145 150 155 160 Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly 165 170 175 Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala 180 185 190 <210> 25 <211> 166 <212> PRT <213> Dolomedes tenebrosus <400> 25 Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr 1 5 10 15 Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly 20 25 30 Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly 35 40 45 Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 50 55 60 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 65 70 75 80 Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala 85 90 95 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 100 105 110 Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly 130 135 140 Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala 145 150 155 160 Ala Ser Ala Ala Ala Ala 165 <210> 26 <211> 177 <212> PRT <213> Nephilengys cruentata <400> 26 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 100 105 110 Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln 115 120 125 Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 130 135 140 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln 145 150 155 160 Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 165 170 175 Ala <210> 27 <211> 174 <212> PRT <213> Nephilengys cruentata <400> 27 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly 100 105 110 Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly 115 120 125 Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala 130 135 140 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly 145 150 155 160 Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 165 170 <210> 28 <211> 22 <212> PRT <213> Saccharomyces cerevisiae <400> 28 Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser 1 5 10 15 Ala Asn Gln Val Ala Ala 20 <210> 29 <211> 23 <212> PRT <213> Pichia pastoris <400> 29 Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu 1 5 10 15 Leu Thr Asn Ile Val Ser Gly 20 <210> 30 <211> 20 <212> PRT <213> Pichia pastoris <400> 30 Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala 1 5 10 15 Val Val Ser Ala 20 <210> 31 <211> 18 <212> PRT <213> Gallus gallus <400> 31 Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala 1 5 10 15 Leu Gly <210> 32 <400> 32 000 <210> 33 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Asp Lys Arg Glu Ala Glu Ala 85 <210> 34 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 <210> 35 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser 1 5 10 15 Ala Asn Gln Val Ala Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu 20 25 30 Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu 35 40 45 Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn 50 55 60 Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu 65 70 75 80 Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 36 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu 1 5 10 15 Leu Thr Asn Ile Val Ser Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 37 <211> 90 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala 1 5 10 15 Val Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala 20 25 30 Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp 35 40 45 Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu 50 55 60 Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly 65 70 75 80 Val Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 90 <210> 38 <211> 88 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 38 Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala 1 5 10 15 Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile 20 25 30 Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp 35 40 45 Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe 50 55 60 Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser 65 70 75 80 Leu Glu Lys Arg Glu Ala Glu Ala 85 <210> 39 <211> 1416 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 39 Gly Gly Tyr Gly Pro Gly Gln Arg Ala Gly Pro Gly Gln Gly Ala Gly 1 5 10 15 Pro Gly Gln Gly Val Gly Pro Gly Gln Gly Val Gly Thr Gly Gly Gln 20 25 30 Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly 35 40 45 Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Ala Gln Gly Ala Gly Pro 50 55 60 Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Thr Ser Ala Gly 65 70 75 80 Thr Ser Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala 85 90 95 Ser Gly Pro Thr Ala Asp Lys Tyr Gly Pro Gly Ile Gly Arg Tyr Ala 100 105 110 Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala Ser Ala Thr 115 120 125 Thr Val Asn Asn Gly Pro Gln Ile Gly Gly Tyr Gly Pro Gly Gln Gly 130 135 140 Ile Gly Pro Ala Ala Thr Ser Ala Pro Gly Ala Ser Gly Tyr Gly Pro 145 150 155 160 Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly 165 170 175 Ala Gly Pro Trp Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro Gly 180 185 190 Gly Gln Gly Ser Gly Ala Ser Ser Glu Ala Ala Ala Ser Ala Gly Thr 195 200 205 Ser Ala Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala 210 215 220 Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Arg Ala Ala Ala Ser 225 230 235 240 Ala Gly Thr Arg Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly 245 250 255 Pro Ala Ser Gly Pro Thr Ala Ala Tyr Lys Tyr Gly Pro Gly Ile Gly 260 265 270 Gly Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala 275 280 285 Ser Ala Thr Thr Val Asp Ile Gly Pro Gln Val Gly Gly Tyr Gly Pro 290 295 300 Gly Gln Gly Ile Ala Pro Ala Ala Ala Ala Pro Gly Ser Ser Gly Tyr 305 310 315 320 Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly 325 330 335 Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr 340 345 350 Ser Gly Tyr Gly Ser Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala 355 360 365 Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly Gln 370 375 380 Gly Ala Gly Leu Gly Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro 385 390 395 400 Gly Gly Gln Gly Ser Gly Ala Ser Thr Ala Ala Ala Ala Ser Ala Gly 405 410 415 Thr Ser Gly Tyr Ala Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly 420 425 430 Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly 435 440 445 Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser 450 455 460 Gly Ala Ser Ser Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Gln Arg 465 470 475 480 Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly 485 490 495 Gln Gly Val Gly Thr Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala 500 505 510 Ala Ala Ser Ala Gly Thr Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr 515 520 525 Gly Pro Ala Gln Gly Ala Gly Pro Gly Gly Gln Gly Thr Gly Ala Ser 530 535 540 Ser Ala Ala Ala Thr Ser Ala Gly Thr Ser Gly Tyr Gly Pro Gly Tyr 545 550 555 560 Pro Gly Tyr Gly Gln Gly Pro Ala Ser Gly Pro Thr Ala Asp Lys Tyr 565 570 575 Gly Pro Gly Ile Gly Arg Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr 580 585 590 Ser Ala Ala Thr Ala Ser Ala Thr Thr Val Asn Asn Gly Pro Gln Ile 595 600 605 Gly Gly Tyr Gly Pro Gly Gln Gly Ile Gly Pro Ala Ala Thr Ser Ala 610 615 620 Pro Gly Ala Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly 625 630 635 640 Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Trp Gln Gly Val Gly 645 650 655 Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser 660 665 670 Glu Ala Ala Ala Ser Ala Gly Thr Ser Ala Tyr Gly Pro Gly Val Ser 675 680 685 Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly 690 695 700 Ala Ser Ser Arg Ala Ala Ala Ser Ala Gly Thr Arg Gly Tyr Gly Pro 705 710 715 720 Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala Ser Gly Pro Thr Ala Ala 725 730 735 Tyr Lys Tyr Gly Pro Gly Ile Gly Gly Tyr Ala Pro Gly Arg Ser Thr 740 745 750 Thr Ser Thr Ser Ala Ala Thr Ala Ser Ala Thr Thr Val Asp Ile Gly 755 760 765 Pro Gln Val Gly Gly Tyr Gly Pro Gly Gln Gly Ile Ala Pro Ala Ala 770 775 780 Ala Ala Pro Gly Ser Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly 785 790 795 800 Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Thr Gly Ala Ser Ser 805 810 815 Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Gly Ser Gly Val Ser 820 825 830 Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro 835 840 845 Gly Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Leu Gly Gln Gly Val 850 855 860 Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser 865 870 875 880 Thr Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Ala Pro Gly Val 885 890 895 Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly 900 905 910 Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly Gln Gly 915 920 925 Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Ala Ala Ala Ala 930 935 940 Gly Gly Tyr Gly Pro Gly Gln Arg Ala Gly Pro Gly Gln Gly Ala Gly 945 950 955 960 Pro Gly Gln Gly Val Gly Pro Gly Gln Gly Val Gly Thr Gly Gly Gln 965 970 975 Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly 980 985 990 Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Ala Gln Gly Ala Gly Pro 995 1000 1005 Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Thr Ser Ala 1010 1015 1020 Gly Thr Ser Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly 1025 1030 1035 Pro Ala Ser Gly Pro Thr Ala Asp Lys Tyr Gly Pro Gly Ile Gly 1040 1045 1050 Arg Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr 1055 1060 1065 Ala Ser Ala Thr Thr Val Asn Asn Gly Pro Gln Ile Gly Gly Tyr 1070 1075 1080 Gly Pro Gly Gln Gly Ile Gly Pro Ala Ala Thr Ser Ala Pro Gly 1085 1090 1095 Ala Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln 1100 1105 1110 Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Trp Gln Gly Val Gly 1115 1120 1125 Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser 1130 1135 1140 Ser Glu Ala Ala Ala Ser Ala Gly Thr Ser Ala Tyr Gly Pro Gly 1145 1150 1155 Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln 1160 1165 1170 Gly Ser Gly Ala Ser Ser Arg Ala Ala Ala Ser Ala Gly Thr Arg 1175 1180 1185 Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala Ser 1190 1195 1200 Gly Pro Thr Ala Ala Tyr Lys Tyr Gly Pro Gly Ile Gly Gly Tyr 1205 1210 1215 Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala Ser 1220 1225 1230 Ala Thr Thr Val Asp Ile Gly Pro Gln Val Gly Gly Tyr Gly Pro 1235 1240 1245 Gly Gln Gly Ile Ala Pro Ala Ala Ala Ala Pro Gly Ser Ser Gly 1250 1255 1260 Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly 1265 1270 1275 Pro Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser 1280 1285 1290 Ala Gly Thr Ser Gly Tyr Gly Ser Gly Val Ser Gly Tyr Gly Pro 1295 1300 1305 Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly 1310 1315 1320 Val Gly Pro Gly Gln Gly Ala Gly Leu Gly Gln Gly Val Gly Pro 1325 1330 1335 Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Thr 1340 1345 1350 Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Ala Pro Gly Val 1355 1360 1365 Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala 1370 1375 1380 Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly 1385 1390 1395 Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Ala 1400 1405 1410 Ala Ala Ala 1415 <210> 40 <211> 840 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr 1 5 10 15 Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala 20 25 30 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro 35 40 45 Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro 50 55 60 Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr 65 70 75 80 Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala 85 90 95 Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly 100 105 110 Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly 115 120 125 Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala 130 135 140 Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly 145 150 155 160 Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr 165 170 175 Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu 180 185 190 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala 195 200 205 Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala 210 215 220 Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly 225 230 235 240 Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly 245 250 255 Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser 260 265 270 Ser Ser Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Arg Gln Asn 275 280 285 Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Thr Ala Asp Tyr 290 295 300 Gly Gln Lys Gln Val Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser 305 310 315 320 Ala Gly Gly Tyr Thr Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gly 325 330 335 Ala Val Ala Gly Gly Tyr Gly Pro Gly Ala Gly Ser Tyr Gly Ala Gly 340 345 350 Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Ala Gly Thr Ala Ala 355 360 365 Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro 370 375 380 Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ser Ala Gly Gln 385 390 395 400 Gly Ala Gly Gly Tyr Arg Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser 405 410 415 Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr 420 425 430 Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Ala Gly Gln Gly Ala Gly 435 440 445 Gly Tyr Gly Gln Gly Ala Gly Thr Ala Thr Ser Thr Ala Thr Gly Ala 450 455 460 Gly Thr Gly Gly Tyr Gly Arg Leu Ala Gly Gly Tyr Gly Gln Gly Ala 465 470 475 480 Gly Gly Tyr Gly Gln Ala Ala Ala Gly Ala Ala Ala Asp Ala Thr Ala 485 490 495 Gly Ala Gly Gly Tyr Asp Arg Ala Thr Gly Ala Phe Gly Pro Ser Thr 500 505 510 Arg Arg Ala Ala Gly Gly Ser Gly Leu Gly Ala Gly Thr Ala Pro Gly 515 520 525 Ala Phe Ser Gly Ser Gly Ala Gly Gly Lys Gly Pro Gly Asp Tyr Gly 530 535 540 Ser Ser Gln Gly Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ser 545 550 555 560 Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr 565 570 575 Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala 580 585 590 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro 595 600 605 Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro 610 615 620 Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr 625 630 635 640 Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala 645 650 655 Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly 660 665 670 Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly 675 680 685 Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala 690 695 700 Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly 705 710 715 720 Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr 725 730 735 Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu 740 745 750 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala 755 760 765 Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala 770 775 780 Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly 785 790 795 800 Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly 805 810 815 Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser 820 825 830 Ser Ser Ala Ala Ala Ala Ala Ser 835 840 <210> 41 <211> 840 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr 1 5 10 15 Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala 20 25 30 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro 35 40 45 Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro 50 55 60 Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr 65 70 75 80 Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala 85 90 95 Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly 100 105 110 Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly 115 120 125 Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala 130 135 140 Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly 145 150 155 160 Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr 165 170 175 Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu 180 185 190 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala 195 200 205 Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala 210 215 220 Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly 225 230 235 240 Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly 245 250 255 Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser 260 265 270 Ser Ser Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Arg Gln Asn 275 280 285 Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Thr Ala Asp Tyr 290 295 300 Gly Gln Lys Gln Val Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser 305 310 315 320 Ala Gly Gly Tyr Thr Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gly 325 330 335 Ala Val Ala Gly Gly Tyr Gly Pro Gly Ala Gly Ser Tyr Gly Ala Gly 340 345 350 Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Ala Gly Thr Ala Ala 355 360 365 Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro 370 375 380 Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ser Ala Gly Gln 385 390 395 400 Gly Ala Gly Gly Tyr Arg Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser 405 410 415 Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr 420 425 430 Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Ala Gly Gln Gly Ala Gly 435 440 445 Gly Tyr Gly Gln Gly Ala Gly Thr Ala Thr Ser Thr Ala Thr Gly Ala 450 455 460 Gly Thr Gly Gly Tyr Gly Arg Leu Ala Gly Gly Tyr Gly Gln Gly Ala 465 470 475 480 Gly Gly Tyr Gly Gln Ala Ala Ala Gly Ala Ala Ala Asp Ala Thr Ala 485 490 495 Gly Ala Gly Gly Tyr Asp Arg Ala Thr Gly Ala Phe Gly Pro Ser Thr 500 505 510 Arg Arg Ala Ala Gly Gly Ser Gly Leu Gly Ala Gly Thr Ala Pro Gly 515 520 525 Ala Phe Ser Gly Ser Gly Ala Gly Gly Lys Gly Pro Gly Asp Tyr Gly 530 535 540 Ser Ser Gln Gly Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ser 545 550 555 560 Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr 565 570 575 Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala 580 585 590 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro 595 600 605 Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro 610 615 620 Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr 625 630 635 640 Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala 645 650 655 Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly 660 665 670 Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly 675 680 685 Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala 690 695 700 Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly 705 710 715 720 Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr 725 730 735 Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu 740 745 750 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala 755 760 765 Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala 770 775 780 Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly 785 790 795 800 Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly 805 810 815 Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser 820 825 830 Ser Ser Ala Ala Ala Ala Ala Ser 835 840 <210> 42 <211> 885 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 100 105 110 Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln 115 120 125 Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 130 135 140 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln 145 150 155 160 Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 165 170 175 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly 180 185 190 Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr 195 200 205 Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly 210 215 220 Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly 225 230 235 240 Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly 245 250 255 Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala 260 265 270 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly 275 280 285 Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly 290 295 300 Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala 305 310 315 320 Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly 325 330 335 Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 340 345 350 Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln 355 360 365 Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly 370 375 380 Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser 385 390 395 400 Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala 405 410 415 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 420 425 430 Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala 435 440 445 Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln 450 455 460 Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala 465 470 475 480 Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala 485 490 495 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser 500 505 510 Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala 515 520 525 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly 530 535 540 Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly 545 550 555 560 Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala 565 570 575 Ser Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly 580 585 590 Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr 595 600 605 Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala 610 615 620 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly 625 630 635 640 Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly 645 650 655 Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala 660 665 670 Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly 675 680 685 Ser Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala 690 695 700 Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly 705 710 715 720 Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln 725 730 735 Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 740 745 750 Ala Ser Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln 755 760 765 Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly 770 775 780 Tyr Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala 785 790 795 800 Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly 805 810 815 Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly 820 825 830 Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala 835 840 845 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 850 855 860 Gly Ser Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala 865 870 875 880 Ala Ala Ala Ala Ala 885 <210> 43 <211> 996 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly 1 5 10 15 Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala 20 25 30 Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser 35 40 45 Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr 50 55 60 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser 65 70 75 80 Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala 85 90 95 Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr 100 105 110 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr 115 120 125 Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala 130 135 140 Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala 145 150 155 160 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg 165 170 175 Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala 180 185 190 Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly 195 200 205 Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala 210 215 220 Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 225 230 235 240 Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala 245 250 255 Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu 260 265 270 Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 275 280 285 Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr 290 295 300 Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly 305 310 315 320 Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 325 330 335 Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu 340 345 350 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser 355 360 365 Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala 370 375 380 Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly 385 390 395 400 Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr 405 410 415 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser 420 425 430 Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala 435 440 445 Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser 450 455 460 Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly 465 470 475 480 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala 485 490 495 Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly 500 505 510 Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 515 520 525 Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg 530 535 540 Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly 545 550 555 560 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala 565 570 575 Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 580 585 590 Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr 595 600 605 Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly 610 615 620 Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly 625 630 635 640 Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 645 650 655 Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser 660 665 670 Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr 675 680 685 Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly 690 695 700 Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala 705 710 715 720 Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 725 730 735 Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala 740 745 750 Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr 755 760 765 Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala 770 775 780 Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly 785 790 795 800 Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr 805 810 815 Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly 820 825 830 Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn 835 840 845 Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala 850 855 860 Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala 865 870 875 880 Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly 885 890 895 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly 900 905 910 Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr 915 920 925 Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala 930 935 940 Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg 945 950 955 960 Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala 965 970 975 Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala 980 985 990 Gly Ala Gly Ala 995 <210> 44 <211> 1104 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 1 5 10 15 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 20 25 30 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 35 40 45 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 65 70 75 80 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 85 90 95 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 100 105 110 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 115 120 125 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 130 135 140 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 165 170 175 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 180 185 190 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 195 200 205 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 210 215 220 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 225 230 235 240 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 245 250 255 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 260 265 270 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala 275 280 285 Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr 290 295 300 Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala 305 310 315 320 Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala 325 330 335 Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln 340 345 350 Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala 355 360 365 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 370 375 380 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 385 390 395 400 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 405 410 415 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 420 425 430 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 435 440 445 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 450 455 460 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 465 470 475 480 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 485 490 495 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 500 505 510 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 515 520 525 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 530 535 540 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 545 550 555 560 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 565 570 575 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 580 585 590 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 595 600 605 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 610 615 620 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 625 630 635 640 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala 645 650 655 Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr 660 665 670 Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala 675 680 685 Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala 690 695 700 Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln 705 710 715 720 Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala 725 730 735 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 740 745 750 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 755 760 765 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 770 775 780 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 785 790 795 800 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 805 810 815 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 820 825 830 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 835 840 845 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 850 855 860 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 865 870 875 880 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 885 890 895 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 900 905 910 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 915 920 925 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 930 935 940 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 945 950 955 960 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 965 970 975 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 980 985 990 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 995 1000 1005 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val 1010 1015 1020 Ala Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly 1025 1030 1035 Val Tyr Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp 1040 1045 1050 Thr Gly Ala Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro 1055 1060 1065 Gly Ser Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr 1070 1075 1080 Gly Pro Gly Ser Gln Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser 1085 1090 1095 Ser Ala Ala Ala Gly Ala 1100 <210> 45 <211> 1104 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 1 5 10 15 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 20 25 30 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 35 40 45 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 65 70 75 80 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 85 90 95 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 100 105 110 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 115 120 125 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 130 135 140 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 165 170 175 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 180 185 190 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 195 200 205 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 210 215 220 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 225 230 235 240 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 245 250 255 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 260 265 270 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala 275 280 285 Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr 290 295 300 Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala 305 310 315 320 Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala 325 330 335 Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln 340 345 350 Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala 355 360 365 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 370 375 380 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 385 390 395 400 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 405 410 415 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 420 425 430 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 435 440 445 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 450 455 460 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 465 470 475 480 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 485 490 495 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 500 505 510 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 515 520 525 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 530 535 540 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 545 550 555 560 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 565 570 575 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 580 585 590 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 595 600 605 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 610 615 620 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 625 630 635 640 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala 645 650 655 Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr 660 665 670 Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala 675 680 685 Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala 690 695 700 Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln 705 710 715 720 Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala 725 730 735 Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala 740 745 750 Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln 755 760 765 Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 770 775 780 Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly 785 790 795 800 Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro 805 810 815 Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala 820 825 830 Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val 835 840 845 Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala 850 855 860 Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly 865 870 875 880 Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala 885 890 895 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val 900 905 910 Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly 915 920 925 Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly 930 935 940 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser 945 950 955 960 Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala 965 970 975 Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 980 985 990 Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly 995 1000 1005 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val 1010 1015 1020 Ala Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly 1025 1030 1035 Val Tyr Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp 1040 1045 1050 Thr Gly Ala Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro 1055 1060 1065 Gly Ser Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr 1070 1075 1080 Gly Pro Gly Ser Gln Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser 1085 1090 1095 Ser Ala Ala Ala Gly Ala 1100 <210> 46 <211> 930 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr 1 5 10 15 Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala 20 25 30 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro 35 40 45 Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly 50 55 60 Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser 65 70 75 80 Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser 85 90 95 Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly 100 105 110 Gln Gly Val Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly 115 120 125 Ala Ala Thr Gly Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly 130 135 140 Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 145 150 155 160 Gly Ala Ala Thr Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly 165 170 175 Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala 180 185 190 Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe 195 200 205 Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly 210 215 220 Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr 225 230 235 240 Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val 245 250 255 Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala 260 265 270 Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly 275 280 285 Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala 290 295 300 Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val 305 310 315 320 Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln 325 330 335 Lys Gln Ala Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser Ala Gly 340 345 350 Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly 355 360 365 Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly 370 375 380 Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala 385 390 395 400 Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp 405 410 415 Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly Thr Ala Ala Gly Ala Ser 420 425 430 Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly Val Gly Pro Val Gly Tyr 435 440 445 Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly 450 455 460 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Val Thr Val Thr Ala Ala 465 470 475 480 Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val 485 490 495 Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly 500 505 510 Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala 515 520 525 Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly 530 535 540 Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr 545 550 555 560 Gly Gln Gly Ala Gly Val Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala 565 570 575 Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala 580 585 590 Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala 595 600 605 Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr 610 615 620 Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys 625 630 635 640 Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala Ser Ala Ala Val 645 650 655 Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly 660 665 670 Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr 675 680 685 Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly 690 695 700 Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr 705 710 715 720 Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly 725 730 735 Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly 740 745 750 Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala 755 760 765 Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr 770 775 780 Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly 785 790 795 800 Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala 805 810 815 Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly 820 825 830 Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu 835 840 845 Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr 850 855 860 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val Ser Gly Ala Gly 865 870 875 880 Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala 885 890 895 Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr 900 905 910 Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala 915 920 925 Ala Ser 930 <210> 47 <211> 930 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr 1 5 10 15 Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala 20 25 30 Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro 35 40 45 Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly 50 55 60 Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser 65 70 75 80 Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser 85 90 95 Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly 100 105 110 Gln Gly Val Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly 115 120 125 Ala Ala Thr Gly Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly 130 135 140 Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 145 150 155 160 Gly Ala Ala Thr Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly 165 170 175 Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala 180 185 190 Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe 195 200 205 Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly 210 215 220 Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr 225 230 235 240 Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val 245 250 255 Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala 260 265 270 Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly 275 280 285 Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala 290 295 300 Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val 305 310 315 320 Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln 325 330 335 Lys Gln Ala Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser Ala Gly 340 345 350 Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly 355 360 365 Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly 370 375 380 Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala 385 390 395 400 Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp 405 410 415 Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly Thr Ala Ala Gly Ala Ser 420 425 430 Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly Val Gly Pro Val Gly Tyr 435 440 445 Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly 450 455 460 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Val Thr Val Thr Ala Ala 465 470 475 480 Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val 485 490 495 Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly 500 505 510 Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala 515 520 525 Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly 530 535 540 Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr 545 550 555 560 Gly Gln Gly Ala Gly Val Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala 565 570 575 Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala 580 585 590 Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala 595 600 605 Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr 610 615 620 Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys 625 630 635 640 Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala Ser Ala Ala Val 645 650 655 Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly 660 665 670 Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr 675 680 685 Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly 690 695 700 Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr 705 710 715 720 Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly 725 730 735 Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly 740 745 750 Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala 755 760 765 Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr 770 775 780 Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly 785 790 795 800 Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala 805 810 815 Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly 820 825 830 Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu 835 840 845 Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr 850 855 860 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val Ser Gly Ala Gly 865 870 875 880 Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala 885 890 895 Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr 900 905 910 Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala 915 920 925 Ala Ser 930 <210> 48 <211> 740 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly 1 5 10 15 Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr 20 25 30 Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala 35 40 45 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 50 55 60 Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly 65 70 75 80 Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala 85 90 95 Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 100 105 110 Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala 115 120 125 Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 130 135 140 Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly 145 150 155 160 Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg 165 170 175 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly 180 185 190 Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr 195 200 205 Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly 210 215 220 Ala Gly Ala Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala 225 230 235 240 Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly 245 250 255 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala 260 265 270 Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 275 280 285 Gly Tyr Gly Gln Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly 290 295 300 Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala 305 310 315 320 Ala Ile Ala Arg Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 325 330 335 Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly 340 345 350 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly 355 360 365 Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Arg Gly Tyr Gly Gln 370 375 380 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala 385 390 395 400 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala 405 410 415 Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly 420 425 430 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Gly Tyr Gly 435 440 445 Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala 450 455 460 Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr Gly Gln Gly Ala 465 470 475 480 Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala 485 490 495 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 500 505 510 Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Arg 515 520 525 Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala 530 535 540 Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 545 550 555 560 Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala 565 570 575 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala 580 585 590 Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly 595 600 605 Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr 610 615 620 Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala 625 630 635 640 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 645 650 655 Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly 660 665 670 Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala 675 680 685 Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 690 695 700 Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala 705 710 715 720 Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 725 730 735 Gly Gln Gly Ala 740 <210> 49 <211> 972 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 49 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 1 5 10 15 Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly 20 25 30 Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly Val Gly Glu Tyr 35 40 45 Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly 50 55 60 Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly 65 70 75 80 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala 85 90 95 Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 100 105 110 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 115 120 125 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala 130 135 140 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 145 150 155 160 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 165 170 175 Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ser Gly 180 185 190 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 195 200 205 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ser Thr Gly Ala 210 215 220 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 225 230 235 240 Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly 245 250 255 Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser Ser Ala Ala Ala 260 265 270 Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val Thr 275 280 285 Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg Arg Gln Ala Ala 290 295 300 Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly Gln 305 310 315 320 Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 325 330 335 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 340 345 350 Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly 355 360 365 Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 370 375 380 Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln 385 390 395 400 Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 405 410 415 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly 420 425 430 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala 435 440 445 Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 450 455 460 Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 465 470 475 480 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala 485 490 495 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala 500 505 510 Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 515 520 525 Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 530 535 540 Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 545 550 555 560 Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly 565 570 575 Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser 580 585 590 Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn 595 600 605 Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg 610 615 620 Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala 625 630 635 640 Gly Tyr Gly Gln Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly 645 650 655 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala 660 665 670 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala 675 680 685 Ala Gly Ala Gly Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 690 695 700 Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 705 710 715 720 Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 725 730 735 Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly 740 745 750 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala 755 760 765 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 770 775 780 Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala 785 790 795 800 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 805 810 815 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala 820 825 830 Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala 835 840 845 Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln 850 855 860 Gly Ala Gly Ala Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 865 870 875 880 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala 885 890 895 Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala 900 905 910 Ala Ala Thr Ser Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr 915 920 925 Glu Arg Gln Asn Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu 930 935 940 Ile Ala Asp Arg Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr 945 950 955 960 Ser Ala Ala Ala Gly Tyr Gly Gln Gly Ala Gly Thr 965 970 <210> 50 <211> 972 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 50 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 1 5 10 15 Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly 20 25 30 Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly Val Gly Glu Tyr 35 40 45 Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly 50 55 60 Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly 65 70 75 80 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala 85 90 95 Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 100 105 110 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 115 120 125 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala 130 135 140 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 145 150 155 160 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 165 170 175 Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ser Gly 180 185 190 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 195 200 205 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ser Thr Gly Ala 210 215 220 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 225 230 235 240 Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly 245 250 255 Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser Ser Ala Ala Ala 260 265 270 Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val Thr 275 280 285 Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg Arg Gln Ala Ala 290 295 300 Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly Gln 305 310 315 320 Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln 325 330 335 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 340 345 350 Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly 355 360 365 Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 370 375 380 Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln 385 390 395 400 Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 405 410 415 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly 420 425 430 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala 435 440 445 Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala 450 455 460 Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 465 470 475 480 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala 485 490 495 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala 500 505 510 Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 515 520 525 Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 530 535 540 Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 545 550 555 560 Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly 565 570 575 Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser 580 585 590 Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn 595 600 605 Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg 610 615 620 Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala 625 630 635 640 Gly Tyr Gly Gln Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly 645 650 655 Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala 660 665 670 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala 675 680 685 Ala Gly Ala Gly Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 690 695 700 Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 705 710 715 720 Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 725 730 735 Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly 740 745 750 Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala 755 760 765 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 770 775 780 Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala 785 790 795 800 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 805 810 815 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala 820 825 830 Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala 835 840 845 Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln 850 855 860 Gly Ala Gly Ala Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly 865 870 875 880 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala 885 890 895 Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala 900 905 910 Ala Ala Thr Ser Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr 915 920 925 Glu Arg Gln Asn Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu 930 935 940 Ile Ala Asp Arg Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr 945 950 955 960 Ser Ala Ala Ala Gly Tyr Gly Gln Gly Ala Gly Thr 965 970 <210> 51 <211> 930 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 51 Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala 1 5 10 15 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala 20 25 30 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr 35 40 45 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 50 55 60 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala 100 105 110 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala 130 135 140 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 165 170 175 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Val 180 185 190 Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala 195 200 205 Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala 210 215 220 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala 225 230 235 240 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 245 250 255 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly 260 265 270 Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 275 280 285 Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 290 295 300 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 305 310 315 320 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 325 330 335 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 340 345 350 Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 355 360 365 Ala Ala Ala Ala Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr 370 375 380 Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser 385 390 395 400 Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 405 410 415 Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 420 425 430 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 435 440 445 Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln 450 455 460 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp 465 470 475 480 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 485 490 495 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 500 505 510 Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 515 520 525 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln 530 535 540 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 545 550 555 560 Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala 565 570 575 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala 580 585 590 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln 595 600 605 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly 610 615 620 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 625 630 635 640 Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala 645 650 655 Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly 660 665 670 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 675 680 685 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln 690 695 700 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 705 710 715 720 Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala 725 730 735 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Val Gly Gly 740 745 750 Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 755 760 765 Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala 770 775 780 Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala Gly Ala 785 790 795 800 Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 805 810 815 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 820 825 830 Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 835 840 845 Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 850 855 860 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 865 870 875 880 Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala 885 890 895 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 900 905 910 Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 915 920 925 Ala Ala 930 <210> 52 <211> 930 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 52 Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly 1 5 10 15 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln 20 25 30 Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly 35 40 45 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala 50 55 60 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 65 70 75 80 Ala Gly Gly Tyr Gly Lys Gly Gln Gly Ala Ala Ala Ala Ala Phe Ala 85 90 95 Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Tyr 100 105 110 Ala Gly Ala Gly Ala Gly Ala Val Ala Gly Ala Ala Ala Gly Ala Gly 115 120 125 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly 130 135 140 Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 145 150 155 160 Ala Gly Ala Gly Ala Gly Ala Ala Ala Asn Ala Gly Ala Gly Gly Tyr 165 170 175 Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala 180 185 190 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala 195 200 205 Gly Thr Gly Ala Ala Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Val 210 215 220 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala 225 230 235 240 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Pro Gly Gln Gly Ala 245 250 255 Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 260 265 270 Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 275 280 285 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly 290 295 300 Ala Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly 305 310 315 320 Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 325 330 335 Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly 340 345 350 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 355 360 365 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 370 375 380 Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Lys Gly Gln Gly Ala 385 390 395 400 Ala Ala Ala Ala Phe Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly 405 410 415 Ala Gly Ala Gly Ala Tyr Ala Gly Ala Gly Ala Gly Ala Val Ala Gly 420 425 430 Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly 435 440 445 Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala 450 455 460 Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Asn 465 470 475 480 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly 485 490 495 Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 500 505 510 Gly Gln Gly Ala Gly Ala Gly Thr Gly Ala Ala Ala Gly Ala Gly Ala 515 520 525 Ser Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 530 535 540 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 545 550 555 560 Gly Pro Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala 565 570 575 Gly Gly Tyr Gly Gln Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly 580 585 590 Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly 595 600 605 Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Gly Ala Gly Gly Tyr Gly 610 615 620 Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly 625 630 635 640 Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly 645 650 655 Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 660 665 670 Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 675 680 685 Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr 690 695 700 Gly Lys Gly Gln Gly Ala Ala Ala Ala Ala Phe Ala Gly Ala Gly Gly 705 710 715 720 Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Tyr Ala Gly Ala Gly 725 730 735 Ala Gly Ala Val Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr 740 745 750 Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala 755 760 765 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly 770 775 780 Ala Gly Ala Ala Ala Asn Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 785 790 795 800 Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly 805 810 815 Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Thr Gly Ala 820 825 830 Ala Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Val Gly Ala Gly Ala 835 840 845 Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly 850 855 860 Gln Gly Ala Gly Gly Tyr Gly Pro Gly Gln Gly Ala Ala Ala Ala Ala 865 870 875 880 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Gly 885 890 895 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr 900 905 910 Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala 915 920 925 Gly Ala 930 <210> 53 <211> 396 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 53 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala 195 200 205 Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 210 215 220 Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 225 230 235 240 Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln 245 250 255 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala 260 265 270 Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 275 280 285 Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln 290 295 300 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser 305 310 315 320 Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala 325 330 335 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu 340 345 350 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 355 360 365 Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 370 375 380 Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala 385 390 395 <210> 54 <211> 792 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 54 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala 195 200 205 Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 210 215 220 Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 225 230 235 240 Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln 245 250 255 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala 260 265 270 Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 275 280 285 Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln 290 295 300 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser 305 310 315 320 Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala 325 330 335 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu 340 345 350 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 355 360 365 Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 370 375 380 Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala 385 390 395 400 Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala 405 410 415 Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly 420 425 430 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly 435 440 445 Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 450 455 460 Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr 465 470 475 480 Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp 485 490 495 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 500 505 510 Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala 515 520 525 Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 530 535 540 Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 545 550 555 560 Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln 565 570 575 Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser 580 585 590 Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln 595 600 605 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly 610 615 620 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 625 630 635 640 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly 645 650 655 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala 660 665 670 Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 675 680 685 Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 690 695 700 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala 705 710 715 720 Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 725 730 735 Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly 740 745 750 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly 755 760 765 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala 770 775 780 Ala Ser Ala Ala Ala Ser Ser Ala 785 790 <210> 55 <211> 1584 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 55 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala 195 200 205 Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 210 215 220 Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 225 230 235 240 Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln 245 250 255 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala 260 265 270 Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 275 280 285 Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln 290 295 300 Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser 305 310 315 320 Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala 325 330 335 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu 340 345 350 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 355 360 365 Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 370 375 380 Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala 385 390 395 400 Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala 405 410 415 Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly 420 425 430 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly 435 440 445 Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 450 455 460 Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr 465 470 475 480 Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp 485 490 495 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 500 505 510 Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala 515 520 525 Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 530 535 540 Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 545 550 555 560 Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln 565 570 575 Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser 580 585 590 Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln 595 600 605 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly 610 615 620 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 625 630 635 640 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly 645 650 655 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala 660 665 670 Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 675 680 685 Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 690 695 700 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala 705 710 715 720 Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 725 730 735 Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly 740 745 750 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly 755 760 765 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala 770 775 780 Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly 785 790 795 800 Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 805 810 815 Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 820 825 830 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 835 840 845 Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 850 855 860 Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala 865 870 875 880 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly 885 890 895 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 900 905 910 Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln 915 920 925 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly 930 935 940 Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 945 950 955 960 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 965 970 975 Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala 980 985 990 Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala 995 1000 1005 Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly 1010 1015 1020 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 1025 1030 1035 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln 1040 1045 1050 Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala 1055 1060 1065 Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 1070 1075 1080 Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly 1085 1090 1095 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly 1100 1105 1110 Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala 1115 1120 1125 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr 1130 1135 1140 Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly 1145 1150 1155 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr 1160 1165 1170 Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala 1175 1180 1185 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly 1190 1195 1200 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly 1205 1210 1215 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 1220 1225 1230 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly 1235 1240 1245 Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly 1250 1255 1260 Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 1265 1270 1275 Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly 1280 1285 1290 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 1295 1300 1305 Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly 1310 1315 1320 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly 1325 1330 1335 Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala 1340 1345 1350 Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln 1355 1360 1365 Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala 1370 1375 1380 Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr 1385 1390 1395 Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala 1400 1405 1410 Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly 1415 1420 1425 Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 1430 1435 1440 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 1445 1450 1455 Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 1460 1465 1470 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly 1475 1480 1485 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 1490 1495 1500 Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala 1505 1510 1515 Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala 1520 1525 1530 Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly 1535 1540 1545 Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr 1550 1555 1560 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 1565 1570 1575 Ala Ala Ala Ser Ser Ala 1580 <210> 56 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 56 Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly 1 5 10 15 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 20 25 30 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 35 40 45 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 50 55 60 Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly 65 70 75 80 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 85 90 95 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 100 105 110 Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 115 120 125 Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 130 135 140 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala 145 150 155 160 Ala Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala 165 170 175 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 180 185 190 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 195 200 205 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 210 215 220 Ala Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala 225 230 235 240 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 245 250 255 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 260 265 270 Ala Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 275 280 285 Ala Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 290 295 300 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala 305 310 315 320 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly 325 330 335 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 340 345 350 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 355 360 365 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 370 375 380 Ala Ala Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly 385 390 395 400 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 405 410 415 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 420 425 430 Gly Ala Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 435 440 445 Gly Ala Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 450 455 460 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala 465 470 475 480 Ala Ala <210> 57 <211> 810 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 57 Gly Gly Tyr Gly Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala 1 5 10 15 Gly Val Gly Ala Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly 20 25 30 Gly Tyr Gly Ala Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr 35 40 45 Gly Arg Gly Thr Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala 50 55 60 Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Ala Ala Gly Ala Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly 85 90 95 Gln Gly Ala Tyr Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala 100 105 110 Gly Ala Gly Ala Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val 115 120 125 Gly Ala Gly Ala Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly 130 135 140 Gly Tyr Arg Arg Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 145 150 155 160 Thr Ala Ala Ala Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg 165 170 175 Gly Ala Gly Ala Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly 180 185 190 Tyr Gly Arg Asn Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg 195 200 205 Ala Gly Ser Ala Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly 210 215 220 Ala Gly Ala Ser Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly 225 230 235 240 Tyr Gly Arg Gly Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala 245 250 255 Gly Gly Tyr Gly Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala Gly Gly 260 265 270 Tyr Gly Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala Gly Val 275 280 285 Gly Ala Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly Gly Tyr 290 295 300 Gly Ala Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg 305 310 315 320 Gly Thr Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala Ala Ala 325 330 335 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala 340 345 350 Gly Ala Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly Gln Gly 355 360 365 Ala Tyr Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 370 375 380 Gly Ala Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val Gly Ala 385 390 395 400 Gly Ala Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly Gly Tyr 405 410 415 Arg Arg Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Thr Ala 420 425 430 Ala Ala Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Ala 435 440 445 Gly Ala Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly Tyr Gly 450 455 460 Arg Asn Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg Ala Gly 465 470 475 480 Ser Ala Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly Ala Gly 485 490 495 Ala Ser Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly Tyr Gly 500 505 510 Arg Gly Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala Gly Gly 515 520 525 Tyr Gly Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala Gly Gly Tyr Gly 530 535 540 Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala Gly Val Gly Ala 545 550 555 560 Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 565 570 575 Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Thr 580 585 590 Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala Ala Ala Gly Ala 595 600 605 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 610 615 620 Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly Gln Gly Ala Tyr 625 630 635 640 Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 645 650 655 Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val Gly Ala Gly Ala 660 665 670 Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly Gly Tyr Arg Arg 675 680 685 Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Thr Ala Ala Ala 690 695 700 Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 705 710 715 720 Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly Tyr Gly Arg Asn 725 730 735 Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg Ala Gly Ser Ala 740 745 750 Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly Ala Gly Ala Ser 755 760 765 Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly Tyr Gly Arg Gly 770 775 780 Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala Gly Gly Tyr Gly 785 790 795 800 Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala 805 810 <210> 58 <211> 790 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser 20 25 30 Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln 35 40 45 Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr 50 55 60 Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly 65 70 75 80 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala 85 90 95 Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 130 135 140 Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala 145 150 155 160 Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr 165 170 175 Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr 180 185 190 Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly 195 200 205 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 210 215 220 Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala 225 230 235 240 Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser 245 250 255 Gly Tyr Gly Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser 260 265 270 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 275 280 285 Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr 290 295 300 Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala 305 310 315 320 Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala 325 330 335 Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 340 345 350 Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala 355 360 365 Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 370 375 380 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala Gly Ser Gly Ala Gly 385 390 395 400 Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly 405 410 415 Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln 420 425 430 Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala 435 440 445 Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly 450 455 460 Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr 465 470 475 480 Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly 485 490 495 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly 500 505 510 Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala Ala Gly 515 520 525 Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly 530 535 540 Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser Ala 545 550 555 560 Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln Ser 565 570 575 Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr Gly 580 585 590 Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly 595 600 605 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala Gly 610 615 620 Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser Gly 625 630 635 640 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly 645 650 655 Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly 660 665 670 Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser 675 680 685 Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr 690 695 700 Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly 705 710 715 720 Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala 725 730 735 Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala 740 745 750 Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala 755 760 765 Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly 770 775 780 Tyr Gly Ala Gly Ala Ala 785 790 <210> 59 <211> 395 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 59 Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser 20 25 30 Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln 35 40 45 Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr 50 55 60 Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly 65 70 75 80 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala 85 90 95 Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 130 135 140 Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala 145 150 155 160 Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr 165 170 175 Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr 180 185 190 Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly 195 200 205 Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser 210 215 220 Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala 225 230 235 240 Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser 245 250 255 Gly Tyr Gly Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser 260 265 270 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 275 280 285 Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr 290 295 300 Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala 305 310 315 320 Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala 325 330 335 Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 340 345 350 Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala 355 360 365 Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 370 375 380 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala 385 390 395 <210> 60 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Gly Gly Gly Gly Gly Gly His His His His His His 1 5 10 <210> 61 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 61 Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp 1 5 10 15 Lys Asp Tyr Lys Asp Asp Asp Asp Lys 20 25 <210> 62 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 62 Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp 1 5 10 15 Lys Asp Tyr Lys Asp Asp Asp Asp Lys Gly His His His His His His 20 25 30 <210> 63 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 63 Ala Ala Ala Ala Ala 1 5 <210> 64 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 64 Ser Gly Ala Gly Gly 1 5 <210> 65 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 65 Gly Ser Gly Ala Gly 1 5 <210> 66 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: silk protein sequence <400> 66 Gly Gly Ser Gly Ala 1 5 <210> 67 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(8) <223> This sequence may encompass 6-8 residues <400> 67 His His His His His His His His 1 5 <210> 68 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 68 His His His His His His 1 5 <210> 69 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 69 Gly Gly Gly Gly Gly His His His His His His 1 5 10

Claims (57)

  1. 숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는, 다음을 포함하는 방법:
    숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
    상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하며; 그리고
    상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 이 용액 안에 상기 재조합 거미 실크 단백질이 용해화된다.
  2. 청구항 1에 있어서, 이때 상기 염은 칼슘 염을 포함하는, 방법.
  3. 청구항 2에 있어서, 이때 상기 칼슘 염은 염화칼슘, 질산칼슘, 티오시안산칼슘, 요오드화 칼슘, 또는 브롬화 칼슘 중 적어도 하나를 포함하는, 방법.
  4. 청구항 3에 있어서, 이때 상기 칼슘 염은 염화 칼슘을 포함하는, 방법.
  5. 청구항 1-4중 임의의 한 항에 있어서, 이때 상기 용액은 적어도 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함하는, 방법.
  6. 청구항 4에 있어서, 이때 상기 용액은 적어도 2M 염화 칼슘을 포함하는, 방법.
  7. 청구항 3에 있어서, 이때 상기 칼슘 염은 질산 칼슘을 포함하는, 방법.
  8. 청구항 1에 있어서, 이때 상기 염은 스트론튬 염 또는 바륨 염을 포함하는, 방법.
  9. 청구항 1-8중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 또는 35% (w/v)인, 방법.
  10. 청구항 9에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 약 15% (w/v)인, 방법.
  11. 청구항 9에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 최대한 많아도 약 35% (w/v)인, 방법.
  12. 청구항 1-11중 임의의 한 항에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X, 5X 또는 7X인, 방법.
  13. 청구항 12에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X인, 방법.
  14. 청구항 12에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 약 7X인, 방법.
  15. 상기 청구항들중 임의의 항에 있어서, 이때 상기 알코올은 메탄올, 에탄올, 또는 이소프로판올중 적어도 하나를 포함하는, 방법.
  16. 청구항 15에 있어서, 이때 상기 알코올은 메탄올을 포함하는, 방법.
  17. 청구항 1-16중 임의의 한 항에 있어서, 이때 상기 용액은 2M 염화 칼슘과 메탄올을 포함하는, 방법.
  18. 청구항 1-17중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 20℃ 내지 70℃ 온도에서 이 용액과 함께, 항온처리되는, 방법.
  19. 청구항 18에 있어서, 이때 상기 불용성 부분은 실온에서 항온처리되는, 방법.
  20. 청구항 18에 있어서, 이때 상기 불용성 부분은 약 35℃에서 항온처리되는, 방법.
  21. 청구항 18에 있어서, 이때 상기 불용성 부분은 약 55℃에서 항온처리되는, 방법.
  22. 청구항 18에 있어서, 이때 상기 불용성 부분은 70℃를 넘지 않은 온도에서 항온처리되는, 방법.
  23. 청구항 18에 있어서, 이때 상기 불용성 부분은 20℃보다 낮지 않은 온도에서 항온처리되는, 방법.
  24. 청구항 1-24중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 상기 용액에서 15분 내지 120 분 동안 항온처리되는, 방법.
  25. 청구항 24에 있어서, 이때 상기 불용성 부분은 상기 용액에서 30 분 동안 항온처리되는, 방법.
  26. 청구항 1-25중 임의의 한 항에 있어서, 상기 알코올을 증발시키는 것을 더 포함하는, 방법.
  27. 청구항 1-26중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 세포 용해물 펠렛을 포함하는, 방법.
  28. 청구항 1-27중 임의의 한 항에 있어서, 이때 상기 세포 배양물로부터 유래된 불용성 부분의 수집은 상기 숙주 세포의 용해를 포함하는, 방법.
  29. 청구항 28에 있어서, 이때 용해는 열 처리, 화학적 처리, 전단 파괴, 물리적 균질화, 미세유동화, 초음파처리, 또는 화학적 균질화를 포함하는, 방법.
  30. 청구항 28 내지 29에 있어서, 이때 상기 세포 배양물에서 불용성 부분의 수집은 상기 용해된 세포를 원심분리시켜, 세포 용해물 펠렛을 수득하는 것을 포함하는, 방법.
  31. 청구항 1-30중 임의의 한 항에 있어서, 상기 용액으로부터 불순물 제거를 더 포함하는, 방법.
  32. 청구항 31에 있어서, 이때 불순물 제거는 수성 용액을 추가하여, 이들 불순물을 침전시키는 것을 포함하는, 방법.
  33. 청구항 32에 있어서, 이때 상기 수성 용액은 물인, 방법.
  34. 청구항 31에 있어서, 이때 이들 불순물 제거는 여과, 원심분리, 중력 침전, 흡착, 투석 또는 상(phase) 분리를 포함하는, 방법.
  35. 청구항 34에 있어서, 이때 상기 여과는 한외여과, 정밀여과, 또는 정용여과인, 방법.
  36. 청구항 1-35중 임의의 한 항에 있어서, 이때 상기 용해화된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함하는, 방법.
  37. 청구항 1-36중 임의의 한 항에 있어서, 상기 재조합 거미 실크 단백질을 상기 용액으로 단리시키는 것을 더 포함하며, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성되는, 방법.
  38. 청구항 37에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정되는, 방법.
  39. 청구항 37 또는 38에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 ELISA를 이용하여 측정되는, 방법.
  40. 청구항 37-39중 임의의 항에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 방법.
  41. 청구항 37-40중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질인, 방법.
  42. 청구항 37-40중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함하는, 방법.
  43. 청구항 41에 있어서, 이때 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정되는, 방법.
  44. 청구항 41에 있어서, 이때 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 방법.
  45. 청구항 1-44중 임의의 한 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%인, 방법.
  46. 청구항 1-45중 임의의 한 항에 있어서, 이때 상기 재조합 거미 실크 단백질은 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질인, 방법.
  47. 청구항 1-46중 임의의 한 항에 있어서, 이때 상기 재조합 거미 실크 단백질은 서열 식별 번호: 1-27 또는 39-59에서 제시된 서열을 포함하는, 방법.
  48. 청구항 1-47중 임의의 한 항에 있어서, 이때 상기 세포 배양물은 곰팡이, 박테리아 또는 효모 세포를 포함하는, 방법.
  49. 청구항 1-48중 임의의 한 항에 있어서, 이때 상기 박테리아 세포는 대장균(Escherichia coli)인, 방법.
  50. 청구항 1-49중 임의의 한 항에 있어서, 실크 단백질 분말을 만들기 위해 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함하는, 방법.
  51. 숙주 세포로부터 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법:
    숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
    상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하고;
    상기 숙주 세포의 불용성 부분을 적어도 0.1M 염화 칼슘과 메탄올을 포함하는 용액에 추가하고, 이로 인하여 이 용액에서 상기 재조합 거미 실크 단백질을 용해화시키고; 그리고
    이 용액으로부터 상기 재조합 거미 실크 단백질을 단리시키고, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성된다.
  52. 청구항 51에 있어서, 이때 상기 용액은 적어도 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함하는, 방법.
  53. 청구항 51에 있어서, 실크 단백질 분말을 만들기 위해 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함하는, 방법.
  54. 상기 청구항들중 임의의 한 항에 따른 방법에 의해 만들어진, 재조합 거미 실크 단백질을 포함하는 조성물.
  55. 청구항 54에 있어서, 재조합 거미 실크 단백질 분말을 포함하는, 조성물.
  56. 청구항 54 또는 55에 있어서, 이때 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 전장의 재조합 거미 실크를 포함하는, 조성물.
  57. 청구항 1-53중 임의의 한 항에 따라 생성된 재조합 거미 실크 단백질을 포함하는 고형 실크.
KR1020227004065A 2019-08-22 2020-08-21 거미 실크 단백질의 추출 개선을 위한 방법 KR20220050884A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962890473P 2019-08-22 2019-08-22
US62/890,473 2019-08-22
PCT/US2020/047514 WO2021035184A1 (en) 2019-08-22 2020-08-21 Methods for improved extraction of spider silk proteins

Publications (1)

Publication Number Publication Date
KR20220050884A true KR20220050884A (ko) 2022-04-25

Family

ID=74660376

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227004065A KR20220050884A (ko) 2019-08-22 2020-08-21 거미 실크 단백질의 추출 개선을 위한 방법

Country Status (7)

Country Link
US (1) US20220289790A1 (ko)
EP (1) EP4017865A4 (ko)
JP (1) JP2022545183A (ko)
KR (1) KR20220050884A (ko)
CN (1) CN114222751A (ko)
CA (1) CA3147092A1 (ko)
WO (1) WO2021035184A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4031202A1 (en) * 2019-09-16 2022-07-27 Bolt Threads, Inc. Methods for isolating spider silk proteins via high shear solubilization
US11993068B2 (en) 2022-04-15 2024-05-28 Spora Cayman Holdings Limited Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them
WO2024057361A1 (ja) * 2022-09-12 2024-03-21 興和株式会社 可溶化タンパク質製造方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2022961A (en) * 1931-09-23 1935-12-03 American Bemberg Corp Process for the manufacture of artificial silk
US5245012A (en) * 1990-04-19 1993-09-14 The United States Of America As Represented By The Secretary Of The Army Method to achieve solubilization of spider silk proteins
JPWO2017094722A1 (ja) 2015-12-01 2018-10-11 Spiber株式会社 タンパク質溶液を製造する方法
WO2017127940A1 (en) * 2016-01-27 2017-08-03 Dalhousie University Artificial spider aciniform silk proteins, methods of making and uses thereof
CN110719732B (zh) * 2017-03-30 2022-11-18 犹他州立大学 表达蜘蛛丝的转基因蚕
JP2021080571A (ja) * 2018-01-31 2021-05-27 Spiber株式会社 タンパク質繊維及びその製造方法

Also Published As

Publication number Publication date
JP2022545183A (ja) 2022-10-26
CA3147092A1 (en) 2021-02-25
WO2021035184A1 (en) 2021-02-25
CN114222751A (zh) 2022-03-22
EP4017865A1 (en) 2022-06-29
EP4017865A4 (en) 2023-08-23
US20220289790A1 (en) 2022-09-15

Similar Documents

Publication Publication Date Title
JP7544348B2 (ja) 改良シルク繊維を合成するための方法および組成物
KR20220050884A (ko) 거미 실크 단백질의 추출 개선을 위한 방법
KR102618002B1 (ko) 재조합 단백질을 고분비 수율로 생산하기 위한 조성물 및 방법
EP3592800A2 (en) Compositions and methods for producing high secreted yields of recombinant proteins
KR20210096175A (ko) 거미 실크 단백질의 알칼리 정제
EP4218843A2 (en) Methods for isolating spider silk proteins via high shear solubilization