KR20220050884A - 거미 실크 단백질의 추출 개선을 위한 방법 - Google Patents
거미 실크 단백질의 추출 개선을 위한 방법 Download PDFInfo
- Publication number
- KR20220050884A KR20220050884A KR1020227004065A KR20227004065A KR20220050884A KR 20220050884 A KR20220050884 A KR 20220050884A KR 1020227004065 A KR1020227004065 A KR 1020227004065A KR 20227004065 A KR20227004065 A KR 20227004065A KR 20220050884 A KR20220050884 A KR 20220050884A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- ala
- ser
- gln
- tyr
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/34—Extraction; Separation; Purification by filtration, ultrafiltration or reverse osmosis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/12—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by hydrolysis, i.e. solvolysis in general
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43513—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
- C07K14/43518—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01F—CHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
- D01F1/00—General methods for the manufacture of artificial filaments or the like
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01F—CHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
- D01F4/00—Monocomponent artificial filaments or the like of proteins; Manufacture thereof
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Insects & Arthropods (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Hematology (AREA)
- Plant Pathology (AREA)
- Water Supply & Treatment (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Textile Engineering (AREA)
- Cell Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Manufacturing & Machinery (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
Abstract
요약서
염과 알코올 완충액을 이용하여 재조합 거미 실크 단백질의 용해화, 추출 및 단리를 개선시키는 방법들이 본원에 제공된다. 숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는 방법이 제공되는데, 이 방법은 다음을 포함한다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하며; 그리고 상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 이 용액 안에 상기 재조합 거미 실크 단백질이 용해화된다.
염과 알코올 완충액을 이용하여 재조합 거미 실크 단백질의 용해화, 추출 및 단리를 개선시키는 방법들이 본원에 제공된다. 숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는 방법이 제공되는데, 이 방법은 다음을 포함한다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하며; 그리고 상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 이 용액 안에 상기 재조합 거미 실크 단백질이 용해화된다.
Description
관련 출원에 대한 상호 참조
본 출원은 2019년 8월 22일자로 제출된 미국 가출원 번호 62/890,473를 우선권으로 주장하며, 이의 전문이 본 명세서의 참고자료에 편입된다.
서열 목록
본 출원은 EFS-Web을 통하여 제출된 서열 목록을 포함하며, 이의 전문이 본 명세서의 참고자료에 편입된다. 20XX년 XX월, 일자로 생성된 전술한 ASCII 사본은 XXXXXUS_sequencelisting.txt로 명명되며, 크기는 X,XXX,XXX 바이트이다.
배경
거미의 실크 폴리펩티드는 큰 (>150kDa, >1000개 아미노산) 폴리펩티드로써, 이는 다음의 3개 도메인으로 나뉜다: N-말단 비-반복성 도메인 (NTD), 반복 도메인 (REP), 그리고 C-말단 비-반복성 도메인 (CTD). NTD 및 CTD는 상대적으로 작고 (각각 ~150개의 아미노산, ~100개의 아미노산), 잘-연구되었으며, 폴리펩티드 수성 안정성, pH 민감성 및 응집 시 분자 정렬을 부여하는 것으로 간주된다. NTD는 강력하게 예측되는 분비 테그를 또한 보유하며, 이는 대개 이종성(heterologous) 발현 동안 제거된다. 상기 반복성 영역은 천연 폴리펩티드의 ~90%로 구성되며, 결정(crystalline) 영역과 무정형 영역으로 폴딩되는데, 차례로 실크 섬유에 강도 및 유연성을 부여한다.
재조합 거미 실크 폴리펩티드는 생산 및 정제 과정 동안 바람직하지 못한 불용성 응집체를 형성한다. 응집하여 β-쉬트 구조를 형성하는 이들의 능력으로 인하여, 실크 서열 기반의 단백질은 가용화하는 것이 어렵다. 이러한 단백질의 가용화는 생물학적 분자에 대한 가혹한 화학적 조건 (흔히 단백질을 분해하는)을 필요로 하며, 그 결과 수율이 낮고, 점착력(tenacity)이 낮고, 촉감이 좋지 않은 고체 또는 섬유가 만들어진다. 따라서, 실크 단백질의 용해도 및 회수를 증가시키는 이러한 폴리펩티드를 정제해내는 개선된 방법이 필요하다.
발명의 요약
숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는 방법이 본원에 제공되며, 이 방법은 다음을 포함한다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 재조합 거미 실크 단백질을 포함하고; 상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 해당 용액에서 상기 재조합 거미 실크 단백질이 용해화된다.
일부 구체예들에서, 상기 염은 칼슘 염을 포함한다. 일부 구체예들에서, 상기 칼슘 염은 염화칼슘, 질산칼슘, 티오시안산칼슘, 요오드화 칼슘, 또는 브롬화 칼슘 중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 칼슘 염은 염화 칼슘을 포함한다.
일부 구체예들에서, 상기 용액은 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함한다. 일부 구체예들에서, 상기 용액은 2M 염화 칼슘을 포함한다. 일부 구체예들에서, 상기 칼슘 염은 질산 칼슘을 포함한다.
일부 구체예들에서, 상기 염은 스트론튬 염 또는 바륨 염을 포함한다.
일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 또는 35% (w/v) 이다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 약 15% (w/v)이다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액 부피의 최대한 많아도 약 35% (w/v)이다.
일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X, 5X 또는 7X이다. 일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X이다. 일부 구체예들에서, 상기 불용성 부분에 대한 상기 용액 부피 비율은 약 7X이다.
일부 구체예들에서, 상기 알코올은 메탄올, 에탄올, 또는 이소프로판올중 적어도 하나를 포함한다. 일부 구체예들에서, 상기 알코올은 메탄올을 포함한다. 일부 구체예들에서, 상기 용액은 2M 염화 칼슘 및 메탄올을 포함한다.
일부 구체예들에서, 상기 불용성 부분은 20℃ ~ 70℃ 사이의 온도에서 상기 용액과 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 실온에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 약 35℃에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 약 55℃에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 70℃를 넘지 않는 온도에서 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 20℃ 보다 낮지 않은 온도에서 항온처리된다.
일부 구체예들에서, 상기 불용성 부분은 상기 용액에서 15 ~ 120 분 동안 항온처리된다. 일부 구체예들에서, 상기 불용성 부분은 상기 용액에서 30 분 동안 항온처리된다.
일부 구체예들에서, 상기 방법은 상기 알코올을 증발시키는 것을 더 포함한다.
일부 구체예들에서, 상기 불용성 부분은 세포 용해물 펠렛을 포함한다. 일부 구체예들에서, 상기 세포 배양물로부터 유래된 불용성 부분의 수집은 상기 숙주 세포의 용해를 포함한다. 일부 구체예들에서, 용해는 열처리, 화학적 처리, 전단 파괴, 물리적 균질화, 미세유동화, 초음파처리 또는 화학적 균질화를 포함한다.
일부 구체예들에서, 상기 세포 배양물에서 불용성 부분의 수집은 상기 용해된 세포를 원심분리시켜, 세포 용해물 펠렛을 수득하는 것을 더 포함한다.
일부 구체예들에서, 상기 방법은 상기 용액으로부터 불순물을 제거하는 것을 더 포함한다. 일부 구체예들에서, 불순물 제거는 수성을 추가하여 이들 불순물을 침전시키는 것을 포함한다. 일부 구체예들에서, 상기 수성 용액은 물을 포함한다.
일부 구체예들에서, 이들 불순물 제거는 여과, 원심분리, 중력 침전, 흡착, 투석 또는 상(phase) 분리를 포함한다. 일부 구체예들에서, 상기 여과는 한외여과, 정밀여과 또는 정용여과이다.
일부 구체예들에서, 상기 방법은 상기 용액으로부터 재조합 거미 실크 단백질을 단리시키고, 이로써 상기 용액으로부터 단리된 재조합 거미 실크 단백질을 만드는 것을 더 포함한다.
일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 ELISA를 이용하여 측정된다. 일부 구체예들에서, 단리된 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함한다.
일부 구체예들에서, 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 일부 구체예들에서, 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%이다.
일부 구체예들에서, 상기 재조합 거미 실크 단백질은 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질이다. 일부 구체예들에서, 상기 세포 배양물은 곰팡이 세포, 박테리아 세포 또는 효모 세포를 포함한다. 일부 구체예들에서, 상기 박테리아 세포는 대장균(Escherichia coli)이다. 일부 구체예들에서, 상기 방법은 실크 단백질 분말을 생산하기 위해, 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함한다.
또다른 측면에서, 숙주 세포로부터 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법이 본원에 제공된다: 숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고; 상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하고; 상기 숙주 세포의 불용성 부분을 2M 염화 칼슘과 메탄올을 포함하는 용액에 추가하고, 이로 인하여 이 용액에서 상기 재조합 거미 실크 단백질을 용해화시키고; 그리고 상기 용액으로부터 상기 재조합 거미 실크 단백질을 단리시키고, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성된다. 일부 구체예들에서, 상기 방법은 실크 단백질 분말을 생산하기 위해, 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함한다.
또다른 측면에서, 본원에 기술된 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 조성물이 본원에서 제공된다.
일부 구체예들에서, 상기 조성물은 재조합 거미 실크 단백질 분말을 포함한다. 일부 구체예들에서, 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 전장의 재조합 거미 실크를 포함한다.
또다른 측면에서, 본원에 기술된 방법에 의해 만들어진 재조합 거미 실크 단백질을 포함하는 고형 실크가 본원에서 제공된다.
도면의 몇 가지 관점에 대한 간략한 설명
본 발명의 이들 특징 및 다른 특징, 측면 및 이점은 다음의 설명 및 첨부 도면과 관련하여 더 잘 이해될 것이며: 여기에서:
도 1은 용해화 공정의 예시적인 순서도를 나타낸다.
도 2는 용해화 공정의 제 2 예시적인 순서도를 나타낸다.
도 3은 메탄올에서 칼슘 염으로 추출된 P0 거미 실크 단백질을 보여주는 면역블랏을 제공한다.
도 4는 35℃ 및 55℃에서 교반과 함께 항온처리 후, 용액내 P0 거미 실크 단백질의 그래프를 제공한다.
도 5A는 물 침전 후, P0 단백질 단편들을 제거한 후, P0 거미 실크 단백질의 SEC 피크 프로파일을 보여준다. 도 5B는 투석 및 동결건조후, SEC 피크 프로파일을 보여준다.
본 발명의 이들 특징 및 다른 특징, 측면 및 이점은 다음의 설명 및 첨부 도면과 관련하여 더 잘 이해될 것이며: 여기에서:
도 1은 용해화 공정의 예시적인 순서도를 나타낸다.
도 2는 용해화 공정의 제 2 예시적인 순서도를 나타낸다.
도 3은 메탄올에서 칼슘 염으로 추출된 P0 거미 실크 단백질을 보여주는 면역블랏을 제공한다.
도 4는 35℃ 및 55℃에서 교반과 함께 항온처리 후, 용액내 P0 거미 실크 단백질의 그래프를 제공한다.
도 5A는 물 침전 후, P0 단백질 단편들을 제거한 후, P0 거미 실크 단백질의 SEC 피크 프로파일을 보여준다. 도 5B는 투석 및 동결건조후, SEC 피크 프로파일을 보여준다.
상세한 설명
정의
청구범위 및 명세서에 사용된 용어는 달리 명시되지 않는 한, 다음과 같이 정의된다.
본 명세서에 달리 정의되지 않는 한, 본원에서 기술된 해당 방법 및 조성물과 관련하여 사용되는 과학 및 기술 용어들은 해당 분야의 숙련된 기술자들이 통상적으로 이해하는 의미를 가져야 한다. 더욱이, 내용에서 달리 필요하지 않는 한, 단수형 용어들은 복수형을 포함하며, 복수형 용어들은 단수형을 포함한다. 일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 폴리펩티드와 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.
본원에서 기술되는 방법 및 기술은 다른 언급이 없는 한, 일반적으로 당업계에 널리 공지된 통상적인 방법에 따라 실행되며, 그리고 본 명세서 전반에 걸쳐 인용되고 논의된 다양한 일반적이고 보다 구체적인 참고 문헌에 기재된 바와 같이 수행된다. 가령, Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989); Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates (1992, and Supplements to 2002); Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1990); Taylor and Drickamer, Introduction to Glycobiology, Oxford Univ. Press (2003); Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, N.J.; Handbook of Biochemistry: Section A Proteins, Vol I, CRC Press (1976); Handbook of Biochemistry: Section A Proteins, Vol II, CRC Press (1976); Essentials of Glycobiology, Cold Spring Harbor Laboratory Press (1999) 참고.
본 명세서에 언급된 모든 간행물, 특허 및 다른 참고문헌들은 그 전문이 본원의 참고문헌으로 편입된다.
달리 언급이 없는 한, 하기 용어들은 다음과 같은 의미를 가지는 것으로 이해되어야 한다:
"시험관내(in vitro)"라는 용어는 살아있는 유기체와는 분리되어 성장하는 세포, 예를 들어, 조직 배양에서 성장하는 세포에서 발생시키는 과정을 의미한다.
"생체내(in vivo)"라는 용어는 살아있는 유기체에서 일어나는 과정을 의미한다.
본원에 사용된 용어 "정화시키는(clarifying)"이란 숙주 세포 바이오매스, 예를 들어, 전체 세포, 용해된 세포, 막, 지질, 소기관, 핵, 비-거미 실크 단백질, 또는 임의의 기타 바람직하지 않은 세포 부분 또는 산물, 또는 세포 배양의 임의의 기타 바람직하지 않은 부분을 제거하는 방법을 지칭한다. 정화시키는다는 것은 부분적으로 정제된 또는 단리된 거미 실크 조성물로부터 불순물을 제거하는 것을 또한 지칭한다. 불순물에는 비-거미 실크 단백질, 분해된 거미 실크 단백질, 단백질의 큰 집합체, 정제 및 분리 과정에서 사용되는 화학 물질 또는 기타 바람직하지 않은 물질이 포함될 수 있지만 이에 국한되지 않는다.
본원에 사용된 용어 "순도"란 샘플, 가령, 추출된 샘플 안에 부분적 또는 분해 단리된 재조합 거미 실크 단백질, 지질, 단백질, 막 또는 기타 분자와 같은 모든 단리된 성분의 일부로서 전장 단리된 재조합 거미줄 단백질의 양을 지칭한다.
용어 "고형 실크" 또는 "재조합 고형 실크"란 단리된 재조합 거미 실크 조성물, 이를 테면, 섬유, 압출물, 분말, 또는 펠렛을 지칭한다. 압출물이란 압출된 재조합 거미 실크 조성물로써, 이것은 방적돌기(spinneret)를 통해 압출된 것이다.
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 길이가 최소한 10개 염기인 뉴클레오티드의 중합체 형태를 지칭한다. 상기 용어에는 DNA 분자 (예를 들어, cDNA 또는 게놈 또는 합성 DNA) 및 RNA 분자 (예를 들어, mRNA 또는 합성 RNA) 뿐만 아니라, 비-천연 뉴클레오티드 유사체, 비-고유 뉴클레오시드간 결합, 또는 둘 모두를 포함하는 DNA 또는 RNA의 유사체가 내포된다. 상기 핵산은 임의의 형상적(topological) 입체형태일 수 있다. 예를 들면, 상기 핵산은 단일-가닥, 이중-가닥, 삼중-가닥, 사중-가닥, 부분 이중-가닥, 분지형, 헤어핀, 원형 또는 자물쇠(padlocked) 입체형태일 수 있다.
달리 지시되지 않는 한, 및 일반적인 형식 "서열 식별 번호:~"로 본 명세서에 기재된 모든 서열에 대한 예로서, "서열 식별 번호: 1을 포함하는 핵산"은 최소한 일부가 (i) 서열 식별 번호: 1의 서열, 또는 (ii) 서열 식별 번호: 1에 상보적인 서열을 가짐을 지칭한다. 둘 중 선택은 내용에 따라 결정된다. 예를 들어, 핵산이 프로브로 사용되는 경우, 둘 중 하나의 선택은 프로브가 원하는 표적에 상보적이어야 한다는 요건에 따라 결정된다.
"단리된" RNA, DNA 또는 혼합 중합체는 자연발생적 숙주 세포에서 고유의 폴리뉴클레오티드를 자연적으로 동반하는 다른 세포 성분, 예를 들어, 자연적으로 결합된 리보솜, 중합 효소 및 게놈 서열로부터 실질적으로 분리된 것이다.
용어 "재조합(recombinant)"이란 (1) 자연 발생 환경으로부터 제거되어 있거나, (2) 당해 유전자가 자연에서 발견되는 이의 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되지 않은 폴리뉴클레오티드에 작동가능하게 연결되거나, 또는 (4) 실제로는 발생하지 않는 생물분자, 예를 들어, 유전자 또는 폴리펩티드를 의미한다. 용어 "재조합"이란 클로닝된 DNA 단리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종(heterologous) 시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체, 뿐만 아니라 이러한 핵산에 의해 인코드된 폴리펩티드 및/또는 mRNA와 관련하여 사용될 수 있다.
본원에 사용된 바와 같이, 이종 서열이 유기체 게놈 내 내인성 핵산 서열 (또는 이러한 서열의 인코드된 폴리펩티드 산물)에 인접하여 배치되어, 이러한 내인성 핵산 서열의 발현이 변형되는 경우, 이러한 내인성 핵산 서열은 "재조합"으로 간주된다. 이 문맥에서, 이종(heterologous) 서열은 이종 서열 자체가 내인성인지 (동일한 숙주 세포 또는 이의 자손에서 유래한 것인지) 또는 외인성인지 (다른 숙주 세포 또는 이의 자손에서 유래한 것인지)에 관계없이, 내인성 핵산 서열에 자연적으로 인접하지 않는 서열이다. 예를 들어, 프로모터 서열은 숙주 세포의 게놈 내 유전자의 고유 프로모터로 대체될 수 있고 (예를 들어, 상동성 재조합에 의해), 그 결과 이 유전자는 변경된 발현 패턴을 가진다. 이 유전자는 자연적으로 연접하는 서열들 중 최소한 일부로부터 분리되기 때문에, 이제부터는 "재조합" 상태가 될 것이다. 구체예에서, 이종성(heterologous) 핵산 분자는 해당 유기체에 내생적인 것이 아니다. 추가 구체예들에서, 이종성(heterologous) 핵산 분자는 플라스미드이거나, 또는 상동성 또는 무작위 통합에 의해 숙주 염색체로 통합된 분자다.
핵산은 게놈 내 상응하는 핵산에서 자연적으로 발생하지 않는 임의의 변형을 함유하는 경우, "재조합"으로 또한 간주된다. 예를 들어, 내인성 코딩 서열은, 예를 들어, 인간의 개입에 의해 인공적으로 도입된 삽입, 결실 또는 점 돌연변이를 함유하는 경우, "재조합"으로 간주된다. "재조합 핵산"은 이종성 (heterologous) 부위에서 숙주 세포 염색체에 통합된 핵산 및 에피좀으로 존재하는 핵산 구조체가 또한 내포된다.
핵산 서열과 관련하여 용어 "서열 동일성 퍼센트"란 최대 상응을 위해 정렬될 때 동일한 두 개의 서열 내 잔기들 배열의 정량적 값을 지칭한다. 서열 동일성 비교의 길이는 약 9개 이상의 뉴클레오티드, 일반적으로 약 20개 이상의 뉴클레오티드, 보다 일반적으로 약 24개 이상의 뉴클레오티드, 전형적으로 약 28개 이상의 뉴클레오티드, 보다 전형적으로 약 32개 이상의 뉴클레오티드, 그리고 바람직하게는 약 36개 이상의 뉴클레오티드의 스트레치에 걸친 것일 수 있다. 뉴클레오티드 서열 동일성을 측정하는데 사용될 수 있는 해당 분야에 공지된 다수의 상이한 알고리즘이 존재한다. 예를 들어, 폴리뉴클레오티드 서열은 Wisconsin Package Version 10.0, Genetics Computer Group (GCG), Madison, Wis의 프로그램인 FASTA, Gap 또는 Bestfit을 사용하여 비교될 수 있다. FASTA는 문제(query) 서열과 검색 서열간의 가장 잘 겹쳐지는 영역의 정렬 및 서열 동일성 백분율을 제공한다. Pearson, Methods Enzymol. 183:63-98 (1990) (본 명세서에 그 전문이 참고문헌으로 포함됨). 예를 들어, 핵산 서열들 사이의 서열 동일성 퍼센트는 기본 파라미터 (점수화 행렬에 대한 NOPAM 인자 및 워드 크기 6)의 FASTA를 사용하거나 본 명세서에 참고로 포함된 GCG 버전 6.1에 제공된 바와 같은 기본 파라미터를 가지는 갭을 사용하여 결정될 수 있다. 대안적으로, 서열들은 컴퓨터 프로그램, BLAST를 사용하여 비교될 수 있다 (Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet. 3:266-272 (1993); Madden et al., Meth. Enzymol. 266:131-141 (1996); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997); Zhang and Madden, Genome Res. 7:649-656 (1997)), 특히 blastp 또는 tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).
핵산 또는 이의 단편을 지칭할 때, 용어 "실질적 상동성" 또는 "실질적 유사성"은, 상기 논의한 FASTA, BLAST 또는 Gap과 같은 임의의 공지된 서열 동일성 알고리즘으로 측정시, 적절한 뉴클레오티드 삽입 또는 결실과 함께 또다른 핵산 (또는 이의 상보적 가닥)과 최적으로 정렬될 경우, 최소한 약 76%, 80%, 85%, 바람직하게는 최소한 약 90%, 그리고 더욱 바람직하게는 최소한 약 95%, 96%, 97%, 98% 또는 99%의 뉴클레오티드 염기에서 뉴클레오티드 서열 동일성이 존재함을 의미한다.
핵산 (폴리뉴클레오티드로도 지칭됨)은 RNA, cDNA, 게놈 DNA, 및 상기의 합성 형태 및 혼합 중합체의 센스 및 안티센스 가닥 둘 모두를 포함할 수 있다. 이들은 화학적으로 또는 생화학적으로 변형될 수 있거나, 비-천연 또는 유도체화된 뉴클레오티드 염기를 함유할 수 있으며, 이를 해당 분야의 숙련된 기술자는 쉽게 이해할 것이다. 이러한 변형들에는, 예를 들면, 표지화, 메틸화, 하나 이상의 자연 발생 뉴클레오티드의 유사체로의 치환, 뉴클레오티드간 변형, 가령, 비하전된 링키지 (예컨대, 메틸 포스포네이트, 포스포트라이에스터, 포스포라미데이트, 카바메이트, 등), 하전된 링키지 (예컨대, 포스포로티오에이트, 포스포로디티오에이트, 등), 부속 모이어티 (예컨대, 폴리펩티드), 층간삽입물 (예컨대, 아크리딘, 소랄렌, 등), 킬레이터, 알킬레이터, 및 변형된 링키지 (예컨대, 알파 아노머 핵산 등)가 포함된다. 또한 수소 결합 및 다른 화학적 상호 작용을 통해 지정된 서열에 결합하는 능력에서 폴리뉴클레오티드를 모방하는 합성 분자가 포함된다. 이러한 분자는 해당 분야에 공지되어 있으며, 예를 들어, 펩티드 링키지가 분자의 골격에서 포스페이트 링키지를 대체하는 분자들을 포함한다. 다른 변형은, 예를 들어, 리보스 고리가 가교 모이어티 또는 다른 구조, 가령, "잠금" 핵산에서 발견되는 변형을 함유하는 유사체를 포함할 수 있다.
핵산 서열에 적용될 때, 용어 "돌연변이된"이란 핵산 서열의 뉴클레오티드가 참조 핵산 서열과 비교하여 삽입, 결실 또는 변경될 수 있음을 의미한다. 유전자좌에서 단일 변경(점 돌연변이)이 이루어질 수 있거나, 또는 단일 유전자좌에서 다수의 뉴클레오티드가 삽입, 결실 또는 변경될 수 있다. 또한, 핵산 서열 내의 임의의 수의 유전자좌에서 하나 이상의 변형이 이루어질 수 있다. 핵산 서열은 "에러-유발 PCR" (DNA 중합효소의 복제 충실도가 낮은 조건 하에서 PCR을 수행하기 위한 공정, 그 결과 PCR 생성물의 전체 길이를 따라 높은 비율의 점 돌연변이가 수득됨; 예를 들어, Leung et al., Technique, 1: 11-15 (1989) 및 Caldwell and Joyce, PCR Methods Applic. 2: 28-33 참조 (1992)); 그리고 "올리고뉴클레오티드-지정 돌연변이유발" (관심있는 임의의 클로닝된 DNA 단편에서 부위-특이적 돌연변이의 생성을 가능하게 하는 과정; 예를 들어, Reidhaar-Olson and Sauer, Science 241: 53-57 (1988) 참조)와 같은 돌연변이유발 기술을 포함한 (그러나 이에 제한되는 것은 아님) 해당 분야에 공지된 임의의 방법에 의해 돌연변이될 수 있다.
본 명세서에서 사용되는 용어 "벡터"는 그것이 연결되어 있는 또다른 핵산을 전달할 수 있는 핵산 분자를 지칭하고자 한다. 벡터의 한 유형은 "플라스미드"로서, 이는 일반적으로 추가 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프를 지칭하지만, 또한 선형 이중 가닥 분자, 가령, 중합효소 연쇄 반응 (PCR)에 의한 증폭으로 생성된 것, 또는 제한 효소를 이용하여 원형 플라스미드를 처리함으로써 생성된 것들 또한 내포된다. 다른 벡터에는 코스미드, 박테리아 인공 염색체 (BAC) 및 효모 인공 염색체 (YAC)가 내포된다. 다른 유형의 벡터는 바이러스성 벡터이며, 여기서 추가적인 DNA 분절은 바이러스 게놈에 결찰될 수 있다 (하기에서 더 상세히 논의됨). 특정 벡터는 이들이 도입되는 숙주 세포 (예를 들어, 숙주 세포에서 기능하는 복제 원점을 가지는 벡터)에서 자율 복제 가능하다. 다른 벡터는 숙주 세포로 도입될 때 숙주 세포의 게놈에 통합될 수 있으며, 이로써 숙주 게놈과 함께 복제된다. 또한, 특정 바람직한 벡터는 이들이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터를 본 명세서에서 "재조합 발현 벡터" (또는 간단히 "발현 벡터")라고 지칭한다.
본원에 사용된 용어 "발현 시스템"에는 숙주 세포에서 유전자의 발현을 위한 비히클 또는 벡터, 뿐만 아니라 숙주 염색체 내로 유전자의 안정적인 통합을 초래하는 비히클 또는 벡터가 내포된다.
"작동적으로 연결된" 또는 "작동가능하게 연결된" 발현 조절 서열은 발현 조절 서열이 관심 유전자와 인접해 있어 관심 유전자를 제어하는 링키지, 뿐만 아니라 트랜스(trans)로 작용하거나, 또는 일정 거리에서 작용하여 관심 유전자를 조절하는 발현 조절 서열을 지칭한다.
용어 "발현 조절 서열"이란 작동적으로 연결된 코딩 서열들의 발현에 영향을 주는데 필요한 폴리뉴클레오티드 서열을 지칭한다. 발현 조절 서열은 핵산 서열들의 전사, 전사후 사건 및 해독을 제어하는 서열이다. 발현 조절 서열은 적절한 전사 개시, 종결, 프로모터 및 인핸서 서열; 스플라이싱 및 폴리아데닐화 신호와 같은 효율적인 RNA 처리 신호; 세포질 mRNA를 안정화시키는 서열; 해독 효율을 향상시키는 서열 (예를 들어, 리보솜 결합 부위); 폴리펩티드 안정성을 향상시키는 서열; 및 필요한 경우, 폴리펩티드 분비를 향상시키는 서열을 포함한다. 이러한 조절 서열의 성질은 숙주 유기체에 따라 상이한데; 원핵 생물에서, 이러한 조절 서열은 일반적으로 프로모터, 리보솜 결합 부위 및 전사 종결 서열을 포함한다. "조절 서열"이라는 용어는, 최소한, 그 존재가 발현에 필수적인 모든 성분을 포함하며, 그 존재가 유리한 추가 성분, 예를 들어, 리더 서열 및 융합 파트너 서열을 포함할 수 있는 것으로 한다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 RNA 중합효소가 유전자 전사를 개시하기 위해 결합하는 DNA 영역으로서, mRNA 전사 개시 부위의 5' 방향에 위치하는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "재조합 숙주 세포" (또는 간단히 "숙주 세포")는 재조합 벡터가 도입된 세포를 지칭하는 것으로 한다. 이러한 용어는 특정 대상 세포 뿐만 아니라 그러한 세포의 자손을 의미하는 것으로 이해되어야 한다. 돌연변이 또는 환경적 영향으로 인해 특정 변형이 후속 세대에서 발생할 수 있기 때문에, 이러한 자손은 실제로 모 세포와 동일하지 않을 수 있지만, 본원에 사용된 용어 "숙주 세포"의 범위 내에 여전히 내포된다. 재조합 숙주 세포는 배양하여 성장된 분리된 세포 또는 세포주일 수 있거나 또는 살아있는 조직 또는 유기체에 존재하는 세포일 수 있다.
용어 "폴리펩티드"는 자연-발생 단백질과 비-자연 발생 단백질 모두, 그리고 이의 단편, 돌연변이체, 유도체 및 유사체를 포괄한다. 폴리펩티드는 단량체 또는 중합체일 수 있다. 더욱이, 폴리펩티드는 다수의 상이한 도메인을 포함할 수 있는데, 도메인 각각은 하나 또는 그이상의 별개의 활성을 갖는다.
본원에 사용된 바와 같이, 용어 "분자"는 소분자, 펩티드, 폴리펩티드, 당, 뉴클레오티드, 핵산, 폴리뉴클레오티드, 지질 등을 포함하나, 이에 국한되지 않는 임의의 화합물을 의미하고, 이러한 화합물은 천연 화합물이거나 또는 합성 화합물일 수 있다.
본 명세서에 사용된 바와 같이, 용어 "블록(block)" 또는 "반복 단위"는 천연 실크 폴리펩티드 서열에서 반복적으로 발견되고, 기본 반복 실크 폴리펩타이드 서열의 단위로 삼게 되는, 적당한 변형(있을 수 있음)을 갖는, 발견되는 천연 실크 폴리펩티드의 대략 12개 아미노산보다 큰 부분서열을 의미한다. 블록에는 매우 짧은 "모티프"가 내포될 수 있지만, 반드시 그런 것은 아니다. 본원에 사용된 바와 같이, "모티프"는 다중 블록으로 나타나는 대략 2-10개의 아미노산 서열을 의미한다. 예를 들면, 모티프는 아미노산 서열 GGA, GPG, 또는 AAAAA로 구성될 수 있다. 다수 블록의 서열은 "블록 공-중합체"이다.
본원에 사용된 바와 같이, 용어 "반복 도메인"이란 실크 폴리펩티드에서 연속성 (공지의 실크 스페이서 요소를 제외하고, 실질적인 비-반복성 도메인에 의해 중단되지 않은) 반복성 세그먼트 세트로부터 선택된 서열을 지칭한다. 고유 실크 서열은 일반적으로 하나의 반복 도메인을 함유한다. 일부 구체예들에서, 실크 분자 당 하나의 반복 도메인이 있다. 본원에 사용된 것과 같이, "매크로-반복"이란 하나 이상의 블록을 포함하는 자연 발생적 반복 아미노산 서열이다. 구체예에서, 매크로-반복은 반복 도메인에서 적어도 2회 반복된다. 추가 구체예에서, 두 번의 반복은 불완전하다. 본원에 사용된 바와 같이, "유사(quasi)-반복"이란 블록이 유사하지만, 아미노산 서열이 동일하지 않도록 하나 이상의 블록을 포함하는 아미노산 서열이다.
본원에 사용된 바와 같이, "반복 서열" 또는 "R"은 반복성 아미노산 서열을 지칭한다. 구체예에서, 반복 서열에는 매크로-반복 또는 매크로-반복의 단편들이 내포된다. 또다른 구체예에서, 반복 서열에는 블록이 내포된다. 추가 구체예에서, 단일 블록은 두개 반복 서열 사이에서 나뉜다.
"약(about)"이라는 용어는 지정 값 및 그 값의 위와 아래 범위를 포괄하는 것을 나타낸다. 특정 구체예들에서, 용어 "약(about)"은 지정 값 ± 10%, ± 5%, 또는 ± 1%을 나타낸다. 특정 구체예들에서, 적용가능할 경우, 용어 "약"이란 지정 값(들) ± 이 값(들)의 하나의 표준 편차를 나타낸다.
본 명세서 및 첨부된 청구범위에서 사용되는, 단수형 "하나" 및 "그것"은 문맥에서 달리 명확히 언급이 없는 한, 복수형을 포함함을 유념하여야 한다.
본원에 언급된 범위는 언급된 종점을 포함하는 범위 내의 모든 값에 대한 축약 형으로 이해된다. 예를 들면, 1 ~ 50의 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 및 50으로 구성된 군의 임의의 수의 조합 또는 이의 하위-범위가 내포되는 것으로 이해되어야 한다. 또한, 2-5%의 범위에는 2%와 5%, 그리고 그 사이에 있는 숫자 또는 분수가 내포되는데, 예를 들면 다음과 같다: 2.25%, 2.5%, 2.75%, 3%, 3.25%, 3.5%, 3.75%, 4%, 4.25%, 4.5%, 및 4.75%.
재조합 단백질을 용해화시키는 방법
세포 배양물에서 발현된 재조합 거미 실크 단백질은 이들 세포 성분으로부터 정제된 정제되어야 한다. 일부 경우들에서, 상기 실크 단백질은 불용성 세포 찌꺼리 안에 포집되거나, 또는 불용성 실크 단백질 응집체를 형성한다. 불용성 실크 단백질은 정제하기 어렵고, 재조합 실크 단백질 회수가 줄어들게 된다. 이러한 경우들에서, 상기 불용성 세포 찌꺼기 또는 응집체에 다양한 방법을 적용시켜 이 실크 단백질을 방출시키고, 정제를 위해 이를 용해화하여, 이로써 상기 재조합 실크 단백질의 회수가 증가된다.
용해화 과정
재조합 거미 실크 단백질을 용해화시켜, 숙주 세포로부터 이러한 단백질의 추출 및 정제가 개선되게 하는 방법들이 본원에서 기술된다. 일부 경우들에서, 상기 재조합 거미 실크 단백질은 결정질 실크 단백질이다. 결정질 실크 단백질은 비-결정질 실크 단백질보다 용액에서 용해도가 더 낮다.
예시적인 용해화 과정 및 정제 과정은 도 1에 나타낸다. 선택적 순서 단계들은 점선으로 표시된다. 우선, 실크 단백질은 형질전환된 숙주 세포에서 발현된다. 그 다음, 상기 숙주 세포들을 균질화시키고, 실크 단백질이 내포된 불용성 세포 물질이 원심분리를 통하여 펠렛화되며, 상청액을 버리고, 그리고 상기 불용성 물질은 염 및 알코올을 포함하는 용액에서 재현탁된다. 한 실시예에서, 상기 염은 염화 칼슘이고, 상기 알코올은 메탄올이다. 대안으로, 상기 숙주 세포를 직접적으로 염/알코올 용액에 추가하여, 세포를 용해시키고, 해당 실크 단백질을 방출시킬 수 있다. 상기 실크 단백질은 염/알코올 용액에서 항온처리되어, 해당 단백질의 용해화가 증가되며, 남아있는 불용성 물질은 원심분리를 통하여 다시 펠렛화된다. 이 시점에서, 가용성 실크 단백질을 갖는 상청액이 남아있게 되고, 비-실크 단백질 불순물을 제거하기 위한 추가 단계들을 거치게 된다. 일부 경우들에서, 상기 비-실크 단백질 불순물을 침전시키기 위해 물의 추가가 이용된다. 상기 침전된 불순물은 다시 원심분리를 통하여 제거될 수 있고, 폐기될 수 있다. 가용성 실크 단백질을 갖는 알코올 상청액이 남아있고, 상기 알코올은 증발된다. 상기 추출된 실크 단백질 상에서 추가 정제가 실시될 수 있는데, 이를 테면, 여과 또는 투석이 실시될 수 있고, 그 다음 건조시켜 분말을 만든다. 이 용해화 과정에는 용해화된 실크 단백질이 있는 상청액에 알코올이 포함되어 있기 때문에, 방폭형 원심분리기(explosion-proof centrifuge)가 필요하다.
제 2의 예시적인 용해화 과정 및 정제 과정은 도 2에 나타낸다. 선택적 순서 단계들은 점선으로 표시된다. 이 실시예에서, 상기 숙주 세포의 초기 생산 및 용해는 앞선 예시적인 용해화 공정의 것과 동일하다. 상기 실크 단백질은 숙주 세포에서 발현되고, 용해되고, 실크 단백질을 갖는 불용성 부분을 펠렛화시키고, 그 다음 염과 알코올을 포함하는 용액에 재현탁된다. 이 시점에서, 용해화안된 세포 물질은 원심분리가 아닌, 중력을 통하여 침강되도록 한다. 가용성 실크 단백질을 갖는 알코올 상청액을 수집하고, 상기 알코올은 증발된다.. 상기 가용성 실크 단백질을 갖는 상청액은 비-실크 단백질 불순물을 제거하기 위한 추가 단계들을 거치게 된다. 일부 경우들에서, 상기 비-실크 단백질 불순물을 침전시키기 위해 물의 추가가 이용된다. 상기 침전된 불순물은 다시 원심분리를 통하여 제거될 수 있고, 폐기될 수 있다. 상기 추출된 실크 단백질 상에서 추가 정제가 실시될 수 있는데, 이를 테면, 여과 또는 투석이 실시될 수 있고, 그 다음 건조시켜 분말을 만든다. 이 용해화 공정은 방폭형 원심분리기를 필요로 하지 않는다.
일부 구체예들에서, "가용성" 또는 "용해화된"이란 용액 안에 용해된 거미 실크 단백질의 부분을 지칭한다. 일부 구체예들에서, "용해화"란 용액 안에 용해된 거미 실크 단백질의 부분이 용해된 공정을 지칭한다.
일부 구체예들에서, 용해된 거미 실크 단백질의 부분은 전체 거미 실크의 약 1-100% w/w, 1-10% w/w, 1-5% w/w, 5-10% w/w, 10-15% w/w, 15-20% w/w, 20-25% w/w, 25-30% w/w, 30-35% w/w, 35-40% w/w, 40-45% w/w, 45-50% w/w, 50-55% w/w, 55-60% w/w, 60-65% w/w, 65-70% w/w, 70-75% w/w, 75-80% w/w, 80-85% w/w, 85-90% w/w, 90-95% w/w, 또는 95-100% w/w이다. 일부 구체예들에서, 용해된 거미 실크 단백질의 부분은 전체 거미 실크의 적어도 약 1% w/w, 5% w/w, 10% w/w, 15% w/w, 20, 25% w/w, 30% w/w, 35% w/w, 40% w/w, 45% w/w, 50% w/w, 55% w/w, 60% w/w, 65% w/w, 70% w/w, 75% w/w, 80% w/w, 85% w/w, 90% w/w, 95% w/w, 99% w/w, 또는 100% w/w이다. 일부 구체예들에서, 불용성이란 용액 안에 용해되지 않은 거미 실크 단백질의 부분을 지칭한다. 일부 구체예들에서, 불용성 거미 실크 단백질의 부분은 전체 거미 실크의 약 1-100% w/w, 1-10% w/w, 1-5% w/w, 5-10% w/w, 10-15% w/w, 15-20% w/w, 20-25% w/w, 25-30% w/w, 30-35% w/w, 35-40% w/w, 40-45% w/w, 45-50% w/w, 50-55% w/w, 55-60% w/w, 60-65% w/w, 65-70% w/w, 70-75% w/w, 75-80% w/w, 80-85% w/w, 85-90% w/w, 90-95% w/w, 또는 95-100% w/w이다.
염
일부 구체예들에서, 염을 상기 불용성 세포 부분, 펠렛, 또는 용해물에 추가하여, 상기 재조합 거미 실크 단백질을 용해시킨다. 적절한 염에는 칼슘 이온, 스트론튬 이온, 바륨 이온, 마그네슘 이온, 리튬 이온, 나트륨 이온, 칼륨 이온 또는 암모늄 이온과의 염이 내포되지만, 이에 국한되지는 않는다. 이러한 염에는 다음이 내포되나, 이에 국한되지 않는다: 염화칼슘, 질산칼슘, 티오시안산칼슘, 탄산칼슘, 불화칼슘, 요오드화칼슘, 옥살산칼슘, 인산칼슘, 황산칼슘, 브롬화칼슘, 브롬화스트론튬, 탄산스트론튬, 염화스트론, 불화스트론튬, 요오드화스트론튬, 질산스트론튬, 염화바륨, 브롬화바륨, 요오드화바륨, 아세트산바륨, 시안화바륨, 질산바륨, 황산바륨, 탄산바륨, 황화바륨, 불화바륨, 망간산바륨, 인산바륨, 탄산바륨, 질산나트륨, 염화나트륨, 브롬화나트륨, 요오드화나트륨, 나트륨 불화물, 질산칼륨, 염화칼륨, 브롬화칼륨, 불화칼륨, 요오드화칼륨, 또는 이들의 임의의 조합. 일부 구체예들에서, 염은 염화칼슘, 브롬화칼슘, 요오드화칼슘, 염화스트론튬, 브롬화스트론튬, 요오드화스트론튬, 염화바륨, 브롬화바륨, 요오드화바륨, 또는 이들의 임의의 조합이다. 일부 구체예들에서, 상기 염은 칼슘 염이다. 일부 구체예들에서, 상기 염은 염화 칼슘이다. 일부 구체예들에서, 상기 염은 요오드화 칼슘이다. 일부 구체예들에서, 상기 염은 브롬화 칼슘이다. 일부 구체예들에서, 상기 염은 질산 칼슘이다. 일부 구체예들에서, 상기 염은 티오시안산칼슘이다. 일부 구체예들에서, 상기 염은 스트론튬 염이다. 일부 구체예들에서, 상기 염은 염화스트론튬, 요오드화 스트론튬, 또는 브롬화스트론튬이다. 일부 구체예들에서, 상기 염은 바륨 염이다. 일부 구체예들에서, 상기 염은 염화바륨, 요오드화바륨, 또는 브롬화바륨이다.
알코올
일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물을 알코올을 포함하는 용액에 추가하여, 상기 재조합 거미 실크 단백질을 용해화시킨다. 메탄올, 에탄올, 이소프로판올, 이소프로필 알코올, n-프로필 알코올, 부탄올, 펜탄올, 또는 이들의 임의의 유도체, 또는 이들의 임의의 조합을 포함하나 이에 제한되지 않는 당업계에 공지된 임의의 적절한 알코올이 사용될 수 있다. 일차, 이차, 또는 삼차 알코올이 이용될 수 있다. 예시적인 일차 알코올에는 에탄올과 메탄올이 내포된다. 예시적인 이차 알코올에는 이소프로필 알코올과 n-프로필 알코올이 내포된다. 예시적인 삼차 알코올에는 tert-부탄올이 내포된다. 일부 구체예들에서, 상기 알코올은 메탄올이다. 일부 구체예들에서, 상기 알코올은 에탄올이다. 일부 구체예들에서, 상기 알코올은 이소프로판올이다.
완충 조건
염 및 산 용액에 재현탁된 불용성 세포 부분의 양은 부피 대 질량 비율로 또한 설명될 수 있다. 예시적인 부피 대 질량비는 3X, 예를 들어, 용액 300ml 및 세포 덩어리 (mass) 100g이다. 일부 구체예들에서, 상기 불용성 세포 부분 덩어리와 염 및 알코올 용액 부피 비율은 1-10X 덩어리 대 부피, 1-2X 덩어리 대 부피, 1-3X 덩어리 대 부피, 3-5X 덩어리 대 부피, 5-7X 덩어리 대 부피, 6-8X 덩어리 대 부피, 또는 8-10X 덩어리 대 부피일 수 있다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 1X, 2X, 3X, 4X, 5X, 6X, 7X, 8X, 9X, 또는 10X일 수 있다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 3X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 최대한 많아도 3X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 5X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 7X이다. 일부 구체예들에서, 상기 세포 덩어리 대 염 및 알코올 용액 부피 비율은 적어도 9X이다.
상기 세포 덩어리의 불용성 부분은 염 및 알코올 용액에 재현탁된다. 최종 재현탁액에서 세포 덩어리의 양은 용액 부피에 대한 세포 덩어리의 백분율 (부피 백분율로 중량)로 기술될 수 있다. 용액 부피에 대한 세포 덩어리의 부피 중량 백분율의 예시는 100%, 예를 들어, 100mg 세포 덩어리와 100ml 용액이다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량은 1-100%, 1-5%, 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 90-95%, 또는 95-100% w/v일 수 있다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 적어도 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 100% w/v이다.
일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 약 15% (w/v)이다. 일부 구체예들에서, 상기 불용성 부분 세포 덩어리와 염 및 알코올 용액의 부피 중량비는 최대한 많아도 35% (w/v)이다.
일부 구체예들에서, 상기 염 및 알코올 용액 그리고 상기 불용성 세포 부분, 펠렛, 또는 용해물을 포함하는 용액에서 염의 농도는 0.01-10 M, 0.01-0.1 M, 0.1-0.5 M, 0.5-1 M, 1-2 M, 2-3 M, 3-4 M, 4-5 M, 5-6 M, 6-7 M, 7-8 M, 8-9 M, 또는 9-10 M일 수 있다. 일부 구체예들에서, 염 및 알코올 용액 그리고 세포 용해물 또는 펠렛을 포함하는 용액에서 상기 염의 농도는 적어도 약 0.1 M, 0.15 M, 0.2 M, 0.25 M, 0.3 M, 0.35 M, 0.4 M, 0.45 M, 0.5 M, 0.55 M, 0.6 M, 0.65 M, 0.7 M, 0.75 M, 0.8 M, 0.85 M, 0.9 M, 0.95 M, 1 M, 1.5 M, 2 M, 2.5 M, 3 M, 3.5 M, 4 M, 4.5 M, 5 M, 5.5 M, 6 M, 6.5 M, 7 M, 7.5 M, 8 M, 8.5 M, 9 M, 9.5 M, 또는 10 M일 수 있다. 일부 구체예들에서, 상기 용액에서 염의 농도는 1M, 1,5M, 2M, 2.5M 또는 3M이다. 일부 구체예들에서, 상기 용액에서 염의 농도는 2M이다.
전단 보호제, 점도 조절제 및/또는 소포 구조적 속성들에 영향을 미치는 용질과 같은 추가 완충제 변형도 사용할 수 있다. 균질화 또는 미세유동화의 효율을 개선하기 위해, 부형제, 이를 테면, 막 연화제 및 분자 크라우딩제(molecular crowding agent)가 또한 첨가될 수 있다. 완충액에 대한 기타 변형에는 특정 pH 범위 및/또는 다중 농도의 염, 유기 용매, 소분자, 세제, 양쪽성 이온, 아미노산, 중합체 및/또는 상기 것들중 임의의 조합의 다중 농도가 내포될 수 있다.
항온처리 시간 및 온도
일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 정해진 시간 동안 상기 염과 알코올을 포함하는 용액과 함께 항온처리된다. 상기 세포 펠렛 또는 용해물과 상기 용액의 항온처리 시간의 양은 거미 실크 단백질의 용해화를 증가시키기 위해, 또는 이 단백질의 임의의 가능한 분해를 감소시키기 위해 변경될 수 있다. 상기 항온처리 시간은 1 분에서 3 시간 (180 분) 이상, 1 분 내지 60 분, 3 분 내지 90 분, 60 분 내지 120 분, 90 분 내지 150 분, 또는 120 분 내지 180 분일 수 있다. 상기 항온처리 시간은 적어도 1 분, 5 분, 10 분, 15 분, 20 분, 30 분, 45 분, 60 분, 75 분, 90 분, 105 분, 120 분, 135 분, 150 분, 165 분, 180 분, 또는 그 이상일 수 있다. 일부 구체예들에서, 상기 항온처리 시간은 15 분이다. 일부 구체예들에서, 상기 항온처리 시간은 30 분이다. 일부 구체예들에서, 상기 항온처리 시간은 60 분이다. 일부 구체예들에서, 상기 항온처리 시간은 75 분이다. 일부 구체예들에서, 상기 항온처리 시간은 90 분이다. 일부 구체예들에서, 상기 항온처리 시간은 105 분이다. 일부 구체예들에서, 상기 항온처리 시간은 120 분이다.
상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 10-70℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 10-20℃, 20-30℃, 20-22℃, 20-25℃, 25-20℃, 30-40℃, 30-35℃, 35-40℃, 40-55℃, 50-55℃, 55-60℃, 또는 60-70℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 20-30℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 22℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 35℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 55℃에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 70℃를 넘지 않은 온도에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 20℃보다 낮지 않은 온도에서 항온처리될 수 있다. 일부 구체예들에서, 상기 불용성 세포 부분, 펠렛, 또는 용해물은 상기 용액과 함께 실온에서 항온처리될 수 있다.
일부 구체예들에서, 상기 재조합 거미 실크 단백질은 숙주 세포의 세포질에서 발현된다. 이 단백질을 단리하기 위해 상기 숙주 세포를 용해시켜 상기 재조합 거미 실크 단백질을 방출시켜야 한다. 상기 숙주 세포를 용해시키기 위한 임의의 적절한 방법이 이용될 수 있는데, 이 방법에는 열 처리, 화학적 처리, 전단 파괴, 물리적 균질화, 초음파처리, 또는 화학적 균질화가 내포되나, 이에 국한되지 않는다. 화학적 처리에는 원핵 및 진핵 세포의 원형질막을 파괴하는 것으로 알려진 화학 물질 또는 효소, 이를 테면, Triton X-100, Nonidet P-40, CHAPS, 나트륨 도데실 설페이트 (SDS) 또는 기타 적절한 세제와 함께 세포를 항온처리하는 것이 내포된다.
상기 재조합 거미 실크 단백질을 포함하는 불용성 부분은 상기 세포 용해물을 원심분리시키고, 이 세포 용해물에서 상기 재조합 거미 실크 단백질을 비롯한 불용성 물질의 펠렛이 형성됨으로써, 수집될 수 있다. 불용성 재조합 단백질을 펠릿화하는 원심력 또는 속도는 당업자에 의해 결정될 수 있다. 일부 구체예들에서, 상기 원심분리기 속도는 100-10,000 x g이다. 일부 구체예들에서, 상기 원심분리력은 100 x g, 200 x g, 300 x g, 400 x g, 500 x g, 600 x g, 700 x g, 800 x g, 900 x g, 1000 x g, 2000 x g, 3000 x g, 4000 x g, 5000 x g, 6000 x g, 7000 x g, 8000 x g, 9000 x g, 또는 10,000 x g이다. 대안으로, 상기 재조합 거미 실크 단백질을 포함하는 불용성 부분은 침강에 의해 수집될 수 있다.
불순물 제거
일부 구체예들에서, 용해화된 거미 실크 단백질을 포함하는 용액으로부터 비-거미 실크 단백질의 생물학적 또는 화학적 불순물이 제거될 수 있다. 이 용액에서 불순물을 제거하는 것은 여과, 흡수 (가령, 목탄 또는 고체 상태 흡수), 투석 및 코아세르베이션 또는 다양한 화학 물질의 사용에 의해 유도된 상 분리에 의해 수행될 수 있다. 다른 구체예들에서, 상(phase) 분리는 코스모트로프(cosmotrope) 및/또는 용액으로부터 단백질을 침전시키는 데 사용되는 화합물을 첨가함으로써, 화학적으로 유도될 수 있다.
일부 구체예들에서, 불순물은 여과, 정밀여과, 정용여과 및/또는 한외여과 (가령, 탈이온수에 대항하여)를 사용하여 제거된다. 정밀여과에 적합한 막에는 0.1 uM 내지 1 uM가 내포될 수 있다. 한외여과에 적합한 막의 비-제한적 예로는 50 kDa ~ 800 kDa, 100 kDa ~ 800 kDa, 200 kDa ~ 800 kDa, 300 kDa ~ 800 kDa, 400 kDa ~ 800 kDa, 500 kDa ~ 800 kDa, 600 kDa ~ 800 kDa, 700 kDa ~ 800 kDa, 100 kDa ~ 700 kDa, 200 kDa ~ 700 kDa, 300 kDa ~ 700 kDa, 400 kDa ~ 700 kDa, 500 kDa ~ 700 kDa, 600 kDa ~ 700 kDa, 또는 500 kDa ~ 600 kDa의 분자량 컷-오프를 갖는 소수성 막(가령, PES, PS, 셀룰로오스 아세테이트)이 내포된다. 일부 구체예들에서, 한외여과에 의해 농축물(retentate)로서 물 안에 재조합 단백질 슬러리, 그리고 불순물을 포함하는 투과물(permeate)이 생성된다. 한외여과에 적합한 조건 (예를 들어, 막, 온도, 부피 대체)은 투과물 밀도를 최대화하도록 맞춰진 당업계에 공지된 방법을 사용하여 결정할 수 있다. 일부 구체예들에서, 한외여과로 1g/mL ~ 30g/mL 사이의 밀도를 갖는 농축물이 제공된다. 일부 구체예들에서, 한외여과는 농축된 잔류물을 생성하는 농축 단계, 이어서 불순물을 제거하고 물에 현탁된 단백질 슬러리를 생성하는 정용여과 단계를 포함한다. 일부 이러한 구체예들에서, 상기 농축된 농축물은 출발 부피에 대해 2-배 ~ 12-배 부피 양으로 감소되는 농축 비율을 갖는다. 일부 구체예들에서, 상기 정용여과에서 3-배 ~ 10-배 사이의 일정한 부피 대체가 제공된다. 정용여과는 미세 투과성 필터를 통해, 구성 요소들의 분자 크기에 기초하여, 용액내 성분, 이를 테면, 염, 소분자, 단백질, 용매 및 이와 유사한 것들의 제거 또는 분리가 연루된 희석 공정이다.
실시예에 따라, 그리고 제거하고자 하는 불순물의 종류에 따라, 불순물 제거 방법이 달라질 수 있다. 용해화된 실크 단백질을 포함하는 용액으로부터 지질 불순물을 제거하는 방법은 당업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 목탄 또는 지질에 특이적으로 결합하는 다른 흡수 매질에 대한 흡수가 내포된다. 단리된 재조합 단백질로부터 다당류 불순물 제거는 당업계에 공지된 방법에 의해 달성될 수 있다. 이러한 방법의 비-제한적인 예로는 다당류를 가수분해하는 효소로 처리한 후, 한외여과에 의해 생성된 작은 당의 제거가 내포된다. 이러한 효소의 비-제한적인 예로는 글루카나아제, 리티나아제, 만나아제 및 키티나아제가 내포된다.
정량화
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 전장의 재조합 거미 실크 단백질이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 90-95%, 또는 95-100%이다. 일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질의 순도는 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 100%이다.
일부 구체예들에서, 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함한다.
일부 구체예들에서, 상기 전장의 재조합 거미 실크 단백질은 측정되거나, 또는 정량화된다. 전장의 재조합 단백질의 양을 측정 또는 정량화시키는데 이용될 수 있는 임의의 적합한 방법에는 다음이 내포되나, 이에 국한되지 않는다: 크기배제 크로마토그래피 (SEC), SDS-PAGE, 면역블랏 (웨스턴 블랏), 고성능 액체 크로마토그래피 (HPLC), SEC HPLC, 액체 크로마토그래피-질량 분석법(LC-MS), 또는 고속 단백질 액체 크로마토그래피(FPLC), 또는 당업계에 공지된 임의의 기타 적절한 방법, 또는 이들의 임의의 조합. 한 구체예에서, 상기 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정된다. 또다른 구체예에서, 상기 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피 (SEC)를 이용하여 측정된다.
재조합 거미 실크 조성물
실크 폴리펩티드는 벌, 나방, 거미, 진드기 및 기타 절지 동물을 비롯한 다양한 공급원으로부터 얻는다. 일부 유기체는 특유한 서열, 구조적 요소들 및 기계적 속성들을 가진 여러 실크 섬유를 만든다. 예를 들면, 황금눈 뜨개 거미(orb weaving spiders)는 환경 또는 삶의 주기에 맞도록 맞춤 섬유로 중합되는 서로 상이한 실크 폴리펩티드 서열을 만드는 6개의 특유 유형의 선(glands)을 보유하고 있다. 상기 섬유의 이름은 이 섬유가 유래하는 선(glands)의 이름을 따서 명명되었으며, 폴리펩티드는 선(glands)의 약어(가령, "Ma"), 스피드로인(spidroin)의 경우 "Sp"(거미 피브로인의 약자)로 표시된다. 오브 위버(orb weavers)에서, 이러한 유형에는 메이저 엠풀레이트(MaSp, 드래그라인(dragline)이라고도 함), 마이너 엠풀레이(MiSp), 플라겔리폼(Flag), 아시니폼(AcSp), 튜불리폼(TuSp) 및 피리폼(PySp)이 내포된다. 유기체에서 이한 속 및 종에 걸쳐 섬유 유형, 도메인 및 변이 전반에 걸친 폴리펩티드 서열의 이러한 조합은 재조합 섬유의 상업적 생산에 의해 이용될 수 있는 광범위한 잠재적 속성들을 유도한다. 지금까지, 재조합 실크 작업의 대부분은 메이저 엠풀레이트 스피드로인 (MaSp)에 중점을 두었다.
US 특허 9,963,554, "Methods and Compositions for Synthesizing Improved Silk Fibers" (본원의 참고자료에 편입됨)에서는 합성 블록 공중합체, 이들의 생산을 위한 재조합 미생물, 그리고 이들 단백질을 포함하는 합성 섬유용 조성물이 개시되어 있다. US 특허 공개 2019/0100740 (2019년 4월 4일자로 공개됨), 제목 "Modified Strains for the Production of Recombinant Silk" (본원의 참고자료에 편입됨)에서는 효모 세포에 의해 발현되는 재조합 단백질의 분해를 감소시키기 위해, 선택되거나 또는 유전적으로 조작된 피치아 파스토리스(Pichia pastoris) 세포, 및 유용한 화합물의 생산을 위한 효모 세포를 배양하는 방법을 개시한다.
몇 가지 유형들의 고유 거미 실크가 확인된 바 있다. 각각의 천연 방적 실크 유형의 기계적 속성들은 당해 실크의 분자 조성에 밀접하게 연결되어 있는 것으로 여겨진다. 예를 들면, Garb, J.E., et al., Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol., 10:243 (2010); Bittencourt, D., et al., Protein families, natural history and biotechnological aspects of spider silk, Genet. Mol. Res., 11:3 (2012); Rising, A., et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci., 68:2, pg. 169-184 (2011); 그리고 Humenik, M., et al., Spider silk: understanding the structure-function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci., 103, pg. 131-85 (2011) 참고. 예를 들면:
아시니폼(aciniform) (AcSp) 실크는 적당히 높은 강도와 적당히 높은 탄력성이 결합된 결과, 높은 인성을 가지는 경향이 있다. AcSp 실크는 종종 폴리 세린 및 GPX의 모티프를 포함하는 큰 블록 ("앙상블 반복") 크기를 특징으로 한다. 튜불리폼(Tubuliform) (TuSp 또는 원통형) 실크는 보통의 강도 및 높은 탄력성으로 인해 큰 직경을 가지는 경향이 있다. TuSp 실크는 폴리 세린 및 폴리 트레오닌 함량 및 짧은 폴리 알라닌 트랙(tracks)을 특징으로 한다. 메이저 엠풀레이트(Major Ampullate) (MaSp) 실크는 높은 강도 및 보통의 탄력성을 가지는 경향이 있다. MaSp 실크는 다음 두 가지 아형들(subtypes) 중 하나 일 수 있다: MaSp1 및 MaSp2. MaSp1 실크는 일반적으로 MaSp2 실크보다 탄력성이 작고, 폴리 알라닌, GX, 및 GGX 모티프로 특징된다. MaSp2 실크는 폴리 알라닌, GGX, 및 GPX 모티프를 특징으로 한다. 마이너 엠풀레이트(Minor Ampullate) (MiSp) 실크는 보통의 강도 및 보통의 탄력성을 가지는 경향이 있다. MiSp 실크는 GGX, GA, 및 폴리 A 모티프로 특징되며, 종종 대략 100개 아미노산의 스페이서(spacer) 요소들을 함유한다. 플라겔리폼(Flagelliform) (Flag) 실크는 매우 높은 탄력성과 보통의 강도를 가지는 경향이 있다. 플래그(Flag) 실크는 보통 GPG, GGX, 및 짧은 스페이서 모티프를 특징으로 한다.
각 실크 유형의 속성들은 종마다 다를 수 있으며, 독특한 라이프스타일 (예컨대, 앉아있는 거미줄 스피너 대 베가본드 사냥꾼)을 이끄는 거미 또는 진화적으로 오래된 거미는 위의 설명과 다른 특성을 가진 실크를 생산할 수 있다 (거미 다양성 및 분류의 설명에 관하여, Hormiga, G., and Griswold, C.E., Systematics, phylogeny, and evolution of orb-weaving spiders, Annu. Rev. Entomol. 59, pg. 487-512 (2014); 및 Blackedge, T.A. et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. Natl. Acad. Sci. U.S.A., 106:13, pg. 5229-5234 (2009) 참고). 그러나, 천연 실크 단백질의 반복 도메인과 서열 유사성 및/또는 아미노산 조성 유사성을 가지는 합성 블록 코폴리머 폴리펩티드는 상응하는 천연 실크 섬유의 특성을 재현하는 상업적 규모의 일관된 실크-유사 섬유를 제조하는데 사용될 수 있다.
일부 구체예들에서, 상기 재조합 거미 실크는 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질이다. 일부 구체예들에서, 상기 재조합 거미 실크 단백질은 비-무질서 용매에서 90%, 80%, 70%, 60%, 또는 50% 미만의 용해도 임계치를 갖는다.
실크 뉴클레오티드 및 펩티드 서열
추정 실크 서열들의 목록은 관련 용어들, 예컨대 "스피드로인(spidroin)", "피브로인(fibroin)", "MaSp"에 관해 GenBank를 검색함으로써 컴파일될 수 있으며, 독립적인 시퀀싱 시도를 통해 수득된 추가 서열들과 함께 풀링(pooled)될 수 있다. 이어서, 서열들은 아미노산으로 해독되고, 중복 엔트리(entries)에 대해 필터링되고, 수작업을 통하여 도메인들 (NTD, REP, CTD)로 분할된다. 일부 구체예들에서, 후보 아미노산 서열들은 피치아 (코마가타엘라) 파스토리스(Pichia (Komagataella) pastoris)에서의 발현을 위해 최적화된 DNA 서열로 역-해독된다. DNA 서열들은 각각 발현 벡터로 클론되고 피치아 (코마가타엘라) 파스토리스로 형질전환된다. 일부 구체예들에서, 성공적인 발현 및 분비를 나타내는 다양한 실크 도메인들은 이어서 조합 방식으로 어셈블되어 섬유 형성이 가능한 실크 분자를 형성한다.
실크 폴리펩티드는 특징적으로 비-반복 영역 (예를 들어, C-말단 도메인 및 N-말단 도메인)이 연접된 반복 도메인 (REP)으로 구성된다. 상기 반복 도메인은 계층 구조를 나타낸다. 이러한 반복 도메인은 일련의 블록들 (반복 유닛으로도 지칭됨)을 포함한다. 실크 반복 도메인 전체에 걸쳐 블록들은, 때로는 완전하게 때로는 불완전하게 (유사(quasi)-반복 도메인을 구성함) 반복된다. 블록들의 길이 및 조성은 상이한 실크 유형에 따라, 그리고 상이한 종들에 걸쳐 달라진다. 표 1은 선택된 종 및 실크 유형들로부터 얻은 블록 서열들의 예를 열거하며, 추가 예들은 Rising, A. et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci., 68:2, pg 169-184 (2011); 및 Gatesy, J. et al., Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001)에 제시되어 있다. 일부 경우들에서, 블록들은 규칙적인 패턴으로 배열되어, 해당 실크 서열의 반복 도메인에서 여러 차례 (보통 2-8회) 나타나는 더 큰 매크로(macro)-반복을 형성할 수 있다. 반복 도메인 또는 매크로-반복 내 반복된 블록 및 반복 도메인 내 반복된 매크로-반복은 스페이싱 요소에 의해 분리될 수 있다. 블록 서열들은 폴리A 영역을 수반하는 글리신 풍부 영역을 포함할 수 있다. 짧은 (~1-10개) 아미노산 모티프는 블록 내 여러 번 나타난다. 일반적으로 관찰되는 모티프의 하위 집합이 도 1에 나와 있다. 상이한 천연 실크 폴리펩티드들로부터 얻은 블록들은 원 순열 (circular permutation)을 고려하지 않고 선택될 수 있다 (즉, 실크 폴리펩티드들 간에 다른 방식으로 유사한 식별된 블록들은 원 순열로 인해 정렬하지 않을 수 있다). 그러므로, 예를 들어, SGAGG의 "블록"은 본원의 방법 및 조성물의 목적에 있어, GSGAG과 GGSGA와 동일하며; 이들은 모두 서로 원 순열이다. 주어진 실크 서열에 대해 선택된 특정 순열은 그 무엇보다도 편의상 지정될 수 있다 (보통 G로 시작). NCBI 데이터베이스로부터 얻은 실크 서열들은 블록과 비-반복 영역들로 구분될 수 있다.
표 1: 블록 서열
특정 구체예에 따른 블록 및/또는 매크로-반복 도메인으로부터 얻은 섬유-형성 블록 공중합체 폴리펩티드는 참고문헌으로 포함된 국제 특허 공개 공보 WO/2015/042164에 기재되어 있다. GenBank와 같은 단백질 데이터베이스 또는 신생경로 (de novo) 시퀀싱을 통해 얻은 천연 실크 서열은 도메인 (N-말단 도메인, 반복 도메인 및 C-말단 도메인) 별로 분류된다. 섬유로의 합성 및 어셈블리를 위해 선택된 N-말단 도메인 및 C-말단 도메인 서열은 천연 아미노산 서열 정보 및 본 명세서에 기재된 다른 변형을 포함한다. 상기 반복 도메인은 중요한 아미노산 정보를 포착하는 동시에 아미노산을 인코드하는 DNA의 크기를 쉽게 합성가능한 단편들로 감소시키는 대표적인 블록, 일반적으로 실크의 유형에 따라 1 내지 8 개의 대표적인 블록을 함유하는 반복 서열로 분해된다. 일부 구체예들에서, 적절하게 형성된 블록 공중합체 폴리펩티드는 최소한 1개의 반복 서열을 포함하는 하나 이상의 반복 도메인을 포함하고, 선택적으로 N-말단 도메인 및/또는 C-말단 도메인에 연접된다.
일부 구체예들에서, 반복 도메인은 적어도 하나의 반복 서열을 포함한다. 일부 구체예들에서, 상기 반복 서열은 150-300개 아미노산 잔기이다. 일부 구체예들에서, 상기 반복 서열은 다수의 블록을 포함한다. 일부 구체예들에서, 상기 반복 서열은 다수의 매크로-반복을 포함한다. 일부 구체예들에서, 하나의 블록 또는 마크로-반복은 다수의 반복 서열들에 걸쳐 분할된다.
일부 구체예들에서, DNA 어셈블리 요건을 충족시키기 위해, 상기 반복 서열은 글리신으로 시작하고 페닐알라닌 (F), 티로신 (Y), 트립토판 (W), 시스테인 (C), 히스티딘 (H), 아스파라긴 (N), 메티오닌 (M) 또는 아스파르트산 (D)으로 끝날 수 없다. 일부 구체예들에서, 상기 반복 서열들 중 일부는 천연 서열과 비교하여 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 (F, Y, W, C, H, N, M 또는 D에서 종료되는 것을 피하기 위해) 폴리펩티드의 C 말단에 세린을 추가함으로써 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 다른 블록의 상동성 서열로 불완전 블록을 채움으로써 변형될 수 있다. 일부 구체예들에서, 상기 반복 서열은 블록들 또는 매크로반복부들의 순서를 재배열함으로써 변형될 수 있다.
일부 구체예들에서, 비-반복성 N-말단 도메인과 C-말단 도메인이 합성을 위해 선택될 수 있다. 일부 구체예들에서, N-말단 도메인은 SignalP (Peterson, T.N., et. Al., SignalP 4.0: discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg. 785-786 (2011).에 의해 확인된 바와 같이 선두(leading) 신호 서열의 제거에 의한 것일 수 있다.
일부 구체예들에서, N-말단 도메인, 반복 서열, 또는 C-말단 도메인 서열은 아겔레놉시스 아페르타 (Agelenopsis aperta), 알리아티푸스 굴로수스 (Aliatypus gulosus), 아포노펠마 세에만니 (Aphonopelma seemanni), 아프토스티추스 종. (Aptostichus sp.) AS217, 아프토스티추스 종. AS220, 아라네우스 디아데마투스 (Araneus diadematus), 아라네우스 겜모이데스 (Araneus gemmoides), 아라네우스 벤트리코수스 (Araneus ventricosus), 아르지오페 아모에나 (Argiope amoena), 아르지오페 아르젠타타 (Argiope argentata), 아르지오페 브루엔니치 (Argiope bruennichi), 아르지오페 트리파스시아타 (Argiope trifasciata), 아티포이데스 리베르시 (Atypoides riversi), 아비쿨라리아 주루엔시스 (Avicularia juruensis), 보트리오시르툼 칼리포르니쿰 (Bothriocyrtum californicum), 데이노피스 스피노사 (Deinopis Spinosa), 디구에티아 카니티에스 (Diguetia canities), 돌로메데스 테네브로수스 (Dolomedes tenebrosus), 유아그루스 치소세우스 (Euagrus chisoseus), 유프로스테놉스 아우스트랄리스 (Euprosthenops australis), 가스테라칸타 맘모사 (Gasteracantha mammosa), 히포칠루스 토렐리 (Hypochilus thorelli), 쿠쿨카니아 히베르날리스 (Kukulcania hibernalis), 라트로덱투스 헤스페루스 (Latrodectus hesperus), 메가헥수라 풀바 (Megahexura fulva), 메테페이라 그란디오사 (Metepeira grandiosa), 네필라 안티포디아나 (Nephila antipodiana), 네필라 클라바타 (Nephila clavata), 네필라 클라비페스 (Nephila clavipes), 네필라 마다가스카리엔시스 (Nephila madagascariensis), 네필라 필리페스 (Nephila pilipes), 네필렌기스 크루엔타타 (Nephilengys cruentata), 파라윅시아 비스트리아타 (Parawixia bistriata), 페우세티아 비리단스 (Peucetia viridans), 플렉트레우리스 트리스티스 (Plectreurys tristis), 포에실로테리아 레갈리스 (Poecilotheria regalis), 테트라그나타 카우아이엔시스 (Tetragnatha kauaiensis), 또는 울로보루스 디베르수스 (Uloborus diversus)에서 유래될 수 있다.
일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 알파 메이팅(mating) 인자 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 또다른 내인성 또는 이종성 분비 신호 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 3X FLAG 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 다른 친화력(affinity) 태그, 가령, 6-8개의 His 잔기들에 작동가능하도록 연결된다.
분비 신호
세포로부터 분비되는 단백질의 양은 단백질마다 상당히 가변적이며, 초기 상태에서 단백질에 작동 가능하게 연결된 분비 신호에 부분적으로 의존한다. 다수의 분비 신호가 당업계에 공지되어 있으며, 일부는 분비된 재조합 단백질의 생산에 통상적으로 사용된다. 이들 중 눈에 띄는 것은 사카로미세스 세레비시에(saccharomyces cerevisiae)의 α-메이팅 인자(αMF)의 분비 신호이며, 이는 N-말단 19개-아미노산 신호 펩티드 (본원에서 pre-αMF(sc)라고도 함), 그리고 그 뒤에 오는 70개-아미노산 리더 펩티드(본원에서 pro-αMF(sc)라고도 함)로 구성된다. 사카로미세스 세레비시에(saccharomyces cerevisiae) (pre-αMF(sc)/pro-αMF(sc)로 또한 지칭되는) αMF의 분비 신호에 pro-αMF(sc)의 함입은 단백질의 높은 분비 수율을 달성하는 데 중요한 것으로 입증되었다. pre-αMF(sc) 이외의 신호 펩티드에 pro-αMF(sc) 또는 이의 기능적 변이체를 추가하는 것 또한 재조합 단백질의 분비를 달성하는 수단으로 탐구되었지만, 특정 재조합 숙주 세포에서 특정 재조합 단백질에 대한 분비는 증가하지만 기타 재조합 단백질에 대해서는 효과가 없거나 또는 감소하는 등 다양한 정도의 효과를 나타냈다.
다수의 별개의 분비 신호의 사용은 미국 출원 15/724,196에 기재된 바와 같이, 재조합 단백질의 분비 수율을 개선시킬 수 있다. 단 하나의 분비 신호 (가령, pre-αMF(sc)/pro-αMF(sc))에 작동가능하게 연계된 재조합 단백질을 인코딩하는 다중 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포와 비교하였을 때, 적어도 2개의 별개의 분비 신호에 작동가능하게 연계된 재조합 단백질을 인코딩하는 동일한 수의 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포는 재조합 단백질의 더 높은 분비 수율을 만든다. 이론에 결부되는 것은 아니지만, 적어도 2개의 별개의 분비 신호의 사용으로 재조합 숙주 세포가 별개의 세포 분비 경로에 관여하여 재조합 단백질의 효율적인 분비에 영향을 미치고, 따라서 임의의 하나의 분비 경로의 과다-포화가 방지될 수 있다.
별개의 분비 신호 중 적어도 하나는 표 2 또는 표 3에서 선택될 수 있는 신호 펩티드를 포함하거나, 또는 표 2 또는 표 3에서 선택되는 신호 펩티드에 대해 적어도 80% 아미노산 서열 동일성을 갖는 기능적 변이체이다. 일부 구체예들에서, 상기 기능적 변이체는 1개 또는 2개의 치환된 아미노산을 포함하는 표 2 또는 표 3에서 선택된 신호 펩티드이다. 일부 이러한 구체예들에서, 상기 기능적 변이체는 표 2 또는 표 3에서 선택된 신호 펩티드에 대해 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99% 아미노산 서열 동일성을 갖는다. 일부 구체예들에서, 상기 신호 펩티드는 발생초기(nascent) 재조합 단백질의 해독-후 ER로의 전위를 매개한다 (즉, 단백질 합성은 발생초기 재조합 단백질이 ER로 전위되기 전, 해당 세포 세포질에 존재하도록 전위보다 선행된다). 다른 구체예들에서, 상기 신호 펩티드는 발생초기 재조합 단백질의 ER로의 전좌를 해독적으로-동시 매개한다 (즉, 단백질 합성과 ER로의 전좌가 동시에 일어난다). ER로의 동시-해독 전위를 매개하는 신호 펩티드를 사용하는 이점은 신속하게 폴딩되는 경향이 있는 재조합 단백질이 ER로의 전위와, 그리고 그에 따른 분비를 방해하는 입체형태를 취하는 것을 방지한다는 것이다.
표 2 - 분비 신호
표 3 - 재조합 분비 신호
발현 벡터
본원에 기재된 발현 벡터는 당업계에 공지된 기술의 관점에서 본 명세서의 교시에 따라 생성될 수 있다. 서열, 예를 들어, 벡터 서열 또는 이식유전자를 코딩하는 서열은 Integrated DNA Technologies, Coralville, IA 또는 DNA 2.0, Menlo Park, CA와 같은 회사로부터 상업적으로 얻을 수 있다. 키메라 실크 폴리펩티드의 높은-수준 발현을 지시하는 발현 벡터가 본원에서 예시된다.
본원에 기재된 폴리뉴클레오티드에 대한 또다른 표준 공급원은 유기체 (예를 들어, 박테리아), 세포, 또는 선택된 조직으로부터 단리된 폴리뉴클레오티드이다. 선택된 공급원으로부터의 핵산은 일반적으로 연속적인 페놀 및 페놀/클로로포름 추출 후, 에탄올 침전이 내포된 표준 절차에 의해 단리될 수 있다. 침전 후, 상기 폴리뉴클레오티드는 핵산 분자를 단편으로 절단하는 제한 엔도뉴클레아제로 처리될 수 있다. 클로닝을 위한 적절한 크기의 출발 물질을 제공하기 위해, 상기 선택된 크기의 단편들은 아가로스 또는 폴리아크릴아미드 겔 전기영동 또는 펄스장 겔 전기영동을 비롯한 다수의 기술에 의해 분리될 수 있다(Care et al.(1984) Nuc. Acid Res. 12:5647-5664; Chu et al.(1986).) Science 234:1582, Smith et al.(1987) Methods in Enzymology 151:461).
발현 벡터 또는 구조체의 뉴클레오티드 성분을 얻는 또다른 방법은 PCR이다. PCR에 대한 일반적인 절차는 MacPherson et al., PCR: A PRACTICAL APPROACH, (IRL Press at Oxford University Press, (1991))에 교시되어 있다. 각 적용 반응에 대한 PCR 조건은 경험적으로 결정할 수 있다. 다수 개변수가 반응의 성공에 영향을 미친다. 이러한 매개변수 중에는 어닐링 온도 및 시간, 연장 시간, Mg2+ 및 ATP 농도, pH, 프라이머, 주형 및 디옥시리보뉴클레오티드의 상대적 농도가 있다. 예시적인 프라이머는 하기 실시예에서 설명된다. 증폭 후, 생성된 단편은 아가로스 겔 전기영동에 의해 검출된 후 염화 에티듐 착색 및 자외선 조명으로 시각화할 수 있다.
폴리뉴클레오타이드를 얻는 또다른 방법은 효소 절단에 의한 것이다. 예를 들면, 뉴클레오티드 서열은 적절한 인지 제한 효소로 적절한 벡터를 분해하여 생성시킬 수 있다. 제한효소 절단된 단편들은 표준 기술을 사용하여, 4개의 데옥시뉴클레오티드 트리포스페이트(dNTP)의 존재 하에 대장균(E. coli) DNA 중합효소 I (Klenow)의 큰 단편으로 처리함으로써 블런트(blunt) 말단화될 수 있다.
폴리뉴클레오티드는 당업계에 잘 알려진 방법을 사용하여 적절한 골격(backbones), 예를 들어, 플라스미드에 삽입된다. 예를 들면, 삽입체 및 벡터 DNA는 적절한 조건에서 제한 효소와 접촉되어 각 분자에 상보적이거나 또는 블런트 말단을 생성할 수 있고, 이들은 서로 쌍을 이루고, 리가아제와 결합될 수 있다. 대안으로, 합성 핵산 링커는 폴리뉴클레오티드의 말단에 결찰될 수 있다. 이러한 합성 링커들은 벡터 DNA의 특정 제한 부위에 상응하는 핵산 서열을 함유할 수 있다. 기타 수단들이 공지되어 있고, 당업계에 이용가능하다. 구성성분 폴리뉴클레오티드를 위해 다양한 공급원이 사용될 수 있다.
일부 구체예들에서, R, N 또는 C 서열을 함유하는 발현 벡터는 발현 및 분비를 위해 숙주 유기체로 형질전환된다. 일부 구체예들에서, 상기 발현 벡터는 분비 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 종료 신호를 포함한다. 일부 구체예들에서, 상기 발현 벡터는 숙주 세포 게놈에 통합되도록 설계되었으며, 다음을 포함한다: 표적 게놈에 대한 상동성 영역, 프로모터, 분비 신호, 태그 (가령, 플래그 태그), 종결/폴리A 신호, 피치아(Pichia)에 대한 선택가능한 마커, 대장균(E. coli)에 대한 선택가능한 마커, 대장균(E. coli)에 대한 복제 기점, 그리고 관심대상의 단편을 방출하는 제한절단 부위.
숙주 세포 형질전환체
거미 실크 폴리펩티드 및 이의 후손을 발현시키는 핵산 분자 또는 벡터로 형질전환된 숙주 세포가 제공된다. 이들 세포는 자유 복제 벡터일 필요는 없지만, 벡터 상에서 핵산 서열을 또한 담아 있을 수 있다. 다른 구체예들에서, 상기 핵산은 숙주 세포의 게놈에 통합되었다.
일부 구체예들에서, 블록 공중합체 폴리펩티드의 대규모 생산을 가능하게 하는 미생물 또는 숙주 세포는 다음의 조합이 내포된다: 1) 큰 (>75kDa) 폴리펩티드를 생산하는 능력, 2) 세포 외부로 폴리펩티드를 분비하고, 값비싼 다운스트림 세포내 정제를 우회하는 능력, 3) 대규모 오염 물질 (가령, 바이러스 및 박테리아 오염)에 대한 내성, 그리고 4) 유기체를 성장시키고 처리하기 위한 기존 노하우는 대규모(1-2000m3) 생물 반응기이다.
다양한 숙주 유기체는 블록 공중합체 폴리펩티드 발현 시스템을 포함하도록 조작/형질전환될 수 있다. 재조합 실크 폴리펩티드의 발현을 위한 바람직한 유기체는 효모, 진균, 그람 양성 및 그람 음성 박테리아가 내포된다. 특정 구체예들에서, 상기 숙주 유기체는 아르술라 아데니니보란스(Arxula adeninivorans), 아스퍼길러스 아쿨레투스(Aspergillus aculeatus), 아스퍼길러스 아와모리(Aspergillus awamori), 아스퍼길러스 피쿰(Aspergillus ficuum), 아스퍼길러스 푸미가투스(Aspergillus fumigatus), 아스퍼길러스 야포니쿠스(Aspergillus japonicus), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 나이져(Aspergillus niger), 아스퍼길러스 오리제(Aspergillus oryzae), 아스퍼길러스 소야(Aspergillus sojae), 아스퍼길러스 투비겐시스(Aspergillus tubigensis), 바실러스 알카로필루스(Bacillus alkalophilus), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실러스 안트라시스(Bacillus anthracis), 바실러스 브레비스(Bacillus brevis), 바실러스 씨르쿨란스(Bacillus circulans), 바실러스 코아굴란스(Bacillus coagulans), 바실러스 라우투스(Bacillus lautus), 바실러스 렌투스(Bacillus lentus), 바실러스 리퀘니포르미스(Bacillus licheniformis), 바실러스 메탄올리쿠스(Bacillus methanolicus), 바실러스 스테아로테르모필리스(Bacillus stearothermophilus), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 튜린기엔시스(Bacillus thuringiensis), 칸디다 보이디니(Candida boidinii), 크리소스포리움 럭노웬스(Chrysosporium lucknowense), 대장균(Escherichia coli), 푸사리움 그라미네룸(Fusarium graminearum), 푸사리움 베네나툼(Fusarium venenatum), 클루웨로미세스 락티스(Kluyveromyces lactis), 클루유베로미세스 마르시아누스(Kluyveromyces marxianus), 미셀리오프토라 터모필리아(Myceliopthora thermophila), 누로스포라 크라사(Neurospora crassa), 오가타에아 폴리모르파(Ogataea polymorpha), 페니실리움 카멤베르티(Penicillium camemberti), 페니실리움 카네센스(Penicillium canescens), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 에메르소니(Penicillium emersonii), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 그리세로세움(Penicillium griseoroseum), 페니실리움 푸르푸로게눔(Penicillium purpurogenum), 페니실리움 로퀘포르티(Penicillium roqueforti), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 피치아 앙구스타(Pichia angusta), 피치아 메탄올리카(Pichia methanolica), 피치아(코마가타에라) 파스포리스(Pichia (Komagataella) pastoris), 피치아 폴리모르파(Pichia polymorpha), 피치아 스티피티스(Pichia stipitis), 리조무코르 미에하이(Rhizomucor miehei), 리조무코르 푸실리우스(Rhizomucor pusillus), 리조푸스 아르히주스(Rhizopus arrhizus), 스트렙토미세스 리비단스(Streptomyces lividans), 사카로미세스 세레비시에(saccharomyces cerevisiae), 쉬반니오미세스 악시덴탈리스(Schwanniomyces occidentalis), 트리코데르마 하르지아눔(Trichoderma harzianum), 트리코데르마 리세이(Trichoderma reesei), 또는 야로비아 피로리티카(Yarrowia lipolytica)이다.
바람직한 측면들에서, 상기 방법들은 바이오매스를 추출할 필요 없이, 용이하게 회수하기 위해 직접적인 산물 분비를 하는 배양 숙주 세포를 제공한다. 일부 구체예들에서, 상기 블록 공중합체 폴리펩티드는 수집 및 처리를 위해 배지로 바로 분비된다.
공작된 숙주 세포 계통
메탄올자화(methylotrophic) 효모 피치아 파스토리스 (Pichia pastoris)는 재조합 단백질의 생산에 널리 사용된다. P. 파스토리스는 높은 세포 밀도로 성장하고, 엄격하게 제어된 메탄올-유도성 트랜스 유전자 발현을 제공하고, 한정된 배지로 효과적으로 이종성 단백질을 분비할 수 있다. 그러나, P. 파스토리스 (P. pastoris) 균주의 배양 동안, 재조합적으로 발현된 단백질은 이들이 분비되기 전에 세포내에서 수집될 수 있어, 재조합 발현 단백질의 단편 및 감소된 수율의 전장 재조합 단백질을 포함하는 단백질의 혼합물을 생성할 수 있다. 재조합 단백질 생산을 위해 널리 사용되는 또다른 세포주는 대장균(Escherichia coli) 박테리아다. 그러나, 대장균(Escherichia coli) 균주의 배양 동안, 재조합적으로 발현된 단백질은 불용성일 수 있으며, 그 결과 재조합 단백질의 분리가 잘 되지않고, 수율이 감소될 수 있다.
일부 구체예들에서, 본원에 기재된 프로테아제 활성이 감소된 변형 균주는 실크-유사 폴리펩티드 서열을 재조합적으로 발현시킨다. 일부 구체예들에서, 실크-유사 폴리펩티드 서열은 1) 실크 폴리펩티드 서열에서 유래한 반복 도메인들을 혼합 및 매칭시킴으로써 생성된 블록 코폴리머 폴리펩티드 조성물 및/또는 2) 산업적으로 확장가능한 미생물로부터의 분비에 의해 유용한 고체 또는 섬유를 형성하기에 충분히 큰 크기 (약 40kDa)를 가지는 블록 공중 합체 폴리펩티드의 재조합 발현이다. 거미 실크 폴리펩티드의 거의 모든 공개된 아미노산 서열의 서열을 내포하는 실크 반복 도메인 단편들로부터 공작된 큰 (대략적으로 40 kDa 내지 대략적으로 100 kDa) 블록 공중합체 폴리펩티드는 본원에서 기재된 변형된 미생물에서 발현될 수 있다. 일부 구체예에서, 실크 폴리펩티드 서열은 고체 또는 섬유 형성이 가능한 고도로 발현되고 분비된 폴리펩티드를 생성하도록 매칭되고 설계된다. 일부 구체예들에서, 숙주 변형된 균주에서 프로테아제 유전자의 녹아웃 또는 프로테아제 활성의 감소는 실크 유사 폴리펩티드의 분해를 감소시킨다.
일부 구체예들에서, 피치아 파스토리스(Pichia pastoris)에서 프로테아제 활성을 약화시키기 위하여, 이들 효소를 인코드하는 유전자를 불활성화 또는 돌연변이시켜 활성을 감소시키거나 제거한다. 이것은 유전자 조절 요소의 변형을 통한 유전자 자체의 돌연변이 또는 삽입을 통해 이루어질 수 있다. 이것은 표준 효모 유전학 기술을 통해 구현될 수 있다. 이러한 기술의 예는 이중 상동 재조합을 통한 유전자 대체를 포함하며, 여기서 불 활성화될 유전자에 연접하는 상동 영역들은 선별 마커 유전자 (가령, 항생제 내성 유전자 또는 효모 균주의 영양요구성을 보충하는 유전자)에 연접하는 벡터에서 클로닝된다.
대안적으로, 상동성 영역은 PCR-증폭되고 중첩 PCR을 통해 선별 마커 유전자에 연결될 수 있다. 이어서, 이러한 DNA 단편들은 해당 분야에 공지된 방법들, 예컨대, 전기천공법을 통해 피치아 파스토리스(Pichia pastoris)에 형질전환된다. 이어서 선택적 조건하에서 성장하는 형질전환체들을 표준 기술, 예컨대, 게놈 DNA에 대한 PCR 또는 서던 블롯에 의해 유전자 파괴 발생에 대해 분석하였다. 대안적인 실험에서, 유전자 불활성화는 단일 상동 재조합을 통해 구현될 수 있으며, 이 때, 예를 들어, 유전자 ORF의 5' 단부는 선별 마커 유전자를 또한 함유하는 프로모터없는 벡터 상에 클로닝된다. 표적 유전자 상동성 단편에서 벡터만을 절단하는 제한 효소에 의한 분해를 통해 이러한 벡터를 선형화할 때, 이러한 벡터는 피치아 파스토리스(Pichia pastoris) 내에 형질전환된다. 표적 유전자 부위에서의 통합은 게놈 DNA에서의 PCR 또는 서던 블롯을 통해 확인된다. 이러한 방식으로, 벡터 상에 클로닝된 유전자 단편의 복제가 게놈에서 구현되고, 다음과 같은 표적 유전자 좌위의 2개의 복제물이 생성된다: ORF가 불완전하여, 단축된 비활성 단백질을 발현시키는 제 1 복제물, 및 전사를 유도하는 프로모터가 없는 제 2 복제물.
대안으로, 트랜스포존 돌연변이유발을 사용하여 표적 유전자를 불활성화시킨다. 이러한 돌연변이체의 라이브러리는 PCR을 통해 표적 유전자에서의 삽입 발생에 대해 스크리닝될 수 있다.
조작된/녹아웃 균주의 기능적 표현형 (즉, 결핍)은 해당 분야에 공지된 기술을 사용하여 평가될 수 있다. 예를 들어, 프로테아제 활성에서 조작된 균주의 결핍은 해당 분야에 공지된 임의의 다양한 방법, 그 중에서도, 예컨대, 발색 프로테아제 기질의 가수분해 활성 분석, 선택된 프로테아제에 대한 기질 단백질의 밴드 이동 등을 사용하여 확인할 수 있다.
본 명세서에 기재된 프로테아제 활성의 약화는 녹아웃 돌연변이 이외의 메커니즘을 통해 구현될 수 있다. 예를 들면, 원하는 프로테아제는 핵산 서열을 변경하거나, 유전자를 활성이 덜한 프로모터의 제어하에 위치시키거나, 하향 조절하거나, 관심 유전자를 표적으로 하는 간섭 RNA, 리보자임 또는 안티센스 서열을 발현시킴으로써, 또는 해당 분야에 공지된 임의의 다른 기술을 통한 아미노산 서열 변화에 의해 약화될 수 있다. 바람직한 균주에서, PAS_chr4_0584 (YPS1-1) 및 PAS_chr3_1157 (YPS1-2)에서 인코드되는 프로테아제들의 프로테아제 활성은 상기 기재된 임의의 방법에 의해 약화된다. 일부 양상들에서, 메탄올자화 효모 균주, 특히 피치아 파스토리스(Pichia pastoris) 균주 [이때 YPS1-1 및 YPS1-2 유전자는 불활성화되었음]에 대해 기재된다. 일부 구체예들에서, 균주에 의해 발현되는 원하는 단백질 생성물의 프로테아제 활성을 추가로 감소시키기 위해 본 명세서에 제공된 방법에 따라 추가 프로테아제 암호화 유전자가 녹아웃될 수 있다.
일부 구체예들에서, 본 발명에 개시된 P. 파스토리스(P. pastoris) 균주는 실크-유사 폴리펩티드를 발현하기 위해 변형되어 있다. 바람직한 구체예들의 실크-유사 폴리펩티드 제작 방법은 WO 2015/042164, 특히 114-134 단락에 제공되며, 이 문헌은 본 명세서에 참고문헌으로 포함된다. 이 문헌에는 아르지오페 브루엔니치 (Argiope bruennichi) 종과 같은 MaSp2로부터 유래한 재조합 거미 실크 단백질 단편 서열들에 기초한 합성 단백질성 코폴리머가 개시되어 있다. 각각의 반복 유닛의 분자량이 약 20 kDa 이상의, 2 내지 20개 반복 유닛을 포함하는 실크-유사 폴리펩티드가 기재되어 있다. 코폴리머의 각 반복 유닛 내에는 약 60개 이상의 아미노산 잔기가 있고, 이들은 다수의 "유사-반복 유닛"으로 구성되게 된다. 일부 구체예들에서, 본원에 기재된 폴리펩티드의 반복 단위는 MaSp2 드래그라인(dragline) 실크 단백질 서열에 대해 95% 이상의 서열 동일성을 가진다.
실시예
하기는 본 발명을 수행하기 위한 특정 구체예들의 예시이다. 실시예는 오직 설명을 위하여 제공되며, 어떤 방식으로든 본 발명의 범위를 제한하고자 하는 것이 아니다. 사용된 숫자 (예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만, 물론 일부 실험 오차 및 편차가 허용되어야 한다.
달리 지시되지 않는 한, 본 발명의 실시는 숙련된 기술자에게 통상적인 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학적 방법을 이용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다. 가령, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman and Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick and N. Kaplan eds., Academic Press, Inc.); Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey and Sundberg Advanced Organic Chemistry 3 rd Ed. (Plenum Press) Vols A and B(1992) 참고.
실시예 1: 칼슘 염 추출
결정질이 큰 실크는 용액에서 응집체를 형성하여 용해도를 감소시키고, 생산 동안 숙주 세포로부터의 회수를 감소시킨다. 따라서, 이러한 결정질 실크를 용해화를 개선시킨 방법이 필요하다. 이들 실시예에 기술된 방법은 칼슘염 및 알코올을 사용하여 실크 단백질의 용해도를 증가시키는 것이다.
재료와 방법
다중 칼슘 염을 사용하여, 최적의 칼슘 염을 확인하기 위해 P0 (서열 식별 번호: 23에 나타낸 대표적인 블록 아미노산 서열)라고도 하는 UDMisp64k 단백질을 추출했다. P0는 예시적인 결정질이 매우 큰 실크 단백질이다. 6x His 태그에 융합된 P0 실크 유전자를 함유하는 발현 벡터로 형질전환된 대장균 (E. coli)(글리신 링커(GGGGG-HHHHHH)를 사용하여 P0의 c-말단에 추가된 6개의 히스티딘)을 클로람페니콜과 함께, 특정된 최소 염 배지인 Terrific Broth에서 성장시켰다. 발효 24시간 후, IPTG로 P0 발현을 유도하였다. 이들 대장균(E. coli)은 단백질 유도-후 16 시간 시점에 수확되었다. 이들 대장균(E. coli)은 14,0000 PSI에서 단일 패스로 미세유동화기(Microfluidics LM10)를 통해 LB 브로쓰 및 세포를 통과시켜 용해시켰다. 용해물을 Eppendorf 탁상용 원심분리기에서 15,000 x g에서 원심분리기를 통해 펠릿화했다. 불용성 P0를 함유하는 펠릿은 그대로 두었고, 상청액은 버렸다.
메탄올 안에 각각 염화칼슘(CaCl2), 질산칼슘(Ca(NO3)2 또는 CaNit) 및 티오시안산칼슘(C2CaN2S2 또는 Ca(SCN)2 또는 CaSCN)의 20%(w/v) 용액을 준비했다. 100 mg의 세포 용해물 펠렛을 1 mL의 각 칼슘 염/메탄올 (CaMeOH) 용액에 추가하였다. 상기 세포 용해물 펠렛을 실온에서 1 시간 동안 각 CaMeOH 용액에 재현탁시키고, 항온처리하였다. 용해화안된 물질은 원심분리 (15,000 x g)를 통하여 재-펠렛화하였다. 상청액을 유지하고, Bis/Tris 완충액에서 SDS-PAGE를 통해 분석하고 면역블롯팅했다. 항-His 항체를 사용하여 P0 단백질을 가시화하였다.
결과
P0 단량체는 웨스턴용 Bis/Tris Gel에서 분자량보다 약간 더 높게 나타났다. 이 실시예에서 사용된 P0는 64kDa이지만, 일반적으로 SDS-PAGE 젤의 70~100kDa 마커 사이에 나타난다. 이 경우에서, 이 단백질은 100kDa로 이동되었다. 전체 세포 배양액(WCB)은 5M 구아니딘 티오시아네이트로 추출한 반면, 정화된 세포 배양액(CCB)은 용매 없이 추출하여 대조군으로 사용했다. P0 단백질 단량체는 100 kDa에서 단백질 밴드로 표시된 것처럼 티오시안산칼슘(CaSCN) 및 염화칼슘(CaCl2)을 함유한 용액과 함께 항온처리한 후, 상층액 분획에서 관찰되었다 (도 3, 화살표로 표시됨). 그러나, 상기 질산 칼슘 (CaNit) 라인에서 밴드는 관찰되지 않았다. 특정 이론에 얽매이지 않고, Ca-SCN은 아래 또는 위의 다른 밴드가 보이지 않기 때문에, 전장의 P0에 대해 더 높은 특이성을 가질 수 있다고 제안된다. 유사한 강도의 밴드가 CaCl2 레인에서도 관찰되었으며, 더 작은 항-His 태그 종과 함께 P0 단편일 가능성이 있다 (괄호로 나타낸 바와 같이, 약 55 kDa, 50 kDa, 및 37 kDa에서 밴드).
실시예 2: 알코올 추출
최적의 추출 조건을 결정하기 위해, 알코올 선택에 대해 조사했다. 먼저, 불용성 P0를 물 또는 메탄올에서 CaCl2와 함께 항온처리하여, 알코올 용매를 포함해야 하는 요건을 결정했다. 다음으로, 일차 용매로 에탄올과 이소프로판올로 대체하였다. 마지막으로, 물을 용매로 메탄올과 함께 도입하여, 공정의 휘발성을 줄였다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 표 4와 같이 다양한 용매에 다양한 농도의 CaCl2 용액을 만들었다.
불용성 세포 물질 100 mg을 각 용액 1 ml에 첨가하였고, 피펫팅을 통해 재현탁시켰다. 용액 조건 1-6의 샘플을 실온(약 22℃)에서 1시간 동안 항온처리하였다. 용액 조건 1-6의 병렬 샘플을 만들었고, 히팅 블록(Benchmark Scientific BSH1002)에서 55℃에서 1시간 동안 항온처리했다. 용액 조건 7-10으로 처리된 샘플을 히팅 블록에서 55℃에서 1시간 동안 항온처리했다. 항온처리 후, 샘플을 원심분리를 통하여 펠렛화하였다. 용해화된 P0 단백질을 포함하는 상층액을 수집하였고, His 태그에 대한 효소 결합 면역흡착 분석(ELISA)을 통해 분석했다.
결과
용액 조건 1-6으로 처리된 샘플에 대한 ELISA 결과는 22℃ 및 55℃에서 회수된 P0의 백분율로 표 5에 나와 있다. P0 수율 정량은 다음 방정식을 사용하여 ELISA에 의해 결정되었다: (추출물에서 P0) / (WCB에서 P0) = (P0 추출 수율). * 기호는 P0 수율이 ELISA에 의해 감지되지 않았음을 나타낸다
P0는 22℃에서 수성에서 4M, 그리고 메탄올에서 2M 하에 모든 농도의 CaCl2에서 ELISA로 검출할 수 없었다. 물 속의 4M CaCl2는 1% P0를 생성했으며, 열을 가하면 3X에서 3%로 증가했다. 메탄올에서 2M CaCl2은 또한 온도가 더 높을 때, 3x의 유사한 수율 증가를 나타냈다.
용액 조건 7-10 및 열-처리된 조건 6에서 처리한 시료의 ELISA 결과를 표 6에 나타내었다.
에탄올에서 2M 염화칼슘은 메탄올 뿐만 아니라 P0도 추출하지 못했다. 수율은 동일한 추출 조건에서 10x 더 낮았다 (MeOH의 51%와 비교하여 EtOH의 5%).
특정 이론에 얽매이려는 의도 없이, 물은 P0 추출에 부정적인 영향을 미쳤다고 제안된다. 용액이 25%의 물과 75%의 메탄올만을 함유할 때, P0 수율은 4%만큼 낮았고, 수분 함량이 50% 또는 75%로 증가함에 따라 측정 가능한 수율이 없었다.
실시예 3: 항온처리 시간 및 온도
추출 시간을 최소화하면서, 한편 최대 추출을 위한 최적의 온도를 결정하기 위해, 추출 온도를 변경했다. 샘플의 교반도 또한 도입되었다. 연속 혼합과 함께, 이 온도를 낮추는 것은 보다 확장 가능한 공정 시나리오로 조사되었다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 메탄올에서 2M CaCl2 용액 1ml를 100mg의 불용성 세포 물질에 첨가하였고, 이를 피펫팅을 통해 재현탁시켰다. 12개의 분취물이 만들어졌다. 35℃에서 0, 15, 30, 60, 120, 및 240 분 동안 교반과 함께 6개의 분획이 항온처리되었다. 나머지 6개 분획은 55℃에서 0, 5, 15, 30, 60 및 120분 동안 교반하면서 항온처리했다. 각 시점에서 샘플을 제거하고 벤치탑 원심분리기 (Eppendorf 5415D)에서 15,000 xg로 원심분리했다. 용해화된 P0 단백질을 포함하는 상층액을 수집하였고, His 태그에 대한 ELISA를 통해 분석했다.
결과
추출 결과는 도 4에 나타낸다. 추출된 P0 단백질의 양은 55℃와 비교하여 35℃에서 배양된 샘플의 각 시점에서 실질적으로 유사하였다. 두 추출 온도 모두 30분에 피크 추출에 도달했다. 추출 중 연속 혼합을 추가하면 최대 수율이 약 50%에서 80%로 증가했다. 각 조건에 대한 수율 백분율은 표 7에 나와 있다.
따라서, 35℃에서의 항온처리는 55℃에서의 항온처리만큼 효과적이었다. 또한, 항온처리 동안 교반 또는 혼합은 P0 회수를 상당히 개선시켰다.
실시예 4: 추출 부피
생산 확장성을 더욱 향상시키기 위해 추출 중에 사용되는 솔루션의 양을 줄이는 방법을 모색했다. 불용성 펠렛에서 P0를 추출하기 위해, 2M 염화칼슘 용액의 부피를 절반으로 줄였다.
재료와 방법
P0는 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 미세유동화기를 사용하여 세포를 용해시켰고, 불용성 물질을 원심분리를 통해 펠렛화하였다. 불용성 펠렛을 메탄올 중 0.5ml 또는 1ml의 2M CaCl2 용액에 재현탁시켰다. 샘플을 35℃에서 1 hr 동안 교반과 함께 항온처리하였다. 항온처리 후, 샘플을 원심분리를 통해 펠렛화하였고 상청액만 남겼다. 이 상청액 안의 P0는 ELISA 및 크기 배제 크로마토그래피 (SEC)를 통하여 분석하였다. SEC는 샘플에서 전장의 P0의 상대적인 양 결정하는 데 사용되었다.
결과
1ml 및 0.5ml 샘플에서 P0의 수율은 아래 표 8에 나와 있다.
두 샘플에서, 수율은 유사하였으며, 샘플 부피가 감소할 수 있고, 여전히 P0 단백질의 효율적인 추출을 초래할 수 있음을 나타낸다. 0.5ml 샘플은 1ml 샘플에서 14:1 비율과 비교하여, 7:1의 2M 칼슘 메탄올 용액 대 펠릿의 질량 비율과 대략 동일하다. 추출 용적 감소의 이점은 수율 감소의 가치가 있다.
또한, 두 샘플에서 전체 길이 P0의 양은 실질적으로 유사하여 (1ml 샘플의 약 20%에 비해 0.5ml 샘플의 약 22%), 회수된 P0의 순도는 손상되지 않았다.
실시예 5: P0 분말 회수
P0 단백질은 칼슘염과 메탄올 용액에서 회수되었다.
재료와 방법
P0의 낮은 용해도를 활용하기 위해, 물을 1:2의 질량비로 첨가하여 추출하여 침전을 촉진했다. 침전물이 형성되었고, Beckman J-6 원심분리기에서 15분 동안 4, 200 x g에서 원심분리되었다. 전장의 P0는 용액 안에 상청액으로 안정적으로 남아 있었다. SEC 및 ELISA 분석을 위해 물에-침전된 상층액의 샘플을 채취했다. 진공 하에 60℃로 설정된 회전 증발기(Buchi Rotavapor R-210)에서 잔류 상청액에서 메탄올을 증발시켰다. 일단 메탄올이 증발되면, 염화칼슘을 제거하기 위해 샘플을 20kDa 컷-오프(Slide-A-Lyzer Dialysis Cassete 20kDa)가 있는 투석 카세트의 물에 대해 투석시켰다. 투석 후, 침전물이 형성되었고, 15분 동안 4,200 x g에서 원심분리(Beckman J-6)를 통해 펠렛으로 회수하였다. 펠렛은 -80℃에서 동결되었고, 동결 건조되었다(Labconco Freezone 4.5). 용액에서, 그리고 동결건조 후의 전장의 P0의 양은 SEC를 통해 결정되었고, 전체 수율은 ELISA에 의해 결정되었다.
결과
수분 침전은 SEC를 통해 정량화하였을 때, 추출물에서 전장의 P0를 20%에서 50%로 강화시켰다 (도 5A). 동결건조된 P0는 SEC를 통해 정량화하였을 때, 51%가 전장 P0 단량체였다 (도 5B).
총 P0 수율은 ELISA를 통해 정량화하였을 때, 물 침전 및 동결건조 후 56%에서 50%로 단지 6%만 감소했다.
따라서, 물 침전은 불순물을 제거하였고, 한편으로 전체 P0 단백질 수율에 최소한으로 영향을 미쳤다.
실시예 6: MeOH 추출 스크린에서 고-처리량 CaCl
2
본원에 기술된 방법은 MeOH 분석에서 96-웰 블록 CaCl2에서 다른 실크 단백질에 대해 수행되었다.
재료와 방법
실크 단백질은 실시예 1에 기재된 바와 같이, 대장균 (E. coli) 세포에서 발현되었다. 세포 펠렛을 초음파처리하였고, 메탄올 중 2M CaCl2 용액을 첨가했다. 샘플을 혼합하여, 세포 펠렛을 재현탁시켰다. 샘플을 35℃에서 1 hr 동안 교반과 함께 항온처리하였다. 샘플을 ELISA를 통해 분석하였고, 5M GdnSCN, pH 11 추출 대조군에 대해 상대적인 추출 효율(%)을 보고했다. 추정된 결정 부피 분율(CVF)은 먼저 결정 모티프에 잔류물을 할당하여 추정되었다. 결정 모티프는 알라닌, 글리신, 이소류신, 세린, 트레오닌 또는 발린으로만 구성된 6개 이상의 잔기의 임의의 인접 서열로 특정되며, 여기서 글리신은 또다른 글리신과 인접할 수 없다. 그런 다음, 결정질 모티프의 잔기 합을 총 잔기 수로 나누어, 추정된 결정 부피 분율을 계산했다.
결과
표 9에서는 P0 단백질을 비롯한, 다양한 실크 단백질의 MeOH 추출 효율에서 추정된 결정 부피 분율 퍼센트, 수분 함량 퍼센트, 그리고 CaCl2 퍼센트를 보여준다. 추출에 필요한 수분 함량은 실크 단백질에 의존적이었다. 물 함량에 대한 민감성 또한 실크 단백질에 의존적이었다. 최저 추출 효율은 72%이었다.
등가물(Equivalents)
본 발명이 특히 바람직한 구체예들과 다양한 대안적인 구체예들을 참조하여 도시되고 설명되었지만, 관련 기술 분야의 숙련자들은 본 발명의 정신 및 범위를 벗어나지 않고 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다.
본 명세서의 본문 내에 인용된 모든 참고 문헌, 등록된 특허 및 특허 출원은 모든 목적을 위해 전체적으로 참고로 포함된다.
서열 목록
SEQUENCE LISTING
<110> BOLT THREADS, INC.
<120> METHODS FOR IMPROVED EXTRACTION OF SPIDER SILK PROTEINS
<130> BTT-034WO
<140> PCT/US2020/047514
<141> 2020-08-21
<150> 62/890,473
<151> 2019-08-22
<160> 69
<170> PatentIn version 3.5
<210> 1
<211> 181
<212> PRT
<213> Aliatypus gulosus
<400> 1
Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser
1 5 10 15
Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala
20 25 30
Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe
35 40 45
Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser
50 55 60
Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg
65 70 75 80
Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala
85 90 95
Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala
100 105 110
Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu
115 120 125
Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala
130 135 140
Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser
145 150 155 160
Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly
165 170 175
Ala Gly Ser Ala Ser
180
<210> 2
<211> 126
<212> PRT
<213> Plectreurys tristis
<400> 2
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser
20 25 30
Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala
35 40 45
Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly
50 55 60
Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala
65 70 75 80
Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala
85 90 95
Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala
100 105 110
Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
115 120 125
<210> 3
<211> 239
<212> PRT
<213> Plectreurys tristis
<400> 3
Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala
1 5 10 15
Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys
20 25 30
Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln
35 40 45
Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln
50 55 60
Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe
65 70 75 80
Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser
85 90 95
Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro
100 105 110
Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala
115 120 125
Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala
130 135 140
Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser
145 150 155 160
Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser
165 170 175
Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro
180 185 190
Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala
195 200 205
Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln
210 215 220
Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser
225 230 235
<210> 4
<211> 182
<212> PRT
<213> Araneus gemmoides
<400> 4
Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly
1 5 10 15
Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser
20 25 30
Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser
35 40 45
Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala
50 55 60
Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser
65 70 75 80
Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser
85 90 95
Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser
100 105 110
Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr
115 120 125
Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser
130 135 140
Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser
145 150 155 160
Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala
165 170 175
Thr Ser Ile Ser Ala Val
180
<210> 5
<211> 180
<212> PRT
<213> Argiope aurantia
<400> 5
Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala
1 5 10 15
Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala
20 25 30
Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser
35 40 45
Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser
50 55 60
Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser
65 70 75 80
Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala
85 90 95
Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser
100 105 110
Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn
115 120 125
Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala
130 135 140
Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala
145 150 155 160
Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn
165 170 175
Ala Ala Asn Ala
180
<210> 6
<211> 199
<212> PRT
<213> Deinopis spinosa
<400> 6
Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly
1 5 10 15
Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser
20 25 30
Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala
35 40 45
Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln
50 55 60
Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala
65 70 75 80
Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly
85 90 95
Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val
100 105 110
Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser
115 120 125
Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu
130 135 140
Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala
145 150 155 160
Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr
165 170 175
Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln
180 185 190
Ala Val Thr Gly Val Gly Leu
195
<210> 7
<211> 171
<212> PRT
<213> Nephila clavipes
<400> 7
Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala
1 5 10 15
Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala
20 25 30
Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln
35 40 45
Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln
50 55 60
Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr
65 70 75 80
Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala
85 90 95
Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala
100 105 110
Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser
115 120 125
Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu
130 135 140
Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly
145 150 155 160
Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln
165 170
<210> 8
<211> 268
<212> PRT
<213> Argiope trifasciata
<400> 8
Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala
1 5 10 15
Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala
20 25 30
Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly
35 40 45
Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly
50 55 60
Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly
65 70 75 80
Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly
85 90 95
Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val
100 105 110
Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala
115 120 125
Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly
130 135 140
Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly
145 150 155 160
Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly
165 170 175
Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly
180 185 190
Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly
195 200 205
Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly
210 215 220
Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly
225 230 235 240
Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly
245 250 255
Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val
260 265
<210> 9
<211> 420
<212> PRT
<213> Nephila clavipes
<400> 9
Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly
1 5 10 15
Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro
20 25 30
Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr
35 40 45
Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly
50 55 60
Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro
65 70 75 80
Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly
85 90 95
Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly
100 105 110
Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr
115 120 125
Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly
130 135 140
Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro
145 150 155 160
Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly
165 170 175
Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly
180 185 190
Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala
195 200 205
Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly
210 215 220
Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly
225 230 235 240
Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr
245 250 255
Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro
260 265 270
Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly
275 280 285
Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro
290 295 300
Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly
305 310 315 320
Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr
325 330 335
Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro
340 345 350
Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly
355 360 365
Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro
370 375 380
Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr
385 390 395 400
Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly
405 410 415
Pro Tyr Gly Pro
420
<210> 10
<211> 376
<212> PRT
<213> Latrodectus hesperus
<400> 10
Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu
1 5 10 15
Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu
20 25 30
Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly
35 40 45
Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala
50 55 60
Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val
65 70 75 80
Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln
85 90 95
Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp
100 105 110
Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys
115 120 125
Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser
130 135 140
Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn
145 150 155 160
Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val
165 170 175
Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val
180 185 190
Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln
195 200 205
Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly
210 215 220
Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala
225 230 235 240
Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln
245 250 255
Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr
260 265 270
Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala
275 280 285
Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser
290 295 300
Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp
305 310 315 320
Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln
325 330 335
Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile
340 345 350
Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala
355 360 365
Pro Arg Leu Gly Ile Asp Leu Ser
370 375
<210> 11
<211> 200
<212> PRT
<213> Argiope trifasciata
<400> 11
Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly
1 5 10 15
Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe
20 25 30
Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala
35 40 45
Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser
50 55 60
Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser
65 70 75 80
Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val
85 90 95
Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu
100 105 110
Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala
115 120 125
Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly
130 135 140
Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln
145 150 155 160
Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser
165 170 175
Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser
180 185 190
Gln Ala Ser Ala Ser Ser Thr Ser
195 200
<210> 12
<211> 357
<212> PRT
<213> Uloborus diversus
<400> 12
Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala
1 5 10 15
Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln
20 25 30
Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr
35 40 45
Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe
50 55 60
Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val
65 70 75 80
Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser
85 90 95
Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr
100 105 110
Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile
115 120 125
Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu
130 135 140
Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu
145 150 155 160
Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile
165 170 175
Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala
180 185 190
Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln
195 200 205
Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser
210 215 220
Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile
225 230 235 240
Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly
245 250 255
Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser
260 265 270
Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe
275 280 285
Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr
290 295 300
Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser
305 310 315 320
Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile
325 330 335
Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu
340 345 350
Leu Ser Val Ser Ala
355
<210> 13
<211> 32
<212> PRT
<213> Euprosthenops australis
<400> 13
Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly
1 5 10 15
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
20 25 30
<210> 14
<211> 42
<212> PRT
<213> Tetragnatha kauaiensis
<400> 14
Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly
1 5 10 15
Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly
20 25 30
Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 15
<211> 42
<212> PRT
<213> Argiope aurantia
<400> 15
Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly
1 5 10 15
Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly
20 25 30
Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 16
<211> 46
<212> PRT
<213> Deinopis spinosa
<400> 16
Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly
1 5 10 15
Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln
20 25 30
Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala
35 40 45
<210> 17
<211> 42
<212> PRT
<213> Nephila clavata
<400> 17
Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly
1 5 10 15
Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly
20 25 30
Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 18
<211> 174
<212> PRT
<213> Deinopis spinosa
<400> 18
Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala
1 5 10 15
Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala
20 25 30
Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly
35 40 45
Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly
50 55 60
Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
85 90 95
Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala
115 120 125
Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala
130 135 140
Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala
145 150 155 160
Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly
165 170
<210> 19
<211> 149
<212> PRT
<213> Latrodectus hesperus
<400> 19
Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala
1 5 10 15
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly
20 25 30
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala
35 40 45
Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala
85 90 95
Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
100 105 110
Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala
115 120 125
Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
130 135 140
Gln Gly Gln Gly Ala
145
<210> 20
<211> 161
<212> PRT
<213> Nephila clavipes
<400> 20
Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly
1 5 10 15
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
20 25 30
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
35 40 45
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala
50 55 60
Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly
65 70 75 80
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
85 90 95
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
100 105 110
Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
115 120 125
Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
130 135 140
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala
145 150 155 160
Ala
<210> 21
<211> 186
<212> PRT
<213> Nephilengys cruentata
<400> 21
Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala
1 5 10 15
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala
20 25 30
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr
35 40 45
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
50 55 60
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
85 90 95
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala
100 105 110
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
115 120 125
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala
130 135 140
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
145 150 155 160
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
165 170 175
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
180 185
<210> 22
<211> 132
<212> PRT
<213> Uloborus diversus
<400> 22
Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser
20 25 30
Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln
35 40 45
Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr
50 55 60
Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly
65 70 75 80
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala
85 90 95
Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
115 120 125
Gly Ala Ala Ala
130
<210> 23
<211> 198
<212> PRT
<213> Uloborus diversus
<400> 23
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala
1 5 10 15
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly
20 25 30
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
35 40 45
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
65 70 75 80
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
85 90 95
Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
100 105 110
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr
115 120 125
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
130 135 140
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly
145 150 155 160
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
165 170 175
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
180 185 190
Ala Ala Ala Ser Ser Ala
195
<210> 24
<211> 190
<212> PRT
<213> Araneus ventricosus
<400> 24
Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
1 5 10 15
Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
20 25 30
Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala
35 40 45
Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly
50 55 60
Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala
65 70 75 80
Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala
85 90 95
Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala
100 105 110
Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu
115 120 125
Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly
130 135 140
Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly
145 150 155 160
Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly
165 170 175
Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala
180 185 190
<210> 25
<211> 166
<212> PRT
<213> Dolomedes tenebrosus
<400> 25
Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr
1 5 10 15
Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly
20 25 30
Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly
35 40 45
Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
50 55 60
Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly
65 70 75 80
Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala
85 90 95
Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly
100 105 110
Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
115 120 125
Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly
130 135 140
Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala
145 150 155 160
Ala Ser Ala Ala Ala Ala
165
<210> 26
<211> 177
<212> PRT
<213> Nephilengys cruentata
<400> 26
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
20 25 30
Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala
35 40 45
Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala
50 55 60
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
65 70 75 80
Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
85 90 95
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
100 105 110
Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
115 120 125
Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
130 135 140
Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln
145 150 155 160
Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
165 170 175
Ala
<210> 27
<211> 174
<212> PRT
<213> Nephilengys cruentata
<400> 27
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
20 25 30
Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala
35 40 45
Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala
50 55 60
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
65 70 75 80
Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
85 90 95
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly
100 105 110
Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
115 120 125
Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala
130 135 140
Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly
145 150 155 160
Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
165 170
<210> 28
<211> 22
<212> PRT
<213> Saccharomyces cerevisiae
<400> 28
Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser
1 5 10 15
Ala Asn Gln Val Ala Ala
20
<210> 29
<211> 23
<212> PRT
<213> Pichia pastoris
<400> 29
Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu
1 5 10 15
Leu Thr Asn Ile Val Ser Gly
20
<210> 30
<211> 20
<212> PRT
<213> Pichia pastoris
<400> 30
Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala
1 5 10 15
Val Val Ser Ala
20
<210> 31
<211> 18
<212> PRT
<213> Gallus gallus
<400> 31
Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala
1 5 10 15
Leu Gly
<210> 32
<400> 32
000
<210> 33
<211> 89
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Asp Lys Arg Glu Ala Glu Ala
85
<210> 34
<211> 89
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala
85
<210> 35
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser
1 5 10 15
Ala Asn Gln Val Ala Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu
20 25 30
Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu
35 40 45
Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn
50 55 60
Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu
65 70 75 80
Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 36
<211> 93
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 36
Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu
1 5 10 15
Leu Thr Asn Ile Val Ser Gly Ala Pro Val Asn Thr Thr Thr Glu Asp
20 25 30
Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu
35 40 45
Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn
50 55 60
Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys
65 70 75 80
Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 37
<211> 90
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala
1 5 10 15
Val Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala
20 25 30
Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp
35 40 45
Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu
50 55 60
Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly
65 70 75 80
Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 38
<211> 88
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 38
Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala
1 5 10 15
Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile
20 25 30
Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp
35 40 45
Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe
50 55 60
Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser
65 70 75 80
Leu Glu Lys Arg Glu Ala Glu Ala
85
<210> 39
<211> 1416
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 39
Gly Gly Tyr Gly Pro Gly Gln Arg Ala Gly Pro Gly Gln Gly Ala Gly
1 5 10 15
Pro Gly Gln Gly Val Gly Pro Gly Gln Gly Val Gly Thr Gly Gly Gln
20 25 30
Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly
35 40 45
Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Ala Gln Gly Ala Gly Pro
50 55 60
Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Thr Ser Ala Gly
65 70 75 80
Thr Ser Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala
85 90 95
Ser Gly Pro Thr Ala Asp Lys Tyr Gly Pro Gly Ile Gly Arg Tyr Ala
100 105 110
Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala Ser Ala Thr
115 120 125
Thr Val Asn Asn Gly Pro Gln Ile Gly Gly Tyr Gly Pro Gly Gln Gly
130 135 140
Ile Gly Pro Ala Ala Thr Ser Ala Pro Gly Ala Ser Gly Tyr Gly Pro
145 150 155 160
Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly
165 170 175
Ala Gly Pro Trp Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro Gly
180 185 190
Gly Gln Gly Ser Gly Ala Ser Ser Glu Ala Ala Ala Ser Ala Gly Thr
195 200 205
Ser Ala Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala
210 215 220
Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Arg Ala Ala Ala Ser
225 230 235 240
Ala Gly Thr Arg Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly
245 250 255
Pro Ala Ser Gly Pro Thr Ala Ala Tyr Lys Tyr Gly Pro Gly Ile Gly
260 265 270
Gly Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala
275 280 285
Ser Ala Thr Thr Val Asp Ile Gly Pro Gln Val Gly Gly Tyr Gly Pro
290 295 300
Gly Gln Gly Ile Ala Pro Ala Ala Ala Ala Pro Gly Ser Ser Gly Tyr
305 310 315 320
Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly
325 330 335
Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr
340 345 350
Ser Gly Tyr Gly Ser Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala
355 360 365
Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly Gln
370 375 380
Gly Ala Gly Leu Gly Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro
385 390 395 400
Gly Gly Gln Gly Ser Gly Ala Ser Thr Ala Ala Ala Ala Ser Ala Gly
405 410 415
Thr Ser Gly Tyr Ala Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly
420 425 430
Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly
435 440 445
Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser
450 455 460
Gly Ala Ser Ser Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Gln Arg
465 470 475 480
Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly
485 490 495
Gln Gly Val Gly Thr Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala
500 505 510
Ala Ala Ser Ala Gly Thr Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr
515 520 525
Gly Pro Ala Gln Gly Ala Gly Pro Gly Gly Gln Gly Thr Gly Ala Ser
530 535 540
Ser Ala Ala Ala Thr Ser Ala Gly Thr Ser Gly Tyr Gly Pro Gly Tyr
545 550 555 560
Pro Gly Tyr Gly Gln Gly Pro Ala Ser Gly Pro Thr Ala Asp Lys Tyr
565 570 575
Gly Pro Gly Ile Gly Arg Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr
580 585 590
Ser Ala Ala Thr Ala Ser Ala Thr Thr Val Asn Asn Gly Pro Gln Ile
595 600 605
Gly Gly Tyr Gly Pro Gly Gln Gly Ile Gly Pro Ala Ala Thr Ser Ala
610 615 620
Pro Gly Ala Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly
625 630 635 640
Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Trp Gln Gly Val Gly
645 650 655
Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser
660 665 670
Glu Ala Ala Ala Ser Ala Gly Thr Ser Ala Tyr Gly Pro Gly Val Ser
675 680 685
Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly
690 695 700
Ala Ser Ser Arg Ala Ala Ala Ser Ala Gly Thr Arg Gly Tyr Gly Pro
705 710 715 720
Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala Ser Gly Pro Thr Ala Ala
725 730 735
Tyr Lys Tyr Gly Pro Gly Ile Gly Gly Tyr Ala Pro Gly Arg Ser Thr
740 745 750
Thr Ser Thr Ser Ala Ala Thr Ala Ser Ala Thr Thr Val Asp Ile Gly
755 760 765
Pro Gln Val Gly Gly Tyr Gly Pro Gly Gln Gly Ile Ala Pro Ala Ala
770 775 780
Ala Ala Pro Gly Ser Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly
785 790 795 800
Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Thr Gly Ala Ser Ser
805 810 815
Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Gly Ser Gly Val Ser
820 825 830
Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro
835 840 845
Gly Gln Gly Val Gly Pro Gly Gln Gly Ala Gly Leu Gly Gln Gly Val
850 855 860
Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser
865 870 875 880
Thr Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Ala Pro Gly Val
885 890 895
Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly
900 905 910
Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly Gln Gly
915 920 925
Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Ala Ala Ala Ala
930 935 940
Gly Gly Tyr Gly Pro Gly Gln Arg Ala Gly Pro Gly Gln Gly Ala Gly
945 950 955 960
Pro Gly Gln Gly Val Gly Pro Gly Gln Gly Val Gly Thr Gly Gly Gln
965 970 975
Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly
980 985 990
Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Ala Gln Gly Ala Gly Pro
995 1000 1005
Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Thr Ser Ala
1010 1015 1020
Gly Thr Ser Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly
1025 1030 1035
Pro Ala Ser Gly Pro Thr Ala Asp Lys Tyr Gly Pro Gly Ile Gly
1040 1045 1050
Arg Tyr Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr
1055 1060 1065
Ala Ser Ala Thr Thr Val Asn Asn Gly Pro Gln Ile Gly Gly Tyr
1070 1075 1080
Gly Pro Gly Gln Gly Ile Gly Pro Ala Ala Thr Ser Ala Pro Gly
1085 1090 1095
Ala Ser Gly Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln
1100 1105 1110
Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Trp Gln Gly Val Gly
1115 1120 1125
Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser
1130 1135 1140
Ser Glu Ala Ala Ala Ser Ala Gly Thr Ser Ala Tyr Gly Pro Gly
1145 1150 1155
Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gly Gln
1160 1165 1170
Gly Ser Gly Ala Ser Ser Arg Ala Ala Ala Ser Ala Gly Thr Arg
1175 1180 1185
Gly Tyr Gly Pro Gly Tyr Pro Gly Tyr Gly Gln Gly Pro Ala Ser
1190 1195 1200
Gly Pro Thr Ala Ala Tyr Lys Tyr Gly Pro Gly Ile Gly Gly Tyr
1205 1210 1215
Ala Pro Gly Arg Ser Thr Thr Ser Thr Ser Ala Ala Thr Ala Ser
1220 1225 1230
Ala Thr Thr Val Asp Ile Gly Pro Gln Val Gly Gly Tyr Gly Pro
1235 1240 1245
Gly Gln Gly Ile Ala Pro Ala Ala Ala Ala Pro Gly Ser Ser Gly
1250 1255 1260
Tyr Gly Pro Gly Val Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly
1265 1270 1275
Pro Gly Gly Gln Gly Thr Gly Ala Ser Ser Ala Ala Ala Ala Ser
1280 1285 1290
Ala Gly Thr Ser Gly Tyr Gly Ser Gly Val Ser Gly Tyr Gly Pro
1295 1300 1305
Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly
1310 1315 1320
Val Gly Pro Gly Gln Gly Ala Gly Leu Gly Gln Gly Val Gly Pro
1325 1330 1335
Gly Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Thr
1340 1345 1350
Ala Ala Ala Ala Ser Ala Gly Thr Ser Gly Tyr Ala Pro Gly Val
1355 1360 1365
Ser Gly Tyr Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Ala
1370 1375 1380
Gly Pro Gly Gln Gly Ala Gly Pro Gly Gln Gly Val Gly Pro Gly
1385 1390 1395
Gln Gly Ala Gly Pro Gly Gly Gln Gly Ser Gly Ala Ser Ser Ala
1400 1405 1410
Ala Ala Ala
1415
<210> 40
<211> 840
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 40
Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr
1 5 10 15
Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala
20 25 30
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro
35 40 45
Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro
50 55 60
Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr
65 70 75 80
Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala
85 90 95
Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly
100 105 110
Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly
115 120 125
Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala
130 135 140
Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly
145 150 155 160
Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr
165 170 175
Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu
180 185 190
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala
195 200 205
Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala
210 215 220
Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly
225 230 235 240
Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly
245 250 255
Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser
260 265 270
Ser Ser Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Arg Gln Asn
275 280 285
Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Thr Ala Asp Tyr
290 295 300
Gly Gln Lys Gln Val Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser
305 310 315 320
Ala Gly Gly Tyr Thr Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gly
325 330 335
Ala Val Ala Gly Gly Tyr Gly Pro Gly Ala Gly Ser Tyr Gly Ala Gly
340 345 350
Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Ala Gly Thr Ala Ala
355 360 365
Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro
370 375 380
Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ser Ala Gly Gln
385 390 395 400
Gly Ala Gly Gly Tyr Arg Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser
405 410 415
Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr
420 425 430
Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Ala Gly Gln Gly Ala Gly
435 440 445
Gly Tyr Gly Gln Gly Ala Gly Thr Ala Thr Ser Thr Ala Thr Gly Ala
450 455 460
Gly Thr Gly Gly Tyr Gly Arg Leu Ala Gly Gly Tyr Gly Gln Gly Ala
465 470 475 480
Gly Gly Tyr Gly Gln Ala Ala Ala Gly Ala Ala Ala Asp Ala Thr Ala
485 490 495
Gly Ala Gly Gly Tyr Asp Arg Ala Thr Gly Ala Phe Gly Pro Ser Thr
500 505 510
Arg Arg Ala Ala Gly Gly Ser Gly Leu Gly Ala Gly Thr Ala Pro Gly
515 520 525
Ala Phe Ser Gly Ser Gly Ala Gly Gly Lys Gly Pro Gly Asp Tyr Gly
530 535 540
Ser Ser Gln Gly Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ser
545 550 555 560
Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr
565 570 575
Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala
580 585 590
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro
595 600 605
Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro
610 615 620
Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr
625 630 635 640
Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala
645 650 655
Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly
660 665 670
Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly
675 680 685
Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala
690 695 700
Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly
705 710 715 720
Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr
725 730 735
Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu
740 745 750
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala
755 760 765
Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala
770 775 780
Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly
785 790 795 800
Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly
805 810 815
Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser
820 825 830
Ser Ser Ala Ala Ala Ala Ala Ser
835 840
<210> 41
<211> 840
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 41
Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr
1 5 10 15
Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala
20 25 30
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro
35 40 45
Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro
50 55 60
Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr
65 70 75 80
Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala
85 90 95
Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly
100 105 110
Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly
115 120 125
Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala
130 135 140
Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly
145 150 155 160
Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr
165 170 175
Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu
180 185 190
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala
195 200 205
Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala
210 215 220
Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly
225 230 235 240
Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly
245 250 255
Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser
260 265 270
Ser Ser Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Arg Gln Asn
275 280 285
Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Thr Ala Asp Tyr
290 295 300
Gly Gln Lys Gln Val Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser
305 310 315 320
Ala Gly Gly Tyr Thr Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gly
325 330 335
Ala Val Ala Gly Gly Tyr Gly Pro Gly Ala Gly Ser Tyr Gly Ala Gly
340 345 350
Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Ala Gly Thr Ala Ala
355 360 365
Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro
370 375 380
Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ser Ala Gly Gln
385 390 395 400
Gly Ala Gly Gly Tyr Arg Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser
405 410 415
Ala Ser Ala Gly Ala Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr
420 425 430
Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Ala Gly Gln Gly Ala Gly
435 440 445
Gly Tyr Gly Gln Gly Ala Gly Thr Ala Thr Ser Thr Ala Thr Gly Ala
450 455 460
Gly Thr Gly Gly Tyr Gly Arg Leu Ala Gly Gly Tyr Gly Gln Gly Ala
465 470 475 480
Gly Gly Tyr Gly Gln Ala Ala Ala Gly Ala Ala Ala Asp Ala Thr Ala
485 490 495
Gly Ala Gly Gly Tyr Asp Arg Ala Thr Gly Ala Phe Gly Pro Ser Thr
500 505 510
Arg Arg Ala Ala Gly Gly Ser Gly Leu Gly Ala Gly Thr Ala Pro Gly
515 520 525
Ala Phe Ser Gly Ser Gly Ala Gly Gly Lys Gly Pro Gly Asp Tyr Gly
530 535 540
Ser Ser Gln Gly Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ser
545 550 555 560
Gly Gly Tyr Thr Gln Arg Gln Asn Glu Val Ile Thr Thr Val Ser Thr
565 570 575
Thr Arg Gln Lys Thr Ala Asp Tyr Gly Gln Lys Gln Val Ser Gly Ala
580 585 590
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Thr Gln Gly Pro
595 600 605
Gly Gly Tyr Gly Pro Gly Gln Gly Ala Val Ala Gly Gly Tyr Gly Pro
610 615 620
Gly Ala Gly Ser Tyr Gly Ala Gly Ala Ile Asp Ala Ser Gly Gly Tyr
625 630 635 640
Gly Gln Gly Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala
645 650 655
Gly Ala Ala Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly
660 665 670
Gly Tyr Gly Gln Ser Ala Gly Gln Gly Ala Gly Gly Tyr Arg Gln Gly
675 680 685
Ala Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ala Gly Ala Ala
690 695 700
Thr Gly Val Gly Pro Gly Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly
705 710 715 720
Gln Ala Ala Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Thr
725 730 735
Ala Thr Ser Thr Ala Thr Gly Ala Gly Thr Gly Gly Tyr Gly Arg Leu
740 745 750
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Ala Ala Ala
755 760 765
Gly Ala Ala Ala Asp Ala Thr Ala Gly Ala Gly Gly Tyr Asp Arg Ala
770 775 780
Thr Gly Ala Phe Gly Pro Ser Thr Arg Arg Ala Ala Gly Gly Ser Gly
785 790 795 800
Leu Gly Ala Gly Thr Ala Pro Gly Ala Phe Ser Gly Ser Gly Ala Gly
805 810 815
Gly Lys Gly Pro Gly Asp Tyr Gly Ser Ser Gln Gly Ala Ser Ala Ser
820 825 830
Ser Ser Ala Ala Ala Ala Ala Ser
835 840
<210> 42
<211> 885
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 42
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
20 25 30
Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala
35 40 45
Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala
50 55 60
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
65 70 75 80
Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
85 90 95
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
100 105 110
Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
115 120 125
Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
130 135 140
Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln
145 150 155 160
Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
165 170 175
Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly
180 185 190
Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
195 200 205
Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly
210 215 220
Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly
225 230 235 240
Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
245 250 255
Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala
260 265 270
Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly
275 280 285
Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly
290 295 300
Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala
305 310 315 320
Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly
325 330 335
Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
340 345 350
Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln
355 360 365
Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
370 375 380
Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser
385 390 395 400
Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala
405 410 415
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
420 425 430
Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala
435 440 445
Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln
450 455 460
Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala
465 470 475 480
Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala
485 490 495
Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser
500 505 510
Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala
515 520 525
Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly
530 535 540
Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly
545 550 555 560
Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala
565 570 575
Ser Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly
580 585 590
Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr
595 600 605
Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala
610 615 620
Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly
625 630 635 640
Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly
645 650 655
Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala
660 665 670
Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
675 680 685
Ser Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala
690 695 700
Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
705 710 715 720
Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
725 730 735
Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
740 745 750
Ala Ser Gly Ala Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln
755 760 765
Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly
770 775 780
Tyr Gly Gly Leu Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala
785 790 795 800
Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly
805 810 815
Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly
820 825 830
Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala
835 840 845
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
850 855 860
Gly Ser Gly Gln Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala
865 870 875 880
Ala Ala Ala Ala Ala
885
<210> 43
<211> 996
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 43
Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly
1 5 10 15
Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala
20 25 30
Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser
35 40 45
Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr
50 55 60
Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser
65 70 75 80
Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala
85 90 95
Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr
100 105 110
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr
115 120 125
Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala
130 135 140
Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala
145 150 155 160
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg
165 170 175
Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala
180 185 190
Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly
195 200 205
Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala
210 215 220
Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
225 230 235 240
Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala
245 250 255
Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu
260 265 270
Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
275 280 285
Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr
290 295 300
Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly
305 310 315 320
Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly
325 330 335
Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu
340 345 350
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser
355 360 365
Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala
370 375 380
Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly
385 390 395 400
Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr
405 410 415
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser
420 425 430
Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala
435 440 445
Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser
450 455 460
Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly
465 470 475 480
Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala
485 490 495
Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly
500 505 510
Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala
515 520 525
Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg
530 535 540
Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly
545 550 555 560
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala
565 570 575
Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
580 585 590
Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr
595 600 605
Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly
610 615 620
Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly
625 630 635 640
Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr
645 650 655
Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Ser Gly Ala Ser
660 665 670
Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn Ser Glu Gln Gly Gly Tyr
675 680 685
Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala Gly Ser Gly Ala Gly Gly
690 695 700
Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala Glu Ala Thr Ala Gly Ala
705 710 715 720
Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
725 730 735
Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly Asp Tyr Gly Arg Gly Ala
740 745 750
Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr Ser Ser Ala Gly Gly Tyr
755 760 765
Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala Ala Ala Ala Ala Gly Ala
770 775 780
Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg Gly Ser Gly Gly Ala Gly
785 790 795 800
Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala Asp Gly Ala Gly Gly Tyr
805 810 815
Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala Gly Ala Gly Ala Gly Gly
820 825 830
Tyr Gly Ser Gly Ala Ser Ala Arg Ala Ala Ala Gly Ala Gly Gly Asn
835 840 845
Ser Glu Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Thr Ala
850 855 860
Gly Ser Gly Ala Gly Gly Ala Gly Ser Tyr Arg Arg Gly Ser Gly Ala
865 870 875 880
Glu Ala Thr Ala Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Gly
885 890 895
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Asp Ala Gly Ser Ala Gly
900 905 910
Asp Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Glu Ala Gly Thr
915 920 925
Ser Ser Ala Gly Gly Tyr Gly Glu Gln Gly Gly Tyr Gly Thr Gly Ala
930 935 940
Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Ala Gly Gly Tyr Gly Arg
945 950 955 960
Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Pro Gly Ala Ala Gly Ala
965 970 975
Asp Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Asp Ala Gly Ala
980 985 990
Gly Ala Gly Ala
995
<210> 44
<211> 1104
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 44
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
1 5 10 15
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
20 25 30
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
35 40 45
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
65 70 75 80
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
85 90 95
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
100 105 110
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
115 120 125
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
130 135 140
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
145 150 155 160
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
165 170 175
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
180 185 190
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
195 200 205
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
210 215 220
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
225 230 235 240
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
245 250 255
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
260 265 270
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala
275 280 285
Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr
290 295 300
Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala
305 310 315 320
Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala
325 330 335
Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln
340 345 350
Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala
355 360 365
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
370 375 380
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
385 390 395 400
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
405 410 415
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
420 425 430
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
435 440 445
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
450 455 460
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
465 470 475 480
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
485 490 495
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
500 505 510
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
515 520 525
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
530 535 540
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
545 550 555 560
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
565 570 575
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
580 585 590
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
595 600 605
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
610 615 620
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
625 630 635 640
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala
645 650 655
Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr
660 665 670
Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala
675 680 685
Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala
690 695 700
Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln
705 710 715 720
Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala
725 730 735
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
740 745 750
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
755 760 765
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
770 775 780
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
785 790 795 800
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
805 810 815
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
820 825 830
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
835 840 845
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
850 855 860
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
865 870 875 880
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
885 890 895
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
900 905 910
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
915 920 925
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
930 935 940
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
945 950 955 960
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
965 970 975
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
980 985 990
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
995 1000 1005
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val
1010 1015 1020
Ala Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly
1025 1030 1035
Val Tyr Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp
1040 1045 1050
Thr Gly Ala Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro
1055 1060 1065
Gly Ser Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr
1070 1075 1080
Gly Pro Gly Ser Gln Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser
1085 1090 1095
Ser Ala Ala Ala Gly Ala
1100
<210> 45
<211> 1104
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 45
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
1 5 10 15
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
20 25 30
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
35 40 45
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
65 70 75 80
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
85 90 95
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
100 105 110
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
115 120 125
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
130 135 140
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
145 150 155 160
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
165 170 175
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
180 185 190
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
195 200 205
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
210 215 220
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
225 230 235 240
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
245 250 255
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
260 265 270
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala
275 280 285
Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr
290 295 300
Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala
305 310 315 320
Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala
325 330 335
Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln
340 345 350
Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala
355 360 365
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
370 375 380
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
385 390 395 400
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
405 410 415
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
420 425 430
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
435 440 445
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
450 455 460
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
465 470 475 480
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
485 490 495
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
500 505 510
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
515 520 525
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
530 535 540
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
545 550 555 560
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
565 570 575
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
580 585 590
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
595 600 605
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
610 615 620
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
625 630 635 640
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val Ala
645 650 655
Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly Val Tyr
660 665 670
Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp Thr Gly Ala
675 680 685
Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro Gly Ser Gly Ala
690 695 700
Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Pro Gly Ser Gln
705 710 715 720
Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser Ser Ala Ala Ala Gly Ala
725 730 735
Gly Gly Tyr Gly Gln Gly Ser Gly Gly Tyr Gly Gln Asn Ala Gly Ala
740 745 750
Ala Ala Gly Ser Gly Ala Asn Gly Gln Gly Ala Gly Gly Tyr Gly Gln
755 760 765
Gly Ala Ala Ala Val Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
770 775 780
Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala Gly Gly Tyr Gly Gln Gly
785 790 795 800
Ala Gly Gly Asn Gly Gln Gly Val Val Asp Ala Ala Gly Tyr Gly Pro
805 810 815
Gly Ser Gln Gly Tyr Gly Gln Ser Ala Ala Ala Thr Ser Ser Ala Ala
820 825 830
Ala Gly Ala Ser Ala Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val
835 840 845
Thr Thr Val Thr Thr Thr Arg Gln Glu Thr Ala Asp Arg Arg Gln Ala
850 855 860
Ala Arg Ala Ser Ala Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly
865 870 875 880
Gln Gly Thr Arg Gly Tyr Gly Gln Val Pro Gly Ala Ala Ala Gly Ala
885 890 895
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ala Val
900 905 910
Gly Ser Ser Ala Gly Ser Gly Val Ala Gly Tyr Gly Gln Gly Ser Gly
915 920 925
Gly Tyr Gly Gln Ser Ala Ala Ala Ala Ala Gly Ala Gly Ala Tyr Gly
930 935 940
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Gly Ser
945 950 955 960
Gly Ala Gly Gly Cys Gly Gln Gly Ala Gly Gly Tyr Gly Gln Asp Ala
965 970 975
Gly Ala Ala Ala Gly Ala Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
980 985 990
Gly Ala Ala Ser Gly Val Ala Thr Gly Thr Gly Ala Gly Gly Tyr Gly
995 1000 1005
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Ser Ala Thr Ala Val
1010 1015 1020
Ala Ala Ala Gly Ala Gly Ala Gly Ile Ile Gly Gln Gly Ala Gly
1025 1030 1035
Val Tyr Gly Gln Ser Ala Val Ser Ala Ala Gly Ala Ala Gly Asp
1040 1045 1050
Thr Gly Ala Gly Gly Tyr Gly Gln Ser Thr Gly Gly Tyr Gly Pro
1055 1060 1065
Gly Ser Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Gly Tyr
1070 1075 1080
Gly Pro Gly Ser Gln Gly Tyr Gly Gln Gly Ala Ala Ser Thr Ser
1085 1090 1095
Ser Ala Ala Ala Gly Ala
1100
<210> 46
<211> 930
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 46
Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr
1 5 10 15
Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala
20 25 30
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro
35 40 45
Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly
50 55 60
Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser
65 70 75 80
Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser
85 90 95
Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly
100 105 110
Gln Gly Val Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly
115 120 125
Ala Ala Thr Gly Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly
130 135 140
Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
145 150 155 160
Gly Ala Ala Thr Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly
165 170 175
Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala
180 185 190
Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe
195 200 205
Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly
210 215 220
Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr
225 230 235 240
Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val
245 250 255
Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala
260 265 270
Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly
275 280 285
Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala
290 295 300
Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val
305 310 315 320
Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln
325 330 335
Lys Gln Ala Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser Ala Gly
340 345 350
Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly
355 360 365
Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly
370 375 380
Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala
385 390 395 400
Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp
405 410 415
Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly Thr Ala Ala Gly Ala Ser
420 425 430
Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly Val Gly Pro Val Gly Tyr
435 440 445
Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly
450 455 460
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Val Thr Val Thr Ala Ala
465 470 475 480
Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val
485 490 495
Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly
500 505 510
Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala
515 520 525
Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly
530 535 540
Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr
545 550 555 560
Gly Gln Gly Ala Gly Val Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala
565 570 575
Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala
580 585 590
Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala
595 600 605
Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr
610 615 620
Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys
625 630 635 640
Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala Ser Ala Ala Val
645 650 655
Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly
660 665 670
Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr
675 680 685
Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly
690 695 700
Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr
705 710 715 720
Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly
725 730 735
Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly
740 745 750
Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala
755 760 765
Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr
770 775 780
Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly
785 790 795 800
Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala
805 810 815
Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly
820 825 830
Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu
835 840 845
Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr
850 855 860
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val Ser Gly Ala Gly
865 870 875 880
Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala
885 890 895
Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr
900 905 910
Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala
915 920 925
Ala Ser
930
<210> 47
<211> 930
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 47
Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr
1 5 10 15
Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala
20 25 30
Ser Ala Ala Val Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro
35 40 45
Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly
50 55 60
Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser
65 70 75 80
Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser
85 90 95
Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly
100 105 110
Gln Gly Val Gly Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly
115 120 125
Ala Ala Thr Gly Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly
130 135 140
Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
145 150 155 160
Gly Ala Ala Thr Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly
165 170 175
Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala
180 185 190
Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe
195 200 205
Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly
210 215 220
Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr
225 230 235 240
Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val
245 250 255
Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala
260 265 270
Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly
275 280 285
Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala
290 295 300
Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr Gln Lys Gln Asn Glu Val
305 310 315 320
Ile Thr Thr Val Ser Thr Thr Arg Gln Lys Ile Ala Asp Tyr Gly Gln
325 330 335
Lys Gln Ala Ser Gly Ala Ser Ala Ala Val Ser Thr Ser Ser Ala Gly
340 345 350
Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly Pro Gly Lys Gly Ala Gly
355 360 365
Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr Ser Gln Gly Pro Gly Gly
370 375 380
Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly Ala Ala Ile Ala Gly Ala
385 390 395 400
Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr Gly Gln Gly Ala Ile Asp
405 410 415
Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly Thr Ala Ala Gly Ala Ser
420 425 430
Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly Val Gly Pro Val Gly Tyr
435 440 445
Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala Val Gly Gln Gly Ala Gly
450 455 460
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr Val Thr Val Thr Ala Ala
465 470 475 480
Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly Gly Tyr Gly Gln Gly Val
485 490 495
Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala Gly Ile Gly Gly Tyr Gly
500 505 510
Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly Ala Ala Ala Ser Ala Ala
515 520 525
Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu Gly Ala Gly Gly Tyr Gly
530 535 540
Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr Ala Gly Ala Gly Gly Tyr
545 550 555 560
Gly Gln Gly Ala Gly Val Ser Gly Ala Gly Ser Arg Gly Ala Pro Ala
565 570 575
Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala Gly Ala Thr Ser Gly Ala
580 585 590
Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr Gly Pro Ser Gln Val Ala
595 600 605
Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala Ala Ser Gly Gly Tyr Thr
610 615 620
Gln Lys Gln Asn Glu Val Ile Thr Thr Val Ser Thr Thr Arg Gln Lys
625 630 635 640
Ile Ala Asp Tyr Gly Gln Lys Gln Ala Ser Gly Ala Ser Ala Ala Val
645 650 655
Ser Thr Ser Ser Ala Gly Gly Tyr Ala Gln Gly Pro Gly Gly Tyr Gly
660 665 670
Pro Gly Lys Gly Ala Gly Ala Thr Thr Gly Ala Gly Ala Arg Gly Tyr
675 680 685
Ser Gln Gly Pro Gly Gly Tyr Ala Gln Gly Val Ser Thr Ala Ala Gly
690 695 700
Ala Ala Ile Ala Gly Ala Gly Gly Tyr Gly Pro Ser Thr Gly Pro Tyr
705 710 715 720
Gly Gln Gly Ala Ile Asp Ala Ser Gly Gly Tyr Gly Gln Gly Val Gly
725 730 735
Thr Ala Ala Gly Ala Ser Ala Ser Ala Gly Ser Gly Ala Ala Thr Gly
740 745 750
Val Gly Pro Val Gly Tyr Gly Gln Gly Leu Gly Gly Tyr Gly Gln Ala
755 760 765
Val Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Thr
770 775 780
Val Thr Val Thr Ala Ala Val Pro Gly Gly Tyr Gly Pro Gly Ala Gly
785 790 795 800
Gly Tyr Gly Gln Gly Val Gly Ala Ala Ala Gly Ala Gly Thr Asp Ala
805 810 815
Gly Ile Gly Gly Tyr Gly Gln Gly Ala Gly Gly Phe Gly Gln Gly Gly
820 825 830
Ala Ala Ala Ser Ala Ala Thr Gly Ala Gly Pro Gly Gly Tyr Gly Leu
835 840 845
Gly Ala Gly Gly Tyr Gly Gln Pro Ile Gly Ala Thr Ala Gly Ala Thr
850 855 860
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Val Ser Gly Ala Gly
865 870 875 880
Ser Arg Gly Ala Pro Ala Gly Tyr Gly Pro Gly Ala Gly Pro Ala Ala
885 890 895
Gly Ala Thr Ser Gly Ala Val Ala Gly Gly Lys Gly Pro Gly Gly Tyr
900 905 910
Gly Pro Ser Gln Val Ala Ser Ala Ser Ser Ser Ala Ala Ala Ala Ala
915 920 925
Ala Ser
930
<210> 48
<211> 740
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 48
Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly
1 5 10 15
Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr
20 25 30
Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala
35 40 45
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
50 55 60
Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly
65 70 75 80
Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala
85 90 95
Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
100 105 110
Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala
115 120 125
Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
130 135 140
Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly
145 150 155 160
Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg
165 170 175
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly
180 185 190
Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr
195 200 205
Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly
210 215 220
Ala Gly Ala Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala
225 230 235 240
Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly
245 250 255
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala
260 265 270
Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
275 280 285
Gly Tyr Gly Gln Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly
290 295 300
Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala
305 310 315 320
Ala Ile Ala Arg Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
325 330 335
Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly
340 345 350
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly
355 360 365
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Arg Gly Tyr Gly Gln
370 375 380
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala
385 390 395 400
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala
405 410 415
Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly
420 425 430
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Gly Tyr Gly
435 440 445
Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala
450 455 460
Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr Gly Gln Gly Ala
465 470 475 480
Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala
485 490 495
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
500 505 510
Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Arg
515 520 525
Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala
530 535 540
Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
545 550 555 560
Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ser Ala Gly Ala
565 570 575
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala
580 585 590
Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala Gly
595 600 605
Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly Tyr
610 615 620
Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala
625 630 635 640
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
645 650 655
Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly
660 665 670
Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala
675 680 685
Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
690 695 700
Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala
705 710 715 720
Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
725 730 735
Gly Gln Gly Ala
740
<210> 49
<211> 972
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 49
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
1 5 10 15
Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly
20 25 30
Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly Val Gly Glu Tyr
35 40 45
Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly
50 55 60
Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly
65 70 75 80
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala
85 90 95
Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
100 105 110
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
115 120 125
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala
130 135 140
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
145 150 155 160
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
165 170 175
Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ser Gly
180 185 190
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
195 200 205
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ser Thr Gly Ala
210 215 220
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
225 230 235 240
Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly
245 250 255
Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser Ser Ala Ala Ala
260 265 270
Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val Thr
275 280 285
Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg Arg Gln Ala Ala
290 295 300
Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly Gln
305 310 315 320
Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
325 330 335
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
340 345 350
Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly
355 360 365
Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
370 375 380
Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln
385 390 395 400
Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
405 410 415
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly
420 425 430
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala
435 440 445
Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
450 455 460
Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
465 470 475 480
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala
485 490 495
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala
500 505 510
Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
515 520 525
Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
530 535 540
Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
545 550 555 560
Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly
565 570 575
Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser
580 585 590
Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn
595 600 605
Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg
610 615 620
Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala
625 630 635 640
Gly Tyr Gly Gln Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly
645 650 655
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala
660 665 670
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala
675 680 685
Ala Gly Ala Gly Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
690 695 700
Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
705 710 715 720
Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
725 730 735
Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly
740 745 750
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala
755 760 765
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
770 775 780
Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala
785 790 795 800
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
805 810 815
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala
820 825 830
Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala
835 840 845
Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln
850 855 860
Gly Ala Gly Ala Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
865 870 875 880
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala
885 890 895
Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala
900 905 910
Ala Ala Thr Ser Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr
915 920 925
Glu Arg Gln Asn Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu
930 935 940
Ile Ala Asp Arg Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr
945 950 955 960
Ser Ala Ala Ala Gly Tyr Gly Gln Gly Ala Gly Thr
965 970
<210> 50
<211> 972
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 50
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
1 5 10 15
Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly
20 25 30
Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly Val Gly Glu Tyr
35 40 45
Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly
50 55 60
Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly
65 70 75 80
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala
85 90 95
Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
100 105 110
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
115 120 125
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala
130 135 140
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
145 150 155 160
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
165 170 175
Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ser Gly
180 185 190
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
195 200 205
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ser Thr Gly Ala
210 215 220
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
225 230 235 240
Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly
245 250 255
Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser Ser Ala Ala Ala
260 265 270
Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn Glu Val Val Thr
275 280 285
Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg Arg Gln Ala Ala
290 295 300
Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala Gly Tyr Gly Gln
305 310 315 320
Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln
325 330 335
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
340 345 350
Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala Ala Gly Ala Gly
355 360 365
Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
370 375 380
Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln
385 390 395 400
Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
405 410 415
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly Gln Gly Ala Gly
420 425 430
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala
435 440 445
Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala
450 455 460
Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
465 470 475 480
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala
485 490 495
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala
500 505 510
Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
515 520 525
Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
530 535 540
Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
545 550 555 560
Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala Gly Ala Gly Gly
565 570 575
Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala Ala Ala Thr Ser
580 585 590
Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr Glu Arg Gln Asn
595 600 605
Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu Ile Ala Asp Arg
610 615 620
Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr Ser Ala Ala Ala
625 630 635 640
Gly Tyr Gly Gln Gly Ala Gly Thr Gly Gly Tyr Gly Gln Gly Ala Gly
645 650 655
Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala
660 665 670
Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala Ala Gly Ala Ala
675 680 685
Ala Gly Ala Gly Val Gly Glu Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
690 695 700
Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
705 710 715 720
Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
725 730 735
Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ser Tyr Gly
740 745 750
Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala
755 760 765
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
770 775 780
Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala
785 790 795 800
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
805 810 815
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ser Ala
820 825 830
Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Gly Tyr Gly Gln Gly Ala
835 840 845
Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln
850 855 860
Gly Ala Gly Ala Ser Thr Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly
865 870 875 880
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Ala Ala
885 890 895
Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gln Gly Tyr Glu Gln Gly Ala
900 905 910
Ala Ala Thr Ser Ser Ala Ala Ala Gly Ala Ser Ser Thr Gly Tyr Thr
915 920 925
Glu Arg Gln Asn Glu Val Val Thr Thr Val Thr Thr Thr Arg Gln Glu
930 935 940
Ile Ala Asp Arg Arg Gln Ala Ala Ser Ala Ser Gly Ala Val Ser Thr
945 950 955 960
Ser Ala Ala Ala Gly Tyr Gly Gln Gly Ala Gly Thr
965 970
<210> 51
<211> 930
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 51
Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala
1 5 10 15
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala
20 25 30
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr
35 40 45
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
50 55 60
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
85 90 95
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala
100 105 110
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
115 120 125
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala
130 135 140
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
145 150 155 160
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
165 170 175
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Val
180 185 190
Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala
195 200 205
Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala
210 215 220
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala
225 230 235 240
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
245 250 255
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly
260 265 270
Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
275 280 285
Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
290 295 300
Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
305 310 315 320
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
325 330 335
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
340 345 350
Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
355 360 365
Ala Ala Ala Ala Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr
370 375 380
Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser
385 390 395 400
Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
405 410 415
Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
420 425 430
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
435 440 445
Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln
450 455 460
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp
465 470 475 480
Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
485 490 495
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly
500 505 510
Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
515 520 525
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln
530 535 540
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
545 550 555 560
Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala
565 570 575
Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala
580 585 590
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln
595 600 605
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly
610 615 620
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
625 630 635 640
Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala
645 650 655
Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly
660 665 670
Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
675 680 685
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln
690 695 700
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
705 710 715 720
Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala
725 730 735
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Val Gly Gly
740 745 750
Ala Gly Gly Tyr Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
755 760 765
Gly Ala Ala Ser Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala
770 775 780
Gly Gly Ala Gly Gly Tyr Gly Thr Gly Gln Gly Tyr Gly Ala Gly Ala
785 790 795 800
Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
805 810 815
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
820 825 830
Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
835 840 845
Ala Ala Gly Asp Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg
850 855 860
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
865 870 875 880
Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala
885 890 895
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr
900 905 910
Gly Ala Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala
915 920 925
Ala Ala
930
<210> 52
<211> 930
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 52
Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly
1 5 10 15
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln
20 25 30
Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly
35 40 45
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala
50 55 60
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
65 70 75 80
Ala Gly Gly Tyr Gly Lys Gly Gln Gly Ala Ala Ala Ala Ala Phe Ala
85 90 95
Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Tyr
100 105 110
Ala Gly Ala Gly Ala Gly Ala Val Ala Gly Ala Ala Ala Gly Ala Gly
115 120 125
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly
130 135 140
Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
145 150 155 160
Ala Gly Ala Gly Ala Gly Ala Ala Ala Asn Ala Gly Ala Gly Gly Tyr
165 170 175
Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala
180 185 190
Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala
195 200 205
Gly Thr Gly Ala Ala Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Val
210 215 220
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala
225 230 235 240
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Pro Gly Gln Gly Ala
245 250 255
Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
260 265 270
Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
275 280 285
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly
290 295 300
Ala Ala Ala Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly
305 310 315 320
Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
325 330 335
Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly
340 345 350
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
355 360 365
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala
370 375 380
Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Lys Gly Gln Gly Ala
385 390 395 400
Ala Ala Ala Ala Phe Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly
405 410 415
Ala Gly Ala Gly Ala Tyr Ala Gly Ala Gly Ala Gly Ala Val Ala Gly
420 425 430
Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly
435 440 445
Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala
450 455 460
Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Asn
465 470 475 480
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly
485 490 495
Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr
500 505 510
Gly Gln Gly Ala Gly Ala Gly Thr Gly Ala Ala Ala Gly Ala Gly Ala
515 520 525
Ser Ala Gly Ala Gly Val Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
530 535 540
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
545 550 555 560
Gly Pro Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala
565 570 575
Gly Gly Tyr Gly Gln Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly
580 585 590
Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly
595 600 605
Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Gly Ala Gly Gly Tyr Gly
610 615 620
Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly
625 630 635 640
Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly
645 650 655
Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
660 665 670
Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
675 680 685
Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr
690 695 700
Gly Lys Gly Gln Gly Ala Ala Ala Ala Ala Phe Ala Gly Ala Gly Gly
705 710 715 720
Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Tyr Ala Gly Ala Gly
725 730 735
Ala Gly Ala Val Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr
740 745 750
Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala
755 760 765
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly
770 775 780
Ala Gly Ala Ala Ala Asn Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
785 790 795 800
Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala Ala Gly Ala Gly
805 810 815
Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Thr Gly Ala
820 825 830
Ala Ala Gly Ala Gly Ala Ser Ala Gly Ala Gly Val Gly Ala Gly Ala
835 840 845
Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly
850 855 860
Gln Gly Ala Gly Gly Tyr Gly Pro Gly Gln Gly Ala Ala Ala Ala Ala
865 870 875 880
Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ser Gly Ala Gly
885 890 895
Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr
900 905 910
Gly Gln Gly Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Ala Ala Ala
915 920 925
Gly Ala
930
<210> 53
<211> 396
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 53
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala
1 5 10 15
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly
20 25 30
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
35 40 45
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
65 70 75 80
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
85 90 95
Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
100 105 110
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr
115 120 125
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
130 135 140
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly
145 150 155 160
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
165 170 175
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
180 185 190
Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala
195 200 205
Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
210 215 220
Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
225 230 235 240
Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln
245 250 255
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala
260 265 270
Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala
275 280 285
Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln
290 295 300
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser
305 310 315 320
Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala
325 330 335
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu
340 345 350
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
355 360 365
Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
370 375 380
Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala
385 390 395
<210> 54
<211> 792
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 54
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala
1 5 10 15
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly
20 25 30
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
35 40 45
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
65 70 75 80
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
85 90 95
Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
100 105 110
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr
115 120 125
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
130 135 140
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly
145 150 155 160
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
165 170 175
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
180 185 190
Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala
195 200 205
Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
210 215 220
Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
225 230 235 240
Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln
245 250 255
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala
260 265 270
Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala
275 280 285
Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln
290 295 300
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser
305 310 315 320
Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala
325 330 335
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu
340 345 350
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
355 360 365
Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
370 375 380
Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala
385 390 395 400
Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala
405 410 415
Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly
420 425 430
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly
435 440 445
Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
450 455 460
Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr
465 470 475 480
Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp
485 490 495
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
500 505 510
Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala
515 520 525
Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
530 535 540
Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
545 550 555 560
Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln
565 570 575
Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser
580 585 590
Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln
595 600 605
Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly
610 615 620
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly
625 630 635 640
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly
645 650 655
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala
660 665 670
Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
675 680 685
Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly
690 695 700
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala
705 710 715 720
Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala
725 730 735
Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly
740 745 750
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly
755 760 765
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala
770 775 780
Ala Ser Ala Ala Ala Ser Ser Ala
785 790
<210> 55
<211> 1584
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 55
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala
1 5 10 15
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly
20 25 30
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
35 40 45
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
65 70 75 80
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
85 90 95
Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
100 105 110
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr
115 120 125
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
130 135 140
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly
145 150 155 160
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
165 170 175
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
180 185 190
Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala
195 200 205
Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
210 215 220
Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
225 230 235 240
Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln
245 250 255
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala
260 265 270
Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala
275 280 285
Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln
290 295 300
Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser
305 310 315 320
Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala
325 330 335
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu
340 345 350
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
355 360 365
Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
370 375 380
Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala
385 390 395 400
Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala
405 410 415
Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly
420 425 430
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly
435 440 445
Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
450 455 460
Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr
465 470 475 480
Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp
485 490 495
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
500 505 510
Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala
515 520 525
Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
530 535 540
Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
545 550 555 560
Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln
565 570 575
Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser
580 585 590
Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln
595 600 605
Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly
610 615 620
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly
625 630 635 640
Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly
645 650 655
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala
660 665 670
Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
675 680 685
Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly
690 695 700
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala
705 710 715 720
Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala
725 730 735
Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly
740 745 750
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly
755 760 765
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala
770 775 780
Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly
785 790 795 800
Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
805 810 815
Ala Gly Ala Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
820 825 830
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly
835 840 845
Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
850 855 860
Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala
865 870 875 880
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly
885 890 895
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
900 905 910
Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln
915 920 925
Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly
930 935 940
Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly
945 950 955 960
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly
965 970 975
Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala Gly Ala
980 985 990
Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala Gly Ala
995 1000 1005
Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly Gly
1010 1015 1020
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
1025 1030 1035
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln
1040 1045 1050
Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala
1055 1060 1065
Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly
1070 1075 1080
Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly
1085 1090 1095
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly
1100 1105 1110
Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala
1115 1120 1125
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Tyr
1130 1135 1140
Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly
1145 1150 1155
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr
1160 1165 1170
Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala Ser Ser Ala
1175 1180 1185
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly
1190 1195 1200
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly
1205 1210 1215
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala
1220 1225 1230
Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly
1235 1240 1245
Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly
1250 1255 1260
Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala
1265 1270 1275
Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly Tyr Gly Gly
1280 1285 1290
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
1295 1300 1305
Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly
1310 1315 1320
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly
1325 1330 1335
Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala
1340 1345 1350
Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr Gly Gly Gln
1355 1360 1365
Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser Ala Ala Ala
1370 1375 1380
Ser Ser Ala Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr
1385 1390 1395
Ile Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala
1400 1405 1410
Gly Val Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly
1415 1420 1425
Ala Ser Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
1430 1435 1440
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
1445 1450 1455
Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
1460 1465 1470
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Asp Ala Gly
1475 1480 1485
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala
1490 1495 1500
Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala
1505 1510 1515
Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala
1520 1525 1530
Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly Gln Gly
1535 1540 1545
Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Tyr
1550 1555 1560
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
1565 1570 1575
Ala Ala Ala Ser Ser Ala
1580
<210> 56
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 56
Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly
1 5 10 15
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
20 25 30
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
35 40 45
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala
50 55 60
Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly
65 70 75 80
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
85 90 95
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
100 105 110
Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
115 120 125
Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
130 135 140
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala
145 150 155 160
Ala Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala
165 170 175
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
180 185 190
Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly
195 200 205
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala
210 215 220
Ala Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala
225 230 235 240
Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln
245 250 255
Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly
260 265 270
Ala Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly
275 280 285
Ala Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly
290 295 300
Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala
305 310 315 320
Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly
325 330 335
Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly
340 345 350
Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
355 360 365
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly
370 375 380
Ala Ala Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly
385 390 395 400
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly
405 410 415
Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
420 425 430
Gly Ala Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
435 440 445
Gly Ala Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
450 455 460
Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala
465 470 475 480
Ala Ala
<210> 57
<211> 810
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 57
Gly Gly Tyr Gly Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala
1 5 10 15
Gly Val Gly Ala Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly
20 25 30
Gly Tyr Gly Ala Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr
35 40 45
Gly Arg Gly Thr Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala
50 55 60
Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Ala Ala Gly Ala Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly
85 90 95
Gln Gly Ala Tyr Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala
100 105 110
Gly Ala Gly Ala Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val
115 120 125
Gly Ala Gly Ala Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly
130 135 140
Gly Tyr Arg Arg Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala
145 150 155 160
Thr Ala Ala Ala Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg
165 170 175
Gly Ala Gly Ala Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly
180 185 190
Tyr Gly Arg Asn Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg
195 200 205
Ala Gly Ser Ala Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly
210 215 220
Ala Gly Ala Ser Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly
225 230 235 240
Tyr Gly Arg Gly Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala
245 250 255
Gly Gly Tyr Gly Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala Gly Gly
260 265 270
Tyr Gly Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala Gly Val
275 280 285
Gly Ala Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly Gly Tyr
290 295 300
Gly Ala Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg
305 310 315 320
Gly Thr Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala Ala Ala
325 330 335
Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala
340 345 350
Gly Ala Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly Gln Gly
355 360 365
Ala Tyr Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
370 375 380
Gly Ala Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val Gly Ala
385 390 395 400
Gly Ala Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly Gly Tyr
405 410 415
Arg Arg Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Thr Ala
420 425 430
Ala Ala Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Ala
435 440 445
Gly Ala Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly Tyr Gly
450 455 460
Arg Asn Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg Ala Gly
465 470 475 480
Ser Ala Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly Ala Gly
485 490 495
Ala Ser Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly Tyr Gly
500 505 510
Arg Gly Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala Gly Gly
515 520 525
Tyr Gly Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala Gly Gly Tyr Gly
530 535 540
Ala Val Ala Gly Gly Ser Gly Ala Gly Ala Ser Ala Gly Val Gly Ala
545 550 555 560
Gly Ala Gly Ser Val Ala Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala
565 570 575
Gly Thr Gly Ala Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Thr
580 585 590
Gly Ala Gly Thr Ala Ala Gly Ser Gly Ala Gly Ala Ala Ala Gly Ala
595 600 605
Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
610 615 620
Gly Ala Gly Ala Gly Ser Leu Gly Gly Tyr Glu Gly Gln Gly Ala Tyr
625 630 635 640
Ser Ala Gly Val Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala
645 650 655
Gly Ser Val Gly Gly Tyr Gly Arg Gly Ala Gly Val Gly Ala Gly Ala
660 665 670
Ala Ala Gly Ser Ala Ala Gly Ala Gly Gly Ala Gly Gly Tyr Arg Arg
675 680 685
Asp Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Thr Ala Ala Ala
690 695 700
Ser Ser Gly Ala Gly Ser Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala
705 710 715 720
Gly Ala Ala Ala Val Ala Gly Ala Asp Ala Gly Gly Tyr Gly Arg Asn
725 730 735
Ser Gly Ala Gly Thr Ala Ala Tyr Ala Gly Ala Arg Ala Gly Ser Ala
740 745 750
Gly Val Tyr Gly Gly Gln Gly Gly Tyr Ser Ser Gly Ala Gly Ala Ser
755 760 765
Ala Ala Ser Gly Ala Gly Ala Asp Ile Thr Ser Gly Tyr Gly Arg Gly
770 775 780
Asp Gly Ala Gly Ala Gly Ala Gly Thr Ile Gly Ala Gly Gly Tyr Gly
785 790 795 800
Gly Gly Ala Gly Ser Gly Ala Ala Ala Ala
805 810
<210> 58
<211> 790
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 58
Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser
20 25 30
Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln
35 40 45
Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr
50 55 60
Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly
65 70 75 80
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala
85 90 95
Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
115 120 125
Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
130 135 140
Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala
145 150 155 160
Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr
165 170 175
Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr
180 185 190
Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly
195 200 205
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
210 215 220
Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala
225 230 235 240
Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser
245 250 255
Gly Tyr Gly Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser
260 265 270
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
275 280 285
Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr
290 295 300
Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala
305 310 315 320
Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala
325 330 335
Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
340 345 350
Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala
355 360 365
Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
370 375 380
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala Gly Ser Gly Ala Gly
385 390 395 400
Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly
405 410 415
Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln
420 425 430
Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala
435 440 445
Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly
450 455 460
Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr
465 470 475 480
Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly
485 490 495
Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly
500 505 510
Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala Ala Gly
515 520 525
Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly
530 535 540
Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser Ala
545 550 555 560
Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln Ser
565 570 575
Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr Gly
580 585 590
Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly Gly
595 600 605
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala Gly
610 615 620
Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser Gly
625 630 635 640
Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly
645 650 655
Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly
660 665 670
Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser
675 680 685
Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr
690 695 700
Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly
705 710 715 720
Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala
725 730 735
Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala
740 745 750
Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala
755 760 765
Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly
770 775 780
Tyr Gly Ala Gly Ala Ala
785 790
<210> 59
<211> 395
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 59
Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser
20 25 30
Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln
35 40 45
Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr
50 55 60
Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly
65 70 75 80
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala
85 90 95
Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
115 120 125
Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
130 135 140
Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala
145 150 155 160
Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr
165 170 175
Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr
180 185 190
Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly
195 200 205
Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser
210 215 220
Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala
225 230 235 240
Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser
245 250 255
Gly Tyr Gly Ala Gly Ala Ala Ala Gly Ser Gly Ala Gly Ala Gly Ser
260 265 270
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
275 280 285
Gly Ser Ser Ala Ser Ala Gly Ser Ala Ile Asn Thr Gln Thr Val Thr
290 295 300
Ser Ser Thr Thr Thr Ser Ser Gln Ser Ser Ala Ala Ala Thr Gly Ala
305 310 315 320
Gly Tyr Gly Thr Gly Ala Gly Thr Gly Ala Ser Ala Gly Ala Ala Ala
325 330 335
Ser Gly Ala Gly Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
340 345 350
Ala Gly Ala Ser Ala Arg Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala
355 360 365
Gly Ala Ala Ala Ala Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
370 375 380
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Ala
385 390 395
<210> 60
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Gly Gly Gly Gly Gly Gly His His His His His His
1 5 10
<210> 61
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 61
Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp
1 5 10 15
Lys Asp Tyr Lys Asp Asp Asp Asp Lys
20 25
<210> 62
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 62
Gly Asp Tyr Lys Asp Asp Asp Asp Lys Asp Tyr Lys Asp Asp Asp Asp
1 5 10 15
Lys Asp Tyr Lys Asp Asp Asp Asp Lys Gly His His His His His His
20 25 30
<210> 63
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
silk protein sequence
<400> 63
Ala Ala Ala Ala Ala
1 5
<210> 64
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
silk protein sequence
<400> 64
Ser Gly Ala Gly Gly
1 5
<210> 65
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
silk protein sequence
<400> 65
Gly Ser Gly Ala Gly
1 5
<210> 66
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
silk protein sequence
<400> 66
Gly Gly Ser Gly Ala
1 5
<210> 67
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MISC_FEATURE
<222> (1)..(8)
<223> This sequence may encompass 6-8 residues
<400> 67
His His His His His His His His
1 5
<210> 68
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
6xHis tag
<400> 68
His His His His His His
1 5
<210> 69
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 69
Gly Gly Gly Gly Gly His His His His His His
1 5 10
Claims (57)
- 숙주 세포로부터 재조합 거미 실크 단백질을 용해화시키는, 다음을 포함하는 방법:
숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하며; 그리고
상기 숙주 세포의 불용성 부분을 염과 알코올을 포함하는 용액에 추가하고, 이로 인하여 이 용액 안에 상기 재조합 거미 실크 단백질이 용해화된다. - 청구항 1에 있어서, 이때 상기 염은 칼슘 염을 포함하는, 방법.
- 청구항 2에 있어서, 이때 상기 칼슘 염은 염화칼슘, 질산칼슘, 티오시안산칼슘, 요오드화 칼슘, 또는 브롬화 칼슘 중 적어도 하나를 포함하는, 방법.
- 청구항 3에 있어서, 이때 상기 칼슘 염은 염화 칼슘을 포함하는, 방법.
- 청구항 1-4중 임의의 한 항에 있어서, 이때 상기 용액은 적어도 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함하는, 방법.
- 청구항 4에 있어서, 이때 상기 용액은 적어도 2M 염화 칼슘을 포함하는, 방법.
- 청구항 3에 있어서, 이때 상기 칼슘 염은 질산 칼슘을 포함하는, 방법.
- 청구항 1에 있어서, 이때 상기 염은 스트론튬 염 또는 바륨 염을 포함하는, 방법.
- 청구항 1-8중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 또는 35% (w/v)인, 방법.
- 청구항 9에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 약 15% (w/v)인, 방법.
- 청구항 9에 있어서, 이때 상기 불용성 부분은 상기 용액 부피의 최대한 많아도 약 35% (w/v)인, 방법.
- 청구항 1-11중 임의의 한 항에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X, 5X 또는 7X인, 방법.
- 청구항 12에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 적어도 3X인, 방법.
- 청구항 12에 있어서, 이때 상기 불용성 부분에 대한 상기 용액 부피 비율은 약 7X인, 방법.
- 상기 청구항들중 임의의 항에 있어서, 이때 상기 알코올은 메탄올, 에탄올, 또는 이소프로판올중 적어도 하나를 포함하는, 방법.
- 청구항 15에 있어서, 이때 상기 알코올은 메탄올을 포함하는, 방법.
- 청구항 1-16중 임의의 한 항에 있어서, 이때 상기 용액은 2M 염화 칼슘과 메탄올을 포함하는, 방법.
- 청구항 1-17중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 20℃ 내지 70℃ 온도에서 이 용액과 함께, 항온처리되는, 방법.
- 청구항 18에 있어서, 이때 상기 불용성 부분은 실온에서 항온처리되는, 방법.
- 청구항 18에 있어서, 이때 상기 불용성 부분은 약 35℃에서 항온처리되는, 방법.
- 청구항 18에 있어서, 이때 상기 불용성 부분은 약 55℃에서 항온처리되는, 방법.
- 청구항 18에 있어서, 이때 상기 불용성 부분은 70℃를 넘지 않은 온도에서 항온처리되는, 방법.
- 청구항 18에 있어서, 이때 상기 불용성 부분은 20℃보다 낮지 않은 온도에서 항온처리되는, 방법.
- 청구항 1-24중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 상기 용액에서 15분 내지 120 분 동안 항온처리되는, 방법.
- 청구항 24에 있어서, 이때 상기 불용성 부분은 상기 용액에서 30 분 동안 항온처리되는, 방법.
- 청구항 1-25중 임의의 한 항에 있어서, 상기 알코올을 증발시키는 것을 더 포함하는, 방법.
- 청구항 1-26중 임의의 한 항에 있어서, 이때 상기 불용성 부분은 세포 용해물 펠렛을 포함하는, 방법.
- 청구항 1-27중 임의의 한 항에 있어서, 이때 상기 세포 배양물로부터 유래된 불용성 부분의 수집은 상기 숙주 세포의 용해를 포함하는, 방법.
- 청구항 28에 있어서, 이때 용해는 열 처리, 화학적 처리, 전단 파괴, 물리적 균질화, 미세유동화, 초음파처리, 또는 화학적 균질화를 포함하는, 방법.
- 청구항 28 내지 29에 있어서, 이때 상기 세포 배양물에서 불용성 부분의 수집은 상기 용해된 세포를 원심분리시켜, 세포 용해물 펠렛을 수득하는 것을 포함하는, 방법.
- 청구항 1-30중 임의의 한 항에 있어서, 상기 용액으로부터 불순물 제거를 더 포함하는, 방법.
- 청구항 31에 있어서, 이때 불순물 제거는 수성 용액을 추가하여, 이들 불순물을 침전시키는 것을 포함하는, 방법.
- 청구항 32에 있어서, 이때 상기 수성 용액은 물인, 방법.
- 청구항 31에 있어서, 이때 이들 불순물 제거는 여과, 원심분리, 중력 침전, 흡착, 투석 또는 상(phase) 분리를 포함하는, 방법.
- 청구항 34에 있어서, 이때 상기 여과는 한외여과, 정밀여과, 또는 정용여과인, 방법.
- 청구항 1-35중 임의의 한 항에 있어서, 이때 상기 용해화된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함하는, 방법.
- 청구항 1-36중 임의의 한 항에 있어서, 상기 재조합 거미 실크 단백질을 상기 용액으로 단리시키는 것을 더 포함하며, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성되는, 방법.
- 청구항 37에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정되는, 방법.
- 청구항 37 또는 38에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 ELISA를 이용하여 측정되는, 방법.
- 청구항 37-39중 임의의 항에 있어서, 이때 단리된 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 방법.
- 청구항 37-40중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질은 전장의 재조합 거미 실크 단백질인, 방법.
- 청구항 37-40중 임의의 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질은 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 전장의 재조합 거미 실크 단백질을 포함하는, 방법.
- 청구항 41에 있어서, 이때 전장의 재조합 거미 실크 단백질의 양은 웨스턴 블랏을 이용하여 측정되는, 방법.
- 청구항 41에 있어서, 이때 전장의 재조합 거미 실크 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 방법.
- 청구항 1-44중 임의의 한 항에 있어서, 이때 상기 단리된 재조합 거미 실크 단백질의 순도는 5-10%, 10-15%, 15-20%, 20-25%, 25-30%, 30-35%, 35-40%, 45-50%, 50-55%, 55-60%, 60-65%, 65-70%, 70-75%, 75-80%, 80-85%, 85-90%, 09-95%, 또는 95-100%인, 방법.
- 청구항 1-45중 임의의 한 항에 있어서, 이때 상기 재조합 거미 실크 단백질은 상당한 결정질 실크 단백질, 높은 함량의 베타 쉬트 실크 단백질, 또는 낮은 용해도 실크 단백질인, 방법.
- 청구항 1-46중 임의의 한 항에 있어서, 이때 상기 재조합 거미 실크 단백질은 서열 식별 번호: 1-27 또는 39-59에서 제시된 서열을 포함하는, 방법.
- 청구항 1-47중 임의의 한 항에 있어서, 이때 상기 세포 배양물은 곰팡이, 박테리아 또는 효모 세포를 포함하는, 방법.
- 청구항 1-48중 임의의 한 항에 있어서, 이때 상기 박테리아 세포는 대장균(Escherichia coli)인, 방법.
- 청구항 1-49중 임의의 한 항에 있어서, 실크 단백질 분말을 만들기 위해 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함하는, 방법.
- 숙주 세포로부터 재조합 거미 실크 단백질을 단리시키는, 다음을 포함하는 방법:
숙주 세포를 포함하는 세포 배양물을 제공하고, 이때 상기 숙주 세포는 재조합 거미 실크 단백질을 발현시키고;
상기 세포 배양물로부터 유래된 불용성 부분을 수집하고, 이때 상기 불용성 부분은 상기 재조합 거미 실크 단백질을 포함하고;
상기 숙주 세포의 불용성 부분을 적어도 0.1M 염화 칼슘과 메탄올을 포함하는 용액에 추가하고, 이로 인하여 이 용액에서 상기 재조합 거미 실크 단백질을 용해화시키고; 그리고
이 용액으로부터 상기 재조합 거미 실크 단백질을 단리시키고, 이로 인하여 단리된 재조합 거미 실크 단백질이 생성된다. - 청구항 51에 있어서, 이때 상기 용액은 적어도 1M, 1.5M, 2M, 2.5M, 3M, 또는 4M 염화 칼슘을 포함하는, 방법.
- 청구항 51에 있어서, 실크 단백질 분말을 만들기 위해 상기 단리된 재조합 거미 실크 단백질을 건조시키는 것을 더 포함하는, 방법.
- 상기 청구항들중 임의의 한 항에 따른 방법에 의해 만들어진, 재조합 거미 실크 단백질을 포함하는 조성물.
- 청구항 54에 있어서, 재조합 거미 실크 단백질 분말을 포함하는, 조성물.
- 청구항 54 또는 55에 있어서, 이때 상기 재조합 거미 실크는 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100% 전장의 재조합 거미 실크를 포함하는, 조성물.
- 청구항 1-53중 임의의 한 항에 따라 생성된 재조합 거미 실크 단백질을 포함하는 고형 실크.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962890473P | 2019-08-22 | 2019-08-22 | |
US62/890,473 | 2019-08-22 | ||
PCT/US2020/047514 WO2021035184A1 (en) | 2019-08-22 | 2020-08-21 | Methods for improved extraction of spider silk proteins |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220050884A true KR20220050884A (ko) | 2022-04-25 |
Family
ID=74660376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227004065A KR20220050884A (ko) | 2019-08-22 | 2020-08-21 | 거미 실크 단백질의 추출 개선을 위한 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220289790A1 (ko) |
EP (1) | EP4017865A4 (ko) |
JP (1) | JP2022545183A (ko) |
KR (1) | KR20220050884A (ko) |
CN (1) | CN114222751A (ko) |
CA (1) | CA3147092A1 (ko) |
WO (1) | WO2021035184A1 (ko) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4031202A1 (en) * | 2019-09-16 | 2022-07-27 | Bolt Threads, Inc. | Methods for isolating spider silk proteins via high shear solubilization |
US11993068B2 (en) | 2022-04-15 | 2024-05-28 | Spora Cayman Holdings Limited | Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them |
WO2024057361A1 (ja) * | 2022-09-12 | 2024-03-21 | 興和株式会社 | 可溶化タンパク質製造方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2022961A (en) * | 1931-09-23 | 1935-12-03 | American Bemberg Corp | Process for the manufacture of artificial silk |
US5245012A (en) * | 1990-04-19 | 1993-09-14 | The United States Of America As Represented By The Secretary Of The Army | Method to achieve solubilization of spider silk proteins |
JPWO2017094722A1 (ja) | 2015-12-01 | 2018-10-11 | Spiber株式会社 | タンパク質溶液を製造する方法 |
WO2017127940A1 (en) * | 2016-01-27 | 2017-08-03 | Dalhousie University | Artificial spider aciniform silk proteins, methods of making and uses thereof |
CN110719732B (zh) * | 2017-03-30 | 2022-11-18 | 犹他州立大学 | 表达蜘蛛丝的转基因蚕 |
JP2021080571A (ja) * | 2018-01-31 | 2021-05-27 | Spiber株式会社 | タンパク質繊維及びその製造方法 |
-
2020
- 2020-08-21 EP EP20854812.3A patent/EP4017865A4/en active Pending
- 2020-08-21 CN CN202080056231.8A patent/CN114222751A/zh active Pending
- 2020-08-21 KR KR1020227004065A patent/KR20220050884A/ko unknown
- 2020-08-21 WO PCT/US2020/047514 patent/WO2021035184A1/en unknown
- 2020-08-21 US US17/633,498 patent/US20220289790A1/en active Pending
- 2020-08-21 CA CA3147092A patent/CA3147092A1/en active Pending
- 2020-08-21 JP JP2022507782A patent/JP2022545183A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2022545183A (ja) | 2022-10-26 |
CA3147092A1 (en) | 2021-02-25 |
WO2021035184A1 (en) | 2021-02-25 |
CN114222751A (zh) | 2022-03-22 |
EP4017865A1 (en) | 2022-06-29 |
EP4017865A4 (en) | 2023-08-23 |
US20220289790A1 (en) | 2022-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7544348B2 (ja) | 改良シルク繊維を合成するための方法および組成物 | |
KR20220050884A (ko) | 거미 실크 단백질의 추출 개선을 위한 방법 | |
KR102618002B1 (ko) | 재조합 단백질을 고분비 수율로 생산하기 위한 조성물 및 방법 | |
EP3592800A2 (en) | Compositions and methods for producing high secreted yields of recombinant proteins | |
KR20210096175A (ko) | 거미 실크 단백질의 알칼리 정제 | |
EP4218843A2 (en) | Methods for isolating spider silk proteins via high shear solubilization |