KR20210041023A - 성형체를 위한 조성물 - Google Patents

성형체를 위한 조성물 Download PDF

Info

Publication number
KR20210041023A
KR20210041023A KR1020217006385A KR20217006385A KR20210041023A KR 20210041023 A KR20210041023 A KR 20210041023A KR 1020217006385 A KR1020217006385 A KR 1020217006385A KR 20217006385 A KR20217006385 A KR 20217006385A KR 20210041023 A KR20210041023 A KR 20210041023A
Authority
KR
South Korea
Prior art keywords
gly
ala
composition
ser
xaa xaa
Prior art date
Application number
KR1020217006385A
Other languages
English (en)
Inventor
린제이 레이
노우르 엘디엔 엘-디프라위
폴 안드레 게레트
막심 불렛-오뎃
그레고리 윌슨 라이스
조슈아 타일러 키틀슨
예로엔 비스예거
Original Assignee
볼트 쓰레즈, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 볼트 쓰레즈, 인크. filed Critical 볼트 쓰레즈, 인크.
Publication of KR20210041023A publication Critical patent/KR20210041023A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L89/00Compositions of proteins; Compositions of derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08HDERIVATIVES OF NATURAL MACROMOLECULAR COMPOUNDS
    • C08H1/00Macromolecular products derived from proteins
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08KUse of inorganic or non-macromolecular organic substances as compounding ingredients
    • C08K5/00Use of organic ingredients
    • C08K5/04Oxygen-containing compounds
    • C08K5/05Alcohols; Metal alcoholates
    • C08K5/053Polyhydroxylic alcohols
    • DTEXTILES; PAPER
    • D01NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
    • D01DMECHANICAL METHODS OR APPARATUS IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS
    • D01D5/00Formation of filaments, threads, or the like
    • D01D5/08Melt spinning methods
    • DTEXTILES; PAPER
    • D10INDEXING SCHEME ASSOCIATED WITH SUBLASSES OF SECTION D, RELATING TO TEXTILES
    • D10BINDEXING SCHEME ASSOCIATED WITH SUBLASSES OF SECTION D, RELATING TO TEXTILES
    • D10B2211/00Protein-based fibres, e.g. animal fibres
    • D10B2211/01Natural animal fibres, e.g. keratin fibres
    • D10B2211/04Silk

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Polymers & Plastics (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Insects & Arthropods (AREA)
  • Materials Engineering (AREA)
  • Toxicology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mechanical Engineering (AREA)
  • Textile Engineering (AREA)
  • Peptides Or Proteins (AREA)
  • Compositions Of Macromolecular Compounds (AREA)
  • Manufacture Of Macromolecular Shaped Articles (AREA)
  • Artificial Filaments (AREA)
  • Biological Depolymerization Polymers (AREA)

Abstract

본 명세서는 재조합 거미줄 단백질과 가소제를 포함하는 성형체를 위한 조성물에 관한 것이다. 더욱이, 본 명세서는 재조합 거미줄 단백질과 가소제를 포함하는 성형체, 그리고 당해 성형체의 제조 방법에 관한 것이다.

Description

성형체를 위한 조성물
관련 출원에 대한 상호 참조
본 출원은 2018년 8월 10일에 출원된 미국 가출원 번호 62/717,622에 대한 우선권을 주장하며, 그 내용은 그 전문이 본원의 참고자료에 편입된다.
분야
본 명세서는 재조합 거미줄(spider silk) 단백질과 가소제를 포함하는 성형체(molded body)를 위한 조성물에 관한 것이다. 더욱이, 본 명세서는 재조합 거미줄 단백질과 가소제를 포함하는 성형체, 그리고 당해 성형체의 제조 방법에 관한 것이다.
배경
석유-기반 제품의 대안으로 생물적으로 재생가능한, 그리고 생물분해 가능한 재료에 대한 관심이 높아지고 있다. 이를 위해, 식물과 동물로부터 추출한 분자로 재료와 섬유를 만드는 방법을 개발하기 위해 많은 노력을 기울였다. 재생 단백질로 만든 섬유는 1890년대로 거슬러 올라가며, 다양한 전통적인 습식-방적(spinning) 기술을 사용하여 만들어졌다.
습식 방적은 용제와 응고 조(baths)를 사용하여 섬유를 생산한다. 이는 용제 및 응고 조에서 사용되는 화학 물질은 방적 공정 후 섬유로부터 추출되어야 하고, 지속가능하고 믿을만한 공정을 제공하기 위해 닫힌(closed) 루프 공정을 거쳐야 한다는 점이 단점이다. 용융(melt) 방적은 용매 및 응고 조가 필요하지 않아, 습식 방사에 비해 매력적인 선택을 제공하지만, 용융 방적은 또한 (i) 중합체는 압출되어 시판가능한-품질의 섬유를 형성할 수 있는 균질한 용융 조성물을 만들어야 하며, 그리고 (ii) 중합체는 용융 및 압출 단계 동안 분해되어서는 안된다.
요약
본 발명의 일부 구체예들 따르면, 재조합 거미줄 단백질 및 가소제를 포함하는 성형체 및 성형체용 조성물이 본원에 제공되며, 이때 조성물은 용융된 상태 또는 가류성(flowable) 상태로 변형된 후, 실질적으로 균질성(homogeneous)일 수 있으며; 상기 재조합 거미줄 단백질은 성형체로 형성된 후, 실질적으로 분해되지 않거나 또는 6.0wt% 미만의 양으로 분해된다.
더욱이, 본 명세서는 실질적으로 균질한 용융 조성물을 형성하기 위해, 재조합 거미줄 단백질 및 가소제를 포함하는 조성물에 압력 및/또는 전단력(shear force)을 적용하고, 그리고 당해 균질성 용융 조성물을 성형하는 단계를 포함하는, 성형체의 제조 방법을 제공한다. 상기 실질적으로 균질성 용융 조성물은 전형적으로 가류성 상태일 것이며, 예를 들어 압출시켜 섬유로 만들어질 수 있다.
일부 구체예들에 따르면, 재조합 거미줄 단백질과 가소제를 포함하는 성형체용 조성물이 본원에서 제공되는데, 이때 상기 조성물은 가류성 상태로 유도될 수 있으며, 이때 상기 재조합 거미줄 단백질은 실질적으로 가류성 상태에서 비-분해성이다.
일부 구체예들에서, 상기 조성물은 전단력과 압력을 적용시켜, 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 열을 가하지 않고, 전단력과 압력을 적용시켜, 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 가류성 상태로 유도될 수 있으며, 상기 재조합 거미줄 단백질이 당해 조성물 안에서 실질적으로 비-분해된 상태로 유지되면서, 여러 차례 압출된다.
일부 구체예들에서, 상기 조성물은 열가소성(thermoplastic)이다.
일부 구체예들에서, 상기 조성물은 1.5 Nm ~ 13 Nm 범위의 전단력 적용에 의해 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 2 Nm ~ 6 Nm 범위의 전단력 적용에 의해 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 1MPa ~ 300MPa 범위의 압력 적용에 의해 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 5MPa ~ 75MPa 범위의 압력 적용에 의해 가류성 상태로 유도될 수 있다.
일부 구체예들에서, 상기 조성물은 120℃ 미만의 온도, 80℃ 미만의 온도, 40℃ 미만의 온도, 또는 실온에서 가류성 상태로 유도될 수 있다. 일부 구체예들에서, 상기 조성물은 실질적으로 균질하다.
일부 구체예들에서, 상기 재조합 거미줄 단백질은 반복 단위(repeat units)를 포함한다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 60개 ~ 100개 아미노산 길이 범위의 아미노산 잔기가 2 ~ 20개 범위의 반복 단위를 포함한다. 일부 구체예들에서, 상기 재조합 거미줄 단백질의 분자량은 20 ~ 2000kDa 범위다.
일부 구체예들에서, 상기 재조합 거미줄 단백질은 적어도 두 개의 반복 단위 존재(occurrences)를 포함하는데, 당해 반복 단위는 다음을 포함한다: 150개 초과의 아미노산 잔기와 적어도 10kDa의 분자량; 적어도 80%의 알라닌 함량을 포함하는, 6개 또는 그 이상의 연속 아미노산을 갖는 알라닌-풍부 영역; 그리고 적어도 40%의 글리신 함량과 30% 미만의 알라닌 함량을 포함하는, 12개 또는 그 이상의 연속 아미노산을 갖는 글리신-풍부 영역.
일부 구체예들에서, 상기 가소제는 폴리올, 물 및/또는 우레아로부터 선택된다. 일부 구체예들에서, 상기 폴리올은 글리세롤을 포함한다. 일부 구체예들에서, 상기 가소제는 물을 포함한다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 이때 가소재 대 재조합 실크 폴리펩티드 분말의 중량비는 0.05 ~ 1.50:1 범위다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 이때 가소재 대 재조합 실크 폴리펩티드 분말의 중량비는 0.20 ~ 1.70:1 범위다.
일부 구체예들에서, 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 상기 조성물 안에 있는 재조합 거미줄 폴리펩티드 분말의 양은 1 ~ 90wt%의 재조합 거미줄 단백질 범위다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 상기 조성물 안에 있는 재조합 거미줄 폴리펩티드 분말의 양은 20 ~ 41wt%의 재조합 거미줄 단백질 범위다. 일부 구체예들에서, 상기 조성물은 가소제로써 1 ~ 60wt% 범위의 글리세롤을 포함한다. 일부 구체예들에서, 상기 조성물은 가소제로써 15 ~ 30wt% 범위의 글리세롤을 포함한다. 일부 구체예들에서, 상기 조성물은 가소제로써 5 ~ 80wt% 범위의 물을 포함한다. 일부 구체예들에서, 상기 조성물은 가소제로써 19 ~ 27wt% 범위의 물을 포함한다.
일부 구체예들에서, 상기 재조합 거미줄 단백질은 가류성 상태에서 10.0wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 가류성 상태에서 6.0wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 가류성 상태에서 2.0wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질의 분해는 가류성 상태 전 후에 당해 조성물 안에 존재하는 전장(full-length)의 재조합 거미줄 단백질의 양을 측정함으로써 평가된다. 일부 구체예들에서, 상기 전장의 재조합 거미줄 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
본 발명의 일부 구체예들에 따르면, 재조합 거미줄 단백질과 가소제를 포함하는 성형체를 위한 조성물을 포함하는 성형체가 또한 본원에서 제공되며, 이때 상기 조성물은 가류성 상태로 유도될 수 있으며, 이때 상기 재조합 거미줄 단백질은 가류성 상태에서 실질적으로 비-분해된 상태이다.
일부 구체예들에서, 상기 성형체는 섬유다. 일부 구체예들에서, 상기 섬유는 100 Pa ~ 1.2 GPa 범위의 강도를 갖는다. 일부 구체예들에서, 상기 섬유는 편광 광 현미경으로 측정하였을 때, 5x10-5 내지 ~0.04 범위의 복굴절(birefringence)이다.
본 발명의 일부 구체예들에 따르면, 성형체를 준비하는 공정이 또한 본원에서 제공되는데, 이 공정은 다음 단계들을 포함한다: 재조합 거미줄 단백질과 가소제를 포함하는 조성물에 압력과 전단력을 가하여 당해 조성물을 가류성 상태로 전환시키는 단계, 그리고 가류성 상태의 당해 조성물을 압출시켜 성형체를 만드는 단계.
일부 구체예들에서, 성형체를 만들기 위해 상기 조성물의 압출은 당해 조성물을 압출시켜 섬유를 만드는 것을 포함한다. 일부 구체예들에서, 섬유를 만들기 위한 상기 조성물의 압출은 당해 조성물을 방적돌기(spinneret)를 통하여 압출시키는 것을 포함한다. 일부 구체예들에서, 성형체를 만들기 위해 상기 조성물의 압출은 당해 조성물을 몰드(mold)로 압출시키는 것을 포함한다.
일부 구체예들에서, 성형체를 준비하는 공정은 다음을 더 포함한다: (a) 압력과 전단력을 상기 성형체에 적용시켜 당해 성형체가 가류성 상태의 조성물로 전환시키고, 그리고 (b) 당해 가류성 상태의 조성물을 압출시켜 제 2 성형체를 만든다. 일부 구체예들에서, 상기 공정에는 단계 (a)와 (b)를 상기 제 2 성형체에 적어도 한 번 반복하는 것이 더 포함된다.
일부 구체예들에서, 상기 전단력은 1.5 ~ 13 N*m이다. 일부 구체예들에서, 상기 압력은 1MPa ~ 300MPa이다. 일부 구체예들에서, 상기 전단력과 압력은 모세관 유동계(rheometer) 또는 트윈 스크류 압출기(twin screw extruder)를 이용하여 상기 조성물에 적용된다. 일부 구체예들에서, 전술한 압력과 전단력을 적용시키는 동안 상기 트윈 스크류 압출기의 스크류 속도는 10 ~ 300 RPM 범위이다.
일부 구체예들에서, 전단력과 압력을 적용하는 데 사용되는 기구는 혼합 챔버(chamber)를 포함하는데, 이 챔버는 이에 근접해 있는 압출 챔버에 연결되어 있다. 일부 구체예들에서, 상기 조성물은 상기 혼합 챔버 안에서 가열된다. 일부 구체예들에서, 상기 조성물은 상기 압출 챔버 안에서 가열된다. 일부 구체예들에서, 상기 조성물은 120℃ 미만의 온도로 가열된다. 일부 구체예들에서, 상기 조성물은 80℃ 미만의 온도로 가열된다. 일부 구체예들에서, 상기 조성물은 40℃ 미만의 온도로 가열된다. 일부 구체예들에서, 상기 압출 챔버는 상기 조성물이 압출되는 구멍에 근접하여 테이퍼드(tapered)된다. 일부 구체예들에서, 상기 압출 챔버는 온도 제어된다. 일부 구체예들에서, 상기 조성물은 3 ~ 7 분 범위로 혼합 챔버 안에서 체류 시간을 갖는다.
일부 구체예들에서, 압출 후 성형체는 압출 전 조성물과 비교하여, 15% 미만의 수분 함량 손실을 갖는다. 일부 구체예들에서, 압출 후 성형체는 압출 전 조성물과 비교하여, 10% 미만의 수분 함량 손실을 갖는다.
일부 구체예들에서, 상기 성형체는 섬유이며, 당해 섬유는 손으로 연신된다(hand drawn). 일부 구체예들에서, 상기 성형체는 섬유이며, 당해 섬유는 다단계에 걸쳐 뽑아낸다.
일부 구체예들에서, 상기 재조합 거미줄 단백질은 당해 성형체 안에서 실질적으로 비-분해된 상태다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 당해 성형체 안에서 10wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 당해 성형체 안에서 6wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질은 당해 성형체 안에서 2wt% 미만의 양으로 분해된다. 일부 구체예들에서, 상기 재조합 거미줄 단백질의 분해는 압출 전후 당해 조성물 안에 존재하는 전장의 재조합 거미줄 단백질의 양을 측정함으로써 평가된다. 일부 구체예들에서, 상기 전장의 재조합 거미줄 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정된다.
일부 구체예들에서, 상기 성형체는 편광 광 현미경에 의해 측정할 때 최소 복굴절을 갖는다.
전술한 그리고 다른 목적, 특징 및 이점들은 첨부된 도면에 도시된 바와 같은 본 발명의 특정 구체예들에 관한 하기 설명으로부터 명백해질 것이다.
도 1에서는 본 발명의 다양한 구체예에 따른 선택된 열 및 RPM 조건 하에서 압출된 P49W21G30 용융 조성물에 대한 크기 배제 크로마토그래피 데이터를 보여준다.
도 2에서는 본 발명의 다양한 구체예에 따른 선택된 열 및 RPM 조건 하에서 압출된 P65W20G15 용융 조성물에 대한 크기 배제 크로마토그래피 데이터를 보여준다.
도 3에서는 본 발명의 다양한 구체예에 따른 선택된 열 및 RPM 조건 하에서 압출된 P71W19G10 용융 조성물에 대한 크기 배제 크로마토그래피 데이터를 보여준다.
도 4에서는 본 발명의 다양한 구체예에 따른 열중량 분석(TGA)으로 측정된 바와 같이, 선택된 열 및 RPM 조건 하에서 압출된 P49W21G30 용융 조성물의 압출 동안 수분 손실 차트를 보여준다. 이 데이터는 압출 전 출발 펠렛에서의 수분 함량, 그리고 압출 후 선택한 조건에서 압출된 샘플에서의 수분 함량%를 나타낸다.
도 5에서는 본 발명의 다양한 구체예에 따른 열중량 분석(TGA)으로 측정된 바와 같이, 선택된 열 및 RPM 조건 하에서 압출된 P65W20G15 용융 조성물의 압출 동안 수분 손실 차트를 보여준다. 이 데이터는 압출 전 출발 펠렛에서의 수분 함량, 그리고 압출 후 선택한 조건에서 압출된 샘플에서의 수분 함량%를 나타낸다.
도 6에서는 본 발명의 다양한 구체예에 따른 열중량 분석(TGA)으로 측정된 바와 같이, 선택된 열 및 RPM 조건 하에서 압출된 P71W19G10 용융 조성물의 압출 동안 수분 손실 차트를 보여준다. 이 데이터는 압출 전 출발 분말에서의 수분 함량, 그리고 압출 후 선택한 조건에서 압출된 샘플에서의 수분 함량%를 나타낸다.
도 7에서는 Fourier 변환 적외선 분광법 (FTIR)으로 측정하였을 때, 선택된 열 및 RPM 조건에서 압출된 P49W21G30 샘플의 베타 쉬트 함량을 보여준다. 상기 샘플을 출발 단백질 분말 및 출발 펠렛의 참조 대조군과 비교하였다.
도 8에서는 Fourier 변환 적외선 분광법 (FTIR)으로 측정하였을 때, 선택된 열 및 RPM 조건에서 압출된 P65W20G15 샘플의 베타 쉬트 함량을 보여준다. 상기 샘플을 출발 단백질 분말 및 출발 펠렛의 참조 대조군과 비교하였다.
도 9에서는 Fourier 변환 적외선 분광법 (FTIR)으로 측정하였을 때, 선택된 열 및 RPM 조건에서 압출된 P71W19G10 샘플의 베타 쉬트 함량을 보여준다. 상기 샘플을 출발 단백질 분말 및 출발 펠렛의 참조 대조군과 비교하였다.
도 10은 20oC에서 10, 100, 200 또는 300 RPM에서 생산된 선택된 압출 산물을 편광 현미경을 사용하여 캡처한 이미지를 보여준다.
도 11은 95oC에서 10, 100, 200 또는 300 RPM에서 생산된 선택된 압출 산물을 편광 현미경을 사용하여 캡처한 이미지를 보여준다.
도 12에서는 본 발명의 다양한 구체예에 따라 HPLC에 의해 측정하였을 때, 선택된 열 및 RPM 조건 하에서 압출된 P49W21G30 용융 조성물의 압출 동안 글리세롤 손실 차트를 보여준다. 이 데이터는 압출 전 출발 분말 또는 펠렛에서의 글리세롤 함량, 그리고 선택한 조건에서 압출된 후 샘플에서의 글리세롤 함량%를 나타낸다.
도 13에서는 본 발명의 다양한 구체예에 따라 HPLC에 의해 측정하였을 때, 선택된 열 및 RPM 조건 하에서 압출된 P65W20G15 용융 조성물의 압출 동안 글리세롤 손실 차트를 보여준다. 이 데이터는 압출 전 출발 분말 또는 펠렛에서, 그리고 선택한 조건에서 압출된 후 샘플에서의 글리세롤 함량%를 나타낸다.
도 14에서는 본 발명의 다양한 구체예에 따라 HPLC에 의해 측정하였을 때, 선택된 열 및 RPM 조건 하에서 압출된 P71W19G10 용융 조성물의 압출 동안 글리세롤 손실 차트를 보여준다. 이 데이터는 압출 전 출발 분말 또는 펠렛에서, 그리고 선택한 조건에서 압출된 후 샘플에서의 글리세롤 함량%를 나타낸다.
상세한 설명
본 발명의 다양한 구체예들에 관한 세부사항은 하기 상세한 설명에서 설명된다. 본 발명의 그 외 다른 특징, 목적 및 이점들은 하기 상세한 설명으로부터 명확해질 것이다. 본 명세서에 달리 정의되지 않는 한, 본 발명과 관련하여 사용되는 과학 및 기술 용어들은 해당 분야의 숙련된 기술자들이 통상적으로 이해하는 의미를 가져야 한다. 더욱이, 내용에서 달리 필요하지 않는 한, 단수형 용어들은 복수형을 포함하며, 복수형 용어들은 단수형을 포함한다. 용어 "하나 (a 및 an)"는 내용에서 달리 언급이 없는 한, 복수의 지칭을 포함한다. 일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 단백질과 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.
정의
달리 언급이 없는 한, 하기 용어들은 다음과 같은 의미를 가지는 것으로 이해되어야 한다:
용어 "폴리뉴클레오티드" 또는 "핵산 분자"는 적어도 10개 염기 길이의 뉴클레오티드의 중합체 형태를 지칭한다. 상기 용어는 DNA 분자 (예를 들어, cDNA 또는 게놈 또는 합성 DNA) 및 RNA 분자 (예를 들어, mRNA 또는 합성 RNA)뿐만 아니라, 비-천연 뉴클레오티드 유사체, 비-고유 뉴클레오시드간 결합, 또는 둘 모두를 포함하는 DNA 또는 RNA의 유사체를 포함한다. 상기 핵산은 임의의 형상적(topological) 입체형태일 수 있다. 예를 들면, 상기 핵산은 단일-가닥, 이중-가닥, 삼중-가닥, 사중-가닥, 부분 이중-가닥, 분지형, 헤어핀, 원형 또는 자물쇠(padlocked) 입체형태일 수 있다.
달리 지시되지 않는 한, 및 일반적인 형식 "서열 식별 번호:~"로 본 명세서에 기재된 모든 서열에 대한 예로서, "서열 식별 번호: 1을 포함하는 핵산"은 적어도 일부가 (i) 서열 식별 번호: 1의 서열, 또는 (ii) 서열 식별 번호: 1에 상보적인 서열을 가짐을 지칭한다. 둘 중 선택은 내용에 따라 결정된다. 예를 들어, 핵산이 프로브로 사용되는 경우, 둘 중 하나의 선택은 프로브가 원하는 표적에 상보적이어야 한다는 요건에 따라 결정된다.
"단리된(isolated)" RNA, DNA 또는 혼합 중합체는 천연 숙주 세포에서 천연 폴리뉴클레오티드를 자연적으로 동반하는 다른 세포 성분, 예를 들어, 천연적으로 결합된 리보솜, 중합 효소 및 게놈 서열로부터 실질적으로 분리된 것이다.
"단리된" 유기 분자 (예를 들면, 실크 단백질)는 이것이 유래된 숙주 세포의 세포 성분 (막 지질, 염색체, 단백질) 또는 숙주 세포가 배양되었던 배지로부터 실질적으로 분리된 것이다. 이 용어는 특정 분리된 생체 분자가 거의 균질하게 정제될 수 있지만, 당해 생체 분자가 다른 모든 화학 물질로부터 분리되어 있을 필요는 없다.
용어 "재조합(recombinant)"이란 (1) 자연 발생 환경으로부터 제거되어 있거나, (2) 당해 유전자가 자연에서 발견되는 이의 폴리뉴클레오티드의 전부 또는 일부와 연합되어 있지 않거나, (3) 자연에서는 연결되지 않은 폴리뉴클레오티드에 작동가능하게 연결되거나, 또는 (4) 실제로는 발생하지 않는, 생물분자, 예를 들어, 유전자 또는 단백질을 의미한다. 용어 "재조합"이란 클로닝된 DNA 분리물, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종시스템에 의해 생물학적으로 합성된 폴리뉴클레오티드 유사체, 뿐만 아니라 이러한 핵산에 의해 인코드된 단백질 및/또는 mRNA와 관련하여 사용될 수 있다.
이종 서열이 유기체 게놈 안의 내인성 핵산 서열 (또는 이러한 서열의 인코드된 단백질 생성물)에 인접하여 배치되어, 이러한 내인성 핵산 서열의 발현이 변형되는 경우, 이러한 내인성 핵산 서열은 "재조합"으로 간주된다. 이와 관련하여, 이종 서열은 이종 서열 자체가 내인성 (동일한 숙주 세포 또는 이의 자손에서 유래한 것인지) 또는 외인성 (다른 숙주 세포 또는 이의 자손에서 유래한 것인지) 인지에 관계없이, 내인성 핵산 서열에 자연적으로 인접하지 않는 서열이다. 예를 들어, 프로모터 서열은 숙주 세포의 게놈 내 유전자의 고유 프로모터로 대체될 수 있고 (예를 들어, 상동 재조합에 의해), 그 결과 이 유전자는 변경된 발현 패턴을 가진다. 이 유전자는 자연적으로 연접하는 서열들 중 적어도 일부로부터 분리되기 때문에, 이제부터는 "재조합" 상태가 될 것이다.
핵산은 또한 게놈 내 상응하는 핵산에서 자연적으로 발생하지 않는 임의의 변형을 함유하는 경우, "재조합"으로 간주된다. 예를 들어, 내인성 코딩 서열은 예를 들어, 인간의 개입에 의해 인공적으로 도입된 삽입, 결실 또는 점 돌연변이를 함유하는 경우, "재조합"으로 간주된다. "재조합 핵산"은 또한 이종부위에서 숙주 세포 염색체에 통합된 핵산 및 에피좀으로 존재하는 핵산 구조체를 포함한다.
본 명세서에서 사용된 용어 "펩티드"는 짧은 폴리펩티드 예를 들어, 전형적으로 약 50개 미만의 아미노산 길이, 보다 일반적으로 약 30개 미만의 아미노산 길이의 폴리펩티드를 지칭한다. 본 명세서에서 사용된 이 용어는 구조적 그리고 이에 따른 생물학적 기능을 모방하는 유사체 및 모방체를 포함한다.
용어 "폴리펩티드"는 자연-발생 단백질과 비-자연 발생 단백질 모두, 그리고 이의 단편, 돌연변이체, 유도체 및 유사체를 포함한다. 폴리펩티드는 단량체 또는 중합체일 수 있다. 또한, 폴리펩티드는 다수의 상이한 도메인을 포함할 수 있는데, 도메인 각각은 하나 또는 이상의 별개의 활성을 갖는다.
용어 "단리된 단백질" 또는 "단리된 폴리펩티드"란 그 기원 또는 공급 출처에 근거하여, (1) 본래 상태에서 이를 수반하는 자연적으로 연합된 구성성분들과 연합되어 있지 않거나, (2) 자연에서 발견되지 않는 순도로 존재하는데, 이때 순도는 다른 세포 물질의 존재에 대해 조정될 수 있으며 (예컨대, 동일한 종으로부터의 다른 단백질들이 없는), (3) 상이한 종의 세포에 의해 발현되거나, 또는 (4) 자연에서 나타나지 않는 (예컨대, 자연에서 발견되는 폴리펩티드의 단편이거나, 또는 자연에서 발견되지 않는 아미노산 유사체 또는 유도체를 내포하거나, 또는 표준 펩티드 결합 이외의 링키지를 내포하는) 단백질 또는 폴리펩티드이다. 따라서, 화학적으로 합성되거나, 또는 이것이 자연적으로 유래되는 세포와 상이한 세포 시스템에서 합성된 폴리펩티드는 이의 자연적으로 연관된 구성성분들로부터 "단리된" 상태일 것이다. 폴리펩티드 또는 단백질은 또한 당업계에 잘 알려진 단백질 정제 기술을 사용한 분리에 의해 자연적으로 연관된 성분이 실질적으로 없을 수 있다. 이와 같이 정의된 바와 같이, "단리된"이란 상기와 같이 기술된 단백질, 폴리펩티드, 펩티드 또는 올리고펩티드가 본래 환경으로부터 물리적으로 반드시 제거되어야 하는 것은 아니다.
용어 "폴리펩티드 단편"이란 전장 폴리펩티드와 비교하여 결실 예를 들어, 아미노-말단 및/또는 카르복시-말단 결실을 가지는 폴리펩티드를 지칭한다. 바람직한 구체예에서, 상기 폴리펩티드 단편은 단편의 아미노산 서열이 자연 발생 서열의 상응하는 위치와 동일한 인접 서열이다. 단편은 전형적으로 적어도 5개, 6개, 7개, 8개, 9개 또는 10개의 아미노산 길이, 바람직하게는 적어도 12개, 14개, 16개 또는 18개의 아미노산 길이, 더욱 바람직하게는 적어도 20개의 아미노산 길이, 보다 바람직하게는 적어도 25개, 30개, 35개, 40개 또는 45개의 아미노산, 훨씬 더 바람직하게는 적어도 50개 또는 60개의 아미노산 길이, 및 더욱 더 바람직하게는 적어도 70개의 아미노산 길이이다.
단백질을 인코드하는 핵산 서열이 제 2 단백질을 인코드하는 핵산 서열과 유사한 서열을 가지는 경우, 단백질은 제 2 단백질에 대해 "상동성"을 갖거나, 또는 "상동성"이다. 대안적으로, 두 단백질이 "유사한" 아미노산 서열을 가지는 경우, 이 단백질은 두 번째 단백질에 대해 상동성을 가진다. (따라서, "상동성 단백질"이라는 용어는 두 단백질이 유사한 아미노산 서열을 가지는 것을 의미하는 것으로 정의된다.) 본 명세서에서 (특히 예측된 구조적 유사성과 관련하여) 사용되는 아미노산 서열의 두 영역 사이의 상동성은 기능의 유사성을 암시하는 것으로 해석된다.
단백질 또는 펩티드와 관련하여 "상동성"이 사용되는 경우, 동일하지 않은 잔기 위치는 종종 보존적 아미노산 치환으로 인해 상이한 것으로 인정된다. "보존적 아미노산 치환"이란 아미노산 잔기가 유사한 화학적 특성 (예를 들어, 전하 또는 소수성)을 갖는 측쇄 (R 그룹)를 갖는 또 다른 아미노산 잔기로 치환된 것이다. 일반적으로, 보존적 아미노산 치환은 단백질의 기능적 특성을 실질적으로 변화시키지 않을 것이다. 보존적 치환으로 인해 둘 또는 그 이상의 아미노산 서열이 서로 상이한 경우, 서열 동일성 퍼센트 또는 상동성 정도는 치환의 보존적 성질을 보정하기 위해 상향 조정될 수 있다. 이러한 조정을 실시하는 수단은 숙련된 기술자에게 잘 알려져 있다. 예를 들면, Pearson, 1994, Methods Mol. Biol. 24:307-31 및 25:365-89 (본원의 참고자료에 편입됨) 참고.
20개의 전형적인 아미노산 및 그 약어는 통상적 사용에 따른다. Immunology-A Synthesis (Golub and Gren eds., Sinauer Associates, Sunderland, Mass., 2nd ed. 1991) 참고, 이는 본원의 참고자료에 편입됨. 20개의 통상적인 아미노산, 비-자연 아미노산, 가령, α-, α-이중-치환 아미노산, N-알킬 아미노산, 및 이의 비-전형적 아미노산들의 입체이성질체 (예컨대, D-아미노산) 또한 본 발명의 폴리펩티드에 적합한 성분이 될 수 있다. 비전형적인 아미노산들의 예에는 다음이 포함된다: 4-하이드록시프롤린, γ-카르복시글루타메이트, ε-N,N,N-트라이메틸리신, ε-N-아세틸리신, O-포스포세린, N-아세틸세린, N-포름일메티오닌, 3-메틸히스티딘, 5-하이드록시리신, N-메틸아르기닌, 및 다른 유사한 아미노산 및 이미노산(imino acids) (예컨대, 4-하이드록시프롤린). 본 출원에서 사용되는 폴리펩티드 명명법에서 표준 용법 및 관례에 따라 왼쪽 단부는 아미노 말단 단부에 상응하고, 오른쪽 단부는 카르복시-말단 단부에 상응한다.
하기 6개 그룹은 각각 서로에 대해 보존적 치환인 아미노산을 포함한다: 1) 세린 (S), 트레오닌 (T); 2) 아스파르트 산 (D), 글루탐산 (E); 3) 아스파라긴 (N), 글루타민 (Q); 4) 아르기닌 (R), 리신 (K); 5) 이소류신 (I), 류신 (L), 메티오닌 (M), 알라닌 (A), 발린 (V) 및 6) 페닐알라닌 (F), 티로신 (Y), 트립토판 (W).
때때로 서열 동일성 백분율이라고도 하는 폴리펩티드에 대한 서열 상동성은 전형적으로 서열 분석 소프트웨어를 사용하여 측정된다. 예를 들면, Sequence Analysis Software Package of the Genetics Computer Group (GCG), University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wis. 53705 참고. 단백질 분석 소프트웨어는 보존적 아미노산 치환을 포함하여 다양한 치환, 결실 및 다른 변형에 해당하는 상동성의 척도를 사용하여 유사한 서열을 매칭시킨다. 예를 들면, GCG는 "Gap" 및 "Bestfit"와 같은 프로그램을 포함하며, 이 프로그램을 기본 매개변수와 함께 사용하여, 밀접하게 관련된 폴리펩티드들, 가령, 상이한 종의 유기체들의 상동성 폴리펩티드들 간의, 또는 야생형 단백질과 이의 뮤테인 간의 서열 상동성 또는 서열 동일성을 결정할 수 있다. 예를 들면, GCG 버젼 6.1 참고.
특정 폴리펩티드 서열을 다른 유기체의 많은 서열을 함유하는 데이터베이스와 비교할 때, 유용한 알고리즘은 컴퓨터 프로그램 BLAST이다 (Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet. 3:266-272 (1993); Madden et al., Meth. Enzymol. 266:131-141 (1996); Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997); Zhang and Madden, Genome Res. 7:649-656 (1997)), 특히 blastp 또는 tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).
BLASTp의 기본 매개 변수는 다음과 같다: 예상값: 10 (기본값); 필터: seg (기본값); 갭 오픈 코스트: 11 (기본값); 갭 확장 코스트: 1 (기본값); 최대 정렬: 100 (기본값); 워드 크기: 11 (기본값); 디스크립션 수: 100 (기본값); 벌점 행렬: BLOWSUM62.
BLASTp의 기본 매개 변수는 다음과 같다: 예상값: 10 (기본값); 필터: seg (기본값); 갭 오픈 코스트: 11 (기본값); 갭 확장 코스트: 1 (기본값); 최대 정렬: 100 (기본값); 워드 크기: 11 (기본값); 디스크립션 수: 100 (기본값); 벌점 행렬: BLOWSUM62. 상동성을 위해 비교되는 폴리펩티드 서열들의 길이는 일반적으로 적어도 약 16개 아미노산 잔기들, 통상적으로 적어도 약 20개 잔기들, 보다 통상적으로 적어도 약 24개 잔기들, 전형적으로 적어도 약 28개 잔기들, 그리고 바람직하게는 약 35개 초과의 잔기들이 될 것이다. 다수의 상이한 유기체들의 서열을 포함하는 데이터베이스를 검색할 때, 아미노산 서열을 비교하는 것이 바람직하다. 아미노산 서열을 사용한 데이터베이스 검색은 해당 분야에 공지된 blastp 이외의 알고리즘에 의해 측정 될 수 있다. 예를 들면, 폴리펩티드 서열들은 GCG 버젼 6.1의 프로그램인 FASTA를 사용하여 비교될 수 있다. FASTA는 문제(query) 서열과 검색 서열간의 가장 잘 겹쳐지는 영역의 정렬 및 서열 동일성 백분율을 제공한다. Pearson, Methods Enzymol. 183:63-98 (1990) (본 명세서에 참고자료에 편입됨). 예를 들어, 아미노산 서열 간의 서열 동일성 퍼센트는 GCG 버전 6.1(본원의 참고자료에 편입됨)에 제공된 바와 같이, 그의 기본값 매개변수 (워드 크기 2 및 PAM250 스코어링 매트릭스)를 갖는 FASTA를 사용하여 결정될 수 있다.
본 명세서 및 청구범위 전반에 걸쳐, "포함한다(comprise)"라는 단어 또는 "포함하는(comprises)" 또는 "포함하는(comprising)"과 같은 변형 표현은 명시된 정수 또는 정수 그룹을 포함하지만, 다른 정수 또는 정수 그룹을 배제하지 않는다는 것을 의미하는 것으로 이해될 것이다.
본 명세서에서 정의 된 용어 "성형체(molded body)"는 압출 성형(extrusion molding), 사출 성형(injection molding), 압착 성형(compression molding), 블로우 성형(blow molding), 라미네이팅(laminating), 매트릭스 성형(matrix molding), 회전 성형(rotational molding), 스핀 캐스팅(spin casting), 트랜스퍼 성형(transfer molding), 열 성형(thermoforming) 및 이와 유사한 것 등을 포함 하나, 이에 국한되지 않는 성형 공정과 같이 몰드(mold)라고 하는 단단한 프레임을 사용하여, 액체 또는 유연한 원료를 성형하여 제조된 바디를 의미한다.
본원에 정의 된 용어 "섬유"란 길쭉한 성형체를 지칭하며, 전형적으로 섬유는 필라멘트 형태를 가질 것이다.
본 명세서에 사용 된 용어 "용융 방적(melt spinning)"이란 중합체로부터 섬유를 형성하는 방법을 지칭하는데, 이때 당해 중합체는 용융가능한 또는 가류성 상태로 변형되고, 그 다음 방적돌기(spinneret)로부터 압출된 후, 냉각에 의해 고형화된다.
섬유와 관련하여 본 명세서에서 사용되는 용어 "연신(drawing)"은 섬유의 압출 동안 또는 압출 후, 방적된 섬유의 종축을 따라 당해 섬유를 신장시키기 위해 힘을 가하는 것을 지칭한다. 용어 "연신되지 않은 섬유(undrawn fiber)"는 압출되었지만, 임의의 연신을 겪지 않은 섬유를 의미한다. 용어 "연신율(draw ratio)"이란 일반적으로 수집 비율과 공급 비율 사이의 비율로 정의되는 기술 용어다. 일정한 부피에서는 섬유의 초기 직경 (Di)과 최종 직경 (Df)의 비율 (즉, Di/Df)로 결정할 수 있다.
본원에 사용 된 용어 "유리 전이(glass transition)"란 물질 또는 조성물이 단단하거나, 경질 또는 "유리(glassy)" 상태에서보다 유연한 "고무같은(rubbery)" 또는 "점성(viscous)"상태로의 전이를 의미한다.
본원에 사용 된 용어 "유리 전이 온도"는 물질 또는 조성물이 유리 전이를 겪는 온도를 지칭한다.
본원에 사용 된 용어 "용융 전이(melt transition)"란 물질 또는 조성물의 고무같은 상태에서 덜-규칙적인 액체 상태 또는 가류성 상태로의 전이를 지칭한다.
본원에 사용된 용어 "용융 온도"는 물질이 용융 전이를 겪는 온도 범위를 의미한다.
본원에 사용된 용어 "가소제"는 폴리펩티드 서열이 3 차 구조 및 결합을 형성하는 것을 방지하고 및/또는 폴리펩티드 서열의 이동성을 증가시키기 위해, 폴리펩티드 서열과 상호 작용하는 임의의 분자를 지칭한다.
본원에서 사용되는 용어 "가류성 상태(flowable state)"란 액체와 실질적으로 동일한 특성을 갖는 (즉, 고무 상태로부터 액체에 가까운 상태로 전환된) 조성물을 지칭한다.
예시적인 방법 및 재료들을 하기에 설명하고 있으나, 본 명세서에 기재된 방법 및 재료들과 유사하거나 균등한 방법들 및 재료 또한 본 발명의 실시에 사용될 수 있으며, 이는 숙련된 기술자에게 명백할 것이다. 본 출원에서 언급된 모든 간행물 및 그 밖의 다른 참고문헌들은 전부 본 출원에 참고문헌으로 포함된다. 충돌이 있는 경우, 정의를 비롯하여 본 명세서의 내용이 우선한다. 재료, 방법 및 실시예들은 단지 설명을 위한 것이며, 이에 국한을 시키고자 하는 것이 아니다.
개요
재조합 거미줄 단백질과 가소제를 포함하는 성형체용 조성물이 본원에서 제공되며, 이때 상기 조성물은 용융된 또는 가류성 상태에서 균질성이거나 또는 실질적으로 균질성이며; 상기 재조합 거미줄 단백질은 성형체로 형성된 후 실질적으로 비-분해된 상태 (예를 들면, 중량의 10% 미만, 또는 대개 중량의 6% 미만으로 분해된다)이다.
재조합 실크 단백질
본 명세서는 합성 단백질성 공중합체로부터 합성된 섬유 (즉, 재조합 폴리펩티드)를 비롯한 본 발명의 구체예들을 기술한다. 적합한 단백질성 공-중합체는 2016년 8월 45일에 공개된 U.S. 특허 공개 번호 2016/0222174, 2018년 4월 26일에 공개된 U.S. 특허 공개 번호 2018/0111970, 그리고 2018년 3월 1일에 공개된 U.S. 특허 공개 번호 2018/0057548에서 논의된다(이들 각각은 이의 전문이 본원의 참고자료에 편입된다).
일부 구체예들에서, 상기 합성 단백질성 공중합체는 실크-유사 폴리펩티드 서열로부터 만들어진다. 일부 구체예들에서, 상기 실크-유사 폴리펩티드 서열은 1) 실크 폴리펩티드 서열로부터 유도된 반복 도메인을 혼합 및 매칭시킴으로써 생성된 블록 공중합체 폴리펩티드 조성물, 및/또는 2) 산업적 규모로 확장시킬 수 있는 미생물로부터 분비된 유용한 성형체 조성물을 만들기 위한 충분한 크기(대략적으로 40kDa)를 갖는 블록 공중합체 폴리펩티드의 재조합 발현이다. 거미줄 폴리펩티드의 거의 모든 공개된 아미노산 서열의 서열을 내포하는 실크 반복 도메인 단편들로부터 공작된 큰 (대략적으로 40kDa ~ 대략적으로 100kDa) 블록 공중합체 폴리펩티드는 본원에서 기재된 변형된 미생물에서 발현될 수 있다. 일부 구체예에서, 실크 폴리펩티드 서열은 성형체 형성이 가능한 고도로 발현 및 분비된 폴리펩티드를 생성하도록 매칭되고 설계된다.
일부 구체예들에서, 블록 공중합체는 상기 실크 폴리펩티드 서열 공간에 걸쳐 실크 폴리펩티드 도메인의 조합 믹스로부터 공작된다. 일부 구체예들에서, 상기 블록 공중합체는 확장가능한 유기체 (예를 들면, 효모, 곰팡이, 및 그람 양성 박테리아)에서 발현 및 분비에 의해 만들어 진다. 일부 구체예들에서, 상기 블록 공중합체 폴리펩티드는 0개 또는 그 이상의 N-말단 도메인 (NTD), 1개 또는 그 이상의 반복 도메인 (REP), 그리고 0개 또는 그 이상의 C-말단 도메인 (CTD)을 포함한다. 구체예들의 일부 측면에서, 상기 블록 공중합체 폴리펩티드는 단일 폴리펩티드 쇄에서 >100개의 아미노산이다. 일부 구체예들에서, 블록 공-중합체 폴리펩티드는 국제 특허 공개공보 WO/2015/042164, "Methods and Compositions for Synthesizing Improved Silk Fibers" (그 전문이 참고문헌으로 포함됨)에 개시된 블록 공중합체 폴리펩티드의 서열에 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 도메인을 포함한다.
몇 가지 유형들의 고유 거미 실크가 확인된 바 있다. 각각의 천연 방적 실크 유형의 기계적 특성은 당해 실크의 분자 조성에 밀접하게 연결되어있는 것으로 여겨진다. 예를 들면, Garb, J.E., et al., Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol., 10:243 (2010); Bittencourt, D., et al., Protein families, natural history and biotechnological aspects of spider silk, Genet. Mol. Res., 11:3 (2012); Rising, A., et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci., 68:2, pg. 169-184 (2011); 그리고 Humenik, M., et al., Spider silk: understanding the structure-function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci., 103, pg. 131-85 (2011) 참고. 예를 들면:
아시니폼(Aciniform) (AcSp) 실크는 적당해 높은 강도와 적당해 높은 탄력성이 결합된 결과, 높은 인성을 가지는 경향이 있다. AcSp 실크는 종종 폴리 세린 및 GPX의 모티프를 포함하는 큰 블록 ("앙상블 반복") 크기를 특징으로 한다. 튜불리폼(Tubuliform) (TuSp 또는 원통형) 실크는 보통의 강도 및 높은 탄력성으로 인해 큰 직경을 가지는 경향이 있다. TuSp 실크는 폴리 세린 및 폴리 트레오닌 함량 및 짧은 폴리 알라닌 트랙(tracks)을 특징으로 한다. 메이저 엠풀레이트(Major Ampullate) (MaSp) 실크는 높은 강도 및 보통의 탄력성을 가지는 경향이 있다. MaSp 실크는 다음 두 가지 아형들(subtypes) 중 하나 일 수 있다: MaSp1과 MaSp2. MaSp1 실크는 일반적으로 MaSp2 실크보다 탄력성이 작고, 폴리 알라닌, GX, 및 GGX 모티프로 특징된다. MaSp2 실크는 폴리 알라닌, GGX, 및 GPX 모티프로 특징된다. 마이너 엠풀레이트(Minor Ampullate) (MiSp) 실크는 보통의 강도 및 보통의 탄력성을 가지는 경향이 있다. MiSp 실크는 GGX, GA, 및 폴리 A 모티프로 특징되며, 종종 대략 100개 아미노산의 스페이서(spacer) 요소들을 내포한다. 플라겔리폼(Flagelliform) (Flag) 실크는 매우 높은 탄력성과 보통의 강도를 가지는 경향이 있다. Flag 실크는 보통 GPG, GGX, 및 짧은 스페이서 모티프로 특징된다.
각 실크 유형의 특성은 종마다 다를 수 있으며, 독특한 라이프스타일 (예컨대, 앉아있는 거미줄 스피너 대 베가본드 헌터)을 이끄는 거미 또는 진화적으로 오래된 거미는 위의 설명과 다른 특성을 가진 실크를 생산할 수 있다 (거미 다양성 및 분류의 설명에 관해서 Hormiga, G., and Griswold, C.E., Systematics, phylogeny, and evolution of orb-weaving spiders, Annu. Rev. Entomol. 59, pg. 487-512 (2014); 그리고 Blackedge, T.A. et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. Natl. Acad. Sci. U.S.A., 106:13, pg. 5229-5234 (2009) 참고). 그러나, 천연 실크 단백질의 반복 도메인과 서열 유사성 및/또는 아미노산 조성 유사성을 가지는 합성 블록 공중합체 폴리펩티드는 상응하는 천연 실크 폴리펩티드로 만들어진 대응하는 성형체의 특성을 재현하는 특성을 갖는 상업적 규모의 일관된 성형체를 제조하는데 사용될 수 있다.
일부 구체예들에서, 추정 실크 서열들의 목록은 관련 용어들, 예컨대 "스피드로인(spidroin)", "피브로인(fibroin)", "MaSp"에 관해 GenBank를 검색함으로써 컴파일될 수 있으며, 독립적인 시퀀싱 시도를 통해 수득된 추가 서열들과 함께 풀링될 수 있다. 이어서 서열들은 아미노산으로 해독되고, 중복 엔트리(entries)에 대해 필터링되고, 수작업을 통하여 도메인들 (NTD, REP, CTD)로 분할된다. 일부 구체예들에서, 후보 아미노산 서열들은 피키아 (코마가타엘라) 파스토리스(Pichia (Komagataella) pastoris)에서의 발현을 위해 최적화된 DNA 서열로 역-해독된다. 상기 DNA 서열들은 각각 발현 벡터로 클론되고, 피키아 (코마가타엘라) 파스토리스(Pichia (Komagataella) pastoris)로 형질전환된다. 일부 구체예들에서, 성공적인 발현 및 분비를 나타내는 다양한 실크 도메인들은 이어서 조합 방식으로 어셈블되어 성형체 형성이 가능한 실크 분자를 형성한다.
실크 폴리펩티드는 특징적으로 비-반복 영역 (예를 들어, C-말단 및 N-말단 도메인)이 연접된 반복 도메인 (REP)으로 구성된다. 한 구체예에서, C- 말단 및 N- 말단 도메인 모두 길이가 75-350개의 아미노산 범위다. 반복 도메인은 계층 구조를 나타낸다(도 1에 나타냄). 이러한 반복 도메인은 일련의 블록들 (반복 단위(units)으로도 지칭됨)을 포함한다. 실크 반복 도메인 전체에 걸쳐 블록들은, 때로는 완전하게 때로는 불완전하게 유사(quasi)-반복 도메인을 구성함) 반복된다. 블록들의 길이 및 조성은 상이한 실크 유형에 따라, 그리고 상이한 종들에 걸쳐 달라진다. 표 1A는 선택된 종 및 실크 유형들로부터 얻은 블록 서열들의 예를 열거하며, 추가 예들은 Rising, A. et al., Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci., 68:2, pg 169-184 (2011); 그리고 Gatesy, J. et al., Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001)에 제시되어 있다. 일부 경우들에서, 블록들은 규칙적인 패턴으로 배열되어, 해당 실크 서열의 반복 도메인에서 여러 차례 (보통 2-8회) 나타나는 더 큰 매크로(macro)-반복을 형성할 수 있다. 반복 도메인 또는 매크로-반복 안의 반복된 블록 그리고 반복 도메인 안의 반복된 매크로-반복은 스페이싱 요소에 의해 분리될 수 있다. 일부 구체예들에서, 블록 서열들은 폴리A 영역을 수반하는 글리신 풍부 영역을 포함한다. 일부 구체예들에서, 짧은 (~1-10개) 아미노산 모티프는 블록 내 여러 번 나타난다. 본 발명의 목적을 위해, 상이한 천연 실크 폴리펩티드들로부터 얻은 블록들은 원 순열 (circular permutation)을 고려하지 않고 선택될 수 있다 (즉, 실크 폴리펩티드들 간에 다른 방식으로 유사한 식별된 블록들은 원 순열로 인해 정렬하지 않을 수 있다). 그러므로, 예를 들어, SGAGG (서열 식별 번호: 494)의 "블록"은, 본 발명의 목적에 있어, GSGAG (서열 식별 번호: 495) 그리고 GGSGA (서열 식별 번호: 496)와 동일하며; 이들은 모두 서로 원 순열이다. 주어진 실크 서열에 대해 선택된 특정 순열은 무엇보다도 편의상 지정될 수 있다 (보통 G로 시작). NCBI 데이터베이스로부터 얻은 실크 서열들은 블록과 비-반복 영역들로 구분될 수 있다.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
본 발명의 특정 구체예에 따른 블록 및/또는 매크로-반복 도메인으로부터 얻은 섬유-형성 블록 공중합체 폴리펩티드는 참고문헌으로 포함된 국제 특허 공개 공보 WO/2015/042164에 기재되어 있다. GenBank와 같은 단백질 데이터베이스 또는 신생경로 (de novo) 시퀀싱을 통해 얻은 천연 실크 서열은 도메인 (N-말단 도메인, 반복 도메인 및 C-말단 도메인) 별로 분류된다. 섬유 또는 성형체로의 합성 및 어셈블리를 위해 선택된 N-말단 도메인 및 C-말단 도메인 서열은 천연 아미노산 서열 정보 및 본 명세서에 기재된 다른 변형을 포함한다. 상기 반복 도메인은 중요한 아미노산 정보를 포착하는 동시에 아미노산을 인코드하는 DNA의 크기를 쉽게 합성가능한 단편들로 감소시키는 대표적인 블록, 일반적으로 실크의 유형에 따라 1-8 개의 대표적인 블록을 함유하는 반복 서열로 분해된다. 일부 구체예들에서, 적절하게 형성된 블록 공중합체 폴리펩티드는 적어도 1개의 반복 서열을 포함하는 하나 이상의 반복 도메인을 포함하고, 선택적으로 N-말단 도메인 및/또는 C-말단 도메인에 연접된다.
일부 구체예들에서, 반복 도메인은 적어도 하나의 반복 서열을 포함한다. 일부 구체예들에서, 상기 반복 서열은 150-300개의 아미노산 잔기이다. 일부 구체예들에서, 상기 반복 서열은 다수의 블록을 포함한다. 일부 구체예들에서, 상기 반복 서열은 다수의 매크로-반복을 포함한다. 일부 구체예들에서, 블록 또는 매크로-반복부는 다수의 반복 서열에 걸쳐 분할된다.
일부 구체예들에서, DNA 어셈블리 요건을 충족시키기 위해 상기 반복 서열은 글리신으로 시작하고, 페닐알라닌 (F), 티로신 (Y), 트립토판 (W), 시스테인 (C), 히스티딘 (H), 아스파라긴 (N), 메티오닌 (M) 또는 아스파르트산 (D)으로 끝날 수 없다. 일부 구체예들에서, 상기 반복 서열들 중 일부는 천연 서열과 비교하여 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 (F, Y, W, C, H, N, M 또는 D에서 종료되는 것을 피하기 위해) 폴리펩티드의 C 말단에 세린을 추가함으로써 변경될 수 있다. 일부 구체예들에서, 상기 반복 서열은 다른 블록의 상동성 서열로 불완전 블록을 채움으로써 변형될 수 있다. 일부 구체예들에서, 상기 반복 서열은 블록들 또는 매크로반복부들의 순서를 재배열함으로써 변형될 수 있다.
일부 구체예들에서, 비-반복성 N-말단 도메인과 C-말단 도메인이 합성을 위해 선택될 수 있다. 일부 구체예들에서, N-말단 도메인은 SignalP에 의해 확인된 바와 같이 선두(leading) 신호 서열의 제거에 의한 것일 수 있다(Peterson, T.N., et. Al., SignalP 4.0: discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg. 785-786 (2011).
일부 구체예들에서, N-말단 도메인, 반복 서열, 또는 C-말단 도메인 서열은 아겔레놉시스 아페르타 (Agelenopsis aperta), 알리아티푸스 굴로수스 (Aliatypus gulosus), 아포노펠마 세에만니 (Aphonopelma seemanni), 아프토스티추스 종. (Aptostichus sp.) AS217, 아프토스티추스 종. AS220, 아라네우스 디아데마투스 (Araneus diadematus), 아라네우스 겜모이데스 (Araneus gemmoides), 아라네우스 벤트리코수스 (Araneus ventricosus), 아르지오페 아모에나 (Argiope amoena), 아르지오페 아르젠타타 (Argiope argentata), 아르지오페 브루엔니치 (Argiope bruennichi), 아르지오페 트리파스시아타 (Argiope trifasciata), 아티포이데스 리베르시 (Atypoides riversi), 아비쿨라리아 주루엔시스 (Avicularia juruensis), 보트리오시르툼 칼리포르니쿰 (Bothriocyrtum californicum), 데이노피스 스피노사 (Deinopis Spinosa), 디구에티아 카니티에스 (Diguetia canities), 돌로메데스 테네브로수스 (Dolomedes tenebrosus), 유아그루스 치소세우스 (Euagrus chisoseus), 유프로스테놉스 아우스트랄리스 (Euprosthenops australis), 가스테라칸타 맘모사 (Gasteracantha mammosa), 히포칠루스 토렐리 (Hypochilus thorelli), 쿠쿨카니아 히베르날리스 (Kukulcania hibernalis), 라트로덱투스 헤스페루스 (Latrodectus hesperus), 메가헥수라 풀바 (Megahexura fulva), 메테페이라 그란디오사 (Metepeira grandiosa), 네필라 안티포디아나 (Nephila antipodiana), 네필라 클라바타 (Nephila clavata), 네필라 클라비페스 (Nephila clavipes), 네필라 마다가스카리엔시스 (Nephila madagascariensis), 네필라 필리페스 (Nephila pilipes), 네필렌기스 크루엔타타 (Nephilengys cruentata), 파라윅시아 비스트리아타 (Parawixia bistriata), 페우세티아 비리단스 (Peucetia viridans), 플렉트레우리스 트리스티스 (Plectreurys tristis), 포에실로테리아 레갈리스 (Poecilotheria regalis), 테트라그나타 카우아이엔시스 (Tetragnatha kauaiensis), 또는 울로보루스 디베르수스 (Uloborus diversus)에서 유래될 수 있다.
일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 알파 메이팅(mating) 인자 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 또 다른 내인성 또는 이종성 분비 신호 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 3X FLAG 뉴클레오티드 코딩 서열에 작동가능하도록 연결될 수 있다. 일부 구체예들에서, 실크 폴리펩티드 뉴클레오티드 코딩 서열은 다른 친화력(affinity) 태그, 가령, 6-8개의 His 잔기들에 작동가능하도록 연결된다.
일부 구체예들에서, 상기 재조합 거미줄 폴리펩티드는 아르지오페 브루엔니치 (Argiope bruennichi) 종과 같은 MaSp2로부터 유래한 재조합 거미 실크 단백질 단편 서열들에 기초한다. 일부 구체예들에서, 상기 합성된 섬유는 2개 ~ 20개의 반복 단위를 내포하는 단백질 분자들을 함유하는데, 이들 각 반복 단위는 약 20kDa보다 크다. 공중합체의 각 반복 단위 내에는 약 60개 이상의 아미노산 잔기, 대개 60개 ~ 100개 아미노산 범위의 잔기가 있고, 이들은 다수의 "유사-반복 단위(quasi-repeat units)"로 구성되게 된다. 일부 구체예들에서, 본원에 기재된 폴리펩티드의 반복 단위는 MaSp2 드래그라인(dragline) 실크 단백질 서열에 대해 적어도 95%의 서열 동일성을 가진다.
우수한 기계적 성질을 갖는 섬유를 형성하는 단백질성 블록 공중합체의 반복 단위는 실크 폴리펩티드의 일부분을 이용하여 합성될 수 있다. 이들 폴리펩티드 반복 단위는 알라닌-풍부 영역과 글리신-풍부 영역을 함유하며, 길이는 150개 아미노산 또는 이보다 더 길다. 본 개시 내용의 단백질성 블록 공중합체에서 반복부(repeats)로서 사용될 수 있는 일부 예시적인 서열은 공동-소유 PCT 공개 WO 2015/042164에서 제공되며, 그 전체가 참조로 포함되고 Pichia 발현 시스템을 사용하여 발현되는 것으로 입증되었다.
일부 구체예들에서, 거미줄 단백질은 다음을 포함한다: 반복 단위의 적어도 두 차례 발생(occurrences), 당해 반복 단위는 150개 초과 아미노산 잔기와 적어도 10kDa의 분자량을 갖고; 적어도 80%의 알라닌 함량을 포함하는 6개 또는 그 이상의 연속적인 아미노산을 갖는 알라닌-풍부 영역; 적어도 40%의 글리신 함량과 30% 미만의 알라닌 함량을 포함하는 12개 또는 그 이상의 연속적인 아미노산을 갖는 글리신-풍부 영역을 포함하며: 이때 상기 섬유는 550cN/tex보다 큰 탄성 계수, 적어도 10%의 신장성 그리고 15cN/tex의 최종 인장 강도로 구성된 군으로부터 선택된 적어도 하나의 특성을 포함한다.
일부 구체예들에서, 이때 상기 재조합 거미줄 단백질은 반복 단위를 포함하며, 이때 각 반복 단위는 2개 ~ 20개 유사-반복 단위를 포함하는 서열에 대해 적어도 95% 서열 동일성을 갖고; 각 유사-반복 단위는 {GGY-[GPG-X1]n1-GPS-(A)n2}를 포함하며, 이때 각 유사-반복 단위의 경우; X1은 SGGQQ, GAGQQ, GQGOPY, AGQQ, 그리고 SQ으로 구성되며; 그리고 n1은 4 ~ 8이며, 그리고 n2는 6-10이다. 상기 반복 단위는 다수의 유사-반복 단위로 구성된다.
일부 구체예들에서, 3개의 "긴" 유사 반복, 이어서 3개의 "짧은" 유사-반복 단위가 이어진다. 상기 언급된 바와 같이, 짧은 유사-반복 단위는 n1=4 또는 5인 것들이다. 긴 유사-반복 단위들은 n1=6, 7 또는 8인 것들로 특정된다. 일부 구체예들에서, 짧은 유사-반복부 모두는 반복 단위의 각각의 유사-반복 단위 내부의 동일한 위치에서 동일한 X1 모티프를 가진다. 일부 구체예들에서, 6개 중 최대 3개 유사-반복 단위는 동일한 X1 모티프를 공유한다.
추가 구체예들에서, 반복 단위는 반복 단위 내부의 하나의 열에서 2회 이상 나타나는 동일한 X1을 사용하지 않는 유사-반복 단위로 구성된다. 추가 구체예들에서, 반복 단위는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 유사-반복이 반복 단위의 단일 유사-반복 단위에서 동일한 X1을 2회 이상 사용하지 않는 유사-반복 단위들로 구성된다.
일부 구체예들에서, 상기 재조합 거미줄 폴리펩티드는 서열 식별 번호: 1의 폴리펩티드 (즉, 18B) 서열을 포함한다. 일부 구체예들에서, 상기 반복 단위는 서열 식별 번호: 2의 폴리펩티드다. 이들 서열은 표 1B에서 제공된다:
Figure pct00006
Figure pct00007
일부 구체예들에서, 기재된 재조합 거미줄 폴리펩티드로부터 형성된 섬유의 구조는 베타-시트(sheet) 구조, 베타-턴(turn) 구조 또는 알파-나선(helix) 구조를 형성한다. 일부 구체예들에서, 형성된 섬유의 2 차-, 3 차- 및 4 차-단백질 구조는 나노 결정 베타-시트 영역, 무정형(amorphous) 베타-턴 영역, 무정형 알파 나선 영역, 비-결정질(crystalline) 매트릭스에 매립된 무작위로 공간적으로 분포된 나노결정 영역을 갖는 것으로 기술되며, 또는 비-결정질 매트릭스에 내장된 무작위 배향된 나노 결정 영역을 갖는다. 이론에 결부되지 않고, 거미줄 내 단백질의 구조적 특성은 섬유의 기계적 특성과 관련이 있다고 가정한다. 섬유 내 결정질 영역은 섬유의 인장 강도와 연결되어 있는 반면, 무정형 영역은 섬유의 신장성(extensibility)과 연계되어 있다. 메이저 앰플레이트 (MA) 실크는 플라겔리폼 실크보다 강도가 높고 연장성이 적으며, 마찬가지로 MA 실크는 플라겔리폼 실크에 비교하여 결정질 영역의 부피 비율이 더 높다. 더욱이, 거미줄 단백질의 결정질 영역과 무정형 영역의 분자 역학에 기반한 이론적 모델은 결정질 영역이 섬유의 인장 강도와 연계되어 있고, 무정형 영역이 섬유의 연장 성과 연계되어 있다는 주장을 뒷받침한다. 추가적으로, 상기 이론적 모델링은 RPFs의 기계적 특성에 대한 2 차-, 3 차- 및 4 차-구조의 중요성을 뒷받침한다. 예를 들어, 무작위, 병렬 및 직렬 공간 분포에서 나노-결정 도메인의 어셈블리와 비정질 영역 내 얽힌(entangled) 쇄 사이, 그리고 무정형 영역과 나노-결정 영역 사이의 상호 작용력의 강도가 생성 섬유의 이론적 기계적 특성에 영향을 미쳤다.
일부 구체예들에서, 상기 실크 단백질의 분자량은 20kDa ~ 2000kDa, 또는 20kDa 이상, 또는 10kDa 이상, 또는 5kDa 이상, 또는 5 ~ 400kDa, 또는 5 ~ 300kDa, 또는 5 ~ 200kDa, 또는 5 ~ 100kDa, 또는 5 ~ 50kDa, 또는 5 ~ 500kDa, 또는 5 ~ 1000kDa, 또는 5 ~ 2000kDa, 또는 10 ~ 400kDa, 또는 10 ~ 300kDa, 또는 10 ~ 200kDa, 또는 10 ~ 100kDa, 또는 10 ~ 50kDa, 또는 10 ~ 500kDa, 또는 10 ~ 1000kDa, 또는 10 ~ 2000kDa, 또는 20 ~ 400kDa, 또는 20 ~ 300kDa, 또는 20 ~ 200kDa, 또는 40 ~ 300kDa, 또는 40 ~ 500kDa, 또는 20 ~ 100kDa, 또는 20 ~ 50kDa, 또는 20 ~ 500kDa, 또는 20 ~ 1000kDa, 또는 20 ~ 2000kDa 범위일 수 있다.
재조합 거미줄 폴리펩티드 분말 불순물 및 분해 특징
상이한 재조합 거미줄 폴리펩티드는 단백질에 의해 형성된 2 차- 및 3 차-구조의 강도 및 안정성에 기초하여 용융 온도 및 유리 전이 온도와 같은 상이한 물리 화학적 특성을 갖는다. 실크 폴리펩티드는 단량체 형태의 베타 쉬트 구조를 형성한다. 다른 단량체의 존재 하에서, 실크 폴리펩티드는 베타 쉬트 구조의 3-차원 결정 격자를 형성한다. 상기 베타 쉬트 구조는 폴리펩티드 서열의 무정형 영역으로부터 분리되고, 그 사이에 산재되어 있다.
베타 쉬트 구조는 고온에서 매우 안정적이다 - 베타 쉬트의 용융 온도는 빠른 스캐닝 열량계로 측정했을 때 약 257℃이다. Cebe et al., Beating the Heat - Fast Scanning Melts Silk Beta Sheet Crystals, Nature Scientific Reports 3:1130 (2013) 참고. 베타 쉬트 구조는 실크 폴리펩티드의 유리 전이 온도 이상에서 그대로 유지되는 것으로 보이며, 재조합 실크 폴리펩티드의 유리 전이 온도에서 보이는 구조적 전이는 베타 쉬트 사이의 무정형 영역의 이동성이 증가했기 때문이라고 추정되었다.
가소제는 무정형 영역의 이동성을 증가시키고 잠재적으로 베타 쉬트 형성을 방해함으로써, 실크 단백질의 유리 전이 온도와 용융 온도를 낮춘다. 이러한 목적에 사용되는 적합한 가소제는 물 및 글리세롤, 트리글리세롤, 헥사글리세롤 및 데카 글리세롤과 같은 폴리 알코올 (폴리올)을 포함하지만, 이에 국한되지 않는다. 다른 적합한 가소제는 디메틸 이소소르바이트; 디메틸아미노프로필 아민과 아디프트 산의 바이아사미드(biasamide); 2,2,2-트리플루오로 에탄올; 디메틸아미노프로필 아민과 카프릴산/카프르산의 아미드; DEA 아세트아미드 및 이들의 조합을 포함하나, 이에 국한되지 않는다. 기타 적합한 가소제들은 Ullsten et. al, Chapter 5: Plasticizers for Protein Based Materials Viscoeleastic and Viscoplastic Materials (2016) (https://www.intechopen.com/books/viscoelastic-and-viscoplastic-materials/plasticizers-for-protein-based-materials에서 볼 수 있음) 그리고 Vierra et al., Natural-based plasticizers and polymer films: A review, European Polymer Journal 47(3):254-63 (2011)에서 논의되며, 이들의 전문이 본원의 참고자료에 편입된다.
실크 폴리펩티드의 친수성 부분은 공기 중에 존재하는 주변 물을 습도로 결합시킬 수 있으므로, 물은 거의 항상 존재하며 결합된 주변 물은 실크 폴리펩티드를 가소화시킬 수 있다. 일부 구체예들에서, 적합한 가소제는 단독 글리세롤이거나, 또는 물 또는 다른 가소제와 조합하여 존재하는 글리세롤일 수 있다. 다른 적절한 가소제는 상기에서 논의된다.
추가로, 재조합 거미줄 폴리펩티드가 발효에 의해 생산되고, 이로부터 재조합 거미줄 폴리펩티드 분말로 회수되는 경우, 당해 재조합 거미줄 폴리펩티드 분말에서 가소제로 작용하는 불순물이 존재하거나, 또는 그렇지 않으면 3차 구조 형성을 억제시키는 불순물이 존재할 수 있다. 예를 들어, 잔류 지질과 당은 가소제로 작용하여 3 차 구조의 형성을 방해함으로써 단백질의 유리 전이 온도에 영향을 미칠 수 있다.
재조합 거미줄 폴리펩티드 분말 또는 조성물의 순도 및 상대적 조성의 평가에 사용하기 위한 다양하게 잘-확립된 방법들이 이용될 수 있다. 상대적인 크기를 기준으로 하는 크기 배제 크로마토그래피는 전장의 중합체 및 단량체 형태의 재조합 거미줄 폴리펩티드의 상대적인 양을 분석하고, 뿐만 아니라 당해 재조합 거미줄 폴리펩티드 분말에 있는 고-분자량, 저-분자량 및 중간-분자량 불순물의 양을 분석하는 데 사용할 수 있다. 유사하게, 고속-고성능 액체 크로마토그래피를 사용하여 용액에 존재하는 재조합 거미줄 폴리펩티드의 단량체 형태와 같은 다양한 화합물을 측정할 수 있다. 이온 교환 액체 크로마토그래피는 용액 내 지질 및 당과 같은 불순물을 비롯한 다양한 미량 분자의 농도를 평가하는 데 사용할 수 있다. 질량 분석법과 같은 다양한 분자의 크로마토그래피 및 정량화의 다른 방법은 당업계에 잘 확립되어 있다.
구체예에 따라, 재조합 거미줄 폴리펩티드는 재조합 거미줄 폴리펩티드 분말의 다른 성분에 비교하여, 단량체 형태인 재조합 거미줄 폴리펩티드의 양을 기반으로 산출된 순도를 가질 수 있다. 다양한 예에서, 순도는 재조합 거미줄 폴리펩티드의 유형 및 재조합 거미줄 폴리펩티드 분말을 회수, 분리 및 후 처리에 사용되는 기술에 따라, 50wt% ~ 90wt% 범위일 수 있다.
크기 배제 크로마토그래피와 역상 고성능 액체 크로마토그래피는 모두 전장의 재조합 거미줄 폴리펩티드의 측정에 유용하며, 이는 처리 과정 전과 후 조성물에서 거미줄의 양을 비교함으로써, 당해 처리 과정에서 당해 재조합 거미줄 폴리펩티드가 분해되었는지 여부의 결정에 유용한 기술을 제공한다. 본 발명의 다양한 구체예들에서, 처리 과정 전과 후 조성물에 존재하는 전장의 재조합 거미줄 폴리펩티드의 양은 최소 분해를 겪을 수 있다. 분해의 양은 0.001wt% ~ 10wt%, 또는 0.01wt% ~ 6wt%, 예를 들어 10wt% 또는 8% 또는 6wt% 미만, 또는 5wt% 미만, 3wt% 미만 또는 1wt% 미만의 범위 안에 있을 수 있다.
용융 유동학, 2 차- 및 3 차-구조
유동학(rheology)은 일반적으로 섬유 방사에서 중합체와 같은 섬유로 방사되는 재료의 물리-화학적 특성의 분석에 사용된다. 상이한 유동학적 특성은 재료를 섬유로 방적되는 능력과 방적된 섬유의 기계적 특성에 영향을 미칠 수 있다. 유동학은 또한 다른 압력, 온도 및 조건에서 재조합 거미줄 폴리펩티드 및/또는 가소제에 의해 형성된 2 차- 및 3 차-구조의 간접적 연구에 사용될 수 있다. 구체예에 따라, 전단 유량계(shear rheometers) 및/또는 신장 유량계(extensional rheometers)를 사용하여 진동 및 신장 유동학에 의한 상이한 유동학적 특성을 분석할 수 있다.
일부 구체예들에서, 모세관 유동계(Capillary Rheometry)를 사용하여 재조합 거미줄 폴리펩티드 분말과 가소제를 포함하는 조성물의 유리 전이 및/또는 용융 전이를 특징화시킨다. 용융 또는 가류성 상태로 변형되기 전의 이러한 조성물은 본원에서 "재조합 거미줄 조성물"로 지칭된다. 더욱이, 상기 재조합 거미줄 조성물이 용융된 또는 가류성 상태에 있을 때, 이들 당해 조성물은 본원에서 "재조합 거미줄 용융 조성물"로 지칭된다.
일부 구체예들에서, 모세관 유동계를 이용하여 상이한 범위의 압력에 걸쳐 당해 재조합 거미줄 조성물을 압출시키고, 전단력을 증가시킴으로써 생성되는 "램프(ramp)"에 의해, 상기 재조합 거미줄 조성물의 용융 전이 및/또는 유리 전이가 특징화될 수 있다. 구체예 및 예시에 따라, 상기 램프는 대략적으로 300m/s ~ 1500m/s에서 시작될 수 있다. 이 구체예에 따라, 상기 압력은 1MPa에서 125MPa까지, 대개 6MPa에서 50MPa까지 가변적일 수 있다.
일부 구체예들에서, 상기 재조합 거미줄 폴리펩티드 및/또는 동일한 것이 함유된 섬유의 유리 전이 및/또는 용융 전이 온도의 결정에 시차 주사 열량계(Differential Scanning Calorimetry)가 사용된다. 특정 구체예에서, 변조된(Modulated) 시차 주사 열량계를 이용하여 상기 유리 전이 및/또는 용융 전이 온도를 측정한다.
재조합 거미줄 폴리펩티드의 구체예시 및 유형에 따라, 상기 유리 전이 및/또는 용융 전이 온도는 값 범위를 가질 수 있다. 그러나, 재조합 거미줄 폴리펩티드의 측정된 유리 전이 및/또는 용융 전이 온도는 이의 고체형에서 관찰된 것보다는 전형적으로 훨씬 더 낮고, 이는 불순물 또는 다른 가소제의 존재를 나타낼 수 있다.
추가로, Fourier 변환 적외선 (FTIR) 분광학 데이터를 유동학 데이터와 복합시켜, 상기 재조합 실크 분말 및/또는 동일한 것이 함유된 조성물에서 3차 구조의 직접적인 특징화를 모두 제공할 수 있다. FTIR를 이용하여 하기 "Fourier 변환 적외선 (FTIR) 분광학"의 제목이 붙은 섹션에서 논의되는 바와 같이, 실크 폴리펩티드 및/또는 당해 실크 폴리펩티드를 포함하는 조성물의 2차 구조를 정향화시킬 수 있다
이 구체예에 따라, FTIR은 상기 재조합 거미줄 폴리펩티드 분말 및/또는 동일한 것이 함유된 조성물에 존재하는 베타-시트 구조의 정량화에 사용될 수 있다. 추가적으로, 일부 구체예들에서, FTIR은 재조합 거미줄 폴리펩티드 분말에 존재하는 당과 지질과 같은 불순물의 정량화에 사용될 수 있다. 그러나, 다른 단백질 전-처리 방법에 사용되는 다양한 카오트로프(chaotropes) 및 가용화제는 재조합 거미줄 폴리펩티드 분말 또는 동일한 것이 함유된 조성물에서 3 차 구조의 수를 감소시킬 수 있다. 따라서, 재조합 거미줄 폴리펩티드 분말이 섬유로 성형되거나 또는 방적되기 전과 후, 베타 쉬트 구조의 양이 일치하지 않을 수 있다. 유사하게, 분말이 섬유로 성형되거나 또는 방적되기 전과 후, 분말의 유리 전이 온도는 대응하지 않거나, 또는 거의 대응하지 않을 수 있다.
일부 구체예들에서, 재조합 거미줄 폴리펩티드를 특징화시키는 유동학적 데이터는 폴리펩티드에 형성된 2 차- 및 3 차-구조를 분석하기 위해 FTIR과 조합될 수 있다. 특정 구체예에서, 유동학적 데이터는 FTIR 스펙트럼과 함께 캡처될 수 있다. 유동학과 FTIR을 결합하는 예시적인 방법은 Boulet-Audet et al., Silk protein aggregation kinetics revealed by Rheo-IR, Acta Biomaterialia 10:776-784(2014)을 참고하며, 이의 전문이 본원의 참고자료에 편입된다.
Fourier 변환 적외선 (FTIR) 스펙트럼을 이용하여 폴리펩티드 분말 및/또는 섬유에 존재하는 단백질의 3 차 구조를 평가할 수 있다. 특히, FTIR 스펙트럼을 이용하여 상이한 방적 및 후-처리 조건을 거치는 섬유에 존재하는 베타 쉬트의 양을 결정할 수 있다. 따라서, FTIR 스펙트럼을 이용하여 서로 다른 기술을 기반으로 베타 쉬트 구조의 상대적인 양을 결정할 수 있다. 대안으로, 상기 FTIR 스펙트럼을 고유의 곤충 실크와 비교할 수 있다.
이 구체예에 따라, 섬유에 존재하는 상이한 3 차 구조를 평가하기 위해 상이한 파동수에서의 FTIR 스펙트럼이 사용될 수 있다. 다양한 구체예들에서, Amide I 및 Amide II 밴드에 상응하는 파동수는 턴, 베타 쉬트, 알파 나선 및 측쇄와 같은 다양한 단백질 구조의 평가에 사용될 수 있다. 이들 구조에 대응하는 파동수는 당업계에 잘 알려져 있다.
대부분 구체예들에서, 베타 쉬트에 상응하는 파동수에서의 FTIR 스펙트럼은 폴리펩티드 분말 및/또는 섬유에서 베타 쉬트 구조의 양을 평가하기 위해 사용될 것이다. 특정 구체예에서, 982-949cm-1(CH2 록킹(rocking) (A)n), 1695-1690cm-1 (Amide I) 1620-1625cm-1 (Amide I), 1440-1445cm-1 (비대칭 CH3 벤딩) 및/또는 1508cm-1 (Amide II)에서 FTIR 스펙트럼을 이용하여 존재하는 베타 쉬트의 양을 결정한다. 이 구체예에 따라, 존재하는 베타 쉬트의 양을 결정하기 위해 상이한 파동수 및 범위가 측정될 수 있다. 일부 구체예들에서 982-949cm-1 에서 FTIR 스펙트럼을 이용하여 대응하는 피크로부터 간섭을 제거한다. 이러한 파동수에서 스펙트럼을 얻는 예시적인 방법은 Boudet-Audet et al, Identification and classification of silks using infrared spectroscopy, Journal of Experimental Biology, 218:3138-3149 (2015)에서 논의되며, 이의 전문이 본원의 참고자료에 편입된다.
유사하게, 재조합 실크 분말에서 불순물을 특징화시키는 다양한 방법을 유동학적 데이터 및/또는 FTIR 데이터와 결합시켜, 불순물의 존재와 2 차- 및/또는 3 차-구조 형성 간의 관계를 분석할 수 있다.
재조합 거미줄 용융 조성물
본 발명의 목적은 본원에 기재된 방법에 따라 용융 또는 가류성 상태로 전환될 수 있는 (즉, 재조합 거미 실크 용융 조성물로 전환될 수 있는) 다양한 재조합 거미줄 조성물을 제조하는 것이다. 다양한 구체예들에서, 상기 조성물에서 재조합 거미줄 폴리펩티드 분말과 가소제의 농도는 당해 재조합 거미줄 폴리펩티드 분말의 성질 (예를 들면, 당해 재조합 거미줄 폴리펩티드 분말의 순도), 이용된 가소제 유형, 그리고 당해 섬유의 원하는 속성에 기초하여 가변적일 수 있다. 일부 구체예들에서, 농도는 모세관 유량계로부터의 데이터와 같은 유동학적 데이터에 기초하여 조정될 수 있다.
일부 구체예들에서, 용융 흐름 인덱서(Melt Flow Indexer)를 이용하여 재조합 거미줄 용융 조성물이 섬유로 연신될 수 있는지 여부를 결정할 수 있다. 구체적으로, 용융 흐름 인덱서를 이용하여 상기 재조합 거미줄 용융 조성물의 "융용 강도", 또는 압출될 때 당해 재조합 거미줄 용융 조성물을 연산시킬 수 있는 능력을 측정할 수 있다. 다양한 구체예들에서, 재조합 거미줄 폴리펩티드와 가소제의 농도는 원하는 용융 강도에 따라 달라질 수 있다.
일부 구체예들에서, 신장 점도(elongational viscosity), 전단 점도(shear viscosity) 및 선형 점탄성(linear viscoelasticity)과 같은 재조합 거미줄 조성물의 유동학적 특성을 변경하기 위해, 다양한 제제가 재조합 거미줄 조성물에 첨가될 수 있다. 신장 점도 변경에 사용되는 적합한 제제에는 폴리에틸렌 글리콜 (PEG), 트윈 (폴리소르베이트), 도데실 설페이트 나트륨, 폴리에틸렌 또는 이들의 임의 조합이 포함된다. 다른 적합한 제제는 당업계에 잘 알려져 있다.
일부 구체예들에서, 상기 재조합 거미줄 조성물과 함께 중합체 블렌드(blend) 또는 조성물과 함께 이중-구성 섬유가 생성되도록 제 2 중합체가 추가될 수 있다. 이러한 경우, 재조합 거미줄 폴리펩티드의 무정형 영역을 분해하지 않고 재조합 거미줄 조성물 자체와 함께 용융에 적합하게 만드는 용융 온도를 갖는 제 2 중합체를 포함시키는 것이 유용할 수 있다. 다양한 구체예들에서, 재조합 거미줄 폴리펩티드와 블렌딩에 적합한 중합체는 200℃, 180℃, 160℃, 140℃, 120℃ 또는 100℃ 미만의 융용 온도(Tm)을 가질 것이다. 흔히, 상기 재조합 거미줄 폴리펩티드는 20℃, 또는 25℃ 또는 50℃를 초과하는 용융 온도를 가질 것이다. 예시적인 중합체 및 용융 온도의 비-제한적인 목록이 아래 표에 포함되어 있다.
Figure pct00008
이 구체예에 따라, 재조합 거미줄 조성물에서 중량 기준으로 재조합 거미줄 폴리펩티드 분말의 적절한 농도는 다음과 같다: 1 ~ 90wt%, 3 ~ 80wt%, 5 ~ 70wt%, 10 ~ 60wt%, 15 ~ 50wt%, 18 ~ 45wt%, 또는 20 ~ 41wt%.
글리세롤이 가소제로 사용되는 경우, 재조합 거미줄 조성물의 중량 기준 글리세롤의 적절한 농도는 다음 범위와 같다: 1 ~ 60wt%, 10 ~ 60wt%, 10 ~ 50wt%, 10 ~ 40wt%, 15 ~ 40wt%, 10 ~ 30wt%, 또는 15 ~ 30wt%.
물이 가소제로 사용되는 경우, 재조합 거미줄 조성물의 중량 기준 물의 적절한 농도는 다음 범위와 같다: 5 ~ 80wt%, 15 ~ 70wt%, 20 ~ 60wt%, 25 ~ 50wt%, 19 ~ 43wt%, 또는 19 ~ 27wt%. 물이 다른 가소제와 함께 사용되는 경우, 5 ~ 50wt%, 15 ~ 43wt% 또는 19 ~ 27wt% 범위로 존재할 수 있다.
일부 구체예들에서, 물은 사용된 처리 및/또는 다이(die) 크기에 따라 압출 및/또는 냉각 공정 동안 증발될 수 있다. 일부 구체예들에서, 성형 후 수분 손실은 전체 물의 양을 기준으로 1 ~ 50%, 3 ~ 40%, 5 ~ 30%, 7 ~ 20%, 8 ~ 18%, 또는 10 ~ 15% 범위일 수 있다. 대개 손실은 15% 미만, 일부 경우 10% 미만, 예를 들어 1 ~ 10wt%이다. 증발은 의도적이거나 또는 적용된 처리의 결과일 수 있다. 증발의 정도는 예를 들어 당업계에서 이해되는 바와 같이, 적용되는 작동 온도, 유속 및 압력의 선택에 의해 쉽게 제어될 수 있다.
일부 구체예들에서, 적합한 가소제는 폴리올 (예를 들어, 글리세롤), 물, 젖산, 메틸 하이드로퍼옥사이드, 아스코르브산, 1,4-디하이드록시벤젠 (1,4 벤젠디올) 벤젠-1,4-디올, 인산, 에틸렌 글리콜, 프로필렌 글리콜, 트리에탄올 아민, 산 아세테이트, 프로판-1,3-디올 또는 이들의 임의의 조합을 포함할 수 있다.
다양한 구체예들에서, 가소제의 양은 재조합 거미줄 폴리펩티드 분말의 순도 및 상대적 조성에 따라 달라질 수 있다. 예를 들어, 고순도 분말은 저-분자량 화합물과 같은 불순물을 덜 가질 수 있고, 이들 화합물은 가소제로도 작용할 수 있으므로, 따라서 가소제의 더 높은 중량 백분율을 추가해야 한다.
특정 구체예에서, 상기 가소제 (가령, 글리세롤과 물의 조합)에 대한 상기 재조합 거미줄 폴리펩티드 분말의 다양한 비율(중량)은 0.5 또는 0.75 ~ 350wt%의 가소제:재조합 거미줄 폴리펩티드 분말, 1 또는 5 ~ 300wt%의 가소제:재조합 거미줄 폴리펩티드 분말, 10 ~ 300wt%의 가소제:재조합 거미줄 폴리펩티드 분말, 30 ~ 250wt%의 가소제:재조합 거미줄 폴리펩티드 분말, 50 ~ 220wt%의 가소제:재조합 거미줄 단백질, 70 ~ 200wt%의 가소제:재조합 거미줄 폴리펩티드 분말, 또는 90 ~ 180wt%의 가소제:재조합 거미줄 폴리펩티드 분말일 수 있다. 본 명세서에서 사용된 바와 같이, 0.5 ~ 350wt%의 가소제:재조합 거미줄 폴리펩티드 분말이란 0.5:1 ~ 350:1의 비율에 해당된다.
이론에 제한되지 않고, 본 발명의 다양한 구체예들에서, 상기 재조합 거미줄 조성물을 가류성 상태 (예를 들면, 재조합 거미줄 용융 조성물 포함)로 전이 유도는 임의의 제형에서 전-처리 단계로 사용될 수 있는데, 여기에서 단량체 형태로 재조합 거미줄 폴리펩티드를 포함하는 것이 유익하다. 보다 구체적으로, 재조합 거미줄 용융 조성물을 유도하는 것은 단량체 재조합 거미줄 폴리펩티드의 결정 중합체 형태로의 응집을 방지하거나 또는 공정의 나중 단계에서 당해 재조합 거미줄 폴리펩티드가 이의 결정성 중합체로의 전이를 제어하는 것이 바람직한 적용에 이용될 수 있따. 하나의 특정 구체예에서, 상기 재조합 거미줄 용융 조성물을 이용하여 제 2 중합체와 당해 재조합 거미줄 폴리펩티드를 블렌딩시키기 전, 당해 재조합 거미줄 폴리펩티드의 응집을 방지할 수 있다. 또다른 특정 구체예에서, 상기 재조합 거미줄 용융 조성물은 당해 재조합 거미줄 폴리펩티드가 단량체 형태로 염기에 존재하는 화장품 또는 스킨 케어 제품을 위한 염기의 생성에 사용될 수 있다. 이 구체예에서, 염기에 단량체 형태의 재조합 거미줄 폴리펩티드를 갖는 것은 피부와 접촉하거나 다양한 다른 화학 반응을 통해 단량체의 결정질 중합체 형태로의 응집 제어가 가능하다.
용융 또는 가류성 상태 유도
본 발명의 일부 구체예들에 따르면, 상기 재조합 거미줄 조성물은 전단력 및/또는 압력, 전형적으로 이둘 모두를 적용시킴으로써 용융 또는 유동성 상태로 전환된다. 전단력과 압력의 조합을 만들기 위한 적절한 수단에는 단일 스크류 압출기, 트윈 스크류 압출기, 용융 유동 압출기 및 모세관 유량계가 포함되나, 이에 국한되지 않는다.
일부 구체예들에서, 트윈 스크류 압출기를 이용하여 상기 재조합 거미줄 조성물을 용융된 또는 가류성 조성물로 전환시키기 위해 필요한 압력과 전단력을 제공한다. 일부 구체예들에서, 상기 트윈 스크류 압출기는 다음 범위의 전단력을 제공하도록 구성된다: 1.5 뉴톤 미터 (Nm) ~ 13 뉴톤 미터, 2 뉴톤 미터 ~ 10 뉴톤 미터, 2 뉴톤 미터 ~ 8 뉴톤 미터, 또는 2 뉴톤 미터 ~ 6 뉴톤 미터. 일부 구체예들에서, 상기 트윈 스크류 압출기에 의해 제공되는 전단력은 부분적으로 분당 당해 트윈 스크류 압출기의 회전에 따라 달라진다. 다양한 구체예 및 구성들에서, 상기 트윈 스크류 압출기의 분당 회전(RPMs) 범위는 10RPMs ~ 300 RPMs이다. 다양한 구체예들에서, 상기 트윈 스크류 압출기는 전단력과 함께 1MPa ~ 300MPa 범위의 압력을 제공하도록 구성된다.
임의선택적 구체예들에서, 상기 트윈 스크류 압출기는 재조합 거미 실크 용융 조성물로 변형되기 전 및/또는 후, 재조합 거미 실크 조성물에 열을 가하도록 구성된다. 일부 구체예들에서, 상기 트윈 스크류 압출기의 배럴 (즉, 트윈 스크류가 조성물을 혼합하는 실린더)은 가열된다. 다른 구체예들에서, 방적 돌기에 근접해 있는 상기 트윈 스크류 압출기의 일부분(가령, 당해 재조합 거미줄 용융 조성물이 압출되는 구멍)이 열을 받게 된다. 대안적으로, 열이 가해지지 않고, 상기 용융/가류성 상태는 상기 트윈 스크류 압출기에서 재조합 거미줄 조성물에 적용된 전단력으로부터 생성된 열을 통하여 전적으로 유도된다. 예를 들면, 일부 구체예들에서, 용융/가류성 상태를 얻기 위해 적용되는 열의 양은 주변 실온 (예를 들면, 대략적으로 20℃ 초과)과 대등할 것이다.
다양한 구체예들에서, 상기 재조합 거미줄 용융 조성물이 가열되는 온도는 당해 재조합 거미줄 폴리펩티드의 분해를 최소화 또는 완전하게 분해를 방지하기 위해 최소화될 것이다. 특정 구체예들에서, 상기 재조합 거미줄 용융은 120℃ 미만, 100℃ 미만, 80℃ 미만, 60℃ 미만, 40℃ 미만, 또는 20℃ 미만의 온도로 가열시키는 것이다. 대개 상기 용융은 공정 동안 10℃ ~ 120℃, 10℃ ~ 100℃, 15℃ ~ 80℃, 15℃ ~ 60℃, 18℃ ~ 40℃ 또는 20±2℃ 범위의 온도에서 일어날 것이다.
다른 구체예들에서, 재조합 거미줄 조성물을 용융된 또는 가류성 상태로 변형시키는 데 필요한 압력과 전단력을 제공하기 위해 다른 장치가 사용될 수 있다. 위에서 논의 된 바와 같이, 모세관 유량계를 또한 사용하여 상기 재조합 거미줄 조성물을 가류성 또는 용융된 상태로 전환시키는데 필요한 전단력과 압력을 제공할 수 있다.
일부 구체예들에서, 상기 재조합 거미줄 조성물은 이것이 용융된 또는 가류성 상태에 있는 후, 그리고/또는 당해 용융된 또는 가류성 재조합 거미줄 용융 조성물의 압출 전, 임의선택적으로 가열된다. 가열이 필요한 경우, 아마도 상기 재조합 거미줄 조성물의 유리 전이 온도가 높기 때문에, 당해 재조합 거미줄 조성물을 용융된 또는 가류성 상태로 전환시키기 위해 전단력과 압력을 제공하기 위해 이용되는 장치는 가열된 압출 장치에 직접적으로 또는 간접적으로 연결될 수 있다. 특정 구체예에서, 트윈 스크류 실린더 믹스는 가열된 압출 장치에 (직접적으로 또는 간접적으로) 연결된다. 가열 압출 장치의 실시 예 및 구성에 따라, 가열된 압출 장치는 20 ~ 120℃, 80 ~ 110℃, 85 ~ 100℃, 85 ~ 95℃ 및/또는 90 ~ 95℃ 범위의 온도에서 유지될 수 있다.
상기 압출된 재조합 거미줄 용융 조성물은 본원에서 재조합 거미줄 압출물(extrudate)로 지칭된다. 상기 재조합 거미줄 압출물의 적용에 따라, 당해 압출물이 압출되는 상기 방적돌기는 다양한 직경을 가질 수 있다. 예를 들면, 상기 재조합 거미줄 압출물이 몰드로 압출되여 성형 물체가 되는 구체예들에서, 상기 방적돌기의 직경은 200mm 보다 크고, 150mm 보다 크고, 100mm 보다 크고, 50mm 보다 크고, 예를 들면, 100mm ~ 500 mm, 150mm ~ 400mm 또는 200mm ~ 300mm 범위 안에 있을 수 있다. 아래에서 논의되는 바와 같이, 일부 구체예들에서 상기 재조합 거미줄 압출물은 펠렛으로 가공하며, 다시 당해 펠렛에 재조합 거미줄 용융 조성물로 전환시키는데 충분한 전단력과 압력을 가함으로써, 재-가공된다. 상기 재조합 거미줄 압출물이 펠렛으로 가공되는 구체예들에서, 상기 방적돌기는 2mm 보다 큰, 1.5mm 보다 큰 또는 1mm 보다 큰 직경을 가질 수 있고, 예를 들면, 상기 직경은 1mm ~ 5 mm, 1.5mm ~ 4 mm, 또는 2mm ~ 3mm 범위일 수 있다.
상기 재조합 거미줄 압출물이 섬유로 만들어지는 구체예들에서, 상기 방적돌기는 500μm 미만의 (예를 들면, 10μm ~ 500μm 범위의) 구멍을 가질 수 있다. 섬유의 필요한 초기 데니어(denier)에 따라, 상기 재조합 거미줄 단백질 용융 조성물은 구멍의 크기가 다양한 방적 돌기를 통하여 압출될 수 있다. 특정 구체예들에서, 상기 구멍은 25μm ~ 500μm, 50μm ~ 250μm, 또는 75μm ~ 125μm 범위일 수 있다. 일부 구체예들에서, 이상적인 구멍 크기는 당해 섬유의 최종 연신 비율(draw ratio)에 기초할 것이다. 예를 들면, 압출된 섬유의 초기 데니어가 높을수록 연신 비율이 높아질 수 있다.
본 발명의 대부분 구체예들에서, 상기 재조합 거미줄 용융 조성물과 상기 재조합 거미줄 압출물은 모두 실질적으로 균질할 것이며, 이는 광학 현미경으로 검사할 때, 임의의 내포물 또는 침전물을 갖지 않음을 의미한다. 일부 구체예들에서, 재조합 거미줄을 3 차원-격자로 정렬시키기 위한 프록시(proxy)로서 사용될 수 있는 복굴절을 측정하기 위해 광학 현미경이 사용될 수 있다. 복굴절은 빛의 편광과 전파에 의존하는 굴절률을 갖는 재료의 광학적 특성이다. 특히, 복굴절에 의해 측정된 높은 축 방향 차수(axial order)는 높은 인장 강도와 연계될 수 있다. 일부 구체예들에서, 재조합 거미줄 용융 압출물은 최저 복굴절을 가질 것이다.
본 발명에 따르면, 균질한 가류성 상태는 임의서택적으로 열을 가할 수 있지만, 오로지 전단력과 압력 만으로 유도될 수 있다. 열을 가하지 않거나 또는 임의선택적인 열으로 가하지 않고, 전단력과 압력의 조합만으로 재조합 거미줄 용융 조성물 및 재조합 거미줄 압출물에서 재조합 거미줄 폴리펩티드의 가공 동안 분해되지 않는 조성물을 제공하는 것으로 밝혀졌다. 이는 압출물 조성물에 전장의 재조합 거미줄 폴리펩티드를 유지하는 것이 결정성(crystallinity)과 같은 재료의 최적 특성을 창출하고, 이로 인하여 고품질 제품이 생성되기 때문에 바람직하고 유익하다. 본 발명의 구체예들에서, 전단력과 압력 (그리고 임의선택적으로 열)을 적용시켜 취득된 재조합 거미줄 용융 압출물의 분해는 최소이거나, 또는 무시할 수준이다.
상기 재조합 거미줄 폴리펩티드의 분해 양은 다양한 기술을 이용하여 측정될 수 있다. 상기에서 논의된 바와 같이, 크기 배제 크로마토그래피를 이용하여 존재하는 전장의 재조합 거미줄 폴리펩티드의 양을 측정함으로써, 재조합 거미줄 폴리펩티드의 분해 양이 측정될 수 있다. 다양한 구체예들에서, 상기 조성물은 성형체로 형성된 후, 6.0wt% 미만의 양으로 분해된다. 또다른 구체예에서, 상기 조성물은 몰딩 후 4.0wt% 미만, 3.0wt% 미만, 2.0wt% 미만, 또는 1.0wt% 미만의 양으로 분해된다(이러한 분해 양은 0.001wt% ~ 10wt%, 8wt%, 6wt%, 4wt%, 3wt%, 2wt% 또는 1wt%, 또는 0.01wt% ~ 6wt%, 4wt%, 3wt%, 2wt% 또는 1wt% 범위 안에 있을 수 있다). 또다른 구체예에서, 상기 압출물 및/또는 용융 조성물 안에 재조합 거미줄 단백질은 실질적으로 비-분해된 상태다.
섬유로 연신(drawing)
상기 압출물이 섬유 형태로 이용되는 경우, 전구체 섬유는 당해 섬유의 배향을 증가시키고, 3-차원 결정질 구조를 촉진시키기 위해 연신될 수 있다. 연신에 힘을 가하면 당해 섬유 축을 따라 분자의 정렬이 촉진된다. 방적돌기 홀(hole)을 통해 유동되도록 힘을 가할 때, 중합체 분자, 이를 테면, 폴리펩티드가 부분적으로 정렬된다. 상기 섬유는 수작업으로 연신되거나, 또는 기계적으로 연신될 수 있다. 수작업 연신은 대개 섬유 직경의 최소로 감소된, 낮은 복굴절을 갖는 정렬된 섬유를 제공한다.
본 발명에서, 섬유가 연신되는 동안 균일한 고온 표면 위로 전구체 섬유를 통과시킴으로써 정렬을 최적화시킬 수 있다. 본 명세서에서 사용된 바와 같이, "고온 표면"이란 실질적으로 균일한 열과 실질적으로 균일한 표면 모두를 제공하는 표면을 지칭한다. 고온 표면을 열원으로 사용하면, 주변 열원을 사용했을 때 나타나는 변동성이 제거되어, 균일성이 더 크게 향상되고, 결과적으로 당해 섬유의 상업적 대량 생산을 위한 프로세스의 확장성이 향상된다. 일부 구체예들에서, 상기 고온 표면은 금속 막대 또는 기타 금속 표면일 것이다. 다른 구체예들에서, 상기 고온 표면은 세라믹 또는 다른 재질로 만들어질 수 있다. 이 구체예에 따라, 상기 고온 표면은 만곡되거나, 또는 그렇지 않으면 당해 고온 표면 위를 상기 섬유가 용이하게 이용될 수 있는 구성이 될 수 있다.
본 발명의 구체예들에서, 상기 비-연신 압출된 섬유는 이것이 연신될 때 상기 고온 표면 위로 동시에 이용될 수 있다. 이 구체예에 따라, 상기 고온 표면의 온도는 160 ~ 210℃, 180 ~ 210℃, 190 ~ 210℃, 195 ~ 210℃, 195 ~ 205℃, 또는 200 ~ 205℃ 범위일 수 있다.
이 구체예에 따라, 상기 비-연신 압출된 섬유는 상기 고운 표면 위에서 연신될 때 상이한 연신 비율이 적용될 수 있다. 이 구체예에 따라, 상기 연신 비율은 2 ~ 7일 수 있다. 일부 구체예들에서, 최대 안정적 연신 비율은 상기 고온 표면의 온도에 따라 달라질 것이다.
일부 구체예들에서, 상기 고온 표면의 온도는 상기 비-연신 압출된 섬유의 유리 전이 온도에 대한 함수로 산출된다. 예를 들면, 상기 고온 표면의 온도는 상기 재조합 실크 단백질 분말 및/또는 비-연신 압출된 섬유의 유리 전이 온도보다 5℃, 10℃, 15℃, 20℃, 또는 25℃ 더 높은 것으로 산출될 수 있다. 환언하면, 상기 재조합 실크 단백질 분말의 유리 전이 온도 보다 0, 또는 0.1℃ ~ 25℃ 더 큰 범위에서, 대개 0 ~ 10℃, 15℃, 20℃의 범위에서 더 크다.
이 구체예 및 섬유가 상기 균일한 고온 표면을 통과하는 속도 (본원에서 "릴(reel) 속도"로 지칭됨)에 따라, 상기 고온 표면의 길이는 가변적일 수 있으며 (예를 들면, 상기 섬유가 연신되는 고온 표면의 크기(cm)), 따라서 상기 비-연신 압출된 섬유가 열 및 변형을 거치는 기간이 변경된다. 대부분 구체예들에서, 뜨거운 막대의 폭은 1cm보다 적지 않을 것이다. 그러나, 다양한 구체예들에서, 상기 고온 표면의 폭은 1 ~ 50cm, 1 ~ 2cm, 1 ~ 3cm, 1 ~ 5cm, 5 ~ 38cm, 38 ~ 50cm 범위일 수 있다. 이 구체예에 따라, 상기 릴 속도는 분당 1 ~ 60 미터 범위일 수 있다.
상기 릴 속도와 고온 표면의 길이에 따라, 당해 고온 표면 위에서의 전체 체류 시간이 달라질 것이다. 대부분 구체예들에서, 전체 체류 시간은 0.2 초 ~ 3 초 범위일 수 있다.
추가적으로, 상기 비-연신된 섬유는 상이한 연신 비율을 제공하는 다양한 힘을 받을 수 있다. 대부분 구체예들에서, 상기 인장력은 고데(godets)에 의해 제공될 것이다. 일부 구체예들에서, 상기 고데는 상기 고온 표면을 통과하는 섬유가 당해 고온 표면에 대해 각을 이루도록 배치될 것이다. 예를 들면, 상기 고온 표면이 곡면인 경우, 상기 고데는 당해 고온 표면 위를 통과하는 섬유가 당해 고온 표면에 대해 10~40도의 각이 되도록 배치될 수 있다.
다양한 구체예들에서, 상기 비-연신된 섬유의 변형율(즉, 섬유가 열을 받고, 그리고 연신으로 인한 변형된 양)은 상기 인자들에 기초하여 가변적일 수 있다. 변형율은 상기 비-연신된 섬유가 상기 고온 표면으로 공급되는 속도와 당해 섬유가 당해 고온 표면으로부터 수집되는 속도를 기반으로 산출될 수 있다. 예를 들면, 상기 섬유는 분당 1 미터의 속도로 상기 고온 표면으로 공급되며, 분당 5 미터의 속도로 당해 고온 표면으로부터 수집된다. 특정 구체예에서, 상기 변형률은 다음 방정식을 사용하여 산출되며, 여기에서 상기 섬유가 상기 고온 표면으로 공급되는 속도는 v 1 이고, 당해 섬유가 당해 고온 표면으로부터 수집되는 속도는 v 2 이고, 그리고 변형에 걸리는 길이는 L 0 이다.
식 1:
Figure pct00009
구체예에 따라, 고온 표면 위의 연신은 1-단계 또는 다단계 (즉, 2-단계, 3- 단계 또는 4-단계)로 수행될 수 있다. 변형률, 변형률, 릴 속도, 고운 표면의 온도 및 고온 표면의 길이와 같은 매개변수는 각 단계에서 변경되거나 또는 다를 수 있다. 여러 단계에 걸쳐 연신을 수행하면, 섬유의 전체 변형률에 영향을 미칠 수 있으며, 이는 결정질 베타 쉬트 구조의 형성을 향상시키고, 대개 섬유 강도를 향상시킬 수 있다.
섬유의 후-처리(Post-Processing Fiber)
섬유의 분자 정렬을 개선하기 위해 다양한 후-처리 방법이 사용될 수 있다. 섬유 안에 존재하는 가소제 및/또는 재조합 거미줄의 양에 따라, 당해 섬유는 열 처리될 수 있다 (예를 들면, 증기 또는 열을 이용한 어닐링). 다른 예시들에서, 상기 섬유는 다양한 용매로 처리하여, 당해 섬유를 어닐링시키고, 섬유내 단백질 (예를 들면, 18B 단백질)의 결정성을 개선시킬 수 있다. 일부 경우들에서, 상기 섬유는 알코올, 이를 테면 메탄올을 이용하여 어닐링될 수 있다. 특정 구체예에서, 상기 섬유는 알코올 증기를 이용하여 어닐링될 수 있다.
일부 경우들에서, 섬유를 물로 처리하기 전, 섬유 또는 직물을 하나 또는 그 이상의 컨디셔너, 윤활제, 계면활성제, 유화제, 항-응집제 또는 어닐링제로 처리하면, 물로 처리한 후 직물의 손으로 만질 때 촉낌 또는 드레이프(drape)가 변경될 것이다. 특정 구체예에서, 사이클로펜타실옥산 또는 PDMS이 컨디셔너로 사용된다. 특정 구체예에서, 섬유 또는 섬유로 형성된 직물을 알코올로 어닐링하면 물-처리된 섬유 또는 직물의 손으로 만질 때 촉낌 또는 드레이프가 개선된다.
압출물의 재-용융 및 재-압출
본 발명의 일부 구체예들에서, 상기 재조합 거미줄 압출물을 준비하는 공정에는 상기 재조합 거미줄 압출물을 포함하는 성형체 (예를 들면, 재조합 거미줄 압출물로 형성된 펠렛, 섬유 또는 기타 성형 물품)의 재-가공이 추가적으로 포함될 수 있다. 이들 구체예에서, 상기 재조합 거미줄 압출물은 당해 재조합 거미줄 압출물이 용융된 또는 가류성 상태로 전환되도록 충분한 전단력과 압력을 받게 된다.
이론에 제한되지 않고, 글리세롤과 같은 가소제 존재 하에서 상기 재조합 거미줄 폴리펩티드에 전단력과 압력이 가해지면, 당해 재조합 거미줄 폴리펩티드는 "개방-형(open-form) 재조합 거미줄 폴리펩티드"로 전환되며, 이때 당해 재조합 거미줄 폴리펩티드는 펼쳐지고(unfolds), 상기 글리세롤과 상호작용을 형성하게 된다. 글리세롤과의 상호작용으로 인해, 이러한 "개방-형 재조합 거미줄 폴리펩티드"에는 분자간 그리고 분자내 베타-쉬트 상호작용이 덜 형성된다. 구체적으로, 상기 개방 형 재조합 거미줄 폴리펩티드는 비-가역적 3-차원 격자(lattice)를 형성하기 위해 분자간 상호 작용이 형성되는 것을 막는다.
용융 및 압출 공정 동안 상기 재조합 거미줄 폴리펩티드의 분해(존재한다면)가 최소화로 존재하기 때문에, 당해 재조합 거미줄 압출물은 다시 재조합 거미줄 용융 조성물로 역-전환될 수 있고, 여러 번 재-압출될 수 있다. 이러한 의미에서, 상기 조성물은 가열될 수 있기 때문에 "열가소성"이며, 단백질 또는 상기 조성물의 유의미적인 분해 없이 여러 차례 냉각 및 경화가 허용된다. 다양한 구체예들에서, 상기 재조합 거미줄은 적어도 20 번, 적어도 10 번, 또는 적어도 5 번 재-용융되고, 재-압출될 수 있다. 이들 구체예에서, 다수의 재-용융 및 재-압출 단계에 걸쳐 볼 수 있는 분해는 10% 만큼 낮을 수 있다. 재-압출의 옵션은 분해없이, 실질적으로 균질성 조성물의 생산을 허용하고, 상기 조성물로부터 형성된 산물의 용도 변경 또는 재설계를 가능하게 한다. 예를 들면, 품질이 떨어지는 성형 물품은 재-압출 및 재-성형될 수 있다. 수명이 다한 제품의 재활용도 가능하다.
실시예
실시예 1: 재조합 18B 폴리펩티드 분말의 순도
재조합 거미줄 - FLAG 테그를 포함하는 18B 폴리펩티드 서열 (서열 식별 번호: 1)은 다양한 로트의 대규모 발효를 통해 생산되었고, 회수 및 분말로 건조되었다 ("18B 분말"). 역상 고성능 액체 크로마토그래피 ("RP-HPLC")를 사용하여 분말 내 18B 폴리펩티드 단량체의 중량을 측정했다. 샘플을 5M 구아닌 티오시아테이트 (GdSCN) 시약을 사용하여 용해하고 Agilent Poroshell 300SB C3 2.1x75mm 5μm 컬럼에 주입하여 소수성(hydrophobicity)을 기반으로 성분을 분리했다. 검출 양식은 215 nm에서 펩티드 결합의 UV 흡광도 (360 nm 기준)이었다. 18B-FLAG 단량체의 샘플 농도는 18B-FLAG 분말 표준과 비교하여 결정되었으며, 18B-FLAG 단량체 농도는 크기 배제 크로마토그래피 (SEC-HPLC)를 사용하여 미리 결정되었다.
상기 샘플 분말은 57.964wt%의 18B 단량체를 포함하는 것으로 밝혀졌다.
실시예 2: 재조합 실크 분말 압출물 생성
실시예 1의 재조합 실크 분말은 가정용 향신료 분쇄기를 이용하여 혼합했다. 물과 글리세롤 비율을 상기 재조합 실크 분말 ("18B 분말")에 추가하여 하기 표 2에 나타낸 상이한 단백질 분말 대 가소제의 비율을 갖는 재조합 거미줄 조성물을 만들었다.
아래 표 2에 열거된 10 ~ 100g의 상기 재조합 거미줄 조성물 (즉, "제형")은 Xceptional Instruments 트윈 스크류 압출기 (TSE) (항목 번호 TT-ZE5-MSMS-3HT)를 이용하여 혼합하였고, 이 압출기는 모든 TSE 실험에 사용되었다. 스테인레스 강 (S316) 압출기 배럴은 각 길이가 ~ 5cm의 3개 가열 영역을 갖고 있다. 사용된 스크류는 길이 180mm, 직경 9mm, (L/D 비율 20:1) 표준 한 쌍의 스테인레스 강 (S316) 공동-회전 스크류이다. 상기 스크류는 9mm의 피치(pitch)를 갖는다.
하기 열거된 P25W05G70, P49W21G30 및 P65W20G15 제형의 경우, 재조합 거미줄 조성물은 우선 펠렛으로 압출되고, 그 다음 실험에서 당해 펠렛을 재-압출시킴으로써 재-가공되었다. 펠렛을 만들기 위해, 18B/물/글리세롤 혼합물을 포함하는 재조합 거미줄 조성물을 금속 깔때기를 사용하여 TSE로 도입시키고, 몇 분 동안 연속적으로 탬핑(tamping) 장치를 사용하여 트윈 스크류와 접촉하도록 밀어 넣었고, 한편 TSE는 ~ 90-95℃의 온도에서 300RPM에서 출발-배럴, 중간-배럴 및 종료-배럴 영역을 포함한 모든 배럴 영역에서 작동하고 있다. 재료들은 0.5mm 다이를 통하여 용융 상태 (즉, 재조합 거미줄 용융 조성물)로 압출되며, 다이의 구멍은 축에 대해 180°각을 이루고 있어, 재조합 거미줄 압출물이 형성된다.
상기 0.5mm 재조합 거미줄 압출물은 상기 다이로부터 길이가 ~ >10 미터인 연속적인, 탄성 "누들"로 나오게 된다. 5-10g 양의 상응하는 압출물 조성물을 가정용 향신료 분쇄기에 순차적으로 배치시키고, 여기에 5 초 동안의 펄스를 총 6 회 펄스 (총 30 초) 적용하여 펠렛을 만들었다. 상기 펠렛의 길이가 5mm를 넘지 않는지 확인하기 위해, 당해 펠렛을 검사했으며, 펠렛의 평균 길이는 약 2.5mm이다.
하기 열거된 P71W19G10 제형의 경우, 18B/물/글리세롤 재조합 거미줄 혼합물을 실시예 2에 기술된 조건 하에서 사전-혼합시키고, 직접 (즉, 펠렛으로 먼저 압출시키지 않고) 압출시켜 재조합 거미줄 압출물을 만들었다.
Figure pct00010
실시예 3: 적어도 분해를 갖는 재조합 실크 압출물의 생성
다수의 상이한 조건에 대한 분해를 평가하기 위해, 실시예 2에 열거된 재조합 거미줄 제형은 압출 동안 다양한 온도와 다양한 양의 압력과 전단력을 받았다. 구체적으로, 트윈 스크류 압출된 펠렛의 분당 회전 수는 가변적인 양의 토크(torque)와 전단력을 제공하기 위해 변경되었다. 재조합 거미줄 제형을 용융 상태로 전환시키고, 상이한 샘플의 압출에 사용되는 다양한 온도 및 RPM 조합이 하기에 내포되어 있다.
표 1에 열거된 P49W21G30 및 P65W20G15 제형의 압출된 펠렛을 Xceptional Instruments TSE를 사용하여 다양한 RPM 및 온도에서 다시 압출시켰다. Xceptional Instruments TSE 작동을위한 다른 매개 변수는 실시예 2와 관련하여 위에서 설명한 것과 동일했다.
실시예 2에 기재된 바와 같이, P71W19G10 제형은 또한 Xceptional Instruments TSE를 사용하여 다양한 RPM 및 온도에서 압출되었다. Xceptional Instruments TSE 작동을 위한 다른 매개 변수는 실시예 2와 관련하여 위에서 설명한 것과 동일했다.
고-분자량, 저-분자량 및 중간-분자량 불순물, 단량체 18B 및 응집체 18B의 상대적인 양을 특성화시킨 데이터는 다음과 같이 크기 배제 크로마토그래피 (SEC)를 사용하여 수집되었다: 18B 분말을 5M 구아니딘 티오시아네이트에 용해시키고, Yarra SEC-3000 SEC-HPLC 컬럼에 주입하여 분자량 기반으로 성분을 분리했다. 굴절률은 검출 방식으로 사용되었다. 18B 응집체, 18B 단량체, 저-분자량 (1-8kDa) 불순물, 중간-분자량 불순물 (8-50kDa) 및 고-분자량 불순물 (110-150kDa)을 정량화했다. 관련 조성은 질량% 및 면적%로 보고되었다. BSA는 모든 단백질의 >90%가 서로 ~ 7% 이내의 dn/dc 값 (굴절률의 응답 계수)을 나타낸다는 가정 하에 일반 단백질 표준으로 사용되었다. 정체 시간 표준으로 폴리(에틸렌 옥시드)를 사용하였고, 당해 방법의 일관된 성능을 보장하기 위해 BSA 측정기(calibrator)를 점검 표준으로 사용했다.
하기 표 3-5에는 다양한 RPM 및 온도에서 생산된 압출물에 대한 다양한 SEC 분석이 열거되어 있다. 다섯 번째 열에는 출발 펠렛 및 압출물 (P49W21G30 및 P65W20G15)에서 기록된 18B 단량체의 차이 (면적%), 또는 출발 분말 및 압출물 (P71W19G10)에서 기록된 18B 단량체의 차이(면적%)가 포함된다. 도 1-3은 아래에 자세히 설명되어 있으며, 차례로 각각 표 3-5에 대응하는 그래프를 포함한다. 이로부터 테스트된 모든 온도 및 RPM에서 분해가 최소화됨을 알 수 있으며, 이는 가공 조건의 유연성과 압출 방법을 사용한 가공에 대한 일반적인 견고성을 나타낸다.
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
도 1은 20, 40, 60, 80, 95 또는 120℃의 압출 조건에서 위의 표 3에 나열된 P49W21G30 샘플에 대한 SEC 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 18B 단량체 (검은 색 막대), 중간-분자량 불순물 (회색 막대) 및 저-분자량 불순물 (십자 모양 막대)은 면적%로 표시된다.
도 2는 20, 40, 60, 95 또는 140℃의 압출 조건에서 위의 표 4에 나열된 P65W20G15 샘플에 대한 SEC 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 18B 단량체 (검은 색 막대), 중간-분자량 불순물 (회색 막대) 및 저-분자량 불순물 (십자 모양 막대)은 면적%로 표시된다.
도 3은 90, 또는 120℃의 압출 조건에서 위의 표 5에 나열된 P71W19G10 샘플에 대한 SEC 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 18B 단량체 (검은 색 막대), 중간-분자량 불순물 (회색 막대) 및 저-분자량 불순물 (십자 모양 막대)은 면적%로 표시된다.
실시예 4: 열중량 분석- P49W21G30
압출 동안 수분 손실을 분석하기 위해, 압출-전 재조합 거미줄 조성물 및 압출-후 재조합 거미줄 압출물의 수분 함량을 TA 브랜드 TGA Q500 기기를 사용하여 TGA (열중량 분석)로 분석하였다. P49W21G30 및 P65W20G15 샘플의 경우, 실시예 3에서 설명된 압출 실험에 사용된 펠렛의 수분 함량을 참조 샘플로 사용하여 수분 손실을 측정했다. P71W19G10 샘플의 경우, 실시예 3에 기재된 압출 실험에 사용된 재조합 거미줄 조성물의 수분 함량을 참조 샘플로 사용하여 수분 손실을 측정했다.
각 샘플에 대해, 상기 열거된 제형을 포함하는 분말 또는 펠렛 10 mg, +/- 1mg을 분석했다. 수분 함량을 측정하기 위해, 샘플은 "질소 안에서"와 대조적으로 "대기 안"에서 실행되었다. 샘플은 장착된 자동 샘플러를 사용하여, TGA 용광로에 순차적으로 도입되었다. 온도는 TA 브랜드 소프트웨어 제품군을 사용하여 110℃에 도달할 때까지 실온에서 분당 20℃의 속도로 증가하도록 프로그래밍되었다. 그런 다음 당해 샘플을 이 온도에서 45분 동안 유지시켰다. 그 후 샘플을 용광로로부터 빼내고, 당해 용광로는 다음 작동을 시작하기 전, 15분 동안 공기로 불어 넣었다.
하기 표 6-8은 참조 샘플 (즉, 출발 펠렛 또는 분말) 및 압출 샘플에 대한 다양한 측정 값을 열거한다. 도 4-6에는 각각 표 6-8에 포함 된 데이터 그래프가 포함되어 있다. 이 데이터로부터 압출 중 수분 손실이 낮고, 압출 공정에 허용되는 한계 내에 있음을 알 수 있다. 전형적으로 수분 손실은 2 ~ 18% 범위 안에 있다.
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
도 4는 20, 40, 95, 및 120℃의 압출 조건에서 위의 표 6에 나열된 샘플들에 대한 TGA 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 도 4는 또한 이러한 샘플의 생성에 사용된 출발 펠렛의 참조 샘플에 대한 TGA 데이터를 보여준다. 데이터는 모든 처리에 걸쳐 샘플의 수분 함량%를 보여주는데, 출발 펠렛과 비교했을 때, ~ 1-13% 범위의 수분 손실이 있다.
도 5는 20, 40, 60, 및 140℃의 압출 조건에서 위의 표 7에 나열된 샘플들에 대한 TGA 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 도 5는 또한 이러한 샘플의 생성에 사용된 출발 펠렛의 참조 샘플에 대한 TGA 데이터를 보여준다. 데이터는 모든 처리에 걸쳐 샘플의 수분 함량%를 보여주는데, 출발 펠렛과 비교했을 때, ~1-8% 범위의 수분 손실이 있다.
도 6은 90 및 120℃의 압출 조건에서 위의 표 8에 나열된 샘플들에 대한 TGA 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 도 5는 또한 이러한 샘플의 생성에 사용된 출발 분말의 참조 샘플에 대한 TGA 데이터를 보여준다. 데이터는 모든 처리에 걸쳐 샘플의 수분 함량%를 보여주는데, 출발 분말과 비교했을 때, ~1.5-4% 범위의 수분 손실이 있다.
실시예 5: Fourier 변환 적외선 분광기를 사용한 베타 쉬트 함량 분석
압출물에서 2 차- 및 3 차-구조의 형성을 평가하기 위해, 베타 쉬트 함량을 FTIR (Fourier 변환 적외선 분광법)으로 측정했다. FTIR은 대부분 S (수직) 편광을 선택하는 와이어 그리드 편광기(wire grid polarizer) 앞으로 다이아몬드 감쇠 전반사 액세서리(diamond attenuated total reflection accessory)가 탑재된 Bruker Alpha 분광기를 사용하여 압출물에서 수행되었다. 재조합 폴리펩티드 분말과 전구체 섬유가 대조군에 내포되었다. 분자 정렬을 정량화하기 위해, 각 방향 (편광 분극 전기장에 대해 0 및 90 °)의 3 개의 스펙트럼을 4000 ~ 600cm-1의 4cm-1 해상도에서 32 번 스캔하여 수집했다.
982-949cm-1 에 해당하는 피크에 대한 평균 값은 다음 단계에 따라 계산되었다. 흡광도 값은 밴드 없이, 1900~ 1800cm-1 사이의 평균을 빼서 상쇄되었다. 그 다음, 스펙트럼은 등방성(비-방향성) 측쇄 진동 밴드에 대응하는 1350 ~ 1315cm-1 사이의 평균을 나눔으로써 정규화시켰다. 베타 쉬트 함량 측정은 982 ~ 949cm-1.사이의 통합된 흡광도 값의 평균으로 취해졌다.
재조합 거미줄 압출물 (즉, "샘플 베타 쉬트")의 베타 쉬트 함량을 i) 재조합 거미줄 조성물의 생성에 사용된 출발 재조합 거미줄 폴리펩티드 분말의 베타 쉬트 함량 (즉, "참조 사전-수화된 분말") 그리고 ii) 출발 펠렛 (P49W21G30 및 P65W20G15)의 베타 쉬트 함량 (즉,"참조 펠렛 ")과 비교하였으며, 아래의 표 9-11에는 표에 나열된 조건 하에서 생성된 참조 샘플 및 압출물에 대한 측정 값이 나열되어 있다. 도 7-9에는 표 9-11에 표시된 데이터 그래프가 포함되어 있다. 볼 수 있듯이, 재조합 실크 폴리펩티드 분말로부터 출발해서 재조합 거미 실크 압출물이 되는 재료의 베타 쉬트 함량에 유의적인 변화가 없고, 이것으로 당해 방법은 용제 처리가 사용 된 경우와 같이 베타-쉬트를 방해하지 않고, 무정형 단백질 도메인의 가소화 및 이동성을 가능하게 함을 나타낸다.
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
도 7은 20, 40, 60, 80, 95 또는 120℃의 압출 조건에서 생성된, 상기 표 9에 나열된 샘플에 대한 FTIR 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 데이터는 949-982에서 추출되었으며, 출발 펠렛과 비교하여 명확한 경향을 보여주지 않았다.
도 8은 20, 40, 60, 95 또는 140℃의 압출 조건에서 생성된, 상기 표 10에 나열된 샘플에 대한 FTIR 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 데이터는 949-982 밴드에서 추출되었으며, 출발 펠렛과 비교하여 명확한 경향을 보여주지 않았다.
도 9는 90 또는 120℃의 압출 조건에서 생성된, 상기 표 11에 나열된 샘플에 대한 FTIR 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 또는 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 데이터는 물의 존재로 인한 인공물(artifact)을 피하기 위해 949-982 밴드에서 추출되었으며, 출발 펠렛과 비교하여 명확한 경향을 보여주지 않았다.
실시예 6: 편광 광 현미경
편광 광 현미경 (PL)을 사용하여 다양한 압출물의 부드러움과 균질성을 조사했다. 4X PL 대물 렌즈를 사용한 Leica DM750P 편광 현미경을 사용하여, 빛 및 편광 (PL) 이미지를 얻었다. 상기 현미경은 보완적인 PC 기반 이미지 분석 Leica Application Suite, LAS V4.9에 연결되어, ~ 20-30mm 길이의 TSE 압출물을 표준 현미경 슬라이드의 장축을 따라 조심스럽게 배치하고, 당해 현미경 조리개(aperture) 위에 수평 (동에서-서로, 즉 0 °)으로 배치했다. 샘플 가장자리는 우선 초점이 가져간 후, 당해 샘플의 전체적으로 초점이 맞춰졌다. 상기 샘플을 우선 백색광 아래에서 보았고, 조명 제어 노브로 조절하여 적절한 스케일 바(bar)로 캡쳐된 이미지들이 포함된다. 모든 경우에 LAS V4.9 소프트웨어의 자동-밝기 기능은 사용되지 않았다.
다음으로, Analyzer/Bertrand Lens 모듈은 당해 모듈의 하단 로커를 오른쪽으로 돌리고("A" 위치/Analyzer 인(in)), 한편 Analyzer/ Bertrand 렌즈 모듈의 상단 로커는 왼쪽으로 돌렸다 ("O" 위치/Bertrand Lens 아웃(out)). 이와 같은 설정으로 "교차-편광 모드"에서 분석이 가능하도록 하고, 이것은 편광자와 분석기를 통과하는 빛의 허용된 진동 방향이 90°로 지향되는 상태다.
조명 강도의 배경 기복을 제어하기 위해, 모든 샘플을 처음에 보았고, 조명 제어 노브를 사용하여 배경의 밝기를 완전히 검게 될 때까지 감소시켰다. 그런 다음, 각 조리개(eyepieces)를 조리개 빛-차단 액세서리로 덮어, 이미지 캡처 시퀀스 중에 주변 빛이 통과하는 것을 막았다. 이미지는 LAS V4.9 소프트웨어 패키지를 사용하여 0° 및 45° 방향에서 캡처되었다. 이 현미경에 장착된 원형 회전 스테이지를 사용하여 글래스 슬라이드를 45° 각도로 회전시켜 45° 이미지를 얻었다.
도 10 및 11은 편광 현미경을 사용하여 캡처된 예시적인 샘플의 이미지이다. 이들 이미지는 청구된 공정에서 낮은 용융 균열(fracture)을 갖는 매끄러운 섬유를 취득할 수 있음을 보여준다. 따라서, 조건들은 용융 흐름 및 압출에 적합한 것이 분명하다. 추가적으로, 많은 조건에서 축 정렬과 마찬가지로 정성적인 복굴절이 관찰되었다.
도 10에서는 샘플 P49W21G30-1, P49W21G30-2, P49W21G30-3 및 P49W21G30-4로부터 생성된 이미지를 보여주는데, 이들 모두 20℃에서 RPMS를 가변시키면서 얻은 것들이다. 이러한 조건 하에서, 압출물들은 낮은 용융 균열로 매끄럽다. 편광 광 현미경에서 조건에 따라 선호적인 축 정렬(차이에 대해 45° 검사)을 보여주는데, 이때 100 RPM에서 최대 축 정렬을 얻었다.
도 11에서는 샘플 P49W21G30-17, P49W21G30-18, P49W21G30-19 및 P49W21G30-20으로부터 생성된 이미지를 보여주는데, 이들 모두 95℃에서 RPMS를 가변시키면서 얻은 것들이다. 상기 압출물들은 중등도의 용융 균열/표면 결함을 보여주었다. 편광 광 현미경은 10-100 RPM에서의 축 정렬을 보여주었다. 100-300 RPM에서 샘플들은 0 및 45°에서 검사되었을 때, 서로 비슷한 차이를 나타내었다.
실시예 7: 글리세롤 함량의 대사산물 분석
압출 동안 재조합 거미줄 조성물로부터 글리세롤 손실을 결정하기 위해, Phenomenex Security Guard Carbo H+ Guard Column이 장착된 Benson Polymeric 150 x7.8mm H + 7110-0 HPLC 컬럼을 이용하여 당해 글리세롤 함량을 분석하였으며, 이동상으로 0.004 M 황산이 사용되었다. 글리세롤 검량용 시약(calibrants)은 정량화가 가능하도록 처음부터 사용된다. 18B 기반 샘플들에서 글리세롤 양을 측정하기 위해, 당해 조성물 안에 존재하는 글리세롤은 압출 전 (즉, 펠렛 또는 분말 상태의) 그리고 압출 후에 측정되었다. 각 샘플의 경우, 25 mg의 분말 또는 펠렛을 1ml의 0.004 M 황산에 용해시켰고, 1 hr 동안 초음파처리하였다. 그런 다음 샘플을 볼텍싱하고, 각 조건/처리에 대한 후속 실행을 위해 HPLC 바이알에 넣었다.
표 12-14에는 아래 표에 나와있는 조건 하에서 생산된 압출물에 대한 다양한 측정치가 열거되어 있다. 도 12-14에는 동일 샘플의 그래프가 포함된다. 이들로부터 조성물의 글리세롤 함량은 시험 중 최소 손실로 입증된 바와 같이, 시험된 조건의 범위에 걸쳐 안정적임을 알 수 있다.
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
도 12는 20, 40, 60, 80, 95, 및 120℃의 압출 조건에서 위의 표 12에 나열된 샘플들에 대한 대사산물 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 글리세롤 손실은 모든 처리에서 무시할 정도다.
도 13은 20, 40, 60, 95, 및 140℃의 압출 조건에서 위의 표 13에 나열된 샘플들에 대한 대사산물 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 글리세롤 손실은 모든 처리에서 무시할 정도다.
도 14는 90 및 120℃의 압출 조건에서 위의 표 14에 나열된 샘플들에 대한 대사산물 데이터를 보여주는데, 여기서 압출물은 10, 100, 200 및 300 RPM의 작동 매개변수를 사용하여 각 온도에 대해 얻었다. 글리세롤 손실은 모든 처리에서 무시할 정도다.
실시예 8: 글리세롤 함량의 대사산물 분석
P49W21G30 및 P25W05G70 실크 분말 조성물을 혼합하였고, 실시예 2에서 기재된 바와 같이 트윈 스크류 압출시켰다. 압출물을 펠렛으로 다지고, 용융 흐름 색인 (MFI)을 실시했다. MFI를 Goettfert Melt Indexer, 모델 # MI-40, 일련번호 # 10005563에서 수행했다. 배럴 직경은 9.5320 mm이며, 다이 길이는 8.015 mm이고, 구멍 직경은 2.09 mm이었다. 2 분 예열되었다. ASTM D1238 표준 테스트 방법에 따라, Extrusion Plastometer에 의해 열가소성에 대한 유속을 테스트하였다. 95℃에서 2.16 kg 또는 21.6 kg의 로드로 테스트를 실시했다.
표 15는 각 재료 조성물에서 얻은 용융 흐름 지수(Melt Flow Index) 값을 나타내며, P49W21G30의 경우 n=3, 그리고 P25W05G70의 경우 n=6이며, 차례로 2.1 및 21.1 Kg에서 테스트되었다. '+/-'는 n개 샘플 간의 표준 편차를 나타낸다. 이 데이터로부터 단백질/글리세롤/물 기반-펠렛이 예를 들면, 폴리프로필렌과 유사한 범위 (예를 들면, 20g/10 분) 내에 있는 MFI 값을 나타냄을 알 수 있다. 단백질이 더 낮은 조성에서 더 높은 유속이 수득된다.
Figure pct00029
SEQUENCE LISTING <110> BOLT THREADS, INC. <120> COMPOSITION FOR A MOLDED BODY <130> BTT-017WO <140> PCT/US2019/046222 <141> 2019-08-12 <150> 62/717,622 <151> 2018-08-10 <160> 38 <170> PatentIn version 3.5 <210> 1 <211> 945 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 1 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gly Gly 1 5 10 15 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Ser Gly Gln Gln Gly 20 25 30 Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly 35 40 45 Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 50 55 60 Gly Ala Gly Gln Gln Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly 65 70 75 80 Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln 85 90 95 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 100 105 110 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Arg Ser Gln Gly Pro 130 135 140 Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly 145 150 155 160 Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly 165 170 175 Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 180 185 190 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 195 200 205 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala 210 215 220 Ala Ala Ala Ala Ala Ala Val Gly Gly Tyr Gly Pro Gly Ala Gly Gln 225 230 235 240 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 245 250 255 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln 275 280 285 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 290 295 300 Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 305 310 315 320 Gly Ala Gly Gln Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly 325 330 335 Gly Gln Gly Pro Tyr Gly Ser Gly Gln Gln Gly Pro Gly Gly Ala Gly 340 345 350 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala 355 360 365 Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln 370 375 380 Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly 385 390 395 400 Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser 405 410 415 Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro 420 425 430 Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 435 440 445 Gly Pro Gly Ala Gly Gln Arg Ser Gln Gly Pro Gly Gly Gln Gly Pro 450 455 460 Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly 465 470 475 480 Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser 485 490 495 Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly 500 505 510 Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly 515 520 525 Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala 530 535 540 Ala Val Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser 545 550 555 560 Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro 565 570 575 Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly 580 585 590 Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly 595 600 605 Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala 610 615 620 Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln 625 630 635 640 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 645 650 655 Gly Ser Gly Gln Gln Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly 660 665 670 Gly Gln Gly Pro Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala 675 680 685 Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Gly Ala 690 695 700 Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr 705 710 715 720 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 725 730 735 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala 740 745 750 Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly 755 760 765 Gln Arg Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala 770 775 780 Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln 785 790 795 800 Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala 805 810 815 Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly 820 825 830 Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly 835 840 845 Pro Tyr Gly Pro Gly Ala Ala Ala Ala Ala Ala Ala Val Gly Gly Tyr 850 855 860 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 865 870 875 880 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala 885 890 895 Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln 900 905 910 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 915 920 925 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 930 935 940 Ala 945 <210> 2 <211> 315 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gly Gly 1 5 10 15 Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Ser Gly Gln Gln Gly 20 25 30 Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly 35 40 45 Pro Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro 50 55 60 Gly Ala Gly Gln Gln Gly Pro Gly Gly Ala Gly Gln Gln Gly Pro Gly 65 70 75 80 Ser Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln 85 90 95 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 100 105 110 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Arg Ser Gln Gly Pro 130 135 140 Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly 145 150 155 160 Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly 165 170 175 Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 180 185 190 Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser 195 200 205 Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr Gly Pro Gly Ala 210 215 220 Ala Ala Ala Ala Ala Ala Val Gly Gly Tyr Gly Pro Gly Ala Gly Gln 225 230 235 240 Gln Gly Pro Gly Ser Gln Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro 245 250 255 Gly Gly Gln Gly Pro Tyr Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala 260 265 270 Ala Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln 275 280 285 Gly Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Gln Gly Pro Tyr 290 295 300 Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 305 310 315 <210> 3 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: Silk polypeptide block sequence <400> 3 Ser Gly Ala Gly Gly 1 5 <210> 4 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: Silk polypeptide block sequence <400> 4 Gly Ser Gly Ala Gly 1 5 <210> 5 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: Silk polypeptide block sequence <400> 5 Gly Gly Ser Gly Ala 1 5 <210> 6 <211> 181 <212> PRT <213> Aliatypus gulosus <400> 6 Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser 1 5 10 15 Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala 20 25 30 Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe 35 40 45 Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser 50 55 60 Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg 65 70 75 80 Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala 85 90 95 Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala 100 105 110 Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu 115 120 125 Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala 130 135 140 Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser 145 150 155 160 Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly 165 170 175 Ala Gly Ser Ala Ser 180 <210> 7 <211> 126 <212> PRT <213> Plectreurys tristis <400> 7 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser 20 25 30 Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala 35 40 45 Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly 50 55 60 Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala 65 70 75 80 Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala 85 90 95 Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala 100 105 110 Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 115 120 125 <210> 8 <211> 239 <212> PRT <213> Plectreurys tristis <400> 8 Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala 1 5 10 15 Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys 20 25 30 Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln 35 40 45 Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln 50 55 60 Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe 65 70 75 80 Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser 85 90 95 Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro 100 105 110 Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala 115 120 125 Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala 130 135 140 Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser 145 150 155 160 Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser 165 170 175 Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro 180 185 190 Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala 195 200 205 Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln 210 215 220 Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser 225 230 235 <210> 9 <211> 182 <212> PRT <213> Araneus gemmoides <400> 9 Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly 1 5 10 15 Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser 20 25 30 Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser 35 40 45 Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala 50 55 60 Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser 65 70 75 80 Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser 85 90 95 Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser 100 105 110 Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr 115 120 125 Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser 130 135 140 Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser 145 150 155 160 Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala 165 170 175 Thr Ser Ile Ser Ala Val 180 <210> 10 <211> 180 <212> PRT <213> Argiope aurantia <400> 10 Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala 1 5 10 15 Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala 20 25 30 Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser 35 40 45 Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser 50 55 60 Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser 65 70 75 80 Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala 85 90 95 Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser 100 105 110 Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn 115 120 125 Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala 130 135 140 Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala 145 150 155 160 Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn 165 170 175 Ala Ala Asn Ala 180 <210> 11 <211> 199 <212> PRT <213> Deinopis spinosa <400> 11 Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly 1 5 10 15 Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser 20 25 30 Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala 35 40 45 Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln 50 55 60 Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala 65 70 75 80 Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly 85 90 95 Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val 100 105 110 Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser 115 120 125 Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu 130 135 140 Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala 145 150 155 160 Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr 165 170 175 Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln 180 185 190 Ala Val Thr Gly Val Gly Leu 195 <210> 12 <211> 171 <212> PRT <213> Nephila clavipes <400> 12 Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala 1 5 10 15 Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala 20 25 30 Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln 35 40 45 Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln 50 55 60 Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr 65 70 75 80 Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala 85 90 95 Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala 100 105 110 Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser 115 120 125 Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu 130 135 140 Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly 145 150 155 160 Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln 165 170 <210> 13 <211> 268 <212> PRT <213> Argiope trifasciata <400> 13 Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala 1 5 10 15 Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala 20 25 30 Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly 35 40 45 Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly 50 55 60 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly 65 70 75 80 Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 85 90 95 Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val 100 105 110 Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala 115 120 125 Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly 130 135 140 Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly 145 150 155 160 Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly 165 170 175 Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly 180 185 190 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly 195 200 205 Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly 210 215 220 Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly 225 230 235 240 Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly 245 250 255 Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val 260 265 <210> 14 <211> 420 <212> PRT <213> Nephila clavipes <400> 14 Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly 1 5 10 15 Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro 20 25 30 Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr 35 40 45 Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 50 55 60 Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro 65 70 75 80 Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly 85 90 95 Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly 100 105 110 Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr 115 120 125 Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly 130 135 140 Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro 145 150 155 160 Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly 165 170 175 Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly 180 185 190 Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala 195 200 205 Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly 210 215 220 Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly 225 230 235 240 Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr 245 250 255 Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro 260 265 270 Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly 275 280 285 Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro 290 295 300 Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly 305 310 315 320 Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr 325 330 335 Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro 340 345 350 Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly 355 360 365 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro 370 375 380 Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr 385 390 395 400 Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly 405 410 415 Pro Tyr Gly Pro 420 <210> 15 <211> 376 <212> PRT <213> Latrodectus hesperus <400> 15 Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu 1 5 10 15 Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu 20 25 30 Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly 35 40 45 Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala 50 55 60 Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val 65 70 75 80 Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln 85 90 95 Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp 100 105 110 Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys 115 120 125 Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser 130 135 140 Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn 145 150 155 160 Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val 165 170 175 Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val 180 185 190 Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln 195 200 205 Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly 210 215 220 Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala 225 230 235 240 Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln 245 250 255 Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr 260 265 270 Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala 275 280 285 Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser 290 295 300 Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp 305 310 315 320 Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln 325 330 335 Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile 340 345 350 Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala 355 360 365 Pro Arg Leu Gly Ile Asp Leu Ser 370 375 <210> 16 <211> 200 <212> PRT <213> Argiope trifasciata <400> 16 Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly 1 5 10 15 Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe 20 25 30 Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala 35 40 45 Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser 50 55 60 Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser 65 70 75 80 Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val 85 90 95 Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu 100 105 110 Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala 115 120 125 Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly 130 135 140 Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln 145 150 155 160 Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser 165 170 175 Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser 180 185 190 Gln Ala Ser Ala Ser Ser Thr Ser 195 200 <210> 17 <211> 357 <212> PRT <213> Uloborus diversus <400> 17 Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala 1 5 10 15 Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln 20 25 30 Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr 35 40 45 Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe 50 55 60 Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val 65 70 75 80 Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser 85 90 95 Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr 100 105 110 Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile 115 120 125 Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu 130 135 140 Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu 145 150 155 160 Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile 165 170 175 Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala 180 185 190 Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln 195 200 205 Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser 210 215 220 Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile 225 230 235 240 Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly 245 250 255 Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser 260 265 270 Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe 275 280 285 Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr 290 295 300 Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser 305 310 315 320 Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile 325 330 335 Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu 340 345 350 Leu Ser Val Ser Ala 355 <210> 18 <211> 32 <212> PRT <213> Euprosthenops australis <400> 18 Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly 1 5 10 15 Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 20 25 30 <210> 19 <211> 42 <212> PRT <213> Tetragnatha kauaiensis <400> 19 Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly 20 25 30 Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 20 <211> 42 <212> PRT <213> Argiope aurantia <400> 20 Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly 1 5 10 15 Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly 20 25 30 Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 21 <211> 46 <212> PRT <213> Deinopis spinosa <400> 21 Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly 1 5 10 15 Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln 20 25 30 Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala 35 40 45 <210> 22 <211> 42 <212> PRT <213> Nephila clavata <400> 22 Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly 1 5 10 15 Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly 20 25 30 Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 23 <211> 174 <212> PRT <213> Deinopis spinosa <400> 23 Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala 1 5 10 15 Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala 20 25 30 Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly 35 40 45 Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly 50 55 60 Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala 115 120 125 Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala 130 135 140 Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala 145 150 155 160 Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly 165 170 <210> 24 <211> 149 <212> PRT <213> Latrodectus hesperus <400> 24 Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala 1 5 10 15 Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly 20 25 30 Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala 35 40 45 Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala 85 90 95 Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala 100 105 110 Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala 115 120 125 Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly 130 135 140 Gln Gly Gln Gly Ala 145 <210> 25 <211> 161 <212> PRT <213> Nephila clavipes <400> 25 Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly 1 5 10 15 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 20 25 30 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 35 40 45 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala 50 55 60 Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly 65 70 75 80 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 85 90 95 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 100 105 110 Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 115 120 125 Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 130 135 140 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala 145 150 155 160 Ala <210> 26 <211> 186 <212> PRT <213> Nephilengys cruentata <400> 26 Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala 1 5 10 15 Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala 20 25 30 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr 35 40 45 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala 50 55 60 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 65 70 75 80 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala 100 105 110 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 115 120 125 Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala 130 135 140 Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 145 150 155 160 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala 165 170 175 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 180 185 <210> 27 <211> 132 <212> PRT <213> Uloborus diversus <400> 27 Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser 20 25 30 Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln 35 40 45 Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr 50 55 60 Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly 65 70 75 80 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala 85 90 95 Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser 100 105 110 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala 115 120 125 Gly Ala Ala Ala 130 <210> 28 <211> 198 <212> PRT <213> Uloborus diversus <400> 28 Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala 1 5 10 15 Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly 20 25 30 Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala 35 40 45 Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly 50 55 60 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg 65 70 75 80 Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala 85 90 95 Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly 100 105 110 Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr 115 120 125 Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala 130 135 140 Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly 145 150 155 160 Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 165 170 175 Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser 180 185 190 Ala Ala Ala Ser Ser Ala 195 <210> 29 <211> 190 <212> PRT <213> Araneus ventricosus <400> 29 Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly 1 5 10 15 Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 20 25 30 Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala 35 40 45 Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly 50 55 60 Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala 65 70 75 80 Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala 85 90 95 Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala 100 105 110 Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu 115 120 125 Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly 130 135 140 Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly 145 150 155 160 Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly 165 170 175 Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala 180 185 190 <210> 30 <211> 166 <212> PRT <213> Dolomedes tenebrosus <400> 30 Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr 1 5 10 15 Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly 20 25 30 Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly 35 40 45 Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 50 55 60 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 65 70 75 80 Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala 85 90 95 Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly 100 105 110 Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 115 120 125 Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly 130 135 140 Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala 145 150 155 160 Ala Ser Ala Ala Ala Ala 165 <210> 31 <211> 177 <212> PRT <213> Nephilengys cruentata <400> 31 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 100 105 110 Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln 115 120 125 Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala 130 135 140 Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln 145 150 155 160 Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala 165 170 175 Ala <210> 32 <211> 174 <212> PRT <213> Nephilengys cruentata <400> 32 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly 20 25 30 Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala 35 40 45 Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala 50 55 60 Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu 65 70 75 80 Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 85 90 95 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly 100 105 110 Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly 115 120 125 Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala 130 135 140 Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly 145 150 155 160 Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala 165 170 <210> 33 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic His tag <220> <221> MISC_FEATURE <222> (1)..(8) <223> This sequence may encompass 6-8 residues <400> 33 His His His His His His His His 1 5 <210> 34 <211> 1600 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MISC_FEATURE <222> (7)..(11) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (15)..(19) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (23)..(27) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (31)..(35) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (39)..(43) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (47)..(51) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (55)..(59) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (63)..(67) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (4)..(67) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (71)..(80) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (87)..(91) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (95)..(99) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (103)..(107) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (111)..(115) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (119)..(123) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (127)..(131) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (135)..(139) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (143)..(147) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (84)..(147) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (151)..(160) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (167)..(171) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (175)..(179) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (183)..(187) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (191)..(195) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (199)..(203) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (207)..(211) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (215)..(219) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (223)..(227) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (164)..(227) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (231)..(240) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (247)..(251) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (255)..(259) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (263)..(267) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (271)..(275) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (279)..(283) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (287)..(291) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (295)..(299) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (303)..(307) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (244)..(307) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (311)..(320) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (327)..(331) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (335)..(339) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (343)..(347) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (351)..(355) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (359)..(363) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (367)..(371) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (375)..(379) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (383)..(387) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (324)..(387) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (391)..(400) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (407)..(411) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (415)..(419) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (423)..(427) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (431)..(435) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (439)..(443) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (447)..(451) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (455)..(459) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (463)..(467) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (404)..(467) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (471)..(480) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (487)..(491) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (495)..(499) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (503)..(507) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (511)..(515) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (519)..(523) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (527)..(531) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (535)..(539) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (543)..(547) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (484)..(547) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (551)..(560) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (567)..(571) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (575)..(579) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (583)..(587) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (591)..(595) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (599)..(603) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (607)..(611) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (615)..(619) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (623)..(627) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (564)..(627) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (631)..(640) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (647)..(651) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (655)..(659) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (663)..(667) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (671)..(675) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (679)..(683) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (687)..(691) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (695)..(699) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (703)..(707) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (644)..(707) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (711)..(720) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (727)..(731) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (735)..(739) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (743)..(747) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (751)..(755) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (759)..(763) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (767)..(771) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (775)..(779) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (783)..(787) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (724)..(787) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (791)..(800) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (807)..(811) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (815)..(819) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (823)..(827) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (831)..(835) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (839)..(843) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (847)..(851) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (855)..(859) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (863)..(867) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (804)..(867) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (871)..(880) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (887)..(891) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (895)..(899) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (903)..(907) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (911)..(915) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (919)..(923) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (927)..(931) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (935)..(939) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (943)..(947) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (884)..(947) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (951)..(960) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (967)..(971) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (975)..(979) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (983)..(987) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (991)..(995) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (999)..(1003) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1007)..(1011) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1015)..(1019) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1023)..(1027) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (964)..(1027) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1031)..(1040) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1047)..(1051) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1055)..(1059) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1063)..(1067) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1071)..(1075) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1079)..(1083) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1087)..(1091) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1095)..(1099) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1103)..(1107) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1044)..(1107) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1111)..(1120) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1127)..(1131) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1135)..(1139) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1143)..(1147) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1151)..(1155) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1159)..(1163) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1167)..(1171) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1175)..(1179) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1183)..(1187) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1124)..(1187) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1191)..(1200) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1207)..(1211) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1215)..(1219) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1223)..(1227) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1231)..(1235) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1239)..(1243) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1247)..(1251) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1255)..(1259) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1263)..(1267) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1204)..(1267) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1271)..(1280) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1287)..(1291) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1295)..(1299) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1303)..(1307) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1311)..(1315) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1319)..(1323) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1327)..(1331) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1335)..(1339) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1343)..(1347) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1284)..(1347) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1351)..(1360) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1367)..(1371) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1375)..(1379) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1383)..(1387) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1391)..(1395) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1399)..(1403) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1407)..(1411) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1415)..(1419) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1423)..(1427) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1364)..(1427) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1431)..(1440) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1447)..(1451) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1455)..(1459) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1463)..(1467) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1471)..(1475) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1479)..(1483) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1487)..(1491) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1495)..(1499) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1503)..(1507) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1444)..(1507) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1511)..(1520) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1527)..(1531) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1535)..(1539) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1543)..(1547) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1551)..(1555) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1559)..(1563) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1567)..(1571) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1575)..(1579) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1583)..(1587) <223> This region may encompass "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," wherein some positions may be absent <220> <221> MISC_FEATURE <222> (1524)..(1587) <223> This region may encompass 4-8 repeating "GPG-X1" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," and some positions may be absent <220> <221> MISC_FEATURE <222> (1591)..(1600) <223> This region may encompass 6-10 residues <220> <221> MISC_FEATURE <222> (1)..(1600) <223> This sequence may encompass 2-20 "GGY-[GPG-X1]n1-GPS-(A)n2" repeating units, wherein X1 is "SGGQQ," "GAGQQ," "GQGPY," "AGQQ" or "SQ," n1 is 4-8 and n2 is 6-10 and some positions may be absent <400> 34 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 20 25 30 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 35 40 45 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 50 55 60 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 65 70 75 80 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 85 90 95 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 100 105 110 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 115 120 125 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 130 135 140 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 145 150 155 160 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 165 170 175 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 180 185 190 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 195 200 205 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 210 215 220 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 225 230 235 240 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 245 250 255 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 260 265 270 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 275 280 285 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 290 295 300 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 305 310 315 320 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 325 330 335 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 340 345 350 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 355 360 365 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 370 375 380 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 385 390 395 400 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 405 410 415 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 420 425 430 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 435 440 445 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 450 455 460 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 465 470 475 480 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 485 490 495 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 500 505 510 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 515 520 525 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 530 535 540 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 545 550 555 560 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 565 570 575 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 580 585 590 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 595 600 605 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 610 615 620 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 625 630 635 640 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 645 650 655 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 660 665 670 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 675 680 685 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 690 695 700 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 705 710 715 720 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 725 730 735 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 740 745 750 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 755 760 765 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 770 775 780 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 785 790 795 800 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 805 810 815 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 820 825 830 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 835 840 845 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 850 855 860 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 865 870 875 880 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 885 890 895 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 900 905 910 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 915 920 925 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 930 935 940 Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala 945 950 955 960 Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 965 970 975 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 980 985 990 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 995 1000 1005 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa 1010 1015 1020 Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 1025 1030 1035 Ala Ala Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro 1040 1045 1050 Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly 1055 1060 1065 Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa 1070 1075 1080 Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa 1085 1090 1095 Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala 1100 1105 1110 Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Xaa Xaa 1115 1120 1125 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa 1130 1135 1140 Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly 1145 1150 1155 Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro 1160 1165 1170 Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly 1175 1180 1185 Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 1190 1195 1200 Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa 1205 1210 1215 Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa 1220 1225 1230 Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 1235 1240 1245 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa 1250 1255 1260 Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 1265 1270 1275 Ala Ala Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro 1280 1285 1290 Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly 1295 1300 1305 Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa 1310 1315 1320 Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa 1325 1330 1335 Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala 1340 1345 1350 Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr Gly Pro Gly Xaa Xaa 1355 1360 1365 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa 1370 1375 1380 Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly 1385 1390 1395 Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro 1400 1405 1410 Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly 1415 1420 1425 Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Tyr 1430 1435 1440 Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa 1445 1450 1455 Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa 1460 1465 1470 Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa 1475 1480 1485 Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa 1490 1495 1500 Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala 1505 1510 1515 Ala Ala Gly Gly Tyr Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro 1520 1525 1530 Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly 1535 1540 1545 Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa 1550 1555 1560 Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Gly Xaa Xaa Xaa Xaa 1565 1570 1575 Xaa Gly Pro Gly Xaa Xaa Xaa Xaa Xaa Gly Pro Ser Ala Ala Ala 1580 1585 1590 Ala Ala Ala Ala Ala Ala Ala 1595 1600 <210> 35 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 35 Ser Gly Gly Gln Gln 1 5 <210> 36 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 36 Gly Ala Gly Gln Gln 1 5 <210> 37 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 37 Gly Gln Gly Pro Tyr 1 5 <210> 38 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 38 Ala Gly Gln Gln 1

Claims (67)

  1. 재조합 거미줄 단백질과 가소제를 포함하는 성형체의 조성물에 있어서, 이때 상기 조성물은 가류성 상태로 유도될 수 있으며, 이때 상기 재조합 거미줄 단백질은 가류성 상태에서 실질적으로 비-분해된 상태인, 조성물.
  2. 청구항 1에 있어서, 이때 상기 조성물은 전단력과 압력을 가함으로써 가류성 상태로 유도될 수 있는, 조성물.
  3. 청구항 2에 있어서, 이때 상기 조성물은 열 적용 없이, 전단력과 압력을 가함으로써 가류성 상태로 유도될 수 있는, 조성물.
  4. 청구항 3에 있어서, 이때 상기 조성물은 가류성 상태로 유도될 수 있으며, 여러 차례 압출되며, 당해 재조합 거미줄 단백질은 이 조성물 안에서 실질적으로 비-분해된 상태로 유지되는, 조성물.
  5. 청구항 1에 있어서, 이때 상기 조성물은 열가소성인, 조성물.
  6. 청구항 2에 있어서, 이때 상기 조성물은 1.5 Nm ~ 13 Nm 범위의 전단력 적용에 의해 가류성 상태로 유도될 수 있는, 조성물.
  7. 청구항 2에 있어서, 이때 상기 조성물은 2 Nm ~ 6 Nm 범위의 전단력 적용에 의해 가류성 상태로 유도될 수 있는, 조성물.
  8. 청구항 2에 있어서, 이때 상기 조성물은 1MPa ~ 300MPa 범위의 압력 적용에 의해 가류성 상태로 유도될 수 있는, 조성물.
  9. 청구항 2에 있어서, 이때 상기 조성물은 5MPa ~ 75MPa 범위의 압력 적용에 의해 가류성 상태로 유도될 수 있는, 조성물.
  10. 청구항 6-9중 임의의 한 항에 있어서, 이때 전술한 조성물은 120℃ 미만의 온도, 80℃ 미만의 온도, 40℃ 미만의 온도, 또는 실온에서 가류성 상태로 유도될 수 있는, 조성물.
  11. 청구항 1-10중 임의의 한 항에 있어서, 이때 전술한 조성물은 2.16 kg의 로드로 95℃에서 ASTM D1238에 따라 테스트하였을 때, 적어도 0.5, 적어도 1, 적어도 2, 또는 적어도 5의 용융 유동 지수를 갖는, 조성물.
  12. 청구항 1-10중 임의의 한 항에 있어서, 이때 전술한 조성물은 21.6 kg의 로드로 95℃에서 ASTM D1238에 따라 테스트하였을 때, 적어도 0.5, 적어도 1, 적어도 2, 또는 적어도 5의 용융 유동 지수를 갖는, 조성물.
  13. 청구항 1에 있어서, 이때 상기 조성물은 실질적으로 균일한, 조성물.
  14. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 반복 단위를 포함하는 조성물.
  15. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 60개 ~ 100개 아미노산 길이 범위의 아미노산 잔기가 2 ~ 20개 범위의 반복 단위를 포함하는, 조성물.
  16. 청구항 1에 있어서, 이때상기 재조합 거미줄 단백질의 분자량은 20 ~ 2000kDa 범위인, 조성물.
  17. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 반복 단위의 적어도 2회 발생을 포함하는데, 상기 반복 단위는 다음을 포함하는, 조성물:
    150개 이상의 아미노산 잔기와 적어도 10kDa의 분자량을 갖고;
    적어도 80%의 알라닌 함량을 포함하는, 6개 또는 그 이상의 연속적인 아미노산을 갖는 알라닌-풍부 영역; 그리고
    적어도 40%의 글리신 함량과 30% 미만의 알라닌 함량을 포함하는, 12개 또는 그 이상의 연속 아미노산을 갖는 글리신-풍부 영역.
  18. 청구항 1에 있어서, 이때 상기 가소제는 폴리올, 물 및/또는 우레아로부터 선택되는, 조성물.
  19. 청구항 16에 있어서, 이때 상기 폴리올은 글리세롤을 포함하는, 조성물.
  20. 청구항 1에 있어서, 이때 상기 가소제는 물을 포함하는, 조성물.
  21. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 이때 가소제 대 재조합 실크 폴리펩티드 분말의 중량비는 0.05:1 ~ 4:1 범위인, 조성물.
  22. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 가소제 대 재조합 실크 폴리펩티드 분말의 중량비는 0.20:1 ~ 0.70:1 범위인, 조성물.
  23. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 상기 조성물 안에 있는 재조합 거미줄 폴리펩티드 분말의 양은 1 ~ 90wt% 재조합 거미줄 단백질 범위인, 조성물.
  24. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 재조합 거미줄 폴리펩티드 분말 안에 존재하고, 상기 조성물 안에 있는 재조합 거미줄 폴리펩티드 분말의 양은 20 ~ 41wt% 재조합 거미줄 단백질 범위인, 조성물.
  25. 청구항 1에 있어서, 가소제로써 1 ~ 90wt%의 글리세롤을 포함하는, 조성물.
  26. 청구항 1에 있어서, 가소제로써 15 ~ 30wt%의 글리세롤을 포함하는, 조성물.
  27. 청구항 1에 있어서, 가소제로써 5 ~ 80wt%의 물을 포함하는, 조성물.
  28. 청구항 1에 있어서, 가소제로써 19 ~ 27wt%의 물을 포함하는, 조성물.
  29. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 가류성 상태에서 10.0wt% 미만의 양으로 분해되는, 조성물.
  30. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 가류성 상태에서 6.0wt% 미만의 양으로 분해되는, 조성물.
  31. 청구항 1에 있어서, 이때 상기 재조합 거미줄 단백질은 가류성 상태에서 2.0wt% 미만의 양으로 분해되는, 조성물.
  32. 청구항 29-31중 임의의 항에 있어서, 이때 상기 재조합 거미줄 단백질의 분해는 가류성 상태 전후에 당해 조성물 안에 존재하는 전장(full-length)의 재조합 거미줄 단백질의 양을 측정함으로써 평가되는, 조성물.
  33. 청구항 32에 있어서, 이때 상기 전장의 재조합 거미줄 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 조성물.
  34. 청구항 1-33중 임의의 한 항에 따른 조성물을 포함하는 성형체.
  35. 청구항 34에 있어서, 이때 상기 성형체는 섬유인, 성형체.
  36. 청구항 35에 있어서, 이때 상기 섬유는 100Pa ~ 1.2GPa 범위의 강도를 갖는, 성형체.
  37. 청구항 35에 있어서, 이때 상기 섬유는 편광 광 현미경으로 측정하였을 때, 5 x10-5 내지 ~0.04 범위의 복굴절(birefringence)을 갖는, 성형체.
  38. 다음 단계들을 포함하는 성형체 제조 공정:
    (a) 재조합 거미줄 단백질과 가소제를 포함하는 조성물에 압력과 전단력을 가하여 당해 조성물을 가류성 상태로 전환시키는 단계, 그리고
    (b) 당해 가류성 상태의 조성물을 압출시켜 성형체를 만드는 단계.
  39. 청구항 38에 있어서, 이때 성형체를 만들기 위해 상기 조성물의 압출은 섬유를 만들기 위한 상기 조성물의 압출을 포함하는, 공정.
  40. 청구항 39에 있어서, 이때 섬유를 만들기 위한 상기 조성물의 압출은 방적돌기를 통하여 당해 조성물을 압출시키는 것을 포함하는, 공정.
  41. 청구항 38에 있어서, 이때 성형체를 만들기 위해 상기 조성물의 압출은 당해 조성물을 몰드로 압출하는 단계를 포함하는, 공정.
  42. 청구항 38에 있어서, 다음을 더 포함하는, 공정:
    (a) 압력과 전단력을 상기 성형체에 가하여 당해 성형체를 가류성 상태의 조성물로 전환시키고, 그리고
    (b) 당해 가류성 상태의 조성물을 압출시켜 제 2 성형체를 만든다.
  43. 청구항 42에 있어서, 제 2 성형체에 단계 (a)와 (b)를 적어도 1 회 반복하는 것을 더 포함하는, 공정.
  44. 청구항 38-43중 임의의 한 항에 있어서, 이때 전술한 전단력이 1.5 ~ 13 Nm 인, 공정.
  45. 청구항 38-43중 임의의 한 항에 있어서, 이때 전술한 압력은 1MPa ~ 300MPa 인, 공정.
  46. 청구항 38-45중 임의의 한 항에 있어서, 이때 상기 전단력과 압력은 모세관 유량계(rheometer) 또는 트윈 스크류 압출기(twin screw extruder)를 이용하여 당해 조성물에 적용되는, 공정.
  47. 청구항 46에 있어서, 이때 상기 트윈 스크류 압출기의 스크류 속도가 상기 압력과 전단력의 적용 동안 10 ~ 300 RPM 범위인, 공정.
  48. 청구항 38-45중 임의의 한 항에 있어서, 이때 전단력과 압력의 적용에 사용되는 기구는 혼합 챔버를 포함하는데, 이 챔버는 이에 근접해 있는 압출 챔버에 연결되어 있는, 공정.
  49. 청구항 48에 있어서, 이때 상기 조성물은 혼합 챔버 안에서 가열되는, 공정.
  50. 청구항 48에 있어서, 이때 상기 조성물은 상기 압출 챔버 안에서 가열되는, 공정.
  51. 청구항 49 또는 청구항 50에 있어서, 이때 상기 조성물은 120℃ 미만의 온도로 가열되는, 공정.
  52. 청구항 49 또는 청구항 50에 있어서, 이때 상기 조성물은 80℃ 미만의 온도로 가열되는, 공정.
  53. 청구항 49 또는 청구항 50에 있어서, 이때 상기 조성물은 40℃ 미만의 온도로 가열되는, 공정.
  54. 청구항 38-53중 임의의 한 항에 있어서, 이때 압출 후 상기 성형체는 압출 전 조성물과 비교하여, 15% 미만의 수분 함량 손실을 갖는, 공정.
  55. 청구항 38-53중 임의의 한 항에 있어서, 이때 압출 후 상기 성형체는 압출 전 조성물과 비교하여, 10% 미만의 수분 함량 손실을 갖는, 공정.
  56. 청구항 48에 있어서, 이때 상기 조성물은 3 ~ 7 분 범위로 혼합 챔버 안에서 체류 시간을 갖는, 공정.
  57. 청구항 48에 있어서, 이때 상기 압출 챔버는 상기 조성물이 압출되는 구멍에 근접하여 테이퍼드(tapered)되는, 공정.
  58. 청구항 48에 있어서, 이때 상기 압출 챔버는 온도 제어된, 공정.
  59. 청구항 48-58중 임의의 한 항에 있어서, 이때 상기 성형체는 섬유이고, 당해 섬유는 손으로 인발되는, 공정.
  60. 청구항 48-59중 임의의 한 항에 있어서, 이때 상기 성형체는 섬유이고, 당해 섬유는 여러 단계에 걸쳐 인발되는, 공정.
  61. 청구항 48-60중 임의의 한 항에 있어서, 이때 상기 재조합 거미줄 단백질은 성형체 안에서 실질적으로 비-분해된 상태인, 공정.
  62. 청구항 61에 있어서, 이때 상기 재조합 거미줄 단백질은 당해 성형체 안에서 10wt% 미만의 양으로 분해된, 공정.
  63. 청구항 61에 있어서, 이때 상기 재조합 거미줄 단백질은 당해 성형체 안에서 6wt% 미만의 양으로 분해된, 공정.
  64. 청구항 61에 있어서, 이때 상기 재조합 거미줄 단백질은 당해 성형체 안에서 2wt% 미만의 양으로 분해된, 공정.
  65. 청구항 61-64중 임의의 항에 있어서, 이때 상기 재조합 거미줄 단백질의 분해는 압출 전과 후, 조성물 안에 존재하는 전장의 재조합 거미줄 단백질의 양을 측정함으로써 평가되는, 공정.
  66. 청구항 65에 있어서, 이때 상기 전장의 재조합 거미줄 단백질의 양은 크기 배제 크로마토그래피를 이용하여 측정되는, 공정.
  67. 청구항 38-66중 임의의 한 항에 있어서, 이때 상기 성형체는 편광 광 현미경에 의해 측정하였을 때 최소 복굴절을 갖는, 공정.
KR1020217006385A 2018-08-10 2019-08-12 성형체를 위한 조성물 KR20210041023A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862717622P 2018-08-10 2018-08-10
US62/717,622 2018-08-10
PCT/US2019/046222 WO2020033970A2 (en) 2018-08-10 2019-08-12 Composition for a molded body

Publications (1)

Publication Number Publication Date
KR20210041023A true KR20210041023A (ko) 2021-04-14

Family

ID=69415293

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217006385A KR20210041023A (ko) 2018-08-10 2019-08-12 성형체를 위한 조성물

Country Status (9)

Country Link
US (1) US20200102424A1 (ko)
EP (1) EP3833524A4 (ko)
JP (1) JP2021534277A (ko)
KR (1) KR20210041023A (ko)
CN (1) CN112566767A (ko)
AU (1) AU2019318216A1 (ko)
CA (1) CA3107153A1 (ko)
MX (1) MX2021001551A (ko)
WO (1) WO2020033970A2 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW202144386A (zh) * 2020-02-12 2021-12-01 美商保爾特紡織品公司 重組絲固體及膜
EP4185604A2 (en) * 2020-07-23 2023-05-31 Bolt Threads, Inc. Recombinant silk compositions and methods of making thereof
US11993068B2 (en) 2022-04-15 2024-05-28 Spora Cayman Holdings Limited Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001078683A2 (en) * 2000-04-19 2001-10-25 Genentech, Inc. Sustained release formulations comprising growth hormone
AU2003202330A1 (en) * 2002-01-11 2003-07-24 Nexia Biotechnologies, Inc. Recovery of biofilament proteins from biological fluids
AU2003202949A1 (en) * 2002-01-11 2003-07-30 Ali Alwattari Methods and apparatus for spinning spider silk protein
US7057023B2 (en) * 2002-01-11 2006-06-06 Nexia Biotechnologies Inc. Methods and apparatus for spinning spider silk protein
AU2003206519A1 (en) * 2002-02-14 2003-09-04 The University Of British Columbia Alpha-HELICAL PROTEIN BASED MATERIALS AND METHODS FOR MAKING SAME
US9139728B2 (en) 2008-06-30 2015-09-22 Fina Technology, Inc. Single pellet polymeric compositions
US9074302B2 (en) * 2009-09-28 2015-07-07 Trustees Of Tufts College Methods of making drawn silk fibers
WO2011113446A1 (en) 2010-03-17 2011-09-22 Amsilk Gmbh Method for production of polypeptide containing fibres
WO2012145594A2 (en) * 2011-04-20 2012-10-26 Trustees Of Tufts College Molded regenerated silk geometries using temperature control and mechanical processing
JP6556122B2 (ja) * 2013-09-17 2019-08-07 ボルト スレッズ インコーポレイテッド 改良シルク繊維を合成するための方法および組成物
US20180080147A1 (en) * 2015-04-09 2018-03-22 Spiber Inc. Polar solvent solution and production method thereof
CA3028932A1 (en) * 2016-06-23 2017-12-28 Spiber Inc. Modified fibroin
EP3263593A1 (en) * 2016-07-01 2018-01-03 Anna Rising Engineered spider silk proteins and uses thereof
JPWO2018043698A1 (ja) * 2016-09-02 2019-06-24 Spiber株式会社 モールド成形体及びモールド成形体の製造方法
US11447532B2 (en) * 2016-09-14 2022-09-20 Bolt Threads, Inc. Long uniform recombinant protein fibers
US10716876B2 (en) * 2017-01-12 2020-07-21 Collplant Ltd. Method of generating collagen fibers

Also Published As

Publication number Publication date
CN112566767A (zh) 2021-03-26
AU2019318216A1 (en) 2021-03-11
WO2020033970A9 (en) 2020-07-02
MX2021001551A (es) 2021-04-13
EP3833524A2 (en) 2021-06-16
EP3833524A4 (en) 2022-06-22
JP2021534277A (ja) 2021-12-09
CA3107153A1 (en) 2020-02-13
WO2020033970A3 (en) 2020-03-19
US20200102424A1 (en) 2020-04-02
WO2020033970A2 (en) 2020-02-13

Similar Documents

Publication Publication Date Title
KR20210041023A (ko) 성형체를 위한 조성물
JP5584932B2 (ja) タンパク質繊維の製造方法
EP2774934B1 (en) Polypeptide solution, artificial polypeptide fiber production method using same, and polypeptide refining method
Fang et al. Insights into silk formation process: correlation of mechanical properties and structural evolution during artificial spinning of silk fibers
JP5540166B1 (ja) 人造ポリペプチド繊維の製造方法
US20220273526A1 (en) Recombinant spider silk extrudate formulations
US20220127756A1 (en) Methods of Generating Highly-Crystalline Recombinant Spider Silk Protein Fibers
US20190169242A1 (en) Methods of Generating Recombinant Spider Silk Protein Fibers
WO2019151424A1 (ja) フィブロイン組成物、フィブロイン溶液、及びフィブロイン繊維の製造方法
Asakura et al. Formylation of recombinant spider silk in formic acid and wet spinning studied using nuclear magnetic resonance and infrared spectroscopies
US11668024B2 (en) Polar solvent solution and production method thereof
JP2023513579A (ja) 組換えシルク固体及びフィルム