KR20140095010A - 키메라 거미 실크 및 이의 용도 - Google Patents

키메라 거미 실크 및 이의 용도 Download PDF

Info

Publication number
KR20140095010A
KR20140095010A KR1020137010776A KR20137010776A KR20140095010A KR 20140095010 A KR20140095010 A KR 20140095010A KR 1020137010776 A KR1020137010776 A KR 1020137010776A KR 20137010776 A KR20137010776 A KR 20137010776A KR 20140095010 A KR20140095010 A KR 20140095010A
Authority
KR
South Korea
Prior art keywords
gly
aly
ala
silk
gly aly
Prior art date
Application number
KR1020137010776A
Other languages
English (en)
Inventor
말콤 제임스 프레이저
랜디 루이스
돈 자비스
킴벌리 톰슨
조셉 훌
윤-겐 미아오
플로렌스 툴
봉희 손
영수 김
Original Assignee
더 유니버시티 오브 노트르 담 듀락
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 유니버시티 오브 노트르 담 듀락 filed Critical 더 유니버시티 오브 노트르 담 듀락
Publication of KR20140095010A publication Critical patent/KR20140095010A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43563Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects
    • C07K14/43586Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from insects from silkworms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/033Rearing or breeding invertebrates; New breeds of invertebrates
    • A01K67/0333Genetically modified invertebrates, e.g. transgenic, polyploid
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/033Rearing or breeding invertebrates; New breeds of invertebrates
    • A01K67/04Silkworms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K4/00Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof
    • C07K4/12Peptides having up to 20 amino acids in an undefined or only partially defined sequence; Derivatives thereof from animals; from humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • DTEXTILES; PAPER
    • D02YARNS; MECHANICAL FINISHING OF YARNS OR ROPES; WARPING OR BEAMING
    • D02GCRIMPING OR CURLING FIBRES, FILAMENTS, THREADS, OR YARNS; YARNS OR THREADS
    • D02G3/00Yarns or threads, e.g. fancy yarns; Processes or apparatus for the production thereof, not otherwise provided for
    • D02G3/02Yarns or threads characterised by the material or by the materials from which they are made
    • D02G3/04Blended or other yarns or threads containing components made from different materials
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • A01K2217/052Animals comprising random inserted nucleic acids (transgenic) inducing gain of function
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/70Invertebrates
    • A01K2227/706Insects, e.g. Drosophila melanogaster, medfly
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/02Animal zootechnically ameliorated
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Abstract

키메라 거미 실크 단백질 유전자를 보유하고 발현하도록 유전자 조작된 형질전환 누에로서, 키메라 거미 실크 단백질 유전자는 거미 실크 탄성 모티프 서열 및/또는 거미 실크 강도 모티프 서열에 대해 특이적인 거미 실크 도메인을 가지고 있는 키메라 거미 실크 단백질을 암호화하는 형질전환 누에가 개시된다. 또한, 천연 누에 실크 섬유에 비해 향상된 (인장) 강도 및 탄성 특성을 나타내는 향상된 누에 실크 섬유가 제공된다. 본원에 개시된 형질전환 누에를 이용하는, 키메라 실크 섬유를 제조하는 향상된 방법으로, 피기백 벡터 시스템과 헬퍼 플라스미드를 이용하는 방법 또한 제공된다. 유전자 발현 카세트가 제공되며, 여러 가지 합성 거미 실크 암호화 서열(거미 2, 거미 4, 거미 6, 거미 8)을 제조하는 데 이용된다. 피기백 벡터 시스템은 안정적인 형질전환체를 제공하기 위하여 헬퍼 플라스미드 존재 시, 누에 안으로 키메라 거미 실크 유전자를 도입하기 위하여, 돌연변이 누에를 형질전환하는 데 이용된다. 따라서, 이들 형질전환 누에는 실크 섬유의 상업용 생산에 적합한, 효율적으로 거미 실크를 생산하는 생물을 제공한다.

Description

키메라 거미 실크 및 이의 용도{CHIMERIC SPIDER SILK AND USES THEREOF}
본 연구는 미국 국립보건원(National Institutes of Health) 산하 국립생의학영상 및 생체공학연구소(National Institute of Biomedical Imaging and Bioengineering)(DLJ)로부터 보조금 제R21 EB007247호를 지원 받았으므로, 미국 정부는 본 출원의 기술에 관한 권한을 소유할 수 있다. 노트르담대학교 연구국(University of Notre Dame Office of Research)(MJF)과 공동 연구 계약이 있으며, 크레이크 바이오크래프트 래버러토리즈 사(Kraig BioCraft Laboratories, Inc.)(MJF)와의 연구 계약이 있다.
<기술분야>
향상된 강도와 유연성 특성이 있는 키메라 거미 실크 섬유가 제공되므로, 본 발명은 실크 섬유 분야에 관한 것이다. 또한, 특정 거미 실크 유전자 서열(거미실크의 강도 및/또는 거미 실크의 유연성 및/또는 탄성 모티프 서열)을 가지고 있는 유전자 조작된 형질전환 누에를 이용하는 향상된 실크 섬유(특히, 누에/거미 실크 키메라 섬유)를 생산하는 방법이 제공되므로, 본 발명은 키메라 실크 섬유의 생산방법 분야에 관한 것이다. 또한, 거미 실크의 유연성 및/또는 탄성 모티프와 거미 실크의 강도 모티프에 대해 특이적인 거미 실크 유전자 서열을 포함하는 키메라 누에 서열을 포함하도록 유전자 조작된 형질전환 누에 및 특이적으로 설계된 피기백(piggyBac) 벡터를 이용하는 이러한 형질전환 누에를 만드는 방법이 기술되므로, 본 발명은 형질전환 생물에 관한 것이다. 또한, 형질전환 누에를 이용하는 키메라 실크 섬유의 상업적 생산방법이 제공된다.
실크 섬유는 수년 동안 대단히 폭넓은 중요한 외과 수술을 위한 봉합선으로 이용되었다. 미세 섬유는 안과 수술, 신경 수술 및 성형 수술을 위한 봉합선으로 필요하다. 또한, 실크 섬유는 인공 인대, 인공 힘줄, 화상 환자의 피부 이식을 위한 탄력 붕대 및, 지지 및 일부 경우, 뼈 조직, 치주 조직 및 결합 조직의 재생 도중 일시적인 기능을 제공할 수 있는 비계의 재료로서 대단한 장래성을 보유하고 있다. 앞십자인대(ACL) 및 기타 관절 손상 발생률이 노령 인구에서 증가함에 따라, 인대 및 힘줄을 위한 재료로서의 실크 섬유의 개발이 점차 중요해지리라고 예상된다. 봉합선으로 현재 이용되는 섬유 가운데 적은 비율이 천연 누에 견으로부터 유래되지만, 대부분은 화학 산업에 의해 합성 고분자로서 생산된다. 이러한 접근법의 주요한 한계는 그것이 지름, 강도 및 탄성과 같은 좁은 범위의 물리적 성질을 나타내는 실크 섬유를 제공할 뿐이라는 점이다.
박테리아(Lewis, et al. 1996), 효모(Fahnestock and Bedzyk, 1997), 배큘로바이러스 감염 곤충 세포(Huemmerich, et al. 2004), 포유류 세포(Lazaris, et al. 2002) 및 형질전환 식물(Scheller, et al. 2001)을 포함한, 광범위한 재조합 시스템이 다양한 실크 단백질을 생산하는 데 이용되었다. 그러나, 이러한 시스템 중 어느 것도 자연적으로 실크를 잣도록 설계되지 않았고, 따라서 어느 것도 유용한 실크 섬유를 믿을 수 있게 생산하지 못했었다. 상업적인 견지에서 유용하다고 간주될 수 있는 실크 섬유를 위해서는, 섬유는 적당한 인장(강도) 및 유연성 및/또는 탄성 특성을 보유해야 하며, 원하는 상업적 응용 분야의 섬유 제조에 적합해야 한다. 따라서, 이러한 목적을 위해 이용될 수 있는 시스템에 대한 필요성은 계속하여 존재한다.
거미 실크 단백질은 여러 가지 이종 단백질 생산 시스템에서 생산되었다. 각 경우에서, 생산된 단백질의 양은 현실적인 상업 수준에 훨씬 못 미쳤다. 형질전환 식물 및 동물 발현 시스템은 규모를 키울 수 있으나, 이러한 시스템에서조차, 실질적으로 가격 효율적이기 위해서는 재조합 단백질 생산 수준이 증가되어야 할 것이다. 훨씬 더 어려운 문제는 이전의 생산 노력은 섬유가 아니라, 단백질을 생산했다는 점이다. 따라서, 단백질을 생산 후 방법을 이용하여 섬유로 자아야 한다. 이러한 생산 및 방적 문제 때문에, 상업적으로 관심의 대상이 되기에 충분히 긴 거미 실크 섬유, 즉, "유용한" 섬유를 생산할 수 있는 재조합 단백질 생산 시스템의 예가 전혀 없다.
이전에 보고된 섬유 생산 시도에서는 거미 아라네우스 디아데마투스(A. diadematus)로부터 MaSp1, MaSp2 및 관련된 실크 단백질을 암호화하는 유전자를 발현시키기 위해 포유류의 세포 시스템을 이용했다(Lazaris, et al. 2002). 이 작업은 60Kd의 거미 실크 단백질인 ADF-3를 생산하게 하였으며, ADF-3는 정제되어 생산 후 방적 방법으로 섬유를 생산하는 데 이용되었다. 그러나 이 시스템은 유용한 섬유를 지속적으로 산출하지 못한다. 또한, 이러한 접근법은 단백질을 가용화하고, 성공적인 방적 조건을 개발해야 하며, 유용한 성질이 있는 섬유를 얻기 위하여 포스트 스핀 드로(post-spin draw)를 수행할 필요성 때문에 문제가 있다.
본 기술은 제조에 필요한 필요조건인 인장 및 유연성 특성을 나타내는 실크 섬유를 지속적으로 제공하기 위한 상업적 방법이 여전히 결여되어 있다.
본 발명의 목적은 키메라 거미 실크 및 이의 용도를 제공하는 데에 있다.
본 발명은 본 기술에 설명된 위와 같은 어려움 및 다른 곤란함을 극복한다. 특히, 당연히 실크 섬유 방적을 위해 장비를 갖춘 것이므로, 단백질 정제, 가용화 및 인위적인 생산 후 방적과 관련된 문제들을 피할, 상업적 규모에 적응할 수 있는 형질전환 누에 생산 시스템이 제공된다.
일반적이고도 전반적인 의미에서, 본 발명은 우수한 인장 및 유연성 특성이 있는, 상업적으로 유용한 키메라 실크 섬유의 이종 실크 단백질 생산용 플랫폼으로서 형질전환 누에를 이용하는, 키메라 거미 실크 섬유 생산을 위한 생명공학적 접근법을 제공한다. 키메라 실크 섬유는 특정 범위의 바람직한 물리적 성질을 가지고 있는 섬유 또는 원하는 생의학적 응용 분야에 최적화된 소정의 성질을 갖춘 섬유를 제공하도록 맞춤 설계될 수 있다.
거미/누에 실크 단백질 및 키메라 거미 실크 단백질:
일 양상에서, 본 발명은 하나 이상의 거미 실크 유연성 및/또는 탄성 모티프/도메인 서열 및/또는 하나 이상의 거미 실크 강도 도메인 서열에 의해 암호화된 재조합 키메라 거미 실크/누에 실크 단백질을 제공한다. 일부 구현예에서, 키메라 거미/누에 실크 단백질은 거미 2, 거미 4, 거미 6 또는 거미 8 키메라 거미/누에 실크 단백질을 암호화하는 것으로 더 설명된다.
또한, 본 발명은 키메라 누에/거미 실크 단백질로부터 제조된 키메라 거미 실크 섬유를 제공한다. 특정 구현예에서, 천연 누에 실크 섬유와 비교하여 더 큰 인장 강도를 나타내는 키메라 거미 실크 섬유가 기술되며, 일부 구현예에서는 천연 누에 섬유와 비교하여 최대 2배 더 큰 인장 강도를 나타내는 키메라 거미 실크 섬유가 기술된다.
형질전환 누에:
다른 양상에서, 본 발명은 형질전환 생물, 특히 재조합 곤충 및 형질전환 동물을 제공한다. 일부 구현예에서, 형질전환 생물은 형질전환 누에나방과 같은 형질전환 누에이다. 특정 구현예에서, 형질전환 누에를 제공하고자 형질전환되는 숙주 누에는 천연 실크 섬유를 생산하는 능력이 부족한 돌연변이 누에일 것이다. 일부 구현예에서, 누에 돌연변이는 pnd-wl이다.
일부 구현예에서, 돌연변이 누에(누에나방)는 피기백(piggyBac) 시스템을 이용하여 형질전환될 것이며, 이때 피기백 벡터는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 옆에 있는 합성 거미 실크 단백질 서열을 함유하는 발현 카세트를 이용하여 제조된다. 일반적으로, 누에 형질전환은 누에씨에 미세 주사하여 전배반엽(pre-blastoderm) 배아에 피기백 벡터와 피기백 유전자전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 도입하는 단계를 수반한다. 난막(chorion) 천자를 위해 조정된 에펜도르프 로봇식 바늘 조작기가 미세 삽입 개구부를 형성하는 데 이용되는데, 미세 삽입 개구부를 통해 유리 모세관이 삽입되고, 유리 모세관을 통해 DNA 용액이 누에씨로 주사된다. 그런 다음, 주사된 누에씨는 성숙시켜, 유충으로 부화하도록 진행된다. 유충은 성숙한 누에로 성숙하도록 하여, 누에의 일상적인 생애주기에 따라 고치를 짓게 된다.
이러한 형질전환 곤충을 서로, 또는 비 형질전환 곤충/누에와 교배육종하는 것 또한 본 발명의 일부분으로 제공된다.
거미 실크 유전자 발현 카세트:
또 다른 양상에서, 본원에 개시된 바와 같은 하나 이상의 여러 가지 특정 거미 실크 유연성 및/또는 탄성 모티프 서열 및/또는 거미 실크 강도 모티프 서열에 해당하는, 하나 이상의 거미 실크 단백질 서열 모티프를 포함하는, 키메라 누에/거미 실크 발현 카세트가 제공된다. 또 다른 양상에서, 키메라 거미 실크/누에 단백질 및 섬유의 생산방법이 제공된다. 도 5에 묘사된 바와 같은 발현 카세트의 적어도 여덟 가지 버전이 제공되었으며, 이들은 NTD와 거미 실크 서열 사이에 인프레임으로 삽입된 EGFP가 있거나 없는 네 개의 서로 다른 합성 거미 실크 단백질을 암호화한다. 이러한 서열들은 본원에서 "거미 2", "거미 4", "거미 6" 및 "거미 8"로 식별된다.
형질전환 누에:
또 다른 양상에서, 형질전환 누에 및 형질전환 누에의 제조방법이 제공된다. 일부 구현예에서, 형질전환 누에의 제조방법은 누에 서열, 하나 이상의 거미 실크 강도 모티프 서열 및 하나 이상의 거미 실크 유연성 및/또는 탄성 모티프 서열을 암호화하는 키메라 거미 실크 서열을 포함하는 서열을 가지고 있는 발현 카세트를 제조하는 단계; 피기백 벡터(예를 들어, 피기백 벡터 pBac[3xP3-DsRedaf], 도 6 참조, 모체 플라스미드는 도 10 및 도 11 참조, 모체 플라스미드로부터 서브클로닝된 플라스미드는 도 12a 내지 도 12e 참조)에 상기 카세트 서열을 서브클로닝하는 단계; 피기백 벡터와 피기백 유전자전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 전배반엽 누에 배아에 (예컨대, 누에씨에 미세 주사하여) 도입하는 단계; 주사된 누에 배아를 정상적인 생육 조건(약 28℃ 및 70% 습도) 하에서 유충이 부화할 때까지 유지시키는 단계 및 형질전환 누에를 얻는 단계를 포함한다.
이러한 형질전환 누에는 S-적색 눈 표지의 발현을 기초로 한, 추정 형질전환체의 후속적인 식별을 위해 F1 세대 배아를 발생시키기 위해 더 교배될 수 있다. 그런 다음, 이 방법에 의해 식별된 추정 수컷 및 암컷 형질전환체는 더욱 상세한 유전자 분석을 위한 동형 계통의 생산을 위해 교배된다. 특히, 누에 형질전환은 투명한 큐티클의 누에 돌연변이인 pnd-wl의 누에씨에 피기백 벡터와 헬퍼 플라스미드 DNA의 혼합물을 주사하는 단계를 포함하였다. 누에 돌연변이 pnd-wl은 Tamura 등(2000)에 기술되어 있으며, 이 참조문헌은 전체로서 본원에 특히 통합되어 있다. 이 돌연변이는 형광 유전자를 이용한 스크리닝을 훨씬 더 용이하게 하는 멜라닌화 결핍증을 가지고 있다. 일단 적색 눈의 추정 F1 형질전환체가 식별되면, 견사선(silk gland) 단백질 및 채취된 고치 실크의 웨스턴 블로팅을 이용하여 동형 계통을 확인하였다.
키메라 거미 실크/누에 실크 섬유의 제조방법:
또 다른 양상에서, 본 발명은 형질전환 누에에서 키메라 거미 실크/누에 섬유를 생산하기 위한 상업적인 생산방법을 제공한다. 일 구현예에서, 방법은 본원에 기술된 형질전환 누에를 제조하는 단계, 및 형질전환 누에들이 자라서 고치를 형성하도록 허용하는 조건 하에서 그것들을 키우는 단계, 고치를 채취하는 단계, 및 고치로부터 키메라 거미 실크 섬유를 얻는 단계를 포함한다. 실크 고치로부터 실크 섬유를 푸는 및/또는 그렇지 않으면 수확하는 표준 기법이 이용될 수 있다.
제조물품 및 이의 이용방법:
또 다른 양상에서, 본 발명의 키메라 거미 실크 섬유로부터 만들어진 다양한 제조물품들이 제공된다. 예를 들어, 재조합 키메라 거미 실크/누에 섬유는 다른 물품 중에서도 의료용 봉합사 재료, 상처 드레싱 및 조직/관절 교체 및 재건 재료 및 장치, 약물 전달 패치 및/또는 기타 전달 물품, 보호복(방탄 조끼 및 기타 물품), 레크리에이션 물품(텐트, 낙하산, 캠핑장비 등)에 이용될 수 있다.
다른 양상에서, 다양한 의료 절차에서 재조합 키메라 거미 실크/누에 섬유를 이용하는 방법이 제공된다. 예를 들어, 섬유는 성장 또는 재생에서 재조합 섬유로 제조된 조직 강화 생체적합성 구조체 내의 비계로서 조직 수복을 촉진하는 데 이용될 수 있거나, 섬유로 조직된 단백질 또는 치료제의 전달을 제공하는 데 이용될 수 있다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 용어 및 과학 용어는 당해 발명이 속하는 분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 것과 같은 의미를 지닌다. 본원에 기술된 것과 비슷하거나 균등한 방법과 재료가 본 발명의 실현 또는 시험에 이용될 수 있지만, 바람직한 방법 및 재료는 아래에 기술되어 있다. 본원에 언급된 모든 출판물, 특허 출원, 특허 및 기타 참조문헌은 참조로서 통합된다. 또한, 재료, 방법 및 예는 설명을 위한 것일 뿐, 제한하고자 하는 것은 아니다. 충돌하는 경우, 정의를 포함한 본 명세서가 제어한다.
첨부된 도면과 함께, 바람직한 구현예의 아래와 같은 상세한 설명을 읽으면, 본 발명의 다른 목적 및 장점은 당해 분야에 속하는 통상의 지식을 가진 자에게 명백해질 것이고, 첨부된 도면에서 비슷한 도면부호는 비슷한 요소들을 표기하는 데 이용되었다.
도 1은 발산형으로 둥글게 거미줄을 치는 거미(divergent orb weaving spider) 또는 파생형으로 둥글게 거미줄을 치는 거미(derived orb weaving spider)의 두 가지 주요 팽창 실크 단백질의 아미노산 서열을 나타낸다(Gatesy, et al. 2001). 비교 결과, 특히 위에서 설명한 서열 모티프 내에서, 높은 수준의 서열 보존을 확인할 수 있었는데, 이는 이들 종이 서로 갈라진 이래, 1억 2천5백만 년에 걸쳐 유지된 것이다. 여러 가지 둥글게 거미줄을 치는 거미의 주요 팽창 실크 단백질의 공통 반복 아미노산 서열인 (-)는 다른 서열과 비교할 때, 존재하지 않는 아미노산을 나타낸다. 거미는 다음과 같다. Nep.c는 네필라 클라비페스(Nephila clavipes), Lat.g.는 라트로덱투스 게오메트리쿠스(Lactrodectus geometricus), Arg.t.는 아르지오페 트리파스시아타(Argiope trifasciata)이다.
도 2는 둥글게 거미줄을 치는 거미의 소수 팽창 실크 단백질의 공통 아미노산 서열을 나타낸다. 초기의 주요 팽창 실크 단백질 서열이 발표되자마자, N. 클라비페스의 소수 팽창 실크(Mi) 단백질 전사물을 나타내는 cDNA가 분리되어 서열이 분석되었다(Colgin and Lewis, 1998). 이 도면에 제공된 MiSp 서열은 MaSp 단백질과 비교하여, 비슷한 서열과 두드러지게 다른 서열 모두를 가지고 있다. MiSp는 GGX와 짧은 폴리알라닌(polyAla) 서열을 포함하지만, MaSp의 긴 폴리알라닌 모티프는 (GA)n 반복단위에 의해 교체된다. 공통 반복단위는 비슷한 구성을 가지고 있지만, GGX와 GA 반복단위의 수는 크게 다르다.
도 3은 편모상 실크 단백질 cDNA 공통 서열을 나타낸다. 이러한 실크 단백질 cDNA는 N. 클라비페스 편모상 분비샘으로부터 포획을 위한 나선형 실크 단백질을 암호화한다(도 3; Hayashi and Lewis, 2000). 이러한 cDNA는 5' 비번역 부위와 분비 신호 펩티드를 암호화하는 서열, 다섯 개의 아미노산 모티프의 수 차례 반복 및 C 말단을 함유한다. 노던 블로팅 분석 결과, 거의 500Kd의 단백질을 암호화하는 -15kb의 mRNA 크기를 나타냈다. 유전자 서열로부터 예측된 아미노산 서열은 (본원에 추가로 기술된) MaSp2의 성질과도 일치하는, 거미 실크의 탄성의 물리적 기초를 설명하는 데 도움이 되는 단백질 구조 모델을 시사했다.
도 4는 베타 나선형의 컴퓨터 모델을 나타낸다. 이것은 각 오량체 서열에서 II형 B 턴(turn)의 출발 배열이 있는, 에너지 최소화 (GPGGQGPGGY)2 서열의 모델이다.
도 5는 구축된 기본 누에나방 실크 피브리온 중쇄 발현 카세트 상의 몇 가지 변이를 나타낸다. 디자인은 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키고자 설계된 구조체 어셈블리를 포함하였으며, 이때 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 각 발현 카세트의 기능 관련 유전자 요소는 좌측으로부터 우측으로 주요 프로모터, 상류 인핸서 요소(UEE), 기초 프로모터 및 누에나방 fhc 단백질의 N 말단 도메인(NTD), 이어서 NTD의 상류에 위치한 번역 개시부위와 인프레임으로 위치된 다양한 합성 거미 실크 단백질 서열, 이어서 번역 종료부위와 RNA 폴리아데닐화 부위를 포함하는 fhc C 말단 도메인(CTD)을 포함한다.
도 6은 카세트를 피기백에 서브클로닝하기 위한 설계를 나타낸다. 묘사된 발현 카세트의 여덟 가지 서로 다른 버전 각각은 AscI과 FseI을 이용하여 모체 플라스미드로부터 잘라내어 pBAC[3xP3-DSRedaf]의 상응하는 부위로 서브클로닝된 것이다. 이러한 피기백 벡터의 지도를 나타낸 것이다.
도 7은 형질전환 누에 실크의 웨스턴 블롯을 나타낸다. 누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치의 실크 단백질을 거미 실크 특이 항체를 이용한 웨스턴 블로팅에 의해, 이러한 실크를 대상으로 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 연구 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다. 나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다. 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
도 8은 17,388bp 크기의 모체 플라스미드 pSL-거미 #4를 나타낸다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #4 카세트인 거미 실크 (A4S8)x42를 전달한다.
도 9는 모체 플라스미드 pSL-거미 #4 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 벡터는 크기가 18,102bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A4S8)x42와 함께, 키메라 거미 실크 단백질 #4를 전달한다.
도 10은 모체 플라스미드 pSL-거미 #6를 나타낸다. 이 모체 플라스미드는 크기가 12,516bp이다. 이 모체 플라스미드는 키메라 거미 실크 단백질 #6 카세트인 거미 실크 (A2S8)x14)x42를 전달한다.
도 11은 모체 플라스미드 pSL-거미 #6 + GFP를 나타낸다. GFP는 녹색 형광 단백질이다. 이 모체 플라스미드는 크기가 13,230bp이다. 이 모체 플라스미드는 표지 단백질 GFP, 카세트인 거미 실크 (A2S8)x14와 함께, 키메라 거미 실크 단백질 #6를 전달한다.
도 12a 및 도 12b는 피기백 플라스미드를 나타낸다. 도 12a는 크기가 10,458bp인 pXLBacII-ECFP NTD CTD maspX16 구조체를 도시한다. 도 12b는 크기가 11,250bp인 pXLBacII-ECFP NTD CTD maspX24 구조체를 도시한다.
도 13은 pSL-거미 #4의 서열을 나타낸다.
도 14는 pSL-거미 #4 + GFP의 서열을 나타낸다.
도 15는 pSL-거미 #6의 서열을 나타낸다.
도 16은 pSL-거미 #6 + GFP의 서열을 나타낸다.
도 17은 피기백 벡터 설계도를 나타낸다. 도 17a는 A2S814 합성 거미 실크 유전자이다. 도 17b는 거미 6 키메라 누에/거미 실크 유전자이다. 도 17c는 거미 실크 6-GFP 키메라 누에/거미 실크 유전자이다. 도 17d는 피기백 벡터이다. 도 17e에서 부호는 다음을 나타낸다: 편모 탄성 모티프(A2; 120bp); 주요 팽창 스피드로인-2; 거미 모티프(S8; 55bp) Fhc 주요 프로모터(1,157bp), Fhc 인핸서(70bp); Fhc 기초 프로모터, Hhc 5' 비번역 부위(엑손 1/인트론/엑손 2; Fhc N 말단 cds) = 1,744bp; EGF(720bp); A2SB14. 거미 실크 서열(2,462bp), Fhc C 말단 cds (180bp), Fhc 폴리아데닐화 신호(300bp).
도 18은 거미 6-GFP 누에의 (18a) 고치, (18b, 18c) 실크 분비샘, 및 (18d) 실크 섬유에서 키메라 누에/거미 실크/EGFP 단백질의 발현을 나타낸다. 누에 실크 분비샘에서 키메라 누에/거미 실크 단백질의 발현 및 위치 측정. 방법에서 기술한 바와 같이, 실크 분비샘을 절제하여, 거미 6 또는 거미 6-GFP 피기백 벡터를 겨누어, 형광 현미경으로 관찰하였다.
도 19는 실크 섬유의 순차적인 추출을 나타낸다. 본원에 설명된 바와 같이, pnd-wl(3 ~ 6번 레인), 거미 6(8 ~ 11번 레인), 또는 거미 6-GFP(13 ~ 16번 레인) 누에가 생산한 고치를 고무질을 제거하고, 연속 추출 프로토콜의 대상으로 하였다. 각 추출단계에서 용해된 단백질을 SDSPAGE와 (19a) 쿠마시 블루 염색 또는 (19b) 거미 실크 단백질 특이적 항혈청과 면역학적 블로팅으로 분석하였다. M: 분자량 표지. +: 대장균에서 발현 및 정제된 A2S814 거미 실크 단백질. 3번, 8번 및 13번 레인: 식염수 추출. 4번, 9번 및 14번 레인: SDS 추출. 5번, 10번 및 15번 레인: 8M LiSCN/2 메르캅토에탄올 추출. 6번, 11번 및 16번 레인: 16M LiSCN/5 메르캅토에탄올 추출. 화살표는 키메라 거미 실크 단백질을 나타낸다. 겉보기 분자량은 대장균의 A2S814은 약 75kDa, 거미 6는 약 106kDa, 거미 6-GFP는 약 130kDa 및 약 110kDa이었다.
도 20은 형질전환 누에의 복합 섬유, 양친 누에의 천연 섬유, 대표적인 천연 (드래그라인) 거미 실크 섬유를 관찰하여 최고의 기계적 성능을 비교한 것을 도시한 것이다. 섬유 인성은 응력/변형 곡선 아래의 면적으로 정의된다. 고무질을 제거한 천연 및 복합 실크 섬유의 기계적 성질. 천연 누에(pnd-wl)와 대표적인 거미(N. 클라비페스 드래그라인) 실크 섬유에 대해 측정한 최고의 기계적 성능을 형질전환 누에가 생산한 복합 실크 섬유에 대해 얻은 값과 비교하였다. 모든 섬유는 동일한 조건에서 시험하였다. 최대 인성값은 천연 누에 pnd-wl(43.9MJ/m3)과 비교할 때, 거미 6, 7번 계통(86.3MJ/m3), 거미 6-GFP, 1번 계통(98.2MJ/m3), 거미 6-GFP, 4번 계통(167.2MJ/m3) 및 N. 클라비페스 드래그라인(138.7MJ/m3)이었다. 이러한 데이터는 형질전환 누에에서 얻어진 복합 실크 섬유 모두는 비 형질전환 누에에서 얻어진 천연 섬유보다 더 질기다는 점을 보여준다.
도 21은 구조체 pXLBacII-ECFP NTD CTD masplX16(10,458pb)의 핵산 서열을 도시한다.
도 22는 구조체 pXLBacII-ECFP NTD CTD maspX24(11,250bp)의 핵산 서열을 도시한다.
본 발명에 이용된, 누에 염색체로 유전자를 삽입하는 방법은 유전자가 염색체 내에 안정적으로 도입되고 발현되도록, 그리고 교배에 의해서도 자손에 안정적으로 전파되도록 해야 한다. 누에씨로의 미세 주사를 이용하는 방법 또는 유전자 총을 이용하는 방법이 이용될 수 있지만, 이용되는 방법은 바람직하게는 외래 유전자의 누에 염색체로의 삽입을 위한 벡터와 트랜스포존 유전자를 함유하는 헬퍼 플라스미드(Nature Biotechnology 18, 81-84, 2000)를 동시에 함유하는 목표 유전자로 누에씨에 미세 주사하는 것으로 이루어진다.
목표 유전자는 미세 주사된 누에씨로부터 부화되어 육성된 재조합 누에의 생식세포로 삽입된다. 이러한 방식으로 얻어진 재조합 누에의 자손은 그들의 염색체에 목표 유전자를 안정적으로 보유할 수 있다. 본 발명에서 얻어진 재조합 누에의 유전자는 일반 누에와 동일한 방식으로 유지될 수 있다. 즉, 정상적인 조건 하에서 누에씨를 배양하고, 부화된 유충을 모아 인공사료를 먹인 다음, 일반 누에와 동일한 조건에서 사육하여 오령까지의 누에를 사육할 수 있다.
본 발명에서 얻어진 재조합 누에는 일반 누에와 동일한 방식으로 사육될 수 있으며, 누에 발달과 성장을 최대화하기 위하여, 일반 조건에서 사육시켜, 외래 단백질을 생산할 수 있다.
본 발명에서 얻어진 유전자 재조합 누에는 일반 누에와 동일한 방식으로 번데기가 되어 고치를 생산할 수 있다. 수컷과 암컷은 번데기 단계에서 구분되며, 나방으로 변한 후, 수컷과 암컷이 교미하여, 그 다음 날, 누에씨가 채취된다. 누에씨는 일반 누에씨와 동일한 방식으로 보관될 수 있다. 본 발명의 유전자 재조합 누에는 위에서 설명한 바와 같이 육종을 반복하여 후속 세대에서 유지될 수 있고, 많은 수로 증가시킬 수 있다.
여기서 이용되는 프로모터에는 특별한 제한이 없고, 누에 세포 내에서 효율적으로 작용하기만 한다면 임의의 생물에서 유래하는 임의의 프로모터가 이용될 수 있지만, 누에 실크 분비샘에서 특별히 단백질을 유도하도록 설계된 프로모터가 바람직하다. 누에 실크 분비샘 단백질 프로모터의 예로는 피브로인 H 사슬 프로모터, 피브로인 L 사슬 프로모터, p25 프로모터 및 세리신 프로모터를 포함한다.
본 발명에서, "키메라 거미 실크 단백질을 발현시키기 위한 유전자 카세트"는 곤충 세포로 삽입되는 경우에 키메라 단백질의 합성에 필요한 일 세트의 DNA를 나타낸다. 키메라 거미 실크 단백질을 발현시키기 위한 이 유전자 카세트는 키메라 거미 실크 단백질을 암호화하는 유전자의 발현을 촉진하는 프로모터를 함유한다. 보통, 그것은 터미네이터와 폴리아데닌 첨가 부위도 함유하며, 바람직하게는 프로모터, 외래 단백질 구조 유전자, 터미네이터 및 폴리아데닌 첨가 부위를 함유한다. 또한, 그것은 프로모터와 외래 단백질 구조 유전자 사이에 연결된 분비 신호 유전자를 함유할 수도 있다. 임의의 유전자 서열은 폴리아데닌 첨가 서열과 외래 단백질 구조 유전자 사이에도 연결될 수 있다. 또한, 인위적으로 설계되고 합성된 유전자 서열도 연결될 수 있다.
또한, "키메라 거미 실크/누에 유전자를 삽입하기 위한 유전자 카세트"는 양쪽에 한 쌍의 피기백 트랜스포존의 도치된 반복 서열을 가지고 있으며, 피기백 트랜스포존의 작용을 통해 곤충 세포 염색체로 삽입된 일 세트의 DNA로 이루어진, 키메라 거미 실크/누에 유전자를 발현시키기 위한 유전자 카세트를 나타낸다.
본 발명의 벡터는 고리형 또는 선형 DNA 구조를 가지고 있는 벡터를 나타낸다. 대장균에서 복제할 수 있고, 고리형 DNA 구조를 가지고 있는 벡터가 특히 바람직하다. 이 벡터는 또한 형질전환체의 선별을 촉진하기 위한 목적을 위해, 항생제 저항성 유전자 또는 해파리 녹색 형광 단백질 유전자와 같은 표지 유전자를 포함할 수 있다.
본 발명에 이용되는 곤충 세포는 특별한 제한은 없지만, 바람직하게는 인시류 곤충 세포, 더욱 바람직하게는 누에나방 세포, 그리고 훨씬 더 바람직하게는 누에 실크 분비샘 세포 또는 누에나방 알에 함유된 세포이다. 실크 분비샘 세포의 경우, 오령의 누에 유충의 후측 실크 분비샘 세포에서 피브로인 단백질의 활발한 합성이 이루어지며, 그것들이 용이하게 취급되므로, 오령의 누에 유충의 후측 실크 분비샘 세포가 바람직하다.
곤충 세포에 의해, 키메라 거미 실크 단백질의 발현을 위한 유전자 카세트를 도입시키는 데 이용되는 방법에는 특별한 제한이 없다. 누에 실크 분비샘 세포로 도입시키는 경우, 유전자 총을 이용하는 방법 및 미세 주사를 이용하는 방법이 배양된 곤충 세포로의 도입을 위해 이용될 수 있으며, 예를 들어, 유전자 총을 이용하여 오령의 누에 유충의 몸으로부터 절제된 후측의 실크 분비샘 조직으로 유전자를 용이하게 도입시킬 수 있다.
유전자 총을 이용한 후측의 실크 분비샘으로의 유전자 도입은 예를 들어, 1,100 내지 1,800psi의 헬륨 기체 압력에서 입자 총(Bio-Rad, Model No. PDS-1000/He)을 이용하여, 외래 단백질 발현을 위한 유전자 카세트를 포함하는 벡터로 코팅된 금 입자를 한천 플레이트에 고정시킨 후측의 실크 분비샘에 포격하는 것 등에 의해 이루어질 수 있다.
누에나방의 알에 함유된 세포로 유전자를 도입하는 경우, 미세 주사를 이용하는 방법이 바람직하다. 여기서, 알로 미세 주사를 수행하는 경우, 알의 세포 안으로 직접 미세 주사할 필요는 없고, 오히려 간단히 미세 주사에 의해 유전자를 알 안으로 도입시킬 수 있다.
염색체 내에 본 발명의 "키메라 거미 실크 단백질 발현을 위한 유전자 카세트"를 함유하는 재조합 누에는 "키메라 거미 실크 유전자를 삽입하기 위한 카세트"를 가지고 있는 벡터를 누에나방의 알에 미세 주사하여 얻어질 수 있다. 예를 들어, 제1 세대(G1) 누에는 Tamara 등(Nature Biotechnology 18, 81-84, 2000)의 방법에 따라, 누에나방 알에 "키메라 거미 실크 유전자를 삽입하기 위한 카세트"를 가지고 있는 벡터와 피기백 유전자전위효소 유전자가 누에 액틴 프로모터의 제어 하에 배열되는 플라스미드를 동시에 미세 주사하고, 이어서 부화된 유충을 사육하고, 그 결과로 얻어지는 동일한 집단 내의 성충(G0)을 교배시켜 얻어진다. 재조합 누에는 보통 이러한 G1 세대 중에서 1 내지 2%의 빈도로 나타난다.
재조합 누에의 선별은 G1 세대 누에 조직으로부터 DNA를 분리한 후, 외래 단백질 유전자 서열을 기초로 하여 설계된 프라이머를 이용한 PCR에 의해 이루어질 수 있다. 대안적으로, 재조합 누에는, 누에 세포에서 발현될 수 있는 프로모터의 하류에 연결된 녹색 형광 단백질을 암호화하는 유전자를 미리 "유전자를 삽입하기 위한 유전자 카세트"에 삽입한 다음, 제1령 단계의 G1 세대 누에 중에서 자외선 조명 하에서 녹색 형광을 발산하는 개체들을 선별하는 것에 의해 용이하게 선별될 수 있다.
또한, 염색체 내에 "외래 단백질을 발현시키기 위한 유전자 카세트"를 함유하는 재조합 누에를 얻고자 하는 목적으로, 누에나방 알에 "유전자를 삽입하기 위한 유전자 카세트"를 가지고 있는 벡터를 미세 주사하는 경우, 피기백 유전자전위효소 단백질을 동시에 미세 주입하여, 위에서 설명한 것과 동일한 방식으로 재조합 누에가 얻어질 수 있다.
피기백 트랜스포존은 약 2.1k 염기쌍 내부의 양 말단과 ORF에 13개 염기쌍의 도치된 서열을 가지고 있는 DNA의 전달 인자를 나타낸다. 본 발명에 이용되는 피기백 트랜스포존에는 특별한 제한이 없지만, 이용될 수 있는 것들의 예로는 트리코프루시아 니(Trichoplusia ni) 세포주 TN-368, 오토그라파 칼리포니카(Autographa californica NPV, AcNPV) 및 갤러리아 멜로네아(Galleria mellonea) NPV(GmMNPV)에서 기원하는 것들을 포함한다. 유전자 및 DNA 전달 활성을 가지고 있는 피기백 트랜스포존은 바람직하게는 트리코플루시아 니 세포주 TN-368에서 기원하는 피기백의 일부분을 가지고 있는 플라스미드 pHA3PIG 및 pPIGA3GFP를 이용하여 제조될 수 있다(Nature Biotechnology 18, 81-84, 2000). 피기백에서 기원하는 DNA 서열의 구조는 TTAA 서열을 함유하는 도치된 말단 서열 한 쌍을 가지고 있어야 하고, 그러한 DNA 서열 사이에 삽입된 사이토카인 유전자와 같은 외래 유전자를 가지고 있다. 트랜스포존에서 유래하는 DNA 서열을 이용하여 누에 염색체로 외래 유전자를 삽입하기 위하여, 유전자전위효소를 이용하는 것이 더욱 바람직하다. 예를 들어, 유전자가 누에 염색체로 삽입되는 빈도는, 도치된 말단 서열 두 쌍을 인식하고, 그들 사이의 유전자 절편을 잘라내어, 그것을 누에 염색체에 전달하기 위하여, 누에 세포 내에서 유전자전위효소가 전사되고 번역될 수 있도록, 피기백 유전자전위효소를 발현할 수 있는 DNA를 동시에 삽입하여 상당히 향상시킬 수 있다.
본 발명은 다음과 같은 설명에 의해 훨씬 더 제대로 인식될 수 있다.
생의학계의 키메라 실크 단백질:
키메라 거미 실크 섬유는 극도로 얇은 섬유를 필요로 하는, 안과 수술, 신경 수복 및 성형 수술과 같은, 절차의 하위 부류를 위해 널리 이용되는 물질의 일부분으로 제공된다. 추가적인 용도로는 약물 전달을 위한 물질뿐만 아니라, 뼈, 인대 및 힘줄의 재생을 위한 비계 물질을 포함한다.
본 발명의 방법에 의해 생산되는 재조합 거미 실크 섬유는 혈관 상처 수복 장치, 지혈 드레싱, 패치 및 접착제, 봉합사를 포함하는, 상처 폐쇄 시스템, 약물 전달과 같은 다양한 의료 응용 분야에, 그리고 예를 들어, 비계, 인대 보철기기와 같은, 조직 공학 응용 분야에, 그리고 인체로의 장기간 또는 생분해성 이식을 위한 제품에 이용될 수 있다. 바람직한 조직 공학 비계는 본원에 기술된 재조합 거미 실크/누에 섬유로 제조된 섬유로 이루어진 부직포 망이다.
추가적으로, 본 발명의 재조합 키메라 실크 섬유는 척추 디스크, 두개골 조직, 경막, 신경 조직, 간, 췌장, 신장, 방광, 비장, 심장 근육, 골격 근육, 힘줄, 인대 및 유방 조직을 포함하나, 이에 한정되지 않는, 이러한 독특한 비계들로부터 이익을 볼 수 있는 기관 수복, 교체 또는 재생 전략을 위해 이용될 수 있다.
본 발명의 또 다른 구현예에서, 재조합 거미 실크 섬유 물질은 치료제를 함유할 수 있다. 이러한 물질을 형성하기 위하여, 치료제는 물질을 형성하기 전에 섬유 내부로 들어가도록 조작되거나, 물질이 형성된 후에 물질 내부로 로딩될 수 있다. 본 발명의 재조합 키메라 실크 섬유와 함께 이용될 수 있는 여러 가지 치료제의 다양성은 어마어마하다. 일반적으로, 본 발명의 제약 조성물을 통해 투여될 수 있는 치료제는 제한 없이, 항생제 및 항바이러스제와 같은 항감염제; 화학치료제(즉, 항암제); 항거부반응제; 진통제 및 진통제 화합물; 항염증제; 스테로이드와 같은 호르몬제; 성장인자(골형성 단백질(즉, BMP 1~7), 골형성 유사 단백질(즉, GFD-5, GFD-7 및 GFD-8), 표피성장인자(EGF), 섬유아세포 성장인자(즉, FGF 1~9), 혈소판 유래 성장인자(PDGF), 인슐린 유사 성장인자(IGF-I 및 IGF-II), 전환성장인자(즉, TGF-베타 I~III), 혈관 내피 성장인자(VEGF)); 및 기타 천연적으로 유래된 또는 유전자 조작된 단백질, 다당류, 당단백질 또는 지질단백질을 포함한다. 이들 성장인자는 이로써 본원에 참조로 통합된, R. G. Landes Company가 출판하고, Vicki Rosen과 R. Scott Thies이 저술한 <The Cellular and Molecular Basis of Bone Formation and Repair>에 기술되어 있다.
생체활성 물질을 함유하는 재조합 거미 실크/누에 섬유는 하나 이상의 치료제를 물질을 제조하는 데 이용한 섬유와 혼합하여 제형화될 수 있다. 대안적으로, 치료제는 바람직하게는 약학적으로 허용 가능한 담체를 이용하여 섬유에 코팅될 수 있다. 섬유를 용해시키지 않는 임의의 약학적 담체가 이용될 수 있다. 치료제는 액체, 미세하게 분리된 고체, 또는 임의의 기타 적당한 물리적 형태로 존재할 수 있다.
치료제의 양은 이용되는 특정 약물 및 치료되는 의료 상태에 따라 달라질 것이다. 전형적으로, 약물의 양은 물질의 중량을 기준으로 약 0.001퍼센트 내지 약 70퍼센트, 더욱 전형적으로는 약 0.001퍼센트 내지 약 50퍼센트, 가장 전형적으로는 약 0.001퍼센트 내지 약 20퍼센트이다. 예를 들어, 체액 또는 조직과 접촉 시, 약물은 방출될 것이다.
재조합 거미 실크/누에 섬유로 제조된 조직 공학 비계는 제작 후에 추가적으로 변경될 수 있다. 예를 들어, 비계는 원하는 세포 집단을 위한 수용체 또는 화학적 유인물로서 기능하는 생체활성 물질로 코팅될 수 있다. 코팅은 흡수 또는 화학 결합을 통해 적용될 수 있다.
본 발명에 사용하기 적합한 첨가제는 생물학적으로 또는 약학적으로 활성이 있는 화합물을 포함한다. 생물학적으로 활성이 있는 화합물의 예로는 세포 부착에 영향을 미치는 것으로 알려져 있는 "RGD" 인테그린 결합 서열의 변이형을 함유하는 펩티드와 같은, 세포 부착 매개체, 생물학적으로 활성이 있는 리간드, 그리고 특정 종류의 세포 또는 조직 내성장을 증진시키거나 차단하는 물질을 포함한다. 그러한 물질은 예를 들어, 골형성 단백질(BMP)과 같은 골유도 물질, 표피성장인자(EGF), 섬유아세포 성장인자(FGF), 혈소판 유래 성장인자(PDGF), 혈관 내피 성장인자(VEGF), 인슐린 유사 성장인자(IGF-I 및 II), TGF-, YIGSR 펩티드, 글리코사미노글리칸(GAG), 히알루론산(HA), 인테그린, 셀렉틴 및 카드헤린을 포함한다.
비계는 조직 공학 및 재건 수술을 포함한 조직 유도 재생 응용 분야를 위한 물품으로 만들어질 수 있다. 비계의 구조는 관대한 세포 내성장을 허락하여, 세포 파종 전처리 필요성을 줄인다. 외부 지지 기관 제작을 위한 세포의 시험관 내 배양을 지지하기 위한 외부 비계를 형성하기 위해, 비계는 또한 주조될 수 있다.
비계는 신체의 세포외 기질(ECM)을 모방하는 기능을 한다. 비계는 시험관 내 배양 및 후속 이식 과정에서 분리된 세포를 위하여 물리적인 지지체 및 부착성 기질로서 작용한다. 이식된 세포 집단이 성장하고, 세포들이 정상적으로 기능함에 따라, 세포들은 자신의 ECM 지지체를 분비하기 시작한다.
연골과 뼈와 같은 구조 조직의 재건에서, 조직 형태는 기능에 필수적이며, 다양한 두께와 모양의 물품으로 비계를 주조할 것이 요구된다. 3차원 구조에서 원하는 임의의 균열, 구멍 또는 개량은 매트릭스 일부분을 가위, 외과용 메스, 레이저 빔 또는 임의의 기타 절단 도구로 제거하여 만들어질 수 있다. 비계 응용 분야로는 신경, 근골격, 연골, 힘줄, 간, 췌장, 안구, 피부, 혈관, 요도 또는 임의의 기타 조직을 형성하는 속이 꽉 찬 또는 속이 빈 기관과 같은 조직의 재생을 포함한다.
또한, 비계는 3차원 조직 또는 기관을 만들기 위한, 해리 세포, 예컨대, 연골세포 또는 간세포를 위한 매트릭스로서 이식에 이용될 수 있다. 공여자로부터, 확립된 세포 배양 계통으로부터 얻었거나 또는 심지어 유전자 조작 전 또는 후에 얻은, 연골세포, 섬유아세포, 근육 세포 및 골세포와 같은 근육 및 골격계의 세포, 간세포, 췌장 세포(섬세포 포함)와 같은 실질세포, 내장 기원의 세포 및 신경세포, 골수세포, 피부세포, 다능성 세포 및 줄기세포와 같은 기타 세포, 그리고 이의 조합을 포함한 임의의 유형의 세포가 배양 및 가능성 있는 이식을 위한 비계에 첨가될 수 있다. 또한, 조직 조각들이 이용될 수 있으며, 이들은 동일한 구조에 여러 가지 서로 다른 세포 유형을 제공할 수 있다.
세포는 적절한 공여자, 또는 세포들이 이식되고, 표준 기법을 이용하여 해리되어, 지지체 위와 안에 심어지는 환자로부터 얻어진다. 시험관 내 배양은 선택적으로 이식 전에 이루어질 수 있다. 대안적으로, 비계가 이식되어 혈관을 신생하도록 한 다음, 세포가 비계 안에 주사된다. 시험관 내에서의 세포 배양 및 조직 비계의 이식을 위한 방법과 시약은 당해 분야에서 통상의 지식을 가진 자에게 알려져 있다.
본 발명의 재조합 거미/누에 섬유는 방사선을 기반으로 한 멸균(즉, 감마 레이), 화학물질을 기반으로 한 멸균(에틸렌 옥사이드) 또는 기타 적당한 절차와 같은 종래의 멸균 공정을 이용하여 멸균될 수 있다. 바람직하게는 멸균 공정은 8시간 이하의 시간 동안 52 ~ 55℃ 사이의 온도에서 에틸렌 옥사이드로 이루어질 것이다. 멸균 후, 생체적합물질은 이송과 병원 및 기타 의료시설에서의 이용을 위하여 적당히 멸균된 수분 저항성 포장 안으로 포장될 수 있다.
또한, 본 발명의 키메라 실크 섬유는 기능성 운동복 및 방탄조끼의 제조/제작과 같은, 다양한 형태의 운동용 및 보호용 의복의 제조에 이용될 수 있다. 또한, 본원에 개시된 키메라 거미 실크 섬유는 향상된 에어백 제조에서와 같이, 자동차 산업에 이용될 수 있다. 거미줄은 거미줄에 걸리는 날아다니는 곤충의 에너지를 흡수하지만, 개시된 키메라 실크 섬유를 이용하는 에어백은 자동차 충돌에서 더욱 큰 충격에너지를 제공한다.
정의
본원에 사용된 생체적합성은 제조된 실크 섬유 또는 물질이 무독성, 비 돌연변이원성이며, 최소 내지 적당한 정도의 염증 반응을 유도함을 의미한다. 본 발명에 사용하기 위한 바람직한 생체적합성 고분자는 예를 들어, 폴리에틸렌 옥사이드(PEO), 폴리에틸렌 글리콜(PEG), 콜라겐, 피브로넥틴, 케라틴, 폴리아스파르트산, 폴리라이신, 알긴산, 키토산, 키틴, 히알루론산, 펙틴, 폴리카프로락톤, 폴리락트산, 폴리글리콜산, 폴리하이드록시알카노에이트, 덱스트란 및 폴리무수물을 포함할 수 있다. 본 발명에 따르면, 둘 이상의 생체적합성 고분자가 수성 용액에 첨가될 수 있다.
본원에 사용된 유연성 및/또는 탄성 모티프 및/또는 도메인 서열은, 실크 섬유와 같은 물질에 탄성 및/또는 유연성의 특징을 주는 것과 관련된 거미 실크를 암호화하는 유전자 또는 단백질 절편의 식별 가능한 유전자 서열로 정의된다. 예로서, 유연성 및/또는 탄성 모티프 및/또는 도메인은 GPGGA이다.
본원에 사용된 강도 모티프는 실크 섬유에 인장 강도를 증가 및/또는 향상시키기 위한 것과 같이, 물질에 강도의 특징을 주는 것과 관련된 거미 실크를 암호화하는 유전자 또는 단백질 절편의 확인된 유전자 서열로 정의된다. 예로서, 이러한 거미 강도 모티프 일부는 (A가 폴리아데닌 서열일 때) GGPSGPGS(A) 8이다.
본 발명은 본 발명의 예시로서 의도된 다음과 같은 실시예에 의해 추가적으로 특징지어질 것이다.
실시예 1. 재료 및 방법
본 실시예는 형질전환 거미 실크 섬유의 인장 강도 평가에 이용된 기준 표뿐만 아니라, 형질전환 누에 생성에 이용된 재료와 방법/기법, 이용된 유전자 구조체 제조에 이용된 일반적인 절차를 기술하고자 제공된 것이다.
1. 이용된 유전자 서열. 이용된 유전자 서열은 본원에 제공된 도 13 내지 도 16에 제공되어 있다. 예를 들어, 실질적으로 동일한 키메라 거미 실크 단백질 성질을 나타내는 보존적인 치환을 가지고 있는 이들 서열의 짧은 버전 및/또는 긴 버전이 이용될 수 있으리라고 고려되므로, 이것들의 변이형 또한 본 발명의 일부분으로 예상된다.
2. 키메라 거미 실크 단백질 및 이들 키메라 실크 단백질로 얻어진 섬유를 대상으로 인장 강도를 평가할 것이다. 표 1은 키메라 거미 실크 섬유가 평가될 일반적인 기준을 제공한다. 본 발명의 키메라 거미 실크 섬유는 천연 거미 실크와 비슷한 인장 강도 및 기타 기계적 강도 특징을 보유한 것으로 확인되었다.
Figure pct00001
실시예 2. 개별적인 형질전환 누에 실크의 인장 강도 성질 분석
형질전환 누에 실크를 대상으로, 거미 실크 특이적 항체를 이용한, 누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치 실크 섬유의 웨스턴 블로팅에 의해, 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두, 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 연구 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다. 나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다. 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
도 2는 개별적인 형질전환 누에에서 생산된 형질전환 실크의 분석 결과를 나타낸다. 이러한 분석 결과는 거미-4 또는 거미-6 구조체로 형질전환된 형질전환 계통이 비 형질전환된 누에에서 생산된 실크 섬유와 비교하여 향상된 강도를 나타내는 키메라 거미 실크/누에 섬유를 생산함을 분명히 보여준다. 중요하게도, 이들 섬유는 일부 경우에서 천연 실크 강도의 거의 두 배이다. 누에/거미 실크 키메라 섬유 강도의 두 배 향상은 거미 실크만큼 강하고 유연한 누에 실크를 제조하는 데 필수적인 것으로 생각되는 향상과 비슷하다. 따라서, 이러한 결과는 봄빅스(Bombyx)/거미 실크 키메라 단백질을 구성하기 위해, 거미 실크의 명시된 강도 및/또는 유연성 도메인을 암호화하는 피기백 벡터를 이용하여, 천연 거미 실크와 유리하게 경쟁할 수 있는 키메라 거미 실크/누에 섬유를 생산하도록 유전자 조작될 수 있음을 보여준다.
Figure pct00002
실시예 3. 누에 키메라 유전자 발현 카세트 및 형질전환 누에의 키메라 거미 실크/누에 단백질 발현을 위한 피기백 벡터
매우 광범위한 누에 키메라 거미 실크 유전자 발현 카세트를 제공하는 데 있어서 본 발명의 유용성 및 범위를 입증하기 위하여 본 실시예가 제공된다. 또한, 본 실시예는 성공적으로 누에를 형질전환하는 것으로 밝혀진 피기백 벡터의 완성을 보여주며, 그 결과, 제조 시 상업적으로 유용한 길이의 섬유 생산에 적합한, 상업적으로 유용한 키메라 거미 실크 단백질을 성공적으로 생산할 수 있다.
발현 카세트.
아래에 나타낸 기본 발현 카세트에 대한 몇 가지 변이형을 구축하였다. 이들 구조체는 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키도록 설계된 구조체의 어셈블리를 반영하는 것으로, 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 이 점과 관련하여, 도 5에 도시된 기본 누에나방 실크 피브로인 중쇄 발현 카세트 상의 몇 가지 변이형을 구축하였다. 디자인은 피브로인 중쇄(fhc)-거미 실크 키메라를 발현시키도록 설계된 구조체의 어셈블리를 포함하며, 합성 거미 실크 단백질 서열 옆에는 누에나방 fhc 단백질의 N 말단 절편과 C 말단 절편이 있다. 각 발현 카세트의 기능 관련 유전자 요소는 좌측으로부터 우측으로, 주요 프로모터, 상류 인핸서 요소(UEE), 기초 프로모터 및 누에나방 fhc 유전자의 N 말단 도메인(NTD), 이어서 NTD의 상류에 위치한 번역 개시부위와 인프레임으로 위치된 다양한 합성 거미 실크 단백질 서열(아래 참조), 이어서 번역 종료부위와 RNA 폴리아데닐화 부위를 포함하는 fhc C 말단 도메인(CTD)을 포함한다.
도 5에 묘사된 발현 카세트는 여덟 가지 버전이 있는데, 이들은 NTD와 거미 실크 서열 사이에 인프레임으로 삽입된 EGFP가 있거나 없는, 네 개의 서로 다른 합성 거미 실크/누에 단백질을 암호화한다. 이러한 서열들은 "거미 2", "거미 4", "거미 6" 및 "거미 8"로 식별되었으며, 그것들은 다음과 같이 정의된다.
a) 거미 2: 7,104bp로, (A4S8)24로 이루어짐. A1은 추정상의 편모상 실크 탄성 모티프 (GPGGA)의 4개 카피를 나타낸다. 따라서, A4는 이러한 동일한 서열의 16개 카피를 나타낸다. S8은 추정상의 드래그라인 실크 강도 모티프 [GGPSGPGS(A)8]를 나타내며, "링커-폴리알라닌" 서열로도 기술된다. GFP(녹색 형광 단백질) 융합 단백질의 대략적인 크기는 161.9 + 50.4 = 212.3Kd이다.
b) 거미 4: 7,386bp로, (A2S8)42로 이루어짐. A2는 추정상의 편모상 실크 탄성 모티프 (GPGGA)의 8개 카피를 나타낸다. S8은 위와 같이 추정상의 드래그라인 실크 강도 모티프 [GGPSGPGS(A)8]를 나타낸다. GFP 융합 단백질의 대략적인 크기는 169.4 + 50.4 = 219.8Kd이다.
c) 거미 6: 2,462bp로, (A2S8)14로 이루어짐. A2는 탄성 모티프 (GPGGA)의 8개 카피를 나타내고, S8은 위와 같이 강도 모티프 [GGPSGPGS(A)8]을 나타낸다. GFP 융합 단백질의 대략적인 크기는 56.4 + 50.4 = 106.8Kd이다.
d) 거미 8: 4,924bp로, (A2S8)28로 이루어짐. A2는 탄성 모티프(GPGGA)의 8개 카피를 나타내고, S8은 위와 같이 강도 모티프 [GGPSGPGS(A)8]를 나타낸다. GFP 융합 단백질의 대략적인 크기는 112.8 + 50.4 = 163.2Kd이다.
NTD 엑손 I & II의 크기 (1625 + 15161); eGFP (27135); CTD (6470) = 50,391Kd.
실시예 4. 발현 카세트의 피기백으로의 서브클로닝
위에서 도 5에 묘사된 (그리고 실시예 3에 기술된) 발현 카세트의 여덟 가지 서로 다른 버전 각각을 AscI과 FseI을 이용하여 모체 플라스미드로부터 절단하여, pBAC[3xP3-DSRedaf]의 상응하는 부위로 서브클로닝하였다. 이러한 피기백 벡터의 지도를 도 6에 나타내었다.
EGFP가 있는, 그리고 EGFP가 없는, 위에 기술한 모든 피기백 벡터를 개별 구성요소에 대해 PCR로 시험하고, 예상 크기의 산물을 표시하였다.
EGFP에 융합시킨 거미 실크 단백질을 암호화하는 피기백 벡터 각각을 대상으로 누에나방 실크 분비샘에서 EGFP 발현을 유도하는 능력을 분석하여 기능적으로 평가하였다. 간단히 말하면, 실크 분비샘을 누에로부터 절개하고, 피기백 DNA(또는 대조군)로 코팅된 텅스텐 입자로 분비샘을 포격하기 위하여 입자 총을 이용하였다. 그런 다음, 폭격된 조직을 배양 배지의 그레이스 배지에서 배양하고, 이틀 내지 사흘 후, 실크 분비샘을 대상으로 EGFP 발현을 조사하는 데 동료 실험실에서 사용 가능한 EGFP 형광을 구비한 해부 현미경을 이용하였다. 각 벡터는 EGFP 형광을 유도하는 것으로 나타났다.
EGFP 삽입이 있는, 그리고 EGFP 삽입이 없는, 거미 4와 거미 6을 암호화하는 네 개의 피기백 벡터 세트를 형질전환 누에를 생산하는 데 이용하였다.
실시예 5 - 형질전환 누에의 분리
일반적으로, 누에 형질전환은 피기백 벡터와 피기백 유전자 전위효소를 암호화하는 헬퍼 플라스미드의 혼합물을 누에씨에 미세 주사하여 전배반엽 배아에 도입하는 단계를 포함한다. 전배반엽 형성은 알을 낳은 후 4시간 동안 일어나지 않는다. 따라서, 배아 수집과 주사는 상대적으로 긴 시간에 걸쳐 실온에서 이루어질 수 있다. 미세 주사의 기술적 장벽은 난막에 구멍을 뚫을 필요가 있다는 점인데, 난막은 단단한 장벽을 지닌다. Tamura와 동료들은 날카로운 텅스텐 바늘로 난막에 구멍을 뚫은 다음, 그 결과로 생겨난 구멍으로 유리 모세관 주사 바늘을 정확하게 도입함으로써, 누에를 대상으로 하는 미세 주사 기법을 완성시켰다. 이것은 이제 상대적으로 일상적인 절차가 되었으며, 조정된 에펜도르프 로봇식 바늘 조작기로 난막에 구멍을 뚫고, 텅스텐 바늘을 제거하고, 유리 모세관을 삽입하여, DNA 용액을 주사한다. 그런 다음, 누에씨를 크레이지 글루(Krazy glue) 작은 방울을 이용하여 다시 봉하고, 유충이 부화할 때까지 28℃와 70% 습도의 정상적인 사육 조건 하에서 유지시킨다. 그런 다음, 살아 남은 주사된 곤충을 교미시켜, DS-적색 눈 표지의 발현을 기초로 하여, 추정상의 형질전환체를 후속적으로 식별하기 위한 F1 세대 배아를 발생시킨다. 그런 다음, 이 방법에 의해 식별된 추정상의 수컷과 암컷 형질전환체를 교미시켜, 더욱 상세한 유전자 분석을 위한 동형 계통을 생산하였다.
구체적으로, 현재 프로젝트를 위한 누에 형질전환은 피기백 벡터와 헬퍼 플라스미드 DNA의 혼합물을 투명한 큐티클의 누에 돌연변이인 누에나방 pnd-wl의 알에 주사하는 단계를 포함하였다. 이 돌연변이 누에는 Tamura 등(2000)이 기술하였고, 이 참조는 특별히 본원에 참조로서 통합된다. 이 돌연변이는 형광 유전자를 이용한 스크리닝을 훨씬 용이하게 만드는 멜라닌화 결핍증을 가지고 있다. 일단 적색 눈의 추정상의 F1 형질전환체가 식별되면, 동형 계통이 확립되고, 진정한 형질전환체는 실크 분비샘 단백질과 채취된 고치 실크의 웨스턴 블로팅을 이용하여 확인하였다.
실시예 6. 형질전환 누에에 의한 키메라 거미 실크 /누에 생산 분석
누에 실크 분비샘 단백질 내용물과 형질전환 누에 고치의 실크 단백질을 거미 실크 특이 항체를 이용한 웨스턴 블로팅에 의해, 형질전환 누에 실크를 대상으로 거미 실크 키메라 단백질의 존재를 분석하였다. 두 경우에서 모두 형질전환 누에는 키메라 단백질을 생산하는 것으로 확인되었고, 차등 추출 실험 결과는 이들 단백질이 고치의 형질전환 실크 섬유의 필수 성분임을 보여주었다.
나아가, 형광 해부현미경을 이용한 실크 분비샘 또는 실크 섬유의 직접적인 조사에 의해, 키메라 녹색 형광 단백질 융합체 각각의 발현이 실크 분비샘과 섬유 모두에서 명백한 것으로 나타났다(도 7). 대부분의 경우에서, 섬유의 형광 단백질의 양은 정상적인 조명 하에서 고치를 녹색으로 가시화할 수 있을 정도로 많았다.
실시예 7. 피기백 벡터 설계
피기백은 누에를 효율적으로 형질전환시키는 데 이용될 수 있기 때문에4 , 11, 43, 이번 프로젝트를 위해 선택한 벡터였다. 본 프로젝트에 이용된 구체적인 피기백 벡터는 몇 가지 중요한 특질을 가지고 있는 유전자를 전달하고자 설계되었다. 도 17에서 강조된 바와 같이, 이것들은 후측 실크 분비샘으로 외래 거미 실크 단백질의 발현을 목표로 하는 누에나방 피브로인 중쇄(fhc) 프로모터91 , 92 및 발현 수준을 증가시키고 외래 실크 단백질의 섬유로의 어셈블리를 촉진하는 fhc 인핸서93를 포함하였다. 피기백 벡터는 또한 탄성 (GPGGA)8 모티프와 강도(링커-알라닌8) 모티프 모두가 있는, 상대적으로 큰, 합성 거미 실크 단백질인 A2S814 (도 17a)를 암호화하였다. 합성 거미 실크 단백질 서열은 누에나방 fhc 단백질의 N 말단 도메인과 C 말단 도메인을 암호화하는 서열 내에 포함시켰다(도 17b 내지 도 17c). 이러한 키메라 누에/거미 실크 설계는, 이전에 누에나방 실크 분비샘 내의 발생기의 내인성 실크 섬유 내에 외래 단백질을 직접적으로 통합하는 데, 그리고 복합 실크 섬유91 , 92를 생산하는 데 이용되었다.
이번 연구에서 구축된 피기백 벡터 중 하나는 키메라 누에/거미 실크 단백질 하나만 암호화했으나(도 17b), 다른 것은 N 말단 강화된 녹색 형광 단백질(EGFP) 태그가 있는 이 같은 단백질을 암호화했다(도 17c). 후자의 구조체는 형질전환된 자손에 의해 생산된 실크 섬유의 분석을 촉진하였고, 또한, 본원에 기술한 바와 같이, 실크 분비샘에서 키메라 거미 실크 단백질 발현을 조사하기 위한 예비적인 생체 외 실크 분비샘 포격 분석에 이용되었다.
방법:
누에나방 P50/다이조 계통의 실크 분비샘으로부터 분리된 게놈 DNA와 도 17에 도시된 유전자 특이적 프라이머를 이용한 중합효소 연쇄반응(PCR)에 의해 몇 가지 유전자 절편이 분리되었다. 이들 절편은 fhc 주요 프로모터 및 상류 인핸서 요소(MP-UEE), fhc 기초 프로모터(BP)의 두 가지 버전 및 서로 다른 5'- 및 3'-측면 제한부위가 있는 N 말단 도메인(NTD; 엑손 1/인트론 1/엑손 2), fhc C 말단 도메인(CTD; 3'- 코딩 서열 및 폴리아데닌 신호), 및 EGFP를 포함하였다. 각각의 경우에서, 증폭 산물은 겔 정제되었고, 예상 크기의 DNA 절편을 절단하여 회수하였다. 그 다음으로, fhc MP-UEE, fhc CTD, 및 EGFP 절편을 pSLfal l80fa (pSL)(Y. Miao)로 클로닝하고, 두 가지 서로 다른 NTD 절편을 pCR4-TOPO(Invitrogen Corporation, 미국 캘리포니아 주 칼즈배드)로 클로닝하였으며, 올바른 증폭 산물을 함유하는 대장균 형질전환체를 제한효소 지도 작성에 의해 식별하고, 서열분석으로 확인하였다.
그런 다음, 이들 절편을 다음과 같이 이번 연구에 이용된 피기백 벡터를 조립하는 데 이용하였다. 합성 A2S814 거미 실크 서열을 pBluescript SKII+ 플라스미드 전구체(F. Teule 및 R.V. Lewis)로부터 BamHI 및 BspEI로 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL 중간 플라스미드 내의 CTD 상류의 상응하는 부위에 서브클로닝 하였다. 이 단계로부터 pSL-spider6-CTD라는 플라스미드를 얻었다. 그런 다음, NotI/BamHI 절편을 위에서 기술한 pCR4- TOPO-NTD 중간 플라스미드 중 하나로부터 절단하고, 겔 정제하고, 회수하여, pSLspider 6-CTD 내의 거미 6-CTD 서열 상류의 상응하는 부위로 서브클로닝 하여, pSL-NTD- spider 6-CTD를 생산하였다. 동시에, 위에서 기술한 다른 pCR4-TOPO-NTD 중간 플라스미드로부터 NotI/XbaI 절편을 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL-EGFP 중간 플라스미드 내의 EGFP 앰플리머 상류의 상응하는 부위로 서브클로닝 하였다. 이것은 NotI 및 BamHI로 절단되어, pSL-spider 6-CTD 내의 거미 6-CTD 상류의 상응하는 부위로 서브 클로닝된 NTD-EGFP 절편을 함유하는 플라스미드를 생산하였다. 그런 다음, MP-UEE 절편을 위에서 기술한 pSL 중간 플라스미드로부터 SfiI 및 NotI로 절단하여, 겔 정제하고, 회수하여, 위에서 기술한 두 가지 서로 다른 중간 pSL 플라스미드 내의 NTD-spider 6-CTD와 NTD-EGFP-spider 6-CTD 서열의 상류에 있는 상응하는 부위로 서브클로닝 하였다. 최종적으로, 완전히 조립된 MP-UEE-NTD-A2S814-CTD 또는 MP-UEE-NTD-EGFP-A2S814-CTD 카세트를 각각의 최종 pSL 플라스미드로부터 AscI과 FseI으로 절단하고, pBAC[3XP3-DsRedaf]98의 상응하는 부위로 서브클로닝 하였다. 이러한 최종 서브클로닝 단계에서 EGFP 표지의 부재 또는 존재를 나타내기 위하여, 거미 6과 거미 6-EGFP라고 지칭한 두 가지 별도의 피기백 벡터를 얻었다. 이들 벡터를 아래에 기술한 바와 같이 생체 외 실크 분비샘 포격 분석 및 누에 형질전환에 이용하였다.
결과:
생체 외 분석 결과는 GFP 태그를 붙인 키메라 누에/거미 실크 단백질을 암호화하는 피기백 벡터는 후측의 실크 분비샘 영역에 녹색 형광을 유도하였음을 보여주었다. GFP 특이적인 항체를 이용한 면역학적 블로팅 분석은 추가적으로 포격된 실크 분비샘이 약 116kDa의 겉보기 분자량(Mr)을 나타내는 면역반응성 단백질을 함유하였음을 입증하였다. 예상(106kDa)보다 아주 약간 큰, 이러한 결과는 본 피기백 벡터의 기본 설계를 확인시켜 주었으며, 이러한 구조체를 이용하여 형질전환 누에의 분리를 유도하였다.
실시예 8. 형질전환 누에 분리
각 피기백 벡터를 피기백 유전자 전위효소를 암호화하는 플라스미드와 혼합하고, 혼합물을 누에나방 pnd-wl43으로부터 분리된 알에 독립적으로 미세 주사하였다. 이 누에 계통은 투명한 큐티클 표현형을 가져오는 멜라닌화 결핍증을 가지고 있어서, 형질전환체 내의 EGFP 태그가 부착된 키메라 누에-거미 실크 단백질의 검출을 촉진하므로, 이 누에 계통을 이용하였다. 각 피기백 벡터에 포함된 신경 특이적인 3XP3 프로모터27 제어 하에 DS-적색의 발현으로부터 비롯하는 적색 눈 표현형에 의해 추정상의 F1 형질전환체를 조기에 식별하였다(도 17d). 이러한 동물들을 방법에서 기술하는 바와 같이, 형질전환에 이용된 피기백 벡터를 표시하는 거미 6 및 거미 6-GFP라고 표시된, 몇 가지 동형 형질전환 누에 계통을 확립하는 데 이용하였다.
방법:
생체 외 실크 분비샘 포격 분석
오령 3일째에 들어가는 살아있는 누에나방 pnd-wl 계통 누에를 수 초 동안 70% 에탄올에 침지하여 멸균시키고, 0.7% w/v NaCI에 위치시켰다. 그런 다음, 전체 실크 분비샘을 각 동물로부터 무균적으로 절개하여, 항생제가 첨가된 그레이스 배지를 함유하는 페트리접시로 옮겼으며, DNA 포격 과정에 앞서 실크 분비샘을 그곳에 보유되도록 하였다. 동시에, 텅스텐 미세입자(1.7㎛ M-25 마이크로캐리어; Bio-Rad Laboratories, 미국 캘리포니아 주 허큘러스)를 다음과 같이 포격을 위한 DNA로 코팅하였다. 제조사의 지시에 따라 미세입자를 전처리하고, -20℃에서 50% 글리세롤에 3mg/50㎕의 분취량으로 보유하였다. 각 포격 실험 직전에, 3mg 미세입자 분취량을 제조사의 지시에 따라, 해당 피기백 DNA 5㎍으로 최대 부피 5㎕로 코팅하였다. 일부 미세입자 분취량은 DNA-음성 대조군으로 이용하고자 증류수로 코팅하였다. 각 포격 실험은 6회의 반복 검증을 포함하였으며, 각각의 개별적인 포격은 한 쌍의 온전한 실크 분비샘을 포함하였다. 포격을 위해, 분비샘을 유지 상태로부터 1% w/v 멸균 한천을 함유하는 90mm 페트리접시 위의 그레이스 배지에 옮겼으며, 페트리접시는 Bio-Rad Biolistic® PDS-1000/He 입자 전달 시스템 챔버 내에 위치시켰다. 챔버를 Hg에서 20 ~ 22로 비우고, 이전에 기술된 바와 같이26, 6cm의 거리에서 1,100psi의 헬륨 압력을 이용하여 입자 공급원으로부터 목표 조직까지 실크 분비샘을 미리 코팅된 텅스텐 미세입자로 포격하였다. 포격 후, 실크 분비샘을 2X 항생제가 첨가된 그레이스 배지를 함유하는 신선한 페트리 플레이트 내에 위치시키고, 28℃에서 배양하였다. 거미 6-GFP 피기백 벡터에서 EGFP 표지의 일과성 발현을 포격 후 48시간 및 72시간에서 형광 현미경에 의해 평가하였다. 4.2X의 배율, 1/120초의 상 및 1/110초의 녹색 형광(캡쳐)에서 Olympus FSX100 현미경으로 이미지를 얻었다. 또한, EGFP 태그가 부착된, 그리고 부착되지 않은 키메라 누에/거미 실크 단백질의 일과성 발현을 아래에서 기술하는 바와 같이, EGFP 특이적 항혈청 또는 거미 실크 특이적 항혈청을 이용하여 포격된 실크 분비샘 추출물을 면역학적 블로팅하여 평가하였다.
누에 형질전환
pnd-wl 나방이 알을 낳고 1시간 후에 알을 수집하여 현미경 슬라이드 위에 정렬하였다. 벡터와 헬퍼 플라스미드를 각각 0.2㎍/㎕의 최종 농도로 주사 완충액(0.1mM 인산 나트륨, 5mM KCl, pH 6.8)에 재현탁시키고, 월드 프레시젼 인스트루먼트 PV820 압력 조절기(World Precision Instruments PV820 pressure regulator, 미국), 수루가 세이키 M331 마이크로조작기(Suruga Seiki M331 micromanipulator, 일본), 및 나리시게 HD-21 더블 피펫 홀더(Narishige HD-21 double pipette holder, 일본)으로 이루어진 주사 시스템을 이용하여 1~5nl를 각 전배반엽 누에 배아에 주사하였다. 구멍 뚫린 알을 헬핑 핸드 슈퍼 글루 겔(Helping Hand Super Glue gel, The Faucet Queens, Inc., 미국)로 봉한 다음, 배아 발달을 위해 25℃와 70% 습도의 생장 챔버에 위치시켰다. 부화 후, 유충을 인공 사료(Nihon Nosan Co., 일본)로 사육하고, 동일 계통 내 형매 교배에 의해 후속 세대를 얻었다. 형질전환 자손은 550nm와 700nm 사이의 필터가 있는 올림푸스 SXZ12 현미경(일본 도쿄)을 이용하여, DsRed 형광 눈 표지의 존재에 의해 잠정적으로 식별하였다.
결과:
특수한 EGFP 자극 없이, 백색 조명 하에서의 육안 검사에 의해서도 거미 6-GFP 형질전환체에 의해 생산된 고치에서 EGFP 발현이 관찰되었다(도 18a). 이들 동물로부터 실크 분비샘(도 18b 내지 도 18c)과 고치(도 18d)를 형광 현미경으로 조사하였을 때, 강력한 EGFP 발현도 관찰되었다. 고치는 통합된 EGFP 신호가 있는 적어도 일부 실크 섬유를 포함하는 것으로 보였다. EGFP 특이적 항혈청 및 거미 실크 단백질 특이적 항혈청을 이용하여, 실크 분비샘과 고치 추출물을 면역학적 블로팅하여, 거미 6-GFP 실크 분비샘과 고치에서 EGFP 태그가 부착된 키메라 누에/거미 실크 단백질의 발현을 확인하였다(도 19). 거미 실크 단백질 특이적인 항혈청을 이용한 면역학적 블로팅에 의해, 거미 6 실크 분비샘과 고치 추출물에서 비슷한 결과가 얻어졌다(도 19). 이러한 결과는 본 발명자들이 EGFP 태그가 부착된 또는 부착되지 않은 형태의 키메라 누에/거미 실크 단백질을 암호화하는 형질전환 누에를 성공적으로 분리하였다는 것과 이들 단백질이 형질전환 동물에 의해 생산된 실크 섬유와 관련이 있다는 것을 보여주었다.
실시예 9. 복합 실크 섬유의 분석
키메라 누에/거미 실크 단백질과 형질전환 누에가 생산한 복합 실크 섬유와의 연관성을 분석하기 위하여 연속적인 단백질 추출 접근법을 이용하였다. 느슨하게 회합된 세리신 층을 제거한 후, 고무질을 제거한 실크 섬유를 방법에 기술하는 바와 같이, 점차 강해지는 일련의 추출과정의 대상으로 하였다.
방법:
누에고치 단백질의 연속 추출
양친 누에와 형질전환 누에가 생산한 고치를 채취하고, 고치를 물질:용매 비율을 1:50(w/v)으로 하여, 85℃에서 15분 동안 0.05% (w/v) Na2C03에 살살 교반시켜 세리신 층을 제거하였다40. 고무질을 제거한 실크를 욕(bath)으로부터 제거하고, 조심스럽게 교반하면서 그리고 동일한 물질 대 용매 비율로 하여 뜨거운(50~60℃) 물로 2회 세척하였다. 그런 다음, 고무질을 제거한 실크 섬유를 동결 건조하여, 세리신 층 제거 효율을 추정하고자 무게를 측정하였다. 고무질을 제거한 섬유는 다음과 같이, 반드시 꾸준히 교반되도록 혼합 휠(mixing wheel) 상에 회전시키면서 연속 단백질 추출 프로토콜에 이용하였다. 고무질을 제거한 실크 섬유 30mg을 4℃에서 16시간 동안 1ml의 인산 완충 식염수(PBS; 137mM NaCl, 2.7mM KC1, 10mM Na2P04, 1.8mM KH2P04)로 처리하였다. 물질을 원심분리에 의해 불용성 분획과 가용성 분획으로 분리하고, PBS 가용성 분획으로, 상등액을 제거하여 -20℃로 유지시키고, 펠릿은 다음 추출의 대상으로 하였다. 이 펠릿을 2% (w/v) SDS 1ml에 재현탁시키고, 실온에서 16시간 동안 배양하였다. 다시, 물질을 원심분리에 의해 불용성 분획과 가용성 분획으로 분리하고, SDS 가용성 분획으로, 상등액을 제거하여 -20℃로 유지시키고, 펠릿은 다음 추출의 대상으로 하였다. 이 펠릿을 2% (v/v) β-메르캅토에탄올을 함유하는 9M LiSCN 1ml에 재현탁시키고, 실온에서 16~48시간 동안 배양하였다. 원심분리 후, 9 M LiSCN/BME 가용성 분획으로 상등액을 -20℃로 유지시켰다. 이 단계에서 얻어진 최종 펠릿을 5% (v/v) BME를 함유하는 16M LiSCN 1ml에 재현탁시키고, 실온에서 약 1시간 동안 배양하였다. 그 결과, 완전한 용해가 이루어져 최종 추출물을 생산하였는데, 최종 추출물은 면역학적 블로팅이 수행될 때까지 16M LiSCN/BME 가용성 분획으로 -20℃에서 유지되었다.
실크 단백질 분석
생체 외 포격 분석의 실크 분비샘과 미처리 양친 누에 및 형질전환 누에의 실크 분비샘을 얼음 위에서 1% (w/v) SDS와 5M 우레아를 함유하는 인산 나트륨 완충액(30 mM Na2P04, pH 7.4)에 균질화시킨 다음, 4℃의 마이크로원심분리기에서 13,500rpm으로 5분간 정화시켰다. 상등액을 실크 분비샘 추출물로서 채취하고, 이들 추출물과 위에서 기술한 연속 고치 추출물을 10 mM Tris-HCl/2 SDS/5 BME 완충액으로 4배 희석시키고, 약 90㎍의 총 단백질을 함유하는 시료를 SDS-PAGE 로딩 완충액과 1:1로 혼합하여, 95℃에서 5분간 끓인 후, 4~20% 구배율의 겔(Pierce Protein Products; 미국 일리노이 주 록포드) 상으로 로딩하였다. 분리 후, 바이오 래드 트랜스퍼 셀(Bio-Rad transfer cell)을 이용하여 제조사의 지시에 따라 단백질을 겔로부터 PVDF 막(ImmobilonTM; Millipore, 미국 매사추세츠 주 빌러리카)으로 옮겼다. 1차 항체로서 네필라 클라비페스 편모상 실크 유사 A2 펩티드(GenScript Corporation, 미국 뉴저지 주 피스카타웨이) 또는 상업용 EGFP 특이적 마우스 단일클론항체(Living Colors® GFP, Clontech Laboratories, 미국 캘리포니아 주 마운틴뷰)에 대항하여 생산된 거미 실크 단백질 특이적인 다클론성 토끼 항혈청을 이용하여 면역검출법을 수행하였다. 2차 항체는 각각 염소 항토끼 IgG-HRP(Promega Corporation, 미국 위스콘신 주 매디슨) 또는 염소 항마우스 IgG H+L HRP 콘쥬게이트(EMD Chemicals, 미국 뉴저지 주 깁스타운)였다. 모든 항체는 표준 블로킹 완충액(lx PBST/0.05% 탈지분유)에 1:10,000의 희석배율로 이용하였고, 항체-항원 반응은 상업용 키트(ECLTM Western Blotting Detection Reagents; GE healthcare)를 이용하여 화학발광에 의해 시각화하였다.
결과:
이 과정의 각 단계 이후, 가용성 분획과 불용성 분획을 원심분리에 의해 분리하였고, 가용성 분획은 면역학적 블로팅을 위해 보유하였으며, 불용성 분획은 다음 추출에 이용하였다. 최종 추출 용매는 나머지 실크 섬유를 완전히 용해시켰다. 면역학적 블로팅 제어는 거미 실크 단백질 특이적인 항혈청은 pnd-wl 실크 섬유의 어떠한 단백질도 인식하지 못하였지만(도 19b, 3~6번 레인), 대장균에서 생산된 키메라 누에/A2S814 거미 실크 단백질은 인식하였음을 확인시켜 주었다(도 19b, 2번 레인). 형질전환 동물로부터 고무질을 제거한 고치를 식염수(도 19b, 8번과 13번 레인), SDS(도 19b, 9번과 14번 레인) 및 8M LiSCN/2 β-메르캅토에탄올(도 19b, 10번과 15번 레인)을 이용하여 연속 추출한 결과, 임의의 검출할 수 있는 면역반응성 단백질을 방출시키지 못했다. 그러나, 16M LiSCN/5% β-메르캅토에탄올로 나머지 실크 섬유를 후속 추출하자 나머지 거미 6(도 19, 11번 레인)으로부터 약 106kDa Mr의 면역반응성 단백질과 나머지 거미 6-GFP 섬유(도 19, 16번 레인)로부터 약 130 및 약 110kDa의 두 가지 면역반응성 단백질이 방출되었다. 이들 단백질 모두는 예상(거미 6는 78kDa, 거미 6-GFP는 106kDa)보다 컸다. 이러한 차이에 대한 가능성 있는 해명은 거미 실크 서열의 고반복 속성, SDS-PAGE 상에서의 단백질 산물의 이례적인 이동 및/또는 키메라 누에/거미 실크 단백질의 번역 후 변경으로 말미암은 전사/번역 '말더듬기(stuttering)'을 포함한다. 면역학적 블로팅에서 양성 대조군이었던, 대장균에서 생산된 키메라 누에/A2S814 거미 실크 단백질도 예상(60kDa)보다 큰 Mr(약 75kDa)을 나타냈다. 두 가지 형질전환 누에 계통의 고무질을 제거한 고치로부터 얻어진 16M LiSCN/5% β-메르캅토에탄올 추출물 또한 약 40 내지 약 75kDa의 Mr을 나타내는 면역반응성 자국을 포함하여, 아마도 키메라 누에/거미 실크 단백질의 분해 및/또는 미성숙 번역 종결을 반영하였다. 이식 유전자 산물의 크기 또는 그것들의 출현 이유와 상관없이, 연속 추출 결과는 본원에 기술된 바와 같이 제공된 형질전환 누에가 복합 실크 섬유로 극히 안정적으로 도입되는 키메라 누에/거미 실크 단백질을 발현하였음을 명백히 입증하였다.
실시예 10. 복합 실크 섬유의 기계적 성질
형질전환 누에가 생산한 복합 실크 섬유의 고무질이 제거된 천연 및 복합 실크 섬유의 기계적인 성질이 여기에서 기술된다.
시험을 위한 복합 실크 섬유의 제조방법 및 시험 수행방법이 아래 방법에 제시되어 있다.
방법:
기계적 시험에 이용된 고무질이 제거된 누에 실크 섬유는 19mm의 초기 길이(L0)를 나타냈다. 표준 50N 셀과 맞춤 제작된 10g 로드 셀(Transducer Techniques, 미국 캘리포니아 주 테메큘라)가 장착된 MTS 시너지 100 시스템(MTS Synergie 100 system; MTS Systems Corporation, 미국 미네소타 주 에덴 프레리)을 이용하여, 주위 조건(20~22℃와 19~22% 습도)에서 단일 섬유 시험을 수행하였다. 응력 및 변형 값의 계산을 허용하는, 5mm/min의 변형율과 250MHz의 주파수에서 TestWorks® 4.05 소프트웨어(MTS Systems Corporation, 미국 미네소타 주 에덴 프레리)로 두 개의 로드 셀로부터 기계적 데이터(로드 및 신장도)를 기록하였다. 인성(또는 파괴 에너지), 영률(초기 견고성), 최대 응력 및 최대 신장률(=최대 % 변형율)을 결정하기 위하여 MATLAB(7.1버전)을 이용하여 각 섬유에 대해 수집된 데이터 세트로부터 응력/변형 곡선을 그렸다.
결과:
결과는 EGFP 태그가 부착된 또는 부착되지 않은 키메라 누에/거미 실크 단백질을 함유하는 고무질이 제거된 복합 섬유는 pnd-wl 누에의 천연 섬유보다 상당히 큰 신장성과 약간 향상된 강도 및 견고성을 나타냈음을 입증하였다(표 3 및 도 20). 표 3: 양친 및 형질전환 누에가 생산한 12~15개 실크 섬유의 기계적 성질을 온도, 습도 및 시험 속도를 정확하게 매치시킨 조건 하에서 측정하였으며, 평균값과 표준오차를 표에 나타내었다. 비교를 위해, 정확하게 동일한 조건 하에서 동시에 결정한 거미(네필라 클라비페스) 드래그라인 실크 섬유의 평균적인 기계적 성질을 포함시켰다.
Figure pct00003
양친 누에와 형질전환 누에가 생산한 12~15개 실크 섬유의 기계적 성질을 측정하여, 평균값과 표준오차를 표에 나타내었다. 비교를 위해 동일한 조건 하에서 결정한 거미(네필라 클라비페스) 드래그라인 실크 섬유의 최적의 기계적 성질을 포함시켰다.
따라서, 이들 복합 섬유는 천연 누에 실크 섬유보다 질기다. 형질전환 누에가 생산한 복합 실크의 기계적 성질은 양친 계통이 생산한 천연 섬유의 그것들보다 훨씬 더 가변적이었다. 또한, 두 가지 서로 다른 거미 6-GFP 계통이 생산한 복합 섬유는 비슷한 신장성을 나타냈지만, 상이한 인장 강도를 나타냈다. 개별적인 형질전환 계통 내에서의 복합 실크 섬유의 기계적 성질에서 관찰된 변이와 계통별 변이는 복합 섬유 내 이질성을 반영할 수 있고, 이질성은 키메라 누에/거미 실크 단백질 비율 및/또는 섬유를 따라 이들 단백질이 위치하는 것의 차이로부터 비롯될 수 있다. 도 18d에서 복합 섬유 내 이질성의 증거를 볼 수 있다. 형질전환 누에로부터 얻어진 복합 섬유, 양친 누에로부터 얻어진 천연 섬유, 그리고 대표적인 드래그라인 거미 실크 섬유에 대해 관찰한 최고의 기계적 성능을 비교한 것을 도 20에 나타내었다. 결과는 모든 복합 섬유가 pnd-wl 누에로부터 얻어진 천연 실크 섬유보다 질기다는 점을 보여주었다. 또한, 형질전환 거미 6-GFP 4번 계통 누에로부터 얻어진 복합 섬유는 같은 조건 하에서 시험한 천연 거미 드래그라인 실크 섬유보다 훨씬 질겼다. 이러한 결과는 키메라 누에/거미 실크 단백질의 도입이 형질전환 누에 플랫폼을 이용하여 생산된 복합 실크 섬유의 기계적 성질을 상당히 향상시킬 수 있음을 보여준다.
천연 누에(pnd-wl)와 거미(N. 클라비페스 드래그라인) 실크 섬유에 대해 측정한 최고의 기계적 성능을 형질전환 누에가 생산한 복합 실크 섬유에 대해 얻은 값과 비교하였다. 모든 섬유는 동일한 조건에서 시험하였다. 최대 인성값은 누에 pnd-wl(청색선, 43.9MJ/m3), 거미 6, 7번 계통(주황색선, 86.3MJ/m3), 거미 6-GFP, 1번 계통(암록색선, 98.2MJ/m3), 거미 6-GFP, 4번 계통(밝은 녹색선, 167.2MJ/m3) 및 N. 클라비페스 드래그라인(적색선, 138.7MJ/m3)이었다(표 3 참조).
실시예 11. 안정적으로 도입된 키메라 누에/거미 실크 단백질을 함유하는 복합 섬유
거미 실크는 여러 가지 서로 다른 응용을 위한 생체적합물질로서 방대한 용도를 가지고 있다. 이전에는, 거미 농업에 대한 심각한 장애물이 예를 들어, 천연 제조 노력을 제대로 기능하지 못하게 했었다. 거미 실크 섬유 생산을 위하여 효율적인 생명공학적 접근법을 개발해야 하는 필요성은 본 발명에 제공된 플랫폼에 제시되어 있다. 다른 플랫폼이 재조합 거미 실크 단백질 제조용으로 기술되어 있었지만, 이러한 단백질을 유용한 섬유로 효율적으로 처리하는 것은 어려웠다. 단백질이 아니라 섬유를 제조해야 하는 필요성은 누에를 이러한 특정 생명공학적 응용을 위하여 자격을 갖춘 플랫폼으로 자리잡게 한다.
누에나방 세리신(Ser1) 프로모터의 전사적 제어 하에 천연 네필라 클라비페스 주요 팽창 스피드로인-1 실크 단백질을 암호화하는 피기백 벡터를 이용하여, 거미 실크 단백질을 생산하도록 유전자 조작된 형질전환 누에를 분리하였다. 스피드로인 서열을 C 말단 fhc 펩티드를 암호화하는 하류 서열에 융합시켰다. 이러한 피기백 구조체를 이용하여 분리된 형질전환 누에는 키메라 누에/거미 실크 단백질을 함유하는 고치를 생산하였지만, 이 단백질은 느슨하게 회합된 세리신 층에서만 발견되었다. 반대로, 본 발명에 의한 형질전환 누에가 생산한 키메라 누에/거미 실크 단백질은 복합 섬유의 필수 구성요소였다. 다른 것들에 의해 설계된 키메라 누에/거미 실크 단백질의 상대적으로 느슨한 회합은 다른 것들 중에서도 N 말단 누에 fhc 도메인의 부재를 반영할 수 있다. 대안적으로, Ser1 프로모터는 중간의 실크 분비샘에서 전사적으로 활성을 나타내지만, 각각 fhc, 피브로인 경쇄 및 헥사메린 단백질 발현을 제어하는 fhc 프로모터, flc 프로모터 및 fhx 프로모터는 후측의 실크 분비샘에서 활성을 나타내므로, 피기백 벡터 내에 Ser1 프로모터를 이용하는 것은 다른 것들 중에서도 적당한 섬유 어셈블리와 일관되지 않을 수 있다. 섬유 내로의 누에 실크 단백질의 조립은 어느 정도는 실크 유전자 발현의 조밀한 공간적 및 시간적 조절에 의해 제어된다. 따라서, 새롭게 조립된, 복합 실크 섬유로의 키메라 단백질의 안정적인 통합을 촉진하기 위하여, 현재 개시되는 벡터는 천연 실크 단백질과 동일한 장소에서 그리고 동시에 키메라 누에/거미 실크 단백질의 축적을 추진하는 fhc 프로모터로 유전자 조작된다. 다른 것들은 일부 형질전환 누에가 생산한 고치로부터 얻어진 섬유의 탄성 및 인장 강도에서 소량의 증가를 만들어냈다. 그러나, 기계적 시험 전에 세리신 층이 제거되지 않았고, 이러한 고무질 제거 단계는 상업용 실크 섬유 생산을 위한 고치의 처리에서 필수적이다. 따라서, 고치가 종래의 방식으로 처리되었다면, 재조합 거미 실크/누에 단백질은 제거되며, 그 결과로 얻어지는 실크 섬유는 향상된 기계적 성질을 가질 것으로 예상되지 않을 것이다.
거미 실크 단백질을 생산하는 형질전환 누에는 헥사플루오로 용매에 용해시킨 실크 단백질로부터 섬유의 재생에 초점을 둔 다른 연구에서 상대적으로 소수의 구성요소로 보고되었다. 그럼에도, 본 연구는 네필라 클라비페스 주요 팽창 스피드로인-1 또는 편모상 실크 단백질로부터 극히 짧은, 합성형의, "실크 유사" 서열을 암호화하는 피기백 벡터로 생산한 두 가지 형질전환 누에를 기술하였다. 두 가지 실크 유사 펩티드는 N 말단과 C 말단의 fhc 도메인 내에 포함시켰다. 기계적 시험 결과, 이들 형질전환 동물이 생산한 실크 섬유는 약간 큰 인장 강도(41~73MPa)를 나타냈으며, 탄성에는 아무런 변화가 없었다. 연구진은 또한 그것들의 복합 섬유의 기계적 성질에서 관찰되는 상대적으로 작은 변화가 낮은 수준의 재조합 단백질 도입을 반영하였다고 보고한다. 그러한 구조체에 사용되는 특정 거미 실크 유사 펩티드 서열 및/또는 그것들의 작은 크기가, 형질전환 누에가 생산한 복합 섬유의 기계적인 성질의 상대적으로 작은 변화를, 적어도 어느 정도는 설명할 수 있다는 것 역시 가능하다.
본 발명의 형질전환 누에 및 복합 섬유는, 기계적인 성질을 상당히 향상시키는, 안정적으로 통합된 키메라 누에/거미 실크 단백질을 함유하는, 복합 실크 섬유를 생산하는 형질전환 누에 계통을 획득할 수 있는 최초의 것이다. 본 발명의 형질전환 누에 계통이 생산한 복합 거미 실크/누에 섬유는 천연 드래그라인 거미 실크 섬유보다 훨씬 더 질겼다. 다른 요인 중에서도, 이는 적어도 어느 정도는, 반복적인 편모상 유사 (GPGGA)4 탄성 모티프 및 주요 팽창 스피드로인-2 [링커-알라닌8] 결정형 모티프를 암호화하는 2.4kbp A2S814 합성 거미 실크 서열을 이용하였기 때문일 수 있다. 이렇게 상대적으로 큰 합성 거미 실크 단백질은 대장균에서 생산된 후 압출에 의해 섬유로 직조될 수 있으며, 이는 그것이 섬유로 조립할 수 있는 자연적인 능력을 보유하였음을 나타낸다. 그러나, 이 단백질은 서로 호응하여 발현되며, 실크 섬유로 도입되기 위해서는 내인성 누에 fhc, flc 및 fhx 단백질과 상호작용해야 한다. 따라서, A2S814 거미 실크 서열을 조립 공정을 안내하기 위하여 N 말단과 C 말단의 fhc 도메인 내에 포함시켰다. 내인성 누에 실크 단백질과 공간적으로 그리고 시간적으로 가깝게 발현을 추진하는 fhc 도메인의 능력과 함께, 이러한 특질들은, 복합 실크 섬유의 조립에 참여하고, 기계적인 성질에 상당히 이바지하는, 키메라 누에/거미 실크 단백질의 능력을 적어도 부분적으로는 설명할 수 있다.
실시예 12. 피기백 벡터 구조체 및 피기백 벡터 구성요소의 PCR 증폭
누에나방 P50/다이조 계통의 실크 분비샘으로부터 분리된 게놈 DNA와 표 4에 나타낸 유전자 특이적 프라이머를 이용한 중합효소 연쇄반응에 의해 몇 가지 유전자 절편을 분리하였다. 이들 절편은 fhc 주요 프로모터 및 상류 인핸서 요소(MP-UEE), fhc 기초 프로모터(BP)의 두 가지 버전 및 서로 다른 5'- 및 3'-측면 제한부위가 있는 N 말단 도메인(NTD; 엑손 1/인트론 1/엑손 2), fhc C 말단 도메인(CTD; 3' 코딩 서열 및 폴리아데닌 신호), 및 EGFP를 포함하였다. 각각의 경우에서, 증폭 산물은 겔 정제되었고, 예상 크기의 DNA 절편을 절단하여 회수하였다. 그 다음으로, fhc MP-UEE, fhc CTD, 및 EGFP 절편을 pSLfal l80fa로 클로닝하고, 두 가지 서로 다른 NTD 절편을 pCR4-TOPO(Invitrogen Corporation, 미국 캘리포니아 주 칼즈배드)로 클로닝하였으며, 올바른 증폭 산물을 함유하는 대장균 형질전환체를 제한효소 지도 작성에 의해 식별하고, 서열분석으로 확인하였다. 그런 다음, 이들 절편을 다음과 같이 이번 연구에 이용된 피기백 벡터를 조립하는 데 이용하였다. 합성 A2S814 거미 실크 서열을 pBluescript SKII+ 플라스미드 전구체로부터 BamHI 및 BspEL로 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL 중간 플라스미드 내의 CTD 상류의 상응하는 부위에 서브클로닝 하였다. 이 단계로부터 pSL-spider6-CTD라는 플라스미드를 얻었다. 그런 다음, NotI/BamHI 절편을 위에서 기술한 pCR4-TOPO-NTD 중간 플라스미드 중 하나로부터 절단하고, 겔 정제하고, 회수하여, pSLspider 6-CTD 내의 거미 6-CTD 서열 상류의 상응하는 부위로 서브클로닝 하여, pSL-NTD-spider 6-CTD를 생산하였다. 동시에, 위에서 기술한 다른 pCR4-TOPO-NTD 중간 플라스미드로부터 NotI/XbaI 절편을 절단하고, 겔 정제하고, 회수하여, 위에서 기술한 pSL-EGFP 중간 플라스미드 내의 EGFP 앰플리머 상류의 상응하는 부위로 서브클로닝 하였다. 이것은 NotI 및 BamHI로 절단되어, pSL-spider 6-CTD 내의 거미 6-CTD 상류의 상응하는 부위로 서브 클로닝된 NTD-EGFP 절편을 함유하는 플라스미드를 생산하였다. 그런 다음, MP-UEE 절편을 위에서 기술한 pSL 중간 플라스미드로부터 SfiI 및 NotI로 절단하여, 겔 정제하고, 회수하여, 위에서 기술한 두 가지 서로 다른 중간 pSL 플라스미드 내의 NTD-spider 6-CTD와 NTD-EGFP-spider 6-CTD 서열의 상류에 있는 상응하는 부위로 서브클로닝 하였다. 최종적으로, 완전히 조립된 MP-UEE-NTD-A2S814-CTD 또는 MP-UEE-NTD-EGFP-A2S814-CTD 카세트를 각각의 최종 pSL 플라스미드로부터 AscI과 FseI으로 절단하고, pBAC[3XP3-DsRedaf](Horn, et al. (2002), Insect Biochem. Mol. Biol., 32: 1221-1235)의 상응하는 부위로 서브클로닝 하였다. 이러한 최종 서브클로닝 단계에서 EGFP 표지의 부재 또는 존재를 나타내기 위하여, 거미 6과 거미 6-EGFP라고 지칭한 두 가지 별도의 피기백 벡터를 얻었다. 다음과 같은 표는 이용된 피기백 벡터의 주요 구성요소 중 일부의 목록을 제공한다.
Figure pct00004
실시예 13. masp 클로닝
본 실시예는 플라스미드 내에, 그리고 특히 pXLBacII ECFP 플라스미드 내의 NTD 영역을 함유하는 유전자 구조체를 제공하여 본 발명의 유용성을 입증한다.
pXLBacII ECFP 플라스미드와 함께 NTD 영역을 함유하는 잠재적인 양성 클론을 PCR을 이용한 콜로니 스크리닝에 의해 나타내었다.
pXLBacII-ECFP NTD CTD maspX 16(10,458bp)(도 12a) 및 pXLBacII-ECFP NTD CTD maspX24(11,250bp)(도 12b)에 대한 유전자 구조체 masp를 만들었다.
본 발명의 정신 및 범위로부터 벗어나지 않고 본 발명에 대한 다양한 수정 및 변경이 이루어질 수 있음은 본 발명이 속하는 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 따라서, 본 발명의 수정 및 변경이 첨부된 청구항 및 그것들의 균등물 범위 내에 해당되는 한, 본 발명은 본 발명의 수정 및 변경을 포괄하도록 의도되어 있다.
참고문헌
본 참고문헌은 이로써 참조로 본원에 특별히 통합된다.
1. Berghammer, A., Bucher, G., Maderspacher, F., and Klingler, M. (1999), Dev. Genes Evol., 209: 382-389.
2. Birnboim, H. C, and Doly, J. (1979), Nucl. Acids Res., 7: 1513-1523.
3. Brooks, A. E., Creager, M., and Lewis, R. V. (2005), Altering the Mechanics of Spider Silk Through Methanol Post-spin Draw. In "Biomedical Sciences Instrumentation", Vol. 41, pp. 1-6.
4. Cary, L. C, et al. (1989), Virology, 172: 156-169.
5. Choudary, P. V., Kamita, S. G., and Maeda, S. (1995), Expression of foreign genes in Bombyx mori larvae using baculovirus vectors. In "Baculovirus expression protocols" (C. D. Richardson, Ed.), Vol. 39, pp. 243-264. Humana Press, Clifton, N.J.
6. Colgin, M., and Lewis, R. V. (1998), Protein Science, 7: 667-672.
7. Denny, M. W. (1980), Symp. Soc. Exp. Biol., 34: 247-272.
8. Dooling, D. (2005), Growing your own spare parts: NASA assists ligament replacement research.
9. Elick, T. A., Bauser, C. A., Principe, N. M., and Fraser, M. J., Jr. (1996), Genetica, 97: 127-139.
10. Fahnestock, S. R., and Bedzyk, L. A. (1997), Appl. Microbiol. Biotechnol., 47: 33-39.
11. Fraser, M. J. (2000), The TTAA-specific family of transposable elements. In "Insect Transgenesis: Methods and Applications." (A. A. James, and A. H. Handler, Eds.). CRC Press, Orlando.
12. Fraser, M. J., Brusca, J. S., Smith, G. E., and Summers, M. D. (1985), Virology, 145: 356-361.
13. Fraser, M. J., Cary, L., Boonvisudhi, K., and Wang, H. G. (1995), Virology, 211: 397-407.
14. Fraser, M. J., Smith, G. E., and Summers, M. D. (1983), J. Virol., 47: 287-300.
15. Gatesy, J., Hayashi, C, Motriuk, D., Woods, J., and Lewis, R. (2001), Science, 291: 2603-2605.
16. Gosline, J. M., Denny, M. W., and DeMont, M. E. (1984), Nature 309: 551-552.
17. Handler, A. M., and Gomez, S. P. (1995), Mol. Gen. Genet., 247: 399-408.
18. Handler, A. M., and Gomez, S. P. (1996), Genetics, 143: 1339-1347.
19. Handler, A. M., and Harrell, R. A., 2nd (1999), Insect Mol. Biol., 8: 449-457.
20. Handler, A. M., and Harrell, R. A., 2nd (2001), Insect Biochem. Mol. Biol., 31: 199-205.
21. Handler, A. M., McCombs, S. D., Fraser, M. J., and Saul, S. H. (1998), Proc. Natl. Acad. Sci. U. S. A., 95: 7520-7525.
22. Hayashi, C. Y., and Lewis, R. V. (2000), Science, 287: 1477-1479.
23. Hayashi, C. Y., Shipley, N. H., and Lewis, R. V. (1999), Int. J. Biol. Macromol., 24: 271-275.
24. Hinman, M. B., and Lewis, R. V. (1992), J. Biol. Chem., 267: 19320-19324.
25. Holland, C, Terry, A. E., Porter, D., and Vollrath, F. (2006), Nat. Mater., 5: 870-874.
26. Horard, B., Mange, A., Pelissier, B., and Couble, P. (1994), Insect Mol. Biol., 3: 261-265.
27. Horn, C, Jaunich, B., and Wimmer, E. A. (2000), Dev. Genes EvoL, 210: 623-629.
28. Huemmerich, D., et al. (2004), Curr., Biol. 14: 2070-2074.
29. Imamura, M., et al. (2003), Genetics, 165: 1329-1340.
30. Inoue, S., et al. (2005), Insect Biochem. Mol. Biol., 35: 51-59.
31. Inoue, S., et al. (2000), J. Biol. Chem., 275: 40517-40528.
32. Lazaris, A., et al. (2002), Science 295: 472-476.
33. Lewis, R. V., et al. (1996), Prot. Expr. Purif., 7: 400-406.
34. Lobo, N., Li, X., and Fraser, M. J., Jr. (1999), Mol. Gen. Genet., 261: 803-810.
35. Maeda, S., et al. (1985), Nature, 315: 592-594.
36. Mori, K., et al. (1995). J. Mol. Biol. 251: 217-228.
37. O'Brochta, D. A., Gomez, S. P., and Handler, A. M. (1991), Mol. Gen. Genet. 225: 387-394.
38. Peloquin, J. J., et al. (2000), Insect Mol. Biol., 9: 323-333.
39. Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989), "Molecular Cloning: A Laboratory Manual." 2nd edition ed. Cold Spring Harbor Press, Cold Spring Harbor, New York.
40. Scheller, J., Guhrs, K. H., Grosse, F., and Conrad, U. (2001), Nat. BiotechnoL, 19: 573-577.
41. Southern, E. M. (1975), J. Mol. Biol., 98: 503-517.
42. Takei, F., et al. (1984), J. Cell Biol., 99: 2005-2010.
43. Tamura, T., et al. (2000), Nat. Biotechnol., 18: 81-84.
44. Thibault, S. T., Luu, H. T., Vann, N., and Miller, T. A. (1999), Insect Mol. Biol., 8: 119-123.
45. Thomas, J. L., et al. (2002), Insect Biochem. Mol. Biol., 32, 247-253.
46. Tomita, M., et al. (2003), Nat. Biotechnol., 21: 52-56.
47. Towbin, H., et al. (1979), Proc. Natl. Acad, of Sci. U.S.A., 76: 4350-4354.
48. Urry, D. W. (2002), Philosophical Transactions of the Royal Society of London B 357: 169-184.
49. Wang, H. G., and Fraser, M. J. (1993), Insect Mol. Biol., 1: 109-116.
50. Wang, H. H., Fraser, M. J., and Cary, L. C. (1989), Gene., 81: 97-108.
51. Wong Po Foo, C, et al. (2006), Appl. Phys. A., 82: 223-233.
52. Wurm, F. M. (2003), Nat. Biotechnol., 21 : 34-35.
53. Xu, M., and Lewis, R. V. (1990), Proc. Natl. Acad. Sci. U.S.A., 87: 7120-7124.
54. Yamao, M., et al. (1999), Genes. Dev., 13: 511-516.
55. Yun, et al. (2001), "Altering fibrin heavy chain gene of silkworm Bombyx mori by homologous recombination," Shengwu Huaxe yu Shengwu Wuli Xuebao 33(1): 112-116.
56. GenBank Acc. No. AF226688, Zhou, et al. "Bombyx mori fibroin heavy chain Fib-H (fib-H) gene, complete cds.," US Natl. Library of Medicine, Bethesda, MD, USA, Jun. 19, 2000.
57. Zhao, et al. (2001), Acta Biochimica et Biophysica Sinica, 33(1): 112-116.
58. Zhang, et al. (1999), Acta Biochimica et Biophysica Sinica, 31(2): 119-123.
59. Zhou, C.Z., et al. (2000), Nucleic Acids Res., 28. (12): 2413-2419.
60. Tomita, M., et al. (2003), Nat. Biotechnol., 21 (1): 52-56.
61. Yoshizato, Katsutoshi, "A Proposal for Application of Recombinant Insects (Kumikaetai Konchu Riyo Eno Teigen)", Sanshi Konchuken Shiryo, No. 28, pp. 93-95.
62. Toshiki, et al. (2000), Nature Biotechnology, 16: 81-85.
63. Okano, et al. (2000), Journal of Interferon and Cytokine Research, 20: 1015-1022.
64. Xiao-Hui, et al.(2000), Acta Pharmacol. Sin., 21 (9): 797-801.
65. Ishihara, et al. (1999), Biochimica et Biophysica Acta, 1451: 48-58.
66. T. Tamura, "Construction and utilization of transgenic silkworm using transposon", Fiber Preprints, Japan, Vol. 56, No. 2, 2001, p. 38-41.
A. Yanai, et al. (2002), Research Journal of Food and Agriculture, 25 (2): 30-33.
67. T. Tamura, et al. (2000), Agriculture and Horticulture, 75 ( 8): 17-24.
68. Yoshizato, Katsutoshi (2001), "A Proposal for Application of Recombinant Insects (Kumikaetai Konchu Riyo Eno Teigen)", Sanshi Konchuken Shiryo, 28: 93 -95.
69. United States Patent 7,674,882 - Kaplan, et al.
70. United States Patent 7,659, 112 - Hiramatsu, et al.
71. United States Patent 7,521,228 - Lewis, et al.
72. United States Patent 6,268, 169 - Fahnestock.
73. United States Patent 5,994,099 - Lewis.
74. United States Patent 5,989,894 - Lewis.
75. United States Patent 5,756,677 - Lewis
76. United States Patent 5,733,771 - Lewis.
77. Kluge, J.A., Rabotyagova, O., Leisk, G.G. & Kaplan, D.L. (2008), Trends Biotechnol, 26:244-251.
78. Scheibel, T. (2004), Microb. Cell. Fact. 3, 14.
79. Macintosh, A.C., Kearns, V.R., Crawford, A. & Hatton, P.V. (2008), /. Tiss. Engr. Reg. Med., 2:71-80.
80. Gosline, J.M., Guerette, P.A., Ortlepp, C.S. & Savage, K.N. (1999), /. Exp. Biol., 202:3295-3303.
81. Lewis, R.V. (2006), Chem. Rev., 106:3762-3774.
82. Hardy, J.G., L.M., R. & T.R. (2008), S., Polymer, 49:4309-4327.
83. Teule, F., et al. (2007), /. Mat. Set, 42:8974-8985.
84. Teule, F., et al. (2009), Nat. Protoc. 4:341-355.
85. Fahnestock, S.R. & Irwin, S.L. (1997), Appl. Microbiol. Biotechnol., 47:23-32.
86. Fahnestock, S.R. & Bedzyk, L.A. (1997), Appl. Microbiol. Biotechnol., 47:33-39.
87. Zhang, Y., et al. (2008), Mol. Biol. Rep. 35:329-335.
88. Miao, Y., et al. (2006), Appl. Microbiol. Biotechnol., 71: 192-199.
89. Kato, T., Kajikawa, M., Maenaka, K. & Park, E.Y. (2010), Appl. Microbiol. Biotechnol, 85:459-470.
90. Royer, C, et al. (2005), Transgenic Res., 14:463-472.
91. Kojima, K,. et al. (2007), Biosci. Biotechnol. Biochem. 71, 2943-2951.
92. Kurihara, H., Sezutsu, H., Tamura, T. & Yamada, K. (2007), Biochem. Biophys. Res. Commun., 355:976-980.
93. Shimizu, K., et al. (2007), Insect Biochem. Mol. Biol, 37:713-725.
94. Yanagisawa, S., et al. (2007), Biomacromolecules, 8:3487-3492.
95. Wen, H., et al. (2010), Mol. Biol. Rep., 37: 1815-1821.
96. Zhu, Z., et al. (2010), J. Biomater. Sci. olym. Ed., 21:395-411.
97. Sehnal, F. & Akai, H. (1990), Int. Insect Morph. Embryol., 19:79-132.
98. Horn, C, et al. (2002), Insect Biochem. Mol. Biol., 32: 1221-1235.
99. Yamada, H., Nakao, H., Takasu, Y. & Tsubouchi, K. (2001), Mat. Sci. Engr. C, 14:,41- 46.
100. United States Patent 5,728,810 Lewis.
SEQUENCE LISTING <110> THE UNIVERSITY OF NOTRE DAME <120> CHIMERIC SPIDER SILK AND USES THEREOF <130> 343414-00063 <140> PCT/US2011/053760 <141> 2011-09-28 <150> 61/387,332 <151> 2010-09-28 <160> 35 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 1 Gly Pro Gly Gly Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gly Gln Gly 1 5 10 15 Pro Gly Gly Tyr 20 <210> 2 <211> 5 <212> PRT <213> Unknown <220> <223> Description of Unknown: Putative flagelliform silk elastic motif sequence <400> 2 Gly Pro Gly Gly Ala 1 5 <210> 3 <211> 16 <212> PRT <213> Unknown <220> <223> Description of Unknown: Putative dragline silk strength motif sequence <400> 3 Gly Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala 1 5 10 15 <210> 4 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 4 Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly 1 5 10 15 Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro 20 25 30 Gly Gly Ala Gly Pro Gly Gly Ala 35 40 <210> 5 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Ala Ala Ala Ala Ala Ala Ala Ala 1 5 <210> 6 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly 1 5 10 15 Pro Gly Gly Ala 20 <210> 7 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 taactcgagg ctcaaagcct catcccaatt tggag 35 <210> 8 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 ataccgcggt gcagaagaca agccatcgca acggtg 36 <210> 9 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 ataccgcgga aagatgtttt gtacggaaag tttgaa 36 <210> 10 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 ttagcggccg ccgaacccta aaacattgtt acgttacgtt acttg 45 <210> 11 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 11 taagcggccg cgggagaaag catgaagtaa gttctttaaa tattacaaaa a 51 <210> 12 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 ataggatcca cgactgcagc actagtgctg ctgaaatcgc 40 <210> 13 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 atatctagaa cgactgcagc actagtgctg ctgaaatcgc 40 <210> 14 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 14 caatctagac gtgagcaagg gcgaggagct gttcacc 37 <210> 15 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 taaggatcca gcttgtacag ctcgtccatg ccgagag 37 <210> 16 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 atacccggga agcgtcagtt acggagctgg cag 33 <210> 17 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 caagctgact atagtattct tagttgagaa ggcatac 37 <210> 18 <211> 33 <212> PRT <213> Nephila clavipes <400> 18 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly Ala 1 5 10 15 Gly Arg Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala 20 25 30 Ala <210> 19 <211> 26 <212> PRT <213> Lactrodectus geometricus <400> 19 Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gln Gly Gly Gln Gly Gly Ala 1 5 10 15 Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala 20 25 <210> 20 <211> 34 <212> PRT <213> Argiope trifasciata <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (31)..(31) <223> Any amino acid <400> 20 Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Xaa Gln Gly 1 5 10 15 Ala Gly Gln Gly Tyr Gly Ala Gly Ser Gly Gly Gln Gly Gly Xaa Gly 20 25 30 Gln Gly <210> 21 <211> 40 <212> PRT <213> Nephila clavipes <400> 21 Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly 1 5 10 15 Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser 20 25 30 Ala Ala Ala Ala Ala Ala Ala Ala 35 40 <210> 22 <211> 29 <212> PRT <213> Lactrodectus geometricus <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <400> 22 Gly Pro Gly Gly Tyr Gly Pro Gly Pro Gly Xaa Gln Gln Gly Tyr Gly 1 5 10 15 Pro Gly Gly Ser Gly Ala Ala Ala Ala Ala Ala Ala Ala 20 25 <210> 23 <211> 32 <212> PRT <213> Argiope trifasciata <400> 23 Gly Pro Gly Gly Gln Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly 1 5 10 15 Pro Ser Gly Pro Gly Gly Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala 20 25 30 <210> 24 <211> 4949 <212> PRT <213> Nephila clavipes <400> 24 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 20 25 30 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 35 40 45 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 50 55 60 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 65 70 75 80 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 85 90 95 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 100 105 110 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 115 120 125 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 130 135 140 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 145 150 155 160 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 165 170 175 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 180 185 190 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 195 200 205 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 210 215 220 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 225 230 235 240 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 245 250 255 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 260 265 270 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 275 280 285 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 290 295 300 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 305 310 315 320 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 325 330 335 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 340 345 350 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 355 360 365 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 370 375 380 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 385 390 395 400 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 405 410 415 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 420 425 430 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 435 440 445 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 450 455 460 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 465 470 475 480 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 485 490 495 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 500 505 510 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 515 520 525 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 530 535 540 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 545 550 555 560 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 565 570 575 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 580 585 590 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 595 600 605 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 610 615 620 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 625 630 635 640 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 645 650 655 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 660 665 670 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 675 680 685 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 690 695 700 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 705 710 715 720 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 725 730 735 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 740 745 750 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 755 760 765 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 770 775 780 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 785 790 795 800 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 805 810 815 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 820 825 830 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 835 840 845 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 850 855 860 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 865 870 875 880 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 885 890 895 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 900 905 910 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 915 920 925 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 930 935 940 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 945 950 955 960 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 965 970 975 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 980 985 990 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 995 1000 1005 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 1010 1015 1020 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 1025 1030 1035 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 1040 1045 1050 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 1055 1060 1065 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 1070 1075 1080 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 1085 1090 1095 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 1100 1105 1110 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 1115 1120 1125 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 1130 1135 1140 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 1145 1150 1155 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 1160 1165 1170 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 1175 1180 1185 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 1190 1195 1200 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 1205 1210 1215 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 1220 1225 1230 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 1235 1240 1245 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 1250 1255 1260 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 1265 1270 1275 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 1280 1285 1290 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 1295 1300 1305 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 1310 1315 1320 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 1325 1330 1335 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 1340 1345 1350 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 1355 1360 1365 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 1370 1375 1380 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 1385 1390 1395 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 1400 1405 1410 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 1415 1420 1425 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 1430 1435 1440 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 1445 1450 1455 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 1460 1465 1470 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 1475 1480 1485 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 1490 1495 1500 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 1505 1510 1515 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 1520 1525 1530 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 1535 1540 1545 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 1550 1555 1560 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 1565 1570 1575 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 1580 1585 1590 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 1595 1600 1605 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 1610 1615 1620 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 1625 1630 1635 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 1640 1645 1650 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 1655 1660 1665 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 1670 1675 1680 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 1685 1690 1695 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 1700 1705 1710 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 1715 1720 1725 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 1730 1735 1740 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 1745 1750 1755 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 1760 1765 1770 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 1775 1780 1785 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 1790 1795 1800 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 1805 1810 1815 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 1820 1825 1830 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 1835 1840 1845 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 1850 1855 1860 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 1865 1870 1875 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 1880 1885 1890 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 1895 1900 1905 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 1910 1915 1920 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 1925 1930 1935 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 1940 1945 1950 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 1955 1960 1965 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 1970 1975 1980 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 1985 1990 1995 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 2000 2005 2010 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 2015 2020 2025 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 2030 2035 2040 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 2045 2050 2055 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 2060 2065 2070 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 2075 2080 2085 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 2090 2095 2100 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 2105 2110 2115 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 2120 2125 2130 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 2135 2140 2145 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 2150 2155 2160 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 2165 2170 2175 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 2180 2185 2190 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 2195 2200 2205 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 2210 2215 2220 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 2225 2230 2235 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 2240 2245 2250 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 2255 2260 2265 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 2270 2275 2280 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 2285 2290 2295 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 2300 2305 2310 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 2315 2320 2325 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 2330 2335 2340 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 2345 2350 2355 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 2360 2365 2370 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 2375 2380 2385 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 2390 2395 2400 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 2405 2410 2415 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 2420 2425 2430 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 2435 2440 2445 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 2450 2455 2460 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 2465 2470 2475 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 2480 2485 2490 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 2495 2500 2505 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 2510 2515 2520 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 2525 2530 2535 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 2540 2545 2550 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 2555 2560 2565 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 2570 2575 2580 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 2585 2590 2595 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 2600 2605 2610 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 2615 2620 2625 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 2630 2635 2640 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 2645 2650 2655 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 2660 2665 2670 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 2675 2680 2685 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 2690 2695 2700 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 2705 2710 2715 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 2720 2725 2730 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 2735 2740 2745 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 2750 2755 2760 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 2765 2770 2775 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 2780 2785 2790 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 2795 2800 2805 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 2810 2815 2820 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 2825 2830 2835 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 2840 2845 2850 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 2855 2860 2865 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 2870 2875 2880 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 2885 2890 2895 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 2900 2905 2910 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 2915 2920 2925 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 2930 2935 2940 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 2945 2950 2955 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 2960 2965 2970 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 2975 2980 2985 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 2990 2995 3000 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 3005 3010 3015 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 3020 3025 3030 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 3035 3040 3045 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 3050 3055 3060 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 3065 3070 3075 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 3080 3085 3090 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 3095 3100 3105 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 3110 3115 3120 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 3125 3130 3135 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 3140 3145 3150 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 3155 3160 3165 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 3170 3175 3180 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 3185 3190 3195 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 3200 3205 3210 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 3215 3220 3225 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 3230 3235 3240 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 3245 3250 3255 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 3260 3265 3270 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 3275 3280 3285 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 3290 3295 3300 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 3305 3310 3315 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 3320 3325 3330 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 3335 3340 3345 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 3350 3355 3360 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 3365 3370 3375 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 3380 3385 3390 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 3395 3400 3405 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 3410 3415 3420 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 3425 3430 3435 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 3440 3445 3450 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 3455 3460 3465 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 3470 3475 3480 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 3485 3490 3495 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 3500 3505 3510 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 3515 3520 3525 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 3530 3535 3540 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 3545 3550 3555 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 3560 3565 3570 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 3575 3580 3585 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 3590 3595 3600 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 3605 3610 3615 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 3620 3625 3630 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 3635 3640 3645 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 3650 3655 3660 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 3665 3670 3675 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 3680 3685 3690 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 3695 3700 3705 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 3710 3715 3720 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 3725 3730 3735 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 3740 3745 3750 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 3755 3760 3765 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 3770 3775 3780 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 3785 3790 3795 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 3800 3805 3810 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 3815 3820 3825 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 3830 3835 3840 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 3845 3850 3855 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 3860 3865 3870 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 3875 3880 3885 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 3890 3895 3900 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 3905 3910 3915 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 3920 3925 3930 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 3935 3940 3945 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 3950 3955 3960 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 3965 3970 3975 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 3980 3985 3990 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 3995 4000 4005 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 4010 4015 4020 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 4025 4030 4035 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 4040 4045 4050 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 4055 4060 4065 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 4070 4075 4080 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 4085 4090 4095 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 4100 4105 4110 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 4115 4120 4125 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 4130 4135 4140 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 4145 4150 4155 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 4160 4165 4170 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 4175 4180 4185 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 4190 4195 4200 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly 4205 4210 4215 Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala 4220 4225 4230 Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly 4235 4240 4245 Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 4250 4255 4260 Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly 4265 4270 4275 Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly 4280 4285 4290 Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 4295 4300 4305 Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly 4310 4315 4320 Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala 4325 4330 4335 Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala 4340 4345 4350 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly 4355 4360 4365 Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala 4370 4375 4380 Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala 4385 4390 4395 Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly 4400 4405 4410 Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala 4415 4420 4425 Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly 4430 4435 4440 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly 4445 4450 4455 Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala 4460 4465 4470 Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr 4475 4480 4485 Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala 4490 4495 4500 Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg 4505 4510 4515 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly 4520 4525 4530 Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly 4535 4540 4545 Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly 4550 4555 4560 Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly 4565 4570 4575 Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly 4580 4585 4590 Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala 4595 4600 4605 Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly 4610 4615 4620 Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln 4625 4630 4635 Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala 4640 4645 4650 Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly 4655 4660 4665 Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly 4670 4675 4680 Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala 4685 4690 4695 Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly 4700 4705 4710 Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala 4715 4720 4725 Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala 4730 4735 4740 Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala 4745 4750 4755 Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala 4760 4765 4770 Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr 4775 4780 4785 Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly 4790 4795 4800 Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala 4805 4810 4815 Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly 4820 4825 4830 Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala 4835 4840 4845 Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala 4850 4855 4860 Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly 4865 4870 4875 Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Gly 4880 4885 4890 Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr 4895 4900 4905 Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly 4910 4915 4920 Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly 4925 4930 4935 Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 4940 4945 <210> 25 <211> 93 <212> PRT <213> Argiope trifasciata <400> 25 Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser 1 5 10 15 Gly Ala Gly Ala Gly Ser Gly Ser Gly Ala Gly Tyr Gly Val Gly Ala 20 25 30 Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala 35 40 45 Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Ser 50 55 60 Gly Ala Gly Ser Asp Gly Tyr Gly Arg Gly Phe Gly Ala Gly Ala Gly 65 70 75 80 Ser Gly Ala Gly Ala Gly Ser Gly Ala Gly Tyr Gly Ala 85 90 <210> 26 <211> 200 <212> PRT <213> Araneus sp. <400> 26 Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala 1 5 10 15 Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala 20 25 30 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Gly Gly Tyr 35 40 45 Gly Gly Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Gln 50 55 60 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 65 70 75 80 Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala 85 90 95 Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala 100 105 110 Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Gly Gly Tyr 115 120 125 Gly Gly Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Gln 130 135 140 Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala 145 150 155 160 Gly Ala Gly Ala Ala Gly Gly Tyr Gly Gly Gly Ala Gly Ala Gly Ala 165 170 175 Gly Gly Ala Gly Gly Tyr Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala 180 185 190 Gly Ala Ala Ala Ala Ala Gly Ala 195 200 <210> 27 <211> 387 <212> PRT <213> Nephila clavipes <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> MOD_RES <222> (35)..(35) <223> Any amino acid <220> <221> MOD_RES <222> (40)..(40) <223> Any amino acid <220> <221> MOD_RES <222> (45)..(45) <223> Any amino acid <220> <221> MOD_RES <222> (50)..(50) <223> Any amino acid <220> <221> MOD_RES <222> (55)..(55) <223> Any amino acid <220> <221> MOD_RES <222> (60)..(60) <223> Any amino acid <220> <221> MOD_RES <222> (65)..(65) <223> Any amino acid <220> <221> MOD_RES <222> (70)..(70) <223> Any amino acid <220> <221> MOD_RES <222> (75)..(75) <223> Any amino acid <220> <221> MOD_RES <222> (80)..(80) <223> Any amino acid <220> <221> MOD_RES <222> (85)..(85) <223> Any amino acid <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(95) <223> Any amino acid <220> <221> MOD_RES <222> (100)..(100) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(105) <223> Any amino acid <220> <221> MOD_RES <222> (110)..(110) <223> Any amino acid <220> <221> MOD_RES <222> (115)..(115) <223> Any amino acid <220> <221> MOD_RES <222> (120)..(120) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (130)..(130) <223> Any amino acid <220> <221> MOD_RES <222> (135)..(135) <223> Any amino acid <220> <221> MOD_RES <222> (140)..(140) <223> Any amino acid <220> <221> MOD_RES <222> (145)..(145) <223> Any amino acid <220> <221> MOD_RES <222> (150)..(150) <223> Any amino acid <220> <221> MOD_RES <222> (155)..(155) <223> Any amino acid <220> <221> MOD_RES <222> (160)..(160) <223> Any amino acid <220> <221> MOD_RES <222> (165)..(165) <223> Any amino acid <220> <221> MOD_RES <222> (170)..(170) <223> Any amino acid <220> <221> MOD_RES <222> (175)..(175) <223> Any amino acid <220> <221> MOD_RES <222> (180)..(180) <223> Any amino acid <220> <221> MOD_RES <222> (185)..(185) <223> Any amino acid <220> <221> MOD_RES <222> (190)..(190) <223> Any amino acid <220> <221> MOD_RES <222> (195)..(195) <223> Any amino acid <220> <221> MOD_RES <222> (200)..(200) <223> Any amino acid <220> <221> MOD_RES <222> (205)..(205) <223> Any amino acid <220> <221> MOD_RES <222> (208)..(208) <223> Any amino acid <220> <221> MOD_RES <222> (211)..(211) <223> Any amino acid <220> <221> MOD_RES <222> (214)..(214) <223> Any amino acid <220> <221> MOD_RES <222> (217)..(217) <223> Any amino acid <220> <221> MOD_RES <222> (220)..(220) <223> Any amino acid <220> <221> MOD_RES <222> (223)..(223) <223> Any amino acid <220> <221> MOD_RES <222> (226)..(226) <223> Any amino acid <220> <221> MOD_RES <222> (262)..(262) <223> Any amino acid <220> <221> MOD_RES <222> (267)..(267) <223> Any amino acid <220> <221> MOD_RES <222> (272)..(272) <223> Any amino acid <220> <221> MOD_RES <222> (277)..(277) <223> Any amino acid <220> <221> MOD_RES <222> (282)..(282) <223> Any amino acid <220> <221> MOD_RES <222> (287)..(287) <223> Any amino acid <220> <221> MOD_RES <222> (292)..(292) <223> Any amino acid <220> <221> MOD_RES <222> (297)..(297) <223> Any amino acid <220> <221> MOD_RES <222> (302)..(302) <223> Any amino acid <220> <221> MOD_RES <222> (307)..(307) <223> Any amino acid <220> <221> MOD_RES <222> (312)..(312) <223> Any amino acid <220> <221> MOD_RES <222> (317)..(317) <223> Any amino acid <220> <221> MOD_RES <222> (322)..(322) <223> Any amino acid <220> <221> MOD_RES <222> (327)..(327) <223> Any amino acid <220> <221> MOD_RES <222> (332)..(332) <223> Any amino acid <220> <221> MOD_RES <222> (337)..(337) <223> Any amino acid <220> <221> MOD_RES <222> (342)..(342) <223> Any amino acid <220> <221> MOD_RES <222> (347)..(347) <223> Any amino acid <220> <221> MOD_RES <222> (352)..(352) <223> Any amino acid <220> <221> MOD_RES <222> (357)..(357) <223> Any amino acid <220> <221> MOD_RES <222> (362)..(362) <223> Any amino acid <220> <221> MOD_RES <222> (367)..(367) <223> Any amino acid <220> <221> MOD_RES <222> (372)..(372) <223> Any amino acid <220> <221> MOD_RES <222> (377)..(377) <223> Any amino acid <220> <221> MOD_RES <222> (382)..(382) <223> Any amino acid <220> <221> MOD_RES <222> (387)..(387) <223> Any amino acid <400> 27 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 1 5 10 15 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 20 25 30 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 35 40 45 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 50 55 60 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 65 70 75 80 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 85 90 95 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 100 105 110 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 115 120 125 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 130 135 140 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 145 150 155 160 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 165 170 175 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 180 185 190 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Gly Xaa 195 200 205 Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly 210 215 220 Gly Xaa Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp 225 230 235 240 Gly Pro Ile Thr Ile Ser Glu Glu Leu Thr Ile Ser Gly Ala Gly Gly 245 250 255 Ser Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 260 265 270 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 275 280 285 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 290 295 300 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 305 310 315 320 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 325 330 335 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 340 345 350 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 355 360 365 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 370 375 380 Gly Gly Xaa 385 <210> 28 <211> 329 <212> PRT <213> Nephila sp. <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> MOD_RES <222> (35)..(35) <223> Any amino acid <220> <221> MOD_RES <222> (40)..(40) <223> Any amino acid <220> <221> MOD_RES <222> (45)..(45) <223> Any amino acid <220> <221> MOD_RES <222> (50)..(50) <223> Any amino acid <220> <221> MOD_RES <222> (55)..(55) <223> Any amino acid <220> <221> MOD_RES <222> (60)..(60) <223> Any amino acid <220> <221> MOD_RES <222> (65)..(65) <223> Any amino acid <220> <221> MOD_RES <222> (70)..(70) <223> Any amino acid <220> <221> MOD_RES <222> (75)..(75) <223> Any amino acid <220> <221> MOD_RES <222> (80)..(80) <223> Any amino acid <220> <221> MOD_RES <222> (85)..(85) <223> Any amino acid <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(95) <223> Any amino acid <220> <221> MOD_RES <222> (100)..(100) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(105) <223> Any amino acid <220> <221> MOD_RES <222> (110)..(110) <223> Any amino acid <220> <221> MOD_RES <222> (115)..(115) <223> Any amino acid <220> <221> MOD_RES <222> (120)..(120) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <220> <221> MOD_RES <222> (130)..(130) <223> Any amino acid <220> <221> MOD_RES <222> (135)..(135) <223> Any amino acid <220> <221> MOD_RES <222> (140)..(140) <223> Any amino acid <220> <221> MOD_RES <222> (145)..(145) <223> Any amino acid <220> <221> MOD_RES <222> (150)..(150) <223> Any amino acid <220> <221> MOD_RES <222> (155)..(155) <223> Any amino acid <220> <221> MOD_RES <222> (160)..(160) <223> Any amino acid <220> <221> MOD_RES <222> (165)..(165) <223> Any amino acid <220> <221> MOD_RES <222> (170)..(170) <223> Any amino acid <220> <221> MOD_RES <222> (175)..(175) <223> Any amino acid <220> <221> MOD_RES <222> (180)..(180) <223> Any amino acid <220> <221> MOD_RES <222> (183)..(183) <223> Any amino acid <220> <221> MOD_RES <222> (186)..(186) <223> Any amino acid <220> <221> MOD_RES <222> (189)..(189) <223> Any amino acid <220> <221> MOD_RES <222> (192)..(192) <223> Any amino acid <220> <221> MOD_RES <222> (195)..(195) <223> Any amino acid <220> <221> MOD_RES <222> (198)..(198) <223> Any amino acid <220> <221> MOD_RES <222> (201)..(201) <223> Any amino acid <220> <221> MOD_RES <222> (239)..(239) <223> Any amino acid <220> <221> MOD_RES <222> (244)..(244) <223> Any amino acid <220> <221> MOD_RES <222> (249)..(249) <223> Any amino acid <220> <221> MOD_RES <222> (254)..(254) <223> Any amino acid <220> <221> MOD_RES <222> (259)..(259) <223> Any amino acid <220> <221> MOD_RES <222> (264)..(264) <223> Any amino acid <220> <221> MOD_RES <222> (269)..(269) <223> Any amino acid <220> <221> MOD_RES <222> (274)..(274) <223> Any amino acid <220> <221> MOD_RES <222> (279)..(279) <223> Any amino acid <220> <221> MOD_RES <222> (284)..(284) <223> Any amino acid <220> <221> MOD_RES <222> (289)..(289) <223> Any amino acid <220> <221> MOD_RES <222> (294)..(294) <223> Any amino acid <220> <221> MOD_RES <222> (299)..(299) <223> Any amino acid <220> <221> MOD_RES <222> (304)..(304) <223> Any amino acid <220> <221> MOD_RES <222> (309)..(309) <223> Any amino acid <220> <221> MOD_RES <222> (314)..(314) <223> Any amino acid <220> <221> MOD_RES <222> (319)..(319) <223> Any amino acid <220> <221> MOD_RES <222> (324)..(324) <223> Any amino acid <220> <221> MOD_RES <222> (329)..(329) <223> Any amino acid <400> 28 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 1 5 10 15 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 20 25 30 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 35 40 45 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 50 55 60 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 65 70 75 80 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 85 90 95 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 100 105 110 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 115 120 125 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 130 135 140 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 145 150 155 160 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 165 170 175 Pro Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa 180 185 190 Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Thr Val Ile Glu Asp Leu Asp 195 200 205 Ile Thr Ile Asp Gly Ala Asp Gly Pro Ile Thr Ile Ser Glu Glu Leu 210 215 220 Thr Ile Gly Gly Ala Gly Ala Gly Gly Ser Gly Pro Gly Gly Xaa Gly 225 230 235 240 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 245 250 255 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly 260 265 270 Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly 275 280 285 Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 290 295 300 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 305 310 315 320 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 325 <210> 29 <211> 125 <212> PRT <213> Argiope trifasciata <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (25)..(25) <223> Any amino acid <220> <221> MOD_RES <222> (30)..(30) <223> Any amino acid <220> <221> MOD_RES <222> (52)..(52) <223> Any amino acid <220> <221> MOD_RES <222> (57)..(57) <223> Any amino acid <220> <221> MOD_RES <222> (62)..(62) <223> Any amino acid <220> <221> MOD_RES <222> (67)..(67) <223> Any amino acid <220> <221> MOD_RES <222> (72)..(72) <223> Any amino acid <220> <221> MOD_RES <222> (75)..(75) <223> Any amino acid <220> <221> MOD_RES <222> (78)..(78) <223> Any amino acid <220> <221> MOD_RES <222> (81)..(81) <223> Any amino acid <220> <221> MOD_RES <222> (84)..(84) <223> Any amino acid <220> <221> MOD_RES <222> (87)..(87) <223> Any amino acid <220> <221> MOD_RES <222> (90)..(90) <223> Any amino acid <220> <221> MOD_RES <222> (95)..(95) <223> Any amino acid <220> <221> MOD_RES <222> (100)..(100) <223> Any amino acid <220> <221> MOD_RES <222> (105)..(105) <223> Any amino acid <220> <221> MOD_RES <222> (110)..(110) <223> Any amino acid <220> <221> MOD_RES <222> (115)..(115) <223> Any amino acid <220> <221> MOD_RES <222> (120)..(120) <223> Any amino acid <220> <221> MOD_RES <222> (125)..(125) <223> Any amino acid <400> 29 Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 1 5 10 15 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 20 25 30 Val Thr Val Asp Val Asp Val Ser Val Gly Gly Ala Pro Gly Gly Gly 35 40 45 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 50 55 60 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly 65 70 75 80 Xaa Gly Gly Xaa Gly Gly Xaa Gly Gly Xaa Gly Pro Gly Gly Xaa Gly 85 90 95 Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro 100 105 110 Gly Gly Xaa Gly Pro Gly Gly Xaa Gly Pro Gly Gly Xaa 115 120 125 <210> 30 <211> 17388 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60 gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240 gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300 cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360 gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420 ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480 cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540 ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600 gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660 gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720 gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780 ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840 accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900 tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960 tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020 ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080 tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140 cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200 aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260 tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320 accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380 acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440 catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500 attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560 gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620 gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680 gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740 gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800 atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860 actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920 aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980 ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040 catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100 ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160 taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220 tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280 tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340 tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400 tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460 gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520 tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580 ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640 catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700 gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760 cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820 caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880 taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940 gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000 tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060 gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120 ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180 tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240 accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420 cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480 taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800 caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160 cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220 gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640 ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700 acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760 aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820 gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880 atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940 cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000 ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060 taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120 atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180 cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240 tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300 gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360 acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420 accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480 acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540 cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600 tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660 ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720 tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780 ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840 tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900 taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960 gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020 ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080 atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140 gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200 cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260 caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320 gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380 cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440 ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500 cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560 cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620 tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680 tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740 ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800 acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860 tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920 aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980 cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040 aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100 aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160 aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220 agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280 atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340 ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400 aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460 atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520 ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580 atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640 ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700 agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760 gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820 ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880 gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940 caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000 ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060 ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120 ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180 atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240 gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300 caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360 tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420 atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480 cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540 gatatacgag cgatttcagc actagtgctg cagtcgttct agacctggat cccccgggtg 9600 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9660 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9720 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 9780 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 9840 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 9900 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 9960 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10020 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10080 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10140 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10200 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10260 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10320 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10380 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10440 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10500 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10560 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 10620 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10680 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10740 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 10800 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10860 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10920 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 10980 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11040 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11100 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11160 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11220 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11280 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11340 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11400 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11460 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 11520 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 11580 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 11640 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 11700 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 11760 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 11820 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 11880 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 11940 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12000 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12060 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12120 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12180 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12240 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12300 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 12360 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12420 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12480 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 12540 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 12600 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 12660 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 12720 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 12780 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 12840 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 12900 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 12960 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13020 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 13080 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13140 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13200 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 13260 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 13320 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 13380 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 13440 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 13500 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 13560 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 13620 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 13680 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 13740 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 13800 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 13860 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 13920 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 13980 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14040 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 14100 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14160 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14220 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 14280 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14340 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14400 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 14460 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 14520 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 14580 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 14640 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 14700 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 14760 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 14820 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 14880 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 14940 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 15000 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 15060 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 15120 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 15180 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 15240 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 15300 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 15360 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 15420 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 15480 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 15540 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 15600 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 15660 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 15720 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 15780 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 15840 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 15900 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 15960 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 16020 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16080 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16140 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 16200 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16260 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16320 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 16380 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16440 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16500 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 16560 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 16620 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 16680 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 16740 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 16800 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 16860 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggaagc gtcagttacg 16920 gagctggcag gggatacgga caaggtgcag gaagtgcagc ttcctctgtg tcatctgctt 16980 catctcgcag ttacgactat tctcgtcgta acgtccgcaa aaactgtgga attcctagaa 17040 gacaactagt tgttaaattc agagcactgc cttgtgtgaa ttgctaattt ttaatataaa 17100 ataacccttg tttcttactt cgtcctggat acatctatgt tttttttttc gttaataaat 17160 gagagcattt aagttattgt ttttaattac ttttttttag aaaacagatt tcggattttt 17220 tgtatgcatt ttatttgaat gtactaatat aatcaattaa tcaatgaatt catttattta 17280 agggataaca ataatccatg aattcacatg cacatttaaa acaaaactaa attacaatag 17340 gttcatataa aaacaacaag tatgccttct caactaagaa tactatag 17388 <210> 31 <211> 18102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60 gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240 gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300 cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360 gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420 ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480 cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540 ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600 gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660 gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720 gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780 ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840 accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900 tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960 tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020 ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080 tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140 cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200 aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260 tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320 accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380 acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440 catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500 attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560 gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620 gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680 gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740 gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800 atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860 actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920 aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980 ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040 catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100 ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160 taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220 tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280 tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340 tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400 tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460 gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520 tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580 ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640 catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700 gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760 cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820 caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880 taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940 gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000 tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060 gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120 ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180 tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240 accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420 cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480 taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800 caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160 cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220 gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640 ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700 acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760 aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820 gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880 atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940 cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000 ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060 taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120 atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180 cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240 tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300 gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360 acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420 accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480 acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540 cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600 tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660 ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720 tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780 ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840 tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900 taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960 gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020 ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080 atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140 gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200 cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260 caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320 gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380 cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440 ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500 cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560 cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620 tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680 tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740 ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800 acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860 tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920 aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980 cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040 aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100 aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160 aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220 agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280 atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340 ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400 aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460 atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520 ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580 atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640 ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700 agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760 gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820 ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880 gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940 caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000 ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060 ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120 ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180 atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240 gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300 caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360 tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420 atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480 cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540 gatatacgag cgatttcagc actagtgctg cagtcgttct agacgtgagc aagggcgagg 9600 agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 9660 agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt 9720 tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct 9780 acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 9840 ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 9900 acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 9960 agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 10020 acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca 10080 agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca 10140 cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg 10200 ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 10260 ccgccgggat cactctcggc atggacgagc tgtacaagct ggatcccccg ggtggagcag 10320 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 10380 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 10440 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 10500 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10560 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10620 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10680 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10740 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10800 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10860 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10920 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10980 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11040 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11100 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 11160 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11220 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11280 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 11340 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11400 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11460 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 11520 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11580 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11640 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11700 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11760 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11820 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11880 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11940 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 12000 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 12060 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 12120 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 12180 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 12240 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 12300 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 12360 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 12420 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 12480 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12540 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12600 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12660 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12720 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12780 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 12840 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 12900 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 12960 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 13020 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 13080 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 13140 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 13200 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 13260 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 13320 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 13380 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 13440 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13500 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 13560 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 13620 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13680 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 13740 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 13800 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 13860 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 13920 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 13980 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 14040 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 14100 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 14160 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 14220 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 14280 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 14340 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 14400 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 14460 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14520 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 14580 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 14640 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14700 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 14760 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 14820 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14880 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 14940 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 15000 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 15060 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 15120 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 15180 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 15240 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 15300 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 15360 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 15420 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 15480 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 15540 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 15600 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 15660 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 15720 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 15780 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 15840 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 15900 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 15960 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 16020 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 16080 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 16140 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 16200 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 16260 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 16320 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 16380 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 16440 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 16500 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 16560 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16620 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 16680 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 16740 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16800 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 16860 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 16920 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 16980 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 17040 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 17100 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 17160 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 17220 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 17280 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 17340 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 17400 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 17460 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 17520 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 17580 caggctccgc tgcagcggcg gctgctgcag caggtccggg aagcgtcagt tacggagctg 17640 gcaggggata cggacaaggt gcaggaagtg cagcttcctc tgtgtcatct gcttcatctc 17700 gcagttacga ctattctcgt cgtaacgtcc gcaaaaactg tggaattcct agaagacaac 17760 tagttgttaa attcagagca ctgccttgtg tgaattgcta atttttaata taaaataacc 17820 cttgtttctt acttcgtcct ggatacatct atgttttttt tttcgttaat aaatgagagc 17880 atttaagtta ttgtttttaa ttactttttt ttagaaaaca gatttcggat tttttgtatg 17940 cattttattt gaatgtacta atataatcaa ttaatcaatg aattcattta tttaagggat 18000 aacaataatc catgaattca catgcacatt taaaacaaaa ctaaattaca ataggttcat 18060 ataaaaacaa caagtatgcc ttctcaacta agaatactat ag 18102 <210> 32 <211> 12516 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60 gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240 gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300 cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360 gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420 ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480 cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540 ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600 gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660 gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720 gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780 ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840 accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900 tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960 tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020 ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080 tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140 cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200 aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260 tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320 accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380 acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440 catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500 attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560 gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620 gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680 gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740 gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800 atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860 actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920 aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980 ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040 catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100 ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160 taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220 tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280 tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340 tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400 tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460 gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520 tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580 ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640 catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700 gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760 cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820 caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880 taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940 gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000 tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060 gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120 ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180 tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240 accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420 cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480 taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800 caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160 cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220 gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640 ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700 acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760 aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820 gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880 atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940 cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000 ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060 taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120 atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180 cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240 tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300 gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360 acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420 accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480 acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540 cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600 tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660 ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720 tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780 ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840 tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900 taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960 gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020 ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080 atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140 gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200 cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260 caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320 gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380 cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440 ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500 cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560 cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620 tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680 tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740 ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800 acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860 tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920 aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980 cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040 aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100 aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160 aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220 agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280 atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340 ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400 aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460 atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520 ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580 atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640 ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700 agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760 gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820 ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880 gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940 caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000 ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060 ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120 ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180 atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240 gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300 caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360 tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420 atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480 cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540 gatatacgag cgatttcagc actagtgctg cagtcgttct agacctggat cccccgggtg 9600 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9660 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 9720 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 9780 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 9840 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 9900 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 9960 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10020 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10080 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10140 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10200 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10260 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10320 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10380 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10440 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10500 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 10560 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 10620 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10680 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 10740 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 10800 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10860 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 10920 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 10980 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11040 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11100 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11160 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11220 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11280 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11340 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11400 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11460 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 11520 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 11580 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 11640 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 11700 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 11760 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 11820 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 11880 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 11940 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12000 ccgctgcagc ggcggctgct gcagcaggtc cgggaagcgt cagttacgga gctggcaggg 12060 gatacggaca aggtgcagga agtgcagctt cctctgtgtc atctgcttca tctcgcagtt 12120 acgactattc tcgtcgtaac gtccgcaaaa actgtggaat tcctagaaga caactagttg 12180 ttaaattcag agcactgcct tgtgtgaatt gctaattttt aatataaaat aacccttgtt 12240 tcttacttcg tcctggatac atctatgttt tttttttcgt taataaatga gagcatttaa 12300 gttattgttt ttaattactt ttttttagaa aacagatttc ggattttttg tatgcatttt 12360 atttgaatgt actaatataa tcaattaatc aatgaattca tttatttaag ggataacaat 12420 aatccatgaa ttcacatgca catttaaaac aaaactaaat tacaataggt tcatataaaa 12480 acaacaagta tgccttctca actaagaata ctatag 12516 <210> 33 <211> 13230 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 tcgacgtccc atggccattc gaattcggcc ggcctaggcg cgccgtacgc gtatcgataa 60 gctttaagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 120 tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 180 caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 240 gttttttaaa gcaagtaaaa cctctacaaa tgtggtatgg ctgattatga tctagagtcg 300 cggccgctac aggaacaggt ggtggcggcc ctcggtgcgc tcgtactgct ccacgatggt 360 gtagtcctcg ttgtgggagg tgatgtccag cttggagtcc acgtagtagt agccgggcag 420 ctgcacgggc ttcttggcca tgtagatgga cttgaactcc accaggtagt ggccgccgtc 480 cttcagcttc agggccttgt ggatctcgcc cttcagcacg ccgtcgcggg ggtacaggcg 540 ctcggtggag gcctcccagc ccatggtctt cttctgcatt acggggccgt cggaggggaa 600 gttccgccga tgaacttcac cttgtagatg aagcagccgt cctgcaggga ggagtcctgg 660 gtcacggtca ccacgccgcc gtcctcgaag ttcatcacgc gctcccactt gaagccctcg 720 gggaaggaca gcttcttgta gtcggggatg tcggcggggt gcttcacgta caccttggag 780 ccgtactgga actgggggga caggatgtcc caggcgaagg gcagggggcc gcccttggtc 840 accttcagct tcacggtgtt gtggccctcg taggggcggc cctcgcccct cgcccctcga 900 tctcgaactc gtggccgttc acggtgccct ccatgcgcac cttgaagcgc atgaactcct 960 tgatgacgtt cttggaggag cgcaccatgg tggcgaccgg tggatcccgg gcccgcggta 1020 ccgtcgactc tagcggtacc ccgattgttt agcttgttca gctgcgcttg tttatttgct 1080 tagctttcgc ttagcgacgt gttcactttg cttgtttgaa ttgaattgtc gctccgtaga 1140 cgaagcgcct ctatttatac tccggcggtc gagggttcga aatcgataag cttggatcct 1200 aattgaatta gctctaattg aattagtctt ctaattgaat tagtctctaa ttgaattaga 1260 tccccgggcg agctcgaatt aaaccattgt gggaaccgtg cgatcaaaca aacgcgagat 1320 accgggaagt actgaaaaac agtcgctcca ggccagtggg aacatcgatg ttttgttttg 1380 acggacccct tactctcgtc tcatataaac cgaagccagc taagatggta tacttattat 1440 catcttgtga tgaggatgct tctatcaacg aaagtaccgg taaaccgcaa atggttatgt 1500 attataatca aactaaaggc ggagtggaca cgctagacca aatgtgttct gtgatgacct 1560 gcagtaggaa gacgaatagg tggcctatgg cattattgta cggaatgata aacattgcct 1620 gcataaattc ttttattata tacagccata atgtcagtag caagggagaa aaggttcaaa 1680 gtcgcaaaaa atttatgaga aacctttaca tgagcctgac gtcatcgttt atgcgtaagc 1740 gtttagaagc tcctactttg aagagatatt tgcgcgataa tatctctaat attttgccaa 1800 atgaagtgcc tggtacatca gatgacagta ctgaagagcc agtaatgaaa aaacgtactt 1860 actgtactta ctgcccctct aaaataaggc gaaaggcaaa tgcatcgtgc aaaaaatgca 1920 aaaaagttat ttgtcgagag cataatattg atatgtgcca aagttgtttc tgactgacta 1980 ataagtataa tttgtttcta ttatgtataa gttaagctaa ttacttattt tataatacaa 2040 catgactgtt tttaaagtac aaaataagtt tatttttgta aaagagagaa tgtttaaaag 2100 ttttgttact ttatagaaga aattttgagt ttttgttttt ttttaataaa taaataaaca 2160 taaataaatt gtttgttgaa tttattatta gtatgtaagt gtaaatataa taaaacttaa 2220 tatctattca aattaataaa taaacctcga tatacagacc gataaaacac atgcgtcaat 2280 tttacgcatg attatcttta acgtacgtca caatatgatt atctttctag ggttaaataa 2340 tagtttctaa tttttttatt attcagcctg ctgtcgtgaa taccgtatat ctcaacgctg 2400 tctgtgagat tgtcgtattc tagccttttt agtttttcgc tcatcgactt gatattgtcc 2460 gacacatttt cgtcgatttg cgttttgatc aaagacttga gcagagacac gttaatcaac 2520 tgttcaaatt gatccatatt aacgatatca acccgatgcg tatatggtgc gtaaaatata 2580 ttttttaacc ctcttatact ttgcactctg cgttaatacg cgttcgtgta cagacgtaat 2640 catgttttct tttttggata aaactcctac tgagtttgac ctcatattag accctcacaa 2700 gttgcaaaac gtggcatttt ttaccaatga agaatttaaa gttattttaa aaaatttcat 2760 cacagattta aagaagaacc aaaaattaaa ttatttcaac agtttaatcg accagttaat 2820 caacgtgtac acagacgcgt cggcaaaaaa cacgcagccc gacgtgttgg ctaaaattat 2880 taaatcaact tgtgttatag tcacggattt gccgtccaac gtgttcctca aaaagttgaa 2940 gaccaacaag tttacggaca ctattaatta tttgattttg ccccacttca ttttgtggga 3000 tcacaatttt gttatatttt taaaacaaag ctttggcact ggccgtcgtt ttacaacgtc 3060 gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 3120 ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 3180 tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 3240 accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 3300 gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 3360 acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 3420 cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 3480 taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 3540 tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 3600 aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 3660 ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 3720 aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 3780 acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 3840 ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 3900 gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 3960 atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 4020 acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 4080 tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 4140 ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 4200 aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 4260 aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 4320 ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 4380 atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 4440 aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 4500 accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 4560 tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 4620 tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 4680 tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 4740 cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 4800 caaatactgt tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 4860 cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 4920 cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 4980 gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 5040 acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 5100 atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 5160 cctgatatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 5220 gatgctcgtc acggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5280 ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5340 gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5400 gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc 5460 cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 5520 ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc ccaggcttta 5580 cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca atttcacaca 5640 ggaaacagct atgacatgat tacgaattcg agctcggtac ccggggatcc tctagagtcg 5700 acgctcgcgc gacttggttt gccattcttt agcgcgcgtc gcgtcacaca gcttggccac 5760 aatgtggttt ttgtcaaacg aagattctat gacgtgttta aagtttaggt cgagtaaagc 5820 gcaaatcttt tttaacccta gaaagatagt ctgcgtaaaa ttgacgcatg cattcttgaa 5880 atattgctct ctctttctaa atagcgcgaa tccgtcgctg tgcatttagg acatctcagt 5940 cgccgcttgg agctcccgtg aggcgtgctt gtcaatgcgg taagtgtcac tgattttgaa 6000 ctataacgac cgcgtgagtc aaaatgacgc atgattatct tttacgtgac ttttaagatt 6060 taactcatac gataattata ttgttatttc atgttctact tacgtgataa cttattatat 6120 atatattttc ttgttataga tatcgtgact aatatataat aaaatgggta gttctttaga 6180 cgatgagcat atcctctctg ctcttctgca aagcgatgac gagcttgttg gtgaggattc 6240 tgacagtgaa atatcagatc acgtaagtga agatgacgtc cagagcgata cagaagaagc 6300 gtttatagat gaggtacatg aagtgcagcc aacgtcaagc ggtagtgaaa tattagacga 6360 acaaaatgtt attgaacaac caggttcttc atagattctg ttagaagcca aagaatcttg 6420 accttgccac agaggactat tagaggtaag aataaacatt gttggtcaac ttcaaagtcc 6480 acgaggcgta gccgagtctc tgcactgaac attgtcagat ccgagatcgg ccggcctagg 6540 cgcgccaagc ttaaggtgca cggcccacgt ggccactagt acttctcgag gctcaaagcc 6600 tcatcccaat ttggagtcac tcaagacatc cttgattaag gcagctgccg atattgacat 6660 ggacctcgtt cgtgctgcga tagacgactg gccgcgcaga ttgaaggcct gtattcaaaa 6720 tcacggaggt cattttgaat aaactttagt gtcataagaa tctatgtttt gttaagttca 6780 ttttggtata tgaatggtta cataatgaat aaacttgttt caattatttt acattaaaca 6840 tgtgacagaa tttatgacct gactaggtag gtacaaacag cctttttgat attagaaaac 6900 taagtaaaat agcctacggt cacatctctt tccgtgggtg tcgttaaagg gcgacttaga 6960 gaaccaccaa gaacgtagca gaatcctcag agtgtcatac cagcatacag ccatcgctaa 7020 ctgctattta ctggtaatag ggcacattgt aatctcactt aaccatactg tcgggccacc 7080 atctagccta tttctgccac gaatcaatcg tgagtgatgg acatagagaa actattagtt 7140 gagaagaaaa caagagcact aaaggtttga tattgacaaa aatctacttc gccgtcactc 7200 cataggttta ttgtctctca ttagtccaga acagcagtta cagacgtaag cttttacgca 7260 caaactacag ggttgctctt tattgtatcg aaaatatggg acctgaataa gggcgatttt 7320 gacgcgtcct gcccgcccat tcccgatcct acggacagaa tggcaagcag tcgacgtcgc 7380 cccaaacacg tcatttcgga tcctcacgat ccactaacgg tgctttaggt acctcaagca 7440 ccggtcatcg ttctcgtcgg acccgtcgct tgcgacgaag ggctcgacga gcaaattaac 7500 cctcagacac agcccactga gtttctcgcc ggatcttctc agcgggtcgc gtttccgatc 7560 cggtggtaga ttctgcgaag cacggctctt gctaggattc gtgttagcaa cgtcgtcagg 7620 tttgagcccc gtgagctcac ttactagtta aggttacgct gaaatagcct ctcaaggctc 7680 tcagctaggt aggaaacaaa aaaaaaagtc ctgcccttaa caccgttgcg atggcttgtc 7740 ttctgcaccg cggaaagatg ttttgtacgg aaagtttgaa taagtgctta attgcaagta 7800 acgtaacaat gttttagggt tcggcggccg cgggagaaag catgaagtaa gttctttaaa 7860 tattacaaaa aaattgaacg atattataaa attctttaaa atattaaaag taagaacaat 7920 aagatcaatt aaatcataat taatcacatt gttcatgatc acaatttaat ttacttcata 7980 cgttgtattg ttatgttaaa taaaaagatt aatttctatg taattgtatc tgtacaatac 8040 aatgtgtaga tgtttattct atcgaaagta aatacgtcaa aactcgaaaa ttttcagtat 8100 aaaaaggttc aactttttca aatcagcatc agttcggttc caactctcaa gatgagagtc 8160 aaaacctttg tgatcttgtg ctgcgctctg caggtgagtt aattatttta ctattatttc 8220 agaaggtggc cagacgatat cacgggccac ctgataataa gtggtcgcca aaacgcacag 8280 atatcgtaaa ttgtgccatt tgatttgtca cgcccggggg ggctacggaa taaactacat 8340 ttatttattt aaaaaatgaa ccttagatta tgtaacttgt gatttatttg cgtcaaaagt 8400 aggcaagatg aatctatgta aatacctggg cagacttgca atatcctatt tcaccggtaa 8460 atcagcattg caatatgcaa tgcatattca acaatatgta aaacaattcg taaagcatca 8520 ttagaaaata gacgaaagaa attgcataaa attataaccg cattattaat ttattatgat 8580 atctattaac aattgctatt gccttttttt cgcaaattat aatcattttc ataacctcga 8640 ggtagcattc tgttacattt taatacattg gtatgtgatt ataacacgag ctgcccactg 8700 agtttctcgc cagatcttct cagtgggtcg cgttaccgat cacgtgatag attctatgaa 8760 gcactgctct tgttagggct agtgttagca aattctttca ggttgagtct gagagctcac 8820 ctacccatcg gagcgtagct ggaataggct accagctaat aggtagggaa aacaaagctc 8880 gaaacaagct caagtaataa caacataatg tgaccataaa atctcgtggt gtatgagata 8940 caattatgta ctttcccaca aatgtttaca taattagaat gttgttcaac ttgcctaacg 9000 ccccagctag aacattcaat tattactatt accactacta aggcagtatg tcctaactcg 9060 ttccagatca gcgctaactt cgattgaatg tgcgaaattt atagctcaat attttagcac 9120 ttatcgtatt gatttaagaa aaaattgtta acattttgtt tcagtatgtc gcttatacaa 9180 atgcaaacat caatgatttt gatgaggact attttgggag tgatgtcact gtccaaagta 9240 gtaatacaac agatgaaata attagagatg catctggggc agttatcgaa gaacaaatta 9300 caactaaaaa aatgcaacgg aaaaataaaa accatggaat acttggaaaa aatgaaaaaa 9360 tgatcaagac gttcgttata accacggatt ccgacggtaa cgagtccatt gtagaggaag 9420 atgtgctcat gaagacactt tccgatggta ctgttgctca aagttatgtt gctgctgatg 9480 cgggagcata ttctcagagc gggccatacg tatcaaacag tggatacagc actcatcaag 9540 gatatacgag cgatttcagc actagtgctg cagtcgttct agacgtgagc aagggcgagg 9600 agctgttcac cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca 9660 agttcagcgt gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt 9720 tcatctgcac caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct 9780 acggcgtgca gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt 9840 ccgccatgcc cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact 9900 acaagacccg cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga 9960 agggcatcga cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca 10020 acagccacaa cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca 10080 agatccgcca caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca 10140 cccccatcgg cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg 10200 ccctgagcaa agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg 10260 ccgccgggat cactctcggc atggacgagc tgtacaagct ggatcccccg ggtggagcag 10320 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 10380 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 10440 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 10500 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 10560 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 10620 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 10680 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 10740 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 10800 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 10860 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 10920 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 10980 cagcggcggc tgctgcagca ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11040 gtgctggacc aggaggtgct ggtccgggtg gagcaggacc aggaggtgct ggacctggtg 11100 gtgctggacc aggaggtgct ggtccgggtg gcccgtctgg tccaggctcc gctgcagcgg 11160 cggctgctgc agcaggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11220 gaccaggagg tgctggtccg ggtggagcag gaccaggagg tgctggacct ggtggtgctg 11280 gaccaggagg tgctggtccg ggtggcccgt ctggtccagg ctccgctgca gcggcggctg 11340 ctgcagcagg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11400 gaggtgctgg tccgggtgga gcaggaccag gaggtgctgg acctggtggt gctggaccag 11460 gaggtgctgg tccgggtggc ccgtctggtc caggctccgc tgcagcggcg gctgctgcag 11520 caggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11580 ctggtccggg tggagcagga ccaggaggtg ctggacctgg tggtgctgga ccaggaggtg 11640 ctggtccggg tggcccgtct ggtccaggct ccgctgcagc ggcggctgct gcagcaggtc 11700 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11760 cgggtggagc aggaccagga ggtgctggac ctggtggtgc tggaccagga ggtgctggtc 11820 cgggtggccc gtctggtcca ggctccgctg cagcggcggc tgctgcagca ggtccgggtg 11880 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 11940 gagcaggacc aggaggtgct ggacctggtg gtgctggacc aggaggtgct ggtccgggtg 12000 gcccgtctgg tccaggctcc gctgcagcgg cggctgctgc agcaggtccg ggtggagcag 12060 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggagcag 12120 gaccaggagg tgctggacct ggtggtgctg gaccaggagg tgctggtccg ggtggcccgt 12180 ctggtccagg ctccgctgca gcggcggctg ctgcagcagg tccgggtgga gcaggaccag 12240 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtgga gcaggaccag 12300 gaggtgctgg acctggtggt gctggaccag gaggtgctgg tccgggtggc ccgtctggtc 12360 caggctccgc tgcagcggcg gctgctgcag caggtccggg tggagcagga ccaggaggtg 12420 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggagcagga ccaggaggtg 12480 ctggacctgg tggtgctgga ccaggaggtg ctggtccggg tggcccgtct ggtccaggct 12540 ccgctgcagc ggcggctgct gcagcaggtc cgggtggagc aggaccagga ggtgctggac 12600 ctggtggtgc tggaccagga ggtgctggtc cgggtggagc aggaccagga ggtgctggac 12660 ctggtggtgc tggaccagga ggtgctggtc cgggtggccc gtctggtcca ggctccgctg 12720 cagcggcggc tgctgcagca ggtccgggaa gcgtcagtta cggagctggc aggggatacg 12780 gacaaggtgc aggaagtgca gcttcctctg tgtcatctgc ttcatctcgc agttacgact 12840 attctcgtcg taacgtccgc aaaaactgtg gaattcctag aagacaacta gttgttaaat 12900 tcagagcact gccttgtgtg aattgctaat ttttaatata aaataaccct tgtttcttac 12960 ttcgtcctgg atacatctat gttttttttt tcgttaataa atgagagcat ttaagttatt 13020 gtttttaatt actttttttt agaaaacaga tttcggattt tttgtatgca ttttatttga 13080 atgtactaat ataatcaatt aatcaatgaa ttcatttatt taagggataa caataatcca 13140 tgaattcaca tgcacattta aaacaaaact aaattacaat aggttcatat aaaaacaaca 13200 agtatgcctt ctcaactaag aatactatag 13230 <210> 34 <211> 10458 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180 caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240 ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300 cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360 agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420 cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480 caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540 gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600 taaaacgacg gccagtgagc gcgcctcgtt cattcacgtt tttgaacccg tggaggacgg 660 gcagactcgc ggtgcaaatg tgttttacag cgtgatggag cagatgaaga tgctcgacac 720 gctgcagaac acgcagctag attaacccta gaaagataat catattgtga cgtacgttaa 780 agataatcat gcgtaaaatt gacgcatgtg ttttatcggt ctgtatatcg aggtttattt 840 attaatttga atagatatta agttttatta tatttacact tacatactaa taataaattc 900 aacaaacaat ttatttatgt ttatttattt attaaaaaaa aacaaaaact caaaatttct 960 tctataaagt aacaaaactt ttatcgaatt gtatagtatt cttagttgag aaggcatact 1020 tgttgttttt atatgaacct attgtaattt agttttgttt taaatgtgca tgtgaattca 1080 tggattattg ttatccctta aataaatgaa ttcattgatt aattgattat attagtacat 1140 tcaaataaaa tgcatacaaa aaatccgaaa tctgttttct aaaaaaaagt aattaaaaac 1200 aataacttaa atgctctcat ttattaacga aaaaaaaaac atagatgtat ccaggacgaa 1260 gtaagaaaca agggttattt tatattaaaa attagcaatt cacacaaggc agtgctctga 1320 atttaacaac tagttgtctt ctaggaattc cacagttttt gcggacgtta cgacgagaat 1380 agtcgtaact gcgagatgaa gcagatgaca cagaggaagc tgcacttcct gcaccttgtc 1440 cgtatcccct gccagctccg taactgacgc tcttaaggct agcccaccgt agccaccttg 1500 accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 1560 gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 1620 cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 1680 cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 1740 gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 1800 ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 1860 tgcaccctga gagcctagcc caccgtagcc accttgaccg gcgccgcctg cagcagccgc 1920 agcggcgcca gcaccttggc cacccagacc accacggcct gcaccctgag agcctagccc 1980 accgtagcca ccttgaccgg cgccgcctgc agcagccgca gcggcgccag caccttggcc 2040 acccagacca ccacggcctg caccctgaga gcctagccca ccgtagccac cttgaccggc 2100 gccgcctgca gcagccgcag cggcgccagc accttggcca cccagaccac cacggcctgc 2160 accctgagag cctagcccac cgtagccacc ttgaccggcg ccgcctgcag cagccgcagc 2220 ggcgccagca ccttggccac ccagaccacc acggcctgca ccctgagagc ctagcccacc 2280 gtagccacct tgaccggcgc cgcctgcagc agccgcagcg gcgccagcac cttggccacc 2340 cagaccacca cggcctgcac cctgagagcc tagcccaccg tagccacctt gaccggcgcc 2400 gcctgcagca gccgcagcgg cgccagcacc ttggccaccc agaccaccac ggcctgcacc 2460 ctgagagcct agcccaccgt agccaccttg accggcgccg cctgcagcag ccgcagcggc 2520 gccagcacct tggccaccca gaccaccacg gcctgcaccc tgagagccta gcccaccgta 2580 gccaccttga ccggcgccgc ctgcagcagc cgcagcggcg ccagcacctt ggccacccag 2640 accaccacgg cctgcaccct gagagcctag cccaccgtag ccaccttgac cggcgccgcc 2700 tgcagcagcc gcagcggcgc cagcaccttg gccacccaga ccaccacggc ctgcaccctg 2760 agagcctagc ccaccgtagc caccttgacc ggcgccgcct gcagcagccg cagcggcgcc 2820 agcaccttgg ccacccagac caccacggcc tgcaccctga gagcctagcc caccgtagcc 2880 accttgaccg gcgccgcctg cagcagccgc agcggcgcca gcaccttggc cacccagacc 2940 accacggcct gcaccctgag agcctagccc accgtagcca ccttgaccgg cgccgcctgc 3000 agcagccgca gcggcgccag caccttggcc acccagacca ccacggcctg caccctgaga 3060 gcctaggccg cccgggccac atatgacgac tgcagcacta gtgctgaaat cgctcgtata 3120 tccttgatga gtgctgtatc cactgtttga tacgtatggc ccgctctgag aatatgctcc 3180 cgcatcagca gcaacataac tttgagcaac agtaccatcg gaaagtgtct tcatgagcac 3240 atcttcctct acaatggact cgttaccgtc ggaatccgtg gttataacga acgtcttgat 3300 cattttttca ttttttccaa gtattccatg gtttttattt ttccgttgca tttttttagt 3360 tgtaatttgt tcttcgataa ctgccccaga tgcatctcta attatttcat ctgttgtatt 3420 actactttgg acagtgacat cactcccaaa atagtcctca tcaaaatcat tgatgtttgc 3480 atttgtataa gcgacatact gaaacaaaat gttaacaatt ttttcttaaa tcaatacgat 3540 aagtgctaaa atattgagct ataaatttcg cacattcaat cgaagttagc gctgatctgg 3600 aacgagttag gacatactgc cttagtagtg gtaatagtaa taattgaatg ttctagctgg 3660 ggcgttaggc aagttgaaca acattctaat tatgtaaaca tttgtgggaa agtacataat 3720 tgtatctcat acaccacgag attttatggt cacattatgt tgttattact tgagcttgtt 3780 tcgagctttg ttttccctac ctattagctg gtagcctatt ccagctacgc tccgatgggt 3840 aggtgagctc tcagactcaa cctgaaagaa tttgctaaca ctagccctaa caagagcagt 3900 gcttcataga atctatcacg tgatcggtaa cgcgacccac tgagaagatc tggcgagaaa 3960 ctcagtgggc agctcgtgtt ataatcacat accaatgtat taaaatgtaa cagaatgcta 4020 cctcgaggtt atgaaaatga ttataatttg cgaaaaaaag gcaatagcaa ttgttaatag 4080 atatcataat aaattaataa tgcggttata attttatgca atttctttcg tctattttct 4140 aatgatgctt tacgaattgt tttacatatt gttgaatatg cattgcatat tgcaatgctg 4200 atttaccggt gaaataggat attgcaagtc tgcccaggta tttacataga ttcatcttgc 4260 ctacttttga cgcaaataaa tcacaagtta cataatctaa ggttcatttt ttaaataaat 4320 aaatgtagtt tattccgtag cccccccggg cgtgacaaat caaatggcac aatttacgat 4380 atctgtgcgt tttggcgacc acttattatc aggtggcccg tgatatcgtc tggccacctt 4440 ctgaaataat agtaaaataa ttaactcacc tgcagagcgc agcacaagat cacaaaggtt 4500 ttgactctca tcttgagagt tggaaccgaa ctgatgctga tttgaaaaag ttgaaccttt 4560 ttatactgaa aattttcgag ttttgacgta tttactttcg atagaataaa catctacaca 4620 ttgtattgta cagatacaat tacatagaaa ttaatctttt tatttaacat aacaatacaa 4680 cgtatgaagt aaattaaatt gtgatcatga acaatgtgat taattatgat ttaattgatc 4740 ttattgttct tacttttaat attttaaaga attttataat atcgttcaat ttttttgtaa 4800 tatttaaaga acttacttca tgctttctcc cgcggccgcc gaaccctaaa acattgttac 4860 gttacttgca attaagcact tattcaaact ttccgtacaa aacatctttc cgcggtgcag 4920 aagacaagcc atcgcaacgg tgttaagggc aggacttttt tttttgtttc ctacctagct 4980 gagagccttg agaggctatt tcagcgtaac cttaactagt aagtgagctc acggggctca 5040 aacctgacga cgttgctaac acgaatccta gcaagagccg tgcttcgcag aatctaccac 5100 cggatcggaa acgcgacccg ctgagaagat ccggcgagaa actcagtggg ctgtgtctga 5160 gggttaattt gctcgtcgag cccttcgtcg caagcgacgg gtccgacgag aacgatgacc 5220 ggtgcttgag gtacctaaag caccgttagt ggatcgtgag gatccgaaat gacgtgtttg 5280 gggcgacgtc gactgcttgc cattctgtcc gtaggatcgg gaatgggcgg gcaggacgcg 5340 tcaaaatcgc ccttattcag gtcccatatt ttcgatacaa taaagagcaa ccctgtagtt 5400 tgtgcgtaaa agcttacgtc tgtaactgct gttctggact aatgagagac aataaaccta 5460 tggagtgacg gcgaagtaga tttttgtcaa tatcaaacct ttagtgctct tgttttcttc 5520 tcaactaata gtttctctat gtccatcact cacgattgat tcgtggcaga aataggctag 5580 atggtggccc gacagtatgg ttaagtgaga ttacaatgtg ccctattacc agtaaatagc 5640 agttagcgat ggctgtatgc tggtatgaca ctctgaggat tctgctacgt tcttggtggt 5700 tctctaagtc gccctttaac gacacccacg gaaagagatg tgaccgtagg ctattttact 5760 tagttttcta atatcaaaaa ggctgtttgt acctacctag tcaggtcata aattctgtca 5820 catgtttaat gtaaaataat tgaaacaagt ttattcatta tgtaaccatt catataccaa 5880 aatgaactta acaaaacata gattcttatg acactaaagt ttattcaaaa tgacctccgt 5940 gattttgaat acaggccttc aatctgcgcg gccagtcgtc tatcgcagca cgaacgaggt 6000 ccatgtcaat atcggcagct gccttaatca aggatgtctt gagtgactcc aaattgggat 6060 gaggctttga gcctcgacct agttctagtg ttcccacaat ggttaattcg agctcgcccg 6120 gggatctaat tcaattagag actaattcaa ttagagctaa ttcaattagg atccaagctt 6180 atcgatttcg aaccctcgac cgccggagta taaatagagg cgcttcgtct acggagcgac 6240 aattcaattc aaacaagcaa agtgaacacg tcgctaagcg aaagctaagc aaataaacaa 6300 gcgcagctga acaagctaaa caatcggggt accgctagag tcgacggtac gatccaccgg 6360 tcgccaccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 6420 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 6480 ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 6540 ggcccaccct cgtgaccacc ctgacctggg gcgtgcagtg cttcagccgc taccccgacc 6600 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 6660 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 6720 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 6780 tggggcacaa gctggagtac aactacatca gccacaacgt ctatatcacc gccgacaagc 6840 agaagaacgg catcaaggcc aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 6900 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 6960 acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 7020 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 7080 acaagtaaag cggccgcgac tctagatcat aatcagccat accacatttg tagaggtttt 7140 acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 7200 tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 7260 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 7320 caatgtatct taaagcttat cgatacgcgt acggcgcgcc taggccggcc gatactagag 7380 cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgagggtt aattagatct 7440 taatacgact cactataggg cgaattgggt accgggcccc ccctcgaggt cgacggtatc 7500 gataagcttg atatctataa caagaaaata tatatataat aagttatcac gtaagtagaa 7560 catgaaataa caatataatt atcgtatgag ttaaatctta aaagtcacgt aaaagataat 7620 catgcgtcat tttgactcac gcggtcgtta tagttcaaaa tcagtgacac ttaccgcatt 7680 gacaagcacg cctcacggga gctccaagcg gcgactgaga tgtcctaaat gcacagcgac 7740 ggattcgcgc tatttagaaa gagagagcaa tatttcaaga atgcatgcgt caattttacg 7800 cagactatct ttctagggtt aatctagctg catcaggatc atatcgtcgg gtcttttttc 7860 cggctcagtc atcgcccaag ctggcgctat ctgggcatcg gggaggaaga agcccgtgcc 7920 ttttcccgcg aggttgaagc ggcatggaaa gagtttgccg aggatgactg ctgctgcatt 7980 gacgttgagc gaaaacgcac gtttaccatg atgattcggg aaggtgtggc catgcacgcc 8040 tttaacggtg aactgttcgt tcaggccacc tgggatacca gttcgtcgcg gcttttccgg 8100 acacagttcc ggatggtcag cccgaagcgc atcagcaacc cgaacaatac cggcgacagc 8160 cggaactgcc gtgccggtgt gcagattaat gacagcggtg cggcgctggg atattacgtc 8220 agcgaggacg ggtatcctgg ctggatgccg cagaaatgga catggatacc ccgtgagtta 8280 cccggcgggc gcgcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 8340 cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 8400 aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 8460 acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 8520 ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 8580 gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 8640 caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 8700 tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 8760 gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 8820 ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 8880 cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 8940 tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 9000 tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 9060 cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 9120 agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 9180 agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 9240 gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 9300 aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 9360 ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 9420 gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 9480 taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 9540 tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 9600 tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 9660 gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 9720 gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 9780 ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 9840 cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 9900 tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 9960 cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 10020 agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 10080 cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 10140 aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 10200 aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 10260 gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 10320 gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 10380 tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 10440 ttccccgaaa agtgccac 10458 <210> 35 <211> 11250 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtgttgttc cagtttggaa caagagtcca ctattaaaga acgtggactc 180 caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc ccactacgtg aaccatcacc 240 ctaatcaagt tttttggggt cgaggtgccg taaagcacta aatcggaacc ctaaagggag 300 cccccgattt agagcttgac ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa 360 agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac 420 cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc cattcgccat tcaggctgcg 480 caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg 540 gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 600 taaaacgacg gccagtgagc gcgcctcgtt cattcacgtt tttgaacccg tggaggacgg 660 gcagactcgc ggtgcaaatg tgttttacag cgtgatggag cagatgaaga tgctcgacac 720 gctgcagaac acgcagctag attaacccta gaaagataat catattgtga cgtacgttaa 780 agataatcat gcgtaaaatt gacgcatgtg ttttatcggt ctgtatatcg aggtttattt 840 attaatttga atagatatta agttttatta tatttacact tacatactaa taataaattc 900 aacaaacaat ttatttatgt ttatttattt attaaaaaaa aacaaaaact caaaatttct 960 tctataaagt aacaaaactt ttatcgaatt gtatagtatt cttagttgag aaggcatact 1020 tgttgttttt atatgaacct attgtaattt agttttgttt taaatgtgca tgtgaattca 1080 tggattattg ttatccctta aataaatgaa ttcattgatt aattgattat attagtacat 1140 tcaaataaaa tgcatacaaa aaatccgaaa tctgttttct aaaaaaaagt aattaaaaac 1200 aataacttaa atgctctcat ttattaacga aaaaaaaaac atagatgtat ccaggacgaa 1260 gtaagaaaca agggttattt tatattaaaa attagcaatt cacacaaggc agtgctctga 1320 atttaacaac tagttgtctt ctaggaattc cacagttttt gcggacgtta cgacgagaat 1380 agtcgtaact gcgagatgaa gcagatgaca cagaggaagc tgcacttcct gcaccttgtc 1440 cgtatcccct gccagctccg taactgacgc tcttaaggct agcccaccgt agccaccttg 1500 accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 1560 gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 1620 cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 1680 cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 1740 gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 1800 ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 1860 tgcaccctga gagcctagcc caccgtagcc accttgaccg gcgccgcctg cagcagccgc 1920 agcggcgcca gcaccttggc cacccagacc accacggcct gcaccctgag agcctagccc 1980 accgtagcca ccttgaccgg cgccgcctgc agcagccgca gcggcgccag caccttggcc 2040 acccagacca ccacggcctg caccctgaga gcctagccca ccgtagccac cttgaccggc 2100 gccgcctgca gcagccgcag cggcgccagc accttggcca cccagaccac cacggcctgc 2160 accctgagag cctagcccac cgtagccacc ttgaccggcg ccgcctgcag cagccgcagc 2220 ggcgccagca ccttggccac ccagaccacc acggcctgca ccctgagagc ctagcccacc 2280 gtagccacct tgaccggcgc cgcctgcagc agccgcagcg gcgccagcac cttggccacc 2340 cagaccacca cggcctgcac cctgagagcc tagcccaccg tagccacctt gaccggcgcc 2400 gcctgcagca gccgcagcgg cgccagcacc ttggccaccc agaccaccac ggcctgcacc 2460 ctgagagcct agcccaccgt agccaccttg accggcgccg cctgcagcag ccgcagcggc 2520 gccagcacct tggccaccca gaccaccacg gcctgcaccc tgagagccta gcccaccgta 2580 gccaccttga ccggcgccgc ctgcagcagc cgcagcggcg ccagcacctt ggccacccag 2640 accaccacgg cctgcaccct gagagcctag cccaccgtag ccaccttgac cggcgccgcc 2700 tgcagcagcc gcagcggcgc cagcaccttg gccacccaga ccaccacggc ctgcaccctg 2760 agagcctagc ccaccgtagc caccttgacc ggcgccgcct gcagcagccg cagcggcgcc 2820 agcaccttgg ccacccagac caccacggcc tgcaccctga gagcctagcc caccgtagcc 2880 accttgaccg gcgccgcctg cagcagccgc agcggcgcca gcaccttggc cacccagacc 2940 accacggcct gcaccctgag agcctagccc accgtagcca ccttgaccgg cgccgcctgc 3000 agcagccgca gcggcgccag caccttggcc acccagacca ccacggcctg caccctgaga 3060 gcctagccca ccgtagccac cttgaccggc gccgcctgca gcagccgcag cggcgccagc 3120 accttggcca cccagaccac cacggcctgc accctgagag cctagcccac cgtagccacc 3180 ttgaccggcg ccgcctgcag cagccgcagc ggcgccagca ccttggccac ccagaccacc 3240 acggcctgca ccctgagagc ctagcccacc gtagccacct tgaccggcgc cgcctgcagc 3300 agccgcagcg gcgccagcac cttggccacc cagaccacca cggcctgcac cctgagagcc 3360 tagcccaccg tagccacctt gaccggcgcc gcctgcagca gccgcagcgg cgccagcacc 3420 ttggccaccc agaccaccac ggcctgcacc ctgagagcct agcccaccgt agccaccttg 3480 accggcgccg cctgcagcag ccgcagcggc gccagcacct tggccaccca gaccaccacg 3540 gcctgcaccc tgagagccta gcccaccgta gccaccttga ccggcgccgc ctgcagcagc 3600 cgcagcggcg ccagcacctt ggccacccag accaccacgg cctgcaccct gagagcctag 3660 cccaccgtag ccaccttgac cggcgccgcc tgcagcagcc gcagcggcgc cagcaccttg 3720 gccacccaga ccaccacggc ctgcaccctg agagcctagc ccaccgtagc caccttgacc 3780 ggcgccgcct gcagcagccg cagcggcgcc agcaccttgg ccacccagac caccacggcc 3840 tgcaccctga gagcctaggc cgcccgggcc acatatgacg actgcagcac tagtgctgaa 3900 atcgctcgta tatccttgat gagtgctgta tccactgttt gatacgtatg gcccgctctg 3960 agaatatgct cccgcatcag cagcaacata actttgagca acagtaccat cggaaagtgt 4020 cttcatgagc acatcttcct ctacaatgga ctcgttaccg tcggaatccg tggttataac 4080 gaacgtcttg atcatttttt cattttttcc aagtattcca tggtttttat ttttccgttg 4140 cattttttta gttgtaattt gttcttcgat aactgcccca gatgcatctc taattatttc 4200 atctgttgta ttactacttt ggacagtgac atcactccca aaatagtcct catcaaaatc 4260 attgatgttt gcatttgtat aagcgacata ctgaaacaaa atgttaacaa ttttttctta 4320 aatcaatacg ataagtgcta aaatattgag ctataaattt cgcacattca atcgaagtta 4380 gcgctgatct ggaacgagtt aggacatact gccttagtag tggtaatagt aataattgaa 4440 tgttctagct ggggcgttag gcaagttgaa caacattcta attatgtaaa catttgtggg 4500 aaagtacata attgtatctc atacaccacg agattttatg gtcacattat gttgttatta 4560 cttgagcttg tttcgagctt tgttttccct acctattagc tggtagccta ttccagctac 4620 gctccgatgg gtaggtgagc tctcagactc aacctgaaag aatttgctaa cactagccct 4680 aacaagagca gtgcttcata gaatctatca cgtgatcggt aacgcgaccc actgagaaga 4740 tctggcgaga aactcagtgg gcagctcgtg ttataatcac ataccaatgt attaaaatgt 4800 aacagaatgc tacctcgagg ttatgaaaat gattataatt tgcgaaaaaa aggcaatagc 4860 aattgttaat agatatcata ataaattaat aatgcggtta taattttatg caatttcttt 4920 cgtctatttt ctaatgatgc tttacgaatt gttttacata ttgttgaata tgcattgcat 4980 attgcaatgc tgatttaccg gtgaaatagg atattgcaag tctgcccagg tatttacata 5040 gattcatctt gcctactttt gacgcaaata aatcacaagt tacataatct aaggttcatt 5100 ttttaaataa ataaatgtag tttattccgt agcccccccg ggcgtgacaa atcaaatggc 5160 acaatttacg atatctgtgc gttttggcga ccacttatta tcaggtggcc cgtgatatcg 5220 tctggccacc ttctgaaata atagtaaaat aattaactca cctgcagagc gcagcacaag 5280 atcacaaagg ttttgactct catcttgaga gttggaaccg aactgatgct gatttgaaaa 5340 agttgaacct ttttatactg aaaattttcg agttttgacg tatttacttt cgatagaata 5400 aacatctaca cattgtattg tacagataca attacataga aattaatctt tttatttaac 5460 ataacaatac aacgtatgaa gtaaattaaa ttgtgatcat gaacaatgtg attaattatg 5520 atttaattga tcttattgtt cttactttta atattttaaa gaattttata atatcgttca 5580 atttttttgt aatatttaaa gaacttactt catgctttct cccgcggccg ccgaacccta 5640 aaacattgtt acgttacttg caattaagca cttattcaaa ctttccgtac aaaacatctt 5700 tccgcggtgc agaagacaag ccatcgcaac ggtgttaagg gcaggacttt tttttttgtt 5760 tcctacctag ctgagagcct tgagaggcta tttcagcgta accttaacta gtaagtgagc 5820 tcacggggct caaacctgac gacgttgcta acacgaatcc tagcaagagc cgtgcttcgc 5880 agaatctacc accggatcgg aaacgcgacc cgctgagaag atccggcgag aaactcagtg 5940 ggctgtgtct gagggttaat ttgctcgtcg agcccttcgt cgcaagcgac gggtccgacg 6000 agaacgatga ccggtgcttg aggtacctaa agcaccgtta gtggatcgtg aggatccgaa 6060 atgacgtgtt tggggcgacg tcgactgctt gccattctgt ccgtaggatc gggaatgggc 6120 gggcaggacg cgtcaaaatc gcccttattc aggtcccata ttttcgatac aataaagagc 6180 aaccctgtag tttgtgcgta aaagcttacg tctgtaactg ctgttctgga ctaatgagag 6240 acaataaacc tatggagtga cggcgaagta gatttttgtc aatatcaaac ctttagtgct 6300 cttgttttct tctcaactaa tagtttctct atgtccatca ctcacgattg attcgtggca 6360 gaaataggct agatggtggc ccgacagtat ggttaagtga gattacaatg tgccctatta 6420 ccagtaaata gcagttagcg atggctgtat gctggtatga cactctgagg attctgctac 6480 gttcttggtg gttctctaag tcgcccttta acgacaccca cggaaagaga tgtgaccgta 6540 ggctatttta cttagttttc taatatcaaa aaggctgttt gtacctacct agtcaggtca 6600 taaattctgt cacatgttta atgtaaaata attgaaacaa gtttattcat tatgtaacca 6660 ttcatatacc aaaatgaact taacaaaaca tagattctta tgacactaaa gtttattcaa 6720 aatgacctcc gtgattttga atacaggcct tcaatctgcg cggccagtcg tctatcgcag 6780 cacgaacgag gtccatgtca atatcggcag ctgccttaat caaggatgtc ttgagtgact 6840 ccaaattggg atgaggcttt gagcctcgac ctagttctag tgttcccaca atggttaatt 6900 cgagctcgcc cggggatcta attcaattag agactaattc aattagagct aattcaatta 6960 ggatccaagc ttatcgattt cgaaccctcg accgccggag tataaataga ggcgcttcgt 7020 ctacggagcg acaattcaat tcaaacaagc aaagtgaaca cgtcgctaag cgaaagctaa 7080 gcaaataaac aagcgcagct gaacaagcta aacaatcggg gtaccgctag agtcgacggt 7140 acgatccacc ggtcgccacc atggtgagca agggcgagga gctgttcacc ggggtggtgc 7200 ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg 7260 gcgagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc accggcaagc 7320 tgcccgtgcc ctggcccacc ctcgtgacca ccctgacctg gggcgtgcag tgcttcagcc 7380 gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg 7440 tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga 7500 agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg 7560 acggcaacat cctggggcac aagctggagt acaactacat cagccacaac gtctatatca 7620 ccgccgacaa gcagaagaac ggcatcaagg ccaacttcaa gatccgccac aacatcgagg 7680 acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc gacggccccg 7740 tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa gaccccaacg 7800 agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc actctcggca 7860 tggacgagct gtacaagtaa agcggccgcg actctagatc ataatcagcc ataccacatt 7920 tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 7980 aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 8040 caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 8100 gtccaaactc atcaatgtat cttaaagctt atcgatacgc gtacggcgcg cctaggccgg 8160 ccgatactag agcggccgcc accgcggtgg agctccagct tttgttccct ttagtgaggg 8220 ttaattagat cttaatacga ctcactatag ggcgaattgg gtaccgggcc ccccctcgag 8280 gtcgacggta tcgataagct tgatatctat aacaagaaaa tatatatata ataagttatc 8340 acgtaagtag aacatgaaat aacaatataa ttatcgtatg agttaaatct taaaagtcac 8400 gtaaaagata atcatgcgtc attttgactc acgcggtcgt tatagttcaa aatcagtgac 8460 acttaccgca ttgacaagca cgcctcacgg gagctccaag cggcgactga gatgtcctaa 8520 atgcacagcg acggattcgc gctatttaga aagagagagc aatatttcaa gaatgcatgc 8580 gtcaatttta cgcagactat ctttctaggg ttaatctagc tgcatcagga tcatatcgtc 8640 gggtcttttt tccggctcag tcatcgccca agctggcgct atctgggcat cggggaggaa 8700 gaagcccgtg ccttttcccg cgaggttgaa gcggcatgga aagagtttgc cgaggatgac 8760 tgctgctgca ttgacgttga gcgaaaacgc acgtttacca tgatgattcg ggaaggtgtg 8820 gccatgcacg cctttaacgg tgaactgttc gttcaggcca cctgggatac cagttcgtcg 8880 cggcttttcc ggacacagtt ccggatggtc agcccgaagc gcatcagcaa cccgaacaat 8940 accggcgaca gccggaactg ccgtgccggt gtgcagatta atgacagcgg tgcggcgctg 9000 ggatattacg tcagcgagga cgggtatcct ggctggatgc cgcagaaatg gacatggata 9060 ccccgtgagt tacccggcgg gcgcgcttgg cgtaatcatg gtcatagctg tttcctgtgt 9120 gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 9180 cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 9240 tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 9300 gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 9360 ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 9420 caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 9480 aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 9540 atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 9600 cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 9660 ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 9720 gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 9780 accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 9840 cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 9900 cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 9960 gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 10020 aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 10080 aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 10140 actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 10200 taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 10260 gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 10320 tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 10380 ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 10440 accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 10500 agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 10560 acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 10620 tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 10680 cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 10740 tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 10800 ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 10860 gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 10920 tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 10980 ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 11040 gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 11100 cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 11160 gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 11220 ttccgcgcac atttccccga aaagtgccac 11250

Claims (23)

  1. 누에 서열, 하나 이상의 거미 실크 탄성 모티프 서열, 하나 이상의 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는, 키메라 서열에 의해 암호화되는 재조합 거미 실크 단백질.
  2. 제1항에 있어서,
    거미 실크 탄성 모티프 서열은 MaSp 유사 모티프 서열 또는 MiSp 유사 모티프 서열인, 재조합 실크 단백질.
  3. 제2항에 있어서,
    MaSp 유사 모티프는 MaSp1, MaSp2, 또는 이의 조합인, 재조합 거미 실크 단백질.
  4. 제1항에 있어서,
    성장 촉진 펩티드를 더 포함하는 재조합 거미 실크 단백질.
  5. 제1항의 재조합 실크 단백질을 포함하는 키메라 거미 실크/누에 섬유로서, 상기 실크 섬유는 천연 누에 실크 섬유보다 큰 인장 강도를 나타내는, 키메라 거미 실크/누에 섬유.
  6. 하나 이상의 거미 실크 탄성 모티프 서열, 하나 이상의 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는 서열을 가지고 있는 재조합 키메라 유전자를 가지고 있는 형질전환 누에.
  7. 제6항에 있어서,
    누에는 천연 누에 섬유보다 2배 큰 인장 강도를 나타내는 키메라 거미 실크/누에 섬유의 생산에 적합한 키메라 누에/거미 실크 단백질을 생산할 수 있는, 형질전환 누에.
  8. 제5항에 있어서,
    형질전환 누에는 형질전환 누에나방(Bombyx mori) 누에인, 형질전환 누에.
  9. 제6항에 있어서,
    여덟 개의 거미 실크 탄성 모티프 서열을 포함하는 형질전환 누에.
  10. 제8항에 있어서,
    거미 실크 탄성 모티프 서열은 MaSp 유사 모티프 서열 또는 MiSp 유사 모티프 서열인, 형질전환 누에.
  11. 피브로인 중쇄(fhc)-거미 실크 키메라를 발현할 수 있는 누에나방 실크 피브로인 중쇄 발현 카세트를 포함하는 유전자 구조체로서, 상기 구조체는 거미 실크 탄성 모티프 서열, 거미 실크 강도 모티프 서열, 또는 둘 다를 암호화하는 거미 실크 단백질 서열을 포함하고, 상기 구조체는 누에나방 fhc 실크 단백질 서열의 N 말단 절편과 C 말단 절편이 옆에 있는, 유전자 구조체.
  12. 제11항에 있어서,
    거미 실크 단백질 서열은 4개 내지 8개 카피의 추정상의 편모상 실크 탄성 모티프 서열 및 1개 내지 4개 카피의 추정상의 드래그라인 실크 강도 모티프 서열을 포함하는, 유전자 구조체.
  13. 제11항에 있어서,
    탄성 모티프 서열은 GPGGA이고, 강도 모티프 서열은 GGPSGPGS(A)8인, 유전자 구조체.
  14. 도 5에 정의된 유전자 구조체.
  15. 도 12a에 정의된 피기백(piggyBac) 벡터.
  16. 도 12b에 정의된 피기백 벡터.
  17. a.) 키메라 거미 실크 강도 모티프 서열, 거미 실크 유연성 모티프 서열 또는 이의 조합을 암호화하는 유전자를 가지고 있는 피기백 벡터 시스템을 이용하여 형질전환 누에를 제조하는 단계;
    b.) 누에에 고유한 적합한 생리적 조건 하에서 형질전환 누에가 고치를 생산하도록 허용하는 단계;
    c.) 고치를 수집하고 키메라 거미 실크 섬유를 추출하는 단계:를 포함하는 키메라 거미 실크 복합 섬유의 생산을 위한 제조방법.
  18. 제17항에 있어서,
    형질전환 누에는 형질전환 누에나방(Bomby mori) 누에인, 방법.
  19. 거미 실크 복합 섬유 안으로 조립하기에 적합한 안정적인 키메라 거미 실크 단백질을 안정적으로 발현할 수 있는 형질전환 누에나방 누에를 제조하는 방법으로, 상기 키메라 거미 실크 단백질은 거미 실크 유연성 모티프 서열과 거미 실크 강도 모티프 서열, 또는 이의 조합을 포함하는 서열에 의해 암호화되며, 상기 방법은
    a.) 주사된 누에나방 알을 제공하기 위하여, 거미 실크 유연성 모티프 서열, 거미 실크 강도 모티프 서열, 또는 이의 조합을 가지고 있는 재조합 유전자 카세트를 포함하는 피기백 벡터를 돌연변이 누에나방 알에 삽입하는 단계;
    b.) 유충을 제공하기 위하여, 알이 적합한 배양 조건 하에서 부화하도록 허용하는 단계;
    c.) 적합한 배양 조건 하에서 유충이 성숙하도록 허용하는 단계; 및
    c.) 형질전환 누에나방 누에를 선별하는 단계:를 포함하는, 형질전환 누에나방 누에를 제조하는 방법
  20. 제19항에 있어서,
    재조합 유전자 카세트는 형질전환 누에나방의 선별을 위한 녹색 형광 단백질(GFP)를 포함하는, 방법.
  21. 제19항에 있어서,
    피기백 벡터는 pXLBacII-ECFP NTD CTD masplX16(10,458pb) 또는 pXLBacII-ECFP NTD CTD maspX24(11,250bp)인, 방법.
  22. 안정적으로 통합된 거미 실크 단백질을 포함하는 합성 복합 실크 섬유로서, 상기 합성 복합 섬유는 천연 누에 실크 섬유의 인장 강도와 비교하여, 그리고 천연 거미 실크 섬유와 비교하여, 더 큰 인장 강도를 나타내는, 합성 복합 실크 섬유.
  23. 제22항에 있어서,
    안정적으로 통합된 치료 분자를 더 포함하는, 합성 복합 실크 섬유.
KR1020137010776A 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도 KR20140095010A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38733210P 2010-09-28 2010-09-28
US61/387,332 2010-09-28
PCT/US2011/053760 WO2012050919A2 (en) 2010-09-28 2011-09-28 Chimeric spider silk and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020177005086A Division KR101926286B1 (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도

Publications (1)

Publication Number Publication Date
KR20140095010A true KR20140095010A (ko) 2014-07-31

Family

ID=45938877

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020137010776A KR20140095010A (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도
KR1020187034773A KR102063002B1 (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도
KR1020177005086A KR101926286B1 (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020187034773A KR102063002B1 (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도
KR1020177005086A KR101926286B1 (ko) 2010-09-28 2011-09-28 키메라 거미 실크 및 이의 용도

Country Status (9)

Country Link
US (6) US20130212718A1 (ko)
EP (1) EP2621957B1 (ko)
JP (3) JP2014502140A (ko)
KR (3) KR20140095010A (ko)
CN (3) CN107190017A (ko)
AU (3) AU2011314072B2 (ko)
BR (1) BR112013007247A2 (ko)
CA (1) CA2812791C (ko)
WO (1) WO2012050919A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124772A1 (ko) * 2020-12-07 2022-06-16 (주)메디코스바이오텍 재조합 실크 단백질 생산능이 향상된 재조합 미생물 및 이를 이용한 고분자량 재조합 실크 단백질의 생산 방법

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140095010A (ko) * 2010-09-28 2014-07-31 더 유니버시티 오브 노트르 담 듀락 키메라 거미 실크 및 이의 용도
CN102358902B (zh) * 2011-04-02 2013-01-02 西南大学 家蚕丝素重链基因突变序列及突变的方法和应用
WO2012165476A1 (ja) 2011-06-01 2012-12-06 スパイバー株式会社 人造ポリペプチド繊維及びその製造方法
CN102808034B (zh) * 2012-08-29 2014-02-26 苏州大学 一种在蚕卵期鉴别家蚕吐丝颜色的方法
CN102808033B (zh) * 2012-08-29 2014-07-16 苏州大学 一种在幼虫期鉴别家蚕吐丝颜色的方法
EP3973992A3 (en) 2013-09-17 2022-08-31 Bolt Threads, Inc. Methods and compositions for synthesizing improved silk fibers
US10172407B2 (en) * 2015-06-10 2019-01-08 New York University Ecostructural bicycle/activity safety helmet
CN105031723B (zh) * 2015-06-23 2017-05-24 上海交通大学 基于蜘蛛丝蛋白的温敏性水凝胶
JP2018531169A (ja) 2015-09-17 2018-10-25 ロベルト ベロッツィ ヘレス 耐力複合パネル、材料、製品、ならびに製造方法および使用方法
WO2017067423A1 (zh) * 2015-10-23 2017-04-27 浙江大学 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白的方法
CN105400817B (zh) * 2015-10-23 2019-01-18 杭州超丝生物科技有限公司 利用家蚕同时合成分泌黑寡妇蜘蛛牵引丝蛋白1和蛋白2的方法
CN105400815B (zh) * 2015-10-23 2019-01-25 杭州超丝生物科技有限公司 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白1的方法
CN105463022B (zh) * 2015-10-23 2019-01-25 杭州超丝生物科技有限公司 利用家蚕丝腺生物反应器合成分泌黑寡妇蜘蛛牵引丝蛋白2的方法
RU2769982C2 (ru) 2016-04-28 2022-04-12 Спайбер Инк. Модифицированный фиброин
CN109661404A (zh) * 2016-06-23 2019-04-19 丝芭博株式会社 改造丝心蛋白
US11447532B2 (en) 2016-09-14 2022-09-20 Bolt Threads, Inc. Long uniform recombinant protein fibers
JP6990413B2 (ja) * 2016-10-18 2022-02-03 国立研究開発法人農業・食品産業技術総合研究機構 遺伝子組換えミノムシ絹糸
CN110719732B (zh) * 2017-03-30 2022-11-18 犹他州立大学 表达蜘蛛丝的转基因蚕
US11692015B2 (en) 2017-07-26 2023-07-04 Spiber Inc. Modified fibroin
WO2019094700A1 (en) * 2017-11-10 2019-05-16 Cocoon Biotech Inc. Silk-based products and methods of use
CN108392232B (zh) * 2018-04-11 2023-07-25 苏州大学 以功能化蛋白丝线为载体的体内细胞捕获器
CN113260745A (zh) 2019-01-09 2021-08-13 丝芭博株式会社 改造丝心蛋白
CN109821053B (zh) * 2019-02-28 2021-06-01 李春 一种可吸收医用缝合线及其制备方法
CN109939257B (zh) * 2019-02-28 2021-04-09 李琳 一种抗菌医用绷带及其制备方法
CN109912720B (zh) * 2019-03-14 2021-12-07 天津大学 一种蛛丝蛋白的设计合成方法和纺丝
US20210246471A1 (en) * 2020-02-11 2021-08-12 Kraig Biocraft Laboratories, Inc. Modification of heavy chain fibroin in bombyx mori
JP2023515692A (ja) * 2020-03-04 2023-04-13 ポセイダ セラピューティクス,インコーポレイティド 代謝性肝障害の治療のための組成物と方法
WO2021211942A1 (en) * 2020-04-17 2021-10-21 Massachusetts Institute Of Technology Precision delivery of multi-scale payloads to tissue-specific targets in plants
CN111500591B (zh) * 2020-05-11 2023-01-06 浙江大学 蜘蛛聚状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法
CN111518832B (zh) * 2020-05-11 2023-01-06 浙江大学 蜘蛛梨状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法
CN111518831B (zh) * 2020-05-11 2022-12-06 浙江大学 蜘蛛葡萄状腺丝蛋白基因序列的应用及其改良家蚕丝性能的方法
WO2022232090A2 (en) * 2021-04-29 2022-11-03 Carnegie Mellon University Acoustically responsive biomaterials
CN113737521B (zh) * 2021-09-27 2023-03-31 溧阳市天目湖农业发展有限公司 一种长效抗菌的天然蚕丝纤维及其加工工艺
CN114164509B (zh) * 2021-12-16 2024-02-02 中国科学院电工研究所 一种具有紫外及近红外屏蔽性能的蚕丝纤维及其制备方法和应用
CN114685687B (zh) * 2022-05-05 2023-11-24 苏州大学 一种含金丝织网蜘蛛大壶状腺丝蛋白复合丝的制备方法
CN115992181A (zh) * 2022-05-05 2023-04-21 苏州大学 一种通过苜蓿银纹夜蛾核型多角体病毒用家蚕生产嵌合蚕丝的方法
CN114957485B (zh) * 2022-05-05 2023-11-10 苏州大学 一种含多种蜘蛛腺丝蛋白的高强度蚕丝及其制备方法
WO2024057361A1 (ja) * 2022-09-12 2024-03-21 興和株式会社 可溶化タンパク質製造方法
CN116178571A (zh) * 2023-02-21 2023-05-30 南开大学 一种内质网靶向人工蛋白、重组酿酒酵母、内质网靶向囊泡、免疫佐剂和疫苗
CN116425848A (zh) * 2023-04-11 2023-07-14 北京新诚中科技术有限公司 重组嵌合蛛丝蛋白、生物蛋白纤维及其制备方法和应用

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10179171A (ja) * 1996-09-17 1998-07-07 Wako Pure Chem Ind Ltd ペプチドグリカン認識蛋白質およびその製造法
US5994099A (en) * 1997-12-31 1999-11-30 The University Of Wyoming Extremely elastic spider silk protein and DNA coding therefor
US20020082411A1 (en) * 2001-01-23 2002-06-27 Darrick Carter Immune mediators and related methods
US7521228B2 (en) * 2001-08-29 2009-04-21 The University Of Wyoming Spider silk protein encoding nucleic acids, polypeptides, antibodies and methods of use thereof
US7659112B2 (en) * 2002-03-06 2010-02-09 Toray Industries, Inc. Process for producing physiologically active protein using genetically modified silkworm
US8574590B2 (en) * 2003-07-30 2013-11-05 Integral Molecular, Inc. Lipoparticles comprising proteins, methods of making, and using the same
DE10347992A1 (de) * 2003-10-15 2005-05-12 Trw Repa Gmbh Gurtaufroller für einen Fahrzeug-Sicherheitsgurt
WO2005068495A1 (ja) * 2004-01-13 2005-07-28 Toray Industries, Inc. クモ糸タンパク質を含む絹糸および該絹糸を産生するカイコ
US20050261479A1 (en) * 2004-04-29 2005-11-24 Christian Hoffmann Method for purifying and recovering silk proteins using magnetic affinity separation
CA2573780C (en) * 2004-07-22 2013-11-19 Technische Universitaet Muenchen Recombinant spider silk proteins
BRPI0701826B1 (pt) * 2007-03-16 2021-02-17 Embrapa - Empresa Brasileira De Pesquisa Agropecuária proteínas da teia de aranha nephilengys cruentata, avicularia juruensis e parawixia bistriata isoladas da biodiversidade brasileira
US8825743B2 (en) * 2007-07-12 2014-09-02 Cornell University Semantic transactions in online applications
US9131671B2 (en) * 2008-02-01 2015-09-15 Entogenetics, Inc. Methods, compositions and systems for production of recombinant spider silk polypeptides
KR101698076B1 (ko) * 2010-03-29 2017-01-19 에릭 제임스 커비 라이브 이벤트 개시
KR20140095010A (ko) * 2010-09-28 2014-07-31 더 유니버시티 오브 노트르 담 듀락 키메라 거미 실크 및 이의 용도

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124772A1 (ko) * 2020-12-07 2022-06-16 (주)메디코스바이오텍 재조합 실크 단백질 생산능이 향상된 재조합 미생물 및 이를 이용한 고분자량 재조합 실크 단백질의 생산 방법

Also Published As

Publication number Publication date
CA2812791A1 (en) 2012-04-19
KR101926286B1 (ko) 2018-12-10
BR112013007247A2 (pt) 2016-06-14
EP2621957B1 (en) 2021-06-02
JP2014502140A (ja) 2014-01-30
AU2011314072B2 (en) 2017-03-30
US20150322122A1 (en) 2015-11-12
CN109136245A (zh) 2019-01-04
KR20170023415A (ko) 2017-03-03
US20130212718A1 (en) 2013-08-15
WO2012050919A2 (en) 2012-04-19
JP2019205463A (ja) 2019-12-05
EP2621957A2 (en) 2013-08-07
AU2019201497A1 (en) 2019-04-11
US20150322121A1 (en) 2015-11-12
JP2017127309A (ja) 2017-07-27
US20190106467A1 (en) 2019-04-11
AU2011314072A1 (en) 2013-05-23
KR20180130603A (ko) 2018-12-07
CN107190017A (zh) 2017-09-22
CN103261231A (zh) 2013-08-21
EP2621957A4 (en) 2014-03-26
CA2812791C (en) 2020-07-14
KR102063002B1 (ko) 2020-01-07
AU2017201493A1 (en) 2017-03-23
WO2012050919A3 (en) 2012-12-27
US20190153047A1 (en) 2019-05-23
US20190185528A1 (en) 2019-06-20

Similar Documents

Publication Publication Date Title
KR102063002B1 (ko) 키메라 거미 실크 및 이의 용도
KR102424721B1 (ko) Rna-유도 엔도뉴클레아제의 세포 내로의 펩티드 매개성 전달
Chang et al. Delivery of recombinant gene products with microencapsulated cells in vivo
KR20220047898A (ko) 게놈 편집 면역 효과기 세포
CN110191955A (zh) 在体外和体内对工程化的细胞中表达的化学物质诱导的信号传导复合物进行外源性药物激活的方法
KR20090031936A (ko) 프로테아제 스크리닝 방법 및 이에 의해 확인된 프로테아제
AU2016343979A1 (en) Delivery of central nervous system targeting polynucleotides
CN116059250A (zh) 适用于异种移植的三重转基因猪
EA030440B1 (ru) Сопровождающая диагностика для терапии антигиалуронановым агентом и способы ее применения
DK2443248T3 (en) IMPROVEMENT OF LONG-CHAIN POLYUM Saturated OMEGA-3 AND OMEGA-6 FATTY ACID BIOS SYNTHESIS BY EXPRESSION OF ACYL-CoA LYSOPHOSPHOLIPID ACYL TRANSFERASES
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
CN111733174B (zh) 一种分离的核酸分子及其用途
RO109863B1 (ro) Gena care codifica cel putin un factor de restrictie complementar, animal transgenic si metode de transplantare a tesuturilor sau organelor animale
CN106659805B (zh) 通过miRNA抑制埃博拉病毒的方法
CN101517074A (zh) 蛋白酶筛选方法及由此鉴别的蛋白酶
CN110868850B (zh) 缺乏i类和ii类mhc的nsg小鼠
CN101883843A (zh) 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量
CN106456674B (zh) 转基因猪胰岛和其用于治疗糖尿病的用途
KR101658163B1 (ko) 만능 줄기세포-유래의 테라토마 형성 억제방법
EP2217622B1 (en) Method for the separation of cells
CN113260704B (zh) CYP4V2和RdCVF在制备药物中的用途
US20040014158A1 (en) Protein conjugates, methods, vectors, proteins and DNA for producing them, their use, and medicaments and vaccines containing a certain quantity of said protein conjugates
WO2002092791A1 (en) Tissues or organs for use in xenotransplantation
KR20240021211A (ko) Klk2-gpi 융합 단백질에 대한 핵산 코딩, 재조합 세포 및 이의 용도
CN115443141A (zh) 胰腺内巨噬细胞m2极化治疗1型糖尿病

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
A107 Divisional application of patent