KR20220009980A - 조절된 합성 유전자 발현 시스템 - Google Patents

조절된 합성 유전자 발현 시스템 Download PDF

Info

Publication number
KR20220009980A
KR20220009980A KR1020217040123A KR20217040123A KR20220009980A KR 20220009980 A KR20220009980 A KR 20220009980A KR 1020217040123 A KR1020217040123 A KR 1020217040123A KR 20217040123 A KR20217040123 A KR 20217040123A KR 20220009980 A KR20220009980 A KR 20220009980A
Authority
KR
South Korea
Prior art keywords
syntf
domain
seq
dbd
protein
Prior art date
Application number
KR1020217040123A
Other languages
English (en)
Inventor
아마드 에스. 칼릴
윌슨 더블유. 웡
디비야 이스라니
후이샨 리
Original Assignee
트르스티스 오브 보스톤 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 트르스티스 오브 보스톤 유니버시티 filed Critical 트르스티스 오브 보스톤 유니버시티
Publication of KR20220009980A publication Critical patent/KR20220009980A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/14Blood; Artificial blood
    • A61K35/17Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/503Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
    • C12N9/506Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • C07K2319/715Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16 containing a domain for ligand dependent transcriptional activation, e.g. containing a steroid receptor domain
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/95Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)

Abstract

본 명세서에 기술된 기술은 조절된 합성 유전자 발현 시스템에 관한 것이다. 한 양태에서, DNA 결합 도메인, 전사 이펙터 도메인, 및 조절인자 단백질을 포함하는 합성 전사 인자(synTF)가 본 명세서에 기술된다. 본 명세서에 기술된 다른 양태는 상기 synTF를 포함하는 유전자 발현 시스템 및 상기 synTF를 사용하여 질병 및 장애를 치료하는 방법이다.

Description

조절된 합성 유전자 발현 시스템
관련 출원과의 상호 참조
본 PCT 출원은 35 §U.S.C.에 따라 2019년 5월 16일에 출원된 미국 가출원 제62/848,850호에 대한 이익을 주장하며, 이의 전문은 본 명세서에 참조로 인용된다.
정부 지원
본 발명은 국방고등연구계획국(Defense Advanced Research Project Agency)에서 수여한 기금 번호 D16AP00142 및 국립과학재단(National Science Foundation)에서 수여한 기금 번호 CCF-1522074에 따른 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 특정의 권리를 갖는다.
서열목록
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하고, 그의 전문이 본 명세서에 참조로 포함된다. 2020년 5월 15일에 생성된, 상기 ASCII 사본의 명칭은 701586-095350_SL.txt이며 그의 크기는 921,581바이트이다.
기술분야
본 명세서에 기술된 기술은 조절된 합성 유전자 발현 시스템에 관한 것이다.
배경
차세대 세포 요법은 정교한 방식으로 질병을 감지하고 이에 대응할 수 있는 설계자의 면역 세포를 창조하는 것을 추구한다. 이 목표를 달성하려면 복잡한 환경 입력을 처리하고 정확하게 조절된 치료제의 발현을 매개함으로써 인간 세포 기능을 프로그래밍하는 데 사용할 수 있는 조작된 조절 요소와 회로가 근본적으로 필요하다. 이 목표를 위해, 합성 전사 프로그램은 감지 및 반응 모듈과 인터페이스하여 세포에서 새로운 조절 계층(layers)을 구현할 수 있다.
치료제의 단순한 구성적 발현에 대한 의존을 넘어 면역 세포 요법을 발전시키기 위해, 조정가능하고 다용도 조절 프로파일을 제공하는 프로그램 가능한 유전 성분이 필요하다. 또한, 이러한 구성 요소는 높은 특이성, 낮은 면역원성, 및 전달가능성을 포함하는, 인간 치료 맥락과 호환성이 있는 특성을 자체적으로 가져야 한다.
T 세포 면역요법은 백혈병 및 림프종과 같은 액체 종양(liquid tumor)을 포함하는 암 치료에 대한 엄청난 가능성을 보여주었다. 그러나, 놀라운 효과와 함께 면역요법을 받는 환자에게 생명을 위협하는 위험을 초래하는, 사이토카인 방출 증후군(CRS) 및 신경독성과 같은, 심각한 부작용이 있다. 주입 후 조작된 T 세포의 활성을 제어할 수 있는 안전하고 효과적인 감지 및 반응(sense-and-response) 전략을 개발하는 것이 점점 더 중요해지고 있다.
발명의 요약
본 명세서에 기술된 기술은 유전자 발현을 제어하는 방법에 관한 것이다. 일반적으로, 본 명세서에 기술된 기술은 조절인자 단백질(regulator protein; RP)을 포함하는 합성 전사 인자(synTF)에 관한 것으로, 여기서 조절인자 단백질은 synTF의 활성을 조절한다. 특히, 본 명세서에 개시된 것과 같은 방법, 시스템 및 조성물에 따른 synTF는 (i) 발현될 관심 유전자(GOI)의 핵산에 작동가능하게 연결된 프로모터의 3'에 위치한 표적 핵산 서열(또는 표적 DNA 결합 모티프(DBM))에 결합하는 DNA 결합 도메인(DBD), (ii) 이펙터 도메인(ED) 및 조절인자 단백질(RP)을 포함하며, 여기서 조절인자 단백질은 DNA 결합 도메인(DBD)과 이펙터 도메인(ED)의 커플링(coupling)을 제어하거나 또는 ED의 세포 국재화를 제어하여, 세포 ED 및 DBD가 핵 내에서 부착되고/되거나 위치할 때, ED가 관심 유전자의 유전자 발현을 조절하기 위해 프로모터에 대한 번역 기구를 모집하거나 억제하는 기능을 발휘할 수 있도록 한다. 일부 실시형태에서, ED는 전사 액티베이터(TA)일 수 있으며, 이에 의해 ED가 관심 유전자의 전사 시작 부위에 존재할 때 유전자 발현을 켤 수 있고, 일부 실시형태에서, ED는 전사 리프레서(TR)이며, 그래서 ED가 관심 유전자의 전사 시작 부위에 존재할 때 유전자 발현이 저해되거나 억제되도록 한다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, SynTF의 조절인자 단백질은 프로테아제, 한 쌍의 유도성 근접 도메인(IPD) 또는 전위 도메인(즉, 세포질 격리 단백질)으로부터 선택되며, 이들 각각은 본 명세서에 그리고 아래에서 더 자세히 설명된다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, synTF는 자가-절단 프로테아제인 조절인자 단백질을 포함하고, 예를 들어, 하나의 예시적인 프로테아제는 NS3이다. 자가-절단 프로테아제를 포함하는 SynTF는 또한 본 명세서에서 " 억제성 프로테아제 SynTF "로 지칭될 수 있다. 본 명세서에 개시된 시스템, 조성물 및 방법의 이러한 실시형태에서, DBD는 이펙터 도메인에 직접적으로 연결되거나 간접적으로 연결(또는 커플링)되고, 프로테아제 조절인자 단백질(전형적으로 DBD와 ED 사이에 위치)은 ED에 대한 DBD의 커플링을 제어한다. 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 저해하는 작용제의 존재하에, DBD 및 ED는 커플링되거나 손상되지 않은 상태로(직접적으로 또는 간접적으로) 유지되고 이펙터 도메인은 프로모터로부터의 유전자 발현을 제어(즉, ED가 TA인 경우 관심 유전자(GOI)의 유전자 발현을 켜거나, 또는 ED가 TR인 경우 유전자 발현을 억제)할 수 있다(예를 들어, 도 5a-5c 참조). 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 저해하는 작용제의 부재 하에, DBD와 ED 사이의 연결이 붕괴되거나 절단되고, 그리하여 ED가 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 따라서 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다.
본 명세서에 개시된 시스템, 조성물 및 방법의 또 다른 실시형태에서, synTF는 DBD와 ED 사이에 위치하는 한 쌍의 인듀서 근접 도메인("IPD 쌍"으로 지칭됨)인 조절인자 단백질을 포함하고, 여기서 IPD의 각 도메인은 인듀서 작용제의 존재 하에 함께 모여, 그리하여 DBD와 ED를 연결하고 유전자 발현을 제어한다(예를 들어, 도 3 및 7a 참조). IPD 쌍을 포함하는 SynTF는 또한 본 명세서에서 " 이종이량체화 도메인 SynTF "로 지칭될 수 있다. 예를 들어, 조절인자 단백질이 IPD 쌍인 이러한 실시형태에서, IPD 쌍의 각 도메인은 DBD 또는 ED 중 어느 하나에 부착되며, 인듀서 작용제의 존재 하에, IPD의 각 도메인이 인듀서 작용제에 결합하며, 그로 인해 DBD와 ED를 간접적으로 커플링시키며, 그래서 DBD가 프로모터 영역에 결합할 때, ED가 프로모터로부터 유전자 발현을 제어(즉, ED가 TA인 경우 유전자 발현을 켜거나, ED가 TR인 경우 유전자 발현을 억제)되도록 할 수 있다(예를 들어, 도 7a 참조). RP가 IPD 쌍인 대안적인 실시형태에서, 인듀서 작용제의 부재 하에, DBD 및 ED는 커플링되지 않은 채로 남아 있고, 그리하여 ED는 GOI의 전사 시작 부위로부터 유전자 전사를 조절하는 위치에 있지 않다. 예시적인 IPD 쌍 및 이들의 유도제(inducing agent)가 본 명세서에 개시되어 있다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, synTF는 전위 도메인인 조절인자 단백질을 포함한다. 일부 실시형태에서, 전위 도메인은 세포질 격리 단백질이고, 예를 들어, 하나의 예시적인 세포질 격리 단백질은 ERT2 및 이의 변이체이다. 전위 도메인, 예를 들어, 세포질 격리 단백질을 포함하는 SynTF는 또한 본 명세서에서 " 전위 도메인 SynTF "로 지칭될 수 있다. 본 명세서에 개시된 시스템, 조성물 및 방법의 이러한 실시형태에서, DBD는 이펙터 도메인에 직접적으로 또는 간접적으로 연결(또는 커플링)되며, 전위 도메인, 예를 들어, 세포질 격리 단백질 조절인자 단백질(이는 ED, 또는 DBD에 부착되거나 또는 DBD와 ED 사이에 위치할 수 있음)은 DBD-ED를 포함하는 synTF의 세포 국재화를 제어한다(예를 들어, 도 4 참조). 이러한 실시형태에서, 세포질 격리 단백질에 결합하는 리간드의 부재 하에, 세포질 격리 단백질은 세포질 내에서 ED 및 커플링된 DBD를 격리하고, 그리하여 ED는 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 그리하여 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다. 대조적으로, 세포질 격리 단백질에 결합하는 리간드의 존재 하에, 세포질 격리 단백질이 저해되어, synTF의 DBD-ED가 세포질에서 핵으로 전위할 수 있게 하여 DBD가 DNA 결합 모티프(DBM)에 결합할 수 있고 이펙터 도메인(ED)은 프로모터로부터의 유전자 발현을 제어(즉, ED가 TA인 경우 관심 유전자(GOI)의 유전자 발현을 켜거나, 또는 ED가 TA인 경우 유전자 발현을 억제)할 수 있다(예를 들어, 도 4 참조).
본 명세서에 개시된 시스템, 조성물 및 방법의 또 다른 양태는 본 명세서에서 "유도된 분해 도메인"으로도 지칭될 수 있는 소분자 보조 차단(SMASh) 도메인을 포함하는 synTF이다. 일반적으로, SMASh 도메인은 분해를 위해 SMASh 도메인에 부착된 폴리펩티드를 표적으로 하는 기능을 발휘한다. 일부 실시형태에서, SMASh 도메인은 인듀서 근접 도메인 쌍(IPD)인 조절인자 단백질, 또는 세포질 격리 단백질을 포함하는 synTF에 부착된다(예를 들어, 도 6b 참조). 대안적인 실시형태에서, 조절인자 단백질은 SMASh 도메인일 수 있다(즉, SMASh 도메인은 synTF에서 자가-절단 프로테아제 조절인자 단백질을 대체한다)(예를 들어, 도 6a 참조).
본 명세서에 개시된 방법, 시스템 및 조성물의 모든 양태에서, SMASh 도메인은 자가-절단 프로테아제 및 데그론(degron) 도메인을 포함한다. 일부 실시형태에서, 자가-절단 프로테아제는 본 명세서에 개시된 NS3 프로테아제 또는 이의 변이체이다. 일부 실시형태에서, SMASh 도메인은 NS3 프로테아제 도메인, 부분 NS3 나선 도메인 및 NS4A 도메인을 포함하고, 본 명세서에 기술된 synTF의 N-말단 또는 C-말단에 융합될 수 있다. 단지 이론 및 설명에 국한되지 않고, SMASh 도메인이 본 명세서에 개시된 것과 같이 synTF에 부착되는 경우, 그리고 SMASh 도메인 자가-절단 프로테아제의 저해제(inhibitor)가 존재 하는 경우, SMASh 도메인 및 부착된 synTF 둘 모두가 분해를 위한 표적이 된다. 이것은 "SynTF-분해"라고 지칭되며 synTF가 "SynTF-꺼짐(OFF)"으로 되는 것을 초래하며- 즉 synTF가 분해되기 때문에, synTF에 존재하는 이펙터 도메인의 유형에 관계없이, synTF는 DBM에 결합할 수 없거나, 또는 관심 유전자의 발현을 조절할 수 없다. 반대로, 자가-절단 프로테아제의 저해제가 부재 하는 경우, 자가-절단 프로테아제는 synTF에서 SMASh 도메인을 절단(또는 커플링해제)하고, SMASh 도메인만 분해의 표적이 되고, 방출된 synTF의 활성이 조절인자 단백질을 통해 조절된다. 이와 같이, 프로테아제 저해제의 부재 하에, SMASh 도메인이 synTF에 부착되는 경우, "SMASh-분해"라고 지칭하며 synTF가 "SynTF-켜짐(ON)"으로 되는 것으로 초래하여, synTF가 조절인자 단백질에 의해 조절될 수 있으며, 유전자 발현은 각각 ED가 전사 액티베이터 단백질인지 리프레서 단백질인지에 따라 발생하거나 억제될 수 있다. 따라서, synTF에 부착된 SMASh 도메인의 존재는 조절인자 단백질 외에 GOI의 발현을 위한 제2 수준의 제어를 가능하게 한다.
일부 실시형태에서, SMASh 도메인은 그 자체로 synTF의 조절인자 단백질로서 역할하고(즉, SMASh 도메인은 자가-절단 프로테아제 조절인자 단백질을 대체함), 유도 분해 도메인 SynTF로 지칭된다(예를 들어, 도 6a 참조). 이러한 실시형태에서, SMASh 도메인이 조절인자 단백질로서 역할하는 경우, SMASh 도메인은 synTF의 ED 또는 DBD 중 어느 하나에 부착될 수 있고, NS3 프로테아제의 부재 하에, NS3 프로테아제는 활성이고 SMASh 도메인은 synTF에서 커플링해제되며, 그로 인해 SMASh 도메인만 분해를 위한 표적이 되며, DBD와 커플링된 ED를 포함하는 synTF는 프로모터로부터 유전자 발현을 제어(즉, DBD가 DBM에 결합하여 ED를 프로모터에 근접하게 만들고, ED가 TA인 경우 GOI의 유전자 발현을 켜거나, 또는 ED가 TR인 경우 유전자 발현을 억제)할 수 있게 된다. 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 억제하는 작용제의 부재 하에, DBD와 ED 사이의 연결이 붕괴되거나 절단되고, 그리하여 ED가 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 그리하여 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다.
일부 실시형태에서, SMASh 도메인이 전위 도메인 synTF(예를 들어, 조절인자 단백질이 격리 단백질인 경우), 또는 이종이량체화 도메인 synTF(즉, 조절인자 단백질이 유도성 근접 도메인의 쌍(IPD 쌍)인 경우)에 부착되는 경우, SMASH 도메인은 "SMASH 태그"로 지칭될 수 있고 synTF의 C-말단 또는 N-말단에 부착될 수 있다(예를 들어, 도 6b 또는 도 16a 참조). 단지 일예로서, C-말단 SMASh 태그는 ED의 C-말단에 부착되거나, synTF의 조절인자 단백질은 N-말단에서 C-말단 순서로 다음을 포함할 수 있다: NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인, 여기서 SMASh 태그는 synTF의 이펙터 도메인의 C-말단에 융합된다. 일부 실시형태에서 그리고 단지 일예로서, SMASh 태그가 synTF의 N-말단에 융합되는 경우(본 명세서에서 "N-말단 SMASh 태그"로 지칭됨), SMASh 태그는 N-말단에서 C-말단 순서로 다음을 포함한다: 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인, 및 NS3 절단 부위, 여기서 SMASh 태그는 synTF의 N-말단에 융합된다.
본 명세서에 개시된 기술의 또 다른 양태는 관심 유전자(GOI)의 유전자 발현을 제어하기 위한 시스템과 관련이 있으며, 여기서 시스템은 본 명세서에 기술된 synTF 및 유전자 발현을 조절하기 위해 synTF가 결합하는 요소를 포함하는 핵산 구축물을 포함한다. 특히, 일부 양태에서, 시스템은 (i) 본 명세서에 개시된 것과 같은 적어도 하나의 합성 전사 인자(synTF), 및 (ii) 적어도 하나의 핵산 구축물을 포함하며, 여기서 synTF는 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하고, 여기서 ED는 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 여기서 커플링은 적어도 하나의 RP에 의해 조절되거나, 또는 DBD에 연결된 ED의 세포 국재화는 적어도 하나의 RP에 의해 조절되고, 여기서 적어도 하나의 RP는 RP 인듀서에 의해 조절되며, 여기서 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있으며, 여기서 핵산 작제물은 (i) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및 (ii) 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 포함한다. RP 인듀서의 존재 하에, synTF의 조절인자 단백질이 DBD에 대한 ED의 커플링(예를 들어, 프로테아제 도메인 synTF 또는 유도 근접 도메인 synTF)을 조절하는 일부 실시형태에서, synTF의 DBD에 대한 ED의 커플링이 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때 ED가 프로모터 서열에 근접할 수 있게 하며, 여기서 ED는 관심 유전자의 발현을 제어한다("ED-켜짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 켜는 결과("TA-켜짐"(발현))를 초래하는 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 억제하거나 조절한다("TR-켜짐"(발현 없음)). 대조적으로, RP 인듀서가 부재하는 경우, synTF의 DBD에 대한 ED의 커플링이 절단되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때 ED가 프로모터 서열에 근접하게 되는 것을 방지하여, 관심 유전자의 유전자 발현을 방지한다("ED-꺼짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는 것을 초래하는("TA-꺼짐"(발현 없음)) 반면, ED는 전사 리프레서 단백질(TR)인 경우, 유전자 발현을 켠다("TR-꺼짐"/억제-꺼짐, 그리하여 유전자 발현을 가능하게 함).
synTF의 조절인자 단백질이 synTF의 세포 국재화(DBD 및 연결된 ED)를 조절하는 실시형태에서, RP 인듀서가 존재할 때, synTF의 DBD에 커플링된 ED는 세포질에서 격리되지 않고, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있게 하고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접하여 관심 유전자의 발현을 제어할 수 있게 한다("ED-켜짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 켜는 결과("TA-켜짐"(발현))를 초래하는 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 저해하거나 억제한다("TR-켜짐"(발현 없음)).
또한, RP 인듀서가 부재하는 경우, synTF의 DBD에 커플링된 ED가 세포질 내에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 대한 근접하여 존재하는 것을 방지하고, 관심 유전자의 발현을 방지한다("ED-꺼짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는("TA-꺼짐"(발현 없음)) 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 유전자 발현을 켠다("TR-꺼짐"/억제-꺼짐, 그리하여 유전자 발현을 가능하게 함).
표 17: 관심 유전자의 궁극적인 발현에 대한 조절인자 단백질 인듀서의 존재 또는 부재를 요약한 표.
Figure pct00001
따라서, GOI의 유전자 발현이 일어나는지 여부는, 이로만 제한되는 것은 아니지만, 다음을 포함하는 3가지 수준의 조절에 의존한다; (i) synTF에서 조절인자 단백질의 유형, (ii) 조절인자 단백질 인듀서(RP 인듀서)의 존재 또는 부재, 및 (iii) 이펙터 도메인의 유형.
더욱이, 일부 실시형태에서, 유전자 발현을 제어하기 위한 시스템은, 본 명세서에 개시된 것과 같이 synTF에 부착된 SMASh 도메인이 존재하는지 여부에 따라, 유전자 발현에 대한 추가적인 수준의 제어를 위해 구성될 수 있다. 예를 들어, synTF에 대한 SMASh 도메인의 부착은 다음과 같은 결과를 초래할 것이다: SMASh 프로테아제에 대한 저해제가 존재하는 경우, SMASh 프로테아제 활성이 저해되어, synTF가 분해되고("Syn-분해") synTF의 DBD가 DBM에 결합하는 것이 방지되고 관심 유전자의 발현 또는 억제가 제어된다("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)). 대안적 실시형태에서, SMASh 프로테아제에 대한 저해제가 부재하는 경우, SMASh 프로테아제가 활성이고 synTF에서 자가절단/커플링해제되어, SMASh 도메인이 분해를 위한 표적이 되고, synTF의 DBD가 DBM 및 synTF의 ED에 결합하여 관심 유전자의 발현을 제어하는 것이 가능하다("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)).
본 명세서에 기술된 기술의 다른 양태는 관심 유전자의 발현을 조절하기 위한 synTF의 결합을 위한 본 명세서에 개시된 것과 같은 핵산 서열, 및 또한 합성 전사 인자를 코딩하는 핵산을 포함하는 세포에 관한 것이다. 일부 실시형태에서, 핵산 서열은 별개의 구축물 상에 있고, 일부 실시형태에서, 이들은 본 명세서에 개시되고 "단일 벡터"로 지칭되는 동일한 구축물에 있다.
다른 실시형태는 본 개시로부터 쉽게 명백해질 것이다. 본 발명의 양태는 아래에 설명한 예시적인 이점을 발생시키는 구성 및 사용의 특정 이점을 교시한다.
본 발명의 양태의 다른 특징 및 이점은, 일예로서, 본 발명의 양태의 원리를 예시하는 첨부 도면과 함께, 이하의 보다 상세한 설명으로부터 명백해질 것이다.
도 1a-1h는 직교(orthogonal) ZF 어레이에 기초한 포유류 synTF의 설계 및 특성화를 보여주는 일련의 개략도 및 그래프이다. 도 1a는 직교 6-유닛 ZF 어레이를 기반으로 하는 synTF의 설계를 보여주는 개략도이다. 도 1b는 synTF 및 리포터 시스템을 보여주는 개략도이다. 도 1c는 synTF가 동족 synTF/DBM 쌍의 라이브러리에 걸쳐 해당 통합 리포터를 강력하게 활성화한다는 것을 보여주는 막대 그래프이며; mCherry 발현은 특정 ZF-p65 synTF의 존재시에만 일어났으며 TF의 부재 또는 GFP-p65의 존재시에는 일어나지 않았음에 주목해야 한다. 도 1d는 특정 synTF와 리포터의 동시발현을 보여주는 히트맵이며; mCherry 리포터는 합성 오퍼레이터 및 이의 동족 synTF에 의해 활성화됨에 주목해야 한다. 도 1e-1g는 ZF1-p65(도 1e), ZF3-p65(도 1f) 및 ZF10-p65(도 1g)를 포함하는, synTF를 발현하는 인간 세포의 트랜스크립톰(transcriptome) 프로파일링을 보여주는 일련의 산점도(scatterplots)이며, synTF의 매우 특이적이고 직교적인 조절을 나타낸다. 도 1h는 Gal4 및 TetR과 비교하여 synTF의 트랜스크립톰 프로파일링을 보여주는 막대 그래프이다. 차등적으로 조절된 전사체 = Log2|배수 변화|>1; FDR<0.1(모두 3개의 독립적인 반복실험(replicate)에 대해).
도 2는 소분자-반응성 synTF 시스템을 나타내는 개략도이다.
도 3은 유도된 근접에 의해 조절되는 예시적인 synTF를 나타내는 개략도이다.
도 4는 세포질 격리에 의해 조절되는 예시적인 synTF를 보여주는 개략도이다.
도 5a-5c는 자가-절단 프로테아제 저해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 5a는 NS3에 의해 조절되는 synTF를 보여주는 개략도이다. GRZ는 그라조프레비르(NS3의 소분자 저해제)를 나타낸다. 도 5b는 소분자 부재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 자가 절제는 ZF(징크 핑거 결합 도메인 또는 DNA 결합 도메인(DBD))와 ED(이펙터 도메인)의 커플링해제를 야기하여 전사 조절 활성을 허용하지 않는다. 도 5c는 소분자 존재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 활성 저해는 ZF와 ED의 국소 커플링을 허용하여, 전사 조절 활성을 허용한다.
도 6a-6b는 유도 분해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 6a는 SMASh에 의해 조절되는 synTF를 나타내는 개략도이다. 도 6b는 ERT2 및 SMASh 도메인을 모두 사용하는 조절된 전사 인자를 보여주는 개략도이다. SMASh 도메인은 ERT2-함유 synTF의 C-말단("C-말단 SMASh", 상단) 및 ERT2-함유 synTF의 N-말단("N-말단 SMASh", 하단)에 배치되었다.
도 7a-7c는 예시적인 이종이량체화 synTF를 보여주는 일련의 개략도 및 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 생산(output)의 일시적 활성화를 야기했음을 나타내는 그래프를 도시한 도면이다. 도 7a는 DBD(또는 ZF1)를 ED에 커플링하는 유도 근접 도메인(IPD)의 개략도를 도시한다. 이 예시적인 실시형태에서, ABA는 ED에 대한 ZF1의 커플링을 유지하기 위한 인듀서 리간드로서 기능한다. 도 7a는 또한 나타낸 바와 같이 여러 상이한 ABA 처치 농도의 함수로서 측정된 아웃풋(output) 형광을 나타낸다(용량 반응). 도 7b는 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도함을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 7c는 4일 후 소분자(ABA)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 8a-8c는 예시적인 세포질 격리 synTF를 보여주는 일련의 개략도 및 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 야기했음을 보여주는 그래프이다. 도 8a는 세포질 격리 단백질 ERT2와 함께 ED(즉, p63)에 융합된 DBD(또는 ZF3)를 갖는 예시적인 synTF를 보여준다. 도 8a는 또한 나타낸 바와 같이 여러 상이한 4OHT 처리 농도의 함수로서 측정된 아웃풋 형광을 나타낸다(용량 반응). 도 8b는 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 8c는 4일 후 소분자(4OHT)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 9a-9c는 프로테아제로서 NS3을 갖는 예시적인 억제성 프로테아제 synTF의 일련의 개략도, 및 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 나타내는 그래프이다. 도 9a는 ED(즉, p65)에 커플링된 프로테아제에 커플링된 DBD(또는 ZF10)를 지니는 예시적인 synTF를 도시한다. 도 9a는 또한 나타낸 바와 같이 아웃풋 형광이 여러 상이한 그라조프레비르 처리 농도의 함수로서 측정되었음을 나타낸다(용량 반응). 도 9b는 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 9c는 4일 후 소분자(그라조프레비르)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 10a-10d는 예시적인 synTF를 보여주는 일련의 개략도 및 소분자(예를 들어, ABA, 4OHT, 또는 그라조프레비르)의 투여가 HEK293 및 Jurkat 세포주 둘 다에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 유도하였음을 보여주는 그래프이다. 도 10a는 ABA, 4OHT 또는 그라조프레비르 각각에 의해 조절되는, 이종이량체화 도메인 synTF, 세포질 격리 도메인 synTF 및 억제성 프로테아제 synTF의 3가지 예시적인 synTF를 보여주는 개략도이다. 도 10b는 리포터 시스템을 나타내는 개략도이다. 도 10c-10d는 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 소분자의 다양한 시간 및 용량에서 리포터의 synTF 활성화를 보여주는 일련의 선 그래프(왼쪽)를 보여준다(최고 용량에 해당하는 더 어두운 회색과 함께, 용량은 회색 음영으로 나타나있다). 도 10c-10d는 또한 D4에서 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 리포터의 synTF 활성화를 보여주는 일련의 막대 그래프(오른쪽) 및 소분자의 최고 용량(ABA의 경우 1mM; 4OHT의 경우 4uM; GRZ의 경우 4uM)을 보여준다. 도 10c-10d에서, 상단 그래프는 ABA-조절 synTF, 중간 그래프는 4OHT-조절 synTF, 하단 그래프는 그라조프레비르-조절 synTF에 해당한다. 도 10c-10d에서, 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다.
도 11a-11b는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 11a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 11b는 소분자의 투여(상단 그래프: ABA, 중간 그래프: 4OHT; 하단 그래프: GRZ)가 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 11b는 다양한 시간에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 12a-12c는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 12a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 12b-12c는 소분자(그라조프레비르)의 투여가 HEK293(도 12b) 및 Jurkat 세포주(도 12c)에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 12b-12c는 다양한 시간에 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 13a-13d는 소분자(그라조프레비르)의 투여가 CD4+ 1차 인간 T 세포에서 ZF-반응성 프로모터로부터의 형광-태깅된 키메라 항원 수용체(CD19-CAR) 단백질의 일시적 활성화를 야기했음을 보여주는 일련의 개략도 및 그래프이다. 도 13a는 CD19-CAR 발현 시스템 및 유도성 synTF를 보여주는 개략도이다. NS3를 포함하는 억제성 프로테아제 synTF가 도시되어 있으며; 그러나, 논의된 바와 같은 임의의 synTF는 본 명세서에 개시된 방법에 따라 CD19-CAR GOI의 발현을 조절하는 데 사용될 수 있다. 도 13b는 다양한 시점 및 여러 다른 그라조프레비르 처리 농도에서 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 선 그래프(왼쪽) 및 3일째에 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 막대 그래프(오른쪽)를 보여준다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 CD19 항원-제시 표적 세포(CD19+ NALM 세포)와 이들 1차 세포의 후속 공동-배양이, 사이토카인의 향상된 생산에 의해 측정된, T-세포 활성화를 초래하였음을 보여준다. 이 향상된 수준의 사이토카인 생산을 사이토카인 발현을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 D1 또는 D2에서 여러 상이한 그라조프레비르 처리 농도에서 IFNγ 발현(도 13c) 및 IL-2 발현(도 13d)을 보여주는 일련의 막대 그래프이다.
도 14a-14b는 1차 인간 T 세포에서 CD19 CAR 및 IL-4 발현의 조절을 보여주는 일련의 개략도 및 그래프이다. 도 14a는 CD19-CAR 및 IL-4 발현 시스템 및 예시적인 유도성 synTF인, CD19-CAR을 조절하는 억제성 프로테아제 synTF 및 IL4의 발현을 조절하는 세포질 격리 synTF를 보여주는 개략도이다. 도 14b는, 나타낸 바와 같이, 다양한 시점에서 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(상단 그래프) 및 IL-4 발현(하단 그래프)을 나타내는 일련의 선 그래프이다. 도 14c는, 나타낸 바와 같이, 5일째에 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(밝은 회색, 왼쪽 축) 및 IL-4 발현(짙은 회색, 오른쪽 축)을 보여주는 막대 그래프이다.
도 15a-15c는 유전자 발현을 제어하기 위한 시스템에 관한 핵산 구축물을 보여주는 일련의 개략도 및 소분자(그라조프레비르)의 투여가 Jurkat T 세포주에서 ZF-반응성 프로모터로부터 사이토카인(IL10)의 일시적 활성화를 야기했음을 보여주는 그래프이다. 도 15a-15b는 이러한 유도성 활성화가 NS3-synTF 발현과 이어서 IL10 생산을 제어하기 위한 별도의 핵산 구축물("이중 렌티바이러스 벡터", 도 15a)의 전달을 통해, 또는 NS3-synTF의 발현을 제어할 뿐 아니라, IL10 생산을 조절하는 단일 핵산 구축물("단일 렌티바이러스 벡터", 도 15b)의 전달을 통해 달성될 수 있음을 보여주는 일련의 개략도이다. 도 15c는 이중 벡터 또는 단일 벡터 시스템에서 2일 동안 1uM GZV의 존재(진한 회색) 또는 부재(밝은 회색) 하에서 IL-10을 보여주는 막대 그래프이다.
도 16a-16b는 각각 ERT2 및 SMASh 도메인을 포함하는 세포질 격리 및 유도된 분해 synTF를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 활성화 및 조정가능한 불활성화를 보여주는 일련의 개략도 및 그래프이다. 도 16a는 N-말단 SMASh synTF 및 C-말단 SMASh synTF를 나타내는 개략도이다. 도 16b는 나타낸 바와 같이 4OHT의 제거 및 그라조프레비르의 존재 또는 부재 후 리포터 발현을 보여주는 선 그래프이다.
도 17은 C-말단 SMASh synTF(왼쪽 히트맵) 및 N-말단 SMASh synTF(오른쪽 히트맵)가 있는 ERT2 및 SMASh 도메인을 사용하여 인간 세포주에서 형광 단백질의 조정가능한 합성 전사 활성화를 보여주는 일련의 히트맵이다.
도 18은 KRAB-ZF-ERT2-SMASh(상단 그래프), HP1a-ZF-ERT2-SMASh(중간 그래프), 및 EED-ZF-ERT2-SMASh(하단 그래프)를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 선 그래프이다. "항상 꺼짐(+GZV)"은 그라조프레비르의 존재 및 4OHT의 부재를 나타낸다. "항상 꺼짐(-GZV)"은 그라조프레비르 및 4OHT 둘 다의 부재를 나타낸다. "항상 켜짐"은 그라조프레비르의 부재 및 4OHT의 존재를 나타낸다.
도 19서열식별번호: 4의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[p65]-[PYL](903 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고;
Figure pct00002
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며;
Figure pct00003
는 ABI1cs CO1 도메인을 나타내고;
Figure pct00004
는 2A 리보솜 스킵 서열을 나타내고;
Figure pct00005
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반(plain) 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은, 폴리펩티드를 [ABI]-[ZF] 및 [p65]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [p65]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(p65)가 커플링될 수 있다.
도 20서열식별번호: 5의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[KRAB]-[PYL](808 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고;
Figure pct00006
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며;
Figure pct00007
는 ABI1cs CO1 도메인을 나타내고;
Figure pct00008
는 2A 리보솜 스킵 서열을 나타내고;
Figure pct00009
는 KRAB 억제 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은 폴리펩티드를 [ABI]-[ZF] 및 [KRAB]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [KRAB]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(KRAB)가 커플링될 수 있다.
도 21서열식별번호: 6의 주석이 달린 서열인, [ZF]-[p65]-[ERT2](692 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고;
Figure pct00010
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00011
는 ERT2 도메인을 나타내고;
Figure pct00012
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 22서열식별번호: 7의 주석이 달린 서열인, [KRAB]-[ZF]-[ERT2](605 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고;
Figure pct00013
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00014
는 ERT2 도메인을 나타내고;
Figure pct00015
는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 23서열식별번호: 8의 주석이 달린 서열인, [ZF]-[NS3]-[p65](704 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고;
Figure pct00016
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고;
Figure pct00017
는 NS3 도메인을 나타내고;
Figure pct00018
는 HA 태그를 나타내고;
Figure pct00019
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 24서열식별번호: 9, [KRAB]-[NS3]-[ZF](609 aa)의 주석이 달린 서열을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고;
Figure pct00020
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고;
Figure pct00021
는 NS3 도메인을 나타내고;
Figure pct00022
는 HA 태그를 나타내고;
Figure pct00023
는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 25서열식별번호: 10의 주석이 달린 서열인, [ZF]-[p65]-[ERT2]-[SMASh](998 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00024
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00025
는 ERT2 도메인을 나타내고;
Figure pct00026
는 NS3 절단 부위를 나타내고;
Figure pct00027
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00028
는 NS3 부분 헬리카제를 나타내고;
Figure pct00029
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 26서열식별번호: 11로 주석이 달린 서열인, [SMASh]-[ZF]-[p65]-[ERT2](997 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00030
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00031
는 ERT2 도메인을 나타내고;
Figure pct00032
는 NS3 절단 부위를 나타내고;
Figure pct00033
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00034
는 NS3 부분 헬리카제를 나타내고;
Figure pct00035
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 27서열식별번호: 12로 주석이 달린 서열, [ZF]-[p65]-[SMASh](728 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00036
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00037
는 NS3 절단 부위를 나타내고;
Figure pct00038
는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00039
는 NS3 부분 헬리카제를 나타내고;
Figure pct00040
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 28서열식별번호: 13의 주석이 달린 서열, [KRAB]-[ZF]-[ERT2]-[SMASh](878 aa)를 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00041
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00042
는 NS3 절단 부위를 나타내고;
Figure pct00043
는 KRAB 리프레서 도메인을 나타내고;
Figure pct00044
는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00045
는 NS3 부분 헬리카제를 나타내고;
Figure pct00046
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 29서열식별번호: 14의 주석이 달린 서열인, [HP1a]-[ZF]-[ERT2]-[SMASh], (1003 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00047
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00048
는 NS3 절단 부위를 나타내고;
Figure pct00049
는 HP1a 리프레서 도메인을 나타내고;
Figure pct00050
는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00051
는 NS3 부분 헬리카제를 나타내고;
Figure pct00052
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 30서열식별번호: 15의 주석이 달린 서열인, [EED]-[ZF]-[ERT2]-[SMASh](1253 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고;
Figure pct00053
는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고;
Figure pct00054
는 NS3 절단 부위를 나타내고;
Figure pct00055
는 HP1a 리프레서 도메인을 나타내고;
Figure pct00056
는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고;
Figure pct00057
는 NS3 부분 헬리카제를 나타내고;
Figure pct00058
는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 31은 인간 게놈에 직교하는 합성 전사 오퍼레이터 서열의 동정을 나타내는 일련의 그래프이다. "Biostrings"으로 명명된 생물정보학 문자열 매칭 알고리즘을 사용하여 인간 게놈에서 오퍼레이터 서열의 발생을 평가했다. 여기서 x축은 hg19 ref 어셈블리에서 특정 문자열(들)의 발생 횟수를 나타내고; 스케일은 다른 세트와 패널에 대해 변경됨에 주의해야 한다. 상단 패널에는 11개의 "합성 오퍼레이터"와 정확하거나 또는 모든 가능한 미스매치 서열의 인스턴스(instances)가 있다: 이 알고리즘은 이들에 대한 정확한 또는 1-2개의 미스매치 서열이 없음을 보여주었으며, 이는 서열 구성이 게놈적으로-이격된(genomically-distant) 것으로 고려될 수 있음을 시사한다. 여러 표준(canonical) TF 오퍼레이터 서열을 또한 인간 게놈과 비교하였다. 본 명세서에 설명된 합성 오퍼레이터는 유사하거나 더 짧은 길이의 이러한 "이종성(heterologous)" 인식 서열에 비해 더 나은 성능을 발휘한다.
본 명세서에 사용된 하기 약어는 다음과 같이 정의된다: synTF(합성 전사 인자); ZF(징크 핑거); HEK(인간 배아 신장 293 세포); ED(이펙터 도메인); AD(액티베이터 도메인); RD(리프레서 도메인); GOI(관심 유전자); OUT(아웃풋); DBM(DNA 결합 모티프); pUb(유비퀴틴 C 프로모터); p65(전사 인자 P65); minCMV(최소 사이토메갈로바이러스 프로모터); AAVS1(아데노-관련 바이러스 통합 부위 1); chr19(인간 염색체 19); GFP(녹색 형광 단백질); TPM(백만 분의 전사체, 즉, 시퀀싱된 샘플에 대한 RNA 전사체의 전체 풀에 걸친 각 개별 RNA 전사체의 정규화된 값); ABI(ABA-둔감); PYL(PYR1-유사, 단백질 피라박틴 내성 1-유사); ABA(앱시스산); ERT2(에스트로겐 수용체 리간드 결합 도메인의 돌연변이된 변이체), 4OHT(4-하이드록시타목시펜); NS3(HCV의 비구조 단백질 3); GZV 또는 GRZ(그라조프레비르); SMASh(소분자 보조 차단); a.u.(임의의 단위 또는 상대적인 방출 강도); IFNγ(인터페론 감마); IL-2(인터루킨 2); IL-4(인터루킨 4); CD19(분화 클러스터 19); mCh(mCherry); pSFFV(침묵-취약 비장 초점 형성 바이러스 프로모터); minTK(HSV 티미딘 키나제(TK) 프로모터로부터의 최소 프로모터 단편); 렌티(렌티바이러스).
상세한 설명
본 명세서에 개시된 것과 같은 방법 및 조성물에 사용하기 위한 synTF가 본 명세서에 기술되어 있으며, 여기서 synTF는 (i) 표적 핵산 서열(또는 표적 DNA 결합 모티프(DBM))에 결합하는 DNA 결합 도메인(DBD), (ii) 이펙터 도메인(ED) 및 조절인자 단백질(RP)을 포함하며, 여기서 조절인자 단백질은 DNA 결합 도메인(DBD)과 이펙터 도메인(ED)의 커플링 또는 연결을 제어(이러한 커플링은 또한 "매개체 도메인(mediator domain)"으로 지칭될 수 있음)하거나, 또는 ED의 세포 국재화를 제어하여, 그래서 ED와 DBD가 핵 내에서 부착되고/되거나 위치할 때, ED가 유전자를 프로모터에 번역 기계를 모집하거나 억제하는 기능을 발휘하여 관심 유전자의 유전자 발현을 조절할 수 있다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 다양한 입력에 의해 활성화되거나 억제될 수 있으며, 이의 비제한적 예는, 인듀서(예를 들어, 소분자), 광-유도성 제어(예를 들어, 이량체화, 조립, 국재화), 온도, pH, 인산화, 산소, 지질, 자기, 전기, 공간 메커니즘(예를 들어, 세포내 및/또는 세포외; 예를 들어, 합성 수용체 및/또는 가용성 인자), 내인성 리간드(예를 들어, 바이오마커), 세포 주기 상태, 고유 신호전달 경로, 또는 질병 및/또는 병원성 상태(예를 들어, 응집, 감염)를 포함한다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, SynTF의 조절인자 단백질은 프로테아제, 한 쌍의 유도성 근접 도메인(IPD), 전위 도메인(즉, 세포질 격리 단백질) 또는 유도된 분해 도메인으로부터 선택되며, 이들 각각은 본 명세서에서 그리고 아래에 더 상세히 기술된다.
유도성 또는 약물-제어가능한 합성 전사 인자의 4가지 일반적인 프레임워크가 본 명세서에 기술되어 있다: (1) 억제성 프로테아제 synTF로 지칭되는, 억제성 프로테아제를 포함하는 synTF; (2) 유도 근접 도메인 SynTF로 지칭되는, 유도 근접 도메인을 포함하는 synTF; (3) 세포질 격리 synTF로 지칭되는, 세포질 격리 도메인을 포함하는 synTF 시스템; 및 (4) 유도된 분해 도메인 synTF로 지칭되는, 유도 분해 도메인을 포함하는 synTF. 또한, 상기 synTF 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 벡터, 상기 synTF 폴리펩티드를 발현하는 세포, 상기 synTF 폴리펩티드를 포함하는 약제학적 조성물, 및 상기 synTF 폴리펩티드를 사용하는 방법이 기술된다.
포유류 세포를 포함하는 광범위한 진핵 세포 및 유기체에서 유전자 발현을 정밀하게 제어할 수 있는 조작된 전사 인자 단백질(synTF)의 부류 및 상응하는 반응성 인공 조작된 프로모터가 본 명세서에 기술되어 있다. 이러한 synTF는 숙주 게놈에서 감소되거나 최소한의 결합 잠재력(즉, 숙주 게놈에 대한 "직교" 활성)을 갖도록 특별히 설계된 것이다. 본 명세서에 기술된 synTF 단백질은 숙주 게놈 서열과 거리가 멀고 상이한 특정 18-20개 뉴클레오티드 서열을 표적화하고 결합하도록 설계된 조작된 징크 핑거(ZF) 어레이를 기반으로 하는 DNA 결합 도메인(DBD)을 포함하며, synTF 단백질은 선택된 호스트에서 사용된다. 이 전략은 synTF 단백질과 숙주 게놈의 비특이적 상호작용을 제한하며; 이러한 비특이적 상호작용은 이상적이지 않고, 그리하여 바람직하지 않다.
일부 양태에서, 본 명세서에 기술된 synTF는 하기 파라미터에 따라 설계된다: (1) 표적가능한 DNA 서열(ZF 결합 부위로도 알려짐)은 숙주 게놈에서 감소된 결합 잠재력을 갖도록 특이적으로 설계된 ZF 어레이에 대해 확인된 것이고; (2) ZF 어레이는 설계되고 조립되며; (3) synTF는 조작된(즉, 공유적으로 연결된) ZF 어레이를 전사 및/또는 후성유전적(epigenetic) 이펙터 도메인에 커플링함으로써 설계되고; (4) 상응하는 반응성 프로모터는 구성적 프로모터의 상류에 표적가능한 DNA 서열(즉, ZF 결합 부위)의 인스턴스를 배치함으로써 설계된다. 표적가능한 DNA 서열은 표적가능한 DNA 서열 상의 synTF의 점유가 유전자 발현에서 프로모터의 활성을 조절하도록 프로모터에 작동가능하게 연결된다. synTF와 표적가능한 DNA 서열-프로모터의 조합은, 내인성 유전자의 발현에 영향을 미치지 않거나 최소한으로 미치면서, 발현 시스템 내에 배치된 원하는 유전자의 발현을 위해, 인공적이고 확장가능하며 조절가능한 독특한 발현 시스템을 형성하며, 이는 내인성 유전자의 오프-사이트(off-site) 유전자 조절이 없거나 최소한임을 의미한다.
본 명세서에 기술된 synTF는 숙주 게놈에서 기능적 결합 잠재력이 감소되거나 최소화되어, 부분적으로, synTF에 의한 오프사이트 DNA 표적화가 없거나 최소인 이점을 제공한다. 또한, 본 명세서에 기술된 합성 ZF-기반 단백질(synTF)은 포유류 단백질 스캐폴드로부터 유래되어, 다른 원핵생물-유래 도메인에 비해 최소 수준의 면역원성을 부여한다. 다른 부류의 프로그래밍가능한 DNA-표적화 도메인과 대조적으로, 이러한 징크-핑거-기반 조절인자 단백질은 TALE 및 dCas9 단백질보다 상당히 작고(~4-5x), TALE 반복 단백질보다 덜 반복적이며, 렌티바이러스 패키징 한계에 의해 제한되지 아니하여, 렌티바이러스 운반 구축물에서 편리한 패키징을 가능하게 하고 다른 바람직한 제어 요소를 위한 공간을 제공할 수 있다.
I. 합성 전사 인자 도메인
다수의 양태에서, 하기 도메인 중 적어도 하나를 포함하는 synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템이 본 명세서에 기술된다: 전사 이펙터 도메인, DNA-결합 도메인, 억제성 프로테아제, 유도 근접 도메인, 세포질 격리 도메인, 유도된 분해 도메인으로 이루어진 군에서 선택된 적어도 하나의 조절인자 단백질, 적어도 하나의 링커 펩티드, 적어도 하나의 검출가능한 마커, 및/또는 자가-절단 펩티드, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템은 집합적으로(즉, 제1 폴리펩티드 및/또는 제2 폴리펩티드) 적어도 하기를 포함한다: 전사 이펙터 도메인; DNA-결합 도메인; 억제성 프로테아제, 유도 근접 도메인, 세포질 격리 도메인, 및/또는 유도된 분해 도메인으로 이루어진 그룹으로부터 선택되는 적어도 하나의 조절인자 단백질. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 적어도 하나의 링커 펩티드, 또는 적어도 하나의 검출가능한 마커, 및/또는 적어도 하나의 자가-절단 펩티드, 또는 이들의 임의의 조합을 추가로 포함한다. 본 명세서 설명된 특정 synTF는 제한으로 해석되어서는 아니된다. 예를 들어, 다음 조합이 본 명세에서 고려된다(예를 들어, 표 8 참조):
표 8: synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템에서 도메인의 예시적인 조합. 표 8에 나타낸 각각의 예시적인 synTF 폴리펩티드는 또한 전사 이펙터 도메인 및 DNA-결합 도메인을 포함한다. 도메인은 임의의 순서로 존재할 수 있다. "PRO"는 억제성 프로테아제를 나타낸다. "IPD"는 유도 근접 도메인을 나타낸다. "CS"는 세포질 격리 도메인을 나타낸다. "DD"는 유도된 데그론 도메인을 나타낸다. "LP"는 링커 펩티드를 나타낸다. "DM"은 검출가능한 마커를 나타낸다. "SP"는 자가-절단 펩티드를 나타낸다.
Figure pct00059
Figure pct00060
전사 이펙터 도메인(ED)
전사 이펙터 도메인(ED)을 포함하는 synTF가 본 명세서에서 기술되며, 이는 또한 본 명세서에서 이펙터 도메인으로 지칭될 수 있다. 본 명세서에 기술된 임의의 양태의 한 실시형태에서, synTF의 전사 이펙터 도메인(ED)은 전사 활성화 도메인(TA) 또는 전사 리프레서 도메인(본 명세서에서 전사 리프레서(TR)로도 지칭됨)이다. 예를 들어, 전사 이펙터 도메인은 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP64 활성화 도메인인, VP16의 4개의 탠덤 복사본으로 구성된 활성화 도메인; NFκB의 p65 활성화 도메인 또는 이의 기능적 단편; 엡스타인-바 바이러스 R 트랜스액티베이터(Rta) 활성화 도메인 또는 이의 기능적 단편; VP64, p65 및 Rta 활성화 도메인으로 구성된 3성분(tripartite) 액티베이터(여기서 3성분 액티베이터는 VPR 활성화 도메인으로 알려져 있음); 미니VPR; p300 HAT 코어 활성화 도메인으로 알려진, 인간 E1A-연관 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인; CBP HAT 도메인; KRAB(Kruppel Associated Box) 억제 도메인; KRAB-MeCP2; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 리프레서 도메인; HDAC4 도메인; HP1 알파 억제 도메인; 및 EED(배아 외배엽 발달) 리프레서 도메인으로 이루어진 군에서 선택된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5, 또는 전사 이펙터 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 전사 이펙터 도메인을 포함한다. 복수의 전사 이펙터 도메인을 포함하는 실시형태에서, 복수의 전사 이펙터 도메인은 상이한 개별 전사 이펙터 도메인 또는 동일한 전사 이펙터 도메인의 복수 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 전사 ED는 전사 액티베이터(TA) 도메인이다. 본 명세서에 사용되는 용어 "전사 액티베이터" 도메인은 유전자 발현을 증가시키는 이펙터를 지칭한다. 임의의 양태의 일부 실시형태에서, TA는 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택된다. 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: 미국 특허 제10,138,493호; 미국 특허 제10,590,182호; Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; Vora et al., Rational design of a compact CRISPR-Cas9 activator for AAV-mediated delivery, bioRxiv 2018 doi.org/10.1101/298620; Chavez et al., Nat Methods. 2015 April, 12(4): 326-328; Park et al., Cell. 2019 Jan 10, 176(1-2):227-238, e20; Hilton et al., Nature Biotechnology volume 33, pages 510-517(2015); Sajwan et al., Sci Rep. 2019; 9: 18104.
임의의 양태의 일부 실시형태에서, TA는 p65, 또는 이의 기능적 단편이다. 핵 인자 NF-카파-B p65 서브유닛으로도 알려진 전사 인자 p65는 인간에서 RELA 유전자에 의해 코딩되는 단백질이다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 69 또는 서열식별번호: 69에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 117 또는 서열식별번호: 117에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 118 또는 서열식별번호: 118의 일부, 예를 들어, 서열식별번호: 118의 잔기 150-261, 100-261, 200-261, 1-200, 1-50, 1-100, 또는 50-100을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 69, 117-121, 193-197 중 하나, 또는 이의 기능을 유지하는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 120(p65 100-261) 또는 동일한 기능을 유지하는 서열식별번호: 120에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 69, p65(NFkB의 아미노산 361-551) 활성화 도메인(191 aa)
Figure pct00061
서열식별번호: 117, p65 (전체 서열, 551 aa), 전사 인자 p65 이소형 1 [Homo sapiens], NCBI 참조 서열: NP_068810.3
Figure pct00062
서열식별번호: 118, p65 1-261 (261 aa)
Figure pct00063
서열식별번호: 119, p65 150-261 (112 aa)
Figure pct00064
서열식별번호: 120, p65 100-261 (162 aa)
Figure pct00065
서열식별번호: 121, p65 200-261 (62 aa)
Figure pct00066
서열식별번호: 193, p65 1-200 (200 aa)
Figure pct00067
서열식별번호: 194, p65 1-150 (150 aa)
Figure pct00068
서열식별번호: 195, p65 1-100 (100 aa)
Figure pct00069
서열식별번호: 196, p65 50-150 (101 aa)
Figure pct00070
서열식별번호: 197, p65 143-261 (119 aa)
Figure pct00071
임의의 양태의 일부 실시형태에서, TA는 Rta, 또는 이의 기능적 단편이다. Rta는 엡스타인-바 바이러스 R 트랜스액티베이터(Rta) 활성화 도메인이다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198 또는 서열식별번호: 198에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198의 일부, 예를 들어, 서열식별번호: 198의 잔기 75-190, 125-190, 50-175, 75-175, 100-175, 또는 125-175를 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198-204 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 198-204 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 200(Rta 125-190) 또는 동일한 기능을 유지하는 서열식별번호: 200에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 198, Rta (전체 서열, 1-190; 190 aa)
Figure pct00072
서열식별번호: 199, Rta (75-190; 116 aa)
Figure pct00073
서열식별번호: 200, Rta (125-190; 66 aa)
Figure pct00074
서열식별번호: 201, Rta (50-175; 126 aa)
Figure pct00075
서열식별번호: 202, Rta (75-175; 101 aa)
Figure pct00076
서열식별번호: 203, Rta (100-175; 76 aa)
Figure pct00077
서열식별번호: 204, Rta (125-175; 51 aa)
Figure pct00078
임의의 양태의 일부 실시형태에서, TA는 VPR, 또는 이의 기능적 단편이다. VPR은 VP64, p65 및 Rta 활성화 도메인으로 구성된 3성분 액티베이터이다. 임의의 양태의 일부 실시형태에서, VPR은 VP64(예를 들어, 서열식별번호: 208), p65(예를 들어, 서열식별번호: 69, 117-121 또는 193-197 중 어느 하나 또는 동일한 기능을 유지하는 서열식별번호: 69, 117-121 또는 193-197 중 어느 하나에 대해 적어도 85% 서열 동일성을 갖는 폴리펩티드), 및 Rta(예를 들어, 서열식별번호: 198-204 중 어느 하나 또는 동일한 기능을 유지하는 서열식별번호: 198-204 중 어느 하나에 대해 적어도 85% 서열 동일성을 갖는 폴리펩티드)를 포함한다. 임의의 양태의 일부 실시형태에서, VPR은 서열식별번호: 205, 206 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 205 또는 206 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 205, p65(100-261 aa; 서열식별번호: 120) 절단 및 RTA(125-190 aa; 서열식별번호: 200) 절단을 포함하는, miniVPR; 굵은 텍스트는 VP64(서열식별번호: 208)를 나타내고; 기울임꼴 텍스트는 SV40 NLS(서열식별번호: 65)를 나타내고; 굵은 기울임꼴 텍스트는 p65(100-261 aa; 서열식별번호: 120)를 나타내고; 이중 밑줄그어진 텍스트는 RTA(125-190 aa, 서열식별번호: 200)를 나타낸다.
Figure pct00079
Figure pct00080
서열식별번호: 206, 전체 VPR; 굵은 텍스트는 VP64(서열식별번호: 208)를 나타내고; 기울임꼴 텍스트는 SV40 NLS(서열식별번호: 65)를 나타내고; 굵은 기울임꼴 텍스트는 p65(서열식별번호: 118)를 나타내고; 이중 밑줄그어진 텍스트는 RTA(서열식별번호: 198)를 나타낸다.
Figure pct00081
임의의 양태의 일부 실시형태에서, TA는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 VP16의 4개의 탠덤 카피를 포함하는 VP64 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 207, 208 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 207 또는 208 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 207, VP16 (11 aa)
Figure pct00082
서열식별번호: 208, VP64(53aa), 굵은 텍스트로 나타낸 VP16 도메인을 지님,
Figure pct00083
.
임의의 양태의 일부 실시형태에서, TA는 p300 또는 이의 기능적 단편을 포함한다. 아데노바이러스 E1A-관련 세포 p300 전사 코-액티베이터 단백질은 염색질 리모델링을 통해 전사를 조절하는 히스톤 아세틸트랜스퍼라제로서 기능한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 209 또는 서열식별번호: 209에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 209의 일부, 예를 들어, 서열식별번호: 209의 잔기 1048-1664를 포함한다. 임의의 양태의 일부 실시형태에서, TA는 p300 HAT 코어 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 210 또는 서열식별번호: 210에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 209, 210, 또는 이의 기능을 유지하는 서열식별번호: 209 또는 210 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드 중 어느 하나를 포함한다.
서열식별번호: 209, 인간 아세틸트랜스퍼라제 p300(2414 aa), 굵은 텍스트는 코어 활성화 도메인을 나타냄
Figure pct00084
Figure pct00085
서열식별번호: 210, p300 HAT 코어 활성화 도메인 (617 aa)
Figure pct00086
임의의 양태의 일부 실시형태에서, TA는 CBP 또는 이의 기능적 단편을 포함한다. CBP(CREB(Cyclic AMP-Responsive Element-Binding Protein) 결합 단백질, CREBBP)는 다수의 다양한 전사 인자의 전사 공동활성화에 관여하며 고유 히스톤 아세틸트랜스퍼라제 활성을 가지고 있다. 임의의 양태의 일부 실시형태에서, CBP는 호모 사피엔스(Homo sapiens), 드로소필라 멜라노가스터(Drosophila melanogaster), 또는 상동성 CBP 단백질을 발현하는 임의의 다른 유기체로부터 유래된다. 임의의 양태의 일부 실시형태에서, TA는 CBP HAT 코어 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 211-213 중 하나, 또는 이의 기능을 유지하는 서열식별번호: 211-213 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 211, 호모 사피엔스 CBP, 히스톤 아세틸트랜스퍼라제(HAT)-도메인; CREB-결합 단백질 이소형 a[호모 사피엔스]의 잔기 1342-1649, NCBI 참조 서열: NP_004371.2; CREB-결합 단백질 이소형 b[호모 사피엔스]의 잔기 1304-1611, NCBI 참조 서열: NP_001073315.1.
Figure pct00087
서열식별번호: 212, 네지레(nejire), 이소형 E[Drosophila melanogaster]의 잔기 1954-2267, NCBI 참조 서열: NP_001259387.1, HAT_KAT11, 히스톤 아세틸화 단백질
Figure pct00088
서열식별번호: 213, 드로소필라 CBP(nejire)로부터의 aa 1696-2329, NCBI 참조 서열: NP_001259387.1, 브로모도메인, PHD 도메인, 및 HAT 도메인 포함
Figure pct00089
임의의 양태의 일부 실시형태에서, 전사 ED는 전사 리프레서(TR) 도메인이다. 본 명세서에 사용되는 용어 "전사 리프레서" 도메인은 유전자 발현을 감소시키는 이펙터를 지칭한다. 임의의 양태의 일부 실시형태에서, TR은 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택된다. 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 제10,138,493호; 미국 특허 제10,590,182호; Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; Park et al., Cell. 2019 Jan 10, 176(1-2):227-238, e20; Yeo et al., Nature Methods volume 15, pages 611-616(2018); Bintu et al., Science. 2016 Feb 12; 351(6274): 720-724 참조.
임의의 양태의 일부 실시형태에서, TR은 KRAB, 또는 이의 기능적 단편을 포함한다. KRAB(Kr
Figure pct00090
ppel Associated Box) 도메인은 약 400개의 인간 징크 핑거 단백질-기반 전사 인자(KRAB 징크 핑거 단백질)에 존재하는 전사 억제 도메인의 카테고리이며, H3K9me3을 쓰거나 읽는 다른 염색질 조절인자(regulator)와 연관된다. 임의의 양태의 일부 실시형태에서, TR은 2분 리프레서 도메인인 KRAB-MeCP2를 포함한다. 임의의 양태의 일부 실시형태에서, KRAB 도메인은 서열식별번호: 72, 97, 214-215 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 72, 97, 214-215 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, TR은 MeCP2의 전사 억제 도메인(TRD) 도메인, 또는 이의 기능적 단편을 포함한다. 임의의 양태의 일부 실시형태에서, MeCP2의 전사 억제 도메인(TRD) 도메인은 서열식별번호: 216 또는 이의 기능을 유지하는 서열식별번호: 216에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 72: KRAB 리프레서 도메인 (96 aa)
Figure pct00091
서열식별번호: 97: KRAB 리프레서 도메인 (65 aa)
Figure pct00092
서열식별번호: 214, KRAB-MeCP2 (382 aa), KRAB 도메인(굵은 텍스트), 글리신-세린 풍부 링커(무형식(unformatted) 텍스트) 및 MeCP2의 전사 억제 도메인(TRD) 도메인(기울임꼴 텍스트)을 포함함.
Figure pct00093
Figure pct00094
서열식별번호: 215, KRAB 리프레서 도메인 (74 aa)
Figure pct00095
서열식별번호: 216, MeCP2의 전사 억제 도메인(TRD) 도메인(296 aa)
Figure pct00096
임의의 양태의 일부 실시형태에서, TR은 Hp1a 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. 이질염색질 단백질 1(드로소필라의 HP1a)은 함동원체(pericentric) 이질염색질과 두드러지게 연관되고 수반되는 유전자 침묵을 매개하는 보존된 진핵생물 염색체 단백질이다. HP1a는 크로모 도메인을 통해 H3K9me2/3에 결합하고, 크로모 섀도우 도메인을 통해 K9 상의 히스톤 H3을 메틸화하는 히스톤 메틸트랜스퍼라제 중 하나인 SU(VAR)3-9에 결합한다. 임의의 양태의 일부 실시형태에서, Hp1a 리프레서 도메인은 서열식별번호: 98 또는 이의 기능을 유지하는 서열식별번호: 98에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 98: Hp1a 리프레서 도메인(190 aa)
Figure pct00097
임의의 양태의 일부 실시형태에서, TR은 EED 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. EED(배아 외배엽 발달)는 라이신 27에서 히스톤 H3을 메틸화하는(H3K27me3), 폴리콤(Polycomb) 억제 복합체 2(PRC2)의 일부로 기능한다. 폴리콤 패밀리 구성원은 연속적인 세포 세대에 걸쳐 유전자의 전사 억제 상태를 유지하는 데 관여하는 다량체 단백질 복합체를 형성한다. 임의의 양태의 일부 실시형태에서, EED 리프레서 도메인은 서열식별번호: 99 또는 또는 이의 기능을 유지하는 서열식별번호: 99에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 99: EED 리프레서 도메인(440 aa)
Figure pct00098
임의의 양태의 일부 실시형태에서, TR은 DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. DNMT3B는 CpG 메틸화에 관여하는데, 이는 배아 발달, 각인, 및 X-염색체 불활성화에 중요한 후생적 변형이다. 임의의 양태의 일부 실시형태에서, DNMT3B 리프레서 도메인은 서열식별번호: 217 또는 이의 기능을 유지하는 서열식별번호: 217에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 217, DNMT3B 리프레서 도메인(792 aa), Uniprot 식별자 Q9UBC3-5, DNA(시토신-5)-메틸트랜스퍼라제의 DNM3B_HUMAN 이소형 5
Figure pct00099
임의의 양태의 일부 실시형태에서, TR은 히스톤 데아세틸라제 4(HDAC4) 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. HDAC4는 히스톤 H3 및 H4에서 아세틸기를 제거한다. 임의의 양태의 일부 실시형태에서, HDAC4 리프레서 도메인은 서열식별번호: 218 또는 이의 기능을 유지하는 서열식별번호: 218에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 218, HDAC4 도메인, GenBank: AAD29046.1 (1084 aa)
Figure pct00100
본 명세서에 기술된 임의의 양태의 또 다른 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF-함유 융합 단백질에서, 전사 이펙터 도메인은 후성유전적 이펙터 도메인이다. 예를 들어, 적어도 하나의 ZF 단백질 도메인은 (1) DNA 또는 히스톤 잔기(예를 들어, DNA 메틸트랜스퍼라제, 히스톤 메틸트랜스퍼라제, 히스톤 아세틸트랜스퍼라제)의 화학적 변형을 촉매하거나 (2) 화학적 변형(예를 들어, DNA 데메틸라제, DNA 디옥시게나제, DNA 히드록실라제, 히스톤 데메틸라제, 히스톤 데아세틸라제)을 제거하는 하나 이상의 염색질 조절 효소에 융합된다. 예를 들어, DNA 메틸트랜스퍼라제 DNMT(DNMT1, DNMT3)는 메틸기의 시토신으로의 전이를 촉매하며, 이는 일반적으로 억제 조절인자 단백질의 동원을 통해 전사 억제를 초래한다. 또 다른 예는 CBP/p300 히스톤 아세틸트랜스퍼라제이며, 이는 일반적으로 복수의 전사 인자와의 상호작용을 통한 전사 활성화와 연관된다. DNA 또는 히스톤 잔기(들) 상의 생화학적 마크의 침착(deposition)과 연관된 관련 후성유전적 이펙터 도메인은 HAT1, GCN5, PCAF, MLL, SET, DOT1, SUV39H, G9a, KAT2A/B 및 EZH1/2를 포함한다. DNA 또는 히스톤 잔기(들)로부터 생화학적 마크의 제거와 연관된 관련 후성유전적 이펙터 도메인은 TET1/2, SIRT 패밀리, LSD1, 및 KDM 패밀리를 포함한다.
DNA-결합 도메인
적어도 하나의 DNA-결합 도메인(DBD)을 포함하는 synTF가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5, 또는 그 이상의 DBD(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 DBD를 포함한다. 복수의 DBD를 포함하는 실시형태에서, 복수의 DBD는 상이한 개별 DBD 또는 동일한 DBD의 복수의 사본, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는 조작된 징크 핑거(ZF) 결합 도메인이다. 징크 핑거(ZF)는 DNA 및 RNA와 같은 핵산 서열과 상호작용할 수 있도록 하는 단백질 내의 핑거-형상의 접힘이다. 이러한 접힘은 당업계에 잘 알려져 있다. 접힘은 단백질의 특정 아미노산이 아연 원자에 결합하여 생성된다. 징크-핑거 함유 단백질(ZF 단백질이라고도 함)은 핵산 인식, 역전사 및 바이러스 조립뿐만 아니라 유전자의 발현을 조절할 수 있다.
ZF는 약 30개의 아미노산을 포함하는 비교적 작은 폴리펩티드 도메인이며, 접혀서 역평행 β-시트(ββα-접힘으로 알려짐)에 인접한 α-나선을 형성한다. 접힘은, 아래에서 추가로 설명되는 바와 같이, 4개의 크게 불변(징크 핑거 프레임워크 유형에 따라 다름) Cys 및/또는 His 잔기 사이의 아연 이온의 배위(co-ordination)에 의해 안정화된다. 천연 징크 핑거 도메인은 잘 연구되었고, 문헌에 기술되어 있으며, 예를 들어, Miller et al., (1985) EMBO J. 4: 1609-1614; Berg (1988) Proc. Natl. Acad. Sci. USA 85: 99-102; and Lee et al., (1989) Science 245: 635-637을 참조한다. ZF 도메인은, 이중-가닥 DNA 표적 서열에서 핵산 트리플릿, 또는 중첩 콰드로플릿(아래에 설명됨)을 인식하고 결합한다. 그러나, ZF는 또한 RNA 및 단백질에 결합하는 것으로 알려져 있다(Clemens, K. R. et al. (1993) Science 260: 530-533; Bogenhagen, D. F. (1993) Mol. Cell. Biol. 13: 5149-5158; Searles, M. A. et al. (2000) J. Mol. Biol. 301: 47-60; Mackay, J. P. & Crossley, M. (1998) Trends Biochem. Sci. 23: 1-4).
한 실시형태에서, 본 명세서에 사용되는 용어 "징크 핑거"(ZF) 또는 "징크 핑거 모티프"(ZF 모티프) 또는 "징크 핑거 도메인"(ZF 도메인)은 개별 "핑거"를 지칭하며, 이는 본 명세서의 다른 곳에서 기술된 바와 같이 아연 이온에 의해 안정화된 베타-베타-알파(ββ-α)-단백질 접힘을 포함한다. Zn-배위(coordinated) ββα 단백질 접힘은 "핑거"인 핑거-유사 돌출부를 생성한다. 각 ZF 모티프는 일반적으로 약 30개의 아미노산을 포함한다. 본 명세서에서 사용되는 용어 "모티프"는 구조적 모티프를 의미한다. ZF 모티프는 아연 이온에 의해 안정화된 ββα-접힘을 갖는 초이차(supersecondary) 구조이다.
한 실시형태에서, 당업계의 통상적인 용법에 따른 용어 "ZF 모티프"는 특정 기능과 동일시될 수 있는 폴리펩티드의 아미노산 서열의 이산된 연속 부분을 지칭한다. ZF 모티프는 대부분 구조적으로 독립적이며 다른 환경에서 구조와 기능을 유지할 수 있다. ZF 모티프는 구조적 및 기능적으로 독립적이기 때문에, 모티프가 도메인 자격도 갖추고 있으므로, 종종 ZF 도메인으로 지칭한다. 따라서, ZF 도메인은 이들의 표적 분자와 탠덤 접촉을 이루는 복수의 핑거-유사 돌출부를 포함하는 단백질 모티프이다. 일반적으로, ZF 도메인은 트리플릿 또는 (중첩) 콰드로플릿 뉴클레오티드 서열에 결합한다. 탠덤하게 배열된 인접 ZF 도메인은 링커 서열에 의해 함께 결합되어 어레이를 형성한다. ZF 펩티드는 일반적으로 ZF 어레이를 포함하고, 조합시 자연에는 존재하지 않는 복수의 "ZF 도메인"으로 구성된다. 따라서, 이들은 인공 또는 합성 ZF 펩티드 또는 단백질로 간주된다.
C2H2 징크 핑거(C2H2-ZFs)는 척추동물 DNA-결합 도메인의 가장 널리 퍼진 유형이며, 각각 3개(또는 그 이상)의 순차적인 염기와 접촉하는 순차 C2H2-ZF와 함께, 일반적으로 탠덤 어레이(ZFA)로 나타난다. C2H2-ZF는 모듈 방식으로 조립될 수 있다. 정의된 3-염기 특이성을 가진 일련의 모듈이 주어지면, 모듈식 조립은 또한 특정 DNA-결합 선호도로 인공 단백질을 구성하는 방법을 제시한다.
ZF-함유 단백질은 일반적으로 ZF(ZFA)의 어레이를 형성하는 ZF 모티프의 스트링 또는 사슬을 함유한다. 따라서, 천연 ZF 단백질은 2개 이상의 ZF, 즉 2개 이상의 ZF 모티프로 구성된 ZFA를 포함할 수 있으며, 이는 서로 직접적으로 인접할 수 있거나(즉, 짧은(표준) 링커 서열에 의해 분리될 수 있음), 또는 더 길고 유연하거나 구조화된 폴리펩티드 서열에 의해 분리될 수 있다. 직접적으로 인접한 ZF 도메인은 연접(contiguous) 핵산 서열, 즉 인접한 트리뉴클레오티드/트리플릿에 결합할 것으로 예상된다. 어떤 경우에, 교차-결합이 인접한 ZF와 이들 각각의 표적 트리플릿 사이에서도 발생할 수 있으며, 이는 표적 서열의 인식을 강화하거나 향상시키는 데 도움이 되고, 중첩 콰드로플렛 서열의 결합을 야기한다(Isalan et al., (1997) Proc Natl. Acad. Sci. USA, 94: 5617-5621). 이에 비해, 동일한 단백질 내의 원위(distant) ZF 도메인은 비-연접 핵산 서열 또는 심지어 상이한 분자(예를 들어, 핵산이라기 보다는 단백질)를 인식(또는 이에 결합)할 수 있다.
조작된 ZF-함유 단백질은 DNA-결합 징크 핑거 단백질 도메인(ZF 단백질 도메인) 및 단백질이 이의 효과를 발휘하는 또 다른 도메인(이펙터 도메인)으로 구성된 키메라 단백질이다. 이펙터 도메인은 전사 액티베이터 또는 리프레서, 메틸화 도메인 또는 뉴클레아제일 수 있다. DNA-결합 ZF 단백질 도메인은 조작된 징크 핑거 어레이(ZFA)를 포함할 수 있다. 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; US Patent 10,138,493; 미국 특허 출원 US20200002710A1.
조작된 ZF-함유 단백질은 비천연이고 적합하게는 3개 이상, 예를 들어 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 이상(예를 들어, 최대 약 30개 또는 32개) 탠덤하게 서로 인접하여 배열된 ZF 모티프를 포함하며, ZF 모티프 또는 ZFA의 어레이를 형성한다. 특히, 본 개시의 ZF-함유 synTF 단백질(ZF-함유 synTF 융합 단백질, 또는 간단히 synTF)은 적어도 3개의 ZF, 적어도 4개의 ZF 모티프, 적어도 5개의 ZF 모티프, 또는 적어도 6개의 ZF 모티프, 적어도 7개의 ZF 모티프, 적어도 8개의 ZF 모티프, 적어도 9개의 ZF 모티프, 적어도 10개의 ZF 모티프, 적어도 11개 또는 적어도 12개의 ZF 모티프; 및 일부 경우에 적어도 18개의 ZF 모티프를 포함한다. 다른 실시형태에서, ZF synTF는 최대 6, 7, 8, 10, 11, 12, 16, 17, 18, 22, 23, 24, 28, 29, 30, 34, 36, 40, 41, 42, 46, 47, 48, 54, 55, 56, 58, 59, 60개의 ZF 모티브를 함유한다. 일부 실시형태에서, ZF 어레이는 1개 이상의 ZF 모티프를 포함한다. 본 개시의 ZF-함유 synTF는 연접 직교 표적 핵산 결합 부위에 결합한다. 즉, 융합 단백질의 ZF 도메인에 포함되는 ZF 또는 ZFA는 직교 표적 핵산 서열에 결합한다.
한 실시형태에서, 본 명세서에 사용된 "조작된 합성 전사 인자" 또는 "조작된 synTF" 또는 "synTF"는 하기 특징 중 적어도 하나를 갖는 조작된 ZF-함유 키메라 단백질을 지칭하며 하나 이상을 가질 수 있다: 표적 직교 특이적 DNA 서열에 결합하고, 예를 들어, 숙주 진핵생물 게놈에서 감소되거나 최소한의 기능적 결합 잠재력을 가짐; 다른 원핵생물-유래 도메인에 비해 최소 수준의 면역원성을 부여하는, 포유류 단백질 스캐폴드에서 유래됨; 및 렌티바이러스 운반 구축물과 같은, 바이러스 운반 시스템에 패키징될 수 있음.
또 다른 실시형태에서, 본 명세서에 사용되는 용어 "조작된 합성 전사 인자" 또는 "조작된 synTF"("synTF" 또는 "ZF synTF"로 약칭됨)는 폴리펩티드인 합성 전사 인자를 함유하는 조작된 ZF, 즉, ZF 함유 합성 전사 인자 단백질을 지칭한다. 이러한 synTF는 특정 표적 핵산 서열에 결합하기 위한 ZF 어레이(ZFA)를 내부에 함유한다. synTF는 DNA-결합, ZF-함유 단백질 도메인 및 synTF가 유전자 발현에 영향을 미치는 이펙터 도메인을 포함하는 키메라 융합 단백질이다. 이러한 synTF는 유전자 발현을 조절할 수 있으며, 여기서 조절은 synTF의 DNA-결합, ZF-함유 단백질이 결합하는 특정 표적 핵산 서열에도 작동가능하게 연결된 프로모터에 작동가능하게 연결된 유전자의 발현을 증가 또는 감소시킴으로써 이루어진다.
본 명세서에 사용되는 용어 "ZF 어레이"("ZFA"로 약칭됨)는 탠덤하게 배열된 ZF 모티프의 어레이, 스트링, 또는 사슬을 지칭한다. ZFA는 6개의 ZF 모티프(6-핑거 ZFA), 7개의 ZF 모티프(7-핑거 ZFA), 또는 8개의 ZF 모티프(8-핑거 ZFA)를 가질 수 있다.
본 명세서에 사용되는 용어 "조작된 반응성/반응 프로모터", "조작된 프로모터" 또는 "조작된 반응성/반응 프로모터 요소"는, 직교 DNA 표적 서열이 각각의 전사 인자에 의해 결합될 때 직교 DNA 표적 서열이 프로모터에 반응적 특성을 부여하도록 프로모터 서열의 상류에 작동가능하게 연결된 적어도 하나의 직교 DNA 표적 서열을 갖는 프로모터 서열을 함유하는 핵산 구축물을 지칭하며, 반응적 특성은 상류 부근의 직교 DNA 표적 서열이 ZF-함유 합성 전사 인자에 의해 결합될 때 해당 프로모터로부터의 유전자 전사 개시가 향상되거나 억제되는지 여부이다. 프로모터 서열의 상류에 작동가능하게 연결된 하나 이상의 직교 DNA 표적 서열이 있을 수 있다. 하나의 직교 DNA 표적 서열이 있는 경우, 프로모터는 "1X" 프로모터로 지칭되며, 여기서 "1X"는 프로모터 구축물에 존재하는 직교 DNA 표적 서열의 수를 나타낸다. 예를 들어, 4X 반응성 프로모터는 조작된 반응 프로모터 구축물에서 4개의 직교 DNA 표적 서열을 갖는 것으로 확인될 것이고, 4개의 직교 DNA 표적 서열은 프로모터 서열의 상류에 있다.
ZF 단백질 도메인은 징크 핑거 어레이(ZFA)를 주요 구성요소로 하여 모듈식으로 설계되며, 각 ZFA는 6-8개 ZF 모티프로 이루어진다. ZF 단백질 도메인은 적어도 하나의 ZFA를 포함하고, 최대 10개의 ZFA를 포함할 수 있다. ZF 단백질 도메인은 하나에서 최대 10개의 ZFA를 가질 수 있다.
본 명세서에 기술된 synTF 또는 임의의 조작된 융합 단백질의 디자인은 또한 모듈식이며, 이는 synTF가 ZF 도메인(ZFA)의 모듈 및 이펙터 도메인/단백질 상호작용 도메인/리간드 결합 도메인/이량체화 도메인의 모듈로 구성됨을 의미하며, 개별 모듈은 본 명세서에 기술된 바와 같이 함께 공유적으로 접합되고, 개별 모듈은 서로 독립적으로 기능한다. ZFA의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9 및 최대 10까지 가능하다. 2개 이상의 ZFA가 있는 경우, ZFA는, 예를 들어, L1 펩티드 링커에 의해 NH2-에서 COOH- 말단 배열로 탠덤하게 서로 공유적으로 컨주게이션되어 ZFA의 어레이를 형성한다. ZFA는, 전체적으로, ZF 단백질 도메인을 형성하고, 이펙터 도메인 또는 조절인자 단백질의 N-말단 또는 C-말단에 공유적으로 연결된다. 본 명세서에 기술된 synTF 또는 ZF-함유 융합 단백질의 ZF 단백질 도메인에 존재하는 ZFA가 2개 이상 있는 경우, ZFA는 동일하거나, 상이할 수 있다.
본 명세서에 개시된 synTF의 ZF 단백질 도메인 또는 본 명세서에 기술된 ZF 함유 융합 단백질의 각 모듈 ZFA는 6 내지 8개의 ZF 모티프로 구성된다. 7개의 ZF 모티프를 갖는 단일 ZFA, 7-핑거 ZFA의 일예에 대한 도 2b 참조. ZF 모티프는 α 나선과 역평행 β 시트(αββ)로 구성된 작은 단백질 구조의 모티프이며, 핑거-유사 돌출 접힘, "핑거"를 안정화시키기 위해 모티프 내 2개의 히스티딘 잔기와 2개의 시스테인 잔기에 의해 하나의 아연 이온이 배위하는 것이 특징이다. 본 명세서에 개시된 synTF의 ZF 단백질 도메인 내의 ZF 모티프는 Cys2His2 징크 핑거 모티프이다. 한 실시형태에서, ZF 모티프는 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)의 펩티드를 포함하거나, 이로 본질적으로 이루어지거나, 또는 이로 이루어지며, 여기서 X는 임의의 아미노산, 아래 첨자 번호는 아미노산 잔기의 가능한 수를 나타내고, C는 시스테인이고, H는 히스티딘이고, (나선)은 짧은 알파 나선을 형성하는 α-6(또는 7) 연접 아미노산 잔기 펩티드이다.
나선은 가변적이다. 이 짧은 알파 나선은 ZF 모티프에서 2개의 히스티딘 잔기와 2개의 시스테인 잔기에 의한 아연 이온의 배위를 통해 형성된 핑거의 한 면을 형성한다. 각각의 ZFA에 대해, 그 안의 6 내지 8개의 ZF 모티프는 약 4 내지 6개의 아미노산 잔기를 갖는 펩티드 링커에 의해 NH2-에서 COOH- 말단으로 서로 연결되어 ZF 모티프 또는 ZF의 어레이를 형성한다. 각 ZF 모티프의 핑거-유사 돌출 접힘은 핵산 서열과 상호 작용하고 결합한다. 대략 2개의 ZF 모티프에 대해 한 펩티드 서열이 ~6개 염기쌍(bp) 핵산 서열과 상호작용하고 이에 결합한다. ZFA 내의 복수의 ZF 모티프는 직교 표적 DNA 서열과 접촉하는 핑거-유사 돌출부를 형성한다. 따라서, 예를 들어, 6개의 ZF 모티프 또는 핑거-유사 돌출부가 있는 ZFA(6-핑거 ZFA)는 ~18-20bp 핵산 서열과 상호작용하여 결합하고, 8-핑거 ZFA는 ~24-26bp 핵산 서열에 결합한다. 따라서, 한 실시양태에서, synTF의 ZF 단백질 도메인 내의 ZFA는 N'-[(식 1)-L2]6-8-C' 서열을 포함하거나, 이로 본질적으로 이루어거나, 이로 이루어지며, 여기서 아래첨자 6-8은 ZF 모티프의 수를 나타내고, L2는 4-6개의 아미노산 잔기를 갖는 링커 펩티드이며, N'- 및 C'-는 각각 펩타이드 서열의 N-말단 및 C-말단을 나타낸다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-C'이고, ZFA가 본질적으로 8개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]- ]-[(식 1)-L2]-[(식 1)-L2]-C'이다.
서열식별번호: 219:
Figure pct00101
본 명세서에 기술된 임의의 양태의 또 다른 실시형태에서, ZF 모티프는 화학식 2의 펩티드, [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)를 포함하며, 여기서 X는 임의의 아미노산이고, 아래 첨자 숫자는 가능한 아미노산 잔기 수, C는 시스테인, H는 히스티딘, (나선)은 짧은 알파 나선을 형성하는 6개(또는 7개) 연접 아미노산 잔기 펩티드이다. 따라서, 한 실시형태에서, synTF의 ZF 단백질 도메인 내의 ZFA는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 본질적으로 구성되거나, 또는 이로 구성되며, 여기서 아래첨자 6-8은 ZF 모티프의 수를 나타내고, L2는 4-6개의 아미노산 잔기를 갖는 링커 펩티드이며, N'- 및 C'-는 각각 펩티드 서열의 N-말단 및 C-말단을 나타낸다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-C'이고 ZFA가 본질적으로 8개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-]-[(식 2)-L2]-[(식 2)-L2]-C'이다
서열식별번호: 220:
Figure pct00102
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 단일 ZFA가 본 명세서에 기술된 synTF의 ZF 단백질 도메인인 경우, ZF 단백질 도메인 내의 ZFA는 다음 서열을 포함하거나, 본질적으로 구성되거나, 이로 구성된다: N'-PGERPFQCRICMRNFS-(나선 1)-HTRTHTGEKPFQCRICMRNFS-(나선 2)- HLRTHTGSQK PFQCRICMRNFS-(나선 3)-HTRTHTGEK PFQCRICMRNFS-(나선 4)-HLRTHTGSQKPFQCRICMRNFS-(나선 5)-HTRTHTGEK PFQCRICMRNFS-(나선 6)-HLRTHLR-C'(서열식별번호: 380), 여기서 (나선)은 짧은 알파 나선을 형성하고 또한 일반 텍스트 "xxxxxxx"로 표시될 수 있는 α-6(또는 7) 연접 아미노산 잔기 펩티드이다.
서열식별번호: 377, 징크 핑거 도메인 스캐폴드; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 일반 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6를 나타낸다.
Figure pct00103
서열식별번호: 101, 징크 핑거 도메인 스캐폴드, 여기서 [나선 1], [나선 2], [나선 3], [나선 4], [나선 5], 및 [나선 6]은 또한 일반 텍스트 "xxxxxxx"로 나타낼 수 있다.
Figure pct00104
서열식별번호: 76, 징크 핑거 도메인 스캐폴드; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타낸다. 일반 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6를 나타낸다.
Figure pct00105
임의의 양태의 일부 실시형태에서, 징크 핑거 스캐폴드는 서열식별번호: 76, 101, 377, 380, 또는 동일한 기능을 유지하는 서열식별번호: 76, 101, 377, 또는 380 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드 중 하나를 포함한다.
한 실시형태에서, 나선 1, 2, 3, 4, 5 및 6의 6개 모두는 서로 구별되고 상이하다. 다른 실시형태에서, 나선 1, 2, 3, 4, 5 및 6의 6개 모두는 서로 동일하다. 달리, 6개의 나선 중 적어도 2개가 서로 동일하고 같다. 다른 실시형태에서, ZFA의 6개 나선 중 적어도 3개는 서로 동일하고 같거나, ZFA의 6개 나선 중 적어도 4개는 서로 동일하고 같거나, 또는 ZFA의 6개 나선 중 적어도 5개는 서로 동일하고 같다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 개시된 개별 ZFA의 6 내지 8개의 ZF 모티프의 나선은 다음 그룹 1-11(예를 들어, 서열식별번호: 122-180, 192) 중 하나에 기재된 6-아미노산(또는 7-아미노산) 잔기 펩티드 서열로부터 선택된다. 일부 실시형태에서, 본 명세서에 개시된 개별 ZFA 내의 ZF 모티프 중 적어도 4개는 하기 그룹 1-11 중 하나에 개시된 6-아미노산(또는 7-아미노산) 잔기 펩티드 서열로부터 선택된다. 다른 실시형태에서, 모든 ZF 모티프, 즉 본 명세서에 개시된 개별 ZFA의 6개, 7개 또는 8개 ZF 모티프는 하기 그룹 1-11 중 하나에 개시된 6개(또는 7개) 아미노산 잔기 펩티드 서열로부터 선택된다. 임의의 개별 ZFA에서, ZFA를 포함하는 단일 ZF에 대해 선택된 나선은 ZFA에서 두 번 이상 반복될 수 있다. 이는 임의의 주어진 단일 ZFA에 대해, ZFA의 적어도 4개 또는 모든 나선이 본 명세서에 개시된 동일한 그룹으로부터 선택됨을 의미한다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성되는 경우, 이는 6개의 알파 나선이 있음을 의미한다. 개별 ZFA에 있는 ZF의 모든 6-8개 나선(나선 1; 나선 2; 나선 3; 나선 4; 나선 5; 나선 6; 나선 7; 나선 8)은 다음 그룹 1-11 중 하나에서 선택되며, 예를 들어, 6개의 나선은 모두 그룹 2에서 선택된다. 즉, 단일 ZFA를 구성하는 모든 ZF의 나선은 모두 동일한 그룹에서 나온다. 대안적으로, 6개의 나선 중 적어도 4개는 그룹 1-11에서 선택된 한 그룹인 동일한 그룹에서 선택된다. 예를 들어, 6개의 나선 중 4개는 그룹 5에서 선택되고, 6-ZF 모티프 ZFA의 나머지 2개 나선은 다른 그룹 1-4, 6-11에서 선택되거나, 또는 짧은 알파 나선을 형성하는 임의의 다른 나선일 수 있다. ZFA를 구성하는 다른 나머지 나선은 당업계에 공지된 것일 수 있다.
표 10: 그룹 1-4 나선
Figure pct00106
Figure pct00107
표 11: 그룹 5-7 나선
Figure pct00108
표 12: 그룹 8-11 나선
Figure pct00109
나선이 그룹 1에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 ZFA에서 6개 나선의 조합 및 배열의 비제한적 예(그룹 1 ZFA 나선 콤보)는 다음과 같다:
ZF 1-1: N'-DEANLRR, DPSVLKR, QSANLLR, DPSSLKR,QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 124, 125, 126, 및 127)
ZF 1-2: N'-DEANLRR, DPSVLKR, QSANLLR, DPSSLKR,QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 124, 125, 126, 및 128)
ZF 1-3: N'-EEANLRR, DHSSLKR, QSANLLR, DPSSLKR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 124, 125, 126, 및 127)
ZF 1-4: N'-EEANLRR, DHSSLKR, QSANLLR, DPSSLKR QQTNLTR, ERRSLAR-C'(출현 순서로, 각각, 서열식별번호 129, 130, 124, 125, 126, 및 128)
ZF 1-5: N'-DEANLRR, DPSVLKR, QQTNLTR, ERRSLAR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 126, 128, 126, 및 127)
ZF 1-6: N'-DEANLRR, DPSVLKR, QQTNLTR, ERRSLAR QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 126, 128, 126, 및 128)
ZF 1-7: N'-EEANLRR, DHSSLKR, QQTNLTR, ERRSLAR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 126, 128, 126, 및 127)
ZF 1-8: N'-EEANLRR, DHSSLKR, QQTNLTR, ERRSLAR QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 126, 128, 126, 및 128).
나선이 그룹 2에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 존재하는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 2 ZFA 나선 콤보)는 다음과 같다:
ZF 2-1: N'-QRSSLVR, DMGNLGR, RSHDLTR, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 133, 134, 13, 및 136)
ZF 2-2: N'-QKQALTR, DRGNLTR, RSHDLTR, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 133, 134, 13, 및 136)
ZF 2-3: N'-QRSSLVR, DMGNLGR, RSHDLTV, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 139, 134, 13, 및 136)
ZF 2-4: N'-QKQALTR, DRGNLTR, RSHDLTV, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 139, 134, 13, 및 136)
ZF 2-5: N'-QRSSLVR, DMGNLGR, RSHDLTR, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 133, 134, 148, 및 149)
ZF 2-6: N'-QKQALTR, DRGNLTR, RSHDLTR, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 133, 134, 148, 및 149)
ZF 2-7: N'-QRSSLVR, DMGNLGR, RSHDLTV, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 139, 134, 148, 및 149)
ZF 2-8: N'-QKQALTR, DRGNLTR, RSHDLTV, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 139, 134, 148, 및 149)
나선이 그룹 3에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 3 ZFA 나선 콤보)는 다음과 같다:
ZF 3-1: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 142, 및 138)
ZF 3-2: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 143, 및 138)
ZF 3-3: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 142, 및 138)
ZF 3-4: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 143, 및 138)
ZF 3-5: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 142, 및 138)
ZF 3-6: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 143, 및 138)
ZF 3-7: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 142, 및 138)
ZF 3-8: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 143, 및 138)
임의의 양태의 일부 실시형태에서, QRNNLGR(서열식별번호: 192)이 QTNNLGR(서열식별번호: 141) 대신에 사용된다. 나선이 그룹 3에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 3 ZFA 나선 콤보)는, 다음과 같다:
ZF 3-1: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 142, 및 138)
ZF 3-2: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 143, 및 138)
ZF 3-3: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 142, 및 138)
ZF 3-4: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 143, 및 138)
ZF 3-5: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 142, 및 138)
ZF 3-6: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 143, 및 138)
ZF 3-7: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 142, 및 138)
ZF 3-8: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 143, 및 138).
나선이 그룹 4로부터 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 4 ZFA 나선 콤보)는, 다음과 같다.
ZF 4-1: N'-QQTNLTR, QGTSLAR, VRHNLTR, DKSVLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 140, 13, 및 136)
ZF 4-2: N'-QQTNLTR, QGTSLAR, VRHNLTR, DKSVLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 140, 148, 및 149)
ZF 4-3: N'-QQTNLTR, QGTSLAR, VRHNLTR, DHSNLSR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 150, 13, 및 136)
ZF 4-4: N'-QQTNLTR, QGTSLAR, VRHNLTR, DHSNLSR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 150, 148, 및 149)
ZF 4-5: N'-QQTNLTR, QSTSLQR, VRHNLTR, DKSVLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 140, 13, 및 136)
ZF 4-6: N'-QQTNLTR, QSTSLQR, VRHNLTR, DKSVLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 140, 148, 및 149)
ZF 4-7: N'-QQTNLTR, QSTSLQR, VRHNLTR, DHSNLSR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 150, 13, 및 136)
ZF 4-8: N'-QQTNLTR, QSTSLQR, VRHNLTR, DHSNLSR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 150, 148, 및 149)
나선이 그룹 5에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 5 ZFA 나선 콤보)는, 다음과 같다:
ZF 5-1: N'-NMSNLTR, DRSVLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 154, 155, 156, 및 156)
ZF 5-2: N'-QLANLAR, DQTTLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 154, 155, 156, 및 156)
ZF 5-3: N'-NMSNLTR, DRSVLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 159, 155, 156, 및 156)
ZF 5-4: N'-QLANLAR, DQTTLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 159, 155, 156, 및 156)
ZF 5-5: N'-NMSNLTR, DRSVLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 154, 155, 156, 및 156)
ZF 5-6: N'-QLANLAR, DQTTLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 154, 155, 156, 및 156)
ZF 5-7: N'-NMSNLTR, DRSVLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 159, 155, 156, 및 156)
ZF 5-8: N'-QLANLAR, DQTTLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 159, 155, 156, 및 156)
나선이 그룹 6에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 6 ZFA 나선 콤보)는, 다음과 같다:
ZF 6-1: N'-QQTNLTR, QGGNLAL, DHSSLKR, RADMLRR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 161, 13, 및 136)
ZF 6-2: N'-QQTNLTR, QGGNLAL, DHSSLKR, RADMLRR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 161, 148, 및 149)
ZF 6-3: N'-QQTNLTR, QKANLGV, DHSSLKR, RADMLRR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 161, 13, 및 136)
ZF 6-4: N'-QQTNLTR, QKANLGV, DHSSLKR, RADMLRR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 161, 148, 및 149)
ZF 6-5: N'-QQTNLTR, QGGNLAL, DHSSLKR, RLDMLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 163, 13, 및 136)
ZF 6-6: N'-QQTNLTR, QGGNLAL, DHSSLKR, RLDMLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 163, 148, 및 149)
ZF 6-7: N'-QQTNLTR, QKANLGV, DHSSLKR, RLDMLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 163, 13, 및 136)
ZF 6-8: N'-QQTNLTR, QKANLGV, DHSSLKR, RLDMLAR,EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 163, 148, 및 149)
나선이 그룹 7에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 7 ZFA 나선 콤보)는, 다음과 같다:
ZF 7-1: N'-QRSSLVR, QRGNLNM, RPQELRR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 165, 130, 166, 및 167)
ZF 7-2: N'-QRSSLVR, QQGNLQL, RPQELRR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 165, 130, 166, 및 167)
ZF 7-3: N'-QRSSLVR, QRGNLNM, RRQELTR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 169, 130, 166, 및 167)
ZF 7-4: N'-QRSSLVR, QQGNLQL, RRQELTR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 169, 130, 166, 및 167)
ZF 7-5: N'-QRSSLVR, QRGNLNM, RPQELRR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 165, 130, 166, 및 149)
ZF 7-6: N'-QRSSLVR, QQGNLQL, RPQELRR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 165, 130, 166, 및 149)
ZF 7-7: N'-QRSSLVR, QRGNLNM, RRQELTR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 169, 130, 166, 및 149)
ZF 7-8: N'-QRSSLVR, QQGNLQL, RRQELTR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 169, 130, 166, 및 149)
나선이 그룹 8에서 선택되고 모티브가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 8 ZFA 나선 콤보)는, 다음과 같다:
ZF 8-1: N'-QASNLTR, DHSSLKR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 170, 130, 171, 131, 172, 및 149)
ZF 8-2: N'-QASNLTR, DHSSLKR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 170, 130, 171, 131, 173, and 149)
ZF 8-3: N'-QRSNLAR, DHSSLKR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 174, 130, 171, 131, 172, 및 149)
ZF 8-4: N'-QRSNLAR, DHSSLKR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 174, 130, 171, 131, 173, 및 149)
나선이 그룹 9에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 9 ZFA 나선 콤보)는, 다음과 같다:
ZF 9-1: N'-DSSNLRR, DQGNLIR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 135, 136, 171, 131, 172, 및 149)
ZF 9-2: N'-EKQNLAR, DPSNLRR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 148, 149, 171, 131, 172, 및 149)
ZF 9-3: N'-DSSNLRR, DQGNLIR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 135, 136, 171, 131, 173, 및 149)
ZF 9-4: N'-EKQNLAR, DPSNLRR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 148, 149, 171, 131, 173, 및 149)
나선이 그룹 10에서 선택되고 모티프가 NH2-에서 COOH- 말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 10 ZFA 나선 콤보)는, 다음과 같다:
ZF 10-1: N'-RRHGLDR, DHSSLKR, VRHNLTR, DHSNLSR, QRSSLVR, ESGHLKR-C' (출현 순서로, 각각, 서열식별번호 175, 130, 147, 150, 131, 및 176)
나선이 그룹 11에서 선택되고 모티프가 NH2-에서 COOH- 말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 11 ZFA 나선 콤보)는, 다음과 같다:
ZF 11-1: N'-QLSNLTR, DRSSLKR, QRSSLVR, RLDMLAR, VRHSLTR, ESGALRR-C' (출현 순서로, 각각, 서열식별번호 177, 178, 131, 163, 179, 및 180)
따라서, 일부 양태에서, ZF 단백질 도메인, 이펙터 도메인, 및 조절인자 단백질을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF-함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 본 명세서에 개시된 ZFA 나선 콤보 그룹 1-11 중 하나로부터 선택된 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함한다. ZF 단백질 도메인에 2개 이상의 ZFA(즉, ZF 어레이)가 있는 경우, 도메인의 각 ZFA는 본 명세서에 개시된 ZFA 나선 콤보 그룹 1-11 중 하나로부터 선택된 ZFA 나선 콤보를 가지며, 선택된 ZFA 나선 콤보 그룹은 synTF의 ZF 단백질 도메인 중의 각 ZFA에 대해 다르거나 중복될 수 있다. 예를 들어, synTF가 본질적으로 3개의 ZFA(3-ZFA 어레이에서 ZFA-1―ZFA-2―ZFA-3)와 이펙터 도메인으로 구성된 ZF 단백질 도메인을 포함하는 경우, ZFA-1은 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-2는 그룹 5 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-3은 그룹 7 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖는다. 다른 실시형태에서, 선택된 ZFA 나선 콤보 그룹은 synTF의 ZF 어레이에 대해 중복 또는 삼중화될 수 있다. 예를 들어, synTF의 3-ZFA 어레이-함유 ZF 단백질 도메인에서, ZFA 중 2개는 동일한 ZFA 나선 콤보 그룹, 예를 들어, 그룹 2에서 선택된 ZFA 나선 콤보를 포함하고, 제3 ZFA는 다른 ZFA 나선 콤보 그룹, 예를 들어, 그룹 4로부터 선택된 ZFA 나선 콤보를 갖는다. 동일한 그룹 2 ZFA 나선 콤보로부터 선택된 ZFA 나선 콤보를 갖는 2개의 ZFA는 나선 ZFA의 상이하거나 동일한 실제 조합 및 배열을 가질 수 있다. 예를 들어, synTF가 본질적으로 5개의 ZFA(5-ZFA 어레이에서 ZFA-1―ZFA-2―ZFA-3―ZFA-4―ZFA-5)와 이펙터 도메인으로 구성된 ZF 단백질 도메인으로 구성되는 경우, ZFA-1은 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-2는 그룹 5 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-3은 또한 그룹 1 ZFA 나선 콤보에서 선택한 ZFA 나선 콤보를 갖고, ZFA-4는 그룹 4 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-5는 그룹 2 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖는다. ZFA-1과 ZFA-3은 모두 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고 있지만, ZFA-1과 ZFA-3 내의 나선의 실제 조합과 배열은 다를 수도 있고 같을 수도 있다. 예를 들어, ZFA-1 및 ZFA-3는, 각각, ZFA 나선 콤보 ZF 1-1 및 ZF 1-5를 갖거나, 또는 ZFA-1 및 ZFA-3 둘 다 ZFA 나선 콤보 ZF 1-1을 갖는다.
다른 양태에서, ZF 단백질 도메인 및 이펙터 도메인을 포함하거나, ZF 단백질 도메인, 이펙터 도메인, 및 리간드 결합 도메인을 포함하거나, 또는 ZF 단백질 도메인 및 리간드 결합 도메인 또는 이량체화 도메인을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF-함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 본 명세서에 개시된 ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1, 및 ZF 11-1로 이루어진 군에서 선택된 적어도 하나의 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함한다.
임의의 양태의 일부 실시형태에서, ZF 단백질 도메인은 ZF1-3, ZF2-6, ZF3-5, ZF4-8, ZF5-7, ZF6-4, ZF7-3, ZF8-1, ZF9-2, ZF10-1 및 ZF11-1로 이루어진 그룹으로부터 선택된 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함하며, 이들은 본 명세서에서 ZF1, ZF2, ZF3, ZF4, ZF5, ZF6, ZF7, ZF8, ZF9, ZF10, 및 ZF11로 각각 지칭되기도 한다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 임의의 ZF-함유 융합 단백질에서, 기재된 단백질 내의 개별 ZFA는 직교 표적 DNA 서열(또한 본 명세서에서 DNA 결합 모티프로 지칭됨)에 결합하도록, 예컨대 다음과 같이 특이적으로 설계된다:
표적 1: 5' C GTC GAA GTC GAA GTC GAC C 3'(서열식별번호: 181)
표적 2: 5' G GAC GAC GTT ACG GAC GTA C 3'(서열식별번호: 182)
표적 3: 5' A GAC GTC GAA GTA GCC GTA G 3'(서열식별번호: 183)
표적 4: 5' G GAC GAC GCC GAT GTA GAA G 3'(서열식별번호: 184)
표적 5: 5' T GAA GCA GTC GAC GCC GAA G 3'(서열식별번호: 185)
표적 6: 5' G GAC GAC GCG GTC TAA GAA G 3'(서열식별번호: 186)
표적 7: 5' C GAC GAG GTC GCA TAA GTA G 3'(서열식별번호: 187)
표적 8: 5' A GAC GCA GTA TAG GTC GAA C 3'(서열식별번호: 188)
표적 9: 5' A GAC GCA GTA TAG GAC GAC G 3'(서열식별번호: 189)
표적 10: 5' C GGC GTA GCC GAT GTC GCG C 3'(서열식별번호: 190)
표적 11: 5' G GTC GTT GCG GTA GTC GAA G 3'(서열식별번호: 191)
임의의 양태의 일부 실시형태에서, ZF 결합 도메인은 서열식별번호: 181-191 중 적어도 하나를 포함하는 서열 또는 동일한 기능을 유지하는 서열식별번호: 181-191 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열에 특이적으로 결합한다.
임의의 양태의 일부 실시형태에서, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, 및 ZF 1-8은 표적 1에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7 및 ZF 2-8은 표적 2에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, 및 ZF 3-8은 표적 3에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8은 표적 4에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5- 5, ZF 5-6, ZF 5-7, 및 ZF 5-8은 표적 5에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4 , ZF 6-5, ZF 6-6, ZF 6-7, 및 ZF 6-8은 표적 6에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, 및 ZF 7-8은 표적 7에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 8-1, ZF 8-2, ZF 8-3 및 ZF 8-4는 표적 8에 결합한다. 임의의 양태의 일부 실시형태, ZF 9-1, ZF 9-2, ZF 9-3, 및 ZF 9-4는 표적 9에 결합한다. 임의의 양태의 일부 실시형태에서, ZF10-1은 표적 10에 결합한다. 임의의 양태의 일부 실시형태에서, ZF11-1은 표적 11에 결합한다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 표적 1-11로부터 선택된 표적 DNA 서열을 표적으로 하는, N'-[(식 1)-L2]6-8-C' 서열 또는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 이로 이루어지거나, 또는 본질적으로 이루어지는 ZFA가 본 명세서에 제공되며, 여기서 화학식 1은 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)이고 화학식 2는 [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)이다.
다른 양태에서, ZF 단백질 도메인 및 이펙터 도메인을 포함하거나, ZF 단백질 도메인, 이펙터 도메인, 및 리간드 결합 도메인을 포함하거나, 또는 ZF 단백질 도메인 및 리간드 결합 도메인 또는 이량체화 도메인을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF 함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 적어도 하나의 ZFA를 포함하고, 적어도 하나의 ZFA는 N'-[(식 1)-L2]6-8-C' 서열 또는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 이로 구성되거나, 또는 이로 본질적으로 구성되며, 상기 내의 ZFA(들)은 표적 1-11로부터 선택된 표적 DNA 서열을 표적으로 하고, 여기서 화학식 1은 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)이고 화학식 2는 [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)이다.
임의의 양태의 일부 실시형태에서, ZF 결합 도메인은 서열식별번호: 1-3 중 하나, 또는 동일한 기능을 유지하는 서열식별번호: 1-3 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 1, ZF1-3 (ZF1)의 서열
Figure pct00110
서열식별번호: 2, ZF3-5 (ZF3)의 서열
Figure pct00111
서열식별번호: 3, ZF10-1 (ZF10)의 서열
Figure pct00112
임의의 양태의 일부 실시형태에서, DBD는 3-유닛 ZF 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, 3-단위 ZF 단백질은 서열식별번호: 221-228 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 221-228 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 221 고친화도 스캐폴드(굵은 글씨는 돌연변이 잔기를 나타내고, 일반 텍스트 "xxxxxxx"는 3개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로, 각각, 나선 1, 나선 2, 나선 3을 나타냄)
Figure pct00113
서열식별번호: 222 저친화도 스캐폴드(굵은 글씨는 돌연변이된 잔기를 나타내고 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
Figure pct00114
임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는, 13-6, 14-3, 21-16, 36-4, 37-12, 42-10, 43-8, 54-8, 55-1, 62-1, 92-1, 93-10, 97-4, 129-3, 150-4, 151-1, 158-2, 172-5, 및 173-3으로 이루어진 그룹으로부터 선택되며; 예를 들어, Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; 미국 특허 제10,138,493호; 미국 특허 출원 US20200002710A1을 참조하며, 이들 각각의 전문은 본 명세서에 참조로 인용된다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는, 36-4(서열 223), 43-8(서열 224 또는 225), 42-4(서열 223), 43-8(서열 224 또는 225), 10(서열번호 226-227), 97-4(서열번호 228) 중 임의의 것에서 하나 이상 선택된다.
서열식별번호: 223, 36-4 (굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타낸다)
Figure pct00115
서열식별번호: 224 43-8 저친화도(굵은 글씨는 돌연변이된 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
Figure pct00116
서열식별번호: 225 43-8 고친화도(굵은 글씨는 돌연변이 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
Figure pct00117
서열식별번호: 226 42-10 저친화도(굵은 글씨는 돌연변이된 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
Figure pct00118
서열식별번호: 227 42-10 높은 친화도(굵은 글씨는 돌연변이 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
Figure pct00119
서열식별번호: 228, 97-4 (굵은 기울임꼴 텍스트는, 각각, 나선 1, 2 및 3을 나타냄)
Figure pct00120
임의의 양태의 일부 실시형태에서, DBD는 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합한다.
서열식별번호: 229는 36-4에 대한 예시적인 DBM(DNA 결합 모티프) 핵산 서열이다: c GAA GAC GCT g.
서열식별번호: 230 내지 서열식별번호: 232 43-8에 대한 예시적인 DBM 친화성 변이체 핵산 서열이다. 굵은 텍스트는 WT 서열에서 돌연변이된 잔기를 나타낸다. 서열식별번호: 230 43-8 DBM1 - aGAGTGAGGAc -이다. 서열식별번호: 231 43-8 DBM2 - aCAGTGAGGAc -이다. 서열식별번호: 232는 43-8 DBM3 - aTAGTGAGGAc -이다.
서열식별번호: 233-239는 42-10에 대한 예시적인 DBM 친화성 변이체 핵산 서열이다. 굵은 텍스트는 WT 서열에서 돌연변이된 잔기를 나타낸다. 서열식별번호: 233 42-10 DBM1 - aGACGCTGCTc - 이다. 서열식별번호: 234는 42-10 DBM2 - tGACGCTGCTt - 이다. 서열식별번호: 235는 42-10 DBM3 - aGACGGTGCTc - 이다. 서열식별번호: 236은 42-10 DBM4 - aCACGCTGCTc - 이다. 서열식별번호: 237은 42-10 DBM5 - aGACGCTACTc - 이다. 서열식별번호: 238은 42-10 DBM6 - aGACGCTGCTa - 이다. 서열식별번호: 239는 42-10 DBM7 - aGACTCTGCTc - 이다.
서열식별번호: 240은 97-4에 대한 예시적인 DBM(DNA 결합 모티프) 핵산 서열이다: TTA TGG GAG a.
억제성 프로테아제 도메인
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF는 조절인자 단백질을 포함하고, 여기서 조절인자 단백질은 억제성 프로테아제 도메인(본 명세서에서 PRO 또는 RPD로 지칭됨)이다. 본 명세서에 사용되는 용어 "억제성 프로테아제"는 특정 작용제(예를 들어, 프로테아제에 특이적으로 결합함)의 존재 또는 부재에 의해 불활성화될 수 있는 프로테아제를 지칭한다. 일부 실시형태에서, 억제성 프로테아제는 특이적 작용제의 부재 하에 활성이고(예를 들어, 프로테아제 절단 부위를 절단함) 특이적 작용제의 존재 하에 불활성이다(예를 들어, 프로테아제 절단 부위를 절단하지 않음). 일부 실시형태에서, 특이적 작용제는 프로테아제 저해제이다. 일부 실시형태에서, 프로테아제 저해제는 본 명세서에 기술된 바와 같은 주어진 억제성 프로테아제를 특이적으로 억제한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 억제성 프로테아제(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 억제성 프로테아제를 포함한다. 복수의 억제성 프로테아제를 포함하는 실시형태에서, 복수의 억제성 프로테아제는 상이한 개별 억제성 프로테아제 또는 동일한 억제성 프로테아제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
억제성 프로테아제의 비제한적 예는 C형 간염 바이러스 프로테아제(예를 들어, NS3 및 NS2-3); HIV1 프로테아제; 코로나바이러스(주요) 프로테아제; 담배 식각 바이러스(TEV) 프로테아제; 신호 펩티다제; 서브틸리신/켁신 패밀리의 전구단백질(proprotein) 전환효소(푸린(furin), PCI, PC2, PC4, PACE4, PC5, PC); 소수성 잔기(예를 들어, Leu, Phe, Val, 또는 Met)에서 절단하는 전구단백질 전환효소; Ala 또는 Thr과 같은 작은 아미노산 잔기에서 절단하는 전구단백질 전환효소; 프로피오멜라노코르틴 전환 효소(PCE); 크로마핀 과립 아스파르트산 프로테아제(CGAP); 프로호르몬 티올 프로테아제; 카복시펩티다아제(예를 들어, 카복시펩티다아제 E/H, 카복시펩티다아제 D 및 카복시펩티다아제 Z); 아미노펩티다제(예를 들어, 아르기닌 아미노펩티다제, 리신 아미노펩티다제, 아미노펩티다제 B); 프롤릴 엔도펩티다제; 아미노펩티다제 N; 인슐린 분해효소; 칼파인(calpain); 고분자량 프로테아제; 및 카스파제 1, 2, 3, 4, 5, 6, 7, 8, 및 9를 포함한다. 기타 프로테아제는 아미노펩티다제 N; 퓨로마이신 민감성 아미노펩티다제; 안지오텐신 전환 효소; 피로글루타밀 펩티다제 II; 디펩티딜 펩티다제 IV; N-아르기닌 이염기성 전환효소; 엔도펩티다제 24.15; 엔도펩티다제 24.16; 아밀로이드 전구체 단백질 세크레타제 알파, 베타 및 감마; 안지오텐신 전환 효소 세크레타제; TGF 알파 세크레타제; TF 알파 세크레타제; FAS 리간드 세크레타제; TNF 수용체-I 및 -II 세크레타제; CD30 세크레타제; KL1 및 KL2 세크레타제; IL6 수용체 세크레타제; CD43, CD44 세크레타제; CD 16-1 및 CD 16-11 세크레타제; L-셀렉틴 세크레타제; 엽산 수용체 세크레타제; MMP 1, 2, 3, 7, 8, 9, 10, 11, 12, 13, 14 및 15; 유로키나제 플라스미노겐 액티베이터; 조직 플라스미노겐 액티베이터; 플라스민; 트롬빈; BMP-1(프로콜라겐 C-펩티다제); 아담(ADAM) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11; 및 그랜자임 A, B, C, D, E, F, G 및 H를 포함하나, 이로만 제한되는 것은 아니다. 프로테아제에 대한 논의를 위해, 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: V. Y. H. Hook, Proteolytic and cellular mechanisms in prohormone and proprotein processing, RG Landes Company, Austin, Tex., USA (1998); N. M. Hooper et al., Biochem. J. 321: 265-279 (1997); Z. Werb, Cell 9 1: 439-442 (1997); T. G. Wolfsberg et al., J. Cell Biol. 131: 275-278 (1995); K. Murakami and J. D. Etlinger, Biochem. Biophys. Res. Comm. 146: 1249-1259 (1987); T. Berg et al., Biochem. J. 307: 313-326 (1995); M. J. Smyth and J. A. Trapani, Immunology Today 16: 202-206 (1995); R. V. Talanian et al., J. Biol. Chem. 272: 9677-9682 (1997); and N. A. Thomberry et a, J. Biol. Chem. 272: 17907-1791 1 (1997); 국제특허출원 WO2019118518; Rajakuberan et al., Methods Mol Biol. 2012;903:393-405; Gao et al. Science 21 Sep 2018: Vol. 361, Issue 6408, pp. 1252-1258; Tague et al., Nat Methods. 2018 Jul;15(7):519-522; Lin et al. PNAS June 3, 2008 105 (22) 7744-7749; 2020년 3월 27일에 출원된 미국 특허 출원 제16/832,751호.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 C형 간염 바이러스(HCV) 비구조 단백질 3(NS3)이다. p-70으로도 알려진 NS3는 C형 간염 바이러스 폴리프로테인(polyprotein)의 70kDa 절단 생성물인 바이러스 비구조 단백질이다. 631-잔기 HCV NS3 단백질은 N-말단 영역에 트립신/키모트립신-유사 세린 프로테아제 및 C-말단 영역에 헬리카제 및 뉴클레오시드 트리포스파타제를 함유하는 이중-기능 단백질이다. 기능적 세린 프로테아제 활성에 필요한 최소 서열은, "NS3a"로도 지칭될 수 있는 NS3 단백질의 N-말단 180개 아미노산을 포함한다. NS3 단백질의 N 말단으로부터 최대 14개 잔기의 결실은, 세린 프로테아제 활성을 유지한 채 용인된다. 따라서, 본 명세서에 기술된 억제성 프로테아제는 야생형 NS3 단백질의 적어도 잔기 14-180을 포함한다.
HCV는 "a" 및 "b" 서브타입으로 추가로 지정될 수 있는, 1 내지 7로 라벨링된 적어도 7개의 유전자형을 갖는다. 따라서, 억제성 프로테아제는 HCV 유전자형 1 NS3, HCV 유전자형 1a NS3, HCV 유전자형 1b NS3, HCV 유전자형 2 NS3, HCV 유전자형 2a NS3, HCV 유전자형 2b NS3, HCV 유전자형 3 NS3, HCV 유전자형 3a NS3, HCV 유전자형 3b NS3, HCV 유전자형 4 NS3, HCV 유전자형 4a NS3, HCV 유전자형 4b NS3, HCV 유전자형 5 NS3, HCV 유전자형 5a NS3, HCV 유전자형 5b NS3, HCV 유전자형 6 NS3, HCV 유전자형 6a NS3, HCV 유전자형 6b NS3, HCV 유전자형 7 NS3, HCV 유전자형 7a NS3, 또는 HCV 유전자형 7b NS3일 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 HCV NS3 유전자형, 변이체, 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS3 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS3 단백질의 잔기 1-180을 포함한다(예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Chao Lin, Chapter 6: HCV NS3-4A Serine Protease, Hepatitis C Viruses: Genomes and Molecular Biology, Editor: Tan SL, Norfolk (UK): Horizon Bioscience, 2006). 임의의 양태의 일부 실시형태에서, 억제성 프로테아제는, 프로테아제가 그의 절단 및/또는 결합 기능을 유지하도록, 본 명세서에 기술된 바와 같은 2, 3, 4, 5개, 또는 그 이상의 상이한 NS3 유전자형, 변이체, 또는 돌연변이체의 키메라이다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255 또는 동일한 기능을 유지하는 서열식별번호: 82, 91, 241-255 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255의 첫 번째(즉, N-말단) 잔기를 최대한 포함하지 않는다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255의 잔기 1-180, 2-180, 3-180, 4-180, 5-180, 6-180, 7-180, 8-180, 9-180, 10-180, 11-180, 12-180, 13-180, 14-180, 15-180, 16-180, 17-180, 18-180, 19-180, 20-180, 21-180, 22-180, 23-180, 24-180, 25-180, 26-180, 27-180, 28-180, 29-180, 또는 30-180을 포함한다.
서열식별번호: 82, NS3(유전자형 1A), 189 aa; 굵은 텍스트는 촉매 트라이어드의 His-57을 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 촉매 트라이어드의 Asp-81을 나타내고; 굵은 기울임꼴 텍스트 는 촉매 트라이어드의 Ser-139를 나타내고; 이중 밑줄그어진 텍스트는 Asp-168을 나타낸다.
Figure pct00121
서열식별번호: 91, NS3 프로테아제 도메인(유전자형 1A)
Figure pct00122
서열식별번호: 241, NS3(유전자형 1A), 180 aa(예를 들어, C형 간염 바이러스 유전자형 1 폴리프로테인의 잔기 1027-1206, NCBI 참조 서열: NP_671491.1 참조.
Figure pct00123
서열식별번호: 242, NS3 (유전자형 1B), 180 aa(예를 들어, 잔기 1-180 사슬 A, Ns3 프로테아제, PDB: 4K8B_A 참조)
Figure pct00124
서열식별번호: 243, NS3 (유전자형 2), 180 aa(예를 들어, C형 간염 바이러스 유전자형 2 폴리프로테인의 잔기 1031-1210, NCBI 참조 서열: YP_001469630.1 참조
Figure pct00125
서열식별번호: 244, NS3 (유전자형 3), 180 aa(예를 들어, C형 간염 바이러스 유전자형 3 폴리프로테인의 잔기 1033-1212, NCBI 참조 서열: YP_001469631.1 참조)
Figure pct00126
서열식별번호: 245, NS3 (유전자형 4), 180 aa(예를 들어, C형 간염 바이러스 유전자형 4 폴리프로테인의 잔기 1027-1206, NCBI 참조 서열: YP_001469632.1 참조)
Figure pct00127
서열식별번호: 246, NS3 (유전자형 5), 180 aa(예를 들어, C형 간염 바이러스 유전자형 5 폴리프로테인의 잔기 1028-1207, NCBI 참조 서열: YP_001469633.1 참조)
Figure pct00128
서열식별번호: 247, NS3 (유전자형 6), 180 aa(예를 들어, C형 간염 바이러스 유전자형 6 폴리프로테인의 잔기 1032-1211, NCBI 참조 서열: YP_001469634.1 참조)
Figure pct00129
서열식별번호: 248, NS3 (유전자형 7), 180 aa(예를 들어, C형 간염 바이러스 유전자형 7 폴리프로테인의 잔기 1031-1210, NCBI 참조 서열: YP_009272536.1 참조)
Figure pct00130
서열식별번호: 249, NS3 유전자형 1a(HCV-H), 180 aa
Figure pct00131
서열식별번호: 250, NS3 유전자형 1b (HCV-BK), 180 aa
Figure pct00132
서열식별번호: 251, NS3 유전자형 2a (HCV-J6), 180 aa
Figure pct00133
서열식별번호: 252, NS3 유전자형 2b (HCV-J8), 180 aa
Figure pct00134
서열식별번호: 253, NS3 유전자형 3a (HCV-Nz11), 180 aa
Figure pct00135
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 본 명세서에 기술된 바와 같은 1, 2, 3, 4, 5개, 또는 그 이상의 상이한 프로테아제 저해제에 대해 내성이다. HCV NS3 프로테아제 저해제에 대한 내성을 부여하는 NS3 아미노산 치환의 비제한적 예는 다음을 포함한다: V36L(예를 들어, 유전자형 1b), V36M(예를 들어, 유전자형 2a), T54S(예를 들어, 유전자형 1b), Y56F(예를 들어, 유전자형 1b), Q80L(예를 들어, 유전자형 1b), Q80R(예를 들어, 유전자형 1b), Q80K(예를 들어, 유전자형 1a, 1b, 6a), Y132I(예를 들어, 유전자형 1b), A156S(예를 들어, 유전자형 2a), A156G, A156T, A156V, D168A(예를 들어, 유전자형 1b), I170V(예를 들어, 유전자형 1b), S20N, R26K, Q28R, A39T, Q41R, I71V, Q80R, Q86R, P89L, P89S, S101N, A111S, P115S, S122R, R155Q, L144F, A150V, R155W, V158L, D168A, D168G, D168H, D168N, D168V, D168E, D168Y, E176K, T178S, M179I, M179V, 및 M179T. 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Sun et al., Gene Expr. 2018, 18(1): 63-69; Kliemann et al., World J Gastroenterol. 2016 Oct 28, 22(40): 8910-8917; 미국 특허 제7,208,309호; 제7,494,660호.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 본 명세서에 기술된 바와 같은 적어도 하나의 내성 돌연변이 또는 이의 임의의 조합을 포함하는 NS3 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 적어도 하나의 프로테아제 저해제에 대해 내성이지만 적어도 하나의 다른 프로테아제 저해제에 대해 반응성인 NS3 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 시스템은 다음을 포함한다: (a) 제1 프로테아제 저해제에 대해 내성이고 제2 프로테아제 저해제에 대해 감수성인 억제성 프로테아제(예를 들어, NS3)를 포함하는 제1 synTF 폴리펩티드; 및 (b) 제1 프로테아제 저해제에 대해 감수성이고 제2 프로테아제 저해제에 대해 내성인 억제성 프로테아제(예를 들어, NS3)를 포함하는 제2 synTF 폴리펩티드. 따라서, 제1 프로테아제 저해제의 존재는 제2 synTF 폴리펩티드의 활성을 조절할 수 있지만 제1 synTF 폴리펩티드는 조절할 수 없는 반면, 제2 프로테아제 저해제의 존재는 제1 synTF 폴리펩티드의 활성을 조절할 수 있지만 제2 synTF 폴리펩티드는 조절할 수 없다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 본 명세서에 기술된 바와 같은 1, 2, 3, 4, 5개, 또는 그 이상의 상이한 프로테아제 저해제에 민감하다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 아스나프레비르(예를 들어, 서열식별번호: 254 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 NS3AI로 지칭된다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 하기 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 텔라프레비르(예를 들어, 서열식별번호: 255 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 NS3TI로 지칭된다. 예를 들어, WO2019023164; Jacobs et al., StaPLs: versatile genetically encoded modules for engineering drug-inducible proteins, Nat Methods. 2018 Jul; 15(7): 523-526을 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
서열식별번호: 254, NS3AI; V36M, T54A, S122G 돌연변이는 각각 굵은 이중 밑줄그어진 텍스트로 제시된다
Figure pct00136
서열식별번호: 255, NS3TI; F43L, Q80K, S122R, D168Y 돌연변이는 각각 굵은 이중 밑줄그어진 텍스트로 제시된다
Figure pct00137
임의의 양태의 일부 실시형태에서, 폴리펩티드는 억제성 프로테아제에 대한 보조인자(cofactor)를 추가로 포함한다. 본 명세서에 사용되는 용어 "억제성 프로테아제에 대한 보조인자"는 억제성 프로테아제의 활성을 증가시키는 분자를 지칭한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 억제성 프로테아제에 대한 1, 2, 3, 4, 5개 또는 그 이상의 보조인자를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 각각의 억제성 프로테아제에 대해 하나의 보조인자를 포함한다. 억제성 프로테아제에 대한 복수의 보조인자를 포함하는 실시형태에서, 억제성 프로테아제에 대한 복수의 보조인자는 상이한 개별 보조인자 또는 동일한 보조인자의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 보조인자는 HSV NS4A 도메인이고, 억제성 프로테아제는 HSV NS3이다. 비구조 단백질 4a(NS4A)는 비구조 HCV 단백질 중 가장 작은 것이다. NS4A 단백질은, (1) NS3-4A 복합체를 소포체 및 미토콘드리아 외막의 외부 소엽(outer leaflet)에 고정하는 것, (2) NS3A 세린 프로테아제에 대한 보조인자로 역할하는 것, (3) NS3A 헬리카제 활성을 증강하는 것, 및 (4) NS5A 과인산화 조절 바이러스 복제를 조절하는 것을 포함하여, HCV 수명 주기에서 여러 기능을 한다. NS4A와 NS4B 사이의 상호작용은 게놈 복제를 제어하고, NS3와 NS4A 사이의 상호작용은 바이러스 조립에 소정 역할을 한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3에 대한 보조인자로서 작용하는 NS4a 폴리펩티드의 부분을 포함한다. 결실 분석은 54-잔기 NS4A 단백질의 중앙 영역(대략 잔기 21 내지 34)이 NS3 세린 프로테아제의 보조인자 기능에 필수적이며 충분함을 나타내었다. 따라서, 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 보조인자는 야생형 NS4A 단백질의 14-잔기 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는 HCV 유전자형 1 NS4A, HCV 유전자형 1a NS4A, HCV 유전자형 1b NS4A, HCV 유전자형 2 NS4A, HCV 유전자형 2a NS4A, HCV 유전자형 2b NS4A, HCV 유전자형 3 NS4A, HCV 유전자형 3a NS4A, HCV 유전자형 3b NS4A, HCV 유전자형 4 NS4A, HCV 유전자형 4a NS4A, HCV 유전자형 4b NS4A, HCV 유전자형 5 NS4A, HCV 유전자형 5a NS4A, HCV 유전자형 5b NS4A, HCV 유전자형 6 NS4A, HCV 유전자형 6a NS4A, HCV 유전자형 6b NS4A, HCV 유전자형 7 NS4A, HCV 유전자형 7a NS4A, 또는 HCV 유전자형 7b NS4A일 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 NS4A 유전자형, 변이체 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS4A 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS4A 단백질의 잔기 21-31을 포함한다(예를 들어, Chao Lin 2006 전게서 참조; 예를 들어, 표 13 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 48, 98, 137-156, 또는 서열식별번호: 48, 98, 137-156 중 하나와 동일한 기능을 유지하는 서열식별번호: 48, 98, 137-156 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 81, 93, 96, 255-276, 또는 동일한 기능을 유지하는 서열식별번호: 81, 93, 96, 255-276 중 하나의 서열에 대해 적어도 95% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 81, 93, 96, 255-276 중 어느 하나의 잔기 1-14, 1-13, 1-12, 1-11, 1-10, 2-14, 2-13, 2-12, 2-11, 2-10, 3-14, 3-13, 3-12, 3-11, 3-10, 4-14, 4-13, 4-12, 4-11, 또는 4-10을 포함한다.
서열식별번호: 81, NS4A (유전자형 1A), 13 aa,
Figure pct00138
서열식별번호: 93, NS4A 도메인(유전자형 1a)
Figure pct00139
서열식별번호: 96, NS4 (굵은 텍스트의 L6 링커 포함)
Figure pct00140
서열식별번호: 106, NS4A 도메인,
Figure pct00141
서열식별번호: 256, NS4A (유전자형 1B), 12 aa,
Figure pct00142
; 예를 들어, 사슬 C, 비구조 단백질, PDB: 4K8B_C 참조.
서열식별번호: 257, NS4A (유전자형 1), 14 aa (예를 들어, C형 간염 바이러스 유전자형 1 폴리프로테인의 잔기 1678-1691, NCBI 참조 서열: NP_671491.1 참조):
Figure pct00143
서열식별번호: 258, NS4A (유전자형 2), 14 aa (예를 들어, C형 간염 바이러스 유전자형 2 폴리프로테인의 잔기 1682-1695, NCBI 참조 서열: YP_001469630.1 참조:
Figure pct00144
서열식별번호: 259, NS4A (유전자형 3), 14 aa (예를 들어 C형 간염 바이러스 유전자형 3 폴리프로테인의 잔기 1684-1697, NCBI 참조 서열: YP_001469631.1 참조):
Figure pct00145
서열식별번호: 260, NS4A (유전자형 4), 14 aa (예를 들어, C형 간염 바이러스 유전자형 4 폴리프로테인의 잔기 1678-1691, NCBI 참조 서열: YP_001469632.1 참조):
Figure pct00146
서열식별번호: 261, NS4A (유전자형 5), 14 aa (예를 들어, C형 간염 바이러스 유전자형 5 폴리프로테인의 잔기 1679-1692, NCBI 참조 서열: YP_001469633.1 참조):
Figure pct00147
서열식별번호: 262, NS4A (유전자형 6), 14 aa (예를 들어, C형 간염 바이러스 유전자형 6 폴리프로테인의 잔기 1683-1696, NCBI 참조 서열: YP_001469634.1 참조):
Figure pct00148
서열식별번호: 263, NS4A (유전자형 7), 14 aa (예를 들어, C형 간염 바이러스 유전자형 7 폴리프로테인의 잔기 1682-1695, NCBI 참조 서열: YP_009272536.1 참조):
Figure pct00149
임의의 양태의 일부 실시형태에서, NS4A 서열은 표 13으로부터 선택된다. 한 실시형태에서, NS4A는 서열식별번호: 264-276의 잔기 21-31 또는 적어도 70% 동일한 서열을 포함한다.
표 13: 예시적인 NS4A 서열(예를 들어, Chao Lin 2006 전게서 참조). 잔기 21-31은 굵게 기재되어 있다.
Figure pct00150
Figure pct00151
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 본 명세서에 기술된 바와 같은 NS3 및 NS4A 유전자형, 변이체, 또는 돌연변이체의 임의의 조합을 포함할 수 있다. 한 실시형태에서, NS3 및 NS4A는 서로 동일한 유전자형으로부터 선택된다. 임의의 양태의 일부 실시형태에서, NS3은 유전자형 1a이고 NS4A는 유전자형 1b이다. 임의의 양태의 일부 실시형태에서, NS3은 유전자형 1b이고 NS4A는 유전자형 1a이다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3 억제성 프로테아제에 인접한 HSV NS4A 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, NS4A 도메인은 NS3 억제성 프로테아제의 N-말단이다. 임의의 양태의 일부 실시형태에서, NS4A 도메인은 NS3 억제성 프로테아제의 C-말단이다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 NS4A 도메인과 NS3 억제성 프로테아제 사이에 펩티드 링커를 포함한다. 링커(예를 들어, NS4A 도메인과 NS3 억제성 프로테아제 사이)의 비제한적 예는 SGTS(서열식별번호: 277) 및 GSGS(서열식별번호: 278)를 포함한다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드에서 본 명세서에 기술된 바와 같은 임의의 2개의 도메인은 펩티드 링커, 예를 들어, 이들 사이에 가요성 링커를 위치시킴으로써 단일 폴리펩티드로 연결될 수 있다. 본 명세서에 사용된 "펩티드 링커"는 길이가 약 2 내지 100개 아미노산인 올리고- 또는 폴리펩티드 영역을 지칭하며, 이는 본 명세서에 기술된 바와 같은 폴리펩티드의 임의의 서열을 함께 연결한다. 일부 실시형태에서, 링커는 인접한 단백질 도메인이 서로에 대해 자유롭게 이동할 수 있도록 글리신 및 세린과 같은 가요성 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 보장하는 것이 바람직한 경우 더 긴 링커가 사용될 수 있다. 링커는 절단가능하거나 절단 불가능할 수 있다.
본 명세서에는 프로테아제 절단 부위를 포함하는 synTF 폴리펩티드가 기술되어 있다. 본 명세서에 사용되는 용어 "프로테아제 절단 부위"는 억제성 프로테아제에 의해 인식되고 절단되는 특정 서열 또는 서열 모티프를 지칭한다. 프로테아제에 대한 절단 부위는 단백질분해성 절단 동안 프로테아제에 의해 인식되는 특정 아미노산 서열 또는 모티프를 포함하고, 일반적으로 절단가능한(scissile) 결합의 어느 한쪽에 주변(surrounding) 1 내지 6개 아미노산을 포함하며, 이는 프로테아제의 활성 부위에 결합하고 기질로 인식하는 데 사용된다. 임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는 억제성 프로테아제에 의해 특이적으로 결합되고 이에 의해 절단되는 임의의 부위일 수 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 2개의 프로테아제 절단 부위를 포함한다. 복수의 프로테아제 절단 부위를 포함하는 실시형태에서, 복수의 프로테아제 절단 부위는 상이한 개별 프로테아제 절단 부위 또는 동일한 프로테아제 절단 부위의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
비제한적인 예로서, HCV 복제 동안, NS3-4A 세린 프로테아제는 HCV 폴리프로테인 전구체의 4개 접합부에서 단백질분해성 절단을 담당한다: NS3/NS4A(자가-절단), NS4A/NS4B, NS4B/NS5A, 및 NS5A/NS5B. 따라서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 NS3/NS4A 절단 부위, NS4A/NS4B 절단 부위, NS4B/NS5A 절단 부위, 또는 NS5A/NS5B 절단 부위일 수 있다. 프로테아제 절단 부위는 HCV 유전자형 1, 유전자형 1a, 유전자형 1b, 유전자형 2, 유전자형 2a, 유전자형 2b, 유전자형 3, 유전자형 3a, 유전자형 3b, 유전자형 4, 유전자형 4a, 유전자형 4b, 유전자형 5, 유전자형 5a, 유전자형 5b, 유전자형 6, 유전자형 6a, 유전자형 6b, 유전자형 7, 유전자형 7a NS4A, 또는 유전자형 7b로부터의 프로테아제 절단 부위일 수 있다. 임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 NS3/NS4A 프로테아제 절단 부위 또는 이의 변이체 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS4A 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS4A 단백질의 잔기 21-31을 포함한다(예를 들어, Chao Lin 2006 전게서 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 서열식별번호: 78, 83, 87, 279-301, 또는 동일한 기능을 유지하는 서열식별번호: 78, 83, 87, 279-301 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 서열식별번호: 78, 83, 87, 279-301 중 어느 하나의 잔기 1-20, 1-19, 1-18, 1-17, 1-16, 1-15, 2-20, 2-19, 2-18, 2-17, 2-16, 2-15, 3-20, 3-19, 3-18, 3-17, 3-16, 3-15, 4-20, 4-19, 4-18, 4-17, 4-16, 4-15, 5-20, 5-19, 5-18, 5-17, 5-16, 또는 5-15를 포함한다.
서열식별번호: 78, NS5A/5B 커트 부위(CC), 10 aa,
Figure pct00152
서열식별번호: 83, NS4A/4B 커트 부위 (CS), 14 aa,
Figure pct00153
서열식별번호: 87, N3 절단 부위(NS4A/4B 커트 부위),
Figure pct00154
서열식별번호: 279,
Figure pct00155
서열식별번호: 280, NS5A/5B 커트 부위,
Figure pct00156
서열식별번호: 281, NS4A/4B 커트 부위,
Figure pct00157
표 14: 예시적인 NS3/NS4A 프로테아제 절단 부위(예를 들어, Chao Lin 2006 전게서 참조).
Figure pct00158
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 2개의 프로테아제 절단 부위를 포함하며, 하나는 NS3-NS4A 복합체의 N-말단 및 다른 하나는 NS3-NS4A 복합체의 C-말단에 있다(예를 들어, 표 15 참조). 임의의 양태의 일부 실시형태에서, 2개의 프로테아제 절단 부위는 동일한 절단 부위 또는 상이한 절단 부위일 수 있다.
표 15: 예시적인 프로테아제 절단 부위 조합. "N"은 NS3-NS4A 복합체의 N-말단을 나타낸다. "C"는 NS3-NS4A 복합체의 C-말단을 나타낸다. "3/4A"는 NS3/NS4A 절단 부위를 나타낸다. "4A/4B"는 NS4A/NS4B 절단 부위를 나타낸다. "4B/5A"는 NS4B/NS5A 절단 부위를 나타낸다. "5A/5B"는 NS5A/NS5B 절단 부위를 나타낸다.
Figure pct00159
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3/NS4A, NS4A/NS4B, NS4B/NS5A, 및 NS5A/NS5B 절단 부위의 임의의 공지된 유전자형, 변이체 또는 돌연변이체를 포함한다. 한 실시형태에서, 2개의 프로테아제 절단 부위는 서로 동일한 유전자형으로부터 선택된다.
임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는, synTF가 프로테아제 저해제의 부재 하에 억제성 프로테아제를 사용하여 자체 절단할 때, 새로 절단된 폴리펩티드(들)의 N-말단에서 생성된 아미노산이 폴리펩티드(들)가 다른 절단된 폴리펩티드에 비해 더 빠른 속도로 분해되고 더 짧은 반감기를 갖도록 위치되거나 조작된다. N-말단 규칙에 따르면, N-말단에 아미노산 His, Tyr, Gln, Asp, Asn, Phe, Leu, Trp, Lys, 또는 Arg를 포함하는 새로 절단된 폴리펩티드는 높은 분해율 및 짧은 반감기(예를 들어, 효모에서 10분 이하; 포유류 망상적혈구에서 1-5.5시간)를 나타낸다. 상대적으로, N-말단에 아미노산 Val, Met, Gly, Pro, Ala, Ser, Thr, Cys, Ile, 또는 Glu를 포함하는 새로 절단된 폴리펩티드는 더 낮은 분해율 및 더 긴 반감기(예를 들어, 효모에서 30분 또는 그 이상; 포유류 망상적혈구에서 1-100시간)를 나타낸다. 예를 들어, 문헌의 내용이 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Gonda et al., Universality and Structure of the N-end rule, The Journal of Biological Chemistry, Vol. 264 (28), pp. 16700-16712, 1989. 따라서, 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단에서 생성된 아미노산은 His, Tyr, Gln, Asp, Asn, Phe, Leu, Trp, Lys 또는 Arg이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단에서 생성된 아미노산은 Val, Met, Gly, Pro, Ala, Ser, Thr, Cys, Ile, 또는 Glu가 아니다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단은 서열식별번호: 79 또는 N-말단에서 His 또는 다른 고도로 분해된 아미노산을 유지하는 서열식별번호: 79의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 서열식별번호: 79, N-말단 규칙, 8 aa,
Figure pct00160
.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 촉매 활성인 억제성 프로테아제를 포함한다. HCV NS3의 경우, 촉매 트라이어드는 His-57, Asp-81, 및 Ser-139를 포함한다. 억제성 프로테아제와 관련하여, "촉매적으로 활성인"은 프로테아제 절단 부위에서 절단하는 활성을 지칭한다. 임의의 양태의 일부 실시형태에서, 촉매적으로 활성인 억제성 프로테아제는 촉매 트리어드를 유지하는, 즉 His-57, Asp-81, 및/또는 Ser-139에서 비동의적(non-synonymous) 치환을 포함하지 않는 본 명세서에 추가로 기재된 바와 같은 임의의 억제성 프로테아제일 수 있다.
임의의 양태의 일부 실시형태에서, synTF는 NS3 프로테아제 도메인, NS4A 및/또는 적어도 하나의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, synTF는 서열식별번호: 85 또는 102 또는 서열식별번호: 85 또는 102 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 85, NS3 도메인, 다음을 포함함: N-말단 규칙(서열식별번호: 79, 굵은 텍스트), AU1 태그(서열식별번호: 80, 기울임꼴 이중 밑줄그어진 텍스트), NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트)의 일부:
Figure pct00161
서열식별번호: 102, NS3 도메인, 다음을 포함함: NS3 절단 부위(서열식별번호: 78 및 83, 이중 밑줄그어진 텍스트), N-말단 규칙(서열식별번호: 79, 굵은 텍스트), AU1 태그(서열식별번호: 80, 기울임꼴 텍스트), NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 이중 밑줄그어진 텍스트):
Figure pct00162
임의의 양태의 일부 실시형태에서, synTF는 안정화가능한 폴리펩티드 연결(StaPL) 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, StaPL 도메인은 NS4A, NS3 프로테아제 도메인, 및 NS3 헬리카제 도메인의 일부를 포함한다. 임의의 양태의 일부 실시형태에서, 부분 NS3 헬리카제 도메인은 서열식별번호: 92, 105, 302, 또는 서열식별번호: 92, 105, 302의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 92, NS3 부분 헬리카제 도메인,
Figure pct00163
서열식별번호: 105, NS3 부분 헬리카제 도메인,
Figure pct00164
서열식별번호: 302, NS3 부분 헬리카제 도메인,
Figure pct00165
임의의 양태의 일부 실시형태에서, StaPL 도메인은, 예를 들어, 펩티드 링커를 통해 직접적으로 또는 간접적으로 연결된, EDVVCCHSI(서열식별번호: 280) 또는 DEMEECSQH(서열식별번호: 281)로부터 선택된 N 말단에 프로테아제 절단 부위를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, StaPL 도메인은 서열식별번호: 304-306, 또는 서열식별번호: 304-306의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 304, StaPL 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 )
Figure pct00166
임의의 양태의 일부 실시형태에서, StaPL 도메인은 하나 이상의 프로테아제 저해제에 대한 민감성을 증가시키는 하나 이상의 돌연변이를 포함하는 억제성 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이러한 돌연변이는 아스나프레비르(예를 들어, 서열식별번호: 254, 305 참조)에 대한 민감성을 증가시키기 때문에 이러한 StaPL은 또한 본 명세서에서 StaPLAI로 지칭된다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 하기 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 텔라프레비르(예를 들어, 서열식별번호: 255, 306 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 StaPLTI로 지칭된다.
서열식별번호: 305, StaPLAI 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 ); V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 제시되어 있음.
Figure pct00167
서열식별번호: 306, StaPLTI 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 ); F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 제시되어 있음
Figure pct00168
임의의 양태의 일부 실시형태에서, synTF는 TimeSTAMP 도메인(단백질의 연령 측정을 위한 시간 특이적 태그)을 포함한다. 임의의 양태의 일부 실시형태에서, TimeSTAMP는 억제성 프로테아제, 적어도 하나의 프로테아제 절단 부위, 및 검출가능한 마커를 포함한다. 검출가능한 마커는 프로테아제 저해제가 첨가될 때까지 억제성 프로테아제의 활성에 의해 번역 직후 synTF에서 제거되고, 그 후에 새로 합성된 synTF 폴리펩티드는 마커를 보유한다. TimeSTAMP는 단백질의 연령 측정에 대한 시간-특이적 태깅을 가능케하며, 매우 엄격한 시간 제어로 관심있는 새로 합성된 단백질의 민감하고 비섭동적인(nonperturbative) 시각화 및 정량화가 가능하다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 야생형 프로테아제와 비교하여 증가된 용해도를 나타낸다. 비제한적 예로서, NS3 프로테아제는 하기 돌연변이 또는 이들의 임의의 조합 중 적어도 하나를 포함할 수 있다: Leu13이 Glu로 치환된 것; Leu14가 Glu로 치환된 것; Ile17이 Gln으로 치환된 것; Ile18이 Glu로 치환된 것; 및/또는 Leu21이 Gln으로 치환된 것. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 서열식별번호: 307-315, 또는 서열식별번호: 307-315와 동일한 기능(예를 들어, 세린 프로테아제; 증가된 용해도)을 유지하는 서열식별번호: 307-315 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 억제성 프로테아제를 포함하며; 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 제6333186호 및 미국 특허 공개 특허 제US20020106642호를 참조.
서열식별번호: 307, 가용성 NS3, 182 aa
Figure pct00169
서열식별번호: 308, 가용성 NS3/NS4A, 195 aa
Figure pct00170
서열식별번호: 309, 가용성 NS3/NS4A, 195 aa
Figure pct00171
서열식별번호: 310, 가용성 NS3/NS4A, 197 aa
Figure pct00172
서열식별번호: 311, 가용성 NS3/NS4A, 197 aa
Figure pct00173
서열식별번호: 312, 가용성 NS3/NS4A, 197 aa
Figure pct00174
서열식별번호: 313, 가용성 NS3/NS4A, 197 aa
Figure pct00175
서열식별번호: 314, 가용성 NS3/NS4A, 197 aa
Figure pct00176
서열식별번호: 315, NS3aH1, 가용성 NS3/NS4A (S139A), 196 aa
Figure pct00177
Figure pct00178
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 특정 리간드에 대한 결합 친화도를 증가시키기 위한 돌연변이를 포함한다. 비제한적인 예로서, NS3aH1(예를 들어, 서열식별번호: 315)은 ANR 펩티드(예를 들어, 서열식별번호: GELDELVYLLDGPGYDPIHSD)와의 상호작용에 필요한 다음 4개의 돌연변이를 포함한다: A7S, E13L, I35V 및 T42S. 따라서, 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: A7S, E13L, I35V 및 T42S, 또는 이들의 임의의 조합.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 프로테아제 저해제와 조합된다. 본 명세서에 사용된, "~와 조합하여"는 동일한 제형에 임의의 분자적 또는 물리적 배열로, 예를 들어, 혼화물(admixture), 용액, 혼합물(mixture), 현탁액, 콜로이드, 에멀젼으로 존재하는 2가지 이상의 물질을 지칭한다. 제형은 균질하거나 불균일한 혼합물일 수 있다. 임의의 양태의 일부 실시형태에서, 활성 화합물(들)은 초구조(superstructure), 예를 들어, 나노입자, 리포솜, 벡터, 세포, 스캐폴드 등에 포함될 수 있으며, 상기 초구조는 용액, 혼합물, 혼합물, 현탁액 등에서, synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템을 이룬다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 억제성 프로테아제에 결합된 프로테아제 저해제에 결합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 억제성 프로테아제에 결합된 프로테아제 저해제에 특이적으로 결합된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 저해제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 프로테아제 저해제와 조합된다. 복수의 프로테아제 저해제를 포함하는 실시형태에서, 복수의 프로테아제 저해제는 상이한 개별 프로테아제 저해제 또는 동일한 프로테아제 저해제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 그라조프레비르(GZV 또는 GZP로 약칭됨; 예를 들어, PubChem CID: 44603531 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 다노프레비르(DNV; 예를 들어, PubChem CID: 11285588 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 승인된 NS3 프로테아제 저해제, 예컨대, 그라조프레비르, 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르, 및 텔라프레비르이나, 이로만 제한되는 것은 아니다. NS3 프로테아제 저해제의 추가의 비제한적인 예는 표 16에 열거되어 있다(예를 들어, 그 내용이 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: McCauley and Rudd, Hepatitis C virus NS3/4a protease inhibitors, Current Opinion in Pharmacology 2016, 30:84-92).
표 16: 예시적인 NS3/NS4A 프로테아제 저해제
Figure pct00179
Figure pct00180
Figure pct00181
Figure pct00182
Figure pct00183
Figure pct00184
데그론 도메인
여러 양태에서, 데그론 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "데그론 도메인"은, 예를 들어, 프로테아좀 또는 자가포식-리소좀 경로를 통해 부착된 단백질의 분해를 촉진하는 서열을 지칭하고; 임의의 양태의 일부 실시형태에서, 용어 "데그론", "분해 도메인" 및 "분해 도메인"은 "데그론 도메인"과 상호교환가능하게 사용될 수 있다. 일부 실시형태에서, 데그론 도메인은, 단백질에 융합될 때 단백질의 반감기가 적어도 2배 감소되도록 단백질을 불안정화시키는 폴리펩티드이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 데그론 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 데그론 도메인을 포함한다. 복수의 데그론 도메인을 포함하는 실시형태에서, 복수의 데그론 도메인은 상이한 개별 데그론 도메인 또는 동일한 데그론 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
많은 상이한 데그론 서열/신호(예를 들어, 유비퀴틴-프로테아좀 시스템의 것)가 기술되었으며, 이들 중 임의의 것이 본 명세서에 제공된 바와 같이 사용될 수 있다. 데그론 도메인은 세포 수용체에 작동가능하게 연결될 수 있지만, 데그론 도메인이 여전히 세포 수용체의 분해를 유도하는 기능을 하는 한, 이와 연접되거나 또는 바로 인접할 필요는 없다. 일부 실시형태에서, 데그론 도메인은 세포 수용체의 빠른 분해를 유도한다. 데그론 도메인과 단백질 분해에서의 이들의 기능에 대한 논의는, 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌을 참조: Kanemaki et al. (2013) Pflugers Arch. 465(3):4l9-425, Erales et al. (2014) Biochim Biophys Acta 1843(l):216-221, Schrader et al. (2009) Nat. Chem. Biol. 5(11): 815-822, Ravid et al. (2008) Nat. Rev. Mol. Cell. Biol. 9(9):679-690, Tasaki et al. (2007) Trends Biochem Sci. 32(1 1):520-528, Meinnel et al. (2006) Biol. Chem. 387(7):839- 851, Kim et al. (2013) Autophagy 9(7): 1100-1103, Varshavsky (2012) Methods Mol. Biol. 832: 1-11, and Fayadat et al. (2003) Mol Biol Cell. 14(3): 1268-1278; Chassin et al., Nature Communications volume 10, Article number: 2013 (2019); Natsume and Kanemaki Annu Rev Genet. 2017 Nov 27,51:83-102.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 다음을 포함하지만 이로만 제한되지 않는 유비퀴틴 태그를 포함한다: UbR, UbP, UbW, UbH, UbI, UbK, UbQ, UbV, UbL, UbD, UbN, UbG, UbY, UbT, UbS, UbF, UbA, UbC, UbE, UbM, 3xUbVR, 3xUbVV, 2xUbVR, 2xUbVV, UbAR, UbVV, UbVR, UbAV, 2xUbAR, 2xUbAV. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 억제성 프로테아제, 프로테아제 절단 부위, 및 데그론 도메인을 포함하는 복합체를 지칭하는 자가-절제(self-excising) 데그론을 포함한다. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 조건부(conditional) 데그론 도메인이며, 여기서 분해는 리간드(예를 들어, 데그론 스태빌라이저) 또는 온도 변화 또는 특정 파장의 빛과 같은 다른 인풋(input)에 의해 유도된다. 조건부 데그론 도메인의 비제한적 예는 eDHFR 데그론(예를 들어, TMP 인듀서); FKBP12(예를 들어, 라파마이신 유사체 인듀서); 온도 민감성 디히드로폴레이트 환원효소(R-DHFRts, 또는 ts-DHFR); HCV NS3/NS4A 데그론; 저온 데그론(lt-degron)으로 명명된 변형된 버전의 R-DHFRt; 옥신-유도성 분해(AID); 할로태그-소수성 태그(HaloTag-Hydrophobic Tag), HaloPROTAC, 및 dTAG 시스템(예를 들어, HyT13 또는 HyT36 인듀서); 감광성 데그론(PSD); 청색광-유도성 데그론(B-LID); 담배 식각 바이러스(TEV) 프로테아제-유도 단백질 불활성화(TIPI)-데그론 시스템; deGradFP(디그레이드 녹색 형광 단백질; 예를 들어, NSlmb-vhhGFP 발현에 의해 유도됨); 또는 기능의 회복을 위한 분할된 유비퀴틴(SURF, 예를 들어, 라파마이신에 의해 유도됨)을 포함한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 E. 콜라이(E. coli) 디히드로폴레이트 환원효소(eDHFR) 데그론이다. eDHFR 데그론은 포유류 세포와 C. 엘레간스(C. elegans)에서 외인성으로 발현된 단백질의 광범위한 고갈을 허용한다. eDHFR 데그론은 진핵 세포에서 무해한, 아래 나타낸, 항생제이며 데그론 스태빌라이저인 트리메토프림(TMP)에 단단히 결합하여 안정화된다.
Figure pct00185
eDHFR로 태깅된 단백질은 세포가 TMP에 노출되지 않으면 구성적으로 분해된다. 태깅된 단백질의 수준은 성장 배지에서 TMP 농도를 조절하여 직접적으로 제어할 수 있다. shRNA 방법과 달리 이 데그론-기반 전략은 고갈 역학이 천연 단백질 반감기에 의해 제한되지 않기 때문에, 안정한 단백질의 더 신속한 녹다운을 가능케하므로 유리하다. TMP는 최대 100배까지 용량-의존적 방식으로 DD-표적 단백질 융합을 안정화하여, 시스템에 상당한 동적 범위를 제공한다. 리간드 TMP는 단독으로 작동하며 제2 단백질과의 이량체화를 필요로하지 않는다. 이 시스템은 본 명세서에 기술된 synTF 폴리펩티드와 같은 막통과 단백질의 수준을 조절할 수 있을 정도로 효과적이다: 예를 들어, Schrader et al., Chem Biol. 2010 Sep 24, 17(9): 917-918; Ryan M. Sheridan and David L. Bentley, Biotechniques. 2016, 60(2): 69-74; Iwamoto et al., Chem Biol. 2010 Sep 24;17(9):981-8을 참조한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 FK506- 및 라파마이신-결합 단백질(FKBP12)(UniProtKB - P62942(FKB1A_HUMAN), 본 명세서에 참조로 통합됨), 또는 이의 변이체로부터 유래된 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, FKBP12 유래 아미노산 서열은 아미노산 위치 36에서 페닐알라닌(F)(메티오닌 없이 카운팅됨)에서 발린(V)(F36V)(FKBP12* 또는 FKBP*도 지칭됨)으로의 돌연변이를 포함한다. 임의의 양태의 일부 실시형태에서, 데그론 스태빌라이저는 하기에 나타낸 실드(Sheild)-1과 같은 라파마이신 유사체이다. 예를 들어, Banaszynski et al., Cell. 2006 Sep 8; 126(5): 995-1004; 미국 특허 출원 US20180179522; 미국 특허 제10,137,180호를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
Figure pct00186
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 데그론 도메인은 서열식별번호: 317 또는 318, 또는 동일한 기능(예를 들어, 분해, TMP 또는 Shield-1에 대한 결합)을 유지하는 서열식별번호: 317 또는 318의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 317, DHFR (V19A), 158 aa,
Figure pct00187
서열식별번호: 318, FK506- 및 라파마이신 결합 단백질(FKBP), 107 aa
Figure pct00188
임의의 양태의 일부 실시형태에서, 불안정화 데그론 도메인은 synTF 폴리펩티드의 거의 완전한 제거 또는 분해를 야기하는 적어도 하나의 돌연변이를 포함한다. DHFR(예를 들어, 서열식별번호: 317) 돌연변이의 비제한적 예는 다음을 포함한다: V19A, Y100I, G121V, H12Y, H12L, R98H, F103S, M42T, H114R, I61F, T68S, H12Y/Y100I, H12L/Y100I, R98H/F103S, M42T/H114R, 및 I61F/T68S, 또는 이들의 조합; 예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 미국 특허 제8173792호 참조.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 리간드-유도 분해(LID) 도메인을 포함한다. LID 도메인을 포함하는 단백질은 데그론 디스태빌라이저의 존재 하에 불안정화되고 분해된다. 임의의 양태의 일부 실시형태에서, 데그론 도메인의 LID 도메인은 데그론 디스태빌라이저에 결합하여, 부착된 단백질의 분해를 촉진할 수 있다. 시스템은 가역적이며 데그론 디스태빌라이저가 제거될 때 단백질은 불안정화되지 않고/않거나 분해되지 않는다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 데그론 도메인에 결합된 데그론 디스태빌라이저에 결합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 데그론 도메인에 결합된 데그론 디스태빌라이저에 특이적으로 결합된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 1, 2, 3, 4, 5개, 또는 그 이상의 데그론 디스태빌라이저와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 디스태빌라이저와 조합된다. 복수의 데그론 디스태빌라이저를 포함하는 실시형태에서, 복수의 데그론 디스태빌라이저는 상이한 개별 데그론 디스태빌라이저 또는 동일한 데그론 스태빌라이저의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, LID 데그론 도메인은 FK506- 및 라파마이신-결합 단백질(FKBP)을 포함하고, 예를 들어, 10-아미노산 링커(Gly4SerGly4Ser) 또는 본 명세서에 기술된 다른 링커와 같은 개재 링커와 함께, FKBP의 C 말단에 융합된 데그론을 추가로 포함한다. 임의의 양태의 일부 실시형태에서, FKBP(예를 들어, 서열식별번호: 318)의 C 말단에 융합된 데그론은 19개 아미노산 서열: TRGVEEVAEGVVLLRRRGN(서열식별번호: 319), 또는 동일한 기능을 유지하는 적어도 95% 동일한 서열을 포함한다. 소분자 실드-1의 부재 하에, 19-aa 데그론은 FKBP 융합 단백질에 결합되고, 단백질은 안정하다. 존재시, 실드-1은 FKBP에 단단히 결합하여, 19-aa 데그론을 대체하고 LID 도메인 및 임의의 융합된 파트너 단백질의 신속하고 진행적인 분해를 유도한다. 임의의 양태의 일부 실시형태에서, 데그론 디스태빌라이저는, 위에서 나타낸, 실드-1, 또는 이의 유사체이다: 예를 들어, Bonger et al., Nat Chem Biol. 2011 Jul 3;7(8):531-7을 참조한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 옥신-유도성 분해(AID)를 포함한다. AID에 융합된 단백질(인돌-3-아세트산 유도성 17 또는 AUX/IAA 전사 조절 계열 단백질로도 알려져 있음)은 신속하게 분해된다. 분해는 AID로 태깅된 단백질을 SKP1-CUL1-F-Box(SCF) 유비퀴틴 E3 리가제에 대한 옥신-의존적 방식으로 모집하여 이들의 유비퀴틸화 및 프로테아좀 분해를 초래하는, 식물 F-Box 단백질 TIR1의 이소성(ectopic) 발현을 필요로 한다. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 서열식별번호: 320의 잔기 65-133, 65-130, 70-130, 또는 70-120을 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 서열식별번호: 320 또는 321, 또는 동일한 기능을 유지하는 서열식별번호: 320 또는 321의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, Daniel et al., Nat Commun. 2018 Aug 17;9(1):3297을 참조하며, 그의 전문은 본 명세서에 참조로 인용된다.
서열식별번호: 320, AUX/IAA 전사 조절인자 패밀리 단백질 [Arabidopsis thaliana], NCBI 참조 서열: NP_171921.1, 229 aa
Figure pct00189
서열식별번호: 321, mAID (minimal AID), 68 aa
Figure pct00190
임의의 양태의 일부 실시형태에서, 데그론 도메인은 NS3 헬리카제 및 NS4A의 변형된 부분을 포함한다. 구축물에서 NS3pro 및 NS4A 서열의 배열은 기능적 데그론을 생성한다. HCV 복제 동안, 자유 NS4A N-말단은 소포체 막에 삽입되는 소수성 α-나선을 형성한다. 이 N-말단은 NS3 헬리카제 도메인에 의해 프로테아제 활성 부위에 위치하기 때문에 NS3/4A 접합부에서 HCV 비구조적 폴리펩티드의 절단에 의해 생성된다. 조작된 구축물에는 헬리카제 도메인이 결여되어 있으므로, NS3/4A 절단이 발생하지 않는다. 자유 N-말단 없이 막으로 삽입될 수 없는, NS4A의 소수성 서열은 데그론-유사 활성을 나타낸다. 예를 들어, 미국 특허 제10,550,379호; Chung et al., Nat Chem Biol. 2015 Sep; 11(9): 713-720을 참조하며, 이들의 전문은 본 명세서에 참조로 인용된다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 서열식별번호: 322, 또는 동일한 기능을 유지하는 서열식별번호: 322의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 322, HCV NS3/NS4A 데그론 도메인(42 aa)
Figure pct00191
유도된 분해 도메인
여러 양태에서, 자가-절제 데그론 또는 소분자-보조 차단(SMASh) 도메인으로도 지칭되는, 유도된 분해 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, SMASh 도메인은 억제성 프로테아제, 적어도 하나의 프로테아제 절단 부위, 및 데그론 도메인을 포함한다. 프로테아제 저해제의 부재 하에, 억제성 프로테아제는 synTF에서 데그론을 절단하고, synTF는 분해되지 않는다. 프로테아제 저해제의 존재 하에, 억제성 프로테아제는 synTF에서 데그론을 절단하지 않으며, 데그론 도메인은 synTF의 분해를 야기한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 유도된 분해 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 유도된 분해 도메인을 포함한다. 복수의 유도 분해 도메인을 포함하는 실시형태에서, 복수의 유도 분해 도메인은 상이한 개별 유도 분해 도메인 또는 동일한 유도 분해 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 유비퀴틴 태그; eDHFR 데그론(예를 들어, TMP 인듀서); FKBP12(예를 들어, 라파마이신 유사체 인듀서); 온도 민감성 디히드로폴레이트 환원효소(R-DHFRts, 또는 ts-DHFR); HCV NS3/NS4A 데그론; 저온 데그론(lt-degron)으로 명명된 변형된 버전의 R-DHFRt; 옥신-유도성 분해(AID); 할로태그-소수성 태그, HaloPROTAC, 및 dTAG 시스템(예를 들어, HyT13 또는 HyT36 인듀서); 감광성 데그론(PSD); 청색광-유도성 데그론(B-LID); 담배 식각 바이러스(TEV) 프로테아제 유도 단백질 불활성화(TIPI)-데그론 시스템; deGradFP(디그레이드 녹색 형광 단백질, 예를 들어 NSlmb-vhhGFP 발현에 의해 유도됨); 또는 기능의 회복을 위한 분할된 유비퀴틴(SURF; 예를 들어, 라파마이신에 의해 유도됨)으로 이루어진 군에서 선택된다.
임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 NS3 헬리카제 및 NS4A의 변형된 부분을 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 서열식별번호: 322, 또는 동일한 기능을 유지하는 서열식별번호: 322의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh 태그는 억제성 프로테아제, 부분 프로테아제 나선 도메인, 및 보조인자 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 태그는 억제성 프로테아제, 부분 프로테아제 나선 도메인, 보조인자 도메인, 및 적어도 하나의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 태그는 NS3 억제성 프로테아제, NS3 부분 프로테아제 나선 도메인, NS3 보조인자 도메인(즉, NS4A), 및 NS3 억제성 프로테아제의 적어도 하나의 프로테아제 절단 부위를 포함한다.
임의의 양태의 일부 실시형태에서, SMASh 태그는 C-말단 SMASh 태그이고, 예를 들어, 태그는 synTF의 C-말단에 부착되도록 조작된다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 태그의 N-말단에 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 N-말단에서 C-말단 순서로 다음을 포함한다: NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 synTF의 전사 이펙터 도메인의 C-말단에 융합된다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 synTF의 DNA-결합 도메인의 C-말단에 융합된다.
임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 서열식별번호: 86, 324, 327, 또는 동일한 기능을 유지하는 서열식별번호: 86, 324, 327의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 86, C-말단 SMASh 도메인(304 aa); 굵은 텍스트는 NS3 절단 부위(서열식별번호: 87)를 나타내고;
Figure pct00192
는 링커(서열식별번호: 88 또는 90)을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그(서열식별번호: 89)를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인(서열식별번호: 91)을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제(서열식별번호: 92)를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인(서열식별번호: 93)을 나타낸다:
Figure pct00193
임의의 양태의 일부 실시형태에서, SMASh 태그는 N-말단 SMASh 태그이고, 예를 들어, 태그는 synTF의 N-말단에 부착되도록 조작된다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 태그의 C-말단에 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 N-말단에서 C-말단 순서로 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인, 및 NS3 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 synTF의 전사 이펙터 도메인의 N-말단에 융합된다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 synTF의 DNA-결합 도메인의 N-말단에 융합된다.
임의의 양태의 일부 실시형태에서, N-말단 SMAh 태그는 서열식별번호: 94, 95, 325, 326, 328, 329, 또는 동일한 기능을 유지하는 서열식별번호: 94, 95, 325, 326, 328, 또는 329 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 94, N-말단 SMASh 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커(서열식별번호: 88 또는 90)를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그(서열식별번호: 89)를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인(서열식별번호: 91)을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제(서열식별번호: 92)을 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인(서열식별번호: 93)을 나타내고; 굵은 텍스트는 NS3 절단 부위(서열식별번호: 279)를 나타낸다:
Figure pct00194
서열식별번호: 95, N-말단 SMASh 도메인(303 aa, NS4A 내에 GSSGSS(서열식별번호: 323) L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타낸다.
Figure pct00195
임의의 양태의 일부 실시형태에서, SMASh 도메인은 하나 이상의 프로테아제 저해제에 대한 민감성을 증가시키는 하나 이상의 돌연변이를 포함하는 억제성 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, SMAh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이들 돌연변이는 아나프레비르에 대한 민감성을 증가시키기 때문에, 이러한 SMASh는 또한 본 명세서에서 SMAShAI로 지칭된다(예를 들어, 서열식별번호: 254, 324, 325, 326 참조). 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이들 돌연변이는 텔라프레비르에 대한 감수성을 증가시키기 때문에, 이러한 프로테아제는 또한 SMAShTI로도 지칭된다(예를 들어, 서열식별번호: 255, 327, 328, 329 참조).
서열식별번호: 324, (304 aa)가 있는 C-말단 SMAShAI 도메인; 굵은 텍스트는 NS3 절단 부위를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00196
서열식별번호: 325, N-말단 SMAShAI 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00197
서열식별번호: 326, N-말단 SMAShAI 도메인(303 aa, NS4A 내에 L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00198
서열식별번호: 327, (304 aa)을 지니는 C-말단 SMAShTI 도메인; 굵은 텍스트 는 NS3 절단 부위를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00199
서열식별번호: 328, N-말단 SMAShTI 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00200
서열식별번호: 329, N-말단 SMAShTI 도메인(303 aa, NS4A 내에 L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
Figure pct00201
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 SMASh 도메인은 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 저해제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 SMASh 도메인은 하나의 프로테아제 저해제와 조합된다. 복수의 프로테아제 저해제를 포함하는 실시형태에서, 복수의 프로테아제 저해제는 상이한 개별 프로테아제 저해제 또는 동일한 프로테아제 저해제의 복수의 카피, 또는 상기한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 그루조프레비르(GZV 또는 GZP로 약칭됨; 예를 들어, PubChem CID: 44603531 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 다노프레비르(DNV; 예를 들어, PubChem CID: 11285588 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 승인된 NS3 프로테아제 저해제, 예컨대 비제한적으로 그라조프레비르, 다노프레비르, 시메프레비르, 아나프레비르, 실루프레비르, 보세프레비르 , 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르, 및 텔라프레비르이나, 이로만 제한되는 것은 아니다. NS3 프로테아제 저해제의 추가의 비제한적인 예는 표 16에 열거되어 있다(예를 들어, 그 내용이 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: McCauley and Rudd, Hepatitis C virus NS3/4a protease inhibitors, Current Opinion in Pharmacology 2016, 30:84-92).
유도 근접 도메인
여러 양태에서, 본 명세서에서 이종이량체화 도메인으로도 지칭되는 적어도 2개의 유도 근접 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "유도 근접 도메인"은 자극(예를 들어, 화학적 인듀서, 빛 등)의 존재 하에 이량체화되도록 유도되거나 근접하게 되는 적어도 2개의 도메인을 지칭한다. 임의의 양태의 일부 실시형태에서, 유도 근접 도메인 쌍은 제1 유도 근접(IPDA) 및 적어도 제2 유도 근접(IPDB)을 포함하고, 여기서 인듀서 작용제 또는 인듀서 신호의 존재 하에, IPDA 및 IPDB는 함께 모인다. 임의의 양태의 실시형태에서, synTF 이펙터 도메인은 제1 폴리펩티드에서 IPDA(또는 IPDB)에 연결되고, synTF DBD는 제2 폴리펩티드에서 IPDB(또는 IPDA)에 연결된다. 따라서, 인듀서 작용제 또는 인듀서 신호의 존재 하에, IPDA 및 IPDB는 함께 연결되어 합성 TF의 DBD에 대한 ED의 연결을 초래한다. 인듀서 작용제 또는 인듀서 신호의 부재 하에, ED는 합성 TF의 DBD에 커플링해제되거나 연결해제된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 유도 근접 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 유도 근접 도메인을 포함한다. 복수의 유도 근접 도메인을 포함하는 실시형태에서, 복수의 유도 근접 도메인은 상이한 개별 유도 근접 도메인 또는 동일한 유도 근접 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상에서 선택된 IPDA 및 IPDB를 포함한다: (1) GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함; (2) FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(Rapalog)(RAP)에 결합함; (3) PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함; (4) 광-유도성 이량체화 도메인(LIDD)을 포함하는 IPDA, 여기서 LIDD는 적절한 파장의 광 인듀서 신호에 노출 시 상보적 LIDD(IPDB)와 함께 이량체화된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 IPD의 이량체화 또는 근접을 유도하는 1, 2, 3, 4, 5개, 또는 그 이상의 인듀서 작용제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 인듀서 작용제와 조합된다. 복수의 인듀서 작용제를 포함하는 실시형태에서, 인듀서 작용제는 상이한 개별 인듀서 작용제 또는 동일한 인듀서 작용제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, IPD 쌍은 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 앱시스산(ABA) 신호전달 경로의 성분으로부터 유래된, ABI(ABA 둔감성) 도메인 및 PYL(피라박틴 내성-유사) 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, IPD 쌍은 PYL1(PYLcs, 아미노산 33 내지 209) 및 ABI1(ABIcs, 아미노산 126 내지 423)의 상호작용 상보적 표면(CS)을 포함한다. 임의의 양태의 일부 실시형태에서, ABI 도메인(예를 들어, 서열식별번호: 66)은 돌연변이 A18D 및 E108G를 포함한다. 임의의 양태의 일부 실시형태에서, ABI 도메인은 검출가능한 마커(예를 들어, FLAG 태그)를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, PYL 도메인은 검출가능한 마커(예를 들어, HA 태그)를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, ABI 도메인은 서열식별번호: 66 또는 107, 또는 동일한 기능을 유지하는 서열식별번호: 66 또는 107 중 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, PYL 도메인은 서열식별번호: 71 또는 108, 또는 동일한 기능을 유지하는 서열식별번호: 71 또는 108 중 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 66, ABI cs CO1 (298 aa)
Figure pct00202
서열식별번호: 71, PYL1cs 도메인(177 aa)
Figure pct00203
서열식별번호: 107, 대안적인 ABI 결합 모티프
Figure pct00204
서열식별번호: 108, 대안적인 PYL 결합 모티프
Figure pct00205
임의의 양태의 일부 실시형태에서, 근접 인듀서 작용제(예를 들어, ABI 및 PYL 도메인용)는 앱시스산(ABA)이다:
Figure pct00206
일부 실시형태에서, IPD 쌍은 FKBP(FK506- 및 라파마이신-결합 단백질) 및 FKBP12-라파마이신-결합 단백질(FRB) 단백질이며, 이들은 라팔로그의 존재 하에 함께 모여 이량체화된다. 임의의 양태의 일부 실시형태에서, FKBP 도메인은 서열식별번호: 109 또는 318, 또는 동일한 기능을 유지하는 서열식별번호: 109 또는 318 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, FRB 도메인은 서열식별번호: 110 또는 동일한 기능을 유지하는 서열식별번호: 110의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 109, FKBP aa 결합 모티프:
Figure pct00207
서열식별번호: 110, FRB 결합 모티프,
Figure pct00208
임의의 양태의 일부 실시형태에서, (예를 들어, FKBP 및 FRB 도메인을 위한) 근접 인듀서 작용제는 아래 나타낸 라파마이신이다. 임의의 양태의 일부 실시형태에서, (예를 들어, FKBP 및 FRB 도메인을 위한) 근접 인듀서 작용제는 라팔로그, 즉, 라파마이신 유사체이다. 임의의 양태의 일부 실시형태에서, 라팔로그는 본 명세서에 추가로 기재된 바와 같이 실드-1이다.
Figure pct00209
다른 실시형태에서, IPD 쌍은, 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터 유래되는, GAI(지베렐린 둔감성) 및 GID1(지베렐린 둔감성 드워프1) 단백질이며, 이는 지베렐린 에스테르(GE)의 존재 하에 함께 모인다. 임의의 양태의 일부 실시형태에서, GAI 도메인은 서열식별번호: 111 또는 동일한 기능을 유지하는 서열식별번호: 111의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, GAI 도메인은 GAI의 아미노-말단 DELLA 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, GID 도메인은 서열식별번호: 112 또는 동일한 기능을 유지하는 서열식별번호: 112의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 111, GAI 결합 모티프,
Figure pct00210
서열식별번호: 112, GID1 결합 모티프
Figure pct00211
임의의 양태의 일부 실시형태에서, (예를 들어, GAI 및 GID1 도메인을 위한) 근접 인듀서 작용제는 생활성 지베렐린(아래에 나타냄), 지베렐린 에스테르(GE), 또는 다른 지베렐린 유사체이다.
Figure pct00212
일부 실시형태에서, IPD 쌍은 높은 친화도(Kd = 500 nM)를 갖고 카페인의 존재 하에 동종이량체화하는 VHH 카멜리드 항체(aCaffVHH로 지칭됨)와 같은, 카페인-유도된 이량체화 시스템을 포함한다. 일부 실시형태에서, IPD 쌍은 특정 화학적 리간드를 사용하여 화학적으로 유도된 이량체화 시스템(COMBINES-CID)의 조합 결합제-가능 선택(combinatorial binders-enabled selection)으로부터 선택된다. 비제한적인 예로서, 리간드는 CBD(칸나비디올)일 수 있다. 일부 실시형태에서, IPD 쌍은, 단백질(예를 들어, ABT-737)에 결합된 소분자에 의해 생성된 화학적 에피토프를 인식하는 합성 항체를 선택하여 공지된 소분자-단백질 복합체로부터 유래된, 인간 항체-기반 화학적 유도된 이량체화(AbCID)를 포함한다. 일부 실시형태에서, IPD 쌍은, FK506의 존재 하에 함께 모이는, 칼시뉴린 및 FKBP를 포함한다. 일부 실시형태에서, IPD 쌍은, 시클로스포린 A의 존재 하에 함께 모이는, 칼시뉴린 및 프롤릴 이성질화효소 CyP를 포함한다. 일부 실시형태에서, IPD 쌍은, FKCsA, FK506 및 사이클로스프린 A의 융합물의 존재 하에 함께 모이는, CyP 및 FKBP을 포함한다. 일부 실시형태에서, IPD 쌍은 2개의 FK506 분자의 융합물인 FK2012의 존재 하에 함께 모이는, FKBP의 2개 카피를 포함한다. 예를 들어, Franco et al., Journal of Chromatography B, Volume 878, Issue 2, 15 January 2010, Pages 177-186; Liang et al. Sci Signal 2011 Mar 15;4(164):rs2; Laura A. Banaszynski et al. JACS 2005 Apr 6;127(13):4715-21; Miyamoto et al. Nat Chem Biol Nature Chemical Biology volume 8, pages465-470(2012); Bojar et al. Nature Communications volume 9, Article number: 2318 (2018); Kang et al. JACS 2019 Jul 17; 141(28): 10948-10952; Hill et al. Nat ChemBio 2018 Feb;14(2):112-117; Stanton et al. Science 2018 Mar 9; 359(6380): eaao5902; Weinberg et al. Nat Biotech 2017 May; 35(5): 453-462; Matthew J Kennedy, Nature Methods volume 7, pages 973-975(2010); 미국 특허 출원 US20180163195 및 US20170183654; 미국 특허 제8735096호를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
일부 실시형태에서, IPD 쌍은 광-유도성 이량체화 도메인(LIDD) 쌍을 포함하며, 이의 비제한적인 예는 nMag/nMag, CRY2/CIBN, 및 광변색성(photochromic) 단백질을 포함한다. 일부 실시형태에서, IPD 쌍은 nMag 및 pMag 단백질과 같은 광-유도성 이량체화 도메인(LIDD) 쌍을 포함하며, 이는, 청색광 신호로, 예를 들어, 청색광 펄스 신호, 또는 적당한 파장의 빛의 펄스 후, 함께 모이고 이량체화된다. 임의의 양태의 일부 실시형태에서, nMag 도메인은 서열식별번호: 113 또는 동일한 기능을 유지하는 서열식별번호: 113의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, pMag 도메인은 서열식별번호: 114 또는 동일한 기능을 유지하는 서열식별번호: 114의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 113, nMag 결합 모티프
Figure pct00213
서열식별번호: 114, pMag 결합 모티프
Figure pct00214
일부 실시형태에서, IPD 쌍은 광-유도성 이량체화 도메인(LIDD) 쌍, 예컨대, 크립토크롬 2(CRY2) 및 CIBN(CIB1(CRY2 상호작용 염기성-나선-루프 나선 1)의 절단된 버전) 및, 예를 들어, 청색광 펄스 신호, 또는 적절한 파장의 광 펄스 후, 청색광 신호로 함께 모이고 이량체화되는 아라비돕스 탈리아나(Arabidopsis thaliana)로부터 유래한 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, CIBN 도메인은 서열식별번호: 115 또는 동일한 기능을 유지하는 서열식별번호: 115의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, CRY2 도메인은 서열식별번호: 116 또는 동일한 기능을 유지하는 서열식별번호: 116의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 115, CIBN LIDD
Figure pct00215
서열식별번호: 116, CRY2 LIDD
Figure pct00216
일부 실시형태에서, IPD 쌍은 Dronpa, Padron, rsTagRFP, 및 mApple을 포함하나 이로만 제한되는 것은 아닌, 광변색성 단백질 도메인과 같은 광-유도성 이량체화 도메인(LIDD) 쌍, 또는 형광 특성을 갖는 이의 변이체 또는 폴리펩티드 단편(예를 들어, Dronpa-145N, Padron-145N 또는 mApple-162H-164A)을 포함한다. 이러한 광변색성 단백질 도메인은 특정 파장(예를 들어, 청색광)의 존재 하에 이량체화된다. 임의의 양태의 일부 실시형태에서, 광변색성 단백질 도메인은 서열식별번호: 330-333 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 330-333 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 330, Dropna-145K (224 aa)
Figure pct00217
서열식별번호: 331, Dropna-145N (224 aa)
Figure pct00218
서열식별번호: 332, Padron-145N (224 aa)
Figure pct00219
서열식별번호: 333, mApple-162H-164A (236 aa)
Figure pct00220
세포질 격리 도메인
몇몇 양태에서, 본 명세서에서 전위 도메인으로도 지칭되는, 세포질 격리 도메인 또는 단백질을 포함하는 synTF 폴리펩티드가 본 명세서에 기술되어 있다. 본 명세서에 사용되는 용어 "세포질 격리 도메인"은, 예를 들어, 리간드의 결합을 통해 연결된 synTF의 세포하(subcellular) 위치에 영향을 미치는 도메인을 지칭한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 세포질 격리 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 세포질 격리 도메인을 포함한다. 복수의 세포질 격리 도메인을 포함하는 실시형태에서, 복수의 세포질 격리 도메인은 상이한 개별 세포질 격리 도메인 또는 동일한 세포질 격리 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 리간드 결합 도메인(LBD)을 포함하고, 여기서 리간드의 존재 하에, 세포질에 대한 단백질의 격리는 저해된다. 임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 핵 국재화 신호(NLS)를 추가로 포함하고, 여기서 리간드의 부재 하에 NLS는 저해되고, 그로 인해 격리 단백질의 핵으로의 전위가 방지되고, 리간드의 존재 하에 핵 국재화 신호가 노출되어 격리 단백질이 핵으로 전위될 수 있다. 따라서, 리간드가 부재할 때, synTF는 세포질에 격리된다. 리간드가 부재할 때, synTF가 핵으로 전위된다.
임의의 양태의 일부 실시형태에서, 격리 단백질은 에스트로겐 수용체(ER)의 적어도 일부를 포함한다. ER은, 동족 리간드의 부재시 세포의 세포질 인자와 자연적으로 결합하여, 스스로 세포질에 효과적으로 격리된다. 에스트로겐 또는 기타 스테로이드 호르몬 유도체와 같은, 동족 리간드의 결합은 세포질 복합체로부터의 해리를 허용하고 핵 국재화 신호를 노출시켜, 핵으로의 전위를 허용하는, 수용체에 대한 형태적(conformational) 변화를 야기한다.
임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 334 또는 동일한 기능을 유지하는 서열식별번호: 334의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ER의 일부(예를 들어, 서열식별번호: 334), 예를 들어, ER의 C-말단 리간드-결합 및 핵 국재화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 334의 잔기 282-595 또는 서열식별번호: 334의 잔기 282-595에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 334, 에스트로겐 수용체 이소형 1 [Homo sapiens]; NCBI 참조 서열: NP_000116.2 (595 aa)
Figure pct00221
임의의 양태의 일부 실시형태에서, 에스트로겐 수용체는 이의 천연 리간드(예를 들어, 에스트라디올)에 결합하는 활성을 감소시키지만 타목시펜 및 이의 유사체와 같은 합성 리간드에 결합하는 활성을 유지하는 적어도 하나의 돌연변이를 포함한다. 임의의 양태의 일부 실시형태에서, 에스트로겐 수용체는 다음 돌연변이 중 적어도 하나를 포함한다: G400V, G521R, L539A, L540A, M543A, L544A, V595A 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, 삼중 G400V/MS43A/L544A ER 돌연변이체는 본 명세서에서 ERT2로 지칭된다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ER로부터의 V595A 돌연변이(예를 들어, 서열식별번호: 334)를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 에스트로겐 리간드 결합 도메인(ERT2) 또는 이의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ERT, ERT2, ERT3, 또는 이의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 74, 335-337 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 74, 335-337 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, 미국 특허 제7,112,715호; Feil et al., Biochemical and Biophysical Research Communications, Volume 237, Issue 3, 28 August 1997, Pages 752-757; Felker et al., PLoS One. 2016 Apr 14;11(4):e0152989를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
서열식별번호: 74, ERT2(314 aa) 굵은 이중밑줄 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G400V, M543A, L544A, 및 V595A 돌연변이
Figure pct00222
서열식별번호: 335, ERT(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G521R 돌연변이
Figure pct00223
서열식별번호: 336, ERT3(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 M543A, L544A, 및 V595A 돌연변이
Figure pct00224
Figure pct00225
서열식별번호: 337, ERT(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G400V, L539A, L540A 돌연변이
Figure pct00226
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 격리 단백질은 1, 2, 3, 4, 5개, 또는 그 이상의 리간드와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 격리 단백질은 하나의 리간드와 조합된다. 복수의 리간드를 포함하는 실시형태에서, 복수의 리간드는 상이한 개별 리간드 또는 동일한 리간드의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 리간드는 에스트라디올(PubChem CID: 5757), 또는 이의 유사체이다. 임의의 양태의 일부 실시형태에서, 리간드는 에스트로겐 수용체의 합성 리간드, 예컨대 타목시펜 또는 이의 유도체이다. 리간드는, 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜 및 풀베스트란트로부터 선택되며, 여기서 ERT(예를 들어, ERT2)에 대한 리간드의 결합은 NLS를 노출시키고 ERT의 핵 전위를 초래한다. 임의의 양태의 일부 실시형태에서, 리간드는 아래에 나타낸 (PubChem CID: 449459), 아피목시펜으로도 지칭될 수 있는 4-하이드록시타목시펜(4-OHT)이다. 임의의 양태의 일부 실시형태에서, 리간드는 아래에 나타낸(PubChem CID: 10090750) 4-하이드록시-N-데스메틸타목시펜이며, 이는 엔독시펜으로도 지칭될 수 있다. 임의의 양태의 일부 실시형태에서, 리간드는 ICI 182,780으로도 지칭될 수 있는 아래에 나타낸 풀베스트란트(PubChem CID 104741)이다.
Figure pct00227
Figure pct00228
임의의 양태의 일부 실시형태에서, synTF의 격리 단백질은 막통과 수용체 격리 단백질이고, synTF의 DNA-결합 도메인(DBD) 및 전사 이펙터(TE) 도메인은 수용체의 막통과 도메인의 세포질 측부(side)에 연결된다. 막통과 단백질에 대한 특정 리간드의 부재 하에, synTF의 DBD 및 TA는 세포막에 격리된다. 막통과 단백질에 대한 특정 리간드의 존재하에, 막통과 단백질은 스스로 절단되어 synTF의 DBD와 TA가 세포질로 방출되어 핵으로 운반된다. 막통과 수용체 격리 단백질의 비제한적인 예는 합성 노치(notch) 수용체 또는 제1 및 제2 외인성 세포외 센서를 포함하며, 이는 본 명세서에서 추가로 설명된다.
임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 노치 수용체 또는 합성 노치(synNotch) 수용체와 같은 내인성 노치 수용체의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, synNotch를 포함하는 synTF는 다음을 포함한다: (a) 노치 수용체에 이종성인 특정 결합 쌍의 제1 구성원을 포함하는 세포외 도메인; (b) 노치 수용체 조절 영역; 및 (c) synTF의 DNA 결합 도메인 및 전사 이펙터 도메인을 포함하는 세포내 도메인. 특정 결합 쌍의 제2 구성원의 존재 하에, 특정 결합 쌍의 제2 구성원에 대한 특정 결합 쌍의 제1 구성원의 결합은 결합-유도된 단백질분해 절단 부위의 절단을 유도하여 세포내 도메인을 활성화시키며, 그로 인해 synTF가 핵으로 전위하는 것이 가능하다. 특정 결합 쌍의 제2 구성원의 부재 하에, synTF는 세포막에서 격리된 상태로 유지된다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 338-339 중 하나 또는 동일한 기능을 유지하는 서열 74, 335-337 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 또는 적어도 70%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: 미국 특허 제10,590,182호; Morsut et al., Cell. 2016 Feb 11;164(4):780-91. 임의의 양태의 일부 실시형태에서, 노치 수용체 조절 영역은 Lin-12 노치 반복부 A-C, 이종이량체화 도메인 HD-N 및 HD-C, 결합-유도된 단백질분해 절단 부위, 및 막통과 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, 노치 변이체는 노치 세포외 서브유닛(NEC)(음성 조절 영역(NRR)을 포함함)이 부분적으로 또는 완전히 제거된 노치 수용체이다. 임의의 양태의 일부 실시형태에서, 노치 수용체 조절 영역은, 예를 들어, 하기 도메인 중 하나 이상이 결여된 synNotch의 절단되거나 변형된 변이체이다: Lin-12 노치 반복부 A-C, 이종이량체화 도메인 HD-N 및 HD-C, 결합-유도된 단백질분해 절단 부위, 노치 세포외 도메인(NEC), 음성 조절 영역(NRR), 또는 막통과 도메인.
서열식별번호: 338, synNotch (306 aa)
Figure pct00229
서열식별번호: 339, synNotch (358 aa)
Figure pct00230
특정 결합 쌍(예를 들어, synNotch의 것)의 적합한 제1 구성원은 항체-기반 인식 스캐폴드; 항체(즉, 항원-결합 항체 단편을 포함하는 항체-기반 인식 스캐폴드); 비-항체-기반 인식 스캐폴드; 항원(예를 들어, 내인성 항원, 외인성 항원 등); 수용체에 대한 리간드; 수용체; 비-항체-기반 인식 스캐폴드의 표적; Fc 수용체(예를 들어, FcγIIIa; FcγIIIb 등); 세포외 기질 성분 등을 포함하나, 이로만 제한되는 것은 아니다.
특정 결합 쌍(예를 들어, synNotch의 것)은, 예를 들어, 항원-항체 특정 결합 쌍(여기서 제1 구성원은, 항원인 제2 구성원에 특이적으로 결합하는 항체(또는 항체 기반 인식 스캐폴드)이거나, 또는 제1 구성원이 항원이고 제2 구성원이 항원에 특이적으로 결합하는 항체(또는 항체-기반 인식 스캐폴드)임); 리간드-수용체 특정 결합 쌍(여기서 제1 구성원은 리간드이고 제2 구성원은 리간드가 결합하는 수용체이거나, 또는 제1 구성원은 수용체이고 제2 구성원은 수용체에 결합하는 리간드임); 비-항체 기반 인식 스캐폴드-표적 특정 결합 쌍(여기서 제1 구성원은 비-항체-기반 인식 스캐폴드이고 제2 구성원은 비-항체-기반 인식 스캐폴드에 결합하는 표적이거나, 또는 제1 구성원은 표적이고 제2 구성원은 표적에 결합하는 비-항체-기반 인식 스캐폴드임); 접착 분자-세포외 기질 결합 쌍; Fc 수용체-Fc 결합 쌍(여기서 제1 구성원은 Fc 수용체인 제2 구성원에 결합하는 면역글로불린 Fc를 포함하거나, 또는 제1 구성원은 면역글로불린 Fc를 포함하는 제2 구성원에 결합하는 Fc 수용체임); 및 수용체-공동-수용체(receptor-co-receptor) 결합 쌍(여기서 제1 구성원은 공동-수용체인 제2 구성원에 특이적으로 결합하는 수용체이거나, 또는 제1 구성원은 수용체인 제2 구성원에 특이적으로 결합하는 공동-수용체임)을 포함한다.
임의의 양태의 일부 실시형태에서, 막통과 수용체 격리 단백질은 제1 및 제2 외인성 세포외 센서를 포함하고, 여기서 상기 제1 외인성 세포외 센서는, (a) 리간드 결합 도메인, (b) 막통과 도메인, (c) 프로테아제 절단 부위, 및 (d) synTF의 DBD 및 TA를 포함하고; 상기 제2 외인성 세포외 센서는 (e) 리간드 결합 도메인, (f) 막통과 도메인, 및 (g) 프로테아제 도메인을 포함한다. 이러한 시스템은 모듈식 세포외 센서 아키텍처(MESA) 시스템이라고도 지칭될 수 있다. 제1 및 제2 외인성 세포외 센서에 대한 리간드의 존재 하에, 두 수용체는 근접하여, 프로테아제가 프로테아제 절단 부위를 절단하고 synTF의 DBD 및 TA를 세포질로 방출하여 핵으로 전위되도록 허용한다. 제1 및 제2 외인성 세포외 센서에 대한 리간드의 부재 하에, synTF의 DBD 및 TA는 세포막에서 격리된 상태로 유지된다. 임의의 양태의 일부 실시형태에서, 프로테아제는 본 명세서에 기술된 바와 같은 임의의 프로테아제(예를 들어, NS3)를 포함하고, 프로테아제 절단 부위는 본 명세서에 기술된 바와 같은 NS3 프로테아제 절단 부위를 포함한다. 예를 들어, 다음 문헌 참조: 미국 특허 출원 2014/0234851; Daringer et al., ACS Synth. Biol. 2014, 3, 12, 892-902.
임의의 유형의 적합한 리간드 결합 도메인(LB)이 막통과 수용체 격리 단백질과 함께 사용될 수 있다. 리간드 결합 도메인은, 예를 들어, 기존 수용체 리간드-결합 도메인 또는 조작된 리간드 결합 도메인으로부터 유래될 수 있다. 기존 리간드-결합 도메인은, 예를 들어, 사이토카인 수용체, 케모카인 수용체, 선천성 면역 수용체(TLR 등), 후각 수용체, 스테로이드 및 호르몬 수용체, 성장 인자 수용체, 암에서 발생하는 돌연변이체 수용체, 신경전달물질 수용체에서 나올 수 있다. 조작된 리간드-결합 도메인은, 예를 들어, 단일-사슬 항체(아래의 scFv 구축물 논의 참조), 조작된 피브로넥틴 기반 결합 단백질, 및 조작된 컨센서스-유래 결합 단백질(예를 들어, 류신-풍부 반복부 또는 안키린-풍부 반복부, 예컨대, DARPin에 기반함)일 수 있다. 리간드는 그러한 리간드-결합 도메인의 임의의 동족 리간드일 수 있다.
링커 펩티드
여러 양태에서, 본 명세서에는 적어도 하나의 링커 펩티드를 포함하는 synTF 폴리펩티드가 기재되어 있다. 본 명세서에 사용된 "링커 펩티드"("펩티드 링커"와 상호교환적으로 사용됨)는 길이가 약 2 내지 100개의 아미노산인 올리고- 또는 폴리펩티드 영역을 지칭하며, 이는 본 명세서에 기술된 바와 같은 폴리펩티드의 임의의 서열을 함께 연결한다. 일부 실시형태에서, 링커는 인접한 단백질 도메인이 서로에 대해 자유롭게 이동할 수 있도록 글리신 및 세린과 같은 가요성 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 하는 것이 바람직한 경우 더 긴 링커가 사용될 수 있다. 링커는 절단가능하거나 절단불가능할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 링커 펩티드(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 링커 펩티드를 포함한다. 복수의 링커 펩티드를 포함하는 실시형태에서, 복수의 링커 펩티드는 상이한 개별 링커 펩티드 또는 동일한 링커 펩티드의 복수의 카피, 또는 전술한 것의 조합일 수 있다. 임의의 양태의 일부 실시형태에서, 링커 펩티드는 본 명세서에 기술된 바와 같은 임의의 2개의 도메인 사이의 임의의 위치에 위치할 수 있다: 예를 들어, DBD와 조절인자 단백질 사이, 조절인자 단백질과 이펙터 도메인 사이, DBD와 이펙터 도메인 사이, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, 링커 펩티드는, 예를 들어, 도메인의 구성요소를 연결하기 위해 DBD, 이펙터 도메인, 또는 조절인자 단백질 내에 위치할 수 있다.
본 명세서에 설명된 임의의 한 양태의 일부 실시형태에서, 링커는 여러 ZF를 탠덤하게 서로 연결하여 ZF 어레이를 형성한다. 본 명세서에 기술된 어느 한 양태의 일부 실시형태에서, 링커는 제1 ZFA를 제2 ZFA와 연결한다. 본 명세서에 기술된 임의의 한 양태의 일부 실시형태에서, 링커는 여러 ZFA를 서로 탠덤하게 연결하여 ZF-함유 ZF 단백질 도메인을 형성한다. 본 명세서에 기술된 폴리펩티드에 유용한 펩티드 링커 분자의 비제한적 예는 글리신-풍부 펩티드 링커를 포함하고(예를 들어, US 5,908,626 참조), 여기서 아미노산 잔기의 절반 이상이 글리신이다. 바람직하게는, 이러한 글리신-풍부 펩티드 링커는 약 20개 이하의 아미노산으로 구성된다. 링커 분자는 또한 비-펩티드 또는 부분 펩티드 분자를 포함할 수 있다. 예를 들어, 펩티드는 글루타르알데히드 또는 EDC(Pierce, Rockford, Illinois)와 같은 잘 알려진 가교 분자를 사용하여 펩티드 또는 다른 분자에 연결될 수 있다. 본 명세서에 기술된 조작된 synTF의 일부 실시형태에서, synTF의 ZF 단백질 도메인 내의 ZF 어레이(ZFA)는 링커 펩티드와 함께 각각의 융합 단백질에서 함께 연결된다.
링커 펩티드의 비제한적 예는 다음을 포함하지만, 이로만 제한되는 것은 아니다: PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323).
예를 들어, TGSQK(서열식별번호: 341) 또는 TGEKP(서열식별번호: 342) 또는 TGGGEKP(서열식별번호: 344)은 ZFA 사이에서 링커로 사용되고; VEIEDTE(서열식별번호: 346), GGSGGS(서열식별번호: 303), GGSGG(서열식별번호: 67), GGGSG(서열식별번호: 70), CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345)이 ZF 도메인과 이펙터 도메인을 함께 연결시키는 데 사용되고; PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GSSGSS(서열식별번호: 323)이, 본 명세서에 추가로 기술되는, MASh 도메인, StaPL 도메인, 또는 NS3/NS4a 도메인의 영역을 연결하는 데 사용된다.
가요성 링커는 일반적으로 Gly, Ser 및 Thr과 같은 작은 비극성 또는 극성 잔기로 구성된다. 링커를 포함하는 본 명세서에 기술된 임의의 융합 단백질의 한 실시형태에서, 링커 펩티드는 Gly 또는 Ser인 적어도 하나의 아미노산을 포함한다. 링커를 포함하는 본 명세서에 기술된 융합 단백질의 한 실시형태에서, 링커는 길이가 1개 내지 25개 잔기인 가요성 폴리펩티드이다. 가요성 펩티드 링커의 일반적인 예는 (GGS)n(여기서 n은 1에서 8(서열식별번호: 351, GGSGGSGGSGGSGGSGGSGGSGGS)), 또는 (Gly4Ser)n 반복부(여기서 n은 1-8(서열식별번호: 352, GGGGSGGGGSGGGGSGGGGSGGGGSGGG,GGGGSGGGGS), 바람직하게는, n=3, 4, 5 또는 6임), 즉 (Gly-Gly-Gly-Gly-Ser)n(서열식별번호: 353)(GGGGS, 여기서 n은 모티프의 반복 수를 나타냄)을 포함한다. 예를 들어, 가요성 링커는 (GGS)2(서열식별번호: 354, GGSGGS)이다. 대안적으로, 가요성 펩티드 링커는 Gly-Ser 반복부(Gly-Ser)p를 포함하며, 여기서 p는 모티프의 Gly-Ser 반복부의 수를 나타내고, p=1-8(서열식별번호: 355, GSGSGSGSGSGSGSGS), 바람직하게는 n=3, 4, 5 또는 6을 나타낸다. 가요성 링커의 또 다른 예는 TGSQK(서열식별번호: 341)이다.
ZF 단백질 도메인 및 이펙터 도메인이 링커 펩티드와 함께 연결된 본 명세서에 기술된 조작된 synTF의 한 실시형태에서, 링커 펩티드의 길이는 약 1 내지 20개 아미노산이다. 한 실시형태에서, 링커 펩티드는 Lys를 포함하지 않거나, 를 포함하지 않거나, Lys 및 Arg 둘 다를 포함하지 않는다.
본 명세서에 기술된 조작된 synTF의 일부 실시형태에서, ZF 단백질 도메인 및 이펙터 도메인은 화학적 가교제(cross-linking agents)와 함께 연결된다. 이관능성 가교 분자는 2개의 별개의 반응성 부위를 갖는 링커 분자이다. 예를 들어, 이작용성 링커 분자의 반응성 부위 중 하나는 펩티드 상의 작용기와 반응하여 공유 결합을 형성할 수 있고, 다른 반응성 부위는 다른 분자의 작용기와 반응하여 공유 결합을 형성할 수 있다. 분자를 가교시키는 일반적인 방법은 검토되어 있다(예를 들어, 다음 문헌 참조: Means and Feeney, Bioconjugate Chem., 1:2-12 (1990)).
동종이관능성 가교제(cross-linker) 분자는 화학적으로 동일한 2개의 반응성 부위를 갖는다. 동종이관능성 가교제 분자의 비제한적 예는, 제한됨이 없이, 글루타르알데히드; N,N'-비스(3-말레이미도-프로피오닐-2-하이드록시-1,3-프로판디올(설프히드릴-특이적 동종이작용성 가교제), 특정 N-숙신이미드 에스테르(예를 들어, 디숙신이미딜 수베레이트, 디티오비스(숙신이미딜 프로피오네이트), 및 가용성 비스-술폰산 및 이의 염을 포함한다(예를 들어, 다음 문헌 참조: Pierce Chemicals, Rockford, Illinois; Sigma-Aldrich Corp., St. Louis, Missouri).
이작용성 가교제 분자는 이종이작용성 링커 분자이며, 이는 링커가 2개 이상의 상이한 반응성 부위를 가지며, 각각은 펩티드 또는 다른 분자에 개별적으로 연결될 수 있음을 의미한다. 이러한 이종이작용성 링커의 사용은 선택된 펩티드 서열에 대한 각각의 반응성 부위의 화학적 분리 및 단계적 부가(벡터 결합(vectorial conjunction))를 허용한다. 본 개시에 유용한 이종이작용성 링커 분자는, 제한됨이 없이, m-말레이미도벤조일-N-하이드록시숙신이미드 에스테르를 포함한다(Green et al., Cell, 28: 477-487 (1982); Palker et al., Proc. Natl. Acad. Sci (USA), 84: 2479-2483 (1987) 참조); m-말레이미도-벤조일술포숙신이미드 에스테르; 말레이미도부티르산 N-하이드록시숙신이미드 에스테르; 및 N-숙신이미딜 3-(2-피리딜-디티오)프로피오네이트(예를 들어, Carlos et al., Biochem. J., 173: 723-737 (1978); Sigma-Aldrich Corp., St. Louis, Missouri 참조)를 포함한다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 ZF-함유 융합 단백질에서, ZFA 내의 모든 나선은 4 내지 6개의 아미노산 잔기를 갖는 펩티드 링커(L2)에 의해 연결된다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF-함유 융합 단백질에서, 개별 ZFA 내의 모든 나선은 TGEKP(서열식별번호: 342) 또는 TGSKP(서열식별번호: 356) 또는 TGQKP(서열식별번호: 357) 또는 TGGKP(서열식별번호: 358)와 같은 강성 펩티드 링커에 의해 연결된다. 강성 링커는 ZF 모티프의 표적 DNA 서열에 대한 상승적 결합을 부여하는 데 도움이 된다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF 함유 융합 단백질에서, (L1) 또는 (L2)는 가요성 링커이다. 비제한적인 예는 다음을 포함한다: TGSQKP(서열식별번호: 359) 및 TGGGEKP(서열식별번호: 344). 한 실시형태에서, 링커 가요성 펩티드는 1 내지 20개 아미노산 길이이다. 가요성 링커는 인접한 ZF 모티프 간의 협동작용(cooperativity)을 약화시키는 데 기여한다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF 함유 융합 단백질에서, (L1) 또는 (L2)는 강성 링커이다. 비제한적 예는 다음을 포함한다: TGEKP(서열식별번호: 342), TGSKP(서열식별번호: 356), TGQKP(서열식별번호: 357) 및 TGGKP(서열식별번호: 358).
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 2개 이상의 ZFA가 있는 본 명세서에 기술된 synTF 또는 ZF 함유 융합 단백질에서, 개별 ZFA는 TGSQKP(서열식별번호: 359)와 같은, 가요성 펩티드 링커에 의해 연결된다. 또 다른 실시형태에서, ZFA는 화학적 가교제에 의해 연결된다. 화학적 가교결합제는 당업계에 공지되어 있다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 ZF 함유 융합 단백질에서, 개별 ZFA 내의 모든 나선은 강성 펩티드 링커 및 가요성 펩티드 링커의 조합에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 강성 펩티드 링커 및 가요성 펩티드 링커가 교대로 사용되어 핑거를 연결한다.
자가-절단 펩티드
여러 양태에서, 자가-절단 펩티드를 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "자가-절단 펩티드"는 자체 절단을 촉매할 수 있는 짧은 아미노산 서열(예를 들어, 대략 18-22개의 aa 길이 펩티드)을 지칭한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 다성분 synTF 시스템(예를 들어, 유도된 근접 synTF 시스템)은 자가-절단 펩티드 도메인을 통해 서로 물리적으로 연결된 적어도 2개의 폴리펩티드를 포함한다. 자가-절단 펩티드는 제1 폴리펩티드와 제2 폴리펩티드(및/또는 제3 폴리펩티드 등)의 핵산이 동일한 벡터에 존재할 수 있도록 하지만, 번역 후에 자가-절단 펩티드는 번역된 폴리펩티드를 복수의 별개 폴리펩티드로 절단한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 자가-절단 펩티드를, 예를 들어, 각각의 synTF 폴리펩티드 사이에 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은, 예를 들어, synTF 폴리펩티드 시스템의 제1 폴리펩티드와 제2 폴리펩티드 사이에 하나의 자가-절단 펩티드를 포함한다. 복수의 자가-절단 펩티드를 포함하는 실시형태에서, 복수의 자가-절단 펩티드는 상이한 개별 자가-절단 펩티드 또는 동일한 자가-절단 펩티드의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
일부 실시형태에서, 자가-절단 펩티드는, 예를 들어, 이종이량체화 도메인 synTF에서 사용된다. 비제한적인 예로서, 도 19 및 20은 [ABI]-[ZF]를 포함하는 제1 폴리펩티드 영역과 [ED]-[PYL]을 포함하는 제2 폴리펩티드 영역 사이의 2A 자가-절단 펩티드를 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은 폴리펩티드를 2개의 폴리펩티드, [ABI]-[ZF] 및 [ED]-[PYL]로 절단하며, 이는 ABA의 존재 하에 [ED]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하여, DBD(ZF)와 ED(예를 들어, p65 또는 KRAB)를 커플링할 수 있다.
임의의 양태의 일부 실시형태에서, 자가-절단 펩티드는 2A 리보솜 스킵 서열로도 지칭될 수 있는 2A 펩티드 패밀리에 속한다. 2A 펩티드의 비제한적인 예는 P2A, E2A, F2A 및 T2A를 포함한다(예를 들어, 표 18 참조). F2A는 구제역 바이러스 18에서 파생되고; E2A는 말 비염(equine rhinitis) A 바이러스에서 파생되고; P2A는 돼지 테스코바이러스-1 2A에서 파생되고; T2A는 토시아 아시그나 바이러스(thosea asigna virus) 2A에서 파생된다. 임의의 양태의 일부 실시형태에서, 2A 펩티드의 N-말단은 서열 "GSG"(Gly-Ser-Gly)를 포함한다. 임의의 양태의 일부 실시형태에서, 2A 펩티드의 N-말단은 서열 "GSG"(Gly-Ser-Gly)를 포함하지 않는다.
표 18: 예시적인 자가-절단 펩티드
Figure pct00231
2A-펩티드-매개 절단은 단백질 번역 후에 시작된다. 절단은 2A 펩티드의 C-말단에 있는 프롤린(P)과 글리신(G) 사이의 펩티드 결합이 끊어짐으로써 촉발된다. 2A-펩티드-매개 절단의 분자 메커니즘은 진정한 단백질 분해 절단보다는 글리실-프롤릴 펩티드 결합 형성의 리보솜 "스키핑(skipping)"을 포함한다. 서로 다른 2A 펩티드는 상이한 절단 효율을 나타내며, P2A가 가장 효율적이고 F2A가 가장 덜 효율적이다. 따라서, F2A 결합 단백질의 최대 50%가 융합 단백질로 세포에 남아 있을 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드 시스템의 자가-절단 펩티드는 서열식별번호: 68, 360-362, 또는 동일한 기능(예를 들어, 자가-절단)을 유지하는 서열식별번호: 68, 360-362 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 시스템의 복수의 폴리펩티드를 1:1(또는 1:1:1 등) 화학량론적 비율로 제공하는 것이 유리하다(예를 들어, 이러한 화학량론적 비율은 최적의 기능성을 초래한다). synTF 시스템의 제1 및 제2(및 제3 등) 폴리펩티드의 1:1(또는 1:1:1 등) 비율이 유리한 실시형태에서, 제1 및 제2 폴리펩티드는, 본 명세서에 기술된 바와 같은 자가-절단 펩티드(들)이 측접하는, 단일 벡터로 제공될 수 있다. synTF 시스템의 제1 및 제2(및 제3 등) 폴리펩티드의 1:1(또는 1:1:1 등) 비율이 유리하지 않은 실시형태에서(예를 들어, 이 화학양론적 비율은 최적이 아닌(suboptimal) 기능성을 초래하고, 다른 비율은 최적의 기능성을 초래함), 그러면 제1 및 제2 폴리펩티드는, 예를 들어, 원하는 화학량론적 비율로 복수의 개별 벡터로 제공될 수 있다.
검출가능한 마커
여러 양태에서, 본 명세서에는 적어도 하나의 검출가능한 마커를 포함하는 synTF 폴리펩티드가 기재되어 있다. 본 명세서에 사용되는 용어 "검출가능한 마커"는 synTF 폴리펩티드에 부착될 때 폴리펩티드가 결합하는 해당 폴리펩티드 또는 또 다른 분자에 검아웃풋(detectability)을 부여하는 모이어티를 지칭한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 검출가능한 마커를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 검출가능한 마커를 포함한다. 복수의 검출가능한 마커를 포함하는 실시형태에서, 복수의 검출가능한 마커는 상이한 개별 검출가능한 마커 또는 동일한 검출가능한 마커의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 형광 모이어티는 검출가능한 마커로서 사용될 수 있지만, 검출가능한 마커는 또한, 예를 들어, 동위원소, 형광 단백질 및 펩티드, 효소, 특정 결합 쌍의 성분, 발색단, 본 명세서에 정의된 것과 같은 친화성 태그, 항체, 콜로이드성 금속(즉, 금) 및 양자점을 포함한다. 검출가능한 마커는 직접적으로 또는 간접적으로 검출될 수 있다. 직접적으로 검출가능한 마커는 검출가능한 신호를 생성하기 위해 추가 시약이나 기질을 필요로 하지 않는다. 예로는 동위원소와 형광단을 포함한다. 간접적으로 검출가능한 마커는 하나 이상의 보조 인자 또는 기질의 존재 또는 작용을 필요로 한다. 예로는 크로모젠 X-gal(5-브로모-4-클로로-3-인도일-β-D-갈락토피라노사이드)과 같은 기질의 절단시 착색된 반응 생성물의 생성에 의해 검출가능한 β-갈락토시다제, 기질 디아미노벤지딘의 존재하에서 착색된 반응 생성물의 생성에 의해 검출가능한 양고추냉이 퍼옥시다제 및 니트로블루 테트라졸륨 및 5-브로모-4-클로로-3-인돌릴 포스페이트의 존재하에 착색된 반응 생성물의 생성에 의해 검출가능한 알칼리성 포스파타제와 같은 효소, 및 친화도 태그를 포함한다. 친화도 태그의 비제한적 예는 Strep-태그, 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 글루타티온-S-트랜스퍼라제(GST), FLAG-태그, HA-태그, Myc-태그, 폴리(His)-태그뿐 아니라 이의 유도체를 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 GFP, V5, HA1, Myc, VSV-G, HSV, FLAG, HIS, mCherry, AU1, 및 비오틴으로부터 선택된다.
서열식별번호: 65, NLS, PKKKRKV
서열식별번호: 77, 3X FLAG 태그 + 핵 국재화 서열 (굵은 텍스트)
DYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPGG
서열식별번호: 80, AU1 태그, DTYRYI
서열식별번호: 84, HA 태그, YPYDVPDYA
서열식별번호: 89, FLAG 태그, DYKDDDDK
서열식별번호: 372, mCherry:
Figure pct00232
서열식별번호: 376, huEGFRt (절단된 인간 EGFR 폴리펩티드)
Figure pct00233
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 검출가능한 마커는 서열식별번호: 65, 77, 80, 80, 89, 372, 376, 또는 동일함(예를 들어, synTF 폴리펩티드 또는 synTF 폴리펩티드의 절단된 단편의 검출)을 유지하는 서열식별번호: 65, 77, 80, 80, 89, 372 또는 376 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 본 명세서에 기술된 바와 같은 synTF 폴리펩티드 내의 어디에도 위치할 수 있다. 한 실시형태에서, 검출가능한 마커는 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 임의의 도메인 사이에 위치하지만, 기능적 도메인 내에서 발견되지 않거나 도메인의 기능을 방해하지 않는다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 세포외 결합 도메인의 C 말단에 인접하여 위치한다. 이러한 마커는 세포질 발현 또는 핵 전위를 포함하는 synTF 폴리펩티드의 발현을 검출하는 데 사용될 수 있다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제와 프로테아제 절단 부위 사이에 위치하고; 이러한 마커는 synTF 폴리펩티드의 절단 및/또는 발현을 검출하는 데 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제와 프로테아제 절단 부위 사이에 위치하는 검출가능한 마커는 AU1 태그, HA1 태그, 또는 본 명세서에 기술된 바와 같은 임의의 다른 마커를 포함한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 인접하고 N-말단에 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대한 N-말단 제1 프로테아제 절단 부위에 대해 C-말단에 인접하여 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대해 C 말단에 인접하여 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대해 C 말단 및 제2 프로테아제 절단 부위에 대해 N-말단에 인접하여 위치한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 폴리펩티드의 C-말단 말단에 위치한다. 이러한 마커는 synTF 폴리펩티드의 세포내 발현을 검출하는 데 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 폴리펩티드의 C-말단 말단에 위치한 검출가능한 마커는 mCherry 또는 본 명세서에 기술된 바와 같은 또 다른 마커를 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드, 특히 대상체에 투여되는 것 또는 약제학적 조성물의 일부인 것은 면역원성인 검출가능한 마커를 포함하지 않는다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 GFP, mCherry, HA1, 또는 임의의 다른 면역원성 마커를 포함하지 않는다.
II. 유도성 합성 전사 인자
복수의 양태에서, (a) 적어도 하나의 DNA 결합 도메인(DBD), (b) 전사 이펙터 도메인(ED), 및 (c) 적어도 하나의 조절인자 단백질(RP)을 포함하는 합성 전사 인자가 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, ED는 DBD에 직접적으로 커플링되거나 연결된다. 임의의 양태의 일부 실시형태에서, ED는 DBD에 간접적으로 커플링되거나 연결된다. 임의의 양태의 일부 실시형태에서, DBD에 대한 ED의 커플링은 적어도 하나의 RP에 의해 조절된다. 임의의 양태의 일부 실시형태에서, ED의 세포 국재화는 적어도 하나의 조절인자 단백질에 의해 조절된다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 조절인자 단백질은 억제성 프로테아제, 유도된 분해 도메인, 유도 근접 도메인, 및 세포질 격리 도메인으로 이루어진 그룹으로부터 선택된다.
임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-RP; DBD-RP-ED; ED-DBD-RP; ED-RP-DBD; RP-DBD-ED; 또는 RP-ED-DBD. 2개의 조절인자 단백질(즉, RP1 및 RP2)을 포함하는 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-RP1-RP2; ED-DBD-RP1-RP2; RP1-DBD-ED-RP2; DBD-RP1-ED-RP2; ED-RP1-DBD-RP2; RP1-ED-DBD-RP2; RP1-ED-RP2-DBD; ED-RP1-RP2-DBD; RP2-RP1-ED-DBD; RP1-RP2-ED-DBD; ED-RP2-RP1-DBD; RP2-ED-RP1-DBD; RP2-DBD-RP1-ED; DBD-RP2-RP1-ED; RP1-RP2-DBD-ED; RP2-RP1-DBD-ED; DBD-RP1-RP2-ED; RP1-DBD-RP2-ED; ED-DBD-RP2-RP1; DBD-ED-RP2-RP1; RP2-ED-DBD-RP1; ED-RP2-DBD-RP1; DBD-RP2-ED-RP1; 및 RP2-DBD-ED-RP1.
일부 실시형태에서 그리고 단지 일예로서, 본 명세서에 개시된 것과 같은, 예시적인 RP1은 유도 근접 도메인(IPD), 또는 세포질 격리 도메인(CS)으로부터 선택되고, RP2는 유도된 분해 도메인(SMASh 도메인 포함)으로부터 선택된다. 또 다른 실시형태에서, 예시적인 RP1은 유도된 분해 도메인(SMASh 도메인 포함)이고 PR2는 유도 근접 도메인(IPD) 또는 세포질 격리 도메인(IPD)으로부터 선택된다.
복수의 양태에서, 예시적인 synTF 폴리펩티드가 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 서열식별번호: 4-15, 40-51, 또는 378-379 중 하나, 또는 서열식별번호: 4-15, 40-51, 또는 378-379 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
A. 억제성 프로테아제 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 억제성 프로테아제이다. 따라서, 본 명세서에 기술된 한 양태에서, synTF는 다음을 포함한다: (a) DBD; (b) ED; 및 (c) 억제성 프로테아제 도메인(본 명세서에서 PRO 또는 RPD로 지칭됨). 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-PRO; DBD-PRO-ED; ED-DBD-PRO; ED-PRO-DBD; PRO-DBD-ED; 또는 PRO-ED-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 본 명세서에 추가로 기재된 바와 같이 적어도 하나의 프로테아제 절단 부위(PC)를 추가로 포함한다. 바람직한 실시형태에서, 적어도 하나의 프로테아제 절단 부위는, 프로테아제가 프로테아제 절단 부위에서 절단할 때, DBD와 ED가 커플링되지 않도록, DBD와 ED 사이에 위치한다. 따라서, 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단까지 다음을 포함한다: PRO-ED-PC-DBD; ED-PRO-PC-DBD; ED-PC-PRO-DBD; DBD-PC-PRO-ED; DBD-PRO-PC-ED; PRO-DBD-PC-ED; ED-PC-DBD-PRO; 및 DBD-PC-ED-PRO.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 2개의 프로테아제 절단 부위(PC)를 포함한다. 임의의 양태의 일부 실시형태에서, 2개의 프로테아제 절단 부위는 억제성 프로테아제 도메인의 N 말단 및 C 말단, 예를 들어, N-말단에서 C-말단으로 직접적으로 위치한다: PC1-PRO-PC2. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-PC1-PRO-PC2-ED, 또는 ED-PC1-PRO-PC2-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 본 명세서에 추가로 기재된 바와 같이 억제성 프로테아제(CO)에 대한 보조인자를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는 예를 들어, N-말단에서 C-말단으로 다음과 같이, 억제성 프로테아제에 직접적으로 연결된다: CO-PRO 또는 PRO-CO. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-PRO-CO; DBD-PRO-CO-ED; ED-DBD-PRO-CO; ED-PRO-CO-DBD; PRO-CO-DBD-ED; PRO-CO-ED-DBD; DBD-ED-CO-PRO; DBD-CO-PRO-ED; ED-DBD-CO-PRO; ED-CO-PRO-DBD; CO-PRO-DBD-ED; CO-PRO-ED-DBD; DBD-PC1-PRO-CO-PC2-ED; ED-PC1-PRO-CO-PC2-DBD; DBD-PC1-CO-PRO-PC2-ED; 또는 ED-PC1-CO-PRO-PC2-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF의 DBD는 ZF10-1을 포함한다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF의 DBD는 서열식별번호: 3 또는 동일한 기능을 유지하는 서열식별번호: 3에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 억제성 프로테아제 synTF가 본 명세서에 기술된다: (a) DBD, (b) 억제성 프로테아제; 및 (c) 전사 액티베이터 도메인. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 8 또는 44 또는 동일한 기능을 유지하는 서열식별번호: 8 또는 44 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 20 또는 32, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 20 또는 32 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 20 또는 32의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 억제성 프로테아제 synTF가 본 명세서에 기술된다: (a) 전사 리프레서 도메인, (b) 억제성 프로테아제; 및 (c) DBD. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 9 또는 45, 또는 동일한 기능을 유지하는 서열식별번호: 9 또는 45 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 21 또는 33, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 21 또는 33 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 21 또는 33의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
B. 유도된 분해 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 유도된 분해 도메인이다. 따라서, 한 양태에서 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; 및 (c) 유도 분해 도메인(SMASh). 본 명세서에 기술된 바와 같이, SMASh 도메인은 C-말단 SMASh 도메인 또는 N-말단 SMASh 도메인일 수 있다. 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-ED-SMASh; ED-DBD-SMASH; SMASH-DBD-ED; 또는 SMASH-ED-DBD.
임의의 양태의 일부 실시형태에서, SMASh synTF의 DBD는 ZF10-1을 포함한다. 임의의 양태의 일부 실시형태에서, SMAh synTF의 DBD는 서열식별번호: 3 또는 동일한 기능을 유지하는 서열식별번호: 3에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, 및 (c) 유도된 분해(예를 들어, SMASh) 도메인. 임의의 양태의 일부 실시형태에서, SMASh synTF는 서열식별번호: 12 또는 48, 또는 동일한 기능을 유지하는 서열식별번호: 12 또는 48 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh synTF는 서열식별번호: 24 또는 36, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 24 또는 36 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 21 또는 33의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 세포질 격리 도메인(CS)을 추가로 포함한다. 따라서, 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 세포질 격리 도메인(CS). 임의의 양태의 일부 실시형태에서, synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-SMASh-CS; ED-DBD-SMASH-CS; SMASH-DBD-ED-CS; DBD-SMASH-ED-CS; ED-SMASH-DBD-CS; SMASH-ED-DBD-CS; SMASH-ED-CS-DBD; ED-SMASH-CS-DBD; CS-SMASH-ED-DBD; SMASH-CS-ED-DBD; ED-CS-SMASH-DBD; CS-ED-SMASH-DBD; CS-DBD-SMASH-ED; DBD-CS-SMASH-ED; SMASH-CS-DBD-ED; CS-SMASH-DBD-ED; DBD-SMASH-CS-ED; SMASH-DBD-CS-ED; ED-DBD-CS-SMASH; DBD-ED-CS-SMASH; CS-ED-DBD-SMASH; ED-CS-DBD-SMASH; DBD-CS-ED-SMASH; 및 CS-DBD-ED-SMASH. 바람직한 실시형태에서, SMASh 도메인은, 다음과 같이, C-말단 또는 N-말단에 존재한다: 예를 들어, SMASh-DBD-ED-CS; SMASH-ED-DBD-CS; SMASH-ED-CS-DBD; SMASH-CS-ED-DBD; SMASH-CS-DBD-ED; SMASH-DBD-CS-ED; ED-DBD-CS-SMASH; DBD-ED-CS-SMASH; CS-ED-DBD-SMASH; ED-CS-DBD-SMASH; DBD-CS-ED-SMASH; 및 CS-DBD-ED-SMASH.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF의 DBD는 ZF3-5를 포함한다. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF의 DBD는 서열식별번호: 2 또는 동일한 기능을 유지하는 서열식별번호: 2에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, (c) 세포질 격리 도메인, 및 (d) 유도된 분해(예를 들어, SMASh) 도메인. 또 다른 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 유도된 분해(예를 들어, SMASh) 도메인, (b) DBD, (c) 전사 액티베이터 도메인, 및 (d) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 10, 11, 46, 47, 또는 379, 또는 동일한 기능을 유지하는 서열식별번호: 10, 11, 46, 47, 또는 379 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 22, 23, 34, 또는 35, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 22, 23, 34, 또는 35 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 22, 23, 34, 또는 35의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 전사 억제 도메인, (b) DBD, (c) 세포질 격리 도메인 및 (d) 유도된 분해(예를 들어, SMASh) 도메인. 또 다른 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 유도된 분해(예를 들어, SMASh) 도메인, (b) 전사 리프레서 도메인, (c) DBD, 및 (d) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 13-15 또는 49-51 중 하나 또는 또는 동일한 기능을 유지하는 서열식별번호: 13-15 또는 49-51 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 25-27 또는 37-39 중 하나 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 22, 23, 24, 또는 35 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 25-27 또는 37-39의 코돈-최적화된 버전에 의해 코딩된다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 억제성 도메인(PRO)을 추가로 포함한다. 따라서, 본 명세서에 기술된 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 억제성 프로테아제 도메인(PRO). 임의의 양태의 일부 실시형태에서, synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-SMASh-PRO; ED-DBD-SMASh-PRO; SMASh-DBD-ED-PRO; DBD-SMASh-ED-PRO; ED-SMASh-DBD-PRO; SMASh-ED-DBD-PRO; SMASh-ED-PRO-DBD; ED-SMASh-PRO-DBD; PRO-SMASh-ED-DBD; SMASh-PRO-ED-DBD; ED-PRO-SMASh-DBD; PRO-ED-SMASh-DBD; PRO-DBD-SMASh-ED; DBD-PRO-SMASh-ED; SMASh-PRO-DBD-ED; PRO-SMASh-DBD-ED; DBD-SMASh-PRO-ED; SMASh-DBD-PRO-ED; ED-DBD-PRO-SMASh; DBD-ED-PRO-SMASh; PRO-ED-DBD-SMASh; ED-PRO-DBD-SMASh; DBD-PRO-ED-SMASh; 및 PRO-DBD-ED-SMASh. 일부 실시형태에서, SMASh 도메인은 C-말단 또는 N-말단에 있고 PRO 도메인은 DBD 및 ED 도메인 사이에 있다: 예를 들어, SMASh-ED-PRO-DBD; SMASH-DBD-PRO-ED; ED-PRO-DBD-SMASH; 및 DBD-PRO-ED-SMASH.
일부 실시형태에서, 각 도메인의 서열은 본 명세서에 기술된 예시적인 도메인 서열로부터 선택된다. 일부 실시형태에서, PRO/SMASh synTF 시스템의 ED는 전사 액티베이터이다. 일부 실시형태에서, PRO/SMASh synTF 시스템의 ED는 전사 리프레서이다. PRO 도메인에 대한 프로테아제 저해제의 존재하는 경우, ED와 DBD가 커플링되고 synTF는 켜짐(on)이고, PRO 도메인에 대한 프로테아제 저해제가 부재하는 경우, ED와 DBD가 커플링되지 않고 synTF는 꺼짐(off)이다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 존재하는 경우, PRO/SMASh synTF 시스템이 분해된다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 부재하는 경우, SMASh 태그가 분해되고 PRO/SMASh synTF 시스템은 분해되지 않는다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 도메인 및 유도된 분해 도메인 각각은 상이한 프로테아제를 포함하거나 또는 각각은 상이한 NS3 프로테아제 저해제에 대한 민감성을 갖는 NS3 프로테아제를 포함하여, 별도의 프로테아제 저해제를 사용하여 별개로 PRO 도메인 및 SMASH 도메인을 조절할 수 있다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 유도된 근접 쌍(IPD)을 추가로 포함한다. 따라서, 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 유도 근접 쌍(IPD). 유도된 분해 도메인은 IPD synTF 시스템의 어느 하나의 폴리펩티드에 연결될 수 있다. 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD, (ii) 유도된 근접 쌍(IP1)의 제1 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제1 폴리펩티드; 및 (b) (i) ED 및 (ii) 유도된 근접 쌍(IP2)의 제2 구성원을 포함하는 제2 폴리펩티드. 또 다른 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD 및 (ii) 유도된 근접 쌍(IP1)의 제1 구성원을 포함하는 제1 폴리펩티드; 및 (b) (i) ED, (ii) 유도된 근접 쌍(IP2)의 제2 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제2 폴리펩티드. 또 다른 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD, (ii) 유도된 근접 쌍(IP1)의 제1 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제1 폴리펩티드; 및 (b) (i) ED, (ii) 유도 근접 쌍(IP2)의 제2 구성원, 및 (iii) 유도 분해 도메인(SMASh)을 포함하는 제2 폴리펩티드. SMASh는 인듀서 작용제의 존재 하에, 예를 들어, 가요성 링커 펩티드의 사용을 통해 IPD1 및 IPD2의 결합을 방해하지 않도록 연결된다. 제1 및 제2 IPD/SMASh synTF 시스템의 비제한적인 예는 표 19에 제시되어 있다.
표 19: 제1 및 제2 IPD/SMASh synTF 시스템의 예시적인 쌍(각각의 폴리펩티드는 N-말단에서 C-말단으로 나타나 있음).
Figure pct00234
일부 실시형태에서, 각 도메인의 서열은 본 명세서에 기술된 예시적인 도메인 서열로부터 선택된다. 일부 실시형태에서, IPD/SMASh synTF 시스템의 ED는 전사 액티베이터이다. 일부 실시형태에서, IPD/SMASh synTF 시스템의 ED는 전사 리프레서이다. 유도된 근접 쌍의 인듀서가 존재하는 경우, IP1 및 IP2는 인듀서에 결합하여 IPD/SMASh 시스템의 두 폴리펩티드를 모두 포함하는 단백질 복합체의 형성이 초래되고, 인듀서가 부재하는 경우, IPD/SMASh 시스템의 폴리펩티드는 복합체를 형성하지 않는다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 존재하는 경우, IPD/SMASh synTF 시스템이 분해된다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 부재하는 경우, SMASh 태그가 분해되고 IPD/SMASh synTF 시스템은 분해되지 않는다.
C. 유도 근접 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 한 쌍의 유도 근접 도메인이다. 유도된 근접 쌍의 두 구성원 각각은 DBD 또는 ED에 직접적으로 연결된다. 따라서, 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD 및 (ii) 유도된 근접 쌍(IP1)의 제1 구성원을 포함하는 제1 폴리펩티드; 및 (b) (i) ED 및 (ii) 유도된 근접 쌍(IP2)의 제2 구성원을 포함하는 제2 폴리펩티드. 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-IP1 및 ED-IP2; DBD-IP1 및 IP2-ED; IP1-DBD 및 ED-IP2; 또는 IP1-DBD 및 IP2-ED. 즉, DBD는 유도된 근접 쌍(즉, IP1)의 한 구성원에 부착되고, ED는 유도된 근접 쌍(즉, IP2)의 다른 구성원 또는 동족 구성원에 부착되어, 유도된 근접 쌍의 인듀서가 존재하는 경우, IP1과 IP2가 인듀서에 결합하여 DBD-IP1:IP2-ED를 포함하는 단백질 복합체의 형성이 초래되고, 인듀서가 부재하는 경우, DBD-IP1과 ED-IP2는 복합체를 형성하지 않는다.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 2개의 폴리펩티드는 자가-절단 펩티드(SCP)에 의해 연결되어, synTF 시스템은 하나의 벡터에 의해 발현되고 2개의 폴리펩티드는 각각의 이어진 번역으로부터 절단된다. 따라서, 유도된 근접 synTF 시스템은 N-말단에서 C-말단으로 다음을 포함할 수 있다: DBD-IP1-SCP-ED-IP2; DBD-IP1-SCP-IP2-ED; IP1-DBD-SCP-ED-IP2; 또는 IP1-DBD-SCP-IP2-ED.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 DBD는 ZF1-3을 포함한다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 DBD는 서열식별번호: 1 또는 동일한 기능을 유지하는 서열식별번호: 1에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 에 대해 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, 유도된 근접 synTF가 본 명세서에 기술되고, 여기서: (a) 제1 폴리펩티드는 N-말단에서 C-말단으로, (i) 유도된 근접성 쌍의 제1 구성원 및 (ii) DBD를 포함하고; 및 (b) 제2 폴리펩티드는 N-말단에서 C-말단으로, (i) 전사 액티베이터 도메인 및 (ii) 유도된 근접 쌍의 제2 구성원을 포함한다. 임의의 양태의 일부 실시형태에서, 제1 및 제2 유도된 근접 synTF는 자가-절단 펩티드에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 4 또는 40, 또는 동일한 기능을 유지하는 서열식별번호: 4 또는 40 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 유도된 근접성 synTF는 서열식별번호: 16 또는 28, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 16 또는 28 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 16 또는 28의 코돈-최적화된 버전에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, 유도된 근접 synTF가 본 명세서에 기술되고, 여기서: (a) 제1 폴리펩티드는 N-말단에서 C-말단으로, (i) 유도된 근접성 쌍의 제1 구성원 및 (ii) DBD를 포함하고; (b) 제2 폴리펩티드는 N-말단에서 C-말단으로, (i) 전사 리프레서 도메인 및 (ii) 유도된 근접 쌍의 제2 구성원을 포함한다. 임의의 양태의 일부 실시형태에서, 제1 및 제2 유도된 근접 synTF는 자가-절단 펩티드에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 5 또는 41 또는 동일한 기능을 유지하는 서열식별번호: 5 또는 41 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 17 또는 29, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 17 또는 29 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 17 또는 29의 코돈-최적화된 버전에 의해 코딩된다.
D. 세포질 격리 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 세포질 격리 단백질이다. 따라서, 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; 및 (c) 세포질 격리 단백질(CS). 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-ED-CS; DBD-CS-ED; ED-DBD-CS; ED-CS-DBD; CS-DBD-ED; 또는 CS-ED-DBD.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF의 DBD는 ZF3-5를 포함한다. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF의 DBD는 서열식별번호: 2 또는 동일한 기능을 유지하는 서열식별번호: 2에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 세포질 격리 synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, 및 (c) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 6 또는 42 또는 동일한 기능을 유지하는 서열식별번호: 6 또는 42 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 18 또는 30, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 18 또는 30 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 18 또는 30의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 세포질 격리 synTF가 본 명세서에 기술된다: (a) 전사 리프레서 도메인, (b) DBD, 및 (c) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 7, 43, 또는 378, 또는 동일한 기능을 유지하는 서열식별번호: 7, 43, 또는 378 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 19 또는 31 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 19 또는 31 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 19 또는 31의 코돈-최적화된 버전에 의해 코딩된다.
III. 폴리뉴클레오티드 및 벡터
복수의 양태에서, synTF를 코딩하는 폴리뉴클레오티드가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, synTF 폴리뉴클레오티드는 서열식별번호: 28-39(예를 들어, 표 2 참조) 중 하나, 또는 폴리펩티드로서 동일한 기능(예를 들어, 유도성 전사 인자)을 유지하는 서열식별번호: 28-39 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
일부 실시형태에서, synTF 폴리뉴클레오티드는 서열식별번호: 28-39의 코돈 최적화된 버전이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 또는 핵산은 코돈-최적화되며, 예를 들어, 핵산 서열의 천연 또는 야생형 서열은 다른 코돈을 포함하도록 변경되거나 조작되어, 변형되거나 조작된 핵산은 천연/야생형 서열과 동일한 폴리펩티드 발현 생성물을 코딩하지만, 원하는 발현 시스템에서 개선된 효율로 전사 및/또는 번역될 것이다. 임의의 양태의 일부 실시형태에서, 발현 시스템은 천연/야생형 서열의 공급원(또는 이러한 유기체로부터 수득된 세포) 이외의 유기체이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 포유동물 또는 포유류 세포, 예를 들어, 마우스, 뮤린 세포, 또는 인간 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 인간 세포에서의 발현을 위해 코돈 최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 효모 또는 효모 세포에서의 발현을 위해 코돈 최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 박테리아 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 E. 콜라이(E. coli) 세포에서의 발현을 위해 코돈-최적화된다.
일부 실시형태에서, 본 명세서에 기술된 유전자(예를 들어, synTF, 관심 유전자) 중 하나 이상은 재조합 발현 벡터 또는 플라스미드에서 발현된다. 본 명세서에 사용되는 용어 "벡터"는 도입유전자(transgene)를 숙주 세포 내로 전달하기에 적합한 폴리뉴클레오티드 서열을 지칭한다. 용어 "벡터"는 플라스미드, 미니염색체, 파지, 네이키드 DNA 등을 포함한다. 예를 들어, 미국 특허 제4,980,285호; 제5,631,150호; 제5,707,828호; 제5,759,828호; 제5,888,783호 및 제5,919,670호, 및 Sambrook et al, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Press(1989)을 참조한다. 벡터의 한 유형은 추가 DNA 세그먼트가 결찰되는 원형 이중-가닥 DNA 루프를 지칭하는 "플라스미드"이다. 벡터의 또 다른 유형은 바이러스 벡터이며, 여기서 추가 DNA 세그먼트는 바이러스 게놈에 결찰된다. 특정 벡터(예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터)는 이들이 도입된 숙주 세포에서 자율 복제할 수 있다. 또한, 특정 벡터는 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 일반적으로 재조합 DNA 기술에서 유용한 발현 벡터는 종종 플라스미드 형태이다. 본 명세서에서 "플라스미드"와 "벡터"는 플라스미드가 가장 일반적으로 사용되는 벡터 형태이므로 혼용하여 사용한다. 그러나, 본 발명은 동등한 기능을 발휘하는 바이러스 벡터(예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스)와 같은, 다른 형태의 발현 벡터를 포함하도록 의도된다.
클로닝 벡터는 자율적으로 복제할 수 있거나 숙주 세포의 게놈에 통합될 수 있고, 벡터가 결정가능한 방식으로 절단될 수 있으며 새로운 재조합 벡터가 숙주 세포에서 복제하는 활성을 보유하도록 원하는 DNA 서열이 결찰될 수 있는, 하나 이상의 엔도뉴클레아제 제한 부위를 추가로 특징으로 하는 것이다. 플라스미드의 경우, 플라스미드가 숙주 박테리아와 같은 숙주 세포 내에서 카피 수에서 증가함에 따라 원하는 서열의 복제가 여러 번 또는 숙주가 유사분열에 의해 번식하기 전에 숙주당 단 한번 발생할 수 있다. 파지의 경우, 복제는 용해기(lytic phase)에서 능동적으로 또는 용원기(lysogenic phase)에서 수동적으로 일어날 수 있다.
발현 벡터는 원하는 DNA 서열이 본 명세서에 기술된 바와 같은 DNA-결합 도메인을 포함하는 조절 서열에 작동가능하게 연결되도록 제한 및 결찰에 의해 삽입될 수 있고 RNA 전사체로서 발현될 수 있는 것이다. 벡터는 벡터로 형질전환 또는 형질전환 또는 형질감염되었거나 또는 그렇지 않은 세포의 식별에 사용하기에 적합한 하나 이상의 마커 서열을 추가로 함유할 수 있다. 마커는, 예를 들어, 항생제 또는 기타 화합물에 대한 내성 또는 감수성을 증가 또는 감소시키는 단백질을 코딩하는 유전자, 당업계에 공지된 표준 검정에 의해 활성이 검출가능한 효소를 코딩하는 유전자(예를 들어, β-갈락토시다제, 루시퍼라제 또는 알칼리성 포스파타제), 및 형질전환 또는 형질감염된 세포, 숙주, 콜로니 또는 플라크의 표현형에 가시적으로 영향을 미치는 유전자(예를 들어, 녹색 형광 단백질)를 포함한다. 특정 실시형태에서, 본 명세서에 사용된 벡터는 이들이 작동가능하게 연결된 DNA 절편에 존재하는 구조적 유전자 생성물의 자율적 복제 및 발현을 가능케 할 수 있다.
본 명세서에 사용된 바와 같이, 코딩 서열 및 조절 서열은, 코딩 서열의 발현 또는 전사가 조절 서열의 영향 또는 제어 하에 놓이도록 하는 방식으로 공유적으로 연결될 때 "작동가능하게" 연결된 것으로 언급된다. 코딩 서열이 기능적 단백질로 번역되는 것이 바람직한 경우, 5' 조절 서열 중의 프로모터의 유도가 코딩 서열의 전사를 초래하면, 그리고 두 DNA 서열 사이의 연결 특성이 (1) 프레임-이동 돌연변이의 도입을 초래하지 않거나, (2) 코딩 서열의 전사를 유도하는 프로모터 영역의 활성을 방해하지 않거나, 또는 (3) 단백질로 번역될 해당 RNA 전사체의 활성을 방해하지 않으면, 두 DNA 서열은 작동가능하게 연결된 것으로 언급된다. 따라서, 프로모터 영역이 생성된 전사체가 원하는 단백질 또는 폴리펩티드로 번역될 수 있도록 해당 DNA 서열의 전사를 수행할 수 있었다면, 프로모터 영역이 코딩 서열에 작동가능하게 연결된 것일 수 있다.
본 명세서에 기술된 임의의 폴리펩티드를 코딩하는 핵산 분자가 세포에서 발현될 때, 다양한 전사 제어 서열(예를 들어, 프로모터/인핸서 서열)이 발현을 유도하는 데 사용될 수 있다. 프로모터는 천연 프로모터, 즉 유전자 발현의 정상적인 조절을 제공하는, 내인성 맥락에서 유전자의 프로모터일 수 있다. 일부 실시형태에서, 프로모터는 구성적일 수 있으며, 즉 프로모터는 상향조절되며 이는 연관된 유전자의 지속적인 전사를 가능케한다. 분자의 존재 또는 부재에 의해 조절되는 프로모터와 같은, 다양한 조건부 프로모터가 또한 사용될 수 있다.
유전자 발현에 필요한 조절 서열의 정확한 특성은 종 또는 세포 유형에 따라 다를 수 있지만, 일반적으로 필요에 따라, TATA 박스, 캡핑 서열, CAAT 서열 등과 같은, 전사 및 번역 각각의 개시에 관여하는 5' 비-전사 및 5'-비-번역 서열을 포함할 수 있다. 특히, 이러한 5' 비-전사 조절 서열은 작동가능하게 연결된 유전자의 전사 조절을 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다. 조절 서열은 또한 원하는 대로 인핸서 서열 또는 상류 액티베이터 서열을 포함할 수 있다. 본 발명의 벡터는 선택적으로 5' 리더 또는 신호 서열을 포함할 수 있다. 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량에 속한다.
임의의 양태의 일부 실시형태에서, 프로모터는, 이로만 제한되는 것은 아니지만, 다음을 포함하는 진핵생물 또는 인간 구성적 프로모터이다: 인간 신장 인자-1 알파(EF-1알파, EF1a) 프로모터; 침묵-취약 비장 초점 형성 바이러스(SFFV); 거대세포바이러스(CMV) 프로모터; 유비퀴틴 C(UbiC, pUb, UbC) 프로모터; 포스포글리세레이트 키나제 1(PGK, pGK) 프로모터; 닭 베타-액틴 프로모터(CAG/CAGG)에 융합된 거대세포바이러스(CMV) 인핸서; 시미안 바이러스 40(SV40) 인핸서 및 초기 프로모터; 베타 액틴(ACTB) 프로모터 등. 임의의 양태의 일부 실시형태에서, 프로모터는 최소 프로모터 또는 코어 프로모터이다. 최소 또는 코어 프로모터는 정의상 전사 시작 부위에 대해 -35에서 +35 영역 사이에 위치한 서열이며; 최소 프로모터는 일반적으로 전체 프로모터보다 짧고, 인핸서 또는 사일런서와 같은 추가 요소를 포함하지 않는다. 최소 프로모터의 비제한적 예는 minCMV; CMV53(상류 GC 박스가 추가된 minCMV); minSV40(최소 시미안 바이러스 40 프로모터); miniTK(단순 헤르페스 티미딘 키나제 프로모터의 -33 내지 +32 영역); MLP(아데노바이러스 주요 후기 프로모터의 -38 내지 +6 영역); pJB42CAT5(인간 junB 유전자에서 유래된 최소 프로모터); ybTATA(합성 최소 프로모터), 및 TATA 박스 단독. 예를 들어, Ede et al., ACS Synth Biol. 2016 May 20, 5(5): 395-404; Qin et al., PLoS One. 2010, 5(5): e10611; Norman et al., PLoS One. 2010 Aug 26,5(8):e12413을 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 16-27, 58-60, 64)는 SFFV 프로모터(예를 들어, 서열식별번호: 363)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 55-57)는 완전한 CMV 프로모터(예를 들어, 서열식별번호: 364)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 52-54, 62)는 minCMV 프로모터(예를 들어, 서열식별번호: 365)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 61, 63, 64)는 minTK 프로모터(예를 들어, 서열식별번호: 366)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 진핵생물 mRNA 전사체에서 단백질 번역 개시 부위로서 기능하는 핵산 모티프인 Kozak 서열(예를 들어, GCCGCCACC)을 포함한다.
발현에 필요한 모든 요소를 함유하는 발현 벡터는 상업적으로 입수가능하고 당업자에게 공지되어 있다. 예를 들어, 다음 문헌 참조: Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989. 세포는 이종성(heterologous) DNA(RNA)의 세포 내로의 도입에 의해 유전적으로 조작된다. 해당 이종성 DNA(RNA)는 전사 요소의 작동가능한 제어 하에 배치되어 숙주 세포에서 이종성 DNA의 발현을 허용한다.
임의의 양태의 일부 실시형태에서, synTF 벡터는 서열식별번호: 16-27 또는 서열식별번호: 52-64 중 하나(예를 들어, 표 1 또는 2 참조) 또는 서열식별번호: 16-27 또는 서열식별번호: 52-64 중 하나와 동일한 기능(예를 들어, 렌티바이러스 벡터, synTF 폴리펩티드 발현)을 유지하는, 서열식별번호: 236-261 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
일부 실시형태에서, 벡터는 pHR 벡터이다. 일부 실시형태에서, 벡터는 렌티바이러스 벡터이다. "렌티바이러스"라는 용어는 레트로비리대(Retroviridae) 패밀리의 속을 지칭한다. 렌티바이러스는 비분열 세포를 감염시킬 수 있다는 점에서 레트로바이러스 중에서 독특하며; 이들은 숙주 세포의 DNA에 상당한 양의 유전 정보를 전달할 수 있으므로, 유전자 전달 벡터의 가장 효율적인 방법 중 하나이다. HIV, SIV, 및 FIV는 모두 렌티바이러스의 예이다. 용어 "렌티바이러스 벡터"는, 특히 문헌[Milone et al., Mol. Ther. 17(8): 1453-1464 (2009)]에서 제공한 것과 같은 자가-불활성화 렌티바이러스 벡터를 포함하는, 렌티바이러스 게놈의 적어도 일부로부터 유래된 벡터를 의미한다. 클리닉에서 사용될 수 있는 렌티바이러스 벡터의 다른 예는, 예를 들어, Oxford BioMedica의 LENTIVECTOR® 유전자 전달 기술, Lentigen의 LENTIMAX™ 벡터 시스템 등을 포함하지만 이로만 제한되는 것은 아니다. 비임상 유형의 렌티바이러스 벡터가 또한 이용가능하고 당업자에게 공지되어 있을 것이다.
임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 중심 폴리퓨린 트랙(cPPT; 예를 들어, 서열식별번호: 367)을 포함한다. 중심 폴리퓨린 트랙/중심 종결 서열은 표적-세포 감염 동안 바이러스 게놈의 핵 내수송(importation)을 증가시키는 "DNA 플랩"을 생성한다. cPPT/CTS 요소는 벡터 통합 및 형질도입 효율을 향상시킨다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 우드척 간염 바이러스 전사후 조절 요소(WPRE; 예를 들어, 서열식별번호: 368)를 포함하는데, 이는 폴리(A) 부위 판독-진행(read-through)을 방지하고, RNA 프로세싱 및 성숙을 촉진하고, RNA의 핵 외수송(export)을 증가시킨다. 게놈 전사체에서, 이것은 벡터 패키징을 강화하고 역가를 증가시킨다. 형질도입된 표적 세포에서, WPRE는 mRNA 전사체 성숙을 촉진하여 도입유전자 발현을 부스팅한다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 긴 말단 반복부(LTR; 예를 들어, 서열식별번호: 369 및 370)를 포함한다. LTR은 레트로바이러스 RNA의 역전사에 의해 형성된 레트로트랜스포존 또는 프로바이러스 DNA의 어느 한 말단에서 발견되는 수백번 또는 수천번 반복되는 동일한 DNA 서열이고; 이들은 바이러스에 의해 숙주 게놈에 유전 물질을 삽입하는 데 사용된다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는, 고역가 벡터를 생성하는 데 필요한, Rev 반응 요소(RRE; 예를 들어, 서열식별번호: 371)를 포함한다.
제한 없이, 본 명세서에 기술된 유전자는 하나의 벡터 또는 별도의 벡터에 포함될 수 있다. 예를 들어, synTF를 코딩하는 폴리뉴클레오티드와 관심 유전자를 코딩하는 폴리뉴클레오티드가 동일한 벡터에 포함될 수 있다. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 폴리뉴클레오티드 및 관심 유전자를 코딩하는 폴리뉴클레오티드가 상이한 벡터에 포함될 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 synTF를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 관심 유전자를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 synTF를 코딩하는 적어도 하나의 폴리뉴클레오티드 및 관심 유전자를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다.
한 양태에서, synTF 렌티바이러스 발현 벡터(예를 들어, 서열식별번호: 16-27)가 본 명세서에 기술된다. 일부 실시형태에서, synTF 렌티바이러스 발현 벡터는 프로모터(예를 들어, SFFV)에 작동가능하게 연결된 synTF를 코딩하는 폴리뉴클레오티드를 포함한다. 또 다른 양태에서, 렌티바이러스 리포터 벡터(예를 들어, 서열식별번호: 52-60)가 본 명세서에 기술된다. 일부 실시형태에서, 렌티바이러스 리포터 벡터는 다음을 포함한다: (i) synTF의 DBD에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개, 또는 그 이상)의 DNA-결합 모티프(DBM); (ii) 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열; 및 (iii) 프로모터 서열에 작동가능하게 연결된 검출가능한 마커(즉, 리포터, 예를 들어, mCherry). 일부 실시형태에서, 렌티바이러스 리포터 벡터는 전사 활성화 도메인을 포함하는 synTF에 대한 활성화 리포터(예를 들어, 서열식별번호: 52-54)이며, 그래서 유도성 synTF가 켜짐인 경우, synTF의 DBD가 리포터의 DBM에 결합하고, 전사 액티베이터 도메인은 검출가능한 마커의 전사를 활성화시키고; 유도성 synTF의 DBD가 꺼짐이고 리포터의 DBM에 결합되지 않은 경우, 코어 또는 최소 프로모터(예를 들어, minCMV)에만 작동가능하게 연결되어 있으므로 검출가능한 마커가 생성되지 않는다. 일부 실시형태에서, 렌티바이러스 리포터 벡터는 전사 리프레서 도메인을 포함하는 유도성 synTF에 대한 억제 리포터(예를 들어, 서열식별번호: 55-60)이며, 그래서 synTF가 켜짐인 경우, synTF의 DBD가 리포터의 DBM에 결합하고, 전사 리프레서 도메인은 검출가능한 마커의 전사를 억제하고; synTF가 꺼짐인 경우, synTF의 DBD는 리포터의 DBM에 결합되지 않고, 전체 구성적 프로모터(예를 들어, 전체 CMV 또는 SFFV)에 작동가능하게 연결되어 있어 검출가능한 마커가 생성된다.
한 양태에서, 관심 유전자(GOI) 렌티바이러스 발현 벡터(예를 들어, 61-64)가 본 명세서에 기술된다. 일부 실시형태에서, GOI 벡터는 synTF의 DBD 및 최소 프로모터에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개, 또는 그 이상)의 DNA-결합 모티프(DBM)에 작동가능하게 연결된 관심 유전자를 포함한다. 일부 실시형태에서, GOI 벡터는 본 명세서에 기술된 바와 같은 리포터 벡터를 포함하며, 여기서 검출가능한 마커는 관심 유전자로 대체되거나 융합되고; 그래서 synTF는 조절인자 단백질 인듀서의 존재 또는 부재 하에 관심 유전자의 발현을 유도하거나, 또는 관심 유전자의 발현을 억제할 수 있다.
일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 다음의 것으로 이루어진 군에서 선택된다: 케모카인, 케모카인 수용체, 키메라 항원 수용체, 사이토카인, 사이토카인 수용체, 분화 인자, 성장 인자, 성장인자수용체, 호르몬, 대사효소, 병원체 유래 단백질, 증식 인듀서, 수용체, RNA 가이드된 뉴클레아제, 부위-특이적 뉴클레아제, 소분자 2차 메신저 합성 효소, T 세포 수용체, 독소 유래 단백질, 전사 액티베이터, 전사 리프레서, 전사적 액티베이터, 전사적 리프레서, 번역 조절인자, 번역 액티베이터, 번역 리프레서, 활성화 면역수용체, 항체, 세포자멸사 억제인자, 세포자멸사 인듀서, 조작된 T 세포 수용체, 이뮨액티베이터, 면역억제인자, 억제 면역수용체, 및 RNA 가이드된 DNA 결합 단백질. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 치료가 필요한 대상체, 예를 들어, 암이 있거나, 자가면역이 있거나, 또는 재생 의학이 필요한 대상체에게 유익할 것이다.
일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는, 예를 들어, mCherry(예를 들어, 서열식별번호: 372)와 같은 검출가능한 마커에 연결된, CD19 CAR(예를 들어, 서열식별번호: 61, 373)이다. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 자가-절단 펩티드를 사용하여 검출가능한 마커, 예를 들어, (huEGFRt)에 연결될 수 있는 IL2(예를 들어, 서열식별번호: 62, 374)이다. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 IL10(예를 들어, 서열식별번호: 63-64, 375)이다.
한 양태에서, 구성적 프로모터에 작동가능하게 연결된 synTF 및 synTF의 DBD에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개 또는 그 이상)의 DNA-결합 모티프(DBM) 및 최소 프로모터(예를 들어, 서열식별번호: 64)에 작동가능하게 연결된 관심 유전자 둘 다를 포함하는 렌티바이러스 벡터가 본 명세서에 기술된다. 따라서, 5'에서 3' 방향으로 다음을 포함하는 핵산이 본 명세서에 기술된다: (a) 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열; (b) 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열; (c) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 synTF의 DBD의 결합은 이펙터 도메인(ED)을 GOI에 작동가능하게 연결된 프로모터 서열에 근접하여 위치시키는, 핵산 서열; (d) 제2 프로모터 서열; 및 (e) 제2 프로모터 서열에 작동가능하게 연결된 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 코딩된 synTF는 (c)의 핵산 서열의 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열.
임의의 양태의 일부 실시형태에서, GOI에 작동가능하게 연결된 프로모터 서열은 다음 중 임의의 것에서 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 핵산에 작동가능하게 연결된 프로모터 서열은 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터이다.
일부 실시형태에서, synTF를 코딩하는 폴리뉴클레오티드는 유도성 프로모터에 작동가능하게 연결되며, 이는 프로모터 액티베이터의 존재 또는 프로모터 리프레서의 부재 하에 활성이고, 프로모터 인듀서의 부재 또는 프로모터 리프레서의 존재 하에 불활성이다. 유도성 프로모터의 비제한적인 예는 다음을 포함한다: 독시사이클린-유도성 프로모터, lac 프로모터, lacUV5 프로모터, tac 프로모터, trc 프로모터, T5 프로모터, T7 프로모터, T7-lac 프로모터, araBAD 프로모터, rha 프로모터, tet 프로모터, 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG) 의존성 프로모터, AlcA 프로모터, LexA 프로모터, 온도 유도성 프로모터(예를 들어, Hsp70 또는 Hsp90-유래 프로모터), 또는 광 유도성 프로모터(예를 들어, pDawn/YFI/FixK2 프로모터/CI/pR 프로모터 시스템).
일부 실시형태에서, 벡터는, 예를 들어, 박테리아에서 벡터를 선택적으로 증폭하기 위한 선택가능한 마커를 포함한다. 박테리아에 사용하기 위한 선택가능한 마커 유전자의 비제한적인 예는 암피실린, 테트라사이클린 및 카나마이신에 대한 내성을 부여하는 항생제 내성 유전자를 포함한다. 테트라사이클린(tet) 및 암피실린(amp) 내성 마커 유전자는 pBR322(Beverly, Mass.소재, New England BioLabs로부터, cat. no. 303-3s로 입수가능함)를 포함하는 상업적으로 이용가능한 다수의 벡터 중 임의의 것으로부터 얻을 수 있다. tet 코딩 서열은 뉴클레오티드 86-476에 포함되어 있고; amp 유전자는 뉴클레오티드 3295-4155에 포함되어 있다. 카나마이신(kan) 유전자의 뉴클레오티드 서열은 벡터 pACYC 177(New England BioLabs, Cat no. 401-L, GenBank 수탁 번호 X06402)로 이용가능한다.
일부 실시형태에서, 재조합적으로 발현된 유전자 중 하나 이상이 세포의 게놈으로 통합될 수 있다.
청구된 발명의 효소를 코딩하는 핵산 분자는 당업계에서 표준인 방법 및 기술을 사용하여 세포 또는 세포들 내로 도입될 수 있다. 예를 들어, 핵산 분자는 화학적 형질전환 및 전기천공, 형질도입, 입자 충격 등을 포함하는 형질전환과 같은 표준 프로토콜에 의해 도입될 수 있다. 청구된 발명의 효소를 코딩하는 핵산 분자의 발현은 또한 핵산 분자를 게놈에 통합함으로써 달성될 수 있다.
IV. synTF 시스템
본 기술의 또 다른 양태는 관심 유전자(GOI)의 유전자 발현을 제어하기 위한 synTF 시스템에 관한 것으로, 여기서 시스템은 본 명세서에 기술된 synTF 및 유전자 발현을 조절하기 위해 synTF가 결합하는 요소를 포함하는 핵산 구축물을 포함한다. 한 양태에서, 다음을 포함하는, 유전자 발현을 제어하는 시스템이 본 명세서에 기술된다: (a) 본 명세서에 기술된 바와 같은 적어도 하나의 합성 전사 인자(synTF); 및 (b) 본 명세서에 기술된 바와 같은 적어도 하나의 핵산 구축물로서, 예를 들어, 하기를 포함하는 핵산 구축물: (i) syn의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM); (ii) 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자.
예시적인 시스템이 도 1b, 2, 5c, 10b, 11a, 12a, 13a, 14a 및 15a-15b에 도시되어 있으며, 이들은 synTF 및 관심 유전자(예를 들어, mCherry, CD19 CAR, IL4, IL10)를 포함하는 핵산 서열 구축물을 제시한다. synTF가 프로테아제 synTF 또는 유도 근접 도메인 synTF인 synTF 실시형태에서(즉, DBD에 대한 ED의 커플링이 적어도 하나의 프로테아제 RP 또는 적어도 하나의 유도된 근접 쌍에 의해 조절되는 경우), RP 인듀서의 존재 하에, synTF의 DBD에 대한 ED의 커플링이 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접할 수 있고 관심 유전자의 유전자 발현의 개시 또는 억제를 촉진할 수 있다("ED-켜짐"). 대안적으로, RP 인듀서의 부재 하에, synTF의 DBD에 대한 ED의 커플링이 끊어져, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접하는 것을 방지하고, ED가 관심 유전자의 발현을 조절하는 것을 방지한다("ED-꺼짐"). 이펙터 도메인이 전사 액티베이터(TA)인지 또는 전사 리프레서(TR)인지에 따라, ED-켜짐 및 ED-꺼짐은 다른 효과를 나타낸다 - 즉, ED가 TA이면, synTF가 "ED-켜짐" 배열로 존재시, 유전자 발현이 발생할 수 있는 반면, ED가 전사 리프레서(TR)이면, ED-켜짐 배열은 유전자 발현의 억제를 초래할 것이다(예를 들어, 발현 없음). 반대로, ED가 TA이면, synTF가 "ED-꺼짐" 배열로 존재시, 유전자 발현이 꺼짐인 반면, ED가 전사 리프레서(TR)이면 "ED-꺼짐" 배열은 유전자 발현의 억제를 해제하여, 유전자 발현이 켜짐이 된다. 상이한 synTF 및 이펙터 도메인에 따른 최종 유전자 발현에 대한 각 조절자 프로모터 인듀서의 효과에 대한 요약은 본 명세서의 표 20에 요약되어 있다.
유사하게, 단지 일예로서, synTF가 세포질 격리 도메인 synTF인 synTF 실시형태에서(즉, ED-DBD 융합 단백질의 세포 국재화가 적어도 하나의 세포질 격리 조절인자 단백질에 의해 조절되는 경우), RP 인듀서의 존재 하에, ED-DBD는 세포질에서 격리되지 않아, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있게 하고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접하여 위치하게 하여 관심 유전자의 발현을 제어할 수 있다("ED-켜짐").
따라서, 인듀서의 존재 하에, ED가 TA이면 ED-켜짐 배열은 유전자 발현이 일어날 수 있게 하며("TA-켜짐"이라고 함) 반면, ED가 TR이면 ED-켜짐 배열은 유전자 발현의 억제를 초래할 것이다(예를 들어, "TR-켜짐"으로 지칭되고 유전자 발현은 없음). 대안적으로, RP 인듀서의 부재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 근접하는 것을 방지하고, 관심 유전자의 발현을 방지한다("ED-꺼짐"). 따라서, 인듀서의 부재 하에, ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는 결과를 초래하는("TA-꺼짐"(발현 없음)) 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 켠다("TR-꺼짐"), 그리하여 억제가 꺼지고, 그리하여 유전자 발현이 일어날 수 있음).
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, synTF는 유도된 분해 도메인 synTF이거나, 또는 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함한다. 본 명세서에 기술된 바와 같이, SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분적 프로테아제 나선 도메인 및 보조인자 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 프로테아제에 대한 저해제("SMASh 억제제"로 지칭됨)의 존재 하에, SMASh 프로테아제 활성이 억제되어 synTF가 분해되는 결과가 초래되고, 이는 DBD가 DBM에 결합하는 것과 관심 유전자의 발현 또는 억제를 제어하는 것을 방지한다("synTF-분해"; ED-꺼짐). 임의의 양태의 일부 실시형태에서, SMASh 프로테아제에 대한 저해제의 부재 하에, SMASh 프로테아제는 활성이고 synTF로부터 자가-절단/커플링해제되어, SMASh 도메인이 분해를 위해 표적화되고 synTF의 DBD가 DBM 및 synTF의 ED에 결합하여 관심 유전자의 발현이 제어되도록 허용한다("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)).
표 20A: 관심 유전자의 궁극적인 발현에 대한 조절인자 단백질 인듀서의 존재 또는 부재의 영향을 요약한 표.
Figure pct00235
Figure pct00236
따라서, GOI의 발현은 다음을 포함하지만 이로만 제한한되지 않는 3가지 수준의 제어에 의존한다: (i) synTF에서 조절인자 단백질의 유형, (ii) 조절인자 단백질 인듀서(RP 인듀서)의 존재 또는 부재, 및 (iii) 이펙터 도메인의 유형. 일부 실시형태에서, synTF가 유도된 분해 도메인 또는 SMASh 도메인을 포함하는 경우, 이는 또한 GOI의 발현에 대한 추가 수준의 제어를 제공할 수 있다. SMASh 도메인을 포함하는 synTF의 GOI의 궁극적인 발현은 표 20B에 제시되어 있다.
표 20B
Figure pct00237
Figure pct00238
표 20B에 나타낸 바와 같이, SMASh 억제자가 존재하는 경우, 조절인자 단백질 인듀서(예를 들어, 프로테아제 저해제, IPD 인듀서 또는 CS-SynTF에 대한 리간드)의 부재 또는 존재 하에서도, synTF는 분해되고 GOI의 발현은 ED가 TA인지 TR인지에 따라 달라진다. 그러나, SMASh 억제자의 부재 하에, GOI의 발현은 표 20B에 나타낸 바와 같이 조절인자 단백질 인듀서의 존재 또는 부재에 의존한다.
따라서, 한 양태에서, 본 명세서에는 (a) 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서, ED는 직접적으로 또는 간접적으로 DBD에 커플링 또는 연결되고, 여기서 커플링은 적어도 하나의 RP에 의해 조절되거나, DBD에 연결된 ED의 세포 국재화는 적어도 하나의 RP에 의해 조절되고, 적어도 하나의 RP는 RP 인듀서에 의해 조절되고, DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF; (b) (i) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및 (ii) 적어도 하나의 DBM의 3' 에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는 핵산 구축물;을 포함하는 유전자 발현을 제어하기 위한 시스템이 기술되며; 여기서 DBD에 대한 ED의 커플링이 적어도 하나의 RP에 의해 조절되는 synTF의 경우; RP 인듀서의 존재 하에, synTF의 DBD에 대한 ED의 커플링은 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접할 수 있고, ED는 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는 RP 인듀서의 부재 하에, synTF의 DBD에 대한 ED의 커플링이 끊어져, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접하는 것이 방지되어, 관심 유전자 발현을 방지하며("ED-꺼짐"); 여기서 DBD에 연결된 ED의 세포 국재화가 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우; RP 인듀서의 존재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되지 않아, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접할 수 있어 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는 RP 인듀서의 부재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 근접하는 것을 방지하여, 관심 유전자의 발현을 방지한다("ED-꺼짐").
synTF에 의한 조절을 위한 GOI를 코딩하는 핵산 구축물
본 명세서에 기술된 바와 같이, 일부 양태에서, 시스템은 본 명세서에 기술된 바와 같은 synTF 및 GOI를 포함하는 핵산 구축물을 포함한다. 일부 실시형태에서, 핵산 구축물물은 5'에서 3' 방향으로, (i) synTF의 DBD의 결합을 가능하게 하는 DBA 결합 모티프(DBM), (ii) 프로모터 서열, 및 (iii) GOI를 코딩하는 핵산을 포함하며, 여기서 GOI를 코딩하는 핵산은 프로모터 서열에 작동가능하게 연결된다. 예시적인 시스템이 도 5c 및 12a에 도시되어 있다.
일부 실시형태에서, 시스템은 프로모터에 작동가능하게 연결된, synTF를 코딩하는 핵산 서열을 추가로 포함한다; 예를 들어, 프로모터가 구성적 프로모터인 경우, 예시적인 시스템에 대해서는 도 10b, 13a, 14a 및 15a를 참조. 이러한 실시형태에서, 프로모터에 대한 인듀서가 존재하는 경우, synTF가 발현될 수 있고, GOI의 유전자 발현 조절에 대한 synTF의 활성은, 조절인자 단백질 인듀서 및/또는 SMASH 도메인이 연결된 경우에, SMASh 인듀서의 존재 또는 부재에 의존한다.
일부 실시형태에서, 핵산 구축물은 (i) 프로모터 하에 synTF를 코딩하는 제1 핵산 및 (ii) (i) 발현된 synTF의 DBD의 결합을 가능하게 하는 DBA 결합 모티프 (DBM), (ii) 프로모터 서열, 및 (iii) GOI를 코딩하는 핵산을 포함하는 제2 핵산 구축물을 포함하며, 여기서 GOI를 코딩하는 핵산은 프로모터 서열에 작동가능하게 연결되어 있다. 따라서, 유도성 synTF 및 GOI를 코딩하는 핵산은 동일한 핵산 구축물 상에 존재한다; 예를 들어, 이러한 예시적인 시스템에 대해서는 도 15b를 참조.
일부 실시형태에서, 핵산 구축물은 (i) synTF를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터, 및 (ii) 제2 프로모터에 작동가능하게 연결된 GOI를 코딩하는 핵산을 포함하며, 여기서 제2 프로모터에 대한 5'은 제1 프로모터의 제어 하에 발현되는 synTF 단백질에 대한 DBM이다. 일부 실시형태에서, 도 15b에 도시된 바와 같이, 구축물은 5'에서 3' 방향으로 다음을 포함한다: (i) 안티센스 방향으로 GOI를 코딩하는 핵산, (ii) GOI에 작동가능하게 연결된 안티센스 방향의 제1 프로모터, (iii) 안티센스 방향의 DBD, (iv) 센스 방향의 제2 프로모터, 및 (v) 제2 프로모터에 작동가능하게 연결된 센스 방향의 synTF를 코딩하는 핵산. 이러한 시스템은 synTF의 발현을 허용하며, 여기서 발현된 synTF는 synTF에 대한 인듀서의 존재 또는 부재 하에 GOI의 발현을 조절하는 데 사용될 수 있다.
임의의 양태의 일부 실시형태에서, GOI 또는 synTF에 작동가능하게 연결된 프로모터는 다음 중 임의의 것으로부터 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터.
임의의 양태의 일부 실시형태에서, 시스템에 의해 발현되는 적어도 하나의 synTF는 본 명세서에 기술된 임의의 것 중에서 선택된다. 임의의 양태의 일부 실시형태에서, synTF 시스템은, 동일하거나 상이한 GOI를 제어하는, 본 명세서에 기술된 바와 같은 적어도 2개의 synTF 폴리펩티드의 임의의 조합을 포함할 수 있다. 비제한적 예로서, 도 14a-14c는 각각 별개의 조절인자 단백질 및 GOI를 갖는 2개의 synTF를 포함하는 시스템을 나타낸다: CD19 CAR 발현을 제어하는 억제성 프로테아제 synTF 및 IL4 발현을 제어하는 세포질 격리 도메인 synTF. 아래의 표 9는 이러한 synTF 시스템 조합의 비제한적인 예를 제시한다. 임의의 양태의 일부 실시형태에서, 표 9에 나타낸 예는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT와 같은 소분자 약물)와 조합될 수 있다.
표 9: synTF 시스템. "PRO"는 본 명세서에 기술된 바와 같은 억제성 프로테아제 synTF 폴리펩티드 및 시스템을 나타낸다. "ID"는 본 명세서에 기술된 바와 같은 유도된 분해 synTF 폴리펩티드 및 시스템을 나타낸다. "IPD"는 본 명세서에 기술된 바와 같은 유도된 근접 synTF 폴리펩티드 및 시스템을 나타낸다. "CS"는 본 명세서에 기술된 세포질 격리 도메인 synTF 폴리펩티드 및 시스템을 나타낸다.
Figure pct00239
Figure pct00240
I. 세포
한 양태에서, 본 명세서에 기술된 바와 같은 적어도 하나의 synTF 폴리펩티드, synTF 시스템, synTF 폴리뉴클레오티드, 또는 synTF 벡터를 포함하는 세포 또는 이의 집단이 본 명세서에 기술된다(예를 들어, 표 1-2 참조). 임의의 양태의 일부 실시형태에서, 세포 또는 이의 집단은 synTF 폴리펩티드 또는 시스템의 임의의 조합을 포함할 수 있다(예를 들어, 표 9 참조).
한 양태에서, 본 발명은 synTF를 발현하도록 조작된 세포(예를 들어, T 세포)를 제공하며, 여기서 synTF 세포의 활성은 소분자에 의해 제어될 수 있다. 한 양태에서, 세포는 synTF로 형질전환되고, synTF는 세포 표면에서 발현된다. 일부 실시형태에서, 세포(예를 들어, T 세포)는 synTF를 코딩하는 바이러스 벡터로 형질도입된다. 일부 실시형태에서, 바이러스 벡터는 레트로바이러스 벡터이다. 일부 실시형태에서, 바이러스 벡터는 렌티바이러스 벡터이다. 이러한 일부 실시형태에서, 세포는 synTF를 안정적으로 발현할 수 있다. 또 다른 실시형태에서, 세포(예를 들어, T 세포)는 synTF를 코딩하는 핵산, 예를 들어, mRNA, cDNA, DNA로 형질감염된다. 일부 이러한 실시형태에서, 세포는 synTF를 일시적으로 발현할 수 있다.
한 양태에서, 다음을 포함하는 세포가 본 명세서에 기술된다: synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열, 적어도 하나의 DBM의 3'에 위치하는 프로모터 서열, 및 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산..
한 양태에서, 다음을 포함하는 세포가 본 명세서에 기술된다: (a) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산을 포함하는 제1 핵산 서열, 및 (b) 유도성 또는 구성적 프로모터에 작동가능하게 연결된, 본 명세서에 기술된 것과 같은 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열.
임의의 양태의 일부 실시형태에서, 세포는 5'에서 3' 방향으로 다음을 포함한다: (a) 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열; (b) 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열; (c) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 synTF의 DBD의 결합은 이펙터 도메인(ED)을 GOI에 작동가능하게 연결된 프로모터 서열에 근접하여 위치시키는 것인, 핵산 서열; (d) 제2 프로모터 서열; 및 (e) 제2 프로모터 서열에 작동가능하게 연결된, 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 코딩된 synTF는 (c)의 핵산 서열의 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는 것인, 핵산 서열.
임의의 양태의 일부 실시형태에서, GOI에 작동가능하게 연결된 프로모터 서열은 다음 중 임의의 것으로부터 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 핵산에 작동가능하게 연결된 프로모터 서열은 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터이다.
임의의 양태의 일부 실시형태에서, 세포는 면역 세포를 포함한다. 임의의 양태의 일부 실시형태에서, 면역 세포는 CD4+ T 세포, CD8+ T 세포, 조절 T 세포(Treg), 또는 자연 살해(NK) 세포를 포함한다. 한 실시형태에서, 세포는 T 세포를 포함한다. 한 실시형태에서, 세포는 CD4+ T 세포를 포함한다. 한 실시형태에서, 세포는 CD8+ T 세포를 포함한다. 다른 실시형태에서, 세포는 B 세포를 포함한다.
임의의 양태의 일부 실시형태에서, 세포는 대상체로부터 단리된다. 본 명세서에 사용되는 용어 "단리된(isolated)"은 세포가 이들의 자연 환경 이외의 조건에 놓이는 것을 의미한다. 용어 "단리된"은 이후에 이들 세포를 다른 세포와의 조합물 또는 혼합물로 사용하는 것을 배제하지 않는다. 임의의 양태의 일부 실시형태에서, 면역 세포(예를 들어, T 세포)는, (a) 대상체로부터 단리되고; (b) 본 명세서에 기술된 synTF 시스템을 발현하도록 유전적으로 변형되고; (c) 대상체에게 투여된다. 임의의 양태의 일부 실시형태에서, 세포는 제1 대상체로부터 단리되고 제2 대상체에게 투여된다. 임의의 양태의 일부 실시형태에서, 면역 세포는 먼저 대상체로부터의 체세포 샘플로부터 분화되고 이어서 본 명세서에 기술된 바와 같은 synTF 시스템을 발현하도록 유전적으로 변형된다.
임의의 양태의 일부 실시형태에서, 세포는 세포에서 적어도 하나의 HLA 클래스 I 유전자의 불활성화 변형을 포함한다. 일부 실시형태에서, 내인성(endogenous) HLA(예를 들어, 클래스 I 및/또는 클래스 II 주요 조직적합성 복합체)는, 예를 들어, 면역원성을 감소시키기 위해 편집되거나 제거될 수 있다. 일부 실시형태에서, 유전적 변형은 NK 세포-매개 용해를 방지하기 위한 비표준 HLA-G 및 HLA-E의 도입 및 발현을 포함할 수 있으며(예를 들어, Riolobos L et al. 2013 참조), 이는 면역요법, 예를 들어, 암 면역 요법을 위한 보편적 T 세포의 공급원을 제공할 수 있다.
일부 실시형태에서, synTF 시스템을 발현하도록 세포를 유전적으로 변형시키는 방법은 다음을 포함할 수 있지만 이에 제한되지는 않는다: synTF를 코딩하는 벡터로 세포의 형질감염 또는 전기천공; synTF 시스템을 코딩하는 바이러스 벡터(예를 들어, 레트로바이러스, 렌티바이러스)를 사용한 형질도입; 징크 핑거 뉴클레아제(ZFN), 전사 액티베이터-유사 이펙터 뉴클레아제(TALEN), 메가뉴클레아제-TALEN, 또는 CRISPR-Cas를 사용한 유전자 편집; 또는 synTF 시스템을 발현하도록 세포를 유전적으로 변형시키는 당업계에 공지된 임의의 다른 방법.
II. 약제학적 조성물 및 투여
일부 실시형태에서, 본 명세서에 기술된 방법은 본 명세서에 기술된 바와 같은 synTF 시스템으로 질환 또는 장애(예를 들어, 암 또는 자가면역)를 갖거나 갖는 것으로 진단된 대상체를 치료하는 것에 관한 것이다. 이러한 질병 또는 장애를 갖는 대상체는 암 또는 자가면역에 대한 현재의 진단 방법을 사용하여 의사에 의해 확인될 수 있다. 이들 상태를 특징짓고 진단에 도움이 되는 증상 및/또는 합병증은 당업계에 공지되어 있다. 암 또는 자가면역의 가족력, 또는 암 또는 자가면역의 위험 인자에 대한 노출은 또한 대상체가 그러한 질병 또는 장애를 가질 가능성이 있는지 여부를 결정하거나, 또는 암 또는 자가면역의 진단을 내리는 데 도움이 될 수 있다.
본 명세서에 기술된 조성물은 암 또는 자가면역을 갖거나 갖는 것으로 진단된 대상체에게 투여될 수 있다. 일부 실시형태에서, 본 명세서에 기술된 방법은 유효량의 본 명세서에 기술된 조성물, 예를 들어, 본 명세서에 기술된 바와 같은 synTF 시스템을 암 또는 자가면역의 증상을 완화시키기 위해 대상체에게 투여하는 단계를 포함한다. 본 명세서에 사용된 "증상 완화(alleviating a symptom)"는 암 또는 자가면역과 관련된 임의의 상태 또는 증상을 개선하는 것이다. 동등한 미처리 대조군과 비교하여, 이러한 감소는 임의의 표준 기술에 의해 측정시 적어도 5%, 10%, 20%, 40%, 50%, 60%, 80%, 90%, 95%, 99% 또는 그 이상이다.
본 명세서에 기술된 조성물을 대상체에게 투여하기 위한 다양한 수단은 당업자에게 공지되어 있다. 작용제는 주사 또는 시간 경과에 따른 점진적 주입에 의해 정맥내로 투여될 수 있다. 주어진 경로에 대한 적절한 제형이 주어지면, 예를 들어, 본 명세서에 기술된 방법 및 조성물에 유용한 작용제는 정맥내, 비강내, 흡입에 의해, 복강내, 근육내, 피하(subcutaneously), 공동내, 종양내 투여될 수 있고, 필요한 경우, 연동 수단에 의해, 또는 당업자에게 공지된 다른 수단에 의해 전달될 수 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 사용된 화합물은 경구, 정맥내 또는 근육내 투여된다. 투여는 국소적이거나 전신적일 수 있다. 예를 들어, 기관 또는 조직 이식 부위에 직접적으로, 국소 투여하는 것이 구체적으로 고려된다.
적어도 하나의 작용제를 함유하는 치료 조성물은, 예를 들어, 통상적으로 단위 용량으로 투여될 수 있다. 치료 조성물과 관련하여 사용될 때 용어 "단위 용량(unit dose)"은 대상체에 대한 단일 투여량으로 적합한 물리적으로 별개의 단위를 지칭하며, 각 단위는 필요한 생리학적으로 허용가능한 희석제, 즉, 담체 또는 비히클과 연계하여 원하는 치료 효과를 생성하도록 계산된 미리 결정된 양의 활성 물질을 함유한다.
조성물은 투여 제형(dosage formulation)과 양립가능한 방식으로 치료적 유효량으로 투여된다. 투여할 양과 시기는 치료될 대상체, 활성 성분을 활용하는 대상체의 시스템의 능력, 및 원하는 치료 효과의 정도에 따라 다르다..
대상체에 synTF 세포 및 synTF 폴리펩티드(들)의 활성을 조절하기 위한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)가 투여되는 실시형태에서, 세포 및 약물(들)은 함께 또는 별도로 투여될 수 있다. 대상체에게 synTF 세포 및 synTF 폴리펩티드(들)의 활성을 조절하는 약물이 별도로 투여되는 실시형태에서, 각각의 조성물은 본 명세서에 기술된 임의의 투여량 및 투여 경로/루틴에 따라, 별도로, 투여될 수 있다.
본 명세서에 사용되는 용어 "유효량(effective amount)"은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 질병 또는 장애의 적어도 하나 이상의 증상을 완화시키는 데 필요한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT))의 양을 지칭하며, 원하는 효과를 제공하기에 충분한 양의 약리학적 조성물에 관한 것이다. 따라서, 용어 "치료학적 유효량(therapeutically effective amount)"은 전형적인 대상체에게 투여될 때 특정한 항-종양 또는 항-자가면역 효과를 제공하기에 충분한 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)의 양을 지칭한다. 다양한 맥락에서, 본 명세서에 사용된 유효량은 또한 질병의 증상의 발달을 지연시키거나, 증상 질병의 경과를 변경(예를 들어, 이로만 제한되는 것은 아니지만, 질병의 증상 진행을 늦추는 것)하거나, 또는 질병의 증상을 역전시키는 데 충분한 양을 포함할 수 있다. 따라서, 정확한 "유효량"을 지정하는 것은 일반적으로 실행가능하지 않다. 그러나, 임의의 주어진 케이스의 경우, 적절한 "유효량"은 단지 일상적인 실험만을 이용하여 당업자에 의해 결정될 수 있다.
유효량, 독성 및 치료 효능은, 예를 들어, LD50(집단의 50%에 치명적인 용량) 및 ED50(집단의 50%에서 치료적으로 효과적인 용량)을 결정하기 위해 세포 배양 또는 실험 동물에서 표준 약학 절차에 의해 결정될 수 있다. 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 달라질 수 있다. 독성 효과와 치료 효과 사이의 용량 비율은 치료 지수이며 LD50/ED50 비율로 나타낼 수 있다. 큰 치료 지수를 나타내는 조성물 및 방법이 바람직하다. 치료적 유효량은 초기에 세포 배양 분석에서 추정할 수 있다. 또한, IC50(즉, 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)의 농도)을 포함하는 순환 혈장 농도 범위를 달성하기 위해 용량을 동물 모델에서 공식화할 수 있으며, 이는 세포 배양, 또는 적절한 동물 모델에서 결정된 바와 같이 증상의 최대 억제의 절반을 달성한다. 혈장 내 수준은, 예를 들어, 조절인자 단백질 인듀서에 대한 고성능 액체 크로마토그래피 또는 synTF 세포에 대한 유세포 분석에 의해 측정될 수 있다. 임의의 특정 용량의 효과는 적절한 생물학적 분석으로 모니터링할 수 있다. 투여량은 의사가 결정할 수 있으며 필요에 따라 관찰된 치료 효과에 맞게 조정할 수 있다.
유효량, 독성, 및 치료 효능은, 예를 들어, 최소 유효 용량 및/또는 최대 허용 용량을 결정하기 위해, 세포 배양물 또는 실험 동물에서 표준 약제학적 절차에 의해 결정될 수 있다. 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 달라질 수 있다. 치료적 유효 용량은 초기에 세포 배양 분석에서 추정할 수 있다. 또한, 최소 유효 용량과 최대 허용 용량 사이의 용량 범위를 달성하기 위해 용량을 동물 모델에서 제형화할 수 있다. 임의의 특정 투여량의 효과는 적합한 생물학적 검정, 예를 들어, 특히 종양 성장 및/또는 크기에 대한 검정에 의해 모니터링될 수 있다. 투여량량은 의사가 결정할 수 있으며 필요에 따라 관찰된 치료 효과에 맞게 조정할 수 있다.
일반적으로, 본 명세서에 기술된 synTF-시스템-발현 세포를 포함하는 약제학적 조성물은, 해당 범위 내의 모든 정수 값을 포함하여, 102 내지 1010개 세포/kg 체중, 바람직하게는 105 내지 106개 세포/kg 체중의 투여량으로 투여될 수 있다고 말할 수 있다. 세포의 수는 그 안에 포함된 세포의 유형과 마찬가지로 조성물이 의도되는 궁극적인 용도에 따라 달라질 것이다. 본 명세서에 제공된 용도를 위해, 세포는 일반적으로 1리터 이하의 부피이고, 500 mL 이하, 심지어 250 mL 또는 100 mL 이하일 수 있다. 따라서, 원하는 세포의 밀도는 전형적으로 106개 세포/ml를 초과하고 일반적으로 107개 세포/ml를 초과하며, 일반적으로 108개 세포/ml 이상이다. 임상적으로 관련된 면역 세포 수는 누적적으로 105, 106, 107, 108, 109, 1010, 1011, 또는 1012개 세포와 같거나 초과하는 복수의 주입으로 할당될 수 있다. SynTF-시스템-발현 세포 조성물은 이러한 범위 내의 투여량으로 복수회 투여될 수 있다. 세포는 요법을 받는 환자에 대해 동종이계(allogeneic), 동계(syngeneic), 이계(xenogeneic), 또는 자가(autologous)일 수 있다. 원하는 경우, 치료는 면역 반응의 유도를 향상시키기 위해 본 명세서에 기술된 바와 같은 미토겐(예를 들어, PHA) 또는 림포카인, 사이토카인, 및/또는 케모카인(예를 들어, IFN-γ, IL-2, IL-12, TNF-알파, IL-18 및 TNF-베타, GM-CSF, IL-4, IL-13, Flt3-L, RANTES, MIP1α 등)의 투여를 포함할 수도 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x105개 세포 내지 약 1x108개 세포일 수 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x106개 내지 약 1x107개 세포일 수 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x106개 세포일 수 있다. 일부 실시형태에서, 1회 용량의 세포가 투여될 수 있다. 일부 실시형태에서, 세포의 용량은, 예를 들어, 1회, 2회 또는 그 이상 반복될 수 있다. 일부 실시형태에서, 세포의 용량은, 예를 들어, 매일, 매주, 또는 매월 기준으로 투여될 수 있다.
특정 실시형태에서, 본 명세서에 기술된 바와 같은 synTF의 활성을 조절하는 조절인자 단백질 인듀서(예를 들어, 그루조프레비르, ABA, 4OHT; 본 명세서에서 인듀서 작용제로도 지칭됨)의 유효 용량은 환자에 한 번 투여될 수 있다. 특정 실시형태에서, 조절인자 단백질 인듀서의 유효 용량은 환자에게 반복적으로 투여될 수 있다. 임의의 양태의 일부 실시형태에서, ABA의 유효 용량은 약 1 mM이다. 임의의 양태의 일부 실시형태에서, 4OHT의 유효 용량은 약 4 μM이다. 임의의 양태의 일부 실시형태에서, 그라조프레비르의 유효 용량은 약 4 μM이다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서(예를 들어, 그라조프레비르)의 유효 용량은 적어도 0.05 mM, 적어도 0.1 mM, 적어도 0.15 mM, 적어도 0.2 mM, 적어도 0.25 mM, 적어도 0.3 mM, 적어도 0.35 mM, 적어도 0.4 mM, 적어도 0.45 mM, 적어도 0.5 mM, 적어도 0.55 mM, 적어도 0.6 mM, 적어도 0.65 mM, 적어도 0.7 mM, 적어도 0.75 mM, 적어도 0.8 mM, 적어도 0.85 mM, 적어도 0.9 mM, 적어도 0.95 mM, 적어도 1 mM, 적어도 1.05 mM, 적어도 1.1 mM, 적어도 1.15 mM, 적어도 1.2 mM, 적어도 1.25 mM, 적어도 1.3 mM, 적어도 1.35 mM, 적어도 1.4 mM, 적어도 1.45 mM, 적어도 1.5 mM, 적어도 1.55 mM, 적어도 1.6 mM, 적어도 1.65 mM, 적어도 1.7 mM, 적어도 1.75 mM, 적어도 1.8 mM, 적어도 1.85 mM, 적어도 1.9 mM, 적어도 1.95 mM, 적어도 2 mM, 적어도 2.05 mM, 적어도 2.1 mM, 적어도 2.15 mM, 적어도 2.2 mM, 적어도 2.25 mM, 적어도 2.3 mM, 적어도 2.35 mM, 적어도 2.4 mM, 적어도 2.45 mM, 적어도 2.5 mM, 적어도 2.55 mM, 적어도 2.6 mM, 적어도 2.65 mM, 적어도 2.7 mM, 적어도 2.75 mM, 적어도 2.8 mM, 적어도 2.85 mM, 적어도 2.9 mM, 적어도 2.95 mM, 적어도 3 mM, 적어도 3.05 mM, 적어도 3.1 mM, 적어도 3.15 mM, 적어도 3.2 mM, 적어도 3.25 mM, 적어도 3.3 mM, 적어도 3.35 mM, 적어도 3.4 mM, 적어도 3.45 mM, 적어도 3.5 mM, 적어도 3.55 mM, 적어도 3.6 mM, 적어도 3.65 mM, 적어도 3.7 mM, 적어도 3.75 mM, 적어도 3.8 mM, 적어도 3.85 mM, 적어도 3.9 mM, 적어도 3.95 mM, 적어도 4 mM, 적어도 4.05 mM, 적어도 4.1 mM, 적어도 4.15 mM, 적어도 4.2 mM, 적어도 4.25 mM, 적어도 4.3 mM, 적어도 4.35 mM, 적어도 4.4 mM, 적어도 4.45 mM, 적어도 4.5 mM, 적어도 4.55 mM, 적어도 4.6 mM, 적어도 4.65 mM, 적어도 4.7 mM, 적어도 4.75 mM, 적어도 4.8 mM, 적어도 4.85 mM, 적어도 4.9 mM, 적어도 4.95 mM, 또는 적어도 5 mM이다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서(예를 들어, ABA, 4OHT)의 유효 용량은 적어도 0.05 μM, 적어도 0.1 μM, 적어도 0.15 μM, 적어도 0.2 μM, 적어도 0.25 μM, 적어도 0.3 μM, 적어도 0.35 μM, 적어도 0.4 μM, 적어도 0.45 μM, 적어도 0.5 μM, 적어도 0.55 μM, 적어도 0.6 μM, 적어도 0.65 μM, 적어도 0.7 μM, 적어도 0.75 μM, 적어도 0.8 μM, 적어도 0.85 μM, 적어도 0.9 μM, 적어도 0.95 μM, 적어도 1 μM, 적어도 1.05 μM, 적어도 1.1 μM, 적어도 1.15 μM, 적어도 1.2 μM, 적어도 1.25 μM, 적어도 1.3 μM, 적어도 1.35 μM, 적어도 1.4 μM, 적어도 1.45 μM, 적어도 1.5 μM, 적어도 1.55 μM, 적어도 1.6 μM, 적어도 1.65 μM, 적어도 1.7 μM, 적어도 1.75 μM, 적어도 1.8 μM, 적어도 1.85 μM, 적어도 1.9 μM, 적어도 1.95 μM, 적어도 2 μM, 적어도 2.05 μM, 적어도 2.1 μM, 적어도 2.15 μM, 적어도 2.2 μM, 적어도 2.25 μM, 적어도 2.3 μM, 적어도 2.35 μM, 적어도 2.4 μM, 적어도 2.45 μM, 적어도 2.5 μM, 적어도 2.55 μM, 적어도 2.6 μM, 적어도 2.65 μM, 적어도 2.7 μM, 적어도 2.75 μM, 적어도 2.8 μM, 적어도 2.85 μM, 적어도 2.9 μM, 적어도 2.95 μM, 적어도 3 μM, 적어도 3.05 μM, 적어도 3.1 μM, 적어도 3.15 μM, 적어도 3.2 μM, 적어도 3.25 μM, 적어도 3.3 μM, 적어도 3.35 μM, 적어도 3.4 μM, 적어도 3.45 μM, 적어도 3.5 μM, 적어도 3.55 μM, 적어도 3.6 μM, 적어도 3.65 μM, 적어도 3.7 μM, 적어도 3.75 μM, 적어도 3.8 μM, 적어도 3.85 μM, 적어도 3.9 μM, 적어도 3.95 μM, 적어도 4 μM, 적어도 4.05 μM, 적어도 4.1 μM, 적어도 4.15 μM, 적어도 4.2 μM, 적어도 4.25 μM, 적어도 4.3 μM, 적어도 4.35 μM, 적어도 4.4 μM, 적어도 4.45 μM, 적어도 4.5 μM, 적어도 4.55 μM, 적어도 4.6 μM, 적어도 4.65 μM, 적어도 4.7 μM, 적어도 4.75 μM, 적어도 4.8 μM, 적어도 4.85 μM, 적어도 4.9 μM, 적어도 4.95 μM, 또는 적어도 5 μM이다.
전신 투여를 위해, 예를 들어, 0.1 mg/kg, 0.5 mg/kg, 1.0 mg/kg, 2.0 mg/kg, 2.5 mg/kg, 5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 40 mg/kg, 50 mg/kg 또는 그 이상과 같은, 조절인자 단백질 인듀서의 치료량을 대상체에게 투여할 수 있다.
일부 실시형태에서, 용량은 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 2 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 4 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 5 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 6 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 8 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 10 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 100 mg/㎡ 내지 약 700 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 250 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 375 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 500 mg/㎡일 수 있다.
일부 실시형태에서, 용량은 정맥내 투여될 수 있다. 일부 실시형태에서, 정맥내 투여는 약 10분 내지 약 3시간의 기간에 걸쳐 발생하는 주입일 수 있다. 일부 실시형태에서, 정맥내 투여는 약 30분 내지 약 90분의 기간에 걸쳐 발생하는 주입일 수 있다.
일부 실시형태에서, 용량은 약 매주 투여될 수 있다. 일부 실시형태에서, 용량은 매주 투여될 수 있다. 일부 실시형태에서, 용량은 약 12주 내지 약 18주 동안 매주 투여될 수 있다. 일부 실시형태에서 용량은 약 2주마다 투여될 수 있다. 일부 실시형태에서 용량은 약 3주마다 투여될 수 있다. 일부 실시형태에서, 용량은 약 2주마다 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 2주마다 정맥내 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 정맥내 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 매주 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 2주마다 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 총 약 2 내지 약 10회 용량이 투여된다. 일부 실시형태에서, 총 4회 용량이 투여된다. 일부 실시형태에서, 총 5회 용량이 투여된다. 일부 실시형태에서, 총 6회 용량이 투여된다. 일부 실시형태에서, 총 7회 용량이 투여된다. 일부 실시형태에서, 총 8회 용량이 투여된다. 일부 실시형태에서, 투여는 총 약 4주 내지 약 12주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 6주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 8주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 12주 동안 진행된다. 일부 실시형태에서, 초기 용량은 후속 용량보다 약 1.5 내지 약 2.5배 더 클 수 있다.
일부 실시형태에서, 용량은 약 1 mg 내지 약 2000 mg일 수 있다. 일부 실시형태에서, 용량은 약 3 mg일 수 있다. 일부 실시형태에서, 용량은 약 10 mg일 수 있다. 일부 실시형태에서, 용량은 약 30 mg일 수 있다. 일부 실시형태에서, 용량은 약 1000 mg일 수 있다. 일부 실시형태에서, 용량은 약 2000 mg일 수 있다. 일부 실시형태에서, 용량은 매일 정맥내 주입에 의해 제공되는 약 3 mg일 수 있다. 일부 실시형태에서, 용량은 매일 정맥내 주입에 의해 제공되는 약 10 mg일 수 있다. 일부 실시형태에서, 용량은 주당 3회 정맥내 주입에 의해 제공되는 약 30 mg일 수 있다.
일부 실시형태에서, 초기 치료 요법 후, 치료는 덜 빈번하게 투여될 수 있다. 예를 들어, 3개월 동안 격주로 치료한 후, 한 달에 한 번, 6개월 또는 1년 이상 동안 치료를 반복할 수 있다. 본 명세서에 기술된 방법에 따른 치료는 상태의 마커 또는 증상의 수준을, 예를 들어, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90% 또는 그 이상 감소시킬 수 있다.
본 명세서에 기술된 바와 같은 synTF 세포 및/또는 조절인자 단백질 인듀서의 투여량은 의사에 의해 결정될 수 있고, 치료의 관찰된 효과에 적합하도록, 필요에 따라, 조정될 수 있다. 치료 지속기간 및 빈도와 관련하여, 숙련된 임상의는 치료가 치료적 이점을 제공하는 시기를 결정하고 투여량을 증가시킬지 또는 감소시킬지, 투여 빈도를 증가시킬지 또는 감소시킬지, 치료를 중단할지, 치료를 재개할지, 또는 치료 요법에 다른 변경을 줄지 여부를 결정하기 위해 대상을 모니터링하는 것이 일반적이다. 투약 일정은 synTF 시스템 및/또는 조절인자 단백질 인듀서에 대한 대상체의 민감성과 같은 여러 임상 요인에 따라 일주일에 한 번에서 매일까지 다양할 수 있다. 원하는 용량 또는 양은 한 번에 투여되거나 하위 용량, 예를 들어, 2-4개의 하위 용량으로 나누어 일정 기간에 걸쳐, 예를 들어, 하루 또는 다른 적절한 일정을 통해 적절한 간격으로 투여될 수 있다. 일부 실시형태에서, 투여는 만성적, 예를 들어, 수주 또는 수개월의 기간에 걸쳐 매일 1회 이상의 용량 및/또는 치료일 수 있다. 투약 및/또는 치료 일정의 예는 1주, 2주, 3주, 4주, 1개월, 2개월, 3개월, 4개월, 5개월, 또는 6개월, 또는 그 이상의 기간에 걸쳐 매일, 매일 2회, 매일 3회 또는 매일 4회 또는 그 이상의 투여이다. 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 조성물은 5분, 10분, 15분, 20분, 또는 25분 기간과 같은 기간에 걸쳐 투여될 수 있다.
본 명세서에 기술된 방법에 따른 synTF 시스템의 투여를 위한 투여량 범위는, 예를 들어, synTF 시스템의 형태, 이의 효능, 및 본 ADTP서에 기재된 상태의 증상, 마커, 또는 지표(indicators)가 감소되는 정도, 예를 들어, 질환 또는 장애(예를 들어, 암 또는 자가면역)에 대해 원하는 백분율 감소에 좌우된다. 투여량은 부작용을 유발할 정도로 크지 않아야 한다. 일반적으로, 투여량은 환자의 연령, 상태, 및 성별에 따라 달라질 것이며, 당업자에 의해 결정될 수 있다. 투여량은 임의의 합병증의 경우 개별 의사에 의해 조정될 수도 있다.
예를 들어, 본 명세서에 기술된 상태의 치료에서 synTF의 효능은 숙련된 임상의에 의해 결정될 수 있다. 그러나, 치료라는 용어가 본 명세서에 사용된 경우, 본 명세서에 기술된 상태의 징후 또는 증상 중 하나 이상이 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 증상이 발생되거나, 또는 심지어 개선되는 경우, 또는 원하는 반응이, 예를 들어, 본 명세서에 기술된 방법에 따른 치료 후 적어도 10%까지 유도되는 경우, 치료는 "유효한 치료"로 간주된다. 효능은, 예를 들어 본 명세서에 기술된 방법에 따라 치료되는 상태의 마커, 지표, 증상 및/또는 발생도(incidence), 또는 적절한 임의의 다른 측정가능한 파라미터, 예를 들어, 종양 크기를 측정함으로써 평가될 수 있다. 효능은 입원에 의해 평가된 개인의 악화 실패, 또는 의학적 개입의 필요성(즉, 질병의 진행이 중단됨)에 의해 측정될 수도 있다. 이러한 지표를 측정하는 방법은 당업자에게 알려져 있고/있거나 본 명세서에 기술되어 있다. 치료는 개인 또는 동물(일부 비제한적인 예로는 인간 또는 동물을 포함함)의 질병의 임의의 치료를 포함하고 다음을 포함한다: (1) 질병의 억제, 예를 들어, 증상(예를 들어, 통증 또는 염증)의 악화 방지; 또는 (2) 질병의 중증도 완화, 예를 들어, 증상의 퇴행 유발. 질병의 치료를 위한 유효량은, 이를 필요로 하는 대상체에게 투여될 때, 이 용어가 해당 질병에 대해 본 명세서에 정의된 바와 같은 효과적인 치료를 초래하기에 충분한 양을 의미한다. 작용제의 효능은 상태 또는 원하는 반응(예를 들어, 종양 크기)의 물리적 지표를 평가함으로써 결정할 수 있다. 이러한 파라미터 중 임의의 하나, 또는 파라미터의 임의의 조합을 측정함으로써 투여 및/또는 치료의 효능을 모니터링하는 것은 당업자의 능력 범위 내에 있다. 효능은 본 명세서에 기술된 상태, 예를 들어, 암 치료의 동물 모델에서 평가될 수 있다. 실험 동물 모델을 사용하는 경우, 마커, 예를 들어, 종양 크기에서의 통계적으로 유의한 변화가 관찰될 때 치료의 효능이 입증된다.
synTF 시스템의 주어진 용량에 대한 평가를 가능케 하는 시험관내(in vitro) 및 동물 모델 분석이 본 명세서에 제공된다. 주어진 투여량 조합의 효능은 또한 동물 모델, 예를 들어, 특정 암 동물 모델에서 평가될 수 있다.
한 양태에서, 집합적으로 "synTF 조성물"로 지칭되는, 본 명세서에 기술된 바와 같은 적어도 하나의 synTF 폴리펩티드, synTF 시스템, synTF 폴리뉴클레오티드, synTF 벡터, 또는 synTF-포함 세포를 포함하는 약제학적 조성물이 본 명세서에 기술된다(예를 들어, 표 1-2 참조). 임의의 양태의 일부 실시형태에서, 약제학적 조성물은 synTF 폴리펩티드 또는 시스템의 임의의 조합을 포함할 수 있다(예를 들어, 표 9 참조). 임의의 양태의 일부 실시형태에서, 약제학적 조성물은 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)를 추가로 포함할 수 있다.
일부 실시형태에서, 본 명세서에 기술된 기술은 본 명세서에 기술된 바와 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서, 및 임의로 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물에 관한 것이다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서를 포함한다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본질적으로 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서로 이루어진다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서로 이루어진다. 약학적으로 허용되는 담체 및 희석제는 식염수, 수성 완충 용액, 용매 및/또는 분산 매질을 포함한다. 이러한 담체 및 희석제의 사용은 당업계에 잘 알려져 있다. 약제학적으로 허용가능한 담체로 역할할 수 있는 물질의 일부 비제한적 예로는 다음을 포함한다: (1) 당, 예컨대, 락토오스, 글루코오스 및 수크로오스; (2) 전분, 예컨대, 옥수수 전분 및 감자 전분; (3) 셀룰로오스 및 이의 유도체, 예컨대, 나트륨 카복시메틸 셀룰로오스, 메틸셀룰로오스, 에틸 셀룰로오스, 미정질 셀룰로오스 및 셀룰로오스 아세테이트; (4) 트라가칸트 분말; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대, 마그네슘 스테아레이트, 나트륨 라우릴 설페이트 및 탈크; (8) 부형제, 예컨대, 코코아 버터 및 좌약 왁스; (9) 오일, 예컨대 땅콩유, 면실유, 홍화유, 참기름, 올리브유, 옥수수유 및 대두유; (10) 글리콜, 예컨대, 프로필렌 글리콜; (11) 폴리올, 예컨대, 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(PEG); (12) 에스테르, 예컨대, 에틸 올레이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대, 수산화마그네슘 및 수산화알루미늄; (15) 알긴산; (16) 발열원 없는 물; (17) 등장 식염수; (18) 링거의 솔루션; (19) 에틸 알코올; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카보네이트 및/또는 폴리무수물; (22) 증량제(bulking agents), 예컨대, 폴리펩티드 및 아미노산; (23) 혈청 성분, 예컨대, 혈청 알부민, HDL 및 LDL; (24) C2-C12알코올, 예컨대, 에탄올; 및 (25) 약제학적 제형에 사용되는 기타 무독성 상용성 물질. 습윤제, 착색제, 이형제, 코팅제, 감미제, 향미제, 방향제, 방부제 및 항산화제가 또한 제형에 존재할 수 있다. "부형제", "담체", " 약제학적으로 허용가능한 담체" 등과 같은 용어는 본 명세서에서 상호교환가능하게 사용된다. 일부 실시형태에서, 담체는 활성 작용제, 예를 들어, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드, synTF 시스템, 및/또는 조절인자 단백질 인듀서의 분해를 억제한다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서를 포함하는 제약 조성물은 비경구 투여 형태일 수 있다. 비경구 투여 형태의 투여는 전형적으로 오염물에 대한 환자의 자연 방어를 우회하기 때문에, 비경구 투여 형태는 바람직하게는 멸균되거나 환자에게 투여하기 전에 멸균될 수 있다. 비경구 투여 형태의 예로는 주사용으로 준비된 용액, 주사를 위한 약제학적으로 허용가능한 비히클에 용해되거나 현탁될 준비가 된 건조 제품, 주사용으로 준비된 현탁액, 및 에멀젼을 포함하지만 이로만 제한되는 것은 아니다. 또한, DUROS®-유형 투여 형태 및 용량-덤핑을 포함하지만 이로만 제한되는 것은 아닌, 제어-방출 비경구 투여 형태가 환자의 투여를 위해 제조될 수 있다..
본 명세서에 개시된 것과 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서의 비경구 투여 형태를 제공하기 위해 사용될 수 있는 적합한 비히클은 당업자에게 잘 알려져 있다. 예는, 제한됨이 없이, 다음을 포함한다: 멸균수; 주사용수 USP; 생리 식염수; 포도당 용액; 이로만 제한되는 것은 아니지만 염화나트륨 주사, 링거 주사, 덱스트로스 주사, 덱스트로스 및 염화나트륨 주사, 및 락테이트 링거 주사와 같은 수성 비히클; 이로만 제한되는 것은 아니지만 에틸 알코올, 폴리에틸렌 글리콜 및 프로필렌 글리콜과 같은 수혼화성 비히클; 및 이로만 제한되는 것은 아니지만, 옥수수유, 면실유, 땅콩유, 참기름, 에틸 올레에이트, 이소프로필 미리스테이트, 및 벤질 벤조에이트와 같은 비수성 비히클.
synTF 조성물 및/또는 조절인자 단백질 인듀서를 포함하는 약제학적 조성물은 또한 경구 투여에 적합하도록, 예를 들어, 개별 투여 형태, 예컨대, 이로만 제한되는 것은 아니지만, 정제(제한됨이 없이 스코어링되거나 또는 코팅된 정제를 포함함), 환제, 캐플릿, 캡슐, 씹을 수 있는 정제, 분말 패킷, 카셰(cachets), 트로키, 웨이퍼, 에어로졸 스프레이, 또는 액체, 예컨대, 이로만 제한되는 것은 아니지만, 시럽, 엘릭서, 수성 액체, 비수성 액체의 용액 또는 현탁액, 수중유 에멀젼, 또는 유중수 에멀젼으로 제형화될 수 있다. 이러한 조성물은 개시된 화합물의 약제학적으로 허용가능한 염의 미리 결정된 양을 함유하고, 당업자에게 잘 알려진 약제학적 방법에 의해 제조될 수 있다. 일반적으로 다음 문헌 참조: Remington: The Science and Practice of Pharmacy, 21st Ed., Lippincott, Williams, and Wilkins, Philadelphia PA. (2005).
통상적인 투여 형태는 일반적으로 제형으로부터 신속하거나 즉각적인 약물 방출을 제공한다. 약물의 약리학 및 약동학에 따라, 기존 투여 형태를 사용하면 환자의 혈액 및 기타 조직에서 약물 농도의 큰 변동을 야기할 수 있다. 이러한 변동은 투여 빈도, 작용 개시, 효능 지속기간, 치료 혈액 수준의 유지, 독성, 부작용 등과 같은 많은 파라미터에 영향을 미칠 수 있다. 유리하게는, 제어-방출 제형은 약물의 작용 개시, 작용 지속기간, 치료 윈도우 내의 혈장 수준, 및 최고 혈액 수준을 제어하기 위해 사용될 수 있다. 특히, 제어- 또는 연장-방출 투여 형태 또는 제형은, 약물을 과소 투약하는 것(under-dosing)(즉, 최소 치료 수준 이하로 내려감)을 비롯하여 약물에 대한 독성 수준을 초과하는 것 둘 다로부터 발생할 수 있는, 잠재적인 부작용과 안전성 문제를 최소화하면서 약물의 최대 효과가 달성되도록 보장하기 위해 사용될 수 있다. 일부 실시형태에서, 조성물은 지연 방출(sustained release) 제형으로 투여될 수 있다.
제어-방출 약제학적 제품은 비-제어 방출 대응물에 의해 달성되는 것보다 약물 요법을 개선하는 공통 목표를 가지고 있다. 이상적으로, 의학적 치료에서 최적으로 설계된 제어-방출 제제의 사용은 최소한의 시간 내에 상태를 치료하거나 조절하기 위해 사용되는 최소한의 약물 물질을 특징으로 한다. 제어-방출 제형의 장점은 다음을 포함한다: 1) 약물 활성의 연장; 2) 투여 빈도 감소; 3) 환자 순응도 증가; 4) 더 적은 총 약물의 사용; 5) 국소 또는 전신 부작용의 감소; 6) 약물 축적의 최소화; 7) 혈액 수준 변동의 감소; 8) 치료 효능의 개선; 9) 약물 활성의 강화 또는 손실 감소; 및 10) 질병 또는 상태의 제어 속도의 개선. Kim, Cherng-ju, Controlled Release Dosage Form Design, 2 (Technomic Publishing, Lancaster, Pa.: 2000).
대부분의 제어-방출 제형은 원하는 치료 효과를 신속하게 생성하는 약물(활성 성분)의 양을 초기에 방출하고, 연장된 기간에 걸쳐 이러한 수준의 치료적 또는 예방적 효과를 유지하기 위해 다른 양의 약물을 점진적으로 또 지속적으로 방출하도록 설계된다. 체내에서 이러한 일정한 수준의 약물을 유지하기 위해, 대사되고 체내에서 배설되는 약물의 양을 대체할 수 있는 속도(rate)로 약물이 제형에서 방출되어야 한다. 활성 성분의 제어-방출은 pH, 이온 강도, 삼투압, 온도, 효소, 물, 및 기타 생리학적 조건 또는 화합물을 포함하나, 이로만 제한되는 것은 아닌 다양한 조건에 의해 자극될 수 있다.
다양한 공지된 제어-방출 또는 연장-방출 투여 형태, 제형, 및 디바이스가 본 개시의 염 및 조성물과 함께 사용하기 위해 조정될 수 있다. 예로는, 이로만 제한되는 것은 아니지만, 미국 특허 제3,845,770호; 제3,916,899호; 제3,536,809호; 제3,598,123호; 제4,008,719호; 제5674,533호; 제5,059,595호; 제5,591,767호; 제5,120,548호; 제5,073,543호; 제5,639,476호; 제5,354,556호; 제5,733,566호; 및 제6,365,185 B1호에 기재된 것들을 포함하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
이러한 투여 형태는, 예를 들어, 하이드록시프로필메틸 셀룰로오스, 기타 중합체 매트릭스, 겔, 투과성 막, 삼투 시스템(예컨대, OROS® (Alza Corporation, Mountain View, Calif. USA)), 또는 이들의 조합을 사용하여 다양한 비율로 원하는 방출 프로파일을 제공할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 조성물 및/또는 조절인자 단백질 유도제는 단일요법으로서 투여되며, 예를 들어, 질환 또는 장애(예를 들어, 암)에 대한 또 다른 치료는 대상체에게 투여되지 않는다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 방법은 제2 작용제 및/또는 치료제를 대상체에, 예를 들어, 조합 요법의 일부로 투여하는 것을 추가로 포함할 수 있다. 제2 작용제 및/또는 치료의 비제한적 예는 방사선 요법, 수술, 젬시타빈, 시스플라틴, 파클리탁셀, 카르보플라틴, 보르테조밉, AMG479, 보리노스타트, 리툭시맙, 테모졸로미드, 라파마이신, ABT-737, PI-103; 티오테파 및 CYTOXAN® 시클로포스파미드와 같은 알킬화제; 부술판, 임프로술판 및 피포술판과 같은 알킬 술포네이트; 벤조도파, 카르보쿠온, 메투레도파, 및 우레도파와 같은 아지리딘류; 알트레타민, 트리에틸렌멜라민, 트리에틸렌포스포르아미드, 트리에틸렌티오포스포르아미드 및 트리메틸올 멜라민을 포함하는 에틸렌이민 및 메틸멜라민; 아세토게닌(특히 불라타신 및 불라타시논); 캄프토테신(합성 유사체 토포테칸 포함); 브리오스타틴; 칼리스타틴; CC-1065(이의 아도젤레신, 카르젤레신 및 비젤레신 합성 유사체 포함); 크립토피신(특히 크립토피신 1 및 크립토피신 8); 돌라스타틴; 듀오카르마이신(합성 유사체, KW-2189 및 CB1-TM1 포함); 엘류테로빈; 판크라티스타틴; 사르코딕틴; 스폰지스타틴; 클로람부실, 클로르나파진, 콜로포스파미드, 에스트라무스틴, 이포스파미드, 메클로레타민, 메클로레타민 옥사이드 히드로클로라이드, 멜팔란, 노벤비친, 페네스테린, 프레드니무스틴, 트로포스파미드, 우라실 머스타드와 같은 질소 머스타드; 카르무스틴, 클로로조토신, 포테무스틴, 로무스틴, 니무스틴 및 라니무스틴과 같은 니트로소우레아; 엔디인 항생제(예를 들어, 칼리케아미신, 특히 칼리케아미신 감마1I 및 칼리케아미신 오메가I1(예를 들어, Agnew, Chem. Intl. Ed. Engl., 33:183-186 (1994) 참조))와 같은 항생제; 클로드로네이트와 같은 비스포스포네이트; 에스페라미신; 뿐만 아니라 네오카르지노스타틴 발색단 및 관련 발색단백 엔디인 항생제 발색단), 아클라시노마이신, 악티노마이신, 아우트라마이신, 아자세린, 블레오마이신, 칵티노마이신, 카라비신, 카미노마이신, 카르지노필린, 크로모마이신, 닥티노마이신, 다우노루비신, 데토루비신, 6-디아조-5-옥소-L-노르류신, ADRIAMYCIN® 독소루비신(모르폴리노-독소루비신, 시아노모르폴리노-독소루비신, 2-피롤리노-독소루비신 및 데옥시독소루비신 포함), 에피루비신, 에소루비신, 이다루비신, 마르셀로마이신, 미토마이신 C, 미코페놀산, 노갈라마이신, 올리보마이신, 페플로마이신, 포트피로마이신, 퓨로마이신, 켈라마이신, 로도루비신, 스트렙토니그린, 스트렙토조신, 투베르시딘, 주비노신스타트; 메토트렉세이트 및 5-플루오로우라실(5-FU)과 같은 항대사물질; 데놉테린, 메토트렉세이트, 프테롭테린, 트리메트렉세이트와 같은 엽산 유사체; 플루다라빈, 6-메르캅토퓨린, 티아미프린, 티오구아닌과 같은 퓨린 유사체; 안시타빈, 아자시티딘, 6-아자우리딘, 카르모푸르, 시타라빈, 디데옥시우리딘, 독시플루리딘, 에노시타빈, 플록수리딘과 같은 피리미딘 유사체; 칼루스테론, 드로모스타놀론 프로피오네이트, 에피티오스타놀, 메피티오스탄, 테스토락톤과 같은 안드로겐; 아미노글루테티미드, 미토탄, 트리로스탄과 같은 항-부신(anti-adrenals); 프롤린산과 같은 엽산 보충제; 아세글라톤; 알도포스파미드 배당체; 아미노레불린산; 에닐루라실; 암사크린; 베스트라부실; 비산트렌; 에다트락세이트; 데파민; 데메콜신; 디아지쿠온; 엘포르미틴; 엘립티늄 아세테이트; 에포틸론; 에토글루시드; 질산갈륨; 하이드록시우레아; 렌티난; 로니다이닌; 메이탄신 및 아사미토신과 같은 메이탄시노이드(maytansinoids); 미토구아존; 미톡산트론; 모피단몰; 니트라에린; 펜토스타틴; 페나멧; 피라루비신; 로속산트론; 포도필린산; 2-에틸히드라지드; 프로카바진; PSK® 다당류 복합체(JHS Natural Products, Eugene, Oreg.); 라족산; 리족신; 시조푸란; 스피로게르마늄; 테누아존산; 트리아지쿠온; 2,2',2''-트리클로로트리에틸아민; 트리코테센(특히 T-2 독소, 베라쿠린 A, 로리딘 A 및 안귀딘); 우레탄; 빈데신; 다카르바진; 만노무스틴; 미토브로니톨; 미톨락톨; 피포브로만; 가시토신; 아라비노사이드("Ara-C"); 시클로포스파미드; 티오테파; 탁소이드, 예를 들어 TAXOL® 파클리탁셀(Bristol-Myers Squibb Oncology, Princeton, NJ), ABRAXANE® 파클리탁셀의 크레모포가 없는 알부민-조작된 나노입자 제형(American Pharmaceutical Partners, Schaumberg, IL), 및 TAXOTERE® 독세셀(Rhone-Poulenc Rorer, Antony, France); 클로란부실; GEMZAR® 젬시타빈; 6-티오구아닌; 머캅토퓨린; 메토트렉세이트; 시스플라틴, 옥살리플라틴 및 카르보플라틴과 같은 백금 유사체; 빈블라스틴; 백금; 에토포사이드(VP-16); 이포스파미드; 미톡산트론; 빈크리스틴; NAVELBINE® 비노렐빈; 노반트론; 테니포사이드; 에다트렉세이트; 다우노마이신; 아미노프테린; 젤로다; 이반드로네이트; 이리노테칸(Camptosar, CPT-11)(5-FU 및 류코보린과 함께 이리노테칸의 치료 요법 포함); 토포이소머라제 억제제 RFS 2000; 디플루오로메틸오르니틴(DMFO); 레티노산과 같은 레티노이드; 카페시타빈; 콤브레타스타틴; 류코보린(LV); 옥살리플라틴 치료 요법(FOLFOX)을 포함하는 옥살리플라틴; 라파티닙(Tykerb®); 세포 증식을 감소시키는 PKC-알파, Raf, H-Ras, EGFR(예를 들어, 엘로티닙(Tarceva®)) 및 VEGF-A의 저해제 및 상기한 것 중 임의의 것의 약제학적으로 허용가능한 염, 산 또는 유도체를 포함할 수 있다.
또한, 치료 방법은 방사선 또는 방사선 요법의 사용을 추가로 포함할 수 있다. 또한, 치료 방법은 외과적 치료의 사용을 추가로 포함할 수 있다.
VII. 치료 방법
본 명세서에 기술된 synTF 조성물은 특히 암 또는 자가면역의 치료를 필요로 하는 대상체에게 투여될 수 있다. 자가면역은 자신의 건강한 세포와 조직에 대한 유기체의 면역 반응 시스템이다. 이러한 비정상적인 면역 반응으로 인해 발생하는 모든 질병을 "자가면역 질환"이라고 한다. 임의의 양태의 일부 실시형태에서, 대상체는 재생 의학 및/또는 면역요법을 필요로 하는 유전적 장애가 있다.
일부 실시형태에서, synTF 시스템은 적어도 하나의 조절인자 단백질 및 이의 상응하는 조절인자 단백질 인듀서에 의해 자체적으로 조절되는, 적어도 하나의 유도성 synTF에 의해 제어되는, 관심 유전자(예를 들어, 치료 단백질, 대사물(analyte))를 발현한다. 이와 같이, 관심 유전자의 발현은 암, 자가면역, 또는 유전적 장애와 같은 질병의 치료를 위한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA 또는 4OHT와 같은 FDA-승인된 소분자)의 존재, 부재, 또는 이의 증가되거나 감소된 수준에 의해 특이적으로 조절될 수 있다.
단지 일예로서, 도 13a-13d는 CD19-CAR이 억제성 프로테아제 synTF에 의해 조절되는 암을 치료하기 위한 예시적인 시스템을 나타낸다. 또 다른 비제한적 예로서, 도 14a-14c는 CD19-CAR 및 IL4가, 각각, 억제성 프로테아제 synTF 및 세포질 격리 synTF에 의해 조절되는 암을 치료하는 예시적인 시스템을 나타낸다. 다른 비제한적 예로서, 도 15a-15c는, 단일 벡터 시스템 또는 이중 벡터 시스템으로부터 발현될 수 있는, 억제성 프로테아제 synTF에 의해 IL10이 조절되는 자가면역 질환을 치료하기 위한 예시적인 시스템을 나타낸다.
일부 실시형태에서, 치료 방법은 본 명세서에 기술된 조성물에 의한 치료로부터 이익을 얻을 수 있는 대상체 또는 환자를 먼저 진단하는 것을 포함할 수 있다. 일부 실시형태에서, 이러한 진단은 대상체 또는 환자로부터의 샘플에서 마커(예를 들어, 본 명세서에 기술된 바와 같은 종양 항원)의 비정상적 수준을 검출하거나 측정하는 것을 포함한다. 일부 실시형태에서, 방법은 본 명세서에 기술된 바와 같은 synTF 조성물을 환자에게 투여하는 것을 추가로 포함한다.
일부 실시형태에서, 대상체는 참조에 비해 본 명세서에 기술된 분석물의 비정상적 수준을 갖는 것으로 이전에 결정된 적이 있다. 일부 실시형태에서, 참조 수준은 유사한 세포 유형, 샘플 유형, 샘플 처리의 샘플에서의 수준, 및/또는 샘플/대상체와 유사한 연령, 성별 및 기타 인구통계학적 파라미터의 대상체로부터 얻은 수준일 수 있다. 일부 실시형태에서, 시험 샘플 및 대조군 참조 샘플은 동일한 유형의 것, 즉 동일한 생물학적 공급원으로부터 수득된 것이고, 동일한 조성, 예를 들어, 동일한 수와 유형의 세포를 포함한다.
본 명세서에 사용되는 용어 "샘플" 또는 "시험 샘플"은 생물학적 유기체, 예를 들어, 대상체의 혈액 또는 혈장 샘플에서 채취하거나 단리한 샘플을 나타낸다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 기술은 생물학적 샘플의 여러 예를 포함한다. 임의의 양태의 일부 실시형태에서, 생물학적 샘플은 세포, 또는 조직, 또는 말초 혈액, 또는 체액이다. 예시적인 생물학적 샘플은, 이로만 제한되는 것은 아니지만, 생검, 종양 샘플, 생체 유체 샘플; 혈액; 혈청; 혈장; 소변; 정액; 점액; 조직 생검; 장기 생검; 활액; 담즙액; 뇌척수액; 점막 분비물; 유출물(effusion); 땀; 타액; 및/또는 조직 샘플 등을 포함한다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. 용어 "시험 샘플"은 미처리 또는 전처리(또는 사전-가공)된 생물학적 시료도 포함한다. 임의의 양태의 일부 실시형태에서, 시험 샘플은 대상체로부터의 세포를 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 설명된 분석물의 비정상적 수준을 가지고 있는지 여부를 결정하는 단계는 i) 대상체로부터 샘플을 얻거나 얻은 적이 있는 단계 및 ii) 대상체의 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 시료에 대해 어세이를 수행하거나 수행한 적이 있는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체에서 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대해 분석을 수행하거나 수행한 적이 있는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체로부터 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대한 분석을 주문하거나 요청하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체에서 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대한 분석 결과를 수신하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 비정상적 수준의 분석물을 갖고 있는지 여부를 결정하는 단계는 대상체를 감소된 수준의 분석물을 갖는 대상체로 확인하는 보고, 결과 또는 다른 수단을 수신하는 단계를 포함할 수 있다.
임의의 실시형태의 한 양태에서, 암(또는 본 명세서에 기술된 바와 같은 또 다른 질병 또는 장애)의 치료가 필요한 대상체에서 암(또는 본 명세서에 기술된 바와 같은 또 다른 질환 또는 장애)을 치료하는 방법이 본 명세서에 기술되며, 상기 방법은 다음을 포함한다: a) 대상체가 본 명세서에 기술된 비정상적 수준의 분석물을 가지고 있는지 여부를 결정하는 단계; 및 b) 분석물의 수준이 참조에 비해 증가하거나 비정상인 경우 대상체에게 본 명세서에 기술된 바와 같은 synTF 조성물을 투여하도록 지시하거나 또는 유도하는 단계. 임의의 양태의 일부 실시형태에서, 대상체에게 특정 치료를 투여하도록 지시하거나 또는 유도하는 단계는 분석 결과의 보고를 제공하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체에게 특정 치료를 투여하도록 지시하거나 유도하는 단계는 분석 결과의 보고 및/또는 분석 결과를 고려한 치료 권고를 제공하는 단계를 포함할 수 있다.
한 양태에서, synTF의 활성을 조절하는 방법이 본 명세서에 기술되며, 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF를 포함하는 세포 집단을 제공하는 단계; 및 (b) 세포 집단을 조절인자 단백질 인듀서의 유효량과 접촉시키는 단계.
한 양태에서, 관심 유전자의 발현을 조절하는 방법이 본 명세서에 기술되며, 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 세포 집단을 제공하는 단계; 및 (b) 세포 집단을 조절인자 단백질 인듀서의 유효량과 접촉시키는 단계를 포함한다.
한 양태에서, 세포-기반 요법이 필요한 대상체를 치료하는 방법이 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, 세포-기반 요법이 필요한 대상체는 관심 유전자의 조절된 발현으로부터 이익을 얻을 임의의 대상체를 포함한다. 임의의 양태의 일부 실시형태에서, 세포-기반 요법을 필요로 하는 대상체는 암, 자가면역, 또는 본 명세서에 기술된 바와 같은 또 다른 질환 또는 장애를 갖는 대상체를 포함한다. 임의의 양태의 일부 실시형태에서, 대상체는 재생 의학 및/또는 면역요법을 필요로 하는 유전적 장애가 있다. 따라서, 상기 방법은 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 세포 집단을 대상체에게 투여하는 단계; 및 (b) 조절인자 단백질 인듀서의 유효량을 대상체에게 투여하는 단계.
synTF가 전사 액티베이터 및 억제성 프로테아제, 유도 근접 도메인, 및/또는 세포질 격리 도메인을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재 하에, synTF는 켜짐이고 관심 유전자의 전사는 켜짐이며; 조절인자 단백질 인듀서의 부재하에, synTF는 꺼짐이고 관심 유전자의 전사는 꺼짐이다.
synTF가 전사 리프레서 및 억제성 프로테아제, 유도 근접 도메인, 및/또는 세포질 격리 도메인을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재하에, synTF는 켜짐이고 관심 유전자의 전사는 꺼짐이고; 조절인자 단백질 인듀서가 부재하에, synTF는 꺼짐이고 관심 유전자의 전사는 켜짐이다.
synTF가 전사 액티베이터 및 유도된 분해 도메인(예를 들어, SMASh)을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재 하에, synTF는 꺼짐이고 관심 유전자의 전사는 꺼짐이며; 조절인자 단백질 인듀서가 없는 경우 synTF는 켜짐이고 관심 유전자의 전사는 켜짐이다.
임의의 양태의 일부 실시형태에서, 세포 집단은 면역 세포를 포함한다. 임의의 양태의 일부 실시형태에서, 면역 세포의 집단은 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함한다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는 세포 집단이 투여되는 것과 동시에 투여된다. 임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는 세포 집단이 투여된 후에 투여된다. 비제한적 예로서, 조절인자 단백질 인듀서는 세포 집단이 투여된 후 적어도 1분, 적어도 2분, 적어도 3분, 적어도 4분, 적어도 5분, 적어도 10분, 적어도 20분, 적어도 30분, 적어도 1시간, 적어도 2시간, 적어도 3시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 2일, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 6일, 적어도 7일, 적어도 1.5주, 적어도 2주, 적어도 3주, 적어도 4주, 적어도 5주, 적어도 6주, 적어도 7주, 적어도 적어도 8주, 적어도 9주, 적어도 10주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월, 적어도 5개월, 적어도 6개월, 적어도 7개월, 적어도 세포 집단이 투여된 후 8개월, 적어도 9개월, 적어도 10개월, 적어도 11개월, 또는 적어도 1년에 투여된다. 임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는, 예를 들어, IV를 사용하여 연속적으로 투여된다.
다양한 실시형태에서, synTF 시스템을 포함하는 세포를 사용하여 암을 치료할 수 있다. 일부 실시형태에서, 암을 치료하기 위해 관심 있는 항암 유전자를 발현하는 synTF 시스템을 포함하는 면역 세포(예를 들어, T 세포).
본 명세서에 사용되는 용어 "암"은 일반적으로 비정상적인 세포가 통제 없이 분열하고 주변 조직을 침범할 수 있는 질병 또는 상태의 부류에 관한 것이다. 암세포는 또한 혈액과 림프 시스템을 통해 신체의 다른 부분으로 퍼질 수 있다. 암에는 몇 가지 주요 유형이 있다. 암종(carcinoma)은 피부 또는 내부 장기를 덮거나 연결하는 피부 또는 조직에서 시작되는 암이다. 육종(sarcoma)은 뼈, 연골, 지방, 근육, 혈관 또는 기타 결합 또는 지지 조직에서 시작되는 암이다. 백혈병은 골수와 같은 혈액 형성 조직에서 시작하여, 많은 수의 비정상 혈액 세포가 생성되어 혈액으로 들어가도록 야기하는 암이다. 림프종과 다발성 골수종은 면역 시스템의 세포에서 시작되는 암이다. 중추신경계 암은 뇌와 척수의 조직에서 시작되는 암이다.
임의의 양태의 일부 실시형태에서, 암은 원발성 암이다. 임의의 양태의 일부 실시형태에서, 암은 악성 암이다. 본 명세서에 사용되는 용어 "악성"은 종양 세포의 그룹이 제어되지 않는 성장(즉, 정상 한계를 넘어서는 분열), 침범(즉, 인접 조직에 대한 침입 및 파괴), 및 전이(즉, 림프 또는 혈액을 통해 신체의 다른 위치로 퍼짐) 중 하나 이상을 나타내는 암을 지칭한다. 본 명세서에 사용되는 용어 "전이하다"는 신체의 한 부분에서 다른 부분으로의 암의 확산을 의미한다. 전이된 세포에 의해 형성된 종양을 "전이성 종양" 또는 "전이"라고 한다. 전이성 종양은 원래(원발성) 종양에 있는 것과 유사한 세포를 포함한다. 본 명세서에 사용되는 용어 "양성" 또는 "비악성"은 더 커질 수 있지만 신체의 다른 부분으로 퍼지지 않는 종양을 지칭한다. 양성 종양은 자가-제한적이며 일반적으로 침범하거나 전이하지 않는다.
"암 세포" 또는 "종양 세포"는 암성 성장 또는 조직의 개별 세포를 의미한다. 종양은 일반적으로 양성, 전악성, 또는 악성일 수 있는, 세포의 비정상적 성장에 의해 형성된 부종 또는 병변을 지칭한다. 대부분의 암세포는 종양을 형성하지만, 일부(예를 들어, 백혈병)는 반드시 종양을 형성하는 것은 아니다. 종양을 형성하는 암세포의 경우, 암(세포)과 종양(세포)이라는 용어는 상호교환적으로 사용된다.
본 명세서에 사용되는 용어 "신생물"은 조직의 임의의 신규 및 비정상 성장, 예를 들어, 조직의 비정상 덩어리를 지칭하며, 이의 성장은 정상 조직의 성장을 초과하고 조정되지 않는다. 따라서, 신생물은 양성 신생물, 전악성 신생물, 또는 악성 신생물일 수 있다.
암 또는 종양이 있는 대상체는 대상체의 신체에 객관적으로 측정가능한 암세포가 존재하는 대상체이다. 이 정의에는 잠재적으로 잠복하는 종양 또는 미세전이뿐만 아니라 악성, 활발하게 증식하는 암이 포함된다. 원래 위치에서 이동하여 다른 중요한 장기에 씨를 뿌린 암은 결국 영향을 받은 장기의 기능 악화를 통해 대상체의 사망을 야기할 수 있다.
암의 예로는, 이로만 제한되는 것은 아니지만, 암종, 림프종, 모세포종, 육종, 백혈병, 기저 세포 암종, 담도암; 방광암; 골암; 뇌 및 CNS 암; 유방암; 복막의 암; 자궁 경부암; 융모막암종(choriocarcinoma); 결장 및 직장암; 결합 조직 암; 소화 시스템의 암; 자궁내막암; 식도암; 안암; 두경부의 암; 위암(위장암 포함); 교모세포종(glioblastoma, GBM); 간세포성 암종(hepatic carcinoma); 헤파토마(hepatoma); 상피내 신생물; 신장(kidney) 또는 신세포(renal) 암; 후두암; 백혈병; 간(liver) 암; 폐암(예를 들어, 소세포 폐암, 비-소세포 폐암, 폐의 선암종, 및 폐의 편평상피암종); 호지킨 림프종 및 비-호지킨 림프종을 포함하는 림프종; 흑색종; 골수종; 신경 모세포종; 구강암(예를 들어, 입술, 혀, 입, 및 인두); 난소암; 췌장암; 전립선암; 망막모세포종; 횡문근육종; 직장암; 호흡기 시스템의 암; 타액선 암종; 육종; 피부암; 편평 세포암; 위암; 고환암; 갑상선 암; 자궁 또는 자궁내막암; 비뇨기 시스템의 암; 외음부암; 뿐만 아니라, 다른 암종 및 육종; 뿐만 아니라, B-세포 림프종(하위 등급/여포성 비호지킨 림프종(NHL), 소림프구성(SL) NHL, 중위 등급/여포성 NHL, 중위 등급 미만성 NHL, 상위 등급 면역모세포성 NHL; 상위 등급 림프모구 NHL; 상위 등급 소형 비-절단 세포 NHL; 벌키 질병 NHL; 외투 세포 림프종; AIDS-관련 림프종; 및 발덴스트롱(Waldenstrom)의 거대글로불린혈증); 만성 림프구성 백혈병(CLL); 급성 림프구성 백혈병(ALL); 헤어리 세포 백혈병; 만성 골수성 백혈병; 및 이식-후 림프증식성 장애(PTLD), 뿐만 아니라 모반증(phakomatoses), 부종(예컨대, 뇌종양과 관련된 부종), 및 메이그(Meig) 증후군과 관련된 비정상적인 혈관 증식을 포함한다.
"암 세포"는 생체내, 생체외 또는 조직 배양에서 암성, 전-암성 또는 형질전환된 세포로서, 반드시 새로운 유전 물질의 흡수를 수반하지 않는 자발적 또는 유도된 표현형 변화를 나타낸다. 형질전환은 형질전환 바이러스로의 감염 및 새로운 게놈 핵산의 도입, 또는 외인성 핵산의 흡수로 인해 발생할 수 있지만, 자연적으로 발생하거나 발암물질에 노출된 후 발생하여, 내인성 유전자를 돌연변이시킬 수도 있다. 형질전환/암은, 예를 들어, 형태학적 변화, 세포의 불멸화, 비정상적인 성장 조절, 병소 형성, 고정 독립성(anchorage independence), 악성, 접촉 억제의 상실 및 성장의 밀도 제한, 성장 인자 또는 혈청 독립성, 종양 특이적 마커, 침습성 또는 전이, 및 누드 마우스와 같은 적합한 동물 숙주에서의 종양 성장과 연관되어 있다.
자가면역 질환
다양한 실시형태에서, synTF 시스템을 포함하는 세포는 자가면역 질환을 치료하는 데 사용될 수 있다. 일부 실시형태에서, 자가면역 질환-특이적 항원에 대해 유도된 관심 유전자를 발현하는 synTF 시스템을 포함하는 면역 세포(예를 들어, T 세포)는 자가면역 질환을 치료하는 데 사용될 수 있다. "자가면역 질환"은 대상체 자신의 항체가 숙주 조직과 반응하거나, 또는 면역 이펙터 T 세포가 내인성 자가-펩티드에 자가반응하여 조직 파괴를 유발하는 질환의 부류를 지칭한다. 따라서 면역 반응은 자가 항원으로 지칭되는 대상체 자신의 항원에 대해 유발된다. 본 명세서에서 "자가-항원"은 정상 숙주 조직의 항원을 의미한다. 정상적인 숙주 조직은 신생물 세포를 포함하지 않는다.
본 명세서에 사용된, 자가항원은 이러한 병원성 면역 반응을 유발하는 내인성 단백질 또는 이의 단편이다. 자가항원은, 자가면역 질환에서, 면역 시스템에 의한 공격의 1차(또는 1차) 표적이 되는 포유동물 내에서 정상적으로 발견되는 임의의 물질 또는 이의 부분일 수 있다. 이 용어는 또한 포유동물에게 투여될 때 자가면역 질환의 특징을 갖는 상태를 유도하는 항원 물질을 포함한다. 추가로, 이 용어는 자가항원의 면역우성 에피토프 또는 면역우성 에피토프 영역으로 본질적으로 구성된 소화성 서브클래스를 포함한다. 유도된 자가면역 상태의 면역우성 에피토프 또는 영역은 질병을 유도하기 위해 전체 자가항원 대신에 사용될 수 있는 자가항원의 단편이다. 자가면역 질환에 걸린 인간에서, 면역우성 에피토프 또는 영역은 자가면역 공격 하에 있는 조직 또는 기관에 특이적인 항원의 단편이며 자가면역 공격 T-세포의 상당한 비율(예를 들어, 반드시 절대 다수는 아니지만 다수)에 의해 인식된다.
자가면역 질환과 관련된 것으로 알려진 자가항원은 탈수초성 질환(예를 들어, 다발성 경화증 및 실험적 자가면역 척수염)이 있는 수초 단백질; 콜라겐 및 류마티스 관절염; 인슐린, 프로인슐린, 글루탐산 탈탄산효소 65(GAD65); 인슐린 의존성 당뇨병이 있는 이자(islet) 세포 항원(ICA512; ICA12)을 포함한다.
다수의 자가면역 관련 질병 및 염증 상태의 공통된 특징은 전염증성 CD4+ T 세포의 관여이다. 이들 T 세포는 염증성 Th1 유형 사이토카인의 방출을 담당한다. Th1 유형을 특징으로 하는 사이토카인은 인터루킨 2(IL-2), γ-인터페론, TNFα 및 IL-12를 포함한다. 이러한 전염증성 사이토카인은 면역 반응을 자극하는 작용을 하여, 많은 경우 자가 조직의 파괴를 초래한다. T 세포 반응의 억제와 관련된 사이토카인은 Th2 유형이며, IL-10, IL-4 및 TGF-β를 포함한다. Th1 및 Th2 유형 T 세포는 면역원에 반응하여 동일한 항원 수용체를 사용할 수 있음이 밝혀졌고; 전자는 자극성 반응을 생성하고 후자는 억제적 반응을 생성한다.
본 명세서에는 자가면역 질환의 치료를 필요로 하는 환자에게 유효량의 synTF 조성물을 투여하는 것을 포함하는, 자가면역 질환의 치료 방법이 제공된다. 기재된 방법 중 어느 하나의 한 실시형태에서, 자가면역 장애는 하기로 이루어진 그룹으로부터 선택된다: 갑상선염, 제1형 당뇨병, 하시모토 갑상선염, 그레이브스병, 체강병, 다발성 경화증, 길랭-바레 증후군, 애디슨병, 레이노 현상(Raynaud's phenomenon), 굿파스처병, 관절염(급성 관절염과 같은 류마티스 관절염, 만성 류마티스 관절염, 통풍 또는 통풍성 관절염, 급성 통풍성 관절염, 급성 면역학적 관절염, 만성 염증성 관절염, 퇴행성 관절염, II형 콜라겐-유도 관절염, 감염성 관절염, 라임 관절염, 증식성 관절염, 건선 관절염, 스틸병(Still's disease), 척추 관절염, 및 소아-발병 류마티스 관절염, 예후성 관절염(arthritis chronica progrediente), 기형 관절염, 원발성 다발성 관절염(polyarthritis chronica primaria), 반응성 관절염, 및 강직성 척추염(ankylosing spondylitis)), 염증성 과증식성 피부 질환, 판상 건선, 창자 건선, 농포성 건선, 및 손톱 건선과 같은 건선, 건초열 및 잡스 증후군과 같은 아토피성 질환을 포함하는 아토피, 접촉성 피부염, 만성 접촉성 피부염, 박리성 피부염, 알레르기성 피부염, 알레르기성 접촉성 피부염, 포진성 피부염, 문상 피부염(nummular dermatitis), 지루성 피부염, 비-특이적 피부염, 일차 자극성 접촉 피부염, 및 아토피성 피부염을 포함하는 피부염, x-연관 고 IgM 증후군, 알레르기성 안내 염증성 질환, 두드러기, 예컨대 만성 알레르기성 두드러기 및 만성 자가면역 두드러기를 포함하는, 만성 특발성 두드러기, 근염, 다발성 근염(polymyositis)/피부근염, 소아 피부근염, 독성 표피 괴사 용해, 경피증(전신성 경피증 포함), 경화증, 예컨대 전신성 경화증, 다발성 경화증, 예컨대 척추-광학(spino-optical) MS, 원발성 진행성 MS(PPMS), 및 재발 완화형 MS(RRMS), 진행성 전신성 경화증, 죽상동맥경화증, 동맥경화증, 확산성 경화증(sclerosis disseminata), 운동실조성 경화증, 시신경척수염(neuromyelitis optica, NMO), 염증성 장질환(IBD)(예를 들어, 크론병, 자가면역-매개 위장 질환, 대장염, 예컨대 궤양성 대장염(ulcerative colitis), 대장 궤양(colitis ulcerosa), 현미경적 대장염, 교원성 대장염(collagenous colitis), 용종성 대장염(colitis polyposa), 괴사성 장염(necrotizing enterocolitis), 및 경벽 대장염(transmural colitis), 및 자가면역 염증성 장 질환), 장 염증, 괴저성 농피증, 결절 홍반, 원발성 경화성 담관염, 성인 또는 급성 호흡 곤란 증후군(ARDS)을 포함하는 호흡 곤란 증후군, 수막염, 포도막(uvea) 전체 또는 일부의 염증, 홍채염, 맥락막염, 자가면역성 혈액 장애, 류마티스 척추염 , 류마티스성 활막염, 유전성 혈관부종, 수막염에서와 같은 뇌신경 손상, 임신 포진(herpes gestationis), 임신성 천포창(pemphigoid gestationis), 음낭 가려움증(pruritis scroti), 자가면역성 조기난소부전, 자가면역 상태로 인한 돌발성 난청, IgE-매개 질환, 예컨대 아나필락시스 및 알레르기성 및 아토피성 비염, 뇌염, 예컨대 라스무센 뇌염 및 변연 및/또는 뇌간 뇌염, 포도막염, 예컨대 전방 포도막염, 급성 전방 포도막염, 육아종성 포도막염, 비육아종성 포도막염, 수정체항원성 포도막염, 후방 포도막염, 또는 자가면역성 포도막염, 신증후군(nephrotic syndrome)이 있거나 없는 사구체신염(GN), 예컨대 만성 또는 급성 사구체신염, 예컨대 원발성 GN, 면역-매개 GN, 막성 GN(막성 신병증), 특발성 막성 GN 또는 특발성 막성 신병증, 유형 I 및 유형 II를 포함하는 막성- 또는 막성 증식성 GN(MPGN), 및 급속 진행성 GN, 증식성 신염, 자가면역 다선 내분비 부전, 형질세포성국한성귀두염(balanitis circumscripta plasmacellularis)을 포함하는 귀두염, 귀두포피염(balanoposthitis), 원심성환상홍반(erythema annulare centrifugum), 고정이색소성홍반(erythema dyschromicum perstans), 다형성 홍반(eythema multiform), 환상 육아종(granuloma annulare), 광택태선(lichen nitidus), 경화성위축성태선(lichen sclerosus et atrophicus), 만성 단순 태선, 가시성 태선, 편평 태선, 층판 어린선(lamellar ichthyosis), 표피용해성 과각화증(epidermolytic hyperkeratosis), 전암성 각화증, 괴저성 농피증, 알레르기성 상태 및 반응, 알레르기성 리액션(allergic reaction), 알레르기성 또는 아토피성 습진, 지방성 습진, 이한성 습진 및 수포성 손바닥 발바닥 습진을 포함한 습진, 천식, 예컨대 천식 기관지(asthma bronchiale), 기관지성 천식(bronchial asthma), 및 자가면역천식, T 세포의 침윤 및 만성 염증 반응을 포함하는 상태, 임신 중 태아 A-B-O 혈액형과 같은 외래 항원에 대한 면역 반응, 만성 폐염증 질환, 자가면역 심근염(autoimmune myocarditis), 백혈구 부착 결핍(leukocyte adhesion deficiency), 루푸스 신염, 루푸스 뇌염, 소아 루푸스, 비-신장성(non-renal) 루푸스, 신장 외 루푸스, 원판상 루푸스 및 원판상 홍반 루푸스(discoid lupus erythematosus), 탈모성 루푸, 전신성 홍반성 루푸스(SLE) 또는 피부 SLE 또는 아급성 피부 SLE와 같은 신생아 피부하 SLE(피부하 SLE), 신생아 루푸스 증후군(NLE) 및 파종성 홍반성 루푸스를 포함하는, 루프스, 소아 인슐린-의존성 당뇨병(IDDM)을 포함하는, 소아 발병(제1형) 당뇨병, 성인 발병 당뇨병(II형 당뇨병), 자가면역 당뇨병, 특발성 당뇨병성 요붕증(idiopathic diabetes insipidus), 당뇨병성 망막병증, 당뇨병성 신병증, 당뇨병성 대동맥 장애, 사이토카인 및 T-림프구에 의해 매개되는 급성 및 지연 과민반응과 연관된 면역 반응, 유육종증(sarcoidosis), 림프종 육아종증(lymphomatoid granulomatosis)을 포함한 육아종증, 베게너 육아종증, 무과립구증, 혈관염(vasculitis)을 포함하는 혈관염증(vasculitides), 대혈관 혈관염(류마티스성 다발성 근육통 및 거대 세포(다카야스) 동맥염 포함), 중형 혈관염(가와사키병 및 결절성 다발동맥염(polyarteritis nodosa)/결절성 동맥염(periarteritis nodosa) 포함), 현미경적 다발동맥염, 면역혈관염, CNS 혈관염, 피부 혈관염, 과민성 혈관염, 전신성 괴사성 혈관염과 같은 괴사성 혈관염, ANCA 관련 혈관염, 예컨대 크루그-스트라우스(Churg-Strauss) 혈관염 또는 증후군(CSS) 및 ANCA-관련 소혈관 혈관염, 측두 동맥염(temporal arteritis), 자가면역 재생불량성 빈혈, 쿰스(Coombs) 양성 빈혈, 다이아몬드 블랙판 빈혈, 자가면역 용혈성 빈혈(AIHA)을 포함한 용혈성 빈혈 또는 면역성 용혈성 빈혈, 악성 빈혈(pernicious anemia)(고립성 빈혈(anemia perniciosa)), 애디슨병, 순수 적혈구 빈혈 또는 무형성증(PRCA), 인자 VIII 결핍증, A형 혈우병, 자가면역 호중구감소증, 범혈구감소증, 백혈구감소증, 백혈구 혈관누출(leukocyte diapedesis) 관련 질환, CNS 염증성 장애, 패혈증에 이차적인 것과 같은 다발성 장기 손상 증후군, 트라우마 또는 출혈, 항원-항체 복합체 매개 질환, 항-사구체 기저막 질환, 항-인지질항체 증후군, 알레르기성 신경염, 베체트 질환/증후군, 캐슬만(Castleman) 증후군, 굿파스처(Goodpasture) 증후군, 레이노(Reynaud) 증후군, 쇼그렌(Sjogren) 증후군, 스티븐스-존슨(Stevens-Johnson) 증후군, 천포창 수포성 및 피부 천포창과 같은 천포창, 천포창(심상 천포창, 폴리아세우스 천포창, 천포창 점액-막 천포창 및 홍반성 천포창 포함), 자가면역 다발내분비병증, 라이터병 또는 증후군, 면역복합신염과 같은 면역복합질환, 항체-매개성 신염, 다발성신경병증, IgM 다발신경병증 또는 IgM 매개 신경병증과 같은 만성 신경병증 및 만성 또는 급성 ITP를 포함하는 특발성 혈소판 감소성 자반병(ITP)과 같은 자가면역 또는 면역-매개 혈소판 감소증, 공막염, 예컨대 특발성 각막 공막염(idiopathic cerato-scleritis), 상공막염, 자가면역 고환염(autoimmune orchitis) 및 난소염(oophoritis)을 포함한 고환 및 난소의 자가면역 질환, 원발성 갑상선기능저하증, 부갑상선기능저하증, 자가면역갑상선염과 같은 갑상선염, 하시모토병, 만성갑상선염(하시모토 갑상선염), 또는 아급성갑상선염을 포함한 자가면역 내분비질환, 특발성 갑상선기능저하증, 그레이브병, 자가면역 다선 증후군(또는 다선 내분비병증 증후군)과 같은 다선 증후군, 램버트-이튼(Lambert-Eaton) 근무력 증후군 또는 이튼-랩버트 증후군과 같은 신경학적 부신생물 증후군을 포함하는, 부신생물 증후군, 강직한 남성(stiff-man) 또는 강직한 사람(stiff-person) 증후군, 알레르기성 뇌척수염(allergic encephalomyelitis) 또는 뇌척수염성 알레르기(encephalomyelitis allergica)과 같은 뇌척수염 및 실험적 알레르기성 뇌척수염(EAE), 흉선종-관련 중증 근무력증, 소뇌 변성, 신경근긴장증, 옵소클로누스(opsoclonus) 또는 옵소클로누스 간대성 근경련 증후군(OMS), 및 감각 신경병증과 같은 중증 근무력증, 다초점 운동 신경병증, 쉬한(Sheehan) 증후군, 자가면역 간염, 루푸스 간염, 거대 세포 간염, 자가면역 만성 활동성 간염, 림프성 간질성 폐렴(LIP), 폐쇄성 세기관지염(비-이식) 대(vs) NSIP, 길랭-바레(Guillain-Barre) 증후군, 베르거(Berger) 신병증(IgA 신병증), 특발성 IgA 신병증, 선형 IgA 피부병, 급성 열성 호중구 피부병, 각막하 농포성 피부병, 일과성 가극세포 용해성 피부병(transient acantholytic dermatosis), 원발성 담즙성 간경변증 및 폐렴 간경변증과 같은 간경변증, 자가면역 장병증 증후군, 체강(체강) 또는 체강병(Coeliac disease), 셀리악 스프루(글루텐 장병증), 난치성 스프루, 특발성 스프루, 한랭글로불린혈증, 편도 위축성 측삭 경화증(ALS; 루게릭병), 관상동맥 질환, 자가면역 내이 질환(AIED)과 같은 자가면역 귀 질환, 자가면역 청력 상실, 불응성 또는 재발(relapsed) 또는 재발성(relapsing) 다발연골염(polychondritis)과 같은 다발연골염, 폐포 단백증(pulmonary alveolar proteinosis), 코간 증후군/비매독 간질 각막염, 벨 마비, 스위트병/증후군, 자가면역 주사비(rosacea autoimmune), 조스터-관련 통증, 아밀로이드증, 비-암성 림프구증가증, 단클론성 B 세포 림프구증가증(예를 들어, 양성 단클론성 감마병증 및 미확인 중요성의 단클론성 감마병증, MGUS)을 포함하는 원발성 림프구증가증, 말초 신경병증, 종양 부종 증후군, CNS의 채널병증(channelopathies)을 포함한 채널병증, 자폐증, 염증성 근병증, 국소 또는 분절 또는 국소 분절 사구체경화증(FSGS), 내분비 안과병증, 포도막망막염, 맥락망막염, 자가면역 간 질환(autoimmune hepatological disorder), 섬유근육통, 다발성 내분비 부전, 슈미트 증후군, 부신염, 위 위축, 자가면역 탈수초성 질환 및 만성 염증성 탈수초성 다발신경병증과 같은 탈수초성 질환(demyelinating diseases), 드레슬러(Dressler) 증후군, 원형 탈모증, 전두 탈모증, CREST 증후군(석회화증, 레이노 현상, 식도 운동장애, 경화증, 모세혈관확장증), 남성 및 여성 자가면역 불임(예를 들어, 항-정자 항체로 인한), 혼합 결합 조직 질환, 샤가스(Chagas) 질환, 류마티스열, 반복 유산, 농부의 폐, 다형 홍반(erythema multiforme), 심장절개후 증후군(post-cardiotomy syndrome), 쿠싱(Cushing) 증후군, 버드팬시(bird-fancier) 폐, 알레르기 육아종성 혈관염, 양성 림프구성 혈관염, 알포트(Alport) 증후군, 알레르기성 폐포염 및 섬유화성 폐포염과 같은 폐포염, 간질성 폐질환, 수혈 반응, 샘프터(Sampter) 증후군, 카플란(Caplan) 증후군, 심내막염, 심근내막 섬유증, 미만성 간질성 폐섬유증, 간질성 폐 섬유증, 폐섬유증, 특발성 폐섬유증, 낭포성 섬유증, 안구내염, 지속융기홍반(erythema elevatum et diutinum), 태아 적혈구증, 호산구성 안면염, 슐만(Shulman) 증후군, 펠티(Felty) 증후군, 모양체염, 예컨대 만성 모양체염(chronic cyclitis), 헤테로만성 모양체염, 홍체모양체염(iridocyclitis)(급성 또는 만성) 또는 푸치(Fuch) 모양체염, 히노치-숀레인(Henoch-Schonlein) 자반병, SCID, 패혈증, 내독소혈증, 예방접종 후 증후군, 에반(Evan) 증후군, 자가면역 생식선 부전, 시드남 무도병(Sydenham's chorea), 연쇄상 구균 후 신염, 혈전혈관염(thromboangitis ubiterans), 갑상선 중독증, 척수매독(tabes dorsalis), 맥락막염, 거대 세포 다발성 근육통, 만성 과민성 폐렴, 건성 각결막염(keratoconjunctivitis sicca), 특발성 신염 증후군, 최소 변화 신병증, 양성 가족성 및 허혈 재관류 손상, 이식장기 재관류, 망막 자가면역, 아프타(aphthae), 아프타성 구내염, 동맥경화 장애, 무정자형성(aspermiogenesis), 자가면역 용혈, 보엑 질환(Boeck's disease), 알레르기성 장염, 결절성 홍반, 특발성 안면마비, 만성 피로 증후군, 류마티스성 열병, 함만-리치 질환(Hamman-Rich's disease), 감각신경성 청력 상실, 국소 회장염, 백혈구 감소증, 횡단 척수염, 원발성 특발성 점액종, 교감 안염(ophthalmia symphatica), 급성 다발성신경근염, 괴저 농피증, 후천성 비장 위축, 백반증, 독성 쇼크 증후군, T 세포 침윤과 관련된 상태, 백혈구 부착 결핍증, 사이토카인 및 T-림프구에 의해 매개되는 급성 및 지연 과민반응과 관련된 면역 반응, 백혈구 혈관누출과 관련된 질환, 다발성 장기 손상 증후군, 항원-항체 복합체 매개 질환, 항-사구체 기저막 질환, 알레르기성 신경염, 자가면역 다내분비병증(autoimmune polyendocrinopathies), 난소염, 원발성 점액종, 자가면역 위축성 위염, 류마티스 질환, 혼합 결합 조직 질환, 신증후군, 췌도염(insulitis), 다내분비 부전, 자가면역 다선성 증후군 I형, 성인-발병 특발성 부갑상선기능저하증(AOIH), 심근염, 신 증후군, 원발성 경화성 담관염, 급성 또는 만성 부비동염, 사골(ethmoid), 전두(frontal), 상악(maxillary), 또는 접형골(sphenoid ) 부비동염, 호산구 관련 장애, 예컨대 호산구 증가증, 폐 침윤 호산구 증가증, 폐침윤 호산구 증가증, 호산구 증가 근육통 증후군(eosinophilia-myalgia syndrome), 로플러(Loffler) 증후군, 만성 호산구성 폐렴, 열대성 폐 호산구 증가증, 호산구 함유 육아종, 혈청 음성 척추관절염, 다내분비 자가면역 질환, 경화성 담관염, 공막(sclera), 상공막(episclera), 브루톤(Bruton) 증후군, 유아(infancy)의 일과성 저감마글로불린혈증, 비스코트-얼드리치 증후군(Wiskott-Aldrich Syndrome), 미세혈관확장성운동실조(ataxia telangiectasia syndrome), 혈관확장증, 콜라겐 질환과 관련된 자가면역 장애, 류머티즘, 알레르기 과민성 장애, 사구체신염, 재관류 손상, 허혈성 재관류 장애, 림프종성 기관기관지염, 염증성 피부병(inflammatory dermatoses), 급성 염증성 성분이 있는 피부병, 및 자가면역 포도막염(autoimmune uveoretinitis)(AUR).
유전적 장애
다양한 실시형태에서, synTF 시스템을 포함하는 세포는 유전적 장애를 치료하는데 사용될 수 있다. 일부 실시형태에서, 결함있는 유전자를 대체하는 관심 유전자를 발현하는 synTF 시스템을 포함하는 세포는 유전적 장애를 치료하는 데 사용될 수 있다. 일부 실시형태에서, 세포는 줄기 세포이다.
본 명세서에 기술된 synTF 시스템 또는 세포를 사용하여 치료될 수 있는 유전적 장애의 비제한적인 예는 다음을 포함한다: 혈색소병증; b-지중해 빈혈 메이저; α- 지중해 빈혈 메이저; 겸상 적혈구 빈혈; 면역결핍 질환; 중증 복합 면역결핍 증후군; 베어 림프구 증후군; 만성 육아종 질환; 비스코트-얼드리치 증후군(Wiskott-Aldrich Syndrome); 영아 무과립구증(코스트만 증후군); 태만 백혈구 증후군(호중구 액틴 결핍증); 호중구 막 GP-180 결핍증; 무감마글로불린혈증; X-연관 림프증식성 증후군; X-연관 고-IgM 증후군; 신진 대사의 선천적 오류; 점액다당류; 헐러병(MPS-1)(α-이두로니다제 결핍증); 헐러-샤이에 증후군(Hurler-Scheie syndrome); 헌터병(MPS-II)(이두로네이트 설파타제 결핍증); 산필리포 B(MPS-IIIB)(α-글리코사미니다제 결핍증); 모르퀴오(MPS-IV)(헥소사민-6-설파타제 결핍증); 마로토-라미 증후군(MPS-VI)(아릴설파타제 B 결핍증); 슬라이(Sly) 증후군(MPS-VII)(b-글루쿠로니다제 결핍증); 점액지질증; 파브리병(Fabry disease)(α-갈락토시다제 A 결핍증); 고셔병(글루코세레브로시다제 결핍증); 크라베병(Krabbe disease)(갈락토실세라미다제 결핍증); 이색성 백혈구 이영양증(아릴설파타제 A 결핍, 니만-픽병(스핑고미엘리나제 결핍; 부신 백질이영양증(Adrenal leukodystrophy); I-세포 점액 지질증 I;, 조혈 질환; 골화석증(Osteopetrosis); 다이아몬드-블랙판 증후군; 및 판코니 빈혈.
Ⅷ. 정의
편의상, 명세서, 실시예 및 첨부된 특허청구범위에 사용된 일부 용어 및 구문의 의미가 아래에 제공된다. 달리 명시되지 않거나 문맥에서 암시되지 않는 한, 다음 용어 및 어구는 아래 제공된 의미를 포함한다. 정의는 특정 실시형태를 설명하는 데 도움을 주기 위해 제공되며, 본 발명의 범위는 청구범위에 의해서만 제한되기 때문에 청구된 발명을 제한하도록 의도되지 않는다. 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 해당 기술 분야에서 용어의 사용과 여기에 제공된 정의 사이에 명백한 불일치가 있는 경우 본 명세서에 제공된 정의가 우선한다.
편의를 위해, 명세서, 실시예 및 첨부된 청구범위에서, 사용된 특정 용어가 여기에 모여있다.
본 명세서에 사용되는 용어 "조작된 반응성 리포터" 또는 "조작된 전사 단위"는 리포터 유전자에 작동가능하게 연결된 조작된 프로모터를 함유하는 핵산 구축물이고, 리포터 유전자의 발현은 상류 조절 요소, 예컨대 조작된 프로모터에서 직교 DNA 표적 서열(들)에 의해 제어된다. 리포터 유전자는 일반적으로 유전자 산물인 전사된 단백질, 예를 들어, 녹색 형광 단백질이 쉽게 검출되고 모니터링되는 것이다.
본 명세서에 사용된 바와 같이, 당업계에서 사용되는 용어 "프로모터"는 특정 유전자의 전사를 개시하고 RNA 폴리머라제가 결합하여 전사를 개시하는 DNA 영역이다. 프로모터는 유전자의 전사 시작 부위 근처, 동일한 가닥 및 DNA 상류에 위치한다.
본 명세서에 사용되는 용어 "직교"는 DNA 서열 및 게놈 생물학에서 사용될 때 "직교"는 진핵 시스템에서 천연에서 자연적으로 발생하는 것과 매우 상이한 DNA 서열을 의미한다.
조작된 프로모터 또는 조작된 전사 단위 또는 조작된 반응성 리포터와 관련하여 본 명세서에 사용되는 용어 "반응성", 이 용어는 상류 근처의 직교 DNA 표적 서열이 각각의 ZF-함유 합성 전사 인자에 의해 결합될 때 프로모터로부터의 유전자 전사 개시가 강화되거나 억제되는지 여부를 지칭한다.
본 명세서에 사용되는 용어 "작동가능하게 연결된"은 핵산 구축물, 조작된 반응성 리포터 및 조작된 전사 단위에서 본 명세서에 기술된 직교 DNA 표적 서열 또는 프로모터 서열(RNA 중합효소 결합 부위)과 관련하여 사용될 때 직교 DNA 표적 서열 및 프로모터가 인-프레임(in-frame)으로 존재하고, 전사 인자 또는 전사에 대한 RNA 폴리머라제에 의한 각각의 결합 효과를 허용하기 위해 단백질 또는 펩티드 또는 RNA를 코딩하는 핵산으로부터 적절한 공간 및 거리에 있음을 의미한다.
용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며, 선형 또는 원형 형태 및 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오티드(DNA) 또는 리보뉴클레오티드(RNA) 중합체를 지칭한다. 본 개시의 목적을 위해, 이러한 DNA 또는 RNA 중합체는 천연 뉴클레오티드, 비-천연 또는 합성 뉴클레오티드, 및 이들의 혼합물을 포함할 수 있다. 비천연 뉴클레오티드는 천연 뉴클레오티드의 유사체 뿐만 아니라 염기, 당 및/또는 인산염 모이어티(예를 들어, 포스포로티오에이트 골격)에서 변형된 뉴클레오티드를 포함할 수 있다. 변형된 핵산의 비제한적인 예는 PNA 및 모르폴리노 핵산이다. 일반적으로 특정 뉴클레오티드의 유사체는 동일한 염기쌍 특이성을 가지며, 즉 G의 유사체는 C와 염기쌍을 이룰 수 있다. 본 개시의 목적을 위해, 이러한 용어는 중합체의 길이와 관련하여 제한하는 것으로 간주되어서는 안된다.
본 명세서에 사용된, "유전자"는 폴리펩티드 또는 리보핵산 유전자 생성물의 생산에 관여하는 핵산(전형적으로 DNA)의 세그먼트이다. 이것은 코딩 영역(리더 및 트레일러)의 앞뒤 영역을 비롯한 개별 코딩 세그먼트(엑손) 사이의 개재 서열(인트론)을 포함한다. 편리하게는, 이 용어는 또한 관련 코딩 서열에 인접하거나 또는 멀리 떨어져 있을 수 있는 유전자 발현에 필요한 제어 서열(예를 들어, 인핸서, 사일런서, 프로모터, 터미네이터 등) 뿐만 아니라, 유전자 생성물을 코딩하는 코딩 및/또는 전사된 영역을 포함한다.
본 명세서에 사용되는 용어 "조절(modulation)"은 유전자 발현과 관련하여 유전자 활성의 변화를 의미한다. 조절은 활성화(즉, 활성 또는 발현 수준의 증가)와 유전자 활성의 억제 또는 저해를 모두 포함한다. 본 개시의 바람직한 실시형태에서, 본 개시의 치료 분자(예를 들어, 펩티드)는 유전자 발현 또는 활성의 리프레서이다.
본 명세서에 사용된, 핵산 "표적", "표적 부위" 또는 "표적 서열" 또는 "DNA 표적 서열"은 본 개시의 synTF의 ZFA가 결합할 핵산 서열이며, 단, 결합 반응의 조건은 제한적이지 않다. 표적 부위는 핵산 분자 또는 더 큰 폴리뉴클레오티드의 일부일 수 있다. 본 개시에 따르면, 본 개시의 synTF에서 ZFA에 대한 표적 서열은 단일 인접 핵산 서열을 포함할 수 있다. 이들 용어는 또한 상호교환적으로 사용되는 "결합 부위", "결합 서열", "인식 부위" 또는 인식 서열"이라는 용어로 대체되거나 보충될 수 있다.
본 명세서에 사용된 "결합(binding)"은 거대분자 간의 비공유 상호작용(예를 들어, ZF 어레이 함유 단백질과 핵산 표적 부위 사이)을 지칭한다. 일부 경우에, 결합은 하나 이상의 특정 뉴클레오티드(또는 염기쌍)와 하나 이상의 특정 아미노산 사이와 같이 서열-특이적일 것이다. 그러나, 결합 상호작용의 모든 성분이 서열-특이적일 필요는 없다는 것이 이해될 것이다(예를 들어, DNA 백본에서 포스페이트 잔기와의 비-공유적 상호작용). 본 개시의 핵산 서열과 ZF 펩티드 간의 결합 상호작용은 결합 친화도 및/또는 해리 상수(Kd)를 특징으로 할 수 있다. 표적 부위에 결합하는 본 개시의 ZF 펩티드에 대한 적합한 해리 상수는 1 μM 이하, 1 nM 이하, 또는 1 pM 이하 정도(order)일 수 있다. "친화도"는 결합의 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 Kd 값과 상관관계가 있다. 본 개시의 ZF synTF는 DNA-결합 활성, RNA-결합 활성 및/또는 심지어 단백질-결합 활성을 가질 수 있다. 일부 실시형태에서, 본 개시의 ZF synTF는 서열 특이적 dsDNA-결합 활성을 갖도록 설계되거나 선택된다. 예를 들어, 특정 ZF 어레이 또는 단백질에 대한 표적 부위는 관련(concerned) ZF가 뉴클레오티드-특이적 결합이 가능한 서열이다. 그러나, ZF 어레이 또는 단백질의 아미노산 서열에 따라, 하나 이상의 표적 서열에 결합하거나 이를 인식할 수 있지만, 일반적으로 하나의 서열은, 개별 비-공유적 상호작용의 상대적 특이성에 의존하여, 임의의 다른 인식 서열에 대해 우선적으로 결합할 수 있다. 일반적으로, 특이적 결합은 바람직하게는 1 nM 이하, 100 pM 이하; 또는 10 pM 이하의 해리 상수(Kd)로 달성된다. 일부 실시형태에서, 본 개시의 ZF synTF는 1 nM 이하, 또는 1 pM 이하, 또는 0.1 pM 이하, 또는 심지어 10 fM 이하의 해리 상수로 특정 표적 서열에 결합한다.
"비-표적"은 관련된 핵산 서열이 관련 ZF 펩티드에 의해 인식할 수 있을 정도로 결합되지 않음을 의미한다. 일부 실시형태에서, 본 명세서에 기술된 ZF 펩티드가 공지된 서열-특이적 표적 서열을 갖는 경우, 다른 모든 핵산 서열은 비-표적인 것으로 간주될 수 있는 것으로 고려될 수 있다. 실용적인 관점에서, 비-표적 서열과 특정 ZF 펩티드 사이의 상호작용을 하위-생리학적인 것(즉, 생리학적 표적 서열/ZF 펩티드 농도 하에서 생리학적 반응을 생성할 수 없음)으로 정의하는 것이 편리할 수 있다. 예를 들어, ZF 펩티드와 비-표적 서열 사이의 결합을 측정할 수 있는 경우, 해리 상수(Kd)는 일반적으로 1μM 보다 더 약하며, 예컨대 10 μM 또는 그 보다 약하거나, 100 μM 또는 그 보다 약하거나, 또는 적어도 1 mM이다.
본 명세서에 사용되는 용어 "상호작용"은 수용체 및 이의 리간드의 맥락에서 사용될 때 수용체의 리간드-결합 부위(또는 단편)와 리간드의 수용체-결합 부위(또는 단편) 사이의 비공유 결합의 결과로서 수용체와 이의 리간드 사이의 결합을 지칭한다. 서로에 대해 약간의 결합 친화도를 갖는, 2개의 엔티티, 예를 들어, 분자 또는 단백질의 맥락에서, 용어 "상호작용"은 2개의 엔티티 간의 비-공유적 결합의 결과로서 2개의 엔티티의 결합을 지칭한다. 용어 "상호작용", "복합체화(complexing)" 및 "결합(bonding)"은 수용체 및 이의 리간드의 맥락에서 그리고 2개의 결합 엔티티의 맥락에서 사용될 때 상호교환적으로 사용된다.
용어 "감소하다(decrease)", "감소된(reduced)", "감소(reduction)" 또는 "저해하다(inhibit)"는 모두 통계적으로 유의한 양만큼 감소를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, "감소되다(reduce)", "감소(reduction)" 또는 "감소(decrease)" 또는 "저해하다(inhibit)"는 전형적으로 참조 수준(예를 들어, 주어진 치료제 또는 작용제의 부재)과 비교하여 적어도 10% 감소를 의미하고, 예를 들어, 적어도 약 10%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 그 이상 만큼의 감소를 포함할 수 있다. 본 명세서에 사용된 "감소" 또는 "저해"는 참조 수준과 비교하여 완전한 저해 또는 감소를 포함하지 않는다. "완전한 저해"는 참조 수준과 비교하여 100% 저해이다. 감소는 바람직하게는, 예를 들어, 주어진 장애가 없는 개인에 대해 정상 범위 내에서 허용되는 수준까지 낮아질 수 있다.
용어 "증가된(increased)", "증가하다(increase)", "강화하다(enhance)" 또는 "활성화하다(activate)"는 모두 정적으로 유의한 양만큼 증가를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, 용어 "증가된", "증가하다", "강화하다" 또는 "활성화하다"는 참조 수준과 비교하여 적어도 10%의 증가, 예를 들어, 참조 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%의 증가 또는 이를 포함하여 최대 100% 증가 또는 10-100% 사이의 임의의 증가, 또는 참조 수준과 비교하여 적어도 약 2배, 또는 적어도 약 3배, 또는 적어도 약 4배, 또는 적어도 약 5배 이상 또는 적어도 약 10배 증가, 또는 2배 내지 10배 이상의 임의의 증가를 의미할 수 있다. 마커 또는 증상과 관련하여, "증가"는 이러한 수준에서의 통계적으로 유의한 증가이다.
본 명세서에 사용된 "대상체"는 인간 또는 동물을 의미한다. 일반적으로 동물은 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류는 침팬지, 사이노몰구스 원숭이, 거미 원숭이, 및 마카크(macaques), 예를 들어, 레수스(Rhesus)를 포함한다. 설치류는 마우스, 래트, 우드척, 페럿, 토끼 및 햄스터를 포함한다. 가축 및 사냥감 동물은 소, 말, 돼지, 사슴, 들소, 버팔로, 펠린 종, 예를 들어, 국내 고양이, 카닌 종, 예를 들어, 개, 여우, 늑대, 조류 종, 예를 들어, 닭, 에뮤, 타조 및 물고기, 예를 들어, 송어, 메기 및 연어를 포함한다. 일부 실시형태에서, 대상체는 포유동물, 예를 들어, 영장류, 예를 들어, 인간이다. "개체(individual)", "환자" 및 "대상체"라는 용어는 본 명세서에서 상호교환적으로 사용된다.
바람직하게는, 대상체는 포유동물이다. 포유동물은 인간, 인간이 아닌 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있지만, 이들 예에 제한되는 것은 아니다. 인간 이외의 포유동물은 유리하게는 암의 동물 모델을 나타내는 대상체로 사용될 수 있다. 대상체는 남성 또는 여성일 수 있다.
대상체는 치료가 필요한 상태(예를 들어, 암) 또는 이러한 상태와 관련된 하나 이상의 합병증을 앓고 있거나 지니는 것으로 이전에 진단된 적이 있거나 또는 확인된 적이 있는 사람일 수 있으며, 선택적으로 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증에 대한 치료를 이미 받은 사람일 수 있다. 대안적으로, 대상체는 또한 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증을 갖는 것으로 이전에 진단되지 않은 사람일 수 있다. 예를 들어, 대상체는 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증에 대한 하나 이상의 위험 인자를 나타내는 사람 또는 위험 인자를 나타내지 않는 대상체일 수 있다.
특정 상태에 대한 치료가 "필요한 대상체"는 해당 상태를 갖고 있거나, 해당 상태를 갖는 것으로 진단되거나, 또는 해당 상태가 발생할 위험이 있는 대상체일 수 있다.
본 명세서에 사용되는 용어 "단백질" 및 "폴리펩티드"는 인접한 잔기의 알파-아미노 및 카복시기 사이의 펩티드 결합에 의해 서로 연결된, 일련의 아미노산 잔기를 나타내기 위해 상호교환적으로 사용된다. 용어 "단백질" 및 "폴리펩티드"는, 크기나 기능에 관계없이, 변형된 아미노산(예를 들어, 인산화, 당화(glycated), 글리코실화(glycosylated) 등) 및 아미노산 유사체를 포함하는 아미노산의 중합체를 지칭한다. "단백질" 및 "폴리펩티드"는 종종 비교적 큰 폴리펩티드와 관련하여 사용되는 반면, 용어 "펩티드"는 종종 작은 폴리펩티드와 관련하여 사용되지만, 당업계에서 이러한 용어의 사용은 중복된다. 용어 "단백질" 및 "폴리펩티드"는 유전자 생성물 및 이의 단편을 언급할 때 본 명세서에서 상호교환적으로 사용된다. 따라서, 예시적인 폴리펩티드 또는 단백질은 유전자 생성물, 자연적으로 발생하는 단백질, 상동체, 오르쏘로그(orthologs), 파라로그(paralogs), 단편 및 전술한 것들의 기타 등가물, 변이체, 단편, 및 유사체를 포함한다.
본 명세서에 기술된 다양한 실시형태에서, 기재된 임의의 특정 폴리펩티드의 변이체(자연적으로 발생하거나 또는 기타의 것), 대립유전자, 상동체, 보존적으로 변형된 변이체, 및/또는 보존적 치환 변이체가 포함되는 것으로 추가로 고려된다. 아미노산 서열과 관련하여, 당업자는 코딩된 서열에서 단일 아미노산 또는 적은 비율의 아미노산을 변경하는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 추가가 "보존적으로 변형된 변이체"이며, 여기서 변형은 아미노산의 화학적으로 유사한 아미노산으로의 치환을 초래하고 폴리펩티드의 원하는 활성을 유지하는 것임을 인지할 것이다. 이러한 보존적으로 변형된 변이체는 본 개시와 일치하는 다형성 변이체, 종간 상동체, 및 대립유전자에 추가되고 이를 배제하지 않는다.
주어진 아미노산은, 예를 들어, 하나의 지방족 잔기를 다른 것으로 치환(예컨대, Ile, Val, Leu 또는 Ala는 상호 치환), 또는 한 극성 잔기의 다른 잔기로의 치환(예컨대, Lys와 Arg 사이; Glu와 Asp 사이; 또는 Gln과 Asn 사이)함으로써, 유사한 물리화학적 특성을 갖는 잔기로 대체될 수 있다. 이와 같은 다른 보존적 치환, 예를 들어, 유사한 소수성 특성을 갖는 전체 영역의 치환은 잘 알려져 있다. 보존적 아미노산 치환을 포함하는 폴리펩티드는 원하는 천연 또는 참조 폴리펩티드의 활성, 예를 들어, 기능 및 특이성이 유지됨을 확인하기 위해 본 명세서에 기술된 분석 중 임의의 하나로 테스트될 수 있다.
아미노산은 측쇄 특성의 유사성에 따라 분류될 수 있다(AL Lehninger, in Biochemistry, second ed., pp. 73-75, Worth Publishers, New York (1975)): (1) 비-극성: Ala(A), Val(V), Leu(L), Ile(I), Pro(P), Phe(F), Trp(W), Met(M); (2) 비하전 극성: Gly(G), Ser(S), Thr(T), Cys(C), Tyr(Y), Asn(N), Gln(Q); (3) 산성: Asp(D), Glu(E); (4) 염기성: Lys(K), Arg(R), His(H). 대안적으로, 자연적으로 발생하는 잔기는 공통 측쇄 특성에 따라 그룹으로 나눌 수 있다: (1) 소수성: 노르류신(Norleucine), Met, Ala, Val, Leu, Ile; (2) 중성 친수성: Cys, Ser, Thr, Asn, Gln; (3) 산성: Asp, Glu; (4) 염기성: His, Lys, Arg; (5) 사슬 배향에 영향을 미치는 잔기: Gly, Pro; (6) 방향족: Trp, Tyr, Phe. 비보존적 치환은 이러한 클래스 중 하나의 구성원을 다른 클래스로 교환하는 것을 수반한다. 특정 보존적 치환은, 예를 들어, 다음을 포함한다; Ala를 Gly 또는 Ser으로; Arg를 Lys으로; Asn를 Gln 또는 His으로; Asp를 Glu로; Cys를 Ser으로; Gln를 Asn으로; Glu를 Asp로; Gly를 Ala 또는 Pro으로; His를 Asn 또는 Gln으로; Ile를 Leu 또는 Val으로; Leu를 Ile 또는 Val으로; Lys를 Arg으로, Gln으로 또는 Glu로; Met를 Leu으로, Tyr으로 또는 Ile으로; Phe를 Met으로, Leu으로 또는 Tyr으로; Ser를 Thr로; Thr를 Ser으로; Trp을 Tyr으로; Tyr을 Trp으로; 및/또는 Phe를 Val으로, Ile으로 또는 Leu으로.
일부 실시형태에서, 본 명세서에 기술된 폴리펩티드(또는 이러한 폴리펩티드를 코딩하는 핵산)는 본 명세서에 기술된 아미노산 서열 중 하나의 기능적 단편일 수 있다. 본 명세서에 사용된, "기능적 단편"은 본 명세서에 하기에 기재된 검정에 따른 야생형 참조 폴리펩티드 활성의 적어도 50%를 보유하는 펩티드의 단편 또는 세그먼트이다. 기능적 단편은 본 명세서에 개시된 서열의 보존적 치환을 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 폴리펩티드는 제1 N-말단 아미노산 메티오닌을 포함할 수 있다. 폴리펩티드가 제1 N-말단 메티오닌을 포함하지 않는 실시형태에서, 폴리펩티드의 변이체가 제1 N-말단 메티오닌을 포함하는 것으로 이해된다.
일부 실시형태에서, 본 명세서에 기술된 폴리펩티드는 본 명세서에 기술된 서열의 변이체일 수 있다. 일부 실시형태에서, 변이체는 보존적으로 변형된 변이체이다. 보존적 치환 변이체는, 예를 들어, 천연 뉴클레오티드 서열의 돌연변이에 의해 수득될 수 있다. 본 명세서에 언급된, "변이체"는 천연 또는 참조 폴리펩티드와 실질적으로 상동성이지만, 하나 또는 복수의 결실, 삽입 또는 치환으로 인해 천연 또는 참조 폴리펩티드의 아미노산 서열과 상이한 아미노산 서열을 갖는 폴리펩티드이다. 변이체 폴리펩티드-코딩 DNA 서열은 천연 또는 참조 DNA 서열과 비교할 때 뉴클레오티드의 하나 이상의 추가, 결실 또는 치환을 포함하지만, 활성을 유지하는 변이체 단백질 또는 이의 단편을 코딩하는 서열을 포함한다. 매우 다양한 PCR-기반 부위-특이적 돌연변이유발 접근법이 당업계에 공지되어 있으며 통상의 기술자에 의해 적용될 수 있다.
변이체 아미노산 또는 DNA 서열은 천연 또는 참조 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 그 이상 동일하다. 천연 서열과 돌연변이 서열 사이의 상동성(동일성 퍼센트)의 정도는, 예를 들어, 월드 와이드 웹에서 이 목적을 위해 일반적으로 사용되는 무료로 사용 가능한 컴퓨터 프로그램(예를 들어, 디폴트 설정이 있는 BLASTp 또는 BLASTn)을 사용하여 두 서열을 비교하여 결정할 수 있다.
천연 아미노산 서열의 변경은 당업자에게 공지된 다수의 기술 중 임의의 것에 의해 달성될 수 있다. 돌연변이는, 예를 들어, 천연 서열의 단편에 결찰할 수 있는 제한 부위가 플랭킹된, 돌연변이 서열을 함유하는 올리고뉴클레오티드를 합성함으로써 특정 유전자좌에 도입될 수 있다. 결찰 후, 생성된 재구성된 서열은 원하는 아미노산 삽입, 치환 또는 결실을 갖는 유사체를 코딩한다. 대안적으로, 올리고뉴클레오티드-지정 부위-특이적 돌연변이유발 절차를 사용하여 요구되는 치환, 결실 또는 삽입에 따라 변경된 특정 코돈을 갖는 변경된 뉴클레오티드 서열을 제공할 수 있다. 그러한 변경을 생성하기 위한 기술은 매우 잘 확립되어 있으며, 예를 들어, 문헌[Walder et al. (Gene 42:133, 1986); Bauer et al. (Gene 37:73, 1985); Craik (BioTechniques, January 1985, 12-19); Smith et al. (Genetic Engineering: Principles and Methods, Plenum Press, 1981); 및 미국 특허 제4,518,584호 및 제4,737,462호]에 기술되어 있으며, 이들의 전문은 본 명세서에 참조로 인용된다. 폴리펩티드의 적절한 형태를 유지하는 데 관여하지 않는 임의의 시스테인 잔기는 또한 일반적으로 세린으로 치환되어, 분자의 산화 안정성을 개선하고 비정상적인 가교를 방지할 수 있다. 반대로, 시스테인 결합(들)은 폴리펩티드에 첨가되어 안정성을 향상시키거나 올리고머화를 촉진할 수 있다.
본 명세서에 사용되는 용어 "핵산" 또는 "핵산 서열"은 리보핵산, 데옥시리보핵산 또는 이들의 유사체의 단위를 포함하는 임의의 분자, 바람직하게는 중합체 분자를 지칭한다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. 단일 가닥 핵산은 변성된 이중 가닥 DNA의 한 핵산 가닥일 수 있다. 대안적으로, 이는 임의의 이중 가닥 DNA로부터 유래되지 않은 단일 가닥 핵산일 수 있다. 한 양태에서, 핵산은 DNA일 수 있다. 또 다른 양태에서, 핵산은 RNA일 수 있다. 적합한 DNA는, 예를 들어, 게놈 DNA, cDNA, 또는 벡터 DNA를 포함할 수 있다. 적합한 RNA는, 예를 들어, mRNA를 포함할 수 있다.
용어 "발현"은 RNA 및 단백질을 생성하고 적절한 경우 단백질을 분비하는 데 관련된 세포 과정을 의미하며, 이에는, 적용가능한 경우, 예를 들어, 전사, 전사체 가공, 번역 및 단백질 폴딩, 변형 및 가공이 포함되나, 이로만 제한되는 것은 아니다. 발현은 핵산 단편 또는 단편들로부터 유래된 센스(예를 들어, mRNA) 또는 안티센스 RNA의 전사 및 안정적인 축적 및/또는 mRNA의 폴리펩티드로의 번역을 지칭할 수 있다.
본 명세서에 사용되는 용어 "검출(detecting)" 또는 "측정(measuring)"은, 예를 들어, 시료에 분석물의 존재를 나타내는 프로브, 라벨, 또는 표적 분자로부터의 신호를 관찰하는 것을 의미한다. 특정 라벨 모이어티를 검출하기 위한 당업계에 공지된 임의의 방법이 검출을 위해 사용될 수 있다. 예시적인 검출 방법은 분광학적, 형광학적, 광화학적, 생화학적, 면역화학적, 전기적, 광학적, 또는 화학적 방법을 포함하지만 이에 제한되는 것은 아니다. 임의의 양태의 일부 실시형태에서, 측정은 정량적 관찰일 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 폴리펩티드, 핵산, 또는 세포가 조작될 수 있다. 본 명세서에 사용된 바와 같이, "조작된"은 인간의 손에 의해 조작된 양태을 지칭한다. 예를 들어, 폴리펩티드의 적어도 하나의 양태, 예를 들어, 이것의 서열이 인간의 손에 의해 조작되어 자연에 존재하는 양태와 다를 경우 "조작된" 것으로 간주된다. 통상적인 관행이고 당업자에 의해 이해되는 바와 같이, 조작된 세포의 자손은 비록 실제 조작이 이전 엔티티에 대해 수행되었음에도 불구하고 일반적으로 여전히 "조작된" 것으로 지칭된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 외인성이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 이소성(ectopic)이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 내인성이 아니다.
용어 "외인성"은 세포의 천연 공급원 이외의 세포에 존재하는 물질을 지칭한다. 본 명세서에 사용되는 용어 "외인성"은 인간의 손을 포함하는 과정에 의해 생물학적 시스템, 예컨대, 정상적으로는 발견되지 않으며, 핵산 또는 폴리펩티드를 그러한 세포 또는 유기체 내로 도입하는 것을 원하는 세포 또는 유기체 내로 도입된 핵산(예를 들어, 폴리펩티드를 코딩하는 핵산) 또는 폴리펩티드를 지칭할 수 있다. 대안적으로, "외인성"은 인간의 손을 포함하는 과정에 의해 생물학적 시스템, 예컨대, 상대적으로 적은 양으로 발견되고, 세포 또는 유기체 내에서 핵산 또는 폴리펩티드의 양을 증가시키는 것, 예를 들어, 이소성 발현 또는 수준을 생성하는 것을 원하는 세포 또는 유기체 내로 도입된 핵산 또는 폴리펩티드를 지칭할 수 있다. 대조적으로, 용어 "내인성"은 생물학적 시스템 또는 세포에 고유한 물질을 지칭한다. 본 명세서에 사용된 바와 같이, "이소성"은 비정상적인 위치 및/또는 양에서 발견되는 물질을 지칭한다. 이소성 물질은 일반적으로 주어진 세포에서 발견되지만, 훨씬 적은 양 및/또는 다른 시간에 발견되는 것일 수 있다. 이소성은 또한 자연 환경에서 주어진 세포에서 자연적으로 발견되거나 발현되지 않는 폴리펩티드 또는 핵산과 같은 물질을 포함한다.
본 명세서에 기술된 바와 같이, "항원"은 항체 작용제(예를 들어, 세포외 결합 도메인) 상의 결합 부위에 의해 결합되는 분자이다. 전형적으로, 항원은 항체 리간드에 의해 결합되고 생체내에서 항체 반응을 일으킬 수 있다. 항원은 폴리펩티드, 단백질, 핵산 또는 기타 분자 또는 이의 일부일 수 있다. 용어 "항원 결정기"는 항원-결합 분자, 보다 구체적으로 상기 분자의 항원 결합 부위에 의해 인식되는 항원 상의 에피토프를 의미한다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 폴리펩티드(예를 들어, synTF 폴리펩티드)를 코딩하는 핵산은 벡터에 포함된다. 본 명세서에 기술된 양태 중 일부에서, 본 명세서에 기술된 바와 같은 주어진 폴리펩티드, 또는 이의 임의의 모듈을 코딩하는 핵산 서열은 벡터에 작동가능하게 연결된다. 본 명세서에 사용되는 용어 "벡터"는 숙주 세포로의 전달 또는 상이한 숙주 세포 사이의 전달을 위해 설계된 핵산 구축물을 지칭한다. 본 명세서에 사용된, 벡터는 바이러스성 또는 비-바이러스성일 수 있다. 용어 "벡터"는 적절한 제어 요소와 연관될 때 복제할 수 있고 유전자 서열을 세포로 전달할 수 있는 임의의 유전 요소를 포함한다. 벡터는 클로닝 벡터, 발현 벡터, 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 바이러스, 비리온 등을 포함할 수 있지만 이로만 제한되는 것은 아니다.
임의의 양태의 일부 실시형태에서, 벡터는 재조합이고, 예를 들어, 이는 2개 이상의 상이한 공급원으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 종으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 유전자로부터 기원하는 서열을 포함하고, 예를 들어 융합 단백질 또는 적어도 하나의 비-천연(예를 들어, 이종성) 유전적 조절 요소(예를 들어, 프로모터, 억제인자, 활성제, 인핸서, 반응 요소 등).
본 명세서에 사용되는 용어 "발현 벡터"는 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩티드의 발현을 유도하는 벡터를 지칭한다. 발현된 서열은 종종 세포에 대해 이종성일 것이지만 반드시 그런 것은 아니다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어, 발현 벡터는 2개의 복제 시스템을 가질 수 있으며, 그리하여 이것이 2개의 유기체, 예를 들어, 발현을 위한 인간 세포 및 클로닝 및 증폭을 위한 원핵 숙주에서 유지되도록 할 수 있다.
본 명세서에 사용되는 용어 "바이러스 벡터"는 바이러스 기원의 적어도 하나의 요소를 포함하고 바이러스 벡터 입자에 패키징될 수 있는 능력을 갖는 핵산 벡터 구축물을 지칭한다. 바이러스 벡터는 비필수적인 바이러스 유전자 대신에 본 명세서에 기술된 바와 같은 폴리펩티드를 코딩하는 핵산을 함유할 수 있다. 벡터 및/또는 입자는 시험관내(in vitro) 또는 생체내에서(in vivo) 임의의 핵산을 세포 내로 전달하기 위한 목적으로 사용될 수 있다. 바이러스 벡터의 다양한 형태가 공지되어 있다. 본 발명의 바이러스 벡터의 비제한적인 예는 AAV 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 헤르페스바이러스 벡터, 알파바이러스 벡터, 폭스바이러스 벡터, 배큘로바이러스 벡터, 및 키메라 바이러스 벡터를 포함한다.
본 명세서에 기술된 벡터는, 일부 실시형태에서, 다른 적합한 조성물 및 요법과 조합될 수 있음을 이해해야 한다. 일부 실시형태에서, 벡터는 에피솜(episomal)이다. 적합한 에피솜 벡터의 사용은 높은 카피 수의 추가 염색체 DNA에서 대상체의 관심 뉴클레오티드를 유지하며, 그로 인해 염색체 통합의 잠재적 효과를 제거하는 수단을 제공한다.
본 명세서에 사용되는 용어 "치료하다", "치료", "치료하는" 또는 "개선(amelioration)"은 치료적 치료를 지칭하며, 여기서 목적은 질병 또는 장애, 예를 들어, 암과 관련된 상태의 진행 또는 극심도를 역전시키거나, 경감시키거나, 개선하거나, 억제하거나, 느리게 하거나 또는 중지시키는 것이다. 용어 "치료하는"은 질병 또는 장애(예를 들어, 암, 자가면역, 유전적 장애)와 관련된 상태, 질병 또는 장애의 적어도 하나의 부작용 또는 증상을 감소 또는 완화하는 것을 포함한다. 치료는 일반적으로 하나 이상의 증상이나 임상 지표가 감소하면 "유효"하다. 대안적으로, 치료는 질병의 진행이 감소되거나 중단되는 경우 "유효"하다. 즉, "치료"는 증상 또는 마커의 개선뿐만 아니라, 치료가 없을 때 예상되는 것과 비교하여 증상의 진행 또는 악화의 중단, 적어도 감퇴를 포함한다. 유익하거나 원하는 임상 결과는, 검출가능 여부에 관계없이, 하나 이상의 증상(들)의 완화, 질병 정도의 감소, 질병의 안정화된(즉, 악화되지 않는) 상태, 질병 진행의 지연 또는 감퇴, 질병 상태의 개선 또는 완화, 관해(부분적이든 전체적이든) 및/또는 사망률 감소를 포함하나, 이로만 제한되는 것은 아니다. 질병의 "치료"라는 용어는 또한 질병의 증상 또는 부작용으로부터의 경감(완화적 치료 포함)을 제공하는 것을 포함한다.
본 명세서에 사용되는 용어 "약제학적 조성물"은 약학적으로 허용되는 담체, 예를 들어, 제약 산업에서 일반적으로 사용되는 담체와 조합된 활성 작용제를 지칭한다. "약제학적으로 허용가능한"이라는 어구는, 건전한 의학적 판단의 범위 내에서, 과도한 독성, 자극, 알레르기 반응 또는 기타 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합하며, 합리적인 이익/위험 비율에 부합하는, 그러한 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭하기 위해 본 명세서에 사용된다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 물 이외의 담체일 수 있다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 크림, 에멀젼, 겔, 리포솜, 나노입자, 및/또는 연고일 수 있다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 인공 또는 조작된 담체, 예를 들어, 활성 성분이 자연에서 또는 자연 내에서 발생하는 것으로 밝혀지지 않은 담체일 수 있다.
본 명세서에 사용되는 용어 "투여(administering)"는 원하는 부위에서 작용제의 적어도 부분적 전달을 초래하는 방법 또는 경로에 의해 본 명세서에 개시된 것과 같은 화합물을 대상체로 배치하는 것을 지칭한다. 본 명세서에 개시된 화합물을 포함하는 약제학적 조성물은 대상체에서 효과적인 치료를 초래하는 임의의 적절한 경로에 의해 투여될 수 있다. 일부 실시형태에서, 투여는 물리적인 인간 활동, 예를 들어, 주사, 섭취 행위, 적용 행위, 및/또는 전달 디바이스 또는 기계의 조작을 포함한다. 이러한 활동은, 예를 들어, 의료 전문가 및/또는 치료를 받는 대상체에 의해 수행될 수 있다.
본 명세서에 사용되는 "접촉(contacting)"은 적어도 하나의 세포에 작용제를 전달하거나, 또는 노출시키기 위한 임의의 적합한 수단을 지칭한다. 예시적인 전달 방법은, 세포 배양 매체(medium)로의 직접 전달, 형질감염, 형질도입, 관류, 주사 또는 당업자에게 공지된 기타 전달 방법을 포함하지만, 이로만 제한되는 것은 아니다. 일부 실시형태에서, 접촉은 물리적 인간 활동, 예를 들어, 주사; 분배, 혼합 및/또는 따라내는 활동; 및/또는 전달 디바이스 또는 기계를 포함한다.
본 명세서에 사용되는 용어 "유사체"는 참조 물질과 하나 이상의 특정 구조적 특징, 요소, 구성요서, 또는 모이어티를 공유하는 물질을 지칭한다. 일반적으로 "유사체"는 참조 물질과 상당한 구조적 유사성을 보여주지만, 예를 들어, 핵심 또는 컨센서스(consensus) 구조를 공유하지만, 또한 특정 개별 방식에서 차이가 있다. 일부 실시형태에서, 유사체는, 예를 들어, 참조 물질의 화학적 조작에 의해, 참조 물질로부터 생성될 수 있는 물질이다.
"통계적으로 유의한" 또는 "유의하게"라는 용어는 통계적 유의성을 지칭하며 일반적으로 2 표준편차(2SD) 이상의 차이를 의미한다.
구현 실시예 이외, 또는 달리 지시된 경우, 본 명세서에 사용된 성분 또는 반응 조건의 양을 나타내는 모든 숫자는 "약"이라는 용어로 모든 경우에 변형되는 것으로 이해해야 한다. 백분율과 관련하여 사용되는 용어 "약"은 ±1%를 의미할 수 있다.
본 명세서에 사용된 바와 같은, 용어 "포함하는"은 제시된 정의된 요소 외에 다른 요소가 또한 존재할 수도 있음을 의미한다. "포함하는"의 사용은 제한이 아니라 포함을 나타낸다.
용어 "~로 이루어진"은 본 명세서에 기술된 바와 같은 조성물, 방법 및 이들의 각각의 구성요소를 지칭하며, 실시형태의 설명에서 언급되지 않은 임의의 요소를 배제한다.
본 명세서에서 사용되는 용어 "본질적으로 ~로 이루어진"은 주어진 실시형태에 필요한 요소를 지칭한다. 이 용어는 본 발명의 해당 실시형태의 기본적이고 신규한 또는 기능적 특성(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서에 사용되는 용어 "~에 상응하는"은 제1 폴리펩티드 또는 핵산 내의 열거된 위치에 있는 아미노산 또는 뉴클레오티드, 또는 제2 폴리펩티드 또는 핵산 내의 열거된 아미노산 또는 뉴클레오티드와 등가인 아미노산 또는 뉴클레오티드를 지칭한다. 등가의 열거된 아미노산 또는 뉴클레오티드는 당업계에 공지된 상동성 프로그램, 예를 들어, BLAST를 사용하여 후보 서열의 정렬에 의해 결정될 수 있다.
본 명세서에 사용되는 용어 "특이적 결합"은 2개의 분자, 화합물, 세포 및/또는 입자 사이의 화학적 상호작용을 지칭하며, 여기서 제1 엔티티는, 비-표적 제3 엔티티에 결합하는 것보다 더 큰 특이성과 친화력으로 제2 표적 엔티티에 결합한다. 일부 실시형태에서, 특이적 결합은 제3 비-표적 엔티티에 대한 친화도에 비해 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배 또는 그 초과인 제2 표적 엔티티에 대한 제1 엔티티의 친화도를 지칭할 수 있다. 주어진 표적에 대해 특이적인 시약은 이용되는 분석 조건 하에서 해당 표적에 대한 특이적 결합을 나타내는 것이다.
단수 용어 "a", "an" 및 "the"는 문맥이 달리 명확하게 나타내지 않는 한 복수의 지시 대상을 포함한다. 유사하게, "또는"이라는 단어는 문맥이 명백하게 달리 나타내지 않는 한 "및"을 포함하도록 의도된다. 본 명세서에 기술된 것과 유사하거나 등가인 방법 및 재료가 본 개시의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 아래에 기재되어 있다. 약어, "예를 들어(e.g.)"는 라틴어(exempli gratia)에서 파생된 것으로, 비제한적인 예를 나타내기 위해 본 명세서에서 사용된다. 따라서 약어 "예를 들어(e.g.)" "예를 들어(for example)"라는 용어와 동의어이다.
본 명세서에 개시된 본 발명의 대안적 요소 또는 실시형태의 그룹화는 제한으로 해석되어서는 안 된다. 각 그룹 구성원은 개별적으로 또는 본 명세서에서 확인되는 그룹의 다른 구성원 또는 다른 요소와 임의의 조합으로 언급되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성을 이유로 그룹에 포함되거나 그룹에서 삭제될 수 있다. 임의의 그러한 포함 또는 삭제가 발생하는 경우, 본 명세서는 변형에 따라 해당 그룹을 포함하는 것으로 간주되며, 그로인해 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹에 대한 문언적 설명을 충족한다.
본 명세서에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용되는 과학 및 기술 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미를 가질 것이다. 본 발명은 본 명세서에 기술된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않으며 그 자체로 다양할 수 있다는 것을 이해해야 한다. 본 명세서에서 사용한 용어(terminology)는 단지 특정한 실시형태를 설명하기 위해 사용된 것이며, 청구범위에 의해서만 정의되는 본 발명의 범위를 한정하려는 의도가 아니다. 면역학 및 분자 생물학에서 일반적인 용어의 정의는 다음 문헌: The Merck Manual of Diagnosis and Therapy, 20th Edition, published by Merck Sharp & Dohme Corp., 2018 (ISBN 0911910190, 978-0911910421); Robert S. Porter et al. (eds.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); 및 Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology by Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), W. W. Norton & Company, 2016 (ISBN 0815345054, 978-0815345053); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; 및 Current Protocols in Immunology (CPI) (John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737)에서 찾을 수 있으며, 이들 문헌의 전문은 본 명세서에 참조로 인용된다..
당업자는 사용되는 화학요법제를 쉽게 확인할 수 있다(예를 들어, Physicians' Cancer Chemotherapy Drug Manual 2014, Edward Chu, Vincent T. DeVita Jr., Jones & Bartlett Learning; Principles of Cancer Therapy, Chapter 85 in Harrison's Principles of Internal Medicine, 18th edition; Therapeutic Targeting of Cancer Cells: Era of Molecularly Targeted Agents and Cancer Pharmacology, Chs. 28-29 in Abeloff's Clinical Oncology, 2013 Elsevier; 및 Fischer D S (ed): The Cancer Chemotherapy Handbook, 4th ed. St. Louis, Mosby-Year Book, 2003 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 개시는 인간을 복제하는 방법, 인간의 생식계열 유전적 정체성을 변형시키는 방법, 산업적 또는 상업적 목적을 위한 인간 배아의 사용 또는 사람이나 동물, 그리고 그러한 과정으로 인해 동물에게 임의의 실질적인 의학적 이익 없이 고통을 야기할 가능성이 있는 동물의 유전적 정체성을 변형시키는 방법에 관한 것은 아니다.
기타 용어들은 본 발명의 다양한 양태의 설명 내에서 본 명세서에 정의되어 있다.
모든 특허 및 기타 간행물; 문헌 참조, 발행된 특허, 공개된 특허 출원 및 동시-계류 중인 특허 출원을 포함하며; 본 출원 전반에 걸쳐 인용된 것은, 예를 들어, 본 명세서에 기술된 기술과 관련하여 사용될 수 있는 그러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 본 명세서에 명시적으로 참조로 통합된다. 이러한 간행물은 본 출원의 출원일 이전의 개시를 위해서만 제공된다. 이와 관련하여, 그 어떤 것도 발명자가 선행 발명으로 인해 또는 다른 이유로 그러한 개시보다 선행할 자격이 없다고 인정하는 것으로 해석되어서는 아니된다. 이들 문헌의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 사용할 수 있는 정보를 기반으로 하며, 이러한 문헌의 날짜 또는 내용의 정확성에 대한 어떠한 인정도 구성하지 아니한다.
본 개시내용의 실시형태에 대한 설명은 완전한 것이거나 또는 개시된 정확한 형태로 개시를 제한하도록 의도된 것은 아니다. 본 개시의 특정 실시형태 및 이에 대한 실시예는 예시의 목적으로 본 명세서에 기술되어 있지만, 관련 기술 분야의 통상의 지식을 가진 자가 인식하는 바와 같이, 본 개시의 범위 내에서 다양한 균등한 변형이 가능하다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되는 경우, 대안적인 실시형태는 다른 순서로 기능을 수행할 수 있거나, 또는 기능이 실질적으로 동시에 수행될 수 있다. 본 명세서에 제공된 개시의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본 명세서에 설명된 다양한 실시형태는 추가 실시형태를 제공하기 위해 결합될 수 있다. 본 개시의 양태는, 필요한 경우, 본 개시의 또 다른 실시형태를 제공하기 위해 상기 참조 및 적용의 구성, 기능 및 개념을 사용하도록 변형될 수 있다. 또한, 생물학적 기능 동등성 고려로 인해, 종류나 양에 생물학적 또는 화학적 작용에 영향을 미치지 않으면서 단백질 구조에 약간의 변화를 줄 수 있다. 이러한 변화 및 기타 변화는 상세한 설명에 비추어 본 개시에 대해 이루어질 수 있다. 이러한 모든 변형은 첨부된 청구범위의 범위 내에 포함되도록 의도된다.
전술한 실시형태 중 임의의 것의 특정 요소는 다른 실시형태의 요소로 결합되거나 대체될 수 있다. 또한, 본 개시의 특정 실시형태와 관련된 이점이 이러한 실시형태의 맥락에서 기술되었지만, 다른 실시형태가 또한 이러한 이점을 나타낼 수 있으며, 모든 실시형태가 본 개시의 범위 내에 포함되기 위해 반드시 그러한 이점을 나타낼 필요는 없다.
본 명세서에 기술된 기술은 어떤 식으로든 추가적인 제한인 것으로 간주되지 않아야 하는 하기의 실시예에 의해 추가로 설명된다.
본 명세서에 기술된 기술의 일부 실시형태는 다음의 번호매겨진 항목 중 어느 하나에 따라 정의될 수 있다:
1. 합성 전사 인자(synTF)로서,
a. 적어도 하나의 DNA 결합 도메인(DBD),
b. 전사 이펙터 도메인(ED),
c. 적어도 하나의 조절인자 단백질(RP)을 포함하며,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고,
상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는
상기 ED의 세포 국재화는 상기 적어도 하나의 조절인자 단백질에 의해 조절되는,
synTF.
2. 항목 1에 있어서, 상기 전사 ED가 전사 액티베이터(TA) 도메인인, synTF.
3. 항목 2에 있어서, 상기 TA가 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택되는, synTF.
4. 항목 2에 있어서, 상기 TA가 p65 또는 이의 변이체인, synTF.
5. 항목 4에 있어서, 상기 p65가 서열식별번호: 69, 117-121, 193-197 중 하나 또는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
6. 항목 1에 있어서, 상기 전사 ED가 전사 리프레서(TR) 도메인인, synTF.
7. 항목 6에 있어서, 상기 TR이 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택되는, synTF
8. 항목 6에 있어서, 상기 TR이 KRAB, 또는 이의 변이체인, synTF.
9. 항목 8에 있어서, 상기 KRAB가 서열식별번호: 72, 97, 또는 214-215 중 하나, 또는 서열식별번호: 72, 97, 또는 214-215 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
10. 항목 1에 있어서, 상기 적어도 하나의 DBD가 조작된 징크 핑거(ZF) 결합 도메인인, synTF.
11. 항목 10에 있어서, 상기 ZF-결합 도메인이 2개 이상의 ZF 모티프를 포함하는, synTF.
12. 항목 11에 있어서, 상기 ZF-결합 도메인이 탠덤(tandem)하게 서로 인접하여 배열된 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 또는 그 이상의 ZF 모티프를 포함하여 ZF 어레이(ZFA)를 형성하는, synTF.
13. 항목 1 내지 항목 12 중 어느 한 항목에 있어서, 상기 ZF 결합 도멘인이, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1 및 ZF 11-1 중 어느 하나에서 선택되는, synTF.
14. 항목 1 내지 항목 13 중 어느 한 항목에 있어서, ZF 결합 도메인이 서열식별번호 1-3, 76, 101, 377, 또는 380 중 어느 하나로부터 선택되는, synTF.
15. 항목 14에 있어서, 상기 ZF 결합 도메인이 서열 181-191 중 적어도 하나를 포함하는 서열에 특이적으로 결합하는, synTF.
16. 항목 1 내지 항목 15 중 어느 한 항목에 있어서, 상기 적어도 하나의 DBD가 서열식별번호: 221 또는 222, 36-4(서열식별번호: 223), 43-8(서열식별번호: 224 또는 225), 42-10(서열식별번호: 226 또는 227), 97-4(서열식별번호: 228) 중의 임의의 것의 하나 이상에서 선택되거나, 또는 상기 DBD가 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합하는, synTF.
17. 항목 1에 있어서, 상기 조절인자 단백질이 상기 DBD와 상기 전사 이펙터 도메인 사이에 위치하는, synTF.
18. 항목 1 내지 항목 17 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 억제성 프로테아제인, synTF.
19. 항목 1 내지 항목 18 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 NS3 프로테아제 단백질인, synTF.
20. 항목 1 내지 항목 19 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 서열식별번호: 82, 85, 91, 102, 241-255, 304-315의 아미노산, 또는 서열식별번호: 82, 85, 91, 102, 241-255, 304-315에 대해 적어도 85% 서열 동일성의 상동체를 포함하는, synTF.
21. 항목 1 내지 항목 19 중 어느 한 항목에 있어서, 프로테아제 저해제, 또는 NS3의 저해제의 존재 하에, 상기 NS3 프로테아제 단백질이 저해되어 상기 DBD와 상기 이펙터 도메인의 커플링을 유지하는, synTF.
22. 항목 1 내지 항목 19 중 어느 한 항목에 있어서, 상기 프로테아제 저해제 또는 NS3에 대한 저해제의 부재 하에, 상기 NS3 프로테아제 단백질이 활성이고 상기 DBD로부터의 이의 절제를 초래하여, 상기 DBD와 상기 이펙터 도메인 사이의 연결을 커플링해제하는, synTF.
23. 항목 21 또는 항목 22에 있어서, NS3의 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 다사사리토나비르, 및 텔라프레비르 중의 어느 하나로부터 선택되는, synTF.
24. 항목 1에 있어서, 상기 적어도 하나의 RP가 한 쌍의 유도 근접 도메인(IPD 쌍)이고, 여기서 상기 IPD 쌍은,
제1 유도 근접 도메인(IPDA) 및 적어도 제2 상보 IPD(IPDB)를 포함하며,
인듀서 또는 인듀서 신호의 존재 하에, 상기 IPDA 및 IPDB는 함께 모여 상기 합성 TF의 상기 DBD에 대한 상기 ED의 연결을 초래하고,
인듀서 또는 인듀서 신호의 부재 하에, 상기 ED는 상기 합성 TF의 상기 DBD에 대해 커플링해제되거나 연결해제되는, synTF.
25. 항목 24에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상으로부터 선택된 IPDA 및 IPDB를 포함하는, synTF:
a. GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 상기 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함;
b. FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 상기 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(RAP)에 결합함;
c. PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서, 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함;
d. 광-유도성 이량체화 도멘인(Light-inducible Dimerization domain, LIDD)를 포함하는 IPDA, 여기서 상기 LIDD는 적절한 파장의 광 인듀서 신호에 노출시 상보적 LIDD(IPDB)와 이량체화됨.
26. 항목 24에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 PYL 도메인 또는 이의 단편 및 ABI 도메인을 포함하는 IPDA 및 IPDB를 포함하고, 여기서 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합하는, synTF.
27. 항목 24에 있어서, 상기 LIDD가 nMag 또는 CIBN 또는 광변색성 단백질 도메인이고, 여기서 nMag는 청색광 인듀서 신호에 노출시 상기 상보적 LIDD pMag와 이량체화할 수 있고, CIBN은 청색 인듀서 광 신호에 노출시 상기 상보적 CRY2와 이량체화할 수 있고, 상기 광변색성 단백질은 청색 인듀서 광 신호에 노출시 이량체화할 수 있는, synTF.
28. 항목 24에 있어서, 상기 광 인듀서 신호는 펄스 광 신호인, synTF.
29. 항목 1 내지 항목 17 중 어느 한 항목에 있어서, 상기 적어도 하나의 RP가 세포질 격리 단백질인, synTF.
30. 항목 29에 있어서, 상기 격리 단백질이 리간드 결합 도메인(LBD)을 포함하고, 상기 리간드의 존재 하에, 상기 세포질에 대한 상기 단백질의 격리가 저해되는, synTF.
31. 항목 29에 있어서, 상기 세포질 격리 단백질이 리간드 결합 도메인 및 핵 국재화 신호(NLS)를 포함하고, 상기 리간드의 부재 하에 상기 NLS가 저해되어 상기 격리 단백질의 상기 핵으로의 전위를 방지하고, 상기 리간드의 존재 하에 상기 핵 국재화 신호가 노출되어 상기 격리 단백질이 상기 핵으로 전위할 수 있는, synTF.
32. 항목 29 내지 항목 31 중 어느 한 항목에 있어서, 상기 격리 단백질이 에스트로겐 수용체(ER)의 적어도 일부를 포함하는, synTF.
33. 항목 29 내지 항목 32 중 어느 한 항목에 있어서, 상기 격리 단백질이 ERT2, ERT, 및 ERT3으로 이루어진 그룹으로부터 선택되는, 에스트로겐 리간드 결합 도메인(ERT) 또는 이의 변이체를 포함하는, synTF.
34. 항목 33에 있어서, 상기 ERT가 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜, 풀베스트란트로부터 선택된 하나 이상의 리간드에 결합하고, ERT에 대한 상기 리간드의 결합은 상기 NLS를 노출시키고, 상기 ERT의 핵내 전위를 초래하는, synTF.
35. 항목 29에 있어서, 상기 세포질 격리 단백질이 막통과 수용체 격리 단백질을 포함하는, synTF.
36. 항목 1 내지 항목 35 중 어느 한 항목에 있어서, 상기 synTF가 N-말단 DBD, 상기 격리 단백질, 및 C-말단 이펙터 도메인을 포함하는, synTF.
37. 제36항에 있어서, 상기 이펙터 도메인이 전사 액티베이터(TA)인, synTF.
38. 항목 1 내지 항목 35 중 어느 한 항목에 있어서, 상기 synTF가 N-말단 이펙터 도메인, DBD 및 C-말단 세포질 격리 단백질을 포함하는, synTF.
39. 항목 38에 있어서, 상기 이펙터 도메인이 전사 리프레서(TR)인, synTF.
40. 항목 1 내지 항목 23 중 어느 한 항목에 있어서, 상기 NS3 단백질이 소분자-보조 차단(Small molecule-Assisted Shutoff; SMASh) 도메인의 일부이고, 여기서 상기 SMASh 도메인은 상기 NS3 단백질, 부분 프로테아제 나선 도메인 및 NS4A 도메인을 포함하는, synTF.
41. 항목 1 내지 항목 9 및 항목 24 내지 항목 40 중 어느 한 항목에 있어서, 상기 synTF가 소분자-보조 차단(SMASh) 태그를 추가로 포함하고, 여기서 상기 SMASh 태그가 억제성 프로테아제를 포함하는 N-말단 또는 C-말단 SMASh 도메인, 부분 프로테아제 나선 도메인 및 보조인자 도메인인, synTF.
42. 항목 41에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인을 포함하는 C-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 상기 이펙터 도메인의 C-말단에 융합되는, synTF.
43. 항목 41에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인 및 NS3 절단 부위를 포함하는 N-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 N-말단에 융합되는, synTF.
44. 항목 40 내지 항목 43 중 어느 한 항목에 있어서, 상기 NS3 프로테아제에 대한 저해제의 부재 하에, 상기 NS3 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 그로 인해 상기 SMASh 태그가 분해를 위한 표적이 되는 것을 초래하고("SMASh-분해", synTF-켜짐/TA-켜짐/RP-켜짐),
NS3 프로테아제에 대한 저해제의 존재 하에, NS3 프로테아제 활성이 억제되며, 그로 인해 상기 SMASh 태깅된 synTF가 분해를 위한 표적이 되는 것을 초래하는("synTF-분해", synTF-꺼짐/TA-꺼짐/RP-꺼짐"), synTF.
45. 항목 44에 있어서, 상기 NS3 프로테아제에 대한 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르 및 텔라프레비르 중 어느 하나로부터 선택되는, synTF.
46. 항목 24 내지 항목 45 중 어느 한 항목에 있어서, 상기 synTF가 SMASh 태그 및 세포질 격리 단백질을 포함하는, synTF.
47. 항목 46에 있어서, 상기 synTF가 상기 세포질 격리 단백질에 대한 리간드의 존재 및 상기 NS3 프로테아제에 대한 저해제의 부재 하에 활성이고; 상기 synTF가 상기 세포질 격리 단백질에 대한 상기 리간드의 부재 및 상기 NS3 프로테아제에 대한 저해제의 존재 하에 불활성인, synTF.
48. 항목 1 내지 항목 47 중 어느 한 항목에 있어서, 하기의 링커 펩티드를 추가로 포함하고, 상기 링커 펩티드는 상기 DBD와 상기 조절인자 단백질 사이; 상기 조절인자 단백질과 상기 이펙터 도메인 사이; 상기 DBD와 상기 이펙터 도메인 사이; 상기 DBD, 이펙터 도메인 또는 조절인자 단백질 내; 또는 이들의 임의의 조합으로부터의 임의의 위치에 위치될 수 있는, synTF:
PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323).
49. 유전자 발현 제어 시스템으로서,
a. 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는 상기 DBD에 연결된 상기 ED의 세포 국재화는 상기 적어도 하나의 RP에 의해 조절되고,
상기 적어도 하나의 RP는 RP 인듀서에 의해 조절되고,
상기 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF,
b. 핵산 구축물로서,
i. 상기 synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및
ii. 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및
iii. 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는, 핵산 구출물,
을 포함하며,
상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접할 수 있고, 상기 ED는 상기 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하며("ED-꺼짐"),
상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED는 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 이펙터 도메인(ED)이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 제어할 수 있거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 synTF의 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 이펙터 도메인(ED)이 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하는("ED-꺼짐"),
시스템.
50. 항목 49에 있어서, 상기 전사 이펙터 도메인(ED)이 전사 액티베이터(TA)이고,
a. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어, 상기 TA가 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 방지하며("TA-꺼짐"),
b. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되고, 상기 관심 유전자의 발현을 방지하는("TA-꺼짐"), 시스템.
51. 항목 49에 있어서, 상기 ED가 전사 리프레서(TR)이고, 여기서
a. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어, 상기 TR이 상기 관심 유전자의 발현을 방지하거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 허용하며("TR-꺼짐"(발현-있음)),
b. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 끄거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 허용하는("TR-꺼짐"(발현-있음)),
시스템.
52. 항목 49 내지 항목 51 중 어느 한 항목에 있어서, 상기 synTF가 항목 1 내지 항목 48 중 어느 한 항목에서 선택되는, 시스템.
53. 항목 49 내지 항목 52 중 어느 한 항목에 있어서, 상기 적어도 하나의 synTF가 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함하고, 여기서 SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분 프로테아제 나선 도메인 및 보조인자 도메인을 포함하고,
상기 SMASh 프로테아제에 대한 저해제의 존재 하에, 상기 SMASh 프로테아제 활성이 억제되어, 상기 synTF가 분해되는 것을 초래하고, 상기 DBM에 대한 상기 synTF의 DBD의 결합을 방지하고, 상기 관심 유전자의 발현 또는 억제를 제어하며("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)),
상기 SMASh 프로테아제에 대한 저해제의 부재 하에, 상기 SMASh 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 상기 SMASh 도메인이 분해를 위한 표적이 되고, 상기 synTF의 DBD가 상기 synTF의 DBM 및 ED에 결합하도록 허용되어 상기 관심 유전자의 발현을 제어하는("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)), 시스템.
54. 항목 49 내지 항목 53 중 어느 한 항목에 있어서, 상기 프로모터가 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터 중 임의의 것으로부터 선택되는, 시스템.
55. 세포로서,
a. synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 제1 핵산 서열, 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산, 및
b. 유도성 또는 구성적 프로모터에 작동가능하게 연결된 항목 1 내지 항목 48 중 어느 한 항목에 따른 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열을 포함하는, 세포.
56. 항목 55에 있어서, 상기 세포가 5'에서 3' 방향으로,
a. 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열,
b. 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열,
c. synTF의 상기 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 상기 synTF의 DBD의 결합은 상기 이펙터 도메인(ED)을 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열의 근처에 위치시키는, 핵산 서열,
d. 제2 프로모터 서열, 및
e. 상기 제2 프로모터 서열에 작동가능하게 연결된, 상기 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 상기 코딩된 synTF는 (c)의 상기 핵산 서열의 상기 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열,
을 포함하는 핵산 구축물을 포함하는, 세포:.
57. 항목 55 또는 항목 56에 있어서, 상기 GOI에 작동가능하게 연결된 프로모터 상기 서열이 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터 중 임의의 것으로부터 선택되는, 세포.
58. 항목 55 또는 항목 56에 있어서, 상기 synTF를 코딩하는 핵산에 작동가능하게 연결된 상기 프로모터 서열이 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터인, 세포.
59. 항목 1 내지 항목 48 중 어느 한 항목의 synTF, 또는 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템을 코딩하는 폴리뉴클레오티드.
60. 항목 59의 폴리뉴클레오티드를 포함하는 벡터.
61. 항목 1 내지 항목 48 중 어느 한 항목의 synTF, 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템, 항목 55 내지 항목 58 중 어느 한 항목의 synTF 세포, 항목 59의 폴리뉴클레오티드, 또는 항목 60의 벡터를 포함하는 조성물.
62. 항목 1 내지 항목 48 중 어느 한 항목의 synTF, 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템, 항목 55 내지 항목 58 중 어느 한 항목의 synTF 세포, 항목 59의 폴리뉴클레오티드, 또는 항목 60의 벡터, 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물.
63. synTF의 활성을 조절하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법.
64. 관심 유전자의 발현을 조절하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법.
65. 세포-기반 요법을 필요로 하는 대상체를 치료하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 상기 대상체에게 투여하는 단계; 및
b. 상기 대상체에 유효량의 조절인자 단백질 인듀서를 투여하는 단계
를 포함하는, 방법.
66. 항목 63 내지 항목 65 중 어느 한 항목에 있어서, 상기 세포 집단이 면역 세포를 포함하는, 방법.
67. 항목 65에 있어서, 상기 면역 세포의 집단이 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함하는, 방법.
68. 항목 65 내지 항목 67 중 어느 한 항목에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여되는 것과 동시에 투여되는, 방법.
69. 항목 65 내지 항목 67 중 어느 한 항목에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여된 후에 투여되는, 방법.
실시예
실시예 1: 유도성 합성 전사 인자(NS3 SynTF)
개요
본 명세서에는 정확한 인간 게놈-직교 조절을 위한 합성 전사 인자(synTF) 및 반응성 프로모터가 기술된다. 합성 전사 인자 단백질은 반응성 프로모터에서 유전자 발현을 국부적으로 조절할 수 있는 DNA 결합 및 이펙터 도메인의 최소 모듈식 융합물이다. 이들은 근본적으로 조작된 징크 핑거(ZF) DNA 결합 어레이를 전사 또는 후성유전적 이펙터 도메인에 커플링시킨다.
본 명세서에 기재된 조작된 ZF 어레이는 천연 포유류 ZF 스캐폴드로부터 유래되지만 인간 게놈 서열에서 멀리 떨어진 특정 18-20개 뉴클레오티드 서열을 표적화하도록 재설계되고; 이 특징은 인간 게놈에서 감소된 표적-이탈(off-target) 결합 잠재력을 부여한다.
전사 및 후성유전적 이펙터 도메인은 p65 전사 액티베이터 및 KRAB 리프레서와 같은 자연적으로 발생하는 인간 이펙터 도메인을 포함한다. 조작된 ZF 어레이와 커플링되면, 이들은 조작된 세포의 표적화된 유전자좌에서 전사를 국부적으로 조절(즉, 하류 유전자 활성화 또는 억제)할 수 있다.
상응하는 반응성 프로모터는 포유류 세포에서 정확하고 국소적인 유전자 발현 제어를 가능하게 하기 위해 구성적 프로모터의 상류에 ZF 결합 부위의 인스턴스(instances)를 배치함으로써 설계된다.
본 명세서에는 상응하는 반응성 프로모터에서 유전자 발현을 강력하게 조절하고, 인간 게놈에서 표적-이탈 유전자의 발현에 최소한으로 영향을 미치는 합성 전사 인자의 라이브러리가 기술되어 있다(예를 들어, 도 1a-1h 참조).
소분자의 부재 하에, 합성 전사 인자가 불활성화되게 된다. 동족 소분자의 존재 하에, 전사 인자는 반응성 프로모터로부터의 아웃풋 유전자의 발현을 조절할 수 있다(예를 들어, 도 2a-2b 참조).
유도 근접 도메인
소분자(앱시스산 = ABA)에 반응성인 ABI/PYL 유도 근접 도메인을 본 명세서에 기재된 바와 같이 synTF를 조절하는 데 사용할 수 있다(예를 들어, Liang et al. Sci Signal, 2011 참조). 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터 유래한 ABA-비민감성 1(ABI1) 및 PYR1-유사(PYL) 도메인은 소분자 앱시스산(ABA)에 의해 배위될 때 조건부로 상호작용할 수 있는 상보적인 표면을 가지고 있다. ABA는 인간의 식이에서 자연적으로 낮은 수준으로 존재하는 식물 호르몬이며, 이후에 인간 투여에 안전한 소분자로 추정되고 있다.
2개의 융합 단백질 - ABI1(또는 PYL) 도메인에 융합된 ZF DNA 결합 도메인과 PYL(또는 ABI1) 도메인에 융합된 이펙터 도메인 - 의 발현은 synTF 하위 도메인의 분리를 허용하며, 그로 인해 국소 유전자 조절 기능을 불활성화시킨다.
이어서, ABA의 투여는 ABI1 및 PYL 서브유닛 사이의 조건부 이량체화를 허용할 수 있어, ZF 및 이펙터 도메인이 국부적으로 커플링되고 synTF 기능을 유지하도록 허용할 수 있다(예를 들어, 도 3 참조).
전위 도메인
소분자(4-하이드록시타목시펜 = 4OHT)에 반응성인, ERT2 핵 전위 도메인을 본 명세서에 기재된 바와 같이 synTF를 조절하는 데 사용할 수 있다(예를 들어, Indra et al. Nucleic Acids Res (1999) 참조). 인간 에스트로겐 수용체(ER)는, 다른 단백질 도메인에 융합될 때, 활성에 대한 리간드-의존적 제어를 생성할 수 있는 리간드 반응성 도메인을 포함한다. 도메인은 동족 리간드의 부재 하에 세포의 세포질 인자와 자연적으로 결합하여, 세포질에 효과적으로 스스로 격리된다. 에스트로겐 또는 기타 스테로이드 호르몬 유도체와 같은 동족 리간드의 결합은 세포질 복합체로부터의 해리를 허용하고 핵 국재화 신호를 노출시켜, 핵으로의 전위를 허용하는 수용체에 대한 형태적 변화를 야기한다. 이 에스트로겐 수용체 리간드 결합 도메인(ERT2)의 돌연변이된 변이체는 특정 "직교" 리간드(예를 들어, 타목시펜, 4-하이드록시타목시펜)에 대한 민감도를 향상시켰고 내인성 리간드(예를 들어, 에스트라디올)에 대한 민감성을 감소시켰다.
4-하이드록시타목시펜(4OHT)은 특정 유방암에 대한 치료제로 FDA 승인을 받은 에스트로겐 수용체의 선택적 조절제(modulator)이다.
ZF DNA 결합 도메인, 이펙터 도메인, 및 ERT2 도메인을 함유하는 융합 단백질의 발현은 synTF의 세포질 국재화를 허용하며, 그로 인해 유전자 발현 카세트가 핵/게놈에 존재하기 때문에 국소 유전자 조절이 기능적으로 불활성화되게 한다.
이어서, 4OHT의 투여는 synTF의 조건부 핵 전위를 허용하여, 세포 핵에서 synTF 기능을 허용할 수 있다(예를 들어, 도 4 참조).
자가-절단 프로테아제 도메인
비-구조적 단백질 3(NS3) 도메인을 synTF 활성에 대한 소분자 조절 제어에 사용할 수 있다(예를 들어, Lin et al. PNAS(2008) 참조). 비구조 단백질 3(NS3)은 C형 간염 바이러스에서 유래한 세린 프로테아제이며 발현된 단백질로부터 자연적으로 자가-절제될 수 있다. 이와 같이, ZF와 이펙터 도메인 사이에 배치된 NS3 단백질 도메인을 갖는 발현된 융합 단백질의 개발은 synTF 하위 도메인의 자동-절단 및 분리를 허용하며, 그로 인해 국소 유전자 조절 기능이 불활성화되게 한다.
많은 FDA-승인된 소분자가 NS3 프로테아제를 표적화하고 HepC 치료 개입 전략으로서 이의 절단 활성을 억제하도록 개발되었다.
이어서, 이러한 소분자 중 하나 - 예를 들어, 그라조프레비르 - 의 투여는 융합 단백질에서 NS3의 자가 절제를 방지할 수 있어, ZF와 이펙터 도메인이 국소적으로 커플링된 상태를 유지하고 synTF 기능을 유지하도록 할 수 있다.
소분자의 부재 하에, NS3 프로테아제는 발현된 융합 단백질로부터 자가-절단되어, DNA 결합 및 이펙터 도메인의 분리를 통해 합성 전사 인자가 불활성화되게 한다. 소분자의 존재 하에, NS3 프로테아제 활성이 억제되고 융합 단백질 복합체가 안정화되어, 전사 인자가 반응성 프로모터로부터의 아웃풋 유전자의 발현을 조절하도록 허용한다(예를 들어, 도 5a-5c 참조).
유도된 분해 도메인
NS3 도메인을 함유하는, SMASh(Small Molecule-Assisted Shutoff) 도메인은 synTF 활성에 대한 소분자 조절 제어에 사용될 수 있다. 소분자-보조 차단(SMASh) 태그는 NS3 프로테아제, 부분 NS3 헬리카제 도메인, 및 NS4A 도메인을 함유하는 조작된 단백질 도메인이다. 모든 개별 요소는 C형 간염 바이러스에서 유래된다.
NS3 프로테아제와 부분 NS3 헬리카제 및 NS4A 도메인의 조합된 배열은 "데그론" 서열을 유도하여, 도메인의 신속한 분해를 촉진한다(예를 들어, Chung et al. Nat Chem Biol 2015 참조).
관심 단백질의 N- 또는 C-말단에 대한 SMASh 도메인의 융합은 이의 자가-절단 및 단백질로부터의 분리를 초래하여, SMASh 도메인이 분해에 대해 표적화되는 동안 관심 단백질이 발현되게 한다.
이어서, NS3 억제제 소분자, 예를 들어, 그라조프레비르의 투여는 관심 단백질로부터 SMASh의 자가-절제를 방지할 수 있어, 전체 융합 단백질이 분해에 대해 표적화되게 하고 그리하여 관심 단백질이 비발현되게 한다.
NS3-함유 SMASh 단백질은 합성 전사 인자의 활성을 번역-후에(post-translationally) 조절하도록 하기 위해 본 명세서에서 사용되었다(예를 들어, 도 6a-6b 참조).
실험적 분석 및 지지 데이터
ABI/PYL 도메인을 사용하는 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(ABA)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적인 활성화를 야기하였다. 아웃풋 형광을 나타낸 바와 같이 여러 다른 ABA 처리 농도의 함수로 측정했다(용량 반응; 예를 들어, 도 7a 참조). 소분자(ABA)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 7b 참조). 4일 후 소분자(ABA)의 제거는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 7c 참조).
ERT2 도메인을 사용하는 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(4OHT)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다. 아웃풋 형광을 나타낸 바와 같이 여러 다른 4OHT 처리 농도의 함수로 측정했다(용량 반응; 예를 들어, 도 8a 참조). 소분자(4OHT)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 생산량의 일시적 활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 8b 참조). 4일 후 소분자(4OHT)의 제거는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 8c 참조).
NS3를 사용한 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다. 아웃풋 형광은 나타낸 바와 같이 여러 다른 그라조프레비르 처리 농도의 함수로 측정했다(용량 반응)(예를 들어, 도 9a 참조). 소분자(그라조프레비르)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다(예를 들어, 도 9b 참조). 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 4일 후 소분자(그라조프레비르)의 제거는 Jurkat 세포주에서 ZF 반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 9c 참조).
소분자(예를 들어, ABA, 4OHT, 또는 그라조프레비르)의 투여는 HEK293 및 Jurkat 세포주 둘 다에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도했다(예를 들어, 도 10a-10d 참조) . 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 소분자(예를 들어, ABA, 4OHT 또는 그라조프레비르) 처리 농도의 함수로 아웃풋 형광도 여기에 나타나 있다.
인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 소분자(ABA)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 상단 그래프 참조). 소분자(4OHT)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이러한 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 중간 그래프 참조). 소분자(GRZ)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이러한 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 하단 그래프 참조).
인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 소분자(그라조프레비르)의 투여는 HEK293 및 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 12a-12c 참조).
1차 인간 세포에서 키메라 항원 수용체의 유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 CD4+ 1차 인간 T 세포에서 ZF 반응성 프로모터로부터 형광적으로 태깅된(fluorescently-tagged) 키메라 항원 수용체(CD19-CAR) 단백질의 일시적 활성화를 야기하였다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 그라조프레비르 처리 농도의 함수로서의 아웃풋 형광도 여기에 나타나 있다. CD19 항원 제시 표적 세포와 이들 1차 세포의 후속 공동 배양은 T-세포 활성화를 초래했으며, 이는 사이토카인의 향상된 생산으로 측정되었다. 이 향상된 수준의 사이토카인 생산을 사이토카인 발현을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 그라조프레비르 처리 농도의 함수로서의 사이토카인 생산도 여기에 나타나 있다(예를 들어, 도 13a-13d 참조).
1차 인간 세포에서 키메라 항원 수용체의 유도성 합성 전사 활성화(이중 약물 조절 맥락에서): 소분자(4OHT)의 투여는 CD4+ 1차 인간 T 세포에서 ZF-반응성 프로모터로부터 IL4 사이토카인의 발현 및 분비를 야기하였다. 이 시스템을 직교 ZF 반응성 프로모터의 형광적으로 태깅된 키메라 항원 수용체(CD19-CAR) 단백질의 또 다른 소분자(그라조프레비르) 조절 활성화와 연계하여 사용하였다. ERT2-synTF는 4OHT에만 반응했으며 그라조프레비르의 존재에 영향을 받지 않았다. 마찬가지로, NS3-synTF는 그라조프레비르에만 반응했으며 4OHT의 존재에 영향을 받지 않았다. (예를 들어, 도 14a-14b 참조).
Jurkat 인간 세포주에서 사이토카인의 유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 Jurkat T 세포주에서 ZF-반응성 프로모터로부터 사이토카인(IL10)의 일시적 활성화를 야기하였다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 이러한 유도성 활성화는 NS3-synTF 발현 및 IL10 생산을 위한 별도의 렌티바이러스 카세트("이중 렌티바이러스 벡터")의 전달을 통해, 또는 NS3-synTF를 발현할 뿐만 아니라 IL10 생산을 조절하는 단일 렌티바이러스 카세트의 전달을 통해 달성할 수 있다(예를 들어, 도 15a-15c 참조).
ERT2 및 SMASh 도메인을 사용하는 인간 세포주에서 형광 단백질의 유도성 합성 전사 활성화 및 조정가능한 불활성화 : 3개의 Jurkat T 세포주를 테스트했다: (1) ZF-p65-ERT2(SMASh 없음, 예를 들어, 도 4 참조); (2) ZF-p65-ERT2-SMASh(C-말단 SMASh); 및 (3) SMASh-ZF-p65-ERT2(N-말단 SMASh)(예를 들어, 도 16a 참조). 4일 동안 ERT2 반응성 소분자(4OHT)의 투여는 모든 세포주에서 ZF 반응성 프로모터로부터 형광 단백질의 일시적 활성화를 야기하였다. 6 내지 16일째부터 소분자(4OHT)의 후속 제거는 모든 세포주에서 형광 단백질의 일시적 불활성화를 야기하였다. 12일 동안 SMASh-반응성 소분자(그라조프레비르)의 부재는 기준선 수준으로 리포터의 동등하고 느린 불활성화를 야기하였다. 12일 동안의 SMASh 반응성 소분자(그라조프레비르)의 투여는 기준선 수준으로 리포터의 빠른 불활성화를 야기하였다. 리포터의 이러한 신속한 불활성화를 SMASh 도메인이 없는 조건과 비교했으며, 이는 "그라조프레비르의 부재"에서와 같이 동등한 느린 불활성화를 야기하였다(예를 들어, 도 16b 참조).
ERT2 및 SMASh 도메인을 사용하여 인간 세포주에서 형광 단백질의 조정가능한 합성 전사 활성화: 2개의 Jurkat T 세포주를 테스트했다: (1) ZF-p65-ERT2-SMASh(C-말단 SMASh) 및 (2) SMASh -ZF-p65-ERT2(N-말단 SMASh). 4일 동안 다양한 양의 ERT2 반응성 소분자(4OHT) 및 SMASh 반응성 소분자(GZV)의 공동 투여는 ZF 반응성 프로모터로부터 형광 단백질의 일시적 활성화를 다양한 수준으로 야기하였다. 모든 조건에서 4OHT가 없거나 최소한이면 활성화가 거의 또는 전혀 야기되지 않았다. 모든 조건에서 존재하거나 거의 최대에 가까우면 활성화가 거의 또는 전혀 야기되지 않았다. 4OHT의 존재 및 GZV의 부재는 최대 활성화를 야기한다. C-말단 및 N-말단 SMASh 변이체는 GZV 농도에 대해 차등적 민감도를 나타냈다(예를 들어, 도 17 참조).
ERT2 및 SMASh 도메인을 사용하는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 3개의 Jurkat T 세포주를 테스트했다: (1) KRAB-ZF-ERT2-SMASh; (2) HP1a-ZF-ERT2-SMASH; 및 (3) EED-ZF-ERT2-SMASH. 6일 동안 ERT2 반응성 소분자(4OHT)의 투여는 모든 세포주에서 ZF 반응성 프로모터로부터 형광 단백질의 일시적 억제를 야기하였다. 음성 대조군에서 SMASh-반응성 소분자(GZV)의 부재는 4OHT 부재 하에 유의한 "누출(leaky)" 억제를 야기하였다(예를 들어, 도 18 참조).
실시예 2: 포유류-최적화되고, 협력적으로 자가-조립되는 합성 전사 인자(synTF) 및 포유류 유전자 발현의 약물-유도성 컨트롤러
세포는 다인자 화학적 및 생물학적 자극에 반응하여 정확한 유전자 발현 프로그램을 활성화한다. 이 과정에 대한 의도적 조작이 합성 생물학의 주요 목표이며, 이를 인간 세포에 적용하면 인간 생물학을 이해하고 질병에 정교한 방식으로 반응하는 차세대 진단 및 치료제 개발하는 데 돌파구를 마련할 수 있다. 실제로, 종양단백질의 기초 연구에서 세포 재프로그래밍, 세포 치료 개발에 이르기까지, 다양한 응용 분야는 입력 신호에 대한 응답으로 유전자 발현 아웃풋의 정확하고 조정가능한 제어를 필요로 한다. 불행히도, 포유류 세포에서 인공적으로 유전자 발현을 제어하는 도구는 근본적인 생물학적 과정을 연구하고 설계자 세포-기반 치료법을 설계하는 능력을 크게 제한하는 상당한 한계가 있다. 가장 널리 사용되는 도구는 박테리아 전사 시스템에서 유래된, 구세대 기술이고; 이들은 동시에 제어할 수 있고 조정가능하지 않으며, 새로운 입력 신호를 유연하게 통합할 수 없는 유전자의 수에 제한을 부여한다. 결과적으로, 연구자들은 생화학적 신호(예를 들어, 리간드, 화학적 인듀서, 형태발생적 신호(cues))를 유연하게 감지 통합하고, 이에 따라 조정가능한 활성화 프로파일을 생성할 수 있는 정교한 유전자 발현 컨트롤러를 생성할 수 없다. 포유류 세포에서 이러한 정밀한 유전자 발현 컨트롤러에 의해 변형될 수 있는 많은 생물의학 적용 중에는, 과잉-활성화 및 조직 특이성과 관련된 문제로 고통받을 수 있는, 암, 자가면역, 및 재생 의학을 위한 세포-기반 치료제의 개발이 있다.
본 명세서에는 포유동물 세포에서 유전자 발현 조절을 조절하기 위한 조성물, 방법 및 시스템이 기술되어 있다. 본 명세서에는 원하는 생물의학 적용을 위한 특이성, 제어, 및 활성을 향상시키기 위한 설계자 인간 세포의 "신호 처리" 능력의 확대가 설명되어 있다. 이론에 구속되길 원치 않으면서, 중심 가설은 이러한 확대된 신호 처리가 "단순한" 일대일 조절에 기반한 현재의 유전자 발현 시스템 대신, 협력적, 조합적 전사 조절 체계를 사용하여 달성될 수 있다는 것이다. 이러한 가설은 후생동물(metazoa)에서 신호가 유전자 발현을 활성화하기 위해 협력적으로 조립되는 거대 다가 전사 인자(TF) 복합체를 사용하여 처리되고 통합된다는 관찰에 기반한다.
본 명세서에는 포유동물 유전자 발현 조절을 위한 정보 처리 모듈이 기술되어 있다. 기능성은 인간 1차 면역 세포에서 입증되는데, 이는 인간 생리학 및 세포 면역요법에서의 사용에서 이들이 수행하는 기본적인 역할 때문이다. 본 명세서에는 FDA 승인 직교 약물에 의해 조절되는 유도성 컨트롤러가 설명되어 있다. 컨트롤러는 표준 바이러스 벡터에 의해 발현되며, 이들은 자가면역 및 암에 대해 치료적으로 중요한 리포터 또는 유전자 산물(synTF 및 사이토카인)의 조절된 발현을 유도하는 것으로 입증되어 있다. 따라서, 포유류 유전자 발현의 포유류-최적화된, 협력적으로 자가-조립되는 합성 전사 인자(synTF) 및 약물-유도성 컨트롤러가 본 명세서에 기재되어 있다.
이러한 약물-유도성 컨트롤러는 포유류 시스템 전반에 걸쳐 정밀한 유전자 발현 조절을 허용한다. 세포 치료를 개선하기 위해 조작된 인간 세포의 감지 및 반응 능력을 확대하는 것 외에도, 이러한 컨트롤러는 기본적인 생물의학 연구에 광범위하게 유용하다. 이것은 동시에 다수의 유전자 생성물(예를 들어, 종양단백질 또는 재프로그래밍 인자)에 대한 약물-유도성, 일시적 제어를 허용하는 것을 포함한다.
유전자 발현 제어 시스템: 전망과 한계.
살아있는 시스템에서 정보 흐름에 대한 의도적 조작은 합성 생물학의 궁극적인 목표이며, 인간 세포에 대한 이의 적용은 인간 생물학의 이해와 차세대 진단 및 치료제 개발의 돌파구로 이어질 수 있다. 특히, 유전자 발현 기술은 광범위한 응용을 위해 세포에서 이러한 정보 흐름을 조절하는 데 중요한 역할을 해왔다. 예를 들어, 오르가노이드를 형성하는 발달 과정은 유전자 조절 네트워크(GRN)의 형태로 줄기 세포에서 게놈적으로 코딩된다. 유전자 발현 제어 회로를 통한 GRN의 조작은 시험관내에서 형태형성(morphogenesis)을 프로그래밍하고 가이드하는 데 유익한 것으로 입증되었다. 동물 모델 개발에서, 조직-특이적 및 소분자 유도성 프로모터는 종종 유전자 발현의 기관-특이적 및 시간적 제어를 달성하는 데 사용된다. 또한, c-fos 프로모터는 마우스에서 활성화된 뉴런을 기능적으로 라벨밍하고 광유전학적 채널 로돕신 단백질의 발현을 제어하여 빛 자극으로 공포 기억을 인공적으로 회상시키는 데 사용되었다. 마지막으로, 인간 T 세포에서, 항원-특이적 scFv 및 T 세포 신호전달 도메인의 융합물인, 키메라 항원 수용체(CAR)의 이소성 과발현은 최근 임상 시험에서 급성 림프모구성 백혈병(ALL)에 대한 높은 효능으로 암에 대한 특이성을 재유도할 수 있다.
현재의 유전자 발현 기술이 근본적이고 치료적인 돌파구로 이끌었으나, 이들의 단점 또한 많다. 예를 들어, 유도 만능 줄기 세포로부터의 세포 재프로그래밍의 비효율은 종종 주요 단백질 및 전사 인자가 올바른 농도와 시간에서 발현되지 않기 때문에 기인된다. 또한, c-fos 프로모터는 다양한 뉴런에서 다양한 활성을 갖는 것으로 알려져 있으며, 이는 많은 응용 분야에서 사용할 수 없게 한다. 또한, 조직 특이적 프로모터에 대해 많은 표적-이탈 효과가 보고되어 있으며, 그에 따라 데이터 해석을 혼란스럽게 한다. 마지막으로, 유망한, 세포 면역요법은 세포 특이성, 과잉 활성화, 천연 면역 시스템 및 조직 미세환경과의 예기치 않은 상호작용과 관련된 문제의 조합으로 인해 종종 (치명적인) 부작용을 나타냈다.
누적적으로, 앞서 언급한 문제는 포유류 세포로 정교한 "신호 처리"를 조작하는 연구자의 능력을 제한하는, 현재 유전자 발현 제어 시스템의 근본적인 한계의 결과이다. 첫째, 사용 중인 전사 제어 시스템의 수가 적고, 하나의 잘 개발되고 널리 사용되는 화학적으로 유도가능한 유전자 발현 시스템(TetR-기반 tTa)이 있기때문에 더욱 악화된다. 이것은 연구자들이 포유류 세포에서 한 번에 하나의 유전자 산물만을 확실하게 조건부로 유도할 수 있음을 의미한다. 둘째, 시스템은 사실상 표준 미생물 전사 시스템(예를 들어, TetR)의 모든 유도체이다. 고도로 활동적이지만, 이러한 시스템은 고정된 반응 프로파일을 가지고 있으며, 치료 단백질이 생산되는 방식을 정확하게 조정하기 위해 이들의 활성화 프로파일을 예측적으로 재구성하는 전략은 사소하지 않다. 따라서, 세포-자율 컨트롤러를 설계하든지 아니면 외인성 유도성 컨트롤러를 설계하든지 간에, 현재 도구는 새로운 입력 신호를 유연하게 통합하고 원하는 적용을 위한 맞춤형 전사 프로그램(아웃풋)을 생성할 수 없다.
포유류 유전자 발현 조절을 위한 강력한 정보-처리 모듈이 본 명세서에 기술되어 있다. synTF 프레임워크는 인간 세포 조작 적용과 호환된다: 이는 매우 조정가능하고 확립된 바이러스 벡터를 사용하여 쉽게 전달되는 작은 전체적으로 인간-유래된 단백질 도메인으로 구성된다. 인간 생리학에 대한 이들의 중요성 및 세포 면역 요법에서의 이들의 사용으로 인해 기능성은 인간 1차 면역 세포에서 입증된다. 유연성과 일반화 가능성을 보여주기 위해, 이 핵심 시스템은 조작된 면역 세포에서 다양한 유형의 유용한 유전자 발현 컨트롤러, 예컨대 직교, FDA 승인 약물의 투여에 의해 외인성으로 제어되는 유도성 컨트롤러를 구성하는 기초로 사용된다. 이러한 컨트롤러는 치료 유전자(synTF 및 사이토카인)의 생산과 연결되며, 그로 인해 컨트롤러의 적용은 영향을 받아 암, 자가면역 및 재생 의학에 대한 차세대 세포 치료제의 신호 처리 특징(증가된 특이성, 제어 및 활성)이 강화된다.
주요 혁신은 포유류 세포 조절을 위해 특별히 최적화된 새로운 종류의 합성 TF 시스템이 포함하며, 다음과 같은 특징이 있다: 인간 유래 구성요소, 확립된 바이러스 벡터를 사용하여 손쉬운 전달을 위한 컴팩트한 유전자 페이로드, 조정가능한 분자 특성을 가진 모듈 도메인, 및 천연 트랜스크립톰에 직교하는 특정 조절. 또한 인간 1차 면역 세포에서 synTF 및 사이토카인 생산의 조정가능한 제어를 허용하는 것으로 입증된, 포유류 세포에 대한 새로운 직교 약물-유도성 유전자 발현 시스템의 세트가 본 명세서에 기재되어 있다.
포유류 세포에서 유전자 발현을 제어하기 위한 현재 도구는 심각하게 제한되어 있다. 인간 세포에서 새로운 정밀 유전자 발현 컨트롤러를 생성하는 데에는 (1) 확대된 직교 DNA 결합 부분 세트를 갖고, (2) 테트라사이클린 항생제를 넘어 안전한 전달가능한 화학 물질에 반응하고, (3) 고도로 조정가능한 활성화/응답 프로파일을 허용하는 전사 시스템의 개발을 필요로 한다. 본 명세서에 설명된 것은 이러한 요구 사항을 충족하는 것이 특징인 "포유류-최적화된" 합성 TF(synTF) 시스템의 새로운 클래스이다. 이러한 synTF는 인간 1차 면역 세포에서 치료 유전자 생성물의 활성화 프로파일을 조정하기 위해 약물-유도성 컨트롤러에 사용된다.
직교 징크 핑거 어레이를 기반으로 하는 포유류 synTF의 생성 및 특성화
포유류 synTF는 인간 세포에서 정확하고 효과적인 직교 전사 제어를 위해 개발되었다. synTF는 인공 C2H2 징크 핑거(ZF) 어레이를 기반으로 한다. ZF는 자연적인 인간(및 모든 진핵생물) TF 중에서 가장 일반적인 DNA 인식 모티프이다. ZF는 인간 세포에서 인공 전사 제어 시스템을 조작하기 위한 근간으로서 4가지 주요 이점을 제공한다: (1) ZF는 인간-유래(TALE 또는 CRISPR/Cas9와 달리)이며 그에 따라 바람직하지 않은 면역 반응을 유발할 가능성이 적다. 실제로, 구세대 ZF 시스템은 영장류에서 치료 유전자 산물의 장기간 조절을 달성하기 위한 임상적으로 실행가능한 전략인 것으로 드러났다. (2) 더 부피가 큰 대응물(예를 들어, CRISPR/Cas9)과 달리, ZF 단백질은 작기 때문에(~30-AA 도메인은 DNA의 3bp에 결합함), 일반적인 바이러스 벡터를 사용하여 쉽게 패키징되고 전달되는 컴팩트한 유전자 페이로드 디자인을 허용한다. (3) 아래에 설명된 바와 같이, ZF-기반 synTF는 고도로 조정가능한 분자 특성을 가진 모듈식 디자인을 가지고 있다. (4) 맞춤형 DNA-결합 특이성을 가진 ZF 어레이는 다양한 synTF-DBM 특이성을 생성하도록 조작될 수 있다. 게놈-직교 DBM을 표적으로 하는 ZF-기반 합성 전사 조절인자(regulators)는 포유류 조작 응용을 위해 아직 개발되지 못했다.
포유류, 직교 synTF의 라이브러리 생성 및 평가
원칙적으로 인간 게놈에서 고유한 주소지정가능성(addressability)을 제공하는 길이인, 정의된 20-bp DBM을 표적으로 하는 6-유닛 ZF 어레이를 생성하기 위한 워크플로우가 본 명세서에 설명되어 있다. 워크플로우는 모듈식 어셈블리와 2-유닛 빌딩 블록에서 6-유닛 어레이의 기능적 선택을 활용한다. 이 접근법을 이용하여, 인간 게놈에 대한 직교성을 최대화하도록 선택된 결합 특이성을 갖는 11개의 6-유닛 어레이의 라이브러리를 생성했다(예를 들어, 그 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 공개 US20180057838 참조). 본 발명자들은 이러한 어레이를 인간 전사 이펙터 도메인(p65 활성화 도메인, KRAB/HP1a 침묵 도메인)에 융합시켜 인간화된 최소 synTF를 생성했다(예를 들어, 도 1a 참조). 이들의 활성을 테스트하기 위해, 형광 단백질의 전사를 구동하는 최소 프로모터의 상류에 4개의 탠덤 20-bp DBM으로 구성된, synTF-반응성 리포터 구축물을 보유하는 상응하는 HEK293FT 리포터 라인을 생성시켰다(예를 들어, 도 1b 참조). 각 synTF 발현 구축물을 사용한 리포터 세포의 형질도입은 이들의 상응하는 리포터의 강력한 활성화를 나타내었지만(예를 들어, 도 1c 참조), 비-동족 리포터를 활성화시키지 않았다(예를 들어, 도 1d 참조). 다음으로, RNA-seq 측정을 사용하여 게놈-전체(genome-wide) 전사에 대한 synTF의 영향을 매핑했다. synTF 조절 프로파일은 매우 특이적이었으며, 고유의 전사체 프로파일에 대한 최소한의 효과를 나타내었다(예를 들어, 도 1e-1g 참조). 중요하게는, synTF 트랜스크립톰 프로파일이 고전적인 Gal4 및 TetR 기반 시스템과 유리하게 비교되었으며, 일부 synTF는 차등 조절 분석에 기반한 우수한 특이성을 입증했다(예를 들어, 도 1h 참조). 3개의 독립적인 생물학적 참조에 대한 프로파일 평가를 포함하여, 이 분석을 수행하기 위해 엄격한 프레임워크를 사용하였다. 함께, 이러한 데이터는 6-유닛 ZF 어레이가 포유류 유전자 발현의 특이적이고 효과적인 조절인자인 synTF를 조작하는 데 사용될 수 있음을 입증한다. 이러한 실험은 또한 synTF를 생성하고 평가하기 위한 파이프라인을 확립한다. 도구 개발의 엄격함을 추가로 뒷받침하는 것은 이러한 ZF synTF 중 하나가 포유류 세포에서 강력하고 특이적인 후성유전적 조절을 허용하는 데 사용되었다는 것이다(예를 들어, Park et al. Cell 176, 227-238 e220, (2019) 참조).
유전자 발현 컨트롤러 디자인을 위한 "부품(parts)"으로서 synTF 친화성 변이체의 생성
예외적으로 높은 생체내(in vivo) 활성 및 트랜스크립톰적 특이성을 나타내는 라이브러리(ZF1 및 ZF10)로부터의 2개의 직교 synTF를 추가 개발을 위해 선택했다. 이러한 synTF에 대한 synTF/DBM 친화도(Kt) 변이체를 생성시켰다. 친화도 변이체는 여러 목적으로 사용된다. 첫째, synTF 결합 친화도를 조절하는 것은 전사 아웃풋 수준을 조정하는 데 유용한 전략이다. 포유류 "부품" 툴킷을 채우기 위해, 각 synTF에 대해 ~10개의 변이체의 친화도 시리즈를 생성시켰다(예를 들어, 표 10-12, 서열식별번호: 122-180, 192 참조).
3가지 전략의 조합을 사용하여 낮은 nM - 중간 μM에 걸쳐 있는 ZF-DBM 친화도 변이체를 생성시켰다: (1) DNA 포스페이트 백본 상호작용을 매개하는 ZF(DNA 인식 나선의 외부)에서 보존된 아르기닌 잔기의 알라닌 돌연변이. (2) 전체 길이 6-유닛 ZF 어레이를 4-유닛위 하위어레이로 절단(truncation). (3) 코어 DBM 내부와 직접적으로 측접하는 부분 둘 모두에서 뉴클레오티드 돌연변이. 이들 변이체의 활성은 전술한 생체내(in vivo) 리포터 분석을 사용하여 평가할 수 있다. 이어서, 친화도는 시험관내(in vitro) 결합 분석을 사용하여 직접 측정할 수 있다. 간단히 말해서, ZF-MBP 융합 단백질은 각 변이체에 대해 정제된다. 형광 이방성(FA) 결합 측정을 수행하여 단일 WT DBM을 내포하는 미리-결합된 FITC-라벨링된 올리고 프로브에 대해 DBM 종의 경쟁적 적정을 수행한다. 결합 곡선은 전체 DBM 변이체 세트에 대해 얻을 수 있으며, 데이터를 2차(quadratic) 결합 방정식에 피팅하여 Kt 값을 추출한다. 이 작업의 결과는 유전자 발현 컨트롤러를 설계하는 데 사용할 수 있는 포유류 synTF "부품"(측정된 DBM-결합 친화도를 가짐) 세트이다.
약물-유도성 synTF 컨트롤러 개발 및 인간 1차 면역 세포에서 synTF 및 사이토카인 아웃풋을 일시적으로 제어하는 이들의 활성 테스트
포유류 세포에서 유전자 발현을 다중화하고 원하는 단백질에 대한 일시적인 발현 제어를 허용하는 활성을 제공하는, 직교 FDA-승인 약물에 반응하는 유도성 유전자 발현 컨트롤러가 본 명세서에 기재되어 있다. 컨트롤러를 synTF와 리간드 반응성 도메인을 융합하여 조작했고 인간 T 세포(예를 들어, 1차 T 세포주 및 Jurkat T 세포주)에서 이들의 성능을 평가했으며, 인간 생리학 및 번역 연구에 대한 이들의 확립된 중요성에 기반하여 선택했다. 인간 T 세포, 특히 1차 T 세포에서 유전자 발현을 정밀하게 제어하는 것은 여전히 도전적인 과제로 남아 있다. 따라서, 이러한 세포에서 이러한 시스템을 구축하는 것은 다른 도전적인 세포 유형에 이들을 적용할 수 있는 근간을 제공한다. 유도성 시스템을 항-Her2 synTF 및 IL-12 발현을 제어하는 데 사용하였다. 항-Her2 synTF T 세포는 임상 시험에서 육종 치료에 대한 가능성을 보여주었지만, 치명적인 표적 종양 이탈(on-target-off-tumor) 부작용이 있을 수 있다. 유사하게, IL-12는 강력한 항-종양 활성을 나타내지만, 용량-제한 독성으로 인해 까다롭다. 따라서, 항-Her2 및 IL-12의 조절된 발현은 이들의 안전성 프로파일을 개선할 수 있다.
약물-유도성 synTF는 1차 인간 면역 세포에서 치료 유전자 생성물의 조절된 발현 제어를 가능하게 한다
synTF 활성에 대한 제어를 얻기 위해, 비-구조 단백질(NS3) 도메인을 synTF에 융합시켰다(예를 들어, 도 9a-9b 참조). NS3는 C형 간염 바이러스(HCV)에서 유래하는 자가-절단 프로테아제이며, 단백질 발현을 제어하기 위한 분해 태그로 사용되었다. 약물의 부재 하에, NS3는 ZF 도메인에서 p65 활성화 도메인을 절단하여, 유전자 전사를 방지한다. 세포-투과성 FDA-승인 억제제 그라조프레비르(GZV)가 존재하면, NS3 프로테아제 활성이 차단되어, synTF는 온전하게 유지된다. NS3 시스템은, 부분적으로, 최대 12주 동안 고용량(예를 들어, 100 mg/일)으로 일반적으로 복용하는, GZF의 탁월한 안전성 프로파일 때문에 선택되었다. 콤팩트한, GZV-유도성 synTF 컨트롤러는 단일 렌티바이러스에 패키징될 수 있다. 이는 인간 면역 세포(예를 들어, IL-10 컨트롤러; 예를 들어, 도 15a-15c 참조)에서 치료적으로 관련된 도입유전자(therapeutically-relevant transgenes)의 조절된 발현 제어, 또는 CD4+ 1차 인간 T 세포(예를 들어, 도 13a-13d 참조)에서 기능하는 CD19 CAR의 용량- 및 시간-의존적 발현 제어를 허용한다. 이러한 연구는 포유류 유전자 발현을 조절하기 위한 약물 유도성 synTF 컨트롤러의 유용성을 입증한다.
직교 약물-유도성 유전자 발현 컨트롤러의 개발 및 평가
시스템 설계: 직교 FDA-승인 약물에 반응하는 synTF 컨트롤러 개발은 유전자 발현 제어를 다중화하는 능력을 제공한다. 하기 것에 의해 조절되는 조작된 컨트롤러가 본 명세서에 기술된다: (1) 에스트로겐 수용체 변이체(예컨대, ERT2)에 융합된 분자의 활성을 선택적으로 조절하는 FDA-승인 유방암 치료제 타목시펜의 대사산물인 4-하이드록시타목시펜(4OHT), 및 (2) GZV(위에서 설명한 바와 같음). 4OHT- 및 GZV-유도성 시스템을 리간드 결합 도메인을 2개의 직교 synTF에 융합하여 생성시켰다. 인간 p65를 활성화 도메인으로 사용하였고, synTF의 발현은 구성적 프로모터(예를 들어, EF1-a)에 의해 제어되었다. 관심 유전자를 구동하는 상응하는 synTF-반응성 프로모터와 동일한 pHR 렌티바이러스 벡터에 유도성 synTF를 배치했다.
시스템 평가: GFP, synTF, 및 사이토카인 발현에 대한 분석, 뿐만 아니라 Jurkat 또는 인간 1차 T 세포에서 synTF 활성에 대한 분석이 본 명세서에 설명되어 있다. Jurkat T 세포주의 다양한 유전 회로의 상대적 성능은 인간 1차 CD8 T 세포에서 테스트함으로써 평가할 수 있다. T 세포 생물학의 이해에 관한 이들의 가치와, 소정 비용으로 분석 파이프라인을 확장할 수 있는 이들의 능력 때문에 Jurkat 세포를 사용하였다. Jurkat에서 강력하게 발현되는 synTF는 1차 T 세포에서도 유사하게 강하다.
유도성 synTF를 먼저 리포터로서 GFP(또는 mCherry와 같은 또 다른 검출가능한 마커)를 사용하여 특성규명했다. 전체 시스템을 높을 효율을 보장하기 위해 25의 감염 다중도를 갖는 렌티바이러스 형질도입을 통해 Jurkat T 세포에 도입했으며, qPCR로 바이러스 카피 수(VCN)를 정량화했다. 유도성 synTF 컨트롤러를 특성규명하기 위해, 96웰 플레이트에 각각 5 x 104개 세포를 렌티바이러스와 함께 접종하고, 3승 배수(three orders of magnitude)(예를 들어, GZV 0-10 μM, 4OHT 0-1 μM)에 걸쳐 8가지 다른 약물 농도로 첨가했으며, GFP 발현 수준은 유세포 분석으로 정량화될 수 있다(예를 들어, 도 10a-10d 참조). 유전자 발현 수준은 VCN으로 정규화될 수 있다. 이러한 용량 반응에서, 동적 범위 및 활성화 임계값을 정의할 수 있다. 단일 벡터 디자인에서 선택 마커가 결여될 수 있기 때문에, 형질도입 효율은 4OHT 또는 GZV에 의한 유도 후 GFP 양성 세포의 백분율과 동일한 것으로 가정되었다.
번역 잠재력을 입증하기 위해, 인간 1차 CD8 T 세포에서 synTF 또는 사이토카인 발현을 제어하기 위해 큰 동적 범위를 나타내는 유도성 시스템을 선택할 수 있다. 컨트롤러 회로를 GFP를 치료 단백질(예를 들어, 항-Her2 synTF 또는 IL-12)로 대체하여 조작하고, 렌티바이러스 형질도입을 통해 인간 1차 CD8 T 세포에 도입하고, 본 명세서에 기재된 방법을 사용하여 평가할 수 있다. 간단히 말해서, ROSETTASEP 및 SEPMATE 키트(STEMCELL Technology)를 사용하여 혈액 은행에서 얻은 익명의 남성 및 여성 기증자의 류코팩(leukopaks)으로부터 1차 인간 T 세포를 정제할 수 있다. myc-태깅된 synTF에 대한 면역염색법으로 인듀서의 존재 또는 부재 하의 synTF 발현 수준을 측정하고, ELISA로 IL-12 발현을 측정했다. synTF를 활성화하기 위해, 5 x 104개의 조작된 T 세포를 K562 세포를 발현하는 Her2와 1:1 비율로 96웰 플레이트에서 혼합한다. T 세포 활성화를 사이토카인 생산(예를 들어, IL-2 및 IFN-g), 세포 사멸, 및 증식을 통해 측정한다. 세포 사멸을 유세포 분석을 통해 살아있는 K562 세포(예를 들어, 형광 표지)의 수로 측정한다. synTF 또는 사이토카인을 구성적으로 발현하는 T 세포, 및 synTF 또는 사이토카인이 결여된 세포를 대조군으로 테스트한다. 각 샘플에 대해 3번씩(triplicate) 수행한다. 표본 간의 통계적 유의성은 스튜던트의 T-검정(양측)으로 결정할 수 있다. <0.05인 값은 유의한 것으로 간주된다. 재현성을 보장하기 위해, 각 실험은 3회 초과하여 독립적으로 반복된다.
실시예 3: 면역 세포 요법을 위한 합성 전사 조절
개요: 차세대 세포 요법은 정교한 방식으로 질병을 감지하고 이에 반응할 수 있는 디자이너 면역 세포를 생성하는 것을 추구한다. 이 목표를 달성하려면 복잡한 환경 입력을 처리하고 치료 작용제의 정확하게 조절된 발현을 매개함으로써 인간 세포 기능을 프로그래밍하는 데 사용할 수 있는 조작된 조절 요소와 회로가 근본적으로 요구된다. 이 목표를 위해, 합성 전사 프로그램은 감지 및 반응 모듈과 인터페이스하여 세포에서 새로운 조절 계층(layers)을 구현할 수 있다(예를 들어, 도 1a-1b 참조).
치료 작용제의 단순한 구성적 발현에 대한 의존을 넘어 면역 세포 요법을 진보시키기 위해, 조정가능하고 다용도의 조절 프로파일을 제공하는 프로그래밍가능한 유전 구성요소에 대한 요구가 존재한다. 또한 이러한 구성요소는 높은 특이성, 낮은 면역원성, 및 전달가능성을 포함하는, 인간 치료 맥락과 호환되는 특성을 자체적으로 가져야 한다.
조작된 징크 핑거(ZF) 도메인은 앞서 언급한 고려 사항을 해결할 수 있기 때문에 인간 세포에서 전사 조절을 위한 유망한 부분(moieties)이다. 이러한 자연적으로 콤팩트한 DNA 결합 요소는 진핵생물 전사 인자에 편재하고 있다. 이들은 프로그래밍가능한 서열 인식과 맞춤가능한 분자 특성을 갖춘 모듈식 디자인을 가지고 있다. 이러한 모티프의 구조와 프로그래밍가능성을 이해하여 유용한 유전자 조절 기능을 달성하기 위한 광범위한 기초 작업이 진행되었다.
치료 유전자 조절에 적용하기에 적합한 합성 전사 조절 플랫폼이 본 명세서에 기술되어 있다. 인간 게놈에 고유하고 직교하는 인식 서열을 가진 조작된 ZF 도메인의 라이브러리가 조작되고 활용되며, 이러한 최소 조절인자(regulators)는 제어된 유전자 발현을 달성하기 위해 약물 반응성 도메인에 연결된다. 이 프레임워크는 면역 세포 요법을 위한 정교한 유전자 발현 프로그램을 광범위하게 허용한다.
치료 유전자의 합성 전사 조절을 위한 이러한 플랫폼은 T 세포에서 사용될 수 있다. synTF의 이러한 핵심 전사 인자는 포유류 시스템으로부터의 이들의 콤팩트한 크기와 고유한 유래로 인해 요법에 매우 유리하다. 안전하고/하거나 FDA-승인된 약물을 투여하여 (예를 들어, T 세포에서) 활성을 제어하기 위해 이러한 인자를 소분자-반응성 도메인에 연결시켰다.
합성 징크 핑거-TF 라이브러리의 구축: 독특하고 추정상 인간 게놈에 직교하는 18 bp 결합 모티프를 갖는 조작된 6-유닛 징크 핑거(ZF) 도메인을 사용하여 합성 전사 인자의 라이브러리를 구축했다. 동족 및 비-동족 리포터에 대한 최소 전사 조절인자의 활성을 HEK293 세포주에서 평가했다(예를 들어, 도 1c-1d 참조).
트랜스크립톰 반응의 평가: 본 발명의 합성 전사 조절인자의 발현 시 세포 트랜스크립톰 반응의 변화를 HEK293 세포주에서 측정했다. 이러한 전역(global) 트랜스크립톰 프로파일을 널리 사용되는 "직교" DNA 결합 도메인(예를 들어, Gal4, TetR)의 프로파일과 비교하였다(예를 들어, 도 1f-1h 참조).
유도성 전사 조절인자의 개발: 전사 조절인자를 유전자 발현을 일시적으로 조절하기 위해 유도성 도메인에 커플링시켰다. FDA-승인 약물이거나 인간에게 안전한 것으로 알려진 소분자에 반응하는 후보 유도성 요소를 선택했다. 유도성 전사 조절인자의 용량 의존적 및 시간 의존적 활성을 HEK293 및 Jurkat 세포주 둘 다에서 평가했다(예를 들어, 도 2-4, 5a-5c, 6a-6b, 7a-7c, 8a-8c, 9a-9c, 10a-10d 참조).
면역 세포 기능의 제어: 본 발명의 소분자 유도성 조절 시스템 중 하나(예를 들어, NS3-조절된 synTF)는 일차 CD4+ T 세포에서 CD19 키메라 항원 수용체의 발현을 일시적으로 조절하고 세포 활성화 시 사이토카인의 조정가능한 생산을 허용하는 데 활용되었다(예를 들어, 도 13a-13d 참조).
실시예 4: 인간 세포에서 합성 전사 조절을 위한 플랫폼
치료 세포는 정교한 방식으로 질병을 감지하고 이에 반응하도록 조작될 수 있다. 세포는 자연적으로 다양한 환경 신호를 통합하고 처리할 수 있다. 세포는 그들의 내재적인 유전적 및 후성유전적 프로그램을 사용하여 공간과 시간에 걸쳐 정보를 처리하는 자연적으로 지각하고 적응가능한 디바이스이다. 인공 유전 프로그램은 인간 세포에 새롭고 점점 더 복잡한 치료 기능을 부여할 수 있다.
합성 생물학 분야는 다음과 같은 모든 분야에 실제로 기여해 왔다: (1) 다양한 신호(예를 들어, 인공 수용체, 반응성 단백질)를 식별하기 위한 전략 개발, (2) 정보를 해석하기 위한 새로운 플랫폼 및 셀룰러 로직 모듈(예를 들어, 전사 네트워크, 신호 캐스케이드) 및 (3) 이것들을 바람직하고 효과적인 반응과 치료적 결과로 번역(예를 들어, 교정 도입유전자, 자극 분자). 유전자 프로그램으로 인간 세포를 조작함으로써, 세포는 질병과 관련된 신호를 통합 및 처리하고, 궁극적으로 정교한 방식으로 치료적으로 반응할 수 있는 새로운 기회를 얻게 된다.
전사 인자(TF)는 자연적으로 세포 거동을 조절한다. 새로운 유전 요소는 치료 세포의 신호 처리 능력을 향상시킬 수 있다. 정보 처리와 관련하여, 전사 인자는, 유전자 발현을 국부적으로 그리고 조건부로 조절하는 이들의 본질적인 능력으로 인해 회로 및 유전 프로그램 내에서 주요 매개 조절 요소로 종종 활용된다. TF는 기본적으로 게놈적 과정과 흥미로운 세포 거동을 지배한다(예를 들어, 강력한 유전자 활성화 및 침묵, 분화, 인핸서 등). 이러한 복잡한 거동은 종종 진핵생물 맥락에서 고유한 TF 특징(예를 들어, 인핸서 서열에 대한 특이성, DNA 구조와 염색질을 변형하는 활성, 협동성을 상호작용하는 활성, 다른 유전자를 일시적으로 그리고 순서대로 조절하는 능력 등)으로 인해 나타난다.
역사적으로, 이종성 TF는 원핵생물 시스템(예를 들어, Gal4, TetR, LacI 및 기타)에서 인간 세포의 "직교적으로" 제어 프로그램으로 공동-채택되어 왔다. 이것 자체가 포유류 합성 생물학 분야에서 많은 중요한 기초적 발전을 허용하였으나, 이러한 "원시적(primitive)" 부품을 사용하여 밝혀낼 수 있는 조절 특성과 유용한 거동은 그 양이 비교적 제한적이다.
세포가 보다 신뢰할 수 있는 방식으로 더 많은 정보 채널을 처리할 수 있게 하는 새로운 조절 요소에 대한 지속적인 요구가 존재한다. 합성 전사 조절은 제어가능한 발현을 허용할 수 있다. 본 명세서에 설명된 것은 이러한 TF 사이의 조작된 협력적 상호작용이 복잡한 신호 처리 동작을 일으킬 수 있는 방법에 대한 탐구를 포함하는 맞춤제작가능한 특성을 가진 인공 진핵생물 TF이다.
조작된 유전 성분은 인간 세포에서 정확하고 다용도의 전사 조절을 위해 사용될 수 있다.
인간 세포에서의 치료 적용을 위한 차세대 조절 요소의 개발과 관련하여, 이러한 TF의 유리한 특성을 이하에서 설명한다.
이러한 합성 전사 인자는 다음 요건을 충족한다: (1) 안전하고 비면역원성인 포유동물 시스템에서 유래된 성분, (2) 표적-이탈 효과를 최소화하면서 이들의 오퍼레이터 서열에서 매우 특이적으로 인식하고 조절할 수 있는 성분, (3) 다른 분자 구성요소와 프로그래밍가능하고 조정가능한 상호작용을 허용하는 것들, 및 (4) 확립된 전달 벡터 내에서 인간 세포에서 성공적으로 전달될 수 있는 것들.
조작된 ZF 도메인은 이러한 모든 고려 사항을 해결하는 전사 조절을 위한 유망한 모이어티이다 - 이들은 자연적으로 발생하고, 인간 TF에서 최소 DBD이며, 합성 조절에 적합할 수 있다.
조작된 징크 핑거 도메인은 인간 세포의 처리 능력을 향상시킬 수 있는 합성 전사 조절인자를 구축하는 데 사용될 수 있다.
18bp DNA 오퍼레이터를 특이적으로 인식하는 인공 6-유닛 ZF 도메인 세트를 개발했다; 이것들은 천연 인간 게놈 서열과 거리가 멀고 오르쏘로그성(orthologous)이다. 이러한 조작된 결합 도메인을 인간-유래 이펙터 도메인에 커플링하고 반응성 프로모터를 개발하여 간단한 전사 조절 프로그램을 개발했다. 이러한 프로그램은 치료 회로에서 인터페이스할 수 있다 - 소분자에 반응하는 유도성 synTF를 생성하고 이러한 제어가능한 synTF를 사용하여 치료 아웃풋의 발현을 조절함.
인간 게놈에 직교하는 합성 전사 오퍼레이터 서열이 확인되었다. 편리한 1:1 인식 코드가 있는 다른 기술(예를 들어, TALE, CRISPR)과 비교하여 ZF 도메인을 프로그래밍하는 데에는 특이적인 도전과제가 있다. 하나의 ZF 유닛은 3bp의 DNA를 특정하고 이들은 모듈식으로 연결되어 더 큰 서열 어레이를 특정할 수 있다. 그러나, 이러한 ZF 단위가 더 큰 어레이 내에 배열될 때 상황-의존적 활성(context-dependent activity)이 나타날 수 있다.
게놈-직교 인식 서열 기능적이고 활성적인 DNA 결합 도메인을 찾는 이중 도전과제를 해결하기 위해, 2-유닛 ZF 서브어레이 세트를 사용하였다(예를 들어, J. Keith Joung(ZF 아카이브); 미국 특허 제10,138,493호(2018) 참조). 게놈에서 대표성이 낮은(underrepresented) 6bp 인식 서열을 확인했다. 이론에 구속되는 것을 원치않고, 서열들의 연속성(concatenation)이 매우 먼 18bp 서열(고유성을 부여할 수 있는 길이)로 이어질 것이라는 가설을 세웠다. 그런 다음 해당 6-유닛 ZF의 어레이를 스크리닝하여 이러한 서열을 인식할 수 있는 것들을 찾고, 11개 서열("오퍼레이터")과 상응하는 6-유닛 ZF의 초기 라이브러리를 얻었다.
인간 게놈에서 오퍼레이터 서열의 발생을 평가하기 위해 "바이오스트링(Biostrings)"이라 불리는 생물정보학 스트링 매칭 알고리즘을 사용하였다. 합성 오퍼레이터를 여러 표준 TF 오퍼레이터 서열(예를 들어, UAS/Gal4, TetO/TetR, ZFHD1)와 비교하였다. 설명된 워크플로우를 통해 생성된 합성 오퍼레이터를 유사하거나 더 짧은 길이의 이러한 "이종성" 인식 서열에 비해 더 나은 성능을 나타냈다(예를 들어, 도 31 참조).
본 명세서에는 합성 오퍼레이터 서열 및 동족 전사 인자의 라이브러리가 기술되어 있다. 반응 세포주를 형광 아웃풋을 구동하는 최소 프로모터의 상류에 합성 오퍼레이터 서열을 배치하고, 이들을 HEK 세포에 통합함으로써 개발했다. 그런 다음 반응성(즉, 리포터) 세포주를 인간-유래 이펙터 도메인(예를 들어, p65)에 커플링된 조작된 결합 도메인으로 구성된 최소 합성 전사 인자로 일시적으로 형질감염시켰다. 이들 단백질은 어레이에 결합할 수 있었고 이어서 형광 아웃풋의 발현을 부스팅할 수 있었다. 각 리포터는 상응하는 synTF의 존재시에만 켜졌고, ZF 도메인을 대체하는 GFP가 있는 "모의 TF"를 사용하는 음성 대조군의 경우에는 켜지지 않았다. 이 세트의 상호 직교성에 대한 테스트는 TF가 이들의 상응하는 오퍼레이터에 특이적이었으나, 비동족 서열에 대해서는 그렇지 않았다는 것을 입증했다(예를 들어, 도 1a-1d 참조).
synTF 특이성 및 게놈-전체 활성을 설명하기 위해 트랜스크립톰 측정을 사용하였다. 본 발명의 synTF의 특이성과 게놈-전체 직교성은 인간 게놈에서 경험적으로 평가되었다. 단일하게 통합된 HEK 세포주는 이의 동족 형광 리포터와 함께 synTF를 구성적으로 발현했다. 총 RNA를 수집하고 트랜스크립톰 분석을 수행하여 표적-이탈 오조절과 비교하여 형광 트랜스크립톰의 표적-적중(on-target) 조절을 조사했다. 이러한 차등 발현 수준을 GFP-p65 "모의" TF를 포함하는 참조 세포주(reference line)와 비교하였다. synTF 세포주에서 mCherry의 유의한 차등 활성화가 있었지만, 두 세포주 사이의 고유 세포 트랜스크립톰의 극히 높은 상관관계는 synTF가 이들의 표적 부위에서 특이적으로 발현을 조절함을 나타낸다(예를 들어, 도 1e-1h 참조).
본 명세서에 기재된 바와 같이, 소분자 유도성 조절은 synTF 활성의 제어에 유용하다. 합성 전사 조절인자의 약물-제어가능한 버전은 관련 소분자의 존재 및 농도에 반응하는 TF를 생성하여 조작되었다. 이들은 TF의 활성에 대한 조정가능하고 일시적인 제어에 유용하다. 리포터와 synTF를 이러한 페이로드를 다양한 세포 유형에 전달할 수 있는 렌티바이러스 카세트로 이식했다. 다른 메커니즘을 통해 synTF의 활성을 제어하기 위해 3개의 안전한 및/또는 FDA 승인된 소분자를 사용했으며: 이러한 메커니즘은 다음을 포함한다: (1) ABI/PYL 도메인의 앱시스산 매개 헤테로-이량체화; (2) ERT2 도메인의 4-하이드록시타목시펜 매개 핵 전위; 및 (3) 바이러스 NS3 자가-절단 프로테아제의 그라조프레비르 매개 안정화. 3개의 직교 synTF 액티베이터를 각 유도성 시스템에 연결시켰다(예를 들어, 도 2-4, 5a-5c, 6a-6b, 7a-7c, 8a-8c, 9a-9c, 10a-10d 참조).
조정가능한 유전자 활성화는 소분자 유도성 synTF를 사용하여 달성되었다. HEK293 및 Jurkat 세포주 모두에서, 3가지 유도성 synTF 액티베이터 각각에 대한 유도성 프로파일을 결정했다. 리포터 발현을 시간 및 다양한 약물 농도에 따라 평가했다. 4일차에 분석된 가장 높은 수준의 발현이 나타났으며, 이는 미처리 세포주에 비해 약물-처리된 세포주에서 강력한 유도성 발현을 제시한다(예를 들어, 도 10a-10d 참조).
조정가능한 유전자 침묵은 또한 소분자 유도성 synTF를 사용하여 달성할 수 있다. 유전자 발현을 억제할 수 있는 유도성 synTF를 조작했다. 형광 아웃풋을 구성적으로 발현하도록 반응성 프로모터를 변형시켰다. p65 활성화 도메인을 KRAB 억제 도메인(인간-유래 사일런서)으로 대체했고, 동일한 ZF-약물 쌍을 synTF 액티베이터로 이용했다. HEK 세포주에서 3개의 유도성 synTF 억제인자 각각에 대해 유도성 프로파일을 측정했으며, 시간이 지남에 따라 미처리된 세포주에 비해 약물-처리된 세포주에서 리포터 발현의 강력한 침묵이 있었다(예를 들어, 도 11a-11b, 12a-12c 참조).
유도성 synTF는 단일 렌티바이러스 벡터로부터 사이토카인 발현을 조절할 수 있으며, 이는 synTF의 콤팩트한 특성을 입증한다. IL-10의 발현을 차례로 조절할 수 있는 그라조프레비르-유도성 synTF를 발현할 수 있는 단일 렌티바이러스 벡터를 조작했다. 발현 요소를 포함하는 이 전체 삽입물의 크기는 3.5 kB이었으며, 이는 최소 크기이고 특정 벡터의 총 페이로드 패키징 한계에 근접한다. 감염된 Jurkat 세포에서 바이러스를 생성시켰고, 그라조프레비르 투여 2일 후 형질도입된 세포에서 IL-10의 강력한 유도 발현이 관찰되었으며, 이는 이것이 인간 세포에서 치료 아웃풋을 조절하는 효율적인 전략임을 제시한다(예를 들어, 도 15a-15c 참조).
유도성 synTF는 1차 세포에서 synTF 발현을 조절할 수 있다. 그라조프레비르-유도성 synTF를 1차 CD4+ 세포에서 CD19-CAR의 발현을 제어하는 데 사용하였다. 상이한 투여 농도의 약물을 사용하여, synTF의 용량-의존적 발현을 시간 경과에 따라 측정했다. 3일째에 가장 높은 농도로 강한 배수 유도가 나타났다. 그런 다음 그라조프레비르-유도된 세포를 CD19+ 항원 제시 세포와 공동 배양하여 1차 세포를 활성화시키고, IFN감마 및 IL-2 사이토카인의 용량-의존적 생산을 시간에 따라 연이어 측정했다. 이러한 결과는 치료제로부터 아웃풋의 발현을 확실하게 제어할 수 있는 능력을 강조하며, 따라서 이들의 기능성이 점점더 복잡한 설정에서 제어된다는 것을 강조한다(예를 들어, 도 13a-13d 참조).
결론적으로, 유리한 특성을 갖는 새로운 전사 조절 요소를 구축하면 인간 세포가 조정가능하고 신뢰할 수 있는 방식으로 정보를 처리하고 치료 기능을 조절하는 것이 가능하다. 직교 ZF 결합 도메인 및 합성 오퍼레이터 서열의 라이브러리가 특별히 개발되었고, 이들은 최소 전사 조절 프로그램을 조작하는 데 사용되었다. 본 명세서에 나타난 바와 같이, 이러한 synTF는 회로에서 치료 프로그램을 제어하는 데 사용되었고, 따라서 정교한 유전자 발현 프로그램에서 이러한 synTF의 유용성이 입증되었다.
실시예 5: 예시적인 서열
유도 근접 도메인
[ABI]-[ZF]-[2A]-[p65]-[PYL] 합성 전사 액티베이터: 이 특정 실시형태에서, ZF는 ABI 도메인의 C-말단에 융합되는 한편, p65는 PYL 도메인에 N-말단에 융합된다. 두 개의 복합 도메인은 동일한 프로모터에서 발현되며; 이들은 2A 리보솜 스킵 서열에 의해 분리된다(예를 들어, 서열식별번호: 4, 도 19 참조).
[ABI]-[ZF]-[2A]-[KRAB]-[PYL] 합성 전사 리프레서: 이러한 특정 실시양태에서, ZF는 ABI 도메인의 C-말단에 융합되는 한편, KRAB는 PYL 도메인에 N-말단에 융합된다. 두 개의 복합 도메인은 동일한 프로모터에서 발현된다. 이들은 2A 리보솜 스킵 서열에 의해 분리된다(예를 들어, 서열식별번호: 5, 도 20 참조).
세포질 격리 도메인
[ZF]-[p65]-[ERT2] 합성 전사 액티베이터: 이 특정 실시양태에서, p65 이펙터 도메인은 ZF 도메인에 대한 C-말단 융합된다. ERT2 도메인은 p65 도메인에 대해 C-말단에 융합된다(예를 들어, 서열식별번호: 6, 도 21 참조).
[KRAB]-[ZF]-[ERT2] 합성 전사 리프레서: 이러한 특정 실시양태에서, KRAB 이펙터 도메인은 ZF 도메인에 N-말단 융합된다. ERT2 도메인은 ZF 도메인에 대해 C-말단에 융합된다(예를 들어, 서열식별번호: 7, 도 22 참조).
자가-절단 프로테아제 도메인
[ZF]-[NS3]-[p65] 합성 전사 액티베이터: 이러한 특정 실시양태에서, 징크 핑거 DNA 결합 도메인은 NS3 도메인에 대해 N-말단인 한편, 이펙터 도메인은 NS3 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 8, 도 23 참조).
[KRAB]-[NS3]-[ZF] 합성 전사 리프레서: 이러한 특정 실시양태에서, 이펙터 도메인은 NS3 도메인에 대해 N-말단인 한편, 징크 핑거 DNA 결합 도메인은 NS3 도메인에 대해 C-말단이다(예를 들어, 서열식별번호 9, 도 24 참조).
유도된 분해 도메인
[ZF]-[p65]-[ERT2]-[SMASh] 합성 전사 액티베이터 ("C-말단 SMASh"): 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 10, 도 25 참조).
[SMASh]-[ZF]-[p65]-[ERT2] 합성 전사 액티베이터 ("N-말단 SMASh"): 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 N-말단이다(예를 들어, 서열식별번호: 11, 도 26 참조).
[ZF]-[p65]-[SMASh]: 이러한 특정 실시양태에서, SMASh 도메인(NS3 함유)은 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다(예를 들어, 서열식별번호: 12, 도 27 참조).
[KRAB]-[ZF]-[ERT2]-[SMASh]: 이러한 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 KRAB 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대한 C-말단이다(예를 들어, 서열식별번호: 13, 도 28 참조).
[HP1a]-[ZF]-[ERT2]-[SMASh]: 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 HP1a 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 14, 도 29 참조).
[EED]-[ZF]-[ERT2]-[SMASh]: 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 EED 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 15, 도 30 참조).
서열 표
표 1: 예시적인 벡터
Figure pct00241
Figure pct00242
표 2: 예시적인 SynTFs (마지막 3개 컬럼은 예시적인 서열식별번호를 나타낸다)
Figure pct00243
표 3은 예시적인 이종이량체화 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 3: 예시적인 유도 근접 도메인 SynTF
Figure pct00244
표 4는 예시적인 전위 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 4: 예시적인 세포질 격리 도메인 SynTF
Figure pct00245
표 5는 예시적인 자가-절단 프로테아제 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 5: 예시적인 억제성 프로테아제 SynTF
Figure pct00246
Figure pct00247
표 6 및 7은 예시적인 유도 분해 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 6: 예시적인 유도된 분해 도메인 SynTF(액티베이터 도메인)
Figure pct00248
표 7: 예시적인 유도된 분해 도메인 SynTF(리프레서 도메인)
Figure pct00249
SEQUENCE LISTING <110> TRUSTEES OF BOSTON UNIVERISTY <120> REGULATED SYNTHETIC GENE EXPRESSION SYSTEMS <130> 701586-095350USPT/WOPT <150> 62/848,850 <151> 2019-05-16 <160> 380 <170> PatentIn version 3.5 <210> 1 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 1 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Glu Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His 35 40 45 Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu 65 70 75 80 Leu Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu 100 105 110 Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Asp Ala Thr Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 2 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 2 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys 35 40 45 Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu 65 70 75 80 Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu 100 105 110 Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 3 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 3 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His 35 40 45 Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu 65 70 75 80 Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu 100 105 110 Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 4 <211> 903 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (336)..(342) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (364)..(370) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (393)..(399) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (421)..(427) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (450)..(456) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (478)..(484) <223> Xaa can be any naturally occurring amino acid <400> 4 Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro 1 5 10 15 Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala 20 25 30 Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met 35 40 45 Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val 50 55 60 Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg 65 70 75 80 Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu 85 90 95 Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn 100 105 110 Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr 115 120 125 Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe 130 135 140 Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr 145 150 155 160 Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala 165 170 175 Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala 180 185 190 Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr 195 200 205 Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg 210 215 220 Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp 225 230 235 240 Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu 245 250 255 Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala 260 265 270 Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala 275 280 285 Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile 290 295 300 Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro 305 310 315 320 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 325 330 335 Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro 340 345 350 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 355 360 365 Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 370 375 380 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 385 390 395 400 Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 405 410 415 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His 420 425 430 Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 465 470 475 480 Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Pro Lys Lys 485 490 495 Lys Arg Lys Val Thr Cys Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu 500 505 510 Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly His His 515 520 525 Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala 530 535 540 Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala 545 550 555 560 Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala 565 570 575 Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro 580 585 590 Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 595 600 605 Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn 610 615 620 Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser 625 630 635 640 Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr 645 650 655 Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val 660 665 670 Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala 675 680 685 Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser 690 695 700 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly 705 710 715 720 Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln 725 730 735 Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser 740 745 750 Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser 755 760 765 Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys 770 775 780 Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg 785 790 795 800 Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg 805 810 815 Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr 820 825 830 Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His 835 840 845 Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu 850 855 860 Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr 865 870 875 880 Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala 885 890 895 Ser Ile Thr Glu Ala Met Asn 900 <210> 5 <211> 808 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (336)..(342) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (364)..(370) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (393)..(399) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (421)..(427) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (450)..(456) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (478)..(484) <223> Xaa can be any naturally occurring amino acid <400> 5 Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro 1 5 10 15 Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala 20 25 30 Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met 35 40 45 Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val 50 55 60 Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg 65 70 75 80 Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu 85 90 95 Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn 100 105 110 Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr 115 120 125 Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe 130 135 140 Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr 145 150 155 160 Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala 165 170 175 Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala 180 185 190 Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr 195 200 205 Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg 210 215 220 Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp 225 230 235 240 Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu 245 250 255 Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala 260 265 270 Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala 275 280 285 Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile 290 295 300 Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro 305 310 315 320 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 325 330 335 Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro 340 345 350 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 355 360 365 Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 370 375 380 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 385 390 395 400 Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 405 410 415 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His 420 425 430 Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 465 470 475 480 Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg 485 490 495 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 500 505 510 Glu Glu Asn Pro Gly Pro Gly His His Pro Lys Lys Lys Arg Lys Val 515 520 525 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 530 535 540 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 545 550 555 560 Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 565 570 575 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 580 585 590 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 595 600 605 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 610 615 620 Gly Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser 625 630 635 640 Gln Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys 645 650 655 Ser Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp 660 665 670 Ser Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile 675 680 685 Lys Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr 690 695 700 Arg Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu 705 710 715 720 Arg Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile 725 730 735 Thr Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val 740 745 750 His Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val 755 760 765 Leu Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp 770 775 780 Thr Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu 785 790 795 800 Ala Ser Ile Thr Glu Ala Met Asn 805 <210> 6 <211> 692 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (20)..(26) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (48)..(54) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (77)..(83) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (105)..(111) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (134)..(140) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (162)..(168) <223> Xaa can be any naturally occurring amino acid <400> 6 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 65 70 75 80 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 100 105 110 Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln 180 185 190 Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro 195 200 205 Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala 210 215 220 Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala 225 230 235 240 Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu 245 250 255 Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala 260 265 270 Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser 275 280 285 Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val 290 295 300 Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile 305 310 315 320 Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala 325 330 335 Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu 340 345 350 Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln 355 360 365 Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg 370 375 380 Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys 385 390 395 400 Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu 405 410 415 Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg 420 425 430 Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp 435 440 445 Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe 450 455 460 Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp 465 470 475 480 Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro 485 490 495 Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly 500 505 510 Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr 515 520 525 Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys 530 535 540 Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser 545 550 555 560 Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu 565 570 575 Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu 580 585 590 Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu 595 600 605 Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser 610 615 620 Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala 625 630 635 640 Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser 645 650 655 Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser 660 665 670 Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe 675 680 685 Pro Ala Thr Ala 690 <210> 7 <211> 605 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (127)..(133) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (155)..(161) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (184)..(190) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (212)..(218) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (241)..(247) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (269)..(275) <223> Xaa can be any naturally occurring amino acid <400> 7 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 65 70 75 80 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 85 90 95 Val Leu Glu Gly Gly Gly Gly Ser Gly Thr Cys Arg Ser Arg Pro Gly 100 105 110 Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe 130 135 140 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg 165 170 175 Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 180 185 190 Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 195 200 205 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr 210 215 220 Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 225 230 235 240 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys 245 250 255 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 260 265 270 Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val 275 280 285 Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser 290 295 300 Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu 305 310 315 320 Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile 325 330 335 Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met 340 345 350 Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile 355 360 365 Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp 370 375 380 Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly 385 390 395 400 Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro 405 410 415 Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val 420 425 430 Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met 435 440 445 Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu 450 455 460 Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu 465 470 475 480 Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu 485 490 495 Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln 500 505 510 Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser 515 520 525 Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val 530 535 540 Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His 545 550 555 560 Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser 565 570 575 His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr 580 585 590 Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 595 600 605 <210> 8 <211> 704 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (20)..(26) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (48)..(54) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (77)..(83) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (105)..(111) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (134)..(140) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (162)..(168) <223> Xaa can be any naturally occurring amino acid <400> 8 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 65 70 75 80 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 100 105 110 Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His 180 185 190 Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys 195 200 205 Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly 210 215 220 Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly 225 230 235 240 Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly 245 250 255 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 260 265 270 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 275 280 285 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 290 295 300 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 305 310 315 320 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 325 330 335 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 340 345 350 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 355 360 365 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 370 375 380 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu 385 390 395 400 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 405 410 415 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 420 425 430 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 435 440 445 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 450 455 460 Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val 465 470 475 480 Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro 485 490 495 Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Asp 500 505 510 Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser 515 520 525 Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro 530 535 540 Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro 545 550 555 560 Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala 565 570 575 Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu 580 585 590 Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser 595 600 605 Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu 610 615 620 Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr 625 630 635 640 Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr 645 650 655 Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro 660 665 670 Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile 675 680 685 Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu 690 695 700 <210> 9 <211> 609 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (450)..(456) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (478)..(484) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (507)..(513) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (535)..(541) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (564)..(570) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (592)..(598) <223> Xaa can be any naturally occurring amino acid <400> 9 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 65 70 75 80 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 85 90 95 Val Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His 100 105 110 Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys 115 120 125 Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly 130 135 140 Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly 145 150 155 160 Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly 165 170 175 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 180 185 190 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 195 200 205 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 210 215 220 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 225 230 235 240 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 245 250 255 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 260 265 270 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 275 280 285 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 290 295 300 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu 305 310 315 320 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 325 330 335 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 340 345 350 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 355 360 365 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 370 375 380 Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val 385 390 395 400 Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro 405 410 415 Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Ser 420 425 430 Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 465 470 475 480 Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe 485 490 495 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa 500 505 510 Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile 515 520 525 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys 530 535 540 Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 545 550 555 560 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr 565 570 575 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 580 585 590 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln 595 600 605 Leu <210> 10 <211> 998 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (20)..(26) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (48)..(54) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (77)..(83) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (105)..(111) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (134)..(140) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (162)..(168) <223> Xaa can be any naturally occurring amino acid <400> 10 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 65 70 75 80 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 100 105 110 Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln 180 185 190 Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro 195 200 205 Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala 210 215 220 Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala 225 230 235 240 Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu 245 250 255 Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala 260 265 270 Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser 275 280 285 Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val 290 295 300 Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile 305 310 315 320 Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala 325 330 335 Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu 340 345 350 Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln 355 360 365 Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg 370 375 380 Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys 385 390 395 400 Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu 405 410 415 Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg 420 425 430 Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp 435 440 445 Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe 450 455 460 Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp 465 470 475 480 Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro 485 490 495 Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly 500 505 510 Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr 515 520 525 Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys 530 535 540 Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser 545 550 555 560 Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu 565 570 575 Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu 580 585 590 Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu 595 600 605 Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser 610 615 620 Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala 625 630 635 640 Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser 645 650 655 Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser 660 665 670 Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe 675 680 685 Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu 690 695 700 Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp 705 710 715 720 Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro 725 730 735 Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile 740 745 750 Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln 755 760 765 Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly 770 775 780 Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser 785 790 795 800 Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu 805 810 815 Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr 820 825 830 Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile 835 840 845 Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg 850 855 860 Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro 865 870 875 880 Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly 885 890 895 Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr 900 905 910 Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr 915 920 925 Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys 930 935 940 Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly 945 950 955 960 Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val 965 970 975 Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro 980 985 990 Asp Arg Glu Val Leu Tyr 995 <210> 11 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (325)..(331) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (353)..(359) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (382)..(388) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (410)..(416) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (439)..(445) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (467)..(473) <223> Xaa can be any naturally occurring amino acid <400> 11 Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser 1 5 10 15 Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg 20 25 30 Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn 35 40 45 Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe 50 55 60 Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala 65 70 75 80 Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr 85 90 95 Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser 100 105 110 Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val 115 120 125 Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg 130 135 140 Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser 145 150 155 160 Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg 165 170 175 Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro 180 185 190 Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn 195 200 205 Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp 210 215 220 Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr 225 230 235 240 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 245 250 255 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 260 265 270 Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu 275 280 285 Val Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 290 295 300 Pro Gly Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met 305 310 315 320 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His 325 330 335 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 340 345 350 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln 355 360 365 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 370 375 380 Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln 385 390 395 400 Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa 405 410 415 His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 420 425 430 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg 435 440 445 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 450 455 460 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg 465 470 475 480 Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly 485 490 495 Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu 500 505 510 Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu 515 520 525 Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln 530 535 540 Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr 545 550 555 560 Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly 565 570 575 Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala 580 585 590 Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro 595 600 605 Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala 610 615 620 Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro 625 630 635 640 Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp 645 650 655 Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser 660 665 670 Gln Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met 675 680 685 Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys 690 695 700 Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala 705 710 715 720 Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr 725 730 735 Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala 740 745 750 Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly 755 760 765 Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala 770 775 780 Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His 785 790 795 800 Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln 805 810 815 Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala 820 825 830 Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val 835 840 845 Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu 850 855 860 Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val 865 870 875 880 Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly 885 890 895 Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile 900 905 910 Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr 915 920 925 Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu 930 935 940 Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala 945 950 955 960 Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr 965 970 975 Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly 980 985 990 Phe Pro Ala Thr Ala 995 <210> 12 <211> 728 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (71)..(77) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (99)..(105) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (128)..(134) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (156)..(162) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (185)..(191) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (213)..(219) <223> Xaa can be any naturally occurring amino acid <400> 12 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly Gly Ser Gly 35 40 45 Gly Thr Ala Ser Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile 50 55 60 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg 65 70 75 80 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 85 90 95 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly 100 105 110 Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro 130 135 140 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 165 170 175 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 180 185 190 Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 195 200 205 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His 210 215 220 Leu Arg Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro 225 230 235 240 Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln 245 250 255 Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser 260 265 270 Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro 275 280 285 Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu 290 295 300 Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp 305 310 315 320 Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp 325 330 335 Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly 340 345 350 Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro 355 360 365 Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro 370 375 380 Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser 385 390 395 400 Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu 405 410 415 Leu Ser Gln Ile Ser Ser Pro Gly Asp Glu Met Glu Glu Cys Ser Gln 420 425 430 His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp 435 440 445 Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser 450 455 460 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 465 470 475 480 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 485 490 495 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 500 505 510 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 515 520 525 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 530 535 540 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 545 550 555 560 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 565 570 575 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 580 585 590 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 595 600 605 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 610 615 620 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 625 630 635 640 Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala 645 650 655 Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met 660 665 670 Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu 675 680 685 Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly 690 695 700 Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile 705 710 715 720 Ile Pro Asp Arg Glu Val Leu Tyr 725 <210> 13 <211> 878 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (94)..(100) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (122)..(128) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (151)..(157) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (179)..(185) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (208)..(214) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (236)..(242) <223> Xaa can be any naturally occurring amino acid <400> 13 Met Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr 1 5 10 15 Arg Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg 20 25 30 Glu Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe 35 40 45 Leu Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp 50 55 60 Pro Trp Gly Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu 65 70 75 80 Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 85 90 95 Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln 100 105 110 Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa 115 120 125 His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 130 135 140 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg 145 150 155 160 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 165 170 175 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr Gly 180 185 190 Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 195 200 205 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro 210 215 220 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 225 230 235 240 Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg 245 250 255 Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro 260 265 270 Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr 275 280 285 Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu 290 295 300 Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met 305 310 315 320 Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn 325 330 335 Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln 340 345 350 Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu 355 360 365 Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn 370 375 380 Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu 385 390 395 400 Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn 405 410 415 Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn 420 425 430 Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu 435 440 445 Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile 450 455 460 His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg 465 470 475 480 Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn 485 490 495 Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro 500 505 510 Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala 515 520 525 Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His 530 535 540 Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr 545 550 555 560 Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu 565 570 575 Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp 580 585 590 Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly 595 600 605 Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr 610 615 620 Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys 625 630 635 640 Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr 645 650 655 Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly 660 665 670 Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met 675 680 685 Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly 690 695 700 Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu 705 710 715 720 Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser 725 730 735 Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser 740 745 750 Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe 755 760 765 Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile 770 775 780 Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp 785 790 795 800 Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile 805 810 815 Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val 820 825 830 Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala 835 840 845 Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu 850 855 860 Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 865 870 875 <210> 14 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (219)..(225) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (247)..(253) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (276)..(282) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (304)..(310) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (333)..(339) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (361)..(367) <223> Xaa can be any naturally occurring amino acid <400> 14 Met Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp 1 5 10 15 Glu Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys 20 25 30 Gly Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His 35 40 45 Asn Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser 50 55 60 Glu Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys 65 70 75 80 Pro Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn 85 90 95 Ser Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp 100 105 110 Ile Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly 115 120 125 Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp 130 135 140 Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys 145 150 155 160 Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala 165 170 175 Tyr Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser Gly 180 185 190 Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe 195 200 205 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa 210 215 220 Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile 225 230 235 240 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg 245 250 255 Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 260 265 270 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr 275 280 285 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 290 295 300 Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr Gly Ser Gln Lys 305 310 315 320 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 325 330 335 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 340 345 350 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 355 360 365 Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg Gly Ser Ser 370 375 380 Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile 385 390 395 400 Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln 405 410 415 Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu 420 425 430 Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu 435 440 445 Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys 450 455 460 Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu 465 470 475 480 Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg 485 490 495 Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu 500 505 510 Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp 515 520 525 Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly 530 535 540 Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val 545 550 555 560 Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His 565 570 575 Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met 580 585 590 Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln 595 600 605 Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met 610 615 620 Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp 625 630 635 640 Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser 645 650 655 Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr 660 665 670 Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly 675 680 685 Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu 690 695 700 Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp 705 710 715 720 Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser 725 730 735 Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu 740 745 750 Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val 755 760 765 Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala 770 775 780 Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr 785 790 795 800 Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn 805 810 815 Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser 820 825 830 Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg 835 840 845 His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser 850 855 860 Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly 865 870 875 880 Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala 885 890 895 Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu 900 905 910 Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser 915 920 925 Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys 930 935 940 Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr 945 950 955 960 Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu 965 970 975 Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys 980 985 990 Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 995 1000 <210> 15 <211> 1253 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (469)..(475) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (497)..(503) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (526)..(532) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (554)..(560) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (583)..(589) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (611)..(617) <223> Xaa can be any naturally occurring amino acid <400> 15 Met Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro 1 5 10 15 Ala Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp 20 25 30 Leu Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr 35 40 45 Asn Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly 50 55 60 Arg Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr 65 70 75 80 Ser Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu 85 90 95 Phe Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val 100 105 110 Phe Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser 115 120 125 Gln Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp 130 135 140 Glu Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His 145 150 155 160 Pro Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn 165 170 175 Pro Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala 180 185 190 Ile Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser 195 200 205 Val Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr 210 215 220 Leu Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu 225 230 235 240 Ser Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met 245 250 255 Asp His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn 260 265 270 Ala Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro 275 280 285 Phe Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile 290 295 300 His Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu 305 310 315 320 Ser Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met 325 330 335 Glu Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile 340 345 350 Leu Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe 355 360 365 Ser Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly 370 375 380 Lys Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys 385 390 395 400 Cys Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr 405 410 415 Ser Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala 420 425 430 Ser Ile Trp Arg Trp Asp Arg Leu Arg Gly Gly Ser Gly Ser Gly Ser 435 440 445 Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met 450 455 460 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His 465 470 475 480 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 485 490 495 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln 500 505 510 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 515 520 525 Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln 530 535 540 Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa 545 550 555 560 His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 565 570 575 Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg 580 585 590 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 595 600 605 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg 610 615 620 Gly Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala 625 630 635 640 Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn 645 650 655 Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu 660 665 670 Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro 675 680 685 Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg 690 695 700 Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val 705 710 715 720 Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu 725 730 735 Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val 740 745 750 Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys 755 760 765 Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser 770 775 780 Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu 785 790 795 800 Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser 805 810 815 Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp 820 825 830 Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr 835 840 845 Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser 850 855 860 His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met 865 870 875 880 Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala 885 890 895 Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val 900 905 910 Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser 915 920 925 His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro 930 935 940 Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro 945 950 955 960 Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp 965 970 975 Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile 980 985 990 Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr 995 1000 1005 Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln 1010 1015 1020 Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn 1025 1030 1035 Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 1040 1045 1050 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp 1055 1060 1065 Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 1070 1075 1080 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg 1085 1090 1095 His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly 1100 1105 1110 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser 1115 1120 1125 Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe 1130 1135 1140 Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe 1145 1150 1155 Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe 1160 1165 1170 Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile 1175 1180 1185 Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp 1190 1195 1200 Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu 1205 1210 1215 Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile 1220 1225 1230 Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp 1235 1240 1245 Arg Glu Val Leu Tyr 1250 <210> 16 <211> 11661 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 16 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860 gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920 cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980 agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040 ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100 catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160 accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220 agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280 tttaattaag ccgccaccat gttcgaaccc aagaagaaga gaaaggtgtt cgaaactagt 8340 gtgcccctgt atggcttcac ttccatttgt ggccgacggc ctgaaatgga agccgcggtg 8400 tcaaccatac cacggtttct gcagagctca tcaggctcca tgctggacgg acgctttgat 8460 ccacagtctg ccgcacattt ctttggagtc tacgacggcc acgggggcag ccaggtcgcc 8520 aactactgca gggaaaggat gcatttggca cttgccgaag agatcgccaa agagaagccc 8580 atgttgtgtg atggggatac ctggctggag aagtggaaga aagcgctttt taactctttt 8640 ctgagagtgg attctgagat agaatctgtc gcacccgaga ccgtgggcag cacatccgtc 8700 gtagccgtag tgtttccctc ccacatattc gtcgccaact gcggcgacag tcgagccgtc 8760 ctctgccgag gtaagaccgc cctgcctctg agtgttgacc ataagcccga ccgggaggat 8820 gaggccgccc gaatcgaggc cgccggtgga aaagtcatcc aatggaacgg cgcaagagtg 8880 ttcggcgtgc tggcgatgtc caggagcatt ggagaccggt acctgaagcc cagcataatc 8940 ccagatcccg aagtgaccgc agtcaagagg gtgaaagagg acgattgtct gatcctggct 9000 agcgatggcg tatgggacgt gatgactgat gaggaggcgt gtgaaatggc ccgcaagcga 9060 atcctgctgt ggcataaaaa aaacgcagtc gcgggggacg cttctcttct ggcagacgaa 9120 aggcgcaaag aaggtaaaga cccggctgct atgagcgccg ccgaatatct cagtaagctg 9180 gcaattcagc gagggtccaa agacaacatt tccgtggtcg tggtagacct caaaggcggt 9240 tccggcggtt ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc 9300 tccgaggagg caaacttgag gcgccacacc cgaacacata caggagaaaa gccattccaa 9360 tgtcgaattt gtatgcgcaa tttttcagat cactcaagcc tcaagcgaca cctccgcaca 9420 catactggtt cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaatca 9480 gcgaaccttt tgcggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc 9540 tgtatgcgga acttcagcga ccccagttca ttgaagaggc atttgcgaac tcacaccggt 9600 tctcaaaaac cttttcagtg ccgaatttgt atgcgcaact tcagccaaca aacaaatttg 9660 acgagacaca cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc 9720 aattttagcg atgcgacaca acttgttagg catctgcgca cacacttgcg gggatccccg 9780 aagaaaaaac ggaaagtgac ctgcagggga agcggagcta ctaacttcag cctgctgaag 9840 caggctggag acgtggagga gaaccctgga cctggtcacc atgatgagtt tcccaccatg 9900 gtgtttcctt ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc 9960 ctgccccagg ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc 10020 ccagcccctg tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc 10080 aagcccaccc aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat 10140 gatgaagacc tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg 10200 gcatccgtcg acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc 10260 cacacaactg agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg 10320 gcccagaggc cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc 10380 ctcctttcag gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg 10440 agtcagatca gctccggtgg tggcagcggt caattgactc aagacgaatt cacccaactc 10500 tcccaatcaa tcgccgagtt ccacacgtac caactcggta acggccgttg ctcatctctc 10560 ctagctcagc gaatccacgc gccgccggaa acagtatggt ccgtggtgag acgtttcgat 10620 aggccacaga tttacaaaca cttcatcaaa agctgtaacg tgagtgaaga tttcgagatg 10680 cgagtgggat gcacgcgcga cgtgaacgtg ataagtggat taccggcgaa tacgtctcga 10740 gagagattag atctgttgga cgatgatcgg agagtgactg ggtttagtat aaccggtggt 10800 gaacataggc tgaggaatta taaatcggtt acgacggttc atagatttga gaaagaagaa 10860 gaagaagaaa ggatctggac cgttgttttg gaatcttatg ttgttgatgt accggaaggt 10920 aattcggagg aagatacgag attgtttgct gatacggtta ttagattgaa tcttcagaaa 10980 cttgcttcga tcactgaagc tatgaactaa agcggccgcg actctagagt cgacctgcag 11040 gcatgcaagc ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa 11100 agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 11160 atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 11220 tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 11280 tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 11340 ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 11400 cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 11460 gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg 11520 acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 11580 ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 11640 ctttgggccg cctccccgca t 11661 <210> 17 <211> 11376 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 17 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860 gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920 cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980 agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040 ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100 catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160 accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220 agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280 tttaattaag ccgccaccat gttcgaaccc aagaagaaga gaaaggtgtt cgaaactagt 8340 gtgcccctgt atggcttcac ttccatttgt ggccgacggc ctgaaatgga agccgcggtg 8400 tcaaccatac cacggtttct gcagagctca tcaggctcca tgctggacgg acgctttgat 8460 ccacagtctg ccgcacattt ctttggagtc tacgacggcc acgggggcag ccaggtcgcc 8520 aactactgca gggaaaggat gcatttggca cttgccgaag agatcgccaa agagaagccc 8580 atgttgtgtg atggggatac ctggctggag aagtggaaga aagcgctttt taactctttt 8640 ctgagagtgg attctgagat agaatctgtc gcacccgaga ccgtgggcag cacatccgtc 8700 gtagccgtag tgtttccctc ccacatattc gtcgccaact gcggcgacag tcgagccgtc 8760 ctctgccgag gtaagaccgc cctgcctctg agtgttgacc ataagcccga ccgggaggat 8820 gaggccgccc gaatcgaggc cgccggtgga aaagtcatcc aatggaacgg cgcaagagtg 8880 ttcggcgtgc tggcgatgtc caggagcatt ggagaccggt acctgaagcc cagcataatc 8940 ccagatcccg aagtgaccgc agtcaagagg gtgaaagagg acgattgtct gatcctggct 9000 agcgatggcg tatgggacgt gatgactgat gaggaggcgt gtgaaatggc ccgcaagcga 9060 atcctgctgt ggcataaaaa aaacgcagtc gcgggggacg cttctcttct ggcagacgaa 9120 aggcgcaaag aaggtaaaga cccggctgct atgagcgccg ccgaatatct cagtaagctg 9180 gcaattcagc gagggtccaa agacaacatt tccgtggtcg tggtagacct caaaggcggt 9240 tccggcggtt ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc 9300 tccgaggagg caaacttgag gcgccacacc cgaacacata caggagaaaa gccattccaa 9360 tgtcgaattt gtatgcgcaa tttttcagat cactcaagcc tcaagcgaca cctccgcaca 9420 catactggtt cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaatca 9480 gcgaaccttt tgcggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc 9540 tgtatgcgga acttcagcga ccccagttca ttgaagaggc atttgcgaac tcacaccggt 9600 tctcaaaaac cttttcagtg ccgaatttgt atgcgcaact tcagccaaca aacaaatttg 9660 acgagacaca cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc 9720 aattttagcg atgcgacaca acttgttagg catctgcgca cacacttgcg gggatccacc 9780 tgcaggggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 9840 aaccctggac ctggtcacca tccgaagaaa aaacggaaag tggatgctaa gtcactgact 9900 gcctggtccc ggacactggt gaccttcaag gatgtgtttg tggacttcac cagggaggag 9960 tggaagctgc tggacactgc tcagcagatc ctgtacagaa atgtgatgct ggagaactat 10020 aagaacctgg tttccttggg ttatcagctt actaagccag atgtgatcct ccggttggag 10080 aagggagaag agccctggct ggtggagaga gaaattcacc aagagaccca tcctgattca 10140 gagactgcat ttgaaatcaa atcatcagtt ggtggtggca gcggtcaatt gactcaagac 10200 gaattcaccc aactctccca atcaatcgcc gagttccaca cgtaccaact cggtaacggc 10260 cgttgctcat ctctcctagc tcagcgaatc cacgcgccgc cggaaacagt atggtccgtg 10320 gtgagacgtt tcgataggcc acagatttac aaacacttca tcaaaagctg taacgtgagt 10380 gaagatttcg agatgcgagt gggatgcacg cgcgacgtga acgtgataag tggattaccg 10440 gcgaatacgt ctcgagagag attagatctg ttggacgatg atcggagagt gactgggttt 10500 agtataaccg gtggtgaaca taggctgagg aattataaat cggttacgac ggttcataga 10560 tttgagaaag aagaagaaga agaaaggatc tggaccgttg ttttggaatc ttatgttgtt 10620 gatgtaccgg aaggtaattc ggaggaagat acgagattgt ttgctgatac ggttattaga 10680 ttgaatcttc agaaacttgc ttcgatcact gaagctatga actaaagcgg ccgcgactct 10740 agagtcgacc tgcaggcatg caagcttgat atcaagctta tcgataatca acctctggat 10800 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 10860 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 10920 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 10980 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 11040 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 11100 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 11160 tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 11220 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 11280 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag 11340 acgagtcgga tctccctttg ggccgcctcc ccgcat 11376 <210> 18 <211> 11044 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 18 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgtc tagaccaggc gaacgaccgt 8340 ttcaatgccg gatatgtatg aggaacttct cccagaggtc cagcttggta cggcacaccc 8400 gaacacatac aggagaaaag ccattccaat gtcgaatttg tatgcgcaat ttttcagaca 8460 agtctgtgtt ggctcgacac ctccgcacac atactggttc acagaagccc tttcagtgca 8520 ggatttgtat gcgcaacttt agccaacgct catccctggt aaggcacact agaacgcata 8580 caggtgagaa gcctttccag tgtcgcatct gtatgcggaa cttcagccag cggaataact 8640 tgggcaggca tttgcgaact cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta 8700 tgcgcaactt cagcacccac gccgtattga cacgacacac gcgcacgcac accggggaaa 8760 aaccgtttca atgtcgaatc tgcatgcgca attttagcga tagagggaac ctcactcgac 8820 atctgcgcac acacttgcgg ggatccacct gcagggatga gtttcccacc atggtgtttc 8880 cttctgggca gatcagccag gcctcggcct tggccccggc ccctccccaa gtcctgcccc 8940 aggctccagc ccctgcccct gctccagcca tggtatcagc tctggcccag gccccagccc 9000 ctgtcccagt cctagcccca ggccctcctc aggctgtggc cccacctgcc cccaagccca 9060 cccaggctgg ggaaggaacg ctgtcagagg ccctgctgca gctgcagttt gatgatgaag 9120 acctgggggc cttgcttggc aacagcacag acccagctgt gttcacagac ctggcatccg 9180 tcgacaactc cgagtttcag cagctgctga accagggcat acctgtggcc ccccacacaa 9240 ctgagcccat gctgatggag taccctgagg ctataactcg cctagtgaca ggggcccaga 9300 ggccccccga cccagctcct gctccactgg gggccccggg gctccccaat ggcctccttt 9360 caggagatga agacttctcc tccattgcgg acatggactt ctcagccctg ctgagtcaga 9420 tcagctccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9480 ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9540 ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9600 atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9660 gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9720 tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9780 tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9840 ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9900 catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9960 ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 10020 aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 10080 aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 10140 cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 10200 acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 10260 ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 10320 gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10380 ctgccacagc ttaagcggcc gcgactctag agtcgacctg caggcatgca agcttgatat 10440 caagcttatc gataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 10500 taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 10560 tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct 10620 ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga 10680 cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc 10740 tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac 10800 aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt 10860 tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt 10920 cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc 10980 tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc 11040 gcat 11044 <210> 19 <211> 10783 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 19 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgga tgctaagtca ctgactgcct 8340 ggtcccggac actggtgacc ttcaaggatg tgtttgtgga cttcaccagg gaggagtgga 8400 agctgctgga cactgctcag cagatcctgt acagaaatgt gatgctggag aactataaga 8460 acctggtttc cttgggttat cagcttacta agccagatgt gatcctccgg ttggagaagg 8520 gagaagagcc ctggctggtg gagagagaaa ttcaccaaga gacccatcct gattcagaga 8580 ctgcatttga aatcaaatca tcagttctcg agggaggcgg tggaagcggc acctgcaggt 8640 ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc tcccagaggt 8700 ccagcttggt acggcacacc cgaacacata caggagaaaa gccattccaa tgtcgaattt 8760 gtatgcgcaa tttttcagac aagtctgtgt tggctcgaca cctccgcaca catactggtt 8820 cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaacgc tcatccctgg 8880 taaggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc tgtatgcgga 8940 acttcagcca gcggaataac ttgggcaggc atttgcgaac tcacaccggt tctcaaaaac 9000 cttttcagtg ccgaatttgt atgcgcaact tcagcaccca cgccgtattg acacgacaca 9060 cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc aattttagcg 9120 atagagggaa cctcactcga catctgcgca cacacttgcg gggatcccaa ttgtgcgtac 9180 gcggatcctc tgctggagac atgagagctg ccaacctttg gccaagcccg ctcatgatca 9240 aacgctctaa gaagaacagc ctggccttgt ccctgacggc cgaccagatg gtcagtgcct 9300 tgttggatgc tgagcccccc atactctatt ccgagtatga tcctaccaga cccttcagtg 9360 aagcttcgat gatgggctta ctgaccaacc tggcagacag ggagctggtt cacatgatca 9420 actgggcgaa gagggtgcca ggctttgtgg atttgaccct ccatgatcag gtccaccttc 9480 tagaatgtgc ctggctagag atcctgatga ttggtctcgt ctggcgctcc atggagcacc 9540 cagtgaagct actgtttgct cctaacttgc tcttggacag gaaccaggga aaatgtgtag 9600 agggcatggt ggagatcttc gacatgctgc tggctacatc atctcggttc cgcatgatga 9660 atctgcaggg agaggagttt gtgtgcctca aatctattat tttgcttaat tctggagtgt 9720 acacatttct gtccagcacc ctgaagtctc tggaagagaa ggaccatatc caccgagtcc 9780 tggacaagat cacagacact ttgatccacc tgatggccaa ggcaggcctg accctgcagc 9840 agcagcacca gcggctggcc cagctcctcc tcatcctctc ccacatcagg cacatgagta 9900 acaaaggcat ggagcatctg tacagcatga agtgcaagaa cgtggtgccc ctctatgacc 9960 tgctgctgga ggcggcggac gcccaccgcc tacatgcgcc cactagccgt ggaggggcat 10020 ccgtggagga gacggaccaa agccacttgg ccactgcggg ctctacttca tcgcattcct 10080 tgcaaaagta ttacatcacg ggggaggcag agggtttccc tgccacagct taagcggccg 10140 cgactctaga gtcgacctgc aggcatgcaa gcttgatatc aagcttatcg ataatcaacc 10200 tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 10260 gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 10320 cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 10380 tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 10440 cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 10500 ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 10560 tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 10620 tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 10680 ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 10740 ccctcagacg agtcggatct ccctttgggc cgcctccccg cat 10783 <210> 20 <211> 11080 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 20 tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60 acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120 actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180 cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240 tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300 ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360 gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420 cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480 tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540 gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600 tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660 taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720 gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780 gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840 gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900 caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960 cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020 gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080 gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140 aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200 aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260 gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320 aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380 ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440 ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500 ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560 gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620 atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680 aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740 tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800 aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860 tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920 aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980 tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040 cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100 agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160 gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220 tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280 gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340 ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460 cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580 ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700 aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760 gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820 ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880 gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940 agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000 atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060 acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120 agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300 gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420 caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960 cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020 tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080 caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140 gtttggatcg ataagcttga tatcgaattc ctgcagcccc gataaaataa aagattttat 4200 ttagtctcca gaaaaagggg ggaatgaaag accccacctg taggtttggc aagctagctg 4260 cagtaacgcc attttgcaag gcatggaaaa ataccaaacc aagaatagag aagttcagat 4320 caagggcggg tacatgaaaa tagctaacgt tgggccaaac aggatatctg cggtgagcag 4380 tttcggcccc ggcccggggc caagaacaga tggtcaccgc agtttcggcc ccggcccgag 4440 gccaagaaca gatggtcccc agatatggcc caaccctcag cagtttctta agacccatca 4500 gatgtttcca ggctccccca aggacctgaa atgaccctgc gccttatttg aattaaccaa 4560 tcagcctgct tctcgcttct gttcgcgcgc ttctgcttcc cgagctctat aaaagagctc 4620 acaacccctc actcggcgcg ccagtcctcc gacagactga gtcgcccggg ggggatctgg 4680 agctctcgag aattctcacg cgtgccgcca ccatgtctag acccggagag cgcccattcc 4740 agtgtcggat ttgcatgcgg aacttttcga gaagacacgg cctggacaga catacccgta 4800 ctcatacagg tgaaaaaccc tttcagtgtc ggatctgtat gcgaaatttc tccgaccaca 4860 gcagcctgaa gagacatcta cgtacccaca ccggcagcca gaagccattt cagtgtcgga 4920 tctgtatgcg gaacttctcc gtgagacaca acctgaccag acatctacgt acgcacaccg 4980 gagagaagcc attccaatgc cgaatatgca tgcgcaactt cagtgaccac agcaacctga 5040 gcagacacct aaaaacccac accggttccc agaagccatt tcagtgtcgg atctgtatgc 5100 ggaacttctc ccagcgcagc agcctggtga gacatctacg tacgcacacc ggagagaagc 5160 cattccaatg ccgaatatgc atgcgcaact tcagtgagag cggccacctg aagagacacc 5220 tgcgtacgca cctgagggga tccacctgca gggactacaa agaccatgac ggtgattata 5280 aagatcatga catcgattac aaggatgacg atgacaagat ggcccccaag aaaaagagga 5340 aggtgggcat tcacggggtg ccgggtggac tcgagggagg cggtggaagc ggcggtaccg 5400 aggacgtggt gtgctgccac tcaatctacg gcaagaagaa gggtgatatc gacacctacc 5460 gatacatagg ctcttccggg acaggctgcg tggtcatagt gggcaggatc gtcttgtccg 5520 gatccggcac tagtgcgccc atcacggcgt acgcccagca gacgagaggc ctcctagggt 5580 gtataatcac cagcctgact ggccgggaca aaaaccaagt ggagggtgag gtccagatcg 5640 tgtcaactgc tacccaaacc ttcctggcaa cgtgcatcaa tggggtatgc tgggcagtct 5700 accacggggc cggaacgagg accatcgcat cacccaaggg tcctgtcatc cagatgtata 5760 ccaatgtgga ccaagacctt gtgggctggc ccgctcctca aggttcccgc tcattgacac 5820 cctgtacctg cggctcctcg gacctttacc tggtcacgag gcacgccgat gtcattcccg 5880 tgcgccggcg aggtgatagc aggggtagcc tgctttcgcc ccggcccatt tcctacttga 5940 aaggctcctc ggggggtccg ctgttgtgcc ccgcgggaca cgccgtgggc ctattcaggg 6000 ccgcggtgtg cacccgtgga gtggctaaag cggtggactt tatccctgtg gagaacctag 6060 agacaaccat gagatccccg gtgttcacgg acaactcctc tccaccagca gtcaccctga 6120 cgcacccaat caccaaaatc gatagggagg ttctctacca ggagttcgat gagatggaag 6180 agtgctctca gcactatccc tacgatgtgc ccgattacgc tggaggcggt ggaagcggcg 6240 gtaccgatga gtttcccacc atggtgtttc cttctgggca gatcagccag gcctcggcct 6300 tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct gctccagcca 6360 tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca ggccctcctc 6420 aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg ctgtcagagg 6480 ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc aacagcacag 6540 acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag cagctgctga 6600 accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag taccctgagg 6660 ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct gctccactgg 6720 gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc tccattgcgg 6780 acatggactt ctcagccctg ctgagtcaga tcagctccca attgtaagcg gccgcgactc 6840 tagagtcgac ctgcaggcat gcaagcttga tatcaagctt atcgataatc aacctctgga 6900 ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 6960 tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 7020 ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 7080 gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 7140 caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 7200 actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 7260 ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac 7320 ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 7380 tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 7440 gacgagtcgg atctcccttt gggccgcctc cccgcatcga taccgtcgac ctcgagggaa 7500 ttaattcgag ctcggtacct ttaagaccaa tgacttacaa ggcagctgta gatcttagcc 7560 actttttaaa agaaaagggg ggactggaag ggctaattca ctcccaacga agacaagatc 7620 tgctttttgc ttgtactggg tctctctggt tagaccagat ctgagcctgg gagctctctg 7680 gctaactagg gaacccactg cttaagcctc aataaagctt gccttgagtg cttcaagtag 7740 tgtgtgcccg tctgttgtgt gactctggta actagagatc cctcagaccc ttttagtcag 7800 tgtggaaaat ctctagcagc atctagaatt aattccgtgt attctatagt gtcacctaaa 7860 tcgtatgtgt atgatacata aggttatgta ttaattgtag ccgcgttcta acgacaatat 7920 gtacaagcct aattgtgtag catctggctt actgaagcag accctatcat ctctctcgta 7980 aactgccgtc agagtcggtt tggttggacg aaccttctga gtttctggta acgccgtccc 8040 gcacccggaa atggtcagcg aaccaatcag cagggtcatc gctagccaga tcctctacgc 8100 cggacgcatc gtggccggca tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc 8160 cgacatcacc gatggggaag atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg 8220 cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg ggcgccatct ccttgcatgc 8280 accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct gcttcctaat 8340 gcaggagtcg cataagggag agcgtcgaat ggtgcactct cagtacaatc tgctctgatg 8400 ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt 8460 gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc 8520 agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat 8580 ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg 8640 gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 8700 tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 8760 ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 8820 ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 8880 gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 8940 gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg 9000 acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 9060 actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 9120 ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 9180 cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 9240 gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 9300 caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 9360 aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 9420 ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 9480 tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 9540 ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 9600 ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 9660 ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 9720 tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 9780 cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 9840 taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 9900 gcttcagcag agcgcagata ccaaatactg tctttctagt gtagccgtag ttaggccacc 9960 acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 10020 ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 10080 ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 10140 cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 10200 aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 10260 gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 10320 gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 10380 gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 10440 ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 10500 ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 10560 caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tgtggaatgt 10620 gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 10680 gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 10740 tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 10800 cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 10860 tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 10920 cttttttgga ggcctaggct tttgcaaaaa gcttggacac aagacaggct tgcgagatat 10980 gtttgagaat accactttat cccgcgtcag ggagaggcag tgcgtaaaaa gacgcggact 11040 catgtgaaat actggttttt agtgcgccag atctctataa 11080 <210> 21 <211> 10795 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 21 tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60 acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120 actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180 cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240 tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300 ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360 gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420 cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480 tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540 gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600 tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660 taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720 gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780 gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840 gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900 caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960 cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020 gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080 gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140 aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200 aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260 gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320 aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380 ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440 ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500 ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560 gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620 atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680 aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740 tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800 aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860 tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920 aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980 tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040 cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100 agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160 gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220 tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280 gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340 ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460 cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580 ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700 aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760 gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820 ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880 gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940 agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000 atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060 acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120 agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300 gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420 caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960 cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020 tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080 caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140 gtttggatcg ataagcttga tatcgaattc ctgcagcccc gataaaataa aagattttat 4200 ttagtctcca gaaaaagggg ggaatgaaag accccacctg taggtttggc aagctagctg 4260 cagtaacgcc attttgcaag gcatggaaaa ataccaaacc aagaatagag aagttcagat 4320 caagggcggg tacatgaaaa tagctaacgt tgggccaaac aggatatctg cggtgagcag 4380 tttcggcccc ggcccggggc caagaacaga tggtcaccgc agtttcggcc ccggcccgag 4440 gccaagaaca gatggtcccc agatatggcc caaccctcag cagtttctta agacccatca 4500 gatgtttcca ggctccccca aggacctgaa atgaccctgc gccttatttg aattaaccaa 4560 tcagcctgct tctcgcttct gttcgcgcgc ttctgcttcc cgagctctat aaaagagctc 4620 acaacccctc actcggcgcg ccagtcctcc gacagactga gtcgcccggg ggggatctgg 4680 agctctcgag aattctcacg cgtgccgcca ccatggatgc taagtcactg actgcctggt 4740 cccggacact ggtgaccttc aaggatgtgt ttgtggactt caccagggag gagtggaagc 4800 tgctggacac tgctcagcag atcctgtaca gaaatgtgat gctggagaac tataagaacc 4860 tggtttcctt gggttatcag cttactaagc cagatgtgat cctccggttg gagaagggag 4920 aagagccctg gctggtggag agagaaattc accaagagac ccatcctgat tcagagactg 4980 catttgaaat caaatcatca gttacctgca gggactacaa agaccatgac ggtgattata 5040 aagatcatga catcgattac aaggatgacg atgacaagat ggcccccaag aaaaagagga 5100 aggtgggcat tcacggggtg ccgggtggac tcgagggagg cggtggaagc ggcggtaccg 5160 aggacgtggt gtgctgccac tcaatctacg gcaagaagaa gggtgatatc gacacctacc 5220 gatacatagg ctcttccggg acaggctgcg tggtcatagt gggcaggatc gtcttgtccg 5280 gatccggcac tagtgcgccc atcacggcgt acgcccagca gacgagaggc ctcctagggt 5340 gtataatcac cagcctgact ggccgggaca aaaaccaagt ggagggtgag gtccagatcg 5400 tgtcaactgc tacccaaacc ttcctggcaa cgtgcatcaa tggggtatgc tgggcagtct 5460 accacggggc cggaacgagg accatcgcat cacccaaggg tcctgtcatc cagatgtata 5520 ccaatgtgga ccaagacctt gtgggctggc ccgctcctca aggttcccgc tcattgacac 5580 cctgtacctg cggctcctcg gacctttacc tggtcacgag gcacgccgat gtcattcccg 5640 tgcgccggcg aggtgatagc aggggtagcc tgctttcgcc ccggcccatt tcctacttga 5700 aaggctcctc ggggggtccg ctgttgtgcc ccgcgggaca cgccgtgggc ctattcaggg 5760 ccgcggtgtg cacccgtgga gtggctaaag cggtggactt tatccctgtg gagaacctag 5820 agacaaccat gagatccccg gtgttcacgg acaactcctc tccaccagca gtcaccctga 5880 cgcacccaat caccaaaatc gatagggagg ttctctacca ggagttcgat gagatggaag 5940 agtgctctca gcactatccc tacgatgtgc ccgattacgc tggaggcggt ggaagcggcg 6000 gtacctctag acccggagag cgcccattcc agtgtcggat ttgcatgcgg aacttttcga 6060 gaagacacgg cctggacaga catacccgta ctcatacagg tgaaaaaccc tttcagtgtc 6120 ggatctgtat gcgaaatttc tccgaccaca gcagcctgaa gagacatcta cgtacccaca 6180 ccggcagcca gaagccattt cagtgtcgga tctgtatgcg gaacttctcc gtgagacaca 6240 acctgaccag acatctacgt acgcacaccg gagagaagcc attccaatgc cgaatatgca 6300 tgcgcaactt cagtgaccac agcaacctga gcagacacct aaaaacccac accggttccc 6360 agaagccatt tcagtgtcgg atctgtatgc ggaacttctc ccagcgcagc agcctggtga 6420 gacatctacg tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact 6480 tcagtgagag cggccacctg aagagacacc tgcgtacgca cctgagggga tcccaattgt 6540 aagcggccgc gactctagag tcgacctgca ggcatgcaag cttgatatca agcttatcga 6600 taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6660 tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6720 tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6780 gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6840 tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 6900 tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 6960 gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7020 cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7080 caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7140 tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgataccg 7200 tcgacctcga gggaattaat tcgagctcgg tacctttaag accaatgact tacaaggcag 7260 ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta attcactccc 7320 aacgaagaca agatctgctt tttgcttgta ctgggtctct ctggttagac cagatctgag 7380 cctgggagct ctctggctaa ctagggaacc cactgcttaa gcctcaataa agcttgcctt 7440 gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc tggtaactag agatccctca 7500 gaccctttta gtcagtgtgg aaaatctcta gcagcatcta gaattaattc cgtgtattct 7560 atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 7620 ttctaacgac aatatgtaca agcctaattg tgtagcatct ggcttactga agcagaccct 7680 atcatctctc tcgtaaactg ccgtcagagt cggtttggtt ggacgaacct tctgagtttc 7740 tggtaacgcc gtcccgcacc cggaaatggt cagcgaacca atcagcaggg tcatcgctag 7800 ccagatcctc tacgccggac gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc 7860 tggcgcctat atcgccgaca tcaccgatgg ggaagatcgg gctcgccact tcgggctcat 7920 gagcgcttgt ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc 7980 catctccttg catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact 8040 gggctgcttc ctaatgcagg agtcgcataa gggagagcgt cgaatggtgc actctcagta 8100 caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 8160 cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 8220 ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 8280 tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag 8340 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 8400 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 8460 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 8520 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 8580 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 8640 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 8700 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 8760 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 8820 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 8880 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 8940 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 9000 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 9060 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 9120 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 9180 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 9240 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 9300 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 9360 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 9420 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 9480 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 9540 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 9600 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcttt ctagtgtagc 9660 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 9720 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 9780 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 9840 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 9900 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 9960 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 10020 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 10080 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 10140 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 10200 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 10260 aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 10320 gcagctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 10380 aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 10440 cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 10500 cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 10560 ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 10620 gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gacacaagac 10680 aggcttgcga gatatgtttg agaataccac tttatcccgc gtcagggaga ggcagtgcgt 10740 aaaaagacgc ggactcatgt gaaatactgg tttttagtgc gccagatctc tataa 10795 <210> 22 <211> 11962 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 22 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgtc tagaccaggc gaacgaccgt 8340 ttcaatgccg gatatgtatg aggaacttct cccagaggtc cagcttggta cggcacaccc 8400 gaacacatac aggagaaaag ccattccaat gtcgaatttg tatgcgcaat ttttcagaca 8460 agtctgtgtt ggctcgacac ctccgcacac atactggttc acagaagccc tttcagtgca 8520 ggatttgtat gcgcaacttt agccaacgct catccctggt aaggcacact agaacgcata 8580 caggtgagaa gcctttccag tgtcgcatct gtatgcggaa cttcagccag cggaataact 8640 tgggcaggca tttgcgaact cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta 8700 tgcgcaactt cagcacccac gccgtattga cacgacacac gcgcacgcac accggggaaa 8760 aaccgtttca atgtcgaatc tgcatgcgca attttagcga tagagggaac ctcactcgac 8820 atctgcgcac acacttgcgg ggatccacct gcagggatga gtttcccacc atggtgtttc 8880 cttctgggca gatcagccag gcctcggcct tggccccggc ccctccccaa gtcctgcccc 8940 aggctccagc ccctgcccct gctccagcca tggtatcagc tctggcccag gccccagccc 9000 ctgtcccagt cctagcccca ggccctcctc aggctgtggc cccacctgcc cccaagccca 9060 cccaggctgg ggaaggaacg ctgtcagagg ccctgctgca gctgcagttt gatgatgaag 9120 acctgggggc cttgcttggc aacagcacag acccagctgt gttcacagac ctggcatccg 9180 tcgacaactc cgagtttcag cagctgctga accagggcat acctgtggcc ccccacacaa 9240 ctgagcccat gctgatggag taccctgagg ctataactcg cctagtgaca ggggcccaga 9300 ggccccccga cccagctcct gctccactgg gggccccggg gctccccaat ggcctccttt 9360 caggagatga agacttctcc tccattgcgg acatggactt ctcagccctg ctgagtcaga 9420 tcagctccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9480 ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9540 ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9600 atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9660 gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9720 tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9780 tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9840 ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9900 catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9960 ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 10020 aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 10080 aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 10140 cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 10200 acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 10260 ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 10320 gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10380 ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc ggcgccggca 10440 gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc gggacaggct 10500 ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga ggcctcctag 10560 ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt gaggtccaga 10620 tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta tgctgggcag 10680 tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc atccagatgt 10740 ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc cgctcattga 10800 caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc gatgtcattc 10860 ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc atttcctact 10920 tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg ggcctattca 10980 gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct gtggagaacc 11040 tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca gcagtcaccc 11100 tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg tcggccgacc 11160 tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt 11220 attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg 11280 caattatacc tgacagggag gttctctact aagcggccgc gactctagag tcgacctgca 11340 ggcatgcaag cttgatatca agcttatcga taatcaacct ctggattaca aaatttgtga 11400 aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 11460 aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 11520 atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 11580 gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 11640 cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 11700 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 11760 ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 11820 gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 11880 gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 11940 cctttgggcc gcctccccgc at 11962 <210> 23 <211> 11959 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 23 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgga ttacaaggat gacgacgata 8340 agggctcttc cgggacaggc tccggatccg gcactagtgc gcccatcacg gcgtacgccc 8400 agcagacgag aggcctccta gggtgtataa tcaccagcct gactggccgg gacaaaaacc 8460 aagtggaggg tgaggtccag atcgtgtcaa ctgctaccca aaccttcctg gcaacgtgca 8520 tcaatggggt atgctgggca gtctaccacg gggccggaac gaggaccatc gcatcaccca 8580 agggtcctgt catccagatg tataccaatg tggaccaaga ccttgtgggc tggcccgctc 8640 ctcaaggttc ccgctcattg acaccctgta cctgcggctc ctcggacctt tacctggtca 8700 cgaggcacgc cgatgtcatt cccgtgcgcc ggcgaggtga tagcaggggt agcctgcttt 8760 cgccccggcc catttcctac ttgaaaggct cctcgggggg tccgctgttg tgccccgcgg 8820 gacacgccgt gggcctattc agggccgcgg tgtgcacccg tggagtggct aaagcggtgg 8880 actttatccc tgtggagaac ctagagacaa ccatgagatc cccggtgttc acggacaact 8940 cctctccacc agcagtcacc ctgacgcacc caatcaccaa aatcgatacc aaatacatca 9000 tgacatgcat gtcggccgac ctggaggtcg tcacgagcac ctgggtgctc gttggcggcg 9060 tcctggctgc tctggccgcg tattgcctgt caacaggctg cgtggtcata gtgggcagga 9120 tcgtcttgtc cgggaagccg gcaggcagta gcggaagcag tattatacct gacagggagg 9180 ttctctacca ggagttcgaa gatgtcgtgc catgctcaat gggctcgccc gggtctagac 9240 caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag aggtccagct 9300 tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga atttgtatgc 9360 gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact ggttcacaga 9420 agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc ctggtaaggc 9480 acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg cggaacttca 9540 gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa aaaccttttc 9600 agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga cacacgcgca 9660 cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt agcgatagag 9720 ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg gatgagtttc 9780 ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc ccggcccctc 9840 cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta tcagctctgg 9900 cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct gtggccccac 9960 ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg ctgcagctgc 10020 agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca gctgtgttca 10080 cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag ggcatacctg 10140 tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata actcgcctag 10200 tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc ccggggctcc 10260 ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg gacttctcag 10320 ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct ggagacatga 10380 gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag aacagcctgg 10440 ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag ccccccatac 10500 tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg ggcttactga 10560 ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg gtgccaggct 10620 ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg ctagagatcc 10680 tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg tttgctccta 10740 acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag atcttcgaca 10800 tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag gagtttgtgt 10860 gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc agcaccctga 10920 agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca gacactttga 10980 tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg ctggcccagc 11040 tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag catctgtaca 11100 gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg gcggacgccc 11160 accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg gaccaaagcc 11220 acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac atcacggggg 11280 aggcagaggg tttccctgcc acagcttaag cggccgcgac tctagagtcg acctgcaggc 11340 atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 11400 attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 11460 gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 11520 ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 11580 cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 11640 ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 11700 tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 11760 gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 11820 gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 11880 gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 11940 ttgggccgcc tccccgcat 11959 <210> 24 <211> 11128 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 24 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860 gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920 cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980 agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040 ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100 catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160 accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220 agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280 tgccgccacc atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta 8340 caaggatgac gatgacaaga tggcccccaa gaaaaagagg aaggtgggca ttcacggggt 8400 gccgggtgga ctcgagggag gcggtggaag cggcggtacc gctagctcta gacccggaga 8460 gcgcccattc cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag 8520 acatacccgt actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt 8580 ctccgaccac agcagcctga agagacatct acgtacccac accggcagcc agaagccatt 8640 tcagtgtcgg atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg 8700 tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca 8760 cagcaacctg agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg 8820 gatctgtatg cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac 8880 cggagagaag ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct 8940 gaagagacac ctgcgtacgc acctgagggg atccacctgc agggatgagt ttcccaccat 9000 ggtgtttcct tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt 9060 cctgccccag gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc 9120 cccagcccct gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc 9180 caagcccacc caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga 9240 tgatgaagac ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct 9300 ggcatccgtc gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc 9360 ccacacaact gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg 9420 ggcccagagg ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg 9480 cctcctttca ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct 9540 gagtcagatc agctcccccg gggatgagat ggaagagtgc tctcagcact tacccggcgc 9600 cggcagtagt ggcgatatca tggattacaa ggatgacgac gataagggct cttccgggac 9660 aggctccgga tccggcacta gtgcgcccat cacggcgtac gcccagcaga cgagaggcct 9720 cctagggtgt ataatcacca gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt 9780 ccagatcgtg tcaactgcta cccaaacctt cctggcaacg tgcatcaatg gggtatgctg 9840 ggcagtctac cacggggccg gaacgaggac catcgcatca cccaagggtc ctgtcatcca 9900 gatgtatacc aatgtggacc aagaccttgt gggctggccc gctcctcaag gttcccgctc 9960 attgacaccc tgtacctgcg gctcctcgga cctttacctg gtcacgaggc acgccgatgt 10020 cattcccgtg cgccggcgag gtgatagcag gggtagcctg ctttcgcccc ggcccatttc 10080 ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct 10140 attcagggcc gcggtgtgca cccgtggagt ggctaaagcg gtggacttta tccctgtgga 10200 gaacctagag acaaccatga gatccccggt gttcacggac aactcctctc caccagcagt 10260 caccctgacg cacccaatca ccaaaatcga taccaaatac atcatgacat gcatgtcggc 10320 cgacctggag gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc 10380 cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc aggatcgtct tgtccgggaa 10440 gccggcaatt atacctgaca gggaggttct ctactaaagc ggccgcgact ctagagtcga 10500 cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 10560 ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 10620 tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 10680 gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 10740 cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 10800 tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 10860 cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 10920 gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 10980 gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 11040 cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 11100 gatctccctt tgggccgcct ccccgcat 11128 <210> 25 <211> 11602 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 25 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgct agcagtgtca gtgacatttg 8340 aagatgtggc tgtgctcttt actcgggacg agtggaagaa gctggatctg tctcagagaa 8400 gcctgtaccg tgaggtgatg ctggagaatt acagcaacct ggcctccatg gcaggattcc 8460 tgtttaccaa accaaaggtg atctccctgt tgcagcaagg agaggatccc tgggggggta 8520 gcggcagcgg tagcgcatgc tctagaccag gcgaacgacc gtttcaatgc cggatatgta 8580 tgaggaactt ctcccagagg tccagcttgg tacggcacac ccgaacacat acaggagaaa 8640 agccattcca atgtcgaatt tgtatgcgca atttttcaga caagtctgtg ttggctcgac 8700 acctccgcac acatactggt tcacagaagc cctttcagtg caggatttgt atgcgcaact 8760 ttagccaacg ctcatccctg gtaaggcaca ctagaacgca tacaggtgag aagcctttcc 8820 agtgtcgcat ctgtatgcgg aacttcagcc agcggaataa cttgggcagg catttgcgaa 8880 ctcacaccgg ttctcaaaaa ccttttcagt gccgaatttg tatgcgcaac ttcagcaccc 8940 acgccgtatt gacacgacac acgcgcacgc acaccgggga aaaaccgttt caatgtcgaa 9000 tctgcatgcg caattttagc gatagaggga acctcactcg acatctgcgc acacacttgc 9060 ggggatccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9120 ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9180 ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9240 atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9300 gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9360 tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9420 tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9480 ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9540 catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9600 ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 9660 aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 9720 aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 9780 cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 9840 acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 9900 ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 9960 gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10020 ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc ggcgccggca 10080 gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc gggacaggct 10140 ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga ggcctcctag 10200 ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt gaggtccaga 10260 tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta tgctgggcag 10320 tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc atccagatgt 10380 ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc cgctcattga 10440 caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc gatgtcattc 10500 ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc atttcctact 10560 tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg ggcctattca 10620 gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct gtggagaacc 10680 tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca gcagtcaccc 10740 tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg tcggccgacc 10800 tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt 10860 attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg 10920 caattatacc tgacagggag gttctctact aagcggccgc gactctagag tcgacctgca 10980 ggcatgcaag cttgatatca agcttatcga taatcaacct ctggattaca aaatttgtga 11040 aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 11100 aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 11160 atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 11220 gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 11280 cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 11340 ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 11400 ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 11460 gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 11520 gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 11580 cctttgggcc gcctccccgc at 11602 <210> 26 <211> 11977 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 26 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatggg aaagaaaacc aagcggacag 8340 ctgacagttc ttcttcagag gatgaggagg agtatgtcgt ggagaaggtg ctagacaggc 8400 gcgtggttaa gggacaagtg gaatatctac tgaagtggaa aggcttttct gaggagcaca 8460 atacttggga acctgagaaa aacttggatt gccctgagct aatttctgaa tttatgaaaa 8520 agtataagaa gatgaaggag ggtgaaaata ataaacccag ggagaagtca gaaagtaaca 8580 agaggaaatc caatttctca aacagtgccg atgacatcaa atctaaaaaa aagagagagc 8640 agagcaatga tatcgctcgg ggctttgaga gaggactgga accagaaaag atcattgggg 8700 caacagattc ctgtggtgat ttaatgttcc taatgaaatg gaaagacaca gatgaagctg 8760 acctggttct tgcaaaagaa gctaatgtga aatgtccaca aattgtgata gcattttatg 8820 aagagagact gacatggcat gcatatcctg aggatgcgga aaacaaagag aaagaaacag 8880 caaagagcgg gggtagcggc agcggtagcg catgctctag accaggcgaa cgaccgtttc 8940 aatgccggat atgtatgagg aacttctccc agaggtccag cttggtacgg cacacccgaa 9000 cacatacagg agaaaagcca ttccaatgtc gaatttgtat gcgcaatttt tcagacaagt 9060 ctgtgttggc tcgacacctc cgcacacata ctggttcaca gaagcccttt cagtgcagga 9120 tttgtatgcg caactttagc caacgctcat ccctggtaag gcacactaga acgcatacag 9180 gtgagaagcc tttccagtgt cgcatctgta tgcggaactt cagccagcgg aataacttgg 9240 gcaggcattt gcgaactcac accggttctc aaaaaccttt tcagtgccga atttgtatgc 9300 gcaacttcag cacccacgcc gtattgacac gacacacgcg cacgcacacc ggggaaaaac 9360 cgtttcaatg tcgaatctgc atgcgcaatt ttagcgatag agggaacctc actcgacatc 9420 tgcgcacaca cttgcgggga tcccaattgt gcgtacgcgg atcctctgct ggagacatga 9480 gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag aacagcctgg 9540 ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag ccccccatac 9600 tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg ggcttactga 9660 ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg gtgccaggct 9720 ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg ctagagatcc 9780 tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg tttgctccta 9840 acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag atcttcgaca 9900 tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag gagtttgtgt 9960 gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc agcaccctga 10020 agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca gacactttga 10080 tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg ctggcccagc 10140 tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag catctgtaca 10200 gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg gcggacgccc 10260 accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg gaccaaagcc 10320 acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac atcacggggg 10380 aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc tctcagcact 10440 tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac gataagggct 10500 cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac gcccagcaga 10560 cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa aaccaagtgg 10620 agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg tgcatcaatg 10680 gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca cccaagggtc 10740 ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc gctcctcaag 10800 gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg gtcacgaggc 10860 acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg ctttcgcccc 10920 ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc gcgggacacg 10980 ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg gtggacttta 11040 tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac aactcctctc 11100 caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac atcatgacat 11160 gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg 11220 ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc aggatcgtct 11280 tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaagcg gccgcgactc 11340 tagagtcgac ctgcaggcat gcaagcttga tatcaagctt atcgataatc aacctctgga 11400 ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 11460 tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 11520 ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 11580 gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 11640 caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 11700 actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 11760 ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac 11820 ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 11880 tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 11940 gacgagtcgg atctcccttt gggccgcctc cccgcat 11977 <210> 27 <211> 12727 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 27 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800 tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860 ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920 gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980 cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040 gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100 tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160 caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220 ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280 tggagctctc gagaattctc acgcgtgccg ccaccatgtc cgagagggaa gtgtcgactg 8340 cgccggcggg aacagacatg cccgcggcca agaagcagaa gttgagcagc gacgagaaca 8400 gcaacccgga cctctcggga gacgaaaatg acgatgctgt cagtattgag agtggcacaa 8460 acacagaacg cccggacacg cccacaaata cgccaaatgc accaggaagg aaaagctggg 8520 gaaagggaaa atggaagtca aagaaatgca aatattcttt caaatgtgtg aacagcctca 8580 aggaagatca taaccagcca ttgtttggag ttcagtttaa ctggcacagt aaagaaggag 8640 accctctggt gtttgcaact gtgggaagca acagagtaac cttatacgaa tgccattcac 8700 agggggagat acggttattg cagtcctatg tagatgctga tgcagatgaa aacttttaca 8760 cttgtgcatg gacctatgat agcaacacca gccaccctct attagcagtt gctggatcta 8820 gaggcattat aagaataatt aatcctataa caatgcagtg tataaagcac tatgttggcc 8880 atggaaatgc tatcaatgag ctgaaattcc acccacgaga cccaaacctt ctcctgtcag 8940 taagtaaaga tcatgcttta cggttatgga atatccaaac agacactctt gtggcaatat 9000 tcggaggtgt ggaagggcac agagatgaag ttctgagtgc tgattatgat cttttgggtg 9060 aaaaaataat gtcctgtggt atggatcact ctcttaaact gtggagaatc aactcaaaga 9120 ggatgatgaa tgcaattaag gagtcttatg attataaccc aaacaaaact aacaggccat 9180 ttatttccca gaaaatccac tttcctgact tttctaccag agacatacat aggaattatg 9240 ttgattgtgt gcgatggtta ggcgatttga tactttccaa gtcttgtgaa aatgccattg 9300 tatgctggaa acctggcaaa atggaggatg atatagataa aattaaacct agtgagtcta 9360 atgtgactat tcttgggcga tttgattaca gccagtgtga catttggtac atgaggtttt 9420 ctatggattt ctggcaaaag atgcttgcat tgggcaatca ggttggcaaa ctgtatgttt 9480 gggatttaga agtagaagat cctcataaag ccaaatgcac aacactgacc catcataaat 9540 gtggcgcggc tattcgacaa accagtttca gtagggatag cagcatcctc atagctgtct 9600 gcgatgatgc cagcatttgg cgctgggatc gacttcgagg gggtagcggc agcggtagcg 9660 catgctctag accaggcgaa cgaccgtttc aatgccggat atgtatgagg aacttctccc 9720 agaggtccag cttggtacgg cacacccgaa cacatacagg agaaaagcca ttccaatgtc 9780 gaatttgtat gcgcaatttt tcagacaagt ctgtgttggc tcgacacctc cgcacacata 9840 ctggttcaca gaagcccttt cagtgcagga tttgtatgcg caactttagc caacgctcat 9900 ccctggtaag gcacactaga acgcatacag gtgagaagcc tttccagtgt cgcatctgta 9960 tgcggaactt cagccagcgg aataacttgg gcaggcattt gcgaactcac accggttctc 10020 aaaaaccttt tcagtgccga atttgtatgc gcaacttcag cacccacgcc gtattgacac 10080 gacacacgcg cacgcacacc ggggaaaaac cgtttcaatg tcgaatctgc atgcgcaatt 10140 ttagcgatag agggaacctc actcgacatc tgcgcacaca cttgcgggga tcccaattgt 10200 gcgtacgcgg atcctctgct ggagacatga gagctgccaa cctttggcca agcccgctca 10260 tgatcaaacg ctctaagaag aacagcctgg ccttgtccct gacggccgac cagatggtca 10320 gtgccttgtt ggatgctgag ccccccatac tctattccga gtatgatcct accagaccct 10380 tcagtgaagc ttcgatgatg ggcttactga ccaacctggc agacagggag ctggttcaca 10440 tgatcaactg ggcgaagagg gtgccaggct ttgtggattt gaccctccat gatcaggtcc 10500 accttctaga atgtgcctgg ctagagatcc tgatgattgg tctcgtctgg cgctccatgg 10560 agcacccagt gaagctactg tttgctccta acttgctctt ggacaggaac cagggaaaat 10620 gtgtagaggg catggtggag atcttcgaca tgctgctggc tacatcatct cggttccgca 10680 tgatgaatct gcagggagag gagtttgtgt gcctcaaatc tattattttg cttaattctg 10740 gagtgtacac atttctgtcc agcaccctga agtctctgga agagaaggac catatccacc 10800 gagtcctgga caagatcaca gacactttga tccacctgat ggccaaggca ggcctgaccc 10860 tgcagcagca gcaccagcgg ctggcccagc tcctcctcat cctctcccac atcaggcaca 10920 tgagtaacaa aggcatggag catctgtaca gcatgaagtg caagaacgtg gtgcccctct 10980 atgacctgct gctggaggcg gcggacgccc accgcctaca tgcgcccact agccgtggag 11040 gggcatccgt ggaggagacg gaccaaagcc acttggccac tgcgggctct acttcatcgc 11100 attccttgca aaagtattac atcacggggg aggcagaggg tttccctgcc acagctcccg 11160 gggatgagat ggaagagtgc tctcagcact tacccggcgc cggcagtagt ggcgatatca 11220 tggattacaa ggatgacgac gataagggct cttccgggac aggctccgga tccggcacta 11280 gtgcgcccat cacggcgtac gcccagcaga cgagaggcct cctagggtgt ataatcacca 11340 gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta 11400 cccaaacctt cctggcaacg tgcatcaatg gggtatgctg ggcagtctac cacggggccg 11460 gaacgaggac catcgcatca cccaagggtc ctgtcatcca gatgtatacc aatgtggacc 11520 aagaccttgt gggctggccc gctcctcaag gttcccgctc attgacaccc tgtacctgcg 11580 gctcctcgga cctttacctg gtcacgaggc acgccgatgt cattcccgtg cgccggcgag 11640 gtgatagcag gggtagcctg ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg 11700 ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct attcagggcc gcggtgtgca 11760 cccgtggagt ggctaaagcg gtggacttta tccctgtgga gaacctagag acaaccatga 11820 gatccccggt gttcacggac aactcctctc caccagcagt caccctgacg cacccaatca 11880 ccaaaatcga taccaaatac atcatgacat gcatgtcggc cgacctggag gtcgtcacga 11940 gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag 12000 gctgcgtggt catagtgggc aggatcgtct tgtccgggaa gccggcaatt atacctgaca 12060 gggaggttct ctactaagcg gccgcgactc tagagtcgac ctgcaggcat gcaagcttga 12120 tatcaagctt atcgataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 12180 tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 12240 tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc 12300 tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc 12360 tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt 12420 cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg 12480 gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga aatcatcgtc 12540 ctttccttgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta 12600 cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg 12660 gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt gggccgcctc 12720 cccgcat 12727 <210> 28 <211> 2712 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 28 atgttcgaac ccaagaagaa gagaaaggtg ttcgaaacta gtgtgcccct gtatggcttc 60 acttccattt gtggccgacg gcctgaaatg gaagccgcgg tgtcaaccat accacggttt 120 ctgcagagct catcaggctc catgctggac ggacgctttg atccacagtc tgccgcacat 180 ttctttggag tctacgacgg ccacgggggc agccaggtcg ccaactactg cagggaaagg 240 atgcatttgg cacttgccga agagatcgcc aaagagaagc ccatgttgtg tgatggggat 300 acctggctgg agaagtggaa gaaagcgctt tttaactctt ttctgagagt ggattctgag 360 atagaatctg tcgcacccga gaccgtgggc agcacatccg tcgtagccgt agtgtttccc 420 tcccacatat tcgtcgccaa ctgcggcgac agtcgagccg tcctctgccg aggtaagacc 480 gccctgcctc tgagtgttga ccataagccc gaccgggagg atgaggccgc ccgaatcgag 540 gccgccggtg gaaaagtcat ccaatggaac ggcgcaagag tgttcggcgt gctggcgatg 600 tccaggagca ttggagaccg gtacctgaag cccagcataa tcccagatcc cgaagtgacc 660 gcagtcaaga gggtgaaaga ggacgattgt ctgatcctgg ctagcgatgg cgtatgggac 720 gtgatgactg atgaggaggc gtgtgaaatg gcccgcaagc gaatcctgct gtggcataaa 780 aaaaacgcag tcgcggggga cgcttctctt ctggcagacg aaaggcgcaa agaaggtaaa 840 gacccggctg ctatgagcgc cgccgaatat ctcagtaagc tggcaattca gcgagggtcc 900 aaagacaaca tttccgtggt cgtggtagac ctcaaaggcg gttccggcgg ttctagacca 960 ggcgaacgac cgtttcaatg ccggatatgt atgaggaact tctccgagga ggcaaacttg 1020 aggcgccaca cccgaacaca tacaggagaa aagccattcc aatgtcgaat ttgtatgcgc 1080 aatttttcag atcactcaag cctcaagcga cacctccgca cacatactgg ttcacagaag 1140 ccctttcagt gcaggatttg tatgcgcaac tttagccaat cagcgaacct tttgcggcac 1200 actagaacgc atacaggtga gaagcctttc cagtgtcgca tctgtatgcg gaacttcagc 1260 gaccccagtt cattgaagag gcatttgcga actcacaccg gttctcaaaa accttttcag 1320 tgccgaattt gtatgcgcaa cttcagccaa caaacaaatt tgacgagaca cacgcgcacg 1380 cacaccgggg aaaaaccgtt tcaatgtcga atctgcatgc gcaattttag cgatgcgaca 1440 caacttgtta ggcatctgcg cacacacttg cggggatccc cgaagaaaaa acggaaagtg 1500 acctgcaggg gaagcggagc tactaacttc agcctgctga agcaggctgg agacgtggag 1560 gagaaccctg gacctggtca ccatgatgag tttcccacca tggtgtttcc ttctgggcag 1620 atcagccagg cctcggcctt ggccccggcc cctccccaag tcctgcccca ggctccagcc 1680 cctgcccctg ctccagccat ggtatcagct ctggcccagg ccccagcccc tgtcccagtc 1740 ctagccccag gccctcctca ggctgtggcc ccacctgccc ccaagcccac ccaggctggg 1800 gaaggaacgc tgtcagaggc cctgctgcag ctgcagtttg atgatgaaga cctgggggcc 1860 ttgcttggca acagcacaga cccagctgtg ttcacagacc tggcatccgt cgacaactcc 1920 gagtttcagc agctgctgaa ccagggcata cctgtggccc cccacacaac tgagcccatg 1980 ctgatggagt accctgaggc tataactcgc ctagtgacag gggcccagag gccccccgac 2040 ccagctcctg ctccactggg ggccccgggg ctccccaatg gcctcctttc aggagatgaa 2100 gacttctcct ccattgcgga catggacttc tcagccctgc tgagtcagat cagctccggt 2160 ggtggcagcg gtcaattgac tcaagacgaa ttcacccaac tctcccaatc aatcgccgag 2220 ttccacacgt accaactcgg taacggccgt tgctcatctc tcctagctca gcgaatccac 2280 gcgccgccgg aaacagtatg gtccgtggtg agacgtttcg ataggccaca gatttacaaa 2340 cacttcatca aaagctgtaa cgtgagtgaa gatttcgaga tgcgagtggg atgcacgcgc 2400 gacgtgaacg tgataagtgg attaccggcg aatacgtctc gagagagatt agatctgttg 2460 gacgatgatc ggagagtgac tgggtttagt ataaccggtg gtgaacatag gctgaggaat 2520 tataaatcgg ttacgacggt tcatagattt gagaaagaag aagaagaaga aaggatctgg 2580 accgttgttt tggaatctta tgttgttgat gtaccggaag gtaattcgga ggaagatacg 2640 agattgtttg ctgatacggt tattagattg aatcttcaga aacttgcttc gatcactgaa 2700 gctatgaact aa 2712 <210> 29 <211> 2427 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 29 atgttcgaac ccaagaagaa gagaaaggtg ttcgaaacta gtgtgcccct gtatggcttc 60 acttccattt gtggccgacg gcctgaaatg gaagccgcgg tgtcaaccat accacggttt 120 ctgcagagct catcaggctc catgctggac ggacgctttg atccacagtc tgccgcacat 180 ttctttggag tctacgacgg ccacgggggc agccaggtcg ccaactactg cagggaaagg 240 atgcatttgg cacttgccga agagatcgcc aaagagaagc ccatgttgtg tgatggggat 300 acctggctgg agaagtggaa gaaagcgctt tttaactctt ttctgagagt ggattctgag 360 atagaatctg tcgcacccga gaccgtgggc agcacatccg tcgtagccgt agtgtttccc 420 tcccacatat tcgtcgccaa ctgcggcgac agtcgagccg tcctctgccg aggtaagacc 480 gccctgcctc tgagtgttga ccataagccc gaccgggagg atgaggccgc ccgaatcgag 540 gccgccggtg gaaaagtcat ccaatggaac ggcgcaagag tgttcggcgt gctggcgatg 600 tccaggagca ttggagaccg gtacctgaag cccagcataa tcccagatcc cgaagtgacc 660 gcagtcaaga gggtgaaaga ggacgattgt ctgatcctgg ctagcgatgg cgtatgggac 720 gtgatgactg atgaggaggc gtgtgaaatg gcccgcaagc gaatcctgct gtggcataaa 780 aaaaacgcag tcgcggggga cgcttctctt ctggcagacg aaaggcgcaa agaaggtaaa 840 gacccggctg ctatgagcgc cgccgaatat ctcagtaagc tggcaattca gcgagggtcc 900 aaagacaaca tttccgtggt cgtggtagac ctcaaaggcg gttccggcgg ttctagacca 960 ggcgaacgac cgtttcaatg ccggatatgt atgaggaact tctccgagga ggcaaacttg 1020 aggcgccaca cccgaacaca tacaggagaa aagccattcc aatgtcgaat ttgtatgcgc 1080 aatttttcag atcactcaag cctcaagcga cacctccgca cacatactgg ttcacagaag 1140 ccctttcagt gcaggatttg tatgcgcaac tttagccaat cagcgaacct tttgcggcac 1200 actagaacgc atacaggtga gaagcctttc cagtgtcgca tctgtatgcg gaacttcagc 1260 gaccccagtt cattgaagag gcatttgcga actcacaccg gttctcaaaa accttttcag 1320 tgccgaattt gtatgcgcaa cttcagccaa caaacaaatt tgacgagaca cacgcgcacg 1380 cacaccgggg aaaaaccgtt tcaatgtcga atctgcatgc gcaattttag cgatgcgaca 1440 caacttgtta ggcatctgcg cacacacttg cggggatcca cctgcagggg aagcggagct 1500 actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acctggtcac 1560 catccgaaga aaaaacggaa agtggatgct aagtcactga ctgcctggtc ccggacactg 1620 gtgaccttca aggatgtgtt tgtggacttc accagggagg agtggaagct gctggacact 1680 gctcagcaga tcctgtacag aaatgtgatg ctggagaact ataagaacct ggtttccttg 1740 ggttatcagc ttactaagcc agatgtgatc ctccggttgg agaagggaga agagccctgg 1800 ctggtggaga gagaaattca ccaagagacc catcctgatt cagagactgc atttgaaatc 1860 aaatcatcag ttggtggtgg cagcggtcaa ttgactcaag acgaattcac ccaactctcc 1920 caatcaatcg ccgagttcca cacgtaccaa ctcggtaacg gccgttgctc atctctccta 1980 gctcagcgaa tccacgcgcc gccggaaaca gtatggtccg tggtgagacg tttcgatagg 2040 ccacagattt acaaacactt catcaaaagc tgtaacgtga gtgaagattt cgagatgcga 2100 gtgggatgca cgcgcgacgt gaacgtgata agtggattac cggcgaatac gtctcgagag 2160 agattagatc tgttggacga tgatcggaga gtgactgggt ttagtataac cggtggtgaa 2220 cataggctga ggaattataa atcggttacg acggttcata gatttgagaa agaagaagaa 2280 gaagaaagga tctggaccgt tgttttggaa tcttatgttg ttgatgtacc ggaaggtaat 2340 tcggaggaag atacgagatt gtttgctgat acggttatta gattgaatct tcagaaactt 2400 gcttcgatca ctgaagctat gaactaa 2427 <210> 30 <211> 2079 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 30 atgtctagac caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag 60 aggtccagct tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga 120 atttgtatgc gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact 180 ggttcacaga agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc 240 ctggtaaggc acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg 300 cggaacttca gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa 360 aaaccttttc agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga 420 cacacgcgca cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt 480 agcgatagag ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg 540 gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 600 ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 660 tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 720 gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 780 ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 840 gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 900 ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 960 actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 1020 ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 1080 gacttctcag ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct 1140 ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 1200 aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 1260 ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 1320 ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1380 gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1440 ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1500 tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1560 atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1620 gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1680 agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1740 gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1800 ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1860 catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1920 gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1980 gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 2040 atcacggggg aggcagaggg tttccctgcc acagcttaa 2079 <210> 31 <211> 1818 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 31 atggatgcta agtcactgac tgcctggtcc cggacactgg tgaccttcaa ggatgtgttt 60 gtggacttca ccagggagga gtggaagctg ctggacactg ctcagcagat cctgtacaga 120 aatgtgatgc tggagaacta taagaacctg gtttccttgg gttatcagct tactaagcca 180 gatgtgatcc tccggttgga gaagggagaa gagccctggc tggtggagag agaaattcac 240 caagagaccc atcctgattc agagactgca tttgaaatca aatcatcagt tctcgaggga 300 ggcggtggaa gcggcacctg caggtctaga ccaggcgaac gaccgtttca atgccggata 360 tgtatgagga acttctccca gaggtccagc ttggtacggc acacccgaac acatacagga 420 gaaaagccat tccaatgtcg aatttgtatg cgcaattttt cagacaagtc tgtgttggct 480 cgacacctcc gcacacatac tggttcacag aagccctttc agtgcaggat ttgtatgcgc 540 aactttagcc aacgctcatc cctggtaagg cacactagaa cgcatacagg tgagaagcct 600 ttccagtgtc gcatctgtat gcggaacttc agccagcgga ataacttggg caggcatttg 660 cgaactcaca ccggttctca aaaacctttt cagtgccgaa tttgtatgcg caacttcagc 720 acccacgccg tattgacacg acacacgcgc acgcacaccg gggaaaaacc gtttcaatgt 780 cgaatctgca tgcgcaattt tagcgataga gggaacctca ctcgacatct gcgcacacac 840 ttgcggggat cccaattgtg cgtacgcgga tcctctgctg gagacatgag agctgccaac 900 ctttggccaa gcccgctcat gatcaaacgc tctaagaaga acagcctggc cttgtccctg 960 acggccgacc agatggtcag tgccttgttg gatgctgagc cccccatact ctattccgag 1020 tatgatccta ccagaccctt cagtgaagct tcgatgatgg gcttactgac caacctggca 1080 gacagggagc tggttcacat gatcaactgg gcgaagaggg tgccaggctt tgtggatttg 1140 accctccatg atcaggtcca ccttctagaa tgtgcctggc tagagatcct gatgattggt 1200 ctcgtctggc gctccatgga gcacccagtg aagctactgt ttgctcctaa cttgctcttg 1260 gacaggaacc agggaaaatg tgtagagggc atggtggaga tcttcgacat gctgctggct 1320 acatcatctc ggttccgcat gatgaatctg cagggagagg agtttgtgtg cctcaaatct 1380 attattttgc ttaattctgg agtgtacaca tttctgtcca gcaccctgaa gtctctggaa 1440 gagaaggacc atatccaccg agtcctggac aagatcacag acactttgat ccacctgatg 1500 gccaaggcag gcctgaccct gcagcagcag caccagcggc tggcccagct cctcctcatc 1560 ctctcccaca tcaggcacat gagtaacaaa ggcatggagc atctgtacag catgaagtgc 1620 aagaacgtgg tgcccctcta tgacctgctg ctggaggcgg cggacgccca ccgcctacat 1680 gcgcccacta gccgtggagg ggcatccgtg gaggagacgg accaaagcca cttggccact 1740 gcgggctcta cttcatcgca ttccttgcaa aagtattaca tcacggggga ggcagagggt 1800 ttccctgcca cagcttaa 1818 <210> 32 <211> 2115 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 32 atgtctagac ccggagagcg cccattccag tgtcggattt gcatgcggaa cttttcgaga 60 agacacggcc tggacagaca tacccgtact catacaggtg aaaaaccctt tcagtgtcgg 120 atctgtatgc gaaatttctc cgaccacagc agcctgaaga gacatctacg tacccacacc 180 ggcagccaga agccatttca gtgtcggatc tgtatgcgga acttctccgt gagacacaac 240 ctgaccagac atctacgtac gcacaccgga gagaagccat tccaatgccg aatatgcatg 300 cgcaacttca gtgaccacag caacctgagc agacacctaa aaacccacac cggttcccag 360 aagccatttc agtgtcggat ctgtatgcgg aacttctccc agcgcagcag cctggtgaga 420 catctacgta cgcacaccgg agagaagcca ttccaatgcc gaatatgcat gcgcaacttc 480 agtgagagcg gccacctgaa gagacacctg cgtacgcacc tgaggggatc cacctgcagg 540 gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 600 gacaagatgg cccccaagaa aaagaggaag gtgggcattc acggggtgcc gggtggactc 660 gagggaggcg gtggaagcgg cggtaccgag gacgtggtgt gctgccactc aatctacggc 720 aagaagaagg gtgatatcga cacctaccga tacataggct cttccgggac aggctgcgtg 780 gtcatagtgg gcaggatcgt cttgtccgga tccggcacta gtgcgcccat cacggcgtac 840 gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 900 aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 960 tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 1020 cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 1080 gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 1140 gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 1200 ctttcgcccc ggcccatttc ctacttgaaa ggctcctcgg ggggtccgct gttgtgcccc 1260 gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 1320 gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 1380 aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga tagggaggtt 1440 ctctaccagg agttcgatga gatggaagag tgctctcagc actatcccta cgatgtgccc 1500 gattacgctg gaggcggtgg aagcggcggt accgatgagt ttcccaccat ggtgtttcct 1560 tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt cctgccccag 1620 gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc cccagcccct 1680 gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc caagcccacc 1740 caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 1800 ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 1860 gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 1920 gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg ggcccagagg 1980 ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg cctcctttca 2040 ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 2100 agctcccaat tgtaa 2115 <210> 33 <211> 1830 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 33 atggatgcta agtcactgac tgcctggtcc cggacactgg tgaccttcaa ggatgtgttt 60 gtggacttca ccagggagga gtggaagctg ctggacactg ctcagcagat cctgtacaga 120 aatgtgatgc tggagaacta taagaacctg gtttccttgg gttatcagct tactaagcca 180 gatgtgatcc tccggttgga gaagggagaa gagccctggc tggtggagag agaaattcac 240 caagagaccc atcctgattc agagactgca tttgaaatca aatcatcagt tacctgcagg 300 gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 360 gacaagatgg cccccaagaa aaagaggaag gtgggcattc acggggtgcc gggtggactc 420 gagggaggcg gtggaagcgg cggtaccgag gacgtggtgt gctgccactc aatctacggc 480 aagaagaagg gtgatatcga cacctaccga tacataggct cttccgggac aggctgcgtg 540 gtcatagtgg gcaggatcgt cttgtccgga tccggcacta gtgcgcccat cacggcgtac 600 gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 660 aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 720 tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 780 cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 840 gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 900 gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 960 ctttcgcccc ggcccatttc ctacttgaaa ggctcctcgg ggggtccgct gttgtgcccc 1020 gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 1080 gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 1140 aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga tagggaggtt 1200 ctctaccagg agttcgatga gatggaagag tgctctcagc actatcccta cgatgtgccc 1260 gattacgctg gaggcggtgg aagcggcggt acctctagac ccggagagcg cccattccag 1320 tgtcggattt gcatgcggaa cttttcgaga agacacggcc tggacagaca tacccgtact 1380 catacaggtg aaaaaccctt tcagtgtcgg atctgtatgc gaaatttctc cgaccacagc 1440 agcctgaaga gacatctacg tacccacacc ggcagccaga agccatttca gtgtcggatc 1500 tgtatgcgga acttctccgt gagacacaac ctgaccagac atctacgtac gcacaccgga 1560 gagaagccat tccaatgccg aatatgcatg cgcaacttca gtgaccacag caacctgagc 1620 agacacctaa aaacccacac cggttcccag aagccatttc agtgtcggat ctgtatgcgg 1680 aacttctccc agcgcagcag cctggtgaga catctacgta cgcacaccgg agagaagcca 1740 ttccaatgcc gaatatgcat gcgcaacttc agtgagagcg gccacctgaa gagacacctg 1800 cgtacgcacc tgaggggatc ccaattgtaa 1830 <210> 34 <211> 2997 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 34 atgtctagac caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag 60 aggtccagct tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga 120 atttgtatgc gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact 180 ggttcacaga agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc 240 ctggtaaggc acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg 300 cggaacttca gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa 360 aaaccttttc agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga 420 cacacgcgca cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt 480 agcgatagag ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg 540 gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 600 ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 660 tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 720 gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 780 ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 840 gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 900 ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 960 actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 1020 ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 1080 gacttctcag ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct 1140 ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 1200 aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 1260 ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 1320 ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1380 gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1440 ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1500 tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1560 atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1620 gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1680 agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1740 gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1800 ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1860 catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1920 gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1980 gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 2040 atcacggggg aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc 2100 tctcagcact tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac 2160 gataagggct cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac 2220 gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 2280 aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 2340 tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 2400 cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 2460 gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 2520 gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 2580 ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc 2640 gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 2700 gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 2760 aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac 2820 atcatgacat gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc 2880 ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc 2940 aggatcgtct tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaa 2997 <210> 35 <211> 2994 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 35 atggattaca aggatgacga cgataagggc tcttccggga caggctccgg atccggcact 60 agtgcgccca tcacggcgta cgcccagcag acgagaggcc tcctagggtg tataatcacc 120 agcctgactg gccgggacaa aaaccaagtg gagggtgagg tccagatcgt gtcaactgct 180 acccaaacct tcctggcaac gtgcatcaat ggggtatgct gggcagtcta ccacggggcc 240 ggaacgagga ccatcgcatc acccaagggt cctgtcatcc agatgtatac caatgtggac 300 caagaccttg tgggctggcc cgctcctcaa ggttcccgct cattgacacc ctgtacctgc 360 ggctcctcgg acctttacct ggtcacgagg cacgccgatg tcattcccgt gcgccggcga 420 ggtgatagca ggggtagcct gctttcgccc cggcccattt cctacttgaa aggctcctcg 480 gggggtccgc tgttgtgccc cgcgggacac gccgtgggcc tattcagggc cgcggtgtgc 540 acccgtggag tggctaaagc ggtggacttt atccctgtgg agaacctaga gacaaccatg 600 agatccccgg tgttcacgga caactcctct ccaccagcag tcaccctgac gcacccaatc 660 accaaaatcg ataccaaata catcatgaca tgcatgtcgg ccgacctgga ggtcgtcacg 720 agcacctggg tgctcgttgg cggcgtcctg gctgctctgg ccgcgtattg cctgtcaaca 780 ggctgcgtgg tcatagtggg caggatcgtc ttgtccggga agccggcagg cagtagcgga 840 agcagtatta tacctgacag ggaggttctc taccaggagt tcgaagatgt cgtgccatgc 900 tcaatgggct cgcccgggtc tagaccaggc gaacgaccgt ttcaatgccg gatatgtatg 960 aggaacttct cccagaggtc cagcttggta cggcacaccc gaacacatac aggagaaaag 1020 ccattccaat gtcgaatttg tatgcgcaat ttttcagaca agtctgtgtt ggctcgacac 1080 ctccgcacac atactggttc acagaagccc tttcagtgca ggatttgtat gcgcaacttt 1140 agccaacgct catccctggt aaggcacact agaacgcata caggtgagaa gcctttccag 1200 tgtcgcatct gtatgcggaa cttcagccag cggaataact tgggcaggca tttgcgaact 1260 cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta tgcgcaactt cagcacccac 1320 gccgtattga cacgacacac gcgcacgcac accggggaaa aaccgtttca atgtcgaatc 1380 tgcatgcgca attttagcga tagagggaac ctcactcgac atctgcgcac acacttgcgg 1440 ggatccacct gcagggatga gtttcccacc atggtgtttc cttctgggca gatcagccag 1500 gcctcggcct tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct 1560 gctccagcca tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca 1620 ggccctcctc aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg 1680 ctgtcagagg ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc 1740 aacagcacag acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag 1800 cagctgctga accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag 1860 taccctgagg ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct 1920 gctccactgg gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc 1980 tccattgcgg acatggactt ctcagccctg ctgagtcaga tcagctccca attgtgcgta 2040 cgcggatcct ctgctggaga catgagagct gccaaccttt ggccaagccc gctcatgatc 2100 aaacgctcta agaagaacag cctggccttg tccctgacgg ccgaccagat ggtcagtgcc 2160 ttgttggatg ctgagccccc catactctat tccgagtatg atcctaccag acccttcagt 2220 gaagcttcga tgatgggctt actgaccaac ctggcagaca gggagctggt tcacatgatc 2280 aactgggcga agagggtgcc aggctttgtg gatttgaccc tccatgatca ggtccacctt 2340 ctagaatgtg cctggctaga gatcctgatg attggtctcg tctggcgctc catggagcac 2400 ccagtgaagc tactgtttgc tcctaacttg ctcttggaca ggaaccaggg aaaatgtgta 2460 gagggcatgg tggagatctt cgacatgctg ctggctacat catctcggtt ccgcatgatg 2520 aatctgcagg gagaggagtt tgtgtgcctc aaatctatta ttttgcttaa ttctggagtg 2580 tacacatttc tgtccagcac cctgaagtct ctggaagaga aggaccatat ccaccgagtc 2640 ctggacaaga tcacagacac tttgatccac ctgatggcca aggcaggcct gaccctgcag 2700 cagcagcacc agcggctggc ccagctcctc ctcatcctct cccacatcag gcacatgagt 2760 aacaaaggca tggagcatct gtacagcatg aagtgcaaga acgtggtgcc cctctatgac 2820 ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc ccactagccg tggaggggca 2880 tccgtggagg agacggacca aagccacttg gccactgcgg gctctacttc atcgcattcc 2940 ttgcaaaagt attacatcac gggggaggca gagggtttcc ctgccacagc ttaa 2994 <210> 36 <211> 2187 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 36 atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60 gatgacaaga tggcccccaa gaaaaagagg aaggtgggca ttcacggggt gccgggtgga 120 ctcgagggag gcggtggaag cggcggtacc gctagctcta gacccggaga gcgcccattc 180 cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag acatacccgt 240 actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt ctccgaccac 300 agcagcctga agagacatct acgtacccac accggcagcc agaagccatt tcagtgtcgg 360 atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg tacgcacacc 420 ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca cagcaacctg 480 agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg gatctgtatg 540 cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac cggagagaag 600 ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct gaagagacac 660 ctgcgtacgc acctgagggg atccacctgc agggatgagt ttcccaccat ggtgtttcct 720 tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt cctgccccag 780 gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc cccagcccct 840 gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc caagcccacc 900 caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 960 ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 1020 gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 1080 gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg ggcccagagg 1140 ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg cctcctttca 1200 ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 1260 agctcccccg gggatgagat ggaagagtgc tctcagcact tacccggcgc cggcagtagt 1320 ggcgatatca tggattacaa ggatgacgac gataagggct cttccgggac aggctccgga 1380 tccggcacta gtgcgcccat cacggcgtac gcccagcaga cgagaggcct cctagggtgt 1440 ataatcacca gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt ccagatcgtg 1500 tcaactgcta cccaaacctt cctggcaacg tgcatcaatg gggtatgctg ggcagtctac 1560 cacggggccg gaacgaggac catcgcatca cccaagggtc ctgtcatcca gatgtatacc 1620 aatgtggacc aagaccttgt gggctggccc gctcctcaag gttcccgctc attgacaccc 1680 tgtacctgcg gctcctcgga cctttacctg gtcacgaggc acgccgatgt cattcccgtg 1740 cgccggcgag gtgatagcag gggtagcctg ctttcgcccc ggcccatttc ctacttgaaa 1800 ggctcctctg ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct attcagggcc 1860 gcggtgtgca cccgtggagt ggctaaagcg gtggacttta tccctgtgga gaacctagag 1920 acaaccatga gatccccggt gttcacggac aactcctctc caccagcagt caccctgacg 1980 cacccaatca ccaaaatcga taccaaatac atcatgacat gcatgtcggc cgacctggag 2040 gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc cgcgtattgc 2100 ctgtcaacag gctgcgtggt catagtgggc aggatcgtct tgtccgggaa gccggcaatt 2160 atacctgaca gggaggttct ctactaa 2187 <210> 37 <211> 2637 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 37 atgctagcag tgtcagtgac atttgaagat gtggctgtgc tctttactcg ggacgagtgg 60 aagaagctgg atctgtctca gagaagcctg taccgtgagg tgatgctgga gaattacagc 120 aacctggcct ccatggcagg attcctgttt accaaaccaa aggtgatctc cctgttgcag 180 caaggagagg atccctgggg gggtagcggc agcggtagcg catgctctag accaggcgaa 240 cgaccgtttc aatgccggat atgtatgagg aacttctccc agaggtccag cttggtacgg 300 cacacccgaa cacatacagg agaaaagcca ttccaatgtc gaatttgtat gcgcaatttt 360 tcagacaagt ctgtgttggc tcgacacctc cgcacacata ctggttcaca gaagcccttt 420 cagtgcagga tttgtatgcg caactttagc caacgctcat ccctggtaag gcacactaga 480 acgcatacag gtgagaagcc tttccagtgt cgcatctgta tgcggaactt cagccagcgg 540 aataacttgg gcaggcattt gcgaactcac accggttctc aaaaaccttt tcagtgccga 600 atttgtatgc gcaacttcag cacccacgcc gtattgacac gacacacgcg cacgcacacc 660 ggggaaaaac cgtttcaatg tcgaatctgc atgcgcaatt ttagcgatag agggaacctc 720 actcgacatc tgcgcacaca cttgcgggga tcccaattgt gcgtacgcgg atcctctgct 780 ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 840 aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 900 ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 960 ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1020 gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1080 ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1140 tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1200 atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1260 gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1320 agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1380 gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1440 ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1500 catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1560 gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1620 gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 1680 atcacggggg aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc 1740 tctcagcact tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac 1800 gataagggct cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac 1860 gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 1920 aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 1980 tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 2040 cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 2100 gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 2160 gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 2220 ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc 2280 gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 2340 gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 2400 aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac 2460 atcatgacat gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc 2520 ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc 2580 aggatcgtct tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaa 2637 <210> 38 <211> 3012 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 38 atgggaaaga aaaccaagcg gacagctgac agttcttctt cagaggatga ggaggagtat 60 gtcgtggaga aggtgctaga caggcgcgtg gttaagggac aagtggaata tctactgaag 120 tggaaaggct tttctgagga gcacaatact tgggaacctg agaaaaactt ggattgccct 180 gagctaattt ctgaatttat gaaaaagtat aagaagatga aggagggtga aaataataaa 240 cccagggaga agtcagaaag taacaagagg aaatccaatt tctcaaacag tgccgatgac 300 atcaaatcta aaaaaaagag agagcagagc aatgatatcg ctcggggctt tgagagagga 360 ctggaaccag aaaagatcat tggggcaaca gattcctgtg gtgatttaat gttcctaatg 420 aaatggaaag acacagatga agctgacctg gttcttgcaa aagaagctaa tgtgaaatgt 480 ccacaaattg tgatagcatt ttatgaagag agactgacat ggcatgcata tcctgaggat 540 gcggaaaaca aagagaaaga aacagcaaag agcgggggta gcggcagcgg tagcgcatgc 600 tctagaccag gcgaacgacc gtttcaatgc cggatatgta tgaggaactt ctcccagagg 660 tccagcttgg tacggcacac ccgaacacat acaggagaaa agccattcca atgtcgaatt 720 tgtatgcgca atttttcaga caagtctgtg ttggctcgac acctccgcac acatactggt 780 tcacagaagc cctttcagtg caggatttgt atgcgcaact ttagccaacg ctcatccctg 840 gtaaggcaca ctagaacgca tacaggtgag aagcctttcc agtgtcgcat ctgtatgcgg 900 aacttcagcc agcggaataa cttgggcagg catttgcgaa ctcacaccgg ttctcaaaaa 960 ccttttcagt gccgaatttg tatgcgcaac ttcagcaccc acgccgtatt gacacgacac 1020 acgcgcacgc acaccgggga aaaaccgttt caatgtcgaa tctgcatgcg caattttagc 1080 gatagaggga acctcactcg acatctgcgc acacacttgc ggggatccca attgtgcgta 1140 cgcggatcct ctgctggaga catgagagct gccaaccttt ggccaagccc gctcatgatc 1200 aaacgctcta agaagaacag cctggccttg tccctgacgg ccgaccagat ggtcagtgcc 1260 ttgttggatg ctgagccccc catactctat tccgagtatg atcctaccag acccttcagt 1320 gaagcttcga tgatgggctt actgaccaac ctggcagaca gggagctggt tcacatgatc 1380 aactgggcga agagggtgcc aggctttgtg gatttgaccc tccatgatca ggtccacctt 1440 ctagaatgtg cctggctaga gatcctgatg attggtctcg tctggcgctc catggagcac 1500 ccagtgaagc tactgtttgc tcctaacttg ctcttggaca ggaaccaggg aaaatgtgta 1560 gagggcatgg tggagatctt cgacatgctg ctggctacat catctcggtt ccgcatgatg 1620 aatctgcagg gagaggagtt tgtgtgcctc aaatctatta ttttgcttaa ttctggagtg 1680 tacacatttc tgtccagcac cctgaagtct ctggaagaga aggaccatat ccaccgagtc 1740 ctggacaaga tcacagacac tttgatccac ctgatggcca aggcaggcct gaccctgcag 1800 cagcagcacc agcggctggc ccagctcctc ctcatcctct cccacatcag gcacatgagt 1860 aacaaaggca tggagcatct gtacagcatg aagtgcaaga acgtggtgcc cctctatgac 1920 ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc ccactagccg tggaggggca 1980 tccgtggagg agacggacca aagccacttg gccactgcgg gctctacttc atcgcattcc 2040 ttgcaaaagt attacatcac gggggaggca gagggtttcc ctgccacagc tcccggggat 2100 gagatggaag agtgctctca gcacttaccc ggcgccggca gtagtggcga tatcatggat 2160 tacaaggatg acgacgataa gggctcttcc gggacaggct ccggatccgg cactagtgcg 2220 cccatcacgg cgtacgccca gcagacgaga ggcctcctag ggtgtataat caccagcctg 2280 actggccggg acaaaaacca agtggagggt gaggtccaga tcgtgtcaac tgctacccaa 2340 accttcctgg caacgtgcat caatggggta tgctgggcag tctaccacgg ggccggaacg 2400 aggaccatcg catcacccaa gggtcctgtc atccagatgt ataccaatgt ggaccaagac 2460 cttgtgggct ggcccgctcc tcaaggttcc cgctcattga caccctgtac ctgcggctcc 2520 tcggaccttt acctggtcac gaggcacgcc gatgtcattc ccgtgcgccg gcgaggtgat 2580 agcaggggta gcctgctttc gccccggccc atttcctact tgaaaggctc ctctgggggt 2640 ccgctgttgt gccccgcggg acacgccgtg ggcctattca gggccgcggt gtgcacccgt 2700 ggagtggcta aagcggtgga ctttatccct gtggagaacc tagagacaac catgagatcc 2760 ccggtgttca cggacaactc ctctccacca gcagtcaccc tgacgcaccc aatcaccaaa 2820 atcgatacca aatacatcat gacatgcatg tcggccgacc tggaggtcgt cacgagcacc 2880 tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt attgcctgtc aacaggctgc 2940 gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg caattatacc tgacagggag 3000 gttctctact aa 3012 <210> 39 <211> 3762 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 39 atgtccgaga gggaagtgtc gactgcgccg gcgggaacag acatgcccgc ggccaagaag 60 cagaagttga gcagcgacga gaacagcaac ccggacctct cgggagacga aaatgacgat 120 gctgtcagta ttgagagtgg cacaaacaca gaacgcccgg acacgcccac aaatacgcca 180 aatgcaccag gaaggaaaag ctggggaaag ggaaaatgga agtcaaagaa atgcaaatat 240 tctttcaaat gtgtgaacag cctcaaggaa gatcataacc agccattgtt tggagttcag 300 tttaactggc acagtaaaga aggagaccct ctggtgtttg caactgtggg aagcaacaga 360 gtaaccttat acgaatgcca ttcacagggg gagatacggt tattgcagtc ctatgtagat 420 gctgatgcag atgaaaactt ttacacttgt gcatggacct atgatagcaa caccagccac 480 cctctattag cagttgctgg atctagaggc attataagaa taattaatcc tataacaatg 540 cagtgtataa agcactatgt tggccatgga aatgctatca atgagctgaa attccaccca 600 cgagacccaa accttctcct gtcagtaagt aaagatcatg ctttacggtt atggaatatc 660 caaacagaca ctcttgtggc aatattcgga ggtgtggaag ggcacagaga tgaagttctg 720 agtgctgatt atgatctttt gggtgaaaaa ataatgtcct gtggtatgga tcactctctt 780 aaactgtgga gaatcaactc aaagaggatg atgaatgcaa ttaaggagtc ttatgattat 840 aacccaaaca aaactaacag gccatttatt tcccagaaaa tccactttcc tgacttttct 900 accagagaca tacataggaa ttatgttgat tgtgtgcgat ggttaggcga tttgatactt 960 tccaagtctt gtgaaaatgc cattgtatgc tggaaacctg gcaaaatgga ggatgatata 1020 gataaaatta aacctagtga gtctaatgtg actattcttg ggcgatttga ttacagccag 1080 tgtgacattt ggtacatgag gttttctatg gatttctggc aaaagatgct tgcattgggc 1140 aatcaggttg gcaaactgta tgtttgggat ttagaagtag aagatcctca taaagccaaa 1200 tgcacaacac tgacccatca taaatgtggc gcggctattc gacaaaccag tttcagtagg 1260 gatagcagca tcctcatagc tgtctgcgat gatgccagca tttggcgctg ggatcgactt 1320 cgagggggta gcggcagcgg tagcgcatgc tctagaccag gcgaacgacc gtttcaatgc 1380 cggatatgta tgaggaactt ctcccagagg tccagcttgg tacggcacac ccgaacacat 1440 acaggagaaa agccattcca atgtcgaatt tgtatgcgca atttttcaga caagtctgtg 1500 ttggctcgac acctccgcac acatactggt tcacagaagc cctttcagtg caggatttgt 1560 atgcgcaact ttagccaacg ctcatccctg gtaaggcaca ctagaacgca tacaggtgag 1620 aagcctttcc agtgtcgcat ctgtatgcgg aacttcagcc agcggaataa cttgggcagg 1680 catttgcgaa ctcacaccgg ttctcaaaaa ccttttcagt gccgaatttg tatgcgcaac 1740 ttcagcaccc acgccgtatt gacacgacac acgcgcacgc acaccgggga aaaaccgttt 1800 caatgtcgaa tctgcatgcg caattttagc gatagaggga acctcactcg acatctgcgc 1860 acacacttgc ggggatccca attgtgcgta cgcggatcct ctgctggaga catgagagct 1920 gccaaccttt ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg 1980 tccctgacgg ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat 2040 tccgagtatg atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac 2100 ctggcagaca gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg 2160 gatttgaccc tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg 2220 attggtctcg tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg 2280 ctcttggaca ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg 2340 ctggctacat catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc 2400 aaatctatta ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct 2460 ctggaagaga aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac 2520 ctgatggcca aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc 2580 ctcatcctct cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg 2640 aagtgcaaga acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc 2700 ctacatgcgc ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg 2760 gccactgcgg gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca 2820 gagggtttcc ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc 2880 ggcgccggca gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc 2940 gggacaggct ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga 3000 ggcctcctag ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt 3060 gaggtccaga tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta 3120 tgctgggcag tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc 3180 atccagatgt ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc 3240 cgctcattga caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc 3300 gatgtcattc ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc 3360 atttcctact tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg 3420 ggcctattca gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct 3480 gtggagaacc tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca 3540 gcagtcaccc tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg 3600 tcggccgacc tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct 3660 ctggccgcgt attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc 3720 gggaagccgg caattatacc tgacagggag gttctctact aa 3762 <210> 40 <211> 903 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 40 Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro 1 5 10 15 Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala 20 25 30 Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met 35 40 45 Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val 50 55 60 Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg 65 70 75 80 Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu 85 90 95 Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn 100 105 110 Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr 115 120 125 Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe 130 135 140 Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr 145 150 155 160 Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala 165 170 175 Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala 180 185 190 Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr 195 200 205 Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg 210 215 220 Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp 225 230 235 240 Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu 245 250 255 Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala 260 265 270 Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala 275 280 285 Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile 290 295 300 Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro 305 310 315 320 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu 325 330 335 Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 340 345 350 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Ser Leu 355 360 365 Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 370 375 380 Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu Leu Arg His 385 390 395 400 Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 405 410 415 Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu Arg Thr His 420 425 430 Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ala Thr 465 470 475 480 Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser Pro Lys Lys 485 490 495 Lys Arg Lys Val Thr Cys Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu 500 505 510 Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly His His 515 520 525 Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala 530 535 540 Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala 545 550 555 560 Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala 565 570 575 Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro 580 585 590 Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 595 600 605 Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn 610 615 620 Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser 625 630 635 640 Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr 645 650 655 Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val 660 665 670 Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala 675 680 685 Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser 690 695 700 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly 705 710 715 720 Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln 725 730 735 Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser 740 745 750 Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser 755 760 765 Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys 770 775 780 Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg 785 790 795 800 Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg 805 810 815 Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr 820 825 830 Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His 835 840 845 Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu 850 855 860 Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr 865 870 875 880 Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala 885 890 895 Ser Ile Thr Glu Ala Met Asn 900 <210> 41 <211> 808 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 41 Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro 1 5 10 15 Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala 20 25 30 Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met 35 40 45 Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val 50 55 60 Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg 65 70 75 80 Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu 85 90 95 Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn 100 105 110 Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr 115 120 125 Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe 130 135 140 Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr 145 150 155 160 Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala 165 170 175 Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala 180 185 190 Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr 195 200 205 Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg 210 215 220 Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp 225 230 235 240 Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu 245 250 255 Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala 260 265 270 Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala 275 280 285 Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile 290 295 300 Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro 305 310 315 320 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu 325 330 335 Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 340 345 350 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Ser Leu 355 360 365 Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 370 375 380 Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu Leu Arg His 385 390 395 400 Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 405 410 415 Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu Arg Thr His 420 425 430 Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ala Thr 465 470 475 480 Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg 485 490 495 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 500 505 510 Glu Glu Asn Pro Gly Pro Gly His His Pro Lys Lys Lys Arg Lys Val 515 520 525 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 530 535 540 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 545 550 555 560 Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 565 570 575 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 580 585 590 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 595 600 605 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 610 615 620 Gly Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser 625 630 635 640 Gln Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys 645 650 655 Ser Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp 660 665 670 Ser Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile 675 680 685 Lys Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr 690 695 700 Arg Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu 705 710 715 720 Arg Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile 725 730 735 Thr Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val 740 745 750 His Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val 755 760 765 Leu Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp 770 775 780 Thr Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu 785 790 795 800 Ala Ser Ile Thr Glu Ala Met Asn 805 <210> 42 <211> 692 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 42 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp 35 40 45 Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser 65 70 75 80 Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His 100 105 110 Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln 180 185 190 Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro 195 200 205 Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala 210 215 220 Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala 225 230 235 240 Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu 245 250 255 Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala 260 265 270 Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser 275 280 285 Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val 290 295 300 Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile 305 310 315 320 Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala 325 330 335 Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu 340 345 350 Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln 355 360 365 Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg 370 375 380 Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys 385 390 395 400 Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu 405 410 415 Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg 420 425 430 Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp 435 440 445 Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe 450 455 460 Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp 465 470 475 480 Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro 485 490 495 Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly 500 505 510 Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr 515 520 525 Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys 530 535 540 Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser 545 550 555 560 Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu 565 570 575 Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu 580 585 590 Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu 595 600 605 Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser 610 615 620 Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala 625 630 635 640 Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser 645 650 655 Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser 660 665 670 Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe 675 680 685 Pro Ala Thr Ala 690 <210> 43 <211> 605 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 43 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 65 70 75 80 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 85 90 95 Val Leu Glu Gly Gly Gly Gly Ser Gly Thr Cys Arg Ser Arg Pro Gly 100 105 110 Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg 115 120 125 Ser Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe 130 135 140 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala 145 150 155 160 Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg 165 170 175 Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr 180 185 190 Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 195 200 205 Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr 210 215 220 Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 225 230 235 240 Thr His Ala Val Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys 245 250 255 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn 260 265 270 Leu Thr Arg His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val 275 280 285 Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser 290 295 300 Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu 305 310 315 320 Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile 325 330 335 Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met 340 345 350 Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile 355 360 365 Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp 370 375 380 Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly 385 390 395 400 Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro 405 410 415 Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val 420 425 430 Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met 435 440 445 Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu 450 455 460 Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu 465 470 475 480 Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu 485 490 495 Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln 500 505 510 Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser 515 520 525 Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val 530 535 540 Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His 545 550 555 560 Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser 565 570 575 His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr 580 585 590 Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 595 600 605 <210> 44 <211> 704 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 44 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp 35 40 45 His Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn 65 70 75 80 Leu Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His 100 105 110 Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His 180 185 190 Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys 195 200 205 Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly 210 215 220 Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly 225 230 235 240 Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly 245 250 255 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 260 265 270 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 275 280 285 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 290 295 300 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 305 310 315 320 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 325 330 335 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 340 345 350 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 355 360 365 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 370 375 380 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu 385 390 395 400 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 405 410 415 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 420 425 430 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 435 440 445 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 450 455 460 Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val 465 470 475 480 Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro 485 490 495 Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Asp 500 505 510 Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser 515 520 525 Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro 530 535 540 Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro 545 550 555 560 Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala 565 570 575 Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu 580 585 590 Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser 595 600 605 Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu 610 615 620 Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr 625 630 635 640 Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr 645 650 655 Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro 660 665 670 Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile 675 680 685 Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu 690 695 700 <210> 45 <211> 609 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 45 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 65 70 75 80 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 85 90 95 Val Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His 100 105 110 Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys 115 120 125 Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly 130 135 140 Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly 145 150 155 160 Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly 165 170 175 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 180 185 190 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 195 200 205 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 210 215 220 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 225 230 235 240 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 245 250 255 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 260 265 270 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 275 280 285 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 290 295 300 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu 305 310 315 320 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 325 330 335 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 340 345 350 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 355 360 365 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 370 375 380 Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val 385 390 395 400 Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro 405 410 415 Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Ser 420 425 430 Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 435 440 445 Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly Glu 450 455 460 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser 465 470 475 480 Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe 485 490 495 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu Thr 500 505 510 Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile 515 520 525 Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu Lys 530 535 540 Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 545 550 555 560 Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His Thr 565 570 575 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu 580 585 590 Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser Gln 595 600 605 Leu <210> 46 <211> 998 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 46 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp 35 40 45 Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser 65 70 75 80 Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His 100 105 110 Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln 180 185 190 Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro 195 200 205 Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala 210 215 220 Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala 225 230 235 240 Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu 245 250 255 Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala 260 265 270 Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser 275 280 285 Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val 290 295 300 Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile 305 310 315 320 Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala 325 330 335 Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu 340 345 350 Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln 355 360 365 Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg 370 375 380 Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys 385 390 395 400 Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu 405 410 415 Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg 420 425 430 Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp 435 440 445 Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe 450 455 460 Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp 465 470 475 480 Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro 485 490 495 Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly 500 505 510 Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr 515 520 525 Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys 530 535 540 Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser 545 550 555 560 Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu 565 570 575 Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu 580 585 590 Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu 595 600 605 Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser 610 615 620 Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala 625 630 635 640 Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser 645 650 655 Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser 660 665 670 Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe 675 680 685 Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu 690 695 700 Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp 705 710 715 720 Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro 725 730 735 Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile 740 745 750 Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln 755 760 765 Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly 770 775 780 Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser 785 790 795 800 Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu 805 810 815 Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr 820 825 830 Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile 835 840 845 Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg 850 855 860 Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro 865 870 875 880 Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly 885 890 895 Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr 900 905 910 Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr 915 920 925 Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys 930 935 940 Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly 945 950 955 960 Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val 965 970 975 Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro 980 985 990 Asp Arg Glu Val Leu Tyr 995 <210> 47 <211> 997 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 47 Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser 1 5 10 15 Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg 20 25 30 Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn 35 40 45 Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe 50 55 60 Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala 65 70 75 80 Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr 85 90 95 Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser 100 105 110 Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val 115 120 125 Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg 130 135 140 Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser 145 150 155 160 Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg 165 170 175 Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro 180 185 190 Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn 195 200 205 Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp 210 215 220 Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr 225 230 235 240 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 245 250 255 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 260 265 270 Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu 275 280 285 Val Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 290 295 300 Pro Gly Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met 305 310 315 320 Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His 325 330 335 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 340 345 350 Asp Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln 355 360 365 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser 370 375 380 Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln 385 390 395 400 Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg 405 410 415 His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 420 425 430 Cys Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg 435 440 445 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 450 455 460 Phe Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg 465 470 475 480 Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly 485 490 495 Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu 500 505 510 Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu 515 520 525 Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln 530 535 540 Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr 545 550 555 560 Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly 565 570 575 Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala 580 585 590 Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro 595 600 605 Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala 610 615 620 Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro 625 630 635 640 Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp 645 650 655 Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser 660 665 670 Gln Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met 675 680 685 Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys 690 695 700 Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala 705 710 715 720 Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr 725 730 735 Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala 740 745 750 Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly 755 760 765 Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala 770 775 780 Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His 785 790 795 800 Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln 805 810 815 Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala 820 825 830 Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val 835 840 845 Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu 850 855 860 Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val 865 870 875 880 Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly 885 890 895 Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile 900 905 910 Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr 915 920 925 Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu 930 935 940 Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala 945 950 955 960 Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr 965 970 975 Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly 980 985 990 Phe Pro Ala Thr Ala 995 <210> 48 <211> 728 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 48 Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp 1 5 10 15 Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val 20 25 30 Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly Gly Ser Gly 35 40 45 Gly Thr Ala Ser Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile 50 55 60 Cys Met Arg Asn Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg 65 70 75 80 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 85 90 95 Phe Ser Asp His Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly 100 105 110 Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val 115 120 125 Arg His Asn Leu Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro 130 135 140 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu 145 150 155 160 Ser Arg His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 165 170 175 Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His 180 185 190 Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 195 200 205 Arg Asn Phe Ser Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His 210 215 220 Leu Arg Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro 225 230 235 240 Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln 245 250 255 Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser 260 265 270 Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro 275 280 285 Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu 290 295 300 Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp 305 310 315 320 Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp 325 330 335 Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly 340 345 350 Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro 355 360 365 Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro 370 375 380 Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser 385 390 395 400 Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu 405 410 415 Leu Ser Gln Ile Ser Ser Pro Gly Asp Glu Met Glu Glu Cys Ser Gln 420 425 430 His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp 435 440 445 Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser 450 455 460 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 465 470 475 480 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 485 490 495 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 500 505 510 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 515 520 525 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 530 535 540 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 545 550 555 560 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 565 570 575 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 580 585 590 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 595 600 605 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 610 615 620 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 625 630 635 640 Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala 645 650 655 Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met 660 665 670 Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu 675 680 685 Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly 690 695 700 Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile 705 710 715 720 Ile Pro Asp Arg Glu Val Leu Tyr 725 <210> 49 <211> 878 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 49 Met Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr 1 5 10 15 Arg Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg 20 25 30 Glu Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe 35 40 45 Leu Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp 50 55 60 Pro Trp Gly Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu 65 70 75 80 Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser 85 90 95 Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln 100 105 110 Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala Arg 115 120 125 His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 130 135 140 Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg 145 150 155 160 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 165 170 175 Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr Gly 180 185 190 Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr 195 200 205 His Ala Val Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 210 215 220 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn Leu 225 230 235 240 Thr Arg His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg 245 250 255 Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro 260 265 270 Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr 275 280 285 Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu 290 295 300 Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met 305 310 315 320 Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn 325 330 335 Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln 340 345 350 Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu 355 360 365 Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn 370 375 380 Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu 385 390 395 400 Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn 405 410 415 Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn 420 425 430 Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu 435 440 445 Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile 450 455 460 His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg 465 470 475 480 Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn 485 490 495 Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro 500 505 510 Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala 515 520 525 Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His 530 535 540 Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr 545 550 555 560 Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu 565 570 575 Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp 580 585 590 Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly 595 600 605 Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr 610 615 620 Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys 625 630 635 640 Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr 645 650 655 Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly 660 665 670 Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met 675 680 685 Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly 690 695 700 Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu 705 710 715 720 Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser 725 730 735 Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser 740 745 750 Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe 755 760 765 Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile 770 775 780 Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp 785 790 795 800 Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile 805 810 815 Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val 820 825 830 Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala 835 840 845 Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu 850 855 860 Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 865 870 875 <210> 50 <211> 1003 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 50 Met Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp 1 5 10 15 Glu Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys 20 25 30 Gly Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His 35 40 45 Asn Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser 50 55 60 Glu Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys 65 70 75 80 Pro Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn 85 90 95 Ser Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp 100 105 110 Ile Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly 115 120 125 Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp 130 135 140 Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys 145 150 155 160 Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala 165 170 175 Tyr Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser Gly 180 185 190 Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe 195 200 205 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val 210 215 220 Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile 225 230 235 240 Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala Arg His Leu Arg 245 250 255 Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 260 265 270 Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr 275 280 285 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln 290 295 300 Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr Gly Ser Gln Lys 305 310 315 320 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr His Ala Val 325 330 335 Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 340 345 350 Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn Leu Thr Arg His 355 360 365 Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg Gly Ser Ser 370 375 380 Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile 385 390 395 400 Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln 405 410 415 Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu 420 425 430 Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu 435 440 445 Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys 450 455 460 Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu 465 470 475 480 Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg 485 490 495 Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu 500 505 510 Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp 515 520 525 Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly 530 535 540 Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val 545 550 555 560 Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His 565 570 575 Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met 580 585 590 Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln 595 600 605 Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met 610 615 620 Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp 625 630 635 640 Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser 645 650 655 Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr 660 665 670 Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly 675 680 685 Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu 690 695 700 Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp 705 710 715 720 Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser 725 730 735 Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu 740 745 750 Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val 755 760 765 Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala 770 775 780 Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr 785 790 795 800 Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn 805 810 815 Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser 820 825 830 Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg 835 840 845 His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser 850 855 860 Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly 865 870 875 880 Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala 885 890 895 Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu 900 905 910 Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser 915 920 925 Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys 930 935 940 Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr 945 950 955 960 Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu 965 970 975 Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys 980 985 990 Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 995 1000 <210> 51 <211> 1253 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 51 Met Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro 1 5 10 15 Ala Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp 20 25 30 Leu Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr 35 40 45 Asn Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly 50 55 60 Arg Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr 65 70 75 80 Ser Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu 85 90 95 Phe Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val 100 105 110 Phe Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser 115 120 125 Gln Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp 130 135 140 Glu Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His 145 150 155 160 Pro Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn 165 170 175 Pro Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala 180 185 190 Ile Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser 195 200 205 Val Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr 210 215 220 Leu Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu 225 230 235 240 Ser Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met 245 250 255 Asp His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn 260 265 270 Ala Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro 275 280 285 Phe Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile 290 295 300 His Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu 305 310 315 320 Ser Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met 325 330 335 Glu Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile 340 345 350 Leu Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe 355 360 365 Ser Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly 370 375 380 Lys Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys 385 390 395 400 Cys Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr 405 410 415 Ser Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala 420 425 430 Ser Ile Trp Arg Trp Asp Arg Leu Arg Gly Gly Ser Gly Ser Gly Ser 435 440 445 Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met 450 455 460 Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His 465 470 475 480 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 485 490 495 Asp Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln 500 505 510 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser 515 520 525 Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln 530 535 540 Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg 545 550 555 560 His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile 565 570 575 Cys Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg 580 585 590 Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 595 600 605 Phe Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg 610 615 620 Gly Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala 625 630 635 640 Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn 645 650 655 Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu 660 665 670 Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro 675 680 685 Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg 690 695 700 Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val 705 710 715 720 Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu 725 730 735 Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val 740 745 750 Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys 755 760 765 Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser 770 775 780 Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu 785 790 795 800 Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser 805 810 815 Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp 820 825 830 Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr 835 840 845 Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser 850 855 860 His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met 865 870 875 880 Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala 885 890 895 Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val 900 905 910 Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser 915 920 925 His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro 930 935 940 Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro 945 950 955 960 Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp 965 970 975 Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile 980 985 990 Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr 995 1000 1005 Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln 1010 1015 1020 Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn 1025 1030 1035 Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 1040 1045 1050 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp 1055 1060 1065 Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 1070 1075 1080 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg 1085 1090 1095 His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly 1100 1105 1110 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser 1115 1120 1125 Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe 1130 1135 1140 Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe 1145 1150 1155 Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe 1160 1165 1170 Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile 1175 1180 1185 Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp 1190 1195 1200 Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu 1205 1210 1215 Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile 1220 1225 1230 Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp 1235 1240 1245 Arg Glu Val Leu Tyr 1250 <210> 52 <211> 9439 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 52 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860 gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920 tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980 ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040 cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100 taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160 cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220 cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280 tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340 gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400 cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460 gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520 gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580 gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640 caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700 ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760 cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820 atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880 attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940 gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000 ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060 cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120 ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180 tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240 gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300 gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360 gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420 ttgggccgcc tccccgcat 9439 <210> 53 <211> 9439 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 53 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860 gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920 tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980 ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040 cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100 taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160 cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220 cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280 tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340 gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400 cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460 gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520 gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580 gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640 caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700 ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760 cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820 atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880 attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940 gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000 ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060 cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120 ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180 tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240 gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300 gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360 gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420 ttgggccgcc tccccgcat 9439 <210> 54 <211> 9439 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 54 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860 gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920 tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980 ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040 cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100 taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160 cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220 cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280 tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340 gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400 cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460 gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520 gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580 gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640 caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700 ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760 cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820 atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880 attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940 gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000 ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060 cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120 ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180 tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240 gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300 gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360 gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420 ttgggccgcc tccccgcat 9439 <210> 55 <211> 10091 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 55 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860 gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920 tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040 attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100 tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160 aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220 cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280 taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340 gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400 tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460 tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520 cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580 cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640 aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700 tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760 ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820 ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880 agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940 aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000 tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060 ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120 acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180 tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240 ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300 tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360 tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420 ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480 ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540 gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600 atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660 tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720 ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780 ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840 gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900 cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960 gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020 tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080 cctccccgca t 10091 <210> 56 <211> 10091 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 56 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860 gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920 tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040 attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100 tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160 aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220 cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280 taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340 gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400 tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460 tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520 cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580 cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640 aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700 tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760 ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820 ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880 agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940 aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000 tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060 ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120 acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180 tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240 ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300 tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360 tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420 ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480 ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540 gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600 atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660 tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720 ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780 ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840 gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900 cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960 gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020 tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080 cctccccgca t 10091 <210> 57 <211> 10091 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 57 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860 gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920 tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040 attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100 tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160 aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220 cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280 taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340 gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400 tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460 tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520 cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580 cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640 aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700 tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760 ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820 ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880 agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940 aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000 tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060 ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120 acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180 tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240 ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300 tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360 tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420 ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480 ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540 gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600 atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660 tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720 ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780 ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840 gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900 cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960 gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020 tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080 cctccccgca t 10091 <210> 58 <211> 9868 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 58 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860 gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920 tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040 aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100 gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160 aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220 acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280 tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340 ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400 cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460 cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520 cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580 ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640 cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700 cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760 cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820 ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880 caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940 catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000 gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060 ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120 catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180 ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240 cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300 ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360 tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420 gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480 cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540 tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600 cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660 gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720 gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780 cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840 gatctccctt tgggccgcct ccccgcat 9868 <210> 59 <211> 9868 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 59 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860 gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920 tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040 aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100 gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160 aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220 acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280 tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340 ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400 cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460 cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520 cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580 ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640 cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700 cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760 cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820 ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880 caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940 catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000 gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060 ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120 catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180 ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240 cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300 ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360 tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420 gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480 cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540 tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600 cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660 gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720 gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780 cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840 gatctccctt tgggccgcct ccccgcat 9868 <210> 60 <211> 9868 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 60 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860 gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920 tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980 ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040 aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100 gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160 aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220 acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280 tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340 ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400 cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460 cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520 cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580 ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640 cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700 cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760 cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820 ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880 caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940 catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000 gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060 ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120 catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180 ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240 cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300 ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360 tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420 gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480 cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540 tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600 cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660 gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720 gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780 cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840 gatctccctt tgggccgcct ccccgcat 9868 <210> 61 <211> 11090 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 61 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcgtcgacc gggtttcgta acaatcgcat 7800 gaggattcgc aacgccttcg gcgtagccga tgtcgcgctc ccgtctcagt aaaggtcggc 7860 gtagccgatg tcgcgcaatc ggactgcctt cgtacggcgt agccgatgtc gcgcgtatca 7920 gtcgcctcgg aacggcgtag ccgatgtcgc gcattcgtaa gaggctcact ctcccttaca 7980 cggagtggat aactagtttc gcatattaag gtgacgcgtg tggcctcgaa caccgagcga 8040 ccctgcagcg acccgcttaa ggatccaccg gtcgccacca cacatacaca gaaatggcct 8100 taccagtgac cgccttgctc ctgccgctgg ccttgctgct ccacgccgcc aggccggaca 8160 tccagatgac acagactaca tcctccctgt ctgcctctct gggagacaga gtcaccatca 8220 gttgcagggc aagtcaggac attagtaaat atttaaattg gtatcagcag aaaccagatg 8280 gaactgttaa actcctgatc taccatacat caagattaca ctcaggagtc ccatcaaggt 8340 tcagtggcag tgggtctgga acagattatt ctctcaccat tagcaacctg gagcaagaag 8400 atattgccac ttacttttgc caacagggta atacgcttcc gtacacgttc ggaggcggca 8460 ccaagctgga gatcacaggt ggcggtggct cgggcggtgg tgggtcgggt ggcggcggat 8520 ctgaggtgaa actgcaggag tcaggacctg gcctggtggc gccctcacag agcctgtccg 8580 tcacatgcac tgtctcaggg gtctcattac ccgactatgg tgtaagctgg attcgccagc 8640 ctccacgaaa gggtctggag tggctgggag taatatgggg tagtgaaacc acatactata 8700 attcagctct caaatccaga ctgaccatca tcaaggacaa ctccaagagc caagttttct 8760 taaaaatgaa cagtctgcaa actgatgaca cagccattta ctactgtgcc aaacattatt 8820 actacggtgg tagctatgct atggactact ggggccaagg aacctcagtc accgtctcct 8880 cagaacaaaa actcatctca gaagaagatc tgaatggggc cgcaaccacg acgccagcgc 8940 cgcgaccacc aacaccggcg cccaccatcg cgttgcagcc cctgtccctg cgcccagagg 9000 cgtgccggcc agcggcgggg ggcgcagtgc acacgagggg gctggacttc gcctgtgatt 9060 tttgggtgct ggtggtggtt ggtggagtcc tggcttgcta tagcttgcta gtaacagtgg 9120 cctttattat tttctgggtg aggagtaaga ggagcaggct cctgcacagt gactacatga 9180 acatgactcc ccgccgcccc gggcccaccc gcaagcatta ccagccctat gccccaccac 9240 gcgacttcgc agcctatcgc tccaaacggg gcagaaagaa actcctgtat atattcaaac 9300 aaccatttat gagaccagta caaactactc aagaggaaga tggctgtagc tgccgatttc 9360 cagaagaaga agaaggagga tgtgaactga gagtgaagtt cagcaggagc gcagacgccc 9420 ccgcgtacaa gcagggccag aaccagctct ataacgagct caatctagga cgaagagagg 9480 agtacgatgt tttggacaag agacgtggcc gggaccctga gatgggggga aagccgagaa 9540 ggaagaaccc tcaggaaggc ctgtacaatg aactgcagaa agataagatg gcggaggcct 9600 acagtgagat tgggatgaaa ggcgagcgcc ggaggggcaa ggggcacgat ggcctttacc 9660 agggtctcag tacagccacc aaggacacct acgacgccct tcacatgcag gccctgcccc 9720 ctcgcggcat ggtgagcaag ggcgaggagg ataacatggc catcatcaag gagttcatgc 9780 gcttcaaggt gcacatggag ggctccgtga acggccacga gttcgagatc gagggcgagg 9840 gcgagggccg cccctacgag ggcacccaga ccgccaagct gaaggtgacc aagggtggcc 9900 ccctgccctt cgcctgggac atcctgtccc ctcagttcat gtacggctcc aaggcctacg 9960 tgaagcaccc cgccgacatc cccgactact tgaagctgtc cttccccgag ggcttcaagt 10020 gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac cgtgacccag gactcctccc 10080 tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg caccaacttc ccctccgacg 10140 gccccgtaat gcagaagaag accatgggct gggaggcctc ctccgagcgg atgtaccccg 10200 aggacggcgc cctgaagggc gagatcaagc agaggctgaa gctgaaggac ggcggccact 10260 acgacgctga ggtcaagacc acctacaagg ccaagaagcc cgtgcagctg cccggcgcct 10320 acaacgtcaa catcaagttg gacatcacct cccacaacga ggactacacc atcgtggaac 10380 agtacgaacg cgccgagggc cgccactcca ccggcggcat ggacgagctg tacaagtaaa 10440 gcggccgcga ctctagagtc gacctgcagg catgcaagct tgatatcaag cttatcgata 10500 atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 10560 cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 10620 tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 10680 ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 10740 gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 10800 ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 10860 tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 10920 cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 10980 atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 11040 gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 11090 <210> 62 <211> 10333 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 62 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800 tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860 gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920 tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980 ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040 cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg ggtctcacct cccaactgct 8100 tccccctctg ttcttcctgc tagcatgtgc cggcaacttt gtccacggac acaagtgcga 8160 tatcacctta caggagatca tcaaaacttt gaacagcctc acagagcaga agactctgtg 8220 caccgagttg accgtaacag acatctttgc tgcctccaag aacacaactg agaaggaaac 8280 cttctgcagg gctgcgactg tgctccggca gttctacagc caccatgaga aggacactcg 8340 ctgcctgggt gcgactgcac agcagttcca caggcacaag cagctgatcc gattcctgaa 8400 acggctcgac aggaacctct ggggcctggc gggcttgaat tcctgtcctg tgaaggaagc 8460 caaccagagt acgttggaaa acttcttgga aaggctaaag acgatcatga gagagaaata 8520 ttcaaagtgt tcgagcctcg agggcggcgg agagggcaga ggaagtcttc taacatgcgg 8580 tgacgtggag gagaatcccg gccctaggat gcttctcctg gtgacaagcc ttctgctctg 8640 tgagttacca cacccagcat tcctcctgat cccacgcaaa gtgtgtaacg gaataggtat 8700 tggtgaattt aaagactcac tctccataaa tgctacgaat attaaacact tcaaaaactg 8760 cacctccatc agtggcgatc tccacatcct gccggtggca tttaggggtg actccttcac 8820 acatactcct cctctggatc cacaggaact ggatattctg aaaaccgtaa aggaaatcac 8880 agggtttttg ctgattcagg cttggcctga aaacaggacg gacctccatg cctttgagaa 8940 cctagaaatc atacgcggca ggaccaagca acatggtcag ttttctcttg cagtcgtcag 9000 cctgaacata acatccttgg gattacgctc cctcaaggag ataagtgatg gagatgtgat 9060 aatttcagga aacaaaaatt tgtgctatgc aaatacaata aactggaaaa aactgtttgg 9120 gacctccggt cagaaaacca aaattataag caacagaggt gaaaacagct gcaaggccac 9180 aggccaggtc tgccatgcct tgtgctcccc cgagggctgc tggggcccgg agcccaggga 9240 ctgcgtctct tgccggaatg tcagccgagg cagggaatgc gtggacaagt gcaaccttct 9300 ggagggtgag ccaagggagt ttgtggagaa ctctgagtgc atacagtgcc acccagagtg 9360 cctgcctcag gccatgaaca tcacctgcac aggacgggga ccagacaact gtatccagtg 9420 tgcccactac attgacggcc cccactgcgt caagacctgc ccggcaggag tcatgggaga 9480 aaacaacacc ctggtctgga agtacgcaga cgccggccat gtgtgccacc tgtgccatcc 9540 aaactgcacc tacggatgca ctgggccagg tcttgaaggc tgtccaacga atgggcctaa 9600 gatcccgtcc atcgccactg ggatggtggg ggccctcctc ttgctgctgg tggtggccct 9660 ggggatcggc ctcttcatgt gaagcggccg cgactctaga gtcgacctgc aggcatgcaa 9720 gcttgatatc aagcttatcg ataatcaacc tctggattac aaaatttgtg aaagattgac 9780 tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 9840 gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 9900 gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 9960 gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 10020 gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 10080 ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc 10140 atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 10200 ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 10260 tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 10320 cgcctccccg cat 10333 <210> 63 <211> 9281 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 63 cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60 caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120 tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180 gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240 cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300 atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360 tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420 tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480 cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540 tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600 atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660 gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720 gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780 ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840 ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900 tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960 cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020 cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080 aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140 gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200 aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260 ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320 ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380 agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440 tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500 tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560 ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620 gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680 acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740 tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800 gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860 actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920 aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980 cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040 tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100 cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160 tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220 ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280 ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340 cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400 aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460 agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520 tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580 ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640 cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700 atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760 ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820 tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880 gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940 gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000 cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060 gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120 tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240 ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300 gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360 ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420 ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480 cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540 cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600 taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660 gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720 taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780 tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840 gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900 gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960 gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020 ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080 ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140 ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200 tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260 ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320 tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380 gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440 gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500 cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560 tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620 taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680 atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740 cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800 caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860 tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920 aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980 ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040 ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100 ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340 ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400 caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460 tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520 ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580 atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640 caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700 ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760 tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820 gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880 atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940 ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000 gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060 ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120 tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180 agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240 ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300 caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360 agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420 aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480 ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540 ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600 tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660 aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720 aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780 accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840 agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900 agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960 gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020 catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080 ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140 agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200 agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260 caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320 tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380 gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440 tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500 atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560 cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620 gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680 ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740 ccagtttgga tcgataagct tgatatcgaa ttcgtcgacc gggtttcgta acaatcgcat 7800 gaggattcgc aacgccttcg gcgtagccga tgtcgcgctc ccgtctcagt aaaggtcggc 7860 gtagccgatg tcgcgcaatc ggactgcctt cgtacggcgt agccgatgtc gcgcgtatca 7920 gtcgcctcgg aacggcgtag ccgatgtcgc gcattcgtaa gaggctcact ctcccttaca 7980 cggagtggat aactagtttc gcatattaag gtgacgcgtg tggcctcgaa caccgagcga 8040 ccctgcagcg acccgcttaa ggatccaccg gtcgccacca cacatacaca gaaatgcact 8100 catctgctct cctttgctgt ctcgtgctcc tgactggagt acgcgcgtca cccggtcaag 8160 ggacacaaag cgaaaactcc tgtacgcatt ttccgggcaa cctccctaat atgcttcgcg 8220 acttgcgaga tgcattttcc agggtgaaga ccttcttcca gatgaaggac cagttggata 8280 atcttctcct caaggagtct cttttggagg acttcaaggg ctacctggga tgtcaagccc 8340 ttagcgaaat gattcagttt tatcttgaag aggtcatgcc gcaagctgag aaccaggacc 8400 ccgacataaa agcccatgtg aactccctcg gcgagaattt gaagacgctg agacttagat 8460 tgagaagatg tcatagattt ctcccatgtg agaataagtc caaggctgtc gagcaggtta 8520 agaatgcttt caataagttg caggaaaaag gaatctataa ggcaatgagc gagtttgaca 8580 tctttattaa ctacattgag gcttatatga ctatgaaaat tagaaactaa agcggccgcg 8640 actctagagt cgacctgcag gcatgcaagc ttgatatcaa gcttatcgat aatcaacctc 8700 tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 8760 tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 8820 ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 8880 tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 8940 ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 9000 cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 9060 acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 9120 ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 9180 accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 9240 ctcagacgag tcggatctcc ctttgggccg cctccccgca t 9281 <210> 64 <211> 11931 <212> DNA <213> Artificial Sequence <220> <223> synthetic vector <400> 64 tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60 acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120 actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180 cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240 tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300 ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360 gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420 cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480 tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540 gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600 tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660 taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720 gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780 gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840 gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900 caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960 cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020 gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080 gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140 aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200 aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260 gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320 aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380 ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440 ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500 ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560 gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620 atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680 aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740 tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800 aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860 tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920 aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980 tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040 cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100 agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160 gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220 tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280 gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340 ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400 tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460 cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520 gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580 ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640 ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700 aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760 gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820 ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880 gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940 agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000 atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060 acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120 agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180 attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240 gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300 gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360 caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420 caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480 gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540 tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600 gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660 gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720 aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780 ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840 ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900 gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960 cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020 tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080 caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140 gtttggatcg ataagcttga tatcgaattc ctgcagcctt agtttctaat tttcatagtc 4200 atataagcct caatgtagtt aataaagatg tcaaactcgc tcattgcctt atagattcct 4260 ttttcctgca acttattgaa agcattctta acctgctcga cagccttgga cttattctca 4320 catgggagaa atctatgaca tcttctcaat ctaagtctca gcgtcttcaa attctcgccg 4380 agggagttca catgggcttt tatgtcgggg tcctggttct cagcttgcgg catgacctct 4440 tcaagataaa actgaatcat ttcgctaagg gcttgacatc ccaggtagcc cttgaagtcc 4500 tccaaaagag actccttgag gagaagatta tccaactggt ccttcatctg gaagaaggtc 4560 ttcaccctgg aaaatgcatc tcgcaagtcg cgaagcatat tagggaggtt gcccggaaaa 4620 tgcgtacagg agttttcgct ttgtgtccct tgaccgggtg acgcgcgtac tccagtcagg 4680 agcacgagac agcaaaggag agcagatgag tgcatttctg tgtatgtgtg gtggcgaccg 4740 gtggatcctt aagcgggtcg ctgcagggtc gctcggtgtt cgaggccaca cgcgtcacct 4800 taatatgcga aactagttat ccactccgtg taagggagag tgagcctctt acgaatgcgc 4860 gacatcggct acgccgttcc gaggcgactg atacgcgcga catcggctac gccgtacgaa 4920 ggcagtccga ttgcgcgaca tcggctacgc cgacctttac tgagacggga gcgcgacatc 4980 ggctacgccg aaggcgttgc gaatcctcat gcgattgtta cgaaacccgc cgataaaata 5040 aaagatttta tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg 5100 caagctagct gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga 5160 gaagttcaga tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct 5220 gcggtgagca gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc 5280 cccggcccga ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt 5340 aagacccatc agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt 5400 gaattaacca atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta 5460 taaaagagct cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg 5520 gggggatctg gagctctcga gaattctcac gcgtgccgcc accatgtcta gacccggaga 5580 gcgcccattc cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag 5640 acatacccgt actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt 5700 ctccgaccac agcagcctga agagacatct acgtacccac accggcagcc agaagccatt 5760 tcagtgtcgg atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg 5820 tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca 5880 cagcaacctg agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg 5940 gatctgtatg cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac 6000 cggagagaag ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct 6060 gaagagacac ctgcgtacgc acctgagggg atccacctgc agggactaca aagaccatga 6120 cggtgattat aaagatcatg acatcgatta caaggatgac gatgacaaga tggcccccaa 6180 gaaaaagagg aaggtgggca ttcacggggt gccgggtgga ctcgagggag gcggtggaag 6240 cggcggtacc gaggacgtgg tgtgctgcca ctcaatctac ggcaagaaga agggtgatat 6300 cgacacctac cgatacatag gctcttccgg gacaggctgc gtggtcatag tgggcaggat 6360 cgtcttgtcc ggatccggca ctagtgcgcc catcacggcg tacgcccagc agacgagagg 6420 cctcctaggg tgtataatca ccagcctgac tggccgggac aaaaaccaag tggagggtga 6480 ggtccagatc gtgtcaactg ctacccaaac cttcctggca acgtgcatca atggggtatg 6540 ctgggcagtc taccacgggg ccggaacgag gaccatcgca tcacccaagg gtcctgtcat 6600 ccagatgtat accaatgtgg accaagacct tgtgggctgg cccgctcctc aaggttcccg 6660 ctcattgaca ccctgtacct gcggctcctc ggacctttac ctggtcacga ggcacgccga 6720 tgtcattccc gtgcgccggc gaggtgatag caggggtagc ctgctttcgc cccggcccat 6780 ttcctacttg aaaggctcct cggggggtcc gctgttgtgc cccgcgggac acgccgtggg 6840 cctattcagg gccgcggtgt gcacccgtgg agtggctaaa gcggtggact ttatccctgt 6900 ggagaaccta gagacaacca tgagatcccc ggtgttcacg gacaactcct ctccaccagc 6960 agtcaccctg acgcacccaa tcaccaaaat cgatagggag gttctctacc aggagttcga 7020 tgagatggaa gagtgctctc agcactatcc ctacgatgtg cccgattacg ctggaggcgg 7080 tggaagcggc ggtaccgatg agtttcccac catggtgttt ccttctgggc agatcagcca 7140 ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag cccctgcccc 7200 tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag tcctagcccc 7260 aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg gggaaggaac 7320 gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg ccttgcttgg 7380 caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact ccgagtttca 7440 gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 7500 gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 7560 tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 7620 ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc aattgtaagc 7680 ggccgcgact ctagagtcga cctgcaggca tgcaagcttg atatcaagct tatcgataat 7740 caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 7800 tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 7860 gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 7920 cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 7980 tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 8040 gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 8100 ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc 8160 tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 8220 ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc 8280 cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg ataccgtcga 8340 cctcgaggga attaattcga gctcggtacc tttaagacca atgacttaca aggcagctgt 8400 agatcttagc cactttttaa aagaaaaggg gggactggaa gggctaattc actcccaacg 8460 aagacaagat ctgctttttg cttgtactgg gtctctctgg ttagaccaga tctgagcctg 8520 ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 8580 gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 8640 cttttagtca gtgtggaaaa tctctagcag catctagaat taattccgtg tattctatag 8700 tgtcacctaa atcgtatgtg tatgatacat aaggttatgt attaattgta gccgcgttct 8760 aacgacaata tgtacaagcc taattgtgta gcatctggct tactgaagca gaccctatca 8820 tctctctcgt aaactgccgt cagagtcggt ttggttggac gaaccttctg agtttctggt 8880 aacgccgtcc cgcacccgga aatggtcagc gaaccaatca gcagggtcat cgctagccag 8940 atcctctacg ccggacgcat cgtggccggc atcaccggcg ccacaggtgc ggttgctggc 9000 gcctatatcg ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc 9060 gcttgtttcg gcgtgggtat ggtggcaggc cccgtggccg ggggactgtt gggcgccatc 9120 tccttgcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc 9180 tgcttcctaa tgcaggagtc gcataaggga gagcgtcgaa tggtgcactc tcagtacaat 9240 ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 9300 ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 9360 ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt 9420 gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 9480 cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 9540 tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 9600 gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 9660 tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 9720 tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 9780 ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 9840 atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 9900 cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 9960 attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 10020 gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 10080 ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 10140 gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 10200 agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 10260 gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 10320 gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 10380 ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 10440 tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 10500 tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 10560 catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 10620 gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 10680 aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 10740 gaaggtaact ggcttcagca gagcgcagat accaaatact gtctttctag tgtagccgta 10800 gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 10860 gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 10920 atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 10980 cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 11040 cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 11100 agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 11160 tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 11220 gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 11280 catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 11340 agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 11400 ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 11460 ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 11520 atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 11580 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 11640 actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 11700 ctaatttttt ttatttatgc agaggccgag gccgcctcgg cctctgagct attccagaag 11760 tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agcttggaca caagacaggc 11820 ttgcgagata tgtttgagaa taccacttta tcccgcgtca gggagaggca gtgcgtaaaa 11880 agacgcggac tcatgtgaaa tactggtttt tagtgcgcca gatctctata a 11931 <210> 65 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 65 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 66 <211> 298 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 66 Val Pro Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met 1 5 10 15 Glu Ala Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly 20 25 30 Ser Met Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe 35 40 45 Gly Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg 50 55 60 Glu Arg Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro 65 70 75 80 Met Leu Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu 85 90 95 Phe Asn Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro 100 105 110 Glu Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His 115 120 125 Ile Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly 130 135 140 Lys Thr Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp 145 150 155 160 Glu Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn 165 170 175 Gly Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp 180 185 190 Arg Tyr Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val 195 200 205 Lys Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val 210 215 220 Trp Asp Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg 225 230 235 240 Ile Leu Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu 245 250 255 Leu Ala Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser 260 265 270 Ala Ala Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp 275 280 285 Asn Ile Ser Val Val Val Val Asp Leu Lys 290 295 <210> 67 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 67 Gly Gly Ser Gly Gly 1 5 <210> 68 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 68 Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val 1 5 10 15 Glu Glu Asn Pro Gly Pro 20 <210> 69 <211> 191 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 69 Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala 1 5 10 15 Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala 20 25 30 Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala 35 40 45 Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro 50 55 60 Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 65 70 75 80 Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn 85 90 95 Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser 100 105 110 Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr 115 120 125 Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val 130 135 140 Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala 145 150 155 160 Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser 165 170 175 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser 180 185 190 <210> 70 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 70 Gly Gly Gly Ser Gly 1 5 <210> 71 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 71 Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu Phe His 1 5 10 15 Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala Gln Arg 20 25 30 Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg Phe Asp 35 40 45 Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val Ser Glu 50 55 60 Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val Ile Ser 65 70 75 80 Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu Asp Asp 85 90 95 Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His Arg Leu 100 105 110 Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys Glu Glu 115 120 125 Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val Val Asp 130 135 140 Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala Asp Thr 145 150 155 160 Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu Ala Met 165 170 175 Asn <210> 72 <211> 96 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 72 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 1 5 10 15 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 20 25 30 Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 35 40 45 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 50 55 60 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 65 70 75 80 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 85 90 95 <210> 73 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 73 Cys Val Arg Gly Ser 1 5 <210> 74 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 74 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 75 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 75 Gly Gly Gly Gly Ser Gly 1 5 <210> 76 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (19)..(25) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (47)..(53) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (76)..(82) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (104)..(110) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (133)..(139) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (161)..(167) <223> Xaa can be any naturally occurring amino acid <400> 76 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 65 70 75 80 Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 100 105 110 Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 77 <211> 39 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 77 Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr 1 5 10 15 Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val Gly 20 25 30 Ile His Gly Val Pro Gly Gly 35 <210> 78 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 78 Glu Asp Val Val Cys Cys His Ser Ile Tyr 1 5 10 <210> 79 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 79 His Ser Ile Tyr Gly Lys Lys Lys 1 5 <210> 80 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 80 Asp Thr Tyr Arg Tyr Ile 1 5 <210> 81 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 81 Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 1 5 10 <210> 82 <211> 189 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 82 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser 180 185 <210> 83 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 83 Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His 1 5 10 <210> 84 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 84 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 85 <211> 241 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 85 Gly Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser 1 5 10 15 Gly Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser 20 25 30 Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu 35 40 45 Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val 50 55 60 Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala 65 70 75 80 Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr 85 90 95 Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn 100 105 110 Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser 115 120 125 Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg 130 135 140 His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser 145 150 155 160 Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly 165 170 175 Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala 180 185 190 Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu 195 200 205 Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser 210 215 220 Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu 225 230 235 240 Val <210> 86 <211> 304 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 86 Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser 1 5 10 15 Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly 20 25 30 Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln 35 40 45 Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg 50 55 60 Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr 65 70 75 80 Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr 85 90 95 His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile 100 105 110 Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro 115 120 125 Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu 130 135 140 Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly 145 150 155 160 Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys 165 170 175 Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly 180 185 190 Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp 195 200 205 Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe 210 215 220 Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr 225 230 235 240 Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu 245 250 255 Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu 260 265 270 Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile 275 280 285 Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 290 295 300 <210> 87 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 87 Asp Glu Met Glu Glu Cys Ser Gln His Leu 1 5 10 <210> 88 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 88 Pro Gly Ala Gly Ser Ser Gly Asp Ile Met 1 5 10 <210> 89 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 89 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 90 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 90 Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser 1 5 10 <210> 91 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 91 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp 180 185 <210> 92 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 92 Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile 1 5 10 15 Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val 20 25 30 Thr <210> 93 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 93 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 20 25 30 Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 35 40 45 <210> 94 <211> 297 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 94 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu 275 280 285 Asp Val Val Pro Cys Ser Met Gly Ser 290 295 <210> 95 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 95 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val 275 280 285 Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 290 295 300 <210> 96 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 96 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 20 25 30 Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu 35 40 45 Val Leu Tyr 50 <210> 97 <211> 65 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 97 Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr Arg 1 5 10 15 Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg Glu 20 25 30 Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe Leu 35 40 45 Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp Pro 50 55 60 Trp 65 <210> 98 <211> 190 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 98 Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp Glu 1 5 10 15 Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys Gly 20 25 30 Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His Asn 35 40 45 Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser Glu 50 55 60 Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys Pro 65 70 75 80 Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn Ser 85 90 95 Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp Ile 100 105 110 Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly Ala 115 120 125 Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp Thr 130 135 140 Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys Pro 145 150 155 160 Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala Tyr 165 170 175 Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser 180 185 190 <210> 99 <211> 440 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 99 Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro Ala 1 5 10 15 Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp Leu 20 25 30 Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr Asn 35 40 45 Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly Arg 50 55 60 Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr Ser 65 70 75 80 Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu Phe 85 90 95 Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val Phe 100 105 110 Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser Gln 115 120 125 Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp Glu 130 135 140 Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His Pro 145 150 155 160 Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn Pro 165 170 175 Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala Ile 180 185 190 Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser Val 195 200 205 Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr Leu 210 215 220 Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu Ser 225 230 235 240 Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met Asp 245 250 255 His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn Ala 260 265 270 Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro Phe 275 280 285 Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile His 290 295 300 Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu Ser 305 310 315 320 Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met Glu 325 330 335 Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile Leu 340 345 350 Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe Ser 355 360 365 Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly Lys 370 375 380 Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys Cys 385 390 395 400 Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr Ser 405 410 415 Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala Ser 420 425 430 Ile Trp Arg Trp Asp Arg Leu Arg 435 440 <210> 100 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 100 Gly Gly Ser Gly Ser Gly Ser Ala Cys 1 5 <210> 101 <211> 172 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (17)..(23) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (45)..(51) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (74)..(80) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (102)..(108) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (131)..(137) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (159)..(165) <223> Xaa can be any naturally occurring amino acid <400> 101 Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys 20 25 30 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 35 40 45 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln 50 55 60 Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70 75 80 His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys 85 90 95 Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr 100 105 110 His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 115 120 125 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 145 150 155 160 Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg 165 170 <210> 102 <211> 265 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 102 Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly Lys Lys Lys Gly Asp 1 5 10 15 Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly Thr Gly Cys Val Val 20 25 30 Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly Thr Ser Ala Pro Ile 35 40 45 Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr 50 55 60 Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile 65 70 75 80 Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val 85 90 95 Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro 100 105 110 Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val 115 120 125 Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys 130 135 140 Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro 145 150 155 160 Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro 165 170 175 Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala 180 185 190 Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val 195 200 205 Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met 210 215 220 Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu 225 230 235 240 Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val Leu Tyr Gln Glu Phe 245 250 255 Asp Glu Met Glu Glu Cys Ser Gln His 260 265 <210> 103 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 103 Leu Glu Gly Gly Gly Gly Ser Gly Gly 1 5 <210> 104 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 104 Gly Gly Gly Gly Ser Gly Gly Thr 1 5 <210> 105 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 105 Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys 1 5 10 15 <210> 106 <211> 63 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 106 Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val 1 5 10 15 Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala 20 25 30 Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val 35 40 45 Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 50 55 60 <210> 107 <211> 305 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 107 Pro Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu 1 5 10 15 Asp Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser 20 25 30 Met Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly 35 40 45 Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu 50 55 60 Arg Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met 65 70 75 80 Leu Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe 85 90 95 Asn Ser Phe Leu Arg Val Asp Ser Glu Ile Gly Ser Val Ala Pro Glu 100 105 110 Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile 115 120 125 Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys 130 135 140 Thr Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu 145 150 155 160 Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly 165 170 175 Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg 180 185 190 Tyr Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys 195 200 205 Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp 210 215 220 Asp Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile 225 230 235 240 Leu Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu 245 250 255 Ala Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala 260 265 270 Ala Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn 275 280 285 Ile Ser Val Val Val Val Asp Leu Lys Asp Tyr Lys Asp Asp Asp Asp 290 295 300 Lys 305 <210> 108 <211> 188 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 108 Ala Pro Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu 1 5 10 15 Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala 20 25 30 Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg 35 40 45 Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val 50 55 60 Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val 65 70 75 80 Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu 85 90 95 Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His 100 105 110 Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys 115 120 125 Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val 130 135 140 Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala 145 150 155 160 Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu 165 170 175 Ala Met Asn Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 180 185 <210> 109 <211> 109 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 109 Ser Arg Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr 1 5 10 15 Phe Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu 20 25 30 Glu Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe 35 40 45 Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly 50 55 60 Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro 65 70 75 80 Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His 85 90 95 Ala Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu 100 105 <210> 110 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 110 Ile Leu Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg 1 5 10 15 Leu Tyr Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu 20 25 30 Pro Leu His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr 35 40 45 Ser Phe Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp 50 55 60 Cys Arg Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln Ala 65 70 75 80 Trp Asp Leu Tyr Tyr His Val Phe Arg Arg Ile Ser 85 90 <210> 111 <211> 92 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 111 Met Lys Arg Asp His His His His His His Gln Asp Lys Lys Thr Met 1 5 10 15 Met Met Asn Glu Glu Asp Asp Gly Asn Gly Met Asp Glu Leu Leu Ala 20 25 30 Val Leu Gly Tyr Lys Val Arg Ser Ser Glu Met Ala Asp Val Ala Gln 35 40 45 Lys Leu Glu Gln Leu Glu Val Met Met Ser Asn Val Gln Glu Asp Asp 50 55 60 Leu Ser Gln Leu Ala Thr Glu Thr Val His Tyr Asn Pro Ala Glu Leu 65 70 75 80 Tyr Thr Trp Leu Asp Ser Met Leu Thr Asp Leu Asn 85 90 <210> 112 <211> 345 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 112 Met Ala Ala Ser Asp Glu Val Asn Leu Ile Glu Ser Arg Thr Val Val 1 5 10 15 Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Val Ala Tyr Asn 20 25 30 Ile Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Tyr 35 40 45 Leu Asp Arg Lys Val Thr Ala Asn Ala Asn Pro Val Asp Gly Val Phe 50 55 60 Ser Phe Asp Val Leu Ile Asp Arg Arg Ile Asn Leu Leu Ser Arg Val 65 70 75 80 Tyr Arg Pro Ala Tyr Ala Asp Gln Glu Gln Pro Pro Ser Ile Leu Asp 85 90 95 Leu Glu Lys Pro Val Asp Gly Asp Ile Val Pro Val Ile Leu Phe Phe 100 105 110 His Gly Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp 115 120 125 Thr Leu Cys Arg Arg Leu Val Gly Leu Cys Lys Cys Val Val Val Ser 130 135 140 Val Asn Tyr Arg Arg Ala Pro Glu Asn Pro Tyr Pro Cys Ala Tyr Asp 145 150 155 160 Asp Gly Trp Ile Ala Leu Asn Trp Val Asn Ser Arg Ser Trp Leu Lys 165 170 175 Ser Lys Lys Asp Ser Lys Val His Ile Phe Leu Ala Gly Asp Ser Ser 180 185 190 Gly Gly Asn Ile Ala His Asn Val Ala Leu Arg Ala Gly Glu Ser Gly 195 200 205 Ile Asp Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Asn 210 215 220 Glu Arg Thr Glu Ser Glu Lys Ser Leu Asp Gly Lys Tyr Phe Val Thr 225 230 235 240 Val Arg Asp Arg Asp Trp Tyr Trp Lys Ala Phe Leu Pro Glu Gly Glu 245 250 255 Asp Arg Glu His Pro Ala Cys Asn Pro Phe Ser Pro Arg Gly Lys Ser 260 265 270 Leu Glu Gly Val Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu 275 280 285 Asp Leu Ile Arg Asp Trp Gln Leu Ala Tyr Ala Glu Gly Leu Lys Lys 290 295 300 Ala Gly Gln Glu Val Lys Leu Met His Leu Glu Lys Ala Thr Val Gly 305 310 315 320 Phe Tyr Leu Leu Pro Asn Asn Asn His Phe His Asn Val Met Asp Glu 325 330 335 Ile Ser Ala Phe Val Asn Ala Glu Cys 340 345 <210> 113 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 113 His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Asp 1 5 10 15 Gln Ile Gly Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp 20 25 30 Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro 35 40 45 Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn 50 55 60 Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly 65 70 75 80 Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile 85 90 95 Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu 100 105 110 Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr 115 120 125 Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly 130 135 140 Phe Gln Cys Glu Thr Glu 145 150 <210> 114 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 114 His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Arg 1 5 10 15 Gln Ile Arg Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp 20 25 30 Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro 35 40 45 Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn 50 55 60 Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly 65 70 75 80 Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile 85 90 95 Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu 100 105 110 Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr 115 120 125 Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly 130 135 140 Phe Gln Cys Glu Thr Glu 145 150 <210> 115 <211> 171 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 115 Met Asn Gly Ala Ile Gly Gly Asp Leu Leu Leu Asn Phe Pro Asp Met 1 5 10 15 Ser Val Leu Glu Arg Gln Arg Ala His Leu Lys Tyr Leu Asn Pro Thr 20 25 30 Phe Asp Ser Pro Leu Ala Gly Phe Phe Ala Asp Ser Ser Met Ile Thr 35 40 45 Gly Gly Glu Met Asp Ser Tyr Leu Ser Thr Ala Gly Leu Asn Leu Pro 50 55 60 Met Met Tyr Gly Glu Thr Thr Val Glu Gly Asp Ser Arg Leu Ser Ile 65 70 75 80 Ser Pro Glu Thr Thr Leu Gly Thr Gly Asn Phe Lys Lys Arg Lys Phe 85 90 95 Asp Thr Glu Thr Lys Asp Cys Asn Glu Lys Lys Lys Lys Met Thr Met 100 105 110 Asn Arg Asp Asp Leu Val Glu Glu Gly Glu Glu Glu Lys Ser Lys Ile 115 120 125 Thr Glu Gln Asn Asn Gly Ser Thr Lys Ser Ile Lys Lys Met Lys His 130 135 140 Lys Ala Lys Lys Glu Glu Asn Asn Phe Ser Asn Asp Ser Ser Lys Val 145 150 155 160 Thr Lys Glu Leu Glu Lys Thr Asp Tyr Ile His 165 170 <210> 116 <211> 612 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 116 Met Lys Met Asp Lys Lys Thr Ile Val Trp Phe Arg Arg Asp Leu Arg 1 5 10 15 Ile Glu Asp Asn Pro Ala Leu Ala Ala Ala Ala His Glu Gly Ser Val 20 25 30 Phe Pro Val Phe Ile Trp Cys Pro Glu Glu Glu Gly Gln Phe Tyr Pro 35 40 45 Gly Arg Ala Ser Arg Trp Trp Met Lys Gln Ser Leu Ala His Leu Ser 50 55 60 Gln Ser Leu Lys Ala Leu Gly Ser Asp Leu Thr Leu Ile Lys Thr His 65 70 75 80 Asn Thr Ile Ser Ala Ile Leu Asp Cys Ile Arg Val Thr Gly Ala Thr 85 90 95 Lys Val Val Phe Asn His Leu Tyr Asp Pro Val Ser Leu Val Arg Asp 100 105 110 His Thr Val Lys Glu Lys Leu Val Glu Arg Gly Ile Ser Val Gln Ser 115 120 125 Tyr Asn Gly Asp Leu Leu Tyr Glu Pro Trp Glu Ile Tyr Cys Glu Lys 130 135 140 Gly Lys Pro Phe Thr Ser Phe Asn Ser Tyr Trp Lys Lys Cys Leu Asp 145 150 155 160 Met Ser Ile Glu Ser Val Met Leu Pro Pro Pro Trp Arg Leu Met Pro 165 170 175 Ile Thr Ala Ala Ala Glu Ala Ile Trp Ala Cys Ser Ile Glu Glu Leu 180 185 190 Gly Leu Glu Asn Glu Ala Glu Lys Pro Ser Asn Ala Leu Leu Thr Arg 195 200 205 Ala Trp Ser Pro Gly Trp Ser Asn Ala Asp Lys Leu Leu Asn Glu Phe 210 215 220 Ile Glu Lys Gln Leu Ile Asp Tyr Ala Lys Asn Ser Lys Lys Val Val 225 230 235 240 Gly Asn Ser Thr Ser Leu Leu Ser Pro Tyr Leu His Phe Gly Glu Ile 245 250 255 Ser Val Arg His Val Phe Gln Cys Ala Arg Met Lys Gln Ile Ile Trp 260 265 270 Ala Arg Asp Lys Asn Ser Glu Gly Glu Glu Ser Ala Asp Leu Phe Leu 275 280 285 Arg Gly Ile Gly Leu Arg Glu Tyr Ser Arg Tyr Ile Cys Phe Asn Phe 290 295 300 Pro Phe Thr His Glu Gln Ser Leu Leu Ser His Leu Arg Phe Phe Pro 305 310 315 320 Trp Asp Ala Asp Val Asp Lys Phe Lys Ala Trp Arg Gln Gly Arg Thr 325 330 335 Gly Tyr Pro Leu Val Asp Ala Gly Met Arg Glu Leu Trp Ala Thr Gly 340 345 350 Trp Met His Asn Arg Ile Arg Val Ile Val Ser Ser Phe Ala Val Lys 355 360 365 Phe Leu Leu Leu Pro Trp Lys Trp Gly Met Lys Tyr Phe Trp Asp Thr 370 375 380 Leu Leu Asp Ala Asp Leu Glu Cys Asp Ile Leu Gly Trp Gln Tyr Ile 385 390 395 400 Ser Gly Ser Ile Pro Asp Gly His Glu Leu Asp Arg Leu Asp Asn Pro 405 410 415 Ala Leu Gln Gly Ala Lys Tyr Asp Pro Glu Gly Glu Tyr Ile Arg Gln 420 425 430 Trp Leu Pro Glu Leu Ala Arg Leu Pro Thr Glu Trp Ile His His Pro 435 440 445 Trp Asp Ala Pro Leu Thr Val Leu Lys Ala Ser Gly Val Glu Leu Gly 450 455 460 Thr Asn Tyr Ala Lys Pro Ile Val Asp Ile Asp Thr Ala Arg Glu Leu 465 470 475 480 Leu Ala Lys Ala Ile Ser Arg Thr Arg Glu Ala Gln Ile Met Ile Gly 485 490 495 Ala Ala Pro Asp Glu Ile Val Ala Asp Ser Phe Glu Ala Leu Gly Ala 500 505 510 Asn Thr Ile Lys Glu Pro Gly Leu Cys Pro Ser Val Ser Ser Asn Asp 515 520 525 Gln Gln Val Pro Ser Ala Val Arg Tyr Asn Gly Ser Lys Arg Val Lys 530 535 540 Pro Glu Glu Glu Glu Glu Arg Asp Met Lys Lys Ser Arg Gly Phe Asp 545 550 555 560 Glu Arg Glu Leu Phe Ser Thr Ala Glu Ser Ser Ser Ser Ser Ser Val 565 570 575 Phe Phe Val Ser Gln Ser Cys Ser Leu Ala Ser Glu Gly Lys Asn Leu 580 585 590 Glu Gly Ile Gln Asp Ser Ser Asp Gln Ile Thr Thr Ser Leu Gly Lys 595 600 605 Asn Gly Cys Lys 610 <210> 117 <211> 551 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 117 Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala 1 5 10 15 Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met 20 25 30 Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly 35 40 45 Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn 50 55 60 Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp 65 70 75 80 Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg 85 90 95 Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser 100 105 110 Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln 115 120 125 Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Val Pro 130 135 140 Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys 145 150 155 160 Phe Gln Val Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro 165 170 175 Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala 180 185 190 Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly 195 200 205 Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile 210 215 220 Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser 225 230 235 240 Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro 245 250 255 Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu 260 265 270 Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr 275 280 285 Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg 290 295 300 Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly 305 310 315 320 Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg 325 330 335 Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr 340 345 350 Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe 355 360 365 Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro 370 375 380 Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val 385 390 395 400 Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly 405 410 415 Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly 420 425 430 Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu 435 440 445 Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr 450 455 460 Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln 465 470 475 480 Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr 485 490 495 Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp 500 505 510 Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu 515 520 525 Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala 530 535 540 Leu Leu Ser Gln Ile Ser Ser 545 550 <210> 118 <211> 261 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 118 Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys 1 5 10 15 Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro 20 25 30 Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val 35 40 45 Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr 50 55 60 Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr 65 70 75 80 Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro 85 90 95 Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro 100 105 110 Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu 115 120 125 Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr 130 135 140 Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe 145 150 155 160 Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala 165 170 175 Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu 180 185 190 Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu 195 200 205 Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg 210 215 220 Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn 225 230 235 240 Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp 245 250 255 Phe Ser Ala Leu Leu 260 <210> 119 <211> 112 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 119 Ser Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu 1 5 10 15 Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu 20 25 30 Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile 35 40 45 Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu 50 55 60 Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala 65 70 75 80 Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly 85 90 95 Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu 100 105 110 <210> 120 <211> 162 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 120 Ser Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val 1 5 10 15 Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly 20 25 30 Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly 35 40 45 Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu 50 55 60 Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr 65 70 75 80 Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln 85 90 95 Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr 100 105 110 Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp 115 120 125 Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu 130 135 140 Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala 145 150 155 160 Leu Leu <210> 121 <211> 62 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 121 Ser Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile 1 5 10 15 Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala 20 25 30 Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu 35 40 45 Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu 50 55 60 <210> 122 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 122 Asp Glu Ala Asn Leu Arg Arg 1 5 <210> 123 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 123 Asp Pro Ser Val Leu Lys Arg 1 5 <210> 124 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 124 Gln Ser Ala Asn Leu Leu Arg 1 5 <210> 125 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 125 Asp Pro Ser Ser Leu Lys Arg 1 5 <210> 126 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 126 Gln Gln Thr Asn Leu Thr Arg 1 5 <210> 127 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 127 Asp Ala Thr Gln Leu Val Arg 1 5 <210> 128 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 128 Glu Arg Arg Ser Leu Ala Arg 1 5 <210> 129 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 129 Glu Glu Ala Asn Leu Arg Arg 1 5 <210> 130 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 130 Asp His Ser Ser Leu Lys Arg 1 5 <210> 131 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 131 Gln Arg Ser Ser Leu Val Arg 1 5 <210> 132 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 132 Asp Met Gly Asn Leu Gly Arg 1 5 <210> 133 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 133 Arg Ser His Asp Leu Thr Arg 1 5 <210> 134 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 134 His Lys Ser Ser Leu Thr Arg 1 5 <210> 135 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 135 Asp Ser Ser Asn Leu Arg Arg 1 5 <210> 136 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 136 Asp Gln Gly Asn Leu Ile Arg 1 5 <210> 137 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 137 Gln Lys Gln Ala Leu Thr Arg 1 5 <210> 138 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 138 Asp Arg Gly Asn Leu Thr Arg 1 5 <210> 139 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 139 Arg Ser His Asp Leu Thr Val 1 5 <210> 140 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 140 Asp Lys Ser Val Leu Ala Arg 1 5 <210> 141 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 141 Gln Thr Asn Asn Leu Gly Arg 1 5 <210> 142 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 142 Thr His Ala Val Leu Thr Arg 1 5 <210> 143 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 143 Thr Lys Ser Leu Leu Ala Arg 1 5 <210> 144 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 144 Gln Lys Gln Ala Leu Asp Arg 1 5 <210> 145 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 145 Asp Thr Ser Val Leu Asn Arg 1 5 <210> 146 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 146 Gln Gly Thr Ser Leu Ala Arg 1 5 <210> 147 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 147 Val Arg His Asn Leu Thr Arg 1 5 <210> 148 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 148 Glu Lys Gln Asn Leu Ala Arg 1 5 <210> 149 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 149 Asp Pro Ser Asn Leu Arg Arg 1 5 <210> 150 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 150 Asp His Ser Asn Leu Ser Arg 1 5 <210> 151 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 151 Gln Ser Thr Ser Leu Gln Arg 1 5 <210> 152 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 152 Asn Met Ser Asn Leu Thr Arg 1 5 <210> 153 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 153 Asp Arg Ser Val Leu Arg Arg 1 5 <210> 154 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 154 Leu Gln Glu Asn Leu Thr Arg 1 5 <210> 155 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 155 Asp Arg Ser Ser Leu Arg Arg 1 5 <210> 156 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 156 Gln Ser Gly Thr Leu His Arg 1 5 <210> 157 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 157 Gln Leu Ala Asn Leu Ala Arg 1 5 <210> 158 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 158 Asp Gln Thr Thr Leu Arg Arg 1 5 <210> 159 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 159 Asp Pro Ser Asn Leu Ala Arg 1 5 <210> 160 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 160 Gln Gly Gly Asn Leu Ala Leu 1 5 <210> 161 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 161 Arg Ala Asp Met Leu Arg Arg 1 5 <210> 162 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 162 Gln Lys Ala Asn Leu Gly Val 1 5 <210> 163 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 163 Arg Leu Asp Met Leu Ala Arg 1 5 <210> 164 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 164 Gln Arg Gly Asn Leu Asn Met 1 5 <210> 165 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 165 Arg Pro Gln Glu Leu Arg Arg 1 5 <210> 166 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 166 Arg Gln Asp Asn Leu Gly Arg 1 5 <210> 167 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 167 Asp Gly Gly Asn Leu Gly Arg 1 5 <210> 168 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 168 Gln Gln Gly Asn Leu Gln Leu 1 5 <210> 169 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 169 Arg Arg Gln Glu Leu Thr Arg 1 5 <210> 170 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 170 Gln Ala Ser Asn Leu Thr Arg 1 5 <210> 171 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 171 Arg Ala His Asn Leu Leu Leu 1 5 <210> 172 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 172 Gln Ser Thr Thr Leu Lys Arg 1 5 <210> 173 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 173 Gln Gly Thr Thr Leu Lys Arg 1 5 <210> 174 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 174 Gln Arg Ser Asn Leu Ala Arg 1 5 <210> 175 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 175 Arg Arg His Gly Leu Asp Arg 1 5 <210> 176 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 176 Glu Ser Gly His Leu Lys Arg 1 5 <210> 177 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 177 Gln Leu Ser Asn Leu Thr Arg 1 5 <210> 178 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 178 Asp Arg Ser Ser Leu Lys Arg 1 5 <210> 179 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 179 Val Arg His Ser Leu Thr Arg 1 5 <210> 180 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 180 Glu Ser Gly Ala Leu Arg Arg 1 5 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 181 cgtcgaagtc gaagtcgacc 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 182 ggacgacgtt acggacgtac 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 183 agacgtcgaa gtagccgtag 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 184 ggacgacgcc gatgtagaag 20 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 185 tgaagcagtc gacgccgaag 20 <210> 186 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 186 ggacgacgcg gtctaagaag 20 <210> 187 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 187 cgacgaggtc gcataagtag 20 <210> 188 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 188 agacgcagta taggtcgaac 20 <210> 189 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 189 agacgcagta taggacgacg 20 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 190 cggcgtagcc gatgtcgcgc 20 <210> 191 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 191 ggtcgttgcg gtagtcgaa 19 <210> 192 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 192 Gln Arg Asn Asn Leu Gly Arg 1 5 <210> 193 <211> 200 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 193 Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys 1 5 10 15 Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro 20 25 30 Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val 35 40 45 Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr 50 55 60 Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr 65 70 75 80 Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro 85 90 95 Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro 100 105 110 Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu 115 120 125 Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr 130 135 140 Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe 145 150 155 160 Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala 165 170 175 Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu 180 185 190 Leu Asn Gln Gly Ile Pro Val Ala 195 200 <210> 194 <211> 150 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 194 Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys 1 5 10 15 Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro 20 25 30 Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val 35 40 45 Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr 50 55 60 Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr 65 70 75 80 Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro 85 90 95 Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro 100 105 110 Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu 115 120 125 Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr 130 135 140 Gln Ala Gly Glu Gly Thr 145 150 <210> 195 <211> 100 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 195 Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys 1 5 10 15 Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro 20 25 30 Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val 35 40 45 Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr 50 55 60 Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr 65 70 75 80 Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro 85 90 95 Ala Pro Pro Gln 100 <210> 196 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 196 Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro 1 5 10 15 Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met 20 25 30 Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala 35 40 45 Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala 50 55 60 Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala 65 70 75 80 Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln 85 90 95 Ala Gly Glu Gly Thr 100 <210> 197 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 197 Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu 1 5 10 15 Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp 20 25 30 Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln 35 40 45 Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro 50 55 60 Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala 65 70 75 80 Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu 85 90 95 Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp 100 105 110 Met Asp Phe Ser Ala Leu Leu 115 <210> 198 <211> 190 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 198 Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser 1 5 10 15 Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg 20 25 30 Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu 35 40 45 Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val 50 55 60 Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro 65 70 75 80 Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu 85 90 95 Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile 100 105 110 Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His 115 120 125 Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser 130 135 140 Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn 145 150 155 160 Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met 165 170 175 His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe 180 185 190 <210> 199 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 199 Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu 1 5 10 15 Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu 20 25 30 Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly 35 40 45 Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu 50 55 60 Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro 65 70 75 80 Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu 85 90 95 Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp 100 105 110 Thr Ser Leu Phe 115 <210> 200 <211> 66 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 200 Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr 1 5 10 15 Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr 20 25 30 Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu 35 40 45 Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser 50 55 60 Leu Phe 65 <210> 201 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 201 Ser Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly 1 5 10 15 Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala 20 25 30 Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr 35 40 45 Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro 50 55 60 Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro 65 70 75 80 Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met 85 90 95 Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu 100 105 110 Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala 115 120 125 <210> 202 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 202 Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu 1 5 10 15 Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu 20 25 30 Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly 35 40 45 Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu 50 55 60 Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro 65 70 75 80 Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu 85 90 95 Cys Leu Leu His Ala 100 <210> 203 <211> 76 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 203 Ser Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys 1 5 10 15 Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro 20 25 30 Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu 35 40 45 Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu 50 55 60 Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala 65 70 75 <210> 204 <211> 51 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 204 Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr 1 5 10 15 Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr 20 25 30 Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu 35 40 45 Leu His Ala 50 <210> 205 <211> 316 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 205 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 1 5 10 15 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 20 25 30 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 35 40 45 Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys 50 55 60 Lys Arg Lys Val Gly Ser Gly Gly Gly Ser Gly Gly Ser Gly Ser Val 65 70 75 80 Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala 85 90 95 Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro 100 105 110 Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly 115 120 125 Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu 130 135 140 Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu 145 150 155 160 Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile 165 170 175 Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu 180 185 190 Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala 195 200 205 Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly 210 215 220 Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu 225 230 235 240 Ser Gly Gly Gly Ser Gly Gly Ser Gly Ser Asp Leu Ser His Pro Pro 245 250 255 Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr 260 265 270 Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile 275 280 285 Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile 290 295 300 Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe 305 310 315 <210> 206 <211> 526 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 206 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 1 5 10 15 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 20 25 30 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 35 40 45 Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys 50 55 60 Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His 65 70 75 80 Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile 85 90 95 Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro 100 105 110 Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro 115 120 125 Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr 130 135 140 Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala 145 150 155 160 Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala 165 170 175 Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala 180 185 190 Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro 195 200 205 Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 210 215 220 Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn 225 230 235 240 Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser 245 250 255 Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr 260 265 270 Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val 275 280 285 Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala 290 295 300 Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser 305 310 315 320 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser 325 330 335 Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser 340 345 350 Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg 355 360 365 Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu 370 375 380 Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val 385 390 395 400 Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro 405 410 415 Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu 420 425 430 Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile 435 440 445 Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His 450 455 460 Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser 465 470 475 480 Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn 485 490 495 Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met 500 505 510 His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe 515 520 525 <210> 207 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 207 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu 1 5 10 <210> 208 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 208 Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser 1 5 10 15 Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu 20 25 30 Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe 35 40 45 Asp Leu Asp Met Leu 50 <210> 209 <211> 2414 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 209 Met Ala Glu Asn Val Val Glu Pro Gly Pro Pro Ser Ala Lys Arg Pro 1 5 10 15 Lys Leu Ser Ser Pro Ala Leu Ser Ala Ser Ala Ser Asp Gly Thr Asp 20 25 30 Phe Gly Ser Leu Phe Asp Leu Glu His Asp Leu Pro Asp Glu Leu Ile 35 40 45 Asn Ser Thr Glu Leu Gly Leu Thr Asn Gly Gly Asp Ile Asn Gln Leu 50 55 60 Gln Thr Ser Leu Gly Met Val Gln Asp Ala Ala Ser Lys His Lys Gln 65 70 75 80 Leu Ser Glu Leu Leu Arg Ser Gly Ser Ser Pro Asn Leu Asn Met Gly 85 90 95 Val Gly Gly Pro Gly Gln Val Met Ala Ser Gln Ala Gln Gln Ser Ser 100 105 110 Pro Gly Leu Gly Leu Ile Asn Ser Met Val Lys Ser Pro Met Thr Gln 115 120 125 Ala Gly Leu Thr Ser Pro Asn Met Gly Met Gly Thr Ser Gly Pro Asn 130 135 140 Gln Gly Pro Thr Gln Ser Thr Gly Met Met Asn Ser Pro Val Asn Gln 145 150 155 160 Pro Ala Met Gly Met Asn Thr Gly Met Asn Ala Gly Met Asn Pro Gly 165 170 175 Met Leu Ala Ala Gly Asn Gly Gln Gly Ile Met Pro Asn Gln Val Met 180 185 190 Asn Gly Ser Ile Gly Ala Gly Arg Gly Arg Gln Asn Met Gln Tyr Pro 195 200 205 Asn Pro Gly Met Gly Ser Ala Gly Asn Leu Leu Thr Glu Pro Leu Gln 210 215 220 Gln Gly Ser Pro Gln Met Gly Gly Gln Thr Gly Leu Arg Gly Pro Gln 225 230 235 240 Pro Leu Lys Met Gly Met Met Asn Asn Pro Asn Pro Tyr Gly Ser Pro 245 250 255 Tyr Thr Gln Asn Pro Gly Gln Gln Ile Gly Ala Ser Gly Leu Gly Leu 260 265 270 Gln Ile Gln Thr Lys Thr Val Leu Ser Asn Asn Leu Ser Pro Phe Ala 275 280 285 Met Asp Lys Lys Ala Val Pro Gly Gly Gly Met Pro Asn Met Gly Gln 290 295 300 Gln Pro Ala Pro Gln Val Gln Gln Pro Gly Leu Val Thr Pro Val Ala 305 310 315 320 Gln Gly Met Gly Ser Gly Ala His Thr Ala Asp Pro Glu Lys Arg Lys 325 330 335 Leu Ile Gln Gln Gln Leu Val Leu Leu Leu His Ala His Lys Cys Gln 340 345 350 Arg Arg Glu Gln Ala Asn Gly Glu Val Arg Gln Cys Asn Leu Pro His 355 360 365 Cys Arg Thr Met Lys Asn Val Leu Asn His Met Thr His Cys Gln Ser 370 375 380 Gly Lys Ser Cys Gln Val Ala His Cys Ala Ser Ser Arg Gln Ile Ile 385 390 395 400 Ser His Trp Lys Asn Cys Thr Arg His Asp Cys Pro Val Cys Leu Pro 405 410 415 Leu Lys Asn Ala Gly Asp Lys Arg Asn Gln Gln Pro Ile Leu Thr Gly 420 425 430 Ala Pro Val Gly Leu Gly Asn Pro Ser Ser Leu Gly Val Gly Gln Gln 435 440 445 Ser Ala Pro Asn Leu Ser Thr Val Ser Gln Ile Asp Pro Ser Ser Ile 450 455 460 Glu Arg Ala Tyr Ala Ala Leu Gly Leu Pro Tyr Gln Val Asn Gln Met 465 470 475 480 Pro Thr Gln Pro Gln Val Gln Ala Lys Asn Gln Gln Asn Gln Gln Pro 485 490 495 Gly Gln Ser Pro Gln Gly Met Arg Pro Met Ser Asn Met Ser Ala Ser 500 505 510 Pro Met Gly Val Asn Gly Gly Val Gly Val Gln Thr Pro Ser Leu Leu 515 520 525 Ser Asp Ser Met Leu His Ser Ala Ile Asn Ser Gln Asn Pro Met Met 530 535 540 Ser Glu Asn Ala Ser Val Pro Ser Leu Gly Pro Met Pro Thr Ala Ala 545 550 555 560 Gln Pro Ser Thr Thr Gly Ile Arg Lys Gln Trp His Glu Asp Ile Thr 565 570 575 Gln Asp Leu Arg Asn His Leu Val His Lys Leu Val Gln Ala Ile Phe 580 585 590 Pro Thr Pro Asp Pro Ala Ala Leu Lys Asp Arg Arg Met Glu Asn Leu 595 600 605 Val Ala Tyr Ala Arg Lys Val Glu Gly Asp Met Tyr Glu Ser Ala Asn 610 615 620 Asn Arg Ala Glu Tyr Tyr His Leu Leu Ala Glu Lys Ile Tyr Lys Ile 625 630 635 640 Gln Lys Glu Leu Glu Glu Lys Arg Arg Thr Arg Leu Gln Lys Gln Asn 645 650 655 Met Leu Pro Asn Ala Ala Gly Met Val Pro Val Ser Met Asn Pro Gly 660 665 670 Pro Asn Met Gly Gln Pro Gln Pro Gly Met Thr Ser Asn Gly Pro Leu 675 680 685 Pro Asp Pro Ser Met Ile Arg Gly Ser Val Pro Asn Gln Met Met Pro 690 695 700 Arg Ile Thr Pro Gln Ser Gly Leu Asn Gln Phe Gly Gln Met Ser Met 705 710 715 720 Ala Gln Pro Pro Ile Val Pro Arg Gln Thr Pro Pro Leu Gln His His 725 730 735 Gly Gln Leu Ala Gln Pro Gly Ala Leu Asn Pro Pro Met Gly Tyr Gly 740 745 750 Pro Arg Met Gln Gln Pro Ser Asn Gln Gly Gln Phe Leu Pro Gln Thr 755 760 765 Gln Phe Pro Ser Gln Gly Met Asn Val Thr Asn Ile Pro Leu Ala Pro 770 775 780 Ser Ser Gly Gln Ala Pro Val Ser Gln Ala Gln Met Ser Ser Ser Ser 785 790 795 800 Cys Pro Val Asn Ser Pro Ile Met Pro Pro Gly Ser Gln Gly Ser His 805 810 815 Ile His Cys Pro Gln Leu Pro Gln Pro Ala Leu His Gln Asn Ser Pro 820 825 830 Ser Pro Val Pro Ser Arg Thr Pro Thr Pro His His Thr Pro Pro Ser 835 840 845 Ile Gly Ala Gln Gln Pro Pro Ala Thr Thr Ile Pro Ala Pro Val Pro 850 855 860 Thr Pro Pro Ala Met Pro Pro Gly Pro Gln Ser Gln Ala Leu His Pro 865 870 875 880 Pro Pro Arg Gln Thr Pro Thr Pro Pro Thr Thr Gln Leu Pro Gln Gln 885 890 895 Val Gln Pro Ser Leu Pro Ala Ala Pro Ser Ala Asp Gln Pro Gln Gln 900 905 910 Gln Pro Arg Ser Gln Gln Ser Thr Ala Ala Ser Val Pro Thr Pro Thr 915 920 925 Ala Pro Leu Leu Pro Pro Gln Pro Ala Thr Pro Leu Ser Gln Pro Ala 930 935 940 Val Ser Ile Glu Gly Gln Val Ser Asn Pro Pro Ser Thr Ser Ser Thr 945 950 955 960 Glu Val Asn Ser Gln Ala Ile Ala Glu Lys Gln Pro Ser Gln Glu Val 965 970 975 Lys Met Glu Ala Lys Met Glu Val Asp Gln Pro Glu Pro Ala Asp Thr 980 985 990 Gln Pro Glu Asp Ile Ser Glu Ser Lys Val Glu Asp Cys Lys Met Glu 995 1000 1005 Ser Thr Glu Thr Glu Glu Arg Ser Thr Glu Leu Lys Thr Glu Ile 1010 1015 1020 Lys Glu Glu Glu Asp Gln Pro Ser Thr Ser Ala Thr Gln Ser Ser 1025 1030 1035 Pro Ala Pro Gly Gln Ser Lys Lys Lys Ile Phe Lys Pro Glu Glu 1040 1045 1050 Leu Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln 1055 1060 1065 Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu 1070 1075 1080 Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser Pro Met Asp 1085 1090 1095 Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu 1100 1105 1110 Pro Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn Ala 1115 1120 1125 Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser 1130 1135 1140 Lys Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln 1145 1150 1155 Ser Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln 1160 1165 1170 Thr Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp 1175 1180 1185 Ala Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys 1190 1195 1200 Cys Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp 1205 1210 1215 Pro Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys 1220 1225 1230 Arg Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr 1235 1240 1245 Glu Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu 1250 1255 1260 Ile Ile Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys 1265 1270 1275 Ser Ala Arg Thr Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu 1280 1285 1290 Pro Ser Thr Arg Leu Gly Thr Phe Leu Glu Asn Arg Val Asn Asp 1295 1300 1305 Phe Leu Arg Arg Gln Asn His Pro Glu Ser Gly Glu Val Thr Val 1310 1315 1320 Arg Val Val His Ala Ser Asp Lys Thr Val Glu Val Lys Pro Gly 1325 1330 1335 Met Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu Ser Phe 1340 1345 1350 Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly 1355 1360 1365 Val Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser 1370 1375 1380 Asp Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu 1385 1390 1395 Asp Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val 1400 1405 1410 Tyr His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu 1415 1420 1425 Gly Tyr Thr Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly 1430 1435 1440 Asp Asp Tyr Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro 1445 1450 1455 Lys Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys 1460 1465 1470 Ala Val Ser Glu Arg Ile Val His Asp Tyr Lys Asp Ile Phe Lys 1475 1480 1485 Gln Ala Thr Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro Tyr 1490 1495 1500 Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys 1505 1510 1515 Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Arg Glu Glu Asn Thr 1520 1525 1530 Ser Asn Glu Ser Thr Asp Val Thr Lys Gly Asp Ser Lys Asn Ala 1535 1540 1545 Lys Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn Lys Ser Ser Leu 1550 1555 1560 Ser Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn Val Ser Asn 1565 1570 1575 Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu 1580 1585 1590 Val Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn Ser 1595 1600 1605 Leu Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu 1610 1615 1620 Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His 1625 1630 1635 Leu Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys 1640 1645 1650 Met Leu Val Glu Leu His Thr Gln Ser Gln Asp Arg Phe Val Tyr 1655 1660 1665 Thr Cys Asn Glu Cys Lys His His Val Glu Thr Arg Trp His Cys 1670 1675 1680 Thr Val Cys Glu Asp Tyr Asp Leu Cys Ile Thr Cys Tyr Asn Thr 1685 1690 1695 Lys Asn His Asp His Lys Met Glu Lys Leu Gly Leu Gly Leu Asp 1700 1705 1710 Asp Glu Ser Asn Asn Gln Gln Ala Ala Ala Thr Gln Ser Pro Gly 1715 1720 1725 Asp Ser Arg Arg Leu Ser Ile Gln Arg Cys Ile Gln Ser Leu Val 1730 1735 1740 His Ala Cys Gln Cys Arg Asn Ala Asn Cys Ser Leu Pro Ser Cys 1745 1750 1755 Gln Lys Met Lys Arg Val Val Gln His Thr Lys Gly Cys Lys Arg 1760 1765 1770 Lys Thr Asn Gly Gly Cys Pro Ile Cys Lys Gln Leu Ile Ala Leu 1775 1780 1785 Cys Cys Tyr His Ala Lys His Cys Gln Glu Asn Lys Cys Pro Val 1790 1795 1800 Pro Phe Cys Leu Asn Ile Lys Gln Lys Leu Arg Gln Gln Gln Leu 1805 1810 1815 Gln His Arg Leu Gln Gln Ala Gln Met Leu Arg Arg Arg Met Ala 1820 1825 1830 Ser Met Gln Arg Thr Gly Val Val Gly Gln Gln Gln Gly Leu Pro 1835 1840 1845 Ser Pro Thr Pro Ala Thr Pro Thr Thr Pro Thr Gly Gln Gln Pro 1850 1855 1860 Thr Thr Pro Gln Thr Pro Gln Pro Thr Ser Gln Pro Gln Pro Thr 1865 1870 1875 Pro Pro Asn Ser Met Pro Pro Tyr Leu Pro Arg Thr Gln Ala Ala 1880 1885 1890 Gly Pro Val Ser Gln Gly Lys Ala Ala Gly Gln Val Thr Pro Pro 1895 1900 1905 Thr Pro Pro Gln Thr Ala Gln Pro Pro Leu Pro Gly Pro Pro Pro 1910 1915 1920 Ala Ala Val Glu Met Ala Met Gln Ile Gln Arg Ala Ala Glu Thr 1925 1930 1935 Gln Arg Gln Met Ala His Val Gln Ile Phe Gln Arg Pro Ile Gln 1940 1945 1950 His Gln Met Pro Pro Met Thr Pro Met Ala Pro Met Gly Met Asn 1955 1960 1965 Pro Pro Pro Met Thr Arg Gly Pro Ser Gly His Leu Glu Pro Gly 1970 1975 1980 Met Gly Pro Thr Gly Met Gln Gln Gln Pro Pro Trp Ser Gln Gly 1985 1990 1995 Gly Leu Pro Gln Pro Gln Gln Leu Gln Ser Gly Met Pro Arg Pro 2000 2005 2010 Ala Met Met Ser Val Ala Gln His Gly Gln Pro Leu Asn Met Ala 2015 2020 2025 Pro Gln Pro Gly Leu Gly Gln Val Gly Ile Ser Pro Leu Lys Pro 2030 2035 2040 Gly Thr Val Ser Gln Gln Ala Leu Gln Asn Leu Leu Arg Thr Leu 2045 2050 2055 Arg Ser Pro Ser Ser Pro Leu Gln Gln Gln Gln Val Leu Ser Ile 2060 2065 2070 Leu His Ala Asn Pro Gln Leu Leu Ala Ala Phe Ile Lys Gln Arg 2075 2080 2085 Ala Ala Lys Tyr Ala Asn Ser Asn Pro Gln Pro Ile Pro Gly Gln 2090 2095 2100 Pro Gly Met Pro Gln Gly Gln Pro Gly Leu Gln Pro Pro Thr Met 2105 2110 2115 Pro Gly Gln Gln Gly Val His Ser Asn Pro Ala Met Gln Asn Met 2120 2125 2130 Asn Pro Met Gln Ala Gly Val Gln Arg Ala Gly Leu Pro Gln Gln 2135 2140 2145 Gln Pro Gln Gln Gln Leu Gln Pro Pro Met Gly Gly Met Ser Pro 2150 2155 2160 Gln Ala Gln Gln Met Asn Met Asn His Asn Thr Met Pro Ser Gln 2165 2170 2175 Phe Arg Asp Ile Leu Arg Arg Gln Gln Met Met Gln Gln Gln Gln 2180 2185 2190 Gln Gln Gly Ala Gly Pro Gly Ile Gly Pro Gly Met Ala Asn His 2195 2200 2205 Asn Gln Phe Gln Gln Pro Gln Gly Val Gly Tyr Pro Pro Gln Gln 2210 2215 2220 Gln Gln Arg Met Gln His His Met Gln Gln Met Gln Gln Gly Asn 2225 2230 2235 Met Gly Gln Ile Gly Gln Leu Pro Gln Ala Leu Gly Ala Glu Ala 2240 2245 2250 Gly Ala Ser Leu Gln Ala Tyr Gln Gln Arg Leu Leu Gln Gln Gln 2255 2260 2265 Met Gly Ser Pro Val Gln Pro Asn Pro Met Ser Pro Gln Gln His 2270 2275 2280 Met Leu Pro Asn Gln Ala Gln Ser Pro His Leu Gln Gly Gln Gln 2285 2290 2295 Ile Pro Asn Ser Leu Ser Asn Gln Val Arg Ser Pro Gln Pro Val 2300 2305 2310 Pro Ser Pro Arg Pro Gln Ser Gln Pro Pro His Ser Ser Pro Ser 2315 2320 2325 Pro Arg Met Gln Pro Gln Pro Ser Pro His His Val Ser Pro Gln 2330 2335 2340 Thr Ser Ser Pro His Pro Gly Leu Val Ala Ala Gln Ala Asn Pro 2345 2350 2355 Met Glu Gln Gly His Phe Ala Ser Pro Asp Gln Asn Ser Met Leu 2360 2365 2370 Ser Gln Leu Ala Ser Asn Pro Gly Met Ala Asn Leu His Gly Ala 2375 2380 2385 Ser Ala Thr Asp Leu Gly Leu Ser Thr Asp Asn Ser Asp Leu Asn 2390 2395 2400 Ser Asn Leu Ser Gln Ser Thr Leu Asp Ile His 2405 2410 <210> 210 <211> 617 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 210 Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr Leu Glu 1 5 10 15 Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro Val 20 25 30 Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser 35 40 45 Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr 50 55 60 Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn 65 70 75 80 Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser 85 90 95 Lys Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln Ser 100 105 110 Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln Thr Leu 115 120 125 Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala Thr Tyr 130 135 140 Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys Phe Asn Glu 145 150 155 160 Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp Pro Ser Gln Pro Gln 165 170 175 Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys Arg Lys Asn Asp Thr Leu 180 185 190 Asp Pro Glu Leu Phe Val Glu Cys Thr Glu Cys Gly Arg Lys Met His 195 200 205 Gln Ile Cys Val Leu His His Glu Ile Ile Trp Pro Ala Gly Phe Val 210 215 220 Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg Thr Arg Lys Glu Asn Lys 225 230 235 240 Phe Ser Ala Lys Arg Leu Pro Ser Thr Arg Leu Gly Thr Phe Leu Glu 245 250 255 Asn Arg Val Asn Asp Phe Leu Arg Arg Gln Asn His Pro Glu Ser Gly 260 265 270 Glu Val Thr Val Arg Val Val His Ala Ser Asp Lys Thr Val Glu Val 275 280 285 Lys Pro Gly Met Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu 290 295 300 Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp 305 310 315 320 Gly Val Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser 325 330 335 Asp Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu Asp 340 345 350 Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val Tyr His 355 360 365 Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr Thr 370 375 380 Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile 385 390 395 400 Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu 405 410 415 Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala Val Ser Glu Arg Ile 420 425 430 Val His Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu 435 440 445 Thr Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn 450 455 460 Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu Arg 465 470 475 480 Lys Arg Glu Glu Asn Thr Ser Asn Glu Ser Thr Asp Val Thr Lys Gly 485 490 495 Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn 500 505 510 Lys Ser Ser Leu Ser Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn 515 520 525 Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His 530 535 540 Lys Glu Val Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn 545 550 555 560 Ser Leu Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu 565 570 575 Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Leu 580 585 590 Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys Met Leu 595 600 605 Val Glu Leu His Thr Gln Ser Gln Asp 610 615 <210> 211 <211> 308 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 211 Val Asn Lys Phe Leu Arg Arg Gln Asn His Pro Glu Ala Gly Glu Val 1 5 10 15 Phe Val Arg Val Val Ala Ser Ser Asp Lys Thr Val Glu Val Lys Pro 20 25 30 Gly Met Lys Ser Arg Phe Val Asp Ser Gly Glu Met Ser Glu Ser Phe 35 40 45 Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val 50 55 60 Asp Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Asp Cys 65 70 75 80 Pro Pro Pro Asn Thr Arg Arg Val Tyr Ile Ser Tyr Leu Asp Ser Ile 85 90 95 His Phe Phe Arg Pro Arg Cys Leu Arg Thr Ala Val Tyr His Glu Ile 100 105 110 Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr Val Thr Gly 115 120 125 His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His 130 135 140 Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu 145 150 155 160 Trp Tyr Lys Lys Met Leu Asp Lys Ala Phe Ala Glu Arg Ile Ile His 165 170 175 Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu Thr Ser 180 185 190 Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu 195 200 205 Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Lys 210 215 220 Glu Glu Ser Thr Ala Ala Ser Glu Thr Thr Glu Gly Ser Gln Gly Asp 225 230 235 240 Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Asn Lys Asn Lys 245 250 255 Ser Ser Ile Ser Arg Ala Asn Lys Lys Lys Pro Ser Met Pro Asn Val 260 265 270 Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys 275 280 285 Glu Val Phe Phe Val Ile His Leu His Ala Gly Pro Val Ile Asn Thr 290 295 300 Leu Pro Pro Ile 305 <210> 212 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 212 Val Asn Asn Phe Leu Lys Lys Lys Glu Ala Gly Ala Gly Glu Val His 1 5 10 15 Ile Arg Val Val Ser Ser Ser Asp Lys Cys Val Glu Val Lys Pro Gly 20 25 30 Met Arg Arg Arg Phe Val Glu Gln Gly Glu Met Met Asn Glu Phe Pro 35 40 45 Tyr Arg Ala Lys Ala Leu Phe Ala Phe Glu Glu Val Asp Gly Ile Asp 50 55 60 Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Glu Cys Pro 65 70 75 80 Ala Pro Asn Thr Arg Arg Val Tyr Ile Ala Tyr Leu Asp Ser Val His 85 90 95 Phe Phe Arg Pro Arg Gln Tyr Arg Thr Ala Val Tyr His Glu Ile Leu 100 105 110 Leu Gly Tyr Met Asp Tyr Val Lys Gln Leu Gly Tyr Thr Met Ala His 115 120 125 Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys 130 135 140 His Pro Thr Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp 145 150 155 160 Tyr Lys Lys Met Leu Asp Lys Gly Met Ile Glu Arg Ile Ile Gln Asp 165 170 175 Tyr Lys Asp Ile Leu Lys Gln Ala Met Glu Asp Lys Leu Gly Ser Ala 180 185 190 Ala Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu 195 200 205 Glu Ser Ile Lys Glu Leu Asp Gln Glu Glu Glu Glu Lys Arg Lys Gln 210 215 220 Ala Glu Ala Ala Glu Ala Ala Ala Ala Ala Asn Leu Phe Ser Ile Glu 225 230 235 240 Glu Asn Glu Val Ser Gly Asp Gly Lys Lys Lys Gly Gln Lys Lys Ala 245 250 255 Lys Lys Ser Asn Lys Ser Lys Ala Ala Gln Arg Lys Asn Ser Lys Lys 260 265 270 Ser Asn Glu His Gln Ser Gly Asn Asp Leu Ser Thr Lys Ile Tyr Ala 275 280 285 Thr Met Glu Lys His Lys Glu Val Phe Phe Val Ile Arg Leu His Ser 290 295 300 Ala Gln Ser Ala Ala Ser Leu Ala Pro Ile 305 310 <210> 213 <211> 634 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 213 Asn Gly Lys Tyr Ser Asp Pro Trp Glu Tyr Val Asp Asp Val Trp Leu 1 5 10 15 Met Phe Asp Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr 20 25 30 Arg Tyr Cys Thr Lys Leu Ser Glu Val Phe Glu Ala Glu Ile Asp Pro 35 40 45 Val Met Gln Ala Leu Gly Tyr Cys Cys Gly Arg Lys Tyr Thr Phe Asn 50 55 60 Pro Gln Val Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg 65 70 75 80 Asp Ala Lys Tyr Tyr Ser Tyr Gln Asn Arg Tyr Thr Tyr Cys Gln Lys 85 90 95 Cys Phe Asn Asp Ile Gln Gly Asp Thr Val Thr Leu Gly Asp Asp Pro 100 105 110 Leu Gln Ser Gln Thr Gln Ile Lys Lys Asp Gln Phe Lys Glu Met Lys 115 120 125 Asn Asp His Leu Glu Leu Glu Pro Phe Val Asn Cys Gln Glu Cys Gly 130 135 140 Arg Lys Gln His Gln Ile Cys Val Leu Trp Leu Asp Ser Ile Trp Pro 145 150 155 160 Gly Gly Phe Val Cys Asp Asn Cys Leu Lys Lys Lys Asn Ser Lys Arg 165 170 175 Lys Glu Asn Lys Phe Asn Ala Lys Arg Leu Pro Thr Thr Lys Leu Gly 180 185 190 Val Tyr Ile Glu Thr Arg Val Asn Asn Phe Leu Lys Lys Lys Glu Ala 195 200 205 Gly Ala Gly Glu Val His Ile Arg Val Val Ser Ser Ser Asp Lys Cys 210 215 220 Val Glu Val Lys Pro Gly Met Arg Arg Arg Phe Val Glu Gln Gly Glu 225 230 235 240 Met Met Asn Glu Phe Pro Tyr Arg Ala Lys Ala Leu Phe Ala Phe Glu 245 250 255 Glu Val Asp Gly Ile Asp Val Cys Phe Phe Gly Met His Val Gln Glu 260 265 270 Tyr Gly Ser Glu Cys Pro Ala Pro Asn Thr Arg Arg Val Tyr Ile Ala 275 280 285 Tyr Leu Asp Ser Val His Phe Phe Arg Pro Arg Gln Tyr Arg Thr Ala 290 295 300 Val Tyr His Glu Ile Leu Leu Gly Tyr Met Asp Tyr Val Lys Gln Leu 305 310 315 320 Gly Tyr Thr Met Ala His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp 325 330 335 Asp Tyr Ile Phe His Cys His Pro Thr Asp Gln Lys Ile Pro Lys Pro 340 345 350 Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Gly Met Ile 355 360 365 Glu Arg Ile Ile Gln Asp Tyr Lys Asp Ile Leu Lys Gln Ala Met Glu 370 375 380 Asp Lys Leu Gly Ser Ala Ala Glu Leu Pro Tyr Phe Glu Gly Asp Phe 385 390 395 400 Trp Pro Asn Val Leu Glu Glu Ser Ile Lys Glu Leu Asp Gln Glu Glu 405 410 415 Glu Glu Lys Arg Lys Gln Ala Glu Ala Ala Glu Ala Ala Ala Ala Ala 420 425 430 Asn Leu Phe Ser Ile Glu Glu Asn Glu Val Ser Gly Asp Gly Lys Lys 435 440 445 Lys Gly Gln Lys Lys Ala Lys Lys Ser Asn Lys Ser Lys Ala Ala Gln 450 455 460 Arg Lys Asn Ser Lys Lys Ser Asn Glu His Gln Ser Gly Asn Asp Leu 465 470 475 480 Ser Thr Lys Ile Tyr Ala Thr Met Glu Lys His Lys Glu Val Phe Phe 485 490 495 Val Ile Arg Leu His Ser Ala Gln Ser Ala Ala Ser Leu Ala Pro Ile 500 505 510 Gln Asp Pro Asp Pro Leu Leu Thr Cys Asp Leu Met Asp Gly Arg Asp 515 520 525 Ala Phe Leu Thr Leu Ala Arg Asp Lys His Phe Glu Phe Ser Ser Leu 530 535 540 Arg Arg Ala Gln Phe Ser Thr Leu Ser Met Leu Tyr Glu Leu His Asn 545 550 555 560 Gln Gly Gln Asp Lys Phe Val Tyr Thr Cys Asn His Cys Lys Thr Ala 565 570 575 Val Glu Thr Arg Tyr His Cys Thr Val Cys Asp Asp Phe Asp Leu Cys 580 585 590 Ile Val Cys Lys Glu Lys Val Gly His Gln His Lys Met Glu Lys Leu 595 600 605 Gly Phe Asp Ile Asp Asp Gly Ser Ala Leu Ala Asp His Lys Gln Ala 610 615 620 Asn Pro Gln Glu Ala Arg Lys Gln Ser Ile 625 630 <210> 214 <211> 382 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 214 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Ser Gly Gly Gly Ser 65 70 75 80 Gly Gly Ser Gly Ser Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser 85 90 95 Val Gln Val Lys Arg Val Leu Glu Lys Ser Pro Gly Lys Leu Leu Val 100 105 110 Lys Met Pro Phe Gln Ala Ser Pro Gly Gly Lys Gly Glu Gly Gly Gly 115 120 125 Ala Thr Thr Ser Ala Gln Val Met Val Ile Lys Arg Pro Gly Arg Lys 130 135 140 Arg Lys Ala Glu Ala Asp Pro Gln Ala Ile Pro Lys Lys Arg Gly Arg 145 150 155 160 Lys Pro Gly Ser Val Val Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys 165 170 175 Ala Val Lys Glu Ser Ser Ile Arg Ser Val Gln Glu Thr Val Leu Pro 180 185 190 Ile Lys Lys Arg Lys Thr Arg Glu Thr Val Ser Ile Glu Val Lys Glu 195 200 205 Val Val Lys Pro Leu Leu Val Ser Thr Leu Gly Glu Lys Ser Gly Lys 210 215 220 Gly Leu Lys Thr Cys Lys Ser Pro Gly Arg Lys Ser Lys Glu Ser Ser 225 230 235 240 Pro Lys Gly Arg Ser Ser Ser Ala Ser Ser Pro Pro Lys Lys Glu His 245 250 255 His His His His His His Ala Glu Ser Pro Lys Ala Pro Met Pro Leu 260 265 270 Leu Pro Pro Pro Pro Pro Pro Glu Pro Gln Ser Ser Glu Asp Pro Ile 275 280 285 Ser Pro Pro Glu Pro Gln Asp Leu Ser Ser Ser Ile Cys Lys Glu Glu 290 295 300 Lys Met Pro Arg Ala Gly Ser Leu Glu Ser Asp Gly Cys Pro Lys Glu 305 310 315 320 Pro Ala Lys Thr Gln Pro Met Val Ala Ala Ala Ala Thr Thr Thr Thr 325 330 335 Thr Thr Thr Thr Thr Val Ala Glu Lys Tyr Lys His Arg Gly Glu Gly 340 345 350 Glu Arg Lys Asp Ile Val Ser Ser Ser Met Pro Arg Pro Asn Arg Glu 355 360 365 Glu Pro Val Asp Ser Arg Thr Pro Val Thr Glu Arg Val Ser 370 375 380 <210> 215 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 215 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 1 5 10 15 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 20 25 30 Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 35 40 45 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 50 55 60 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val 65 70 <210> 216 <211> 296 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 216 Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Val Gln Val Lys Arg Val 1 5 10 15 Leu Glu Lys Ser Pro Gly Lys Leu Leu Val Lys Met Pro Phe Gln Ala 20 25 30 Ser Pro Gly Gly Lys Gly Glu Gly Gly Gly Ala Thr Thr Ser Ala Gln 35 40 45 Val Met Val Ile Lys Arg Pro Gly Arg Lys Arg Lys Ala Glu Ala Asp 50 55 60 Pro Gln Ala Ile Pro Lys Lys Arg Gly Arg Lys Pro Gly Ser Val Val 65 70 75 80 Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys Ala Val Lys Glu Ser Ser 85 90 95 Ile Arg Ser Val Gln Glu Thr Val Leu Pro Ile Lys Lys Arg Lys Thr 100 105 110 Arg Glu Thr Val Ser Ile Glu Val Lys Glu Val Val Lys Pro Leu Leu 115 120 125 Val Ser Thr Leu Gly Glu Lys Ser Gly Lys Gly Leu Lys Thr Cys Lys 130 135 140 Ser Pro Gly Arg Lys Ser Lys Glu Ser Ser Pro Lys Gly Arg Ser Ser 145 150 155 160 Ser Ala Ser Ser Pro Pro Lys Lys Glu His His His His His His His 165 170 175 Ala Glu Ser Pro Lys Ala Pro Met Pro Leu Leu Pro Pro Pro Pro Pro 180 185 190 Pro Glu Pro Gln Ser Ser Glu Asp Pro Ile Ser Pro Pro Glu Pro Gln 195 200 205 Asp Leu Ser Ser Ser Ile Cys Lys Glu Glu Lys Met Pro Arg Ala Gly 210 215 220 Ser Leu Glu Ser Asp Gly Cys Pro Lys Glu Pro Ala Lys Thr Gln Pro 225 230 235 240 Met Val Ala Ala Ala Ala Thr Thr Thr Thr Thr Thr Thr Thr Thr Val 245 250 255 Ala Glu Lys Tyr Lys His Arg Gly Glu Gly Glu Arg Lys Asp Ile Val 260 265 270 Ser Ser Ser Met Pro Arg Pro Asn Arg Glu Glu Pro Val Asp Ser Arg 275 280 285 Thr Pro Val Thr Glu Arg Val Ser 290 295 <210> 217 <211> 792 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 217 Met Lys Gly Asp Thr Arg His Leu Asn Gly Glu Glu Asp Ala Gly Gly 1 5 10 15 Arg Glu Asp Ser Ile Leu Val Asn Gly Ala Cys Ser Asp Gln Ser Ser 20 25 30 Asp Ser Pro Pro Ile Leu Glu Ala Ile Arg Thr Pro Glu Ile Arg Gly 35 40 45 Arg Arg Ser Ser Ser Arg Leu Ser Lys Arg Glu Val Ser Ser Leu Leu 50 55 60 Ser Tyr Thr Gln Asp Leu Thr Gly Asp Gly Asp Gly Glu Asp Gly Asp 65 70 75 80 Gly Ser Asp Thr Pro Val Met Pro Lys Leu Phe Arg Glu Thr Arg Thr 85 90 95 Arg Ser Glu Ser Pro Ala Val Arg Thr Arg Asn Asn Asn Ser Val Ser 100 105 110 Ser Arg Glu Arg His Arg Pro Ser Pro Arg Ser Thr Arg Gly Arg Gln 115 120 125 Gly Arg Asn His Val Asp Glu Ser Pro Val Glu Phe Pro Ala Thr Arg 130 135 140 Ser Leu Arg Arg Arg Ala Thr Ala Ser Ala Gly Thr Pro Trp Pro Ser 145 150 155 160 Pro Pro Ser Ser Tyr Leu Thr Ile Asp Leu Thr Asp Asp Thr Glu Asp 165 170 175 Thr His Gly Thr Pro Gln Ser Ser Ser Thr Pro Tyr Ala Arg Leu Ala 180 185 190 Gln Asp Ser Gln Gln Gly Gly Met Glu Ser Pro Gln Val Glu Ala Asp 195 200 205 Ser Gly Asp Gly Asp Ser Ser Glu Tyr Gln Asp Gly Lys Glu Phe Gly 210 215 220 Ile Gly Asp Leu Val Trp Gly Lys Ile Lys Gly Phe Ser Trp Trp Pro 225 230 235 240 Ala Met Val Val Ser Trp Lys Ala Thr Ser Lys Arg Gln Ala Met Ser 245 250 255 Gly Met Arg Trp Val Gln Trp Phe Gly Asp Gly Lys Phe Ser Glu Val 260 265 270 Ser Ala Asp Lys Leu Val Ala Leu Gly Leu Phe Ser Gln His Phe Asn 275 280 285 Leu Ala Thr Phe Asn Lys Leu Val Ser Tyr Arg Lys Ala Met Tyr His 290 295 300 Ala Leu Glu Lys Ala Arg Val Arg Ala Gly Lys Thr Phe Pro Ser Ser 305 310 315 320 Pro Gly Asp Ser Leu Glu Asp Gln Leu Lys Pro Met Leu Glu Trp Ala 325 330 335 His Gly Gly Phe Lys Pro Thr Gly Ile Glu Gly Leu Lys Pro Asn Asn 340 345 350 Thr Gln Pro Glu Asn Lys Thr Arg Arg Arg Thr Ala Asp Asp Ser Ala 355 360 365 Thr Ser Asp Tyr Cys Pro Ala Pro Lys Arg Leu Lys Thr Asn Cys Tyr 370 375 380 Asn Asn Gly Lys Asp Arg Gly Asp Glu Asp Gln Ser Arg Glu Gln Met 385 390 395 400 Ala Ser Asp Val Ala Asn Asn Lys Ser Ser Leu Glu Asp Gly Cys Leu 405 410 415 Ser Cys Gly Arg Lys Asn Pro Val Ser Phe His Pro Leu Phe Glu Gly 420 425 430 Gly Leu Cys Gln Thr Cys Arg Asp Arg Phe Leu Glu Leu Phe Tyr Met 435 440 445 Tyr Asp Asp Asp Gly Tyr Gln Ser Tyr Cys Thr Val Cys Cys Glu Gly 450 455 460 Arg Glu Leu Leu Leu Cys Ser Asn Thr Ser Cys Cys Arg Cys Phe Cys 465 470 475 480 Val Glu Cys Leu Glu Val Leu Val Gly Thr Gly Thr Ala Ala Glu Ala 485 490 495 Lys Leu Gln Glu Pro Trp Ser Cys Tyr Met Cys Leu Pro Gln Arg Cys 500 505 510 His Gly Val Leu Arg Arg Arg Lys Asp Trp Asn Val Arg Leu Gln Ala 515 520 525 Phe Phe Thr Ser Asp Thr Gly Leu Glu Tyr Glu Ala Pro Lys Leu Tyr 530 535 540 Pro Ala Ile Pro Ala Ala Arg Arg Arg Pro Ile Arg Val Leu Ser Leu 545 550 555 560 Phe Asp Gly Ile Ala Thr Gly Tyr Leu Val Leu Lys Glu Leu Gly Ile 565 570 575 Lys Val Gly Lys Tyr Val Ala Ser Glu Val Cys Glu Glu Ser Ile Ala 580 585 590 Val Gly Thr Val Lys His Glu Gly Asn Ile Lys Tyr Val Asn Asp Val 595 600 605 Arg Asn Ile Thr Lys Lys Asn Ile Glu Glu Trp Gly Pro Phe Asp Leu 610 615 620 Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Asn Val Asn Pro Ala 625 630 635 640 Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr 645 650 655 His Leu Leu Asn Tyr Ser Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe 660 665 670 Phe Trp Met Phe Glu Asn Val Val Ala Met Lys Val Gly Asp Lys Arg 675 680 685 Asp Ile Ser Arg Phe Leu Glu Cys Asn Pro Val Met Ile Asp Ala Ile 690 695 700 Lys Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro 705 710 715 720 Gly Met Asn Arg Pro Val Ile Ala Ser Lys Asn Asp Lys Leu Glu Leu 725 730 735 Gln Asp Cys Leu Glu Tyr Asn Arg Ile Ala Lys Asp Leu Trp Leu Ser 740 745 750 Cys Ala Leu His Arg Arg Val Gln His Gly Pro Trp Cys Pro Pro Glu 755 760 765 Ala Ala Gly Lys Val Leu Glu Arg Ala Cys His Pro Thr Pro Leu Arg 770 775 780 Pro Ser Glu Gly Leu Leu Cys Met 785 790 <210> 218 <211> 1084 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 218 Met Ser Ser Gln Ser His Pro Asp Gly Leu Ser Gly Arg Asp Gln Pro 1 5 10 15 Val Glu Leu Leu Asn Pro Ala Arg Val Asn His Met Pro Ser Thr Val 20 25 30 Asp Val Ala Thr Ala Leu Pro Leu Gln Val Ala Pro Ser Ala Val Pro 35 40 45 Met Asp Leu Arg Leu Asp His Gln Phe Ser Leu Pro Val Ala Glu Pro 50 55 60 Ala Leu Arg Glu Gln Gln Leu Gln Gln Glu Leu Leu Ala Leu Lys Gln 65 70 75 80 Lys Gln Gln Ile Gln Arg Gln Ile Leu Ile Ala Glu Phe Gln Arg Gln 85 90 95 His Glu Gln Leu Ser Arg Gln His Glu Ala Gln Leu His Glu His Ile 100 105 110 Lys Gln Gln Gln Glu Met Leu Ala Met Lys His Gln Gln Glu Leu Leu 115 120 125 Glu His Gln Arg Lys Leu Glu Arg His Arg Gln Glu Gln Glu Leu Glu 130 135 140 Lys Gln His Arg Glu Gln Lys Leu Gln Gln Leu Lys Asn Lys Glu Lys 145 150 155 160 Gly Lys Glu Ser Ala Val Ala Ser Thr Glu Val Lys Met Lys Leu Gln 165 170 175 Glu Phe Val Leu Asn Lys Lys Lys Ala Leu Ala His Arg Asn Leu Asn 180 185 190 His Cys Ile Ser Ser Asp Pro Arg Tyr Trp Tyr Gly Lys Thr Gln His 195 200 205 Ser Ser Leu Asp Gln Ser Ser Pro Pro Gln Ser Gly Val Ser Thr Ser 210 215 220 Tyr Asn His Pro Val Leu Gly Met Tyr Asp Ala Lys Asp Asp Phe Pro 225 230 235 240 Leu Arg Lys Thr Ala Ser Glu Pro Asn Leu Lys Leu Arg Ser Arg Leu 245 250 255 Lys Gln Lys Val Ala Glu Arg Arg Ser Ser Pro Leu Leu Arg Arg Lys 260 265 270 Asp Gly Pro Val Val Thr Ala Leu Lys Lys Arg Pro Leu Asp Val Thr 275 280 285 Asp Ser Ala Cys Ser Ser Ala Pro Gly Ser Gly Pro Ser Ser Pro Asn 290 295 300 Asn Ser Ser Gly Ser Val Ser Ala Glu Asn Gly Ile Ala Pro Ala Val 305 310 315 320 Pro Ser Ile Pro Ala Glu Thr Ser Leu Ala His Arg Leu Val Ala Arg 325 330 335 Glu Gly Ser Ala Ala Pro Leu Pro Leu Tyr Thr Ser Pro Ser Leu Pro 340 345 350 Asn Ile Thr Leu Gly Leu Pro Ala Thr Gly Pro Ser Ala Gly Thr Ala 355 360 365 Gly Gln Gln Asp Thr Glu Arg Leu Thr Leu Pro Ala Leu Gln Gln Arg 370 375 380 Leu Ser Leu Phe Pro Gly Thr His Leu Thr Pro Tyr Leu Ser Thr Ser 385 390 395 400 Pro Leu Glu Arg Asp Gly Gly Ala Ala His Ser Pro Leu Leu Gln His 405 410 415 Met Val Leu Leu Glu Gln Pro Pro Ala Gln Ala Pro Leu Val Thr Gly 420 425 430 Leu Gly Ala Leu Pro Leu His Ala Gln Ser Leu Val Gly Ala Asp Arg 435 440 445 Val Ser Pro Ser Ile His Lys Leu Arg Gln His Arg Pro Leu Gly Arg 450 455 460 Thr Gln Ser Ala Pro Leu Pro Gln Asn Ala Gln Ala Leu Gln His Leu 465 470 475 480 Val Ile Gln Gln Gln His Gln Gln Phe Leu Glu Lys His Lys Gln Gln 485 490 495 Phe Gln Gln Gln Gln Leu Gln Met Asn Lys Ile Ile Pro Lys Pro Ser 500 505 510 Glu Pro Ala Arg Gln Pro Glu Ser His Pro Glu Glu Thr Glu Glu Glu 515 520 525 Leu Arg Glu His Gln Ala Leu Leu Asp Glu Pro Tyr Leu Asp Arg Leu 530 535 540 Pro Gly Gln Lys Glu Ala His Ala Gln Ala Gly Val Gln Val Lys Gln 545 550 555 560 Glu Pro Ile Glu Ser Asp Glu Glu Glu Ala Glu Pro Pro Arg Glu Val 565 570 575 Glu Pro Gly Gln Arg Gln Pro Ser Glu Gln Glu Leu Leu Phe Arg Gln 580 585 590 Gln Ala Leu Leu Leu Glu Gln Gln Arg Ile His Gln Leu Arg Asn Tyr 595 600 605 Gln Ala Ser Met Glu Ala Ala Gly Ile Pro Val Ser Phe Gly Gly His 610 615 620 Arg Pro Leu Ser Arg Ala Gln Ser Ser Pro Ala Ser Ala Thr Phe Pro 625 630 635 640 Val Ser Val Gln Glu Pro Pro Thr Lys Pro Arg Phe Thr Thr Gly Leu 645 650 655 Val Tyr Asp Thr Leu Met Leu Lys His Gln Cys Thr Cys Gly Ser Ser 660 665 670 Ser Ser His Pro Glu His Ala Gly Arg Ile Gln Ser Ile Trp Ser Arg 675 680 685 Leu Gln Glu Thr Gly Leu Arg Gly Lys Cys Glu Cys Ile Arg Gly Arg 690 695 700 Lys Ala Thr Leu Glu Glu Leu Gln Thr Val His Ser Glu Ala His Thr 705 710 715 720 Leu Leu Tyr Gly Thr Asn Pro Leu Asn Arg Gln Lys Leu Asp Ser Lys 725 730 735 Lys Leu Leu Gly Ser Leu Ala Ser Val Phe Val Arg Leu Pro Cys Gly 740 745 750 Gly Val Gly Val Asp Ser Asp Thr Ile Trp Asn Glu Val His Ser Ala 755 760 765 Gly Ala Ala Arg Leu Ala Val Gly Cys Val Val Glu Leu Val Phe Lys 770 775 780 Val Ala Thr Gly Glu Leu Lys Asn Gly Phe Ala Val Val Arg Pro Pro 785 790 795 800 Gly His His Ala Glu Glu Ser Thr Pro Met Gly Phe Cys Tyr Phe Asn 805 810 815 Ser Val Ala Val Ala Ala Lys Leu Leu Gln Gln Arg Leu Ser Val Ser 820 825 830 Lys Ile Leu Ile Val Asp Trp Asp Val His His Gly Asn Gly Thr Gln 835 840 845 Gln Ala Phe Tyr Ser Asp Pro Ser Val Leu Tyr Met Ser Leu His Arg 850 855 860 Tyr Asp Asp Gly Asn Phe Phe Pro Gly Ser Gly Ala Pro Asp Glu Val 865 870 875 880 Gly Thr Gly Pro Gly Val Gly Phe Asn Val Asn Met Ala Phe Thr Gly 885 890 895 Gly Leu Asp Pro Pro Met Gly Asp Ala Glu Tyr Leu Ala Ala Phe Arg 900 905 910 Thr Val Val Met Pro Ile Ala Ser Glu Phe Ala Pro Asp Val Val Leu 915 920 925 Val Ser Ser Gly Phe Asp Ala Val Glu Gly His Pro Thr Pro Leu Gly 930 935 940 Gly Tyr Asn Leu Ser Ala Arg Cys Phe Gly Tyr Leu Thr Lys Gln Leu 945 950 955 960 Met Gly Leu Ala Gly Gly Arg Ile Val Leu Ala Leu Glu Gly Gly His 965 970 975 Asp Leu Thr Ala Ile Cys Asp Ala Ser Glu Ala Cys Val Ser Ala Leu 980 985 990 Leu Gly Asn Glu Leu Asp Pro Leu Pro Glu Lys Val Leu Gln Gln Arg 995 1000 1005 Pro Asn Ala Asn Ala Val Arg Ser Met Glu Lys Val Met Glu Ile 1010 1015 1020 His Ser Lys Tyr Trp Arg Cys Leu Gln Arg Thr Thr Ser Thr Ala 1025 1030 1035 Gly Arg Ser Leu Ile Glu Ala Gln Thr Cys Glu Asn Glu Glu Ala 1040 1045 1050 Glu Thr Val Thr Ala Met Ala Ser Leu Ser Val Gly Val Lys Pro 1055 1060 1065 Ala Glu Lys Arg Pro Asp Glu Glu Pro Met Glu Glu Glu Pro Pro 1070 1075 1080 Leu <210> 219 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(9) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (11)..(23) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (25)..(30) <223> Xaa can be any naturally occurring amino acid <400> 219 Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa His 20 25 30 <210> 220 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (1)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(6) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (8)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (20)..(22) <223> Xaa can be any naturally occurring amino acid <400> 220 Xaa Xaa Xaa Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa His Xaa Xaa Xaa His 20 <210> 221 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (16)..(22) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (44)..(50) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (72)..(78) <223> Xaa can be any naturally occurring amino acid <400> 221 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 35 40 45 Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 222 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (16)..(22) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (44)..(50) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (72)..(78) <223> Xaa can be any naturally occurring amino acid <400> 222 Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 35 40 45 Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 223 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 223 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gly 1 5 10 15 Arg Gln Ala Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Asp Lys Ala Asn Leu 35 40 45 Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 224 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 224 Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Arg 1 5 10 15 Gln Asp Arg Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gln Lys Glu His Leu 35 40 45 Ala Gly His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Arg Arg Asp Asn Leu Asn Arg His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 225 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 225 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Arg 1 5 10 15 Gln Asp Arg Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gln Lys Glu His Leu 35 40 45 Ala Gly His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Arg Arg Asp Asn Leu Asn Arg His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 226 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 226 Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Thr 1 5 10 15 Gly Gln Ile Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Val Ala His Ser Leu 35 40 45 Lys Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Asp Pro Ser Asn Leu Arg Arg His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 227 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 227 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Thr 1 5 10 15 Gly Gln Ile Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Val Ala His Ser Leu 35 40 45 Lys Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Ala Asn Phe Ser Asp Pro Ser Asn Leu Arg Arg His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 228 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 228 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg 1 5 10 15 Gln Ser Asn Leu Ser Arg His Thr Arg Thr His Thr Gly Glu Lys Pro 20 25 30 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Asn Glu His Leu 35 40 45 Val Leu His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 50 55 60 Ile Cys Met Arg Asn Phe Ser Gln Lys Thr Gly Leu Arg Val His Leu 65 70 75 80 Lys Thr His Leu Arg 85 <210> 229 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 229 cgaagacgct g 11 <210> 230 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 230 agagtgagga c 11 <210> 231 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 231 acagtgagga c 11 <210> 232 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 232 atagtgagga c 11 <210> 233 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 233 agacgctgct c 11 <210> 234 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 234 tgacgctgct t 11 <210> 235 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 235 agacggtgct c 11 <210> 236 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 236 acacgctgct c 11 <210> 237 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 237 agacgctact c 11 <210> 238 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 238 agacgctgct a 11 <210> 239 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 239 agactctgct c 11 <210> 240 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 240 attatgggag a 11 <210> 241 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 241 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg 180 <210> 242 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 242 Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val 35 40 45 Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu 50 55 60 Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu 165 170 175 Thr Thr Met Arg 180 <210> 243 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 243 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr 1 5 10 15 Ile Val Val Ser Met Thr Gly Arg Asp Lys Thr Glu Gln Ala Gly Glu 20 25 30 Ile Gln Val Leu Ser Thr Val Thr Gln Ser Phe Leu Gly Thr Ser Ile 35 40 45 Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu 50 55 60 Ala Gly Ser Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu Gly 65 70 75 80 Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu Pro 85 90 95 Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu Ser 115 120 125 Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu 130 135 140 Cys Pro Arg Gly His Ala Val Gly Val Phe Arg Ala Ala Val Cys Ser 145 150 155 160 Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu Asp 165 170 175 Ile Val Thr Arg 180 <210> 244 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 244 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr 1 5 10 15 Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Val Val Thr Gly Glu 20 25 30 Val Gln Val Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Thr Thr Val 35 40 45 Gly Gly Val Ile Trp Thr Val Tyr His Gly Ala Gly Ser Arg Thr Leu 50 55 60 Ala Gly Ala Lys His Pro Ala Leu Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Lys Ser Leu Glu Pro 85 90 95 Cys Ala Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Asp Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Ser Thr Ala Ser Leu Leu Ser 115 120 125 Pro Arg Pro Leu Ala Cys Leu Lys Gly Ser Ser Gly Gly Pro Val Met 130 135 140 Cys Pro Ser Gly His Val Ala Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ser Leu Gln Phe Ile Pro Val Glu Thr Leu Ser 165 170 175 Thr Gln Ala Arg 180 <210> 245 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 245 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Phe Ser Thr 1 5 10 15 Ile Val Thr Ser Leu Thr Gly Arg Asp Thr Asn Glu Asn Cys Gly Glu 20 25 30 Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Gly Thr Ala Val 35 40 45 Asn Gly Val Met Trp Thr Val Tyr His Gly Ala Gly Ala Lys Thr Ile 50 55 60 Ser Gly Pro Lys Gly Pro Val Asn Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Val Arg Ser Leu Ala Pro 85 90 95 Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Thr Arg Gly Ala Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Ile Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Met Gly His Arg Ala Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Leu Glu 165 170 175 Thr Thr Met Arg 180 <210> 246 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 246 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Val Leu Gly Ala 1 5 10 15 Ile Val Leu Ser Leu Thr Gly Arg Asp Lys Asn Glu Ala Glu Gly Glu 20 25 30 Val Gln Phe Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Ile Cys Ile 35 40 45 Asn Gly Val Met Trp Thr Leu Phe His Gly Ala Gly Ser Lys Thr Leu 50 55 60 Ala Gly Pro Lys Gly Pro Val Val Gln Met Tyr Thr Asn Val Asp Lys 65 70 75 80 Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Lys Gly Ser Leu Thr Arg 85 90 95 Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Thr Arg Ala Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Ile Met 130 135 140 Cys Pro Ser Gly His Val Val Gly Val Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Leu Glu Phe Val Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg 180 <210> 247 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 247 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Val Gly Thr 1 5 10 15 Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Glu Ala Glu Gly Glu 20 25 30 Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Thr Ile 35 40 45 Asn Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Ser Lys Asn Leu 50 55 60 Ala Gly Pro Lys Gly Pro Val Cys Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Leu Gly Ala Arg Ser Leu Ala Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Gly Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Thr Arg Ala Ala Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Leu Met 130 135 140 Cys Pro Ser Gly His Val Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Leu Asp Phe Ile Pro Val Glu Asn Met Asp 165 170 175 Thr Thr Met Arg 180 <210> 248 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 248 Ala Pro Ile Ser Ala Tyr Ala Gln Gln Thr Arg Gly Leu Ile Ser Thr 1 5 10 15 Leu Val Val Ser Leu Thr Gly Arg Asp Lys Asn Glu Thr Ala Gly Glu 20 25 30 Val Gln Val Leu Ser Thr Ser Thr Gln Thr Phe Leu Gly Thr Asn Val 35 40 45 Gly Gly Val Met Trp Gly Pro Tyr His Gly Ala Gly Thr Arg Thr Val 50 55 60 Ala Gly Arg Gly Gly Pro Val Leu Gln Met Tyr Thr Ser Val Ser Asp 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ser Lys Ser Leu Glu Pro 85 90 95 Cys Ser Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp 100 105 110 Val Leu Pro Leu Arg Arg Lys Gly Asp Gly Thr Ala Ser Leu Leu Ser 115 120 125 Pro Arg Pro Val Ser Ser Leu Lys Gly Ser Ser Gly Gly Pro Val Leu 130 135 140 Cys Pro Gln Ser His Cys Val Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Gln Phe Val Pro Ile Glu Lys Met Gln 165 170 175 Val Ala Gln Arg 180 <210> 249 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 249 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Thr Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg 180 <210> 250 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 250 Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val 35 40 45 Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu 50 55 60 Ala Ala Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Lys Pro Pro Gly Ala Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Phe Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu 165 170 175 Thr Thr Met Arg 180 <210> 251 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 251 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr 1 5 10 15 Ile Val Val Ser Met Thr Gly Arg Asp Lys Thr Glu Gln Ala Gly Glu 20 25 30 Ile Gln Val Leu Ser Thr Val Thr Gln Ser Phe Leu Gly Thr Thr Ile 35 40 45 Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu 50 55 60 Ala Gly Ser Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu Gly 65 70 75 80 Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu Pro 85 90 95 Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu Ser 115 120 125 Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu 130 135 140 Cys Pro Arg Gly His Ala Val Gly Val Phe Arg Ala Ala Val Cys Ser 145 150 155 160 Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu Asp 165 170 175 Ile Val Thr Arg 180 <210> 252 <211> 182 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 252 Ala Pro Ile Thr Ala Tyr Thr Gln Gln Thr Arg Gly Leu Leu Gly Ala 1 5 10 15 Ile Val Val Ser Leu Thr Gly Arg Asp Lys Asn Glu Gln Ala Gly Gln 20 25 30 Val Gln Val Leu Ser Ser Val Thr Gln Thr Phe Leu Gly Thr Ser Ile 35 40 45 Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu 50 55 60 Ala Gly Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Ser Ala Glu Gly 65 70 75 80 Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Asp Pro 85 90 95 Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Lys Asp Asp Arg Arg Gly Ala Leu Leu Ser 115 120 125 Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu 130 135 140 Cys Ser Arg Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Ser Tyr 145 150 155 160 Asn Thr Phe Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Ser 165 170 175 Leu Asp Val Ala Thr Arg 180 <210> 253 <211> 180 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 253 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr 1 5 10 15 Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Val Val Thr Gly Glu 20 25 30 Val Gln Val Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Thr Thr Val 35 40 45 Gly Gly Val Ile Trp Thr Val Tyr His Gly Ala Gly Ser Arg Thr Leu 50 55 60 Ala Gly Ala Lys His Pro Ala Leu Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Lys Ser Leu Glu Pro 85 90 95 Cys Ala Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Asp Ala Asp 100 105 110 Val Ile Pro Ala Arg Arg Arg Gly Asp Ser Thr Ala Ser Leu Leu Ser 115 120 125 Pro Arg Pro Leu Ala Cys Leu Lys Gly Ser Ser Gly Gly Pro Val Met 130 135 140 Cys Pro Ser Gly His Val Ala Gly Ile Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ser Leu Gln Phe Ile Pro Val Glu Thr Leu Ser 165 170 175 Thr Gln Ala Arg 180 <210> 254 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 254 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp 180 185 <210> 255 <211> 186 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 255 Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys 1 5 10 15 Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 20 25 30 Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu Ala Thr Cys Ile 35 40 45 Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile 50 55 60 Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys 65 70 75 80 Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro 85 90 95 Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 100 105 110 Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly Ser Leu Leu Ser 115 120 125 Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 130 135 140 Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr 145 150 155 160 Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val Glu Asn Leu Glu 165 170 175 Thr Thr Met Arg Ser Pro Val Phe Thr Asp 180 185 <210> 256 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 256 Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser 1 5 10 <210> 257 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 257 Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys 1 5 10 <210> 258 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 258 Gly Cys Val Cys Ile Ile Gly Arg Leu His Ile Asn Gln Arg 1 5 10 <210> 259 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 259 Gly Cys Val Val Ile Val Gly His Ile Glu Leu Glu Gly Lys 1 5 10 <210> 260 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 260 Gly Ser Val Val Ile Val Gly Arg Val Val Leu Ser Gly Gln 1 5 10 <210> 261 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 261 Gly Ser Val Ala Ile Val Gly Arg Ile Ile Leu Ser Gly Arg 1 5 10 <210> 262 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 262 Gly Cys Val Val Ile Cys Gly Arg Ile Val Thr Ser Gly Lys 1 5 10 <210> 263 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 263 Gly Ser Val Val Val Val Gly Arg Val Val Leu Gly Ser Asn 1 5 10 <210> 264 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 264 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 20 25 30 Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 265 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 265 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Val Val Leu Ser 20 25 30 Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 266 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 266 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 20 25 30 Gly Arg Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 267 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 267 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser 20 25 30 Gly Arg Pro Ala Ile Val Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 268 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 268 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser 20 25 30 Gly Arg Pro Ala Ile Ile Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 269 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 269 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser 20 25 30 Gly Lys Pro Ala Val Val Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 270 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 270 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser 20 25 30 Gly Arg Pro Ala Val Ile Pro Asp Arg Glu Leu Leu Tyr Arg Glu Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 271 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 271 Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr 1 5 10 15 Cys Leu Ala Thr Gly Cys Val Cys Ile Ile Gly Arg Leu His Val Asn 20 25 30 Gln Arg Ala Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 272 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 272 Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr 1 5 10 15 Cys Leu Ala Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Ile Asn 20 25 30 Gly Arg Ala Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 273 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 273 Ser Ser Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr 1 5 10 15 Cys Leu Ala Thr Gly Cys Ile Ser Ile Ile Gly Arg Leu His Leu Asn 20 25 30 Asp Arg Val Val Val Ala Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 274 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 274 Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr 1 5 10 15 Cys Leu Ala Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Leu Asn 20 25 30 Asp Gln Val Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 275 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 275 Ser Thr Trp Val Leu Leu Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 1 5 10 15 Cys Leu Ser Val Gly Cys Val Val Ile Val Gly His Ile Glu Leu Glu 20 25 30 Gly Lys Pro Ala Leu Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 276 <211> 54 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 276 Ser Thr Trp Val Leu Leu Gly Gly Val Leu Ala Ala Val Ala Ala Tyr 1 5 10 15 Cys Leu Ser Val Gly Cys Val Val Ile Val Gly His Ile Glu Leu Gly 20 25 30 Gly Lys Pro Ala Leu Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr 35 40 45 Asp Glu Met Glu Glu Cys 50 <210> 277 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 277 Ser Gly Thr Ser 1 <210> 278 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 278 Gly Ser Gly Ser 1 <210> 279 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 279 Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 1 5 10 <210> 280 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 280 Glu Asp Val Val Cys Cys His Ser Ile 1 5 <210> 281 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 281 Asp Glu Met Glu Glu Cys Ser Gln His 1 5 <210> 282 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 282 Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val 1 5 10 15 Gly Gly Val Leu 20 <210> 283 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 283 Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val 1 5 10 15 Gly Gly Val Leu 20 <210> 284 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 284 Cys Met Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp Val Leu Ala 1 5 10 15 Gly Gly Val Leu 20 <210> 285 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 285 Cys Met Gln Ala Asp Leu Glu Ile Met Thr Ser Ser Trp Val Leu Ala 1 5 10 15 Gly Gly Val Leu 20 <210> 286 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 286 Cys Met Ser Ala Asp Leu Glu Val Thr Thr Ser Thr Trp Val Leu Leu 1 5 10 15 Gly Gly Val Leu 20 <210> 287 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 287 Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Tyr 1 5 10 15 Ile Glu Gln Gly 20 <210> 288 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 288 Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser His Leu Pro Tyr 1 5 10 15 Ile Glu Gln Gly 20 <210> 289 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 289 Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser Arg Ala Ala Leu 1 5 10 15 Ile Glu Glu Gly 20 <210> 290 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 290 Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser Lys Ala Ala Leu 1 5 10 15 Ile Glu Glu Gly 20 <210> 291 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 291 Tyr Gln Gln Tyr Asp Glu Met Glu Glu Cys Ser Gln Ala Ala Pro Tyr 1 5 10 15 Ile Glu Gln Ala 20 <210> 292 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 292 Trp Ile Ser Ser Glu Cys Thr Thr Pro Cys Ser Gly Ser Trp Leu Arg 1 5 10 15 Asp Val Trp Asp 20 <210> 293 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 293 Trp Ile Asn Glu Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp Leu Arg 1 5 10 15 Asp Val Trp Asp 20 <210> 294 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 294 Trp Ile Thr Glu Asp Cys Pro Ile Pro Cys Ser Gly Ser Trp Leu Arg 1 5 10 15 Asp Val Trp Asp 20 <210> 295 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 295 Trp Ile Thr Glu Asp Cys Pro Val Pro Cys Ser Gly Ser Trp Leu Gln 1 5 10 15 Asp Ile Trp Asp 20 <210> 296 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 296 Trp Ile Asn Glu Asp Tyr Pro Ser Pro Cys Ser Asp Asp Trp Leu Arg 1 5 10 15 Thr Ile Trp Asp 20 <210> 297 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 297 Gly Ala Asp Thr Glu Asp Val Val Cys Cys Ser Met Ser Tyr Ser Trp 1 5 10 15 Thr Gly Ala Leu 20 <210> 298 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 298 Glu Glu Ala Ser Glu Asp Val Val Cys Cys Ser Met Ser Tyr Thr Trp 1 5 10 15 Thr Gly Ala Leu 20 <210> 299 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 299 Ser Glu Glu Asp Asp Ser Val Val Cys Cys Ser Met Ser Tyr Ser Trp 1 5 10 15 Thr Gly Ala Leu 20 <210> 300 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 300 Ser Asp Gln Glu Asp Ser Val Ile Cys Cys Ser Met Ser Tyr Ser Trp 1 5 10 15 Thr Gly Ala Leu 20 <210> 301 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 301 Asp Ser Glu Glu Gln Ser Val Val Cys Cys Ser Met Ser Tyr Ser Trp 1 5 10 15 Thr Gly Ala Leu 20 <210> 302 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 302 Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His 1 5 10 <210> 303 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 303 Gly Gly Ser Gly Gly 1 5 <210> 304 <211> 221 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 304 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 1 5 10 15 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 20 25 30 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 35 40 45 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 50 55 60 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 65 70 75 80 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 85 90 95 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 100 105 110 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 115 120 125 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu 130 135 140 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 145 150 155 160 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 165 170 175 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 180 185 190 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 195 200 205 Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser 210 215 220 <210> 305 <211> 221 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 305 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 1 5 10 15 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 20 25 30 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 35 40 45 Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr 50 55 60 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 65 70 75 80 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 85 90 95 Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 100 105 110 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 115 120 125 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly Ser Leu 130 135 140 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 145 150 155 160 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 165 170 175 Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn 180 185 190 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 195 200 205 Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser 210 215 220 <210> 306 <211> 221 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 306 Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly 1 5 10 15 Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu 20 25 30 Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu 35 40 45 Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu Ala Thr 50 55 60 Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg 65 70 75 80 Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val 85 90 95 Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu 100 105 110 Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His 115 120 125 Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly Ser Leu 130 135 140 Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro 145 150 155 160 Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val 165 170 175 Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val Glu Asn 180 185 190 Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro 195 200 205 Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser 210 215 220 <210> 307 <211> 182 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 307 Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly 1 5 10 15 Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly 20 25 30 Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys 35 40 45 Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr 50 55 60 Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp 65 70 75 80 Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr 85 90 95 Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala 100 105 110 Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu 115 120 125 Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu 130 135 140 Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys 145 150 155 160 Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu 165 170 175 Glu Thr Thr Met Arg Ser 180 <210> 308 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 308 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Asn 1 5 10 15 Gly Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr 20 25 30 Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile 35 40 45 Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val 50 55 60 Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro 65 70 75 80 Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val 85 90 95 Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys 100 105 110 Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro 115 120 125 Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro 130 135 140 Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala 145 150 155 160 Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val 165 170 175 Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr Met 180 185 190 Arg Ser Pro 195 <210> 309 <211> 195 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 309 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Asn 1 5 10 15 Gly Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln Glu Thr 20 25 30 Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile 35 40 45 Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val 50 55 60 Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro 65 70 75 80 Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val 85 90 95 Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys 100 105 110 Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro 115 120 125 Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro 130 135 140 Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala 145 150 155 160 Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val 165 170 175 Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr Met 180 185 190 Arg Ser Pro 195 <210> 310 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 310 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser 1 5 10 15 Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln 20 25 30 Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val 35 40 45 Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn 50 55 60 Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala 65 70 75 80 Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp 85 90 95 Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys 100 105 110 Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val 115 120 125 Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro 130 135 140 Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys 145 150 155 160 Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg 165 170 175 Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr 180 185 190 Thr Met Arg Ser Pro 195 <210> 311 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 311 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser 1 5 10 15 Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln 20 25 30 Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val 35 40 45 Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn 50 55 60 Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala 65 70 75 80 Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp 85 90 95 Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys 100 105 110 Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val 115 120 125 Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro 130 135 140 Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys 145 150 155 160 Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg 165 170 175 Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr 180 185 190 Thr Met Arg Ser Pro 195 <210> 312 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 312 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser 1 5 10 15 Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln 20 25 30 Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val 35 40 45 Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn 50 55 60 Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala 65 70 75 80 Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp 85 90 95 Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys 100 105 110 Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val 115 120 125 Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro 130 135 140 Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys 145 150 155 160 Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg 165 170 175 Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr 180 185 190 Thr Met Arg Ser Pro 195 <210> 313 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 313 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser 1 5 10 15 Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Gln Gly Cys Gln 20 25 30 Lys Thr Ser His Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val 35 40 45 Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn 50 55 60 Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala 65 70 75 80 Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp 85 90 95 Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys 100 105 110 Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val 115 120 125 Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro 130 135 140 Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys 145 150 155 160 Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg 165 170 175 Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr 180 185 190 Thr Met Arg Ser Pro 195 <210> 314 <211> 197 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 314 Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser 1 5 10 15 Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Gln Gly Thr Gln 20 25 30 Lys Thr Ser His Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val 35 40 45 Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn 50 55 60 Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala 65 70 75 80 Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp 85 90 95 Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys 100 105 110 Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val 115 120 125 Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro 130 135 140 Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys 145 150 155 160 Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg 165 170 175 Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr 180 185 190 Thr Met Arg Ser Pro 195 <210> 315 <211> 196 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 315 Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser Gly 1 5 10 15 Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln Glu 20 25 30 Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln 35 40 45 Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn Gly 50 55 60 Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser 65 70 75 80 Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp Leu 85 90 95 Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr 100 105 110 Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile 115 120 125 Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg 130 135 140 Pro Ile Ser Tyr Leu Lys Gly Ser Ala Gly Gly Pro Leu Leu Cys Pro 145 150 155 160 Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg Gly 165 170 175 Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr 180 185 190 Met Arg Ser Pro 195 <210> 316 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 316 Gly Glu Leu Asp Glu Leu Val Tyr Leu Leu Asp Gly Pro Gly Tyr Asp 1 5 10 15 Pro Ile His Ser Asp 20 <210> 317 <211> 158 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 317 Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu 1 5 10 15 Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg 20 25 30 Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser 35 40 45 Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln 50 55 60 Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala 65 70 75 80 Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly 85 90 95 Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr 100 105 110 His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu 115 120 125 Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala 130 135 140 Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg 145 150 155 <210> 318 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 318 Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro 1 5 10 15 Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp 20 25 30 Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe 35 40 45 Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala 50 55 60 Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr 65 70 75 80 Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr 85 90 95 Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu 100 105 <210> 319 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 319 Thr Arg Gly Val Glu Glu Val Ala Glu Gly Val Val Leu Leu Arg Arg 1 5 10 15 Arg Gly Asn <210> 320 <211> 229 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 320 Met Met Gly Ser Val Glu Leu Asn Leu Arg Glu Thr Glu Leu Cys Leu 1 5 10 15 Gly Leu Pro Gly Gly Asp Thr Val Ala Pro Val Thr Gly Asn Lys Arg 20 25 30 Gly Phe Ser Glu Thr Val Asp Leu Lys Leu Asn Leu Asn Asn Glu Pro 35 40 45 Ala Asn Lys Glu Gly Ser Thr Thr His Asp Val Val Thr Phe Asp Ser 50 55 60 Lys Glu Lys Ser Ala Cys Pro Lys Asp Pro Ala Lys Pro Pro Ala Lys 65 70 75 80 Ala Gln Val Val Gly Trp Pro Pro Val Arg Ser Tyr Arg Lys Asn Val 85 90 95 Met Val Ser Cys Gln Lys Ser Ser Gly Gly Pro Glu Ala Ala Ala Phe 100 105 110 Val Lys Val Ser Met Asp Gly Ala Pro Tyr Leu Arg Lys Ile Asp Leu 115 120 125 Arg Met Tyr Lys Ser Tyr Asp Glu Leu Ser Asn Ala Leu Ser Asn Met 130 135 140 Phe Ser Ser Phe Thr Met Gly Lys His Gly Gly Glu Glu Gly Met Ile 145 150 155 160 Asp Phe Met Asn Glu Arg Lys Leu Met Asp Leu Val Asn Ser Trp Asp 165 170 175 Tyr Val Pro Ser Tyr Glu Asp Lys Asp Gly Asp Trp Met Leu Val Gly 180 185 190 Asp Val Pro Trp Pro Met Phe Val Asp Thr Cys Lys Arg Leu Arg Leu 195 200 205 Met Lys Gly Ser Asp Ala Ile Gly Leu Ala Pro Arg Ala Met Glu Lys 210 215 220 Cys Lys Ser Arg Ala 225 <210> 321 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 321 Lys Glu Lys Ser Ala Cys Pro Lys Asp Pro Ala Lys Pro Pro Ala Lys 1 5 10 15 Ala Gln Val Val Gly Trp Pro Pro Val Arg Ser Tyr Arg Lys Asn Val 20 25 30 Met Val Ser Cys Gln Lys Ser Ser Gly Gly Pro Glu Ala Ala Ala Phe 35 40 45 Val Lys Val Ser Met Asp Gly Ala Pro Tyr Leu Arg Lys Ile Asp Leu 50 55 60 Arg Met Tyr Lys 65 <210> 322 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 322 Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala 1 5 10 15 Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu 20 25 30 Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr 35 40 <210> 323 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 323 Gly Ser Ser Gly Ser Ser 1 5 <210> 324 <211> 304 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 324 Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser 1 5 10 15 Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly 20 25 30 Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln 35 40 45 Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg 50 55 60 Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr 65 70 75 80 Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr 85 90 95 His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile 100 105 110 Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro 115 120 125 Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu 130 135 140 Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly 145 150 155 160 Asp Gly Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys 165 170 175 Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly 180 185 190 Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp 195 200 205 Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe 210 215 220 Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr 225 230 235 240 Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu 245 250 255 Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu 260 265 270 Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile 275 280 285 Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 290 295 300 <210> 325 <211> 297 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 325 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu 275 280 285 Asp Val Val Pro Cys Ser Met Gly Ser 290 295 <210> 326 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 326 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val 275 280 285 Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 290 295 300 <210> 327 <211> 304 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 327 Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser 1 5 10 15 Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly 20 25 30 Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln 35 40 45 Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg 50 55 60 Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr 65 70 75 80 Gln Thr Leu Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr 85 90 95 His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile 100 105 110 Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro 115 120 125 Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu 130 135 140 Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly 145 150 155 160 Asp Arg Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys 165 170 175 Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly 180 185 190 Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr 195 200 205 Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe 210 215 220 Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr 225 230 235 240 Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu 245 250 255 Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu 260 265 270 Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile 275 280 285 Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr 290 295 300 <210> 328 <211> 297 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 328 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu 275 280 285 Asp Val Val Pro Cys Ser Met Gly Ser 290 295 <210> 329 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 329 Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly 1 5 10 15 Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly 20 25 30 Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln 35 40 45 Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu 50 55 60 Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly 65 70 75 80 Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr 85 90 95 Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg 100 105 110 Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr 115 120 125 Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly 130 135 140 Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly 145 150 155 160 Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala 165 170 175 Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val 180 185 190 Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser 195 200 205 Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr 210 215 220 Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser 225 230 235 240 Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys 245 250 255 Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly 260 265 270 Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val 275 280 285 Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser 290 295 300 <210> 330 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 330 Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly 1 5 10 15 Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys 20 25 30 Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly 35 40 45 Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Thr Val Phe Cys Tyr Gly 50 55 60 Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys 65 70 75 80 Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met Asn Tyr Glu 85 90 95 Asp Gly Gly Ile Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp 100 105 110 Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn 115 120 125 Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Pro Ser Thr Glu 130 135 140 Lys Leu Tyr Val Arg Asp Gly Val Leu Lys Gly Asp Val Asn Met Ala 145 150 155 160 Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr 165 170 175 Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Phe Val Asp 180 185 190 His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn 195 200 205 Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Lys 210 215 220 <210> 331 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 331 Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly 1 5 10 15 Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys 20 25 30 Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly 35 40 45 Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Thr Val Phe Cys Tyr Gly 50 55 60 Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys 65 70 75 80 Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met Asn Tyr Glu 85 90 95 Asp Gly Gly Ile Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp 100 105 110 Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn 115 120 125 Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Pro Ser Thr Glu 130 135 140 Asn Leu Tyr Val Arg Asp Gly Val Leu Lys Gly Asp Val Asn Met Ala 145 150 155 160 Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr 165 170 175 Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Phe Val Asp 180 185 190 His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn 195 200 205 Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Lys 210 215 220 <210> 332 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 332 Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly 1 5 10 15 Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys 20 25 30 Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly 35 40 45 Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Met Ala Phe Cys Tyr Gly 50 55 60 Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys 65 70 75 80 Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met His Tyr Glu 85 90 95 Asp Gly Gly Ser Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp 100 105 110 Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn 115 120 125 Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Arg Ser Thr Glu 130 135 140 Asn Leu Tyr Val Arg Asp Gly Val Leu Lys Ser Asp Gly Asn Tyr Ala 145 150 155 160 Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr 165 170 175 Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Ser Val Asp 180 185 190 His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn 195 200 205 Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Asn 210 215 220 <210> 333 <211> 236 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 333 Met Val Ser Lys Gly Glu Glu Asn Asn Met Ala Ile Ile Lys Glu Phe 1 5 10 15 Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe 20 25 30 Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Ala Phe Gln Thr 35 40 45 Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp 50 55 60 Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Val Tyr Ile Lys His 65 70 75 80 Pro Ala Asp Ile Pro Asp Tyr Phe Lys Leu Ser Phe Pro Glu Gly Phe 85 90 95 Arg Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Ile Ile His Val 100 105 110 Asn Gln Asp Ser Ser Leu Gln Asp Gly Val Phe Ile Tyr Lys Val Lys 115 120 125 Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys 130 135 140 Thr Met Gly Trp Glu Ala Ser Glu Glu Arg Met Tyr Pro Glu Asp Gly 145 150 155 160 Ala His Lys Ala Glu Ile Lys Lys Arg Leu Lys Leu Lys Asp Gly Gly 165 170 175 His Tyr Ala Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val 180 185 190 Gln Leu Pro Gly Ala Tyr Ile Val Asp Ile Lys Leu Asp Ile Val Ser 195 200 205 His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly 210 215 220 Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 334 <211> 595 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 334 Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His 1 5 10 15 Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys 20 25 30 Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys 35 40 45 Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala 50 55 60 Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr 65 70 75 80 Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly 85 90 95 Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His 100 105 110 Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val 115 120 125 Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala 130 135 140 Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly 145 150 155 160 Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met 165 170 175 Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala 180 185 190 Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe 195 200 205 Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr 210 215 220 Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys 225 230 235 240 Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg 245 250 255 Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp 260 265 270 Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala 275 280 285 Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn 290 295 300 Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu 305 310 315 320 Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro 325 330 335 Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg 340 345 350 Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val 355 360 365 Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu 370 375 380 Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly 385 390 395 400 Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys 405 410 415 Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser 420 425 430 Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu 435 440 445 Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser 450 455 460 Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp 465 470 475 480 Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr 485 490 495 Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser 500 505 510 His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met 515 520 525 Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu 530 535 540 Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val 545 550 555 560 Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser 565 570 575 His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro 580 585 590 Ala Thr Val 595 <210> 335 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 335 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Gly Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Arg 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Met Leu Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Val 305 310 <210> 336 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 336 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Gly Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 337 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 337 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Ala Ala Leu Glu Met Leu Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Val 305 310 <210> 338 <211> 306 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 338 Pro Pro Gln Ile Glu Glu Ala Cys Glu Leu Pro Glu Cys Gln Val Asp 1 5 10 15 Ala Gly Asn Lys Val Cys Asn Leu Gln Cys Asn Asn His Ala Cys Gly 20 25 30 Trp Asp Gly Gly Asp Cys Ser Leu Asn Phe Asn Asp Pro Trp Lys Asn 35 40 45 Cys Thr Gln Ser Leu Gln Cys Trp Lys Tyr Phe Ser Asp Gly His Cys 50 55 60 Asp Ser Gln Cys Asn Ser Ala Gly Cys Leu Phe Asp Gly Phe Asp Cys 65 70 75 80 Gln Leu Thr Glu Gly Gln Cys Asn Pro Leu Tyr Asp Gln Tyr Cys Lys 85 90 95 Asp His Phe Ser Asp Gly His Cys Asp Gln Gly Cys Asn Ser Ala Glu 100 105 110 Cys Glu Trp Asp Gly Leu Asp Cys Ala Glu His Val Pro Glu Arg Leu 115 120 125 Ala Ala Gly Thr Leu Val Leu Val Val Leu Leu Pro Pro Asp Gln Leu 130 135 140 Arg Asn Asn Ser Phe His Phe Leu Arg Glu Leu Ser His Val Leu His 145 150 155 160 Thr Asn Val Val Phe Lys Arg Asp Ala Gln Gly Gln Gln Met Ile Phe 165 170 175 Pro Tyr Tyr Gly His Glu Glu Glu Leu Arg Lys His Pro Ile Lys Arg 180 185 190 Ser Thr Val Gly Trp Ala Thr Ser Ser Leu Leu Pro Gly Thr Ser Gly 195 200 205 Gly Arg Gln Arg Arg Glu Leu Asp Pro Met Asp Ile Arg Gly Ser Ile 210 215 220 Val Tyr Leu Glu Ile Asp Asn Arg Gln Cys Val Gln Ser Ser Ser Gln 225 230 235 240 Cys Phe Gln Ser Ala Thr Asp Val Ala Ala Phe Leu Gly Ala Leu Ala 245 250 255 Ser Leu Gly Ser Leu Asn Ile Pro Tyr Lys Ile Glu Ala Val Lys Ser 260 265 270 Glu Pro Val Glu Pro Pro Leu Pro Ser Gln Leu His Leu Met Tyr Val 275 280 285 Ala Ala Ala Ala Phe Val Leu Leu Phe Phe Val Gly Cys Gly Val Leu 290 295 300 Leu Ser 305 <210> 339 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 339 Pro Cys Val Gly Ser Asn Pro Cys Tyr Asn Gln Gly Thr Cys Glu Pro 1 5 10 15 Thr Ser Glu Asn Pro Phe Tyr Arg Cys Leu Cys Pro Ala Lys Phe Asn 20 25 30 Gly Leu Leu Cys His Ile Leu Asp Tyr Ser Phe Thr Gly Gly Ala Gly 35 40 45 Arg Asp Ile Pro Pro Pro Gln Ile Glu Glu Ala Cys Glu Leu Pro Glu 50 55 60 Cys Gln Val Asp Ala Gly Asn Lys Val Cys Asn Leu Gln Cys Asn Asn 65 70 75 80 His Ala Cys Gly Trp Asp Gly Gly Asp Cys Ser Leu Asn Phe Asn Asp 85 90 95 Pro Trp Lys Asn Cys Thr Gln Ser Leu Gln Cys Trp Lys Tyr Phe Ser 100 105 110 Asp Gly His Cys Asp Ser Gln Cys Asn Ser Ala Gly Cys Leu Phe Asp 115 120 125 Gly Phe Asp Cys Gln Leu Thr Glu Gly Gln Cys Asn Pro Leu Tyr Asp 130 135 140 Gln Tyr Cys Lys Asp His Phe Ser Asp Gly His Cys Asp Gln Gly Cys 145 150 155 160 Asn Ser Ala Glu Cys Glu Trp Asp Gly Leu Asp Cys Ala Glu His Val 165 170 175 Pro Glu Arg Leu Ala Ala Gly Thr Leu Val Leu Val Val Leu Leu Pro 180 185 190 Pro Asp Gln Leu Arg Asn Asn Ser Phe His Phe Leu Arg Glu Leu Ser 195 200 205 His Val Leu His Thr Asn Val Val Phe Lys Arg Asp Ala Gln Gly Gln 210 215 220 Gln Met Ile Phe Pro Tyr Tyr Gly His Glu Glu Glu Leu Arg Lys His 225 230 235 240 Pro Ile Lys Arg Ser Thr Val Gly Trp Ala Thr Ser Ser Leu Leu Pro 245 250 255 Gly Thr Ser Gly Gly Arg Gln Arg Arg Glu Leu Asp Pro Met Asp Ile 260 265 270 Arg Gly Ser Ile Val Tyr Leu Glu Ile Asp Asn Arg Gln Cys Val Gln 275 280 285 Ser Ser Ser Gln Cys Phe Gln Ser Ala Thr Asp Val Ala Ala Phe Leu 290 295 300 Gly Ala Leu Ala Ser Leu Gly Ser Leu Asn Ile Pro Tyr Lys Ile Glu 305 310 315 320 Ala Val Lys Ser Glu Pro Val Glu Pro Pro Leu Pro Ser Gln Leu His 325 330 335 Leu Met Tyr Val Ala Ala Ala Ala Phe Val Leu Leu Phe Phe Val Gly 340 345 350 Cys Gly Val Leu Leu Ser 355 <210> 340 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 340 Pro Gly Glu Arg 1 <210> 341 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 341 Thr Gly Ser Gln Lys 1 5 <210> 342 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 342 Thr Gly Glu Lys Pro 1 5 <210> 343 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 343 Thr His Leu Arg 1 <210> 344 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 344 Thr Gly Gly Gly Glu Lys Pro 1 5 <210> 345 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 345 Phe His Tyr Asp Arg Asn Asn Ile Ala Val Gly Ala Asp Glu Ser Val 1 5 10 15 Val Lys Glu Ala His Arg Glu Val Ile Asn Ser Ser Thr Glu Gly Leu 20 25 30 Leu Leu Asn Ile Asp Lys Asp Ile Arg Lys Ile Leu Ser Gly Tyr Ile 35 40 45 Val Glu Ile Glu Asp Thr Glu 50 55 <210> 346 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 346 Val Glu Ile Glu Asp Thr Glu 1 5 <210> 347 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 347 Lys Asp Ile Arg Lys Ile Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp 1 5 10 15 Thr Glu <210> 348 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 348 Ser Thr Glu Gly Leu Leu Leu Asn Ile Asp Lys Asp Ile Arg Lys Ile 1 5 10 15 Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp Thr Glu 20 25 <210> 349 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 349 Glu Val Lys Gln Glu Asn Arg Leu Leu Asn Glu Ser Glu Ser 1 5 10 <210> 350 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 350 Val Gly Ala Asp Glu Ser Val Val Lys Glu Ala His Arg Glu Val Ile 1 5 10 15 Asn Ser Ser Thr Glu Gly Leu Leu Leu Asn Ile Asp Lys Asp Ile Arg 20 25 30 Lys Ile Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp Thr Glu 35 40 45 <210> 351 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 351 Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly 1 5 10 15 Gly Ser Gly Gly Ser Gly Gly Ser 20 <210> 352 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 352 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 1 5 10 15 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Gly Ser 35 40 <210> 353 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 353 Gly Gly Gly Gly Ser 1 5 <210> 354 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 354 Gly Gly Ser Gly Gly Ser 1 5 <210> 355 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 355 Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 1 5 10 15 <210> 356 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 356 Thr Gly Ser Lys Pro 1 5 <210> 357 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 357 Thr Gly Gln Lys Pro 1 5 <210> 358 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 358 Thr Gly Gly Lys Pro 1 5 <210> 359 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 359 Thr Gly Ser Gln Lys Pro 1 5 <210> 360 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 360 Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu 1 5 10 15 Glu Asn Pro Gly Pro 20 <210> 361 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 361 Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp 1 5 10 15 Val Glu Ser Asn Pro Gly Pro 20 <210> 362 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 362 Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala 1 5 10 15 Gly Asp Val Glu Ser Asn Pro Gly Pro 20 25 <210> 363 <211> 494 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 363 ccgataaaat aaaagatttt atttagtctc cagaaaaagg ggggaatgaa agaccccacc 60 tgtaggttat ggcaagctag ctgcagtaac gccattattg caaggcatgg aaaaatacca 120 aaccaagaat agagaagttc agatcaaggg cgggtacatg aaaatagcta acgtagggcc 180 aaacaggata tctgcggtga gcagtttcgg ccccggcccg gggccaagaa cagatggtca 240 ccgcagtttc ggccccggcc cgaggccaag agcagatggt ccccagatat ggcccaaccc 300 tcagcagttt cttaagaccc atcagatgtt tccaggctcc cccaaggacc tgaaatgacc 360 ctgcgcctta tttgaattaa ccaatcagcc tgcttctcgc ttctgttcgc gcgcttctgc 420 ttcccgagct ctataaaaga gctcacaacc cctcactcgg cgcgccagtc ctccgacaga 480 ctgagtcgcc cggg 494 <210> 364 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 364 gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420 agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540 aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctc 588 <210> 365 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 365 taggcgtgta cggtgggagg cctatataag cagagctcgt ttagtgaacc gtcagatcgc 60 ctgga 65 <210> 366 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 366 ttcgcatatt aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct 60 taa 63 <210> 367 <211> 180 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 367 cgccaaatgg cagtattcat ccacaatttt aaaagaaaag gggggattgg ggggtacagt 60 gcaggggaaa gaatagtaga cataatagca acagacatac aaactaaaga attacaaaaa 120 caaattacaa aaattcaaaa ttttcgggtt tattacaggg acagcagaga tccagtttgg 180 <210> 368 <211> 592 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 368 taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 60 tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 120 tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 180 gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 240 tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 300 tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 360 gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 420 cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 480 caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 540 tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc at 592 <210> 369 <211> 636 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 369 gttggaaggg ctaattcact cccaaagaag acaagatatc cttgatctgt ggatctacca 60 cacacaaggc tacttccctg attagcagaa ctacacacca gggccagggg tcagatatcc 120 actgaccttt ggatggtgct acaagctagt accagttgag ccagataagg tagaagaggc 180 caataaagga gagaacacca gcttgttaca ccctgtgagc ctgcatggga tggatgaccc 240 ggagagagaa gtgttagagt ggaggtttga cagccgccta gcatttcatc acgtggcccg 300 agagctgcat ccggagtact tcaagaactg ctgatatcga gcttgctaca agggactttc 360 cgctggggac tttccaggga ggcgtggcct gggcgggact ggggagtggc gagccctcag 420 atcctgcata taagcagctg ctttttgcct gtactgggtc tctctggtta gaccagatct 480 gagcctggga gctctctggc taactaggga acccactgct taagcctcaa taaagcttgc 540 cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga ctctggtaac tagagatccc 600 tcagaccctt ttagtcagtg tggaaaatct ctagca 636 <210> 370 <211> 236 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 370 actggaaggg ctaattcact cccaacgaag acaagatctg ctttttgctt gtactgggtc 60 tctctggtta gaccagatct gagcctggga gctctctggc taactaggga acccactgct 120 taagcctcaa taaagcttgc cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga 180 ctctggtaac tagagatccc tcagaccctt ttagtcagtg tggaaaatct ctagca 236 <210> 371 <211> 205 <212> DNA <213> Artificial Sequence <220> <223> synthetic polynucleotide <400> 371 tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 60 tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 120 ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 180 gaatcctggc tgtgaaagat accta 205 <210> 372 <211> 235 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 372 Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met 1 5 10 15 Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu 20 25 30 Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala 35 40 45 Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile 50 55 60 Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro 65 70 75 80 Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys 85 90 95 Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr 100 105 110 Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu 115 120 125 Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr 130 135 140 Met Gly Trp Gln Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala 145 150 155 160 Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His 165 170 175 Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln 180 185 190 Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His 195 200 205 Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg 210 215 220 His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 373 <211> 544 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 373 Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu His 1 5 10 15 Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser 20 25 30 Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp 35 40 45 Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val 50 55 60 Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser 65 70 75 80 Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser 85 90 95 Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn 100 105 110 Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly 115 120 125 Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val 130 135 140 Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu 145 150 155 160 Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val 165 170 175 Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val 180 185 190 Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg 195 200 205 Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met 210 215 220 Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His 225 230 235 240 Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr 245 250 255 Ser Val Thr Val Ser Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 260 265 270 Asn Gly Ala Ala Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala 275 280 285 Pro Thr Ile Ala Leu Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg 290 295 300 Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys 305 310 315 320 Asp Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser 325 330 335 Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg 340 345 350 Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro 355 360 365 Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe 370 375 380 Ala Ala Tyr Arg Ser Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe 385 390 395 400 Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly 405 410 415 Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg 420 425 430 Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln 435 440 445 Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp 450 455 460 Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro 465 470 475 480 Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp 485 490 495 Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg 500 505 510 Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr 515 520 525 Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly 530 535 540 <210> 374 <211> 153 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 374 Met Gly Leu Thr Ser Gln Leu Leu Pro Pro Leu Phe Phe Leu Leu Ala 1 5 10 15 Cys Ala Gly Asn Phe Val His Gly His Lys Cys Asp Ile Thr Leu Gln 20 25 30 Glu Ile Ile Lys Thr Leu Asn Ser Leu Thr Glu Gln Lys Thr Leu Cys 35 40 45 Thr Glu Leu Thr Val Thr Asp Ile Phe Ala Ala Ser Lys Asn Thr Thr 50 55 60 Glu Lys Glu Thr Phe Cys Arg Ala Ala Thr Val Leu Arg Gln Phe Tyr 65 70 75 80 Ser His His Glu Lys Asp Thr Arg Cys Leu Gly Ala Thr Ala Gln Gln 85 90 95 Phe His Arg His Lys Gln Leu Ile Arg Phe Leu Lys Arg Leu Asp Arg 100 105 110 Asn Leu Trp Gly Leu Ala Gly Leu Asn Ser Cys Pro Val Lys Glu Ala 115 120 125 Asn Gln Ser Thr Leu Glu Asn Phe Leu Glu Arg Leu Lys Thr Ile Met 130 135 140 Arg Glu Lys Tyr Ser Lys Cys Ser Ser 145 150 <210> 375 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 375 His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val Arg 1 5 10 15 Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His Phe 20 25 30 Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe Ser 35 40 45 Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu Leu 50 55 60 Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys Gln 65 70 75 80 Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro Gln 85 90 95 Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu Gly 100 105 110 Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg Phe 115 120 125 Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn Ala 130 135 140 Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu Phe 145 150 155 160 Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile Arg 165 170 175 Asn <210> 376 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <400> 376 Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu 1 5 10 15 Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile 20 25 30 Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe 35 40 45 Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr 50 55 60 Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn 65 70 75 80 Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg 85 90 95 Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile 100 105 110 Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val 115 120 125 Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp 130 135 140 Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn 145 150 155 160 Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu 165 170 175 Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser 180 185 190 Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu 195 200 205 Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln 210 215 220 Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly 225 230 235 240 Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro 245 250 255 His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr 260 265 270 Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His 275 280 285 Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro 290 295 300 Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala 305 310 315 320 Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met 325 330 335 <210> 377 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (19)..(25) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (47)..(53) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (76)..(82) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (104)..(110) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (133)..(139) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (161)..(167) <223> Xaa can be any naturally occurring amino acid <400> 377 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 35 40 45 Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 65 70 75 80 Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 100 105 110 Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 378 <211> 606 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (128)..(134) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (156)..(162) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (185)..(191) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (213)..(219) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (242)..(248) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (270)..(276) <223> Xaa can be any naturally occurring amino acid <400> 378 Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 1 5 10 15 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 20 25 30 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 35 40 45 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 50 55 60 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 65 70 75 80 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 85 90 95 Val Leu Glu Gly Gly Gly Gly Ser Gly Gly Thr Cys Arg Ser Arg Pro 100 105 110 Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa 115 120 125 Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro 130 135 140 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa 145 150 155 160 Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys 165 170 175 Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His 180 185 190 Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met 195 200 205 Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His 210 215 220 Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 225 230 235 240 Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu 245 250 255 Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa 260 265 270 Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys 275 280 285 Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro 290 295 300 Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser 305 310 315 320 Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro 325 330 335 Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser 340 345 350 Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met 355 360 365 Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His 370 375 380 Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile 385 390 395 400 Gly Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala 405 410 415 Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met 420 425 430 Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met 435 440 445 Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu 450 455 460 Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu 465 470 475 480 Glu Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr 485 490 495 Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His 500 505 510 Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met 515 520 525 Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val 530 535 540 Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu 545 550 555 560 His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln 565 570 575 Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys 580 585 590 Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 595 600 605 <210> 379 <211> 991 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (319)..(325) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (347)..(353) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (376)..(382) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (404)..(410) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (433)..(439) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (461)..(467) <223> Xaa can be any naturally occurring amino acid <400> 379 Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser 1 5 10 15 Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg 20 25 30 Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn 35 40 45 Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe 50 55 60 Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala 65 70 75 80 Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr 85 90 95 Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser 100 105 110 Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val 115 120 125 Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg 130 135 140 Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser 145 150 155 160 Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg 165 170 175 Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro 180 185 190 Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn 195 200 205 Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp 210 215 220 Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr 225 230 235 240 Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr 245 250 255 Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser 260 265 270 Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe 275 280 285 Glu Asp Val Val Pro Cys Ser Met Gly Ser Pro Gly Ser Arg Pro Gly 290 295 300 Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 305 310 315 320 Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe 325 330 335 Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa 340 345 350 Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg 355 360 365 Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu 370 375 380 Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg 385 390 395 400 Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr 405 410 415 Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 420 425 430 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys 435 440 445 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 450 455 460 Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg Asp 465 470 475 480 Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser 485 490 495 Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro 500 505 510 Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro 515 520 525 Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala 530 535 540 Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu 545 550 555 560 Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser 565 570 575 Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu 580 585 590 Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr 595 600 605 Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr 610 615 620 Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro 625 630 635 640 Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile 645 650 655 Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu 660 665 670 Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp 675 680 685 Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu 690 695 700 Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro 705 710 715 720 Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala 725 730 735 Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His 740 745 750 Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu 755 760 765 His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met 770 775 780 Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe 785 790 795 800 Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly 805 810 815 Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg 820 825 830 Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile 835 840 845 Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser 850 855 860 Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp 865 870 875 880 Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln 885 890 895 His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His 900 905 910 Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn 915 920 925 Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg 930 935 940 Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp 945 950 955 960 Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln 965 970 975 Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 980 985 990 <210> 380 <211> 172 <212> PRT <213> Artificial Sequence <220> <223> synthetic polypeptide <220> <221> misc_feature <222> (17)..(23) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (45)..(51) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (74)..(80) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (102)..(108) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (131)..(137) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (159)..(165) <223> Xaa can be any naturally occurring amino acid <400> 380 Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys 20 25 30 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa 35 40 45 Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln 50 55 60 Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa 65 70 75 80 His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys 85 90 95 Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr 100 105 110 His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 115 120 125 Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa 145 150 155 160 Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg 165 170

Claims (69)

  1. 합성 전사 인자(synTF)로서:
    a. 적어도 하나의 DNA 결합 도메인(DBD),
    b. 전사 이펙터 도메인(ED),
    c. 적어도 하나의 조절인자 단백질(RP)을 포함하며,
    상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링(coupling) 또는 연결되고,
    상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는
    상기 ED의 세포 국재화는 상기 적어도 하나의 조절인자 단백질에 의해 조절되는,
    합성 전사 인자(synTF).
  2. 제1항에 있어서, 상기 전사 ED가 전사 액티베이터(TA) 도메인인, synTF.
  3. 제2항에 있어서, 상기 TA가 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택되는, synTF.
  4. 제2항에 있어서, 상기 TA가 p65 또는 이의 변이체인, synTF.
  5. 제4항에 있어서, 상기 p65가 서열식별번호: 69, 117-121, 193-197 중 하나 또는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
  6. 제1항에 있어서, 상기 전사 ED가 전사 리프레서(TR) 도메인인, synTF.
  7. 제6항에 있어서, 상기 TR이 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택되는, synTF
  8. 제6항에 있어서, 상기 TR이 KRAB, 또는 이의 변이체인, synTF.
  9. 제8항에 있어서, 상기 KRAB가 서열식별번호: 72, 97, 또는 214-215 중 하나, 또는 서열식별번호: 72, 97, 또는 214-215 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
  10. 제1항에 있어서, 상기 적어도 하나의 DBD가 조작된 징크 핑거(ZF) 결합 도메인인, synTF.
  11. 제10항에 있어서, 상기 ZF-결합 도메인이 2개 이상의 ZF 모티프를 포함하는, synTF.
  12. 제11항에 있어서, 상기 ZF-결합 도메인이 일렬로 서로 인접하게 배열된 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 또는 그 이상의 ZF 모티프 중 어느 하나를 포함하여 ZF 어레이(ZFA)를 형성하는, synTF.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 ZF 결합 도메인이, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1 및 ZF 11-1 중 어느 하나에서 선택되는, synTF.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, ZF 결합 도메인이 서열식별번호 1 내지 3, 76, 101, 377, 또는 380 중 어느 하나로부터 선택되는 것인, synTF.
  15. 제14항에 있어서, 상기 ZF 결합 도메인이 서열 181-191 중 적어도 하나를 포함하는 서열에 특이적으로 결합하는, synTF.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 적어도 하나의 DBD가 서열식별번호: 221 또는 222, 36-4(서열식별번호: 223), 43-8(서열식별번호: 224 또는 225), 42-10(서열식별번호: 226 또는 227), 97-4(서열식별번호: 228) 중의 임의의 것의 하나 이상에서 선택되거나, 또는 상기 DBD가 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합하는, synTF.
  17. 제1항에 있어서, 상기 조절인자 단백질이 상기 DBD와 상기 전사 이펙터 도메인 사이에 위치하는, synTF.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 억제성 프로테아제인, synTF.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 NS3 프로테아제 단백질인, synTF.
  20. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 서열식별번호: 82, 85, 91, 102, 241-255, 304-315의 아미노산, 또는 서열식별번호: 82, 85, 91, 102, 241-255, 304-315에 대해 적어도 85% 서열 동일성의 상동체를 포함하는, synTF.
  21. 제1항 내지 제19항 중 어느 한 항에 있어서, 프로테아제 저해제, 또는 NS3의 저해제의 존재 하에, 상기 NS3 프로테아제 단백질이 억제되어 상기 DBD와 상기 이펙터 도메인의 커플링을 유지하는, synTF.
  22. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 프로테아제 저해제 또는 NS3에 대한 저해제의 부재 하에, 상기 NS3 프로테아제 단백질은 활성이고 상기 DBD로부터의 이의 절제를 초래하며, 그로 인해 상기 DBD와 상기 이펙터 도메인 사이의 연결을 커플링해제하는, synTF.
  23. 제21항 또는 제22항에 있어서, NS3의 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 다사사리토나비르, 및 텔라프레비르 중의 어느 하나로부터 선택되는, synTF.
  24. 제1항에 있어서, 상기 적어도 하나의 RP가 한 쌍의 유도 근접 도메인(IPD 쌍)이고, 상기 IPD 쌍은,
    제1 유도 근접 도메인(IPDA) 및 적어도 제2 상보 IPD(IPDB)를 포함하며,
    인듀서 작용제 또는 인듀서 신호의 존재 하에, 상기 IPDA 및 IPDB는 함께 모여 상기 합성 TF의 상기 DBD에 대한 상기 ED의 연결을 초래하고,
    인듀서 작용제 또는 인듀서 신호의 부재 하에, 상기 ED는 상기 합성 TF의 DBD에 대해 커플링해제되거나 연결해제되는, synTF.
  25. 제24항에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상으로부터 선택된 IPDA 및 IPDB를 포함하는, synTF:
    a. GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 상기 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함;
    b. FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 상기 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(RAP)에 결합함;
    c. PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서, 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함;
    d. 광-유도가능 이량체화 도메인(Light-inducible Dimerization domain, LIDD)를 포함하는 IPDA, 여기서 상기 LIDD는 적절한 파장의 광 인듀서 신호에 노출시 상보적 LIDD(IPDB)와 이량체화됨.
  26. 제24항에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 PYL 도메인 또는 이의 단편 및 ABI 도메인을 포함하는 IPDA 및 IPDB를 포함하고, 여기서 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합하는, synTF.
  27. 제24항에 있어서, 상기 LIDD가 nMag 또는 CIBN 또는 광변색성 단백질 도메인이고, 여기서 nMag는 청색광 인듀서 신호에 노출시 상기 상보적 LIDD pMag와 이량체화할 수 있고, CIBN은 청색 인듀서 광 신호에 노출시 상기 상보적 CRY2와 이량체화할 수 있고, 상기 광변색성 단백질은 청색 인듀서 광 신호에 노출시 이량체화할 수 있는, synTF.
  28. 제24항에 있어서, 상기 광 인듀서 신호는 펄스 광 신호인, synTF.
  29. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 적어도 하나의 RP가 세포질 격리 단백질인, synTF.
  30. 제29항에 있어서, 상기 격리 단백질이 리간드 결합 도메인(LBD)을 포함하고, 상기 리간드의 존재 하에, 상기 세포질에 대한 상기 단백질의 격리가 저해되는, synTF.
  31. 제29항에 있어서, 상기 세포질 격리 단백질이 리간드 결합 도메인 및 핵 국재화 신호(NLS)를 포함하고, 상기 리간드의 부재 하에 상기 NLS가 저해되어 상기 격리 단백질의 상기 핵으로의 전위를 방지하고, 상기 리간드의 존재 하에 상기 핵 국재화 신호가 노출되어 상기 격리 단백질이 상기 핵으로 전위할 수 있는, synTF.
  32. 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 격리 단백질이 에스트로겐 수용체(ER)의 적어도 일부를 포함하는, synTF.
  33. 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 격리 단백질이 ERT2, ERT, 및 ERT3으로 이루어진 그룹으로부터 선택되는, 에스트로겐 리간드 결합 도메인(ERT) 또는 이의 변이체를 포함하는, synTF.
  34. 제33항에 있어서, 상기 ERT가 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜, 풀베스트란트로부터 선택된 하나 이상의 리간드에 결합하고, ERT에 대한 상기 리간드의 결합은 상기 NLS를 노출시키고, 상기 ERT의 핵내 전위를 초래하는, synTF.
  35. 제29항에 있어서, 상기 세포질 격리 단백질이 막통과 수용체 격리 단백질을 포함하는, synTF.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 synTF가 N-말단 DBD, 상기 격리 단백질, 및 C-말단 이펙터 도메인을 포함하는, synTF.
  37. 제36항에 있어서, 상기 이펙터 도메인이 전사 액티베이터(TA)인, synTF.
  38. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 synTF가 N-말단 이펙터 도메인, DBD 및 C-말단 세포질 격리 단백질을 포함하는, synTF.
  39. 제38항에 있어서, 상기 이펙터 도메인이 전사 리프레서(TR)인, synTF.
  40. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 NS3 단백질이 소분자-보조 차단(Small molecule-Assisted Shutoff; SMASh) 도메인의 일부이고, 여기서 상기 SMASh 도메인은 상기 NS3 단백질, 부분 프로테아제 나선 도메인 및 NS4A 도메인을 포함하는, synTF.
  41. 제1항 내지 제9항 및 제24항 내지 제40항 중 어느 한 항에 있어서, 상기 synTF가 소분자-보조 차단(SMASh) 태그를 추가로 포함하고, 여기서 상기 SMASh 태그가 억제성 프로테아제를 포함하는 N-말단 또는 C-말단 SMASh 도메인, 부분 프로테아제 나선 도메인 및 보조인자 도메인인, synTF.
  42. 제41항에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인을 포함하는 C-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 상기 이펙터 도메인의 C-말단에 융합되는, synTF.
  43. 제41항에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인 및 NS3 절단 부위를 포함하는 N-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 N-말단에 융합되는, synTF.
  44. 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 NS3 프로테아제에 대한 저해제의 부재 하에, 상기 NS3 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 그로 인해 상기 SMASh 태그가 분해를 위한 표적이 되는 것을 초래하고("SMASh-분해", synTF-켜짐/TA-켜짐/RP-켜짐),
    NS3 프로테아제에 대한 저해제의 존재 하에, NS3 프로테아제 활성이 억제되며, 그로 인해 상기 SMASh 태깅된 synTF가 분해를 위한 표적이 되는 것을 초래하는("synTF-분해", synTF-꺼짐/TA-꺼짐/RP-꺼짐"), synTF.
  45. 제44항에 있어서, NS3 프로테아제에 대한 상기 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르 및 텔라프레비르 중 어느 하나로부터 선택되는, synTF.
  46. 제24항 내지 제45항 중 어느 한 항에 있어서, 상기 synTF가 SMASh 태그 및 세포질 격리 단백질을 포함하는, synTF.
  47. 제46항에 있어서, 상기 synTF가 상기 세포질 격리 단백질에 대한 리간드의 존재 및 상기 NS3 프로테아제에 대한 저해제의 부재 하에 활성이고; 상기 synTF가 상기 세포질 격리 단백질에 대한 상기 리간드의 부재 및 상기 NS3 프로테아제에 대한 저해제의 존재 하에 불활성인, synTF.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 하기 링커 펩티드를 추가로 포함하고, 상기 링커 펩티드는 상기 DBD와 상기 조절인자 단백질 사이; 상기 조절인자 단백질과 상기 이펙터 도메인 사이; 상기 DBD와 상기 이펙터 도메인 사이; 상기 DBD, 이펙터 도메인 또는 조절인자 단백질 내; 또는 이들의 임의의 조합으로부터의 임의의 위치에 위치될 수 있는, synTF:
    PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323).
  49. 유전자 발현 제어 시스템으로서,
    c. 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서,
    상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는 상기 DBD에 연결된 상기 ED의 세포 국재화는 상기 적어도 하나의 RP에 의해 조절되고,
    상기 적어도 하나의 RP는 RP 인듀서에 의해 조절되고,
    상기 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF,
    d. 핵산 구축물로서,
    i. 상기 synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및
    ii. 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및
    iii. 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는, 핵산 구출물,
    을 포함하며,
    상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
    상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접할 수 있고, 상기 ED는 상기 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는
    상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하며("ED-꺼짐"),
    상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
    상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED는 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 이펙터 도메인(ED)이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 제어할 수 있거나("ED-켜짐"), 또는
    상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 synTF의 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 이펙터 도메인(ED)이 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하는("ED-꺼짐"),
    시스템.
  50. 제49항에 있어서, 상기 전사 이펙터 도메인(ED)이 전사 액티베이터(TA)이고,
    c. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
    i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어, 상기 TA가 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
    ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 방지하며("TA-꺼짐"),
    d. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
    i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
    ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되고, 상기 관심 유전자의 발현을 방지하는("TA-꺼짐"), 시스템.
  51. 제49항에 있어서, 상기 ED가 전사 리프레서(TR)이고, 여기서
    c. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
    i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어, 상기 TR이 상기 관심 유전자의 발현을 방지하거나("TR-켜짐"(발현-없음)), 또는
    ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 허용하며("TR-꺼짐"(발현-있음)),
    d. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
    i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 끄거나("TR-켜짐"(발현-없음)), 또는
    ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 허용하는("TR-꺼짐"(발현-있음)),
    시스템.
  52. 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 synTF가 제1항 내지 제48항 중 어느 한 항에서 선택되는, 시스템.
  53. 제49항 내지 제52항 중 어느 한 항에 있어서, 상기 적어도 하나의 synTF가 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함하고, 여기서 SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분 프로테아제 나선 도메인 및 보조인자 도메인을 포함하고,
    상기 SMASh 프로테아제에 대한 저해제의 존재 하에, 상기 SMASh 프로테아제 활성이 억제되어, 상기 synTF가 분해되는 것을 초래하고, 상기 DBM에 대한 상기 synTF의 DBD의 결합을 방지하고, 상기 관심 유전자의 발현 또는 억제를 제어하며("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)),
    상기 SMASh 프로테아제에 대한 저해제의 부재 하에, 상기 SMASh 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 상기 SMASh 도메인이 분해를 위한 표적이 되고, 상기 synTF의 DBD가 상기 synTF의 DBM 및 ED에 결합하도록 허용되어 상기 관심 유전자의 발현을 제어하는("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)), 시스템.
  54. 제49항 내지 제53항 중 어느 한 항에 있어서, 상기 프로모터가 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터 , 및 베타 액틴/ACTB 프로모터 중 임의의 것으로부터 선택되는, 시스템.
  55. 세포로서,
    a. synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 제1 핵산 서열, 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산, 및
    b. 유도성 또는 구성적 프로모터에 작동가능하게 연결된 제1항 내지 제48항 중 어느 한 항에 따른 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열을 포함하는, 세포.
  56. 제55항에 있어서, 상기 세포가 5'에서 3' 방향으로,
    a. 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열,
    b. 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열,
    c. synTF의 상기 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 상기 synTF의 DBD의 결합은 상기 이펙터 도메인(ED)을 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열의 근처에 위치시키는, 핵산 서열,
    d. 제2 프로모터 서열, 및
    e. 상기 제2 프로모터 서열에 작동가능하게 연결된, 상기 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 상기 코딩된 synTF는 (c)의 상기 핵산 서열의 상기 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열,
    을 포함하는 핵산 구축물을 포함하는, 세포.
  57. 제55항 또는 제56항에 있어서, 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열이 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터 중 임의의 것으로부터 선택되는, 세포.
  58. 제55항 또는 제56항에 있어서, 상기 synTF를 코딩하는 핵산에 작동가능하게 연결된 상기 프로모터 서열이 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터인, 세포.
  59. 제1항 내지 제48항 중 어느 한 항의 synTF, 또는 제49항 내지 제54항 중 어느 한 항의 synTF 시스템을 코딩하는 폴리뉴클레오티드.
  60. 제59항의 폴리뉴클레오티드를 포함하는 벡터.
  61. 제1항 내지 제48항 중 어느 한 항의 synTF, 제49항 내지 제54항 중 어느 한 항의 synTF 시스템, 제55항 내지 제58항 중 어느 한 항의 synTF 세포, 제59항의 폴리뉴클레오티드, 또는 제60항의 벡터를 포함하는 조성물.
  62. 제1항 내지 제48항 중 어느 한 항의 synTF, 제49항 내지 제54항 중 어느 한 항의 synTF 시스템, 제55항 내지 제58항 중 어느 한 항의 synTF 세포, 제59항의 폴리뉴클레오티드, 또는 제60항의 벡터, 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물.
  63. synTF의 활성을 조절하는 방법으로서,
    a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 제공하는 단계; 및
    b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
    를 포함하는, 방법.
  64. 관심 유전자의 발현을 조절하는 방법으로서,
    a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 제공하는 단계; 및
    b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
    를 포함하는, 방법.
  65. 세포 기반 요법을 필요로 하는 대상체를 치료하는 방법으로서,
    a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 상기 대상체에게 투여하는 단계; 및
    b. 상기 대상체에 유효량의 조절인자 단백질 인듀서를 투여하는 단계
    를 포함하는, 방법.
  66. 제63항 내지 제65항 중 어느 한 항에 있어서, 상기 세포 집단이 면역 세포를 포함하는, 방법.
  67. 제65항에 있어서, 상기 면역 세포의 집단이 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함하는, 방법.
  68. 제65항 내지 제67항 중 어느 한 항에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여되는 것과 동시에 투여되는, 방법.
  69. 제65항 내지 제67항 중 어느 한 항에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여된 후에 투여되는, 방법.
KR1020217040123A 2019-05-16 2020-05-15 조절된 합성 유전자 발현 시스템 KR20220009980A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962848850P 2019-05-16 2019-05-16
US62/848,850 2019-05-16
PCT/US2020/033171 WO2020232366A2 (en) 2019-05-16 2020-05-15 Regulated synthetic gene expression systems

Publications (1)

Publication Number Publication Date
KR20220009980A true KR20220009980A (ko) 2022-01-25

Family

ID=73288822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217040123A KR20220009980A (ko) 2019-05-16 2020-05-15 조절된 합성 유전자 발현 시스템

Country Status (8)

Country Link
US (2) US11530246B2 (ko)
EP (1) EP3969037A4 (ko)
JP (1) JP2022532236A (ko)
KR (1) KR20220009980A (ko)
CN (1) CN114375198A (ko)
AU (1) AU2020275884A1 (ko)
CA (1) CA3138576A1 (ko)
WO (1) WO2020232366A2 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11572565B2 (en) 2020-07-21 2023-02-07 Trustees Of Boston University Inducible control of gene expression
CA3208497A1 (en) * 2021-01-15 2022-07-21 Outpace Bio, Inc. Small molecule-regulated gene expression system
JP2024513232A (ja) * 2021-04-06 2024-03-22 センティ バイオサイエンシズ インコーポレイテッド 薬物で調節可能な転写リプレッサー
US20230304062A1 (en) * 2021-10-18 2023-09-28 Regeneron Pharmaceuticals, Inc. Controlled transcription of polynucleotides
US20230151353A1 (en) * 2021-11-12 2023-05-18 Replace Therapeutics, Inc. Direct replacement genome editing
WO2023225482A2 (en) * 2022-05-16 2023-11-23 The Regents Of The University Of California T cell activation responsive constructs for enhanced car-t cell therapy
US20240110185A1 (en) * 2022-08-15 2024-04-04 Trustees Of Boston University Inducible anti-sense repressor switches and uses thereof

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2814642B1 (fr) 2000-10-03 2005-07-01 Ass Pour Le Dev De La Rech En Souris transgenique pour la recombinaison ciblee mediee par la cre-er modifiee
US8173792B2 (en) 2007-02-09 2012-05-08 The Board Of Trustees Of The Leland Stanford Junior University Method for regulating protein function in cells using synthetic small molecules
US8530636B2 (en) 2008-05-07 2013-09-10 The Board Of Trustees Of The Leland Stanford Junior University Method for regulating protein function in cells in vivo using synthetic small molecules
US20120178647A1 (en) * 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
CA2825064C (en) * 2011-02-04 2022-08-30 Genentech, Inc. Fc variants and methods for their production
WO2013022739A1 (en) 2011-08-05 2013-02-14 Leonard Joshua N Modular extracellular sensor architecture for cell-based biosensors
US8735096B2 (en) 2012-03-22 2014-05-27 The Board Of Trustees Of The Leland Stanford Junior University Optical control of protein activity and localization by fusion to photochromic protein domains
TW201514202A (zh) * 2013-04-03 2015-04-16 Aliophtha Ag 經工程改造以克服內體捕獲之人工轉錄因子
EP3080271B1 (en) 2013-12-12 2020-02-12 The Broad Institute, Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
US11030531B2 (en) 2014-06-06 2021-06-08 Trustees Of Boston University DNA recombinase circuits for logical control of gene expression
AU2016222887B2 (en) 2015-02-24 2022-07-14 The Regents Of The University Of California Binding-triggered transcriptional switches and methods of use thereof
WO2017004022A2 (en) 2015-06-29 2017-01-05 The Board Of Trustees Of The Leland Stanford Junior University Degron fusion constructs and methods for controlling protein production
EP3331905B1 (en) 2015-08-06 2022-10-05 Dana-Farber Cancer Institute, Inc. Targeted protein degradation to attenuate adoptive t-cell therapy associated adverse inflammatory responses
WO2018039471A2 (en) * 2016-08-25 2018-03-01 Trustees Of Boston University Synthetic transcriptional and epigenetic regulators based on engineered, orthogonal zinc finger proteins
US20180163195A1 (en) 2016-12-12 2018-06-14 Trustees Of Boston University Inducible dimerization of recombinases
WO2018222880A1 (en) * 2017-05-31 2018-12-06 Trustees Of Boston University Mechano-activated control of gene expression
US20210087548A1 (en) 2017-07-24 2021-03-25 The Board Of Trustees Of The Leland Stanford Junior University Compositions and Methods for Inducing Protein Function
WO2020006409A1 (en) 2018-06-28 2020-01-02 Trustees Of Boston University Systems and methods for control of gene expression

Also Published As

Publication number Publication date
AU2020275884A1 (en) 2022-01-06
JP2022532236A (ja) 2022-07-13
US11530246B2 (en) 2022-12-20
CA3138576A1 (en) 2020-11-19
US20200377564A1 (en) 2020-12-03
WO2020232366A3 (en) 2020-12-17
EP3969037A2 (en) 2022-03-23
US20230159600A1 (en) 2023-05-25
WO2020232366A2 (en) 2020-11-19
EP3969037A4 (en) 2024-01-17
CN114375198A (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
KR20220009980A (ko) 조절된 합성 유전자 발현 시스템
US20220089750A1 (en) Car-expressing cells against multiple tumor antigens and uses thereof
KR20180097631A (ko) 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법
KR102550926B1 (ko) 이중 항체 구축물을 발현하는 aav를 포함하는 조성물 및 이들의 용도
RU2762359C2 (ru) Химерные антигенные рецепторы, нацеленные на рецептор, связанный с g-белками, и их применение
KR20200032174A (ko) 강화된 키메라 항원 수용체 및 이의 용도
JP2023036921A (ja) 蝸牛および前庭細胞に核酸を送達するための物質および方法
KR20180108590A (ko) 항-tcr-복합체 항체 또는 단편을 암호화하는 바이러스
KR20210068485A (ko) 노화를 역전시키고 기관 및 조직 재생을 촉진시키기 위한 세포 재프로그래밍
TW200940563A (en) Improved mammalian expression vectors and uses thereof
CN107849583B (zh) 使用细胞分裂基因座控制细胞增殖的工具和方法
KR20190100200A (ko) 동종이형 종양 세포 백신
AU2017240233A1 (en) A highly sensitive and specific luciferase based reporter assay for antigen detection
KR20100128286A (ko) 조혈계 기원의 종양 치료용 조성물 및 방법
CN112262214A (zh) 病毒载体及包装细胞系
KR20210154176A (ko) 표적화된 생체내 후성유전학적 억제에 의한 장기지속성 진통
KR20220103928A (ko) 시험관 내 활성화 및 연쇄 살해 t 세포 집단의 확장 및 종양 세포 사멸 세포로 암 환자의 수동 면역화를 위한 조성물 및 방법
AU2024200495A1 (en) Magea1 immunogenic peptides, binding proteins recognizing magea1 immunogenic peptides, and uses thereof
KR20220041214A (ko) Il-1 수퍼패밀리의 사이토카인의 시공적 제한 활성으로 무장된 면역반응성 세포
KR20230002681A (ko) 대형 아데노바이러스 페이로드의 통합
JP2023179549A (ja) 腫瘍抗原をコードする麻疹ウイルス
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
CN115768890A (zh) 通过分子和物理启动对t细胞免疫疗法的热控制
NL2027815B1 (en) Genomic integration
RU2812852C2 (ru) Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii)