KR20220009980A - 조절된 합성 유전자 발현 시스템 - Google Patents
조절된 합성 유전자 발현 시스템 Download PDFInfo
- Publication number
- KR20220009980A KR20220009980A KR1020217040123A KR20217040123A KR20220009980A KR 20220009980 A KR20220009980 A KR 20220009980A KR 1020217040123 A KR1020217040123 A KR 1020217040123A KR 20217040123 A KR20217040123 A KR 20217040123A KR 20220009980 A KR20220009980 A KR 20220009980A
- Authority
- KR
- South Korea
- Prior art keywords
- syntf
- domain
- seq
- dbd
- protein
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/14—Blood; Artificial blood
- A61K35/17—Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/503—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses
- C12N9/506—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from viruses derived from RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/71—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
- C07K2319/715—Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16 containing a domain for ligand dependent transcriptional activation, e.g. containing a steroid receptor domain
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/95—Fusion polypeptide containing a motif/fusion for degradation (ubiquitin fusions, PEST sequence)
Abstract
본 명세서에 기술된 기술은 조절된 합성 유전자 발현 시스템에 관한 것이다. 한 양태에서, DNA 결합 도메인, 전사 이펙터 도메인, 및 조절인자 단백질을 포함하는 합성 전사 인자(synTF)가 본 명세서에 기술된다. 본 명세서에 기술된 다른 양태는 상기 synTF를 포함하는 유전자 발현 시스템 및 상기 synTF를 사용하여 질병 및 장애를 치료하는 방법이다.
Description
관련 출원과의 상호 참조
본 PCT 출원은 35 §U.S.C.에 따라 2019년 5월 16일에 출원된 미국 가출원 제62/848,850호에 대한 이익을 주장하며, 이의 전문은 본 명세서에 참조로 인용된다.
정부 지원
본 발명은 국방고등연구계획국(Defense Advanced Research Project Agency)에서 수여한 기금 번호 D16AP00142 및 국립과학재단(National Science Foundation)에서 수여한 기금 번호 CCF-1522074에 따른 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 특정의 권리를 갖는다.
서열목록
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하고, 그의 전문이 본 명세서에 참조로 포함된다. 2020년 5월 15일에 생성된, 상기 ASCII 사본의 명칭은 701586-095350_SL.txt이며 그의 크기는 921,581바이트이다.
기술분야
본 명세서에 기술된 기술은 조절된 합성 유전자 발현 시스템에 관한 것이다.
배경
차세대 세포 요법은 정교한 방식으로 질병을 감지하고 이에 대응할 수 있는 설계자의 면역 세포를 창조하는 것을 추구한다. 이 목표를 달성하려면 복잡한 환경 입력을 처리하고 정확하게 조절된 치료제의 발현을 매개함으로써 인간 세포 기능을 프로그래밍하는 데 사용할 수 있는 조작된 조절 요소와 회로가 근본적으로 필요하다. 이 목표를 위해, 합성 전사 프로그램은 감지 및 반응 모듈과 인터페이스하여 세포에서 새로운 조절 계층(layers)을 구현할 수 있다.
치료제의 단순한 구성적 발현에 대한 의존을 넘어 면역 세포 요법을 발전시키기 위해, 조정가능하고 다용도 조절 프로파일을 제공하는 프로그램 가능한 유전 성분이 필요하다. 또한, 이러한 구성 요소는 높은 특이성, 낮은 면역원성, 및 전달가능성을 포함하는, 인간 치료 맥락과 호환성이 있는 특성을 자체적으로 가져야 한다.
T 세포 면역요법은 백혈병 및 림프종과 같은 액체 종양(liquid tumor)을 포함하는 암 치료에 대한 엄청난 가능성을 보여주었다. 그러나, 놀라운 효과와 함께 면역요법을 받는 환자에게 생명을 위협하는 위험을 초래하는, 사이토카인 방출 증후군(CRS) 및 신경독성과 같은, 심각한 부작용이 있다. 주입 후 조작된 T 세포의 활성을 제어할 수 있는 안전하고 효과적인 감지 및 반응(sense-and-response) 전략을 개발하는 것이 점점 더 중요해지고 있다.
발명의 요약
본 명세서에 기술된 기술은 유전자 발현을 제어하는 방법에 관한 것이다. 일반적으로, 본 명세서에 기술된 기술은 조절인자 단백질(regulator protein; RP)을 포함하는 합성 전사 인자(synTF)에 관한 것으로, 여기서 조절인자 단백질은 synTF의 활성을 조절한다. 특히, 본 명세서에 개시된 것과 같은 방법, 시스템 및 조성물에 따른 synTF는 (i) 발현될 관심 유전자(GOI)의 핵산에 작동가능하게 연결된 프로모터의 3'에 위치한 표적 핵산 서열(또는 표적 DNA 결합 모티프(DBM))에 결합하는 DNA 결합 도메인(DBD), (ii) 이펙터 도메인(ED) 및 조절인자 단백질(RP)을 포함하며, 여기서 조절인자 단백질은 DNA 결합 도메인(DBD)과 이펙터 도메인(ED)의 커플링(coupling)을 제어하거나 또는 ED의 세포 국재화를 제어하여, 세포 ED 및 DBD가 핵 내에서 부착되고/되거나 위치할 때, ED가 관심 유전자의 유전자 발현을 조절하기 위해 프로모터에 대한 번역 기구를 모집하거나 억제하는 기능을 발휘할 수 있도록 한다. 일부 실시형태에서, ED는 전사 액티베이터(TA)일 수 있으며, 이에 의해 ED가 관심 유전자의 전사 시작 부위에 존재할 때 유전자 발현을 켤 수 있고, 일부 실시형태에서, ED는 전사 리프레서(TR)이며, 그래서 ED가 관심 유전자의 전사 시작 부위에 존재할 때 유전자 발현이 저해되거나 억제되도록 한다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, SynTF의 조절인자 단백질은 프로테아제, 한 쌍의 유도성 근접 도메인(IPD) 또는 전위 도메인(즉, 세포질 격리 단백질)으로부터 선택되며, 이들 각각은 본 명세서에 그리고 아래에서 더 자세히 설명된다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, synTF는 자가-절단 프로테아제인 조절인자 단백질을 포함하고, 예를 들어, 하나의 예시적인 프로테아제는 NS3이다. 자가-절단 프로테아제를 포함하는 SynTF는 또한 본 명세서에서 " 억제성 프로테아제 SynTF "로 지칭될 수 있다. 본 명세서에 개시된 시스템, 조성물 및 방법의 이러한 실시형태에서, DBD는 이펙터 도메인에 직접적으로 연결되거나 간접적으로 연결(또는 커플링)되고, 프로테아제 조절인자 단백질(전형적으로 DBD와 ED 사이에 위치)은 ED에 대한 DBD의 커플링을 제어한다. 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 저해하는 작용제의 존재하에, DBD 및 ED는 커플링되거나 손상되지 않은 상태로(직접적으로 또는 간접적으로) 유지되고 이펙터 도메인은 프로모터로부터의 유전자 발현을 제어(즉, ED가 TA인 경우 관심 유전자(GOI)의 유전자 발현을 켜거나, 또는 ED가 TR인 경우 유전자 발현을 억제)할 수 있다(예를 들어, 도 5a-5c 참조). 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 저해하는 작용제의 부재 하에, DBD와 ED 사이의 연결이 붕괴되거나 절단되고, 그리하여 ED가 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 따라서 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다.
본 명세서에 개시된 시스템, 조성물 및 방법의 또 다른 실시형태에서, synTF는 DBD와 ED 사이에 위치하는 한 쌍의 인듀서 근접 도메인("IPD 쌍"으로 지칭됨)인 조절인자 단백질을 포함하고, 여기서 IPD의 각 도메인은 인듀서 작용제의 존재 하에 함께 모여, 그리하여 DBD와 ED를 연결하고 유전자 발현을 제어한다(예를 들어, 도 3 및 7a 참조). IPD 쌍을 포함하는 SynTF는 또한 본 명세서에서 " 이종이량체화 도메인 SynTF "로 지칭될 수 있다. 예를 들어, 조절인자 단백질이 IPD 쌍인 이러한 실시형태에서, IPD 쌍의 각 도메인은 DBD 또는 ED 중 어느 하나에 부착되며, 인듀서 작용제의 존재 하에, IPD의 각 도메인이 인듀서 작용제에 결합하며, 그로 인해 DBD와 ED를 간접적으로 커플링시키며, 그래서 DBD가 프로모터 영역에 결합할 때, ED가 프로모터로부터 유전자 발현을 제어(즉, ED가 TA인 경우 유전자 발현을 켜거나, ED가 TR인 경우 유전자 발현을 억제)되도록 할 수 있다(예를 들어, 도 7a 참조). RP가 IPD 쌍인 대안적인 실시형태에서, 인듀서 작용제의 부재 하에, DBD 및 ED는 커플링되지 않은 채로 남아 있고, 그리하여 ED는 GOI의 전사 시작 부위로부터 유전자 전사를 조절하는 위치에 있지 않다. 예시적인 IPD 쌍 및 이들의 유도제(inducing agent)가 본 명세서에 개시되어 있다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, synTF는 전위 도메인인 조절인자 단백질을 포함한다. 일부 실시형태에서, 전위 도메인은 세포질 격리 단백질이고, 예를 들어, 하나의 예시적인 세포질 격리 단백질은 ERT2 및 이의 변이체이다. 전위 도메인, 예를 들어, 세포질 격리 단백질을 포함하는 SynTF는 또한 본 명세서에서 " 전위 도메인 SynTF "로 지칭될 수 있다. 본 명세서에 개시된 시스템, 조성물 및 방법의 이러한 실시형태에서, DBD는 이펙터 도메인에 직접적으로 또는 간접적으로 연결(또는 커플링)되며, 전위 도메인, 예를 들어, 세포질 격리 단백질 조절인자 단백질(이는 ED, 또는 DBD에 부착되거나 또는 DBD와 ED 사이에 위치할 수 있음)은 DBD-ED를 포함하는 synTF의 세포 국재화를 제어한다(예를 들어, 도 4 참조). 이러한 실시형태에서, 세포질 격리 단백질에 결합하는 리간드의 부재 하에, 세포질 격리 단백질은 세포질 내에서 ED 및 커플링된 DBD를 격리하고, 그리하여 ED는 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 그리하여 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다. 대조적으로, 세포질 격리 단백질에 결합하는 리간드의 존재 하에, 세포질 격리 단백질이 저해되어, synTF의 DBD-ED가 세포질에서 핵으로 전위할 수 있게 하여 DBD가 DNA 결합 모티프(DBM)에 결합할 수 있고 이펙터 도메인(ED)은 프로모터로부터의 유전자 발현을 제어(즉, ED가 TA인 경우 관심 유전자(GOI)의 유전자 발현을 켜거나, 또는 ED가 TA인 경우 유전자 발현을 억제)할 수 있다(예를 들어, 도 4 참조).
본 명세서에 개시된 시스템, 조성물 및 방법의 또 다른 양태는 본 명세서에서 "유도된 분해 도메인"으로도 지칭될 수 있는 소분자 보조 차단(SMASh) 도메인을 포함하는 synTF이다. 일반적으로, SMASh 도메인은 분해를 위해 SMASh 도메인에 부착된 폴리펩티드를 표적으로 하는 기능을 발휘한다. 일부 실시형태에서, SMASh 도메인은 인듀서 근접 도메인 쌍(IPD)인 조절인자 단백질, 또는 세포질 격리 단백질을 포함하는 synTF에 부착된다(예를 들어, 도 6b 참조). 대안적인 실시형태에서, 조절인자 단백질은 SMASh 도메인일 수 있다(즉, SMASh 도메인은 synTF에서 자가-절단 프로테아제 조절인자 단백질을 대체한다)(예를 들어, 도 6a 참조).
본 명세서에 개시된 방법, 시스템 및 조성물의 모든 양태에서, SMASh 도메인은 자가-절단 프로테아제 및 데그론(degron) 도메인을 포함한다. 일부 실시형태에서, 자가-절단 프로테아제는 본 명세서에 개시된 NS3 프로테아제 또는 이의 변이체이다. 일부 실시형태에서, SMASh 도메인은 NS3 프로테아제 도메인, 부분 NS3 나선 도메인 및 NS4A 도메인을 포함하고, 본 명세서에 기술된 synTF의 N-말단 또는 C-말단에 융합될 수 있다. 단지 이론 및 설명에 국한되지 않고, SMASh 도메인이 본 명세서에 개시된 것과 같이 synTF에 부착되는 경우, 그리고 SMASh 도메인 자가-절단 프로테아제의 저해제(inhibitor)가 존재 하는 경우, SMASh 도메인 및 부착된 synTF 둘 모두가 분해를 위한 표적이 된다. 이것은 "SynTF-분해"라고 지칭되며 synTF가 "SynTF-꺼짐(OFF)"으로 되는 것을 초래하며- 즉 synTF가 분해되기 때문에, synTF에 존재하는 이펙터 도메인의 유형에 관계없이, synTF는 DBM에 결합할 수 없거나, 또는 관심 유전자의 발현을 조절할 수 없다. 반대로, 자가-절단 프로테아제의 저해제가 부재 하는 경우, 자가-절단 프로테아제는 synTF에서 SMASh 도메인을 절단(또는 커플링해제)하고, SMASh 도메인만 분해의 표적이 되고, 방출된 synTF의 활성이 조절인자 단백질을 통해 조절된다. 이와 같이, 프로테아제 저해제의 부재 하에, SMASh 도메인이 synTF에 부착되는 경우, "SMASh-분해"라고 지칭하며 synTF가 "SynTF-켜짐(ON)"으로 되는 것으로 초래하여, synTF가 조절인자 단백질에 의해 조절될 수 있으며, 유전자 발현은 각각 ED가 전사 액티베이터 단백질인지 리프레서 단백질인지에 따라 발생하거나 억제될 수 있다. 따라서, synTF에 부착된 SMASh 도메인의 존재는 조절인자 단백질 외에 GOI의 발현을 위한 제2 수준의 제어를 가능하게 한다.
일부 실시형태에서, SMASh 도메인은 그 자체로 synTF의 조절인자 단백질로서 역할하고(즉, SMASh 도메인은 자가-절단 프로테아제 조절인자 단백질을 대체함), 유도 분해 도메인 SynTF로 지칭된다(예를 들어, 도 6a 참조). 이러한 실시형태에서, SMASh 도메인이 조절인자 단백질로서 역할하는 경우, SMASh 도메인은 synTF의 ED 또는 DBD 중 어느 하나에 부착될 수 있고, NS3 프로테아제의 부재 하에, NS3 프로테아제는 활성이고 SMASh 도메인은 synTF에서 커플링해제되며, 그로 인해 SMASh 도메인만 분해를 위한 표적이 되며, DBD와 커플링된 ED를 포함하는 synTF는 프로모터로부터 유전자 발현을 제어(즉, DBD가 DBM에 결합하여 ED를 프로모터에 근접하게 만들고, ED가 TA인 경우 GOI의 유전자 발현을 켜거나, 또는 ED가 TR인 경우 유전자 발현을 억제)할 수 있게 된다. 이러한 실시형태에서, 조절인자 단백질(즉, NS3 단백질)을 억제하는 작용제의 부재 하에, DBD와 ED 사이의 연결이 붕괴되거나 절단되고, 그리하여 ED가 유전자의 전사 시작 부위에 근접하지 않게 (또는 ED가 시작 부위에서 해리되게) 되며, 그리하여 TA는 더 이상 GOI의 유전자 발현을 개시할 수 없거나, 또는 달리 RP는 더 이상 관심 유전자의 유전자 발현을 억제할 수 없다.
일부 실시형태에서, SMASh 도메인이 전위 도메인 synTF(예를 들어, 조절인자 단백질이 격리 단백질인 경우), 또는 이종이량체화 도메인 synTF(즉, 조절인자 단백질이 유도성 근접 도메인의 쌍(IPD 쌍)인 경우)에 부착되는 경우, SMASH 도메인은 "SMASH 태그"로 지칭될 수 있고 synTF의 C-말단 또는 N-말단에 부착될 수 있다(예를 들어, 도 6b 또는 도 16a 참조). 단지 일예로서, C-말단 SMASh 태그는 ED의 C-말단에 부착되거나, synTF의 조절인자 단백질은 N-말단에서 C-말단 순서로 다음을 포함할 수 있다: NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인, 여기서 SMASh 태그는 synTF의 이펙터 도메인의 C-말단에 융합된다. 일부 실시형태에서 그리고 단지 일예로서, SMASh 태그가 synTF의 N-말단에 융합되는 경우(본 명세서에서 "N-말단 SMASh 태그"로 지칭됨), SMASh 태그는 N-말단에서 C-말단 순서로 다음을 포함한다: 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인, 및 NS3 절단 부위, 여기서 SMASh 태그는 synTF의 N-말단에 융합된다.
본 명세서에 개시된 기술의 또 다른 양태는 관심 유전자(GOI)의 유전자 발현을 제어하기 위한 시스템과 관련이 있으며, 여기서 시스템은 본 명세서에 기술된 synTF 및 유전자 발현을 조절하기 위해 synTF가 결합하는 요소를 포함하는 핵산 구축물을 포함한다. 특히, 일부 양태에서, 시스템은 (i) 본 명세서에 개시된 것과 같은 적어도 하나의 합성 전사 인자(synTF), 및 (ii) 적어도 하나의 핵산 구축물을 포함하며, 여기서 synTF는 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하고, 여기서 ED는 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 여기서 커플링은 적어도 하나의 RP에 의해 조절되거나, 또는 DBD에 연결된 ED의 세포 국재화는 적어도 하나의 RP에 의해 조절되고, 여기서 적어도 하나의 RP는 RP 인듀서에 의해 조절되며, 여기서 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있으며, 여기서 핵산 작제물은 (i) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및 (ii) 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 포함한다. RP 인듀서의 존재 하에, synTF의 조절인자 단백질이 DBD에 대한 ED의 커플링(예를 들어, 프로테아제 도메인 synTF 또는 유도 근접 도메인 synTF)을 조절하는 일부 실시형태에서, synTF의 DBD에 대한 ED의 커플링이 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때 ED가 프로모터 서열에 근접할 수 있게 하며, 여기서 ED는 관심 유전자의 발현을 제어한다("ED-켜짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 켜는 결과("TA-켜짐"(발현))를 초래하는 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 억제하거나 조절한다("TR-켜짐"(발현 없음)). 대조적으로, RP 인듀서가 부재하는 경우, synTF의 DBD에 대한 ED의 커플링이 절단되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때 ED가 프로모터 서열에 근접하게 되는 것을 방지하여, 관심 유전자의 유전자 발현을 방지한다("ED-꺼짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는 것을 초래하는("TA-꺼짐"(발현 없음)) 반면, ED는 전사 리프레서 단백질(TR)인 경우, 유전자 발현을 켠다("TR-꺼짐"/억제-꺼짐, 그리하여 유전자 발현을 가능하게 함).
synTF의 조절인자 단백질이 synTF의 세포 국재화(DBD 및 연결된 ED)를 조절하는 실시형태에서, RP 인듀서가 존재할 때, synTF의 DBD에 커플링된 ED는 세포질에서 격리되지 않고, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있게 하고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접하여 관심 유전자의 발현을 제어할 수 있게 한다("ED-켜짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 켜는 결과("TA-켜짐"(발현))를 초래하는 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 저해하거나 억제한다("TR-켜짐"(발현 없음)).
또한, RP 인듀서가 부재하는 경우, synTF의 DBD에 커플링된 ED가 세포질 내에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 대한 근접하여 존재하는 것을 방지하고, 관심 유전자의 발현을 방지한다("ED-꺼짐"). ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는("TA-꺼짐"(발현 없음)) 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 유전자 발현을 켠다("TR-꺼짐"/억제-꺼짐, 그리하여 유전자 발현을 가능하게 함).
표 17: 관심 유전자의 궁극적인 발현에 대한 조절인자 단백질 인듀서의 존재 또는 부재를 요약한 표.
따라서, GOI의 유전자 발현이 일어나는지 여부는, 이로만 제한되는 것은 아니지만, 다음을 포함하는 3가지 수준의 조절에 의존한다; (i) synTF에서 조절인자 단백질의 유형, (ii) 조절인자 단백질 인듀서(RP 인듀서)의 존재 또는 부재, 및 (iii) 이펙터 도메인의 유형.
더욱이, 일부 실시형태에서, 유전자 발현을 제어하기 위한 시스템은, 본 명세서에 개시된 것과 같이 synTF에 부착된 SMASh 도메인이 존재하는지 여부에 따라, 유전자 발현에 대한 추가적인 수준의 제어를 위해 구성될 수 있다. 예를 들어, synTF에 대한 SMASh 도메인의 부착은 다음과 같은 결과를 초래할 것이다: SMASh 프로테아제에 대한 저해제가 존재하는 경우, SMASh 프로테아제 활성이 저해되어, synTF가 분해되고("Syn-분해") synTF의 DBD가 DBM에 결합하는 것이 방지되고 관심 유전자의 발현 또는 억제가 제어된다("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)). 대안적 실시형태에서, SMASh 프로테아제에 대한 저해제가 부재하는 경우, SMASh 프로테아제가 활성이고 synTF에서 자가절단/커플링해제되어, SMASh 도메인이 분해를 위한 표적이 되고, synTF의 DBD가 DBM 및 synTF의 ED에 결합하여 관심 유전자의 발현을 제어하는 것이 가능하다("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)).
본 명세서에 기술된 기술의 다른 양태는 관심 유전자의 발현을 조절하기 위한 synTF의 결합을 위한 본 명세서에 개시된 것과 같은 핵산 서열, 및 또한 합성 전사 인자를 코딩하는 핵산을 포함하는 세포에 관한 것이다. 일부 실시형태에서, 핵산 서열은 별개의 구축물 상에 있고, 일부 실시형태에서, 이들은 본 명세서에 개시되고 "단일 벡터"로 지칭되는 동일한 구축물에 있다.
다른 실시형태는 본 개시로부터 쉽게 명백해질 것이다. 본 발명의 양태는 아래에 설명한 예시적인 이점을 발생시키는 구성 및 사용의 특정 이점을 교시한다.
본 발명의 양태의 다른 특징 및 이점은, 일예로서, 본 발명의 양태의 원리를 예시하는 첨부 도면과 함께, 이하의 보다 상세한 설명으로부터 명백해질 것이다.
도 1a-1h는 직교(orthogonal) ZF 어레이에 기초한 포유류 synTF의 설계 및 특성화를 보여주는 일련의 개략도 및 그래프이다. 도 1a는 직교 6-유닛 ZF 어레이를 기반으로 하는 synTF의 설계를 보여주는 개략도이다. 도 1b는 synTF 및 리포터 시스템을 보여주는 개략도이다. 도 1c는 synTF가 동족 synTF/DBM 쌍의 라이브러리에 걸쳐 해당 통합 리포터를 강력하게 활성화한다는 것을 보여주는 막대 그래프이며; mCherry 발현은 특정 ZF-p65 synTF의 존재시에만 일어났으며 TF의 부재 또는 GFP-p65의 존재시에는 일어나지 않았음에 주목해야 한다. 도 1d는 특정 synTF와 리포터의 동시발현을 보여주는 히트맵이며; mCherry 리포터는 합성 오퍼레이터 및 이의 동족 synTF에 의해 활성화됨에 주목해야 한다. 도 1e-1g는 ZF1-p65(도 1e), ZF3-p65(도 1f) 및 ZF10-p65(도 1g)를 포함하는, synTF를 발현하는 인간 세포의 트랜스크립톰(transcriptome) 프로파일링을 보여주는 일련의 산점도(scatterplots)이며, synTF의 매우 특이적이고 직교적인 조절을 나타낸다. 도 1h는 Gal4 및 TetR과 비교하여 synTF의 트랜스크립톰 프로파일링을 보여주는 막대 그래프이다. 차등적으로 조절된 전사체 = Log2|배수 변화|>1; FDR<0.1(모두 3개의 독립적인 반복실험(replicate)에 대해).
도 2는 소분자-반응성 synTF 시스템을 나타내는 개략도이다.
도 3은 유도된 근접에 의해 조절되는 예시적인 synTF를 나타내는 개략도이다.
도 4는 세포질 격리에 의해 조절되는 예시적인 synTF를 보여주는 개략도이다.
도 5a-5c는 자가-절단 프로테아제 저해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 5a는 NS3에 의해 조절되는 synTF를 보여주는 개략도이다. GRZ는 그라조프레비르(NS3의 소분자 저해제)를 나타낸다. 도 5b는 소분자 부재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 자가 절제는 ZF(징크 핑거 결합 도메인 또는 DNA 결합 도메인(DBD))와 ED(이펙터 도메인)의 커플링해제를 야기하여 전사 조절 활성을 허용하지 않는다. 도 5c는 소분자 존재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 활성 저해는 ZF와 ED의 국소 커플링을 허용하여, 전사 조절 활성을 허용한다.
도 6a-6b는 유도 분해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 6a는 SMASh에 의해 조절되는 synTF를 나타내는 개략도이다. 도 6b는 ERT2 및 SMASh 도메인을 모두 사용하는 조절된 전사 인자를 보여주는 개략도이다. SMASh 도메인은 ERT2-함유 synTF의 C-말단("C-말단 SMASh", 상단) 및 ERT2-함유 synTF의 N-말단("N-말단 SMASh", 하단)에 배치되었다.
도 7a-7c는 예시적인 이종이량체화 synTF를 보여주는 일련의 개략도 및 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 생산(output)의 일시적 활성화를 야기했음을 나타내는 그래프를 도시한 도면이다. 도 7a는 DBD(또는 ZF1)를 ED에 커플링하는 유도 근접 도메인(IPD)의 개략도를 도시한다. 이 예시적인 실시형태에서, ABA는 ED에 대한 ZF1의 커플링을 유지하기 위한 인듀서 리간드로서 기능한다. 도 7a는 또한 나타낸 바와 같이 여러 상이한 ABA 처치 농도의 함수로서 측정된 아웃풋(output) 형광을 나타낸다(용량 반응). 도 7b는 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도함을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 7c는 4일 후 소분자(ABA)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 8a-8c는 예시적인 세포질 격리 synTF를 보여주는 일련의 개략도 및 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 야기했음을 보여주는 그래프이다. 도 8a는 세포질 격리 단백질 ERT2와 함께 ED(즉, p63)에 융합된 DBD(또는 ZF3)를 갖는 예시적인 synTF를 보여준다. 도 8a는 또한 나타낸 바와 같이 여러 상이한 4OHT 처리 농도의 함수로서 측정된 아웃풋 형광을 나타낸다(용량 반응). 도 8b는 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 8c는 4일 후 소분자(4OHT)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 9a-9c는 프로테아제로서 NS3을 갖는 예시적인 억제성 프로테아제 synTF의 일련의 개략도, 및 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 나타내는 그래프이다. 도 9a는 ED(즉, p65)에 커플링된 프로테아제에 커플링된 DBD(또는 ZF10)를 지니는 예시적인 synTF를 도시한다. 도 9a는 또한 나타낸 바와 같이 아웃풋 형광이 여러 상이한 그라조프레비르 처리 농도의 함수로서 측정되었음을 나타낸다(용량 반응). 도 9b는 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 9c는 4일 후 소분자(그라조프레비르)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 10a-10d는 예시적인 synTF를 보여주는 일련의 개략도 및 소분자(예를 들어, ABA, 4OHT, 또는 그라조프레비르)의 투여가 HEK293 및 Jurkat 세포주 둘 다에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 유도하였음을 보여주는 그래프이다. 도 10a는 ABA, 4OHT 또는 그라조프레비르 각각에 의해 조절되는, 이종이량체화 도메인 synTF, 세포질 격리 도메인 synTF 및 억제성 프로테아제 synTF의 3가지 예시적인 synTF를 보여주는 개략도이다. 도 10b는 리포터 시스템을 나타내는 개략도이다. 도 10c-10d는 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 소분자의 다양한 시간 및 용량에서 리포터의 synTF 활성화를 보여주는 일련의 선 그래프(왼쪽)를 보여준다(최고 용량에 해당하는 더 어두운 회색과 함께, 용량은 회색 음영으로 나타나있다). 도 10c-10d는 또한 D4에서 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 리포터의 synTF 활성화를 보여주는 일련의 막대 그래프(오른쪽) 및 소분자의 최고 용량(ABA의 경우 1mM; 4OHT의 경우 4uM; GRZ의 경우 4uM)을 보여준다. 도 10c-10d에서, 상단 그래프는 ABA-조절 synTF, 중간 그래프는 4OHT-조절 synTF, 하단 그래프는 그라조프레비르-조절 synTF에 해당한다. 도 10c-10d에서, 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다.
도 11a-11b는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 11a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 11b는 소분자의 투여(상단 그래프: ABA, 중간 그래프: 4OHT; 하단 그래프: GRZ)가 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 11b는 다양한 시간에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 12a-12c는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 12a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 12b-12c는 소분자(그라조프레비르)의 투여가 HEK293(도 12b) 및 Jurkat 세포주(도 12c)에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 12b-12c는 다양한 시간에 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 13a-13d는 소분자(그라조프레비르)의 투여가 CD4+ 1차 인간 T 세포에서 ZF-반응성 프로모터로부터의 형광-태깅된 키메라 항원 수용체(CD19-CAR) 단백질의 일시적 활성화를 야기했음을 보여주는 일련의 개략도 및 그래프이다. 도 13a는 CD19-CAR 발현 시스템 및 유도성 synTF를 보여주는 개략도이다. NS3를 포함하는 억제성 프로테아제 synTF가 도시되어 있으며; 그러나, 논의된 바와 같은 임의의 synTF는 본 명세서에 개시된 방법에 따라 CD19-CAR GOI의 발현을 조절하는 데 사용될 수 있다. 도 13b는 다양한 시점 및 여러 다른 그라조프레비르 처리 농도에서 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 선 그래프(왼쪽) 및 3일째에 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 막대 그래프(오른쪽)를 보여준다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 CD19 항원-제시 표적 세포(CD19+ NALM 세포)와 이들 1차 세포의 후속 공동-배양이, 사이토카인의 향상된 생산에 의해 측정된, T-세포 활성화를 초래하였음을 보여준다. 이 향상된 수준의 사이토카인 생산을 사이토카인 발현을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 D1 또는 D2에서 여러 상이한 그라조프레비르 처리 농도에서 IFNγ 발현(도 13c) 및 IL-2 발현(도 13d)을 보여주는 일련의 막대 그래프이다.
도 14a-14b는 1차 인간 T 세포에서 CD19 CAR 및 IL-4 발현의 조절을 보여주는 일련의 개략도 및 그래프이다. 도 14a는 CD19-CAR 및 IL-4 발현 시스템 및 예시적인 유도성 synTF인, CD19-CAR을 조절하는 억제성 프로테아제 synTF 및 IL4의 발현을 조절하는 세포질 격리 synTF를 보여주는 개략도이다. 도 14b는, 나타낸 바와 같이, 다양한 시점에서 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(상단 그래프) 및 IL-4 발현(하단 그래프)을 나타내는 일련의 선 그래프이다. 도 14c는, 나타낸 바와 같이, 5일째에 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(밝은 회색, 왼쪽 축) 및 IL-4 발현(짙은 회색, 오른쪽 축)을 보여주는 막대 그래프이다.
도 15a-15c는 유전자 발현을 제어하기 위한 시스템에 관한 핵산 구축물을 보여주는 일련의 개략도 및 소분자(그라조프레비르)의 투여가 Jurkat T 세포주에서 ZF-반응성 프로모터로부터 사이토카인(IL10)의 일시적 활성화를 야기했음을 보여주는 그래프이다. 도 15a-15b는 이러한 유도성 활성화가 NS3-synTF 발현과 이어서 IL10 생산을 제어하기 위한 별도의 핵산 구축물("이중 렌티바이러스 벡터", 도 15a)의 전달을 통해, 또는 NS3-synTF의 발현을 제어할 뿐 아니라, IL10 생산을 조절하는 단일 핵산 구축물("단일 렌티바이러스 벡터", 도 15b)의 전달을 통해 달성될 수 있음을 보여주는 일련의 개략도이다. 도 15c는 이중 벡터 또는 단일 벡터 시스템에서 2일 동안 1uM GZV의 존재(진한 회색) 또는 부재(밝은 회색) 하에서 IL-10을 보여주는 막대 그래프이다.
도 16a-16b는 각각 ERT2 및 SMASh 도메인을 포함하는 세포질 격리 및 유도된 분해 synTF를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 활성화 및 조정가능한 불활성화를 보여주는 일련의 개략도 및 그래프이다. 도 16a는 N-말단 SMASh synTF 및 C-말단 SMASh synTF를 나타내는 개략도이다. 도 16b는 나타낸 바와 같이 4OHT의 제거 및 그라조프레비르의 존재 또는 부재 후 리포터 발현을 보여주는 선 그래프이다.
도 17은 C-말단 SMASh synTF(왼쪽 히트맵) 및 N-말단 SMASh synTF(오른쪽 히트맵)가 있는 ERT2 및 SMASh 도메인을 사용하여 인간 세포주에서 형광 단백질의 조정가능한 합성 전사 활성화를 보여주는 일련의 히트맵이다.
도 18은 KRAB-ZF-ERT2-SMASh(상단 그래프), HP1a-ZF-ERT2-SMASh(중간 그래프), 및 EED-ZF-ERT2-SMASh(하단 그래프)를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 선 그래프이다. "항상 꺼짐(+GZV)"은 그라조프레비르의 존재 및 4OHT의 부재를 나타낸다. "항상 꺼짐(-GZV)"은 그라조프레비르 및 4OHT 둘 다의 부재를 나타낸다. "항상 켜짐"은 그라조프레비르의 부재 및 4OHT의 존재를 나타낸다.
도 19는 서열식별번호: 4의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[p65]-[PYL](903 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며; 는 ABI1cs CO1 도메인을 나타내고; 는 2A 리보솜 스킵 서열을 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반(plain) 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은, 폴리펩티드를 [ABI]-[ZF] 및 [p65]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [p65]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(p65)가 커플링될 수 있다.
도 20은 서열식별번호: 5의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[KRAB]-[PYL](808 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며; 는 ABI1cs CO1 도메인을 나타내고; 는 2A 리보솜 스킵 서열을 나타내고; 는 KRAB 억제 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은 폴리펩티드를 [ABI]-[ZF] 및 [KRAB]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [KRAB]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(KRAB)가 커플링될 수 있다.
도 21은 서열식별번호: 6의 주석이 달린 서열인, [ZF]-[p65]-[ERT2](692 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 22는 서열식별번호: 7의 주석이 달린 서열인, [KRAB]-[ZF]-[ERT2](605 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 23은 서열식별번호: 8의 주석이 달린 서열인, [ZF]-[NS3]-[p65](704 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고; 는 NS3 도메인을 나타내고; 는 HA 태그를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 24는 서열식별번호: 9, [KRAB]-[NS3]-[ZF](609 aa)의 주석이 달린 서열을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고; 는 NS3 도메인을 나타내고; 는 HA 태그를 나타내고; 는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 25는 서열식별번호: 10의 주석이 달린 서열인, [ZF]-[p65]-[ERT2]-[SMASh](998 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 26은 서열식별번호: 11로 주석이 달린 서열인, [SMASh]-[ZF]-[p65]-[ERT2](997 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 27은 서열식별번호: 12로 주석이 달린 서열, [ZF]-[p65]-[SMASh](728 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 28은 서열식별번호: 13의 주석이 달린 서열, [KRAB]-[ZF]-[ERT2]-[SMASh](878 aa)를 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 KRAB 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 29는 서열식별번호: 14의 주석이 달린 서열인, [HP1a]-[ZF]-[ERT2]-[SMASh], (1003 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 HP1a 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 30은 서열식별번호: 15의 주석이 달린 서열인, [EED]-[ZF]-[ERT2]-[SMASh](1253 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 HP1a 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 31은 인간 게놈에 직교하는 합성 전사 오퍼레이터 서열의 동정을 나타내는 일련의 그래프이다. "Biostrings"으로 명명된 생물정보학 문자열 매칭 알고리즘을 사용하여 인간 게놈에서 오퍼레이터 서열의 발생을 평가했다. 여기서 x축은 hg19 ref 어셈블리에서 특정 문자열(들)의 발생 횟수를 나타내고; 스케일은 다른 세트와 패널에 대해 변경됨에 주의해야 한다. 상단 패널에는 11개의 "합성 오퍼레이터"와 정확하거나 또는 모든 가능한 미스매치 서열의 인스턴스(instances)가 있다: 이 알고리즘은 이들에 대한 정확한 또는 1-2개의 미스매치 서열이 없음을 보여주었으며, 이는 서열 구성이 게놈적으로-이격된(genomically-distant) 것으로 고려될 수 있음을 시사한다. 여러 표준(canonical) TF 오퍼레이터 서열을 또한 인간 게놈과 비교하였다. 본 명세서에 설명된 합성 오퍼레이터는 유사하거나 더 짧은 길이의 이러한 "이종성(heterologous)" 인식 서열에 비해 더 나은 성능을 발휘한다.
본 명세서에 사용된 하기 약어는 다음과 같이 정의된다: synTF(합성 전사 인자); ZF(징크 핑거); HEK(인간 배아 신장 293 세포); ED(이펙터 도메인); AD(액티베이터 도메인); RD(리프레서 도메인); GOI(관심 유전자); OUT(아웃풋); DBM(DNA 결합 모티프); pUb(유비퀴틴 C 프로모터); p65(전사 인자 P65); minCMV(최소 사이토메갈로바이러스 프로모터); AAVS1(아데노-관련 바이러스 통합 부위 1); chr19(인간 염색체 19); GFP(녹색 형광 단백질); TPM(백만 분의 전사체, 즉, 시퀀싱된 샘플에 대한 RNA 전사체의 전체 풀에 걸친 각 개별 RNA 전사체의 정규화된 값); ABI(ABA-둔감); PYL(PYR1-유사, 단백질 피라박틴 내성 1-유사); ABA(앱시스산); ERT2(에스트로겐 수용체 리간드 결합 도메인의 돌연변이된 변이체), 4OHT(4-하이드록시타목시펜); NS3(HCV의 비구조 단백질 3); GZV 또는 GRZ(그라조프레비르); SMASh(소분자 보조 차단); a.u.(임의의 단위 또는 상대적인 방출 강도); IFNγ(인터페론 감마); IL-2(인터루킨 2); IL-4(인터루킨 4); CD19(분화 클러스터 19); mCh(mCherry); pSFFV(침묵-취약 비장 초점 형성 바이러스 프로모터); minTK(HSV 티미딘 키나제(TK) 프로모터로부터의 최소 프로모터 단편); 렌티(렌티바이러스).
도 2는 소분자-반응성 synTF 시스템을 나타내는 개략도이다.
도 3은 유도된 근접에 의해 조절되는 예시적인 synTF를 나타내는 개략도이다.
도 4는 세포질 격리에 의해 조절되는 예시적인 synTF를 보여주는 개략도이다.
도 5a-5c는 자가-절단 프로테아제 저해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 5a는 NS3에 의해 조절되는 synTF를 보여주는 개략도이다. GRZ는 그라조프레비르(NS3의 소분자 저해제)를 나타낸다. 도 5b는 소분자 부재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 자가 절제는 ZF(징크 핑거 결합 도메인 또는 DNA 결합 도메인(DBD))와 ED(이펙터 도메인)의 커플링해제를 야기하여 전사 조절 활성을 허용하지 않는다. 도 5c는 소분자 존재하의 시스템을 보여주는 개략도이다. NS3 프로테아제 활성 저해는 ZF와 ED의 국소 커플링을 허용하여, 전사 조절 활성을 허용한다.
도 6a-6b는 유도 분해에 의해 조절되는 예시적인 synTF를 보여주는 일련의 개략도이다. 도 6a는 SMASh에 의해 조절되는 synTF를 나타내는 개략도이다. 도 6b는 ERT2 및 SMASh 도메인을 모두 사용하는 조절된 전사 인자를 보여주는 개략도이다. SMASh 도메인은 ERT2-함유 synTF의 C-말단("C-말단 SMASh", 상단) 및 ERT2-함유 synTF의 N-말단("N-말단 SMASh", 하단)에 배치되었다.
도 7a-7c는 예시적인 이종이량체화 synTF를 보여주는 일련의 개략도 및 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 생산(output)의 일시적 활성화를 야기했음을 나타내는 그래프를 도시한 도면이다. 도 7a는 DBD(또는 ZF1)를 ED에 커플링하는 유도 근접 도메인(IPD)의 개략도를 도시한다. 이 예시적인 실시형태에서, ABA는 ED에 대한 ZF1의 커플링을 유지하기 위한 인듀서 리간드로서 기능한다. 도 7a는 또한 나타낸 바와 같이 여러 상이한 ABA 처치 농도의 함수로서 측정된 아웃풋(output) 형광을 나타낸다(용량 반응). 도 7b는 소분자(ABA)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도함을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 7c는 4일 후 소분자(ABA)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 8a-8c는 예시적인 세포질 격리 synTF를 보여주는 일련의 개략도 및 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 야기했음을 보여주는 그래프이다. 도 8a는 세포질 격리 단백질 ERT2와 함께 ED(즉, p63)에 융합된 DBD(또는 ZF3)를 갖는 예시적인 synTF를 보여준다. 도 8a는 또한 나타낸 바와 같이 여러 상이한 4OHT 처리 농도의 함수로서 측정된 아웃풋 형광을 나타낸다(용량 반응). 도 8b는 소분자(4OHT)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 8c는 4일 후 소분자(4OHT)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 9a-9c는 프로테아제로서 NS3을 갖는 예시적인 억제성 프로테아제 synTF의 일련의 개략도, 및 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 나타내는 그래프이다. 도 9a는 ED(즉, p65)에 커플링된 프로테아제에 커플링된 DBD(또는 ZF10)를 지니는 예시적인 synTF를 도시한다. 도 9a는 또한 나타낸 바와 같이 아웃풋 형광이 여러 상이한 그라조프레비르 처리 농도의 함수로서 측정되었음을 나타낸다(용량 반응). 도 9b는 소분자(그라조프레비르)의 투여가 Jurkat 세포주에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 활성화를 유도했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 9c는 4일 후 소분자(그라조프레비르)의 제거가 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 불활성화를 야기했음을 보여준다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 차트에서 측정된 시점은 약물 제거 당일("0일")에 시작한다.
도 10a-10d는 예시적인 synTF를 보여주는 일련의 개략도 및 소분자(예를 들어, ABA, 4OHT, 또는 그라조프레비르)의 투여가 HEK293 및 Jurkat 세포주 둘 다에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 유도하였음을 보여주는 그래프이다. 도 10a는 ABA, 4OHT 또는 그라조프레비르 각각에 의해 조절되는, 이종이량체화 도메인 synTF, 세포질 격리 도메인 synTF 및 억제성 프로테아제 synTF의 3가지 예시적인 synTF를 보여주는 개략도이다. 도 10b는 리포터 시스템을 나타내는 개략도이다. 도 10c-10d는 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 소분자의 다양한 시간 및 용량에서 리포터의 synTF 활성화를 보여주는 일련의 선 그래프(왼쪽)를 보여준다(최고 용량에 해당하는 더 어두운 회색과 함께, 용량은 회색 음영으로 나타나있다). 도 10c-10d는 또한 D4에서 HEK293 세포(도 10c) 또는 Jurkat 세포(도 10d)에서 리포터의 synTF 활성화를 보여주는 일련의 막대 그래프(오른쪽) 및 소분자의 최고 용량(ABA의 경우 1mM; 4OHT의 경우 4uM; GRZ의 경우 4uM)을 보여준다. 도 10c-10d에서, 상단 그래프는 ABA-조절 synTF, 중간 그래프는 4OHT-조절 synTF, 하단 그래프는 그라조프레비르-조절 synTF에 해당한다. 도 10c-10d에서, 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다.
도 11a-11b는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 11a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 11b는 소분자의 투여(상단 그래프: ABA, 중간 그래프: 4OHT; 하단 그래프: GRZ)가 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 11b는 다양한 시간에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 HEK293 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 12a-12c는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 개략도 및 그래프이다. 도 12a는 리포터 시스템 및 이펙터 도메인으로서 리프레서를 포함하는 유도성 synTF를 보여주는 개략도이다. 도 12b-12c는 소분자(그라조프레비르)의 투여가 HEK293(도 12b) 및 Jurkat 세포주(도 12c)에서 ZF-반응성 프로모터로부터 형광 단백질 아웃풋의 일시적 침묵을 야기했음을 보여주는 일련의 그래프이다. 이 감소된 수준의 발현을 발현 아웃풋을 침묵시키지 않은 미처리 세포주와 비교하였다. 도 12b-12c는 다양한 시간에 세포에서 리포터의 synTF 억제를 보여주는 일련의 선 그래프(왼쪽) 및 8일째에 세포에서 리포터의 synTF 억제를 보여주는 일련의 막대 그래프(오른쪽)를 보여준다.
도 13a-13d는 소분자(그라조프레비르)의 투여가 CD4+ 1차 인간 T 세포에서 ZF-반응성 프로모터로부터의 형광-태깅된 키메라 항원 수용체(CD19-CAR) 단백질의 일시적 활성화를 야기했음을 보여주는 일련의 개략도 및 그래프이다. 도 13a는 CD19-CAR 발현 시스템 및 유도성 synTF를 보여주는 개략도이다. NS3를 포함하는 억제성 프로테아제 synTF가 도시되어 있으며; 그러나, 논의된 바와 같은 임의의 synTF는 본 명세서에 개시된 방법에 따라 CD19-CAR GOI의 발현을 조절하는 데 사용될 수 있다. 도 13b는 다양한 시점 및 여러 다른 그라조프레비르 처리 농도에서 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 선 그래프(왼쪽) 및 3일째에 CD4+ 1차 T 세포에서 CD-19 synTF 발현의 synTF 활성화를 보여주는 막대 그래프(오른쪽)를 보여준다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 CD19 항원-제시 표적 세포(CD19+ NALM 세포)와 이들 1차 세포의 후속 공동-배양이, 사이토카인의 향상된 생산에 의해 측정된, T-세포 활성화를 초래하였음을 보여준다. 이 향상된 수준의 사이토카인 생산을 사이토카인 발현을 활성화하지 않은 미처리 세포주와 비교하였다. 도 13c-13d는 D1 또는 D2에서 여러 상이한 그라조프레비르 처리 농도에서 IFNγ 발현(도 13c) 및 IL-2 발현(도 13d)을 보여주는 일련의 막대 그래프이다.
도 14a-14b는 1차 인간 T 세포에서 CD19 CAR 및 IL-4 발현의 조절을 보여주는 일련의 개략도 및 그래프이다. 도 14a는 CD19-CAR 및 IL-4 발현 시스템 및 예시적인 유도성 synTF인, CD19-CAR을 조절하는 억제성 프로테아제 synTF 및 IL4의 발현을 조절하는 세포질 격리 synTF를 보여주는 개략도이다. 도 14b는, 나타낸 바와 같이, 다양한 시점에서 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(상단 그래프) 및 IL-4 발현(하단 그래프)을 나타내는 일련의 선 그래프이다. 도 14c는, 나타낸 바와 같이, 5일째에 GZV 또는 4OHT의 존재 또는 부재 하에 CD19-CAR 발현(밝은 회색, 왼쪽 축) 및 IL-4 발현(짙은 회색, 오른쪽 축)을 보여주는 막대 그래프이다.
도 15a-15c는 유전자 발현을 제어하기 위한 시스템에 관한 핵산 구축물을 보여주는 일련의 개략도 및 소분자(그라조프레비르)의 투여가 Jurkat T 세포주에서 ZF-반응성 프로모터로부터 사이토카인(IL10)의 일시적 활성화를 야기했음을 보여주는 그래프이다. 도 15a-15b는 이러한 유도성 활성화가 NS3-synTF 발현과 이어서 IL10 생산을 제어하기 위한 별도의 핵산 구축물("이중 렌티바이러스 벡터", 도 15a)의 전달을 통해, 또는 NS3-synTF의 발현을 제어할 뿐 아니라, IL10 생산을 조절하는 단일 핵산 구축물("단일 렌티바이러스 벡터", 도 15b)의 전달을 통해 달성될 수 있음을 보여주는 일련의 개략도이다. 도 15c는 이중 벡터 또는 단일 벡터 시스템에서 2일 동안 1uM GZV의 존재(진한 회색) 또는 부재(밝은 회색) 하에서 IL-10을 보여주는 막대 그래프이다.
도 16a-16b는 각각 ERT2 및 SMASh 도메인을 포함하는 세포질 격리 및 유도된 분해 synTF를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 활성화 및 조정가능한 불활성화를 보여주는 일련의 개략도 및 그래프이다. 도 16a는 N-말단 SMASh synTF 및 C-말단 SMASh synTF를 나타내는 개략도이다. 도 16b는 나타낸 바와 같이 4OHT의 제거 및 그라조프레비르의 존재 또는 부재 후 리포터 발현을 보여주는 선 그래프이다.
도 17은 C-말단 SMASh synTF(왼쪽 히트맵) 및 N-말단 SMASh synTF(오른쪽 히트맵)가 있는 ERT2 및 SMASh 도메인을 사용하여 인간 세포주에서 형광 단백질의 조정가능한 합성 전사 활성화를 보여주는 일련의 히트맵이다.
도 18은 KRAB-ZF-ERT2-SMASh(상단 그래프), HP1a-ZF-ERT2-SMASh(중간 그래프), 및 EED-ZF-ERT2-SMASh(하단 그래프)를 사용하여 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제를 보여주는 일련의 선 그래프이다. "항상 꺼짐(+GZV)"은 그라조프레비르의 존재 및 4OHT의 부재를 나타낸다. "항상 꺼짐(-GZV)"은 그라조프레비르 및 4OHT 둘 다의 부재를 나타낸다. "항상 켜짐"은 그라조프레비르의 부재 및 4OHT의 존재를 나타낸다.
도 19는 서열식별번호: 4의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[p65]-[PYL](903 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며; 는 ABI1cs CO1 도메인을 나타내고; 는 2A 리보솜 스킵 서열을 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반(plain) 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은, 폴리펩티드를 [ABI]-[ZF] 및 [p65]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [p65]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(p65)가 커플링될 수 있다.
도 20은 서열식별번호: 5의 주석이 달린 서열인, [ABI]-[ZF]-[2A]-[KRAB]-[PYL](808 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타내며; 는 ABI1cs CO1 도메인을 나타내고; 는 2A 리보솜 스킵 서열을 나타내고; 는 KRAB 억제 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은 폴리펩티드를 [ABI]-[ZF] 및 [KRAB]-[PYL]의 2개의 폴리펩티드로 절단하며, 이들은 ABA의 존재 하에 [KRAB]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하며, 그리하여 DBD(ZF)와 ED(KRAB)가 커플링될 수 있다.
도 21은 서열식별번호: 6의 주석이 달린 서열인, [ZF]-[p65]-[ERT2](692 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 PYL1cs 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 22는 서열식별번호: 7의 주석이 달린 서열인, [KRAB]-[ZF]-[ERT2](605 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 23은 서열식별번호: 8의 주석이 달린 서열인, [ZF]-[NS3]-[p65](704 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고; 는 NS3 도메인을 나타내고; 는 HA 태그를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 24는 서열식별번호: 9, [KRAB]-[NS3]-[ZF](609 aa)의 주석이 달린 서열을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 기울임꼴 텍스트는 제한 사이트를 나타내고; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 3X FLAG 태그 + 핵 국재화 서열을 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 NS3 절단 부위를 나타내고; 는 NS3 도메인을 나타내고; 는 HA 태그를 나타내고; 는 KRAB 억제 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 25는 서열식별번호: 10의 주석이 달린 서열인, [ZF]-[p65]-[ERT2]-[SMASh](998 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 26은 서열식별번호: 11로 주석이 달린 서열인, [SMASh]-[ZF]-[p65]-[ERT2](997 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 표시되며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 ERT2 도메인을 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 27은 서열식별번호: 12로 주석이 달린 서열, [ZF]-[p65]-[SMASh](728 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 p65(아미노산 361-551) 활성화 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 28은 서열식별번호: 13의 주석이 달린 서열, [KRAB]-[ZF]-[ERT2]-[SMASh](878 aa)를 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 KRAB 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 29는 서열식별번호: 14의 주석이 달린 서열인, [HP1a]-[ZF]-[ERT2]-[SMASh], (1003 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 HP1a 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 30은 서열식별번호: 15의 주석이 달린 서열인, [EED]-[ZF]-[ERT2]-[SMASh](1253 aa)을 보여주는 개략도이고; N-말단에서 C-말단으로 나타내며; 굵은 텍스트는 징크 핑거 도메인을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 는 링커를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 는 NS3 절단 부위를 나타내고; 는 HP1a 리프레서 도메인을 나타내고; 는 ERT2 도메인을 나타내고; 기울임꼴 텍스트는 NS3 프로테아제 도메인을 나타내고; 는 NS3 부분 헬리카제를 나타내고; 는 NS4A 도메인을 나타내고; 일반 텍스트 "xxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6을 나타낸다.
도 31은 인간 게놈에 직교하는 합성 전사 오퍼레이터 서열의 동정을 나타내는 일련의 그래프이다. "Biostrings"으로 명명된 생물정보학 문자열 매칭 알고리즘을 사용하여 인간 게놈에서 오퍼레이터 서열의 발생을 평가했다. 여기서 x축은 hg19 ref 어셈블리에서 특정 문자열(들)의 발생 횟수를 나타내고; 스케일은 다른 세트와 패널에 대해 변경됨에 주의해야 한다. 상단 패널에는 11개의 "합성 오퍼레이터"와 정확하거나 또는 모든 가능한 미스매치 서열의 인스턴스(instances)가 있다: 이 알고리즘은 이들에 대한 정확한 또는 1-2개의 미스매치 서열이 없음을 보여주었으며, 이는 서열 구성이 게놈적으로-이격된(genomically-distant) 것으로 고려될 수 있음을 시사한다. 여러 표준(canonical) TF 오퍼레이터 서열을 또한 인간 게놈과 비교하였다. 본 명세서에 설명된 합성 오퍼레이터는 유사하거나 더 짧은 길이의 이러한 "이종성(heterologous)" 인식 서열에 비해 더 나은 성능을 발휘한다.
본 명세서에 사용된 하기 약어는 다음과 같이 정의된다: synTF(합성 전사 인자); ZF(징크 핑거); HEK(인간 배아 신장 293 세포); ED(이펙터 도메인); AD(액티베이터 도메인); RD(리프레서 도메인); GOI(관심 유전자); OUT(아웃풋); DBM(DNA 결합 모티프); pUb(유비퀴틴 C 프로모터); p65(전사 인자 P65); minCMV(최소 사이토메갈로바이러스 프로모터); AAVS1(아데노-관련 바이러스 통합 부위 1); chr19(인간 염색체 19); GFP(녹색 형광 단백질); TPM(백만 분의 전사체, 즉, 시퀀싱된 샘플에 대한 RNA 전사체의 전체 풀에 걸친 각 개별 RNA 전사체의 정규화된 값); ABI(ABA-둔감); PYL(PYR1-유사, 단백질 피라박틴 내성 1-유사); ABA(앱시스산); ERT2(에스트로겐 수용체 리간드 결합 도메인의 돌연변이된 변이체), 4OHT(4-하이드록시타목시펜); NS3(HCV의 비구조 단백질 3); GZV 또는 GRZ(그라조프레비르); SMASh(소분자 보조 차단); a.u.(임의의 단위 또는 상대적인 방출 강도); IFNγ(인터페론 감마); IL-2(인터루킨 2); IL-4(인터루킨 4); CD19(분화 클러스터 19); mCh(mCherry); pSFFV(침묵-취약 비장 초점 형성 바이러스 프로모터); minTK(HSV 티미딘 키나제(TK) 프로모터로부터의 최소 프로모터 단편); 렌티(렌티바이러스).
상세한 설명
본 명세서에 개시된 것과 같은 방법 및 조성물에 사용하기 위한 synTF가 본 명세서에 기술되어 있으며, 여기서 synTF는 (i) 표적 핵산 서열(또는 표적 DNA 결합 모티프(DBM))에 결합하는 DNA 결합 도메인(DBD), (ii) 이펙터 도메인(ED) 및 조절인자 단백질(RP)을 포함하며, 여기서 조절인자 단백질은 DNA 결합 도메인(DBD)과 이펙터 도메인(ED)의 커플링 또는 연결을 제어(이러한 커플링은 또한 "매개체 도메인(mediator domain)"으로 지칭될 수 있음)하거나, 또는 ED의 세포 국재화를 제어하여, 그래서 ED와 DBD가 핵 내에서 부착되고/되거나 위치할 때, ED가 유전자를 프로모터에 번역 기계를 모집하거나 억제하는 기능을 발휘하여 관심 유전자의 유전자 발현을 조절할 수 있다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 다양한 입력에 의해 활성화되거나 억제될 수 있으며, 이의 비제한적 예는, 인듀서(예를 들어, 소분자), 광-유도성 제어(예를 들어, 이량체화, 조립, 국재화), 온도, pH, 인산화, 산소, 지질, 자기, 전기, 공간 메커니즘(예를 들어, 세포내 및/또는 세포외; 예를 들어, 합성 수용체 및/또는 가용성 인자), 내인성 리간드(예를 들어, 바이오마커), 세포 주기 상태, 고유 신호전달 경로, 또는 질병 및/또는 병원성 상태(예를 들어, 응집, 감염)를 포함한다.
본 명세서에 개시된 시스템, 조성물 및 방법의 일부 실시형태에서, SynTF의 조절인자 단백질은 프로테아제, 한 쌍의 유도성 근접 도메인(IPD), 전위 도메인(즉, 세포질 격리 단백질) 또는 유도된 분해 도메인으로부터 선택되며, 이들 각각은 본 명세서에서 그리고 아래에 더 상세히 기술된다.
유도성 또는 약물-제어가능한 합성 전사 인자의 4가지 일반적인 프레임워크가 본 명세서에 기술되어 있다: (1) 억제성 프로테아제 synTF로 지칭되는, 억제성 프로테아제를 포함하는 synTF; (2) 유도 근접 도메인 SynTF로 지칭되는, 유도 근접 도메인을 포함하는 synTF; (3) 세포질 격리 synTF로 지칭되는, 세포질 격리 도메인을 포함하는 synTF 시스템; 및 (4) 유도된 분해 도메인 synTF로 지칭되는, 유도 분해 도메인을 포함하는 synTF. 또한, 상기 synTF 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 벡터, 상기 synTF 폴리펩티드를 발현하는 세포, 상기 synTF 폴리펩티드를 포함하는 약제학적 조성물, 및 상기 synTF 폴리펩티드를 사용하는 방법이 기술된다.
포유류 세포를 포함하는 광범위한 진핵 세포 및 유기체에서 유전자 발현을 정밀하게 제어할 수 있는 조작된 전사 인자 단백질(synTF)의 부류 및 상응하는 반응성 인공 조작된 프로모터가 본 명세서에 기술되어 있다. 이러한 synTF는 숙주 게놈에서 감소되거나 최소한의 결합 잠재력(즉, 숙주 게놈에 대한 "직교" 활성)을 갖도록 특별히 설계된 것이다. 본 명세서에 기술된 synTF 단백질은 숙주 게놈 서열과 거리가 멀고 상이한 특정 18-20개 뉴클레오티드 서열을 표적화하고 결합하도록 설계된 조작된 징크 핑거(ZF) 어레이를 기반으로 하는 DNA 결합 도메인(DBD)을 포함하며, synTF 단백질은 선택된 호스트에서 사용된다. 이 전략은 synTF 단백질과 숙주 게놈의 비특이적 상호작용을 제한하며; 이러한 비특이적 상호작용은 이상적이지 않고, 그리하여 바람직하지 않다.
일부 양태에서, 본 명세서에 기술된 synTF는 하기 파라미터에 따라 설계된다: (1) 표적가능한 DNA 서열(ZF 결합 부위로도 알려짐)은 숙주 게놈에서 감소된 결합 잠재력을 갖도록 특이적으로 설계된 ZF 어레이에 대해 확인된 것이고; (2) ZF 어레이는 설계되고 조립되며; (3) synTF는 조작된(즉, 공유적으로 연결된) ZF 어레이를 전사 및/또는 후성유전적(epigenetic) 이펙터 도메인에 커플링함으로써 설계되고; (4) 상응하는 반응성 프로모터는 구성적 프로모터의 상류에 표적가능한 DNA 서열(즉, ZF 결합 부위)의 인스턴스를 배치함으로써 설계된다. 표적가능한 DNA 서열은 표적가능한 DNA 서열 상의 synTF의 점유가 유전자 발현에서 프로모터의 활성을 조절하도록 프로모터에 작동가능하게 연결된다. synTF와 표적가능한 DNA 서열-프로모터의 조합은, 내인성 유전자의 발현에 영향을 미치지 않거나 최소한으로 미치면서, 발현 시스템 내에 배치된 원하는 유전자의 발현을 위해, 인공적이고 확장가능하며 조절가능한 독특한 발현 시스템을 형성하며, 이는 내인성 유전자의 오프-사이트(off-site) 유전자 조절이 없거나 최소한임을 의미한다.
본 명세서에 기술된 synTF는 숙주 게놈에서 기능적 결합 잠재력이 감소되거나 최소화되어, 부분적으로, synTF에 의한 오프사이트 DNA 표적화가 없거나 최소인 이점을 제공한다. 또한, 본 명세서에 기술된 합성 ZF-기반 단백질(synTF)은 포유류 단백질 스캐폴드로부터 유래되어, 다른 원핵생물-유래 도메인에 비해 최소 수준의 면역원성을 부여한다. 다른 부류의 프로그래밍가능한 DNA-표적화 도메인과 대조적으로, 이러한 징크-핑거-기반 조절인자 단백질은 TALE 및 dCas9 단백질보다 상당히 작고(~4-5x), TALE 반복 단백질보다 덜 반복적이며, 렌티바이러스 패키징 한계에 의해 제한되지 아니하여, 렌티바이러스 운반 구축물에서 편리한 패키징을 가능하게 하고 다른 바람직한 제어 요소를 위한 공간을 제공할 수 있다.
I. 합성 전사 인자 도메인
다수의 양태에서, 하기 도메인 중 적어도 하나를 포함하는 synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템이 본 명세서에 기술된다: 전사 이펙터 도메인, DNA-결합 도메인, 억제성 프로테아제, 유도 근접 도메인, 세포질 격리 도메인, 유도된 분해 도메인으로 이루어진 군에서 선택된 적어도 하나의 조절인자 단백질, 적어도 하나의 링커 펩티드, 적어도 하나의 검출가능한 마커, 및/또는 자가-절단 펩티드, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템은 집합적으로(즉, 제1 폴리펩티드 및/또는 제2 폴리펩티드) 적어도 하기를 포함한다: 전사 이펙터 도메인; DNA-결합 도메인; 억제성 프로테아제, 유도 근접 도메인, 세포질 격리 도메인, 및/또는 유도된 분해 도메인으로 이루어진 그룹으로부터 선택되는 적어도 하나의 조절인자 단백질. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 적어도 하나의 링커 펩티드, 또는 적어도 하나의 검출가능한 마커, 및/또는 적어도 하나의 자가-절단 펩티드, 또는 이들의 임의의 조합을 추가로 포함한다. 본 명세서 설명된 특정 synTF는 제한으로 해석되어서는 아니된다. 예를 들어, 다음 조합이 본 명세에서 고려된다(예를 들어, 표 8 참조):
표 8: synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템에서 도메인의 예시적인 조합. 표 8에 나타낸 각각의 예시적인 synTF 폴리펩티드는 또한 전사 이펙터 도메인 및 DNA-결합 도메인을 포함한다. 도메인은 임의의 순서로 존재할 수 있다. "PRO"는 억제성 프로테아제를 나타낸다. "IPD"는 유도 근접 도메인을 나타낸다. "CS"는 세포질 격리 도메인을 나타낸다. "DD"는 유도된 데그론 도메인을 나타낸다. "LP"는 링커 펩티드를 나타낸다. "DM"은 검출가능한 마커를 나타낸다. "SP"는 자가-절단 펩티드를 나타낸다.
전사 이펙터 도메인(ED)
전사 이펙터 도메인(ED)을 포함하는 synTF가 본 명세서에서 기술되며, 이는 또한 본 명세서에서 이펙터 도메인으로 지칭될 수 있다. 본 명세서에 기술된 임의의 양태의 한 실시형태에서, synTF의 전사 이펙터 도메인(ED)은 전사 활성화 도메인(TA) 또는 전사 리프레서 도메인(본 명세서에서 전사 리프레서(TR)로도 지칭됨)이다. 예를 들어, 전사 이펙터 도메인은 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP64 활성화 도메인인, VP16의 4개의 탠덤 복사본으로 구성된 활성화 도메인; NFκB의 p65 활성화 도메인 또는 이의 기능적 단편; 엡스타인-바 바이러스 R 트랜스액티베이터(Rta) 활성화 도메인 또는 이의 기능적 단편; VP64, p65 및 Rta 활성화 도메인으로 구성된 3성분(tripartite) 액티베이터(여기서 3성분 액티베이터는 VPR 활성화 도메인으로 알려져 있음); 미니VPR; p300 HAT 코어 활성화 도메인으로 알려진, 인간 E1A-연관 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인; CBP HAT 도메인; KRAB(Kruppel Associated Box) 억제 도메인; KRAB-MeCP2; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 리프레서 도메인; HDAC4 도메인; HP1 알파 억제 도메인; 및 EED(배아 외배엽 발달) 리프레서 도메인으로 이루어진 군에서 선택된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5, 또는 전사 이펙터 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 전사 이펙터 도메인을 포함한다. 복수의 전사 이펙터 도메인을 포함하는 실시형태에서, 복수의 전사 이펙터 도메인은 상이한 개별 전사 이펙터 도메인 또는 동일한 전사 이펙터 도메인의 복수 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 전사 ED는 전사 액티베이터(TA) 도메인이다. 본 명세서에 사용되는 용어 "전사 액티베이터" 도메인은 유전자 발현을 증가시키는 이펙터를 지칭한다. 임의의 양태의 일부 실시형태에서, TA는 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택된다. 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: 미국 특허 제10,138,493호; 미국 특허 제10,590,182호; Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; Vora et al., Rational design of a compact CRISPR-Cas9 activator for AAV-mediated delivery, bioRxiv 2018 doi.org/10.1101/298620; Chavez et al., Nat Methods. 2015 April, 12(4): 326-328; Park et al., Cell. 2019 Jan 10, 176(1-2):227-238, e20; Hilton et al., Nature Biotechnology volume 33, pages 510-517(2015); Sajwan et al., Sci Rep. 2019; 9: 18104.
임의의 양태의 일부 실시형태에서, TA는 p65, 또는 이의 기능적 단편이다. 핵 인자 NF-카파-B p65 서브유닛으로도 알려진 전사 인자 p65는 인간에서 RELA 유전자에 의해 코딩되는 단백질이다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 69 또는 서열식별번호: 69에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 117 또는 서열식별번호: 117에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 118 또는 서열식별번호: 118의 일부, 예를 들어, 서열식별번호: 118의 잔기 150-261, 100-261, 200-261, 1-200, 1-50, 1-100, 또는 50-100을 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 69, 117-121, 193-197 중 하나, 또는 이의 기능을 유지하는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, p65는 서열식별번호: 120(p65 100-261) 또는 동일한 기능을 유지하는 서열식별번호: 120에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 69, p65(NFkB의 아미노산 361-551) 활성화 도메인(191 aa)
서열식별번호: 117, p65 (전체 서열, 551 aa), 전사 인자 p65 이소형 1 [Homo sapiens], NCBI 참조 서열: NP_068810.3
서열식별번호: 118, p65 1-261 (261 aa)
서열식별번호: 119, p65 150-261 (112 aa)
서열식별번호: 120, p65 100-261 (162 aa)
서열식별번호: 121, p65 200-261 (62 aa)
서열식별번호: 193, p65 1-200 (200 aa)
서열식별번호: 194, p65 1-150 (150 aa)
서열식별번호: 195, p65 1-100 (100 aa)
서열식별번호: 196, p65 50-150 (101 aa)
서열식별번호: 197, p65 143-261 (119 aa)
임의의 양태의 일부 실시형태에서, TA는 Rta, 또는 이의 기능적 단편이다. Rta는 엡스타인-바 바이러스 R 트랜스액티베이터(Rta) 활성화 도메인이다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198 또는 서열식별번호: 198에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198의 일부, 예를 들어, 서열식별번호: 198의 잔기 75-190, 125-190, 50-175, 75-175, 100-175, 또는 125-175를 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 198-204 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 198-204 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, Rta는 서열식별번호: 200(Rta 125-190) 또는 동일한 기능을 유지하는 서열식별번호: 200에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 198, Rta (전체 서열, 1-190; 190 aa)
서열식별번호: 199, Rta (75-190; 116 aa)
서열식별번호: 200, Rta (125-190; 66 aa)
서열식별번호: 201, Rta (50-175; 126 aa)
서열식별번호: 202, Rta (75-175; 101 aa)
서열식별번호: 203, Rta (100-175; 76 aa)
서열식별번호: 204, Rta (125-175; 51 aa)
임의의 양태의 일부 실시형태에서, TA는 VPR, 또는 이의 기능적 단편이다. VPR은 VP64, p65 및 Rta 활성화 도메인으로 구성된 3성분 액티베이터이다. 임의의 양태의 일부 실시형태에서, VPR은 VP64(예를 들어, 서열식별번호: 208), p65(예를 들어, 서열식별번호: 69, 117-121 또는 193-197 중 어느 하나 또는 동일한 기능을 유지하는 서열식별번호: 69, 117-121 또는 193-197 중 어느 하나에 대해 적어도 85% 서열 동일성을 갖는 폴리펩티드), 및 Rta(예를 들어, 서열식별번호: 198-204 중 어느 하나 또는 동일한 기능을 유지하는 서열식별번호: 198-204 중 어느 하나에 대해 적어도 85% 서열 동일성을 갖는 폴리펩티드)를 포함한다. 임의의 양태의 일부 실시형태에서, VPR은 서열식별번호: 205, 206 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 205 또는 206 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 205, p65(100-261 aa; 서열식별번호: 120) 절단 및 RTA(125-190 aa; 서열식별번호: 200) 절단을 포함하는, miniVPR; 굵은 텍스트는 VP64(서열식별번호: 208)를 나타내고; 기울임꼴 텍스트는 SV40 NLS(서열식별번호: 65)를 나타내고; 굵은 기울임꼴 텍스트는 p65(100-261 aa; 서열식별번호: 120)를 나타내고; 이중 밑줄그어진 텍스트는 RTA(125-190 aa, 서열식별번호: 200)를 나타낸다.
서열식별번호: 206, 전체 VPR; 굵은 텍스트는 VP64(서열식별번호: 208)를 나타내고; 기울임꼴 텍스트는 SV40 NLS(서열식별번호: 65)를 나타내고; 굵은 기울임꼴 텍스트는 p65(서열식별번호: 118)를 나타내고; 이중 밑줄그어진 텍스트는 RTA(서열식별번호: 198)를 나타낸다.
임의의 양태의 일부 실시형태에서, TA는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 VP16의 4개의 탠덤 카피를 포함하는 VP64 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 207, 208 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 207 또는 208 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 208, VP64(53aa), 굵은 텍스트로 나타낸 VP16 도메인을 지님,
임의의 양태의 일부 실시형태에서, TA는 p300 또는 이의 기능적 단편을 포함한다. 아데노바이러스 E1A-관련 세포 p300 전사 코-액티베이터 단백질은 염색질 리모델링을 통해 전사를 조절하는 히스톤 아세틸트랜스퍼라제로서 기능한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 209 또는 서열식별번호: 209에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 209의 일부, 예를 들어, 서열식별번호: 209의 잔기 1048-1664를 포함한다. 임의의 양태의 일부 실시형태에서, TA는 p300 HAT 코어 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, p300은 서열식별번호: 210 또는 서열식별번호: 210에 대해 적어도 85% 서열 동일성을 갖는 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 209, 210, 또는 이의 기능을 유지하는 서열식별번호: 209 또는 210 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드 중 어느 하나를 포함한다.
서열식별번호: 209, 인간 아세틸트랜스퍼라제 p300(2414 aa), 굵은 텍스트는 코어 활성화 도메인을 나타냄
서열식별번호: 210, p300 HAT 코어 활성화 도메인 (617 aa)
임의의 양태의 일부 실시형태에서, TA는 CBP 또는 이의 기능적 단편을 포함한다. CBP(CREB(Cyclic AMP-Responsive Element-Binding Protein) 결합 단백질, CREBBP)는 다수의 다양한 전사 인자의 전사 공동활성화에 관여하며 고유 히스톤 아세틸트랜스퍼라제 활성을 가지고 있다. 임의의 양태의 일부 실시형태에서, CBP는 호모 사피엔스(Homo sapiens), 드로소필라 멜라노가스터(Drosophila melanogaster), 또는 상동성 CBP 단백질을 발현하는 임의의 다른 유기체로부터 유래된다. 임의의 양태의 일부 실시형태에서, TA는 CBP HAT 코어 활성화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, TA는 서열식별번호: 211-213 중 하나, 또는 이의 기능을 유지하는 서열식별번호: 211-213 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 211, 호모 사피엔스 CBP, 히스톤 아세틸트랜스퍼라제(HAT)-도메인; CREB-결합 단백질 이소형 a[호모 사피엔스]의 잔기 1342-1649, NCBI 참조 서열: NP_004371.2; CREB-결합 단백질 이소형 b[호모 사피엔스]의 잔기 1304-1611, NCBI 참조 서열: NP_001073315.1.
서열식별번호: 212, 네지레(nejire), 이소형 E[Drosophila melanogaster]의 잔기 1954-2267, NCBI 참조 서열: NP_001259387.1, HAT_KAT11, 히스톤 아세틸화 단백질
서열식별번호: 213, 드로소필라 CBP(nejire)로부터의 aa 1696-2329, NCBI 참조 서열: NP_001259387.1, 브로모도메인, PHD 도메인, 및 HAT 도메인 포함
임의의 양태의 일부 실시형태에서, 전사 ED는 전사 리프레서(TR) 도메인이다. 본 명세서에 사용되는 용어 "전사 리프레서" 도메인은 유전자 발현을 감소시키는 이펙터를 지칭한다. 임의의 양태의 일부 실시형태에서, TR은 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택된다. 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 제10,138,493호; 미국 특허 제10,590,182호; Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; Park et al., Cell. 2019 Jan 10, 176(1-2):227-238, e20; Yeo et al., Nature Methods volume 15, pages 611-616(2018); Bintu et al., Science. 2016 Feb 12; 351(6274): 720-724 참조.
임의의 양태의 일부 실시형태에서, TR은 KRAB, 또는 이의 기능적 단편을 포함한다. KRAB(Krppel Associated Box) 도메인은 약 400개의 인간 징크 핑거 단백질-기반 전사 인자(KRAB 징크 핑거 단백질)에 존재하는 전사 억제 도메인의 카테고리이며, H3K9me3을 쓰거나 읽는 다른 염색질 조절인자(regulator)와 연관된다. 임의의 양태의 일부 실시형태에서, TR은 2분 리프레서 도메인인 KRAB-MeCP2를 포함한다. 임의의 양태의 일부 실시형태에서, KRAB 도메인은 서열식별번호: 72, 97, 214-215 중 어느 하나, 또는 이의 기능을 유지하는 서열식별번호: 72, 97, 214-215 중 어느 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, TR은 MeCP2의 전사 억제 도메인(TRD) 도메인, 또는 이의 기능적 단편을 포함한다. 임의의 양태의 일부 실시형태에서, MeCP2의 전사 억제 도메인(TRD) 도메인은 서열식별번호: 216 또는 이의 기능을 유지하는 서열식별번호: 216에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 72: KRAB 리프레서 도메인 (96 aa)
서열식별번호: 97: KRAB 리프레서 도메인 (65 aa)
서열식별번호: 214, KRAB-MeCP2 (382 aa), KRAB 도메인(굵은 텍스트), 글리신-세린 풍부 링커(무형식(unformatted) 텍스트) 및 MeCP2의 전사 억제 도메인(TRD) 도메인(기울임꼴 텍스트)을 포함함.
서열식별번호: 215, KRAB 리프레서 도메인 (74 aa)
서열식별번호: 216, MeCP2의 전사 억제 도메인(TRD) 도메인(296 aa)
임의의 양태의 일부 실시형태에서, TR은 Hp1a 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. 이질염색질 단백질 1(드로소필라의 HP1a)은 함동원체(pericentric) 이질염색질과 두드러지게 연관되고 수반되는 유전자 침묵을 매개하는 보존된 진핵생물 염색체 단백질이다. HP1a는 크로모 도메인을 통해 H3K9me2/3에 결합하고, 크로모 섀도우 도메인을 통해 K9 상의 히스톤 H3을 메틸화하는 히스톤 메틸트랜스퍼라제 중 하나인 SU(VAR)3-9에 결합한다. 임의의 양태의 일부 실시형태에서, Hp1a 리프레서 도메인은 서열식별번호: 98 또는 이의 기능을 유지하는 서열식별번호: 98에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 98: Hp1a 리프레서 도메인(190 aa)
임의의 양태의 일부 실시형태에서, TR은 EED 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. EED(배아 외배엽 발달)는 라이신 27에서 히스톤 H3을 메틸화하는(H3K27me3), 폴리콤(Polycomb) 억제 복합체 2(PRC2)의 일부로 기능한다. 폴리콤 패밀리 구성원은 연속적인 세포 세대에 걸쳐 유전자의 전사 억제 상태를 유지하는 데 관여하는 다량체 단백질 복합체를 형성한다. 임의의 양태의 일부 실시형태에서, EED 리프레서 도메인은 서열식별번호: 99 또는 또는 이의 기능을 유지하는 서열식별번호: 99에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 99: EED 리프레서 도메인(440 aa)
임의의 양태의 일부 실시형태에서, TR은 DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. DNMT3B는 CpG 메틸화에 관여하는데, 이는 배아 발달, 각인, 및 X-염색체 불활성화에 중요한 후생적 변형이다. 임의의 양태의 일부 실시형태에서, DNMT3B 리프레서 도메인은 서열식별번호: 217 또는 이의 기능을 유지하는 서열식별번호: 217에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 217, DNMT3B 리프레서 도메인(792 aa), Uniprot 식별자 Q9UBC3-5, DNA(시토신-5)-메틸트랜스퍼라제의 DNM3B_HUMAN 이소형 5
임의의 양태의 일부 실시형태에서, TR은 히스톤 데아세틸라제 4(HDAC4) 리프레서 도메인, 또는 이의 기능적 단편을 포함한다. HDAC4는 히스톤 H3 및 H4에서 아세틸기를 제거한다. 임의의 양태의 일부 실시형태에서, HDAC4 리프레서 도메인은 서열식별번호: 218 또는 이의 기능을 유지하는 서열식별번호: 218에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드를 포함한다.
서열식별번호: 218, HDAC4 도메인, GenBank: AAD29046.1 (1084 aa)
본 명세서에 기술된 임의의 양태의 또 다른 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF-함유 융합 단백질에서, 전사 이펙터 도메인은 후성유전적 이펙터 도메인이다. 예를 들어, 적어도 하나의 ZF 단백질 도메인은 (1) DNA 또는 히스톤 잔기(예를 들어, DNA 메틸트랜스퍼라제, 히스톤 메틸트랜스퍼라제, 히스톤 아세틸트랜스퍼라제)의 화학적 변형을 촉매하거나 (2) 화학적 변형(예를 들어, DNA 데메틸라제, DNA 디옥시게나제, DNA 히드록실라제, 히스톤 데메틸라제, 히스톤 데아세틸라제)을 제거하는 하나 이상의 염색질 조절 효소에 융합된다. 예를 들어, DNA 메틸트랜스퍼라제 DNMT(DNMT1, DNMT3)는 메틸기의 시토신으로의 전이를 촉매하며, 이는 일반적으로 억제 조절인자 단백질의 동원을 통해 전사 억제를 초래한다. 또 다른 예는 CBP/p300 히스톤 아세틸트랜스퍼라제이며, 이는 일반적으로 복수의 전사 인자와의 상호작용을 통한 전사 활성화와 연관된다. DNA 또는 히스톤 잔기(들) 상의 생화학적 마크의 침착(deposition)과 연관된 관련 후성유전적 이펙터 도메인은 HAT1, GCN5, PCAF, MLL, SET, DOT1, SUV39H, G9a, KAT2A/B 및 EZH1/2를 포함한다. DNA 또는 히스톤 잔기(들)로부터 생화학적 마크의 제거와 연관된 관련 후성유전적 이펙터 도메인은 TET1/2, SIRT 패밀리, LSD1, 및 KDM 패밀리를 포함한다.
DNA-결합 도메인
적어도 하나의 DNA-결합 도메인(DBD)을 포함하는 synTF가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5, 또는 그 이상의 DBD(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 DBD를 포함한다. 복수의 DBD를 포함하는 실시형태에서, 복수의 DBD는 상이한 개별 DBD 또는 동일한 DBD의 복수의 사본, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는 조작된 징크 핑거(ZF) 결합 도메인이다. 징크 핑거(ZF)는 DNA 및 RNA와 같은 핵산 서열과 상호작용할 수 있도록 하는 단백질 내의 핑거-형상의 접힘이다. 이러한 접힘은 당업계에 잘 알려져 있다. 접힘은 단백질의 특정 아미노산이 아연 원자에 결합하여 생성된다. 징크-핑거 함유 단백질(ZF 단백질이라고도 함)은 핵산 인식, 역전사 및 바이러스 조립뿐만 아니라 유전자의 발현을 조절할 수 있다.
ZF는 약 30개의 아미노산을 포함하는 비교적 작은 폴리펩티드 도메인이며, 접혀서 역평행 β-시트(ββα-접힘으로 알려짐)에 인접한 α-나선을 형성한다. 접힘은, 아래에서 추가로 설명되는 바와 같이, 4개의 크게 불변(징크 핑거 프레임워크 유형에 따라 다름) Cys 및/또는 His 잔기 사이의 아연 이온의 배위(co-ordination)에 의해 안정화된다. 천연 징크 핑거 도메인은 잘 연구되었고, 문헌에 기술되어 있으며, 예를 들어, Miller et al., (1985) EMBO J. 4: 1609-1614; Berg (1988) Proc. Natl. Acad. Sci. USA 85: 99-102; and Lee et al., (1989) Science 245: 635-637을 참조한다. ZF 도메인은, 이중-가닥 DNA 표적 서열에서 핵산 트리플릿, 또는 중첩 콰드로플릿(아래에 설명됨)을 인식하고 결합한다. 그러나, ZF는 또한 RNA 및 단백질에 결합하는 것으로 알려져 있다(Clemens, K. R. et al. (1993) Science 260: 530-533; Bogenhagen, D. F. (1993) Mol. Cell. Biol. 13: 5149-5158; Searles, M. A. et al. (2000) J. Mol. Biol. 301: 47-60; Mackay, J. P. & Crossley, M. (1998) Trends Biochem. Sci. 23: 1-4).
한 실시형태에서, 본 명세서에 사용되는 용어 "징크 핑거"(ZF) 또는 "징크 핑거 모티프"(ZF 모티프) 또는 "징크 핑거 도메인"(ZF 도메인)은 개별 "핑거"를 지칭하며, 이는 본 명세서의 다른 곳에서 기술된 바와 같이 아연 이온에 의해 안정화된 베타-베타-알파(ββ-α)-단백질 접힘을 포함한다. Zn-배위(coordinated) ββα 단백질 접힘은 "핑거"인 핑거-유사 돌출부를 생성한다. 각 ZF 모티프는 일반적으로 약 30개의 아미노산을 포함한다. 본 명세서에서 사용되는 용어 "모티프"는 구조적 모티프를 의미한다. ZF 모티프는 아연 이온에 의해 안정화된 ββα-접힘을 갖는 초이차(supersecondary) 구조이다.
한 실시형태에서, 당업계의 통상적인 용법에 따른 용어 "ZF 모티프"는 특정 기능과 동일시될 수 있는 폴리펩티드의 아미노산 서열의 이산된 연속 부분을 지칭한다. ZF 모티프는 대부분 구조적으로 독립적이며 다른 환경에서 구조와 기능을 유지할 수 있다. ZF 모티프는 구조적 및 기능적으로 독립적이기 때문에, 모티프가 도메인 자격도 갖추고 있으므로, 종종 ZF 도메인으로 지칭한다. 따라서, ZF 도메인은 이들의 표적 분자와 탠덤 접촉을 이루는 복수의 핑거-유사 돌출부를 포함하는 단백질 모티프이다. 일반적으로, ZF 도메인은 트리플릿 또는 (중첩) 콰드로플릿 뉴클레오티드 서열에 결합한다. 탠덤하게 배열된 인접 ZF 도메인은 링커 서열에 의해 함께 결합되어 어레이를 형성한다. ZF 펩티드는 일반적으로 ZF 어레이를 포함하고, 조합시 자연에는 존재하지 않는 복수의 "ZF 도메인"으로 구성된다. 따라서, 이들은 인공 또는 합성 ZF 펩티드 또는 단백질로 간주된다.
C2H2 징크 핑거(C2H2-ZFs)는 척추동물 DNA-결합 도메인의 가장 널리 퍼진 유형이며, 각각 3개(또는 그 이상)의 순차적인 염기와 접촉하는 순차 C2H2-ZF와 함께, 일반적으로 탠덤 어레이(ZFA)로 나타난다. C2H2-ZF는 모듈 방식으로 조립될 수 있다. 정의된 3-염기 특이성을 가진 일련의 모듈이 주어지면, 모듈식 조립은 또한 특정 DNA-결합 선호도로 인공 단백질을 구성하는 방법을 제시한다.
ZF-함유 단백질은 일반적으로 ZF(ZFA)의 어레이를 형성하는 ZF 모티프의 스트링 또는 사슬을 함유한다. 따라서, 천연 ZF 단백질은 2개 이상의 ZF, 즉 2개 이상의 ZF 모티프로 구성된 ZFA를 포함할 수 있으며, 이는 서로 직접적으로 인접할 수 있거나(즉, 짧은(표준) 링커 서열에 의해 분리될 수 있음), 또는 더 길고 유연하거나 구조화된 폴리펩티드 서열에 의해 분리될 수 있다. 직접적으로 인접한 ZF 도메인은 연접(contiguous) 핵산 서열, 즉 인접한 트리뉴클레오티드/트리플릿에 결합할 것으로 예상된다. 어떤 경우에, 교차-결합이 인접한 ZF와 이들 각각의 표적 트리플릿 사이에서도 발생할 수 있으며, 이는 표적 서열의 인식을 강화하거나 향상시키는 데 도움이 되고, 중첩 콰드로플렛 서열의 결합을 야기한다(Isalan et al., (1997) Proc Natl. Acad. Sci. USA, 94: 5617-5621). 이에 비해, 동일한 단백질 내의 원위(distant) ZF 도메인은 비-연접 핵산 서열 또는 심지어 상이한 분자(예를 들어, 핵산이라기 보다는 단백질)를 인식(또는 이에 결합)할 수 있다.
조작된 ZF-함유 단백질은 DNA-결합 징크 핑거 단백질 도메인(ZF 단백질 도메인) 및 단백질이 이의 효과를 발휘하는 또 다른 도메인(이펙터 도메인)으로 구성된 키메라 단백질이다. 이펙터 도메인은 전사 액티베이터 또는 리프레서, 메틸화 도메인 또는 뉴클레아제일 수 있다. DNA-결합 ZF 단백질 도메인은 조작된 징크 핑거 어레이(ZFA)를 포함할 수 있다. 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; US Patent 10,138,493; 미국 특허 출원 US20200002710A1.
조작된 ZF-함유 단백질은 비천연이고 적합하게는 3개 이상, 예를 들어 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 이상(예를 들어, 최대 약 30개 또는 32개) 탠덤하게 서로 인접하여 배열된 ZF 모티프를 포함하며, ZF 모티프 또는 ZFA의 어레이를 형성한다. 특히, 본 개시의 ZF-함유 synTF 단백질(ZF-함유 synTF 융합 단백질, 또는 간단히 synTF)은 적어도 3개의 ZF, 적어도 4개의 ZF 모티프, 적어도 5개의 ZF 모티프, 또는 적어도 6개의 ZF 모티프, 적어도 7개의 ZF 모티프, 적어도 8개의 ZF 모티프, 적어도 9개의 ZF 모티프, 적어도 10개의 ZF 모티프, 적어도 11개 또는 적어도 12개의 ZF 모티프; 및 일부 경우에 적어도 18개의 ZF 모티프를 포함한다. 다른 실시형태에서, ZF synTF는 최대 6, 7, 8, 10, 11, 12, 16, 17, 18, 22, 23, 24, 28, 29, 30, 34, 36, 40, 41, 42, 46, 47, 48, 54, 55, 56, 58, 59, 60개의 ZF 모티브를 함유한다. 일부 실시형태에서, ZF 어레이는 1개 이상의 ZF 모티프를 포함한다. 본 개시의 ZF-함유 synTF는 연접 직교 표적 핵산 결합 부위에 결합한다. 즉, 융합 단백질의 ZF 도메인에 포함되는 ZF 또는 ZFA는 직교 표적 핵산 서열에 결합한다.
한 실시형태에서, 본 명세서에 사용된 "조작된 합성 전사 인자" 또는 "조작된 synTF" 또는 "synTF"는 하기 특징 중 적어도 하나를 갖는 조작된 ZF-함유 키메라 단백질을 지칭하며 하나 이상을 가질 수 있다: 표적 직교 특이적 DNA 서열에 결합하고, 예를 들어, 숙주 진핵생물 게놈에서 감소되거나 최소한의 기능적 결합 잠재력을 가짐; 다른 원핵생물-유래 도메인에 비해 최소 수준의 면역원성을 부여하는, 포유류 단백질 스캐폴드에서 유래됨; 및 렌티바이러스 운반 구축물과 같은, 바이러스 운반 시스템에 패키징될 수 있음.
또 다른 실시형태에서, 본 명세서에 사용되는 용어 "조작된 합성 전사 인자" 또는 "조작된 synTF"("synTF" 또는 "ZF synTF"로 약칭됨)는 폴리펩티드인 합성 전사 인자를 함유하는 조작된 ZF, 즉, ZF 함유 합성 전사 인자 단백질을 지칭한다. 이러한 synTF는 특정 표적 핵산 서열에 결합하기 위한 ZF 어레이(ZFA)를 내부에 함유한다. synTF는 DNA-결합, ZF-함유 단백질 도메인 및 synTF가 유전자 발현에 영향을 미치는 이펙터 도메인을 포함하는 키메라 융합 단백질이다. 이러한 synTF는 유전자 발현을 조절할 수 있으며, 여기서 조절은 synTF의 DNA-결합, ZF-함유 단백질이 결합하는 특정 표적 핵산 서열에도 작동가능하게 연결된 프로모터에 작동가능하게 연결된 유전자의 발현을 증가 또는 감소시킴으로써 이루어진다.
본 명세서에 사용되는 용어 "ZF 어레이"("ZFA"로 약칭됨)는 탠덤하게 배열된 ZF 모티프의 어레이, 스트링, 또는 사슬을 지칭한다. ZFA는 6개의 ZF 모티프(6-핑거 ZFA), 7개의 ZF 모티프(7-핑거 ZFA), 또는 8개의 ZF 모티프(8-핑거 ZFA)를 가질 수 있다.
본 명세서에 사용되는 용어 "조작된 반응성/반응 프로모터", "조작된 프로모터" 또는 "조작된 반응성/반응 프로모터 요소"는, 직교 DNA 표적 서열이 각각의 전사 인자에 의해 결합될 때 직교 DNA 표적 서열이 프로모터에 반응적 특성을 부여하도록 프로모터 서열의 상류에 작동가능하게 연결된 적어도 하나의 직교 DNA 표적 서열을 갖는 프로모터 서열을 함유하는 핵산 구축물을 지칭하며, 반응적 특성은 상류 부근의 직교 DNA 표적 서열이 ZF-함유 합성 전사 인자에 의해 결합될 때 해당 프로모터로부터의 유전자 전사 개시가 향상되거나 억제되는지 여부이다. 프로모터 서열의 상류에 작동가능하게 연결된 하나 이상의 직교 DNA 표적 서열이 있을 수 있다. 하나의 직교 DNA 표적 서열이 있는 경우, 프로모터는 "1X" 프로모터로 지칭되며, 여기서 "1X"는 프로모터 구축물에 존재하는 직교 DNA 표적 서열의 수를 나타낸다. 예를 들어, 4X 반응성 프로모터는 조작된 반응 프로모터 구축물에서 4개의 직교 DNA 표적 서열을 갖는 것으로 확인될 것이고, 4개의 직교 DNA 표적 서열은 프로모터 서열의 상류에 있다.
ZF 단백질 도메인은 징크 핑거 어레이(ZFA)를 주요 구성요소로 하여 모듈식으로 설계되며, 각 ZFA는 6-8개 ZF 모티프로 이루어진다. ZF 단백질 도메인은 적어도 하나의 ZFA를 포함하고, 최대 10개의 ZFA를 포함할 수 있다. ZF 단백질 도메인은 하나에서 최대 10개의 ZFA를 가질 수 있다.
본 명세서에 기술된 synTF 또는 임의의 조작된 융합 단백질의 디자인은 또한 모듈식이며, 이는 synTF가 ZF 도메인(ZFA)의 모듈 및 이펙터 도메인/단백질 상호작용 도메인/리간드 결합 도메인/이량체화 도메인의 모듈로 구성됨을 의미하며, 개별 모듈은 본 명세서에 기술된 바와 같이 함께 공유적으로 접합되고, 개별 모듈은 서로 독립적으로 기능한다. ZFA의 수는 1, 2, 3, 4, 5, 6, 7, 8, 9 및 최대 10까지 가능하다. 2개 이상의 ZFA가 있는 경우, ZFA는, 예를 들어, L1 펩티드 링커에 의해 NH2-에서 COOH- 말단 배열로 탠덤하게 서로 공유적으로 컨주게이션되어 ZFA의 어레이를 형성한다. ZFA는, 전체적으로, ZF 단백질 도메인을 형성하고, 이펙터 도메인 또는 조절인자 단백질의 N-말단 또는 C-말단에 공유적으로 연결된다. 본 명세서에 기술된 synTF 또는 ZF-함유 융합 단백질의 ZF 단백질 도메인에 존재하는 ZFA가 2개 이상 있는 경우, ZFA는 동일하거나, 상이할 수 있다.
본 명세서에 개시된 synTF의 ZF 단백질 도메인 또는 본 명세서에 기술된 ZF 함유 융합 단백질의 각 모듈 ZFA는 6 내지 8개의 ZF 모티프로 구성된다. 7개의 ZF 모티프를 갖는 단일 ZFA, 7-핑거 ZFA의 일예에 대한 도 2b 참조. ZF 모티프는 α 나선과 역평행 β 시트(αββ)로 구성된 작은 단백질 구조의 모티프이며, 핑거-유사 돌출 접힘, "핑거"를 안정화시키기 위해 모티프 내 2개의 히스티딘 잔기와 2개의 시스테인 잔기에 의해 하나의 아연 이온이 배위하는 것이 특징이다. 본 명세서에 개시된 synTF의 ZF 단백질 도메인 내의 ZF 모티프는 Cys2His2 징크 핑거 모티프이다. 한 실시형태에서, ZF 모티프는 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)의 펩티드를 포함하거나, 이로 본질적으로 이루어지거나, 또는 이로 이루어지며, 여기서 X는 임의의 아미노산, 아래 첨자 번호는 아미노산 잔기의 가능한 수를 나타내고, C는 시스테인이고, H는 히스티딘이고, (나선)은 짧은 알파 나선을 형성하는 α-6(또는 7) 연접 아미노산 잔기 펩티드이다.
나선은 가변적이다. 이 짧은 알파 나선은 ZF 모티프에서 2개의 히스티딘 잔기와 2개의 시스테인 잔기에 의한 아연 이온의 배위를 통해 형성된 핑거의 한 면을 형성한다. 각각의 ZFA에 대해, 그 안의 6 내지 8개의 ZF 모티프는 약 4 내지 6개의 아미노산 잔기를 갖는 펩티드 링커에 의해 NH2-에서 COOH- 말단으로 서로 연결되어 ZF 모티프 또는 ZF의 어레이를 형성한다. 각 ZF 모티프의 핑거-유사 돌출 접힘은 핵산 서열과 상호 작용하고 결합한다. 대략 2개의 ZF 모티프에 대해 한 펩티드 서열이 ~6개 염기쌍(bp) 핵산 서열과 상호작용하고 이에 결합한다. ZFA 내의 복수의 ZF 모티프는 직교 표적 DNA 서열과 접촉하는 핑거-유사 돌출부를 형성한다. 따라서, 예를 들어, 6개의 ZF 모티프 또는 핑거-유사 돌출부가 있는 ZFA(6-핑거 ZFA)는 ~18-20bp 핵산 서열과 상호작용하여 결합하고, 8-핑거 ZFA는 ~24-26bp 핵산 서열에 결합한다. 따라서, 한 실시양태에서, synTF의 ZF 단백질 도메인 내의 ZFA는 N'-[(식 1)-L2]6-8-C' 서열을 포함하거나, 이로 본질적으로 이루어거나, 이로 이루어지며, 여기서 아래첨자 6-8은 ZF 모티프의 수를 나타내고, L2는 4-6개의 아미노산 잔기를 갖는 링커 펩티드이며, N'- 및 C'-는 각각 펩타이드 서열의 N-말단 및 C-말단을 나타낸다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-C'이고, ZFA가 본질적으로 8개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]-[(식 1)-L2]- ]-[(식 1)-L2]-[(식 1)-L2]-C'이다.
본 명세서에 기술된 임의의 양태의 또 다른 실시형태에서, ZF 모티프는 화학식 2의 펩티드, [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)를 포함하며, 여기서 X는 임의의 아미노산이고, 아래 첨자 숫자는 가능한 아미노산 잔기 수, C는 시스테인, H는 히스티딘, (나선)은 짧은 알파 나선을 형성하는 6개(또는 7개) 연접 아미노산 잔기 펩티드이다. 따라서, 한 실시형태에서, synTF의 ZF 단백질 도메인 내의 ZFA는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 본질적으로 구성되거나, 또는 이로 구성되며, 여기서 아래첨자 6-8은 ZF 모티프의 수를 나타내고, L2는 4-6개의 아미노산 잔기를 갖는 링커 펩티드이며, N'- 및 C'-는 각각 펩티드 서열의 N-말단 및 C-말단을 나타낸다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-C'이고 ZFA가 본질적으로 8개의 ZF 모티프로 구성된 경우, 서열은 N'-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-[(식 2)-L2]-]-[(식 2)-L2]-[(식 2)-L2]-C'이다
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 단일 ZFA가 본 명세서에 기술된 synTF의 ZF 단백질 도메인인 경우, ZF 단백질 도메인 내의 ZFA는 다음 서열을 포함하거나, 본질적으로 구성되거나, 이로 구성된다: N'-PGERPFQCRICMRNFS-(나선 1)-HTRTHTGEKPFQCRICMRNFS-(나선 2)- HLRTHTGSQK PFQCRICMRNFS-(나선 3)-HTRTHTGEK PFQCRICMRNFS-(나선 4)-HLRTHTGSQKPFQCRICMRNFS-(나선 5)-HTRTHTGEK PFQCRICMRNFS-(나선 6)-HLRTHLR-C'(서열식별번호: 380), 여기서 (나선)은 짧은 알파 나선을 형성하고 또한 일반 텍스트 "xxxxxxx"로 표시될 수 있는 α-6(또는 7) 연접 아미노산 잔기 펩티드이다.
서열식별번호: 377, 징크 핑거 도메인 스캐폴드; 기울임꼴 이중 밑줄그어진 텍스트는 제한 사이트를 나타내고; 일반 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6를 나타낸다.
서열식별번호: 101, 징크 핑거 도메인 스캐폴드, 여기서 [나선 1], [나선 2], [나선 3], [나선 4], [나선 5], 및 [나선 6]은 또한 일반 텍스트 "xxxxxxx"로 나타낼 수 있다.
서열식별번호: 76, 징크 핑거 도메인 스캐폴드; 기울임꼴 이중 밑줄그어진 텍스트는 제한 부위를 나타낸다. 일반 텍스트 "xxxxxxxx"는 6개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로 나선 1, 나선 2, 나선 3, 나선 4, 나선 5, 및 나선 6를 나타낸다.
임의의 양태의 일부 실시형태에서, 징크 핑거 스캐폴드는 서열식별번호: 76, 101, 377, 380, 또는 동일한 기능을 유지하는 서열식별번호: 76, 101, 377, 또는 380 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 폴리펩티드 중 하나를 포함한다.
한 실시형태에서, 나선 1, 2, 3, 4, 5 및 6의 6개 모두는 서로 구별되고 상이하다. 다른 실시형태에서, 나선 1, 2, 3, 4, 5 및 6의 6개 모두는 서로 동일하다. 달리, 6개의 나선 중 적어도 2개가 서로 동일하고 같다. 다른 실시형태에서, ZFA의 6개 나선 중 적어도 3개는 서로 동일하고 같거나, ZFA의 6개 나선 중 적어도 4개는 서로 동일하고 같거나, 또는 ZFA의 6개 나선 중 적어도 5개는 서로 동일하고 같다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 개시된 개별 ZFA의 6 내지 8개의 ZF 모티프의 나선은 다음 그룹 1-11(예를 들어, 서열식별번호: 122-180, 192) 중 하나에 기재된 6-아미노산(또는 7-아미노산) 잔기 펩티드 서열로부터 선택된다. 일부 실시형태에서, 본 명세서에 개시된 개별 ZFA 내의 ZF 모티프 중 적어도 4개는 하기 그룹 1-11 중 하나에 개시된 6-아미노산(또는 7-아미노산) 잔기 펩티드 서열로부터 선택된다. 다른 실시형태에서, 모든 ZF 모티프, 즉 본 명세서에 개시된 개별 ZFA의 6개, 7개 또는 8개 ZF 모티프는 하기 그룹 1-11 중 하나에 개시된 6개(또는 7개) 아미노산 잔기 펩티드 서열로부터 선택된다. 임의의 개별 ZFA에서, ZFA를 포함하는 단일 ZF에 대해 선택된 나선은 ZFA에서 두 번 이상 반복될 수 있다. 이는 임의의 주어진 단일 ZFA에 대해, ZFA의 적어도 4개 또는 모든 나선이 본 명세서에 개시된 동일한 그룹으로부터 선택됨을 의미한다. 예를 들어, ZFA가 본질적으로 6개의 ZF 모티프로 구성되는 경우, 이는 6개의 알파 나선이 있음을 의미한다. 개별 ZFA에 있는 ZF의 모든 6-8개 나선(나선 1; 나선 2; 나선 3; 나선 4; 나선 5; 나선 6; 나선 7; 나선 8)은 다음 그룹 1-11 중 하나에서 선택되며, 예를 들어, 6개의 나선은 모두 그룹 2에서 선택된다. 즉, 단일 ZFA를 구성하는 모든 ZF의 나선은 모두 동일한 그룹에서 나온다. 대안적으로, 6개의 나선 중 적어도 4개는 그룹 1-11에서 선택된 한 그룹인 동일한 그룹에서 선택된다. 예를 들어, 6개의 나선 중 4개는 그룹 5에서 선택되고, 6-ZF 모티프 ZFA의 나머지 2개 나선은 다른 그룹 1-4, 6-11에서 선택되거나, 또는 짧은 알파 나선을 형성하는 임의의 다른 나선일 수 있다. ZFA를 구성하는 다른 나머지 나선은 당업계에 공지된 것일 수 있다.
표 10: 그룹 1-4 나선
표 11: 그룹 5-7 나선
표 12: 그룹 8-11 나선
나선이 그룹 1에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 ZFA에서 6개 나선의 조합 및 배열의 비제한적 예(그룹 1 ZFA 나선 콤보)는 다음과 같다:
ZF 1-1: N'-DEANLRR, DPSVLKR, QSANLLR, DPSSLKR,QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 124, 125, 126, 및 127)
ZF 1-2: N'-DEANLRR, DPSVLKR, QSANLLR, DPSSLKR,QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 124, 125, 126, 및 128)
ZF 1-3: N'-EEANLRR, DHSSLKR, QSANLLR, DPSSLKR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 124, 125, 126, 및 127)
ZF 1-4: N'-EEANLRR, DHSSLKR, QSANLLR, DPSSLKR QQTNLTR, ERRSLAR-C'(출현 순서로, 각각, 서열식별번호 129, 130, 124, 125, 126, 및 128)
ZF 1-5: N'-DEANLRR, DPSVLKR, QQTNLTR, ERRSLAR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 126, 128, 126, 및 127)
ZF 1-6: N'-DEANLRR, DPSVLKR, QQTNLTR, ERRSLAR QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 122, 123, 126, 128, 126, 및 128)
ZF 1-7: N'-EEANLRR, DHSSLKR, QQTNLTR, ERRSLAR QQTNLTR, DATQLVR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 126, 128, 126, 및 127)
ZF 1-8: N'-EEANLRR, DHSSLKR, QQTNLTR, ERRSLAR QQTNLTR, ERRSLAR-C' (출현 순서로, 각각, 서열식별번호 129, 130, 126, 128, 126, 및 128).
나선이 그룹 2에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 존재하는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 2 ZFA 나선 콤보)는 다음과 같다:
ZF 2-1: N'-QRSSLVR, DMGNLGR, RSHDLTR, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 133, 134, 13, 및 136)
ZF 2-2: N'-QKQALTR, DRGNLTR, RSHDLTR, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 133, 134, 13, 및 136)
ZF 2-3: N'-QRSSLVR, DMGNLGR, RSHDLTV, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 139, 134, 13, 및 136)
ZF 2-4: N'-QKQALTR, DRGNLTR, RSHDLTV, HKSSLTR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 139, 134, 13, 및 136)
ZF 2-5: N'-QRSSLVR, DMGNLGR, RSHDLTR, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 133, 134, 148, 및 149)
ZF 2-6: N'-QKQALTR, DRGNLTR, RSHDLTR, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 133, 134, 148, 및 149)
ZF 2-7: N'-QRSSLVR, DMGNLGR, RSHDLTV, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 132, 139, 134, 148, 및 149)
ZF 2-8: N'-QKQALTR, DRGNLTR, RSHDLTV, HKSSLTR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 137, 138, 139, 134, 148, 및 149)
나선이 그룹 3에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 3 ZFA 나선 콤보)는 다음과 같다:
ZF 3-1: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 142, 및 138)
ZF 3-2: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 143, 및 138)
ZF 3-3: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 142, 및 138)
ZF 3-4: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 143, 및 138)
ZF 3-5: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 142, 및 138)
ZF 3-6: N'-QRSSLVR, DKSVLAR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 141, 143, 및 138)
ZF 3-7: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 142, 및 138)
ZF 3-8: N'-QKQALDR, DTSVLNR, QRSSLVR, QTNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 141, 143, 및 138)
임의의 양태의 일부 실시형태에서, QRNNLGR(서열식별번호: 192)이 QTNNLGR(서열식별번호: 141) 대신에 사용된다. 나선이 그룹 3에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 3 ZFA 나선 콤보)는, 다음과 같다:
ZF 3-1: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 142, 및 138)
ZF 3-2: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 143, 및 138)
ZF 3-3: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 142, 및 138)
ZF 3-4: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 143, 및 138)
ZF 3-5: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 142, 및 138)
ZF 3-6: N'-QRSSLVR, DKSVLAR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 131, 140, 131, 192, 143, 및 138)
ZF 3-7: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, THAVLTR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 142, 및 138)
ZF 3-8: N'-QKQALDR, DTSVLNR, QRSSLVR, QRNNLGR, TKSLLAR, DRGNLTR-C' (출현 순서로, 각각, 서열식별번호 144, 145, 131, 192, 143, 및 138).
나선이 그룹 4로부터 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 4 ZFA 나선 콤보)는, 다음과 같다.
ZF 4-1: N'-QQTNLTR, QGTSLAR, VRHNLTR, DKSVLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 140, 13, 및 136)
ZF 4-2: N'-QQTNLTR, QGTSLAR, VRHNLTR, DKSVLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 140, 148, 및 149)
ZF 4-3: N'-QQTNLTR, QGTSLAR, VRHNLTR, DHSNLSR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 150, 13, 및 136)
ZF 4-4: N'-QQTNLTR, QGTSLAR, VRHNLTR, DHSNLSR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 146, 147, 150, 148, 및 149)
ZF 4-5: N'-QQTNLTR, QSTSLQR, VRHNLTR, DKSVLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 140, 13, 및 136)
ZF 4-6: N'-QQTNLTR, QSTSLQR, VRHNLTR, DKSVLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 140, 148, 및 149)
ZF 4-7: N'-QQTNLTR, QSTSLQR, VRHNLTR, DHSNLSR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 150, 13, 및 136)
ZF 4-8: N'-QQTNLTR, QSTSLQR, VRHNLTR, DHSNLSR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 151, 147, 150, 148, 및 149)
나선이 그룹 5에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 5 ZFA 나선 콤보)는, 다음과 같다:
ZF 5-1: N'-NMSNLTR, DRSVLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 154, 155, 156, 및 156)
ZF 5-2: N'-QLANLAR, DQTTLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 154, 155, 156, 및 156)
ZF 5-3: N'-NMSNLTR, DRSVLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 159, 155, 156, 및 156)
ZF 5-4: N'-QLANLAR, DQTTLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 159, 155, 156, 및 156)
ZF 5-5: N'-NMSNLTR, DRSVLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 154, 155, 156, 및 156)
ZF 5-6: N'-QLANLAR, DQTTLRR, LQENLTR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 154, 155, 156, 및 156)
ZF 5-7: N'-NMSNLTR, DRSVLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 152, 153, 159, 155, 156, 및 156)
ZF 5-8: N'-QLANLAR, DQTTLRR, DPSNLAR, DRSSLRR, QSGTLHR, QSGTLHR-C' (출현 순서로, 각각, 서열식별번호 157, 158, 159, 155, 156, 및 156)
나선이 그룹 6에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 6 ZFA 나선 콤보)는, 다음과 같다:
ZF 6-1: N'-QQTNLTR, QGGNLAL, DHSSLKR, RADMLRR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 161, 13, 및 136)
ZF 6-2: N'-QQTNLTR, QGGNLAL, DHSSLKR, RADMLRR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 161, 148, 및 149)
ZF 6-3: N'-QQTNLTR, QKANLGV, DHSSLKR, RADMLRR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 161, 13, 및 136)
ZF 6-4: N'-QQTNLTR, QKANLGV, DHSSLKR, RADMLRR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 161, 148, 및 149)
ZF 6-5: N'-QQTNLTR, QGGNLAL, DHSSLKR, RLDMLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 163, 13, 및 136)
ZF 6-6: N'-QQTNLTR, QGGNLAL, DHSSLKR, RLDMLAR, EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 160, 130, 163, 148, 및 149)
ZF 6-7: N'-QQTNLTR, QKANLGV, DHSSLKR, RLDMLAR, DSSNLRR, DQGNLIR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 163, 13, 및 136)
ZF 6-8: N'-QQTNLTR, QKANLGV, DHSSLKR, RLDMLAR,EKQNLAR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 126, 162, 130, 163, 148, 및 149)
나선이 그룹 7에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 7 ZFA 나선 콤보)는, 다음과 같다:
ZF 7-1: N'-QRSSLVR, QRGNLNM, RPQELRR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 165, 130, 166, 및 167)
ZF 7-2: N'-QRSSLVR, QQGNLQL, RPQELRR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 165, 130, 166, 및 167)
ZF 7-3: N'-QRSSLVR, QRGNLNM, RRQELTR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 169, 130, 166, 및 167)
ZF 7-4: N'-QRSSLVR, QQGNLQL, RRQELTR, DHSSLKR, RQDNLGR, DGGNLGR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 169, 130, 166, 및 167)
ZF 7-5: N'-QRSSLVR, QRGNLNM, RPQELRR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 165, 130, 166, 및 149)
ZF 7-6: N'-QRSSLVR, QQGNLQL, RPQELRR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 165, 130, 166, 및 149)
ZF 7-7: N'-QRSSLVR, QRGNLNM, RRQELTR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 164, 169, 130, 166, 및 149)
ZF 7-8: N'-QRSSLVR, QQGNLQL, RRQELTR, DHSSLKR, RQDNLGR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 131, 168, 169, 130, 166, 및 149)
나선이 그룹 8에서 선택되고 모티브가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 8 ZFA 나선 콤보)는, 다음과 같다:
ZF 8-1: N'-QASNLTR, DHSSLKR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 170, 130, 171, 131, 172, 및 149)
ZF 8-2: N'-QASNLTR, DHSSLKR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 170, 130, 171, 131, 173, and 149)
ZF 8-3: N'-QRSNLAR, DHSSLKR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 174, 130, 171, 131, 172, 및 149)
ZF 8-4: N'-QRSNLAR, DHSSLKR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 174, 130, 171, 131, 173, 및 149)
나선이 그룹 9에서 선택되고 모티프가 NH2-에서 COOH-말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 9 ZFA 나선 콤보)는, 다음과 같다:
ZF 9-1: N'-DSSNLRR, DQGNLIR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 135, 136, 171, 131, 172, 및 149)
ZF 9-2: N'-EKQNLAR, DPSNLRR, RAHNLLL, QRSSLVR, QSTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 148, 149, 171, 131, 172, 및 149)
ZF 9-3: N'-DSSNLRR, DQGNLIR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 135, 136, 171, 131, 173, 및 149)
ZF 9-4: N'-EKQNLAR, DPSNLRR, RAHNLLL, QRSSLVR, QGTTLKR, DPSNLRR-C' (출현 순서로, 각각, 서열식별번호 148, 149, 171, 131, 173, 및 149)
나선이 그룹 10에서 선택되고 모티프가 NH2-에서 COOH- 말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 10 ZFA 나선 콤보)는, 다음과 같다:
ZF 10-1: N'-RRHGLDR, DHSSLKR, VRHNLTR, DHSNLSR, QRSSLVR, ESGHLKR-C' (출현 순서로, 각각, 서열식별번호 175, 130, 147, 150, 131, 및 176)
나선이 그룹 11에서 선택되고 모티프가 NH2-에서 COOH- 말단 배열로 있는 단일 6-핑거 ZFA에서 6개의 나선의 조합 및 배열의 비제한적 예(그룹 11 ZFA 나선 콤보)는, 다음과 같다:
ZF 11-1: N'-QLSNLTR, DRSSLKR, QRSSLVR, RLDMLAR, VRHSLTR, ESGALRR-C' (출현 순서로, 각각, 서열식별번호 177, 178, 131, 163, 179, 및 180)
따라서, 일부 양태에서, ZF 단백질 도메인, 이펙터 도메인, 및 조절인자 단백질을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF-함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 본 명세서에 개시된 ZFA 나선 콤보 그룹 1-11 중 하나로부터 선택된 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함한다. ZF 단백질 도메인에 2개 이상의 ZFA(즉, ZF 어레이)가 있는 경우, 도메인의 각 ZFA는 본 명세서에 개시된 ZFA 나선 콤보 그룹 1-11 중 하나로부터 선택된 ZFA 나선 콤보를 가지며, 선택된 ZFA 나선 콤보 그룹은 synTF의 ZF 단백질 도메인 중의 각 ZFA에 대해 다르거나 중복될 수 있다. 예를 들어, synTF가 본질적으로 3개의 ZFA(3-ZFA 어레이에서 ZFA-1―ZFA-2―ZFA-3)와 이펙터 도메인으로 구성된 ZF 단백질 도메인을 포함하는 경우, ZFA-1은 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-2는 그룹 5 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-3은 그룹 7 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖는다. 다른 실시형태에서, 선택된 ZFA 나선 콤보 그룹은 synTF의 ZF 어레이에 대해 중복 또는 삼중화될 수 있다. 예를 들어, synTF의 3-ZFA 어레이-함유 ZF 단백질 도메인에서, ZFA 중 2개는 동일한 ZFA 나선 콤보 그룹, 예를 들어, 그룹 2에서 선택된 ZFA 나선 콤보를 포함하고, 제3 ZFA는 다른 ZFA 나선 콤보 그룹, 예를 들어, 그룹 4로부터 선택된 ZFA 나선 콤보를 갖는다. 동일한 그룹 2 ZFA 나선 콤보로부터 선택된 ZFA 나선 콤보를 갖는 2개의 ZFA는 나선 ZFA의 상이하거나 동일한 실제 조합 및 배열을 가질 수 있다. 예를 들어, synTF가 본질적으로 5개의 ZFA(5-ZFA 어레이에서 ZFA-1―ZFA-2―ZFA-3―ZFA-4―ZFA-5)와 이펙터 도메인으로 구성된 ZF 단백질 도메인으로 구성되는 경우, ZFA-1은 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-2는 그룹 5 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-3은 또한 그룹 1 ZFA 나선 콤보에서 선택한 ZFA 나선 콤보를 갖고, ZFA-4는 그룹 4 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고, ZFA-5는 그룹 2 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖는다. ZFA-1과 ZFA-3은 모두 그룹 1 ZFA 나선 콤보에서 선택된 ZFA 나선 콤보를 갖고 있지만, ZFA-1과 ZFA-3 내의 나선의 실제 조합과 배열은 다를 수도 있고 같을 수도 있다. 예를 들어, ZFA-1 및 ZFA-3는, 각각, ZFA 나선 콤보 ZF 1-1 및 ZF 1-5를 갖거나, 또는 ZFA-1 및 ZFA-3 둘 다 ZFA 나선 콤보 ZF 1-1을 갖는다.
다른 양태에서, ZF 단백질 도메인 및 이펙터 도메인을 포함하거나, ZF 단백질 도메인, 이펙터 도메인, 및 리간드 결합 도메인을 포함하거나, 또는 ZF 단백질 도메인 및 리간드 결합 도메인 또는 이량체화 도메인을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF-함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 본 명세서에 개시된 ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1, 및 ZF 11-1로 이루어진 군에서 선택된 적어도 하나의 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함한다.
임의의 양태의 일부 실시형태에서, ZF 단백질 도메인은 ZF1-3, ZF2-6, ZF3-5, ZF4-8, ZF5-7, ZF6-4, ZF7-3, ZF8-1, ZF9-2, ZF10-1 및 ZF11-1로 이루어진 그룹으로부터 선택된 ZFA 나선 콤보를 갖는 적어도 하나의 ZFA를 포함하며, 이들은 본 명세서에서 ZF1, ZF2, ZF3, ZF4, ZF5, ZF6, ZF7, ZF8, ZF9, ZF10, 및 ZF11로 각각 지칭되기도 한다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 임의의 ZF-함유 융합 단백질에서, 기재된 단백질 내의 개별 ZFA는 직교 표적 DNA 서열(또한 본 명세서에서 DNA 결합 모티프로 지칭됨)에 결합하도록, 예컨대 다음과 같이 특이적으로 설계된다:
표적 1: 5' C GTC GAA GTC GAA GTC GAC C 3'(서열식별번호: 181)
표적 2: 5' G GAC GAC GTT ACG GAC GTA C 3'(서열식별번호: 182)
표적 3: 5' A GAC GTC GAA GTA GCC GTA G 3'(서열식별번호: 183)
표적 4: 5' G GAC GAC GCC GAT GTA GAA G 3'(서열식별번호: 184)
표적 5: 5' T GAA GCA GTC GAC GCC GAA G 3'(서열식별번호: 185)
표적 6: 5' G GAC GAC GCG GTC TAA GAA G 3'(서열식별번호: 186)
표적 7: 5' C GAC GAG GTC GCA TAA GTA G 3'(서열식별번호: 187)
표적 8: 5' A GAC GCA GTA TAG GTC GAA C 3'(서열식별번호: 188)
표적 9: 5' A GAC GCA GTA TAG GAC GAC G 3'(서열식별번호: 189)
표적 10: 5' C GGC GTA GCC GAT GTC GCG C 3'(서열식별번호: 190)
표적 11: 5' G GTC GTT GCG GTA GTC GAA G 3'(서열식별번호: 191)
임의의 양태의 일부 실시형태에서, ZF 결합 도메인은 서열식별번호: 181-191 중 적어도 하나를 포함하는 서열 또는 동일한 기능을 유지하는 서열식별번호: 181-191 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열에 특이적으로 결합한다.
임의의 양태의 일부 실시형태에서, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, 및 ZF 1-8은 표적 1에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7 및 ZF 2-8은 표적 2에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, 및 ZF 3-8은 표적 3에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8은 표적 4에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5- 5, ZF 5-6, ZF 5-7, 및 ZF 5-8은 표적 5에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4 , ZF 6-5, ZF 6-6, ZF 6-7, 및 ZF 6-8은 표적 6에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, 및 ZF 7-8은 표적 7에 결합한다. 임의의 양태의 일부 실시형태에서, ZF 8-1, ZF 8-2, ZF 8-3 및 ZF 8-4는 표적 8에 결합한다. 임의의 양태의 일부 실시형태, ZF 9-1, ZF 9-2, ZF 9-3, 및 ZF 9-4는 표적 9에 결합한다. 임의의 양태의 일부 실시형태에서, ZF10-1은 표적 10에 결합한다. 임의의 양태의 일부 실시형태에서, ZF11-1은 표적 11에 결합한다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 표적 1-11로부터 선택된 표적 DNA 서열을 표적으로 하는, N'-[(식 1)-L2]6-8-C' 서열 또는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 이로 이루어지거나, 또는 본질적으로 이루어지는 ZFA가 본 명세서에 제공되며, 여기서 화학식 1은 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)이고 화학식 2는 [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)이다.
다른 양태에서, ZF 단백질 도메인 및 이펙터 도메인을 포함하거나, ZF 단백질 도메인, 이펙터 도메인, 및 리간드 결합 도메인을 포함하거나, 또는 ZF 단백질 도메인 및 리간드 결합 도메인 또는 이량체화 도메인을 포함하는 본 명세서에 기술된 조작된 synTF 또는 ZF 함유 융합 단백질이 본 명세서에 제공되며, 여기서 ZF 단백질 도메인은 적어도 하나의 ZFA를 포함하고, 적어도 하나의 ZFA는 N'-[(식 1)-L2]6-8-C' 서열 또는 N'-[(식 2)-L2]6-8-C' 서열을 포함하거나, 이로 구성되거나, 또는 이로 본질적으로 구성되며, 상기 내의 ZFA(들)은 표적 1-11로부터 선택된 표적 DNA 서열을 표적으로 하고, 여기서 화학식 1은 [X0-3CX1-5CX2-7-(나선)-HX3-6H](서열식별번호: 219)이고 화학식 2는 [X3CX2CX5-(나선)-HX3H](서열식별번호: 220)이다.
임의의 양태의 일부 실시형태에서, ZF 결합 도메인은 서열식별번호: 1-3 중 하나, 또는 동일한 기능을 유지하는 서열식별번호: 1-3 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 1, ZF1-3 (ZF1)의 서열
서열식별번호: 2, ZF3-5 (ZF3)의 서열
서열식별번호: 3, ZF10-1 (ZF10)의 서열
임의의 양태의 일부 실시형태에서, DBD는 3-유닛 ZF 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, 3-단위 ZF 단백질은 서열식별번호: 221-228 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 221-228 중 하나에 대해 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 221 고친화도 스캐폴드(굵은 글씨는 돌연변이 잔기를 나타내고, 일반 텍스트 "xxxxxxx"는 3개의 ZF 나선, 예를 들어, N 말단에서 C 말단으로, 각각, 나선 1, 나선 2, 나선 3을 나타냄)
서열식별번호: 222 저친화도 스캐폴드(굵은 글씨는 돌연변이된 잔기를 나타내고 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는, 13-6, 14-3, 21-16, 36-4, 37-12, 42-10, 43-8, 54-8, 55-1, 62-1, 92-1, 93-10, 97-4, 129-3, 150-4, 151-1, 158-2, 172-5, 및 173-3으로 이루어진 그룹으로부터 선택되며; 예를 들어, Khalil et al., Cell Volume 150, Issue 3, 3 August 2012, Pages 647-658; 미국 특허 제10,138,493호; 미국 특허 출원 US20200002710A1을 참조하며, 이들 각각의 전문은 본 명세서에 참조로 인용된다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 DBD는, 36-4(서열 223), 43-8(서열 224 또는 225), 42-4(서열 223), 43-8(서열 224 또는 225), 10(서열번호 226-227), 97-4(서열번호 228) 중 임의의 것에서 하나 이상 선택된다.
서열식별번호: 223, 36-4 (굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타낸다)
서열식별번호: 224 43-8 저친화도(굵은 글씨는 돌연변이된 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
서열식별번호: 225 43-8 고친화도(굵은 글씨는 돌연변이 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
서열식별번호: 226 42-10 저친화도(굵은 글씨는 돌연변이된 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
서열식별번호: 227 42-10 높은 친화도(굵은 글씨는 돌연변이 잔기를 나타내고, 굵은 기울임꼴 텍스트는 각각 나선 1, 2 및 3을 나타냄)
서열식별번호: 228, 97-4 (굵은 기울임꼴 텍스트는, 각각, 나선 1, 2 및 3을 나타냄)
임의의 양태의 일부 실시형태에서, DBD는 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합한다.
서열식별번호: 229는 36-4에 대한 예시적인 DBM(DNA 결합 모티프) 핵산 서열이다: c GAA GAC GCT g.
서열식별번호: 230 내지 서열식별번호: 232는 43-8에 대한 예시적인 DBM 친화성 변이체 핵산 서열이다. 굵은 텍스트는 WT 서열에서 돌연변이된 잔기를 나타낸다. 서열식별번호: 230은 43-8 DBM1 - aGAGTGAGGAc -이다. 서열식별번호: 231은 43-8 DBM2 - aCAGTGAGGAc -이다. 서열식별번호: 232는 43-8 DBM3 - aTAGTGAGGAc -이다.
서열식별번호: 233-239는 42-10에 대한 예시적인 DBM 친화성 변이체 핵산 서열이다. 굵은 텍스트는 WT 서열에서 돌연변이된 잔기를 나타낸다. 서열식별번호: 233은 42-10 DBM1 - aGACGCTGCTc - 이다. 서열식별번호: 234는 42-10 DBM2 - tGACGCTGCTt - 이다. 서열식별번호: 235는 42-10 DBM3 - aGACGGTGCTc - 이다. 서열식별번호: 236은 42-10 DBM4 - aCACGCTGCTc - 이다. 서열식별번호: 237은 42-10 DBM5 - aGACGCTACTc - 이다. 서열식별번호: 238은 42-10 DBM6 - aGACGCTGCTa - 이다. 서열식별번호: 239는 42-10 DBM7 - aGACTCTGCTc - 이다.
서열식별번호: 240은 97-4에 대한 예시적인 DBM(DNA 결합 모티프) 핵산 서열이다: TTA TGG GAG a.
억제성 프로테아제 도메인
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF는 조절인자 단백질을 포함하고, 여기서 조절인자 단백질은 억제성 프로테아제 도메인(본 명세서에서 PRO 또는 RPD로 지칭됨)이다. 본 명세서에 사용되는 용어 "억제성 프로테아제"는 특정 작용제(예를 들어, 프로테아제에 특이적으로 결합함)의 존재 또는 부재에 의해 불활성화될 수 있는 프로테아제를 지칭한다. 일부 실시형태에서, 억제성 프로테아제는 특이적 작용제의 부재 하에 활성이고(예를 들어, 프로테아제 절단 부위를 절단함) 특이적 작용제의 존재 하에 불활성이다(예를 들어, 프로테아제 절단 부위를 절단하지 않음). 일부 실시형태에서, 특이적 작용제는 프로테아제 저해제이다. 일부 실시형태에서, 프로테아제 저해제는 본 명세서에 기술된 바와 같은 주어진 억제성 프로테아제를 특이적으로 억제한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 억제성 프로테아제(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 억제성 프로테아제를 포함한다. 복수의 억제성 프로테아제를 포함하는 실시형태에서, 복수의 억제성 프로테아제는 상이한 개별 억제성 프로테아제 또는 동일한 억제성 프로테아제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
억제성 프로테아제의 비제한적 예는 C형 간염 바이러스 프로테아제(예를 들어, NS3 및 NS2-3); HIV1 프로테아제; 코로나바이러스(주요) 프로테아제; 담배 식각 바이러스(TEV) 프로테아제; 신호 펩티다제; 서브틸리신/켁신 패밀리의 전구단백질(proprotein) 전환효소(푸린(furin), PCI, PC2, PC4, PACE4, PC5, PC); 소수성 잔기(예를 들어, Leu, Phe, Val, 또는 Met)에서 절단하는 전구단백질 전환효소; Ala 또는 Thr과 같은 작은 아미노산 잔기에서 절단하는 전구단백질 전환효소; 프로피오멜라노코르틴 전환 효소(PCE); 크로마핀 과립 아스파르트산 프로테아제(CGAP); 프로호르몬 티올 프로테아제; 카복시펩티다아제(예를 들어, 카복시펩티다아제 E/H, 카복시펩티다아제 D 및 카복시펩티다아제 Z); 아미노펩티다제(예를 들어, 아르기닌 아미노펩티다제, 리신 아미노펩티다제, 아미노펩티다제 B); 프롤릴 엔도펩티다제; 아미노펩티다제 N; 인슐린 분해효소; 칼파인(calpain); 고분자량 프로테아제; 및 카스파제 1, 2, 3, 4, 5, 6, 7, 8, 및 9를 포함한다. 기타 프로테아제는 아미노펩티다제 N; 퓨로마이신 민감성 아미노펩티다제; 안지오텐신 전환 효소; 피로글루타밀 펩티다제 II; 디펩티딜 펩티다제 IV; N-아르기닌 이염기성 전환효소; 엔도펩티다제 24.15; 엔도펩티다제 24.16; 아밀로이드 전구체 단백질 세크레타제 알파, 베타 및 감마; 안지오텐신 전환 효소 세크레타제; TGF 알파 세크레타제; TF 알파 세크레타제; FAS 리간드 세크레타제; TNF 수용체-I 및 -II 세크레타제; CD30 세크레타제; KL1 및 KL2 세크레타제; IL6 수용체 세크레타제; CD43, CD44 세크레타제; CD 16-1 및 CD 16-11 세크레타제; L-셀렉틴 세크레타제; 엽산 수용체 세크레타제; MMP 1, 2, 3, 7, 8, 9, 10, 11, 12, 13, 14 및 15; 유로키나제 플라스미노겐 액티베이터; 조직 플라스미노겐 액티베이터; 플라스민; 트롬빈; BMP-1(프로콜라겐 C-펩티다제); 아담(ADAM) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11; 및 그랜자임 A, B, C, D, E, F, G 및 H를 포함하나, 이로만 제한되는 것은 아니다. 프로테아제에 대한 논의를 위해, 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: V. Y. H. Hook, Proteolytic and cellular mechanisms in prohormone and proprotein processing, RG Landes Company, Austin, Tex., USA (1998); N. M. Hooper et al., Biochem. J. 321: 265-279 (1997); Z. Werb, Cell 9 1: 439-442 (1997); T. G. Wolfsberg et al., J. Cell Biol. 131: 275-278 (1995); K. Murakami and J. D. Etlinger, Biochem. Biophys. Res. Comm. 146: 1249-1259 (1987); T. Berg et al., Biochem. J. 307: 313-326 (1995); M. J. Smyth and J. A. Trapani, Immunology Today 16: 202-206 (1995); R. V. Talanian et al., J. Biol. Chem. 272: 9677-9682 (1997); and N. A. Thomberry et a, J. Biol. Chem. 272: 17907-1791 1 (1997); 국제특허출원 WO2019118518; Rajakuberan et al., Methods Mol Biol. 2012;903:393-405; Gao et al. Science 21 Sep 2018: Vol. 361, Issue 6408, pp. 1252-1258; Tague et al., Nat Methods. 2018 Jul;15(7):519-522; Lin et al. PNAS June 3, 2008 105 (22) 7744-7749; 2020년 3월 27일에 출원된 미국 특허 출원 제16/832,751호.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 C형 간염 바이러스(HCV) 비구조 단백질 3(NS3)이다. p-70으로도 알려진 NS3는 C형 간염 바이러스 폴리프로테인(polyprotein)의 70kDa 절단 생성물인 바이러스 비구조 단백질이다. 631-잔기 HCV NS3 단백질은 N-말단 영역에 트립신/키모트립신-유사 세린 프로테아제 및 C-말단 영역에 헬리카제 및 뉴클레오시드 트리포스파타제를 함유하는 이중-기능 단백질이다. 기능적 세린 프로테아제 활성에 필요한 최소 서열은, "NS3a"로도 지칭될 수 있는 NS3 단백질의 N-말단 180개 아미노산을 포함한다. NS3 단백질의 N 말단으로부터 최대 14개 잔기의 결실은, 세린 프로테아제 활성을 유지한 채 용인된다. 따라서, 본 명세서에 기술된 억제성 프로테아제는 야생형 NS3 단백질의 적어도 잔기 14-180을 포함한다.
HCV는 "a" 및 "b" 서브타입으로 추가로 지정될 수 있는, 1 내지 7로 라벨링된 적어도 7개의 유전자형을 갖는다. 따라서, 억제성 프로테아제는 HCV 유전자형 1 NS3, HCV 유전자형 1a NS3, HCV 유전자형 1b NS3, HCV 유전자형 2 NS3, HCV 유전자형 2a NS3, HCV 유전자형 2b NS3, HCV 유전자형 3 NS3, HCV 유전자형 3a NS3, HCV 유전자형 3b NS3, HCV 유전자형 4 NS3, HCV 유전자형 4a NS3, HCV 유전자형 4b NS3, HCV 유전자형 5 NS3, HCV 유전자형 5a NS3, HCV 유전자형 5b NS3, HCV 유전자형 6 NS3, HCV 유전자형 6a NS3, HCV 유전자형 6b NS3, HCV 유전자형 7 NS3, HCV 유전자형 7a NS3, 또는 HCV 유전자형 7b NS3일 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 HCV NS3 유전자형, 변이체, 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS3 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS3 단백질의 잔기 1-180을 포함한다(예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Chao Lin, Chapter 6: HCV NS3-4A Serine Protease, Hepatitis C Viruses: Genomes and Molecular Biology, Editor: Tan SL, Norfolk (UK): Horizon Bioscience, 2006). 임의의 양태의 일부 실시형태에서, 억제성 프로테아제는, 프로테아제가 그의 절단 및/또는 결합 기능을 유지하도록, 본 명세서에 기술된 바와 같은 2, 3, 4, 5개, 또는 그 이상의 상이한 NS3 유전자형, 변이체, 또는 돌연변이체의 키메라이다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255 또는 동일한 기능을 유지하는 서열식별번호: 82, 91, 241-255 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255의 첫 번째(즉, N-말단) 잔기를 최대한 포함하지 않는다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제는 서열식별번호: 82, 91, 241-255의 잔기 1-180, 2-180, 3-180, 4-180, 5-180, 6-180, 7-180, 8-180, 9-180, 10-180, 11-180, 12-180, 13-180, 14-180, 15-180, 16-180, 17-180, 18-180, 19-180, 20-180, 21-180, 22-180, 23-180, 24-180, 25-180, 26-180, 27-180, 28-180, 29-180, 또는 30-180을 포함한다.
서열식별번호: 82, NS3(유전자형 1A), 189 aa; 굵은 텍스트는 촉매 트라이어드의 His-57을 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 촉매 트라이어드의 Asp-81을 나타내고; 굵은 기울임꼴 텍스트 는 촉매 트라이어드의 Ser-139를 나타내고; 이중 밑줄그어진 텍스트는 Asp-168을 나타낸다.
서열식별번호: 91, NS3 프로테아제 도메인(유전자형 1A)
서열식별번호: 241, NS3(유전자형 1A), 180 aa(예를 들어, C형 간염 바이러스 유전자형 1 폴리프로테인의 잔기 1027-1206, NCBI 참조 서열: NP_671491.1 참조.
서열식별번호: 242, NS3 (유전자형 1B), 180 aa(예를 들어, 잔기 1-180 사슬 A, Ns3 프로테아제, PDB: 4K8B_A 참조)
서열식별번호: 243, NS3 (유전자형 2), 180 aa(예를 들어, C형 간염 바이러스 유전자형 2 폴리프로테인의 잔기 1031-1210, NCBI 참조 서열: YP_001469630.1 참조
서열식별번호: 244, NS3 (유전자형 3), 180 aa(예를 들어, C형 간염 바이러스 유전자형 3 폴리프로테인의 잔기 1033-1212, NCBI 참조 서열: YP_001469631.1 참조)
서열식별번호: 245, NS3 (유전자형 4), 180 aa(예를 들어, C형 간염 바이러스 유전자형 4 폴리프로테인의 잔기 1027-1206, NCBI 참조 서열: YP_001469632.1 참조)
서열식별번호: 246, NS3 (유전자형 5), 180 aa(예를 들어, C형 간염 바이러스 유전자형 5 폴리프로테인의 잔기 1028-1207, NCBI 참조 서열: YP_001469633.1 참조)
서열식별번호: 247, NS3 (유전자형 6), 180 aa(예를 들어, C형 간염 바이러스 유전자형 6 폴리프로테인의 잔기 1032-1211, NCBI 참조 서열: YP_001469634.1 참조)
서열식별번호: 248, NS3 (유전자형 7), 180 aa(예를 들어, C형 간염 바이러스 유전자형 7 폴리프로테인의 잔기 1031-1210, NCBI 참조 서열: YP_009272536.1 참조)
서열식별번호: 249, NS3 유전자형 1a(HCV-H), 180 aa
서열식별번호: 250, NS3 유전자형 1b (HCV-BK), 180 aa
서열식별번호: 251, NS3 유전자형 2a (HCV-J6), 180 aa
서열식별번호: 252, NS3 유전자형 2b (HCV-J8), 180 aa
서열식별번호: 253, NS3 유전자형 3a (HCV-Nz11), 180 aa
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 본 명세서에 기술된 바와 같은 1, 2, 3, 4, 5개, 또는 그 이상의 상이한 프로테아제 저해제에 대해 내성이다. HCV NS3 프로테아제 저해제에 대한 내성을 부여하는 NS3 아미노산 치환의 비제한적 예는 다음을 포함한다: V36L(예를 들어, 유전자형 1b), V36M(예를 들어, 유전자형 2a), T54S(예를 들어, 유전자형 1b), Y56F(예를 들어, 유전자형 1b), Q80L(예를 들어, 유전자형 1b), Q80R(예를 들어, 유전자형 1b), Q80K(예를 들어, 유전자형 1a, 1b, 6a), Y132I(예를 들어, 유전자형 1b), A156S(예를 들어, 유전자형 2a), A156G, A156T, A156V, D168A(예를 들어, 유전자형 1b), I170V(예를 들어, 유전자형 1b), S20N, R26K, Q28R, A39T, Q41R, I71V, Q80R, Q86R, P89L, P89S, S101N, A111S, P115S, S122R, R155Q, L144F, A150V, R155W, V158L, D168A, D168G, D168H, D168N, D168V, D168E, D168Y, E176K, T178S, M179I, M179V, 및 M179T. 예를 들어, 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Sun et al., Gene Expr. 2018, 18(1): 63-69; Kliemann et al., World J Gastroenterol. 2016 Oct 28, 22(40): 8910-8917; 미국 특허 제7,208,309호; 제7,494,660호.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 본 명세서에 기술된 바와 같은 적어도 하나의 내성 돌연변이 또는 이의 임의의 조합을 포함하는 NS3 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 적어도 하나의 프로테아제 저해제에 대해 내성이지만 적어도 하나의 다른 프로테아제 저해제에 대해 반응성인 NS3 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 시스템은 다음을 포함한다: (a) 제1 프로테아제 저해제에 대해 내성이고 제2 프로테아제 저해제에 대해 감수성인 억제성 프로테아제(예를 들어, NS3)를 포함하는 제1 synTF 폴리펩티드; 및 (b) 제1 프로테아제 저해제에 대해 감수성이고 제2 프로테아제 저해제에 대해 내성인 억제성 프로테아제(예를 들어, NS3)를 포함하는 제2 synTF 폴리펩티드. 따라서, 제1 프로테아제 저해제의 존재는 제2 synTF 폴리펩티드의 활성을 조절할 수 있지만 제1 synTF 폴리펩티드는 조절할 수 없는 반면, 제2 프로테아제 저해제의 존재는 제1 synTF 폴리펩티드의 활성을 조절할 수 있지만 제2 synTF 폴리펩티드는 조절할 수 없다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 본 명세서에 기술된 바와 같은 1, 2, 3, 4, 5개, 또는 그 이상의 상이한 프로테아제 저해제에 민감하다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 아스나프레비르(예를 들어, 서열식별번호: 254 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 NS3AI로 지칭된다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제는 하기 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 텔라프레비르(예를 들어, 서열식별번호: 255 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 NS3TI로 지칭된다. 예를 들어, WO2019023164; Jacobs et al., StaPLs: versatile genetically encoded modules for engineering drug-inducible proteins, Nat Methods. 2018 Jul; 15(7): 523-526을 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
서열식별번호: 254, NS3AI; V36M, T54A, S122G 돌연변이는 각각 굵은 이중 밑줄그어진 텍스트로 제시된다
서열식별번호: 255, NS3TI; F43L, Q80K, S122R, D168Y 돌연변이는 각각 굵은 이중 밑줄그어진 텍스트로 제시된다
임의의 양태의 일부 실시형태에서, 폴리펩티드는 억제성 프로테아제에 대한 보조인자(cofactor)를 추가로 포함한다. 본 명세서에 사용되는 용어 "억제성 프로테아제에 대한 보조인자"는 억제성 프로테아제의 활성을 증가시키는 분자를 지칭한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 억제성 프로테아제에 대한 1, 2, 3, 4, 5개 또는 그 이상의 보조인자를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 각각의 억제성 프로테아제에 대해 하나의 보조인자를 포함한다. 억제성 프로테아제에 대한 복수의 보조인자를 포함하는 실시형태에서, 억제성 프로테아제에 대한 복수의 보조인자는 상이한 개별 보조인자 또는 동일한 보조인자의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 보조인자는 HSV NS4A 도메인이고, 억제성 프로테아제는 HSV NS3이다. 비구조 단백질 4a(NS4A)는 비구조 HCV 단백질 중 가장 작은 것이다. NS4A 단백질은, (1) NS3-4A 복합체를 소포체 및 미토콘드리아 외막의 외부 소엽(outer leaflet)에 고정하는 것, (2) NS3A 세린 프로테아제에 대한 보조인자로 역할하는 것, (3) NS3A 헬리카제 활성을 증강하는 것, 및 (4) NS5A 과인산화 조절 바이러스 복제를 조절하는 것을 포함하여, HCV 수명 주기에서 여러 기능을 한다. NS4A와 NS4B 사이의 상호작용은 게놈 복제를 제어하고, NS3와 NS4A 사이의 상호작용은 바이러스 조립에 소정 역할을 한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3에 대한 보조인자로서 작용하는 NS4a 폴리펩티드의 부분을 포함한다. 결실 분석은 54-잔기 NS4A 단백질의 중앙 영역(대략 잔기 21 내지 34)이 NS3 세린 프로테아제의 보조인자 기능에 필수적이며 충분함을 나타내었다. 따라서, 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 보조인자는 야생형 NS4A 단백질의 14-잔기 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는 HCV 유전자형 1 NS4A, HCV 유전자형 1a NS4A, HCV 유전자형 1b NS4A, HCV 유전자형 2 NS4A, HCV 유전자형 2a NS4A, HCV 유전자형 2b NS4A, HCV 유전자형 3 NS4A, HCV 유전자형 3a NS4A, HCV 유전자형 3b NS4A, HCV 유전자형 4 NS4A, HCV 유전자형 4a NS4A, HCV 유전자형 4b NS4A, HCV 유전자형 5 NS4A, HCV 유전자형 5a NS4A, HCV 유전자형 5b NS4A, HCV 유전자형 6 NS4A, HCV 유전자형 6a NS4A, HCV 유전자형 6b NS4A, HCV 유전자형 7 NS4A, HCV 유전자형 7a NS4A, 또는 HCV 유전자형 7b NS4A일 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 NS4A 유전자형, 변이체 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS4A 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS4A 단백질의 잔기 21-31을 포함한다(예를 들어, Chao Lin 2006 전게서 참조; 예를 들어, 표 13 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 48, 98, 137-156, 또는 서열식별번호: 48, 98, 137-156 중 하나와 동일한 기능을 유지하는 서열식별번호: 48, 98, 137-156 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 81, 93, 96, 255-276, 또는 동일한 기능을 유지하는 서열식별번호: 81, 93, 96, 255-276 중 하나의 서열에 대해 적어도 95% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 억제성 프로테아제에 대한 보조인자는 서열식별번호: 81, 93, 96, 255-276 중 어느 하나의 잔기 1-14, 1-13, 1-12, 1-11, 1-10, 2-14, 2-13, 2-12, 2-11, 2-10, 3-14, 3-13, 3-12, 3-11, 3-10, 4-14, 4-13, 4-12, 4-11, 또는 4-10을 포함한다.
서열식별번호: 93, NS4A 도메인(유전자형 1a)
서열식별번호: 96, NS4 (굵은 텍스트의 L6 링커 포함)
서열식별번호: 106, NS4A 도메인,
서열식별번호: 257, NS4A (유전자형 1), 14 aa (예를 들어, C형 간염 바이러스 유전자형 1 폴리프로테인의 잔기 1678-1691, NCBI 참조 서열: NP_671491.1 참조):
서열식별번호: 258, NS4A (유전자형 2), 14 aa (예를 들어, C형 간염 바이러스 유전자형 2 폴리프로테인의 잔기 1682-1695, NCBI 참조 서열: YP_001469630.1 참조:
서열식별번호: 259, NS4A (유전자형 3), 14 aa (예를 들어 C형 간염 바이러스 유전자형 3 폴리프로테인의 잔기 1684-1697, NCBI 참조 서열: YP_001469631.1 참조):
서열식별번호: 260, NS4A (유전자형 4), 14 aa (예를 들어, C형 간염 바이러스 유전자형 4 폴리프로테인의 잔기 1678-1691, NCBI 참조 서열: YP_001469632.1 참조):
서열식별번호: 261, NS4A (유전자형 5), 14 aa (예를 들어, C형 간염 바이러스 유전자형 5 폴리프로테인의 잔기 1679-1692, NCBI 참조 서열: YP_001469633.1 참조):
서열식별번호: 262, NS4A (유전자형 6), 14 aa (예를 들어, C형 간염 바이러스 유전자형 6 폴리프로테인의 잔기 1683-1696, NCBI 참조 서열: YP_001469634.1 참조):
서열식별번호: 263, NS4A (유전자형 7), 14 aa (예를 들어, C형 간염 바이러스 유전자형 7 폴리프로테인의 잔기 1682-1695, NCBI 참조 서열: YP_009272536.1 참조):
임의의 양태의 일부 실시형태에서, NS4A 서열은 표 13으로부터 선택된다. 한 실시형태에서, NS4A는 서열식별번호: 264-276의 잔기 21-31 또는 적어도 70% 동일한 서열을 포함한다.
표 13: 예시적인 NS4A 서열(예를 들어, Chao Lin 2006 전게서 참조). 잔기 21-31은 굵게 기재되어 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 본 명세서에 기술된 바와 같은 NS3 및 NS4A 유전자형, 변이체, 또는 돌연변이체의 임의의 조합을 포함할 수 있다. 한 실시형태에서, NS3 및 NS4A는 서로 동일한 유전자형으로부터 선택된다. 임의의 양태의 일부 실시형태에서, NS3은 유전자형 1a이고 NS4A는 유전자형 1b이다. 임의의 양태의 일부 실시형태에서, NS3은 유전자형 1b이고 NS4A는 유전자형 1a이다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3 억제성 프로테아제에 인접한 HSV NS4A 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, NS4A 도메인은 NS3 억제성 프로테아제의 N-말단이다. 임의의 양태의 일부 실시형태에서, NS4A 도메인은 NS3 억제성 프로테아제의 C-말단이다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 NS4A 도메인과 NS3 억제성 프로테아제 사이에 펩티드 링커를 포함한다. 링커(예를 들어, NS4A 도메인과 NS3 억제성 프로테아제 사이)의 비제한적 예는 SGTS(서열식별번호: 277) 및 GSGS(서열식별번호: 278)를 포함한다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드에서 본 명세서에 기술된 바와 같은 임의의 2개의 도메인은 펩티드 링커, 예를 들어, 이들 사이에 가요성 링커를 위치시킴으로써 단일 폴리펩티드로 연결될 수 있다. 본 명세서에 사용된 "펩티드 링커"는 길이가 약 2 내지 100개 아미노산인 올리고- 또는 폴리펩티드 영역을 지칭하며, 이는 본 명세서에 기술된 바와 같은 폴리펩티드의 임의의 서열을 함께 연결한다. 일부 실시형태에서, 링커는 인접한 단백질 도메인이 서로에 대해 자유롭게 이동할 수 있도록 글리신 및 세린과 같은 가요성 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 보장하는 것이 바람직한 경우 더 긴 링커가 사용될 수 있다. 링커는 절단가능하거나 절단 불가능할 수 있다.
본 명세서에는 프로테아제 절단 부위를 포함하는 synTF 폴리펩티드가 기술되어 있다. 본 명세서에 사용되는 용어 "프로테아제 절단 부위"는 억제성 프로테아제에 의해 인식되고 절단되는 특정 서열 또는 서열 모티프를 지칭한다. 프로테아제에 대한 절단 부위는 단백질분해성 절단 동안 프로테아제에 의해 인식되는 특정 아미노산 서열 또는 모티프를 포함하고, 일반적으로 절단가능한(scissile) 결합의 어느 한쪽에 주변(surrounding) 1 내지 6개 아미노산을 포함하며, 이는 프로테아제의 활성 부위에 결합하고 기질로 인식하는 데 사용된다. 임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는 억제성 프로테아제에 의해 특이적으로 결합되고 이에 의해 절단되는 임의의 부위일 수 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 2개의 프로테아제 절단 부위를 포함한다. 복수의 프로테아제 절단 부위를 포함하는 실시형태에서, 복수의 프로테아제 절단 부위는 상이한 개별 프로테아제 절단 부위 또는 동일한 프로테아제 절단 부위의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
비제한적인 예로서, HCV 복제 동안, NS3-4A 세린 프로테아제는 HCV 폴리프로테인 전구체의 4개 접합부에서 단백질분해성 절단을 담당한다: NS3/NS4A(자가-절단), NS4A/NS4B, NS4B/NS5A, 및 NS5A/NS5B. 따라서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 NS3/NS4A 절단 부위, NS4A/NS4B 절단 부위, NS4B/NS5A 절단 부위, 또는 NS5A/NS5B 절단 부위일 수 있다. 프로테아제 절단 부위는 HCV 유전자형 1, 유전자형 1a, 유전자형 1b, 유전자형 2, 유전자형 2a, 유전자형 2b, 유전자형 3, 유전자형 3a, 유전자형 3b, 유전자형 4, 유전자형 4a, 유전자형 4b, 유전자형 5, 유전자형 5a, 유전자형 5b, 유전자형 6, 유전자형 6a, 유전자형 6b, 유전자형 7, 유전자형 7a NS4A, 또는 유전자형 7b로부터의 프로테아제 절단 부위일 수 있다. 임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는, 예를 들어, 동일한 기능을 유지하는 임의의 공지된 NS3/NS4A 프로테아제 절단 부위 또는 이의 변이체 또는 돌연변이체일 수 있다. 임의의 양태의 일부 실시형태에서, NS4A 서열은 HCV-H, HCV-1, HCV-J1, HCV-BK, HCV-JK1, HCV-J4, HCV-J, HCV-J6, C14112, HCV-J8, D14114, HCV-Nz11, 또는 HCV-K3a로부터의 NS4A 단백질의 잔기 21-31을 포함한다(예를 들어, Chao Lin 2006 전게서 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 서열식별번호: 78, 83, 87, 279-301, 또는 동일한 기능을 유지하는 서열식별번호: 78, 83, 87, 279-301 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 프로테아제 절단 부위는 서열식별번호: 78, 83, 87, 279-301 중 어느 하나의 잔기 1-20, 1-19, 1-18, 1-17, 1-16, 1-15, 2-20, 2-19, 2-18, 2-17, 2-16, 2-15, 3-20, 3-19, 3-18, 3-17, 3-16, 3-15, 4-20, 4-19, 4-18, 4-17, 4-16, 4-15, 5-20, 5-19, 5-18, 5-17, 5-16, 또는 5-15를 포함한다.
표 14: 예시적인 NS3/NS4A 프로테아제 절단 부위(예를 들어, Chao Lin 2006 전게서 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 2개의 프로테아제 절단 부위를 포함하며, 하나는 NS3-NS4A 복합체의 N-말단 및 다른 하나는 NS3-NS4A 복합체의 C-말단에 있다(예를 들어, 표 15 참조). 임의의 양태의 일부 실시형태에서, 2개의 프로테아제 절단 부위는 동일한 절단 부위 또는 상이한 절단 부위일 수 있다.
표 15: 예시적인 프로테아제 절단 부위 조합. "N"은 NS3-NS4A 복합체의 N-말단을 나타낸다. "C"는 NS3-NS4A 복합체의 C-말단을 나타낸다. "3/4A"는 NS3/NS4A 절단 부위를 나타낸다. "4A/4B"는 NS4A/NS4B 절단 부위를 나타낸다. "4B/5A"는 NS4B/NS5A 절단 부위를 나타낸다. "5A/5B"는 NS5A/NS5B 절단 부위를 나타낸다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 NS3/NS4A, NS4A/NS4B, NS4B/NS5A, 및 NS5A/NS5B 절단 부위의 임의의 공지된 유전자형, 변이체 또는 돌연변이체를 포함한다. 한 실시형태에서, 2개의 프로테아제 절단 부위는 서로 동일한 유전자형으로부터 선택된다.
임의의 양태의 일부 실시형태에서, 프로테아제 절단 부위는, synTF가 프로테아제 저해제의 부재 하에 억제성 프로테아제를 사용하여 자체 절단할 때, 새로 절단된 폴리펩티드(들)의 N-말단에서 생성된 아미노산이 폴리펩티드(들)가 다른 절단된 폴리펩티드에 비해 더 빠른 속도로 분해되고 더 짧은 반감기를 갖도록 위치되거나 조작된다. N-말단 규칙에 따르면, N-말단에 아미노산 His, Tyr, Gln, Asp, Asn, Phe, Leu, Trp, Lys, 또는 Arg를 포함하는 새로 절단된 폴리펩티드는 높은 분해율 및 짧은 반감기(예를 들어, 효모에서 10분 이하; 포유류 망상적혈구에서 1-5.5시간)를 나타낸다. 상대적으로, N-말단에 아미노산 Val, Met, Gly, Pro, Ala, Ser, Thr, Cys, Ile, 또는 Glu를 포함하는 새로 절단된 폴리펩티드는 더 낮은 분해율 및 더 긴 반감기(예를 들어, 효모에서 30분 또는 그 이상; 포유류 망상적혈구에서 1-100시간)를 나타낸다. 예를 들어, 문헌의 내용이 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: Gonda et al., Universality and Structure of the N-end rule, The Journal of Biological Chemistry, Vol. 264 (28), pp. 16700-16712, 1989. 따라서, 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단에서 생성된 아미노산은 His, Tyr, Gln, Asp, Asn, Phe, Leu, Trp, Lys 또는 Arg이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단에서 생성된 아미노산은 Val, Met, Gly, Pro, Ala, Ser, Thr, Cys, Ile, 또는 Glu가 아니다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 새로 절단된 synTF 폴리펩티드의 N-말단은 서열식별번호: 79 또는 N-말단에서 His 또는 다른 고도로 분해된 아미노산을 유지하는 서열식별번호: 79의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 서열식별번호: 79, N-말단 규칙, 8 aa, .
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 촉매 활성인 억제성 프로테아제를 포함한다. HCV NS3의 경우, 촉매 트라이어드는 His-57, Asp-81, 및 Ser-139를 포함한다. 억제성 프로테아제와 관련하여, "촉매적으로 활성인"은 프로테아제 절단 부위에서 절단하는 활성을 지칭한다. 임의의 양태의 일부 실시형태에서, 촉매적으로 활성인 억제성 프로테아제는 촉매 트리어드를 유지하는, 즉 His-57, Asp-81, 및/또는 Ser-139에서 비동의적(non-synonymous) 치환을 포함하지 않는 본 명세서에 추가로 기재된 바와 같은 임의의 억제성 프로테아제일 수 있다.
임의의 양태의 일부 실시형태에서, synTF는 NS3 프로테아제 도메인, NS4A 및/또는 적어도 하나의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, synTF는 서열식별번호: 85 또는 102 또는 서열식별번호: 85 또는 102 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 85, NS3 도메인, 다음을 포함함: N-말단 규칙(서열식별번호: 79, 굵은 텍스트), AU1 태그(서열식별번호: 80, 기울임꼴 이중 밑줄그어진 텍스트), NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트)의 일부:
서열식별번호: 102, NS3 도메인, 다음을 포함함: NS3 절단 부위(서열식별번호: 78 및 83, 이중 밑줄그어진 텍스트), N-말단 규칙(서열식별번호: 79, 굵은 텍스트), AU1 태그(서열식별번호: 80, 기울임꼴 텍스트), NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 이중 밑줄그어진 텍스트):
임의의 양태의 일부 실시형태에서, synTF는 안정화가능한 폴리펩티드 연결(StaPL) 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, StaPL 도메인은 NS4A, NS3 프로테아제 도메인, 및 NS3 헬리카제 도메인의 일부를 포함한다. 임의의 양태의 일부 실시형태에서, 부분 NS3 헬리카제 도메인은 서열식별번호: 92, 105, 302, 또는 서열식별번호: 92, 105, 302의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, StaPL 도메인은, 예를 들어, 펩티드 링커를 통해 직접적으로 또는 간접적으로 연결된, EDVVCCHSI(서열식별번호: 280) 또는 DEMEECSQH(서열식별번호: 281)로부터 선택된 N 말단에 프로테아제 절단 부위를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, StaPL 도메인은 서열식별번호: 304-306, 또는 서열식별번호: 304-306의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 304, StaPL 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 )
임의의 양태의 일부 실시형태에서, StaPL 도메인은 하나 이상의 프로테아제 저해제에 대한 민감성을 증가시키는 하나 이상의 돌연변이를 포함하는 억제성 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이러한 돌연변이는 아스나프레비르(예를 들어, 서열식별번호: 254, 305 참조)에 대한 민감성을 증가시키기 때문에 이러한 StaPL은 또한 본 명세서에서 StaPLAI로 지칭된다. 임의의 양태의 일부 실시형태에서, NS3 프로테아제(예를 들어, StaPL 도메인의 것)는 하기 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이러한 프로테아제는 또한 이러한 돌연변이가 텔라프레비르(예를 들어, 서열식별번호: 255, 306 참조)에 대한 민감성을 증가시키기 때문에 본 명세서에서 StaPLTI로 지칭된다.
서열식별번호: 305, StaPLAI 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 ); V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 제시되어 있음.
서열식별번호: 306, StaPLTI 도메인, 다음을 포함함: NS4A(서열식별번호: 81, 굵은 기울임꼴 텍스트 ), 및 NS3 프로테아제(서열식별번호: 82, 기울임꼴 텍스트); 링커(서열식별번호: 277 및 303, 이중 밑줄그어진 텍스트); NS3 헬리카제(서열식별번호: 302, 굵은 기울임꼴 이중 밑줄그어진 텍스트 ); F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 제시되어 있음
임의의 양태의 일부 실시형태에서, synTF는 TimeSTAMP 도메인(단백질의 연령 측정을 위한 시간 특이적 태그)을 포함한다. 임의의 양태의 일부 실시형태에서, TimeSTAMP는 억제성 프로테아제, 적어도 하나의 프로테아제 절단 부위, 및 검출가능한 마커를 포함한다. 검출가능한 마커는 프로테아제 저해제가 첨가될 때까지 억제성 프로테아제의 활성에 의해 번역 직후 synTF에서 제거되고, 그 후에 새로 합성된 synTF 폴리펩티드는 마커를 보유한다. TimeSTAMP는 단백질의 연령 측정에 대한 시간-특이적 태깅을 가능케하며, 매우 엄격한 시간 제어로 관심있는 새로 합성된 단백질의 민감하고 비섭동적인(nonperturbative) 시각화 및 정량화가 가능하다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 야생형 프로테아제와 비교하여 증가된 용해도를 나타낸다. 비제한적 예로서, NS3 프로테아제는 하기 돌연변이 또는 이들의 임의의 조합 중 적어도 하나를 포함할 수 있다: Leu13이 Glu로 치환된 것; Leu14가 Glu로 치환된 것; Ile17이 Gln으로 치환된 것; Ile18이 Glu로 치환된 것; 및/또는 Leu21이 Gln으로 치환된 것. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 서열식별번호: 307-315, 또는 서열식별번호: 307-315와 동일한 기능(예를 들어, 세린 프로테아제; 증가된 용해도)을 유지하는 서열식별번호: 307-315 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함하는 억제성 프로테아제를 포함하며; 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 제6333186호 및 미국 특허 공개 특허 제US20020106642호를 참조.
서열식별번호: 307, 가용성 NS3, 182 aa
서열식별번호: 308, 가용성 NS3/NS4A, 195 aa
서열식별번호: 309, 가용성 NS3/NS4A, 195 aa
서열식별번호: 310, 가용성 NS3/NS4A, 197 aa
서열식별번호: 311, 가용성 NS3/NS4A, 197 aa
서열식별번호: 312, 가용성 NS3/NS4A, 197 aa
서열식별번호: 313, 가용성 NS3/NS4A, 197 aa
서열식별번호: 314, 가용성 NS3/NS4A, 197 aa
서열식별번호: 315, NS3aH1, 가용성 NS3/NS4A (S139A), 196 aa
임의의 양태의 일부 실시형태에서, 억제성 프로테아제는 특정 리간드에 대한 결합 친화도를 증가시키기 위한 돌연변이를 포함한다. 비제한적인 예로서, NS3aH1(예를 들어, 서열식별번호: 315)은 ANR 펩티드(예를 들어, 서열식별번호: GELDELVYLLDGPGYDPIHSD)와의 상호작용에 필요한 다음 4개의 돌연변이를 포함한다: A7S, E13L, I35V 및 T42S. 따라서, 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 억제성 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: A7S, E13L, I35V 및 T42S, 또는 이들의 임의의 조합.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 프로테아제 저해제와 조합된다. 본 명세서에 사용된, "~와 조합하여"는 동일한 제형에 임의의 분자적 또는 물리적 배열로, 예를 들어, 혼화물(admixture), 용액, 혼합물(mixture), 현탁액, 콜로이드, 에멀젼으로 존재하는 2가지 이상의 물질을 지칭한다. 제형은 균질하거나 불균일한 혼합물일 수 있다. 임의의 양태의 일부 실시형태에서, 활성 화합물(들)은 초구조(superstructure), 예를 들어, 나노입자, 리포솜, 벡터, 세포, 스캐폴드 등에 포함될 수 있으며, 상기 초구조는 용액, 혼합물, 혼합물, 현탁액 등에서, synTF 폴리펩티드 또는 synTF 폴리펩티드 시스템을 이룬다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 억제성 프로테아제에 결합된 프로테아제 저해제에 결합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 억제성 프로테아제에 결합된 프로테아제 저해제에 특이적으로 결합된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 저해제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 프로테아제 저해제와 조합된다. 복수의 프로테아제 저해제를 포함하는 실시형태에서, 복수의 프로테아제 저해제는 상이한 개별 프로테아제 저해제 또는 동일한 프로테아제 저해제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 그라조프레비르(GZV 또는 GZP로 약칭됨; 예를 들어, PubChem CID: 44603531 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 다노프레비르(DNV; 예를 들어, PubChem CID: 11285588 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 승인된 NS3 프로테아제 저해제, 예컨대, 그라조프레비르, 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르, 및 텔라프레비르이나, 이로만 제한되는 것은 아니다. NS3 프로테아제 저해제의 추가의 비제한적인 예는 표 16에 열거되어 있다(예를 들어, 그 내용이 전체로 본 명세서에 참조로 통합되는, 다음 문헌 참조: McCauley and Rudd, Hepatitis C virus NS3/4a protease inhibitors, Current Opinion in Pharmacology 2016, 30:84-92).
표 16: 예시적인 NS3/NS4A 프로테아제 저해제
데그론 도메인
여러 양태에서, 데그론 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "데그론 도메인"은, 예를 들어, 프로테아좀 또는 자가포식-리소좀 경로를 통해 부착된 단백질의 분해를 촉진하는 서열을 지칭하고; 임의의 양태의 일부 실시형태에서, 용어 "데그론", "분해 도메인" 및 "분해 도메인"은 "데그론 도메인"과 상호교환가능하게 사용될 수 있다. 일부 실시형태에서, 데그론 도메인은, 단백질에 융합될 때 단백질의 반감기가 적어도 2배 감소되도록 단백질을 불안정화시키는 폴리펩티드이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 데그론 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 데그론 도메인을 포함한다. 복수의 데그론 도메인을 포함하는 실시형태에서, 복수의 데그론 도메인은 상이한 개별 데그론 도메인 또는 동일한 데그론 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
많은 상이한 데그론 서열/신호(예를 들어, 유비퀴틴-프로테아좀 시스템의 것)가 기술되었으며, 이들 중 임의의 것이 본 명세서에 제공된 바와 같이 사용될 수 있다. 데그론 도메인은 세포 수용체에 작동가능하게 연결될 수 있지만, 데그론 도메인이 여전히 세포 수용체의 분해를 유도하는 기능을 하는 한, 이와 연접되거나 또는 바로 인접할 필요는 없다. 일부 실시형태에서, 데그론 도메인은 세포 수용체의 빠른 분해를 유도한다. 데그론 도메인과 단백질 분해에서의 이들의 기능에 대한 논의는, 예를 들어, 문헌 각각의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌을 참조: Kanemaki et al. (2013) Pflugers Arch. 465(3):4l9-425, Erales et al. (2014) Biochim Biophys Acta 1843(l):216-221, Schrader et al. (2009) Nat. Chem. Biol. 5(11): 815-822, Ravid et al. (2008) Nat. Rev. Mol. Cell. Biol. 9(9):679-690, Tasaki et al. (2007) Trends Biochem Sci. 32(1 1):520-528, Meinnel et al. (2006) Biol. Chem. 387(7):839- 851, Kim et al. (2013) Autophagy 9(7): 1100-1103, Varshavsky (2012) Methods Mol. Biol. 832: 1-11, and Fayadat et al. (2003) Mol Biol Cell. 14(3): 1268-1278; Chassin et al., Nature Communications volume 10, Article number: 2013 (2019); Natsume and Kanemaki Annu Rev Genet. 2017 Nov 27,51:83-102.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 다음을 포함하지만 이로만 제한되지 않는 유비퀴틴 태그를 포함한다: UbR, UbP, UbW, UbH, UbI, UbK, UbQ, UbV, UbL, UbD, UbN, UbG, UbY, UbT, UbS, UbF, UbA, UbC, UbE, UbM, 3xUbVR, 3xUbVV, 2xUbVR, 2xUbVV, UbAR, UbVV, UbVR, UbAV, 2xUbAR, 2xUbAV. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 억제성 프로테아제, 프로테아제 절단 부위, 및 데그론 도메인을 포함하는 복합체를 지칭하는 자가-절제(self-excising) 데그론을 포함한다. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 조건부(conditional) 데그론 도메인이며, 여기서 분해는 리간드(예를 들어, 데그론 스태빌라이저) 또는 온도 변화 또는 특정 파장의 빛과 같은 다른 인풋(input)에 의해 유도된다. 조건부 데그론 도메인의 비제한적 예는 eDHFR 데그론(예를 들어, TMP 인듀서); FKBP12(예를 들어, 라파마이신 유사체 인듀서); 온도 민감성 디히드로폴레이트 환원효소(R-DHFRts, 또는 ts-DHFR); HCV NS3/NS4A 데그론; 저온 데그론(lt-degron)으로 명명된 변형된 버전의 R-DHFRt; 옥신-유도성 분해(AID); 할로태그-소수성 태그(HaloTag-Hydrophobic Tag), HaloPROTAC, 및 dTAG 시스템(예를 들어, HyT13 또는 HyT36 인듀서); 감광성 데그론(PSD); 청색광-유도성 데그론(B-LID); 담배 식각 바이러스(TEV) 프로테아제-유도 단백질 불활성화(TIPI)-데그론 시스템; deGradFP(디그레이드 녹색 형광 단백질; 예를 들어, NSlmb-vhhGFP 발현에 의해 유도됨); 또는 기능의 회복을 위한 분할된 유비퀴틴(SURF, 예를 들어, 라파마이신에 의해 유도됨)을 포함한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 E. 콜라이(E. coli) 디히드로폴레이트 환원효소(eDHFR) 데그론이다. eDHFR 데그론은 포유류 세포와 C. 엘레간스(C. elegans)에서 외인성으로 발현된 단백질의 광범위한 고갈을 허용한다. eDHFR 데그론은 진핵 세포에서 무해한, 아래 나타낸, 항생제이며 데그론 스태빌라이저인 트리메토프림(TMP)에 단단히 결합하여 안정화된다.
eDHFR로 태깅된 단백질은 세포가 TMP에 노출되지 않으면 구성적으로 분해된다. 태깅된 단백질의 수준은 성장 배지에서 TMP 농도를 조절하여 직접적으로 제어할 수 있다. shRNA 방법과 달리 이 데그론-기반 전략은 고갈 역학이 천연 단백질 반감기에 의해 제한되지 않기 때문에, 안정한 단백질의 더 신속한 녹다운을 가능케하므로 유리하다. TMP는 최대 100배까지 용량-의존적 방식으로 DD-표적 단백질 융합을 안정화하여, 시스템에 상당한 동적 범위를 제공한다. 리간드 TMP는 단독으로 작동하며 제2 단백질과의 이량체화를 필요로하지 않는다. 이 시스템은 본 명세서에 기술된 synTF 폴리펩티드와 같은 막통과 단백질의 수준을 조절할 수 있을 정도로 효과적이다: 예를 들어, Schrader et al., Chem Biol. 2010 Sep 24, 17(9): 917-918; Ryan M. Sheridan and David L. Bentley, Biotechniques. 2016, 60(2): 69-74; Iwamoto et al., Chem Biol. 2010 Sep 24;17(9):981-8을 참조한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 FK506- 및 라파마이신-결합 단백질(FKBP12)(UniProtKB - P62942(FKB1A_HUMAN), 본 명세서에 참조로 통합됨), 또는 이의 변이체로부터 유래된 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, FKBP12 유래 아미노산 서열은 아미노산 위치 36에서 페닐알라닌(F)(메티오닌 없이 카운팅됨)에서 발린(V)(F36V)(FKBP12* 또는 FKBP*로도 지칭됨)으로의 돌연변이를 포함한다. 임의의 양태의 일부 실시형태에서, 데그론 스태빌라이저는 하기에 나타낸 실드(Sheild)-1과 같은 라파마이신 유사체이다. 예를 들어, Banaszynski et al., Cell. 2006 Sep 8; 126(5): 995-1004; 미국 특허 출원 US20180179522; 미국 특허 제10,137,180호를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 데그론 도메인은 서열식별번호: 317 또는 318, 또는 동일한 기능(예를 들어, 분해, TMP 또는 Shield-1에 대한 결합)을 유지하는 서열식별번호: 317 또는 318의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 317, DHFR (V19A), 158 aa,
서열식별번호: 318, FK506- 및 라파마이신 결합 단백질(FKBP), 107 aa
임의의 양태의 일부 실시형태에서, 불안정화 데그론 도메인은 synTF 폴리펩티드의 거의 완전한 제거 또는 분해를 야기하는 적어도 하나의 돌연변이를 포함한다. DHFR(예를 들어, 서열식별번호: 317) 돌연변이의 비제한적 예는 다음을 포함한다: V19A, Y100I, G121V, H12Y, H12L, R98H, F103S, M42T, H114R, I61F, T68S, H12Y/Y100I, H12L/Y100I, R98H/F103S, M42T/H114R, 및 I61F/T68S, 또는 이들의 조합; 예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 미국 특허 제8173792호 참조.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 리간드-유도 분해(LID) 도메인을 포함한다. LID 도메인을 포함하는 단백질은 데그론 디스태빌라이저의 존재 하에 불안정화되고 분해된다. 임의의 양태의 일부 실시형태에서, 데그론 도메인의 LID 도메인은 데그론 디스태빌라이저에 결합하여, 부착된 단백질의 분해를 촉진할 수 있다. 시스템은 가역적이며 데그론 디스태빌라이저가 제거될 때 단백질은 불안정화되지 않고/않거나 분해되지 않는다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 데그론 도메인에 결합된 데그론 디스태빌라이저에 결합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 데그론 도메인에 결합된 데그론 디스태빌라이저에 특이적으로 결합된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 1, 2, 3, 4, 5개, 또는 그 이상의 데그론 디스태빌라이저와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 디스태빌라이저와 조합된다. 복수의 데그론 디스태빌라이저를 포함하는 실시형태에서, 복수의 데그론 디스태빌라이저는 상이한 개별 데그론 디스태빌라이저 또는 동일한 데그론 스태빌라이저의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, LID 데그론 도메인은 FK506- 및 라파마이신-결합 단백질(FKBP)을 포함하고, 예를 들어, 10-아미노산 링커(Gly4SerGly4Ser) 또는 본 명세서에 기술된 다른 링커와 같은 개재 링커와 함께, FKBP의 C 말단에 융합된 데그론을 추가로 포함한다. 임의의 양태의 일부 실시형태에서, FKBP(예를 들어, 서열식별번호: 318)의 C 말단에 융합된 데그론은 19개 아미노산 서열: TRGVEEVAEGVVLLRRRGN(서열식별번호: 319), 또는 동일한 기능을 유지하는 적어도 95% 동일한 서열을 포함한다. 소분자 실드-1의 부재 하에, 19-aa 데그론은 FKBP 융합 단백질에 결합되고, 단백질은 안정하다. 존재시, 실드-1은 FKBP에 단단히 결합하여, 19-aa 데그론을 대체하고 LID 도메인 및 임의의 융합된 파트너 단백질의 신속하고 진행적인 분해를 유도한다. 임의의 양태의 일부 실시형태에서, 데그론 디스태빌라이저는, 위에서 나타낸, 실드-1, 또는 이의 유사체이다: 예를 들어, Bonger et al., Nat Chem Biol. 2011 Jul 3;7(8):531-7을 참조한다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 옥신-유도성 분해(AID)를 포함한다. AID에 융합된 단백질(인돌-3-아세트산 유도성 17 또는 AUX/IAA 전사 조절 계열 단백질로도 알려져 있음)은 신속하게 분해된다. 분해는 AID로 태깅된 단백질을 SKP1-CUL1-F-Box(SCF) 유비퀴틴 E3 리가제에 대한 옥신-의존적 방식으로 모집하여 이들의 유비퀴틸화 및 프로테아좀 분해를 초래하는, 식물 F-Box 단백질 TIR1의 이소성(ectopic) 발현을 필요로 한다. 임의의 양태의 일부 실시형태에서, 데그론 도메인은 서열식별번호: 320의 잔기 65-133, 65-130, 70-130, 또는 70-120을 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 서열식별번호: 320 또는 321, 또는 동일한 기능을 유지하는 서열식별번호: 320 또는 321의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, Daniel et al., Nat Commun. 2018 Aug 17;9(1):3297을 참조하며, 그의 전문은 본 명세서에 참조로 인용된다.
서열식별번호: 320, AUX/IAA 전사 조절인자 패밀리 단백질 [Arabidopsis thaliana], NCBI 참조 서열: NP_171921.1, 229 aa
서열식별번호: 321, mAID (minimal AID), 68 aa
임의의 양태의 일부 실시형태에서, 데그론 도메인은 NS3 헬리카제 및 NS4A의 변형된 부분을 포함한다. 구축물에서 NS3pro 및 NS4A 서열의 배열은 기능적 데그론을 생성한다. HCV 복제 동안, 자유 NS4A N-말단은 소포체 막에 삽입되는 소수성 α-나선을 형성한다. 이 N-말단은 NS3 헬리카제 도메인에 의해 프로테아제 활성 부위에 위치하기 때문에 NS3/4A 접합부에서 HCV 비구조적 폴리펩티드의 절단에 의해 생성된다. 조작된 구축물에는 헬리카제 도메인이 결여되어 있으므로, NS3/4A 절단이 발생하지 않는다. 자유 N-말단 없이 막으로 삽입될 수 없는, NS4A의 소수성 서열은 데그론-유사 활성을 나타낸다. 예를 들어, 미국 특허 제10,550,379호; Chung et al., Nat Chem Biol. 2015 Sep; 11(9): 713-720을 참조하며, 이들의 전문은 본 명세서에 참조로 인용된다.
임의의 양태의 일부 실시형태에서, 데그론 도메인은 서열식별번호: 322, 또는 동일한 기능을 유지하는 서열식별번호: 322의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 322, HCV NS3/NS4A 데그론 도메인(42 aa)
유도된 분해 도메인
여러 양태에서, 자가-절제 데그론 또는 소분자-보조 차단(SMASh) 도메인으로도 지칭되는, 유도된 분해 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, SMASh 도메인은 억제성 프로테아제, 적어도 하나의 프로테아제 절단 부위, 및 데그론 도메인을 포함한다. 프로테아제 저해제의 부재 하에, 억제성 프로테아제는 synTF에서 데그론을 절단하고, synTF는 분해되지 않는다. 프로테아제 저해제의 존재 하에, 억제성 프로테아제는 synTF에서 데그론을 절단하지 않으며, 데그론 도메인은 synTF의 분해를 야기한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 유도된 분해 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 유도된 분해 도메인을 포함한다. 복수의 유도 분해 도메인을 포함하는 실시형태에서, 복수의 유도 분해 도메인은 상이한 개별 유도 분해 도메인 또는 동일한 유도 분해 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 유비퀴틴 태그; eDHFR 데그론(예를 들어, TMP 인듀서); FKBP12(예를 들어, 라파마이신 유사체 인듀서); 온도 민감성 디히드로폴레이트 환원효소(R-DHFRts, 또는 ts-DHFR); HCV NS3/NS4A 데그론; 저온 데그론(lt-degron)으로 명명된 변형된 버전의 R-DHFRt; 옥신-유도성 분해(AID); 할로태그-소수성 태그, HaloPROTAC, 및 dTAG 시스템(예를 들어, HyT13 또는 HyT36 인듀서); 감광성 데그론(PSD); 청색광-유도성 데그론(B-LID); 담배 식각 바이러스(TEV) 프로테아제 유도 단백질 불활성화(TIPI)-데그론 시스템; deGradFP(디그레이드 녹색 형광 단백질, 예를 들어 NSlmb-vhhGFP 발현에 의해 유도됨); 또는 기능의 회복을 위한 분할된 유비퀴틴(SURF; 예를 들어, 라파마이신에 의해 유도됨)으로 이루어진 군에서 선택된다.
임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 NS3 헬리카제 및 NS4A의 변형된 부분을 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) 데그론 도메인은 서열식별번호: 322, 또는 동일한 기능을 유지하는 서열식별번호: 322의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh 태그는 억제성 프로테아제, 부분 프로테아제 나선 도메인, 및 보조인자 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 태그는 억제성 프로테아제, 부분 프로테아제 나선 도메인, 보조인자 도메인, 및 적어도 하나의 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 태그는 NS3 억제성 프로테아제, NS3 부분 프로테아제 나선 도메인, NS3 보조인자 도메인(즉, NS4A), 및 NS3 억제성 프로테아제의 적어도 하나의 프로테아제 절단 부위를 포함한다.
임의의 양태의 일부 실시형태에서, SMASh 태그는 C-말단 SMASh 태그이고, 예를 들어, 태그는 synTF의 C-말단에 부착되도록 조작된다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 태그의 N-말단에 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 N-말단에서 C-말단 순서로 다음을 포함한다: NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 synTF의 전사 이펙터 도메인의 C-말단에 융합된다. 임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 synTF의 DNA-결합 도메인의 C-말단에 융합된다.
임의의 양태의 일부 실시형태에서, C-말단 SMASh 태그는 서열식별번호: 86, 324, 327, 또는 동일한 기능을 유지하는 서열식별번호: 86, 324, 327의 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 86, C-말단 SMASh 도메인(304 aa); 굵은 텍스트는 NS3 절단 부위(서열식별번호: 87)를 나타내고;
는 링커(서열식별번호: 88 또는 90)을 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그(서열식별번호: 89)를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인(서열식별번호: 91)을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제(서열식별번호: 92)를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인(서열식별번호: 93)을 나타낸다:
임의의 양태의 일부 실시형태에서, SMASh 태그는 N-말단 SMASh 태그이고, 예를 들어, 태그는 synTF의 N-말단에 부착되도록 조작된다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 태그의 C-말단에 프로테아제 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 N-말단에서 C-말단 순서로 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인, 및 NS3 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 synTF의 전사 이펙터 도메인의 N-말단에 융합된다. 임의의 양태의 일부 실시형태에서, N-말단 SMASh 태그는 synTF의 DNA-결합 도메인의 N-말단에 융합된다.
임의의 양태의 일부 실시형태에서, N-말단 SMAh 태그는 서열식별번호: 94, 95, 325, 326, 328, 329, 또는 동일한 기능을 유지하는 서열식별번호: 94, 95, 325, 326, 328, 또는 329 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 94, N-말단 SMASh 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커(서열식별번호: 88 또는 90)를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그(서열식별번호: 89)를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인(서열식별번호: 91)을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제(서열식별번호: 92)을 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인(서열식별번호: 93)을 나타내고; 굵은 텍스트는 NS3 절단 부위(서열식별번호: 279)를 나타낸다:
서열식별번호: 95, N-말단 SMASh 도메인(303 aa, NS4A 내에 GSSGSS(서열식별번호: 323) L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타낸다.
임의의 양태의 일부 실시형태에서, SMASh 도메인은 하나 이상의 프로테아제 저해제에 대한 민감성을 증가시키는 하나 이상의 돌연변이를 포함하는 억제성 프로테아제를 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, SMAh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: V36M, T54A, S122G, 또는 이들의 임의의 조합; 이들 돌연변이는 아나프레비르에 대한 민감성을 증가시키기 때문에, 이러한 SMASh는 또한 본 명세서에서 SMAShAI로 지칭된다(예를 들어, 서열식별번호: 254, 324, 325, 326 참조). 임의의 양태의 일부 실시형태에서, (예를 들어, SMASh 도메인의) NS3 프로테아제는 다음 돌연변이 중 적어도 하나를 포함한다: F43L, Q80K, S122R, D168Y, 또는 이들의 임의의 조합; 이들 돌연변이는 텔라프레비르에 대한 감수성을 증가시키기 때문에, 이러한 프로테아제는 또한 SMAShTI로도 지칭된다(예를 들어, 서열식별번호: 255, 327, 328, 329 참조).
서열식별번호: 324, (304 aa)가 있는 C-말단 SMAShAI 도메인; 굵은 텍스트는 NS3 절단 부위를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 무형식 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
서열식별번호: 325, N-말단 SMAShAI 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
서열식별번호: 326, N-말단 SMAShAI 도메인(303 aa, NS4A 내에 L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기울임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; V36M, T54A, S122G 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
서열식별번호: 327, (304 aa)을 지니는 C-말단 SMAShTI 도메인; 굵은 텍스트 는 NS3 절단 부위를 나타내고; 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
서열식별번호: 328, N-말단 SMAShTI 도메인(297 aa), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
서열식별번호: 329, N-말단 SMAShTI 도메인(303 aa, NS4A 내에 L6 도메인을 지님), 기울임꼴 이중 밑줄그어진 텍스트는 링커를 나타내고; 굵은 기울임꼴 텍스트 는 FLAG 태그를 나타내고; 기울임꼴 텍스트는 프로테아제 도메인을 나타내고; 형식비지정 텍스트는 NS3 부분 헬리카제를 나타내고; 굵은 기임꼴 이중 밑줄그어진 텍스트 는 NS4A 도메인을 나타내고; 굵은 텍스트는 NS3 절단 부위를 나타내고; F43L, Q80K, S122R, D168Y 돌연변이는, 각각, 굵은 이중 밑줄그어진 텍스트로 나타나 있다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 SMASh 도메인은 1, 2, 3, 4, 5개, 또는 그 이상의 프로테아제 저해제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 SMASh 도메인은 하나의 프로테아제 저해제와 조합된다. 복수의 프로테아제 저해제를 포함하는 실시형태에서, 복수의 프로테아제 저해제는 상이한 개별 프로테아제 저해제 또는 동일한 프로테아제 저해제의 복수의 카피, 또는 상기한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 그루조프레비르(GZV 또는 GZP로 약칭됨; 예를 들어, PubChem CID: 44603531 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 다노프레비르(DNV; 예를 들어, PubChem CID: 11285588 참조)이다. 임의의 양태의 일부 실시형태에서, 프로테아제 저해제는 승인된 NS3 프로테아제 저해제, 예컨대 비제한적으로 그라조프레비르, 다노프레비르, 시메프레비르, 아나프레비르, 실루프레비르, 보세프레비르 , 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르, 및 텔라프레비르이나, 이로만 제한되는 것은 아니다. NS3 프로테아제 저해제의 추가의 비제한적인 예는 표 16에 열거되어 있다(예를 들어, 그 내용이 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: McCauley and Rudd, Hepatitis C virus NS3/4a protease inhibitors, Current Opinion in Pharmacology 2016, 30:84-92).
유도 근접 도메인
여러 양태에서, 본 명세서에서 이종이량체화 도메인으로도 지칭되는 적어도 2개의 유도 근접 도메인을 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "유도 근접 도메인"은 자극(예를 들어, 화학적 인듀서, 빛 등)의 존재 하에 이량체화되도록 유도되거나 근접하게 되는 적어도 2개의 도메인을 지칭한다. 임의의 양태의 일부 실시형태에서, 유도 근접 도메인 쌍은 제1 유도 근접(IPDA) 및 적어도 제2 유도 근접(IPDB)을 포함하고, 여기서 인듀서 작용제 또는 인듀서 신호의 존재 하에, IPDA 및 IPDB는 함께 모인다. 임의의 양태의 실시형태에서, synTF 이펙터 도메인은 제1 폴리펩티드에서 IPDA(또는 IPDB)에 연결되고, synTF DBD는 제2 폴리펩티드에서 IPDB(또는 IPDA)에 연결된다. 따라서, 인듀서 작용제 또는 인듀서 신호의 존재 하에, IPDA 및 IPDB는 함께 연결되어 합성 TF의 DBD에 대한 ED의 연결을 초래한다. 인듀서 작용제 또는 인듀서 신호의 부재 하에, ED는 합성 TF의 DBD에 커플링해제되거나 연결해제된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 유도 근접 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 유도 근접 도메인을 포함한다. 복수의 유도 근접 도메인을 포함하는 실시형태에서, 복수의 유도 근접 도메인은 상이한 개별 유도 근접 도메인 또는 동일한 유도 근접 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상에서 선택된 IPDA 및 IPDB를 포함한다: (1) GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함; (2) FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(Rapalog)(RAP)에 결합함; (3) PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함; (4) 광-유도성 이량체화 도메인(LIDD)을 포함하는 IPDA, 여기서 LIDD는 적절한 파장의 광 인듀서 신호에 노출 시 상보적 LIDD(IPDB)와 함께 이량체화된다.
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 IPD의 이량체화 또는 근접을 유도하는 1, 2, 3, 4, 5개, 또는 그 이상의 인듀서 작용제와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 하나의 인듀서 작용제와 조합된다. 복수의 인듀서 작용제를 포함하는 실시형태에서, 인듀서 작용제는 상이한 개별 인듀서 작용제 또는 동일한 인듀서 작용제의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, IPD 쌍은 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 앱시스산(ABA) 신호전달 경로의 성분으로부터 유래된, ABI(ABA 둔감성) 도메인 및 PYL(피라박틴 내성-유사) 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, IPD 쌍은 PYL1(PYLcs, 아미노산 33 내지 209) 및 ABI1(ABIcs, 아미노산 126 내지 423)의 상호작용 상보적 표면(CS)을 포함한다. 임의의 양태의 일부 실시형태에서, ABI 도메인(예를 들어, 서열식별번호: 66)은 돌연변이 A18D 및 E108G를 포함한다. 임의의 양태의 일부 실시형태에서, ABI 도메인은 검출가능한 마커(예를 들어, FLAG 태그)를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, PYL 도메인은 검출가능한 마커(예를 들어, HA 태그)를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, ABI 도메인은 서열식별번호: 66 또는 107, 또는 동일한 기능을 유지하는 서열식별번호: 66 또는 107 중 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, PYL 도메인은 서열식별번호: 71 또는 108, 또는 동일한 기능을 유지하는 서열식별번호: 71 또는 108 중 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 66, ABI cs CO1 (298 aa)
서열식별번호: 71, PYL1cs 도메인(177 aa)
서열식별번호: 107, 대안적인 ABI 결합 모티프
서열식별번호: 108, 대안적인 PYL 결합 모티프
임의의 양태의 일부 실시형태에서, 근접 인듀서 작용제(예를 들어, ABI 및 PYL 도메인용)는 앱시스산(ABA)이다:
일부 실시형태에서, IPD 쌍은 FKBP(FK506- 및 라파마이신-결합 단백질) 및 FKBP12-라파마이신-결합 단백질(FRB) 단백질이며, 이들은 라팔로그의 존재 하에 함께 모여 이량체화된다. 임의의 양태의 일부 실시형태에서, FKBP 도메인은 서열식별번호: 109 또는 318, 또는 동일한 기능을 유지하는 서열식별번호: 109 또는 318 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, FRB 도메인은 서열식별번호: 110 또는 동일한 기능을 유지하는 서열식별번호: 110의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 109, FKBP aa 결합 모티프:
서열식별번호: 110, FRB 결합 모티프,
임의의 양태의 일부 실시형태에서, (예를 들어, FKBP 및 FRB 도메인을 위한) 근접 인듀서 작용제는 아래 나타낸 라파마이신이다. 임의의 양태의 일부 실시형태에서, (예를 들어, FKBP 및 FRB 도메인을 위한) 근접 인듀서 작용제는 라팔로그, 즉, 라파마이신 유사체이다. 임의의 양태의 일부 실시형태에서, 라팔로그는 본 명세서에 추가로 기재된 바와 같이 실드-1이다.
다른 실시형태에서, IPD 쌍은, 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터 유래되는, GAI(지베렐린 둔감성) 및 GID1(지베렐린 둔감성 드워프1) 단백질이며, 이는 지베렐린 에스테르(GE)의 존재 하에 함께 모인다. 임의의 양태의 일부 실시형태에서, GAI 도메인은 서열식별번호: 111 또는 동일한 기능을 유지하는 서열식별번호: 111의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, GAI 도메인은 GAI의 아미노-말단 DELLA 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, GID 도메인은 서열식별번호: 112 또는 동일한 기능을 유지하는 서열식별번호: 112의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 111, GAI 결합 모티프,
서열식별번호: 112, GID1 결합 모티프
임의의 양태의 일부 실시형태에서, (예를 들어, GAI 및 GID1 도메인을 위한) 근접 인듀서 작용제는 생활성 지베렐린(아래에 나타냄), 지베렐린 에스테르(GE), 또는 다른 지베렐린 유사체이다.
일부 실시형태에서, IPD 쌍은 높은 친화도(Kd = 500 nM)를 갖고 카페인의 존재 하에 동종이량체화하는 VHH 카멜리드 항체(aCaffVHH로 지칭됨)와 같은, 카페인-유도된 이량체화 시스템을 포함한다. 일부 실시형태에서, IPD 쌍은 특정 화학적 리간드를 사용하여 화학적으로 유도된 이량체화 시스템(COMBINES-CID)의 조합 결합제-가능 선택(combinatorial binders-enabled selection)으로부터 선택된다. 비제한적인 예로서, 리간드는 CBD(칸나비디올)일 수 있다. 일부 실시형태에서, IPD 쌍은, 단백질(예를 들어, ABT-737)에 결합된 소분자에 의해 생성된 화학적 에피토프를 인식하는 합성 항체를 선택하여 공지된 소분자-단백질 복합체로부터 유래된, 인간 항체-기반 화학적 유도된 이량체화(AbCID)를 포함한다. 일부 실시형태에서, IPD 쌍은, FK506의 존재 하에 함께 모이는, 칼시뉴린 및 FKBP를 포함한다. 일부 실시형태에서, IPD 쌍은, 시클로스포린 A의 존재 하에 함께 모이는, 칼시뉴린 및 프롤릴 이성질화효소 CyP를 포함한다. 일부 실시형태에서, IPD 쌍은, FKCsA, FK506 및 사이클로스프린 A의 융합물의 존재 하에 함께 모이는, CyP 및 FKBP을 포함한다. 일부 실시형태에서, IPD 쌍은 2개의 FK506 분자의 융합물인 FK2012의 존재 하에 함께 모이는, FKBP의 2개 카피를 포함한다. 예를 들어, Franco et al., Journal of Chromatography B, Volume 878, Issue 2, 15 January 2010, Pages 177-186; Liang et al. Sci Signal 2011 Mar 15;4(164):rs2; Laura A. Banaszynski et al. JACS 2005 Apr 6;127(13):4715-21; Miyamoto et al. Nat Chem Biol Nature Chemical Biology volume 8, pages465-470(2012); Bojar et al. Nature Communications volume 9, Article number: 2318 (2018); Kang et al. JACS 2019 Jul 17; 141(28): 10948-10952; Hill et al. Nat ChemBio 2018 Feb;14(2):112-117; Stanton et al. Science 2018 Mar 9; 359(6380): eaao5902; Weinberg et al. Nat Biotech 2017 May; 35(5): 453-462; Matthew J Kennedy, Nature Methods volume 7, pages 973-975(2010); 미국 특허 출원 US20180163195 및 US20170183654; 미국 특허 제8735096호를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
일부 실시형태에서, IPD 쌍은 광-유도성 이량체화 도메인(LIDD) 쌍을 포함하며, 이의 비제한적인 예는 nMag/nMag, CRY2/CIBN, 및 광변색성(photochromic) 단백질을 포함한다. 일부 실시형태에서, IPD 쌍은 nMag 및 pMag 단백질과 같은 광-유도성 이량체화 도메인(LIDD) 쌍을 포함하며, 이는, 청색광 신호로, 예를 들어, 청색광 펄스 신호, 또는 적당한 파장의 빛의 펄스 후, 함께 모이고 이량체화된다. 임의의 양태의 일부 실시형태에서, nMag 도메인은 서열식별번호: 113 또는 동일한 기능을 유지하는 서열식별번호: 113의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, pMag 도메인은 서열식별번호: 114 또는 동일한 기능을 유지하는 서열식별번호: 114의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 113, nMag 결합 모티프
서열식별번호: 114, pMag 결합 모티프
일부 실시형태에서, IPD 쌍은 광-유도성 이량체화 도메인(LIDD) 쌍, 예컨대, 크립토크롬 2(CRY2) 및 CIBN(CIB1(CRY2 상호작용 염기성-나선-루프 나선 1)의 절단된 버전) 및, 예를 들어, 청색광 펄스 신호, 또는 적절한 파장의 광 펄스 후, 청색광 신호로 함께 모이고 이량체화되는 아라비돕스 탈리아나(Arabidopsis thaliana)로부터 유래한 단백질을 포함한다. 임의의 양태의 일부 실시형태에서, CIBN 도메인은 서열식별번호: 115 또는 동일한 기능을 유지하는 서열식별번호: 115의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, CRY2 도메인은 서열식별번호: 116 또는 동일한 기능을 유지하는 서열식별번호: 116의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 115, CIBN LIDD
서열식별번호: 116, CRY2 LIDD
일부 실시형태에서, IPD 쌍은 Dronpa, Padron, rsTagRFP, 및 mApple을 포함하나 이로만 제한되는 것은 아닌, 광변색성 단백질 도메인과 같은 광-유도성 이량체화 도메인(LIDD) 쌍, 또는 형광 특성을 갖는 이의 변이체 또는 폴리펩티드 단편(예를 들어, Dronpa-145N, Padron-145N 또는 mApple-162H-164A)을 포함한다. 이러한 광변색성 단백질 도메인은 특정 파장(예를 들어, 청색광)의 존재 하에 이량체화된다. 임의의 양태의 일부 실시형태에서, 광변색성 단백질 도메인은 서열식별번호: 330-333 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 330-333 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 330, Dropna-145K (224 aa)
서열식별번호: 331, Dropna-145N (224 aa)
서열식별번호: 332, Padron-145N (224 aa)
서열식별번호: 333, mApple-162H-164A (236 aa)
세포질 격리 도메인
몇몇 양태에서, 본 명세서에서 전위 도메인으로도 지칭되는, 세포질 격리 도메인 또는 단백질을 포함하는 synTF 폴리펩티드가 본 명세서에 기술되어 있다. 본 명세서에 사용되는 용어 "세포질 격리 도메인"은, 예를 들어, 리간드의 결합을 통해 연결된 synTF의 세포하(subcellular) 위치에 영향을 미치는 도메인을 지칭한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 세포질 격리 도메인(들)을 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 세포질 격리 도메인을 포함한다. 복수의 세포질 격리 도메인을 포함하는 실시형태에서, 복수의 세포질 격리 도메인은 상이한 개별 세포질 격리 도메인 또는 동일한 세포질 격리 도메인의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 리간드 결합 도메인(LBD)을 포함하고, 여기서 리간드의 존재 하에, 세포질에 대한 단백질의 격리는 저해된다. 임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 핵 국재화 신호(NLS)를 추가로 포함하고, 여기서 리간드의 부재 하에 NLS는 저해되고, 그로 인해 격리 단백질의 핵으로의 전위가 방지되고, 리간드의 존재 하에 핵 국재화 신호가 노출되어 격리 단백질이 핵으로 전위될 수 있다. 따라서, 리간드가 부재할 때, synTF는 세포질에 격리된다. 리간드가 부재할 때, synTF가 핵으로 전위된다.
임의의 양태의 일부 실시형태에서, 격리 단백질은 에스트로겐 수용체(ER)의 적어도 일부를 포함한다. ER은, 동족 리간드의 부재시 세포의 세포질 인자와 자연적으로 결합하여, 스스로 세포질에 효과적으로 격리된다. 에스트로겐 또는 기타 스테로이드 호르몬 유도체와 같은, 동족 리간드의 결합은 세포질 복합체로부터의 해리를 허용하고 핵 국재화 신호를 노출시켜, 핵으로의 전위를 허용하는, 수용체에 대한 형태적(conformational) 변화를 야기한다.
임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 334 또는 동일한 기능을 유지하는 서열식별번호: 334의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ER의 일부(예를 들어, 서열식별번호: 334), 예를 들어, ER의 C-말단 리간드-결합 및 핵 국재화 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 334의 잔기 282-595 또는 서열식별번호: 334의 잔기 282-595에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
서열식별번호: 334, 에스트로겐 수용체 이소형 1 [Homo sapiens]; NCBI 참조 서열: NP_000116.2 (595 aa)
임의의 양태의 일부 실시형태에서, 에스트로겐 수용체는 이의 천연 리간드(예를 들어, 에스트라디올)에 결합하는 활성을 감소시키지만 타목시펜 및 이의 유사체와 같은 합성 리간드에 결합하는 활성을 유지하는 적어도 하나의 돌연변이를 포함한다. 임의의 양태의 일부 실시형태에서, 에스트로겐 수용체는 다음 돌연변이 중 적어도 하나를 포함한다: G400V, G521R, L539A, L540A, M543A, L544A, V595A 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, 삼중 G400V/MS43A/L544A ER 돌연변이체는 본 명세서에서 ERT2로 지칭된다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ER로부터의 V595A 돌연변이(예를 들어, 서열식별번호: 334)를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 에스트로겐 리간드 결합 도메인(ERT2) 또는 이의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 ERT, ERT2, ERT3, 또는 이의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 74, 335-337 중 하나 또는 동일한 기능을 유지하는 서열식별번호: 74, 335-337 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, 미국 특허 제7,112,715호; Feil et al., Biochemical and Biophysical Research Communications, Volume 237, Issue 3, 28 August 1997, Pages 752-757; Felker et al., PLoS One. 2016 Apr 14;11(4):e0152989를 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
서열식별번호: 74, ERT2(314 aa) 굵은 이중밑줄 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G400V, M543A, L544A, 및 V595A 돌연변이
서열식별번호: 335, ERT(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G521R 돌연변이
서열식별번호: 336, ERT3(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 M543A, L544A, 및 V595A 돌연변이
서열식별번호: 337, ERT(314 aa), 굵은 이중 밑줄그어진 텍스트로 나타낸 ER(예를 들어, 서열식별번호: 334)로부터의 G400V, L539A, L540A 돌연변이
임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 격리 단백질은 1, 2, 3, 4, 5개, 또는 그 이상의 리간드와 조합된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드의 격리 단백질은 하나의 리간드와 조합된다. 복수의 리간드를 포함하는 실시형태에서, 복수의 리간드는 상이한 개별 리간드 또는 동일한 리간드의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 리간드는 에스트라디올(PubChem CID: 5757), 또는 이의 유사체이다. 임의의 양태의 일부 실시형태에서, 리간드는 에스트로겐 수용체의 합성 리간드, 예컨대 타목시펜 또는 이의 유도체이다. 리간드는, 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜 및 풀베스트란트로부터 선택되며, 여기서 ERT(예를 들어, ERT2)에 대한 리간드의 결합은 NLS를 노출시키고 ERT의 핵 전위를 초래한다. 임의의 양태의 일부 실시형태에서, 리간드는 아래에 나타낸 (PubChem CID: 449459), 아피목시펜으로도 지칭될 수 있는 4-하이드록시타목시펜(4-OHT)이다. 임의의 양태의 일부 실시형태에서, 리간드는 아래에 나타낸(PubChem CID: 10090750) 4-하이드록시-N-데스메틸타목시펜이며, 이는 엔독시펜으로도 지칭될 수 있다. 임의의 양태의 일부 실시형태에서, 리간드는 ICI 182,780으로도 지칭될 수 있는 아래에 나타낸 풀베스트란트(PubChem CID 104741)이다.
임의의 양태의 일부 실시형태에서, synTF의 격리 단백질은 막통과 수용체 격리 단백질이고, synTF의 DNA-결합 도메인(DBD) 및 전사 이펙터(TE) 도메인은 수용체의 막통과 도메인의 세포질 측부(side)에 연결된다. 막통과 단백질에 대한 특정 리간드의 부재 하에, synTF의 DBD 및 TA는 세포막에 격리된다. 막통과 단백질에 대한 특정 리간드의 존재하에, 막통과 단백질은 스스로 절단되어 synTF의 DBD와 TA가 세포질로 방출되어 핵으로 운반된다. 막통과 수용체 격리 단백질의 비제한적인 예는 합성 노치(notch) 수용체 또는 제1 및 제2 외인성 세포외 센서를 포함하며, 이는 본 명세서에서 추가로 설명된다.
임의의 양태의 일부 실시형태에서, 세포질 격리 단백질은 노치 수용체 또는 합성 노치(synNotch) 수용체와 같은 내인성 노치 수용체의 변이체를 포함한다. 임의의 양태의 일부 실시형태에서, synNotch를 포함하는 synTF는 다음을 포함한다: (a) 노치 수용체에 이종성인 특정 결합 쌍의 제1 구성원을 포함하는 세포외 도메인; (b) 노치 수용체 조절 영역; 및 (c) synTF의 DNA 결합 도메인 및 전사 이펙터 도메인을 포함하는 세포내 도메인. 특정 결합 쌍의 제2 구성원의 존재 하에, 특정 결합 쌍의 제2 구성원에 대한 특정 결합 쌍의 제1 구성원의 결합은 결합-유도된 단백질분해 절단 부위의 절단을 유도하여 세포내 도메인을 활성화시키며, 그로 인해 synTF가 핵으로 전위하는 것이 가능하다. 특정 결합 쌍의 제2 구성원의 부재 하에, synTF는 세포막에서 격리된 상태로 유지된다. 임의의 양태의 일부 실시형태에서, 격리 단백질은 서열식별번호: 338-339 중 하나 또는 동일한 기능을 유지하는 서열 74, 335-337 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 또는 적어도 70%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다. 예를 들어, 문헌의 내용이 그 전체로 본 명세서에 참조로 통합되는 다음 문헌 참조: 미국 특허 제10,590,182호; Morsut et al., Cell. 2016 Feb 11;164(4):780-91. 임의의 양태의 일부 실시형태에서, 노치 수용체 조절 영역은 Lin-12 노치 반복부 A-C, 이종이량체화 도메인 HD-N 및 HD-C, 결합-유도된 단백질분해 절단 부위, 및 막통과 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, 노치 변이체는 노치 세포외 서브유닛(NEC)(음성 조절 영역(NRR)을 포함함)이 부분적으로 또는 완전히 제거된 노치 수용체이다. 임의의 양태의 일부 실시형태에서, 노치 수용체 조절 영역은, 예를 들어, 하기 도메인 중 하나 이상이 결여된 synNotch의 절단되거나 변형된 변이체이다: Lin-12 노치 반복부 A-C, 이종이량체화 도메인 HD-N 및 HD-C, 결합-유도된 단백질분해 절단 부위, 노치 세포외 도메인(NEC), 음성 조절 영역(NRR), 또는 막통과 도메인.
서열식별번호: 338, synNotch (306 aa)
서열식별번호: 339, synNotch (358 aa)
특정 결합 쌍(예를 들어, synNotch의 것)의 적합한 제1 구성원은 항체-기반 인식 스캐폴드; 항체(즉, 항원-결합 항체 단편을 포함하는 항체-기반 인식 스캐폴드); 비-항체-기반 인식 스캐폴드; 항원(예를 들어, 내인성 항원, 외인성 항원 등); 수용체에 대한 리간드; 수용체; 비-항체-기반 인식 스캐폴드의 표적; Fc 수용체(예를 들어, FcγIIIa; FcγIIIb 등); 세포외 기질 성분 등을 포함하나, 이로만 제한되는 것은 아니다.
특정 결합 쌍(예를 들어, synNotch의 것)은, 예를 들어, 항원-항체 특정 결합 쌍(여기서 제1 구성원은, 항원인 제2 구성원에 특이적으로 결합하는 항체(또는 항체 기반 인식 스캐폴드)이거나, 또는 제1 구성원이 항원이고 제2 구성원이 항원에 특이적으로 결합하는 항체(또는 항체-기반 인식 스캐폴드)임); 리간드-수용체 특정 결합 쌍(여기서 제1 구성원은 리간드이고 제2 구성원은 리간드가 결합하는 수용체이거나, 또는 제1 구성원은 수용체이고 제2 구성원은 수용체에 결합하는 리간드임); 비-항체 기반 인식 스캐폴드-표적 특정 결합 쌍(여기서 제1 구성원은 비-항체-기반 인식 스캐폴드이고 제2 구성원은 비-항체-기반 인식 스캐폴드에 결합하는 표적이거나, 또는 제1 구성원은 표적이고 제2 구성원은 표적에 결합하는 비-항체-기반 인식 스캐폴드임); 접착 분자-세포외 기질 결합 쌍; Fc 수용체-Fc 결합 쌍(여기서 제1 구성원은 Fc 수용체인 제2 구성원에 결합하는 면역글로불린 Fc를 포함하거나, 또는 제1 구성원은 면역글로불린 Fc를 포함하는 제2 구성원에 결합하는 Fc 수용체임); 및 수용체-공동-수용체(receptor-co-receptor) 결합 쌍(여기서 제1 구성원은 공동-수용체인 제2 구성원에 특이적으로 결합하는 수용체이거나, 또는 제1 구성원은 수용체인 제2 구성원에 특이적으로 결합하는 공동-수용체임)을 포함한다.
임의의 양태의 일부 실시형태에서, 막통과 수용체 격리 단백질은 제1 및 제2 외인성 세포외 센서를 포함하고, 여기서 상기 제1 외인성 세포외 센서는, (a) 리간드 결합 도메인, (b) 막통과 도메인, (c) 프로테아제 절단 부위, 및 (d) synTF의 DBD 및 TA를 포함하고; 상기 제2 외인성 세포외 센서는 (e) 리간드 결합 도메인, (f) 막통과 도메인, 및 (g) 프로테아제 도메인을 포함한다. 이러한 시스템은 모듈식 세포외 센서 아키텍처(MESA) 시스템이라고도 지칭될 수 있다. 제1 및 제2 외인성 세포외 센서에 대한 리간드의 존재 하에, 두 수용체는 근접하여, 프로테아제가 프로테아제 절단 부위를 절단하고 synTF의 DBD 및 TA를 세포질로 방출하여 핵으로 전위되도록 허용한다. 제1 및 제2 외인성 세포외 센서에 대한 리간드의 부재 하에, synTF의 DBD 및 TA는 세포막에서 격리된 상태로 유지된다. 임의의 양태의 일부 실시형태에서, 프로테아제는 본 명세서에 기술된 바와 같은 임의의 프로테아제(예를 들어, NS3)를 포함하고, 프로테아제 절단 부위는 본 명세서에 기술된 바와 같은 NS3 프로테아제 절단 부위를 포함한다. 예를 들어, 다음 문헌 참조: 미국 특허 출원 2014/0234851; Daringer et al., ACS Synth. Biol. 2014, 3, 12, 892-902.
임의의 유형의 적합한 리간드 결합 도메인(LB)이 막통과 수용체 격리 단백질과 함께 사용될 수 있다. 리간드 결합 도메인은, 예를 들어, 기존 수용체 리간드-결합 도메인 또는 조작된 리간드 결합 도메인으로부터 유래될 수 있다. 기존 리간드-결합 도메인은, 예를 들어, 사이토카인 수용체, 케모카인 수용체, 선천성 면역 수용체(TLR 등), 후각 수용체, 스테로이드 및 호르몬 수용체, 성장 인자 수용체, 암에서 발생하는 돌연변이체 수용체, 신경전달물질 수용체에서 나올 수 있다. 조작된 리간드-결합 도메인은, 예를 들어, 단일-사슬 항체(아래의 scFv 구축물 논의 참조), 조작된 피브로넥틴 기반 결합 단백질, 및 조작된 컨센서스-유래 결합 단백질(예를 들어, 류신-풍부 반복부 또는 안키린-풍부 반복부, 예컨대, DARPin에 기반함)일 수 있다. 리간드는 그러한 리간드-결합 도메인의 임의의 동족 리간드일 수 있다.
링커 펩티드
여러 양태에서, 본 명세서에는 적어도 하나의 링커 펩티드를 포함하는 synTF 폴리펩티드가 기재되어 있다. 본 명세서에 사용된 "링커 펩티드"("펩티드 링커"와 상호교환적으로 사용됨)는 길이가 약 2 내지 100개의 아미노산인 올리고- 또는 폴리펩티드 영역을 지칭하며, 이는 본 명세서에 기술된 바와 같은 폴리펩티드의 임의의 서열을 함께 연결한다. 일부 실시형태에서, 링커는 인접한 단백질 도메인이 서로에 대해 자유롭게 이동할 수 있도록 글리신 및 세린과 같은 가요성 잔기를 포함하거나 이로 구성될 수 있다. 2개의 인접한 도메인이 서로 입체적으로 간섭하지 않도록 하는 것이 바람직한 경우 더 긴 링커가 사용될 수 있다. 링커는 절단가능하거나 절단불가능할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 링커 펩티드(들)를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 링커 펩티드를 포함한다. 복수의 링커 펩티드를 포함하는 실시형태에서, 복수의 링커 펩티드는 상이한 개별 링커 펩티드 또는 동일한 링커 펩티드의 복수의 카피, 또는 전술한 것의 조합일 수 있다. 임의의 양태의 일부 실시형태에서, 링커 펩티드는 본 명세서에 기술된 바와 같은 임의의 2개의 도메인 사이의 임의의 위치에 위치할 수 있다: 예를 들어, DBD와 조절인자 단백질 사이, 조절인자 단백질과 이펙터 도메인 사이, DBD와 이펙터 도메인 사이, 또는 이들의 임의의 조합. 임의의 양태의 일부 실시형태에서, 링커 펩티드는, 예를 들어, 도메인의 구성요소를 연결하기 위해 DBD, 이펙터 도메인, 또는 조절인자 단백질 내에 위치할 수 있다.
본 명세서에 설명된 임의의 한 양태의 일부 실시형태에서, 링커는 여러 ZF를 탠덤하게 서로 연결하여 ZF 어레이를 형성한다. 본 명세서에 기술된 어느 한 양태의 일부 실시형태에서, 링커는 제1 ZFA를 제2 ZFA와 연결한다. 본 명세서에 기술된 임의의 한 양태의 일부 실시형태에서, 링커는 여러 ZFA를 서로 탠덤하게 연결하여 ZF-함유 ZF 단백질 도메인을 형성한다. 본 명세서에 기술된 폴리펩티드에 유용한 펩티드 링커 분자의 비제한적 예는 글리신-풍부 펩티드 링커를 포함하고(예를 들어, US 5,908,626 참조), 여기서 아미노산 잔기의 절반 이상이 글리신이다. 바람직하게는, 이러한 글리신-풍부 펩티드 링커는 약 20개 이하의 아미노산으로 구성된다. 링커 분자는 또한 비-펩티드 또는 부분 펩티드 분자를 포함할 수 있다. 예를 들어, 펩티드는 글루타르알데히드 또는 EDC(Pierce, Rockford, Illinois)와 같은 잘 알려진 가교 분자를 사용하여 펩티드 또는 다른 분자에 연결될 수 있다. 본 명세서에 기술된 조작된 synTF의 일부 실시형태에서, synTF의 ZF 단백질 도메인 내의 ZF 어레이(ZFA)는 링커 펩티드와 함께 각각의 융합 단백질에서 함께 연결된다.
링커 펩티드의 비제한적 예는 다음을 포함하지만, 이로만 제한되는 것은 아니다: PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323).
예를 들어, TGSQK(서열식별번호: 341) 또는 TGEKP(서열식별번호: 342) 또는 TGGGEKP(서열식별번호: 344)은 ZFA 사이에서 링커로 사용되고; VEIEDTE(서열식별번호: 346), GGSGGS(서열식별번호: 303), GGSGG(서열식별번호: 67), GGGSG(서열식별번호: 70), CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345)이 ZF 도메인과 이펙터 도메인을 함께 연결시키는 데 사용되고; PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GSSGSS(서열식별번호: 323)이, 본 명세서에 추가로 기술되는, MASh 도메인, StaPL 도메인, 또는 NS3/NS4a 도메인의 영역을 연결하는 데 사용된다.
가요성 링커는 일반적으로 Gly, Ser 및 Thr과 같은 작은 비극성 또는 극성 잔기로 구성된다. 링커를 포함하는 본 명세서에 기술된 임의의 융합 단백질의 한 실시형태에서, 링커 펩티드는 Gly 또는 Ser인 적어도 하나의 아미노산을 포함한다. 링커를 포함하는 본 명세서에 기술된 융합 단백질의 한 실시형태에서, 링커는 길이가 1개 내지 25개 잔기인 가요성 폴리펩티드이다. 가요성 펩티드 링커의 일반적인 예는 (GGS)n(여기서 n은 1에서 8(서열식별번호: 351, GGSGGSGGSGGSGGSGGSGGSGGS)), 또는 (Gly4Ser)n 반복부(여기서 n은 1-8(서열식별번호: 352, GGGGSGGGGSGGGGSGGGGSGGGGSGGG,GGGGSGGGGS), 바람직하게는, n=3, 4, 5 또는 6임), 즉 (Gly-Gly-Gly-Gly-Ser)n(서열식별번호: 353)(GGGGS, 여기서 n은 모티프의 반복 수를 나타냄)을 포함한다. 예를 들어, 가요성 링커는 (GGS)2(서열식별번호: 354, GGSGGS)이다. 대안적으로, 가요성 펩티드 링커는 Gly-Ser 반복부(Gly-Ser)p를 포함하며, 여기서 p는 모티프의 Gly-Ser 반복부의 수를 나타내고, p=1-8(서열식별번호: 355, GSGSGSGSGSGSGSGS), 바람직하게는 n=3, 4, 5 또는 6을 나타낸다. 가요성 링커의 또 다른 예는 TGSQK(서열식별번호: 341)이다.
ZF 단백질 도메인 및 이펙터 도메인이 링커 펩티드와 함께 연결된 본 명세서에 기술된 조작된 synTF의 한 실시형태에서, 링커 펩티드의 길이는 약 1 내지 20개 아미노산이다. 한 실시형태에서, 링커 펩티드는 Lys를 포함하지 않거나, 를 포함하지 않거나, Lys 및 Arg 둘 다를 포함하지 않는다.
본 명세서에 기술된 조작된 synTF의 일부 실시형태에서, ZF 단백질 도메인 및 이펙터 도메인은 화학적 가교제(cross-linking agents)와 함께 연결된다. 이관능성 가교 분자는 2개의 별개의 반응성 부위를 갖는 링커 분자이다. 예를 들어, 이작용성 링커 분자의 반응성 부위 중 하나는 펩티드 상의 작용기와 반응하여 공유 결합을 형성할 수 있고, 다른 반응성 부위는 다른 분자의 작용기와 반응하여 공유 결합을 형성할 수 있다. 분자를 가교시키는 일반적인 방법은 검토되어 있다(예를 들어, 다음 문헌 참조: Means and Feeney, Bioconjugate Chem., 1:2-12 (1990)).
동종이관능성 가교제(cross-linker) 분자는 화학적으로 동일한 2개의 반응성 부위를 갖는다. 동종이관능성 가교제 분자의 비제한적 예는, 제한됨이 없이, 글루타르알데히드; N,N'-비스(3-말레이미도-프로피오닐-2-하이드록시-1,3-프로판디올(설프히드릴-특이적 동종이작용성 가교제), 특정 N-숙신이미드 에스테르(예를 들어, 디숙신이미딜 수베레이트, 디티오비스(숙신이미딜 프로피오네이트), 및 가용성 비스-술폰산 및 이의 염을 포함한다(예를 들어, 다음 문헌 참조: Pierce Chemicals, Rockford, Illinois; Sigma-Aldrich Corp., St. Louis, Missouri).
이작용성 가교제 분자는 이종이작용성 링커 분자이며, 이는 링커가 2개 이상의 상이한 반응성 부위를 가지며, 각각은 펩티드 또는 다른 분자에 개별적으로 연결될 수 있음을 의미한다. 이러한 이종이작용성 링커의 사용은 선택된 펩티드 서열에 대한 각각의 반응성 부위의 화학적 분리 및 단계적 부가(벡터 결합(vectorial conjunction))를 허용한다. 본 개시에 유용한 이종이작용성 링커 분자는, 제한됨이 없이, m-말레이미도벤조일-N-하이드록시숙신이미드 에스테르를 포함한다(Green et al., Cell, 28: 477-487 (1982); Palker et al., Proc. Natl. Acad. Sci (USA), 84: 2479-2483 (1987) 참조); m-말레이미도-벤조일술포숙신이미드 에스테르; 말레이미도부티르산 N-하이드록시숙신이미드 에스테르; 및 N-숙신이미딜 3-(2-피리딜-디티오)프로피오네이트(예를 들어, Carlos et al., Biochem. J., 173: 723-737 (1978); Sigma-Aldrich Corp., St. Louis, Missouri 참조)를 포함한다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 ZF-함유 융합 단백질에서, ZFA 내의 모든 나선은 4 내지 6개의 아미노산 잔기를 갖는 펩티드 링커(L2)에 의해 연결된다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF-함유 융합 단백질에서, 개별 ZFA 내의 모든 나선은 TGEKP(서열식별번호: 342) 또는 TGSKP(서열식별번호: 356) 또는 TGQKP(서열식별번호: 357) 또는 TGGKP(서열식별번호: 358)와 같은 강성 펩티드 링커에 의해 연결된다. 강성 링커는 ZF 모티프의 표적 DNA 서열에 대한 상승적 결합을 부여하는 데 도움이 된다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF 함유 융합 단백질에서, (L1) 또는 (L2)는 가요성 링커이다. 비제한적인 예는 다음을 포함한다: TGSQKP(서열식별번호: 359) 및 TGGGEKP(서열식별번호: 344). 한 실시형태에서, 링커 가요성 펩티드는 1 내지 20개 아미노산 길이이다. 가요성 링커는 인접한 ZF 모티프 간의 협동작용(cooperativity)을 약화시키는 데 기여한다.
본 명세서에 기술된 임의의 양태의 한 실시형태에서, 본 명세서에 기술된 synTF 또는 본 명세서에 기술된 ZF 함유 융합 단백질에서, (L1) 또는 (L2)는 강성 링커이다. 비제한적 예는 다음을 포함한다: TGEKP(서열식별번호: 342), TGSKP(서열식별번호: 356), TGQKP(서열식별번호: 357) 및 TGGKP(서열식별번호: 358).
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 2개 이상의 ZFA가 있는 본 명세서에 기술된 synTF 또는 ZF 함유 융합 단백질에서, 개별 ZFA는 TGSQKP(서열식별번호: 359)와 같은, 가요성 펩티드 링커에 의해 연결된다. 또 다른 실시형태에서, ZFA는 화학적 가교제에 의해 연결된다. 화학적 가교결합제는 당업계에 공지되어 있다.
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 또는 ZF 함유 융합 단백질에서, 개별 ZFA 내의 모든 나선은 강성 펩티드 링커 및 가요성 펩티드 링커의 조합에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 강성 펩티드 링커 및 가요성 펩티드 링커가 교대로 사용되어 핑거를 연결한다.
자가-절단 펩티드
여러 양태에서, 자가-절단 펩티드를 포함하는 synTF 폴리펩티드가 본 명세서에 기술된다. 본 명세서에 사용되는 용어 "자가-절단 펩티드"는 자체 절단을 촉매할 수 있는 짧은 아미노산 서열(예를 들어, 대략 18-22개의 aa 길이 펩티드)을 지칭한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 다성분 synTF 시스템(예를 들어, 유도된 근접 synTF 시스템)은 자가-절단 펩티드 도메인을 통해 서로 물리적으로 연결된 적어도 2개의 폴리펩티드를 포함한다. 자가-절단 펩티드는 제1 폴리펩티드와 제2 폴리펩티드(및/또는 제3 폴리펩티드 등)의 핵산이 동일한 벡터에 존재할 수 있도록 하지만, 번역 후에 자가-절단 펩티드는 번역된 폴리펩티드를 복수의 별개 폴리펩티드로 절단한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 자가-절단 펩티드를, 예를 들어, 각각의 synTF 폴리펩티드 사이에 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은, 예를 들어, synTF 폴리펩티드 시스템의 제1 폴리펩티드와 제2 폴리펩티드 사이에 하나의 자가-절단 펩티드를 포함한다. 복수의 자가-절단 펩티드를 포함하는 실시형태에서, 복수의 자가-절단 펩티드는 상이한 개별 자가-절단 펩티드 또는 동일한 자가-절단 펩티드의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
일부 실시형태에서, 자가-절단 펩티드는, 예를 들어, 이종이량체화 도메인 synTF에서 사용된다. 비제한적인 예로서, 도 19 및 20은 [ABI]-[ZF]를 포함하는 제1 폴리펩티드 영역과 [ED]-[PYL]을 포함하는 제2 폴리펩티드 영역 사이의 2A 자가-절단 펩티드를 나타낸다. 폴리펩티드의 번역 후, 자가-절단 펩티드인 2A 서열은 폴리펩티드를 2개의 폴리펩티드, [ABI]-[ZF] 및 [ED]-[PYL]로 절단하며, 이는 ABA의 존재 하에 [ED]-[PYL]·ABA·[ABI]-[ZF] 복합체를 형성하여, DBD(ZF)와 ED(예를 들어, p65 또는 KRAB)를 커플링할 수 있다.
임의의 양태의 일부 실시형태에서, 자가-절단 펩티드는 2A 리보솜 스킵 서열로도 지칭될 수 있는 2A 펩티드 패밀리에 속한다. 2A 펩티드의 비제한적인 예는 P2A, E2A, F2A 및 T2A를 포함한다(예를 들어, 표 18 참조). F2A는 구제역 바이러스 18에서 파생되고; E2A는 말 비염(equine rhinitis) A 바이러스에서 파생되고; P2A는 돼지 테스코바이러스-1 2A에서 파생되고; T2A는 토시아 아시그나 바이러스(thosea asigna virus) 2A에서 파생된다. 임의의 양태의 일부 실시형태에서, 2A 펩티드의 N-말단은 서열 "GSG"(Gly-Ser-Gly)를 포함한다. 임의의 양태의 일부 실시형태에서, 2A 펩티드의 N-말단은 서열 "GSG"(Gly-Ser-Gly)를 포함하지 않는다.
표 18: 예시적인 자가-절단 펩티드
2A-펩티드-매개 절단은 단백질 번역 후에 시작된다. 절단은 2A 펩티드의 C-말단에 있는 프롤린(P)과 글리신(G) 사이의 펩티드 결합이 끊어짐으로써 촉발된다. 2A-펩티드-매개 절단의 분자 메커니즘은 진정한 단백질 분해 절단보다는 글리실-프롤릴 펩티드 결합 형성의 리보솜 "스키핑(skipping)"을 포함한다. 서로 다른 2A 펩티드는 상이한 절단 효율을 나타내며, P2A가 가장 효율적이고 F2A가 가장 덜 효율적이다. 따라서, F2A 결합 단백질의 최대 50%가 융합 단백질로 세포에 남아 있을 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드 시스템의 자가-절단 펩티드는 서열식별번호: 68, 360-362, 또는 동일한 기능(예를 들어, 자가-절단)을 유지하는 서열식별번호: 68, 360-362 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 시스템의 복수의 폴리펩티드를 1:1(또는 1:1:1 등) 화학량론적 비율로 제공하는 것이 유리하다(예를 들어, 이러한 화학량론적 비율은 최적의 기능성을 초래한다). synTF 시스템의 제1 및 제2(및 제3 등) 폴리펩티드의 1:1(또는 1:1:1 등) 비율이 유리한 실시형태에서, 제1 및 제2 폴리펩티드는, 본 명세서에 기술된 바와 같은 자가-절단 펩티드(들)이 측접하는, 단일 벡터로 제공될 수 있다. synTF 시스템의 제1 및 제2(및 제3 등) 폴리펩티드의 1:1(또는 1:1:1 등) 비율이 유리하지 않은 실시형태에서(예를 들어, 이 화학양론적 비율은 최적이 아닌(suboptimal) 기능성을 초래하고, 다른 비율은 최적의 기능성을 초래함), 그러면 제1 및 제2 폴리펩티드는, 예를 들어, 원하는 화학량론적 비율로 복수의 개별 벡터로 제공될 수 있다.
검출가능한 마커
여러 양태에서, 본 명세서에는 적어도 하나의 검출가능한 마커를 포함하는 synTF 폴리펩티드가 기재되어 있다. 본 명세서에 사용되는 용어 "검출가능한 마커"는 synTF 폴리펩티드에 부착될 때 폴리펩티드가 결합하는 해당 폴리펩티드 또는 또 다른 분자에 검아웃풋(detectability)을 부여하는 모이어티를 지칭한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드(또는 집합적으로 synTF 폴리펩티드 시스템)는 1, 2, 3, 4, 5개, 또는 그 이상의 검출가능한 마커를 포함한다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드 또는 시스템은 하나의 검출가능한 마커를 포함한다. 복수의 검출가능한 마커를 포함하는 실시형태에서, 복수의 검출가능한 마커는 상이한 개별 검출가능한 마커 또는 동일한 검출가능한 마커의 복수의 카피, 또는 전술한 것의 조합일 수 있다.
임의의 양태의 일부 실시형태에서, 형광 모이어티는 검출가능한 마커로서 사용될 수 있지만, 검출가능한 마커는 또한, 예를 들어, 동위원소, 형광 단백질 및 펩티드, 효소, 특정 결합 쌍의 성분, 발색단, 본 명세서에 정의된 것과 같은 친화성 태그, 항체, 콜로이드성 금속(즉, 금) 및 양자점을 포함한다. 검출가능한 마커는 직접적으로 또는 간접적으로 검출될 수 있다. 직접적으로 검출가능한 마커는 검출가능한 신호를 생성하기 위해 추가 시약이나 기질을 필요로 하지 않는다. 예로는 동위원소와 형광단을 포함한다. 간접적으로 검출가능한 마커는 하나 이상의 보조 인자 또는 기질의 존재 또는 작용을 필요로 한다. 예로는 크로모젠 X-gal(5-브로모-4-클로로-3-인도일-β-D-갈락토피라노사이드)과 같은 기질의 절단시 착색된 반응 생성물의 생성에 의해 검출가능한 β-갈락토시다제, 기질 디아미노벤지딘의 존재하에서 착색된 반응 생성물의 생성에 의해 검출가능한 양고추냉이 퍼옥시다제 및 니트로블루 테트라졸륨 및 5-브로모-4-클로로-3-인돌릴 포스페이트의 존재하에 착색된 반응 생성물의 생성에 의해 검출가능한 알칼리성 포스파타제와 같은 효소, 및 친화도 태그를 포함한다. 친화도 태그의 비제한적 예는 Strep-태그, 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 글루타티온-S-트랜스퍼라제(GST), FLAG-태그, HA-태그, Myc-태그, 폴리(His)-태그뿐 아니라 이의 유도체를 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 GFP, V5, HA1, Myc, VSV-G, HSV, FLAG, HIS, mCherry, AU1, 및 비오틴으로부터 선택된다.
서열식별번호: 65, NLS, PKKKRKV
서열식별번호: 77, 3X FLAG 태그 + 핵 국재화 서열 (굵은 텍스트)
DYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPGG
서열식별번호: 80, AU1 태그, DTYRYI
서열식별번호: 84, HA 태그, YPYDVPDYA
서열식별번호: 89, FLAG 태그, DYKDDDDK
서열식별번호: 372, mCherry:
서열식별번호: 376, huEGFRt (절단된 인간 EGFR 폴리펩티드)
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 검출가능한 마커는 서열식별번호: 65, 77, 80, 80, 89, 372, 376, 또는 동일함(예를 들어, synTF 폴리펩티드 또는 synTF 폴리펩티드의 절단된 단편의 검출)을 유지하는 서열식별번호: 65, 77, 80, 80, 89, 372 또는 376 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 본 명세서에 기술된 바와 같은 synTF 폴리펩티드 내의 어디에도 위치할 수 있다. 한 실시형태에서, 검출가능한 마커는 본 명세서에 기술된 바와 같은 synTF 폴리펩티드의 임의의 도메인 사이에 위치하지만, 기능적 도메인 내에서 발견되지 않거나 도메인의 기능을 방해하지 않는다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 세포외 결합 도메인의 C 말단에 인접하여 위치한다. 이러한 마커는 세포질 발현 또는 핵 전위를 포함하는 synTF 폴리펩티드의 발현을 검출하는 데 사용될 수 있다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제와 프로테아제 절단 부위 사이에 위치하고; 이러한 마커는 synTF 폴리펩티드의 절단 및/또는 발현을 검출하는 데 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제와 프로테아제 절단 부위 사이에 위치하는 검출가능한 마커는 AU1 태그, HA1 태그, 또는 본 명세서에 기술된 바와 같은 임의의 다른 마커를 포함한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 인접하고 N-말단에 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대한 N-말단 제1 프로테아제 절단 부위에 대해 C-말단에 인접하여 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대해 C 말단에 인접하여 위치한다. 임의의 양태의 일부 실시형태에서, 검출가능한 마커는 억제성 프로테아제에 대해 C 말단 및 제2 프로테아제 절단 부위에 대해 N-말단에 인접하여 위치한다.
임의의 양태의 일부 실시형태에서, 검출가능한 마커는 폴리펩티드의 C-말단 말단에 위치한다. 이러한 마커는 synTF 폴리펩티드의 세포내 발현을 검출하는 데 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 폴리펩티드의 C-말단 말단에 위치한 검출가능한 마커는 mCherry 또는 본 명세서에 기술된 바와 같은 또 다른 마커를 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드, 특히 대상체에 투여되는 것 또는 약제학적 조성물의 일부인 것은 면역원성인 검출가능한 마커를 포함하지 않는다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드는 GFP, mCherry, HA1, 또는 임의의 다른 면역원성 마커를 포함하지 않는다.
II.
유도성 합성 전사 인자
복수의 양태에서, (a) 적어도 하나의 DNA 결합 도메인(DBD), (b) 전사 이펙터 도메인(ED), 및 (c) 적어도 하나의 조절인자 단백질(RP)을 포함하는 합성 전사 인자가 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, ED는 DBD에 직접적으로 커플링되거나 연결된다. 임의의 양태의 일부 실시형태에서, ED는 DBD에 간접적으로 커플링되거나 연결된다. 임의의 양태의 일부 실시형태에서, DBD에 대한 ED의 커플링은 적어도 하나의 RP에 의해 조절된다. 임의의 양태의 일부 실시형태에서, ED의 세포 국재화는 적어도 하나의 조절인자 단백질에 의해 조절된다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 조절인자 단백질은 억제성 프로테아제, 유도된 분해 도메인, 유도 근접 도메인, 및 세포질 격리 도메인으로 이루어진 그룹으로부터 선택된다.
임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-RP; DBD-RP-ED; ED-DBD-RP; ED-RP-DBD; RP-DBD-ED; 또는 RP-ED-DBD. 2개의 조절인자 단백질(즉, RP1 및 RP2)을 포함하는 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-RP1-RP2; ED-DBD-RP1-RP2; RP1-DBD-ED-RP2; DBD-RP1-ED-RP2; ED-RP1-DBD-RP2; RP1-ED-DBD-RP2; RP1-ED-RP2-DBD; ED-RP1-RP2-DBD; RP2-RP1-ED-DBD; RP1-RP2-ED-DBD; ED-RP2-RP1-DBD; RP2-ED-RP1-DBD; RP2-DBD-RP1-ED; DBD-RP2-RP1-ED; RP1-RP2-DBD-ED; RP2-RP1-DBD-ED; DBD-RP1-RP2-ED; RP1-DBD-RP2-ED; ED-DBD-RP2-RP1; DBD-ED-RP2-RP1; RP2-ED-DBD-RP1; ED-RP2-DBD-RP1; DBD-RP2-ED-RP1; 및 RP2-DBD-ED-RP1.
일부 실시형태에서 그리고 단지 일예로서, 본 명세서에 개시된 것과 같은, 예시적인 RP1은 유도 근접 도메인(IPD), 또는 세포질 격리 도메인(CS)으로부터 선택되고, RP2는 유도된 분해 도메인(SMASh 도메인 포함)으로부터 선택된다. 또 다른 실시형태에서, 예시적인 RP1은 유도된 분해 도메인(SMASh 도메인 포함)이고 PR2는 유도 근접 도메인(IPD) 또는 세포질 격리 도메인(IPD)으로부터 선택된다.
복수의 양태에서, 예시적인 synTF 폴리펩티드가 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, synTF 폴리펩티드는 서열식별번호: 4-15, 40-51, 또는 378-379 중 하나, 또는 서열식별번호: 4-15, 40-51, 또는 378-379 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
A.
억제성 프로테아제 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 억제성 프로테아제이다. 따라서, 본 명세서에 기술된 한 양태에서, synTF는 다음을 포함한다: (a) DBD; (b) ED; 및 (c) 억제성 프로테아제 도메인(본 명세서에서 PRO 또는 RPD로 지칭됨). 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-PRO; DBD-PRO-ED; ED-DBD-PRO; ED-PRO-DBD; PRO-DBD-ED; 또는 PRO-ED-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 본 명세서에 추가로 기재된 바와 같이 적어도 하나의 프로테아제 절단 부위(PC)를 추가로 포함한다. 바람직한 실시형태에서, 적어도 하나의 프로테아제 절단 부위는, 프로테아제가 프로테아제 절단 부위에서 절단할 때, DBD와 ED가 커플링되지 않도록, DBD와 ED 사이에 위치한다. 따라서, 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단까지 다음을 포함한다: PRO-ED-PC-DBD; ED-PRO-PC-DBD; ED-PC-PRO-DBD; DBD-PC-PRO-ED; DBD-PRO-PC-ED; PRO-DBD-PC-ED; ED-PC-DBD-PRO; 및 DBD-PC-ED-PRO.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 2개의 프로테아제 절단 부위(PC)를 포함한다. 임의의 양태의 일부 실시형태에서, 2개의 프로테아제 절단 부위는 억제성 프로테아제 도메인의 N 말단 및 C 말단, 예를 들어, N-말단에서 C-말단으로 직접적으로 위치한다: PC1-PRO-PC2. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-PC1-PRO-PC2-ED, 또는 ED-PC1-PRO-PC2-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 본 명세서에 추가로 기재된 바와 같이 억제성 프로테아제(CO)에 대한 보조인자를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제에 대한 보조인자는 예를 들어, N-말단에서 C-말단으로 다음과 같이, 억제성 프로테아제에 직접적으로 연결된다: CO-PRO 또는 PRO-CO. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-PRO-CO; DBD-PRO-CO-ED; ED-DBD-PRO-CO; ED-PRO-CO-DBD; PRO-CO-DBD-ED; PRO-CO-ED-DBD; DBD-ED-CO-PRO; DBD-CO-PRO-ED; ED-DBD-CO-PRO; ED-CO-PRO-DBD; CO-PRO-DBD-ED; CO-PRO-ED-DBD; DBD-PC1-PRO-CO-PC2-ED; ED-PC1-PRO-CO-PC2-DBD; DBD-PC1-CO-PRO-PC2-ED; 또는 ED-PC1-CO-PRO-PC2-DBD.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF의 DBD는 ZF10-1을 포함한다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF의 DBD는 서열식별번호: 3 또는 동일한 기능을 유지하는 서열식별번호: 3에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 억제성 프로테아제 synTF가 본 명세서에 기술된다: (a) DBD, (b) 억제성 프로테아제; 및 (c) 전사 액티베이터 도메인. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 8 또는 44 또는 동일한 기능을 유지하는 서열식별번호: 8 또는 44 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 20 또는 32, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 20 또는 32 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 20 또는 32의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 억제성 프로테아제 synTF가 본 명세서에 기술된다: (a) 전사 리프레서 도메인, (b) 억제성 프로테아제; 및 (c) DBD. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 9 또는 45, 또는 동일한 기능을 유지하는 서열식별번호: 9 또는 45 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 억제성 프로테아제 synTF는 서열식별번호: 21 또는 33, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 21 또는 33 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 21 또는 33의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
B.
유도된 분해 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 유도된 분해 도메인이다. 따라서, 한 양태에서 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; 및 (c) 유도 분해 도메인(SMASh). 본 명세서에 기술된 바와 같이, SMASh 도메인은 C-말단 SMASh 도메인 또는 N-말단 SMASh 도메인일 수 있다. 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-ED-SMASh; ED-DBD-SMASH; SMASH-DBD-ED; 또는 SMASH-ED-DBD.
임의의 양태의 일부 실시형태에서, SMASh synTF의 DBD는 ZF10-1을 포함한다. 임의의 양태의 일부 실시형태에서, SMAh synTF의 DBD는 서열식별번호: 3 또는 동일한 기능을 유지하는 서열식별번호: 3에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, 및 (c) 유도된 분해(예를 들어, SMASh) 도메인. 임의의 양태의 일부 실시형태에서, SMASh synTF는 서열식별번호: 12 또는 48, 또는 동일한 기능을 유지하는 서열식별번호: 12 또는 48 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh synTF는 서열식별번호: 24 또는 36, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 24 또는 36 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 21 또는 33의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 세포질 격리 도메인(CS)을 추가로 포함한다. 따라서, 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 세포질 격리 도메인(CS). 임의의 양태의 일부 실시형태에서, synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-SMASh-CS; ED-DBD-SMASH-CS; SMASH-DBD-ED-CS; DBD-SMASH-ED-CS; ED-SMASH-DBD-CS; SMASH-ED-DBD-CS; SMASH-ED-CS-DBD; ED-SMASH-CS-DBD; CS-SMASH-ED-DBD; SMASH-CS-ED-DBD; ED-CS-SMASH-DBD; CS-ED-SMASH-DBD; CS-DBD-SMASH-ED; DBD-CS-SMASH-ED; SMASH-CS-DBD-ED; CS-SMASH-DBD-ED; DBD-SMASH-CS-ED; SMASH-DBD-CS-ED; ED-DBD-CS-SMASH; DBD-ED-CS-SMASH; CS-ED-DBD-SMASH; ED-CS-DBD-SMASH; DBD-CS-ED-SMASH; 및 CS-DBD-ED-SMASH. 바람직한 실시형태에서, SMASh 도메인은, 다음과 같이, C-말단 또는 N-말단에 존재한다: 예를 들어, SMASh-DBD-ED-CS; SMASH-ED-DBD-CS; SMASH-ED-CS-DBD; SMASH-CS-ED-DBD; SMASH-CS-DBD-ED; SMASH-DBD-CS-ED; ED-DBD-CS-SMASH; DBD-ED-CS-SMASH; CS-ED-DBD-SMASH; ED-CS-DBD-SMASH; DBD-CS-ED-SMASH; 및 CS-DBD-ED-SMASH.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF의 DBD는 ZF3-5를 포함한다. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF의 DBD는 서열식별번호: 2 또는 동일한 기능을 유지하는 서열식별번호: 2에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, (c) 세포질 격리 도메인, 및 (d) 유도된 분해(예를 들어, SMASh) 도메인. 또 다른 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 유도된 분해(예를 들어, SMASh) 도메인, (b) DBD, (c) 전사 액티베이터 도메인, 및 (d) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 10, 11, 46, 47, 또는 379, 또는 동일한 기능을 유지하는 서열식별번호: 10, 11, 46, 47, 또는 379 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 22, 23, 34, 또는 35, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 22, 23, 34, 또는 35 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 22, 23, 34, 또는 35의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 전사 억제 도메인, (b) DBD, (c) 세포질 격리 도메인 및 (d) 유도된 분해(예를 들어, SMASh) 도메인. 또 다른 양태에서, N-말단에서 C-말단으로 다음을 포함하는 SMASh/세포질 격리 synTF가 본 명세서에 기술된다: (a) 유도된 분해(예를 들어, SMASh) 도메인, (b) 전사 리프레서 도메인, (c) DBD, 및 (d) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 13-15 또는 49-51 중 하나 또는 또는 동일한 기능을 유지하는 서열식별번호: 13-15 또는 49-51 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, SMASh/세포질 격리 synTF는 서열식별번호: 25-27 또는 37-39 중 하나 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 22, 23, 24, 또는 35 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 25-27 또는 37-39의 코돈-최적화된 버전에 의해 코딩된다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 억제성 도메인(PRO)을 추가로 포함한다. 따라서, 본 명세서에 기술된 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 억제성 프로테아제 도메인(PRO). 임의의 양태의 일부 실시형태에서, synTF는 N-말단에서 C-말단으로 다음을 포함한다: DBD-ED-SMASh-PRO; ED-DBD-SMASh-PRO; SMASh-DBD-ED-PRO; DBD-SMASh-ED-PRO; ED-SMASh-DBD-PRO; SMASh-ED-DBD-PRO; SMASh-ED-PRO-DBD; ED-SMASh-PRO-DBD; PRO-SMASh-ED-DBD; SMASh-PRO-ED-DBD; ED-PRO-SMASh-DBD; PRO-ED-SMASh-DBD; PRO-DBD-SMASh-ED; DBD-PRO-SMASh-ED; SMASh-PRO-DBD-ED; PRO-SMASh-DBD-ED; DBD-SMASh-PRO-ED; SMASh-DBD-PRO-ED; ED-DBD-PRO-SMASh; DBD-ED-PRO-SMASh; PRO-ED-DBD-SMASh; ED-PRO-DBD-SMASh; DBD-PRO-ED-SMASh; 및 PRO-DBD-ED-SMASh. 일부 실시형태에서, SMASh 도메인은 C-말단 또는 N-말단에 있고 PRO 도메인은 DBD 및 ED 도메인 사이에 있다: 예를 들어, SMASh-ED-PRO-DBD; SMASH-DBD-PRO-ED; ED-PRO-DBD-SMASH; 및 DBD-PRO-ED-SMASH.
일부 실시형태에서, 각 도메인의 서열은 본 명세서에 기술된 예시적인 도메인 서열로부터 선택된다. 일부 실시형태에서, PRO/SMASh synTF 시스템의 ED는 전사 액티베이터이다. 일부 실시형태에서, PRO/SMASh synTF 시스템의 ED는 전사 리프레서이다. PRO 도메인에 대한 프로테아제 저해제의 존재하는 경우, ED와 DBD가 커플링되고 synTF는 켜짐(on)이고, PRO 도메인에 대한 프로테아제 저해제가 부재하는 경우, ED와 DBD가 커플링되지 않고 synTF는 꺼짐(off)이다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 존재하는 경우, PRO/SMASh synTF 시스템이 분해된다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 부재하는 경우, SMASh 태그가 분해되고 PRO/SMASh synTF 시스템은 분해되지 않는다. 임의의 양태의 일부 실시형태에서, 억제성 프로테아제 도메인 및 유도된 분해 도메인 각각은 상이한 프로테아제를 포함하거나 또는 각각은 상이한 NS3 프로테아제 저해제에 대한 민감성을 갖는 NS3 프로테아제를 포함하여, 별도의 프로테아제 저해제를 사용하여 별개로 PRO 도메인 및 SMASH 도메인을 조절할 수 있다.
양태의 일부 실시형태에서, 유도된 분해 도메인 synTF는 제2 조절인자 단백질, 예를 들어, 유도된 근접 쌍(IPD)을 추가로 포함한다. 따라서, 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) DBD; (b) ED; (c) 유도 분해 도메인(SMASh); 및 (d) 유도 근접 쌍(IPD). 유도된 분해 도메인은 IPD synTF 시스템의 어느 하나의 폴리펩티드에 연결될 수 있다. 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD, (ii) 유도된 근접 쌍(IP1)의 제1 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제1 폴리펩티드; 및 (b) (i) ED 및 (ii) 유도된 근접 쌍(IP2)의 제2 구성원을 포함하는 제2 폴리펩티드. 또 다른 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD 및 (ii) 유도된 근접 쌍(IP1)의 제1 구성원을 포함하는 제1 폴리펩티드; 및 (b) (i) ED, (ii) 유도된 근접 쌍(IP2)의 제2 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제2 폴리펩티드. 또 다른 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD, (ii) 유도된 근접 쌍(IP1)의 제1 구성원, 및 (iii) 유도된 분해 도메인(SMASh)을 포함하는 제1 폴리펩티드; 및 (b) (i) ED, (ii) 유도 근접 쌍(IP2)의 제2 구성원, 및 (iii) 유도 분해 도메인(SMASh)을 포함하는 제2 폴리펩티드. SMASh는 인듀서 작용제의 존재 하에, 예를 들어, 가요성 링커 펩티드의 사용을 통해 IPD1 및 IPD2의 결합을 방해하지 않도록 연결된다. 제1 및 제2 IPD/SMASh synTF 시스템의 비제한적인 예는 표 19에 제시되어 있다.
표 19: 제1 및 제2 IPD/SMASh synTF 시스템의 예시적인 쌍(각각의 폴리펩티드는 N-말단에서 C-말단으로 나타나 있음).
일부 실시형태에서, 각 도메인의 서열은 본 명세서에 기술된 예시적인 도메인 서열로부터 선택된다. 일부 실시형태에서, IPD/SMASh synTF 시스템의 ED는 전사 액티베이터이다. 일부 실시형태에서, IPD/SMASh synTF 시스템의 ED는 전사 리프레서이다. 유도된 근접 쌍의 인듀서가 존재하는 경우, IP1 및 IP2는 인듀서에 결합하여 IPD/SMASh 시스템의 두 폴리펩티드를 모두 포함하는 단백질 복합체의 형성이 초래되고, 인듀서가 부재하는 경우, IPD/SMASh 시스템의 폴리펩티드는 복합체를 형성하지 않는다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 존재하는 경우, IPD/SMASh synTF 시스템이 분해된다. 유도된 분해 쌍의 인듀서(예를 들어, 프로테아제 저해제)가 부재하는 경우, SMASh 태그가 분해되고 IPD/SMASh synTF 시스템은 분해되지 않는다.
C. 유도 근접 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 한 쌍의 유도 근접 도메인이다. 유도된 근접 쌍의 두 구성원 각각은 DBD 또는 ED에 직접적으로 연결된다. 따라서, 한 양태에서, 다음을 포함하는 synTF 시스템이 본 명세서에 기술된다: (a) (i) DBD 및 (ii) 유도된 근접 쌍(IP1)의 제1 구성원을 포함하는 제1 폴리펩티드; 및 (b) (i) ED 및 (ii) 유도된 근접 쌍(IP2)의 제2 구성원을 포함하는 제2 폴리펩티드. 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-IP1 및 ED-IP2; DBD-IP1 및 IP2-ED; IP1-DBD 및 ED-IP2; 또는 IP1-DBD 및 IP2-ED. 즉, DBD는 유도된 근접 쌍(즉, IP1)의 한 구성원에 부착되고, ED는 유도된 근접 쌍(즉, IP2)의 다른 구성원 또는 동족 구성원에 부착되어, 유도된 근접 쌍의 인듀서가 존재하는 경우, IP1과 IP2가 인듀서에 결합하여 DBD-IP1:IP2-ED를 포함하는 단백질 복합체의 형성이 초래되고, 인듀서가 부재하는 경우, DBD-IP1과 ED-IP2는 복합체를 형성하지 않는다.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 2개의 폴리펩티드는 자가-절단 펩티드(SCP)에 의해 연결되어, synTF 시스템은 하나의 벡터에 의해 발현되고 2개의 폴리펩티드는 각각의 이어진 번역으로부터 절단된다. 따라서, 유도된 근접 synTF 시스템은 N-말단에서 C-말단으로 다음을 포함할 수 있다: DBD-IP1-SCP-ED-IP2; DBD-IP1-SCP-IP2-ED; IP1-DBD-SCP-ED-IP2; 또는 IP1-DBD-SCP-IP2-ED.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 DBD는 ZF1-3을 포함한다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF의 DBD는 서열식별번호: 1 또는 동일한 기능을 유지하는 서열식별번호: 1에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 에 대해 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, 유도된 근접 synTF가 본 명세서에 기술되고, 여기서: (a) 제1 폴리펩티드는 N-말단에서 C-말단으로, (i) 유도된 근접성 쌍의 제1 구성원 및 (ii) DBD를 포함하고; 및 (b) 제2 폴리펩티드는 N-말단에서 C-말단으로, (i) 전사 액티베이터 도메인 및 (ii) 유도된 근접 쌍의 제2 구성원을 포함한다. 임의의 양태의 일부 실시형태에서, 제1 및 제2 유도된 근접 synTF는 자가-절단 펩티드에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 4 또는 40, 또는 동일한 기능을 유지하는 서열식별번호: 4 또는 40 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 유도된 근접성 synTF는 서열식별번호: 16 또는 28, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 16 또는 28 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 16 또는 28의 코돈-최적화된 버전에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, 유도된 근접 synTF가 본 명세서에 기술되고, 여기서: (a) 제1 폴리펩티드는 N-말단에서 C-말단으로, (i) 유도된 근접성 쌍의 제1 구성원 및 (ii) DBD를 포함하고; (b) 제2 폴리펩티드는 N-말단에서 C-말단으로, (i) 전사 리프레서 도메인 및 (ii) 유도된 근접 쌍의 제2 구성원을 포함한다. 임의의 양태의 일부 실시형태에서, 제1 및 제2 유도된 근접 synTF는 자가-절단 펩티드에 의해 연결된다. 임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 5 또는 41 또는 동일한 기능을 유지하는 서열식별번호: 5 또는 41 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 유도된 근접 synTF는 서열식별번호: 17 또는 29, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 17 또는 29 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 17 또는 29의 코돈-최적화된 버전에 의해 코딩된다.
D. 세포질 격리 도메인 SynTF
임의의 양태의 일부 실시형태에서, 조절인자 단백질은 세포질 격리 단백질이다. 따라서, 한 양태에서, 다음을 포함하는 synTF가 본 명세서에 기술된다: (a) DBD; (b) ED; 및 (c) 세포질 격리 단백질(CS). 임의의 양태의 일부 실시형태에서, synTF의 도메인은 순서대로, 예를 들어, N-말단에서 C-말단으로 다음과 같을 수 있다: DBD-ED-CS; DBD-CS-ED; ED-DBD-CS; ED-CS-DBD; CS-DBD-ED; 또는 CS-ED-DBD.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF의 DBD는 ZF3-5를 포함한다. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF의 DBD는 서열식별번호: 2 또는 동일한 기능을 유지하는 서열식별번호: 2에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 액티베이터를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 세포질 격리 synTF가 본 명세서에 기술된다: (a) DBD, (b) 전사 액티베이터 도메인, 및 (c) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 6 또는 42 또는 동일한 기능을 유지하는 서열식별번호: 6 또는 42 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 이상 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 18 또는 30, 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 18 또는 30 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 핵산 서열, 또는 서열식별번호: 18 또는 30의 코돈-최적화된 버전을 포함하는 벡터 또는 폴리뉴클레오티드에 의해 코딩된다.
임의의 양태의 일부 실시형태에서, 이펙터 도메인(ED)은 전사 리프레서를 포함한다. 한 양태에서, N-말단에서 C-말단으로 다음을 포함하는 세포질 격리 synTF가 본 명세서에 기술된다: (a) 전사 리프레서 도메인, (b) DBD, 및 (c) 세포질 격리 도메인. 임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 7, 43, 또는 378, 또는 동일한 기능을 유지하는 서열식별번호: 7, 43, 또는 378 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 세포질 격리 synTF는 서열식별번호: 19 또는 31 또는 코딩된 폴리펩티드의 동일한 기능을 유지하는 서열식별번호: 19 또는 31 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 아미노산 서열을 포함하는 벡터 또는 폴리뉴클레오티드, 또는 서열식별번호: 19 또는 31의 코돈-최적화된 버전에 의해 코딩된다.
III.
폴리뉴클레오티드 및 벡터
복수의 양태에서, synTF를 코딩하는 폴리뉴클레오티드가 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, synTF 폴리뉴클레오티드는 서열식별번호: 28-39(예를 들어, 표 2 참조) 중 하나, 또는 폴리펩티드로서 동일한 기능(예를 들어, 유도성 전사 인자)을 유지하는 서열식별번호: 28-39 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
일부 실시형태에서, synTF 폴리뉴클레오티드는 서열식별번호: 28-39의 코돈 최적화된 버전이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 또는 핵산은 코돈-최적화되며, 예를 들어, 핵산 서열의 천연 또는 야생형 서열은 다른 코돈을 포함하도록 변경되거나 조작되어, 변형되거나 조작된 핵산은 천연/야생형 서열과 동일한 폴리펩티드 발현 생성물을 코딩하지만, 원하는 발현 시스템에서 개선된 효율로 전사 및/또는 번역될 것이다. 임의의 양태의 일부 실시형태에서, 발현 시스템은 천연/야생형 서열의 공급원(또는 이러한 유기체로부터 수득된 세포) 이외의 유기체이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 포유동물 또는 포유류 세포, 예를 들어, 마우스, 뮤린 세포, 또는 인간 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 인간 세포에서의 발현을 위해 코돈 최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 효모 또는 효모 세포에서의 발현을 위해 코돈 최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 박테리아 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 E. 콜라이(E. coli) 세포에서의 발현을 위해 코돈-최적화된다.
일부 실시형태에서, 본 명세서에 기술된 유전자(예를 들어, synTF, 관심 유전자) 중 하나 이상은 재조합 발현 벡터 또는 플라스미드에서 발현된다. 본 명세서에 사용되는 용어 "벡터"는 도입유전자(transgene)를 숙주 세포 내로 전달하기에 적합한 폴리뉴클레오티드 서열을 지칭한다. 용어 "벡터"는 플라스미드, 미니염색체, 파지, 네이키드 DNA 등을 포함한다. 예를 들어, 미국 특허 제4,980,285호; 제5,631,150호; 제5,707,828호; 제5,759,828호; 제5,888,783호 및 제5,919,670호, 및 Sambrook et al, Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Press(1989)을 참조한다. 벡터의 한 유형은 추가 DNA 세그먼트가 결찰되는 원형 이중-가닥 DNA 루프를 지칭하는 "플라스미드"이다. 벡터의 또 다른 유형은 바이러스 벡터이며, 여기서 추가 DNA 세그먼트는 바이러스 게놈에 결찰된다. 특정 벡터(예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유동물 벡터)는 이들이 도입된 숙주 세포에서 자율 복제할 수 있다. 또한, 특정 벡터는 작동가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 일반적으로 재조합 DNA 기술에서 유용한 발현 벡터는 종종 플라스미드 형태이다. 본 명세서에서 "플라스미드"와 "벡터"는 플라스미드가 가장 일반적으로 사용되는 벡터 형태이므로 혼용하여 사용한다. 그러나, 본 발명은 동등한 기능을 발휘하는 바이러스 벡터(예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스)와 같은, 다른 형태의 발현 벡터를 포함하도록 의도된다.
클로닝 벡터는 자율적으로 복제할 수 있거나 숙주 세포의 게놈에 통합될 수 있고, 벡터가 결정가능한 방식으로 절단될 수 있으며 새로운 재조합 벡터가 숙주 세포에서 복제하는 활성을 보유하도록 원하는 DNA 서열이 결찰될 수 있는, 하나 이상의 엔도뉴클레아제 제한 부위를 추가로 특징으로 하는 것이다. 플라스미드의 경우, 플라스미드가 숙주 박테리아와 같은 숙주 세포 내에서 카피 수에서 증가함에 따라 원하는 서열의 복제가 여러 번 또는 숙주가 유사분열에 의해 번식하기 전에 숙주당 단 한번 발생할 수 있다. 파지의 경우, 복제는 용해기(lytic phase)에서 능동적으로 또는 용원기(lysogenic phase)에서 수동적으로 일어날 수 있다.
발현 벡터는 원하는 DNA 서열이 본 명세서에 기술된 바와 같은 DNA-결합 도메인을 포함하는 조절 서열에 작동가능하게 연결되도록 제한 및 결찰에 의해 삽입될 수 있고 RNA 전사체로서 발현될 수 있는 것이다. 벡터는 벡터로 형질전환 또는 형질전환 또는 형질감염되었거나 또는 그렇지 않은 세포의 식별에 사용하기에 적합한 하나 이상의 마커 서열을 추가로 함유할 수 있다. 마커는, 예를 들어, 항생제 또는 기타 화합물에 대한 내성 또는 감수성을 증가 또는 감소시키는 단백질을 코딩하는 유전자, 당업계에 공지된 표준 검정에 의해 활성이 검출가능한 효소를 코딩하는 유전자(예를 들어, β-갈락토시다제, 루시퍼라제 또는 알칼리성 포스파타제), 및 형질전환 또는 형질감염된 세포, 숙주, 콜로니 또는 플라크의 표현형에 가시적으로 영향을 미치는 유전자(예를 들어, 녹색 형광 단백질)를 포함한다. 특정 실시형태에서, 본 명세서에 사용된 벡터는 이들이 작동가능하게 연결된 DNA 절편에 존재하는 구조적 유전자 생성물의 자율적 복제 및 발현을 가능케 할 수 있다.
본 명세서에 사용된 바와 같이, 코딩 서열 및 조절 서열은, 코딩 서열의 발현 또는 전사가 조절 서열의 영향 또는 제어 하에 놓이도록 하는 방식으로 공유적으로 연결될 때 "작동가능하게" 연결된 것으로 언급된다. 코딩 서열이 기능적 단백질로 번역되는 것이 바람직한 경우, 5' 조절 서열 중의 프로모터의 유도가 코딩 서열의 전사를 초래하면, 그리고 두 DNA 서열 사이의 연결 특성이 (1) 프레임-이동 돌연변이의 도입을 초래하지 않거나, (2) 코딩 서열의 전사를 유도하는 프로모터 영역의 활성을 방해하지 않거나, 또는 (3) 단백질로 번역될 해당 RNA 전사체의 활성을 방해하지 않으면, 두 DNA 서열은 작동가능하게 연결된 것으로 언급된다. 따라서, 프로모터 영역이 생성된 전사체가 원하는 단백질 또는 폴리펩티드로 번역될 수 있도록 해당 DNA 서열의 전사를 수행할 수 있었다면, 프로모터 영역이 코딩 서열에 작동가능하게 연결된 것일 수 있다.
본 명세서에 기술된 임의의 폴리펩티드를 코딩하는 핵산 분자가 세포에서 발현될 때, 다양한 전사 제어 서열(예를 들어, 프로모터/인핸서 서열)이 발현을 유도하는 데 사용될 수 있다. 프로모터는 천연 프로모터, 즉 유전자 발현의 정상적인 조절을 제공하는, 내인성 맥락에서 유전자의 프로모터일 수 있다. 일부 실시형태에서, 프로모터는 구성적일 수 있으며, 즉 프로모터는 상향조절되며 이는 연관된 유전자의 지속적인 전사를 가능케한다. 분자의 존재 또는 부재에 의해 조절되는 프로모터와 같은, 다양한 조건부 프로모터가 또한 사용될 수 있다.
유전자 발현에 필요한 조절 서열의 정확한 특성은 종 또는 세포 유형에 따라 다를 수 있지만, 일반적으로 필요에 따라, TATA 박스, 캡핑 서열, CAAT 서열 등과 같은, 전사 및 번역 각각의 개시에 관여하는 5' 비-전사 및 5'-비-번역 서열을 포함할 수 있다. 특히, 이러한 5' 비-전사 조절 서열은 작동가능하게 연결된 유전자의 전사 조절을 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다. 조절 서열은 또한 원하는 대로 인핸서 서열 또는 상류 액티베이터 서열을 포함할 수 있다. 본 발명의 벡터는 선택적으로 5' 리더 또는 신호 서열을 포함할 수 있다. 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량에 속한다.
임의의 양태의 일부 실시형태에서, 프로모터는, 이로만 제한되는 것은 아니지만, 다음을 포함하는 진핵생물 또는 인간 구성적 프로모터이다: 인간 신장 인자-1 알파(EF-1알파, EF1a) 프로모터; 침묵-취약 비장 초점 형성 바이러스(SFFV); 거대세포바이러스(CMV) 프로모터; 유비퀴틴 C(UbiC, pUb, UbC) 프로모터; 포스포글리세레이트 키나제 1(PGK, pGK) 프로모터; 닭 베타-액틴 프로모터(CAG/CAGG)에 융합된 거대세포바이러스(CMV) 인핸서; 시미안 바이러스 40(SV40) 인핸서 및 초기 프로모터; 베타 액틴(ACTB) 프로모터 등. 임의의 양태의 일부 실시형태에서, 프로모터는 최소 프로모터 또는 코어 프로모터이다. 최소 또는 코어 프로모터는 정의상 전사 시작 부위에 대해 -35에서 +35 영역 사이에 위치한 서열이며; 최소 프로모터는 일반적으로 전체 프로모터보다 짧고, 인핸서 또는 사일런서와 같은 추가 요소를 포함하지 않는다. 최소 프로모터의 비제한적 예는 minCMV; CMV53(상류 GC 박스가 추가된 minCMV); minSV40(최소 시미안 바이러스 40 프로모터); miniTK(단순 헤르페스 티미딘 키나제 프로모터의 -33 내지 +32 영역); MLP(아데노바이러스 주요 후기 프로모터의 -38 내지 +6 영역); pJB42CAT5(인간 junB 유전자에서 유래된 최소 프로모터); ybTATA(합성 최소 프로모터), 및 TATA 박스 단독. 예를 들어, Ede et al., ACS Synth Biol. 2016 May 20, 5(5): 395-404; Qin et al., PLoS One. 2010, 5(5): e10611; Norman et al., PLoS One. 2010 Aug 26,5(8):e12413을 참조하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 16-27, 58-60, 64)는 SFFV 프로모터(예를 들어, 서열식별번호: 363)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 55-57)는 완전한 CMV 프로모터(예를 들어, 서열식별번호: 364)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 52-54, 62)는 minCMV 프로모터(예를 들어, 서열식별번호: 365)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터(예를 들어, 서열식별번호: 61, 63, 64)는 minTK 프로모터(예를 들어, 서열식별번호: 366)를 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 진핵생물 mRNA 전사체에서 단백질 번역 개시 부위로서 기능하는 핵산 모티프인 Kozak 서열(예를 들어, GCCGCCACC)을 포함한다.
발현에 필요한 모든 요소를 함유하는 발현 벡터는 상업적으로 입수가능하고 당업자에게 공지되어 있다. 예를 들어, 다음 문헌 참조: Sambrook et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, 1989. 세포는 이종성(heterologous) DNA(RNA)의 세포 내로의 도입에 의해 유전적으로 조작된다. 해당 이종성 DNA(RNA)는 전사 요소의 작동가능한 제어 하에 배치되어 숙주 세포에서 이종성 DNA의 발현을 허용한다.
임의의 양태의 일부 실시형태에서, synTF 벡터는 서열식별번호: 16-27 또는 서열식별번호: 52-64 중 하나(예를 들어, 표 1 또는 2 참조) 또는 서열식별번호: 16-27 또는 서열식별번호: 52-64 중 하나와 동일한 기능(예를 들어, 렌티바이러스 벡터, synTF 폴리펩티드 발현)을 유지하는, 서열식별번호: 236-261 중 하나의 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다.
일부 실시형태에서, 벡터는 pHR 벡터이다. 일부 실시형태에서, 벡터는 렌티바이러스 벡터이다. "렌티바이러스"라는 용어는 레트로비리대(Retroviridae) 패밀리의 속을 지칭한다. 렌티바이러스는 비분열 세포를 감염시킬 수 있다는 점에서 레트로바이러스 중에서 독특하며; 이들은 숙주 세포의 DNA에 상당한 양의 유전 정보를 전달할 수 있으므로, 유전자 전달 벡터의 가장 효율적인 방법 중 하나이다. HIV, SIV, 및 FIV는 모두 렌티바이러스의 예이다. 용어 "렌티바이러스 벡터"는, 특히 문헌[Milone et al., Mol. Ther. 17(8): 1453-1464 (2009)]에서 제공한 것과 같은 자가-불활성화 렌티바이러스 벡터를 포함하는, 렌티바이러스 게놈의 적어도 일부로부터 유래된 벡터를 의미한다. 클리닉에서 사용될 수 있는 렌티바이러스 벡터의 다른 예는, 예를 들어, Oxford BioMedica의 LENTIVECTOR® 유전자 전달 기술, Lentigen의 LENTIMAX™ 벡터 시스템 등을 포함하지만 이로만 제한되는 것은 아니다. 비임상 유형의 렌티바이러스 벡터가 또한 이용가능하고 당업자에게 공지되어 있을 것이다.
임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 중심 폴리퓨린 트랙(cPPT; 예를 들어, 서열식별번호: 367)을 포함한다. 중심 폴리퓨린 트랙/중심 종결 서열은 표적-세포 감염 동안 바이러스 게놈의 핵 내수송(importation)을 증가시키는 "DNA 플랩"을 생성한다. cPPT/CTS 요소는 벡터 통합 및 형질도입 효율을 향상시킨다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 우드척 간염 바이러스 전사후 조절 요소(WPRE; 예를 들어, 서열식별번호: 368)를 포함하는데, 이는 폴리(A) 부위 판독-진행(read-through)을 방지하고, RNA 프로세싱 및 성숙을 촉진하고, RNA의 핵 외수송(export)을 증가시킨다. 게놈 전사체에서, 이것은 벡터 패키징을 강화하고 역가를 증가시킨다. 형질도입된 표적 세포에서, WPRE는 mRNA 전사체 성숙을 촉진하여 도입유전자 발현을 부스팅한다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는 긴 말단 반복부(LTR; 예를 들어, 서열식별번호: 369 및 370)를 포함한다. LTR은 레트로바이러스 RNA의 역전사에 의해 형성된 레트로트랜스포존 또는 프로바이러스 DNA의 어느 한 말단에서 발견되는 수백번 또는 수천번 반복되는 동일한 DNA 서열이고; 이들은 바이러스에 의해 숙주 게놈에 유전 물질을 삽입하는 데 사용된다. 임의의 양태의 일부 실시형태에서, 렌티바이러스 벡터는, 고역가 벡터를 생성하는 데 필요한, Rev 반응 요소(RRE; 예를 들어, 서열식별번호: 371)를 포함한다.
제한 없이, 본 명세서에 기술된 유전자는 하나의 벡터 또는 별도의 벡터에 포함될 수 있다. 예를 들어, synTF를 코딩하는 폴리뉴클레오티드와 관심 유전자를 코딩하는 폴리뉴클레오티드가 동일한 벡터에 포함될 수 있다. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 폴리뉴클레오티드 및 관심 유전자를 코딩하는 폴리뉴클레오티드가 상이한 벡터에 포함될 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 synTF를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 관심 유전자를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 단일 벡터는 synTF를 코딩하는 적어도 하나의 폴리뉴클레오티드 및 관심 유전자를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함할 수 있다.
한 양태에서, synTF 렌티바이러스 발현 벡터(예를 들어, 서열식별번호: 16-27)가 본 명세서에 기술된다. 일부 실시형태에서, synTF 렌티바이러스 발현 벡터는 프로모터(예를 들어, SFFV)에 작동가능하게 연결된 synTF를 코딩하는 폴리뉴클레오티드를 포함한다. 또 다른 양태에서, 렌티바이러스 리포터 벡터(예를 들어, 서열식별번호: 52-60)가 본 명세서에 기술된다. 일부 실시형태에서, 렌티바이러스 리포터 벡터는 다음을 포함한다: (i) synTF의 DBD에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개, 또는 그 이상)의 DNA-결합 모티프(DBM); (ii) 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열; 및 (iii) 프로모터 서열에 작동가능하게 연결된 검출가능한 마커(즉, 리포터, 예를 들어, mCherry). 일부 실시형태에서, 렌티바이러스 리포터 벡터는 전사 활성화 도메인을 포함하는 synTF에 대한 활성화 리포터(예를 들어, 서열식별번호: 52-54)이며, 그래서 유도성 synTF가 켜짐인 경우, synTF의 DBD가 리포터의 DBM에 결합하고, 전사 액티베이터 도메인은 검출가능한 마커의 전사를 활성화시키고; 유도성 synTF의 DBD가 꺼짐이고 리포터의 DBM에 결합되지 않은 경우, 코어 또는 최소 프로모터(예를 들어, minCMV)에만 작동가능하게 연결되어 있으므로 검출가능한 마커가 생성되지 않는다. 일부 실시형태에서, 렌티바이러스 리포터 벡터는 전사 리프레서 도메인을 포함하는 유도성 synTF에 대한 억제 리포터(예를 들어, 서열식별번호: 55-60)이며, 그래서 synTF가 켜짐인 경우, synTF의 DBD가 리포터의 DBM에 결합하고, 전사 리프레서 도메인은 검출가능한 마커의 전사를 억제하고; synTF가 꺼짐인 경우, synTF의 DBD는 리포터의 DBM에 결합되지 않고, 전체 구성적 프로모터(예를 들어, 전체 CMV 또는 SFFV)에 작동가능하게 연결되어 있어 검출가능한 마커가 생성된다.
한 양태에서, 관심 유전자(GOI) 렌티바이러스 발현 벡터(예를 들어, 61-64)가 본 명세서에 기술된다. 일부 실시형태에서, GOI 벡터는 synTF의 DBD 및 최소 프로모터에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개, 또는 그 이상)의 DNA-결합 모티프(DBM)에 작동가능하게 연결된 관심 유전자를 포함한다. 일부 실시형태에서, GOI 벡터는 본 명세서에 기술된 바와 같은 리포터 벡터를 포함하며, 여기서 검출가능한 마커는 관심 유전자로 대체되거나 융합되고; 그래서 synTF는 조절인자 단백질 인듀서의 존재 또는 부재 하에 관심 유전자의 발현을 유도하거나, 또는 관심 유전자의 발현을 억제할 수 있다.
일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 다음의 것으로 이루어진 군에서 선택된다: 케모카인, 케모카인 수용체, 키메라 항원 수용체, 사이토카인, 사이토카인 수용체, 분화 인자, 성장 인자, 성장인자수용체, 호르몬, 대사효소, 병원체 유래 단백질, 증식 인듀서, 수용체, RNA 가이드된 뉴클레아제, 부위-특이적 뉴클레아제, 소분자 2차 메신저 합성 효소, T 세포 수용체, 독소 유래 단백질, 전사 액티베이터, 전사 리프레서, 전사적 액티베이터, 전사적 리프레서, 번역 조절인자, 번역 액티베이터, 번역 리프레서, 활성화 면역수용체, 항체, 세포자멸사 억제인자, 세포자멸사 인듀서, 조작된 T 세포 수용체, 이뮨액티베이터, 면역억제인자, 억제 면역수용체, 및 RNA 가이드된 DNA 결합 단백질. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 치료가 필요한 대상체, 예를 들어, 암이 있거나, 자가면역이 있거나, 또는 재생 의학이 필요한 대상체에게 유익할 것이다.
일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는, 예를 들어, mCherry(예를 들어, 서열식별번호: 372)와 같은 검출가능한 마커에 연결된, CD19 CAR(예를 들어, 서열식별번호: 61, 373)이다. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 자가-절단 펩티드를 사용하여 검출가능한 마커, 예를 들어, (huEGFRt)에 연결될 수 있는 IL2(예를 들어, 서열식별번호: 62, 374)이다. 일부 실시형태에서, 관심 유전자에 의해 코딩되는 폴리펩티드는 IL10(예를 들어, 서열식별번호: 63-64, 375)이다.
한 양태에서, 구성적 프로모터에 작동가능하게 연결된 synTF 및 synTF의 DBD에 대한 적어도 하나(예를 들어, 1, 2, 3, 4개 또는 그 이상)의 DNA-결합 모티프(DBM) 및 최소 프로모터(예를 들어, 서열식별번호: 64)에 작동가능하게 연결된 관심 유전자 둘 다를 포함하는 렌티바이러스 벡터가 본 명세서에 기술된다. 따라서, 5'에서 3' 방향으로 다음을 포함하는 핵산이 본 명세서에 기술된다: (a) 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열; (b) 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열; (c) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 synTF의 DBD의 결합은 이펙터 도메인(ED)을 GOI에 작동가능하게 연결된 프로모터 서열에 근접하여 위치시키는, 핵산 서열; (d) 제2 프로모터 서열; 및 (e) 제2 프로모터 서열에 작동가능하게 연결된 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 코딩된 synTF는 (c)의 핵산 서열의 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열.
임의의 양태의 일부 실시형태에서, GOI에 작동가능하게 연결된 프로모터 서열은 다음 중 임의의 것에서 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 핵산에 작동가능하게 연결된 프로모터 서열은 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터이다.
일부 실시형태에서, synTF를 코딩하는 폴리뉴클레오티드는 유도성 프로모터에 작동가능하게 연결되며, 이는 프로모터 액티베이터의 존재 또는 프로모터 리프레서의 부재 하에 활성이고, 프로모터 인듀서의 부재 또는 프로모터 리프레서의 존재 하에 불활성이다. 유도성 프로모터의 비제한적인 예는 다음을 포함한다: 독시사이클린-유도성 프로모터, lac 프로모터, lacUV5 프로모터, tac 프로모터, trc 프로모터, T5 프로모터, T7 프로모터, T7-lac 프로모터, araBAD 프로모터, rha 프로모터, tet 프로모터, 이소프로필 β-D-1-티오갈락토피라노사이드(IPTG) 의존성 프로모터, AlcA 프로모터, LexA 프로모터, 온도 유도성 프로모터(예를 들어, Hsp70 또는 Hsp90-유래 프로모터), 또는 광 유도성 프로모터(예를 들어, pDawn/YFI/FixK2 프로모터/CI/pR 프로모터 시스템).
일부 실시형태에서, 벡터는, 예를 들어, 박테리아에서 벡터를 선택적으로 증폭하기 위한 선택가능한 마커를 포함한다. 박테리아에 사용하기 위한 선택가능한 마커 유전자의 비제한적인 예는 암피실린, 테트라사이클린 및 카나마이신에 대한 내성을 부여하는 항생제 내성 유전자를 포함한다. 테트라사이클린(tet) 및 암피실린(amp) 내성 마커 유전자는 pBR322(Beverly, Mass.소재, New England BioLabs로부터, cat. no. 303-3s로 입수가능함)를 포함하는 상업적으로 이용가능한 다수의 벡터 중 임의의 것으로부터 얻을 수 있다. tet 코딩 서열은 뉴클레오티드 86-476에 포함되어 있고; amp 유전자는 뉴클레오티드 3295-4155에 포함되어 있다. 카나마이신(kan) 유전자의 뉴클레오티드 서열은 벡터 pACYC 177(New England BioLabs, Cat no. 401-L, GenBank 수탁 번호 X06402)로 이용가능한다.
일부 실시형태에서, 재조합적으로 발현된 유전자 중 하나 이상이 세포의 게놈으로 통합될 수 있다.
청구된 발명의 효소를 코딩하는 핵산 분자는 당업계에서 표준인 방법 및 기술을 사용하여 세포 또는 세포들 내로 도입될 수 있다. 예를 들어, 핵산 분자는 화학적 형질전환 및 전기천공, 형질도입, 입자 충격 등을 포함하는 형질전환과 같은 표준 프로토콜에 의해 도입될 수 있다. 청구된 발명의 효소를 코딩하는 핵산 분자의 발현은 또한 핵산 분자를 게놈에 통합함으로써 달성될 수 있다.
IV.
synTF 시스템
본 기술의 또 다른 양태는 관심 유전자(GOI)의 유전자 발현을 제어하기 위한 synTF 시스템에 관한 것으로, 여기서 시스템은 본 명세서에 기술된 synTF 및 유전자 발현을 조절하기 위해 synTF가 결합하는 요소를 포함하는 핵산 구축물을 포함한다. 한 양태에서, 다음을 포함하는, 유전자 발현을 제어하는 시스템이 본 명세서에 기술된다: (a) 본 명세서에 기술된 바와 같은 적어도 하나의 합성 전사 인자(synTF); 및 (b) 본 명세서에 기술된 바와 같은 적어도 하나의 핵산 구축물로서, 예를 들어, 하기를 포함하는 핵산 구축물: (i) syn의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM); (ii) 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자.
예시적인 시스템이 도 1b, 2, 5c, 10b, 11a, 12a, 13a, 14a 및 15a-15b에 도시되어 있으며, 이들은 synTF 및 관심 유전자(예를 들어, mCherry, CD19 CAR, IL4, IL10)를 포함하는 핵산 서열 구축물을 제시한다. synTF가 프로테아제 synTF 또는 유도 근접 도메인 synTF인 synTF 실시형태에서(즉, DBD에 대한 ED의 커플링이 적어도 하나의 프로테아제 RP 또는 적어도 하나의 유도된 근접 쌍에 의해 조절되는 경우), RP 인듀서의 존재 하에, synTF의 DBD에 대한 ED의 커플링이 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접할 수 있고 관심 유전자의 유전자 발현의 개시 또는 억제를 촉진할 수 있다("ED-켜짐"). 대안적으로, RP 인듀서의 부재 하에, synTF의 DBD에 대한 ED의 커플링이 끊어져, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접하는 것을 방지하고, ED가 관심 유전자의 발현을 조절하는 것을 방지한다("ED-꺼짐"). 이펙터 도메인이 전사 액티베이터(TA)인지 또는 전사 리프레서(TR)인지에 따라, ED-켜짐 및 ED-꺼짐은 다른 효과를 나타낸다 - 즉, ED가 TA이면, synTF가 "ED-켜짐" 배열로 존재시, 유전자 발현이 발생할 수 있는 반면, ED가 전사 리프레서(TR)이면, ED-켜짐 배열은 유전자 발현의 억제를 초래할 것이다(예를 들어, 발현 없음). 반대로, ED가 TA이면, synTF가 "ED-꺼짐" 배열로 존재시, 유전자 발현이 꺼짐인 반면, ED가 전사 리프레서(TR)이면 "ED-꺼짐" 배열은 유전자 발현의 억제를 해제하여, 유전자 발현이 켜짐이 된다. 상이한 synTF 및 이펙터 도메인에 따른 최종 유전자 발현에 대한 각 조절자 프로모터 인듀서의 효과에 대한 요약은 본 명세서의 표 20에 요약되어 있다.
유사하게, 단지 일예로서, synTF가 세포질 격리 도메인 synTF인 synTF 실시형태에서(즉, ED-DBD 융합 단백질의 세포 국재화가 적어도 하나의 세포질 격리 조절인자 단백질에 의해 조절되는 경우), RP 인듀서의 존재 하에, ED-DBD는 세포질에서 격리되지 않아, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있게 하고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접하여 위치하게 하여 관심 유전자의 발현을 제어할 수 있다("ED-켜짐").
따라서, 인듀서의 존재 하에, ED가 TA이면 ED-켜짐 배열은 유전자 발현이 일어날 수 있게 하며("TA-켜짐"이라고 함) 반면, ED가 TR이면 ED-켜짐 배열은 유전자 발현의 억제를 초래할 것이다(예를 들어, "TR-켜짐"으로 지칭되고 유전자 발현은 없음). 대안적으로, RP 인듀서의 부재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 근접하는 것을 방지하고, 관심 유전자의 발현을 방지한다("ED-꺼짐"). 따라서, 인듀서의 부재 하에, ED가 전사 액티베이터(TA)인 실시형태에서, 이는 유전자 발현을 끄는 결과를 초래하는("TA-꺼짐"(발현 없음)) 반면, ED가 전사 리프레서 단백질(TR)인 실시형태에서, 이는 유전자 발현을 켠다("TR-꺼짐"), 그리하여 억제가 꺼지고, 그리하여 유전자 발현이 일어날 수 있음).
본 명세서에 기술된 임의의 양태의 일부 실시형태에서, synTF는 유도된 분해 도메인 synTF이거나, 또는 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함한다. 본 명세서에 기술된 바와 같이, SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분적 프로테아제 나선 도메인 및 보조인자 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, SMASh 프로테아제에 대한 저해제("SMASh 억제제"로 지칭됨)의 존재 하에, SMASh 프로테아제 활성이 억제되어 synTF가 분해되는 결과가 초래되고, 이는 DBD가 DBM에 결합하는 것과 관심 유전자의 발현 또는 억제를 제어하는 것을 방지한다("synTF-분해"; ED-꺼짐). 임의의 양태의 일부 실시형태에서, SMASh 프로테아제에 대한 저해제의 부재 하에, SMASh 프로테아제는 활성이고 synTF로부터 자가-절단/커플링해제되어, SMASh 도메인이 분해를 위해 표적화되고 synTF의 DBD가 DBM 및 synTF의 ED에 결합하여 관심 유전자의 발현이 제어되도록 허용한다("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)).
표 20A: 관심 유전자의 궁극적인 발현에 대한 조절인자 단백질 인듀서의 존재 또는 부재의 영향을 요약한 표.
따라서, GOI의 발현은 다음을 포함하지만 이로만 제한한되지 않는 3가지 수준의 제어에 의존한다: (i) synTF에서 조절인자 단백질의 유형, (ii) 조절인자 단백질 인듀서(RP 인듀서)의 존재 또는 부재, 및 (iii) 이펙터 도메인의 유형. 일부 실시형태에서, synTF가 유도된 분해 도메인 또는 SMASh 도메인을 포함하는 경우, 이는 또한 GOI의 발현에 대한 추가 수준의 제어를 제공할 수 있다. SMASh 도메인을 포함하는 synTF의 GOI의 궁극적인 발현은 표 20B에 제시되어 있다.
표 20B
표 20B에 나타낸 바와 같이, SMASh 억제자가 존재하는 경우, 조절인자 단백질 인듀서(예를 들어, 프로테아제 저해제, IPD 인듀서 또는 CS-SynTF에 대한 리간드)의 부재 또는 존재 하에서도, synTF는 분해되고 GOI의 발현은 ED가 TA인지 TR인지에 따라 달라진다. 그러나, SMASh 억제자의 부재 하에, GOI의 발현은 표 20B에 나타낸 바와 같이 조절인자 단백질 인듀서의 존재 또는 부재에 의존한다.
따라서, 한 양태에서, 본 명세서에는 (a) 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서, ED는 직접적으로 또는 간접적으로 DBD에 커플링 또는 연결되고, 여기서 커플링은 적어도 하나의 RP에 의해 조절되거나, DBD에 연결된 ED의 세포 국재화는 적어도 하나의 RP에 의해 조절되고, 적어도 하나의 RP는 RP 인듀서에 의해 조절되고, DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF; (b) (i) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및 (ii) 적어도 하나의 DBM의 3' 에 위치한 프로모터 서열, 및 (iii) 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는 핵산 구축물;을 포함하는 유전자 발현을 제어하기 위한 시스템이 기술되며; 여기서 DBD에 대한 ED의 커플링이 적어도 하나의 RP에 의해 조절되는 synTF의 경우; RP 인듀서의 존재 하에, synTF의 DBD에 대한 ED의 커플링은 유지되어, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접할 수 있고, ED는 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는 RP 인듀서의 부재 하에, synTF의 DBD에 대한 ED의 커플링이 끊어져, DBD가 DNA 결합 모티프(DBM)에 결합할 때, ED가 프로모터 서열에 근접하는 것이 방지되어, 관심 유전자 발현을 방지하며("ED-꺼짐"); 여기서 DBD에 연결된 ED의 세포 국재화가 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우; RP 인듀서의 존재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되지 않아, DBD가 DNA 결합 모티프(DBM)에 결합할 수 있고 전사 이펙터 도메인(ED)이 프로모터 서열에 근접할 수 있어 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는 RP 인듀서의 부재 하에, synTF의 DBD에 커플링된 ED는 세포질에서 격리되어, synTF의 DBD가 DBM에 결합하는 것을 방지하고, 이펙터 도메인(ED)이 프로모터 서열에 근접하는 것을 방지하여, 관심 유전자의 발현을 방지한다("ED-꺼짐").
synTF에 의한 조절을 위한 GOI를 코딩하는 핵산 구축물
본 명세서에 기술된 바와 같이, 일부 양태에서, 시스템은 본 명세서에 기술된 바와 같은 synTF 및 GOI를 포함하는 핵산 구축물을 포함한다. 일부 실시형태에서, 핵산 구축물물은 5'에서 3' 방향으로, (i) synTF의 DBD의 결합을 가능하게 하는 DBA 결합 모티프(DBM), (ii) 프로모터 서열, 및 (iii) GOI를 코딩하는 핵산을 포함하며, 여기서 GOI를 코딩하는 핵산은 프로모터 서열에 작동가능하게 연결된다. 예시적인 시스템이 도 5c 및 12a에 도시되어 있다.
일부 실시형태에서, 시스템은 프로모터에 작동가능하게 연결된, synTF를 코딩하는 핵산 서열을 추가로 포함한다; 예를 들어, 프로모터가 구성적 프로모터인 경우, 예시적인 시스템에 대해서는 도 10b, 13a, 14a 및 15a를 참조. 이러한 실시형태에서, 프로모터에 대한 인듀서가 존재하는 경우, synTF가 발현될 수 있고, GOI의 유전자 발현 조절에 대한 synTF의 활성은, 조절인자 단백질 인듀서 및/또는 SMASH 도메인이 연결된 경우에, SMASh 인듀서의 존재 또는 부재에 의존한다.
일부 실시형태에서, 핵산 구축물은 (i) 프로모터 하에 synTF를 코딩하는 제1 핵산 및 (ii) (i) 발현된 synTF의 DBD의 결합을 가능하게 하는 DBA 결합 모티프 (DBM), (ii) 프로모터 서열, 및 (iii) GOI를 코딩하는 핵산을 포함하는 제2 핵산 구축물을 포함하며, 여기서 GOI를 코딩하는 핵산은 프로모터 서열에 작동가능하게 연결되어 있다. 따라서, 유도성 synTF 및 GOI를 코딩하는 핵산은 동일한 핵산 구축물 상에 존재한다; 예를 들어, 이러한 예시적인 시스템에 대해서는 도 15b를 참조.
일부 실시형태에서, 핵산 구축물은 (i) synTF를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터, 및 (ii) 제2 프로모터에 작동가능하게 연결된 GOI를 코딩하는 핵산을 포함하며, 여기서 제2 프로모터에 대한 5'은 제1 프로모터의 제어 하에 발현되는 synTF 단백질에 대한 DBM이다. 일부 실시형태에서, 도 15b에 도시된 바와 같이, 구축물은 5'에서 3' 방향으로 다음을 포함한다: (i) 안티센스 방향으로 GOI를 코딩하는 핵산, (ii) GOI에 작동가능하게 연결된 안티센스 방향의 제1 프로모터, (iii) 안티센스 방향의 DBD, (iv) 센스 방향의 제2 프로모터, 및 (v) 제2 프로모터에 작동가능하게 연결된 센스 방향의 synTF를 코딩하는 핵산. 이러한 시스템은 synTF의 발현을 허용하며, 여기서 발현된 synTF는 synTF에 대한 인듀서의 존재 또는 부재 하에 GOI의 발현을 조절하는 데 사용될 수 있다.
임의의 양태의 일부 실시형태에서, GOI 또는 synTF에 작동가능하게 연결된 프로모터는 다음 중 임의의 것으로부터 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터.
임의의 양태의 일부 실시형태에서, 시스템에 의해 발현되는 적어도 하나의 synTF는 본 명세서에 기술된 임의의 것 중에서 선택된다. 임의의 양태의 일부 실시형태에서, synTF 시스템은, 동일하거나 상이한 GOI를 제어하는, 본 명세서에 기술된 바와 같은 적어도 2개의 synTF 폴리펩티드의 임의의 조합을 포함할 수 있다. 비제한적 예로서, 도 14a-14c는 각각 별개의 조절인자 단백질 및 GOI를 갖는 2개의 synTF를 포함하는 시스템을 나타낸다: CD19 CAR 발현을 제어하는 억제성 프로테아제 synTF 및 IL4 발현을 제어하는 세포질 격리 도메인 synTF. 아래의 표 9는 이러한 synTF 시스템 조합의 비제한적인 예를 제시한다. 임의의 양태의 일부 실시형태에서, 표 9에 나타낸 예는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT와 같은 소분자 약물)와 조합될 수 있다.
표 9: synTF 시스템. "PRO"는 본 명세서에 기술된 바와 같은 억제성 프로테아제 synTF 폴리펩티드 및 시스템을 나타낸다. "ID"는 본 명세서에 기술된 바와 같은 유도된 분해 synTF 폴리펩티드 및 시스템을 나타낸다. "IPD"는 본 명세서에 기술된 바와 같은 유도된 근접 synTF 폴리펩티드 및 시스템을 나타낸다. "CS"는 본 명세서에 기술된 세포질 격리 도메인 synTF 폴리펩티드 및 시스템을 나타낸다.
I.
세포
한 양태에서, 본 명세서에 기술된 바와 같은 적어도 하나의 synTF 폴리펩티드, synTF 시스템, synTF 폴리뉴클레오티드, 또는 synTF 벡터를 포함하는 세포 또는 이의 집단이 본 명세서에 기술된다(예를 들어, 표 1-2 참조). 임의의 양태의 일부 실시형태에서, 세포 또는 이의 집단은 synTF 폴리펩티드 또는 시스템의 임의의 조합을 포함할 수 있다(예를 들어, 표 9 참조).
한 양태에서, 본 발명은 synTF를 발현하도록 조작된 세포(예를 들어, T 세포)를 제공하며, 여기서 synTF 세포의 활성은 소분자에 의해 제어될 수 있다. 한 양태에서, 세포는 synTF로 형질전환되고, synTF는 세포 표면에서 발현된다. 일부 실시형태에서, 세포(예를 들어, T 세포)는 synTF를 코딩하는 바이러스 벡터로 형질도입된다. 일부 실시형태에서, 바이러스 벡터는 레트로바이러스 벡터이다. 일부 실시형태에서, 바이러스 벡터는 렌티바이러스 벡터이다. 이러한 일부 실시형태에서, 세포는 synTF를 안정적으로 발현할 수 있다. 또 다른 실시형태에서, 세포(예를 들어, T 세포)는 synTF를 코딩하는 핵산, 예를 들어, mRNA, cDNA, DNA로 형질감염된다. 일부 이러한 실시형태에서, 세포는 synTF를 일시적으로 발현할 수 있다.
한 양태에서, 다음을 포함하는 세포가 본 명세서에 기술된다: synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열, 적어도 하나의 DBM의 3'에 위치하는 프로모터 서열, 및 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산..
한 양태에서, 다음을 포함하는 세포가 본 명세서에 기술된다: (a) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산을 포함하는 제1 핵산 서열, 및 (b) 유도성 또는 구성적 프로모터에 작동가능하게 연결된, 본 명세서에 기술된 것과 같은 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열.
임의의 양태의 일부 실시형태에서, 세포는 5'에서 3' 방향으로 다음을 포함한다: (a) 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열; (b) 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열; (c) synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 synTF의 DBD의 결합은 이펙터 도메인(ED)을 GOI에 작동가능하게 연결된 프로모터 서열에 근접하여 위치시키는 것인, 핵산 서열; (d) 제2 프로모터 서열; 및 (e) 제2 프로모터 서열에 작동가능하게 연결된, 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 코딩된 synTF는 (c)의 핵산 서열의 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는 것인, 핵산 서열.
임의의 양태의 일부 실시형태에서, GOI에 작동가능하게 연결된 프로모터 서열은 다음 중 임의의 것으로부터 선택된다: miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터. 임의의 양태의 일부 실시형태에서, synTF를 코딩하는 핵산에 작동가능하게 연결된 프로모터 서열은 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터이다.
임의의 양태의 일부 실시형태에서, 세포는 면역 세포를 포함한다. 임의의 양태의 일부 실시형태에서, 면역 세포는 CD4+ T 세포, CD8+ T 세포, 조절 T 세포(Treg), 또는 자연 살해(NK) 세포를 포함한다. 한 실시형태에서, 세포는 T 세포를 포함한다. 한 실시형태에서, 세포는 CD4+ T 세포를 포함한다. 한 실시형태에서, 세포는 CD8+ T 세포를 포함한다. 다른 실시형태에서, 세포는 B 세포를 포함한다.
임의의 양태의 일부 실시형태에서, 세포는 대상체로부터 단리된다. 본 명세서에 사용되는 용어 "단리된(isolated)"은 세포가 이들의 자연 환경 이외의 조건에 놓이는 것을 의미한다. 용어 "단리된"은 이후에 이들 세포를 다른 세포와의 조합물 또는 혼합물로 사용하는 것을 배제하지 않는다. 임의의 양태의 일부 실시형태에서, 면역 세포(예를 들어, T 세포)는, (a) 대상체로부터 단리되고; (b) 본 명세서에 기술된 synTF 시스템을 발현하도록 유전적으로 변형되고; (c) 대상체에게 투여된다. 임의의 양태의 일부 실시형태에서, 세포는 제1 대상체로부터 단리되고 제2 대상체에게 투여된다. 임의의 양태의 일부 실시형태에서, 면역 세포는 먼저 대상체로부터의 체세포 샘플로부터 분화되고 이어서 본 명세서에 기술된 바와 같은 synTF 시스템을 발현하도록 유전적으로 변형된다.
임의의 양태의 일부 실시형태에서, 세포는 세포에서 적어도 하나의 HLA 클래스 I 유전자의 불활성화 변형을 포함한다. 일부 실시형태에서, 내인성(endogenous) HLA(예를 들어, 클래스 I 및/또는 클래스 II 주요 조직적합성 복합체)는, 예를 들어, 면역원성을 감소시키기 위해 편집되거나 제거될 수 있다. 일부 실시형태에서, 유전적 변형은 NK 세포-매개 용해를 방지하기 위한 비표준 HLA-G 및 HLA-E의 도입 및 발현을 포함할 수 있으며(예를 들어, Riolobos L et al. 2013 참조), 이는 면역요법, 예를 들어, 암 면역 요법을 위한 보편적 T 세포의 공급원을 제공할 수 있다.
일부 실시형태에서, synTF 시스템을 발현하도록 세포를 유전적으로 변형시키는 방법은 다음을 포함할 수 있지만 이에 제한되지는 않는다: synTF를 코딩하는 벡터로 세포의 형질감염 또는 전기천공; synTF 시스템을 코딩하는 바이러스 벡터(예를 들어, 레트로바이러스, 렌티바이러스)를 사용한 형질도입; 징크 핑거 뉴클레아제(ZFN), 전사 액티베이터-유사 이펙터 뉴클레아제(TALEN), 메가뉴클레아제-TALEN, 또는 CRISPR-Cas를 사용한 유전자 편집; 또는 synTF 시스템을 발현하도록 세포를 유전적으로 변형시키는 당업계에 공지된 임의의 다른 방법.
II.
약제학적 조성물 및 투여
일부 실시형태에서, 본 명세서에 기술된 방법은 본 명세서에 기술된 바와 같은 synTF 시스템으로 질환 또는 장애(예를 들어, 암 또는 자가면역)를 갖거나 갖는 것으로 진단된 대상체를 치료하는 것에 관한 것이다. 이러한 질병 또는 장애를 갖는 대상체는 암 또는 자가면역에 대한 현재의 진단 방법을 사용하여 의사에 의해 확인될 수 있다. 이들 상태를 특징짓고 진단에 도움이 되는 증상 및/또는 합병증은 당업계에 공지되어 있다. 암 또는 자가면역의 가족력, 또는 암 또는 자가면역의 위험 인자에 대한 노출은 또한 대상체가 그러한 질병 또는 장애를 가질 가능성이 있는지 여부를 결정하거나, 또는 암 또는 자가면역의 진단을 내리는 데 도움이 될 수 있다.
본 명세서에 기술된 조성물은 암 또는 자가면역을 갖거나 갖는 것으로 진단된 대상체에게 투여될 수 있다. 일부 실시형태에서, 본 명세서에 기술된 방법은 유효량의 본 명세서에 기술된 조성물, 예를 들어, 본 명세서에 기술된 바와 같은 synTF 시스템을 암 또는 자가면역의 증상을 완화시키기 위해 대상체에게 투여하는 단계를 포함한다. 본 명세서에 사용된 "증상 완화(alleviating a symptom)"는 암 또는 자가면역과 관련된 임의의 상태 또는 증상을 개선하는 것이다. 동등한 미처리 대조군과 비교하여, 이러한 감소는 임의의 표준 기술에 의해 측정시 적어도 5%, 10%, 20%, 40%, 50%, 60%, 80%, 90%, 95%, 99% 또는 그 이상이다.
본 명세서에 기술된 조성물을 대상체에게 투여하기 위한 다양한 수단은 당업자에게 공지되어 있다. 작용제는 주사 또는 시간 경과에 따른 점진적 주입에 의해 정맥내로 투여될 수 있다. 주어진 경로에 대한 적절한 제형이 주어지면, 예를 들어, 본 명세서에 기술된 방법 및 조성물에 유용한 작용제는 정맥내, 비강내, 흡입에 의해, 복강내, 근육내, 피하(subcutaneously), 공동내, 종양내 투여될 수 있고, 필요한 경우, 연동 수단에 의해, 또는 당업자에게 공지된 다른 수단에 의해 전달될 수 있다. 임의의 양태의 일부 실시형태에서, 본 명세서에 사용된 화합물은 경구, 정맥내 또는 근육내 투여된다. 투여는 국소적이거나 전신적일 수 있다. 예를 들어, 기관 또는 조직 이식 부위에 직접적으로, 국소 투여하는 것이 구체적으로 고려된다.
적어도 하나의 작용제를 함유하는 치료 조성물은, 예를 들어, 통상적으로 단위 용량으로 투여될 수 있다. 치료 조성물과 관련하여 사용될 때 용어 "단위 용량(unit dose)"은 대상체에 대한 단일 투여량으로 적합한 물리적으로 별개의 단위를 지칭하며, 각 단위는 필요한 생리학적으로 허용가능한 희석제, 즉, 담체 또는 비히클과 연계하여 원하는 치료 효과를 생성하도록 계산된 미리 결정된 양의 활성 물질을 함유한다.
조성물은 투여 제형(dosage formulation)과 양립가능한 방식으로 치료적 유효량으로 투여된다. 투여할 양과 시기는 치료될 대상체, 활성 성분을 활용하는 대상체의 시스템의 능력, 및 원하는 치료 효과의 정도에 따라 다르다..
대상체에 synTF 세포 및 synTF 폴리펩티드(들)의 활성을 조절하기 위한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)가 투여되는 실시형태에서, 세포 및 약물(들)은 함께 또는 별도로 투여될 수 있다. 대상체에게 synTF 세포 및 synTF 폴리펩티드(들)의 활성을 조절하는 약물이 별도로 투여되는 실시형태에서, 각각의 조성물은 본 명세서에 기술된 임의의 투여량 및 투여 경로/루틴에 따라, 별도로, 투여될 수 있다.
본 명세서에 사용되는 용어 "유효량(effective amount)"은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 질병 또는 장애의 적어도 하나 이상의 증상을 완화시키는 데 필요한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT))의 양을 지칭하며, 원하는 효과를 제공하기에 충분한 양의 약리학적 조성물에 관한 것이다. 따라서, 용어 "치료학적 유효량(therapeutically effective amount)"은 전형적인 대상체에게 투여될 때 특정한 항-종양 또는 항-자가면역 효과를 제공하기에 충분한 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)의 양을 지칭한다. 다양한 맥락에서, 본 명세서에 사용된 유효량은 또한 질병의 증상의 발달을 지연시키거나, 증상 질병의 경과를 변경(예를 들어, 이로만 제한되는 것은 아니지만, 질병의 증상 진행을 늦추는 것)하거나, 또는 질병의 증상을 역전시키는 데 충분한 양을 포함할 수 있다. 따라서, 정확한 "유효량"을 지정하는 것은 일반적으로 실행가능하지 않다. 그러나, 임의의 주어진 케이스의 경우, 적절한 "유효량"은 단지 일상적인 실험만을 이용하여 당업자에 의해 결정될 수 있다.
유효량, 독성 및 치료 효능은, 예를 들어, LD50(집단의 50%에 치명적인 용량) 및 ED50(집단의 50%에서 치료적으로 효과적인 용량)을 결정하기 위해 세포 배양 또는 실험 동물에서 표준 약학 절차에 의해 결정될 수 있다. 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 달라질 수 있다. 독성 효과와 치료 효과 사이의 용량 비율은 치료 지수이며 LD50/ED50 비율로 나타낼 수 있다. 큰 치료 지수를 나타내는 조성물 및 방법이 바람직하다. 치료적 유효량은 초기에 세포 배양 분석에서 추정할 수 있다. 또한, IC50(즉, 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)의 농도)을 포함하는 순환 혈장 농도 범위를 달성하기 위해 용량을 동물 모델에서 공식화할 수 있으며, 이는 세포 배양, 또는 적절한 동물 모델에서 결정된 바와 같이 증상의 최대 억제의 절반을 달성한다. 혈장 내 수준은, 예를 들어, 조절인자 단백질 인듀서에 대한 고성능 액체 크로마토그래피 또는 synTF 세포에 대한 유세포 분석에 의해 측정될 수 있다. 임의의 특정 용량의 효과는 적절한 생물학적 분석으로 모니터링할 수 있다. 투여량은 의사가 결정할 수 있으며 필요에 따라 관찰된 치료 효과에 맞게 조정할 수 있다.
유효량, 독성, 및 치료 효능은, 예를 들어, 최소 유효 용량 및/또는 최대 허용 용량을 결정하기 위해, 세포 배양물 또는 실험 동물에서 표준 약제학적 절차에 의해 결정될 수 있다. 투여량은 사용된 투여 형태 및 사용된 투여 경로에 따라 달라질 수 있다. 치료적 유효 용량은 초기에 세포 배양 분석에서 추정할 수 있다. 또한, 최소 유효 용량과 최대 허용 용량 사이의 용량 범위를 달성하기 위해 용량을 동물 모델에서 제형화할 수 있다. 임의의 특정 투여량의 효과는 적합한 생물학적 검정, 예를 들어, 특히 종양 성장 및/또는 크기에 대한 검정에 의해 모니터링될 수 있다. 투여량량은 의사가 결정할 수 있으며 필요에 따라 관찰된 치료 효과에 맞게 조정할 수 있다.
일반적으로, 본 명세서에 기술된 synTF-시스템-발현 세포를 포함하는 약제학적 조성물은, 해당 범위 내의 모든 정수 값을 포함하여, 102 내지 1010개 세포/kg 체중, 바람직하게는 105 내지 106개 세포/kg 체중의 투여량으로 투여될 수 있다고 말할 수 있다. 세포의 수는 그 안에 포함된 세포의 유형과 마찬가지로 조성물이 의도되는 궁극적인 용도에 따라 달라질 것이다. 본 명세서에 제공된 용도를 위해, 세포는 일반적으로 1리터 이하의 부피이고, 500 mL 이하, 심지어 250 mL 또는 100 mL 이하일 수 있다. 따라서, 원하는 세포의 밀도는 전형적으로 106개 세포/ml를 초과하고 일반적으로 107개 세포/ml를 초과하며, 일반적으로 108개 세포/ml 이상이다. 임상적으로 관련된 면역 세포 수는 누적적으로 105, 106, 107, 108, 109, 1010, 1011, 또는 1012개 세포와 같거나 초과하는 복수의 주입으로 할당될 수 있다. SynTF-시스템-발현 세포 조성물은 이러한 범위 내의 투여량으로 복수회 투여될 수 있다. 세포는 요법을 받는 환자에 대해 동종이계(allogeneic), 동계(syngeneic), 이계(xenogeneic), 또는 자가(autologous)일 수 있다. 원하는 경우, 치료는 면역 반응의 유도를 향상시키기 위해 본 명세서에 기술된 바와 같은 미토겐(예를 들어, PHA) 또는 림포카인, 사이토카인, 및/또는 케모카인(예를 들어, IFN-γ, IL-2, IL-12, TNF-알파, IL-18 및 TNF-베타, GM-CSF, IL-4, IL-13, Flt3-L, RANTES, MIP1α 등)의 투여를 포함할 수도 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x105개 세포 내지 약 1x108개 세포일 수 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x106개 내지 약 1x107개 세포일 수 있다. 일부 실시형태에서, 투여량은 체중 kg당 약 1x106개 세포일 수 있다. 일부 실시형태에서, 1회 용량의 세포가 투여될 수 있다. 일부 실시형태에서, 세포의 용량은, 예를 들어, 1회, 2회 또는 그 이상 반복될 수 있다. 일부 실시형태에서, 세포의 용량은, 예를 들어, 매일, 매주, 또는 매월 기준으로 투여될 수 있다.
특정 실시형태에서, 본 명세서에 기술된 바와 같은 synTF의 활성을 조절하는 조절인자 단백질 인듀서(예를 들어, 그루조프레비르, ABA, 4OHT; 본 명세서에서 인듀서 작용제로도 지칭됨)의 유효 용량은 환자에 한 번 투여될 수 있다. 특정 실시형태에서, 조절인자 단백질 인듀서의 유효 용량은 환자에게 반복적으로 투여될 수 있다. 임의의 양태의 일부 실시형태에서, ABA의 유효 용량은 약 1 mM이다. 임의의 양태의 일부 실시형태에서, 4OHT의 유효 용량은 약 4 μM이다. 임의의 양태의 일부 실시형태에서, 그라조프레비르의 유효 용량은 약 4 μM이다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서(예를 들어, 그라조프레비르)의 유효 용량은 적어도 0.05 mM, 적어도 0.1 mM, 적어도 0.15 mM, 적어도 0.2 mM, 적어도 0.25 mM, 적어도 0.3 mM, 적어도 0.35 mM, 적어도 0.4 mM, 적어도 0.45 mM, 적어도 0.5 mM, 적어도 0.55 mM, 적어도 0.6 mM, 적어도 0.65 mM, 적어도 0.7 mM, 적어도 0.75 mM, 적어도 0.8 mM, 적어도 0.85 mM, 적어도 0.9 mM, 적어도 0.95 mM, 적어도 1 mM, 적어도 1.05 mM, 적어도 1.1 mM, 적어도 1.15 mM, 적어도 1.2 mM, 적어도 1.25 mM, 적어도 1.3 mM, 적어도 1.35 mM, 적어도 1.4 mM, 적어도 1.45 mM, 적어도 1.5 mM, 적어도 1.55 mM, 적어도 1.6 mM, 적어도 1.65 mM, 적어도 1.7 mM, 적어도 1.75 mM, 적어도 1.8 mM, 적어도 1.85 mM, 적어도 1.9 mM, 적어도 1.95 mM, 적어도 2 mM, 적어도 2.05 mM, 적어도 2.1 mM, 적어도 2.15 mM, 적어도 2.2 mM, 적어도 2.25 mM, 적어도 2.3 mM, 적어도 2.35 mM, 적어도 2.4 mM, 적어도 2.45 mM, 적어도 2.5 mM, 적어도 2.55 mM, 적어도 2.6 mM, 적어도 2.65 mM, 적어도 2.7 mM, 적어도 2.75 mM, 적어도 2.8 mM, 적어도 2.85 mM, 적어도 2.9 mM, 적어도 2.95 mM, 적어도 3 mM, 적어도 3.05 mM, 적어도 3.1 mM, 적어도 3.15 mM, 적어도 3.2 mM, 적어도 3.25 mM, 적어도 3.3 mM, 적어도 3.35 mM, 적어도 3.4 mM, 적어도 3.45 mM, 적어도 3.5 mM, 적어도 3.55 mM, 적어도 3.6 mM, 적어도 3.65 mM, 적어도 3.7 mM, 적어도 3.75 mM, 적어도 3.8 mM, 적어도 3.85 mM, 적어도 3.9 mM, 적어도 3.95 mM, 적어도 4 mM, 적어도 4.05 mM, 적어도 4.1 mM, 적어도 4.15 mM, 적어도 4.2 mM, 적어도 4.25 mM, 적어도 4.3 mM, 적어도 4.35 mM, 적어도 4.4 mM, 적어도 4.45 mM, 적어도 4.5 mM, 적어도 4.55 mM, 적어도 4.6 mM, 적어도 4.65 mM, 적어도 4.7 mM, 적어도 4.75 mM, 적어도 4.8 mM, 적어도 4.85 mM, 적어도 4.9 mM, 적어도 4.95 mM, 또는 적어도 5 mM이다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서(예를 들어, ABA, 4OHT)의 유효 용량은 적어도 0.05 μM, 적어도 0.1 μM, 적어도 0.15 μM, 적어도 0.2 μM, 적어도 0.25 μM, 적어도 0.3 μM, 적어도 0.35 μM, 적어도 0.4 μM, 적어도 0.45 μM, 적어도 0.5 μM, 적어도 0.55 μM, 적어도 0.6 μM, 적어도 0.65 μM, 적어도 0.7 μM, 적어도 0.75 μM, 적어도 0.8 μM, 적어도 0.85 μM, 적어도 0.9 μM, 적어도 0.95 μM, 적어도 1 μM, 적어도 1.05 μM, 적어도 1.1 μM, 적어도 1.15 μM, 적어도 1.2 μM, 적어도 1.25 μM, 적어도 1.3 μM, 적어도 1.35 μM, 적어도 1.4 μM, 적어도 1.45 μM, 적어도 1.5 μM, 적어도 1.55 μM, 적어도 1.6 μM, 적어도 1.65 μM, 적어도 1.7 μM, 적어도 1.75 μM, 적어도 1.8 μM, 적어도 1.85 μM, 적어도 1.9 μM, 적어도 1.95 μM, 적어도 2 μM, 적어도 2.05 μM, 적어도 2.1 μM, 적어도 2.15 μM, 적어도 2.2 μM, 적어도 2.25 μM, 적어도 2.3 μM, 적어도 2.35 μM, 적어도 2.4 μM, 적어도 2.45 μM, 적어도 2.5 μM, 적어도 2.55 μM, 적어도 2.6 μM, 적어도 2.65 μM, 적어도 2.7 μM, 적어도 2.75 μM, 적어도 2.8 μM, 적어도 2.85 μM, 적어도 2.9 μM, 적어도 2.95 μM, 적어도 3 μM, 적어도 3.05 μM, 적어도 3.1 μM, 적어도 3.15 μM, 적어도 3.2 μM, 적어도 3.25 μM, 적어도 3.3 μM, 적어도 3.35 μM, 적어도 3.4 μM, 적어도 3.45 μM, 적어도 3.5 μM, 적어도 3.55 μM, 적어도 3.6 μM, 적어도 3.65 μM, 적어도 3.7 μM, 적어도 3.75 μM, 적어도 3.8 μM, 적어도 3.85 μM, 적어도 3.9 μM, 적어도 3.95 μM, 적어도 4 μM, 적어도 4.05 μM, 적어도 4.1 μM, 적어도 4.15 μM, 적어도 4.2 μM, 적어도 4.25 μM, 적어도 4.3 μM, 적어도 4.35 μM, 적어도 4.4 μM, 적어도 4.45 μM, 적어도 4.5 μM, 적어도 4.55 μM, 적어도 4.6 μM, 적어도 4.65 μM, 적어도 4.7 μM, 적어도 4.75 μM, 적어도 4.8 μM, 적어도 4.85 μM, 적어도 4.9 μM, 적어도 4.95 μM, 또는 적어도 5 μM이다.
전신 투여를 위해, 예를 들어, 0.1 mg/kg, 0.5 mg/kg, 1.0 mg/kg, 2.0 mg/kg, 2.5 mg/kg, 5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 40 mg/kg, 50 mg/kg 또는 그 이상과 같은, 조절인자 단백질 인듀서의 치료량을 대상체에게 투여할 수 있다.
일부 실시형태에서, 용량은 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 2 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 4 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 5 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 6 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 8 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 10 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 100 mg/㎡ 내지 약 700 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 250 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 375 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 500 mg/㎡일 수 있다.
일부 실시형태에서, 용량은 정맥내 투여될 수 있다. 일부 실시형태에서, 정맥내 투여는 약 10분 내지 약 3시간의 기간에 걸쳐 발생하는 주입일 수 있다. 일부 실시형태에서, 정맥내 투여는 약 30분 내지 약 90분의 기간에 걸쳐 발생하는 주입일 수 있다.
일부 실시형태에서, 용량은 약 매주 투여될 수 있다. 일부 실시형태에서, 용량은 매주 투여될 수 있다. 일부 실시형태에서, 용량은 약 12주 내지 약 18주 동안 매주 투여될 수 있다. 일부 실시형태에서 용량은 약 2주마다 투여될 수 있다. 일부 실시형태에서 용량은 약 3주마다 투여될 수 있다. 일부 실시형태에서, 용량은 약 2주마다 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 2주마다 정맥내 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 정맥내 투여되는 약 2 mg/kg 내지 약 15 mg/kg일 수 있다. 일부 실시형태에서, 용량은 약 매주 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 2주마다 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 용량은 약 3주마다 정맥내 투여되는 약 200 mg/㎡ 내지 약 400 mg/㎡일 수 있다. 일부 실시형태에서, 총 약 2 내지 약 10회 용량이 투여된다. 일부 실시형태에서, 총 4회 용량이 투여된다. 일부 실시형태에서, 총 5회 용량이 투여된다. 일부 실시형태에서, 총 6회 용량이 투여된다. 일부 실시형태에서, 총 7회 용량이 투여된다. 일부 실시형태에서, 총 8회 용량이 투여된다. 일부 실시형태에서, 투여는 총 약 4주 내지 약 12주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 6주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 8주 동안 진행된다. 일부 실시형태에서, 투여는 총 약 12주 동안 진행된다. 일부 실시형태에서, 초기 용량은 후속 용량보다 약 1.5 내지 약 2.5배 더 클 수 있다.
일부 실시형태에서, 용량은 약 1 mg 내지 약 2000 mg일 수 있다. 일부 실시형태에서, 용량은 약 3 mg일 수 있다. 일부 실시형태에서, 용량은 약 10 mg일 수 있다. 일부 실시형태에서, 용량은 약 30 mg일 수 있다. 일부 실시형태에서, 용량은 약 1000 mg일 수 있다. 일부 실시형태에서, 용량은 약 2000 mg일 수 있다. 일부 실시형태에서, 용량은 매일 정맥내 주입에 의해 제공되는 약 3 mg일 수 있다. 일부 실시형태에서, 용량은 매일 정맥내 주입에 의해 제공되는 약 10 mg일 수 있다. 일부 실시형태에서, 용량은 주당 3회 정맥내 주입에 의해 제공되는 약 30 mg일 수 있다.
일부 실시형태에서, 초기 치료 요법 후, 치료는 덜 빈번하게 투여될 수 있다. 예를 들어, 3개월 동안 격주로 치료한 후, 한 달에 한 번, 6개월 또는 1년 이상 동안 치료를 반복할 수 있다. 본 명세서에 기술된 방법에 따른 치료는 상태의 마커 또는 증상의 수준을, 예를 들어, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80% 또는 적어도 90% 또는 그 이상 감소시킬 수 있다.
본 명세서에 기술된 바와 같은 synTF 세포 및/또는 조절인자 단백질 인듀서의 투여량은 의사에 의해 결정될 수 있고, 치료의 관찰된 효과에 적합하도록, 필요에 따라, 조정될 수 있다. 치료 지속기간 및 빈도와 관련하여, 숙련된 임상의는 치료가 치료적 이점을 제공하는 시기를 결정하고 투여량을 증가시킬지 또는 감소시킬지, 투여 빈도를 증가시킬지 또는 감소시킬지, 치료를 중단할지, 치료를 재개할지, 또는 치료 요법에 다른 변경을 줄지 여부를 결정하기 위해 대상을 모니터링하는 것이 일반적이다. 투약 일정은 synTF 시스템 및/또는 조절인자 단백질 인듀서에 대한 대상체의 민감성과 같은 여러 임상 요인에 따라 일주일에 한 번에서 매일까지 다양할 수 있다. 원하는 용량 또는 양은 한 번에 투여되거나 하위 용량, 예를 들어, 2-4개의 하위 용량으로 나누어 일정 기간에 걸쳐, 예를 들어, 하루 또는 다른 적절한 일정을 통해 적절한 간격으로 투여될 수 있다. 일부 실시형태에서, 투여는 만성적, 예를 들어, 수주 또는 수개월의 기간에 걸쳐 매일 1회 이상의 용량 및/또는 치료일 수 있다. 투약 및/또는 치료 일정의 예는 1주, 2주, 3주, 4주, 1개월, 2개월, 3개월, 4개월, 5개월, 또는 6개월, 또는 그 이상의 기간에 걸쳐 매일, 매일 2회, 매일 3회 또는 매일 4회 또는 그 이상의 투여이다. 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 조성물은 5분, 10분, 15분, 20분, 또는 25분 기간과 같은 기간에 걸쳐 투여될 수 있다.
본 명세서에 기술된 방법에 따른 synTF 시스템의 투여를 위한 투여량 범위는, 예를 들어, synTF 시스템의 형태, 이의 효능, 및 본 ADTP서에 기재된 상태의 증상, 마커, 또는 지표(indicators)가 감소되는 정도, 예를 들어, 질환 또는 장애(예를 들어, 암 또는 자가면역)에 대해 원하는 백분율 감소에 좌우된다. 투여량은 부작용을 유발할 정도로 크지 않아야 한다. 일반적으로, 투여량은 환자의 연령, 상태, 및 성별에 따라 달라질 것이며, 당업자에 의해 결정될 수 있다. 투여량은 임의의 합병증의 경우 개별 의사에 의해 조정될 수도 있다.
예를 들어, 본 명세서에 기술된 상태의 치료에서 synTF의 효능은 숙련된 임상의에 의해 결정될 수 있다. 그러나, 치료라는 용어가 본 명세서에 사용된 경우, 본 명세서에 기술된 상태의 징후 또는 증상 중 하나 이상이 유익한 방식으로 변경되거나, 다른 임상적으로 허용되는 증상이 발생되거나, 또는 심지어 개선되는 경우, 또는 원하는 반응이, 예를 들어, 본 명세서에 기술된 방법에 따른 치료 후 적어도 10%까지 유도되는 경우, 치료는 "유효한 치료"로 간주된다. 효능은, 예를 들어 본 명세서에 기술된 방법에 따라 치료되는 상태의 마커, 지표, 증상 및/또는 발생도(incidence), 또는 적절한 임의의 다른 측정가능한 파라미터, 예를 들어, 종양 크기를 측정함으로써 평가될 수 있다. 효능은 입원에 의해 평가된 개인의 악화 실패, 또는 의학적 개입의 필요성(즉, 질병의 진행이 중단됨)에 의해 측정될 수도 있다. 이러한 지표를 측정하는 방법은 당업자에게 알려져 있고/있거나 본 명세서에 기술되어 있다. 치료는 개인 또는 동물(일부 비제한적인 예로는 인간 또는 동물을 포함함)의 질병의 임의의 치료를 포함하고 다음을 포함한다: (1) 질병의 억제, 예를 들어, 증상(예를 들어, 통증 또는 염증)의 악화 방지; 또는 (2) 질병의 중증도 완화, 예를 들어, 증상의 퇴행 유발. 질병의 치료를 위한 유효량은, 이를 필요로 하는 대상체에게 투여될 때, 이 용어가 해당 질병에 대해 본 명세서에 정의된 바와 같은 효과적인 치료를 초래하기에 충분한 양을 의미한다. 작용제의 효능은 상태 또는 원하는 반응(예를 들어, 종양 크기)의 물리적 지표를 평가함으로써 결정할 수 있다. 이러한 파라미터 중 임의의 하나, 또는 파라미터의 임의의 조합을 측정함으로써 투여 및/또는 치료의 효능을 모니터링하는 것은 당업자의 능력 범위 내에 있다. 효능은 본 명세서에 기술된 상태, 예를 들어, 암 치료의 동물 모델에서 평가될 수 있다. 실험 동물 모델을 사용하는 경우, 마커, 예를 들어, 종양 크기에서의 통계적으로 유의한 변화가 관찰될 때 치료의 효능이 입증된다.
synTF 시스템의 주어진 용량에 대한 평가를 가능케 하는 시험관내(in vitro) 및 동물 모델 분석이 본 명세서에 제공된다. 주어진 투여량 조합의 효능은 또한 동물 모델, 예를 들어, 특정 암 동물 모델에서 평가될 수 있다.
한 양태에서, 집합적으로 "synTF 조성물"로 지칭되는, 본 명세서에 기술된 바와 같은 적어도 하나의 synTF 폴리펩티드, synTF 시스템, synTF 폴리뉴클레오티드, synTF 벡터, 또는 synTF-포함 세포를 포함하는 약제학적 조성물이 본 명세서에 기술된다(예를 들어, 표 1-2 참조). 임의의 양태의 일부 실시형태에서, 약제학적 조성물은 synTF 폴리펩티드 또는 시스템의 임의의 조합을 포함할 수 있다(예를 들어, 표 9 참조). 임의의 양태의 일부 실시형태에서, 약제학적 조성물은 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA, 4OHT)를 추가로 포함할 수 있다.
일부 실시형태에서, 본 명세서에 기술된 기술은 본 명세서에 기술된 바와 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서, 및 임의로 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물에 관한 것이다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서를 포함한다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본질적으로 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서로 이루어진다. 일부 실시형태에서, 약제학적 조성물의 활성 성분은 본 명세서에 기술된 바와 같은 synTF 시스템 및/또는 조절인자 단백질 인듀서로 이루어진다. 약학적으로 허용되는 담체 및 희석제는 식염수, 수성 완충 용액, 용매 및/또는 분산 매질을 포함한다. 이러한 담체 및 희석제의 사용은 당업계에 잘 알려져 있다. 약제학적으로 허용가능한 담체로 역할할 수 있는 물질의 일부 비제한적 예로는 다음을 포함한다: (1) 당, 예컨대, 락토오스, 글루코오스 및 수크로오스; (2) 전분, 예컨대, 옥수수 전분 및 감자 전분; (3) 셀룰로오스 및 이의 유도체, 예컨대, 나트륨 카복시메틸 셀룰로오스, 메틸셀룰로오스, 에틸 셀룰로오스, 미정질 셀룰로오스 및 셀룰로오스 아세테이트; (4) 트라가칸트 분말; (5) 맥아; (6) 젤라틴; (7) 윤활제, 예컨대, 마그네슘 스테아레이트, 나트륨 라우릴 설페이트 및 탈크; (8) 부형제, 예컨대, 코코아 버터 및 좌약 왁스; (9) 오일, 예컨대 땅콩유, 면실유, 홍화유, 참기름, 올리브유, 옥수수유 및 대두유; (10) 글리콜, 예컨대, 프로필렌 글리콜; (11) 폴리올, 예컨대, 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜(PEG); (12) 에스테르, 예컨대, 에틸 올레이트 및 에틸 라우레이트; (13) 한천; (14) 완충제, 예컨대, 수산화마그네슘 및 수산화알루미늄; (15) 알긴산; (16) 발열원 없는 물; (17) 등장 식염수; (18) 링거의 솔루션; (19) 에틸 알코올; (20) pH 완충 용액; (21) 폴리에스테르, 폴리카보네이트 및/또는 폴리무수물; (22) 증량제(bulking agents), 예컨대, 폴리펩티드 및 아미노산; (23) 혈청 성분, 예컨대, 혈청 알부민, HDL 및 LDL; (24) C2-C12알코올, 예컨대, 에탄올; 및 (25) 약제학적 제형에 사용되는 기타 무독성 상용성 물질. 습윤제, 착색제, 이형제, 코팅제, 감미제, 향미제, 방향제, 방부제 및 항산화제가 또한 제형에 존재할 수 있다. "부형제", "담체", " 약제학적으로 허용가능한 담체" 등과 같은 용어는 본 명세서에서 상호교환가능하게 사용된다. 일부 실시형태에서, 담체는 활성 작용제, 예를 들어, 본 명세서에 기술된 바와 같은 synTF 폴리펩티드, synTF 시스템, 및/또는 조절인자 단백질 인듀서의 분해를 억제한다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서를 포함하는 제약 조성물은 비경구 투여 형태일 수 있다. 비경구 투여 형태의 투여는 전형적으로 오염물에 대한 환자의 자연 방어를 우회하기 때문에, 비경구 투여 형태는 바람직하게는 멸균되거나 환자에게 투여하기 전에 멸균될 수 있다. 비경구 투여 형태의 예로는 주사용으로 준비된 용액, 주사를 위한 약제학적으로 허용가능한 비히클에 용해되거나 현탁될 준비가 된 건조 제품, 주사용으로 준비된 현탁액, 및 에멀젼을 포함하지만 이로만 제한되는 것은 아니다. 또한, DUROS®-유형 투여 형태 및 용량-덤핑을 포함하지만 이로만 제한되는 것은 아닌, 제어-방출 비경구 투여 형태가 환자의 투여를 위해 제조될 수 있다..
본 명세서에 개시된 것과 같은 synTF 조성물 및/또는 조절인자 단백질 인듀서의 비경구 투여 형태를 제공하기 위해 사용될 수 있는 적합한 비히클은 당업자에게 잘 알려져 있다. 예는, 제한됨이 없이, 다음을 포함한다: 멸균수; 주사용수 USP; 생리 식염수; 포도당 용액; 이로만 제한되는 것은 아니지만 염화나트륨 주사, 링거 주사, 덱스트로스 주사, 덱스트로스 및 염화나트륨 주사, 및 락테이트 링거 주사와 같은 수성 비히클; 이로만 제한되는 것은 아니지만 에틸 알코올, 폴리에틸렌 글리콜 및 프로필렌 글리콜과 같은 수혼화성 비히클; 및 이로만 제한되는 것은 아니지만, 옥수수유, 면실유, 땅콩유, 참기름, 에틸 올레에이트, 이소프로필 미리스테이트, 및 벤질 벤조에이트와 같은 비수성 비히클.
synTF 조성물 및/또는 조절인자 단백질 인듀서를 포함하는 약제학적 조성물은 또한 경구 투여에 적합하도록, 예를 들어, 개별 투여 형태, 예컨대, 이로만 제한되는 것은 아니지만, 정제(제한됨이 없이 스코어링되거나 또는 코팅된 정제를 포함함), 환제, 캐플릿, 캡슐, 씹을 수 있는 정제, 분말 패킷, 카셰(cachets), 트로키, 웨이퍼, 에어로졸 스프레이, 또는 액체, 예컨대, 이로만 제한되는 것은 아니지만, 시럽, 엘릭서, 수성 액체, 비수성 액체의 용액 또는 현탁액, 수중유 에멀젼, 또는 유중수 에멀젼으로 제형화될 수 있다. 이러한 조성물은 개시된 화합물의 약제학적으로 허용가능한 염의 미리 결정된 양을 함유하고, 당업자에게 잘 알려진 약제학적 방법에 의해 제조될 수 있다. 일반적으로 다음 문헌 참조: Remington: The Science and Practice of Pharmacy, 21st Ed., Lippincott, Williams, and Wilkins, Philadelphia PA. (2005).
통상적인 투여 형태는 일반적으로 제형으로부터 신속하거나 즉각적인 약물 방출을 제공한다. 약물의 약리학 및 약동학에 따라, 기존 투여 형태를 사용하면 환자의 혈액 및 기타 조직에서 약물 농도의 큰 변동을 야기할 수 있다. 이러한 변동은 투여 빈도, 작용 개시, 효능 지속기간, 치료 혈액 수준의 유지, 독성, 부작용 등과 같은 많은 파라미터에 영향을 미칠 수 있다. 유리하게는, 제어-방출 제형은 약물의 작용 개시, 작용 지속기간, 치료 윈도우 내의 혈장 수준, 및 최고 혈액 수준을 제어하기 위해 사용될 수 있다. 특히, 제어- 또는 연장-방출 투여 형태 또는 제형은, 약물을 과소 투약하는 것(under-dosing)(즉, 최소 치료 수준 이하로 내려감)을 비롯하여 약물에 대한 독성 수준을 초과하는 것 둘 다로부터 발생할 수 있는, 잠재적인 부작용과 안전성 문제를 최소화하면서 약물의 최대 효과가 달성되도록 보장하기 위해 사용될 수 있다. 일부 실시형태에서, 조성물은 지연 방출(sustained release) 제형으로 투여될 수 있다.
제어-방출 약제학적 제품은 비-제어 방출 대응물에 의해 달성되는 것보다 약물 요법을 개선하는 공통 목표를 가지고 있다. 이상적으로, 의학적 치료에서 최적으로 설계된 제어-방출 제제의 사용은 최소한의 시간 내에 상태를 치료하거나 조절하기 위해 사용되는 최소한의 약물 물질을 특징으로 한다. 제어-방출 제형의 장점은 다음을 포함한다: 1) 약물 활성의 연장; 2) 투여 빈도 감소; 3) 환자 순응도 증가; 4) 더 적은 총 약물의 사용; 5) 국소 또는 전신 부작용의 감소; 6) 약물 축적의 최소화; 7) 혈액 수준 변동의 감소; 8) 치료 효능의 개선; 9) 약물 활성의 강화 또는 손실 감소; 및 10) 질병 또는 상태의 제어 속도의 개선. Kim, Cherng-ju, Controlled Release Dosage Form Design, 2 (Technomic Publishing, Lancaster, Pa.: 2000).
대부분의 제어-방출 제형은 원하는 치료 효과를 신속하게 생성하는 약물(활성 성분)의 양을 초기에 방출하고, 연장된 기간에 걸쳐 이러한 수준의 치료적 또는 예방적 효과를 유지하기 위해 다른 양의 약물을 점진적으로 또 지속적으로 방출하도록 설계된다. 체내에서 이러한 일정한 수준의 약물을 유지하기 위해, 대사되고 체내에서 배설되는 약물의 양을 대체할 수 있는 속도(rate)로 약물이 제형에서 방출되어야 한다. 활성 성분의 제어-방출은 pH, 이온 강도, 삼투압, 온도, 효소, 물, 및 기타 생리학적 조건 또는 화합물을 포함하나, 이로만 제한되는 것은 아닌 다양한 조건에 의해 자극될 수 있다.
다양한 공지된 제어-방출 또는 연장-방출 투여 형태, 제형, 및 디바이스가 본 개시의 염 및 조성물과 함께 사용하기 위해 조정될 수 있다. 예로는, 이로만 제한되는 것은 아니지만, 미국 특허 제3,845,770호; 제3,916,899호; 제3,536,809호; 제3,598,123호; 제4,008,719호; 제5674,533호; 제5,059,595호; 제5,591,767호; 제5,120,548호; 제5,073,543호; 제5,639,476호; 제5,354,556호; 제5,733,566호; 및 제6,365,185 B1호에 기재된 것들을 포함하며, 이들 각각의 전문은 본 명세서에서 참조로 인용된다.
이러한 투여 형태는, 예를 들어, 하이드록시프로필메틸 셀룰로오스, 기타 중합체 매트릭스, 겔, 투과성 막, 삼투 시스템(예컨대, OROS® (Alza Corporation, Mountain View, Calif. USA)), 또는 이들의 조합을 사용하여 다양한 비율로 원하는 방출 프로파일을 제공할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 조성물 및/또는 조절인자 단백질 유도제는 단일요법으로서 투여되며, 예를 들어, 질환 또는 장애(예를 들어, 암)에 대한 또 다른 치료는 대상체에게 투여되지 않는다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 방법은 제2 작용제 및/또는 치료제를 대상체에, 예를 들어, 조합 요법의 일부로 투여하는 것을 추가로 포함할 수 있다. 제2 작용제 및/또는 치료의 비제한적 예는 방사선 요법, 수술, 젬시타빈, 시스플라틴, 파클리탁셀, 카르보플라틴, 보르테조밉, AMG479, 보리노스타트, 리툭시맙, 테모졸로미드, 라파마이신, ABT-737, PI-103; 티오테파 및 CYTOXAN® 시클로포스파미드와 같은 알킬화제; 부술판, 임프로술판 및 피포술판과 같은 알킬 술포네이트; 벤조도파, 카르보쿠온, 메투레도파, 및 우레도파와 같은 아지리딘류; 알트레타민, 트리에틸렌멜라민, 트리에틸렌포스포르아미드, 트리에틸렌티오포스포르아미드 및 트리메틸올 멜라민을 포함하는 에틸렌이민 및 메틸멜라민; 아세토게닌(특히 불라타신 및 불라타시논); 캄프토테신(합성 유사체 토포테칸 포함); 브리오스타틴; 칼리스타틴; CC-1065(이의 아도젤레신, 카르젤레신 및 비젤레신 합성 유사체 포함); 크립토피신(특히 크립토피신 1 및 크립토피신 8); 돌라스타틴; 듀오카르마이신(합성 유사체, KW-2189 및 CB1-TM1 포함); 엘류테로빈; 판크라티스타틴; 사르코딕틴; 스폰지스타틴; 클로람부실, 클로르나파진, 콜로포스파미드, 에스트라무스틴, 이포스파미드, 메클로레타민, 메클로레타민 옥사이드 히드로클로라이드, 멜팔란, 노벤비친, 페네스테린, 프레드니무스틴, 트로포스파미드, 우라실 머스타드와 같은 질소 머스타드; 카르무스틴, 클로로조토신, 포테무스틴, 로무스틴, 니무스틴 및 라니무스틴과 같은 니트로소우레아; 엔디인 항생제(예를 들어, 칼리케아미신, 특히 칼리케아미신 감마1I 및 칼리케아미신 오메가I1(예를 들어, Agnew, Chem. Intl. Ed. Engl., 33:183-186 (1994) 참조))와 같은 항생제; 클로드로네이트와 같은 비스포스포네이트; 에스페라미신; 뿐만 아니라 네오카르지노스타틴 발색단 및 관련 발색단백 엔디인 항생제 발색단), 아클라시노마이신, 악티노마이신, 아우트라마이신, 아자세린, 블레오마이신, 칵티노마이신, 카라비신, 카미노마이신, 카르지노필린, 크로모마이신, 닥티노마이신, 다우노루비신, 데토루비신, 6-디아조-5-옥소-L-노르류신, ADRIAMYCIN® 독소루비신(모르폴리노-독소루비신, 시아노모르폴리노-독소루비신, 2-피롤리노-독소루비신 및 데옥시독소루비신 포함), 에피루비신, 에소루비신, 이다루비신, 마르셀로마이신, 미토마이신 C, 미코페놀산, 노갈라마이신, 올리보마이신, 페플로마이신, 포트피로마이신, 퓨로마이신, 켈라마이신, 로도루비신, 스트렙토니그린, 스트렙토조신, 투베르시딘, 주비노신스타트; 메토트렉세이트 및 5-플루오로우라실(5-FU)과 같은 항대사물질; 데놉테린, 메토트렉세이트, 프테롭테린, 트리메트렉세이트와 같은 엽산 유사체; 플루다라빈, 6-메르캅토퓨린, 티아미프린, 티오구아닌과 같은 퓨린 유사체; 안시타빈, 아자시티딘, 6-아자우리딘, 카르모푸르, 시타라빈, 디데옥시우리딘, 독시플루리딘, 에노시타빈, 플록수리딘과 같은 피리미딘 유사체; 칼루스테론, 드로모스타놀론 프로피오네이트, 에피티오스타놀, 메피티오스탄, 테스토락톤과 같은 안드로겐; 아미노글루테티미드, 미토탄, 트리로스탄과 같은 항-부신(anti-adrenals); 프롤린산과 같은 엽산 보충제; 아세글라톤; 알도포스파미드 배당체; 아미노레불린산; 에닐루라실; 암사크린; 베스트라부실; 비산트렌; 에다트락세이트; 데파민; 데메콜신; 디아지쿠온; 엘포르미틴; 엘립티늄 아세테이트; 에포틸론; 에토글루시드; 질산갈륨; 하이드록시우레아; 렌티난; 로니다이닌; 메이탄신 및 아사미토신과 같은 메이탄시노이드(maytansinoids); 미토구아존; 미톡산트론; 모피단몰; 니트라에린; 펜토스타틴; 페나멧; 피라루비신; 로속산트론; 포도필린산; 2-에틸히드라지드; 프로카바진; PSK® 다당류 복합체(JHS Natural Products, Eugene, Oreg.); 라족산; 리족신; 시조푸란; 스피로게르마늄; 테누아존산; 트리아지쿠온; 2,2',2''-트리클로로트리에틸아민; 트리코테센(특히 T-2 독소, 베라쿠린 A, 로리딘 A 및 안귀딘); 우레탄; 빈데신; 다카르바진; 만노무스틴; 미토브로니톨; 미톨락톨; 피포브로만; 가시토신; 아라비노사이드("Ara-C"); 시클로포스파미드; 티오테파; 탁소이드, 예를 들어 TAXOL® 파클리탁셀(Bristol-Myers Squibb Oncology, Princeton, NJ), ABRAXANE® 파클리탁셀의 크레모포가 없는 알부민-조작된 나노입자 제형(American Pharmaceutical Partners, Schaumberg, IL), 및 TAXOTERE® 독세셀(Rhone-Poulenc Rorer, Antony, France); 클로란부실; GEMZAR® 젬시타빈; 6-티오구아닌; 머캅토퓨린; 메토트렉세이트; 시스플라틴, 옥살리플라틴 및 카르보플라틴과 같은 백금 유사체; 빈블라스틴; 백금; 에토포사이드(VP-16); 이포스파미드; 미톡산트론; 빈크리스틴; NAVELBINE® 비노렐빈; 노반트론; 테니포사이드; 에다트렉세이트; 다우노마이신; 아미노프테린; 젤로다; 이반드로네이트; 이리노테칸(Camptosar, CPT-11)(5-FU 및 류코보린과 함께 이리노테칸의 치료 요법 포함); 토포이소머라제 억제제 RFS 2000; 디플루오로메틸오르니틴(DMFO); 레티노산과 같은 레티노이드; 카페시타빈; 콤브레타스타틴; 류코보린(LV); 옥살리플라틴 치료 요법(FOLFOX)을 포함하는 옥살리플라틴; 라파티닙(Tykerb®); 세포 증식을 감소시키는 PKC-알파, Raf, H-Ras, EGFR(예를 들어, 엘로티닙(Tarceva®)) 및 VEGF-A의 저해제 및 상기한 것 중 임의의 것의 약제학적으로 허용가능한 염, 산 또는 유도체를 포함할 수 있다.
또한, 치료 방법은 방사선 또는 방사선 요법의 사용을 추가로 포함할 수 있다. 또한, 치료 방법은 외과적 치료의 사용을 추가로 포함할 수 있다.
VII.
치료 방법
본 명세서에 기술된 synTF 조성물은 특히 암 또는 자가면역의 치료를 필요로 하는 대상체에게 투여될 수 있다. 자가면역은 자신의 건강한 세포와 조직에 대한 유기체의 면역 반응 시스템이다. 이러한 비정상적인 면역 반응으로 인해 발생하는 모든 질병을 "자가면역 질환"이라고 한다. 임의의 양태의 일부 실시형태에서, 대상체는 재생 의학 및/또는 면역요법을 필요로 하는 유전적 장애가 있다.
일부 실시형태에서, synTF 시스템은 적어도 하나의 조절인자 단백질 및 이의 상응하는 조절인자 단백질 인듀서에 의해 자체적으로 조절되는, 적어도 하나의 유도성 synTF에 의해 제어되는, 관심 유전자(예를 들어, 치료 단백질, 대사물(analyte))를 발현한다. 이와 같이, 관심 유전자의 발현은 암, 자가면역, 또는 유전적 장애와 같은 질병의 치료를 위한 조절인자 단백질 인듀서(예를 들어, 그라조프레비르, ABA 또는 4OHT와 같은 FDA-승인된 소분자)의 존재, 부재, 또는 이의 증가되거나 감소된 수준에 의해 특이적으로 조절될 수 있다.
단지 일예로서, 도 13a-13d는 CD19-CAR이 억제성 프로테아제 synTF에 의해 조절되는 암을 치료하기 위한 예시적인 시스템을 나타낸다. 또 다른 비제한적 예로서, 도 14a-14c는 CD19-CAR 및 IL4가, 각각, 억제성 프로테아제 synTF 및 세포질 격리 synTF에 의해 조절되는 암을 치료하는 예시적인 시스템을 나타낸다. 다른 비제한적 예로서, 도 15a-15c는, 단일 벡터 시스템 또는 이중 벡터 시스템으로부터 발현될 수 있는, 억제성 프로테아제 synTF에 의해 IL10이 조절되는 자가면역 질환을 치료하기 위한 예시적인 시스템을 나타낸다.
일부 실시형태에서, 치료 방법은 본 명세서에 기술된 조성물에 의한 치료로부터 이익을 얻을 수 있는 대상체 또는 환자를 먼저 진단하는 것을 포함할 수 있다. 일부 실시형태에서, 이러한 진단은 대상체 또는 환자로부터의 샘플에서 마커(예를 들어, 본 명세서에 기술된 바와 같은 종양 항원)의 비정상적 수준을 검출하거나 측정하는 것을 포함한다. 일부 실시형태에서, 방법은 본 명세서에 기술된 바와 같은 synTF 조성물을 환자에게 투여하는 것을 추가로 포함한다.
일부 실시형태에서, 대상체는 참조에 비해 본 명세서에 기술된 분석물의 비정상적 수준을 갖는 것으로 이전에 결정된 적이 있다. 일부 실시형태에서, 참조 수준은 유사한 세포 유형, 샘플 유형, 샘플 처리의 샘플에서의 수준, 및/또는 샘플/대상체와 유사한 연령, 성별 및 기타 인구통계학적 파라미터의 대상체로부터 얻은 수준일 수 있다. 일부 실시형태에서, 시험 샘플 및 대조군 참조 샘플은 동일한 유형의 것, 즉 동일한 생물학적 공급원으로부터 수득된 것이고, 동일한 조성, 예를 들어, 동일한 수와 유형의 세포를 포함한다.
본 명세서에 사용되는 용어 "샘플" 또는 "시험 샘플"은 생물학적 유기체, 예를 들어, 대상체의 혈액 또는 혈장 샘플에서 채취하거나 단리한 샘플을 나타낸다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 기술은 생물학적 샘플의 여러 예를 포함한다. 임의의 양태의 일부 실시형태에서, 생물학적 샘플은 세포, 또는 조직, 또는 말초 혈액, 또는 체액이다. 예시적인 생물학적 샘플은, 이로만 제한되는 것은 아니지만, 생검, 종양 샘플, 생체 유체 샘플; 혈액; 혈청; 혈장; 소변; 정액; 점액; 조직 생검; 장기 생검; 활액; 담즙액; 뇌척수액; 점막 분비물; 유출물(effusion); 땀; 타액; 및/또는 조직 샘플 등을 포함한다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. 용어 "시험 샘플"은 미처리 또는 전처리(또는 사전-가공)된 생물학적 시료도 포함한다. 임의의 양태의 일부 실시형태에서, 시험 샘플은 대상체로부터의 세포를 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 설명된 분석물의 비정상적 수준을 가지고 있는지 여부를 결정하는 단계는 i) 대상체로부터 샘플을 얻거나 얻은 적이 있는 단계 및 ii) 대상체의 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 시료에 대해 어세이를 수행하거나 수행한 적이 있는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체에서 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대해 분석을 수행하거나 수행한 적이 있는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체로부터 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대한 분석을 주문하거나 요청하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 분석물의 비정상적 수준을 갖는지 여부를 결정하는 단계는 대상체에서 분석물의 수준을 결정/측정하기 위해 대상체로부터 얻은 샘플에 대한 분석 결과를 수신하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체가 본 명세서에 기술된 비정상적 수준의 분석물을 갖고 있는지 여부를 결정하는 단계는 대상체를 감소된 수준의 분석물을 갖는 대상체로 확인하는 보고, 결과 또는 다른 수단을 수신하는 단계를 포함할 수 있다.
임의의 실시형태의 한 양태에서, 암(또는 본 명세서에 기술된 바와 같은 또 다른 질병 또는 장애)의 치료가 필요한 대상체에서 암(또는 본 명세서에 기술된 바와 같은 또 다른 질환 또는 장애)을 치료하는 방법이 본 명세서에 기술되며, 상기 방법은 다음을 포함한다: a) 대상체가 본 명세서에 기술된 비정상적 수준의 분석물을 가지고 있는지 여부를 결정하는 단계; 및 b) 분석물의 수준이 참조에 비해 증가하거나 비정상인 경우 대상체에게 본 명세서에 기술된 바와 같은 synTF 조성물을 투여하도록 지시하거나 또는 유도하는 단계. 임의의 양태의 일부 실시형태에서, 대상체에게 특정 치료를 투여하도록 지시하거나 또는 유도하는 단계는 분석 결과의 보고를 제공하는 단계를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체에게 특정 치료를 투여하도록 지시하거나 유도하는 단계는 분석 결과의 보고 및/또는 분석 결과를 고려한 치료 권고를 제공하는 단계를 포함할 수 있다.
한 양태에서, synTF의 활성을 조절하는 방법이 본 명세서에 기술되며, 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF를 포함하는 세포 집단을 제공하는 단계; 및 (b) 세포 집단을 조절인자 단백질 인듀서의 유효량과 접촉시키는 단계.
한 양태에서, 관심 유전자의 발현을 조절하는 방법이 본 명세서에 기술되며, 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 세포 집단을 제공하는 단계; 및 (b) 세포 집단을 조절인자 단백질 인듀서의 유효량과 접촉시키는 단계를 포함한다.
한 양태에서, 세포-기반 요법이 필요한 대상체를 치료하는 방법이 본 명세서에 기술되어 있다. 임의의 양태의 일부 실시형태에서, 세포-기반 요법이 필요한 대상체는 관심 유전자의 조절된 발현으로부터 이익을 얻을 임의의 대상체를 포함한다. 임의의 양태의 일부 실시형태에서, 세포-기반 요법을 필요로 하는 대상체는 암, 자가면역, 또는 본 명세서에 기술된 바와 같은 또 다른 질환 또는 장애를 갖는 대상체를 포함한다. 임의의 양태의 일부 실시형태에서, 대상체는 재생 의학 및/또는 면역요법을 필요로 하는 유전적 장애가 있다. 따라서, 상기 방법은 다음 단계를 포함한다: (a) 본 명세서에 기술된 바와 같은 synTF 시스템을 포함하는 세포 집단을 대상체에게 투여하는 단계; 및 (b) 조절인자 단백질 인듀서의 유효량을 대상체에게 투여하는 단계.
synTF가 전사 액티베이터 및 억제성 프로테아제, 유도 근접 도메인, 및/또는 세포질 격리 도메인을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재 하에, synTF는 켜짐이고 관심 유전자의 전사는 켜짐이며; 조절인자 단백질 인듀서의 부재하에, synTF는 꺼짐이고 관심 유전자의 전사는 꺼짐이다.
synTF가 전사 리프레서 및 억제성 프로테아제, 유도 근접 도메인, 및/또는 세포질 격리 도메인을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재하에, synTF는 켜짐이고 관심 유전자의 전사는 꺼짐이고; 조절인자 단백질 인듀서가 부재하에, synTF는 꺼짐이고 관심 유전자의 전사는 켜짐이다.
synTF가 전사 액티베이터 및 유도된 분해 도메인(예를 들어, SMASh)을 포함하는 실시형태에서, 조절인자 단백질 인듀서의 존재 하에, synTF는 꺼짐이고 관심 유전자의 전사는 꺼짐이며; 조절인자 단백질 인듀서가 없는 경우 synTF는 켜짐이고 관심 유전자의 전사는 켜짐이다.
임의의 양태의 일부 실시형태에서, 세포 집단은 면역 세포를 포함한다. 임의의 양태의 일부 실시형태에서, 면역 세포의 집단은 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함한다.
임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는 세포 집단이 투여되는 것과 동시에 투여된다. 임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는 세포 집단이 투여된 후에 투여된다. 비제한적 예로서, 조절인자 단백질 인듀서는 세포 집단이 투여된 후 적어도 1분, 적어도 2분, 적어도 3분, 적어도 4분, 적어도 5분, 적어도 10분, 적어도 20분, 적어도 30분, 적어도 1시간, 적어도 2시간, 적어도 3시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 2일, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 6일, 적어도 7일, 적어도 1.5주, 적어도 2주, 적어도 3주, 적어도 4주, 적어도 5주, 적어도 6주, 적어도 7주, 적어도 적어도 8주, 적어도 9주, 적어도 10주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 4개월, 적어도 5개월, 적어도 6개월, 적어도 7개월, 적어도 세포 집단이 투여된 후 8개월, 적어도 9개월, 적어도 10개월, 적어도 11개월, 또는 적어도 1년에 투여된다. 임의의 양태의 일부 실시형태에서, 조절인자 단백질 인듀서는, 예를 들어, IV를 사용하여 연속적으로 투여된다.
암
다양한 실시형태에서, synTF 시스템을 포함하는 세포를 사용하여 암을 치료할 수 있다. 일부 실시형태에서, 암을 치료하기 위해 관심 있는 항암 유전자를 발현하는 synTF 시스템을 포함하는 면역 세포(예를 들어, T 세포).
본 명세서에 사용되는 용어 "암"은 일반적으로 비정상적인 세포가 통제 없이 분열하고 주변 조직을 침범할 수 있는 질병 또는 상태의 부류에 관한 것이다. 암세포는 또한 혈액과 림프 시스템을 통해 신체의 다른 부분으로 퍼질 수 있다. 암에는 몇 가지 주요 유형이 있다. 암종(carcinoma)은 피부 또는 내부 장기를 덮거나 연결하는 피부 또는 조직에서 시작되는 암이다. 육종(sarcoma)은 뼈, 연골, 지방, 근육, 혈관 또는 기타 결합 또는 지지 조직에서 시작되는 암이다. 백혈병은 골수와 같은 혈액 형성 조직에서 시작하여, 많은 수의 비정상 혈액 세포가 생성되어 혈액으로 들어가도록 야기하는 암이다. 림프종과 다발성 골수종은 면역 시스템의 세포에서 시작되는 암이다. 중추신경계 암은 뇌와 척수의 조직에서 시작되는 암이다.
임의의 양태의 일부 실시형태에서, 암은 원발성 암이다. 임의의 양태의 일부 실시형태에서, 암은 악성 암이다. 본 명세서에 사용되는 용어 "악성"은 종양 세포의 그룹이 제어되지 않는 성장(즉, 정상 한계를 넘어서는 분열), 침범(즉, 인접 조직에 대한 침입 및 파괴), 및 전이(즉, 림프 또는 혈액을 통해 신체의 다른 위치로 퍼짐) 중 하나 이상을 나타내는 암을 지칭한다. 본 명세서에 사용되는 용어 "전이하다"는 신체의 한 부분에서 다른 부분으로의 암의 확산을 의미한다. 전이된 세포에 의해 형성된 종양을 "전이성 종양" 또는 "전이"라고 한다. 전이성 종양은 원래(원발성) 종양에 있는 것과 유사한 세포를 포함한다. 본 명세서에 사용되는 용어 "양성" 또는 "비악성"은 더 커질 수 있지만 신체의 다른 부분으로 퍼지지 않는 종양을 지칭한다. 양성 종양은 자가-제한적이며 일반적으로 침범하거나 전이하지 않는다.
"암 세포" 또는 "종양 세포"는 암성 성장 또는 조직의 개별 세포를 의미한다. 종양은 일반적으로 양성, 전악성, 또는 악성일 수 있는, 세포의 비정상적 성장에 의해 형성된 부종 또는 병변을 지칭한다. 대부분의 암세포는 종양을 형성하지만, 일부(예를 들어, 백혈병)는 반드시 종양을 형성하는 것은 아니다. 종양을 형성하는 암세포의 경우, 암(세포)과 종양(세포)이라는 용어는 상호교환적으로 사용된다.
본 명세서에 사용되는 용어 "신생물"은 조직의 임의의 신규 및 비정상 성장, 예를 들어, 조직의 비정상 덩어리를 지칭하며, 이의 성장은 정상 조직의 성장을 초과하고 조정되지 않는다. 따라서, 신생물은 양성 신생물, 전악성 신생물, 또는 악성 신생물일 수 있다.
암 또는 종양이 있는 대상체는 대상체의 신체에 객관적으로 측정가능한 암세포가 존재하는 대상체이다. 이 정의에는 잠재적으로 잠복하는 종양 또는 미세전이뿐만 아니라 악성, 활발하게 증식하는 암이 포함된다. 원래 위치에서 이동하여 다른 중요한 장기에 씨를 뿌린 암은 결국 영향을 받은 장기의 기능 악화를 통해 대상체의 사망을 야기할 수 있다.
암의 예로는, 이로만 제한되는 것은 아니지만, 암종, 림프종, 모세포종, 육종, 백혈병, 기저 세포 암종, 담도암; 방광암; 골암; 뇌 및 CNS 암; 유방암; 복막의 암; 자궁 경부암; 융모막암종(choriocarcinoma); 결장 및 직장암; 결합 조직 암; 소화 시스템의 암; 자궁내막암; 식도암; 안암; 두경부의 암; 위암(위장암 포함); 교모세포종(glioblastoma, GBM); 간세포성 암종(hepatic carcinoma); 헤파토마(hepatoma); 상피내 신생물; 신장(kidney) 또는 신세포(renal) 암; 후두암; 백혈병; 간(liver) 암; 폐암(예를 들어, 소세포 폐암, 비-소세포 폐암, 폐의 선암종, 및 폐의 편평상피암종); 호지킨 림프종 및 비-호지킨 림프종을 포함하는 림프종; 흑색종; 골수종; 신경 모세포종; 구강암(예를 들어, 입술, 혀, 입, 및 인두); 난소암; 췌장암; 전립선암; 망막모세포종; 횡문근육종; 직장암; 호흡기 시스템의 암; 타액선 암종; 육종; 피부암; 편평 세포암; 위암; 고환암; 갑상선 암; 자궁 또는 자궁내막암; 비뇨기 시스템의 암; 외음부암; 뿐만 아니라, 다른 암종 및 육종; 뿐만 아니라, B-세포 림프종(하위 등급/여포성 비호지킨 림프종(NHL), 소림프구성(SL) NHL, 중위 등급/여포성 NHL, 중위 등급 미만성 NHL, 상위 등급 면역모세포성 NHL; 상위 등급 림프모구 NHL; 상위 등급 소형 비-절단 세포 NHL; 벌키 질병 NHL; 외투 세포 림프종; AIDS-관련 림프종; 및 발덴스트롱(Waldenstrom)의 거대글로불린혈증); 만성 림프구성 백혈병(CLL); 급성 림프구성 백혈병(ALL); 헤어리 세포 백혈병; 만성 골수성 백혈병; 및 이식-후 림프증식성 장애(PTLD), 뿐만 아니라 모반증(phakomatoses), 부종(예컨대, 뇌종양과 관련된 부종), 및 메이그(Meig) 증후군과 관련된 비정상적인 혈관 증식을 포함한다.
"암 세포"는 생체내, 생체외 또는 조직 배양에서 암성, 전-암성 또는 형질전환된 세포로서, 반드시 새로운 유전 물질의 흡수를 수반하지 않는 자발적 또는 유도된 표현형 변화를 나타낸다. 형질전환은 형질전환 바이러스로의 감염 및 새로운 게놈 핵산의 도입, 또는 외인성 핵산의 흡수로 인해 발생할 수 있지만, 자연적으로 발생하거나 발암물질에 노출된 후 발생하여, 내인성 유전자를 돌연변이시킬 수도 있다. 형질전환/암은, 예를 들어, 형태학적 변화, 세포의 불멸화, 비정상적인 성장 조절, 병소 형성, 고정 독립성(anchorage independence), 악성, 접촉 억제의 상실 및 성장의 밀도 제한, 성장 인자 또는 혈청 독립성, 종양 특이적 마커, 침습성 또는 전이, 및 누드 마우스와 같은 적합한 동물 숙주에서의 종양 성장과 연관되어 있다.
자가면역 질환
다양한 실시형태에서, synTF 시스템을 포함하는 세포는 자가면역 질환을 치료하는 데 사용될 수 있다. 일부 실시형태에서, 자가면역 질환-특이적 항원에 대해 유도된 관심 유전자를 발현하는 synTF 시스템을 포함하는 면역 세포(예를 들어, T 세포)는 자가면역 질환을 치료하는 데 사용될 수 있다. "자가면역 질환"은 대상체 자신의 항체가 숙주 조직과 반응하거나, 또는 면역 이펙터 T 세포가 내인성 자가-펩티드에 자가반응하여 조직 파괴를 유발하는 질환의 부류를 지칭한다. 따라서 면역 반응은 자가 항원으로 지칭되는 대상체 자신의 항원에 대해 유발된다. 본 명세서에서 "자가-항원"은 정상 숙주 조직의 항원을 의미한다. 정상적인 숙주 조직은 신생물 세포를 포함하지 않는다.
본 명세서에 사용된, 자가항원은 이러한 병원성 면역 반응을 유발하는 내인성 단백질 또는 이의 단편이다. 자가항원은, 자가면역 질환에서, 면역 시스템에 의한 공격의 1차(또는 1차) 표적이 되는 포유동물 내에서 정상적으로 발견되는 임의의 물질 또는 이의 부분일 수 있다. 이 용어는 또한 포유동물에게 투여될 때 자가면역 질환의 특징을 갖는 상태를 유도하는 항원 물질을 포함한다. 추가로, 이 용어는 자가항원의 면역우성 에피토프 또는 면역우성 에피토프 영역으로 본질적으로 구성된 소화성 서브클래스를 포함한다. 유도된 자가면역 상태의 면역우성 에피토프 또는 영역은 질병을 유도하기 위해 전체 자가항원 대신에 사용될 수 있는 자가항원의 단편이다. 자가면역 질환에 걸린 인간에서, 면역우성 에피토프 또는 영역은 자가면역 공격 하에 있는 조직 또는 기관에 특이적인 항원의 단편이며 자가면역 공격 T-세포의 상당한 비율(예를 들어, 반드시 절대 다수는 아니지만 다수)에 의해 인식된다.
자가면역 질환과 관련된 것으로 알려진 자가항원은 탈수초성 질환(예를 들어, 다발성 경화증 및 실험적 자가면역 척수염)이 있는 수초 단백질; 콜라겐 및 류마티스 관절염; 인슐린, 프로인슐린, 글루탐산 탈탄산효소 65(GAD65); 인슐린 의존성 당뇨병이 있는 이자(islet) 세포 항원(ICA512; ICA12)을 포함한다.
다수의 자가면역 관련 질병 및 염증 상태의 공통된 특징은 전염증성 CD4+ T 세포의 관여이다. 이들 T 세포는 염증성 Th1 유형 사이토카인의 방출을 담당한다. Th1 유형을 특징으로 하는 사이토카인은 인터루킨 2(IL-2), γ-인터페론, TNFα 및 IL-12를 포함한다. 이러한 전염증성 사이토카인은 면역 반응을 자극하는 작용을 하여, 많은 경우 자가 조직의 파괴를 초래한다. T 세포 반응의 억제와 관련된 사이토카인은 Th2 유형이며, IL-10, IL-4 및 TGF-β를 포함한다. Th1 및 Th2 유형 T 세포는 면역원에 반응하여 동일한 항원 수용체를 사용할 수 있음이 밝혀졌고; 전자는 자극성 반응을 생성하고 후자는 억제적 반응을 생성한다.
본 명세서에는 자가면역 질환의 치료를 필요로 하는 환자에게 유효량의 synTF 조성물을 투여하는 것을 포함하는, 자가면역 질환의 치료 방법이 제공된다. 기재된 방법 중 어느 하나의 한 실시형태에서, 자가면역 장애는 하기로 이루어진 그룹으로부터 선택된다: 갑상선염, 제1형 당뇨병, 하시모토 갑상선염, 그레이브스병, 체강병, 다발성 경화증, 길랭-바레 증후군, 애디슨병, 레이노 현상(Raynaud's phenomenon), 굿파스처병, 관절염(급성 관절염과 같은 류마티스 관절염, 만성 류마티스 관절염, 통풍 또는 통풍성 관절염, 급성 통풍성 관절염, 급성 면역학적 관절염, 만성 염증성 관절염, 퇴행성 관절염, II형 콜라겐-유도 관절염, 감염성 관절염, 라임 관절염, 증식성 관절염, 건선 관절염, 스틸병(Still's disease), 척추 관절염, 및 소아-발병 류마티스 관절염, 예후성 관절염(arthritis chronica progrediente), 기형 관절염, 원발성 다발성 관절염(polyarthritis chronica primaria), 반응성 관절염, 및 강직성 척추염(ankylosing spondylitis)), 염증성 과증식성 피부 질환, 판상 건선, 창자 건선, 농포성 건선, 및 손톱 건선과 같은 건선, 건초열 및 잡스 증후군과 같은 아토피성 질환을 포함하는 아토피, 접촉성 피부염, 만성 접촉성 피부염, 박리성 피부염, 알레르기성 피부염, 알레르기성 접촉성 피부염, 포진성 피부염, 문상 피부염(nummular dermatitis), 지루성 피부염, 비-특이적 피부염, 일차 자극성 접촉 피부염, 및 아토피성 피부염을 포함하는 피부염, x-연관 고 IgM 증후군, 알레르기성 안내 염증성 질환, 두드러기, 예컨대 만성 알레르기성 두드러기 및 만성 자가면역 두드러기를 포함하는, 만성 특발성 두드러기, 근염, 다발성 근염(polymyositis)/피부근염, 소아 피부근염, 독성 표피 괴사 용해, 경피증(전신성 경피증 포함), 경화증, 예컨대 전신성 경화증, 다발성 경화증, 예컨대 척추-광학(spino-optical) MS, 원발성 진행성 MS(PPMS), 및 재발 완화형 MS(RRMS), 진행성 전신성 경화증, 죽상동맥경화증, 동맥경화증, 확산성 경화증(sclerosis disseminata), 운동실조성 경화증, 시신경척수염(neuromyelitis optica, NMO), 염증성 장질환(IBD)(예를 들어, 크론병, 자가면역-매개 위장 질환, 대장염, 예컨대 궤양성 대장염(ulcerative colitis), 대장 궤양(colitis ulcerosa), 현미경적 대장염, 교원성 대장염(collagenous colitis), 용종성 대장염(colitis polyposa), 괴사성 장염(necrotizing enterocolitis), 및 경벽 대장염(transmural colitis), 및 자가면역 염증성 장 질환), 장 염증, 괴저성 농피증, 결절 홍반, 원발성 경화성 담관염, 성인 또는 급성 호흡 곤란 증후군(ARDS)을 포함하는 호흡 곤란 증후군, 수막염, 포도막(uvea) 전체 또는 일부의 염증, 홍채염, 맥락막염, 자가면역성 혈액 장애, 류마티스 척추염 , 류마티스성 활막염, 유전성 혈관부종, 수막염에서와 같은 뇌신경 손상, 임신 포진(herpes gestationis), 임신성 천포창(pemphigoid gestationis), 음낭 가려움증(pruritis scroti), 자가면역성 조기난소부전, 자가면역 상태로 인한 돌발성 난청, IgE-매개 질환, 예컨대 아나필락시스 및 알레르기성 및 아토피성 비염, 뇌염, 예컨대 라스무센 뇌염 및 변연 및/또는 뇌간 뇌염, 포도막염, 예컨대 전방 포도막염, 급성 전방 포도막염, 육아종성 포도막염, 비육아종성 포도막염, 수정체항원성 포도막염, 후방 포도막염, 또는 자가면역성 포도막염, 신증후군(nephrotic syndrome)이 있거나 없는 사구체신염(GN), 예컨대 만성 또는 급성 사구체신염, 예컨대 원발성 GN, 면역-매개 GN, 막성 GN(막성 신병증), 특발성 막성 GN 또는 특발성 막성 신병증, 유형 I 및 유형 II를 포함하는 막성- 또는 막성 증식성 GN(MPGN), 및 급속 진행성 GN, 증식성 신염, 자가면역 다선 내분비 부전, 형질세포성국한성귀두염(balanitis circumscripta plasmacellularis)을 포함하는 귀두염, 귀두포피염(balanoposthitis), 원심성환상홍반(erythema annulare centrifugum), 고정이색소성홍반(erythema dyschromicum perstans), 다형성 홍반(eythema multiform), 환상 육아종(granuloma annulare), 광택태선(lichen nitidus), 경화성위축성태선(lichen sclerosus et atrophicus), 만성 단순 태선, 가시성 태선, 편평 태선, 층판 어린선(lamellar ichthyosis), 표피용해성 과각화증(epidermolytic hyperkeratosis), 전암성 각화증, 괴저성 농피증, 알레르기성 상태 및 반응, 알레르기성 리액션(allergic reaction), 알레르기성 또는 아토피성 습진, 지방성 습진, 이한성 습진 및 수포성 손바닥 발바닥 습진을 포함한 습진, 천식, 예컨대 천식 기관지(asthma bronchiale), 기관지성 천식(bronchial asthma), 및 자가면역천식, T 세포의 침윤 및 만성 염증 반응을 포함하는 상태, 임신 중 태아 A-B-O 혈액형과 같은 외래 항원에 대한 면역 반응, 만성 폐염증 질환, 자가면역 심근염(autoimmune myocarditis), 백혈구 부착 결핍(leukocyte adhesion deficiency), 루푸스 신염, 루푸스 뇌염, 소아 루푸스, 비-신장성(non-renal) 루푸스, 신장 외 루푸스, 원판상 루푸스 및 원판상 홍반 루푸스(discoid lupus erythematosus), 탈모성 루푸, 전신성 홍반성 루푸스(SLE) 또는 피부 SLE 또는 아급성 피부 SLE와 같은 신생아 피부하 SLE(피부하 SLE), 신생아 루푸스 증후군(NLE) 및 파종성 홍반성 루푸스를 포함하는, 루프스, 소아 인슐린-의존성 당뇨병(IDDM)을 포함하는, 소아 발병(제1형) 당뇨병, 성인 발병 당뇨병(II형 당뇨병), 자가면역 당뇨병, 특발성 당뇨병성 요붕증(idiopathic diabetes insipidus), 당뇨병성 망막병증, 당뇨병성 신병증, 당뇨병성 대동맥 장애, 사이토카인 및 T-림프구에 의해 매개되는 급성 및 지연 과민반응과 연관된 면역 반응, 유육종증(sarcoidosis), 림프종 육아종증(lymphomatoid granulomatosis)을 포함한 육아종증, 베게너 육아종증, 무과립구증, 혈관염(vasculitis)을 포함하는 혈관염증(vasculitides), 대혈관 혈관염(류마티스성 다발성 근육통 및 거대 세포(다카야스) 동맥염 포함), 중형 혈관염(가와사키병 및 결절성 다발동맥염(polyarteritis nodosa)/결절성 동맥염(periarteritis nodosa) 포함), 현미경적 다발동맥염, 면역혈관염, CNS 혈관염, 피부 혈관염, 과민성 혈관염, 전신성 괴사성 혈관염과 같은 괴사성 혈관염, ANCA 관련 혈관염, 예컨대 크루그-스트라우스(Churg-Strauss) 혈관염 또는 증후군(CSS) 및 ANCA-관련 소혈관 혈관염, 측두 동맥염(temporal arteritis), 자가면역 재생불량성 빈혈, 쿰스(Coombs) 양성 빈혈, 다이아몬드 블랙판 빈혈, 자가면역 용혈성 빈혈(AIHA)을 포함한 용혈성 빈혈 또는 면역성 용혈성 빈혈, 악성 빈혈(pernicious anemia)(고립성 빈혈(anemia perniciosa)), 애디슨병, 순수 적혈구 빈혈 또는 무형성증(PRCA), 인자 VIII 결핍증, A형 혈우병, 자가면역 호중구감소증, 범혈구감소증, 백혈구감소증, 백혈구 혈관누출(leukocyte diapedesis) 관련 질환, CNS 염증성 장애, 패혈증에 이차적인 것과 같은 다발성 장기 손상 증후군, 트라우마 또는 출혈, 항원-항체 복합체 매개 질환, 항-사구체 기저막 질환, 항-인지질항체 증후군, 알레르기성 신경염, 베체트 질환/증후군, 캐슬만(Castleman) 증후군, 굿파스처(Goodpasture) 증후군, 레이노(Reynaud) 증후군, 쇼그렌(Sjogren) 증후군, 스티븐스-존슨(Stevens-Johnson) 증후군, 천포창 수포성 및 피부 천포창과 같은 천포창, 천포창(심상 천포창, 폴리아세우스 천포창, 천포창 점액-막 천포창 및 홍반성 천포창 포함), 자가면역 다발내분비병증, 라이터병 또는 증후군, 면역복합신염과 같은 면역복합질환, 항체-매개성 신염, 다발성신경병증, IgM 다발신경병증 또는 IgM 매개 신경병증과 같은 만성 신경병증 및 만성 또는 급성 ITP를 포함하는 특발성 혈소판 감소성 자반병(ITP)과 같은 자가면역 또는 면역-매개 혈소판 감소증, 공막염, 예컨대 특발성 각막 공막염(idiopathic cerato-scleritis), 상공막염, 자가면역 고환염(autoimmune orchitis) 및 난소염(oophoritis)을 포함한 고환 및 난소의 자가면역 질환, 원발성 갑상선기능저하증, 부갑상선기능저하증, 자가면역갑상선염과 같은 갑상선염, 하시모토병, 만성갑상선염(하시모토 갑상선염), 또는 아급성갑상선염을 포함한 자가면역 내분비질환, 특발성 갑상선기능저하증, 그레이브병, 자가면역 다선 증후군(또는 다선 내분비병증 증후군)과 같은 다선 증후군, 램버트-이튼(Lambert-Eaton) 근무력 증후군 또는 이튼-랩버트 증후군과 같은 신경학적 부신생물 증후군을 포함하는, 부신생물 증후군, 강직한 남성(stiff-man) 또는 강직한 사람(stiff-person) 증후군, 알레르기성 뇌척수염(allergic encephalomyelitis) 또는 뇌척수염성 알레르기(encephalomyelitis allergica)과 같은 뇌척수염 및 실험적 알레르기성 뇌척수염(EAE), 흉선종-관련 중증 근무력증, 소뇌 변성, 신경근긴장증, 옵소클로누스(opsoclonus) 또는 옵소클로누스 간대성 근경련 증후군(OMS), 및 감각 신경병증과 같은 중증 근무력증, 다초점 운동 신경병증, 쉬한(Sheehan) 증후군, 자가면역 간염, 루푸스 간염, 거대 세포 간염, 자가면역 만성 활동성 간염, 림프성 간질성 폐렴(LIP), 폐쇄성 세기관지염(비-이식) 대(vs) NSIP, 길랭-바레(Guillain-Barre) 증후군, 베르거(Berger) 신병증(IgA 신병증), 특발성 IgA 신병증, 선형 IgA 피부병, 급성 열성 호중구 피부병, 각막하 농포성 피부병, 일과성 가극세포 용해성 피부병(transient acantholytic dermatosis), 원발성 담즙성 간경변증 및 폐렴 간경변증과 같은 간경변증, 자가면역 장병증 증후군, 체강(체강) 또는 체강병(Coeliac disease), 셀리악 스프루(글루텐 장병증), 난치성 스프루, 특발성 스프루, 한랭글로불린혈증, 편도 위축성 측삭 경화증(ALS; 루게릭병), 관상동맥 질환, 자가면역 내이 질환(AIED)과 같은 자가면역 귀 질환, 자가면역 청력 상실, 불응성 또는 재발(relapsed) 또는 재발성(relapsing) 다발연골염(polychondritis)과 같은 다발연골염, 폐포 단백증(pulmonary alveolar proteinosis), 코간 증후군/비매독 간질 각막염, 벨 마비, 스위트병/증후군, 자가면역 주사비(rosacea autoimmune), 조스터-관련 통증, 아밀로이드증, 비-암성 림프구증가증, 단클론성 B 세포 림프구증가증(예를 들어, 양성 단클론성 감마병증 및 미확인 중요성의 단클론성 감마병증, MGUS)을 포함하는 원발성 림프구증가증, 말초 신경병증, 종양 부종 증후군, CNS의 채널병증(channelopathies)을 포함한 채널병증, 자폐증, 염증성 근병증, 국소 또는 분절 또는 국소 분절 사구체경화증(FSGS), 내분비 안과병증, 포도막망막염, 맥락망막염, 자가면역 간 질환(autoimmune hepatological disorder), 섬유근육통, 다발성 내분비 부전, 슈미트 증후군, 부신염, 위 위축, 자가면역 탈수초성 질환 및 만성 염증성 탈수초성 다발신경병증과 같은 탈수초성 질환(demyelinating diseases), 드레슬러(Dressler) 증후군, 원형 탈모증, 전두 탈모증, CREST 증후군(석회화증, 레이노 현상, 식도 운동장애, 경화증, 모세혈관확장증), 남성 및 여성 자가면역 불임(예를 들어, 항-정자 항체로 인한), 혼합 결합 조직 질환, 샤가스(Chagas) 질환, 류마티스열, 반복 유산, 농부의 폐, 다형 홍반(erythema multiforme), 심장절개후 증후군(post-cardiotomy syndrome), 쿠싱(Cushing) 증후군, 버드팬시(bird-fancier) 폐, 알레르기 육아종성 혈관염, 양성 림프구성 혈관염, 알포트(Alport) 증후군, 알레르기성 폐포염 및 섬유화성 폐포염과 같은 폐포염, 간질성 폐질환, 수혈 반응, 샘프터(Sampter) 증후군, 카플란(Caplan) 증후군, 심내막염, 심근내막 섬유증, 미만성 간질성 폐섬유증, 간질성 폐 섬유증, 폐섬유증, 특발성 폐섬유증, 낭포성 섬유증, 안구내염, 지속융기홍반(erythema elevatum et diutinum), 태아 적혈구증, 호산구성 안면염, 슐만(Shulman) 증후군, 펠티(Felty) 증후군, 모양체염, 예컨대 만성 모양체염(chronic cyclitis), 헤테로만성 모양체염, 홍체모양체염(iridocyclitis)(급성 또는 만성) 또는 푸치(Fuch) 모양체염, 히노치-숀레인(Henoch-Schonlein) 자반병, SCID, 패혈증, 내독소혈증, 예방접종 후 증후군, 에반(Evan) 증후군, 자가면역 생식선 부전, 시드남 무도병(Sydenham's chorea), 연쇄상 구균 후 신염, 혈전혈관염(thromboangitis ubiterans), 갑상선 중독증, 척수매독(tabes dorsalis), 맥락막염, 거대 세포 다발성 근육통, 만성 과민성 폐렴, 건성 각결막염(keratoconjunctivitis sicca), 특발성 신염 증후군, 최소 변화 신병증, 양성 가족성 및 허혈 재관류 손상, 이식장기 재관류, 망막 자가면역, 아프타(aphthae), 아프타성 구내염, 동맥경화 장애, 무정자형성(aspermiogenesis), 자가면역 용혈, 보엑 질환(Boeck's disease), 알레르기성 장염, 결절성 홍반, 특발성 안면마비, 만성 피로 증후군, 류마티스성 열병, 함만-리치 질환(Hamman-Rich's disease), 감각신경성 청력 상실, 국소 회장염, 백혈구 감소증, 횡단 척수염, 원발성 특발성 점액종, 교감 안염(ophthalmia symphatica), 급성 다발성신경근염, 괴저 농피증, 후천성 비장 위축, 백반증, 독성 쇼크 증후군, T 세포 침윤과 관련된 상태, 백혈구 부착 결핍증, 사이토카인 및 T-림프구에 의해 매개되는 급성 및 지연 과민반응과 관련된 면역 반응, 백혈구 혈관누출과 관련된 질환, 다발성 장기 손상 증후군, 항원-항체 복합체 매개 질환, 항-사구체 기저막 질환, 알레르기성 신경염, 자가면역 다내분비병증(autoimmune polyendocrinopathies), 난소염, 원발성 점액종, 자가면역 위축성 위염, 류마티스 질환, 혼합 결합 조직 질환, 신증후군, 췌도염(insulitis), 다내분비 부전, 자가면역 다선성 증후군 I형, 성인-발병 특발성 부갑상선기능저하증(AOIH), 심근염, 신 증후군, 원발성 경화성 담관염, 급성 또는 만성 부비동염, 사골(ethmoid), 전두(frontal), 상악(maxillary), 또는 접형골(sphenoid ) 부비동염, 호산구 관련 장애, 예컨대 호산구 증가증, 폐 침윤 호산구 증가증, 폐침윤 호산구 증가증, 호산구 증가 근육통 증후군(eosinophilia-myalgia syndrome), 로플러(Loffler) 증후군, 만성 호산구성 폐렴, 열대성 폐 호산구 증가증, 호산구 함유 육아종, 혈청 음성 척추관절염, 다내분비 자가면역 질환, 경화성 담관염, 공막(sclera), 상공막(episclera), 브루톤(Bruton) 증후군, 유아(infancy)의 일과성 저감마글로불린혈증, 비스코트-얼드리치 증후군(Wiskott-Aldrich Syndrome), 미세혈관확장성운동실조(ataxia telangiectasia syndrome), 혈관확장증, 콜라겐 질환과 관련된 자가면역 장애, 류머티즘, 알레르기 과민성 장애, 사구체신염, 재관류 손상, 허혈성 재관류 장애, 림프종성 기관기관지염, 염증성 피부병(inflammatory dermatoses), 급성 염증성 성분이 있는 피부병, 및 자가면역 포도막염(autoimmune uveoretinitis)(AUR).
유전적 장애
다양한 실시형태에서, synTF 시스템을 포함하는 세포는 유전적 장애를 치료하는데 사용될 수 있다. 일부 실시형태에서, 결함있는 유전자를 대체하는 관심 유전자를 발현하는 synTF 시스템을 포함하는 세포는 유전적 장애를 치료하는 데 사용될 수 있다. 일부 실시형태에서, 세포는 줄기 세포이다.
본 명세서에 기술된 synTF 시스템 또는 세포를 사용하여 치료될 수 있는 유전적 장애의 비제한적인 예는 다음을 포함한다: 혈색소병증; b-지중해 빈혈 메이저; α- 지중해 빈혈 메이저; 겸상 적혈구 빈혈; 면역결핍 질환; 중증 복합 면역결핍 증후군; 베어 림프구 증후군; 만성 육아종 질환; 비스코트-얼드리치 증후군(Wiskott-Aldrich Syndrome); 영아 무과립구증(코스트만 증후군); 태만 백혈구 증후군(호중구 액틴 결핍증); 호중구 막 GP-180 결핍증; 무감마글로불린혈증; X-연관 림프증식성 증후군; X-연관 고-IgM 증후군; 신진 대사의 선천적 오류; 점액다당류; 헐러병(MPS-1)(α-이두로니다제 결핍증); 헐러-샤이에 증후군(Hurler-Scheie syndrome); 헌터병(MPS-II)(이두로네이트 설파타제 결핍증); 산필리포 B(MPS-IIIB)(α-글리코사미니다제 결핍증); 모르퀴오(MPS-IV)(헥소사민-6-설파타제 결핍증); 마로토-라미 증후군(MPS-VI)(아릴설파타제 B 결핍증); 슬라이(Sly) 증후군(MPS-VII)(b-글루쿠로니다제 결핍증); 점액지질증; 파브리병(Fabry disease)(α-갈락토시다제 A 결핍증); 고셔병(글루코세레브로시다제 결핍증); 크라베병(Krabbe disease)(갈락토실세라미다제 결핍증); 이색성 백혈구 이영양증(아릴설파타제 A 결핍, 니만-픽병(스핑고미엘리나제 결핍; 부신 백질이영양증(Adrenal leukodystrophy); I-세포 점액 지질증 I;, 조혈 질환; 골화석증(Osteopetrosis); 다이아몬드-블랙판 증후군; 및 판코니 빈혈.
Ⅷ.
정의
편의상, 명세서, 실시예 및 첨부된 특허청구범위에 사용된 일부 용어 및 구문의 의미가 아래에 제공된다. 달리 명시되지 않거나 문맥에서 암시되지 않는 한, 다음 용어 및 어구는 아래 제공된 의미를 포함한다. 정의는 특정 실시형태를 설명하는 데 도움을 주기 위해 제공되며, 본 발명의 범위는 청구범위에 의해서만 제한되기 때문에 청구된 발명을 제한하도록 의도되지 않는다. 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 해당 기술 분야에서 용어의 사용과 여기에 제공된 정의 사이에 명백한 불일치가 있는 경우 본 명세서에 제공된 정의가 우선한다.
편의를 위해, 명세서, 실시예 및 첨부된 청구범위에서, 사용된 특정 용어가 여기에 모여있다.
본 명세서에 사용되는 용어 "조작된 반응성 리포터" 또는 "조작된 전사 단위"는 리포터 유전자에 작동가능하게 연결된 조작된 프로모터를 함유하는 핵산 구축물이고, 리포터 유전자의 발현은 상류 조절 요소, 예컨대 조작된 프로모터에서 직교 DNA 표적 서열(들)에 의해 제어된다. 리포터 유전자는 일반적으로 유전자 산물인 전사된 단백질, 예를 들어, 녹색 형광 단백질이 쉽게 검출되고 모니터링되는 것이다.
본 명세서에 사용된 바와 같이, 당업계에서 사용되는 용어 "프로모터"는 특정 유전자의 전사를 개시하고 RNA 폴리머라제가 결합하여 전사를 개시하는 DNA 영역이다. 프로모터는 유전자의 전사 시작 부위 근처, 동일한 가닥 및 DNA 상류에 위치한다.
본 명세서에 사용되는 용어 "직교"는 DNA 서열 및 게놈 생물학에서 사용될 때 "직교"는 진핵 시스템에서 천연에서 자연적으로 발생하는 것과 매우 상이한 DNA 서열을 의미한다.
조작된 프로모터 또는 조작된 전사 단위 또는 조작된 반응성 리포터와 관련하여 본 명세서에 사용되는 용어 "반응성", 이 용어는 상류 근처의 직교 DNA 표적 서열이 각각의 ZF-함유 합성 전사 인자에 의해 결합될 때 프로모터로부터의 유전자 전사 개시가 강화되거나 억제되는지 여부를 지칭한다.
본 명세서에 사용되는 용어 "작동가능하게 연결된"은 핵산 구축물, 조작된 반응성 리포터 및 조작된 전사 단위에서 본 명세서에 기술된 직교 DNA 표적 서열 또는 프로모터 서열(RNA 중합효소 결합 부위)과 관련하여 사용될 때 직교 DNA 표적 서열 및 프로모터가 인-프레임(in-frame)으로 존재하고, 전사 인자 또는 전사에 대한 RNA 폴리머라제에 의한 각각의 결합 효과를 허용하기 위해 단백질 또는 펩티드 또는 RNA를 코딩하는 핵산으로부터 적절한 공간 및 거리에 있음을 의미한다.
용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며, 선형 또는 원형 형태 및 단일- 또는 이중-가닥 형태의 데옥시리보뉴클레오티드(DNA) 또는 리보뉴클레오티드(RNA) 중합체를 지칭한다. 본 개시의 목적을 위해, 이러한 DNA 또는 RNA 중합체는 천연 뉴클레오티드, 비-천연 또는 합성 뉴클레오티드, 및 이들의 혼합물을 포함할 수 있다. 비천연 뉴클레오티드는 천연 뉴클레오티드의 유사체 뿐만 아니라 염기, 당 및/또는 인산염 모이어티(예를 들어, 포스포로티오에이트 골격)에서 변형된 뉴클레오티드를 포함할 수 있다. 변형된 핵산의 비제한적인 예는 PNA 및 모르폴리노 핵산이다. 일반적으로 특정 뉴클레오티드의 유사체는 동일한 염기쌍 특이성을 가지며, 즉 G의 유사체는 C와 염기쌍을 이룰 수 있다. 본 개시의 목적을 위해, 이러한 용어는 중합체의 길이와 관련하여 제한하는 것으로 간주되어서는 안된다.
본 명세서에 사용된, "유전자"는 폴리펩티드 또는 리보핵산 유전자 생성물의 생산에 관여하는 핵산(전형적으로 DNA)의 세그먼트이다. 이것은 코딩 영역(리더 및 트레일러)의 앞뒤 영역을 비롯한 개별 코딩 세그먼트(엑손) 사이의 개재 서열(인트론)을 포함한다. 편리하게는, 이 용어는 또한 관련 코딩 서열에 인접하거나 또는 멀리 떨어져 있을 수 있는 유전자 발현에 필요한 제어 서열(예를 들어, 인핸서, 사일런서, 프로모터, 터미네이터 등) 뿐만 아니라, 유전자 생성물을 코딩하는 코딩 및/또는 전사된 영역을 포함한다.
본 명세서에 사용되는 용어 "조절(modulation)"은 유전자 발현과 관련하여 유전자 활성의 변화를 의미한다. 조절은 활성화(즉, 활성 또는 발현 수준의 증가)와 유전자 활성의 억제 또는 저해를 모두 포함한다. 본 개시의 바람직한 실시형태에서, 본 개시의 치료 분자(예를 들어, 펩티드)는 유전자 발현 또는 활성의 리프레서이다.
본 명세서에 사용된, 핵산 "표적", "표적 부위" 또는 "표적 서열" 또는 "DNA 표적 서열"은 본 개시의 synTF의 ZFA가 결합할 핵산 서열이며, 단, 결합 반응의 조건은 제한적이지 않다. 표적 부위는 핵산 분자 또는 더 큰 폴리뉴클레오티드의 일부일 수 있다. 본 개시에 따르면, 본 개시의 synTF에서 ZFA에 대한 표적 서열은 단일 인접 핵산 서열을 포함할 수 있다. 이들 용어는 또한 상호교환적으로 사용되는 "결합 부위", "결합 서열", "인식 부위" 또는 인식 서열"이라는 용어로 대체되거나 보충될 수 있다.
본 명세서에 사용된 "결합(binding)"은 거대분자 간의 비공유 상호작용(예를 들어, ZF 어레이 함유 단백질과 핵산 표적 부위 사이)을 지칭한다. 일부 경우에, 결합은 하나 이상의 특정 뉴클레오티드(또는 염기쌍)와 하나 이상의 특정 아미노산 사이와 같이 서열-특이적일 것이다. 그러나, 결합 상호작용의 모든 성분이 서열-특이적일 필요는 없다는 것이 이해될 것이다(예를 들어, DNA 백본에서 포스페이트 잔기와의 비-공유적 상호작용). 본 개시의 핵산 서열과 ZF 펩티드 간의 결합 상호작용은 결합 친화도 및/또는 해리 상수(Kd)를 특징으로 할 수 있다. 표적 부위에 결합하는 본 개시의 ZF 펩티드에 대한 적합한 해리 상수는 1 μM 이하, 1 nM 이하, 또는 1 pM 이하 정도(order)일 수 있다. "친화도"는 결합의 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 Kd 값과 상관관계가 있다. 본 개시의 ZF synTF는 DNA-결합 활성, RNA-결합 활성 및/또는 심지어 단백질-결합 활성을 가질 수 있다. 일부 실시형태에서, 본 개시의 ZF synTF는 서열 특이적 dsDNA-결합 활성을 갖도록 설계되거나 선택된다. 예를 들어, 특정 ZF 어레이 또는 단백질에 대한 표적 부위는 관련(concerned) ZF가 뉴클레오티드-특이적 결합이 가능한 서열이다. 그러나, ZF 어레이 또는 단백질의 아미노산 서열에 따라, 하나 이상의 표적 서열에 결합하거나 이를 인식할 수 있지만, 일반적으로 하나의 서열은, 개별 비-공유적 상호작용의 상대적 특이성에 의존하여, 임의의 다른 인식 서열에 대해 우선적으로 결합할 수 있다. 일반적으로, 특이적 결합은 바람직하게는 1 nM 이하, 100 pM 이하; 또는 10 pM 이하의 해리 상수(Kd)로 달성된다. 일부 실시형태에서, 본 개시의 ZF synTF는 1 nM 이하, 또는 1 pM 이하, 또는 0.1 pM 이하, 또는 심지어 10 fM 이하의 해리 상수로 특정 표적 서열에 결합한다.
"비-표적"은 관련된 핵산 서열이 관련 ZF 펩티드에 의해 인식할 수 있을 정도로 결합되지 않음을 의미한다. 일부 실시형태에서, 본 명세서에 기술된 ZF 펩티드가 공지된 서열-특이적 표적 서열을 갖는 경우, 다른 모든 핵산 서열은 비-표적인 것으로 간주될 수 있는 것으로 고려될 수 있다. 실용적인 관점에서, 비-표적 서열과 특정 ZF 펩티드 사이의 상호작용을 하위-생리학적인 것(즉, 생리학적 표적 서열/ZF 펩티드 농도 하에서 생리학적 반응을 생성할 수 없음)으로 정의하는 것이 편리할 수 있다. 예를 들어, ZF 펩티드와 비-표적 서열 사이의 결합을 측정할 수 있는 경우, 해리 상수(Kd)는 일반적으로 1μM 보다 더 약하며, 예컨대 10 μM 또는 그 보다 약하거나, 100 μM 또는 그 보다 약하거나, 또는 적어도 1 mM이다.
본 명세서에 사용되는 용어 "상호작용"은 수용체 및 이의 리간드의 맥락에서 사용될 때 수용체의 리간드-결합 부위(또는 단편)와 리간드의 수용체-결합 부위(또는 단편) 사이의 비공유 결합의 결과로서 수용체와 이의 리간드 사이의 결합을 지칭한다. 서로에 대해 약간의 결합 친화도를 갖는, 2개의 엔티티, 예를 들어, 분자 또는 단백질의 맥락에서, 용어 "상호작용"은 2개의 엔티티 간의 비-공유적 결합의 결과로서 2개의 엔티티의 결합을 지칭한다. 용어 "상호작용", "복합체화(complexing)" 및 "결합(bonding)"은 수용체 및 이의 리간드의 맥락에서 그리고 2개의 결합 엔티티의 맥락에서 사용될 때 상호교환적으로 사용된다.
용어 "감소하다(decrease)", "감소된(reduced)", "감소(reduction)" 또는 "저해하다(inhibit)"는 모두 통계적으로 유의한 양만큼 감소를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, "감소되다(reduce)", "감소(reduction)" 또는 "감소(decrease)" 또는 "저해하다(inhibit)"는 전형적으로 참조 수준(예를 들어, 주어진 치료제 또는 작용제의 부재)과 비교하여 적어도 10% 감소를 의미하고, 예를 들어, 적어도 약 10%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 그 이상 만큼의 감소를 포함할 수 있다. 본 명세서에 사용된 "감소" 또는 "저해"는 참조 수준과 비교하여 완전한 저해 또는 감소를 포함하지 않는다. "완전한 저해"는 참조 수준과 비교하여 100% 저해이다. 감소는 바람직하게는, 예를 들어, 주어진 장애가 없는 개인에 대해 정상 범위 내에서 허용되는 수준까지 낮아질 수 있다.
용어 "증가된(increased)", "증가하다(increase)", "강화하다(enhance)" 또는 "활성화하다(activate)"는 모두 정적으로 유의한 양만큼 증가를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, 용어 "증가된", "증가하다", "강화하다" 또는 "활성화하다"는 참조 수준과 비교하여 적어도 10%의 증가, 예를 들어, 참조 수준과 비교하여 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%의 증가 또는 이를 포함하여 최대 100% 증가 또는 10-100% 사이의 임의의 증가, 또는 참조 수준과 비교하여 적어도 약 2배, 또는 적어도 약 3배, 또는 적어도 약 4배, 또는 적어도 약 5배 이상 또는 적어도 약 10배 증가, 또는 2배 내지 10배 이상의 임의의 증가를 의미할 수 있다. 마커 또는 증상과 관련하여, "증가"는 이러한 수준에서의 통계적으로 유의한 증가이다.
본 명세서에 사용된 "대상체"는 인간 또는 동물을 의미한다. 일반적으로 동물은 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류는 침팬지, 사이노몰구스 원숭이, 거미 원숭이, 및 마카크(macaques), 예를 들어, 레수스(Rhesus)를 포함한다. 설치류는 마우스, 래트, 우드척, 페럿, 토끼 및 햄스터를 포함한다. 가축 및 사냥감 동물은 소, 말, 돼지, 사슴, 들소, 버팔로, 펠린 종, 예를 들어, 국내 고양이, 카닌 종, 예를 들어, 개, 여우, 늑대, 조류 종, 예를 들어, 닭, 에뮤, 타조 및 물고기, 예를 들어, 송어, 메기 및 연어를 포함한다. 일부 실시형태에서, 대상체는 포유동물, 예를 들어, 영장류, 예를 들어, 인간이다. "개체(individual)", "환자" 및 "대상체"라는 용어는 본 명세서에서 상호교환적으로 사용된다.
바람직하게는, 대상체는 포유동물이다. 포유동물은 인간, 인간이 아닌 영장류, 마우스, 래트, 개, 고양이, 말 또는 소일 수 있지만, 이들 예에 제한되는 것은 아니다. 인간 이외의 포유동물은 유리하게는 암의 동물 모델을 나타내는 대상체로 사용될 수 있다. 대상체는 남성 또는 여성일 수 있다.
대상체는 치료가 필요한 상태(예를 들어, 암) 또는 이러한 상태와 관련된 하나 이상의 합병증을 앓고 있거나 지니는 것으로 이전에 진단된 적이 있거나 또는 확인된 적이 있는 사람일 수 있으며, 선택적으로 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증에 대한 치료를 이미 받은 사람일 수 있다. 대안적으로, 대상체는 또한 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증을 갖는 것으로 이전에 진단되지 않은 사람일 수 있다. 예를 들어, 대상체는 질병 또는 장애(예를 들어, 암) 또는 질병 또는 장애(예를 들어, 암)와 관련된 하나 이상의 합병증에 대한 하나 이상의 위험 인자를 나타내는 사람 또는 위험 인자를 나타내지 않는 대상체일 수 있다.
특정 상태에 대한 치료가 "필요한 대상체"는 해당 상태를 갖고 있거나, 해당 상태를 갖는 것으로 진단되거나, 또는 해당 상태가 발생할 위험이 있는 대상체일 수 있다.
본 명세서에 사용되는 용어 "단백질" 및 "폴리펩티드"는 인접한 잔기의 알파-아미노 및 카복시기 사이의 펩티드 결합에 의해 서로 연결된, 일련의 아미노산 잔기를 나타내기 위해 상호교환적으로 사용된다. 용어 "단백질" 및 "폴리펩티드"는, 크기나 기능에 관계없이, 변형된 아미노산(예를 들어, 인산화, 당화(glycated), 글리코실화(glycosylated) 등) 및 아미노산 유사체를 포함하는 아미노산의 중합체를 지칭한다. "단백질" 및 "폴리펩티드"는 종종 비교적 큰 폴리펩티드와 관련하여 사용되는 반면, 용어 "펩티드"는 종종 작은 폴리펩티드와 관련하여 사용되지만, 당업계에서 이러한 용어의 사용은 중복된다. 용어 "단백질" 및 "폴리펩티드"는 유전자 생성물 및 이의 단편을 언급할 때 본 명세서에서 상호교환적으로 사용된다. 따라서, 예시적인 폴리펩티드 또는 단백질은 유전자 생성물, 자연적으로 발생하는 단백질, 상동체, 오르쏘로그(orthologs), 파라로그(paralogs), 단편 및 전술한 것들의 기타 등가물, 변이체, 단편, 및 유사체를 포함한다.
본 명세서에 기술된 다양한 실시형태에서, 기재된 임의의 특정 폴리펩티드의 변이체(자연적으로 발생하거나 또는 기타의 것), 대립유전자, 상동체, 보존적으로 변형된 변이체, 및/또는 보존적 치환 변이체가 포함되는 것으로 추가로 고려된다. 아미노산 서열과 관련하여, 당업자는 코딩된 서열에서 단일 아미노산 또는 적은 비율의 아미노산을 변경하는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 추가가 "보존적으로 변형된 변이체"이며, 여기서 변형은 아미노산의 화학적으로 유사한 아미노산으로의 치환을 초래하고 폴리펩티드의 원하는 활성을 유지하는 것임을 인지할 것이다. 이러한 보존적으로 변형된 변이체는 본 개시와 일치하는 다형성 변이체, 종간 상동체, 및 대립유전자에 추가되고 이를 배제하지 않는다.
주어진 아미노산은, 예를 들어, 하나의 지방족 잔기를 다른 것으로 치환(예컨대, Ile, Val, Leu 또는 Ala는 상호 치환), 또는 한 극성 잔기의 다른 잔기로의 치환(예컨대, Lys와 Arg 사이; Glu와 Asp 사이; 또는 Gln과 Asn 사이)함으로써, 유사한 물리화학적 특성을 갖는 잔기로 대체될 수 있다. 이와 같은 다른 보존적 치환, 예를 들어, 유사한 소수성 특성을 갖는 전체 영역의 치환은 잘 알려져 있다. 보존적 아미노산 치환을 포함하는 폴리펩티드는 원하는 천연 또는 참조 폴리펩티드의 활성, 예를 들어, 기능 및 특이성이 유지됨을 확인하기 위해 본 명세서에 기술된 분석 중 임의의 하나로 테스트될 수 있다.
아미노산은 측쇄 특성의 유사성에 따라 분류될 수 있다(AL Lehninger, in Biochemistry, second ed., pp. 73-75, Worth Publishers, New York (1975)): (1) 비-극성: Ala(A), Val(V), Leu(L), Ile(I), Pro(P), Phe(F), Trp(W), Met(M); (2) 비하전 극성: Gly(G), Ser(S), Thr(T), Cys(C), Tyr(Y), Asn(N), Gln(Q); (3) 산성: Asp(D), Glu(E); (4) 염기성: Lys(K), Arg(R), His(H). 대안적으로, 자연적으로 발생하는 잔기는 공통 측쇄 특성에 따라 그룹으로 나눌 수 있다: (1) 소수성: 노르류신(Norleucine), Met, Ala, Val, Leu, Ile; (2) 중성 친수성: Cys, Ser, Thr, Asn, Gln; (3) 산성: Asp, Glu; (4) 염기성: His, Lys, Arg; (5) 사슬 배향에 영향을 미치는 잔기: Gly, Pro; (6) 방향족: Trp, Tyr, Phe. 비보존적 치환은 이러한 클래스 중 하나의 구성원을 다른 클래스로 교환하는 것을 수반한다. 특정 보존적 치환은, 예를 들어, 다음을 포함한다; Ala를 Gly 또는 Ser으로; Arg를 Lys으로; Asn를 Gln 또는 His으로; Asp를 Glu로; Cys를 Ser으로; Gln를 Asn으로; Glu를 Asp로; Gly를 Ala 또는 Pro으로; His를 Asn 또는 Gln으로; Ile를 Leu 또는 Val으로; Leu를 Ile 또는 Val으로; Lys를 Arg으로, Gln으로 또는 Glu로; Met를 Leu으로, Tyr으로 또는 Ile으로; Phe를 Met으로, Leu으로 또는 Tyr으로; Ser를 Thr로; Thr를 Ser으로; Trp을 Tyr으로; Tyr을 Trp으로; 및/또는 Phe를 Val으로, Ile으로 또는 Leu으로.
일부 실시형태에서, 본 명세서에 기술된 폴리펩티드(또는 이러한 폴리펩티드를 코딩하는 핵산)는 본 명세서에 기술된 아미노산 서열 중 하나의 기능적 단편일 수 있다. 본 명세서에 사용된, "기능적 단편"은 본 명세서에 하기에 기재된 검정에 따른 야생형 참조 폴리펩티드 활성의 적어도 50%를 보유하는 펩티드의 단편 또는 세그먼트이다. 기능적 단편은 본 명세서에 개시된 서열의 보존적 치환을 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 폴리펩티드는 제1 N-말단 아미노산 메티오닌을 포함할 수 있다. 폴리펩티드가 제1 N-말단 메티오닌을 포함하지 않는 실시형태에서, 폴리펩티드의 변이체가 제1 N-말단 메티오닌을 포함하는 것으로 이해된다.
일부 실시형태에서, 본 명세서에 기술된 폴리펩티드는 본 명세서에 기술된 서열의 변이체일 수 있다. 일부 실시형태에서, 변이체는 보존적으로 변형된 변이체이다. 보존적 치환 변이체는, 예를 들어, 천연 뉴클레오티드 서열의 돌연변이에 의해 수득될 수 있다. 본 명세서에 언급된, "변이체"는 천연 또는 참조 폴리펩티드와 실질적으로 상동성이지만, 하나 또는 복수의 결실, 삽입 또는 치환으로 인해 천연 또는 참조 폴리펩티드의 아미노산 서열과 상이한 아미노산 서열을 갖는 폴리펩티드이다. 변이체 폴리펩티드-코딩 DNA 서열은 천연 또는 참조 DNA 서열과 비교할 때 뉴클레오티드의 하나 이상의 추가, 결실 또는 치환을 포함하지만, 활성을 유지하는 변이체 단백질 또는 이의 단편을 코딩하는 서열을 포함한다. 매우 다양한 PCR-기반 부위-특이적 돌연변이유발 접근법이 당업계에 공지되어 있으며 통상의 기술자에 의해 적용될 수 있다.
변이체 아미노산 또는 DNA 서열은 천연 또는 참조 서열에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 그 이상 동일하다. 천연 서열과 돌연변이 서열 사이의 상동성(동일성 퍼센트)의 정도는, 예를 들어, 월드 와이드 웹에서 이 목적을 위해 일반적으로 사용되는 무료로 사용 가능한 컴퓨터 프로그램(예를 들어, 디폴트 설정이 있는 BLASTp 또는 BLASTn)을 사용하여 두 서열을 비교하여 결정할 수 있다.
천연 아미노산 서열의 변경은 당업자에게 공지된 다수의 기술 중 임의의 것에 의해 달성될 수 있다. 돌연변이는, 예를 들어, 천연 서열의 단편에 결찰할 수 있는 제한 부위가 플랭킹된, 돌연변이 서열을 함유하는 올리고뉴클레오티드를 합성함으로써 특정 유전자좌에 도입될 수 있다. 결찰 후, 생성된 재구성된 서열은 원하는 아미노산 삽입, 치환 또는 결실을 갖는 유사체를 코딩한다. 대안적으로, 올리고뉴클레오티드-지정 부위-특이적 돌연변이유발 절차를 사용하여 요구되는 치환, 결실 또는 삽입에 따라 변경된 특정 코돈을 갖는 변경된 뉴클레오티드 서열을 제공할 수 있다. 그러한 변경을 생성하기 위한 기술은 매우 잘 확립되어 있으며, 예를 들어, 문헌[Walder et al. (Gene 42:133, 1986); Bauer et al. (Gene 37:73, 1985); Craik (BioTechniques, January 1985, 12-19); Smith et al. (Genetic Engineering: Principles and Methods, Plenum Press, 1981); 및 미국 특허 제4,518,584호 및 제4,737,462호]에 기술되어 있으며, 이들의 전문은 본 명세서에 참조로 인용된다. 폴리펩티드의 적절한 형태를 유지하는 데 관여하지 않는 임의의 시스테인 잔기는 또한 일반적으로 세린으로 치환되어, 분자의 산화 안정성을 개선하고 비정상적인 가교를 방지할 수 있다. 반대로, 시스테인 결합(들)은 폴리펩티드에 첨가되어 안정성을 향상시키거나 올리고머화를 촉진할 수 있다.
본 명세서에 사용되는 용어 "핵산" 또는 "핵산 서열"은 리보핵산, 데옥시리보핵산 또는 이들의 유사체의 단위를 포함하는 임의의 분자, 바람직하게는 중합체 분자를 지칭한다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. 단일 가닥 핵산은 변성된 이중 가닥 DNA의 한 핵산 가닥일 수 있다. 대안적으로, 이는 임의의 이중 가닥 DNA로부터 유래되지 않은 단일 가닥 핵산일 수 있다. 한 양태에서, 핵산은 DNA일 수 있다. 또 다른 양태에서, 핵산은 RNA일 수 있다. 적합한 DNA는, 예를 들어, 게놈 DNA, cDNA, 또는 벡터 DNA를 포함할 수 있다. 적합한 RNA는, 예를 들어, mRNA를 포함할 수 있다.
용어 "발현"은 RNA 및 단백질을 생성하고 적절한 경우 단백질을 분비하는 데 관련된 세포 과정을 의미하며, 이에는, 적용가능한 경우, 예를 들어, 전사, 전사체 가공, 번역 및 단백질 폴딩, 변형 및 가공이 포함되나, 이로만 제한되는 것은 아니다. 발현은 핵산 단편 또는 단편들로부터 유래된 센스(예를 들어, mRNA) 또는 안티센스 RNA의 전사 및 안정적인 축적 및/또는 mRNA의 폴리펩티드로의 번역을 지칭할 수 있다.
본 명세서에 사용되는 용어 "검출(detecting)" 또는 "측정(measuring)"은, 예를 들어, 시료에 분석물의 존재를 나타내는 프로브, 라벨, 또는 표적 분자로부터의 신호를 관찰하는 것을 의미한다. 특정 라벨 모이어티를 검출하기 위한 당업계에 공지된 임의의 방법이 검출을 위해 사용될 수 있다. 예시적인 검출 방법은 분광학적, 형광학적, 광화학적, 생화학적, 면역화학적, 전기적, 광학적, 또는 화학적 방법을 포함하지만 이에 제한되는 것은 아니다. 임의의 양태의 일부 실시형태에서, 측정은 정량적 관찰일 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 폴리펩티드, 핵산, 또는 세포가 조작될 수 있다. 본 명세서에 사용된 바와 같이, "조작된"은 인간의 손에 의해 조작된 양태을 지칭한다. 예를 들어, 폴리펩티드의 적어도 하나의 양태, 예를 들어, 이것의 서열이 인간의 손에 의해 조작되어 자연에 존재하는 양태와 다를 경우 "조작된" 것으로 간주된다. 통상적인 관행이고 당업자에 의해 이해되는 바와 같이, 조작된 세포의 자손은 비록 실제 조작이 이전 엔티티에 대해 수행되었음에도 불구하고 일반적으로 여전히 "조작된" 것으로 지칭된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 외인성이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 이소성(ectopic)이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 synTF 폴리펩티드는 내인성이 아니다.
용어 "외인성"은 세포의 천연 공급원 이외의 세포에 존재하는 물질을 지칭한다. 본 명세서에 사용되는 용어 "외인성"은 인간의 손을 포함하는 과정에 의해 생물학적 시스템, 예컨대, 정상적으로는 발견되지 않으며, 핵산 또는 폴리펩티드를 그러한 세포 또는 유기체 내로 도입하는 것을 원하는 세포 또는 유기체 내로 도입된 핵산(예를 들어, 폴리펩티드를 코딩하는 핵산) 또는 폴리펩티드를 지칭할 수 있다. 대안적으로, "외인성"은 인간의 손을 포함하는 과정에 의해 생물학적 시스템, 예컨대, 상대적으로 적은 양으로 발견되고, 세포 또는 유기체 내에서 핵산 또는 폴리펩티드의 양을 증가시키는 것, 예를 들어, 이소성 발현 또는 수준을 생성하는 것을 원하는 세포 또는 유기체 내로 도입된 핵산 또는 폴리펩티드를 지칭할 수 있다. 대조적으로, 용어 "내인성"은 생물학적 시스템 또는 세포에 고유한 물질을 지칭한다. 본 명세서에 사용된 바와 같이, "이소성"은 비정상적인 위치 및/또는 양에서 발견되는 물질을 지칭한다. 이소성 물질은 일반적으로 주어진 세포에서 발견되지만, 훨씬 적은 양 및/또는 다른 시간에 발견되는 것일 수 있다. 이소성은 또한 자연 환경에서 주어진 세포에서 자연적으로 발견되거나 발현되지 않는 폴리펩티드 또는 핵산과 같은 물질을 포함한다.
본 명세서에 기술된 바와 같이, "항원"은 항체 작용제(예를 들어, 세포외 결합 도메인) 상의 결합 부위에 의해 결합되는 분자이다. 전형적으로, 항원은 항체 리간드에 의해 결합되고 생체내에서 항체 반응을 일으킬 수 있다. 항원은 폴리펩티드, 단백질, 핵산 또는 기타 분자 또는 이의 일부일 수 있다. 용어 "항원 결정기"는 항원-결합 분자, 보다 구체적으로 상기 분자의 항원 결합 부위에 의해 인식되는 항원 상의 에피토프를 의미한다.
일부 실시형태에서, 본 명세서에 기술된 바와 같은 폴리펩티드(예를 들어, synTF 폴리펩티드)를 코딩하는 핵산은 벡터에 포함된다. 본 명세서에 기술된 양태 중 일부에서, 본 명세서에 기술된 바와 같은 주어진 폴리펩티드, 또는 이의 임의의 모듈을 코딩하는 핵산 서열은 벡터에 작동가능하게 연결된다. 본 명세서에 사용되는 용어 "벡터"는 숙주 세포로의 전달 또는 상이한 숙주 세포 사이의 전달을 위해 설계된 핵산 구축물을 지칭한다. 본 명세서에 사용된, 벡터는 바이러스성 또는 비-바이러스성일 수 있다. 용어 "벡터"는 적절한 제어 요소와 연관될 때 복제할 수 있고 유전자 서열을 세포로 전달할 수 있는 임의의 유전 요소를 포함한다. 벡터는 클로닝 벡터, 발현 벡터, 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 바이러스, 비리온 등을 포함할 수 있지만 이로만 제한되는 것은 아니다.
임의의 양태의 일부 실시형태에서, 벡터는 재조합이고, 예를 들어, 이는 2개 이상의 상이한 공급원으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 종으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 유전자로부터 기원하는 서열을 포함하고, 예를 들어 융합 단백질 또는 적어도 하나의 비-천연(예를 들어, 이종성) 유전적 조절 요소(예를 들어, 프로모터, 억제인자, 활성제, 인핸서, 반응 요소 등).
본 명세서에 사용되는 용어 "발현 벡터"는 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩티드의 발현을 유도하는 벡터를 지칭한다. 발현된 서열은 종종 세포에 대해 이종성일 것이지만 반드시 그런 것은 아니다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어, 발현 벡터는 2개의 복제 시스템을 가질 수 있으며, 그리하여 이것이 2개의 유기체, 예를 들어, 발현을 위한 인간 세포 및 클로닝 및 증폭을 위한 원핵 숙주에서 유지되도록 할 수 있다.
본 명세서에 사용되는 용어 "바이러스 벡터"는 바이러스 기원의 적어도 하나의 요소를 포함하고 바이러스 벡터 입자에 패키징될 수 있는 능력을 갖는 핵산 벡터 구축물을 지칭한다. 바이러스 벡터는 비필수적인 바이러스 유전자 대신에 본 명세서에 기술된 바와 같은 폴리펩티드를 코딩하는 핵산을 함유할 수 있다. 벡터 및/또는 입자는 시험관내(in vitro) 또는 생체내에서(in vivo) 임의의 핵산을 세포 내로 전달하기 위한 목적으로 사용될 수 있다. 바이러스 벡터의 다양한 형태가 공지되어 있다. 본 발명의 바이러스 벡터의 비제한적인 예는 AAV 벡터, 아데노바이러스 벡터, 렌티바이러스 벡터, 레트로바이러스 벡터, 헤르페스바이러스 벡터, 알파바이러스 벡터, 폭스바이러스 벡터, 배큘로바이러스 벡터, 및 키메라 바이러스 벡터를 포함한다.
본 명세서에 기술된 벡터는, 일부 실시형태에서, 다른 적합한 조성물 및 요법과 조합될 수 있음을 이해해야 한다. 일부 실시형태에서, 벡터는 에피솜(episomal)이다. 적합한 에피솜 벡터의 사용은 높은 카피 수의 추가 염색체 DNA에서 대상체의 관심 뉴클레오티드를 유지하며, 그로 인해 염색체 통합의 잠재적 효과를 제거하는 수단을 제공한다.
본 명세서에 사용되는 용어 "치료하다", "치료", "치료하는" 또는 "개선(amelioration)"은 치료적 치료를 지칭하며, 여기서 목적은 질병 또는 장애, 예를 들어, 암과 관련된 상태의 진행 또는 극심도를 역전시키거나, 경감시키거나, 개선하거나, 억제하거나, 느리게 하거나 또는 중지시키는 것이다. 용어 "치료하는"은 질병 또는 장애(예를 들어, 암, 자가면역, 유전적 장애)와 관련된 상태, 질병 또는 장애의 적어도 하나의 부작용 또는 증상을 감소 또는 완화하는 것을 포함한다. 치료는 일반적으로 하나 이상의 증상이나 임상 지표가 감소하면 "유효"하다. 대안적으로, 치료는 질병의 진행이 감소되거나 중단되는 경우 "유효"하다. 즉, "치료"는 증상 또는 마커의 개선뿐만 아니라, 치료가 없을 때 예상되는 것과 비교하여 증상의 진행 또는 악화의 중단, 적어도 감퇴를 포함한다. 유익하거나 원하는 임상 결과는, 검출가능 여부에 관계없이, 하나 이상의 증상(들)의 완화, 질병 정도의 감소, 질병의 안정화된(즉, 악화되지 않는) 상태, 질병 진행의 지연 또는 감퇴, 질병 상태의 개선 또는 완화, 관해(부분적이든 전체적이든) 및/또는 사망률 감소를 포함하나, 이로만 제한되는 것은 아니다. 질병의 "치료"라는 용어는 또한 질병의 증상 또는 부작용으로부터의 경감(완화적 치료 포함)을 제공하는 것을 포함한다.
본 명세서에 사용되는 용어 "약제학적 조성물"은 약학적으로 허용되는 담체, 예를 들어, 제약 산업에서 일반적으로 사용되는 담체와 조합된 활성 작용제를 지칭한다. "약제학적으로 허용가능한"이라는 어구는, 건전한 의학적 판단의 범위 내에서, 과도한 독성, 자극, 알레르기 반응 또는 기타 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합하며, 합리적인 이익/위험 비율에 부합하는, 그러한 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭하기 위해 본 명세서에 사용된다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 물 이외의 담체일 수 있다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 크림, 에멀젼, 겔, 리포솜, 나노입자, 및/또는 연고일 수 있다. 임의의 양태의 일부 실시형태에서, 약제학적으로 허용가능한 담체는 인공 또는 조작된 담체, 예를 들어, 활성 성분이 자연에서 또는 자연 내에서 발생하는 것으로 밝혀지지 않은 담체일 수 있다.
본 명세서에 사용되는 용어 "투여(administering)"는 원하는 부위에서 작용제의 적어도 부분적 전달을 초래하는 방법 또는 경로에 의해 본 명세서에 개시된 것과 같은 화합물을 대상체로 배치하는 것을 지칭한다. 본 명세서에 개시된 화합물을 포함하는 약제학적 조성물은 대상체에서 효과적인 치료를 초래하는 임의의 적절한 경로에 의해 투여될 수 있다. 일부 실시형태에서, 투여는 물리적인 인간 활동, 예를 들어, 주사, 섭취 행위, 적용 행위, 및/또는 전달 디바이스 또는 기계의 조작을 포함한다. 이러한 활동은, 예를 들어, 의료 전문가 및/또는 치료를 받는 대상체에 의해 수행될 수 있다.
본 명세서에 사용되는 "접촉(contacting)"은 적어도 하나의 세포에 작용제를 전달하거나, 또는 노출시키기 위한 임의의 적합한 수단을 지칭한다. 예시적인 전달 방법은, 세포 배양 매체(medium)로의 직접 전달, 형질감염, 형질도입, 관류, 주사 또는 당업자에게 공지된 기타 전달 방법을 포함하지만, 이로만 제한되는 것은 아니다. 일부 실시형태에서, 접촉은 물리적 인간 활동, 예를 들어, 주사; 분배, 혼합 및/또는 따라내는 활동; 및/또는 전달 디바이스 또는 기계를 포함한다.
본 명세서에 사용되는 용어 "유사체"는 참조 물질과 하나 이상의 특정 구조적 특징, 요소, 구성요서, 또는 모이어티를 공유하는 물질을 지칭한다. 일반적으로 "유사체"는 참조 물질과 상당한 구조적 유사성을 보여주지만, 예를 들어, 핵심 또는 컨센서스(consensus) 구조를 공유하지만, 또한 특정 개별 방식에서 차이가 있다. 일부 실시형태에서, 유사체는, 예를 들어, 참조 물질의 화학적 조작에 의해, 참조 물질로부터 생성될 수 있는 물질이다.
"통계적으로 유의한" 또는 "유의하게"라는 용어는 통계적 유의성을 지칭하며 일반적으로 2 표준편차(2SD) 이상의 차이를 의미한다.
구현 실시예 이외, 또는 달리 지시된 경우, 본 명세서에 사용된 성분 또는 반응 조건의 양을 나타내는 모든 숫자는 "약"이라는 용어로 모든 경우에 변형되는 것으로 이해해야 한다. 백분율과 관련하여 사용되는 용어 "약"은 ±1%를 의미할 수 있다.
본 명세서에 사용된 바와 같은, 용어 "포함하는"은 제시된 정의된 요소 외에 다른 요소가 또한 존재할 수도 있음을 의미한다. "포함하는"의 사용은 제한이 아니라 포함을 나타낸다.
용어 "~로 이루어진"은 본 명세서에 기술된 바와 같은 조성물, 방법 및 이들의 각각의 구성요소를 지칭하며, 실시형태의 설명에서 언급되지 않은 임의의 요소를 배제한다.
본 명세서에서 사용되는 용어 "본질적으로 ~로 이루어진"은 주어진 실시형태에 필요한 요소를 지칭한다. 이 용어는 본 발명의 해당 실시형태의 기본적이고 신규한 또는 기능적 특성(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서에 사용되는 용어 "~에 상응하는"은 제1 폴리펩티드 또는 핵산 내의 열거된 위치에 있는 아미노산 또는 뉴클레오티드, 또는 제2 폴리펩티드 또는 핵산 내의 열거된 아미노산 또는 뉴클레오티드와 등가인 아미노산 또는 뉴클레오티드를 지칭한다. 등가의 열거된 아미노산 또는 뉴클레오티드는 당업계에 공지된 상동성 프로그램, 예를 들어, BLAST를 사용하여 후보 서열의 정렬에 의해 결정될 수 있다.
본 명세서에 사용되는 용어 "특이적 결합"은 2개의 분자, 화합물, 세포 및/또는 입자 사이의 화학적 상호작용을 지칭하며, 여기서 제1 엔티티는, 비-표적 제3 엔티티에 결합하는 것보다 더 큰 특이성과 친화력으로 제2 표적 엔티티에 결합한다. 일부 실시형태에서, 특이적 결합은 제3 비-표적 엔티티에 대한 친화도에 비해 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배 또는 그 초과인 제2 표적 엔티티에 대한 제1 엔티티의 친화도를 지칭할 수 있다. 주어진 표적에 대해 특이적인 시약은 이용되는 분석 조건 하에서 해당 표적에 대한 특이적 결합을 나타내는 것이다.
단수 용어 "a", "an" 및 "the"는 문맥이 달리 명확하게 나타내지 않는 한 복수의 지시 대상을 포함한다. 유사하게, "또는"이라는 단어는 문맥이 명백하게 달리 나타내지 않는 한 "및"을 포함하도록 의도된다. 본 명세서에 기술된 것과 유사하거나 등가인 방법 및 재료가 본 개시의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 아래에 기재되어 있다. 약어, "예를 들어(e.g.)"는 라틴어(exempli gratia)에서 파생된 것으로, 비제한적인 예를 나타내기 위해 본 명세서에서 사용된다. 따라서 약어 "예를 들어(e.g.)" "예를 들어(for example)"라는 용어와 동의어이다.
본 명세서에 개시된 본 발명의 대안적 요소 또는 실시형태의 그룹화는 제한으로 해석되어서는 안 된다. 각 그룹 구성원은 개별적으로 또는 본 명세서에서 확인되는 그룹의 다른 구성원 또는 다른 요소와 임의의 조합으로 언급되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성을 이유로 그룹에 포함되거나 그룹에서 삭제될 수 있다. 임의의 그러한 포함 또는 삭제가 발생하는 경우, 본 명세서는 변형에 따라 해당 그룹을 포함하는 것으로 간주되며, 그로인해 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹에 대한 문언적 설명을 충족한다.
본 명세서에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용되는 과학 및 기술 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미를 가질 것이다. 본 발명은 본 명세서에 기술된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않으며 그 자체로 다양할 수 있다는 것을 이해해야 한다. 본 명세서에서 사용한 용어(terminology)는 단지 특정한 실시형태를 설명하기 위해 사용된 것이며, 청구범위에 의해서만 정의되는 본 발명의 범위를 한정하려는 의도가 아니다. 면역학 및 분자 생물학에서 일반적인 용어의 정의는 다음 문헌: The Merck Manual of Diagnosis and Therapy, 20th Edition, published by Merck Sharp & Dohme Corp., 2018 (ISBN 0911910190, 978-0911910421); Robert S. Porter et al. (eds.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); 및 Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology by Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), W. W. Norton & Company, 2016 (ISBN 0815345054, 978-0815345053); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; 및 Current Protocols in Immunology (CPI) (John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737)에서 찾을 수 있으며, 이들 문헌의 전문은 본 명세서에 참조로 인용된다..
당업자는 사용되는 화학요법제를 쉽게 확인할 수 있다(예를 들어, Physicians' Cancer Chemotherapy Drug Manual 2014, Edward Chu, Vincent T. DeVita Jr., Jones & Bartlett Learning; Principles of Cancer Therapy, Chapter 85 in Harrison's Principles of Internal Medicine, 18th edition; Therapeutic Targeting of Cancer Cells: Era of Molecularly Targeted Agents and Cancer Pharmacology, Chs. 28-29 in Abeloff's Clinical Oncology, 2013 Elsevier; 및 Fischer D S (ed): The Cancer Chemotherapy Handbook, 4th ed. St. Louis, Mosby-Year Book, 2003 참조).
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 개시는 인간을 복제하는 방법, 인간의 생식계열 유전적 정체성을 변형시키는 방법, 산업적 또는 상업적 목적을 위한 인간 배아의 사용 또는 사람이나 동물, 그리고 그러한 과정으로 인해 동물에게 임의의 실질적인 의학적 이익 없이 고통을 야기할 가능성이 있는 동물의 유전적 정체성을 변형시키는 방법에 관한 것은 아니다.
기타 용어들은 본 발명의 다양한 양태의 설명 내에서 본 명세서에 정의되어 있다.
모든 특허 및 기타 간행물; 문헌 참조, 발행된 특허, 공개된 특허 출원 및 동시-계류 중인 특허 출원을 포함하며; 본 출원 전반에 걸쳐 인용된 것은, 예를 들어, 본 명세서에 기술된 기술과 관련하여 사용될 수 있는 그러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 본 명세서에 명시적으로 참조로 통합된다. 이러한 간행물은 본 출원의 출원일 이전의 개시를 위해서만 제공된다. 이와 관련하여, 그 어떤 것도 발명자가 선행 발명으로 인해 또는 다른 이유로 그러한 개시보다 선행할 자격이 없다고 인정하는 것으로 해석되어서는 아니된다. 이들 문헌의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 사용할 수 있는 정보를 기반으로 하며, 이러한 문헌의 날짜 또는 내용의 정확성에 대한 어떠한 인정도 구성하지 아니한다.
본 개시내용의 실시형태에 대한 설명은 완전한 것이거나 또는 개시된 정확한 형태로 개시를 제한하도록 의도된 것은 아니다. 본 개시의 특정 실시형태 및 이에 대한 실시예는 예시의 목적으로 본 명세서에 기술되어 있지만, 관련 기술 분야의 통상의 지식을 가진 자가 인식하는 바와 같이, 본 개시의 범위 내에서 다양한 균등한 변형이 가능하다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되는 경우, 대안적인 실시형태는 다른 순서로 기능을 수행할 수 있거나, 또는 기능이 실질적으로 동시에 수행될 수 있다. 본 명세서에 제공된 개시의 교시는 적절하게 다른 절차 또는 방법에 적용될 수 있다. 본 명세서에 설명된 다양한 실시형태는 추가 실시형태를 제공하기 위해 결합될 수 있다. 본 개시의 양태는, 필요한 경우, 본 개시의 또 다른 실시형태를 제공하기 위해 상기 참조 및 적용의 구성, 기능 및 개념을 사용하도록 변형될 수 있다. 또한, 생물학적 기능 동등성 고려로 인해, 종류나 양에 생물학적 또는 화학적 작용에 영향을 미치지 않으면서 단백질 구조에 약간의 변화를 줄 수 있다. 이러한 변화 및 기타 변화는 상세한 설명에 비추어 본 개시에 대해 이루어질 수 있다. 이러한 모든 변형은 첨부된 청구범위의 범위 내에 포함되도록 의도된다.
전술한 실시형태 중 임의의 것의 특정 요소는 다른 실시형태의 요소로 결합되거나 대체될 수 있다. 또한, 본 개시의 특정 실시형태와 관련된 이점이 이러한 실시형태의 맥락에서 기술되었지만, 다른 실시형태가 또한 이러한 이점을 나타낼 수 있으며, 모든 실시형태가 본 개시의 범위 내에 포함되기 위해 반드시 그러한 이점을 나타낼 필요는 없다.
본 명세서에 기술된 기술은 어떤 식으로든 추가적인 제한인 것으로 간주되지 않아야 하는 하기의 실시예에 의해 추가로 설명된다.
본 명세서에 기술된 기술의 일부 실시형태는 다음의 번호매겨진 항목 중 어느 하나에 따라 정의될 수 있다:
1.
합성 전사 인자(synTF)로서,
a. 적어도 하나의 DNA 결합 도메인(DBD),
b. 전사 이펙터 도메인(ED),
c. 적어도 하나의 조절인자 단백질(RP)을 포함하며,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고,
상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는
상기 ED의 세포 국재화는 상기 적어도 하나의 조절인자 단백질에 의해 조절되는,
synTF.
2.
항목 1에 있어서, 상기 전사 ED가 전사 액티베이터(TA) 도메인인, synTF.
3.
항목 2에 있어서, 상기 TA가 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택되는, synTF.
4.
항목 2에 있어서, 상기 TA가 p65 또는 이의 변이체인, synTF.
5.
항목 4에 있어서, 상기 p65가 서열식별번호: 69, 117-121, 193-197 중 하나 또는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
6.
항목 1에 있어서, 상기 전사 ED가 전사 리프레서(TR) 도메인인, synTF.
7.
항목 6에 있어서, 상기 TR이 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택되는, synTF
8.
항목 6에 있어서, 상기 TR이 KRAB, 또는 이의 변이체인, synTF.
9.
항목 8에 있어서, 상기 KRAB가 서열식별번호: 72, 97, 또는 214-215 중 하나, 또는 서열식별번호: 72, 97, 또는 214-215 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
10.
항목 1에 있어서, 상기 적어도 하나의 DBD가 조작된 징크 핑거(ZF) 결합 도메인인, synTF.
11.
항목 10에 있어서, 상기 ZF-결합 도메인이 2개 이상의 ZF 모티프를 포함하는, synTF.
12.
항목 11에 있어서, 상기 ZF-결합 도메인이 탠덤(tandem)하게 서로 인접하여 배열된 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 또는 그 이상의 ZF 모티프를 포함하여 ZF 어레이(ZFA)를 형성하는, synTF.
13.
항목 1 내지 항목 12 중 어느 한 항목에 있어서, 상기 ZF 결합 도멘인이, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1 및 ZF 11-1 중 어느 하나에서 선택되는, synTF.
14.
항목 1 내지 항목 13 중 어느 한 항목에 있어서, ZF 결합 도메인이 서열식별번호 1-3, 76, 101, 377, 또는 380 중 어느 하나로부터 선택되는, synTF.
15.
항목 14에 있어서, 상기 ZF 결합 도메인이 서열 181-191 중 적어도 하나를 포함하는 서열에 특이적으로 결합하는, synTF.
16.
항목 1 내지 항목 15 중 어느 한 항목에 있어서, 상기 적어도 하나의 DBD가 서열식별번호: 221 또는 222, 36-4(서열식별번호: 223), 43-8(서열식별번호: 224 또는 225), 42-10(서열식별번호: 226 또는 227), 97-4(서열식별번호: 228) 중의 임의의 것의 하나 이상에서 선택되거나, 또는 상기 DBD가 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합하는, synTF.
17.
항목 1에 있어서, 상기 조절인자 단백질이 상기 DBD와 상기 전사 이펙터 도메인 사이에 위치하는, synTF.
18.
항목 1 내지 항목 17 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 억제성 프로테아제인, synTF.
19.
항목 1 내지 항목 18 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 NS3 프로테아제 단백질인, synTF.
20.
항목 1 내지 항목 19 중 어느 한 항목에 있어서, 상기 조절인자 단백질이 서열식별번호: 82, 85, 91, 102, 241-255, 304-315의 아미노산, 또는 서열식별번호: 82, 85, 91, 102, 241-255, 304-315에 대해 적어도 85% 서열 동일성의 상동체를 포함하는, synTF.
21.
항목 1 내지 항목 19 중 어느 한 항목에 있어서, 프로테아제 저해제, 또는 NS3의 저해제의 존재 하에, 상기 NS3 프로테아제 단백질이 저해되어 상기 DBD와 상기 이펙터 도메인의 커플링을 유지하는, synTF.
22.
항목 1 내지 항목 19 중 어느 한 항목에 있어서, 상기 프로테아제 저해제 또는 NS3에 대한 저해제의 부재 하에, 상기 NS3 프로테아제 단백질이 활성이고 상기 DBD로부터의 이의 절제를 초래하여, 상기 DBD와 상기 이펙터 도메인 사이의 연결을 커플링해제하는, synTF.
23.
항목 21 또는 항목 22에 있어서, NS3의 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 다사사리토나비르, 및 텔라프레비르 중의 어느 하나로부터 선택되는, synTF.
24.
항목 1에 있어서, 상기 적어도 하나의 RP가 한 쌍의 유도 근접 도메인(IPD 쌍)이고, 여기서 상기 IPD 쌍은,
제1 유도 근접 도메인(IPDA) 및 적어도 제2 상보 IPD(IPDB)를 포함하며,
인듀서 또는 인듀서 신호의 존재 하에, 상기 IPDA 및 IPDB는 함께 모여 상기 합성 TF의 상기 DBD에 대한 상기 ED의 연결을 초래하고,
인듀서 또는 인듀서 신호의 부재 하에, 상기 ED는 상기 합성 TF의 상기 DBD에 대해 커플링해제되거나 연결해제되는, synTF.
25.
항목 24에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상으로부터 선택된 IPDA 및 IPDB를 포함하는, synTF:
a. GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 상기 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함;
b. FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 상기 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(RAP)에 결합함;
c. PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서, 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함;
d. 광-유도성 이량체화 도멘인(Light-inducible Dimerization domain, LIDD)를 포함하는 IPDA, 여기서 상기 LIDD는 적절한 파장의 광 인듀서 신호에 노출시 상보적 LIDD(IPDB)와 이량체화됨.
26.
항목 24에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 PYL 도메인 또는 이의 단편 및 ABI 도메인을 포함하는 IPDA 및 IPDB를 포함하고, 여기서 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합하는, synTF.
27.
항목 24에 있어서, 상기 LIDD가 nMag 또는 CIBN 또는 광변색성 단백질 도메인이고, 여기서 nMag는 청색광 인듀서 신호에 노출시 상기 상보적 LIDD pMag와 이량체화할 수 있고, CIBN은 청색 인듀서 광 신호에 노출시 상기 상보적 CRY2와 이량체화할 수 있고, 상기 광변색성 단백질은 청색 인듀서 광 신호에 노출시 이량체화할 수 있는, synTF.
28.
항목 24에 있어서, 상기 광 인듀서 신호는 펄스 광 신호인, synTF.
29.
항목 1 내지 항목 17 중 어느 한 항목에 있어서, 상기 적어도 하나의 RP가 세포질 격리 단백질인, synTF.
30.
항목 29에 있어서, 상기 격리 단백질이 리간드 결합 도메인(LBD)을 포함하고, 상기 리간드의 존재 하에, 상기 세포질에 대한 상기 단백질의 격리가 저해되는, synTF.
31.
항목 29에 있어서, 상기 세포질 격리 단백질이 리간드 결합 도메인 및 핵 국재화 신호(NLS)를 포함하고, 상기 리간드의 부재 하에 상기 NLS가 저해되어 상기 격리 단백질의 상기 핵으로의 전위를 방지하고, 상기 리간드의 존재 하에 상기 핵 국재화 신호가 노출되어 상기 격리 단백질이 상기 핵으로 전위할 수 있는, synTF.
32.
항목 29 내지 항목 31 중 어느 한 항목에 있어서, 상기 격리 단백질이 에스트로겐 수용체(ER)의 적어도 일부를 포함하는, synTF.
33.
항목 29 내지 항목 32 중 어느 한 항목에 있어서, 상기 격리 단백질이 ERT2, ERT, 및 ERT3으로 이루어진 그룹으로부터 선택되는, 에스트로겐 리간드 결합 도메인(ERT) 또는 이의 변이체를 포함하는, synTF.
34.
항목 33에 있어서, 상기 ERT가 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜, 풀베스트란트로부터 선택된 하나 이상의 리간드에 결합하고, ERT에 대한 상기 리간드의 결합은 상기 NLS를 노출시키고, 상기 ERT의 핵내 전위를 초래하는, synTF.
35.
항목 29에 있어서, 상기 세포질 격리 단백질이 막통과 수용체 격리 단백질을 포함하는, synTF.
36.
항목 1 내지 항목 35 중 어느 한 항목에 있어서, 상기 synTF가 N-말단 DBD, 상기 격리 단백질, 및 C-말단 이펙터 도메인을 포함하는, synTF.
37.
제36항에 있어서, 상기 이펙터 도메인이 전사 액티베이터(TA)인, synTF.
38.
항목 1 내지 항목 35 중 어느 한 항목에 있어서, 상기 synTF가 N-말단 이펙터 도메인, DBD 및 C-말단 세포질 격리 단백질을 포함하는, synTF.
39.
항목 38에 있어서, 상기 이펙터 도메인이 전사 리프레서(TR)인, synTF.
40.
항목 1 내지 항목 23 중 어느 한 항목에 있어서, 상기 NS3 단백질이 소분자-보조 차단(Small molecule-Assisted Shutoff; SMASh) 도메인의 일부이고, 여기서 상기 SMASh 도메인은 상기 NS3 단백질, 부분 프로테아제 나선 도메인 및 NS4A 도메인을 포함하는, synTF.
41.
항목 1 내지 항목 9 및 항목 24 내지 항목 40 중 어느 한 항목에 있어서, 상기 synTF가 소분자-보조 차단(SMASh) 태그를 추가로 포함하고, 여기서 상기 SMASh 태그가 억제성 프로테아제를 포함하는 N-말단 또는 C-말단 SMASh 도메인, 부분 프로테아제 나선 도메인 및 보조인자 도메인인, synTF.
42.
항목 41에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인을 포함하는 C-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 상기 이펙터 도메인의 C-말단에 융합되는, synTF.
43.
항목 41에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인 및 NS3 절단 부위를 포함하는 N-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 N-말단에 융합되는, synTF.
44.
항목 40 내지 항목 43 중 어느 한 항목에 있어서, 상기 NS3 프로테아제에 대한 저해제의 부재 하에, 상기 NS3 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 그로 인해 상기 SMASh 태그가 분해를 위한 표적이 되는 것을 초래하고("SMASh-분해", synTF-켜짐/TA-켜짐/RP-켜짐),
NS3 프로테아제에 대한 저해제의 존재 하에, NS3 프로테아제 활성이 억제되며, 그로 인해 상기 SMASh 태깅된 synTF가 분해를 위한 표적이 되는 것을 초래하는("synTF-분해", synTF-꺼짐/TA-꺼짐/RP-꺼짐"), synTF.
45.
항목 44에 있어서, 상기 NS3 프로테아제에 대한 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르 및 텔라프레비르 중 어느 하나로부터 선택되는, synTF.
46.
항목 24 내지 항목 45 중 어느 한 항목에 있어서, 상기 synTF가 SMASh 태그 및 세포질 격리 단백질을 포함하는, synTF.
47.
항목 46에 있어서, 상기 synTF가 상기 세포질 격리 단백질에 대한 리간드의 존재 및 상기 NS3 프로테아제에 대한 저해제의 부재 하에 활성이고; 상기 synTF가 상기 세포질 격리 단백질에 대한 상기 리간드의 부재 및 상기 NS3 프로테아제에 대한 저해제의 존재 하에 불활성인, synTF.
48.
항목 1 내지 항목 47 중 어느 한 항목에 있어서, 하기의 링커 펩티드를 추가로 포함하고, 상기 링커 펩티드는 상기 DBD와 상기 조절인자 단백질 사이; 상기 조절인자 단백질과 상기 이펙터 도메인 사이; 상기 DBD와 상기 이펙터 도메인 사이; 상기 DBD, 이펙터 도메인 또는 조절인자 단백질 내; 또는 이들의 임의의 조합으로부터의 임의의 위치에 위치될 수 있는, synTF:
PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323).
49.
유전자 발현 제어 시스템으로서,
a. 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는 상기 DBD에 연결된 상기 ED의 세포 국재화는 상기 적어도 하나의 RP에 의해 조절되고,
상기 적어도 하나의 RP는 RP 인듀서에 의해 조절되고,
상기 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF,
b. 핵산 구축물로서,
i. 상기 synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및
ii. 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및
iii. 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는, 핵산 구출물,
을 포함하며,
상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접할 수 있고, 상기 ED는 상기 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하며("ED-꺼짐"),
상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED는 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 이펙터 도메인(ED)이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 제어할 수 있거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 synTF의 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 이펙터 도메인(ED)이 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하는("ED-꺼짐"),
시스템.
50.
항목 49에 있어서, 상기 전사 이펙터 도메인(ED)이 전사 액티베이터(TA)이고,
a. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어, 상기 TA가 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 방지하며("TA-꺼짐"),
b. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되고, 상기 관심 유전자의 발현을 방지하는("TA-꺼짐"), 시스템.
51.
항목 49에 있어서, 상기 ED가 전사 리프레서(TR)이고, 여기서
a. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어, 상기 TR이 상기 관심 유전자의 발현을 방지하거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 허용하며("TR-꺼짐"(발현-있음)),
b. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 끄거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 허용하는("TR-꺼짐"(발현-있음)),
시스템.
52.
항목 49 내지 항목 51 중 어느 한 항목에 있어서, 상기 synTF가 항목 1 내지 항목 48 중 어느 한 항목에서 선택되는, 시스템.
53.
항목 49 내지 항목 52 중 어느 한 항목에 있어서, 상기 적어도 하나의 synTF가 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함하고, 여기서 SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분 프로테아제 나선 도메인 및 보조인자 도메인을 포함하고,
상기 SMASh 프로테아제에 대한 저해제의 존재 하에, 상기 SMASh 프로테아제 활성이 억제되어, 상기 synTF가 분해되는 것을 초래하고, 상기 DBM에 대한 상기 synTF의 DBD의 결합을 방지하고, 상기 관심 유전자의 발현 또는 억제를 제어하며("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)),
상기 SMASh 프로테아제에 대한 저해제의 부재 하에, 상기 SMASh 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 상기 SMASh 도메인이 분해를 위한 표적이 되고, 상기 synTF의 DBD가 상기 synTF의 DBM 및 ED에 결합하도록 허용되어 상기 관심 유전자의 발현을 제어하는("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)), 시스템.
54.
항목 49 내지 항목 53 중 어느 한 항목에 있어서, 상기 프로모터가 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터 중 임의의 것으로부터 선택되는, 시스템.
55.
세포로서,
a. synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 제1 핵산 서열, 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산, 및
b. 유도성 또는 구성적 프로모터에 작동가능하게 연결된 항목 1 내지 항목 48 중 어느 한 항목에 따른 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열을 포함하는, 세포.
56.
항목 55에 있어서, 상기 세포가 5'에서 3' 방향으로,
a. 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열,
b. 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열,
c. synTF의 상기 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 상기 synTF의 DBD의 결합은 상기 이펙터 도메인(ED)을 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열의 근처에 위치시키는, 핵산 서열,
d. 제2 프로모터 서열, 및
e. 상기 제2 프로모터 서열에 작동가능하게 연결된, 상기 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 상기 코딩된 synTF는 (c)의 상기 핵산 서열의 상기 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열,
을 포함하는 핵산 구축물을 포함하는, 세포:.
57.
항목 55 또는 항목 56에 있어서, 상기 GOI에 작동가능하게 연결된 프로모터 상기 서열이 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터 중 임의의 것으로부터 선택되는, 세포.
58.
항목 55 또는 항목 56에 있어서, 상기 synTF를 코딩하는 핵산에 작동가능하게 연결된 상기 프로모터 서열이 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터인, 세포.
59.
항목 1 내지 항목 48 중 어느 한 항목의 synTF, 또는 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템을 코딩하는 폴리뉴클레오티드.
60.
항목 59의 폴리뉴클레오티드를 포함하는 벡터.
61.
항목 1 내지 항목 48 중 어느 한 항목의 synTF, 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템, 항목 55 내지 항목 58 중 어느 한 항목의 synTF 세포, 항목 59의 폴리뉴클레오티드, 또는 항목 60의 벡터를 포함하는 조성물.
62.
항목 1 내지 항목 48 중 어느 한 항목의 synTF, 항목 49 내지 항목 54 중 어느 한 항목의 synTF 시스템, 항목 55 내지 항목 58 중 어느 한 항목의 synTF 세포, 항목 59의 폴리뉴클레오티드, 또는 항목 60의 벡터, 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물.
63.
synTF의 활성을 조절하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법.
64.
관심 유전자의 발현을 조절하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법.
65.
세포-기반 요법을 필요로 하는 대상체를 치료하는 방법으로서,
a. 항목 55 내지 항목 58 중 어느 한 항목의 세포 집단을 상기 대상체에게 투여하는 단계; 및
b. 상기 대상체에 유효량의 조절인자 단백질 인듀서를 투여하는 단계
를 포함하는, 방법.
66.
항목 63 내지 항목 65 중 어느 한 항목에 있어서, 상기 세포 집단이 면역 세포를 포함하는, 방법.
67.
항목 65에 있어서, 상기 면역 세포의 집단이 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함하는, 방법.
68.
항목 65 내지 항목 67 중 어느 한 항목에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여되는 것과 동시에 투여되는, 방법.
69.
항목 65 내지 항목 67 중 어느 한 항목에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여된 후에 투여되는, 방법.
실시예
실시예 1: 유도성 합성 전사 인자(NS3 SynTF)
개요
본 명세서에는 정확한 인간 게놈-직교 조절을 위한 합성 전사 인자(synTF) 및 반응성 프로모터가 기술된다. 합성 전사 인자 단백질은 반응성 프로모터에서 유전자 발현을 국부적으로 조절할 수 있는 DNA 결합 및 이펙터 도메인의 최소 모듈식 융합물이다. 이들은 근본적으로 조작된 징크 핑거(ZF) DNA 결합 어레이를 전사 또는 후성유전적 이펙터 도메인에 커플링시킨다.
본 명세서에 기재된 조작된 ZF 어레이는 천연 포유류 ZF 스캐폴드로부터 유래되지만 인간 게놈 서열에서 멀리 떨어진 특정 18-20개 뉴클레오티드 서열을 표적화하도록 재설계되고; 이 특징은 인간 게놈에서 감소된 표적-이탈(off-target) 결합 잠재력을 부여한다.
전사 및 후성유전적 이펙터 도메인은 p65 전사 액티베이터 및 KRAB 리프레서와 같은 자연적으로 발생하는 인간 이펙터 도메인을 포함한다. 조작된 ZF 어레이와 커플링되면, 이들은 조작된 세포의 표적화된 유전자좌에서 전사를 국부적으로 조절(즉, 하류 유전자 활성화 또는 억제)할 수 있다.
상응하는 반응성 프로모터는 포유류 세포에서 정확하고 국소적인 유전자 발현 제어를 가능하게 하기 위해 구성적 프로모터의 상류에 ZF 결합 부위의 인스턴스(instances)를 배치함으로써 설계된다.
본 명세서에는 상응하는 반응성 프로모터에서 유전자 발현을 강력하게 조절하고, 인간 게놈에서 표적-이탈 유전자의 발현에 최소한으로 영향을 미치는 합성 전사 인자의 라이브러리가 기술되어 있다(예를 들어, 도 1a-1h 참조).
소분자의 부재 하에, 합성 전사 인자가 불활성화되게 된다. 동족 소분자의 존재 하에, 전사 인자는 반응성 프로모터로부터의 아웃풋 유전자의 발현을 조절할 수 있다(예를 들어, 도 2a-2b 참조).
유도 근접 도메인
소분자(앱시스산 = ABA)에 반응성인 ABI/PYL 유도 근접 도메인을 본 명세서에 기재된 바와 같이 synTF를 조절하는 데 사용할 수 있다(예를 들어, Liang et al. Sci Signal, 2011 참조). 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터 유래한 ABA-비민감성 1(ABI1) 및 PYR1-유사(PYL) 도메인은 소분자 앱시스산(ABA)에 의해 배위될 때 조건부로 상호작용할 수 있는 상보적인 표면을 가지고 있다. ABA는 인간의 식이에서 자연적으로 낮은 수준으로 존재하는 식물 호르몬이며, 이후에 인간 투여에 안전한 소분자로 추정되고 있다.
2개의 융합 단백질 - ABI1(또는 PYL) 도메인에 융합된 ZF DNA 결합 도메인과 PYL(또는 ABI1) 도메인에 융합된 이펙터 도메인 - 의 발현은 synTF 하위 도메인의 분리를 허용하며, 그로 인해 국소 유전자 조절 기능을 불활성화시킨다.
이어서, ABA의 투여는 ABI1 및 PYL 서브유닛 사이의 조건부 이량체화를 허용할 수 있어, ZF 및 이펙터 도메인이 국부적으로 커플링되고 synTF 기능을 유지하도록 허용할 수 있다(예를 들어, 도 3 참조).
전위 도메인
소분자(4-하이드록시타목시펜 = 4OHT)에 반응성인, ERT2 핵 전위 도메인을 본 명세서에 기재된 바와 같이 synTF를 조절하는 데 사용할 수 있다(예를 들어, Indra et al. Nucleic Acids Res (1999) 참조). 인간 에스트로겐 수용체(ER)는, 다른 단백질 도메인에 융합될 때, 활성에 대한 리간드-의존적 제어를 생성할 수 있는 리간드 반응성 도메인을 포함한다. 도메인은 동족 리간드의 부재 하에 세포의 세포질 인자와 자연적으로 결합하여, 세포질에 효과적으로 스스로 격리된다. 에스트로겐 또는 기타 스테로이드 호르몬 유도체와 같은 동족 리간드의 결합은 세포질 복합체로부터의 해리를 허용하고 핵 국재화 신호를 노출시켜, 핵으로의 전위를 허용하는 수용체에 대한 형태적 변화를 야기한다. 이 에스트로겐 수용체 리간드 결합 도메인(ERT2)의 돌연변이된 변이체는 특정 "직교" 리간드(예를 들어, 타목시펜, 4-하이드록시타목시펜)에 대한 민감도를 향상시켰고 내인성 리간드(예를 들어, 에스트라디올)에 대한 민감성을 감소시켰다.
4-하이드록시타목시펜(4OHT)은 특정 유방암에 대한 치료제로 FDA 승인을 받은 에스트로겐 수용체의 선택적 조절제(modulator)이다.
ZF DNA 결합 도메인, 이펙터 도메인, 및 ERT2 도메인을 함유하는 융합 단백질의 발현은 synTF의 세포질 국재화를 허용하며, 그로 인해 유전자 발현 카세트가 핵/게놈에 존재하기 때문에 국소 유전자 조절이 기능적으로 불활성화되게 한다.
이어서, 4OHT의 투여는 synTF의 조건부 핵 전위를 허용하여, 세포 핵에서 synTF 기능을 허용할 수 있다(예를 들어, 도 4 참조).
자가-절단 프로테아제 도메인
비-구조적 단백질 3(NS3) 도메인을 synTF 활성에 대한 소분자 조절 제어에 사용할 수 있다(예를 들어, Lin et al. PNAS(2008) 참조). 비구조 단백질 3(NS3)은 C형 간염 바이러스에서 유래한 세린 프로테아제이며 발현된 단백질로부터 자연적으로 자가-절제될 수 있다. 이와 같이, ZF와 이펙터 도메인 사이에 배치된 NS3 단백질 도메인을 갖는 발현된 융합 단백질의 개발은 synTF 하위 도메인의 자동-절단 및 분리를 허용하며, 그로 인해 국소 유전자 조절 기능이 불활성화되게 한다.
많은 FDA-승인된 소분자가 NS3 프로테아제를 표적화하고 HepC 치료 개입 전략으로서 이의 절단 활성을 억제하도록 개발되었다.
이어서, 이러한 소분자 중 하나 - 예를 들어, 그라조프레비르 - 의 투여는 융합 단백질에서 NS3의 자가 절제를 방지할 수 있어, ZF와 이펙터 도메인이 국소적으로 커플링된 상태를 유지하고 synTF 기능을 유지하도록 할 수 있다.
소분자의 부재 하에, NS3 프로테아제는 발현된 융합 단백질로부터 자가-절단되어, DNA 결합 및 이펙터 도메인의 분리를 통해 합성 전사 인자가 불활성화되게 한다. 소분자의 존재 하에, NS3 프로테아제 활성이 억제되고 융합 단백질 복합체가 안정화되어, 전사 인자가 반응성 프로모터로부터의 아웃풋 유전자의 발현을 조절하도록 허용한다(예를 들어, 도 5a-5c 참조).
유도된 분해 도메인
NS3 도메인을 함유하는, SMASh(Small Molecule-Assisted Shutoff) 도메인은 synTF 활성에 대한 소분자 조절 제어에 사용될 수 있다. 소분자-보조 차단(SMASh) 태그는 NS3 프로테아제, 부분 NS3 헬리카제 도메인, 및 NS4A 도메인을 함유하는 조작된 단백질 도메인이다. 모든 개별 요소는 C형 간염 바이러스에서 유래된다.
NS3 프로테아제와 부분 NS3 헬리카제 및 NS4A 도메인의 조합된 배열은 "데그론" 서열을 유도하여, 도메인의 신속한 분해를 촉진한다(예를 들어, Chung et al. Nat Chem Biol 2015 참조).
관심 단백질의 N- 또는 C-말단에 대한 SMASh 도메인의 융합은 이의 자가-절단 및 단백질로부터의 분리를 초래하여, SMASh 도메인이 분해에 대해 표적화되는 동안 관심 단백질이 발현되게 한다.
이어서, NS3 억제제 소분자, 예를 들어, 그라조프레비르의 투여는 관심 단백질로부터 SMASh의 자가-절제를 방지할 수 있어, 전체 융합 단백질이 분해에 대해 표적화되게 하고 그리하여 관심 단백질이 비발현되게 한다.
NS3-함유 SMASh 단백질은 합성 전사 인자의 활성을 번역-후에(post-translationally) 조절하도록 하기 위해 본 명세서에서 사용되었다(예를 들어, 도 6a-6b 참조).
실험적 분석 및 지지 데이터
ABI/PYL 도메인을 사용하는 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(ABA)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적인 활성화를 야기하였다. 아웃풋 형광을 나타낸 바와 같이 여러 다른 ABA 처리 농도의 함수로 측정했다(용량 반응; 예를 들어, 도 7a 참조). 소분자(ABA)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적인 활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 7b 참조). 4일 후 소분자(ABA)의 제거는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 7c 참조).
ERT2 도메인을 사용하는 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(4OHT)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다. 아웃풋 형광을 나타낸 바와 같이 여러 다른 4OHT 처리 농도의 함수로 측정했다(용량 반응; 예를 들어, 도 8a 참조). 소분자(4OHT)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 생산량의 일시적 활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 8b 참조). 4일 후 소분자(4OHT)의 제거는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 8c 참조).
NS3를 사용한 인간 세포주에서 형광 단백질의 용량- 및 시간-유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다. 아웃풋 형광은 나타낸 바와 같이 여러 다른 그라조프레비르 처리 농도의 함수로 측정했다(용량 반응)(예를 들어, 도 9a 참조). 소분자(그라조프레비르)의 투여는 Jurkat 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 야기하였다(예를 들어, 도 9b 참조). 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 4일 후 소분자(그라조프레비르)의 제거는 Jurkat 세포주에서 ZF 반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 불활성화를 야기하였다. 이 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다(예를 들어, 도 9c 참조).
소분자(예를 들어, ABA, 4OHT, 또는 그라조프레비르)의 투여는 HEK293 및 Jurkat 세포주 둘 다에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 활성화를 유도했다(예를 들어, 도 10a-10d 참조) . 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 소분자(예를 들어, ABA, 4OHT 또는 그라조프레비르) 처리 농도의 함수로 아웃풋 형광도 여기에 나타나 있다.
인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 소분자(ABA)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 상단 그래프 참조). 소분자(4OHT)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이러한 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 중간 그래프 참조). 소분자(GRZ)의 투여는 HEK293 세포주에서 ZF-반응성 프로모터로부터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이러한 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 11b, 하단 그래프 참조).
인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 소분자(그라조프레비르)의 투여는 HEK293 및 Jurkat 세포주에서 ZF-반응성 프로모터의 형광 단백질 아웃풋의 일시적 침묵을 야기하였다. 이 감소된 발현 수준을 발현 아웃풋을 침묵시키지 않는 미처리 세포주와 비교하였다(예를 들어, 도 12a-12c 참조).
1차 인간 세포에서 키메라 항원 수용체의 유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 CD4+ 1차 인간 T 세포에서 ZF 반응성 프로모터로부터 형광적으로 태깅된(fluorescently-tagged) 키메라 항원 수용체(CD19-CAR) 단백질의 일시적 활성화를 야기하였다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 그라조프레비르 처리 농도의 함수로서의 아웃풋 형광도 여기에 나타나 있다. CD19 항원 제시 표적 세포와 이들 1차 세포의 후속 공동 배양은 T-세포 활성화를 초래했으며, 이는 사이토카인의 향상된 생산으로 측정되었다. 이 향상된 수준의 사이토카인 생산을 사이토카인 발현을 활성화하지 않은 미처리 세포주와 비교하였다. 여러 다른 그라조프레비르 처리 농도의 함수로서의 사이토카인 생산도 여기에 나타나 있다(예를 들어, 도 13a-13d 참조).
1차 인간 세포에서 키메라 항원 수용체의 유도성 합성 전사 활성화(이중 약물 조절 맥락에서): 소분자(4OHT)의 투여는 CD4+ 1차 인간 T 세포에서 ZF-반응성 프로모터로부터 IL4 사이토카인의 발현 및 분비를 야기하였다. 이 시스템을 직교 ZF 반응성 프로모터의 형광적으로 태깅된 키메라 항원 수용체(CD19-CAR) 단백질의 또 다른 소분자(그라조프레비르) 조절 활성화와 연계하여 사용하였다. ERT2-synTF는 4OHT에만 반응했으며 그라조프레비르의 존재에 영향을 받지 않았다. 마찬가지로, NS3-synTF는 그라조프레비르에만 반응했으며 4OHT의 존재에 영향을 받지 않았다. (예를 들어, 도 14a-14b 참조).
Jurkat 인간 세포주에서 사이토카인의 유도성 합성 전사 활성화: 소분자(그라조프레비르)의 투여는 Jurkat T 세포주에서 ZF-반응성 프로모터로부터 사이토카인(IL10)의 일시적 활성화를 야기하였다. 이러한 향상된 발현 수준을 발현 아웃풋을 활성화하지 않은 미처리 세포주와 비교하였다. 이러한 유도성 활성화는 NS3-synTF 발현 및 IL10 생산을 위한 별도의 렌티바이러스 카세트("이중 렌티바이러스 벡터")의 전달을 통해, 또는 NS3-synTF를 발현할 뿐만 아니라 IL10 생산을 조절하는 단일 렌티바이러스 카세트의 전달을 통해 달성할 수 있다(예를 들어, 도 15a-15c 참조).
ERT2 및 SMASh 도메인을 사용하는 인간 세포주에서 형광 단백질의 유도성 합성 전사 활성화 및 조정가능한 불활성화 : 3개의 Jurkat T 세포주를 테스트했다: (1) ZF-p65-ERT2(SMASh 없음, 예를 들어, 도 4 참조); (2) ZF-p65-ERT2-SMASh(C-말단 SMASh); 및 (3) SMASh-ZF-p65-ERT2(N-말단 SMASh)(예를 들어, 도 16a 참조). 4일 동안 ERT2 반응성 소분자(4OHT)의 투여는 모든 세포주에서 ZF 반응성 프로모터로부터 형광 단백질의 일시적 활성화를 야기하였다. 6 내지 16일째부터 소분자(4OHT)의 후속 제거는 모든 세포주에서 형광 단백질의 일시적 불활성화를 야기하였다. 12일 동안 SMASh-반응성 소분자(그라조프레비르)의 부재는 기준선 수준으로 리포터의 동등하고 느린 불활성화를 야기하였다. 12일 동안의 SMASh 반응성 소분자(그라조프레비르)의 투여는 기준선 수준으로 리포터의 빠른 불활성화를 야기하였다. 리포터의 이러한 신속한 불활성화를 SMASh 도메인이 없는 조건과 비교했으며, 이는 "그라조프레비르의 부재"에서와 같이 동등한 느린 불활성화를 야기하였다(예를 들어, 도 16b 참조).
ERT2 및 SMASh 도메인을 사용하여 인간 세포주에서 형광 단백질의 조정가능한 합성 전사 활성화: 2개의 Jurkat T 세포주를 테스트했다: (1) ZF-p65-ERT2-SMASh(C-말단 SMASh) 및 (2) SMASh -ZF-p65-ERT2(N-말단 SMASh). 4일 동안 다양한 양의 ERT2 반응성 소분자(4OHT) 및 SMASh 반응성 소분자(GZV)의 공동 투여는 ZF 반응성 프로모터로부터 형광 단백질의 일시적 활성화를 다양한 수준으로 야기하였다. 모든 조건에서 4OHT가 없거나 최소한이면 활성화가 거의 또는 전혀 야기되지 않았다. 모든 조건에서 존재하거나 거의 최대에 가까우면 활성화가 거의 또는 전혀 야기되지 않았다. 4OHT의 존재 및 GZV의 부재는 최대 활성화를 야기한다. C-말단 및 N-말단 SMASh 변이체는 GZV 농도에 대해 차등적 민감도를 나타냈다(예를 들어, 도 17 참조).
ERT2 및 SMASh 도메인을 사용하는 인간 세포주에서 형광 단백질의 유도성 합성 전사 억제: 3개의 Jurkat T 세포주를 테스트했다: (1) KRAB-ZF-ERT2-SMASh; (2) HP1a-ZF-ERT2-SMASH; 및 (3) EED-ZF-ERT2-SMASH. 6일 동안 ERT2 반응성 소분자(4OHT)의 투여는 모든 세포주에서 ZF 반응성 프로모터로부터 형광 단백질의 일시적 억제를 야기하였다. 음성 대조군에서 SMASh-반응성 소분자(GZV)의 부재는 4OHT 부재 하에 유의한 "누출(leaky)" 억제를 야기하였다(예를 들어, 도 18 참조).
실시예 2: 포유류-최적화되고, 협력적으로 자가-조립되는 합성 전사 인자(synTF) 및 포유류 유전자 발현의 약물-유도성 컨트롤러
세포는 다인자 화학적 및 생물학적 자극에 반응하여 정확한 유전자 발현 프로그램을 활성화한다. 이 과정에 대한 의도적 조작이 합성 생물학의 주요 목표이며, 이를 인간 세포에 적용하면 인간 생물학을 이해하고 질병에 정교한 방식으로 반응하는 차세대 진단 및 치료제 개발하는 데 돌파구를 마련할 수 있다. 실제로, 종양단백질의 기초 연구에서 세포 재프로그래밍, 세포 치료 개발에 이르기까지, 다양한 응용 분야는 입력 신호에 대한 응답으로 유전자 발현 아웃풋의 정확하고 조정가능한 제어를 필요로 한다. 불행히도, 포유류 세포에서 인공적으로 유전자 발현을 제어하는 도구는 근본적인 생물학적 과정을 연구하고 설계자 세포-기반 치료법을 설계하는 능력을 크게 제한하는 상당한 한계가 있다. 가장 널리 사용되는 도구는 박테리아 전사 시스템에서 유래된, 구세대 기술이고; 이들은 동시에 제어할 수 있고 조정가능하지 않으며, 새로운 입력 신호를 유연하게 통합할 수 없는 유전자의 수에 제한을 부여한다. 결과적으로, 연구자들은 생화학적 신호(예를 들어, 리간드, 화학적 인듀서, 형태발생적 신호(cues))를 유연하게 감지 및 통합하고, 이에 따라 조정가능한 활성화 프로파일을 생성할 수 있는 정교한 유전자 발현 컨트롤러를 생성할 수 없다. 포유류 세포에서 이러한 정밀한 유전자 발현 컨트롤러에 의해 변형될 수 있는 많은 생물의학 적용 중에는, 과잉-활성화 및 조직 특이성과 관련된 문제로 고통받을 수 있는, 암, 자가면역, 및 재생 의학을 위한 세포-기반 치료제의 개발이 있다.
본 명세서에는 포유동물 세포에서 유전자 발현 조절을 조절하기 위한 조성물, 방법 및 시스템이 기술되어 있다. 본 명세서에는 원하는 생물의학 적용을 위한 특이성, 제어, 및 활성을 향상시키기 위한 설계자 인간 세포의 "신호 처리" 능력의 확대가 설명되어 있다. 이론에 구속되길 원치 않으면서, 중심 가설은 이러한 확대된 신호 처리가 "단순한" 일대일 조절에 기반한 현재의 유전자 발현 시스템 대신, 협력적, 조합적 전사 조절 체계를 사용하여 달성될 수 있다는 것이다. 이러한 가설은 후생동물(metazoa)에서 신호가 유전자 발현을 활성화하기 위해 협력적으로 조립되는 거대 다가 전사 인자(TF) 복합체를 사용하여 처리되고 통합된다는 관찰에 기반한다.
본 명세서에는 포유동물 유전자 발현 조절을 위한 정보 처리 모듈이 기술되어 있다. 기능성은 인간 1차 면역 세포에서 입증되는데, 이는 인간 생리학 및 세포 면역요법에서의 사용에서 이들이 수행하는 기본적인 역할 때문이다. 본 명세서에는 FDA 승인 직교 약물에 의해 조절되는 유도성 컨트롤러가 설명되어 있다. 컨트롤러는 표준 바이러스 벡터에 의해 발현되며, 이들은 자가면역 및 암에 대해 치료적으로 중요한 리포터 또는 유전자 산물(synTF 및 사이토카인)의 조절된 발현을 유도하는 것으로 입증되어 있다. 따라서, 포유류 유전자 발현의 포유류-최적화된, 협력적으로 자가-조립되는 합성 전사 인자(synTF) 및 약물-유도성 컨트롤러가 본 명세서에 기재되어 있다.
이러한 약물-유도성 컨트롤러는 포유류 시스템 전반에 걸쳐 정밀한 유전자 발현 조절을 허용한다. 세포 치료를 개선하기 위해 조작된 인간 세포의 감지 및 반응 능력을 확대하는 것 외에도, 이러한 컨트롤러는 기본적인 생물의학 연구에 광범위하게 유용하다. 이것은 동시에 다수의 유전자 생성물(예를 들어, 종양단백질 또는 재프로그래밍 인자)에 대한 약물-유도성, 일시적 제어를 허용하는 것을 포함한다.
유전자 발현 제어 시스템: 전망과 한계.
살아있는 시스템에서 정보 흐름에 대한 의도적 조작은 합성 생물학의 궁극적인 목표이며, 인간 세포에 대한 이의 적용은 인간 생물학의 이해와 차세대 진단 및 치료제 개발의 돌파구로 이어질 수 있다. 특히, 유전자 발현 기술은 광범위한 응용을 위해 세포에서 이러한 정보 흐름을 조절하는 데 중요한 역할을 해왔다. 예를 들어, 오르가노이드를 형성하는 발달 과정은 유전자 조절 네트워크(GRN)의 형태로 줄기 세포에서 게놈적으로 코딩된다. 유전자 발현 제어 회로를 통한 GRN의 조작은 시험관내에서 형태형성(morphogenesis)을 프로그래밍하고 가이드하는 데 유익한 것으로 입증되었다. 동물 모델 개발에서, 조직-특이적 및 소분자 유도성 프로모터는 종종 유전자 발현의 기관-특이적 및 시간적 제어를 달성하는 데 사용된다. 또한, c-fos 프로모터는 마우스에서 활성화된 뉴런을 기능적으로 라벨밍하고 광유전학적 채널 로돕신 단백질의 발현을 제어하여 빛 자극으로 공포 기억을 인공적으로 회상시키는 데 사용되었다. 마지막으로, 인간 T 세포에서, 항원-특이적 scFv 및 T 세포 신호전달 도메인의 융합물인, 키메라 항원 수용체(CAR)의 이소성 과발현은 최근 임상 시험에서 급성 림프모구성 백혈병(ALL)에 대한 높은 효능으로 암에 대한 특이성을 재유도할 수 있다.
현재의 유전자 발현 기술이 근본적이고 치료적인 돌파구로 이끌었으나, 이들의 단점 또한 많다. 예를 들어, 유도 만능 줄기 세포로부터의 세포 재프로그래밍의 비효율은 종종 주요 단백질 및 전사 인자가 올바른 농도와 시간에서 발현되지 않기 때문에 기인된다. 또한, c-fos 프로모터는 다양한 뉴런에서 다양한 활성을 갖는 것으로 알려져 있으며, 이는 많은 응용 분야에서 사용할 수 없게 한다. 또한, 조직 특이적 프로모터에 대해 많은 표적-이탈 효과가 보고되어 있으며, 그에 따라 데이터 해석을 혼란스럽게 한다. 마지막으로, 유망한, 세포 면역요법은 세포 특이성, 과잉 활성화, 천연 면역 시스템 및 조직 미세환경과의 예기치 않은 상호작용과 관련된 문제의 조합으로 인해 종종 (치명적인) 부작용을 나타냈다.
누적적으로, 앞서 언급한 문제는 포유류 세포로 정교한 "신호 처리"를 조작하는 연구자의 능력을 제한하는, 현재 유전자 발현 제어 시스템의 근본적인 한계의 결과이다. 첫째, 사용 중인 전사 제어 시스템의 수가 적고, 하나의 잘 개발되고 널리 사용되는 화학적으로 유도가능한 유전자 발현 시스템(TetR-기반 tTa)이 있기때문에 더욱 악화된다. 이것은 연구자들이 포유류 세포에서 한 번에 하나의 유전자 산물만을 확실하게 조건부로 유도할 수 있음을 의미한다. 둘째, 시스템은 사실상 표준 미생물 전사 시스템(예를 들어, TetR)의 모든 유도체이다. 고도로 활동적이지만, 이러한 시스템은 고정된 반응 프로파일을 가지고 있으며, 치료 단백질이 생산되는 방식을 정확하게 조정하기 위해 이들의 활성화 프로파일을 예측적으로 재구성하는 전략은 사소하지 않다. 따라서, 세포-자율 컨트롤러를 설계하든지 아니면 외인성 유도성 컨트롤러를 설계하든지 간에, 현재 도구는 새로운 입력 신호를 유연하게 통합하고 원하는 적용을 위한 맞춤형 전사 프로그램(아웃풋)을 생성할 수 없다.
포유류 유전자 발현 조절을 위한 강력한 정보-처리 모듈이 본 명세서에 기술되어 있다. synTF 프레임워크는 인간 세포 조작 적용과 호환된다: 이는 매우 조정가능하고 확립된 바이러스 벡터를 사용하여 쉽게 전달되는 작은 전체적으로 인간-유래된 단백질 도메인으로 구성된다. 인간 생리학에 대한 이들의 중요성 및 세포 면역 요법에서의 이들의 사용으로 인해 기능성은 인간 1차 면역 세포에서 입증된다. 유연성과 일반화 가능성을 보여주기 위해, 이 핵심 시스템은 조작된 면역 세포에서 다양한 유형의 유용한 유전자 발현 컨트롤러, 예컨대 직교, FDA 승인 약물의 투여에 의해 외인성으로 제어되는 유도성 컨트롤러를 구성하는 기초로 사용된다. 이러한 컨트롤러는 치료 유전자(synTF 및 사이토카인)의 생산과 연결되며, 그로 인해 컨트롤러의 적용은 영향을 받아 암, 자가면역 및 재생 의학에 대한 차세대 세포 치료제의 신호 처리 특징(증가된 특이성, 제어 및 활성)이 강화된다.
주요 혁신은 포유류 세포 조절을 위해 특별히 최적화된 새로운 종류의 합성 TF 시스템이 포함하며, 다음과 같은 특징이 있다: 인간 유래 구성요소, 확립된 바이러스 벡터를 사용하여 손쉬운 전달을 위한 컴팩트한 유전자 페이로드, 조정가능한 분자 특성을 가진 모듈 도메인, 및 천연 트랜스크립톰에 직교하는 특정 조절. 또한 인간 1차 면역 세포에서 synTF 및 사이토카인 생산의 조정가능한 제어를 허용하는 것으로 입증된, 포유류 세포에 대한 새로운 직교 약물-유도성 유전자 발현 시스템의 세트가 본 명세서에 기재되어 있다.
포유류 세포에서 유전자 발현을 제어하기 위한 현재 도구는 심각하게 제한되어 있다. 인간 세포에서 새로운 정밀 유전자 발현 컨트롤러를 생성하는 데에는 (1) 확대된 직교 DNA 결합 부분 세트를 갖고, (2) 테트라사이클린 항생제를 넘어 안전한 전달가능한 화학 물질에 반응하고, (3) 고도로 조정가능한 활성화/응답 프로파일을 허용하는 전사 시스템의 개발을 필요로 한다. 본 명세서에 설명된 것은 이러한 요구 사항을 충족하는 것이 특징인 "포유류-최적화된" 합성 TF(synTF) 시스템의 새로운 클래스이다. 이러한 synTF는 인간 1차 면역 세포에서 치료 유전자 생성물의 활성화 프로파일을 조정하기 위해 약물-유도성 컨트롤러에 사용된다.
직교 징크 핑거 어레이를 기반으로 하는 포유류 synTF의 생성 및 특성화
포유류 synTF는 인간 세포에서 정확하고 효과적인 직교 전사 제어를 위해 개발되었다. synTF는 인공 C2H2 징크 핑거(ZF) 어레이를 기반으로 한다. ZF는 자연적인 인간(및 모든 진핵생물) TF 중에서 가장 일반적인 DNA 인식 모티프이다. ZF는 인간 세포에서 인공 전사 제어 시스템을 조작하기 위한 근간으로서 4가지 주요 이점을 제공한다: (1) ZF는 인간-유래(TALE 또는 CRISPR/Cas9와 달리)이며 그에 따라 바람직하지 않은 면역 반응을 유발할 가능성이 적다. 실제로, 구세대 ZF 시스템은 영장류에서 치료 유전자 산물의 장기간 조절을 달성하기 위한 임상적으로 실행가능한 전략인 것으로 드러났다. (2) 더 부피가 큰 대응물(예를 들어, CRISPR/Cas9)과 달리, ZF 단백질은 작기 때문에(~30-AA 도메인은 DNA의 3bp에 결합함), 일반적인 바이러스 벡터를 사용하여 쉽게 패키징되고 전달되는 컴팩트한 유전자 페이로드 디자인을 허용한다. (3) 아래에 설명된 바와 같이, ZF-기반 synTF는 고도로 조정가능한 분자 특성을 가진 모듈식 디자인을 가지고 있다. (4) 맞춤형 DNA-결합 특이성을 가진 ZF 어레이는 다양한 synTF-DBM 특이성을 생성하도록 조작될 수 있다. 게놈-직교 DBM을 표적으로 하는 ZF-기반 합성 전사 조절인자(regulators)는 포유류 조작 응용을 위해 아직 개발되지 못했다.
포유류, 직교 synTF의 라이브러리 생성 및 평가
원칙적으로 인간 게놈에서 고유한 주소지정가능성(addressability)을 제공하는 길이인, 정의된 20-bp DBM을 표적으로 하는 6-유닛 ZF 어레이를 생성하기 위한 워크플로우가 본 명세서에 설명되어 있다. 워크플로우는 모듈식 어셈블리와 2-유닛 빌딩 블록에서 6-유닛 어레이의 기능적 선택을 활용한다. 이 접근법을 이용하여, 인간 게놈에 대한 직교성을 최대화하도록 선택된 결합 특이성을 갖는 11개의 6-유닛 어레이의 라이브러리를 생성했다(예를 들어, 그 내용이 그 전체로 본 명세서에 참조로 통합되는, 미국 특허 공개 US20180057838 참조). 본 발명자들은 이러한 어레이를 인간 전사 이펙터 도메인(p65 활성화 도메인, KRAB/HP1a 침묵 도메인)에 융합시켜 인간화된 최소 synTF를 생성했다(예를 들어, 도 1a 참조). 이들의 활성을 테스트하기 위해, 형광 단백질의 전사를 구동하는 최소 프로모터의 상류에 4개의 탠덤 20-bp DBM으로 구성된, synTF-반응성 리포터 구축물을 보유하는 상응하는 HEK293FT 리포터 라인을 생성시켰다(예를 들어, 도 1b 참조). 각 synTF 발현 구축물을 사용한 리포터 세포의 형질도입은 이들의 상응하는 리포터의 강력한 활성화를 나타내었지만(예를 들어, 도 1c 참조), 비-동족 리포터를 활성화시키지 않았다(예를 들어, 도 1d 참조). 다음으로, RNA-seq 측정을 사용하여 게놈-전체(genome-wide) 전사에 대한 synTF의 영향을 매핑했다. synTF 조절 프로파일은 매우 특이적이었으며, 고유의 전사체 프로파일에 대한 최소한의 효과를 나타내었다(예를 들어, 도 1e-1g 참조). 중요하게는, synTF 트랜스크립톰 프로파일이 고전적인 Gal4 및 TetR 기반 시스템과 유리하게 비교되었으며, 일부 synTF는 차등 조절 분석에 기반한 우수한 특이성을 입증했다(예를 들어, 도 1h 참조). 3개의 독립적인 생물학적 참조에 대한 프로파일 평가를 포함하여, 이 분석을 수행하기 위해 엄격한 프레임워크를 사용하였다. 함께, 이러한 데이터는 6-유닛 ZF 어레이가 포유류 유전자 발현의 특이적이고 효과적인 조절인자인 synTF를 조작하는 데 사용될 수 있음을 입증한다. 이러한 실험은 또한 synTF를 생성하고 평가하기 위한 파이프라인을 확립한다. 도구 개발의 엄격함을 추가로 뒷받침하는 것은 이러한 ZF synTF 중 하나가 포유류 세포에서 강력하고 특이적인 후성유전적 조절을 허용하는 데 사용되었다는 것이다(예를 들어, Park et al. Cell 176, 227-238 e220, (2019) 참조).
유전자 발현 컨트롤러 디자인을 위한 "부품(parts)"으로서 synTF 친화성 변이체의 생성
예외적으로 높은 생체내(in vivo) 활성 및 트랜스크립톰적 특이성을 나타내는 라이브러리(ZF1 및 ZF10)로부터의 2개의 직교 synTF를 추가 개발을 위해 선택했다. 이러한 synTF에 대한 synTF/DBM 친화도(Kt) 변이체를 생성시켰다. 친화도 변이체는 여러 목적으로 사용된다. 첫째, synTF 결합 친화도를 조절하는 것은 전사 아웃풋 수준을 조정하는 데 유용한 전략이다. 포유류 "부품" 툴킷을 채우기 위해, 각 synTF에 대해 ~10개의 변이체의 친화도 시리즈를 생성시켰다(예를 들어, 표 10-12, 서열식별번호: 122-180, 192 참조).
3가지 전략의 조합을 사용하여 낮은 nM - 중간 μM에 걸쳐 있는 ZF-DBM 친화도 변이체를 생성시켰다: (1) DNA 포스페이트 백본 상호작용을 매개하는 ZF(DNA 인식 나선의 외부)에서 보존된 아르기닌 잔기의 알라닌 돌연변이. (2) 전체 길이 6-유닛 ZF 어레이를 4-유닛위 하위어레이로 절단(truncation). (3) 코어 DBM 내부와 직접적으로 측접하는 부분 둘 모두에서 뉴클레오티드 돌연변이. 이들 변이체의 활성은 전술한 생체내(in vivo) 리포터 분석을 사용하여 평가할 수 있다. 이어서, 친화도는 시험관내(in vitro) 결합 분석을 사용하여 직접 측정할 수 있다. 간단히 말해서, ZF-MBP 융합 단백질은 각 변이체에 대해 정제된다. 형광 이방성(FA) 결합 측정을 수행하여 단일 WT DBM을 내포하는 미리-결합된 FITC-라벨링된 올리고 프로브에 대해 DBM 종의 경쟁적 적정을 수행한다. 결합 곡선은 전체 DBM 변이체 세트에 대해 얻을 수 있으며, 데이터를 2차(quadratic) 결합 방정식에 피팅하여 Kt 값을 추출한다. 이 작업의 결과는 유전자 발현 컨트롤러를 설계하는 데 사용할 수 있는 포유류 synTF "부품"(측정된 DBM-결합 친화도를 가짐) 세트이다.
약물-유도성 synTF 컨트롤러 개발 및 인간 1차 면역 세포에서 synTF 및 사이토카인 아웃풋을 일시적으로 제어하는 이들의 활성 테스트
포유류 세포에서 유전자 발현을 다중화하고 원하는 단백질에 대한 일시적인 발현 제어를 허용하는 활성을 제공하는, 직교 FDA-승인 약물에 반응하는 유도성 유전자 발현 컨트롤러가 본 명세서에 기재되어 있다. 컨트롤러를 synTF와 리간드 반응성 도메인을 융합하여 조작했고 인간 T 세포(예를 들어, 1차 T 세포주 및 Jurkat T 세포주)에서 이들의 성능을 평가했으며, 인간 생리학 및 번역 연구에 대한 이들의 확립된 중요성에 기반하여 선택했다. 인간 T 세포, 특히 1차 T 세포에서 유전자 발현을 정밀하게 제어하는 것은 여전히 도전적인 과제로 남아 있다. 따라서, 이러한 세포에서 이러한 시스템을 구축하는 것은 다른 도전적인 세포 유형에 이들을 적용할 수 있는 근간을 제공한다. 유도성 시스템을 항-Her2 synTF 및 IL-12 발현을 제어하는 데 사용하였다. 항-Her2 synTF T 세포는 임상 시험에서 육종 치료에 대한 가능성을 보여주었지만, 치명적인 표적 종양 이탈(on-target-off-tumor) 부작용이 있을 수 있다. 유사하게, IL-12는 강력한 항-종양 활성을 나타내지만, 용량-제한 독성으로 인해 까다롭다. 따라서, 항-Her2 및 IL-12의 조절된 발현은 이들의 안전성 프로파일을 개선할 수 있다.
약물-유도성 synTF는 1차 인간 면역 세포에서 치료 유전자 생성물의 조절된 발현 제어를 가능하게 한다
synTF 활성에 대한 제어를 얻기 위해, 비-구조 단백질(NS3) 도메인을 synTF에 융합시켰다(예를 들어, 도 9a-9b 참조). NS3는 C형 간염 바이러스(HCV)에서 유래하는 자가-절단 프로테아제이며, 단백질 발현을 제어하기 위한 분해 태그로 사용되었다. 약물의 부재 하에, NS3는 ZF 도메인에서 p65 활성화 도메인을 절단하여, 유전자 전사를 방지한다. 세포-투과성 FDA-승인 억제제 그라조프레비르(GZV)가 존재하면, NS3 프로테아제 활성이 차단되어, synTF는 온전하게 유지된다. NS3 시스템은, 부분적으로, 최대 12주 동안 고용량(예를 들어, 100 mg/일)으로 일반적으로 복용하는, GZF의 탁월한 안전성 프로파일 때문에 선택되었다. 콤팩트한, GZV-유도성 synTF 컨트롤러는 단일 렌티바이러스에 패키징될 수 있다. 이는 인간 면역 세포(예를 들어, IL-10 컨트롤러; 예를 들어, 도 15a-15c 참조)에서 치료적으로 관련된 도입유전자(therapeutically-relevant transgenes)의 조절된 발현 제어, 또는 CD4+ 1차 인간 T 세포(예를 들어, 도 13a-13d 참조)에서 기능하는 CD19 CAR의 용량- 및 시간-의존적 발현 제어를 허용한다. 이러한 연구는 포유류 유전자 발현을 조절하기 위한 약물 유도성 synTF 컨트롤러의 유용성을 입증한다.
직교 약물-유도성 유전자 발현 컨트롤러의 개발 및 평가
시스템 설계: 직교 FDA-승인 약물에 반응하는 synTF 컨트롤러 개발은 유전자 발현 제어를 다중화하는 능력을 제공한다. 하기 것에 의해 조절되는 조작된 컨트롤러가 본 명세서에 기술된다: (1) 에스트로겐 수용체 변이체(예컨대, ERT2)에 융합된 분자의 활성을 선택적으로 조절하는 FDA-승인 유방암 치료제 타목시펜의 대사산물인 4-하이드록시타목시펜(4OHT), 및 (2) GZV(위에서 설명한 바와 같음). 4OHT- 및 GZV-유도성 시스템을 리간드 결합 도메인을 2개의 직교 synTF에 융합하여 생성시켰다. 인간 p65를 활성화 도메인으로 사용하였고, synTF의 발현은 구성적 프로모터(예를 들어, EF1-a)에 의해 제어되었다. 관심 유전자를 구동하는 상응하는 synTF-반응성 프로모터와 동일한 pHR 렌티바이러스 벡터에 유도성 synTF를 배치했다.
시스템 평가: GFP, synTF, 및 사이토카인 발현에 대한 분석, 뿐만 아니라 Jurkat 또는 인간 1차 T 세포에서 synTF 활성에 대한 분석이 본 명세서에 설명되어 있다. Jurkat T 세포주의 다양한 유전 회로의 상대적 성능은 인간 1차 CD8 T 세포에서 테스트함으로써 평가할 수 있다. T 세포 생물학의 이해에 관한 이들의 가치와, 소정 비용으로 분석 파이프라인을 확장할 수 있는 이들의 능력 때문에 Jurkat 세포를 사용하였다. Jurkat에서 강력하게 발현되는 synTF는 1차 T 세포에서도 유사하게 강하다.
유도성 synTF를 먼저 리포터로서 GFP(또는 mCherry와 같은 또 다른 검출가능한 마커)를 사용하여 특성규명했다. 전체 시스템을 높을 효율을 보장하기 위해 25의 감염 다중도를 갖는 렌티바이러스 형질도입을 통해 Jurkat T 세포에 도입했으며, qPCR로 바이러스 카피 수(VCN)를 정량화했다. 유도성 synTF 컨트롤러를 특성규명하기 위해, 96웰 플레이트에 각각 5 x 104개 세포를 렌티바이러스와 함께 접종하고, 3승 배수(three orders of magnitude)(예를 들어, GZV 0-10 μM, 4OHT 0-1 μM)에 걸쳐 8가지 다른 약물 농도로 첨가했으며, GFP 발현 수준은 유세포 분석으로 정량화될 수 있다(예를 들어, 도 10a-10d 참조). 유전자 발현 수준은 VCN으로 정규화될 수 있다. 이러한 용량 반응에서, 동적 범위 및 활성화 임계값을 정의할 수 있다. 단일 벡터 디자인에서 선택 마커가 결여될 수 있기 때문에, 형질도입 효율은 4OHT 또는 GZV에 의한 유도 후 GFP 양성 세포의 백분율과 동일한 것으로 가정되었다.
번역 잠재력을 입증하기 위해, 인간 1차 CD8 T 세포에서 synTF 또는 사이토카인 발현을 제어하기 위해 큰 동적 범위를 나타내는 유도성 시스템을 선택할 수 있다. 컨트롤러 회로를 GFP를 치료 단백질(예를 들어, 항-Her2 synTF 또는 IL-12)로 대체하여 조작하고, 렌티바이러스 형질도입을 통해 인간 1차 CD8 T 세포에 도입하고, 본 명세서에 기재된 방법을 사용하여 평가할 수 있다. 간단히 말해서, ROSETTASEP 및 SEPMATE 키트(STEMCELL Technology)를 사용하여 혈액 은행에서 얻은 익명의 남성 및 여성 기증자의 류코팩(leukopaks)으로부터 1차 인간 T 세포를 정제할 수 있다. myc-태깅된 synTF에 대한 면역염색법으로 인듀서의 존재 또는 부재 하의 synTF 발현 수준을 측정하고, ELISA로 IL-12 발현을 측정했다. synTF를 활성화하기 위해, 5 x 104개의 조작된 T 세포를 K562 세포를 발현하는 Her2와 1:1 비율로 96웰 플레이트에서 혼합한다. T 세포 활성화를 사이토카인 생산(예를 들어, IL-2 및 IFN-g), 세포 사멸, 및 증식을 통해 측정한다. 세포 사멸을 유세포 분석을 통해 살아있는 K562 세포(예를 들어, 형광 표지)의 수로 측정한다. synTF 또는 사이토카인을 구성적으로 발현하는 T 세포, 및 synTF 또는 사이토카인이 결여된 세포를 대조군으로 테스트한다. 각 샘플에 대해 3번씩(triplicate) 수행한다. 표본 간의 통계적 유의성은 스튜던트의 T-검정(양측)으로 결정할 수 있다. <0.05인 값은 유의한 것으로 간주된다. 재현성을 보장하기 위해, 각 실험은 3회 초과하여 독립적으로 반복된다.
실시예 3: 면역 세포 요법을 위한 합성 전사 조절
개요: 차세대 세포 요법은 정교한 방식으로 질병을 감지하고 이에 반응할 수 있는 디자이너 면역 세포를 생성하는 것을 추구한다. 이 목표를 달성하려면 복잡한 환경 입력을 처리하고 치료 작용제의 정확하게 조절된 발현을 매개함으로써 인간 세포 기능을 프로그래밍하는 데 사용할 수 있는 조작된 조절 요소와 회로가 근본적으로 요구된다. 이 목표를 위해, 합성 전사 프로그램은 감지 및 반응 모듈과 인터페이스하여 세포에서 새로운 조절 계층(layers)을 구현할 수 있다(예를 들어, 도 1a-1b 참조).
치료 작용제의 단순한 구성적 발현에 대한 의존을 넘어 면역 세포 요법을 진보시키기 위해, 조정가능하고 다용도의 조절 프로파일을 제공하는 프로그래밍가능한 유전 구성요소에 대한 요구가 존재한다. 또한 이러한 구성요소는 높은 특이성, 낮은 면역원성, 및 전달가능성을 포함하는, 인간 치료 맥락과 호환되는 특성을 자체적으로 가져야 한다.
조작된 징크 핑거(ZF) 도메인은 앞서 언급한 고려 사항을 해결할 수 있기 때문에 인간 세포에서 전사 조절을 위한 유망한 부분(moieties)이다. 이러한 자연적으로 콤팩트한 DNA 결합 요소는 진핵생물 전사 인자에 편재하고 있다. 이들은 프로그래밍가능한 서열 인식과 맞춤가능한 분자 특성을 갖춘 모듈식 디자인을 가지고 있다. 이러한 모티프의 구조와 프로그래밍가능성을 이해하여 유용한 유전자 조절 기능을 달성하기 위한 광범위한 기초 작업이 진행되었다.
치료 유전자 조절에 적용하기에 적합한 합성 전사 조절 플랫폼이 본 명세서에 기술되어 있다. 인간 게놈에 고유하고 직교하는 인식 서열을 가진 조작된 ZF 도메인의 라이브러리가 조작되고 활용되며, 이러한 최소 조절인자(regulators)는 제어된 유전자 발현을 달성하기 위해 약물 반응성 도메인에 연결된다. 이 프레임워크는 면역 세포 요법을 위한 정교한 유전자 발현 프로그램을 광범위하게 허용한다.
치료 유전자의 합성 전사 조절을 위한 이러한 플랫폼은 T 세포에서 사용될 수 있다. synTF의 이러한 핵심 전사 인자는 포유류 시스템으로부터의 이들의 콤팩트한 크기와 고유한 유래로 인해 요법에 매우 유리하다. 안전하고/하거나 FDA-승인된 약물을 투여하여 (예를 들어, T 세포에서) 활성을 제어하기 위해 이러한 인자를 소분자-반응성 도메인에 연결시켰다.
합성 징크 핑거-TF 라이브러리의 구축: 독특하고 추정상 인간 게놈에 직교하는 18 bp 결합 모티프를 갖는 조작된 6-유닛 징크 핑거(ZF) 도메인을 사용하여 합성 전사 인자의 라이브러리를 구축했다. 동족 및 비-동족 리포터에 대한 최소 전사 조절인자의 활성을 HEK293 세포주에서 평가했다(예를 들어, 도 1c-1d 참조).
트랜스크립톰 반응의 평가: 본 발명의 합성 전사 조절인자의 발현 시 세포 트랜스크립톰 반응의 변화를 HEK293 세포주에서 측정했다. 이러한 전역(global) 트랜스크립톰 프로파일을 널리 사용되는 "직교" DNA 결합 도메인(예를 들어, Gal4, TetR)의 프로파일과 비교하였다(예를 들어, 도 1f-1h 참조).
유도성 전사 조절인자의 개발: 전사 조절인자를 유전자 발현을 일시적으로 조절하기 위해 유도성 도메인에 커플링시켰다. FDA-승인 약물이거나 인간에게 안전한 것으로 알려진 소분자에 반응하는 후보 유도성 요소를 선택했다. 유도성 전사 조절인자의 용량 의존적 및 시간 의존적 활성을 HEK293 및 Jurkat 세포주 둘 다에서 평가했다(예를 들어, 도 2-4, 5a-5c, 6a-6b, 7a-7c, 8a-8c, 9a-9c, 10a-10d 참조).
면역 세포 기능의 제어: 본 발명의 소분자 유도성 조절 시스템 중 하나(예를 들어, NS3-조절된 synTF)는 일차 CD4+ T 세포에서 CD19 키메라 항원 수용체의 발현을 일시적으로 조절하고 세포 활성화 시 사이토카인의 조정가능한 생산을 허용하는 데 활용되었다(예를 들어, 도 13a-13d 참조).
실시예 4: 인간 세포에서 합성 전사 조절을 위한 플랫폼
치료 세포는 정교한 방식으로 질병을 감지하고 이에 반응하도록 조작될 수 있다. 세포는 자연적으로 다양한 환경 신호를 통합하고 처리할 수 있다. 세포는 그들의 내재적인 유전적 및 후성유전적 프로그램을 사용하여 공간과 시간에 걸쳐 정보를 처리하는 자연적으로 지각하고 적응가능한 디바이스이다. 인공 유전 프로그램은 인간 세포에 새롭고 점점 더 복잡한 치료 기능을 부여할 수 있다.
합성 생물학 분야는 다음과 같은 모든 분야에 실제로 기여해 왔다: (1) 다양한 신호(예를 들어, 인공 수용체, 반응성 단백질)를 식별하기 위한 전략 개발, (2) 정보를 해석하기 위한 새로운 플랫폼 및 셀룰러 로직 모듈(예를 들어, 전사 네트워크, 신호 캐스케이드) 및 (3) 이것들을 바람직하고 효과적인 반응과 치료적 결과로 번역(예를 들어, 교정 도입유전자, 자극 분자). 유전자 프로그램으로 인간 세포를 조작함으로써, 세포는 질병과 관련된 신호를 통합 및 처리하고, 궁극적으로 정교한 방식으로 치료적으로 반응할 수 있는 새로운 기회를 얻게 된다.
전사 인자(TF)는 자연적으로 세포 거동을 조절한다. 새로운 유전 요소는 치료 세포의 신호 처리 능력을 향상시킬 수 있다. 정보 처리와 관련하여, 전사 인자는, 유전자 발현을 국부적으로 그리고 조건부로 조절하는 이들의 본질적인 능력으로 인해 회로 및 유전 프로그램 내에서 주요 매개 조절 요소로 종종 활용된다. TF는 기본적으로 게놈적 과정과 흥미로운 세포 거동을 지배한다(예를 들어, 강력한 유전자 활성화 및 침묵, 분화, 인핸서 등). 이러한 복잡한 거동은 종종 진핵생물 맥락에서 고유한 TF 특징(예를 들어, 인핸서 서열에 대한 특이성, DNA 구조와 염색질을 변형하는 활성, 협동성을 상호작용하는 활성, 다른 유전자를 일시적으로 그리고 순서대로 조절하는 능력 등)으로 인해 나타난다.
역사적으로, 이종성 TF는 원핵생물 시스템(예를 들어, Gal4, TetR, LacI 및 기타)에서 인간 세포의 "직교적으로" 제어 프로그램으로 공동-채택되어 왔다. 이것 자체가 포유류 합성 생물학 분야에서 많은 중요한 기초적 발전을 허용하였으나, 이러한 "원시적(primitive)" 부품을 사용하여 밝혀낼 수 있는 조절 특성과 유용한 거동은 그 양이 비교적 제한적이다.
세포가 보다 신뢰할 수 있는 방식으로 더 많은 정보 채널을 처리할 수 있게 하는 새로운 조절 요소에 대한 지속적인 요구가 존재한다. 합성 전사 조절은 제어가능한 발현을 허용할 수 있다. 본 명세서에 설명된 것은 이러한 TF 사이의 조작된 협력적 상호작용이 복잡한 신호 처리 동작을 일으킬 수 있는 방법에 대한 탐구를 포함하는 맞춤제작가능한 특성을 가진 인공 진핵생물 TF이다.
조작된 유전 성분은 인간 세포에서 정확하고 다용도의 전사 조절을 위해 사용될 수 있다.
인간 세포에서의 치료 적용을 위한 차세대 조절 요소의 개발과 관련하여, 이러한 TF의 유리한 특성을 이하에서 설명한다.
이러한 합성 전사 인자는 다음 요건을 충족한다: (1) 안전하고 비면역원성인 포유동물 시스템에서 유래된 성분, (2) 표적-이탈 효과를 최소화하면서 이들의 오퍼레이터 서열에서 매우 특이적으로 인식하고 조절할 수 있는 성분, (3) 다른 분자 구성요소와 프로그래밍가능하고 조정가능한 상호작용을 허용하는 것들, 및 (4) 확립된 전달 벡터 내에서 인간 세포에서 성공적으로 전달될 수 있는 것들.
조작된 ZF 도메인은 이러한 모든 고려 사항을 해결하는 전사 조절을 위한 유망한 모이어티이다 - 이들은 자연적으로 발생하고, 인간 TF에서 최소 DBD이며, 합성 조절에 적합할 수 있다.
조작된 징크 핑거 도메인은 인간 세포의 처리 능력을 향상시킬 수 있는 합성 전사 조절인자를 구축하는 데 사용될 수 있다.
18bp DNA 오퍼레이터를 특이적으로 인식하는 인공 6-유닛 ZF 도메인 세트를 개발했다; 이것들은 천연 인간 게놈 서열과 거리가 멀고 오르쏘로그성(orthologous)이다. 이러한 조작된 결합 도메인을 인간-유래 이펙터 도메인에 커플링하고 반응성 프로모터를 개발하여 간단한 전사 조절 프로그램을 개발했다. 이러한 프로그램은 치료 회로에서 인터페이스할 수 있다 - 소분자에 반응하는 유도성 synTF를 생성하고 이러한 제어가능한 synTF를 사용하여 치료 아웃풋의 발현을 조절함.
인간 게놈에 직교하는 합성 전사 오퍼레이터 서열이 확인되었다. 편리한 1:1 인식 코드가 있는 다른 기술(예를 들어, TALE, CRISPR)과 비교하여 ZF 도메인을 프로그래밍하는 데에는 특이적인 도전과제가 있다. 하나의 ZF 유닛은 3bp의 DNA를 특정하고 이들은 모듈식으로 연결되어 더 큰 서열 어레이를 특정할 수 있다. 그러나, 이러한 ZF 단위가 더 큰 어레이 내에 배열될 때 상황-의존적 활성(context-dependent activity)이 나타날 수 있다.
게놈-직교 인식 서열 및 기능적이고 활성적인 DNA 결합 도메인을 찾는 이중 도전과제를 해결하기 위해, 2-유닛 ZF 서브어레이 세트를 사용하였다(예를 들어, J. Keith Joung(ZF 아카이브); 미국 특허 제10,138,493호(2018) 참조). 게놈에서 대표성이 낮은(underrepresented) 6bp 인식 서열을 확인했다. 이론에 구속되는 것을 원치않고, 서열들의 연속성(concatenation)이 매우 먼 18bp 서열(고유성을 부여할 수 있는 길이)로 이어질 것이라는 가설을 세웠다. 그런 다음 해당 6-유닛 ZF의 어레이를 스크리닝하여 이러한 서열을 인식할 수 있는 것들을 찾고, 11개 서열("오퍼레이터")과 상응하는 6-유닛 ZF의 초기 라이브러리를 얻었다.
인간 게놈에서 오퍼레이터 서열의 발생을 평가하기 위해 "바이오스트링(Biostrings)"이라 불리는 생물정보학 스트링 매칭 알고리즘을 사용하였다. 합성 오퍼레이터를 여러 표준 TF 오퍼레이터 서열(예를 들어, UAS/Gal4, TetO/TetR, ZFHD1)와 비교하였다. 설명된 워크플로우를 통해 생성된 합성 오퍼레이터를 유사하거나 더 짧은 길이의 이러한 "이종성" 인식 서열에 비해 더 나은 성능을 나타냈다(예를 들어, 도 31 참조).
본 명세서에는 합성 오퍼레이터 서열 및 동족 전사 인자의 라이브러리가 기술되어 있다. 반응 세포주를 형광 아웃풋을 구동하는 최소 프로모터의 상류에 합성 오퍼레이터 서열을 배치하고, 이들을 HEK 세포에 통합함으로써 개발했다. 그런 다음 반응성(즉, 리포터) 세포주를 인간-유래 이펙터 도메인(예를 들어, p65)에 커플링된 조작된 결합 도메인으로 구성된 최소 합성 전사 인자로 일시적으로 형질감염시켰다. 이들 단백질은 어레이에 결합할 수 있었고 이어서 형광 아웃풋의 발현을 부스팅할 수 있었다. 각 리포터는 상응하는 synTF의 존재시에만 켜졌고, ZF 도메인을 대체하는 GFP가 있는 "모의 TF"를 사용하는 음성 대조군의 경우에는 켜지지 않았다. 이 세트의 상호 직교성에 대한 테스트는 TF가 이들의 상응하는 오퍼레이터에 특이적이었으나, 비동족 서열에 대해서는 그렇지 않았다는 것을 입증했다(예를 들어, 도 1a-1d 참조).
synTF 특이성 및 게놈-전체 활성을 설명하기 위해 트랜스크립톰 측정을 사용하였다. 본 발명의 synTF의 특이성과 게놈-전체 직교성은 인간 게놈에서 경험적으로 평가되었다. 단일하게 통합된 HEK 세포주는 이의 동족 형광 리포터와 함께 synTF를 구성적으로 발현했다. 총 RNA를 수집하고 트랜스크립톰 분석을 수행하여 표적-이탈 오조절과 비교하여 형광 트랜스크립톰의 표적-적중(on-target) 조절을 조사했다. 이러한 차등 발현 수준을 GFP-p65 "모의" TF를 포함하는 참조 세포주(reference line)와 비교하였다. synTF 세포주에서 mCherry의 유의한 차등 활성화가 있었지만, 두 세포주 사이의 고유 세포 트랜스크립톰의 극히 높은 상관관계는 synTF가 이들의 표적 부위에서 특이적으로 발현을 조절함을 나타낸다(예를 들어, 도 1e-1h 참조).
본 명세서에 기재된 바와 같이, 소분자 유도성 조절은 synTF 활성의 제어에 유용하다. 합성 전사 조절인자의 약물-제어가능한 버전은 관련 소분자의 존재 및 농도에 반응하는 TF를 생성하여 조작되었다. 이들은 TF의 활성에 대한 조정가능하고 일시적인 제어에 유용하다. 리포터와 synTF를 이러한 페이로드를 다양한 세포 유형에 전달할 수 있는 렌티바이러스 카세트로 이식했다. 다른 메커니즘을 통해 synTF의 활성을 제어하기 위해 3개의 안전한 및/또는 FDA 승인된 소분자를 사용했으며: 이러한 메커니즘은 다음을 포함한다: (1) ABI/PYL 도메인의 앱시스산 매개 헤테로-이량체화; (2) ERT2 도메인의 4-하이드록시타목시펜 매개 핵 전위; 및 (3) 바이러스 NS3 자가-절단 프로테아제의 그라조프레비르 매개 안정화. 3개의 직교 synTF 액티베이터를 각 유도성 시스템에 연결시켰다(예를 들어, 도 2-4, 5a-5c, 6a-6b, 7a-7c, 8a-8c, 9a-9c, 10a-10d 참조).
조정가능한 유전자 활성화는 소분자 유도성 synTF를 사용하여 달성되었다. HEK293 및 Jurkat 세포주 모두에서, 3가지 유도성 synTF 액티베이터 각각에 대한 유도성 프로파일을 결정했다. 리포터 발현을 시간 및 다양한 약물 농도에 따라 평가했다. 4일차에 분석된 가장 높은 수준의 발현이 나타났으며, 이는 미처리 세포주에 비해 약물-처리된 세포주에서 강력한 유도성 발현을 제시한다(예를 들어, 도 10a-10d 참조).
조정가능한 유전자 침묵은 또한 소분자 유도성 synTF를 사용하여 달성할 수 있다. 유전자 발현을 억제할 수 있는 유도성 synTF를 조작했다. 형광 아웃풋을 구성적으로 발현하도록 반응성 프로모터를 변형시켰다. p65 활성화 도메인을 KRAB 억제 도메인(인간-유래 사일런서)으로 대체했고, 동일한 ZF-약물 쌍을 synTF 액티베이터로 이용했다. HEK 세포주에서 3개의 유도성 synTF 억제인자 각각에 대해 유도성 프로파일을 측정했으며, 시간이 지남에 따라 미처리된 세포주에 비해 약물-처리된 세포주에서 리포터 발현의 강력한 침묵이 있었다(예를 들어, 도 11a-11b, 12a-12c 참조).
유도성 synTF는 단일 렌티바이러스 벡터로부터 사이토카인 발현을 조절할 수 있으며, 이는 synTF의 콤팩트한 특성을 입증한다. IL-10의 발현을 차례로 조절할 수 있는 그라조프레비르-유도성 synTF를 발현할 수 있는 단일 렌티바이러스 벡터를 조작했다. 발현 요소를 포함하는 이 전체 삽입물의 크기는 3.5 kB이었으며, 이는 최소 크기이고 특정 벡터의 총 페이로드 패키징 한계에 근접한다. 감염된 Jurkat 세포에서 바이러스를 생성시켰고, 그라조프레비르 투여 2일 후 형질도입된 세포에서 IL-10의 강력한 유도 발현이 관찰되었으며, 이는 이것이 인간 세포에서 치료 아웃풋을 조절하는 효율적인 전략임을 제시한다(예를 들어, 도 15a-15c 참조).
유도성 synTF는 1차 세포에서 synTF 발현을 조절할 수 있다. 그라조프레비르-유도성 synTF를 1차 CD4+ 세포에서 CD19-CAR의 발현을 제어하는 데 사용하였다. 상이한 투여 농도의 약물을 사용하여, synTF의 용량-의존적 발현을 시간 경과에 따라 측정했다. 3일째에 가장 높은 농도로 강한 배수 유도가 나타났다. 그런 다음 그라조프레비르-유도된 세포를 CD19+ 항원 제시 세포와 공동 배양하여 1차 세포를 활성화시키고, IFN감마 및 IL-2 사이토카인의 용량-의존적 생산을 시간에 따라 연이어 측정했다. 이러한 결과는 치료제로부터 아웃풋의 발현을 확실하게 제어할 수 있는 능력을 강조하며, 따라서 이들의 기능성이 점점더 복잡한 설정에서 제어된다는 것을 강조한다(예를 들어, 도 13a-13d 참조).
결론적으로, 유리한 특성을 갖는 새로운 전사 조절 요소를 구축하면 인간 세포가 조정가능하고 신뢰할 수 있는 방식으로 정보를 처리하고 치료 기능을 조절하는 것이 가능하다. 직교 ZF 결합 도메인 및 합성 오퍼레이터 서열의 라이브러리가 특별히 개발되었고, 이들은 최소 전사 조절 프로그램을 조작하는 데 사용되었다. 본 명세서에 나타난 바와 같이, 이러한 synTF는 회로에서 치료 프로그램을 제어하는 데 사용되었고, 따라서 정교한 유전자 발현 프로그램에서 이러한 synTF의 유용성이 입증되었다.
실시예 5: 예시적인 서열
유도 근접 도메인
[ABI]-[ZF]-[2A]-[p65]-[PYL] 합성 전사 액티베이터: 이 특정 실시형태에서, ZF는 ABI 도메인의 C-말단에 융합되는 한편, p65는 PYL 도메인에 N-말단에 융합된다. 두 개의 복합 도메인은 동일한 프로모터에서 발현되며; 이들은 2A 리보솜 스킵 서열에 의해 분리된다(예를 들어, 서열식별번호: 4, 도 19 참조).
[ABI]-[ZF]-[2A]-[KRAB]-[PYL] 합성 전사 리프레서: 이러한 특정 실시양태에서, ZF는 ABI 도메인의 C-말단에 융합되는 한편, KRAB는 PYL 도메인에 N-말단에 융합된다. 두 개의 복합 도메인은 동일한 프로모터에서 발현된다. 이들은 2A 리보솜 스킵 서열에 의해 분리된다(예를 들어, 서열식별번호: 5, 도 20 참조).
세포질 격리 도메인
[ZF]-[p65]-[ERT2] 합성 전사 액티베이터: 이 특정 실시양태에서, p65 이펙터 도메인은 ZF 도메인에 대한 C-말단 융합된다. ERT2 도메인은 p65 도메인에 대해 C-말단에 융합된다(예를 들어, 서열식별번호: 6, 도 21 참조).
[KRAB]-[ZF]-[ERT2] 합성 전사 리프레서: 이러한 특정 실시양태에서, KRAB 이펙터 도메인은 ZF 도메인에 N-말단 융합된다. ERT2 도메인은 ZF 도메인에 대해 C-말단에 융합된다(예를 들어, 서열식별번호: 7, 도 22 참조).
자가-절단 프로테아제 도메인
[ZF]-[NS3]-[p65] 합성 전사 액티베이터: 이러한 특정 실시양태에서, 징크 핑거 DNA 결합 도메인은 NS3 도메인에 대해 N-말단인 한편, 이펙터 도메인은 NS3 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 8, 도 23 참조).
[KRAB]-[NS3]-[ZF] 합성 전사 리프레서: 이러한 특정 실시양태에서, 이펙터 도메인은 NS3 도메인에 대해 N-말단인 한편, 징크 핑거 DNA 결합 도메인은 NS3 도메인에 대해 C-말단이다(예를 들어, 서열식별번호 9, 도 24 참조).
유도된 분해 도메인
[ZF]-[p65]-[ERT2]-[SMASh] 합성 전사 액티베이터 ("C-말단 SMASh"): 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 10, 도 25 참조).
[SMASh]-[ZF]-[p65]-[ERT2] 합성 전사 액티베이터 ("N-말단 SMASh"): 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 N-말단이다(예를 들어, 서열식별번호: 11, 도 26 참조).
[ZF]-[p65]-[SMASh]: 이러한 특정 실시양태에서, SMASh 도메인(NS3 함유)은 징크 핑거 DNA 결합 도메인 및 이펙터 도메인에 대한 C-말단이다(예를 들어, 서열식별번호: 12, 도 27 참조).
[KRAB]-[ZF]-[ERT2]-[SMASh]: 이러한 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 KRAB 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대한 C-말단이다(예를 들어, 서열식별번호: 13, 도 28 참조).
[HP1a]-[ZF]-[ERT2]-[SMASh]: 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 HP1a 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 14, 도 29 참조).
[EED]-[ZF]-[ERT2]-[SMASh]: 이 특정 실시양태에서, ERT2(4OHT에 반응하는 돌연변이된 에스트로겐 수용체 도메인)는 EED 리프레서 도메인 및 징크 핑거 DNA 결합 도메인에 대해 C-말단이다. SMASh 도메인(NS3 함유)은 나머지 도메인에 대해 C-말단이다(예를 들어, 서열식별번호: 15, 도 30 참조).
서열 표
표 1: 예시적인 벡터
표 2: 예시적인 SynTFs (마지막 3개 컬럼은 예시적인 서열식별번호를 나타낸다)
표 3은 예시적인 이종이량체화 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 3: 예시적인 유도 근접 도메인 SynTF
표 4는 예시적인 전위 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 4: 예시적인 세포질 격리 도메인 SynTF
표 5는 예시적인 자가-절단 프로테아제 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 5: 예시적인 억제성 프로테아제 SynTF
표 6 및 7은 예시적인 유도 분해 도메인 SynTF 폴리펩티드 서열에서 특정 도메인의 위치를 나타낸다.
표 6: 예시적인 유도된 분해 도메인 SynTF(액티베이터 도메인)
표 7: 예시적인 유도된 분해 도메인 SynTF(리프레서 도메인)
SEQUENCE LISTING
<110> TRUSTEES OF BOSTON UNIVERISTY
<120> REGULATED SYNTHETIC GENE EXPRESSION SYSTEMS
<130> 701586-095350USPT/WOPT
<150> 62/848,850
<151> 2019-05-16
<160> 380
<170> PatentIn version 3.5
<210> 1
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 1
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Glu Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His
35 40 45
Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu
65 70 75 80
Leu Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu
100 105 110
Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Asp Ala Thr Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 2
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 2
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys
35 40 45
Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu
65 70 75 80
Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu
100 105 110
Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 3
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 3
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His
35 40 45
Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu
65 70 75 80
Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu
100 105 110
Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 4
<211> 903
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (336)..(342)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (364)..(370)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (393)..(399)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (421)..(427)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (450)..(456)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (478)..(484)
<223> Xaa can be any naturally occurring amino acid
<400> 4
Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro
1 5 10 15
Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala
20 25 30
Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met
35 40 45
Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val
50 55 60
Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg
65 70 75 80
Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu
85 90 95
Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn
100 105 110
Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr
115 120 125
Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe
130 135 140
Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr
145 150 155 160
Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala
165 170 175
Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala
180 185 190
Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr
195 200 205
Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg
210 215 220
Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp
225 230 235 240
Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu
245 250 255
Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala
260 265 270
Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala
275 280 285
Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile
290 295 300
Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro
305 310 315 320
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
325 330 335
Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro
340 345 350
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
355 360 365
Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
370 375 380
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
385 390 395 400
Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
405 410 415
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His
420 425 430
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
465 470 475 480
Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Pro Lys Lys
485 490 495
Lys Arg Lys Val Thr Cys Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu
500 505 510
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly His His
515 520 525
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
530 535 540
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
545 550 555 560
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
565 570 575
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
580 585 590
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
595 600 605
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
610 615 620
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
625 630 635 640
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
645 650 655
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
660 665 670
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
675 680 685
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
690 695 700
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly
705 710 715 720
Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln
725 730 735
Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser
740 745 750
Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser
755 760 765
Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys
770 775 780
Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg
785 790 795 800
Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg
805 810 815
Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr
820 825 830
Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His
835 840 845
Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu
850 855 860
Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr
865 870 875 880
Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala
885 890 895
Ser Ile Thr Glu Ala Met Asn
900
<210> 5
<211> 808
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (336)..(342)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (364)..(370)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (393)..(399)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (421)..(427)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (450)..(456)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (478)..(484)
<223> Xaa can be any naturally occurring amino acid
<400> 5
Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro
1 5 10 15
Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala
20 25 30
Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met
35 40 45
Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val
50 55 60
Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg
65 70 75 80
Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu
85 90 95
Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn
100 105 110
Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr
115 120 125
Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe
130 135 140
Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr
145 150 155 160
Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala
165 170 175
Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala
180 185 190
Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr
195 200 205
Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg
210 215 220
Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp
225 230 235 240
Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu
245 250 255
Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala
260 265 270
Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala
275 280 285
Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile
290 295 300
Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro
305 310 315 320
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
325 330 335
Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro
340 345 350
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
355 360 365
Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
370 375 380
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
385 390 395 400
Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
405 410 415
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His
420 425 430
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
465 470 475 480
Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg
485 490 495
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
500 505 510
Glu Glu Asn Pro Gly Pro Gly His His Pro Lys Lys Lys Arg Lys Val
515 520 525
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
530 535 540
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
545 550 555 560
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
565 570 575
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
580 585 590
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
595 600 605
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
610 615 620
Gly Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser
625 630 635 640
Gln Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys
645 650 655
Ser Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp
660 665 670
Ser Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile
675 680 685
Lys Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr
690 695 700
Arg Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu
705 710 715 720
Arg Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile
725 730 735
Thr Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val
740 745 750
His Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val
755 760 765
Leu Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp
770 775 780
Thr Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu
785 790 795 800
Ala Ser Ile Thr Glu Ala Met Asn
805
<210> 6
<211> 692
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (20)..(26)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (48)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (77)..(83)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (105)..(111)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (134)..(140)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (162)..(168)
<223> Xaa can be any naturally occurring amino acid
<400> 6
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
100 105 110
Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
180 185 190
Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
195 200 205
Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala
210 215 220
Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala
225 230 235 240
Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu
245 250 255
Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
260 265 270
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
275 280 285
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val
290 295 300
Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
305 310 315 320
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
325 330 335
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
340 345 350
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln
355 360 365
Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg
370 375 380
Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys
385 390 395 400
Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu
405 410 415
Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg
420 425 430
Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp
435 440 445
Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe
450 455 460
Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp
465 470 475 480
Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro
485 490 495
Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly
500 505 510
Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr
515 520 525
Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys
530 535 540
Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser
545 550 555 560
Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu
565 570 575
Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu
580 585 590
Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu
595 600 605
Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser
610 615 620
Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala
625 630 635 640
Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser
645 650 655
Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser
660 665 670
Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe
675 680 685
Pro Ala Thr Ala
690
<210> 7
<211> 605
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (127)..(133)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (155)..(161)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (184)..(190)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (212)..(218)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (241)..(247)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (269)..(275)
<223> Xaa can be any naturally occurring amino acid
<400> 7
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
65 70 75 80
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
85 90 95
Val Leu Glu Gly Gly Gly Gly Ser Gly Thr Cys Arg Ser Arg Pro Gly
100 105 110
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe
130 135 140
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
165 170 175
Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
180 185 190
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
195 200 205
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr
210 215 220
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys
245 250 255
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val
275 280 285
Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser
290 295 300
Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu
305 310 315 320
Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile
325 330 335
Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met
340 345 350
Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile
355 360 365
Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp
370 375 380
Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly
385 390 395 400
Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro
405 410 415
Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val
420 425 430
Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met
435 440 445
Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu
450 455 460
Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu
465 470 475 480
Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu
485 490 495
Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln
500 505 510
Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser
515 520 525
Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val
530 535 540
Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His
545 550 555 560
Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser
565 570 575
His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr
580 585 590
Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
595 600 605
<210> 8
<211> 704
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (20)..(26)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (48)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (77)..(83)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (105)..(111)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (134)..(140)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (162)..(168)
<223> Xaa can be any naturally occurring amino acid
<400> 8
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
100 105 110
Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
180 185 190
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys
195 200 205
Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly
210 215 220
Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly
225 230 235 240
Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly
245 250 255
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
260 265 270
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
275 280 285
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
290 295 300
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
305 310 315 320
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
325 330 335
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
340 345 350
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
355 360 365
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
370 375 380
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu
385 390 395 400
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
405 410 415
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
420 425 430
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
435 440 445
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
450 455 460
Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val
465 470 475 480
Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro
485 490 495
Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Asp
500 505 510
Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser
515 520 525
Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro
530 535 540
Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro
545 550 555 560
Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala
565 570 575
Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu
580 585 590
Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser
595 600 605
Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu
610 615 620
Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr
625 630 635 640
Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr
645 650 655
Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro
660 665 670
Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile
675 680 685
Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu
690 695 700
<210> 9
<211> 609
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (450)..(456)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (478)..(484)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (507)..(513)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (535)..(541)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (564)..(570)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (592)..(598)
<223> Xaa can be any naturally occurring amino acid
<400> 9
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
65 70 75 80
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
85 90 95
Val Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
100 105 110
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys
115 120 125
Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly
130 135 140
Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly
145 150 155 160
Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly
165 170 175
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
180 185 190
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
195 200 205
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
210 215 220
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
225 230 235 240
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
245 250 255
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
260 265 270
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
275 280 285
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
290 295 300
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu
305 310 315 320
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
325 330 335
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
340 345 350
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
355 360 365
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
370 375 380
Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val
385 390 395 400
Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro
405 410 415
Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Ser
420 425 430
Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
465 470 475 480
Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe
485 490 495
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa
500 505 510
Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile
515 520 525
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys
530 535 540
Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
545 550 555 560
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr
565 570 575
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
580 585 590
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln
595 600 605
Leu
<210> 10
<211> 998
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (20)..(26)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (48)..(54)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (77)..(83)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (105)..(111)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (134)..(140)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (162)..(168)
<223> Xaa can be any naturally occurring amino acid
<400> 10
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
100 105 110
Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
180 185 190
Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
195 200 205
Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala
210 215 220
Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala
225 230 235 240
Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu
245 250 255
Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
260 265 270
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
275 280 285
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val
290 295 300
Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
305 310 315 320
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
325 330 335
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
340 345 350
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln
355 360 365
Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg
370 375 380
Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys
385 390 395 400
Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu
405 410 415
Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg
420 425 430
Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp
435 440 445
Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe
450 455 460
Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp
465 470 475 480
Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro
485 490 495
Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly
500 505 510
Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr
515 520 525
Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys
530 535 540
Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser
545 550 555 560
Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu
565 570 575
Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu
580 585 590
Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu
595 600 605
Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser
610 615 620
Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala
625 630 635 640
Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser
645 650 655
Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser
660 665 670
Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe
675 680 685
Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu
690 695 700
Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp
705 710 715 720
Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro
725 730 735
Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile
740 745 750
Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln
755 760 765
Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly
770 775 780
Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser
785 790 795 800
Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu
805 810 815
Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr
820 825 830
Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile
835 840 845
Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg
850 855 860
Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro
865 870 875 880
Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly
885 890 895
Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr
900 905 910
Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr
915 920 925
Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys
930 935 940
Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly
945 950 955 960
Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val
965 970 975
Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro
980 985 990
Asp Arg Glu Val Leu Tyr
995
<210> 11
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (325)..(331)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (353)..(359)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (382)..(388)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (410)..(416)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (439)..(445)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (467)..(473)
<223> Xaa can be any naturally occurring amino acid
<400> 11
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser
1 5 10 15
Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg
20 25 30
Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn
35 40 45
Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe
50 55 60
Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala
65 70 75 80
Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr
85 90 95
Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser
100 105 110
Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val
115 120 125
Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg
130 135 140
Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser
145 150 155 160
Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg
165 170 175
Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro
180 185 190
Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn
195 200 205
Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp
210 215 220
Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr
225 230 235 240
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
245 250 255
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
260 265 270
Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu
275 280 285
Val Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
290 295 300
Pro Gly Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met
305 310 315 320
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His
325 330 335
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
340 345 350
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln
355 360 365
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
370 375 380
Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln
385 390 395 400
Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
405 410 415
His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
420 425 430
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg
435 440 445
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg
465 470 475 480
Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly
485 490 495
Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu
500 505 510
Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu
515 520 525
Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln
530 535 540
Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr
545 550 555 560
Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly
565 570 575
Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
580 585 590
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
595 600 605
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala
610 615 620
Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro
625 630 635 640
Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp
645 650 655
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
660 665 670
Gln Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met
675 680 685
Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys
690 695 700
Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala
705 710 715 720
Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr
725 730 735
Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala
740 745 750
Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly
755 760 765
Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala
770 775 780
Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His
785 790 795 800
Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln
805 810 815
Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala
820 825 830
Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val
835 840 845
Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu
850 855 860
Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val
865 870 875 880
Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly
885 890 895
Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile
900 905 910
Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr
915 920 925
Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu
930 935 940
Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala
945 950 955 960
Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr
965 970 975
Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly
980 985 990
Phe Pro Ala Thr Ala
995
<210> 12
<211> 728
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (71)..(77)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (99)..(105)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (128)..(134)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (156)..(162)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (185)..(191)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (213)..(219)
<223> Xaa can be any naturally occurring amino acid
<400> 12
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly Gly Ser Gly
35 40 45
Gly Thr Ala Ser Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile
50 55 60
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg
65 70 75 80
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
85 90 95
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly
100 105 110
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
165 170 175
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
180 185 190
Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
195 200 205
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His
210 215 220
Leu Arg Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro
225 230 235 240
Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln
245 250 255
Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser
260 265 270
Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro
275 280 285
Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu
290 295 300
Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp
305 310 315 320
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp
325 330 335
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
340 345 350
Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro
355 360 365
Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro
370 375 380
Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser
385 390 395 400
Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu
405 410 415
Leu Ser Gln Ile Ser Ser Pro Gly Asp Glu Met Glu Glu Cys Ser Gln
420 425 430
His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp
435 440 445
Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser
450 455 460
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
465 470 475 480
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
485 490 495
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
500 505 510
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
515 520 525
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
530 535 540
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
545 550 555 560
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
565 570 575
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
580 585 590
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
595 600 605
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
610 615 620
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
625 630 635 640
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
645 650 655
Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met
660 665 670
Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu
675 680 685
Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly
690 695 700
Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile
705 710 715 720
Ile Pro Asp Arg Glu Val Leu Tyr
725
<210> 13
<211> 878
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (94)..(100)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (122)..(128)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (151)..(157)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (179)..(185)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (208)..(214)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (236)..(242)
<223> Xaa can be any naturally occurring amino acid
<400> 13
Met Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr
1 5 10 15
Arg Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg
20 25 30
Glu Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe
35 40 45
Leu Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp
50 55 60
Pro Trp Gly Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu
65 70 75 80
Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
130 135 140
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg
145 150 155 160
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
165 170 175
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr Gly
180 185 190
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro
210 215 220
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg
245 250 255
Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro
260 265 270
Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr
275 280 285
Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu
290 295 300
Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met
305 310 315 320
Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn
325 330 335
Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln
340 345 350
Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu
355 360 365
Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn
370 375 380
Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu
385 390 395 400
Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn
405 410 415
Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn
420 425 430
Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu
435 440 445
Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile
450 455 460
His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg
465 470 475 480
Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn
485 490 495
Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro
500 505 510
Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala
515 520 525
Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His
530 535 540
Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr
545 550 555 560
Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu
565 570 575
Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp
580 585 590
Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly
595 600 605
Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr
610 615 620
Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys
625 630 635 640
Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr
645 650 655
Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly
660 665 670
Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met
675 680 685
Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly
690 695 700
Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu
705 710 715 720
Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser
725 730 735
Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser
740 745 750
Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe
755 760 765
Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile
770 775 780
Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp
785 790 795 800
Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile
805 810 815
Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val
820 825 830
Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala
835 840 845
Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu
850 855 860
Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
865 870 875
<210> 14
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (219)..(225)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (247)..(253)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (276)..(282)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (304)..(310)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (333)..(339)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (361)..(367)
<223> Xaa can be any naturally occurring amino acid
<400> 14
Met Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp
1 5 10 15
Glu Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys
20 25 30
Gly Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His
35 40 45
Asn Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser
50 55 60
Glu Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys
65 70 75 80
Pro Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn
85 90 95
Ser Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp
100 105 110
Ile Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly
115 120 125
Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp
130 135 140
Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys
145 150 155 160
Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala
165 170 175
Tyr Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser Gly
180 185 190
Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe
195 200 205
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile
225 230 235 240
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg
245 250 255
Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
260 265 270
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr
275 280 285
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
290 295 300
Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr Gly Ser Gln Lys
305 310 315 320
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
325 330 335
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
340 345 350
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
355 360 365
Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg Gly Ser Ser
370 375 380
Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile
385 390 395 400
Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln
405 410 415
Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu
420 425 430
Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu
435 440 445
Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys
450 455 460
Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu
465 470 475 480
Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg
485 490 495
Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu
500 505 510
Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp
515 520 525
Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly
530 535 540
Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val
545 550 555 560
Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His
565 570 575
Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met
580 585 590
Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln
595 600 605
Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met
610 615 620
Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp
625 630 635 640
Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser
645 650 655
Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr
660 665 670
Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly
675 680 685
Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu
690 695 700
Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp
705 710 715 720
Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser
725 730 735
Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu
740 745 750
Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val
755 760 765
Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala
770 775 780
Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr
785 790 795 800
Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn
805 810 815
Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser
820 825 830
Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
835 840 845
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser
850 855 860
Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly
865 870 875 880
Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala
885 890 895
Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu
900 905 910
Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser
915 920 925
Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys
930 935 940
Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr
945 950 955 960
Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu
965 970 975
Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys
980 985 990
Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
995 1000
<210> 15
<211> 1253
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (469)..(475)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (497)..(503)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (526)..(532)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (554)..(560)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (583)..(589)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (611)..(617)
<223> Xaa can be any naturally occurring amino acid
<400> 15
Met Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro
1 5 10 15
Ala Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp
20 25 30
Leu Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr
35 40 45
Asn Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly
50 55 60
Arg Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr
65 70 75 80
Ser Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu
85 90 95
Phe Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val
100 105 110
Phe Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser
115 120 125
Gln Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp
130 135 140
Glu Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His
145 150 155 160
Pro Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn
165 170 175
Pro Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala
180 185 190
Ile Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser
195 200 205
Val Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr
210 215 220
Leu Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu
225 230 235 240
Ser Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met
245 250 255
Asp His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn
260 265 270
Ala Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro
275 280 285
Phe Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile
290 295 300
His Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu
305 310 315 320
Ser Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met
325 330 335
Glu Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile
340 345 350
Leu Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe
355 360 365
Ser Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly
370 375 380
Lys Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys
385 390 395 400
Cys Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr
405 410 415
Ser Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala
420 425 430
Ser Ile Trp Arg Trp Asp Arg Leu Arg Gly Gly Ser Gly Ser Gly Ser
435 440 445
Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met
450 455 460
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His
465 470 475 480
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
485 490 495
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln
500 505 510
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
515 520 525
Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln
530 535 540
Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
545 550 555 560
His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
565 570 575
Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg
580 585 590
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
595 600 605
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg
610 615 620
Gly Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala
625 630 635 640
Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn
645 650 655
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
660 665 670
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
675 680 685
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
690 695 700
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
705 710 715 720
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
725 730 735
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val
740 745 750
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
755 760 765
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
770 775 780
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
785 790 795 800
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
805 810 815
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
820 825 830
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
835 840 845
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
850 855 860
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
865 870 875 880
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala
885 890 895
Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val
900 905 910
Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser
915 920 925
His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro
930 935 940
Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro
945 950 955 960
Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp
965 970 975
Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile
980 985 990
Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr
995 1000 1005
Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln
1010 1015 1020
Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn
1025 1030 1035
Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
1040 1045 1050
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp
1055 1060 1065
Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
1070 1075 1080
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
1085 1090 1095
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly
1100 1105 1110
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser
1115 1120 1125
Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe
1130 1135 1140
Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe
1145 1150 1155
Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe
1160 1165 1170
Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile
1175 1180 1185
Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp
1190 1195 1200
Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu
1205 1210 1215
Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile
1220 1225 1230
Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp
1235 1240 1245
Arg Glu Val Leu Tyr
1250
<210> 16
<211> 11661
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 16
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860
gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920
cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980
agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040
ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100
catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160
accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220
agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280
tttaattaag ccgccaccat gttcgaaccc aagaagaaga gaaaggtgtt cgaaactagt 8340
gtgcccctgt atggcttcac ttccatttgt ggccgacggc ctgaaatgga agccgcggtg 8400
tcaaccatac cacggtttct gcagagctca tcaggctcca tgctggacgg acgctttgat 8460
ccacagtctg ccgcacattt ctttggagtc tacgacggcc acgggggcag ccaggtcgcc 8520
aactactgca gggaaaggat gcatttggca cttgccgaag agatcgccaa agagaagccc 8580
atgttgtgtg atggggatac ctggctggag aagtggaaga aagcgctttt taactctttt 8640
ctgagagtgg attctgagat agaatctgtc gcacccgaga ccgtgggcag cacatccgtc 8700
gtagccgtag tgtttccctc ccacatattc gtcgccaact gcggcgacag tcgagccgtc 8760
ctctgccgag gtaagaccgc cctgcctctg agtgttgacc ataagcccga ccgggaggat 8820
gaggccgccc gaatcgaggc cgccggtgga aaagtcatcc aatggaacgg cgcaagagtg 8880
ttcggcgtgc tggcgatgtc caggagcatt ggagaccggt acctgaagcc cagcataatc 8940
ccagatcccg aagtgaccgc agtcaagagg gtgaaagagg acgattgtct gatcctggct 9000
agcgatggcg tatgggacgt gatgactgat gaggaggcgt gtgaaatggc ccgcaagcga 9060
atcctgctgt ggcataaaaa aaacgcagtc gcgggggacg cttctcttct ggcagacgaa 9120
aggcgcaaag aaggtaaaga cccggctgct atgagcgccg ccgaatatct cagtaagctg 9180
gcaattcagc gagggtccaa agacaacatt tccgtggtcg tggtagacct caaaggcggt 9240
tccggcggtt ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc 9300
tccgaggagg caaacttgag gcgccacacc cgaacacata caggagaaaa gccattccaa 9360
tgtcgaattt gtatgcgcaa tttttcagat cactcaagcc tcaagcgaca cctccgcaca 9420
catactggtt cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaatca 9480
gcgaaccttt tgcggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc 9540
tgtatgcgga acttcagcga ccccagttca ttgaagaggc atttgcgaac tcacaccggt 9600
tctcaaaaac cttttcagtg ccgaatttgt atgcgcaact tcagccaaca aacaaatttg 9660
acgagacaca cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc 9720
aattttagcg atgcgacaca acttgttagg catctgcgca cacacttgcg gggatccccg 9780
aagaaaaaac ggaaagtgac ctgcagggga agcggagcta ctaacttcag cctgctgaag 9840
caggctggag acgtggagga gaaccctgga cctggtcacc atgatgagtt tcccaccatg 9900
gtgtttcctt ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc 9960
ctgccccagg ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc 10020
ccagcccctg tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc 10080
aagcccaccc aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat 10140
gatgaagacc tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg 10200
gcatccgtcg acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc 10260
cacacaactg agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg 10320
gcccagaggc cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc 10380
ctcctttcag gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg 10440
agtcagatca gctccggtgg tggcagcggt caattgactc aagacgaatt cacccaactc 10500
tcccaatcaa tcgccgagtt ccacacgtac caactcggta acggccgttg ctcatctctc 10560
ctagctcagc gaatccacgc gccgccggaa acagtatggt ccgtggtgag acgtttcgat 10620
aggccacaga tttacaaaca cttcatcaaa agctgtaacg tgagtgaaga tttcgagatg 10680
cgagtgggat gcacgcgcga cgtgaacgtg ataagtggat taccggcgaa tacgtctcga 10740
gagagattag atctgttgga cgatgatcgg agagtgactg ggtttagtat aaccggtggt 10800
gaacataggc tgaggaatta taaatcggtt acgacggttc atagatttga gaaagaagaa 10860
gaagaagaaa ggatctggac cgttgttttg gaatcttatg ttgttgatgt accggaaggt 10920
aattcggagg aagatacgag attgtttgct gatacggtta ttagattgaa tcttcagaaa 10980
cttgcttcga tcactgaagc tatgaactaa agcggccgcg actctagagt cgacctgcag 11040
gcatgcaagc ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa 11100
agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 11160
atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 11220
tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 11280
tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 11340
ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 11400
cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 11460
gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg 11520
acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 11580
ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 11640
ctttgggccg cctccccgca t 11661
<210> 17
<211> 11376
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 17
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860
gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920
cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980
agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040
ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100
catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160
accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220
agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280
tttaattaag ccgccaccat gttcgaaccc aagaagaaga gaaaggtgtt cgaaactagt 8340
gtgcccctgt atggcttcac ttccatttgt ggccgacggc ctgaaatgga agccgcggtg 8400
tcaaccatac cacggtttct gcagagctca tcaggctcca tgctggacgg acgctttgat 8460
ccacagtctg ccgcacattt ctttggagtc tacgacggcc acgggggcag ccaggtcgcc 8520
aactactgca gggaaaggat gcatttggca cttgccgaag agatcgccaa agagaagccc 8580
atgttgtgtg atggggatac ctggctggag aagtggaaga aagcgctttt taactctttt 8640
ctgagagtgg attctgagat agaatctgtc gcacccgaga ccgtgggcag cacatccgtc 8700
gtagccgtag tgtttccctc ccacatattc gtcgccaact gcggcgacag tcgagccgtc 8760
ctctgccgag gtaagaccgc cctgcctctg agtgttgacc ataagcccga ccgggaggat 8820
gaggccgccc gaatcgaggc cgccggtgga aaagtcatcc aatggaacgg cgcaagagtg 8880
ttcggcgtgc tggcgatgtc caggagcatt ggagaccggt acctgaagcc cagcataatc 8940
ccagatcccg aagtgaccgc agtcaagagg gtgaaagagg acgattgtct gatcctggct 9000
agcgatggcg tatgggacgt gatgactgat gaggaggcgt gtgaaatggc ccgcaagcga 9060
atcctgctgt ggcataaaaa aaacgcagtc gcgggggacg cttctcttct ggcagacgaa 9120
aggcgcaaag aaggtaaaga cccggctgct atgagcgccg ccgaatatct cagtaagctg 9180
gcaattcagc gagggtccaa agacaacatt tccgtggtcg tggtagacct caaaggcggt 9240
tccggcggtt ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc 9300
tccgaggagg caaacttgag gcgccacacc cgaacacata caggagaaaa gccattccaa 9360
tgtcgaattt gtatgcgcaa tttttcagat cactcaagcc tcaagcgaca cctccgcaca 9420
catactggtt cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaatca 9480
gcgaaccttt tgcggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc 9540
tgtatgcgga acttcagcga ccccagttca ttgaagaggc atttgcgaac tcacaccggt 9600
tctcaaaaac cttttcagtg ccgaatttgt atgcgcaact tcagccaaca aacaaatttg 9660
acgagacaca cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc 9720
aattttagcg atgcgacaca acttgttagg catctgcgca cacacttgcg gggatccacc 9780
tgcaggggaa gcggagctac taacttcagc ctgctgaagc aggctggaga cgtggaggag 9840
aaccctggac ctggtcacca tccgaagaaa aaacggaaag tggatgctaa gtcactgact 9900
gcctggtccc ggacactggt gaccttcaag gatgtgtttg tggacttcac cagggaggag 9960
tggaagctgc tggacactgc tcagcagatc ctgtacagaa atgtgatgct ggagaactat 10020
aagaacctgg tttccttggg ttatcagctt actaagccag atgtgatcct ccggttggag 10080
aagggagaag agccctggct ggtggagaga gaaattcacc aagagaccca tcctgattca 10140
gagactgcat ttgaaatcaa atcatcagtt ggtggtggca gcggtcaatt gactcaagac 10200
gaattcaccc aactctccca atcaatcgcc gagttccaca cgtaccaact cggtaacggc 10260
cgttgctcat ctctcctagc tcagcgaatc cacgcgccgc cggaaacagt atggtccgtg 10320
gtgagacgtt tcgataggcc acagatttac aaacacttca tcaaaagctg taacgtgagt 10380
gaagatttcg agatgcgagt gggatgcacg cgcgacgtga acgtgataag tggattaccg 10440
gcgaatacgt ctcgagagag attagatctg ttggacgatg atcggagagt gactgggttt 10500
agtataaccg gtggtgaaca taggctgagg aattataaat cggttacgac ggttcataga 10560
tttgagaaag aagaagaaga agaaaggatc tggaccgttg ttttggaatc ttatgttgtt 10620
gatgtaccgg aaggtaattc ggaggaagat acgagattgt ttgctgatac ggttattaga 10680
ttgaatcttc agaaacttgc ttcgatcact gaagctatga actaaagcgg ccgcgactct 10740
agagtcgacc tgcaggcatg caagcttgat atcaagctta tcgataatca acctctggat 10800
tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 10860
ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 10920
tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 10980
caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 11040
accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 11100
ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 11160
tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 11220
tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 11280
ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag 11340
acgagtcgga tctccctttg ggccgcctcc ccgcat 11376
<210> 18
<211> 11044
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 18
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgtc tagaccaggc gaacgaccgt 8340
ttcaatgccg gatatgtatg aggaacttct cccagaggtc cagcttggta cggcacaccc 8400
gaacacatac aggagaaaag ccattccaat gtcgaatttg tatgcgcaat ttttcagaca 8460
agtctgtgtt ggctcgacac ctccgcacac atactggttc acagaagccc tttcagtgca 8520
ggatttgtat gcgcaacttt agccaacgct catccctggt aaggcacact agaacgcata 8580
caggtgagaa gcctttccag tgtcgcatct gtatgcggaa cttcagccag cggaataact 8640
tgggcaggca tttgcgaact cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta 8700
tgcgcaactt cagcacccac gccgtattga cacgacacac gcgcacgcac accggggaaa 8760
aaccgtttca atgtcgaatc tgcatgcgca attttagcga tagagggaac ctcactcgac 8820
atctgcgcac acacttgcgg ggatccacct gcagggatga gtttcccacc atggtgtttc 8880
cttctgggca gatcagccag gcctcggcct tggccccggc ccctccccaa gtcctgcccc 8940
aggctccagc ccctgcccct gctccagcca tggtatcagc tctggcccag gccccagccc 9000
ctgtcccagt cctagcccca ggccctcctc aggctgtggc cccacctgcc cccaagccca 9060
cccaggctgg ggaaggaacg ctgtcagagg ccctgctgca gctgcagttt gatgatgaag 9120
acctgggggc cttgcttggc aacagcacag acccagctgt gttcacagac ctggcatccg 9180
tcgacaactc cgagtttcag cagctgctga accagggcat acctgtggcc ccccacacaa 9240
ctgagcccat gctgatggag taccctgagg ctataactcg cctagtgaca ggggcccaga 9300
ggccccccga cccagctcct gctccactgg gggccccggg gctccccaat ggcctccttt 9360
caggagatga agacttctcc tccattgcgg acatggactt ctcagccctg ctgagtcaga 9420
tcagctccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9480
ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9540
ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9600
atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9660
gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9720
tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9780
tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9840
ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9900
catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9960
ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 10020
aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 10080
aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 10140
cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 10200
acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 10260
ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 10320
gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10380
ctgccacagc ttaagcggcc gcgactctag agtcgacctg caggcatgca agcttgatat 10440
caagcttatc gataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct 10500
taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc 10560
tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct 10620
ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga 10680
cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc 10740
tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac 10800
aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt 10860
tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt 10920
cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc 10980
tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc 11040
gcat 11044
<210> 19
<211> 10783
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 19
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgga tgctaagtca ctgactgcct 8340
ggtcccggac actggtgacc ttcaaggatg tgtttgtgga cttcaccagg gaggagtgga 8400
agctgctgga cactgctcag cagatcctgt acagaaatgt gatgctggag aactataaga 8460
acctggtttc cttgggttat cagcttacta agccagatgt gatcctccgg ttggagaagg 8520
gagaagagcc ctggctggtg gagagagaaa ttcaccaaga gacccatcct gattcagaga 8580
ctgcatttga aatcaaatca tcagttctcg agggaggcgg tggaagcggc acctgcaggt 8640
ctagaccagg cgaacgaccg tttcaatgcc ggatatgtat gaggaacttc tcccagaggt 8700
ccagcttggt acggcacacc cgaacacata caggagaaaa gccattccaa tgtcgaattt 8760
gtatgcgcaa tttttcagac aagtctgtgt tggctcgaca cctccgcaca catactggtt 8820
cacagaagcc ctttcagtgc aggatttgta tgcgcaactt tagccaacgc tcatccctgg 8880
taaggcacac tagaacgcat acaggtgaga agcctttcca gtgtcgcatc tgtatgcgga 8940
acttcagcca gcggaataac ttgggcaggc atttgcgaac tcacaccggt tctcaaaaac 9000
cttttcagtg ccgaatttgt atgcgcaact tcagcaccca cgccgtattg acacgacaca 9060
cgcgcacgca caccggggaa aaaccgtttc aatgtcgaat ctgcatgcgc aattttagcg 9120
atagagggaa cctcactcga catctgcgca cacacttgcg gggatcccaa ttgtgcgtac 9180
gcggatcctc tgctggagac atgagagctg ccaacctttg gccaagcccg ctcatgatca 9240
aacgctctaa gaagaacagc ctggccttgt ccctgacggc cgaccagatg gtcagtgcct 9300
tgttggatgc tgagcccccc atactctatt ccgagtatga tcctaccaga cccttcagtg 9360
aagcttcgat gatgggctta ctgaccaacc tggcagacag ggagctggtt cacatgatca 9420
actgggcgaa gagggtgcca ggctttgtgg atttgaccct ccatgatcag gtccaccttc 9480
tagaatgtgc ctggctagag atcctgatga ttggtctcgt ctggcgctcc atggagcacc 9540
cagtgaagct actgtttgct cctaacttgc tcttggacag gaaccaggga aaatgtgtag 9600
agggcatggt ggagatcttc gacatgctgc tggctacatc atctcggttc cgcatgatga 9660
atctgcaggg agaggagttt gtgtgcctca aatctattat tttgcttaat tctggagtgt 9720
acacatttct gtccagcacc ctgaagtctc tggaagagaa ggaccatatc caccgagtcc 9780
tggacaagat cacagacact ttgatccacc tgatggccaa ggcaggcctg accctgcagc 9840
agcagcacca gcggctggcc cagctcctcc tcatcctctc ccacatcagg cacatgagta 9900
acaaaggcat ggagcatctg tacagcatga agtgcaagaa cgtggtgccc ctctatgacc 9960
tgctgctgga ggcggcggac gcccaccgcc tacatgcgcc cactagccgt ggaggggcat 10020
ccgtggagga gacggaccaa agccacttgg ccactgcggg ctctacttca tcgcattcct 10080
tgcaaaagta ttacatcacg ggggaggcag agggtttccc tgccacagct taagcggccg 10140
cgactctaga gtcgacctgc aggcatgcaa gcttgatatc aagcttatcg ataatcaacc 10200
tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 10260
gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 10320
cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 10380
tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 10440
cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 10500
ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 10560
tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 10620
tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 10680
ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 10740
ccctcagacg agtcggatct ccctttgggc cgcctccccg cat 10783
<210> 20
<211> 11080
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 20
tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60
acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120
actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180
cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240
tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300
ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360
gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420
cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480
tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540
gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600
tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660
taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720
gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780
gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840
gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900
caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960
cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020
gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080
gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140
aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200
aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260
gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320
aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380
ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440
ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500
ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560
gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620
atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680
aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740
tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800
aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860
tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920
aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980
tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040
cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100
agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160
gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220
tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280
gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340
ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400
tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460
cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520
gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580
ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640
ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700
aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760
gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820
ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880
gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940
agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000
atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060
acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120
agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180
attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240
gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300
gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360
caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420
caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960
cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020
tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080
caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140
gtttggatcg ataagcttga tatcgaattc ctgcagcccc gataaaataa aagattttat 4200
ttagtctcca gaaaaagggg ggaatgaaag accccacctg taggtttggc aagctagctg 4260
cagtaacgcc attttgcaag gcatggaaaa ataccaaacc aagaatagag aagttcagat 4320
caagggcggg tacatgaaaa tagctaacgt tgggccaaac aggatatctg cggtgagcag 4380
tttcggcccc ggcccggggc caagaacaga tggtcaccgc agtttcggcc ccggcccgag 4440
gccaagaaca gatggtcccc agatatggcc caaccctcag cagtttctta agacccatca 4500
gatgtttcca ggctccccca aggacctgaa atgaccctgc gccttatttg aattaaccaa 4560
tcagcctgct tctcgcttct gttcgcgcgc ttctgcttcc cgagctctat aaaagagctc 4620
acaacccctc actcggcgcg ccagtcctcc gacagactga gtcgcccggg ggggatctgg 4680
agctctcgag aattctcacg cgtgccgcca ccatgtctag acccggagag cgcccattcc 4740
agtgtcggat ttgcatgcgg aacttttcga gaagacacgg cctggacaga catacccgta 4800
ctcatacagg tgaaaaaccc tttcagtgtc ggatctgtat gcgaaatttc tccgaccaca 4860
gcagcctgaa gagacatcta cgtacccaca ccggcagcca gaagccattt cagtgtcgga 4920
tctgtatgcg gaacttctcc gtgagacaca acctgaccag acatctacgt acgcacaccg 4980
gagagaagcc attccaatgc cgaatatgca tgcgcaactt cagtgaccac agcaacctga 5040
gcagacacct aaaaacccac accggttccc agaagccatt tcagtgtcgg atctgtatgc 5100
ggaacttctc ccagcgcagc agcctggtga gacatctacg tacgcacacc ggagagaagc 5160
cattccaatg ccgaatatgc atgcgcaact tcagtgagag cggccacctg aagagacacc 5220
tgcgtacgca cctgagggga tccacctgca gggactacaa agaccatgac ggtgattata 5280
aagatcatga catcgattac aaggatgacg atgacaagat ggcccccaag aaaaagagga 5340
aggtgggcat tcacggggtg ccgggtggac tcgagggagg cggtggaagc ggcggtaccg 5400
aggacgtggt gtgctgccac tcaatctacg gcaagaagaa gggtgatatc gacacctacc 5460
gatacatagg ctcttccggg acaggctgcg tggtcatagt gggcaggatc gtcttgtccg 5520
gatccggcac tagtgcgccc atcacggcgt acgcccagca gacgagaggc ctcctagggt 5580
gtataatcac cagcctgact ggccgggaca aaaaccaagt ggagggtgag gtccagatcg 5640
tgtcaactgc tacccaaacc ttcctggcaa cgtgcatcaa tggggtatgc tgggcagtct 5700
accacggggc cggaacgagg accatcgcat cacccaaggg tcctgtcatc cagatgtata 5760
ccaatgtgga ccaagacctt gtgggctggc ccgctcctca aggttcccgc tcattgacac 5820
cctgtacctg cggctcctcg gacctttacc tggtcacgag gcacgccgat gtcattcccg 5880
tgcgccggcg aggtgatagc aggggtagcc tgctttcgcc ccggcccatt tcctacttga 5940
aaggctcctc ggggggtccg ctgttgtgcc ccgcgggaca cgccgtgggc ctattcaggg 6000
ccgcggtgtg cacccgtgga gtggctaaag cggtggactt tatccctgtg gagaacctag 6060
agacaaccat gagatccccg gtgttcacgg acaactcctc tccaccagca gtcaccctga 6120
cgcacccaat caccaaaatc gatagggagg ttctctacca ggagttcgat gagatggaag 6180
agtgctctca gcactatccc tacgatgtgc ccgattacgc tggaggcggt ggaagcggcg 6240
gtaccgatga gtttcccacc atggtgtttc cttctgggca gatcagccag gcctcggcct 6300
tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct gctccagcca 6360
tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca ggccctcctc 6420
aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg ctgtcagagg 6480
ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc aacagcacag 6540
acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag cagctgctga 6600
accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag taccctgagg 6660
ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct gctccactgg 6720
gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc tccattgcgg 6780
acatggactt ctcagccctg ctgagtcaga tcagctccca attgtaagcg gccgcgactc 6840
tagagtcgac ctgcaggcat gcaagcttga tatcaagctt atcgataatc aacctctgga 6900
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 6960
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 7020
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 7080
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 7140
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 7200
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 7260
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac 7320
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 7380
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 7440
gacgagtcgg atctcccttt gggccgcctc cccgcatcga taccgtcgac ctcgagggaa 7500
ttaattcgag ctcggtacct ttaagaccaa tgacttacaa ggcagctgta gatcttagcc 7560
actttttaaa agaaaagggg ggactggaag ggctaattca ctcccaacga agacaagatc 7620
tgctttttgc ttgtactggg tctctctggt tagaccagat ctgagcctgg gagctctctg 7680
gctaactagg gaacccactg cttaagcctc aataaagctt gccttgagtg cttcaagtag 7740
tgtgtgcccg tctgttgtgt gactctggta actagagatc cctcagaccc ttttagtcag 7800
tgtggaaaat ctctagcagc atctagaatt aattccgtgt attctatagt gtcacctaaa 7860
tcgtatgtgt atgatacata aggttatgta ttaattgtag ccgcgttcta acgacaatat 7920
gtacaagcct aattgtgtag catctggctt actgaagcag accctatcat ctctctcgta 7980
aactgccgtc agagtcggtt tggttggacg aaccttctga gtttctggta acgccgtccc 8040
gcacccggaa atggtcagcg aaccaatcag cagggtcatc gctagccaga tcctctacgc 8100
cggacgcatc gtggccggca tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc 8160
cgacatcacc gatggggaag atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg 8220
cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg ggcgccatct ccttgcatgc 8280
accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct gcttcctaat 8340
gcaggagtcg cataagggag agcgtcgaat ggtgcactct cagtacaatc tgctctgatg 8400
ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt 8460
gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc 8520
agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg atacgcctat 8580
ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc acttttcggg 8640
gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc 8700
tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta 8760
ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg 8820
ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg 8880
gttacatcga actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac 8940
gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg 9000
acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt 9060
actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 9120
ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 9180
cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 9240
gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag 9300
caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 9360
aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 9420
ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 9480
tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 9540
ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 9600
ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 9660
ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 9720
tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat 9780
cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc 9840
taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg 9900
gcttcagcag agcgcagata ccaaatactg tctttctagt gtagccgtag ttaggccacc 9960
acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg 10020
ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg 10080
ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa 10140
cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc acgcttcccg 10200
aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga 10260
gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct 10320
gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca 10380
gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc 10440
ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg 10500
ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc 10560
caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tgtggaatgt 10620
gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 10680
gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 10740
tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 10800
cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 10860
tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 10920
cttttttgga ggcctaggct tttgcaaaaa gcttggacac aagacaggct tgcgagatat 10980
gtttgagaat accactttat cccgcgtcag ggagaggcag tgcgtaaaaa gacgcggact 11040
catgtgaaat actggttttt agtgcgccag atctctataa 11080
<210> 21
<211> 10795
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 21
tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60
acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120
actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180
cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240
tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300
ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360
gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420
cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480
tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540
gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600
tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660
taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720
gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780
gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840
gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900
caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960
cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020
gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080
gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140
aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200
aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260
gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320
aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380
ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440
ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500
ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560
gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620
atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680
aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740
tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800
aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860
tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920
aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980
tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040
cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100
agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160
gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220
tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280
gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340
ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400
tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460
cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520
gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580
ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640
ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700
aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760
gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820
ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880
gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940
agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000
atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060
acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120
agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180
attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240
gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300
gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360
caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420
caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960
cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020
tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080
caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140
gtttggatcg ataagcttga tatcgaattc ctgcagcccc gataaaataa aagattttat 4200
ttagtctcca gaaaaagggg ggaatgaaag accccacctg taggtttggc aagctagctg 4260
cagtaacgcc attttgcaag gcatggaaaa ataccaaacc aagaatagag aagttcagat 4320
caagggcggg tacatgaaaa tagctaacgt tgggccaaac aggatatctg cggtgagcag 4380
tttcggcccc ggcccggggc caagaacaga tggtcaccgc agtttcggcc ccggcccgag 4440
gccaagaaca gatggtcccc agatatggcc caaccctcag cagtttctta agacccatca 4500
gatgtttcca ggctccccca aggacctgaa atgaccctgc gccttatttg aattaaccaa 4560
tcagcctgct tctcgcttct gttcgcgcgc ttctgcttcc cgagctctat aaaagagctc 4620
acaacccctc actcggcgcg ccagtcctcc gacagactga gtcgcccggg ggggatctgg 4680
agctctcgag aattctcacg cgtgccgcca ccatggatgc taagtcactg actgcctggt 4740
cccggacact ggtgaccttc aaggatgtgt ttgtggactt caccagggag gagtggaagc 4800
tgctggacac tgctcagcag atcctgtaca gaaatgtgat gctggagaac tataagaacc 4860
tggtttcctt gggttatcag cttactaagc cagatgtgat cctccggttg gagaagggag 4920
aagagccctg gctggtggag agagaaattc accaagagac ccatcctgat tcagagactg 4980
catttgaaat caaatcatca gttacctgca gggactacaa agaccatgac ggtgattata 5040
aagatcatga catcgattac aaggatgacg atgacaagat ggcccccaag aaaaagagga 5100
aggtgggcat tcacggggtg ccgggtggac tcgagggagg cggtggaagc ggcggtaccg 5160
aggacgtggt gtgctgccac tcaatctacg gcaagaagaa gggtgatatc gacacctacc 5220
gatacatagg ctcttccggg acaggctgcg tggtcatagt gggcaggatc gtcttgtccg 5280
gatccggcac tagtgcgccc atcacggcgt acgcccagca gacgagaggc ctcctagggt 5340
gtataatcac cagcctgact ggccgggaca aaaaccaagt ggagggtgag gtccagatcg 5400
tgtcaactgc tacccaaacc ttcctggcaa cgtgcatcaa tggggtatgc tgggcagtct 5460
accacggggc cggaacgagg accatcgcat cacccaaggg tcctgtcatc cagatgtata 5520
ccaatgtgga ccaagacctt gtgggctggc ccgctcctca aggttcccgc tcattgacac 5580
cctgtacctg cggctcctcg gacctttacc tggtcacgag gcacgccgat gtcattcccg 5640
tgcgccggcg aggtgatagc aggggtagcc tgctttcgcc ccggcccatt tcctacttga 5700
aaggctcctc ggggggtccg ctgttgtgcc ccgcgggaca cgccgtgggc ctattcaggg 5760
ccgcggtgtg cacccgtgga gtggctaaag cggtggactt tatccctgtg gagaacctag 5820
agacaaccat gagatccccg gtgttcacgg acaactcctc tccaccagca gtcaccctga 5880
cgcacccaat caccaaaatc gatagggagg ttctctacca ggagttcgat gagatggaag 5940
agtgctctca gcactatccc tacgatgtgc ccgattacgc tggaggcggt ggaagcggcg 6000
gtacctctag acccggagag cgcccattcc agtgtcggat ttgcatgcgg aacttttcga 6060
gaagacacgg cctggacaga catacccgta ctcatacagg tgaaaaaccc tttcagtgtc 6120
ggatctgtat gcgaaatttc tccgaccaca gcagcctgaa gagacatcta cgtacccaca 6180
ccggcagcca gaagccattt cagtgtcgga tctgtatgcg gaacttctcc gtgagacaca 6240
acctgaccag acatctacgt acgcacaccg gagagaagcc attccaatgc cgaatatgca 6300
tgcgcaactt cagtgaccac agcaacctga gcagacacct aaaaacccac accggttccc 6360
agaagccatt tcagtgtcgg atctgtatgc ggaacttctc ccagcgcagc agcctggtga 6420
gacatctacg tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact 6480
tcagtgagag cggccacctg aagagacacc tgcgtacgca cctgagggga tcccaattgt 6540
aagcggccgc gactctagag tcgacctgca ggcatgcaag cttgatatca agcttatcga 6600
taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 6660
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 6720
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 6780
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 6840
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 6900
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 6960
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 7020
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 7080
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 7140
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc atcgataccg 7200
tcgacctcga gggaattaat tcgagctcgg tacctttaag accaatgact tacaaggcag 7260
ctgtagatct tagccacttt ttaaaagaaa aggggggact ggaagggcta attcactccc 7320
aacgaagaca agatctgctt tttgcttgta ctgggtctct ctggttagac cagatctgag 7380
cctgggagct ctctggctaa ctagggaacc cactgcttaa gcctcaataa agcttgcctt 7440
gagtgcttca agtagtgtgt gcccgtctgt tgtgtgactc tggtaactag agatccctca 7500
gaccctttta gtcagtgtgg aaaatctcta gcagcatcta gaattaattc cgtgtattct 7560
atagtgtcac ctaaatcgta tgtgtatgat acataaggtt atgtattaat tgtagccgcg 7620
ttctaacgac aatatgtaca agcctaattg tgtagcatct ggcttactga agcagaccct 7680
atcatctctc tcgtaaactg ccgtcagagt cggtttggtt ggacgaacct tctgagtttc 7740
tggtaacgcc gtcccgcacc cggaaatggt cagcgaacca atcagcaggg tcatcgctag 7800
ccagatcctc tacgccggac gcatcgtggc cggcatcacc ggcgccacag gtgcggttgc 7860
tggcgcctat atcgccgaca tcaccgatgg ggaagatcgg gctcgccact tcgggctcat 7920
gagcgcttgt ttcggcgtgg gtatggtggc aggccccgtg gccgggggac tgttgggcgc 7980
catctccttg catgcaccat tccttgcggc ggcggtgctc aacggcctca acctactact 8040
gggctgcttc ctaatgcagg agtcgcataa gggagagcgt cgaatggtgc actctcagta 8100
caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 8160
cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 8220
ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 8280
tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag 8340
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 8400
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 8460
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 8520
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 8580
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 8640
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 8700
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 8760
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 8820
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 8880
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 8940
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 9000
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 9060
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 9120
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 9180
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 9240
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 9300
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 9360
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 9420
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 9480
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 9540
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 9600
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcttt ctagtgtagc 9660
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 9720
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 9780
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 9840
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 9900
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 9960
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 10020
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 10080
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 10140
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 10200
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 10260
aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 10320
gcagctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 10380
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 10440
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 10500
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 10560
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 10620
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagcttg gacacaagac 10680
aggcttgcga gatatgtttg agaataccac tttatcccgc gtcagggaga ggcagtgcgt 10740
aaaaagacgc ggactcatgt gaaatactgg tttttagtgc gccagatctc tataa 10795
<210> 22
<211> 11962
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 22
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgtc tagaccaggc gaacgaccgt 8340
ttcaatgccg gatatgtatg aggaacttct cccagaggtc cagcttggta cggcacaccc 8400
gaacacatac aggagaaaag ccattccaat gtcgaatttg tatgcgcaat ttttcagaca 8460
agtctgtgtt ggctcgacac ctccgcacac atactggttc acagaagccc tttcagtgca 8520
ggatttgtat gcgcaacttt agccaacgct catccctggt aaggcacact agaacgcata 8580
caggtgagaa gcctttccag tgtcgcatct gtatgcggaa cttcagccag cggaataact 8640
tgggcaggca tttgcgaact cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta 8700
tgcgcaactt cagcacccac gccgtattga cacgacacac gcgcacgcac accggggaaa 8760
aaccgtttca atgtcgaatc tgcatgcgca attttagcga tagagggaac ctcactcgac 8820
atctgcgcac acacttgcgg ggatccacct gcagggatga gtttcccacc atggtgtttc 8880
cttctgggca gatcagccag gcctcggcct tggccccggc ccctccccaa gtcctgcccc 8940
aggctccagc ccctgcccct gctccagcca tggtatcagc tctggcccag gccccagccc 9000
ctgtcccagt cctagcccca ggccctcctc aggctgtggc cccacctgcc cccaagccca 9060
cccaggctgg ggaaggaacg ctgtcagagg ccctgctgca gctgcagttt gatgatgaag 9120
acctgggggc cttgcttggc aacagcacag acccagctgt gttcacagac ctggcatccg 9180
tcgacaactc cgagtttcag cagctgctga accagggcat acctgtggcc ccccacacaa 9240
ctgagcccat gctgatggag taccctgagg ctataactcg cctagtgaca ggggcccaga 9300
ggccccccga cccagctcct gctccactgg gggccccggg gctccccaat ggcctccttt 9360
caggagatga agacttctcc tccattgcgg acatggactt ctcagccctg ctgagtcaga 9420
tcagctccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9480
ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9540
ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9600
atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9660
gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9720
tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9780
tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9840
ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9900
catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9960
ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 10020
aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 10080
aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 10140
cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 10200
acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 10260
ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 10320
gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10380
ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc ggcgccggca 10440
gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc gggacaggct 10500
ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga ggcctcctag 10560
ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt gaggtccaga 10620
tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta tgctgggcag 10680
tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc atccagatgt 10740
ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc cgctcattga 10800
caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc gatgtcattc 10860
ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc atttcctact 10920
tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg ggcctattca 10980
gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct gtggagaacc 11040
tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca gcagtcaccc 11100
tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg tcggccgacc 11160
tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt 11220
attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg 11280
caattatacc tgacagggag gttctctact aagcggccgc gactctagag tcgacctgca 11340
ggcatgcaag cttgatatca agcttatcga taatcaacct ctggattaca aaatttgtga 11400
aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 11460
aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 11520
atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 11580
gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 11640
cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 11700
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 11760
ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 11820
gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 11880
gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 11940
cctttgggcc gcctccccgc at 11962
<210> 23
<211> 11959
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 23
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgga ttacaaggat gacgacgata 8340
agggctcttc cgggacaggc tccggatccg gcactagtgc gcccatcacg gcgtacgccc 8400
agcagacgag aggcctccta gggtgtataa tcaccagcct gactggccgg gacaaaaacc 8460
aagtggaggg tgaggtccag atcgtgtcaa ctgctaccca aaccttcctg gcaacgtgca 8520
tcaatggggt atgctgggca gtctaccacg gggccggaac gaggaccatc gcatcaccca 8580
agggtcctgt catccagatg tataccaatg tggaccaaga ccttgtgggc tggcccgctc 8640
ctcaaggttc ccgctcattg acaccctgta cctgcggctc ctcggacctt tacctggtca 8700
cgaggcacgc cgatgtcatt cccgtgcgcc ggcgaggtga tagcaggggt agcctgcttt 8760
cgccccggcc catttcctac ttgaaaggct cctcgggggg tccgctgttg tgccccgcgg 8820
gacacgccgt gggcctattc agggccgcgg tgtgcacccg tggagtggct aaagcggtgg 8880
actttatccc tgtggagaac ctagagacaa ccatgagatc cccggtgttc acggacaact 8940
cctctccacc agcagtcacc ctgacgcacc caatcaccaa aatcgatacc aaatacatca 9000
tgacatgcat gtcggccgac ctggaggtcg tcacgagcac ctgggtgctc gttggcggcg 9060
tcctggctgc tctggccgcg tattgcctgt caacaggctg cgtggtcata gtgggcagga 9120
tcgtcttgtc cgggaagccg gcaggcagta gcggaagcag tattatacct gacagggagg 9180
ttctctacca ggagttcgaa gatgtcgtgc catgctcaat gggctcgccc gggtctagac 9240
caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag aggtccagct 9300
tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga atttgtatgc 9360
gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact ggttcacaga 9420
agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc ctggtaaggc 9480
acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg cggaacttca 9540
gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa aaaccttttc 9600
agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga cacacgcgca 9660
cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt agcgatagag 9720
ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg gatgagtttc 9780
ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc ccggcccctc 9840
cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta tcagctctgg 9900
cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct gtggccccac 9960
ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg ctgcagctgc 10020
agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca gctgtgttca 10080
cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag ggcatacctg 10140
tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata actcgcctag 10200
tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc ccggggctcc 10260
ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg gacttctcag 10320
ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct ggagacatga 10380
gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag aacagcctgg 10440
ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag ccccccatac 10500
tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg ggcttactga 10560
ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg gtgccaggct 10620
ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg ctagagatcc 10680
tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg tttgctccta 10740
acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag atcttcgaca 10800
tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag gagtttgtgt 10860
gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc agcaccctga 10920
agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca gacactttga 10980
tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg ctggcccagc 11040
tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag catctgtaca 11100
gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg gcggacgccc 11160
accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg gaccaaagcc 11220
acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac atcacggggg 11280
aggcagaggg tttccctgcc acagcttaag cggccgcgac tctagagtcg acctgcaggc 11340
atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 11400
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 11460
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 11520
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 11580
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 11640
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 11700
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 11760
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 11820
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 11880
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 11940
ttgggccgcc tccccgcat 11959
<210> 24
<211> 11128
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 24
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggtta tggcaagcta 7860
gctgcagtaa cgccattatt gcaaggcatg gaaaaatacc aaaccaagaa tagagaagtt 7920
cagatcaagg gcgggtacat gaaaatagct aacgtagggc caaacaggat atctgcggtg 7980
agcagtttcg gccccggccc ggggccaaga acagatggtc accgcagttt cggccccggc 8040
ccgaggccaa gagcagatgg tccccagata tggcccaacc ctcagcagtt tcttaagacc 8100
catcagatgt ttccaggctc ccccaaggac ctgaaatgac cctgcgcctt atttgaatta 8160
accaatcagc ctgcttctcg cttctgttcg cgcgcttctg cttcccgagc tctataaaag 8220
agctcacaac ccctcactcg gcgcgccagt cctccgacag actgagtcgc ccgggacgcg 8280
tgccgccacc atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta 8340
caaggatgac gatgacaaga tggcccccaa gaaaaagagg aaggtgggca ttcacggggt 8400
gccgggtgga ctcgagggag gcggtggaag cggcggtacc gctagctcta gacccggaga 8460
gcgcccattc cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag 8520
acatacccgt actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt 8580
ctccgaccac agcagcctga agagacatct acgtacccac accggcagcc agaagccatt 8640
tcagtgtcgg atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg 8700
tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca 8760
cagcaacctg agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg 8820
gatctgtatg cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac 8880
cggagagaag ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct 8940
gaagagacac ctgcgtacgc acctgagggg atccacctgc agggatgagt ttcccaccat 9000
ggtgtttcct tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt 9060
cctgccccag gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc 9120
cccagcccct gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc 9180
caagcccacc caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga 9240
tgatgaagac ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct 9300
ggcatccgtc gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc 9360
ccacacaact gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg 9420
ggcccagagg ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg 9480
cctcctttca ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct 9540
gagtcagatc agctcccccg gggatgagat ggaagagtgc tctcagcact tacccggcgc 9600
cggcagtagt ggcgatatca tggattacaa ggatgacgac gataagggct cttccgggac 9660
aggctccgga tccggcacta gtgcgcccat cacggcgtac gcccagcaga cgagaggcct 9720
cctagggtgt ataatcacca gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt 9780
ccagatcgtg tcaactgcta cccaaacctt cctggcaacg tgcatcaatg gggtatgctg 9840
ggcagtctac cacggggccg gaacgaggac catcgcatca cccaagggtc ctgtcatcca 9900
gatgtatacc aatgtggacc aagaccttgt gggctggccc gctcctcaag gttcccgctc 9960
attgacaccc tgtacctgcg gctcctcgga cctttacctg gtcacgaggc acgccgatgt 10020
cattcccgtg cgccggcgag gtgatagcag gggtagcctg ctttcgcccc ggcccatttc 10080
ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct 10140
attcagggcc gcggtgtgca cccgtggagt ggctaaagcg gtggacttta tccctgtgga 10200
gaacctagag acaaccatga gatccccggt gttcacggac aactcctctc caccagcagt 10260
caccctgacg cacccaatca ccaaaatcga taccaaatac atcatgacat gcatgtcggc 10320
cgacctggag gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc 10380
cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc aggatcgtct tgtccgggaa 10440
gccggcaatt atacctgaca gggaggttct ctactaaagc ggccgcgact ctagagtcga 10500
cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 10560
ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 10620
tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 10680
gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 10740
cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 10800
tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 10860
cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 10920
gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 10980
gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 11040
cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 11100
gatctccctt tgggccgcct ccccgcat 11128
<210> 25
<211> 11602
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 25
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgct agcagtgtca gtgacatttg 8340
aagatgtggc tgtgctcttt actcgggacg agtggaagaa gctggatctg tctcagagaa 8400
gcctgtaccg tgaggtgatg ctggagaatt acagcaacct ggcctccatg gcaggattcc 8460
tgtttaccaa accaaaggtg atctccctgt tgcagcaagg agaggatccc tgggggggta 8520
gcggcagcgg tagcgcatgc tctagaccag gcgaacgacc gtttcaatgc cggatatgta 8580
tgaggaactt ctcccagagg tccagcttgg tacggcacac ccgaacacat acaggagaaa 8640
agccattcca atgtcgaatt tgtatgcgca atttttcaga caagtctgtg ttggctcgac 8700
acctccgcac acatactggt tcacagaagc cctttcagtg caggatttgt atgcgcaact 8760
ttagccaacg ctcatccctg gtaaggcaca ctagaacgca tacaggtgag aagcctttcc 8820
agtgtcgcat ctgtatgcgg aacttcagcc agcggaataa cttgggcagg catttgcgaa 8880
ctcacaccgg ttctcaaaaa ccttttcagt gccgaatttg tatgcgcaac ttcagcaccc 8940
acgccgtatt gacacgacac acgcgcacgc acaccgggga aaaaccgttt caatgtcgaa 9000
tctgcatgcg caattttagc gatagaggga acctcactcg acatctgcgc acacacttgc 9060
ggggatccca attgtgcgta cgcggatcct ctgctggaga catgagagct gccaaccttt 9120
ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg tccctgacgg 9180
ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat tccgagtatg 9240
atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac ctggcagaca 9300
gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg gatttgaccc 9360
tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg attggtctcg 9420
tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg ctcttggaca 9480
ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg ctggctacat 9540
catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc aaatctatta 9600
ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct ctggaagaga 9660
aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac ctgatggcca 9720
aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc ctcatcctct 9780
cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg aagtgcaaga 9840
acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc 9900
ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg gccactgcgg 9960
gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca gagggtttcc 10020
ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc ggcgccggca 10080
gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc gggacaggct 10140
ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga ggcctcctag 10200
ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt gaggtccaga 10260
tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta tgctgggcag 10320
tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc atccagatgt 10380
ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc cgctcattga 10440
caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc gatgtcattc 10500
ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc atttcctact 10560
tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg ggcctattca 10620
gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct gtggagaacc 10680
tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca gcagtcaccc 10740
tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg tcggccgacc 10800
tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt 10860
attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg 10920
caattatacc tgacagggag gttctctact aagcggccgc gactctagag tcgacctgca 10980
ggcatgcaag cttgatatca agcttatcga taatcaacct ctggattaca aaatttgtga 11040
aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 11100
aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 11160
atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 11220
gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 11280
cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 11340
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 11400
ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 11460
gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 11520
gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 11580
cctttgggcc gcctccccgc at 11602
<210> 26
<211> 11977
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 26
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatggg aaagaaaacc aagcggacag 8340
ctgacagttc ttcttcagag gatgaggagg agtatgtcgt ggagaaggtg ctagacaggc 8400
gcgtggttaa gggacaagtg gaatatctac tgaagtggaa aggcttttct gaggagcaca 8460
atacttggga acctgagaaa aacttggatt gccctgagct aatttctgaa tttatgaaaa 8520
agtataagaa gatgaaggag ggtgaaaata ataaacccag ggagaagtca gaaagtaaca 8580
agaggaaatc caatttctca aacagtgccg atgacatcaa atctaaaaaa aagagagagc 8640
agagcaatga tatcgctcgg ggctttgaga gaggactgga accagaaaag atcattgggg 8700
caacagattc ctgtggtgat ttaatgttcc taatgaaatg gaaagacaca gatgaagctg 8760
acctggttct tgcaaaagaa gctaatgtga aatgtccaca aattgtgata gcattttatg 8820
aagagagact gacatggcat gcatatcctg aggatgcgga aaacaaagag aaagaaacag 8880
caaagagcgg gggtagcggc agcggtagcg catgctctag accaggcgaa cgaccgtttc 8940
aatgccggat atgtatgagg aacttctccc agaggtccag cttggtacgg cacacccgaa 9000
cacatacagg agaaaagcca ttccaatgtc gaatttgtat gcgcaatttt tcagacaagt 9060
ctgtgttggc tcgacacctc cgcacacata ctggttcaca gaagcccttt cagtgcagga 9120
tttgtatgcg caactttagc caacgctcat ccctggtaag gcacactaga acgcatacag 9180
gtgagaagcc tttccagtgt cgcatctgta tgcggaactt cagccagcgg aataacttgg 9240
gcaggcattt gcgaactcac accggttctc aaaaaccttt tcagtgccga atttgtatgc 9300
gcaacttcag cacccacgcc gtattgacac gacacacgcg cacgcacacc ggggaaaaac 9360
cgtttcaatg tcgaatctgc atgcgcaatt ttagcgatag agggaacctc actcgacatc 9420
tgcgcacaca cttgcgggga tcccaattgt gcgtacgcgg atcctctgct ggagacatga 9480
gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag aacagcctgg 9540
ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag ccccccatac 9600
tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg ggcttactga 9660
ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg gtgccaggct 9720
ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg ctagagatcc 9780
tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg tttgctccta 9840
acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag atcttcgaca 9900
tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag gagtttgtgt 9960
gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc agcaccctga 10020
agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca gacactttga 10080
tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg ctggcccagc 10140
tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag catctgtaca 10200
gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg gcggacgccc 10260
accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg gaccaaagcc 10320
acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac atcacggggg 10380
aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc tctcagcact 10440
tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac gataagggct 10500
cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac gcccagcaga 10560
cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa aaccaagtgg 10620
agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg tgcatcaatg 10680
gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca cccaagggtc 10740
ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc gctcctcaag 10800
gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg gtcacgaggc 10860
acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg ctttcgcccc 10920
ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc gcgggacacg 10980
ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg gtggacttta 11040
tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac aactcctctc 11100
caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac atcatgacat 11160
gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg 11220
ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc aggatcgtct 11280
tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaagcg gccgcgactc 11340
tagagtcgac ctgcaggcat gcaagcttga tatcaagctt atcgataatc aacctctgga 11400
ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 11460
tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 11520
ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 11580
gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 11640
caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 11700
actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 11760
ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac 11820
ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 11880
tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 11940
gacgagtcgg atctcccttt gggccgcctc cccgcat 11977
<210> 27
<211> 12727
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 27
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcctgcagc cccgataaaa taaaagattt 7800
tatttagtct ccagaaaaag gggggaatga aagaccccac ctgtaggttt ggcaagctag 7860
ctgcagtaac gccattttgc aaggcatgga aaaataccaa accaagaata gagaagttca 7920
gatcaagggc gggtacatga aaatagctaa cgttgggcca aacaggatat ctgcggtgag 7980
cagtttcggc cccggcccgg ggccaagaac agatggtcac cgcagtttcg gccccggccc 8040
gaggccaaga acagatggtc cccagatatg gcccaaccct cagcagtttc ttaagaccca 8100
tcagatgttt ccaggctccc ccaaggacct gaaatgaccc tgcgccttat ttgaattaac 8160
caatcagcct gcttctcgct tctgttcgcg cgcttctgct tcccgagctc tataaaagag 8220
ctcacaaccc ctcactcggc gcgccagtcc tccgacagac tgagtcgccc gggggggatc 8280
tggagctctc gagaattctc acgcgtgccg ccaccatgtc cgagagggaa gtgtcgactg 8340
cgccggcggg aacagacatg cccgcggcca agaagcagaa gttgagcagc gacgagaaca 8400
gcaacccgga cctctcggga gacgaaaatg acgatgctgt cagtattgag agtggcacaa 8460
acacagaacg cccggacacg cccacaaata cgccaaatgc accaggaagg aaaagctggg 8520
gaaagggaaa atggaagtca aagaaatgca aatattcttt caaatgtgtg aacagcctca 8580
aggaagatca taaccagcca ttgtttggag ttcagtttaa ctggcacagt aaagaaggag 8640
accctctggt gtttgcaact gtgggaagca acagagtaac cttatacgaa tgccattcac 8700
agggggagat acggttattg cagtcctatg tagatgctga tgcagatgaa aacttttaca 8760
cttgtgcatg gacctatgat agcaacacca gccaccctct attagcagtt gctggatcta 8820
gaggcattat aagaataatt aatcctataa caatgcagtg tataaagcac tatgttggcc 8880
atggaaatgc tatcaatgag ctgaaattcc acccacgaga cccaaacctt ctcctgtcag 8940
taagtaaaga tcatgcttta cggttatgga atatccaaac agacactctt gtggcaatat 9000
tcggaggtgt ggaagggcac agagatgaag ttctgagtgc tgattatgat cttttgggtg 9060
aaaaaataat gtcctgtggt atggatcact ctcttaaact gtggagaatc aactcaaaga 9120
ggatgatgaa tgcaattaag gagtcttatg attataaccc aaacaaaact aacaggccat 9180
ttatttccca gaaaatccac tttcctgact tttctaccag agacatacat aggaattatg 9240
ttgattgtgt gcgatggtta ggcgatttga tactttccaa gtcttgtgaa aatgccattg 9300
tatgctggaa acctggcaaa atggaggatg atatagataa aattaaacct agtgagtcta 9360
atgtgactat tcttgggcga tttgattaca gccagtgtga catttggtac atgaggtttt 9420
ctatggattt ctggcaaaag atgcttgcat tgggcaatca ggttggcaaa ctgtatgttt 9480
gggatttaga agtagaagat cctcataaag ccaaatgcac aacactgacc catcataaat 9540
gtggcgcggc tattcgacaa accagtttca gtagggatag cagcatcctc atagctgtct 9600
gcgatgatgc cagcatttgg cgctgggatc gacttcgagg gggtagcggc agcggtagcg 9660
catgctctag accaggcgaa cgaccgtttc aatgccggat atgtatgagg aacttctccc 9720
agaggtccag cttggtacgg cacacccgaa cacatacagg agaaaagcca ttccaatgtc 9780
gaatttgtat gcgcaatttt tcagacaagt ctgtgttggc tcgacacctc cgcacacata 9840
ctggttcaca gaagcccttt cagtgcagga tttgtatgcg caactttagc caacgctcat 9900
ccctggtaag gcacactaga acgcatacag gtgagaagcc tttccagtgt cgcatctgta 9960
tgcggaactt cagccagcgg aataacttgg gcaggcattt gcgaactcac accggttctc 10020
aaaaaccttt tcagtgccga atttgtatgc gcaacttcag cacccacgcc gtattgacac 10080
gacacacgcg cacgcacacc ggggaaaaac cgtttcaatg tcgaatctgc atgcgcaatt 10140
ttagcgatag agggaacctc actcgacatc tgcgcacaca cttgcgggga tcccaattgt 10200
gcgtacgcgg atcctctgct ggagacatga gagctgccaa cctttggcca agcccgctca 10260
tgatcaaacg ctctaagaag aacagcctgg ccttgtccct gacggccgac cagatggtca 10320
gtgccttgtt ggatgctgag ccccccatac tctattccga gtatgatcct accagaccct 10380
tcagtgaagc ttcgatgatg ggcttactga ccaacctggc agacagggag ctggttcaca 10440
tgatcaactg ggcgaagagg gtgccaggct ttgtggattt gaccctccat gatcaggtcc 10500
accttctaga atgtgcctgg ctagagatcc tgatgattgg tctcgtctgg cgctccatgg 10560
agcacccagt gaagctactg tttgctccta acttgctctt ggacaggaac cagggaaaat 10620
gtgtagaggg catggtggag atcttcgaca tgctgctggc tacatcatct cggttccgca 10680
tgatgaatct gcagggagag gagtttgtgt gcctcaaatc tattattttg cttaattctg 10740
gagtgtacac atttctgtcc agcaccctga agtctctgga agagaaggac catatccacc 10800
gagtcctgga caagatcaca gacactttga tccacctgat ggccaaggca ggcctgaccc 10860
tgcagcagca gcaccagcgg ctggcccagc tcctcctcat cctctcccac atcaggcaca 10920
tgagtaacaa aggcatggag catctgtaca gcatgaagtg caagaacgtg gtgcccctct 10980
atgacctgct gctggaggcg gcggacgccc accgcctaca tgcgcccact agccgtggag 11040
gggcatccgt ggaggagacg gaccaaagcc acttggccac tgcgggctct acttcatcgc 11100
attccttgca aaagtattac atcacggggg aggcagaggg tttccctgcc acagctcccg 11160
gggatgagat ggaagagtgc tctcagcact tacccggcgc cggcagtagt ggcgatatca 11220
tggattacaa ggatgacgac gataagggct cttccgggac aggctccgga tccggcacta 11280
gtgcgcccat cacggcgtac gcccagcaga cgagaggcct cctagggtgt ataatcacca 11340
gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta 11400
cccaaacctt cctggcaacg tgcatcaatg gggtatgctg ggcagtctac cacggggccg 11460
gaacgaggac catcgcatca cccaagggtc ctgtcatcca gatgtatacc aatgtggacc 11520
aagaccttgt gggctggccc gctcctcaag gttcccgctc attgacaccc tgtacctgcg 11580
gctcctcgga cctttacctg gtcacgaggc acgccgatgt cattcccgtg cgccggcgag 11640
gtgatagcag gggtagcctg ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg 11700
ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct attcagggcc gcggtgtgca 11760
cccgtggagt ggctaaagcg gtggacttta tccctgtgga gaacctagag acaaccatga 11820
gatccccggt gttcacggac aactcctctc caccagcagt caccctgacg cacccaatca 11880
ccaaaatcga taccaaatac atcatgacat gcatgtcggc cgacctggag gtcgtcacga 11940
gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag 12000
gctgcgtggt catagtgggc aggatcgtct tgtccgggaa gccggcaatt atacctgaca 12060
gggaggttct ctactaagcg gccgcgactc tagagtcgac ctgcaggcat gcaagcttga 12120
tatcaagctt atcgataatc aacctctgga ttacaaaatt tgtgaaagat tgactggtat 12180
tcttaactat gttgctcctt ttacgctatg tggatacgct gctttaatgc ctttgtatca 12240
tgctattgct tcccgtatgg ctttcatttt ctcctccttg tataaatcct ggttgctgtc 12300
tctttatgag gagttgtggc ccgttgtcag gcaacgtggc gtggtgtgca ctgtgtttgc 12360
tgacgcaacc cccactggtt ggggcattgc caccacctgt cagctccttt ccgggacttt 12420
cgctttcccc ctccctattg ccacggcgga actcatcgcc gcctgccttg cccgctgctg 12480
gacaggggct cggctgttgg gcactgacaa ttccgtggtg ttgtcgggga aatcatcgtc 12540
ctttccttgg ctgctcgcct gtgttgccac ctggattctg cgcgggacgt ccttctgcta 12600
cgtcccttcg gccctcaatc cagcggacct tccttcccgc ggcctgctgc cggctctgcg 12660
gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg atctcccttt gggccgcctc 12720
cccgcat 12727
<210> 28
<211> 2712
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 28
atgttcgaac ccaagaagaa gagaaaggtg ttcgaaacta gtgtgcccct gtatggcttc 60
acttccattt gtggccgacg gcctgaaatg gaagccgcgg tgtcaaccat accacggttt 120
ctgcagagct catcaggctc catgctggac ggacgctttg atccacagtc tgccgcacat 180
ttctttggag tctacgacgg ccacgggggc agccaggtcg ccaactactg cagggaaagg 240
atgcatttgg cacttgccga agagatcgcc aaagagaagc ccatgttgtg tgatggggat 300
acctggctgg agaagtggaa gaaagcgctt tttaactctt ttctgagagt ggattctgag 360
atagaatctg tcgcacccga gaccgtgggc agcacatccg tcgtagccgt agtgtttccc 420
tcccacatat tcgtcgccaa ctgcggcgac agtcgagccg tcctctgccg aggtaagacc 480
gccctgcctc tgagtgttga ccataagccc gaccgggagg atgaggccgc ccgaatcgag 540
gccgccggtg gaaaagtcat ccaatggaac ggcgcaagag tgttcggcgt gctggcgatg 600
tccaggagca ttggagaccg gtacctgaag cccagcataa tcccagatcc cgaagtgacc 660
gcagtcaaga gggtgaaaga ggacgattgt ctgatcctgg ctagcgatgg cgtatgggac 720
gtgatgactg atgaggaggc gtgtgaaatg gcccgcaagc gaatcctgct gtggcataaa 780
aaaaacgcag tcgcggggga cgcttctctt ctggcagacg aaaggcgcaa agaaggtaaa 840
gacccggctg ctatgagcgc cgccgaatat ctcagtaagc tggcaattca gcgagggtcc 900
aaagacaaca tttccgtggt cgtggtagac ctcaaaggcg gttccggcgg ttctagacca 960
ggcgaacgac cgtttcaatg ccggatatgt atgaggaact tctccgagga ggcaaacttg 1020
aggcgccaca cccgaacaca tacaggagaa aagccattcc aatgtcgaat ttgtatgcgc 1080
aatttttcag atcactcaag cctcaagcga cacctccgca cacatactgg ttcacagaag 1140
ccctttcagt gcaggatttg tatgcgcaac tttagccaat cagcgaacct tttgcggcac 1200
actagaacgc atacaggtga gaagcctttc cagtgtcgca tctgtatgcg gaacttcagc 1260
gaccccagtt cattgaagag gcatttgcga actcacaccg gttctcaaaa accttttcag 1320
tgccgaattt gtatgcgcaa cttcagccaa caaacaaatt tgacgagaca cacgcgcacg 1380
cacaccgggg aaaaaccgtt tcaatgtcga atctgcatgc gcaattttag cgatgcgaca 1440
caacttgtta ggcatctgcg cacacacttg cggggatccc cgaagaaaaa acggaaagtg 1500
acctgcaggg gaagcggagc tactaacttc agcctgctga agcaggctgg agacgtggag 1560
gagaaccctg gacctggtca ccatgatgag tttcccacca tggtgtttcc ttctgggcag 1620
atcagccagg cctcggcctt ggccccggcc cctccccaag tcctgcccca ggctccagcc 1680
cctgcccctg ctccagccat ggtatcagct ctggcccagg ccccagcccc tgtcccagtc 1740
ctagccccag gccctcctca ggctgtggcc ccacctgccc ccaagcccac ccaggctggg 1800
gaaggaacgc tgtcagaggc cctgctgcag ctgcagtttg atgatgaaga cctgggggcc 1860
ttgcttggca acagcacaga cccagctgtg ttcacagacc tggcatccgt cgacaactcc 1920
gagtttcagc agctgctgaa ccagggcata cctgtggccc cccacacaac tgagcccatg 1980
ctgatggagt accctgaggc tataactcgc ctagtgacag gggcccagag gccccccgac 2040
ccagctcctg ctccactggg ggccccgggg ctccccaatg gcctcctttc aggagatgaa 2100
gacttctcct ccattgcgga catggacttc tcagccctgc tgagtcagat cagctccggt 2160
ggtggcagcg gtcaattgac tcaagacgaa ttcacccaac tctcccaatc aatcgccgag 2220
ttccacacgt accaactcgg taacggccgt tgctcatctc tcctagctca gcgaatccac 2280
gcgccgccgg aaacagtatg gtccgtggtg agacgtttcg ataggccaca gatttacaaa 2340
cacttcatca aaagctgtaa cgtgagtgaa gatttcgaga tgcgagtggg atgcacgcgc 2400
gacgtgaacg tgataagtgg attaccggcg aatacgtctc gagagagatt agatctgttg 2460
gacgatgatc ggagagtgac tgggtttagt ataaccggtg gtgaacatag gctgaggaat 2520
tataaatcgg ttacgacggt tcatagattt gagaaagaag aagaagaaga aaggatctgg 2580
accgttgttt tggaatctta tgttgttgat gtaccggaag gtaattcgga ggaagatacg 2640
agattgtttg ctgatacggt tattagattg aatcttcaga aacttgcttc gatcactgaa 2700
gctatgaact aa 2712
<210> 29
<211> 2427
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 29
atgttcgaac ccaagaagaa gagaaaggtg ttcgaaacta gtgtgcccct gtatggcttc 60
acttccattt gtggccgacg gcctgaaatg gaagccgcgg tgtcaaccat accacggttt 120
ctgcagagct catcaggctc catgctggac ggacgctttg atccacagtc tgccgcacat 180
ttctttggag tctacgacgg ccacgggggc agccaggtcg ccaactactg cagggaaagg 240
atgcatttgg cacttgccga agagatcgcc aaagagaagc ccatgttgtg tgatggggat 300
acctggctgg agaagtggaa gaaagcgctt tttaactctt ttctgagagt ggattctgag 360
atagaatctg tcgcacccga gaccgtgggc agcacatccg tcgtagccgt agtgtttccc 420
tcccacatat tcgtcgccaa ctgcggcgac agtcgagccg tcctctgccg aggtaagacc 480
gccctgcctc tgagtgttga ccataagccc gaccgggagg atgaggccgc ccgaatcgag 540
gccgccggtg gaaaagtcat ccaatggaac ggcgcaagag tgttcggcgt gctggcgatg 600
tccaggagca ttggagaccg gtacctgaag cccagcataa tcccagatcc cgaagtgacc 660
gcagtcaaga gggtgaaaga ggacgattgt ctgatcctgg ctagcgatgg cgtatgggac 720
gtgatgactg atgaggaggc gtgtgaaatg gcccgcaagc gaatcctgct gtggcataaa 780
aaaaacgcag tcgcggggga cgcttctctt ctggcagacg aaaggcgcaa agaaggtaaa 840
gacccggctg ctatgagcgc cgccgaatat ctcagtaagc tggcaattca gcgagggtcc 900
aaagacaaca tttccgtggt cgtggtagac ctcaaaggcg gttccggcgg ttctagacca 960
ggcgaacgac cgtttcaatg ccggatatgt atgaggaact tctccgagga ggcaaacttg 1020
aggcgccaca cccgaacaca tacaggagaa aagccattcc aatgtcgaat ttgtatgcgc 1080
aatttttcag atcactcaag cctcaagcga cacctccgca cacatactgg ttcacagaag 1140
ccctttcagt gcaggatttg tatgcgcaac tttagccaat cagcgaacct tttgcggcac 1200
actagaacgc atacaggtga gaagcctttc cagtgtcgca tctgtatgcg gaacttcagc 1260
gaccccagtt cattgaagag gcatttgcga actcacaccg gttctcaaaa accttttcag 1320
tgccgaattt gtatgcgcaa cttcagccaa caaacaaatt tgacgagaca cacgcgcacg 1380
cacaccgggg aaaaaccgtt tcaatgtcga atctgcatgc gcaattttag cgatgcgaca 1440
caacttgtta ggcatctgcg cacacacttg cggggatcca cctgcagggg aagcggagct 1500
actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acctggtcac 1560
catccgaaga aaaaacggaa agtggatgct aagtcactga ctgcctggtc ccggacactg 1620
gtgaccttca aggatgtgtt tgtggacttc accagggagg agtggaagct gctggacact 1680
gctcagcaga tcctgtacag aaatgtgatg ctggagaact ataagaacct ggtttccttg 1740
ggttatcagc ttactaagcc agatgtgatc ctccggttgg agaagggaga agagccctgg 1800
ctggtggaga gagaaattca ccaagagacc catcctgatt cagagactgc atttgaaatc 1860
aaatcatcag ttggtggtgg cagcggtcaa ttgactcaag acgaattcac ccaactctcc 1920
caatcaatcg ccgagttcca cacgtaccaa ctcggtaacg gccgttgctc atctctccta 1980
gctcagcgaa tccacgcgcc gccggaaaca gtatggtccg tggtgagacg tttcgatagg 2040
ccacagattt acaaacactt catcaaaagc tgtaacgtga gtgaagattt cgagatgcga 2100
gtgggatgca cgcgcgacgt gaacgtgata agtggattac cggcgaatac gtctcgagag 2160
agattagatc tgttggacga tgatcggaga gtgactgggt ttagtataac cggtggtgaa 2220
cataggctga ggaattataa atcggttacg acggttcata gatttgagaa agaagaagaa 2280
gaagaaagga tctggaccgt tgttttggaa tcttatgttg ttgatgtacc ggaaggtaat 2340
tcggaggaag atacgagatt gtttgctgat acggttatta gattgaatct tcagaaactt 2400
gcttcgatca ctgaagctat gaactaa 2427
<210> 30
<211> 2079
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 30
atgtctagac caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag 60
aggtccagct tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga 120
atttgtatgc gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact 180
ggttcacaga agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc 240
ctggtaaggc acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg 300
cggaacttca gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa 360
aaaccttttc agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga 420
cacacgcgca cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt 480
agcgatagag ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg 540
gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 600
ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 660
tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 720
gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 780
ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 840
gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 900
ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 960
actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 1020
ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 1080
gacttctcag ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct 1140
ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 1200
aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 1260
ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 1320
ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1380
gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1440
ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1500
tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1560
atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1620
gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1680
agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1740
gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1800
ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1860
catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1920
gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1980
gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 2040
atcacggggg aggcagaggg tttccctgcc acagcttaa 2079
<210> 31
<211> 1818
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 31
atggatgcta agtcactgac tgcctggtcc cggacactgg tgaccttcaa ggatgtgttt 60
gtggacttca ccagggagga gtggaagctg ctggacactg ctcagcagat cctgtacaga 120
aatgtgatgc tggagaacta taagaacctg gtttccttgg gttatcagct tactaagcca 180
gatgtgatcc tccggttgga gaagggagaa gagccctggc tggtggagag agaaattcac 240
caagagaccc atcctgattc agagactgca tttgaaatca aatcatcagt tctcgaggga 300
ggcggtggaa gcggcacctg caggtctaga ccaggcgaac gaccgtttca atgccggata 360
tgtatgagga acttctccca gaggtccagc ttggtacggc acacccgaac acatacagga 420
gaaaagccat tccaatgtcg aatttgtatg cgcaattttt cagacaagtc tgtgttggct 480
cgacacctcc gcacacatac tggttcacag aagccctttc agtgcaggat ttgtatgcgc 540
aactttagcc aacgctcatc cctggtaagg cacactagaa cgcatacagg tgagaagcct 600
ttccagtgtc gcatctgtat gcggaacttc agccagcgga ataacttggg caggcatttg 660
cgaactcaca ccggttctca aaaacctttt cagtgccgaa tttgtatgcg caacttcagc 720
acccacgccg tattgacacg acacacgcgc acgcacaccg gggaaaaacc gtttcaatgt 780
cgaatctgca tgcgcaattt tagcgataga gggaacctca ctcgacatct gcgcacacac 840
ttgcggggat cccaattgtg cgtacgcgga tcctctgctg gagacatgag agctgccaac 900
ctttggccaa gcccgctcat gatcaaacgc tctaagaaga acagcctggc cttgtccctg 960
acggccgacc agatggtcag tgccttgttg gatgctgagc cccccatact ctattccgag 1020
tatgatccta ccagaccctt cagtgaagct tcgatgatgg gcttactgac caacctggca 1080
gacagggagc tggttcacat gatcaactgg gcgaagaggg tgccaggctt tgtggatttg 1140
accctccatg atcaggtcca ccttctagaa tgtgcctggc tagagatcct gatgattggt 1200
ctcgtctggc gctccatgga gcacccagtg aagctactgt ttgctcctaa cttgctcttg 1260
gacaggaacc agggaaaatg tgtagagggc atggtggaga tcttcgacat gctgctggct 1320
acatcatctc ggttccgcat gatgaatctg cagggagagg agtttgtgtg cctcaaatct 1380
attattttgc ttaattctgg agtgtacaca tttctgtcca gcaccctgaa gtctctggaa 1440
gagaaggacc atatccaccg agtcctggac aagatcacag acactttgat ccacctgatg 1500
gccaaggcag gcctgaccct gcagcagcag caccagcggc tggcccagct cctcctcatc 1560
ctctcccaca tcaggcacat gagtaacaaa ggcatggagc atctgtacag catgaagtgc 1620
aagaacgtgg tgcccctcta tgacctgctg ctggaggcgg cggacgccca ccgcctacat 1680
gcgcccacta gccgtggagg ggcatccgtg gaggagacgg accaaagcca cttggccact 1740
gcgggctcta cttcatcgca ttccttgcaa aagtattaca tcacggggga ggcagagggt 1800
ttccctgcca cagcttaa 1818
<210> 32
<211> 2115
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 32
atgtctagac ccggagagcg cccattccag tgtcggattt gcatgcggaa cttttcgaga 60
agacacggcc tggacagaca tacccgtact catacaggtg aaaaaccctt tcagtgtcgg 120
atctgtatgc gaaatttctc cgaccacagc agcctgaaga gacatctacg tacccacacc 180
ggcagccaga agccatttca gtgtcggatc tgtatgcgga acttctccgt gagacacaac 240
ctgaccagac atctacgtac gcacaccgga gagaagccat tccaatgccg aatatgcatg 300
cgcaacttca gtgaccacag caacctgagc agacacctaa aaacccacac cggttcccag 360
aagccatttc agtgtcggat ctgtatgcgg aacttctccc agcgcagcag cctggtgaga 420
catctacgta cgcacaccgg agagaagcca ttccaatgcc gaatatgcat gcgcaacttc 480
agtgagagcg gccacctgaa gagacacctg cgtacgcacc tgaggggatc cacctgcagg 540
gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 600
gacaagatgg cccccaagaa aaagaggaag gtgggcattc acggggtgcc gggtggactc 660
gagggaggcg gtggaagcgg cggtaccgag gacgtggtgt gctgccactc aatctacggc 720
aagaagaagg gtgatatcga cacctaccga tacataggct cttccgggac aggctgcgtg 780
gtcatagtgg gcaggatcgt cttgtccgga tccggcacta gtgcgcccat cacggcgtac 840
gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 900
aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 960
tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 1020
cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 1080
gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 1140
gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 1200
ctttcgcccc ggcccatttc ctacttgaaa ggctcctcgg ggggtccgct gttgtgcccc 1260
gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 1320
gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 1380
aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga tagggaggtt 1440
ctctaccagg agttcgatga gatggaagag tgctctcagc actatcccta cgatgtgccc 1500
gattacgctg gaggcggtgg aagcggcggt accgatgagt ttcccaccat ggtgtttcct 1560
tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt cctgccccag 1620
gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc cccagcccct 1680
gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc caagcccacc 1740
caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 1800
ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 1860
gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 1920
gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg ggcccagagg 1980
ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg cctcctttca 2040
ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 2100
agctcccaat tgtaa 2115
<210> 33
<211> 1830
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 33
atggatgcta agtcactgac tgcctggtcc cggacactgg tgaccttcaa ggatgtgttt 60
gtggacttca ccagggagga gtggaagctg ctggacactg ctcagcagat cctgtacaga 120
aatgtgatgc tggagaacta taagaacctg gtttccttgg gttatcagct tactaagcca 180
gatgtgatcc tccggttgga gaagggagaa gagccctggc tggtggagag agaaattcac 240
caagagaccc atcctgattc agagactgca tttgaaatca aatcatcagt tacctgcagg 300
gactacaaag accatgacgg tgattataaa gatcatgaca tcgattacaa ggatgacgat 360
gacaagatgg cccccaagaa aaagaggaag gtgggcattc acggggtgcc gggtggactc 420
gagggaggcg gtggaagcgg cggtaccgag gacgtggtgt gctgccactc aatctacggc 480
aagaagaagg gtgatatcga cacctaccga tacataggct cttccgggac aggctgcgtg 540
gtcatagtgg gcaggatcgt cttgtccgga tccggcacta gtgcgcccat cacggcgtac 600
gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 660
aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 720
tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 780
cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 840
gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 900
gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 960
ctttcgcccc ggcccatttc ctacttgaaa ggctcctcgg ggggtccgct gttgtgcccc 1020
gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 1080
gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 1140
aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga tagggaggtt 1200
ctctaccagg agttcgatga gatggaagag tgctctcagc actatcccta cgatgtgccc 1260
gattacgctg gaggcggtgg aagcggcggt acctctagac ccggagagcg cccattccag 1320
tgtcggattt gcatgcggaa cttttcgaga agacacggcc tggacagaca tacccgtact 1380
catacaggtg aaaaaccctt tcagtgtcgg atctgtatgc gaaatttctc cgaccacagc 1440
agcctgaaga gacatctacg tacccacacc ggcagccaga agccatttca gtgtcggatc 1500
tgtatgcgga acttctccgt gagacacaac ctgaccagac atctacgtac gcacaccgga 1560
gagaagccat tccaatgccg aatatgcatg cgcaacttca gtgaccacag caacctgagc 1620
agacacctaa aaacccacac cggttcccag aagccatttc agtgtcggat ctgtatgcgg 1680
aacttctccc agcgcagcag cctggtgaga catctacgta cgcacaccgg agagaagcca 1740
ttccaatgcc gaatatgcat gcgcaacttc agtgagagcg gccacctgaa gagacacctg 1800
cgtacgcacc tgaggggatc ccaattgtaa 1830
<210> 34
<211> 2997
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 34
atgtctagac caggcgaacg accgtttcaa tgccggatat gtatgaggaa cttctcccag 60
aggtccagct tggtacggca cacccgaaca catacaggag aaaagccatt ccaatgtcga 120
atttgtatgc gcaatttttc agacaagtct gtgttggctc gacacctccg cacacatact 180
ggttcacaga agccctttca gtgcaggatt tgtatgcgca actttagcca acgctcatcc 240
ctggtaaggc acactagaac gcatacaggt gagaagcctt tccagtgtcg catctgtatg 300
cggaacttca gccagcggaa taacttgggc aggcatttgc gaactcacac cggttctcaa 360
aaaccttttc agtgccgaat ttgtatgcgc aacttcagca cccacgccgt attgacacga 420
cacacgcgca cgcacaccgg ggaaaaaccg tttcaatgtc gaatctgcat gcgcaatttt 480
agcgatagag ggaacctcac tcgacatctg cgcacacact tgcggggatc cacctgcagg 540
gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 600
ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 660
tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 720
gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 780
ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 840
gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 900
ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 960
actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 1020
ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 1080
gacttctcag ccctgctgag tcagatcagc tcccaattgt gcgtacgcgg atcctctgct 1140
ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 1200
aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 1260
ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 1320
ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1380
gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1440
ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1500
tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1560
atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1620
gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1680
agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1740
gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1800
ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1860
catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1920
gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1980
gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 2040
atcacggggg aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc 2100
tctcagcact tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac 2160
gataagggct cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac 2220
gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 2280
aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 2340
tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 2400
cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 2460
gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 2520
gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 2580
ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc 2640
gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 2700
gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 2760
aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac 2820
atcatgacat gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc 2880
ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc 2940
aggatcgtct tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaa 2997
<210> 35
<211> 2994
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 35
atggattaca aggatgacga cgataagggc tcttccggga caggctccgg atccggcact 60
agtgcgccca tcacggcgta cgcccagcag acgagaggcc tcctagggtg tataatcacc 120
agcctgactg gccgggacaa aaaccaagtg gagggtgagg tccagatcgt gtcaactgct 180
acccaaacct tcctggcaac gtgcatcaat ggggtatgct gggcagtcta ccacggggcc 240
ggaacgagga ccatcgcatc acccaagggt cctgtcatcc agatgtatac caatgtggac 300
caagaccttg tgggctggcc cgctcctcaa ggttcccgct cattgacacc ctgtacctgc 360
ggctcctcgg acctttacct ggtcacgagg cacgccgatg tcattcccgt gcgccggcga 420
ggtgatagca ggggtagcct gctttcgccc cggcccattt cctacttgaa aggctcctcg 480
gggggtccgc tgttgtgccc cgcgggacac gccgtgggcc tattcagggc cgcggtgtgc 540
acccgtggag tggctaaagc ggtggacttt atccctgtgg agaacctaga gacaaccatg 600
agatccccgg tgttcacgga caactcctct ccaccagcag tcaccctgac gcacccaatc 660
accaaaatcg ataccaaata catcatgaca tgcatgtcgg ccgacctgga ggtcgtcacg 720
agcacctggg tgctcgttgg cggcgtcctg gctgctctgg ccgcgtattg cctgtcaaca 780
ggctgcgtgg tcatagtggg caggatcgtc ttgtccggga agccggcagg cagtagcgga 840
agcagtatta tacctgacag ggaggttctc taccaggagt tcgaagatgt cgtgccatgc 900
tcaatgggct cgcccgggtc tagaccaggc gaacgaccgt ttcaatgccg gatatgtatg 960
aggaacttct cccagaggtc cagcttggta cggcacaccc gaacacatac aggagaaaag 1020
ccattccaat gtcgaatttg tatgcgcaat ttttcagaca agtctgtgtt ggctcgacac 1080
ctccgcacac atactggttc acagaagccc tttcagtgca ggatttgtat gcgcaacttt 1140
agccaacgct catccctggt aaggcacact agaacgcata caggtgagaa gcctttccag 1200
tgtcgcatct gtatgcggaa cttcagccag cggaataact tgggcaggca tttgcgaact 1260
cacaccggtt ctcaaaaacc ttttcagtgc cgaatttgta tgcgcaactt cagcacccac 1320
gccgtattga cacgacacac gcgcacgcac accggggaaa aaccgtttca atgtcgaatc 1380
tgcatgcgca attttagcga tagagggaac ctcactcgac atctgcgcac acacttgcgg 1440
ggatccacct gcagggatga gtttcccacc atggtgtttc cttctgggca gatcagccag 1500
gcctcggcct tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct 1560
gctccagcca tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca 1620
ggccctcctc aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg 1680
ctgtcagagg ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc 1740
aacagcacag acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag 1800
cagctgctga accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag 1860
taccctgagg ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct 1920
gctccactgg gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc 1980
tccattgcgg acatggactt ctcagccctg ctgagtcaga tcagctccca attgtgcgta 2040
cgcggatcct ctgctggaga catgagagct gccaaccttt ggccaagccc gctcatgatc 2100
aaacgctcta agaagaacag cctggccttg tccctgacgg ccgaccagat ggtcagtgcc 2160
ttgttggatg ctgagccccc catactctat tccgagtatg atcctaccag acccttcagt 2220
gaagcttcga tgatgggctt actgaccaac ctggcagaca gggagctggt tcacatgatc 2280
aactgggcga agagggtgcc aggctttgtg gatttgaccc tccatgatca ggtccacctt 2340
ctagaatgtg cctggctaga gatcctgatg attggtctcg tctggcgctc catggagcac 2400
ccagtgaagc tactgtttgc tcctaacttg ctcttggaca ggaaccaggg aaaatgtgta 2460
gagggcatgg tggagatctt cgacatgctg ctggctacat catctcggtt ccgcatgatg 2520
aatctgcagg gagaggagtt tgtgtgcctc aaatctatta ttttgcttaa ttctggagtg 2580
tacacatttc tgtccagcac cctgaagtct ctggaagaga aggaccatat ccaccgagtc 2640
ctggacaaga tcacagacac tttgatccac ctgatggcca aggcaggcct gaccctgcag 2700
cagcagcacc agcggctggc ccagctcctc ctcatcctct cccacatcag gcacatgagt 2760
aacaaaggca tggagcatct gtacagcatg aagtgcaaga acgtggtgcc cctctatgac 2820
ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc ccactagccg tggaggggca 2880
tccgtggagg agacggacca aagccacttg gccactgcgg gctctacttc atcgcattcc 2940
ttgcaaaagt attacatcac gggggaggca gagggtttcc ctgccacagc ttaa 2994
<210> 36
<211> 2187
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 36
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaaaaagagg aaggtgggca ttcacggggt gccgggtgga 120
ctcgagggag gcggtggaag cggcggtacc gctagctcta gacccggaga gcgcccattc 180
cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag acatacccgt 240
actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt ctccgaccac 300
agcagcctga agagacatct acgtacccac accggcagcc agaagccatt tcagtgtcgg 360
atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg tacgcacacc 420
ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca cagcaacctg 480
agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg gatctgtatg 540
cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac cggagagaag 600
ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct gaagagacac 660
ctgcgtacgc acctgagggg atccacctgc agggatgagt ttcccaccat ggtgtttcct 720
tctgggcaga tcagccaggc ctcggccttg gccccggccc ctccccaagt cctgccccag 780
gctccagccc ctgcccctgc tccagccatg gtatcagctc tggcccaggc cccagcccct 840
gtcccagtcc tagccccagg ccctcctcag gctgtggccc cacctgcccc caagcccacc 900
caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 960
ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 1020
gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 1080
gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg ggcccagagg 1140
ccccccgacc cagctcctgc tccactgggg gccccggggc tccccaatgg cctcctttca 1200
ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 1260
agctcccccg gggatgagat ggaagagtgc tctcagcact tacccggcgc cggcagtagt 1320
ggcgatatca tggattacaa ggatgacgac gataagggct cttccgggac aggctccgga 1380
tccggcacta gtgcgcccat cacggcgtac gcccagcaga cgagaggcct cctagggtgt 1440
ataatcacca gcctgactgg ccgggacaaa aaccaagtgg agggtgaggt ccagatcgtg 1500
tcaactgcta cccaaacctt cctggcaacg tgcatcaatg gggtatgctg ggcagtctac 1560
cacggggccg gaacgaggac catcgcatca cccaagggtc ctgtcatcca gatgtatacc 1620
aatgtggacc aagaccttgt gggctggccc gctcctcaag gttcccgctc attgacaccc 1680
tgtacctgcg gctcctcgga cctttacctg gtcacgaggc acgccgatgt cattcccgtg 1740
cgccggcgag gtgatagcag gggtagcctg ctttcgcccc ggcccatttc ctacttgaaa 1800
ggctcctctg ggggtccgct gttgtgcccc gcgggacacg ccgtgggcct attcagggcc 1860
gcggtgtgca cccgtggagt ggctaaagcg gtggacttta tccctgtgga gaacctagag 1920
acaaccatga gatccccggt gttcacggac aactcctctc caccagcagt caccctgacg 1980
cacccaatca ccaaaatcga taccaaatac atcatgacat gcatgtcggc cgacctggag 2040
gtcgtcacga gcacctgggt gctcgttggc ggcgtcctgg ctgctctggc cgcgtattgc 2100
ctgtcaacag gctgcgtggt catagtgggc aggatcgtct tgtccgggaa gccggcaatt 2160
atacctgaca gggaggttct ctactaa 2187
<210> 37
<211> 2637
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 37
atgctagcag tgtcagtgac atttgaagat gtggctgtgc tctttactcg ggacgagtgg 60
aagaagctgg atctgtctca gagaagcctg taccgtgagg tgatgctgga gaattacagc 120
aacctggcct ccatggcagg attcctgttt accaaaccaa aggtgatctc cctgttgcag 180
caaggagagg atccctgggg gggtagcggc agcggtagcg catgctctag accaggcgaa 240
cgaccgtttc aatgccggat atgtatgagg aacttctccc agaggtccag cttggtacgg 300
cacacccgaa cacatacagg agaaaagcca ttccaatgtc gaatttgtat gcgcaatttt 360
tcagacaagt ctgtgttggc tcgacacctc cgcacacata ctggttcaca gaagcccttt 420
cagtgcagga tttgtatgcg caactttagc caacgctcat ccctggtaag gcacactaga 480
acgcatacag gtgagaagcc tttccagtgt cgcatctgta tgcggaactt cagccagcgg 540
aataacttgg gcaggcattt gcgaactcac accggttctc aaaaaccttt tcagtgccga 600
atttgtatgc gcaacttcag cacccacgcc gtattgacac gacacacgcg cacgcacacc 660
ggggaaaaac cgtttcaatg tcgaatctgc atgcgcaatt ttagcgatag agggaacctc 720
actcgacatc tgcgcacaca cttgcgggga tcccaattgt gcgtacgcgg atcctctgct 780
ggagacatga gagctgccaa cctttggcca agcccgctca tgatcaaacg ctctaagaag 840
aacagcctgg ccttgtccct gacggccgac cagatggtca gtgccttgtt ggatgctgag 900
ccccccatac tctattccga gtatgatcct accagaccct tcagtgaagc ttcgatgatg 960
ggcttactga ccaacctggc agacagggag ctggttcaca tgatcaactg ggcgaagagg 1020
gtgccaggct ttgtggattt gaccctccat gatcaggtcc accttctaga atgtgcctgg 1080
ctagagatcc tgatgattgg tctcgtctgg cgctccatgg agcacccagt gaagctactg 1140
tttgctccta acttgctctt ggacaggaac cagggaaaat gtgtagaggg catggtggag 1200
atcttcgaca tgctgctggc tacatcatct cggttccgca tgatgaatct gcagggagag 1260
gagtttgtgt gcctcaaatc tattattttg cttaattctg gagtgtacac atttctgtcc 1320
agcaccctga agtctctgga agagaaggac catatccacc gagtcctgga caagatcaca 1380
gacactttga tccacctgat ggccaaggca ggcctgaccc tgcagcagca gcaccagcgg 1440
ctggcccagc tcctcctcat cctctcccac atcaggcaca tgagtaacaa aggcatggag 1500
catctgtaca gcatgaagtg caagaacgtg gtgcccctct atgacctgct gctggaggcg 1560
gcggacgccc accgcctaca tgcgcccact agccgtggag gggcatccgt ggaggagacg 1620
gaccaaagcc acttggccac tgcgggctct acttcatcgc attccttgca aaagtattac 1680
atcacggggg aggcagaggg tttccctgcc acagctcccg gggatgagat ggaagagtgc 1740
tctcagcact tacccggcgc cggcagtagt ggcgatatca tggattacaa ggatgacgac 1800
gataagggct cttccgggac aggctccgga tccggcacta gtgcgcccat cacggcgtac 1860
gcccagcaga cgagaggcct cctagggtgt ataatcacca gcctgactgg ccgggacaaa 1920
aaccaagtgg agggtgaggt ccagatcgtg tcaactgcta cccaaacctt cctggcaacg 1980
tgcatcaatg gggtatgctg ggcagtctac cacggggccg gaacgaggac catcgcatca 2040
cccaagggtc ctgtcatcca gatgtatacc aatgtggacc aagaccttgt gggctggccc 2100
gctcctcaag gttcccgctc attgacaccc tgtacctgcg gctcctcgga cctttacctg 2160
gtcacgaggc acgccgatgt cattcccgtg cgccggcgag gtgatagcag gggtagcctg 2220
ctttcgcccc ggcccatttc ctacttgaaa ggctcctctg ggggtccgct gttgtgcccc 2280
gcgggacacg ccgtgggcct attcagggcc gcggtgtgca cccgtggagt ggctaaagcg 2340
gtggacttta tccctgtgga gaacctagag acaaccatga gatccccggt gttcacggac 2400
aactcctctc caccagcagt caccctgacg cacccaatca ccaaaatcga taccaaatac 2460
atcatgacat gcatgtcggc cgacctggag gtcgtcacga gcacctgggt gctcgttggc 2520
ggcgtcctgg ctgctctggc cgcgtattgc ctgtcaacag gctgcgtggt catagtgggc 2580
aggatcgtct tgtccgggaa gccggcaatt atacctgaca gggaggttct ctactaa 2637
<210> 38
<211> 3012
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 38
atgggaaaga aaaccaagcg gacagctgac agttcttctt cagaggatga ggaggagtat 60
gtcgtggaga aggtgctaga caggcgcgtg gttaagggac aagtggaata tctactgaag 120
tggaaaggct tttctgagga gcacaatact tgggaacctg agaaaaactt ggattgccct 180
gagctaattt ctgaatttat gaaaaagtat aagaagatga aggagggtga aaataataaa 240
cccagggaga agtcagaaag taacaagagg aaatccaatt tctcaaacag tgccgatgac 300
atcaaatcta aaaaaaagag agagcagagc aatgatatcg ctcggggctt tgagagagga 360
ctggaaccag aaaagatcat tggggcaaca gattcctgtg gtgatttaat gttcctaatg 420
aaatggaaag acacagatga agctgacctg gttcttgcaa aagaagctaa tgtgaaatgt 480
ccacaaattg tgatagcatt ttatgaagag agactgacat ggcatgcata tcctgaggat 540
gcggaaaaca aagagaaaga aacagcaaag agcgggggta gcggcagcgg tagcgcatgc 600
tctagaccag gcgaacgacc gtttcaatgc cggatatgta tgaggaactt ctcccagagg 660
tccagcttgg tacggcacac ccgaacacat acaggagaaa agccattcca atgtcgaatt 720
tgtatgcgca atttttcaga caagtctgtg ttggctcgac acctccgcac acatactggt 780
tcacagaagc cctttcagtg caggatttgt atgcgcaact ttagccaacg ctcatccctg 840
gtaaggcaca ctagaacgca tacaggtgag aagcctttcc agtgtcgcat ctgtatgcgg 900
aacttcagcc agcggaataa cttgggcagg catttgcgaa ctcacaccgg ttctcaaaaa 960
ccttttcagt gccgaatttg tatgcgcaac ttcagcaccc acgccgtatt gacacgacac 1020
acgcgcacgc acaccgggga aaaaccgttt caatgtcgaa tctgcatgcg caattttagc 1080
gatagaggga acctcactcg acatctgcgc acacacttgc ggggatccca attgtgcgta 1140
cgcggatcct ctgctggaga catgagagct gccaaccttt ggccaagccc gctcatgatc 1200
aaacgctcta agaagaacag cctggccttg tccctgacgg ccgaccagat ggtcagtgcc 1260
ttgttggatg ctgagccccc catactctat tccgagtatg atcctaccag acccttcagt 1320
gaagcttcga tgatgggctt actgaccaac ctggcagaca gggagctggt tcacatgatc 1380
aactgggcga agagggtgcc aggctttgtg gatttgaccc tccatgatca ggtccacctt 1440
ctagaatgtg cctggctaga gatcctgatg attggtctcg tctggcgctc catggagcac 1500
ccagtgaagc tactgtttgc tcctaacttg ctcttggaca ggaaccaggg aaaatgtgta 1560
gagggcatgg tggagatctt cgacatgctg ctggctacat catctcggtt ccgcatgatg 1620
aatctgcagg gagaggagtt tgtgtgcctc aaatctatta ttttgcttaa ttctggagtg 1680
tacacatttc tgtccagcac cctgaagtct ctggaagaga aggaccatat ccaccgagtc 1740
ctggacaaga tcacagacac tttgatccac ctgatggcca aggcaggcct gaccctgcag 1800
cagcagcacc agcggctggc ccagctcctc ctcatcctct cccacatcag gcacatgagt 1860
aacaaaggca tggagcatct gtacagcatg aagtgcaaga acgtggtgcc cctctatgac 1920
ctgctgctgg aggcggcgga cgcccaccgc ctacatgcgc ccactagccg tggaggggca 1980
tccgtggagg agacggacca aagccacttg gccactgcgg gctctacttc atcgcattcc 2040
ttgcaaaagt attacatcac gggggaggca gagggtttcc ctgccacagc tcccggggat 2100
gagatggaag agtgctctca gcacttaccc ggcgccggca gtagtggcga tatcatggat 2160
tacaaggatg acgacgataa gggctcttcc gggacaggct ccggatccgg cactagtgcg 2220
cccatcacgg cgtacgccca gcagacgaga ggcctcctag ggtgtataat caccagcctg 2280
actggccggg acaaaaacca agtggagggt gaggtccaga tcgtgtcaac tgctacccaa 2340
accttcctgg caacgtgcat caatggggta tgctgggcag tctaccacgg ggccggaacg 2400
aggaccatcg catcacccaa gggtcctgtc atccagatgt ataccaatgt ggaccaagac 2460
cttgtgggct ggcccgctcc tcaaggttcc cgctcattga caccctgtac ctgcggctcc 2520
tcggaccttt acctggtcac gaggcacgcc gatgtcattc ccgtgcgccg gcgaggtgat 2580
agcaggggta gcctgctttc gccccggccc atttcctact tgaaaggctc ctctgggggt 2640
ccgctgttgt gccccgcggg acacgccgtg ggcctattca gggccgcggt gtgcacccgt 2700
ggagtggcta aagcggtgga ctttatccct gtggagaacc tagagacaac catgagatcc 2760
ccggtgttca cggacaactc ctctccacca gcagtcaccc tgacgcaccc aatcaccaaa 2820
atcgatacca aatacatcat gacatgcatg tcggccgacc tggaggtcgt cacgagcacc 2880
tgggtgctcg ttggcggcgt cctggctgct ctggccgcgt attgcctgtc aacaggctgc 2940
gtggtcatag tgggcaggat cgtcttgtcc gggaagccgg caattatacc tgacagggag 3000
gttctctact aa 3012
<210> 39
<211> 3762
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 39
atgtccgaga gggaagtgtc gactgcgccg gcgggaacag acatgcccgc ggccaagaag 60
cagaagttga gcagcgacga gaacagcaac ccggacctct cgggagacga aaatgacgat 120
gctgtcagta ttgagagtgg cacaaacaca gaacgcccgg acacgcccac aaatacgcca 180
aatgcaccag gaaggaaaag ctggggaaag ggaaaatgga agtcaaagaa atgcaaatat 240
tctttcaaat gtgtgaacag cctcaaggaa gatcataacc agccattgtt tggagttcag 300
tttaactggc acagtaaaga aggagaccct ctggtgtttg caactgtggg aagcaacaga 360
gtaaccttat acgaatgcca ttcacagggg gagatacggt tattgcagtc ctatgtagat 420
gctgatgcag atgaaaactt ttacacttgt gcatggacct atgatagcaa caccagccac 480
cctctattag cagttgctgg atctagaggc attataagaa taattaatcc tataacaatg 540
cagtgtataa agcactatgt tggccatgga aatgctatca atgagctgaa attccaccca 600
cgagacccaa accttctcct gtcagtaagt aaagatcatg ctttacggtt atggaatatc 660
caaacagaca ctcttgtggc aatattcgga ggtgtggaag ggcacagaga tgaagttctg 720
agtgctgatt atgatctttt gggtgaaaaa ataatgtcct gtggtatgga tcactctctt 780
aaactgtgga gaatcaactc aaagaggatg atgaatgcaa ttaaggagtc ttatgattat 840
aacccaaaca aaactaacag gccatttatt tcccagaaaa tccactttcc tgacttttct 900
accagagaca tacataggaa ttatgttgat tgtgtgcgat ggttaggcga tttgatactt 960
tccaagtctt gtgaaaatgc cattgtatgc tggaaacctg gcaaaatgga ggatgatata 1020
gataaaatta aacctagtga gtctaatgtg actattcttg ggcgatttga ttacagccag 1080
tgtgacattt ggtacatgag gttttctatg gatttctggc aaaagatgct tgcattgggc 1140
aatcaggttg gcaaactgta tgtttgggat ttagaagtag aagatcctca taaagccaaa 1200
tgcacaacac tgacccatca taaatgtggc gcggctattc gacaaaccag tttcagtagg 1260
gatagcagca tcctcatagc tgtctgcgat gatgccagca tttggcgctg ggatcgactt 1320
cgagggggta gcggcagcgg tagcgcatgc tctagaccag gcgaacgacc gtttcaatgc 1380
cggatatgta tgaggaactt ctcccagagg tccagcttgg tacggcacac ccgaacacat 1440
acaggagaaa agccattcca atgtcgaatt tgtatgcgca atttttcaga caagtctgtg 1500
ttggctcgac acctccgcac acatactggt tcacagaagc cctttcagtg caggatttgt 1560
atgcgcaact ttagccaacg ctcatccctg gtaaggcaca ctagaacgca tacaggtgag 1620
aagcctttcc agtgtcgcat ctgtatgcgg aacttcagcc agcggaataa cttgggcagg 1680
catttgcgaa ctcacaccgg ttctcaaaaa ccttttcagt gccgaatttg tatgcgcaac 1740
ttcagcaccc acgccgtatt gacacgacac acgcgcacgc acaccgggga aaaaccgttt 1800
caatgtcgaa tctgcatgcg caattttagc gatagaggga acctcactcg acatctgcgc 1860
acacacttgc ggggatccca attgtgcgta cgcggatcct ctgctggaga catgagagct 1920
gccaaccttt ggccaagccc gctcatgatc aaacgctcta agaagaacag cctggccttg 1980
tccctgacgg ccgaccagat ggtcagtgcc ttgttggatg ctgagccccc catactctat 2040
tccgagtatg atcctaccag acccttcagt gaagcttcga tgatgggctt actgaccaac 2100
ctggcagaca gggagctggt tcacatgatc aactgggcga agagggtgcc aggctttgtg 2160
gatttgaccc tccatgatca ggtccacctt ctagaatgtg cctggctaga gatcctgatg 2220
attggtctcg tctggcgctc catggagcac ccagtgaagc tactgtttgc tcctaacttg 2280
ctcttggaca ggaaccaggg aaaatgtgta gagggcatgg tggagatctt cgacatgctg 2340
ctggctacat catctcggtt ccgcatgatg aatctgcagg gagaggagtt tgtgtgcctc 2400
aaatctatta ttttgcttaa ttctggagtg tacacatttc tgtccagcac cctgaagtct 2460
ctggaagaga aggaccatat ccaccgagtc ctggacaaga tcacagacac tttgatccac 2520
ctgatggcca aggcaggcct gaccctgcag cagcagcacc agcggctggc ccagctcctc 2580
ctcatcctct cccacatcag gcacatgagt aacaaaggca tggagcatct gtacagcatg 2640
aagtgcaaga acgtggtgcc cctctatgac ctgctgctgg aggcggcgga cgcccaccgc 2700
ctacatgcgc ccactagccg tggaggggca tccgtggagg agacggacca aagccacttg 2760
gccactgcgg gctctacttc atcgcattcc ttgcaaaagt attacatcac gggggaggca 2820
gagggtttcc ctgccacagc tcccggggat gagatggaag agtgctctca gcacttaccc 2880
ggcgccggca gtagtggcga tatcatggat tacaaggatg acgacgataa gggctcttcc 2940
gggacaggct ccggatccgg cactagtgcg cccatcacgg cgtacgccca gcagacgaga 3000
ggcctcctag ggtgtataat caccagcctg actggccggg acaaaaacca agtggagggt 3060
gaggtccaga tcgtgtcaac tgctacccaa accttcctgg caacgtgcat caatggggta 3120
tgctgggcag tctaccacgg ggccggaacg aggaccatcg catcacccaa gggtcctgtc 3180
atccagatgt ataccaatgt ggaccaagac cttgtgggct ggcccgctcc tcaaggttcc 3240
cgctcattga caccctgtac ctgcggctcc tcggaccttt acctggtcac gaggcacgcc 3300
gatgtcattc ccgtgcgccg gcgaggtgat agcaggggta gcctgctttc gccccggccc 3360
atttcctact tgaaaggctc ctctgggggt ccgctgttgt gccccgcggg acacgccgtg 3420
ggcctattca gggccgcggt gtgcacccgt ggagtggcta aagcggtgga ctttatccct 3480
gtggagaacc tagagacaac catgagatcc ccggtgttca cggacaactc ctctccacca 3540
gcagtcaccc tgacgcaccc aatcaccaaa atcgatacca aatacatcat gacatgcatg 3600
tcggccgacc tggaggtcgt cacgagcacc tgggtgctcg ttggcggcgt cctggctgct 3660
ctggccgcgt attgcctgtc aacaggctgc gtggtcatag tgggcaggat cgtcttgtcc 3720
gggaagccgg caattatacc tgacagggag gttctctact aa 3762
<210> 40
<211> 903
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 40
Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro
1 5 10 15
Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala
20 25 30
Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met
35 40 45
Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val
50 55 60
Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg
65 70 75 80
Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu
85 90 95
Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn
100 105 110
Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr
115 120 125
Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe
130 135 140
Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr
145 150 155 160
Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala
165 170 175
Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala
180 185 190
Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr
195 200 205
Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg
210 215 220
Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp
225 230 235 240
Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu
245 250 255
Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala
260 265 270
Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala
275 280 285
Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile
290 295 300
Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro
305 310 315 320
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu
325 330 335
Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
340 345 350
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Ser Leu
355 360 365
Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
370 375 380
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu Leu Arg His
385 390 395 400
Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
405 410 415
Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu Arg Thr His
420 425 430
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ala Thr
465 470 475 480
Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser Pro Lys Lys
485 490 495
Lys Arg Lys Val Thr Cys Arg Gly Ser Gly Ala Thr Asn Phe Ser Leu
500 505 510
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly His His
515 520 525
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
530 535 540
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
545 550 555 560
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
565 570 575
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
580 585 590
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
595 600 605
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
610 615 620
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
625 630 635 640
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
645 650 655
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
660 665 670
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
675 680 685
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
690 695 700
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gly
705 710 715 720
Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln
725 730 735
Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser
740 745 750
Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser
755 760 765
Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys
770 775 780
Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg
785 790 795 800
Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg
805 810 815
Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr
820 825 830
Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His
835 840 845
Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu
850 855 860
Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr
865 870 875 880
Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala
885 890 895
Ser Ile Thr Glu Ala Met Asn
900
<210> 41
<211> 808
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 41
Met Phe Glu Pro Lys Lys Lys Arg Lys Val Phe Glu Thr Ser Val Pro
1 5 10 15
Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu Ala
20 25 30
Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser Met
35 40 45
Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly Val
50 55 60
Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu Arg
65 70 75 80
Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met Leu
85 90 95
Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe Asn
100 105 110
Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro Glu Thr
115 120 125
Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile Phe
130 135 140
Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys Thr
145 150 155 160
Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu Ala
165 170 175
Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly Ala
180 185 190
Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg Tyr
195 200 205
Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys Arg
210 215 220
Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp Asp
225 230 235 240
Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile Leu
245 250 255
Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu Ala
260 265 270
Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala Ala
275 280 285
Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn Ile
290 295 300
Ser Val Val Val Val Asp Leu Lys Gly Gly Ser Gly Gly Ser Arg Pro
305 310 315 320
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu
325 330 335
Glu Ala Asn Leu Arg Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
340 345 350
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Ser Leu
355 360 365
Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
370 375 380
Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Ala Asn Leu Leu Arg His
385 390 395 400
Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
405 410 415
Arg Asn Phe Ser Asp Pro Ser Ser Leu Lys Arg His Leu Arg Thr His
420 425 430
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Gln Gln Thr Asn Leu Thr Arg His Thr Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Ala Thr
465 470 475 480
Gln Leu Val Arg His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg
485 490 495
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
500 505 510
Glu Glu Asn Pro Gly Pro Gly His His Pro Lys Lys Lys Arg Lys Val
515 520 525
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
530 535 540
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
545 550 555 560
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
565 570 575
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
580 585 590
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
595 600 605
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
610 615 620
Gly Gly Gly Ser Gly Gln Leu Thr Gln Asp Glu Phe Thr Gln Leu Ser
625 630 635 640
Gln Ser Ile Ala Glu Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys
645 650 655
Ser Ser Leu Leu Ala Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp
660 665 670
Ser Val Val Arg Arg Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile
675 680 685
Lys Ser Cys Asn Val Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr
690 695 700
Arg Asp Val Asn Val Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu
705 710 715 720
Arg Leu Asp Leu Leu Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile
725 730 735
Thr Gly Gly Glu His Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val
740 745 750
His Arg Phe Glu Lys Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val
755 760 765
Leu Glu Ser Tyr Val Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp
770 775 780
Thr Arg Leu Phe Ala Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu
785 790 795 800
Ala Ser Ile Thr Glu Ala Met Asn
805
<210> 42
<211> 692
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 42
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp
35 40 45
Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser
65 70 75 80
Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His
100 105 110
Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
180 185 190
Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
195 200 205
Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala
210 215 220
Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala
225 230 235 240
Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu
245 250 255
Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
260 265 270
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
275 280 285
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val
290 295 300
Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
305 310 315 320
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
325 330 335
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
340 345 350
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln
355 360 365
Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg
370 375 380
Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys
385 390 395 400
Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu
405 410 415
Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg
420 425 430
Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp
435 440 445
Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe
450 455 460
Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp
465 470 475 480
Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro
485 490 495
Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly
500 505 510
Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr
515 520 525
Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys
530 535 540
Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser
545 550 555 560
Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu
565 570 575
Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu
580 585 590
Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu
595 600 605
Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser
610 615 620
Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala
625 630 635 640
Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser
645 650 655
Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser
660 665 670
Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe
675 680 685
Pro Ala Thr Ala
690
<210> 43
<211> 605
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 43
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
65 70 75 80
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
85 90 95
Val Leu Glu Gly Gly Gly Gly Ser Gly Thr Cys Arg Ser Arg Pro Gly
100 105 110
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg
115 120 125
Ser Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe
130 135 140
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala
145 150 155 160
Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
165 170 175
Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr
180 185 190
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
195 200 205
Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr
210 215 220
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
225 230 235 240
Thr His Ala Val Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys
245 250 255
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn
260 265 270
Leu Thr Arg His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val
275 280 285
Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser
290 295 300
Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu
305 310 315 320
Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile
325 330 335
Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met
340 345 350
Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile
355 360 365
Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp
370 375 380
Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly
385 390 395 400
Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro
405 410 415
Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val
420 425 430
Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met
435 440 445
Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu
450 455 460
Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu
465 470 475 480
Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu
485 490 495
Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln
500 505 510
Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser
515 520 525
Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val
530 535 540
Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His
545 550 555 560
Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser
565 570 575
His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr
580 585 590
Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
595 600 605
<210> 44
<211> 704
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 44
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp
35 40 45
His Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn
65 70 75 80
Leu Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His
100 105 110
Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
180 185 190
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys
195 200 205
Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly
210 215 220
Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly
225 230 235 240
Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly
245 250 255
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
260 265 270
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
275 280 285
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
290 295 300
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
305 310 315 320
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
325 330 335
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
340 345 350
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
355 360 365
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
370 375 380
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu
385 390 395 400
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
405 410 415
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
420 425 430
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
435 440 445
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
450 455 460
Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val
465 470 475 480
Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro
485 490 495
Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Asp
500 505 510
Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser
515 520 525
Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro
530 535 540
Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro
545 550 555 560
Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala
565 570 575
Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu
580 585 590
Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser
595 600 605
Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu
610 615 620
Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr
625 630 635 640
Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr
645 650 655
Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro
660 665 670
Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile
675 680 685
Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu
690 695 700
<210> 45
<211> 609
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 45
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
65 70 75 80
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
85 90 95
Val Thr Cys Arg Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
100 105 110
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys
115 120 125
Arg Lys Val Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly
130 135 140
Gly Ser Gly Gly Thr Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly
145 150 155 160
Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly
165 170 175
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
180 185 190
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
195 200 205
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
210 215 220
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
225 230 235 240
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
245 250 255
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
260 265 270
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
275 280 285
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
290 295 300
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu
305 310 315 320
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
325 330 335
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
340 345 350
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
355 360 365
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
370 375 380
Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val
385 390 395 400
Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Tyr Pro
405 410 415
Tyr Asp Val Pro Asp Tyr Ala Gly Gly Gly Gly Ser Gly Gly Thr Ser
420 425 430
Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
435 440 445
Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly Glu
450 455 460
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser
465 470 475 480
Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe
485 490 495
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu Thr
500 505 510
Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile
515 520 525
Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu Lys
530 535 540
Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
545 550 555 560
Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His Thr
565 570 575
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Glu
580 585 590
Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser Gln
595 600 605
Leu
<210> 46
<211> 998
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 46
Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg
1 5 10 15
Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr
20 25 30
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp
35 40 45
Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln Lys
50 55 60
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser
65 70 75 80
Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
85 90 95
Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His
100 105 110
Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys
115 120 125
Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg Thr
130 135 140
His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
145 150 155 160
Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly
165 170 175
Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln
180 185 190
Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro
195 200 205
Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala
210 215 220
Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala
225 230 235 240
Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu
245 250 255
Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala
260 265 270
Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
275 280 285
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val
290 295 300
Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
305 310 315 320
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
325 330 335
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
340 345 350
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln
355 360 365
Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg
370 375 380
Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys
385 390 395 400
Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu
405 410 415
Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg
420 425 430
Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp
435 440 445
Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe
450 455 460
Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp
465 470 475 480
Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro
485 490 495
Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly
500 505 510
Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr
515 520 525
Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys
530 535 540
Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser
545 550 555 560
Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu
565 570 575
Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu
580 585 590
Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu
595 600 605
Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser
610 615 620
Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala
625 630 635 640
Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser
645 650 655
Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser
660 665 670
Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe
675 680 685
Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu
690 695 700
Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp
705 710 715 720
Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro
725 730 735
Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile
740 745 750
Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln
755 760 765
Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly
770 775 780
Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser
785 790 795 800
Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu
805 810 815
Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr
820 825 830
Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile
835 840 845
Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg
850 855 860
Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro
865 870 875 880
Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly
885 890 895
Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr
900 905 910
Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr
915 920 925
Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys
930 935 940
Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly
945 950 955 960
Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val
965 970 975
Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro
980 985 990
Asp Arg Glu Val Leu Tyr
995
<210> 47
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 47
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser
1 5 10 15
Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg
20 25 30
Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn
35 40 45
Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe
50 55 60
Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala
65 70 75 80
Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr
85 90 95
Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser
100 105 110
Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val
115 120 125
Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg
130 135 140
Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser
145 150 155 160
Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg
165 170 175
Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro
180 185 190
Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn
195 200 205
Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp
210 215 220
Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr
225 230 235 240
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
245 250 255
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
260 265 270
Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu
275 280 285
Val Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
290 295 300
Pro Gly Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met
305 310 315 320
Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His
325 330 335
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
340 345 350
Asp Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln
355 360 365
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser
370 375 380
Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln
385 390 395 400
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg
405 410 415
His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
420 425 430
Cys Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg
435 440 445
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
450 455 460
Phe Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg
465 470 475 480
Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly
485 490 495
Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu
500 505 510
Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu
515 520 525
Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln
530 535 540
Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr
545 550 555 560
Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly
565 570 575
Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
580 585 590
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
595 600 605
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala
610 615 620
Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro
625 630 635 640
Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp
645 650 655
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
660 665 670
Gln Ile Ser Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met
675 680 685
Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys
690 695 700
Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala
705 710 715 720
Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr
725 730 735
Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala
740 745 750
Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly
755 760 765
Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala
770 775 780
Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His
785 790 795 800
Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln
805 810 815
Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala
820 825 830
Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val
835 840 845
Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu
850 855 860
Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val
865 870 875 880
Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly
885 890 895
Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile
900 905 910
Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr
915 920 925
Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu
930 935 940
Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala
945 950 955 960
Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr
965 970 975
Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly
980 985 990
Phe Pro Ala Thr Ala
995
<210> 48
<211> 728
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 48
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Gly Gly Leu Glu Gly Gly Gly Gly Ser Gly
35 40 45
Gly Thr Ala Ser Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile
50 55 60
Cys Met Arg Asn Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg
65 70 75 80
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
85 90 95
Phe Ser Asp His Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly
100 105 110
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val
115 120 125
Arg His Asn Leu Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu
145 150 155 160
Ser Arg His Leu Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
165 170 175
Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His
180 185 190
Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
195 200 205
Arg Asn Phe Ser Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His
210 215 220
Leu Arg Gly Ser Thr Cys Arg Asp Glu Phe Pro Thr Met Val Phe Pro
225 230 235 240
Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln
245 250 255
Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser
260 265 270
Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro
275 280 285
Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu
290 295 300
Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp
305 310 315 320
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp
325 330 335
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
340 345 350
Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro
355 360 365
Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro
370 375 380
Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser
385 390 395 400
Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu
405 410 415
Leu Ser Gln Ile Ser Ser Pro Gly Asp Glu Met Glu Glu Cys Ser Gln
420 425 430
His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp
435 440 445
Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser
450 455 460
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
465 470 475 480
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
485 490 495
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
500 505 510
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
515 520 525
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
530 535 540
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
545 550 555 560
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
565 570 575
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
580 585 590
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
595 600 605
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
610 615 620
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
625 630 635 640
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala
645 650 655
Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met
660 665 670
Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu
675 680 685
Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly
690 695 700
Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile
705 710 715 720
Ile Pro Asp Arg Glu Val Leu Tyr
725
<210> 49
<211> 878
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 49
Met Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr
1 5 10 15
Arg Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg
20 25 30
Glu Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe
35 40 45
Leu Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp
50 55 60
Pro Trp Gly Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu
65 70 75 80
Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser
85 90 95
Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln
100 105 110
Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala Arg
115 120 125
His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
130 135 140
Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg
145 150 155 160
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
165 170 175
Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr Gly
180 185 190
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr
195 200 205
His Ala Val Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
210 215 220
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn Leu
225 230 235 240
Thr Arg His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg
245 250 255
Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro
260 265 270
Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr
275 280 285
Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu
290 295 300
Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met
305 310 315 320
Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn
325 330 335
Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln
340 345 350
Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu
355 360 365
Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn
370 375 380
Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu
385 390 395 400
Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn
405 410 415
Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn
420 425 430
Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu
435 440 445
Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile
450 455 460
His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg
465 470 475 480
Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn
485 490 495
Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro
500 505 510
Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala
515 520 525
Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His
530 535 540
Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr
545 550 555 560
Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu
565 570 575
Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp
580 585 590
Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly
595 600 605
Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr
610 615 620
Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys
625 630 635 640
Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr
645 650 655
Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly
660 665 670
Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met
675 680 685
Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly
690 695 700
Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu
705 710 715 720
Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser
725 730 735
Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser
740 745 750
Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe
755 760 765
Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile
770 775 780
Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp
785 790 795 800
Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile
805 810 815
Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val
820 825 830
Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala
835 840 845
Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu
850 855 860
Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
865 870 875
<210> 50
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 50
Met Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp
1 5 10 15
Glu Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys
20 25 30
Gly Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His
35 40 45
Asn Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser
50 55 60
Glu Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys
65 70 75 80
Pro Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn
85 90 95
Ser Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp
100 105 110
Ile Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly
115 120 125
Ala Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp
130 135 140
Thr Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys
145 150 155 160
Pro Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala
165 170 175
Tyr Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser Gly
180 185 190
Gly Ser Gly Ser Gly Ser Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe
195 200 205
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser Ser Leu Val
210 215 220
Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile
225 230 235 240
Cys Met Arg Asn Phe Ser Asp Lys Ser Val Leu Ala Arg His Leu Arg
245 250 255
Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
260 265 270
Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His Thr
275 280 285
Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln
290 295 300
Arg Asn Asn Leu Gly Arg His Leu Arg Thr His Thr Gly Ser Gln Lys
305 310 315 320
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Thr His Ala Val
325 330 335
Leu Thr Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys
340 345 350
Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Gly Asn Leu Thr Arg His
355 360 365
Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys Val Arg Gly Ser Ser
370 375 380
Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile
385 390 395 400
Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln
405 410 415
Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu
420 425 430
Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu
435 440 445
Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys
450 455 460
Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu
465 470 475 480
Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg
485 490 495
Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu
500 505 510
Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe Asp
515 520 525
Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly
530 535 540
Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val
545 550 555 560
Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His
565 570 575
Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met
580 585 590
Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln
595 600 605
Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met
610 615 620
Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp
625 630 635 640
Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser
645 650 655
Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr
660 665 670
Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly
675 680 685
Glu Ala Glu Gly Phe Pro Ala Thr Ala Pro Gly Asp Glu Met Glu Glu
690 695 700
Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser Gly Asp Ile Met Asp
705 710 715 720
Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser
725 730 735
Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu
740 745 750
Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val
755 760 765
Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala
770 775 780
Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr
785 790 795 800
Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn
805 810 815
Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser
820 825 830
Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
835 840 845
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser
850 855 860
Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly
865 870 875 880
Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala
885 890 895
Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu
900 905 910
Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser
915 920 925
Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr Lys
930 935 940
Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr
945 950 955 960
Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu
965 970 975
Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys
980 985 990
Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
995 1000
<210> 51
<211> 1253
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 51
Met Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro
1 5 10 15
Ala Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp
20 25 30
Leu Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr
35 40 45
Asn Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly
50 55 60
Arg Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr
65 70 75 80
Ser Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu
85 90 95
Phe Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val
100 105 110
Phe Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser
115 120 125
Gln Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp
130 135 140
Glu Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His
145 150 155 160
Pro Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn
165 170 175
Pro Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala
180 185 190
Ile Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser
195 200 205
Val Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr
210 215 220
Leu Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu
225 230 235 240
Ser Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met
245 250 255
Asp His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn
260 265 270
Ala Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro
275 280 285
Phe Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile
290 295 300
His Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu
305 310 315 320
Ser Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met
325 330 335
Glu Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile
340 345 350
Leu Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe
355 360 365
Ser Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly
370 375 380
Lys Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys
385 390 395 400
Cys Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr
405 410 415
Ser Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala
420 425 430
Ser Ile Trp Arg Trp Asp Arg Leu Arg Gly Gly Ser Gly Ser Gly Ser
435 440 445
Ala Cys Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met
450 455 460
Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Thr Arg Thr His
465 470 475 480
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
485 490 495
Asp Lys Ser Val Leu Ala Arg His Leu Arg Thr His Thr Gly Ser Gln
500 505 510
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Ser
515 520 525
Ser Leu Val Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln
530 535 540
Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg
545 550 555 560
His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
565 570 575
Cys Met Arg Asn Phe Ser Thr His Ala Val Leu Thr Arg His Thr Arg
580 585 590
Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
595 600 605
Phe Ser Asp Arg Gly Asn Leu Thr Arg His Leu Arg Thr His Leu Arg
610 615 620
Gly Ser Gln Leu Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala
625 630 635 640
Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn
645 650 655
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
660 665 670
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
675 680 685
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
690 695 700
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
705 710 715 720
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
725 730 735
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val
740 745 750
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
755 760 765
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
770 775 780
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
785 790 795 800
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
805 810 815
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
820 825 830
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
835 840 845
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
850 855 860
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
865 870 875 880
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala
885 890 895
Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val
900 905 910
Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser
915 920 925
His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro
930 935 940
Ala Thr Ala Pro Gly Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro
945 950 955 960
Gly Ala Gly Ser Ser Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp
965 970 975
Lys Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile
980 985 990
Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr
995 1000 1005
Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln
1010 1015 1020
Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn
1025 1030 1035
Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
1040 1045 1050
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp
1055 1060 1065
Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
1070 1075 1080
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
1085 1090 1095
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly
1100 1105 1110
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser
1115 1120 1125
Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe
1130 1135 1140
Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe
1145 1150 1155
Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe
1160 1165 1170
Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile
1175 1180 1185
Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp
1190 1195 1200
Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu
1205 1210 1215
Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile
1220 1225 1230
Val Gly Arg Ile Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp
1235 1240 1245
Arg Glu Val Leu Tyr
1250
<210> 52
<211> 9439
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 52
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860
gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920
tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980
ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040
cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100
taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160
cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220
cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280
tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340
gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400
cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460
gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520
gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580
gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640
caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700
ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760
cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820
atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420
ttgggccgcc tccccgcat 9439
<210> 53
<211> 9439
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 53
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860
gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920
tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980
ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040
cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100
taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160
cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220
cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280
tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340
gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400
cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460
gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520
gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580
gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640
caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700
ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760
cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820
atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420
ttgggccgcc tccccgcat 9439
<210> 54
<211> 9439
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 54
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860
gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920
tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980
ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040
cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg gtgagcaagg gcgaggagga 8100
taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa 8160
cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac 8220
cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc 8280
tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt 8340
gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg 8400
cgtggtgacc gtgacccagg actcctccct gcaggacggc gagttcatct acaaggtgaa 8460
gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg 8520
gcaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca 8580
gaggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc 8640
caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc 8700
ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac 8760
cggcggcatg gacgagctgt acaagtaaag cggccgcgac tctagagtcg acctgcaggc 8820
atgcaagctt gatatcaagc ttatcgataa tcaacctctg gattacaaaa tttgtgaaag 8880
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 8940
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 9000
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 9060
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 9120
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 9180
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 9240
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 9300
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 9360
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 9420
ttgggccgcc tccccgcat 9439
<210> 55
<211> 10091
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 55
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860
gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920
tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220
cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280
taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340
gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400
tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460
tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520
cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580
cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640
aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700
tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760
ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820
ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880
agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940
aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000
tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060
ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120
acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180
tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240
ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300
tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360
tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420
ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480
ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660
tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720
ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780
ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840
gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900
cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960
gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020
tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080
cctccccgca t 10091
<210> 56
<211> 10091
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 56
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860
gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920
tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220
cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280
taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340
gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400
tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460
tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520
cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580
cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640
aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700
tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760
ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820
ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880
agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940
aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000
tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060
ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120
acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180
tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240
ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300
tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360
tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420
ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480
ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660
tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720
ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780
ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840
gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900
cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960
gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020
tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080
cctccccgca t 10091
<210> 57
<211> 10091
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 57
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860
gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920
tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tgttgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc 8040
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc 8100
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt 8160
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca 8220
cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg 8280
taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca 8340
gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc agtacatcaa 8400
tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca ttgacgtcaa 8460
tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta acaactccgc 8520
cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa gcagagctca 8580
cgcgtaccgg tgtcgccacc atggtgagca agggcgagga ggataacatg gccatcatca 8640
aggagttcat gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga 8700
tcgagggcga gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga 8760
ccaagggtgg ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct 8820
ccaaggccta cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg 8880
agggcttcaa gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc 8940
aggactcctc cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact 9000
tcccctccga cggccccgta atgcagaaga agaccatggg ctggcaggcc tcctccgagc 9060
ggatgtaccc cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg 9120
acggcggcca ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc 9180
tgcccggcgc ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca 9240
ccatcgtgga acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc 9300
tgtacaagaa gcttagccat ggcttcccgc cggaggtgga ggagcaggat gatggcacgc 9360
tgcccatgtc ttgtgcccag gagagcggga tggaccgtca ccctgcagcc tgtgcttctg 9420
ctaggatcaa tgtgtagtaa agcggccgcg actctagagt cgacctgcag gcatgcaagc 9480
ttgatatcaa gcttatcgat aatcaacctc tggattacaa aatttgtgaa agattgactg 9540
gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 9600
atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 9660
tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 9720
ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 9780
ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 9840
gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 9900
cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 9960
gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 10020
tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 10080
cctccccgca t 10091
<210> 58
<211> 9868
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 58
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcgtcgaag tcgaagtcga cctcccgtct cagtaaaggt cgtcgaagtc 7860
gaagtcgacc aatcggactg ccttcgtacg tcgaagtcga agtcgaccgt atcagtcgcc 7920
tcggaacgtc gaagtcgaag tcgaccattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040
aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100
gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160
aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220
acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280
tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340
ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400
cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460
cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520
cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580
ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640
cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700
cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760
cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820
ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880
caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940
catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000
gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060
ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120
catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180
ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240
cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300
ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360
tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420
gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480
cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540
tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600
cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660
gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720
gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780
cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840
gatctccctt tgggccgcct ccccgcat 9868
<210> 59
<211> 9868
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 59
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860
gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920
tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040
aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100
gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160
aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220
acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280
tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340
ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400
cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460
cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520
cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580
ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640
cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700
cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760
cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820
ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880
caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940
catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000
gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060
ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120
catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180
ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240
cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300
ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360
tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420
gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480
cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540
tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600
cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660
gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720
gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780
cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840
gatctccctt tgggccgcct ccccgcat 9868
<210> 60
<211> 9868
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 60
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttcggcgtag ccgatgtcgc gctcccgtct cagtaaaggt cggcgtagcc 7860
gatgtcgcgc aatcggactg ccttcgtacg gcgtagccga tgtcgcgcgt atcagtcgcc 7920
tcggaacggc gtagccgatg tcgcgcattc gtaagaggct cactctccct tacacggagt 7980
ggataactag tccgataaaa taaaagattt tatttagtct ccagaaaaag gggggaatga 8040
aagaccccac ctgtaggtta tggcaagcta gctgcagtaa cgccattatt gcaaggcatg 8100
gaaaaatacc aaaccaagaa tagagaagtt cagatcaagg gcgggtacat gaaaatagct 8160
aacgtagggc caaacaggat atctgcggtg agcagtttcg gccccggccc ggggccaaga 8220
acagatggtc accgcagttt cggccccggc ccgaggccaa gagcagatgg tccccagata 8280
tggcccaacc ctcagcagtt tcttaagacc catcagatgt ttccaggctc ccccaaggac 8340
ctgaaatgac cctgcgcctt atttgaatta accaatcagc ctgcttctcg cttctgttcg 8400
cgcgcttctg cttcccgagc tctataaaag agctcacaac ccctcactcg gcgcgccagt 8460
cctccgacag actgagtcgc ccgggacgcg taccggtgtc gccaccatgg tgagcaaggg 8520
cgaggaggat aacatggcca tcatcaagga gttcatgcgc ttcaaggtgc acatggaggg 8580
ctccgtgaac ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg 8640
cacccagacc gccaagctga aggtgaccaa gggtggcccc ctgcccttcg cctgggacat 8700
cctgtcccct cagttcatgt acggctccaa ggcctacgtg aagcaccccg ccgacatccc 8760
cgactacttg aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga 8820
ggacggcggc gtggtgaccg tgacccagga ctcctccctg caggacggcg agttcatcta 8880
caaggtgaag ctgcgcggca ccaacttccc ctccgacggc cccgtaatgc agaagaagac 8940
catgggctgg caggcctcct ccgagcggat gtaccccgag gacggcgccc tgaagggcga 9000
gatcaagcag aggctgaagc tgaaggacgg cggccactac gacgctgagg tcaagaccac 9060
ctacaaggcc aagaagcccg tgcagctgcc cggcgcctac aacgtcaaca tcaagttgga 9120
catcacctcc cacaacgagg actacaccat cgtggaacag tacgaacgcg ccgagggccg 9180
ccactccacc ggcggcatgg acgagctgta caagtaaagc ggccgcgact ctagagtcga 9240
cctgcaggca tgcaagcttg atatcaagct tatcgataat caacctctgg attacaaaat 9300
ttgtgaaaga ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc 9360
tgctttaatg cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt 9420
gtataaatcc tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg 9480
cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg 9540
tcagctcctt tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc 9600
cgcctgcctt gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt 9660
gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc tgtgttgcca cctggattct 9720
gcgcgggacg tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg 9780
cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg 9840
gatctccctt tgggccgcct ccccgcat 9868
<210> 61
<211> 11090
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 61
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcgtcgacc gggtttcgta acaatcgcat 7800
gaggattcgc aacgccttcg gcgtagccga tgtcgcgctc ccgtctcagt aaaggtcggc 7860
gtagccgatg tcgcgcaatc ggactgcctt cgtacggcgt agccgatgtc gcgcgtatca 7920
gtcgcctcgg aacggcgtag ccgatgtcgc gcattcgtaa gaggctcact ctcccttaca 7980
cggagtggat aactagtttc gcatattaag gtgacgcgtg tggcctcgaa caccgagcga 8040
ccctgcagcg acccgcttaa ggatccaccg gtcgccacca cacatacaca gaaatggcct 8100
taccagtgac cgccttgctc ctgccgctgg ccttgctgct ccacgccgcc aggccggaca 8160
tccagatgac acagactaca tcctccctgt ctgcctctct gggagacaga gtcaccatca 8220
gttgcagggc aagtcaggac attagtaaat atttaaattg gtatcagcag aaaccagatg 8280
gaactgttaa actcctgatc taccatacat caagattaca ctcaggagtc ccatcaaggt 8340
tcagtggcag tgggtctgga acagattatt ctctcaccat tagcaacctg gagcaagaag 8400
atattgccac ttacttttgc caacagggta atacgcttcc gtacacgttc ggaggcggca 8460
ccaagctgga gatcacaggt ggcggtggct cgggcggtgg tgggtcgggt ggcggcggat 8520
ctgaggtgaa actgcaggag tcaggacctg gcctggtggc gccctcacag agcctgtccg 8580
tcacatgcac tgtctcaggg gtctcattac ccgactatgg tgtaagctgg attcgccagc 8640
ctccacgaaa gggtctggag tggctgggag taatatgggg tagtgaaacc acatactata 8700
attcagctct caaatccaga ctgaccatca tcaaggacaa ctccaagagc caagttttct 8760
taaaaatgaa cagtctgcaa actgatgaca cagccattta ctactgtgcc aaacattatt 8820
actacggtgg tagctatgct atggactact ggggccaagg aacctcagtc accgtctcct 8880
cagaacaaaa actcatctca gaagaagatc tgaatggggc cgcaaccacg acgccagcgc 8940
cgcgaccacc aacaccggcg cccaccatcg cgttgcagcc cctgtccctg cgcccagagg 9000
cgtgccggcc agcggcgggg ggcgcagtgc acacgagggg gctggacttc gcctgtgatt 9060
tttgggtgct ggtggtggtt ggtggagtcc tggcttgcta tagcttgcta gtaacagtgg 9120
cctttattat tttctgggtg aggagtaaga ggagcaggct cctgcacagt gactacatga 9180
acatgactcc ccgccgcccc gggcccaccc gcaagcatta ccagccctat gccccaccac 9240
gcgacttcgc agcctatcgc tccaaacggg gcagaaagaa actcctgtat atattcaaac 9300
aaccatttat gagaccagta caaactactc aagaggaaga tggctgtagc tgccgatttc 9360
cagaagaaga agaaggagga tgtgaactga gagtgaagtt cagcaggagc gcagacgccc 9420
ccgcgtacaa gcagggccag aaccagctct ataacgagct caatctagga cgaagagagg 9480
agtacgatgt tttggacaag agacgtggcc gggaccctga gatgggggga aagccgagaa 9540
ggaagaaccc tcaggaaggc ctgtacaatg aactgcagaa agataagatg gcggaggcct 9600
acagtgagat tgggatgaaa ggcgagcgcc ggaggggcaa ggggcacgat ggcctttacc 9660
agggtctcag tacagccacc aaggacacct acgacgccct tcacatgcag gccctgcccc 9720
ctcgcggcat ggtgagcaag ggcgaggagg ataacatggc catcatcaag gagttcatgc 9780
gcttcaaggt gcacatggag ggctccgtga acggccacga gttcgagatc gagggcgagg 9840
gcgagggccg cccctacgag ggcacccaga ccgccaagct gaaggtgacc aagggtggcc 9900
ccctgccctt cgcctgggac atcctgtccc ctcagttcat gtacggctcc aaggcctacg 9960
tgaagcaccc cgccgacatc cccgactact tgaagctgtc cttccccgag ggcttcaagt 10020
gggagcgcgt gatgaacttc gaggacggcg gcgtggtgac cgtgacccag gactcctccc 10080
tgcaggacgg cgagttcatc tacaaggtga agctgcgcgg caccaacttc ccctccgacg 10140
gccccgtaat gcagaagaag accatgggct gggaggcctc ctccgagcgg atgtaccccg 10200
aggacggcgc cctgaagggc gagatcaagc agaggctgaa gctgaaggac ggcggccact 10260
acgacgctga ggtcaagacc acctacaagg ccaagaagcc cgtgcagctg cccggcgcct 10320
acaacgtcaa catcaagttg gacatcacct cccacaacga ggactacacc atcgtggaac 10380
agtacgaacg cgccgagggc cgccactcca ccggcggcat ggacgagctg tacaagtaaa 10440
gcggccgcga ctctagagtc gacctgcagg catgcaagct tgatatcaag cttatcgata 10500
atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc 10560
cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta 10620
tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt 10680
ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg 10740
gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta 10800
ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt 10860
tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg 10920
cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca 10980
atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc 11040
gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcat 11090
<210> 62
<211> 10333
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 62
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttccgggttt cgtaacaatc gcatgaggat 7800
tcgcaacgcc ttagacgtcg aagtagccgt agtcccgtct cagtaaaggt agacgtcgaa 7860
gtagccgtag aatcggactg ccttcgtaag acgtcgaagt agccgtaggt atcagtcgcc 7920
tcggaaagac gtcgaagtag ccgtagattc gtaagaggct cactctccct tacacggagt 7980
ggataactag ttaggcgtgt acggtgggag gcctatataa gcagagctcg tttagtgaac 8040
cgtcagatcg cctggaacgc gtaccggtgt cgccaccatg ggtctcacct cccaactgct 8100
tccccctctg ttcttcctgc tagcatgtgc cggcaacttt gtccacggac acaagtgcga 8160
tatcacctta caggagatca tcaaaacttt gaacagcctc acagagcaga agactctgtg 8220
caccgagttg accgtaacag acatctttgc tgcctccaag aacacaactg agaaggaaac 8280
cttctgcagg gctgcgactg tgctccggca gttctacagc caccatgaga aggacactcg 8340
ctgcctgggt gcgactgcac agcagttcca caggcacaag cagctgatcc gattcctgaa 8400
acggctcgac aggaacctct ggggcctggc gggcttgaat tcctgtcctg tgaaggaagc 8460
caaccagagt acgttggaaa acttcttgga aaggctaaag acgatcatga gagagaaata 8520
ttcaaagtgt tcgagcctcg agggcggcgg agagggcaga ggaagtcttc taacatgcgg 8580
tgacgtggag gagaatcccg gccctaggat gcttctcctg gtgacaagcc ttctgctctg 8640
tgagttacca cacccagcat tcctcctgat cccacgcaaa gtgtgtaacg gaataggtat 8700
tggtgaattt aaagactcac tctccataaa tgctacgaat attaaacact tcaaaaactg 8760
cacctccatc agtggcgatc tccacatcct gccggtggca tttaggggtg actccttcac 8820
acatactcct cctctggatc cacaggaact ggatattctg aaaaccgtaa aggaaatcac 8880
agggtttttg ctgattcagg cttggcctga aaacaggacg gacctccatg cctttgagaa 8940
cctagaaatc atacgcggca ggaccaagca acatggtcag ttttctcttg cagtcgtcag 9000
cctgaacata acatccttgg gattacgctc cctcaaggag ataagtgatg gagatgtgat 9060
aatttcagga aacaaaaatt tgtgctatgc aaatacaata aactggaaaa aactgtttgg 9120
gacctccggt cagaaaacca aaattataag caacagaggt gaaaacagct gcaaggccac 9180
aggccaggtc tgccatgcct tgtgctcccc cgagggctgc tggggcccgg agcccaggga 9240
ctgcgtctct tgccggaatg tcagccgagg cagggaatgc gtggacaagt gcaaccttct 9300
ggagggtgag ccaagggagt ttgtggagaa ctctgagtgc atacagtgcc acccagagtg 9360
cctgcctcag gccatgaaca tcacctgcac aggacgggga ccagacaact gtatccagtg 9420
tgcccactac attgacggcc cccactgcgt caagacctgc ccggcaggag tcatgggaga 9480
aaacaacacc ctggtctgga agtacgcaga cgccggccat gtgtgccacc tgtgccatcc 9540
aaactgcacc tacggatgca ctgggccagg tcttgaaggc tgtccaacga atgggcctaa 9600
gatcccgtcc atcgccactg ggatggtggg ggccctcctc ttgctgctgg tggtggccct 9660
ggggatcggc ctcttcatgt gaagcggccg cgactctaga gtcgacctgc aggcatgcaa 9720
gcttgatatc aagcttatcg ataatcaacc tctggattac aaaatttgtg aaagattgac 9780
tggtattctt aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt 9840
gtatcatgct attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt 9900
gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt 9960
gtttgctgac gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg 10020
gactttcgct ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg 10080
ctgctggaca ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc 10140
atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt 10200
ctgctacgtc ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc 10260
tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc 10320
cgcctccccg cat 10333
<210> 63
<211> 9281
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 63
cgataccgtc gacctcgagg gaattaattc gagctcggta cctttaagac caatgactta 60
caaggcagct gtagatctta gccacttttt aaaagaaaag gggggactgg aagggctaat 120
tcactcccaa cgaagacaag atctgctttt tgcttgtact gggtctctct ggttagacca 180
gatctgagcc tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag 240
cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg tgtgactctg gtaactagag 300
atccctcaga cccttttagt cagtgtggaa aatctctagc agcatctaga attaattccg 360
tgtattctat agtgtcacct aaatcgtatg tgtatgatac ataaggttat gtattaattg 420
tagccgcgtt ctaacgacaa tatgtacaag cctaattgtg tagcatctgg cttactgaag 480
cagaccctat catctctctc gtaaactgcc gtcagagtcg gtttggttgg acgaaccttc 540
tgagtttctg gtaacgccgt cccgcacccg gaaatggtca gcgaaccaat cagcagggtc 600
atcgctagcc agatcctcta cgccggacgc atcgtggccg gcatcaccgg cgccacaggt 660
gcggttgctg gcgcctatat cgccgacatc accgatgggg aagatcgggc tcgccacttc 720
gggctcatga gcgcttgttt cggcgtgggt atggtggcag gccccgtggc cgggggactg 780
ttgggcgcca tctccttgca tgcaccattc cttgcggcgg cggtgctcaa cggcctcaac 840
ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg aatggtgcac 900
tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc cgccaacacc 960
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 1020
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgagacg 1080
aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa tggtttctta 1140
gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta 1200
aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata 1260
ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc 1320
ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga 1380
agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct 1440
tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg 1500
tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta 1560
ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat 1620
gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt 1680
acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga 1740
tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga 1800
gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga 1860
actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc 1920
aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc 1980
cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg 2040
tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat 2100
cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata 2160
tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct 2220
ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga 2280
ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg 2340
cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc 2400
aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtctttct 2460
agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc 2520
tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt 2580
ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg 2640
cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct 2700
atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag 2760
ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag 2820
tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg 2880
gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg 2940
gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac 3000
cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt 3060
gagcgaggaa gcggaagagc gcccaatacg caaaccgcct ctccccgcgc gttggccgat 3120
tcattaatgc agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca 3180
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc 3240
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata 3300
gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc ccattctccg 3360
ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc ggcctctgag 3420
ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa aaagcttgga 3480
cacaagacag gcttgcgaga tatgtttgag aataccactt tatcccgcgt cagggagagg 3540
cagtgcgtaa aaagacgcgg actcatgtga aatactggtt tttagtgcgc cagatctcta 3600
taatctcgcg caacctattt tcccctcgaa cactttttaa gccgtagata aacaggctgg 3660
gacacttcac atgagcgaaa aatacatcgt cacctgggac atgttgcaga tccatgcacg 3720
taaactcgca agccgactga tgccttctga acaatggaaa ggcattattg ccgtaagccg 3780
tggcggtctg taccgggtgc gttactggcg cgtgaactgg gtattcgtca tgtcgatacc 3840
gtttgtattt ccagctacga tcacgacaac cagcgcgagc ttaaagtgct gaaacgcgca 3900
gaaggcgatg gcgaaggctt catcgttatt gatgacctgg tggataccgg tggtactgcg 3960
gttgcgattc gtgaaatgta tccaaaagcg cactttgtca ccatcttcgc aaaaccggct 4020
ggtcgtccgc tggttgatga ctatgttgtt gatatcccgc aagatacctg gattgaacag 4080
ccgtgggata tgggcgtcgt attcgtcccg ccaatctccg gtcgctaatc ttttcaacgc 4140
ctggcactgc cgggcgttgt tctttttaac ttcaggcggg ttacaatagt ttccagtaag 4200
tattctggag gctgcatcca tgacacaggc aaacctgagc gaaaccctgt tcaaaccccg 4260
ctttaaacat cctgaaacct cgacgctagt ccgccgcttt aatcacggcg cacaaccgcc 4320
tgtgcagtcg gcccttgatg gtaaaaccat ccctcactgg tatcgcatga ttaaccgtct 4380
gatgtggatc tggcgcggca ttgacccacg cgaaatcctc gacgtccagg cacgtattgt 4440
gatgagcgat gccgaacgta ccgacgatga tttatacgat acggtgattg gctaccgtgg 4500
cggcaactgg atttatgagt gggccccgga tctttgtgaa ggaaccttac ttctgtggtg 4560
tgacataatt ggacaaacta cctacagaga tttaaagctc taaggtaaat ataaaatttt 4620
taagtgtata atgtgttaaa ctactgattc taattgtttg tgtattttag attccaacct 4680
atggaactga tgaatgggag cagtggtgga atgcctttaa tgaggaaaac ctgttttgct 4740
cagaagaaat gccatctagt gatgatgagg ctactgctga ctctcaacat tctactcctc 4800
caaaaaagaa gagaaaggta gaagacccca aggactttcc ttcagaattg ctaagttttt 4860
tgagtcatgc tgtgtttagt aatagaactc ttgcttgctt tgctatttac accacaaagg 4920
aaaaagctgc actgctatac aagaaaatta tggaaaaata ttctgtaacc tttataagta 4980
ggcataacag ttataatcat aacatactgt tttttcttac tccacacagg catagagtgt 5040
ctgctattaa taactatgct caaaaattgt gtacctttag ctttttaatt tgtaaagggg 5100
ttaataagga atatttgatg tatagtgcct tgactagaga tcataatcag ccataccaca 5160
tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 5220
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 5280
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 5340
ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac tcaagctaac 5400
caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta cctagtggtt 5460
tcatttactc taaacctgtg attcctctga attattttca ttttaaagaa attgtatttg 5520
ttaaatatgt actacaaact tagtagttgg aagggctaat tcactcccaa agaagacaag 5580
atatccttga tctgtggatc taccacacac aaggctactt ccctgattag cagaactaca 5640
caccagggcc aggggtcaga tatccactga cctttggatg gtgctacaag ctagtaccag 5700
ttgagccaga taaggtagaa gaggccaata aaggagagaa caccagcttg ttacaccctg 5760
tgagcctgca tgggatggat gacccggaga gagaagtgtt agagtggagg tttgacagcc 5820
gcctagcatt tcatcacgtg gcccgagagc tgcatccgga gtacttcaag aactgctgat 5880
atcgagcttg ctacaaggga ctttccgctg gggactttcc agggaggcgt ggcctgggcg 5940
ggactgggga gtggcgagcc ctcagatcct gcatataagc agctgctttt tgcctgtact 6000
gggtctctct ggttagacca gatctgagcc tgggagctct ctggctaact agggaaccca 6060
ctgcttaagc ctcaataaag cttgccttga gtgcttcaag tagtgtgtgc ccgtctgttg 6120
tgtgactctg gtaactagag atccctcaga cccttttagt cagtgtggaa aatctctagc 6180
agtggcgccc gaacagggac ttgaaagcga aagggaaacc agaggagctc tctcgacgca 6240
ggactcggct tgctgaagcg cgcacggcaa gaggcgaggg gcggcgactg gtgagtacgc 6300
caaaaatttt gactagcgga ggctagaagg agagagatgg gtgcgagagc gtcagtatta 6360
agcgggggag aattagatcg cgatgggaaa aaattcggtt aaggccaggg ggaaagaaaa 6420
aatataaatt aaaacatata gtatgggcaa gcagggagct agaacgattc gcagttaatc 6480
ctggcctgtt agaaacatca gaaggctgta gacaaatact gggacagcta caaccatccc 6540
ttcagacagg atcagaagaa cttagatcat tatataatac agtagcaacc ctctattgtg 6600
tgcatcaaag gatagagata aaagacacca aggaagcttt agacaagata gaggaagagc 6660
aaaacaaaag taagaccacc gcacagcaag cggccggccg ctgatcttca gacctggagg 6720
aggagatatg agggacaatt ggagaagtga attatataaa tataaagtag taaaaattga 6780
accattagga gtagcaccca ccaaggcaaa gagaagagtg gtgcagagag aaaaaagagc 6840
agtgggaata ggagctttgt tccttgggtt cttgggagca gcaggaagca ctatgggcgc 6900
agcgtcaatg acgctgacgg tacaggccag acaattattg tctggtatag tgcagcagca 6960
gaacaatttg ctgagggcta ttgaggcgca acagcatctg ttgcaactca cagtctgggg 7020
catcaagcag ctccaggcaa gaatcctggc tgtgaaagat acctaaagga tcaacagctc 7080
ctggggattt ggggttgctc tggaaaactc atttgcacca ctgctgtgcc ttggaatgct 7140
agttggagta ataaatctct ggaacagatt tggaatcaca cgacctggat ggagtgggac 7200
agagaaatta acaattacac aagcttaata cactccttaa ttgaagaatc gcaaaaccag 7260
caagaaaaga atgaacaaga attattggaa ttagataaat gggcaagttt gtggaattgg 7320
tttaacataa caaattggct gtggtatata aaattattca taatgatagt aggaggcttg 7380
gtaggtttaa gaatagtttt tgctgtactt tctatagtga atagagttag gcagggatat 7440
tcaccattat cgtttcagac ccacctccca accccgaggg gacccgacag gcccgaagga 7500
atagaagaag aaggtggaga gagagacaga gacagatcca ttcgattagt gaacggatct 7560
cgacggtatc gccaaatggc agtattcatc cacaatttta aaagaaaagg ggggattggg 7620
gggtacagtg caggggaaag aatagtagac ataatagcaa cagacataca aactaaagaa 7680
ttacaaaaac aaattacaaa aattcaaaat tttcgggttt attacaggga cagcagagat 7740
ccagtttgga tcgataagct tgatatcgaa ttcgtcgacc gggtttcgta acaatcgcat 7800
gaggattcgc aacgccttcg gcgtagccga tgtcgcgctc ccgtctcagt aaaggtcggc 7860
gtagccgatg tcgcgcaatc ggactgcctt cgtacggcgt agccgatgtc gcgcgtatca 7920
gtcgcctcgg aacggcgtag ccgatgtcgc gcattcgtaa gaggctcact ctcccttaca 7980
cggagtggat aactagtttc gcatattaag gtgacgcgtg tggcctcgaa caccgagcga 8040
ccctgcagcg acccgcttaa ggatccaccg gtcgccacca cacatacaca gaaatgcact 8100
catctgctct cctttgctgt ctcgtgctcc tgactggagt acgcgcgtca cccggtcaag 8160
ggacacaaag cgaaaactcc tgtacgcatt ttccgggcaa cctccctaat atgcttcgcg 8220
acttgcgaga tgcattttcc agggtgaaga ccttcttcca gatgaaggac cagttggata 8280
atcttctcct caaggagtct cttttggagg acttcaaggg ctacctggga tgtcaagccc 8340
ttagcgaaat gattcagttt tatcttgaag aggtcatgcc gcaagctgag aaccaggacc 8400
ccgacataaa agcccatgtg aactccctcg gcgagaattt gaagacgctg agacttagat 8460
tgagaagatg tcatagattt ctcccatgtg agaataagtc caaggctgtc gagcaggtta 8520
agaatgcttt caataagttg caggaaaaag gaatctataa ggcaatgagc gagtttgaca 8580
tctttattaa ctacattgag gcttatatga ctatgaaaat tagaaactaa agcggccgcg 8640
actctagagt cgacctgcag gcatgcaagc ttgatatcaa gcttatcgat aatcaacctc 8700
tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc 8760
tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca 8820
ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg 8880
tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca 8940
ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg 9000
cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg 9060
acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg 9120
ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg 9180
accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc 9240
ctcagacgag tcggatctcc ctttgggccg cctccccgca t 9281
<210> 64
<211> 11931
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic vector
<400> 64
tctcgcgcaa cctattttcc cctcgaacac tttttaagcc gtagataaac aggctgggac 60
acttcacatg agcgaaaaat acatcgtcac ctgggacatg ttgcagatcc atgcacgtaa 120
actcgcaagc cgactgatgc cttctgaaca atggaaaggc attattgccg taagccgtgg 180
cggtctgtac cgggtgcgtt actggcgcgt gaactgggta ttcgtcatgt cgataccgtt 240
tgtatttcca gctacgatca cgacaaccag cgcgagctta aagtgctgaa acgcgcagaa 300
ggcgatggcg aaggcttcat cgttattgat gacctggtgg ataccggtgg tactgcggtt 360
gcgattcgtg aaatgtatcc aaaagcgcac tttgtcacca tcttcgcaaa accggctggt 420
cgtccgctgg ttgatgacta tgttgttgat atcccgcaag atacctggat tgaacagccg 480
tgggatatgg gcgtcgtatt cgtcccgcca atctccggtc gctaatcttt tcaacgcctg 540
gcactgccgg gcgttgttct ttttaacttc aggcgggtta caatagtttc cagtaagtat 600
tctggaggct gcatccatga cacaggcaaa cctgagcgaa accctgttca aaccccgctt 660
taaacatcct gaaacctcga cgctagtccg ccgctttaat cacggcgcac aaccgcctgt 720
gcagtcggcc cttgatggta aaaccatccc tcactggtat cgcatgatta accgtctgat 780
gtggatctgg cgcggcattg acccacgcga aatcctcgac gtccaggcac gtattgtgat 840
gagcgatgcc gaacgtaccg acgatgattt atacgatacg gtgattggct accgtggcgg 900
caactggatt tatgagtggg ccccggatct ttgtgaagga accttacttc tgtggtgtga 960
cataattgga caaactacct acagagattt aaagctctaa ggtaaatata aaatttttaa 1020
gtgtataatg tgttaaacta ctgattctaa ttgtttgtgt attttagatt ccaacctatg 1080
gaactgatga atgggagcag tggtggaatg cctttaatga ggaaaacctg ttttgctcag 1140
aagaaatgcc atctagtgat gatgaggcta ctgctgactc tcaacattct actcctccaa 1200
aaaagaagag aaaggtagaa gaccccaagg actttccttc agaattgcta agttttttga 1260
gtcatgctgt gtttagtaat agaactcttg cttgctttgc tatttacacc acaaaggaaa 1320
aagctgcact gctatacaag aaaattatgg aaaaatattc tgtaaccttt ataagtaggc 1380
ataacagtta taatcataac atactgtttt ttcttactcc acacaggcat agagtgtctg 1440
ctattaataa ctatgctcaa aaattgtgta cctttagctt tttaatttgt aaaggggtta 1500
ataaggaata tttgatgtat agtgccttga ctagagatca taatcagcca taccacattt 1560
gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa 1620
atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc 1680
aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg 1740
tccaaactca tcaatgtatc ttatcatgtc tggatcaact ggataactca agctaaccaa 1800
aatcatccca aacttcccac cccataccct attaccactg ccaattacct agtggtttca 1860
tttactctaa acctgtgatt cctctgaatt attttcattt taaagaaatt gtatttgtta 1920
aatatgtact acaaacttag tagttggaag ggctaattca ctcccaaaga agacaagata 1980
tccttgatct gtggatctac cacacacaag gctacttccc tgattagcag aactacacac 2040
cagggccagg ggtcagatat ccactgacct ttggatggtg ctacaagcta gtaccagttg 2100
agccagataa ggtagaagag gccaataaag gagagaacac cagcttgtta caccctgtga 2160
gcctgcatgg gatggatgac ccggagagag aagtgttaga gtggaggttt gacagccgcc 2220
tagcatttca tcacgtggcc cgagagctgc atccggagta cttcaagaac tgctgatatc 2280
gagcttgcta caagggactt tccgctgggg actttccagg gaggcgtggc ctgggcggga 2340
ctggggagtg gcgagccctc agatcctgca tataagcagc tgctttttgc ctgtactggg 2400
tctctctggt tagaccagat ctgagcctgg gagctctctg gctaactagg gaacccactg 2460
cttaagcctc aataaagctt gccttgagtg cttcaagtag tgtgtgcccg tctgttgtgt 2520
gactctggta actagagatc cctcagaccc ttttagtcag tgtggaaaat ctctagcagt 2580
ggcgcccgaa cagggacttg aaagcgaaag ggaaaccaga ggagctctct cgacgcagga 2640
ctcggcttgc tgaagcgcgc acggcaagag gcgaggggcg gcgactggtg agtacgccaa 2700
aaattttgac tagcggaggc tagaaggaga gagatgggtg cgagagcgtc agtattaagc 2760
gggggagaat tagatcgcga tgggaaaaaa ttcggttaag gccaggggga aagaaaaaat 2820
ataaattaaa acatatagta tgggcaagca gggagctaga acgattcgca gttaatcctg 2880
gcctgttaga aacatcagaa ggctgtagac aaatactggg acagctacaa ccatcccttc 2940
agacaggatc agaagaactt agatcattat ataatacagt agcaaccctc tattgtgtgc 3000
atcaaaggat agagataaaa gacaccaagg aagctttaga caagatagag gaagagcaaa 3060
acaaaagtaa gaccaccgca cagcaagcgg ccggccgctg atcttcagac ctggaggagg 3120
agatatgagg gacaattgga gaagtgaatt atataaatat aaagtagtaa aaattgaacc 3180
attaggagta gcacccacca aggcaaagag aagagtggtg cagagagaaa aaagagcagt 3240
gggaatagga gctttgttcc ttgggttctt gggagcagca ggaagcacta tgggcgcagc 3300
gtcaatgacg ctgacggtac aggccagaca attattgtct ggtatagtgc agcagcagaa 3360
caatttgctg agggctattg aggcgcaaca gcatctgttg caactcacag tctggggcat 3420
caagcagctc caggcaagaa tcctggctgt gaaagatacc taaaggatca acagctcctg 3480
gggatttggg gttgctctgg aaaactcatt tgcaccactg ctgtgccttg gaatgctagt 3540
tggagtaata aatctctgga acagatttgg aatcacacga cctggatgga gtgggacaga 3600
gaaattaaca attacacaag cttaatacac tccttaattg aagaatcgca aaaccagcaa 3660
gaaaagaatg aacaagaatt attggaatta gataaatggg caagtttgtg gaattggttt 3720
aacataacaa attggctgtg gtatataaaa ttattcataa tgatagtagg aggcttggta 3780
ggtttaagaa tagtttttgc tgtactttct atagtgaata gagttaggca gggatattca 3840
ccattatcgt ttcagaccca cctcccaacc ccgaggggac ccgacaggcc cgaaggaata 3900
gaagaagaag gtggagagag agacagagac agatccattc gattagtgaa cggatctcga 3960
cggtatcgcc aaatggcagt attcatccac aattttaaaa gaaaaggggg gattgggggg 4020
tacagtgcag gggaaagaat agtagacata atagcaacag acatacaaac taaagaatta 4080
caaaaacaaa ttacaaaaat tcaaaatttt cgggtttatt acagggacag cagagatcca 4140
gtttggatcg ataagcttga tatcgaattc ctgcagcctt agtttctaat tttcatagtc 4200
atataagcct caatgtagtt aataaagatg tcaaactcgc tcattgcctt atagattcct 4260
ttttcctgca acttattgaa agcattctta acctgctcga cagccttgga cttattctca 4320
catgggagaa atctatgaca tcttctcaat ctaagtctca gcgtcttcaa attctcgccg 4380
agggagttca catgggcttt tatgtcgggg tcctggttct cagcttgcgg catgacctct 4440
tcaagataaa actgaatcat ttcgctaagg gcttgacatc ccaggtagcc cttgaagtcc 4500
tccaaaagag actccttgag gagaagatta tccaactggt ccttcatctg gaagaaggtc 4560
ttcaccctgg aaaatgcatc tcgcaagtcg cgaagcatat tagggaggtt gcccggaaaa 4620
tgcgtacagg agttttcgct ttgtgtccct tgaccgggtg acgcgcgtac tccagtcagg 4680
agcacgagac agcaaaggag agcagatgag tgcatttctg tgtatgtgtg gtggcgaccg 4740
gtggatcctt aagcgggtcg ctgcagggtc gctcggtgtt cgaggccaca cgcgtcacct 4800
taatatgcga aactagttat ccactccgtg taagggagag tgagcctctt acgaatgcgc 4860
gacatcggct acgccgttcc gaggcgactg atacgcgcga catcggctac gccgtacgaa 4920
ggcagtccga ttgcgcgaca tcggctacgc cgacctttac tgagacggga gcgcgacatc 4980
ggctacgccg aaggcgttgc gaatcctcat gcgattgtta cgaaacccgc cgataaaata 5040
aaagatttta tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg 5100
caagctagct gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga 5160
gaagttcaga tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct 5220
gcggtgagca gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc 5280
cccggcccga ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt 5340
aagacccatc agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt 5400
gaattaacca atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta 5460
taaaagagct cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg 5520
gggggatctg gagctctcga gaattctcac gcgtgccgcc accatgtcta gacccggaga 5580
gcgcccattc cagtgtcgga tttgcatgcg gaacttttcg agaagacacg gcctggacag 5640
acatacccgt actcatacag gtgaaaaacc ctttcagtgt cggatctgta tgcgaaattt 5700
ctccgaccac agcagcctga agagacatct acgtacccac accggcagcc agaagccatt 5760
tcagtgtcgg atctgtatgc ggaacttctc cgtgagacac aacctgacca gacatctacg 5820
tacgcacacc ggagagaagc cattccaatg ccgaatatgc atgcgcaact tcagtgacca 5880
cagcaacctg agcagacacc taaaaaccca caccggttcc cagaagccat ttcagtgtcg 5940
gatctgtatg cggaacttct cccagcgcag cagcctggtg agacatctac gtacgcacac 6000
cggagagaag ccattccaat gccgaatatg catgcgcaac ttcagtgaga gcggccacct 6060
gaagagacac ctgcgtacgc acctgagggg atccacctgc agggactaca aagaccatga 6120
cggtgattat aaagatcatg acatcgatta caaggatgac gatgacaaga tggcccccaa 6180
gaaaaagagg aaggtgggca ttcacggggt gccgggtgga ctcgagggag gcggtggaag 6240
cggcggtacc gaggacgtgg tgtgctgcca ctcaatctac ggcaagaaga agggtgatat 6300
cgacacctac cgatacatag gctcttccgg gacaggctgc gtggtcatag tgggcaggat 6360
cgtcttgtcc ggatccggca ctagtgcgcc catcacggcg tacgcccagc agacgagagg 6420
cctcctaggg tgtataatca ccagcctgac tggccgggac aaaaaccaag tggagggtga 6480
ggtccagatc gtgtcaactg ctacccaaac cttcctggca acgtgcatca atggggtatg 6540
ctgggcagtc taccacgggg ccggaacgag gaccatcgca tcacccaagg gtcctgtcat 6600
ccagatgtat accaatgtgg accaagacct tgtgggctgg cccgctcctc aaggttcccg 6660
ctcattgaca ccctgtacct gcggctcctc ggacctttac ctggtcacga ggcacgccga 6720
tgtcattccc gtgcgccggc gaggtgatag caggggtagc ctgctttcgc cccggcccat 6780
ttcctacttg aaaggctcct cggggggtcc gctgttgtgc cccgcgggac acgccgtggg 6840
cctattcagg gccgcggtgt gcacccgtgg agtggctaaa gcggtggact ttatccctgt 6900
ggagaaccta gagacaacca tgagatcccc ggtgttcacg gacaactcct ctccaccagc 6960
agtcaccctg acgcacccaa tcaccaaaat cgatagggag gttctctacc aggagttcga 7020
tgagatggaa gagtgctctc agcactatcc ctacgatgtg cccgattacg ctggaggcgg 7080
tggaagcggc ggtaccgatg agtttcccac catggtgttt ccttctgggc agatcagcca 7140
ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag cccctgcccc 7200
tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag tcctagcccc 7260
aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg gggaaggaac 7320
gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg ccttgcttgg 7380
caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact ccgagtttca 7440
gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca tgctgatgga 7500
gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg acccagctcc 7560
tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg aagacttctc 7620
ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc aattgtaagc 7680
ggccgcgact ctagagtcga cctgcaggca tgcaagcttg atatcaagct tatcgataat 7740
caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta tgttgctcct 7800
tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc ttcccgtatg 7860
gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga ggagttgtgg 7920
cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac ccccactggt 7980
tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc cctccctatt 8040
gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc tcggctgttg 8100
ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg gctgctcgcc 8160
tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc ggccctcaat 8220
ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc gcgtcttcgc 8280
cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg ataccgtcga 8340
cctcgaggga attaattcga gctcggtacc tttaagacca atgacttaca aggcagctgt 8400
agatcttagc cactttttaa aagaaaaggg gggactggaa gggctaattc actcccaacg 8460
aagacaagat ctgctttttg cttgtactgg gtctctctgg ttagaccaga tctgagcctg 8520
ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 8580
gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 8640
cttttagtca gtgtggaaaa tctctagcag catctagaat taattccgtg tattctatag 8700
tgtcacctaa atcgtatgtg tatgatacat aaggttatgt attaattgta gccgcgttct 8760
aacgacaata tgtacaagcc taattgtgta gcatctggct tactgaagca gaccctatca 8820
tctctctcgt aaactgccgt cagagtcggt ttggttggac gaaccttctg agtttctggt 8880
aacgccgtcc cgcacccgga aatggtcagc gaaccaatca gcagggtcat cgctagccag 8940
atcctctacg ccggacgcat cgtggccggc atcaccggcg ccacaggtgc ggttgctggc 9000
gcctatatcg ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc 9060
gcttgtttcg gcgtgggtat ggtggcaggc cccgtggccg ggggactgtt gggcgccatc 9120
tccttgcatg caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc 9180
tgcttcctaa tgcaggagtc gcataaggga gagcgtcgaa tggtgcactc tcagtacaat 9240
ctgctctgat gccgcatagt taagccagcc ccgacacccg ccaacacccg ctgacgcgcc 9300
ctgacgggct tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag 9360
ctgcatgtgt cagaggtttt caccgtcatc accgaaacgc gcgagacgaa agggcctcgt 9420
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttaga cgtcaggtgg 9480
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa 9540
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa 9600
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct 9660
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg 9720
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg 9780
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt 9840
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga 9900
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga 9960
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac 10020
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg 10080
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac 10140
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct 10200
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct 10260
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg 10320
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat 10380
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg 10440
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat 10500
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct 10560
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa 10620
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa 10680
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc 10740
gaaggtaact ggcttcagca gagcgcagat accaaatact gtctttctag tgtagccgta 10800
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct 10860
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg 10920
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag 10980
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc 11040
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg 11100
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 11160
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg 11220
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca 11280
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg 11340
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc 11400
ggaagagcgc ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag 11460
ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 11520
atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 11580
gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 11640
actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 11700
ctaatttttt ttatttatgc agaggccgag gccgcctcgg cctctgagct attccagaag 11760
tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agcttggaca caagacaggc 11820
ttgcgagata tgtttgagaa taccacttta tcccgcgtca gggagaggca gtgcgtaaaa 11880
agacgcggac tcatgtgaaa tactggtttt tagtgcgcca gatctctata a 11931
<210> 65
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 65
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 66
<211> 298
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 66
Val Pro Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met
1 5 10 15
Glu Ala Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly
20 25 30
Ser Met Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe
35 40 45
Gly Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg
50 55 60
Glu Arg Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro
65 70 75 80
Met Leu Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu
85 90 95
Phe Asn Ser Phe Leu Arg Val Asp Ser Glu Ile Glu Ser Val Ala Pro
100 105 110
Glu Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His
115 120 125
Ile Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly
130 135 140
Lys Thr Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp
145 150 155 160
Glu Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn
165 170 175
Gly Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp
180 185 190
Arg Tyr Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val
195 200 205
Lys Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val
210 215 220
Trp Asp Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg
225 230 235 240
Ile Leu Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu
245 250 255
Leu Ala Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser
260 265 270
Ala Ala Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp
275 280 285
Asn Ile Ser Val Val Val Val Asp Leu Lys
290 295
<210> 67
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 67
Gly Gly Ser Gly Gly
1 5
<210> 68
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 68
Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
1 5 10 15
Glu Glu Asn Pro Gly Pro
20
<210> 69
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 69
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
1 5 10 15
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
20 25 30
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
35 40 45
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
50 55 60
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
65 70 75 80
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
85 90 95
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
100 105 110
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
115 120 125
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
130 135 140
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
145 150 155 160
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
165 170 175
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
180 185 190
<210> 70
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 70
Gly Gly Gly Ser Gly
1 5
<210> 71
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 71
Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu Phe His
1 5 10 15
Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala Gln Arg
20 25 30
Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg Phe Asp
35 40 45
Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val Ser Glu
50 55 60
Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val Ile Ser
65 70 75 80
Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu Asp Asp
85 90 95
Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His Arg Leu
100 105 110
Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys Glu Glu
115 120 125
Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val Val Asp
130 135 140
Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala Asp Thr
145 150 155 160
Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu Ala Met
165 170 175
Asn
<210> 72
<211> 96
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 72
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
65 70 75 80
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
85 90 95
<210> 73
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 73
Cys Val Arg Gly Ser
1 5
<210> 74
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 74
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 75
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 75
Gly Gly Gly Gly Ser Gly
1 5
<210> 76
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (19)..(25)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (47)..(53)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (76)..(82)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (104)..(110)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (133)..(139)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (161)..(167)
<223> Xaa can be any naturally occurring amino acid
<400> 76
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
100 105 110
Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 77
<211> 39
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 77
Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr
1 5 10 15
Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val Gly
20 25 30
Ile His Gly Val Pro Gly Gly
35
<210> 78
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 78
Glu Asp Val Val Cys Cys His Ser Ile Tyr
1 5 10
<210> 79
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 79
His Ser Ile Tyr Gly Lys Lys Lys
1 5
<210> 80
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 80
Asp Thr Tyr Arg Tyr Ile
1 5
<210> 81
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 81
Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
1 5 10
<210> 82
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 82
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser
180 185
<210> 83
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 83
Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His
1 5 10
<210> 84
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 84
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 85
<211> 241
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 85
Gly Lys Lys Lys Gly Asp Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser
1 5 10 15
Gly Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser
20 25 30
Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu
35 40 45
Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val
50 55 60
Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala
65 70 75 80
Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr
85 90 95
Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn
100 105 110
Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser
115 120 125
Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg
130 135 140
His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser
145 150 155 160
Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly
165 170 175
Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala
180 185 190
Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu
195 200 205
Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser
210 215 220
Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Arg Glu
225 230 235 240
Val
<210> 86
<211> 304
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 86
Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser
1 5 10 15
Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly
20 25 30
Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln
35 40 45
Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg
50 55 60
Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr
65 70 75 80
Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr
85 90 95
His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile
100 105 110
Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro
115 120 125
Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu
130 135 140
Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly
145 150 155 160
Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys
165 170 175
Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly
180 185 190
Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp
195 200 205
Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe
210 215 220
Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr
225 230 235 240
Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu
245 250 255
Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu
260 265 270
Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile
275 280 285
Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
290 295 300
<210> 87
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 87
Asp Glu Met Glu Glu Cys Ser Gln His Leu
1 5 10
<210> 88
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 88
Pro Gly Ala Gly Ser Ser Gly Asp Ile Met
1 5 10
<210> 89
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 89
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 90
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 90
Gly Ser Ser Gly Thr Gly Ser Gly Ser Gly Thr Ser
1 5 10
<210> 91
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 91
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp
180 185
<210> 92
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 92
Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile
1 5 10 15
Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val
20 25 30
Thr
<210> 93
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 93
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
20 25 30
Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
35 40 45
<210> 94
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 94
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu
275 280 285
Asp Val Val Pro Cys Ser Met Gly Ser
290 295
<210> 95
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 95
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val
275 280 285
Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
290 295 300
<210> 96
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 96
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
20 25 30
Gly Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu
35 40 45
Val Leu Tyr
50
<210> 97
<211> 65
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 97
Leu Ala Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr Arg
1 5 10 15
Asp Glu Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg Glu
20 25 30
Val Met Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe Leu
35 40 45
Phe Thr Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp Pro
50 55 60
Trp
65
<210> 98
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 98
Gly Lys Lys Thr Lys Arg Thr Ala Asp Ser Ser Ser Ser Glu Asp Glu
1 5 10 15
Glu Glu Tyr Val Val Glu Lys Val Leu Asp Arg Arg Val Val Lys Gly
20 25 30
Gln Val Glu Tyr Leu Leu Lys Trp Lys Gly Phe Ser Glu Glu His Asn
35 40 45
Thr Trp Glu Pro Glu Lys Asn Leu Asp Cys Pro Glu Leu Ile Ser Glu
50 55 60
Phe Met Lys Lys Tyr Lys Lys Met Lys Glu Gly Glu Asn Asn Lys Pro
65 70 75 80
Arg Glu Lys Ser Glu Ser Asn Lys Arg Lys Ser Asn Phe Ser Asn Ser
85 90 95
Ala Asp Asp Ile Lys Ser Lys Lys Lys Arg Glu Gln Ser Asn Asp Ile
100 105 110
Ala Arg Gly Phe Glu Arg Gly Leu Glu Pro Glu Lys Ile Ile Gly Ala
115 120 125
Thr Asp Ser Cys Gly Asp Leu Met Phe Leu Met Lys Trp Lys Asp Thr
130 135 140
Asp Glu Ala Asp Leu Val Leu Ala Lys Glu Ala Asn Val Lys Cys Pro
145 150 155 160
Gln Ile Val Ile Ala Phe Tyr Glu Glu Arg Leu Thr Trp His Ala Tyr
165 170 175
Pro Glu Asp Ala Glu Asn Lys Glu Lys Glu Thr Ala Lys Ser
180 185 190
<210> 99
<211> 440
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 99
Ser Glu Arg Glu Val Ser Thr Ala Pro Ala Gly Thr Asp Met Pro Ala
1 5 10 15
Ala Lys Lys Gln Lys Leu Ser Ser Asp Glu Asn Ser Asn Pro Asp Leu
20 25 30
Ser Gly Asp Glu Asn Asp Asp Ala Val Ser Ile Glu Ser Gly Thr Asn
35 40 45
Thr Glu Arg Pro Asp Thr Pro Thr Asn Thr Pro Asn Ala Pro Gly Arg
50 55 60
Lys Ser Trp Gly Lys Gly Lys Trp Lys Ser Lys Lys Cys Lys Tyr Ser
65 70 75 80
Phe Lys Cys Val Asn Ser Leu Lys Glu Asp His Asn Gln Pro Leu Phe
85 90 95
Gly Val Gln Phe Asn Trp His Ser Lys Glu Gly Asp Pro Leu Val Phe
100 105 110
Ala Thr Val Gly Ser Asn Arg Val Thr Leu Tyr Glu Cys His Ser Gln
115 120 125
Gly Glu Ile Arg Leu Leu Gln Ser Tyr Val Asp Ala Asp Ala Asp Glu
130 135 140
Asn Phe Tyr Thr Cys Ala Trp Thr Tyr Asp Ser Asn Thr Ser His Pro
145 150 155 160
Leu Leu Ala Val Ala Gly Ser Arg Gly Ile Ile Arg Ile Ile Asn Pro
165 170 175
Ile Thr Met Gln Cys Ile Lys His Tyr Val Gly His Gly Asn Ala Ile
180 185 190
Asn Glu Leu Lys Phe His Pro Arg Asp Pro Asn Leu Leu Leu Ser Val
195 200 205
Ser Lys Asp His Ala Leu Arg Leu Trp Asn Ile Gln Thr Asp Thr Leu
210 215 220
Val Ala Ile Phe Gly Gly Val Glu Gly His Arg Asp Glu Val Leu Ser
225 230 235 240
Ala Asp Tyr Asp Leu Leu Gly Glu Lys Ile Met Ser Cys Gly Met Asp
245 250 255
His Ser Leu Lys Leu Trp Arg Ile Asn Ser Lys Arg Met Met Asn Ala
260 265 270
Ile Lys Glu Ser Tyr Asp Tyr Asn Pro Asn Lys Thr Asn Arg Pro Phe
275 280 285
Ile Ser Gln Lys Ile His Phe Pro Asp Phe Ser Thr Arg Asp Ile His
290 295 300
Arg Asn Tyr Val Asp Cys Val Arg Trp Leu Gly Asp Leu Ile Leu Ser
305 310 315 320
Lys Ser Cys Glu Asn Ala Ile Val Cys Trp Lys Pro Gly Lys Met Glu
325 330 335
Asp Asp Ile Asp Lys Ile Lys Pro Ser Glu Ser Asn Val Thr Ile Leu
340 345 350
Gly Arg Phe Asp Tyr Ser Gln Cys Asp Ile Trp Tyr Met Arg Phe Ser
355 360 365
Met Asp Phe Trp Gln Lys Met Leu Ala Leu Gly Asn Gln Val Gly Lys
370 375 380
Leu Tyr Val Trp Asp Leu Glu Val Glu Asp Pro His Lys Ala Lys Cys
385 390 395 400
Thr Thr Leu Thr His His Lys Cys Gly Ala Ala Ile Arg Gln Thr Ser
405 410 415
Phe Ser Arg Asp Ser Ser Ile Leu Ile Ala Val Cys Asp Asp Ala Ser
420 425 430
Ile Trp Arg Trp Asp Arg Leu Arg
435 440
<210> 100
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 100
Gly Gly Ser Gly Ser Gly Ser Ala Cys
1 5
<210> 101
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (17)..(23)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (45)..(51)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (74)..(80)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (102)..(108)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (131)..(137)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (159)..(165)
<223> Xaa can be any naturally occurring amino acid
<400> 101
Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln
50 55 60
Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys
85 90 95
Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr
100 105 110
His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
115 120 125
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg
165 170
<210> 102
<211> 265
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 102
Glu Asp Val Val Cys Cys His Ser Ile Tyr Gly Lys Lys Lys Gly Asp
1 5 10 15
Ile Asp Thr Tyr Arg Tyr Ile Gly Ser Ser Gly Thr Gly Cys Val Val
20 25 30
Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly Thr Ser Ala Pro Ile
35 40 45
Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr
50 55 60
Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile
65 70 75 80
Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val
85 90 95
Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro
100 105 110
Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val
115 120 125
Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys
130 135 140
Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro
145 150 155 160
Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro
165 170 175
Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala
180 185 190
Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val
195 200 205
Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met
210 215 220
Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu
225 230 235 240
Thr His Pro Ile Thr Lys Ile Asp Arg Glu Val Leu Tyr Gln Glu Phe
245 250 255
Asp Glu Met Glu Glu Cys Ser Gln His
260 265
<210> 103
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 103
Leu Glu Gly Gly Gly Gly Ser Gly Gly
1 5
<210> 104
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 104
Gly Gly Gly Gly Ser Gly Gly Thr
1 5
<210> 105
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 105
Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys
1 5 10 15
<210> 106
<211> 63
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 106
Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val
1 5 10 15
Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala
20 25 30
Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val
35 40 45
Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
50 55 60
<210> 107
<211> 305
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 107
Pro Leu Tyr Gly Phe Thr Ser Ile Cys Gly Arg Arg Pro Glu Met Glu
1 5 10 15
Asp Ala Val Ser Thr Ile Pro Arg Phe Leu Gln Ser Ser Ser Gly Ser
20 25 30
Met Leu Asp Gly Arg Phe Asp Pro Gln Ser Ala Ala His Phe Phe Gly
35 40 45
Val Tyr Asp Gly His Gly Gly Ser Gln Val Ala Asn Tyr Cys Arg Glu
50 55 60
Arg Met His Leu Ala Leu Ala Glu Glu Ile Ala Lys Glu Lys Pro Met
65 70 75 80
Leu Cys Asp Gly Asp Thr Trp Leu Glu Lys Trp Lys Lys Ala Leu Phe
85 90 95
Asn Ser Phe Leu Arg Val Asp Ser Glu Ile Gly Ser Val Ala Pro Glu
100 105 110
Thr Val Gly Ser Thr Ser Val Val Ala Val Val Phe Pro Ser His Ile
115 120 125
Phe Val Ala Asn Cys Gly Asp Ser Arg Ala Val Leu Cys Arg Gly Lys
130 135 140
Thr Ala Leu Pro Leu Ser Val Asp His Lys Pro Asp Arg Glu Asp Glu
145 150 155 160
Ala Ala Arg Ile Glu Ala Ala Gly Gly Lys Val Ile Gln Trp Asn Gly
165 170 175
Ala Arg Val Phe Gly Val Leu Ala Met Ser Arg Ser Ile Gly Asp Arg
180 185 190
Tyr Leu Lys Pro Ser Ile Ile Pro Asp Pro Glu Val Thr Ala Val Lys
195 200 205
Arg Val Lys Glu Asp Asp Cys Leu Ile Leu Ala Ser Asp Gly Val Trp
210 215 220
Asp Val Met Thr Asp Glu Glu Ala Cys Glu Met Ala Arg Lys Arg Ile
225 230 235 240
Leu Leu Trp His Lys Lys Asn Ala Val Ala Gly Asp Ala Ser Leu Leu
245 250 255
Ala Asp Glu Arg Arg Lys Glu Gly Lys Asp Pro Ala Ala Met Ser Ala
260 265 270
Ala Glu Tyr Leu Ser Lys Leu Ala Ile Gln Arg Gly Ser Lys Asp Asn
275 280 285
Ile Ser Val Val Val Val Asp Leu Lys Asp Tyr Lys Asp Asp Asp Asp
290 295 300
Lys
305
<210> 108
<211> 188
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 108
Ala Pro Thr Gln Asp Glu Phe Thr Gln Leu Ser Gln Ser Ile Ala Glu
1 5 10 15
Phe His Thr Tyr Gln Leu Gly Asn Gly Arg Cys Ser Ser Leu Leu Ala
20 25 30
Gln Arg Ile His Ala Pro Pro Glu Thr Val Trp Ser Val Val Arg Arg
35 40 45
Phe Asp Arg Pro Gln Ile Tyr Lys His Phe Ile Lys Ser Cys Asn Val
50 55 60
Ser Glu Asp Phe Glu Met Arg Val Gly Cys Thr Arg Asp Val Asn Val
65 70 75 80
Ile Ser Gly Leu Pro Ala Asn Thr Ser Arg Glu Arg Leu Asp Leu Leu
85 90 95
Asp Asp Asp Arg Arg Val Thr Gly Phe Ser Ile Thr Gly Gly Glu His
100 105 110
Arg Leu Arg Asn Tyr Lys Ser Val Thr Thr Val His Arg Phe Glu Lys
115 120 125
Glu Glu Glu Glu Glu Arg Ile Trp Thr Val Val Leu Glu Ser Tyr Val
130 135 140
Val Asp Val Pro Glu Gly Asn Ser Glu Glu Asp Thr Arg Leu Phe Ala
145 150 155 160
Asp Thr Val Ile Arg Leu Asn Leu Gln Lys Leu Ala Ser Ile Thr Glu
165 170 175
Ala Met Asn Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
180 185
<210> 109
<211> 109
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 109
Ser Arg Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr
1 5 10 15
Phe Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu
20 25 30
Glu Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe
35 40 45
Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly
50 55 60
Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro
65 70 75 80
Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His
85 90 95
Ala Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 110
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 110
Ile Leu Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg
1 5 10 15
Leu Tyr Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu
20 25 30
Pro Leu His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr
35 40 45
Ser Phe Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp
50 55 60
Cys Arg Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln Ala
65 70 75 80
Trp Asp Leu Tyr Tyr His Val Phe Arg Arg Ile Ser
85 90
<210> 111
<211> 92
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 111
Met Lys Arg Asp His His His His His His Gln Asp Lys Lys Thr Met
1 5 10 15
Met Met Asn Glu Glu Asp Asp Gly Asn Gly Met Asp Glu Leu Leu Ala
20 25 30
Val Leu Gly Tyr Lys Val Arg Ser Ser Glu Met Ala Asp Val Ala Gln
35 40 45
Lys Leu Glu Gln Leu Glu Val Met Met Ser Asn Val Gln Glu Asp Asp
50 55 60
Leu Ser Gln Leu Ala Thr Glu Thr Val His Tyr Asn Pro Ala Glu Leu
65 70 75 80
Tyr Thr Trp Leu Asp Ser Met Leu Thr Asp Leu Asn
85 90
<210> 112
<211> 345
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 112
Met Ala Ala Ser Asp Glu Val Asn Leu Ile Glu Ser Arg Thr Val Val
1 5 10 15
Pro Leu Asn Thr Trp Val Leu Ile Ser Asn Phe Lys Val Ala Tyr Asn
20 25 30
Ile Leu Arg Arg Pro Asp Gly Thr Phe Asn Arg His Leu Ala Glu Tyr
35 40 45
Leu Asp Arg Lys Val Thr Ala Asn Ala Asn Pro Val Asp Gly Val Phe
50 55 60
Ser Phe Asp Val Leu Ile Asp Arg Arg Ile Asn Leu Leu Ser Arg Val
65 70 75 80
Tyr Arg Pro Ala Tyr Ala Asp Gln Glu Gln Pro Pro Ser Ile Leu Asp
85 90 95
Leu Glu Lys Pro Val Asp Gly Asp Ile Val Pro Val Ile Leu Phe Phe
100 105 110
His Gly Gly Ser Phe Ala His Ser Ser Ala Asn Ser Ala Ile Tyr Asp
115 120 125
Thr Leu Cys Arg Arg Leu Val Gly Leu Cys Lys Cys Val Val Val Ser
130 135 140
Val Asn Tyr Arg Arg Ala Pro Glu Asn Pro Tyr Pro Cys Ala Tyr Asp
145 150 155 160
Asp Gly Trp Ile Ala Leu Asn Trp Val Asn Ser Arg Ser Trp Leu Lys
165 170 175
Ser Lys Lys Asp Ser Lys Val His Ile Phe Leu Ala Gly Asp Ser Ser
180 185 190
Gly Gly Asn Ile Ala His Asn Val Ala Leu Arg Ala Gly Glu Ser Gly
195 200 205
Ile Asp Val Leu Gly Asn Ile Leu Leu Asn Pro Met Phe Gly Gly Asn
210 215 220
Glu Arg Thr Glu Ser Glu Lys Ser Leu Asp Gly Lys Tyr Phe Val Thr
225 230 235 240
Val Arg Asp Arg Asp Trp Tyr Trp Lys Ala Phe Leu Pro Glu Gly Glu
245 250 255
Asp Arg Glu His Pro Ala Cys Asn Pro Phe Ser Pro Arg Gly Lys Ser
260 265 270
Leu Glu Gly Val Ser Phe Pro Lys Ser Leu Val Val Val Ala Gly Leu
275 280 285
Asp Leu Ile Arg Asp Trp Gln Leu Ala Tyr Ala Glu Gly Leu Lys Lys
290 295 300
Ala Gly Gln Glu Val Lys Leu Met His Leu Glu Lys Ala Thr Val Gly
305 310 315 320
Phe Tyr Leu Leu Pro Asn Asn Asn His Phe His Asn Val Met Asp Glu
325 330 335
Ile Ser Ala Phe Val Asn Ala Glu Cys
340 345
<210> 113
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 113
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Asp
1 5 10 15
Gln Ile Gly Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 114
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 114
His Thr Leu Tyr Ala Pro Gly Gly Tyr Asp Ile Met Gly Tyr Leu Arg
1 5 10 15
Gln Ile Arg Asn Arg Pro Asn Pro Gln Val Glu Leu Gly Pro Val Asp
20 25 30
Thr Ser Cys Ala Leu Ile Leu Cys Asp Leu Lys Gln Lys Asp Thr Pro
35 40 45
Ile Val Tyr Ala Ser Glu Ala Phe Leu Tyr Met Thr Gly Tyr Ser Asn
50 55 60
Ala Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Ser Pro Asp Gly
65 70 75 80
Met Val Lys Pro Lys Ser Thr Arg Lys Tyr Val Asp Ser Asn Thr Ile
85 90 95
Asn Thr Met Arg Lys Ala Ile Asp Arg Asn Ala Glu Val Gln Val Glu
100 105 110
Val Val Asn Phe Lys Lys Asn Gly Gln Arg Phe Val Asn Phe Leu Thr
115 120 125
Met Ile Pro Val Arg Asp Glu Thr Gly Glu Tyr Arg Tyr Ser Met Gly
130 135 140
Phe Gln Cys Glu Thr Glu
145 150
<210> 115
<211> 171
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 115
Met Asn Gly Ala Ile Gly Gly Asp Leu Leu Leu Asn Phe Pro Asp Met
1 5 10 15
Ser Val Leu Glu Arg Gln Arg Ala His Leu Lys Tyr Leu Asn Pro Thr
20 25 30
Phe Asp Ser Pro Leu Ala Gly Phe Phe Ala Asp Ser Ser Met Ile Thr
35 40 45
Gly Gly Glu Met Asp Ser Tyr Leu Ser Thr Ala Gly Leu Asn Leu Pro
50 55 60
Met Met Tyr Gly Glu Thr Thr Val Glu Gly Asp Ser Arg Leu Ser Ile
65 70 75 80
Ser Pro Glu Thr Thr Leu Gly Thr Gly Asn Phe Lys Lys Arg Lys Phe
85 90 95
Asp Thr Glu Thr Lys Asp Cys Asn Glu Lys Lys Lys Lys Met Thr Met
100 105 110
Asn Arg Asp Asp Leu Val Glu Glu Gly Glu Glu Glu Lys Ser Lys Ile
115 120 125
Thr Glu Gln Asn Asn Gly Ser Thr Lys Ser Ile Lys Lys Met Lys His
130 135 140
Lys Ala Lys Lys Glu Glu Asn Asn Phe Ser Asn Asp Ser Ser Lys Val
145 150 155 160
Thr Lys Glu Leu Glu Lys Thr Asp Tyr Ile His
165 170
<210> 116
<211> 612
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 116
Met Lys Met Asp Lys Lys Thr Ile Val Trp Phe Arg Arg Asp Leu Arg
1 5 10 15
Ile Glu Asp Asn Pro Ala Leu Ala Ala Ala Ala His Glu Gly Ser Val
20 25 30
Phe Pro Val Phe Ile Trp Cys Pro Glu Glu Glu Gly Gln Phe Tyr Pro
35 40 45
Gly Arg Ala Ser Arg Trp Trp Met Lys Gln Ser Leu Ala His Leu Ser
50 55 60
Gln Ser Leu Lys Ala Leu Gly Ser Asp Leu Thr Leu Ile Lys Thr His
65 70 75 80
Asn Thr Ile Ser Ala Ile Leu Asp Cys Ile Arg Val Thr Gly Ala Thr
85 90 95
Lys Val Val Phe Asn His Leu Tyr Asp Pro Val Ser Leu Val Arg Asp
100 105 110
His Thr Val Lys Glu Lys Leu Val Glu Arg Gly Ile Ser Val Gln Ser
115 120 125
Tyr Asn Gly Asp Leu Leu Tyr Glu Pro Trp Glu Ile Tyr Cys Glu Lys
130 135 140
Gly Lys Pro Phe Thr Ser Phe Asn Ser Tyr Trp Lys Lys Cys Leu Asp
145 150 155 160
Met Ser Ile Glu Ser Val Met Leu Pro Pro Pro Trp Arg Leu Met Pro
165 170 175
Ile Thr Ala Ala Ala Glu Ala Ile Trp Ala Cys Ser Ile Glu Glu Leu
180 185 190
Gly Leu Glu Asn Glu Ala Glu Lys Pro Ser Asn Ala Leu Leu Thr Arg
195 200 205
Ala Trp Ser Pro Gly Trp Ser Asn Ala Asp Lys Leu Leu Asn Glu Phe
210 215 220
Ile Glu Lys Gln Leu Ile Asp Tyr Ala Lys Asn Ser Lys Lys Val Val
225 230 235 240
Gly Asn Ser Thr Ser Leu Leu Ser Pro Tyr Leu His Phe Gly Glu Ile
245 250 255
Ser Val Arg His Val Phe Gln Cys Ala Arg Met Lys Gln Ile Ile Trp
260 265 270
Ala Arg Asp Lys Asn Ser Glu Gly Glu Glu Ser Ala Asp Leu Phe Leu
275 280 285
Arg Gly Ile Gly Leu Arg Glu Tyr Ser Arg Tyr Ile Cys Phe Asn Phe
290 295 300
Pro Phe Thr His Glu Gln Ser Leu Leu Ser His Leu Arg Phe Phe Pro
305 310 315 320
Trp Asp Ala Asp Val Asp Lys Phe Lys Ala Trp Arg Gln Gly Arg Thr
325 330 335
Gly Tyr Pro Leu Val Asp Ala Gly Met Arg Glu Leu Trp Ala Thr Gly
340 345 350
Trp Met His Asn Arg Ile Arg Val Ile Val Ser Ser Phe Ala Val Lys
355 360 365
Phe Leu Leu Leu Pro Trp Lys Trp Gly Met Lys Tyr Phe Trp Asp Thr
370 375 380
Leu Leu Asp Ala Asp Leu Glu Cys Asp Ile Leu Gly Trp Gln Tyr Ile
385 390 395 400
Ser Gly Ser Ile Pro Asp Gly His Glu Leu Asp Arg Leu Asp Asn Pro
405 410 415
Ala Leu Gln Gly Ala Lys Tyr Asp Pro Glu Gly Glu Tyr Ile Arg Gln
420 425 430
Trp Leu Pro Glu Leu Ala Arg Leu Pro Thr Glu Trp Ile His His Pro
435 440 445
Trp Asp Ala Pro Leu Thr Val Leu Lys Ala Ser Gly Val Glu Leu Gly
450 455 460
Thr Asn Tyr Ala Lys Pro Ile Val Asp Ile Asp Thr Ala Arg Glu Leu
465 470 475 480
Leu Ala Lys Ala Ile Ser Arg Thr Arg Glu Ala Gln Ile Met Ile Gly
485 490 495
Ala Ala Pro Asp Glu Ile Val Ala Asp Ser Phe Glu Ala Leu Gly Ala
500 505 510
Asn Thr Ile Lys Glu Pro Gly Leu Cys Pro Ser Val Ser Ser Asn Asp
515 520 525
Gln Gln Val Pro Ser Ala Val Arg Tyr Asn Gly Ser Lys Arg Val Lys
530 535 540
Pro Glu Glu Glu Glu Glu Arg Asp Met Lys Lys Ser Arg Gly Phe Asp
545 550 555 560
Glu Arg Glu Leu Phe Ser Thr Ala Glu Ser Ser Ser Ser Ser Ser Val
565 570 575
Phe Phe Val Ser Gln Ser Cys Ser Leu Ala Ser Glu Gly Lys Asn Leu
580 585 590
Glu Gly Ile Gln Asp Ser Ser Asp Gln Ile Thr Thr Ser Leu Gly Lys
595 600 605
Asn Gly Cys Lys
610
<210> 117
<211> 551
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 117
Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala
1 5 10 15
Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met
20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly
35 40 45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn
50 55 60
Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp
65 70 75 80
Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg
85 90 95
Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser
100 105 110
Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln
115 120 125
Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Val Pro
130 135 140
Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys
145 150 155 160
Phe Gln Val Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro
165 170 175
Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala
180 185 190
Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly
195 200 205
Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile
210 215 220
Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser
225 230 235 240
Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro
245 250 255
Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu
260 265 270
Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr
275 280 285
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
290 295 300
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly
305 310 315 320
Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg
325 330 335
Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr
340 345 350
Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe
355 360 365
Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro
370 375 380
Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
385 390 395 400
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
405 410 415
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
420 425 430
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
435 440 445
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
450 455 460
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
465 470 475 480
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
485 490 495
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
500 505 510
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
515 520 525
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
530 535 540
Leu Leu Ser Gln Ile Ser Ser
545 550
<210> 118
<211> 261
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 118
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro
100 105 110
Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu
115 120 125
Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
130 135 140
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe
145 150 155 160
Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala
165 170 175
Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu
180 185 190
Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu
195 200 205
Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg
210 215 220
Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn
225 230 235 240
Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp
245 250 255
Phe Ser Ala Leu Leu
260
<210> 119
<211> 112
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 119
Ser Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu
1 5 10 15
Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu
20 25 30
Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile
35 40 45
Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu
50 55 60
Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala
65 70 75 80
Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly
85 90 95
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
100 105 110
<210> 120
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 120
Ser Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val
1 5 10 15
Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly
20 25 30
Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly
35 40 45
Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu
50 55 60
Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr
65 70 75 80
Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln
85 90 95
Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr
100 105 110
Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp
115 120 125
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
130 135 140
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
145 150 155 160
Leu Leu
<210> 121
<211> 62
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 121
Ser Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile
1 5 10 15
Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala
20 25 30
Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu
35 40 45
Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
50 55 60
<210> 122
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 122
Asp Glu Ala Asn Leu Arg Arg
1 5
<210> 123
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 123
Asp Pro Ser Val Leu Lys Arg
1 5
<210> 124
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 124
Gln Ser Ala Asn Leu Leu Arg
1 5
<210> 125
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 125
Asp Pro Ser Ser Leu Lys Arg
1 5
<210> 126
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 126
Gln Gln Thr Asn Leu Thr Arg
1 5
<210> 127
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 127
Asp Ala Thr Gln Leu Val Arg
1 5
<210> 128
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 128
Glu Arg Arg Ser Leu Ala Arg
1 5
<210> 129
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 129
Glu Glu Ala Asn Leu Arg Arg
1 5
<210> 130
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 130
Asp His Ser Ser Leu Lys Arg
1 5
<210> 131
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 131
Gln Arg Ser Ser Leu Val Arg
1 5
<210> 132
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 132
Asp Met Gly Asn Leu Gly Arg
1 5
<210> 133
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 133
Arg Ser His Asp Leu Thr Arg
1 5
<210> 134
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 134
His Lys Ser Ser Leu Thr Arg
1 5
<210> 135
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 135
Asp Ser Ser Asn Leu Arg Arg
1 5
<210> 136
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 136
Asp Gln Gly Asn Leu Ile Arg
1 5
<210> 137
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 137
Gln Lys Gln Ala Leu Thr Arg
1 5
<210> 138
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 138
Asp Arg Gly Asn Leu Thr Arg
1 5
<210> 139
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 139
Arg Ser His Asp Leu Thr Val
1 5
<210> 140
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 140
Asp Lys Ser Val Leu Ala Arg
1 5
<210> 141
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 141
Gln Thr Asn Asn Leu Gly Arg
1 5
<210> 142
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 142
Thr His Ala Val Leu Thr Arg
1 5
<210> 143
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 143
Thr Lys Ser Leu Leu Ala Arg
1 5
<210> 144
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 144
Gln Lys Gln Ala Leu Asp Arg
1 5
<210> 145
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 145
Asp Thr Ser Val Leu Asn Arg
1 5
<210> 146
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 146
Gln Gly Thr Ser Leu Ala Arg
1 5
<210> 147
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 147
Val Arg His Asn Leu Thr Arg
1 5
<210> 148
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 148
Glu Lys Gln Asn Leu Ala Arg
1 5
<210> 149
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 149
Asp Pro Ser Asn Leu Arg Arg
1 5
<210> 150
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 150
Asp His Ser Asn Leu Ser Arg
1 5
<210> 151
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 151
Gln Ser Thr Ser Leu Gln Arg
1 5
<210> 152
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 152
Asn Met Ser Asn Leu Thr Arg
1 5
<210> 153
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 153
Asp Arg Ser Val Leu Arg Arg
1 5
<210> 154
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 154
Leu Gln Glu Asn Leu Thr Arg
1 5
<210> 155
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 155
Asp Arg Ser Ser Leu Arg Arg
1 5
<210> 156
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 156
Gln Ser Gly Thr Leu His Arg
1 5
<210> 157
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 157
Gln Leu Ala Asn Leu Ala Arg
1 5
<210> 158
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 158
Asp Gln Thr Thr Leu Arg Arg
1 5
<210> 159
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 159
Asp Pro Ser Asn Leu Ala Arg
1 5
<210> 160
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 160
Gln Gly Gly Asn Leu Ala Leu
1 5
<210> 161
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 161
Arg Ala Asp Met Leu Arg Arg
1 5
<210> 162
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 162
Gln Lys Ala Asn Leu Gly Val
1 5
<210> 163
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 163
Arg Leu Asp Met Leu Ala Arg
1 5
<210> 164
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 164
Gln Arg Gly Asn Leu Asn Met
1 5
<210> 165
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 165
Arg Pro Gln Glu Leu Arg Arg
1 5
<210> 166
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 166
Arg Gln Asp Asn Leu Gly Arg
1 5
<210> 167
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 167
Asp Gly Gly Asn Leu Gly Arg
1 5
<210> 168
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 168
Gln Gln Gly Asn Leu Gln Leu
1 5
<210> 169
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 169
Arg Arg Gln Glu Leu Thr Arg
1 5
<210> 170
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 170
Gln Ala Ser Asn Leu Thr Arg
1 5
<210> 171
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 171
Arg Ala His Asn Leu Leu Leu
1 5
<210> 172
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 172
Gln Ser Thr Thr Leu Lys Arg
1 5
<210> 173
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 173
Gln Gly Thr Thr Leu Lys Arg
1 5
<210> 174
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 174
Gln Arg Ser Asn Leu Ala Arg
1 5
<210> 175
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 175
Arg Arg His Gly Leu Asp Arg
1 5
<210> 176
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 176
Glu Ser Gly His Leu Lys Arg
1 5
<210> 177
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 177
Gln Leu Ser Asn Leu Thr Arg
1 5
<210> 178
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 178
Asp Arg Ser Ser Leu Lys Arg
1 5
<210> 179
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 179
Val Arg His Ser Leu Thr Arg
1 5
<210> 180
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 180
Glu Ser Gly Ala Leu Arg Arg
1 5
<210> 181
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 181
cgtcgaagtc gaagtcgacc 20
<210> 182
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 182
ggacgacgtt acggacgtac 20
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 183
agacgtcgaa gtagccgtag 20
<210> 184
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 184
ggacgacgcc gatgtagaag 20
<210> 185
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 185
tgaagcagtc gacgccgaag 20
<210> 186
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 186
ggacgacgcg gtctaagaag 20
<210> 187
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 187
cgacgaggtc gcataagtag 20
<210> 188
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 188
agacgcagta taggtcgaac 20
<210> 189
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 189
agacgcagta taggacgacg 20
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 190
cggcgtagcc gatgtcgcgc 20
<210> 191
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 191
ggtcgttgcg gtagtcgaa 19
<210> 192
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 192
Gln Arg Asn Asn Leu Gly Arg
1 5
<210> 193
<211> 200
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 193
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro
100 105 110
Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu
115 120 125
Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
130 135 140
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe
145 150 155 160
Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala
165 170 175
Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu
180 185 190
Leu Asn Gln Gly Ile Pro Val Ala
195 200
<210> 194
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 194
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro
100 105 110
Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu
115 120 125
Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
130 135 140
Gln Ala Gly Glu Gly Thr
145 150
<210> 195
<211> 100
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 195
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln
100
<210> 196
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 196
Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro
1 5 10 15
Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met
20 25 30
Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala
35 40 45
Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala
50 55 60
Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
65 70 75 80
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln
85 90 95
Ala Gly Glu Gly Thr
100
<210> 197
<211> 119
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 197
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
1 5 10 15
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
20 25 30
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
35 40 45
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
50 55 60
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
65 70 75 80
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
85 90 95
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
100 105 110
Met Asp Phe Ser Ala Leu Leu
115
<210> 198
<211> 190
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 198
Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser
1 5 10 15
Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg
20 25 30
Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu
35 40 45
Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val
50 55 60
Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro
65 70 75 80
Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu
85 90 95
Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile
100 105 110
Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His
115 120 125
Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser
130 135 140
Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn
145 150 155 160
Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met
165 170 175
His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
180 185 190
<210> 199
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 199
Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu
1 5 10 15
Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu
20 25 30
Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly
35 40 45
Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu
50 55 60
Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro
65 70 75 80
Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu
85 90 95
Cys Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp
100 105 110
Thr Ser Leu Phe
115
<210> 200
<211> 66
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 200
Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr
1 5 10 15
Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr
20 25 30
Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu
35 40 45
Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser
50 55 60
Leu Phe
65
<210> 201
<211> 126
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 201
Ser Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly
1 5 10 15
Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala
20 25 30
Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr
35 40 45
Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro
50 55 60
Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro
65 70 75 80
Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met
85 90 95
Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu
100 105 110
Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala
115 120 125
<210> 202
<211> 101
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 202
Pro Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu
1 5 10 15
Glu Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu
20 25 30
Met Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly
35 40 45
Gln Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu
50 55 60
Thr Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro
65 70 75 80
Leu Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu
85 90 95
Cys Leu Leu His Ala
100
<210> 203
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 203
Ser Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
1 5 10 15
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
20 25 30
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
35 40 45
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
50 55 60
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala
65 70 75
<210> 204
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 204
Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr
1 5 10 15
Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr
20 25 30
Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu
35 40 45
Leu His Ala
50
<210> 205
<211> 316
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 205
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1 5 10 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
20 25 30
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
35 40 45
Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys
50 55 60
Lys Arg Lys Val Gly Ser Gly Gly Gly Ser Gly Gly Ser Gly Ser Val
65 70 75 80
Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala
85 90 95
Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro
100 105 110
Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly
115 120 125
Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu
130 135 140
Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu
145 150 155 160
Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile
165 170 175
Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu
180 185 190
Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala
195 200 205
Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly
210 215 220
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
225 230 235 240
Ser Gly Gly Gly Ser Gly Gly Ser Gly Ser Asp Leu Ser His Pro Pro
245 250 255
Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr
260 265 270
Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile
275 280 285
Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile
290 295 300
Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
305 310 315
<210> 206
<211> 526
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 206
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1 5 10 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
20 25 30
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
35 40 45
Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys
50 55 60
Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His
65 70 75 80
Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile
85 90 95
Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro
100 105 110
Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro
115 120 125
Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr
130 135 140
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
145 150 155 160
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
165 170 175
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
180 185 190
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
195 200 205
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
210 215 220
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
225 230 235 240
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
245 250 255
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
260 265 270
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
275 280 285
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
290 295 300
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
305 310 315 320
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser
325 330 335
Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser
340 345 350
Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg
355 360 365
Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu
370 375 380
Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val
385 390 395 400
Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro
405 410 415
Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu
420 425 430
Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile
435 440 445
Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His
450 455 460
Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser
465 470 475 480
Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn
485 490 495
Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met
500 505 510
His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520 525
<210> 207
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 207
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1 5 10
<210> 208
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 208
Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1 5 10 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
20 25 30
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
35 40 45
Asp Leu Asp Met Leu
50
<210> 209
<211> 2414
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 209
Met Ala Glu Asn Val Val Glu Pro Gly Pro Pro Ser Ala Lys Arg Pro
1 5 10 15
Lys Leu Ser Ser Pro Ala Leu Ser Ala Ser Ala Ser Asp Gly Thr Asp
20 25 30
Phe Gly Ser Leu Phe Asp Leu Glu His Asp Leu Pro Asp Glu Leu Ile
35 40 45
Asn Ser Thr Glu Leu Gly Leu Thr Asn Gly Gly Asp Ile Asn Gln Leu
50 55 60
Gln Thr Ser Leu Gly Met Val Gln Asp Ala Ala Ser Lys His Lys Gln
65 70 75 80
Leu Ser Glu Leu Leu Arg Ser Gly Ser Ser Pro Asn Leu Asn Met Gly
85 90 95
Val Gly Gly Pro Gly Gln Val Met Ala Ser Gln Ala Gln Gln Ser Ser
100 105 110
Pro Gly Leu Gly Leu Ile Asn Ser Met Val Lys Ser Pro Met Thr Gln
115 120 125
Ala Gly Leu Thr Ser Pro Asn Met Gly Met Gly Thr Ser Gly Pro Asn
130 135 140
Gln Gly Pro Thr Gln Ser Thr Gly Met Met Asn Ser Pro Val Asn Gln
145 150 155 160
Pro Ala Met Gly Met Asn Thr Gly Met Asn Ala Gly Met Asn Pro Gly
165 170 175
Met Leu Ala Ala Gly Asn Gly Gln Gly Ile Met Pro Asn Gln Val Met
180 185 190
Asn Gly Ser Ile Gly Ala Gly Arg Gly Arg Gln Asn Met Gln Tyr Pro
195 200 205
Asn Pro Gly Met Gly Ser Ala Gly Asn Leu Leu Thr Glu Pro Leu Gln
210 215 220
Gln Gly Ser Pro Gln Met Gly Gly Gln Thr Gly Leu Arg Gly Pro Gln
225 230 235 240
Pro Leu Lys Met Gly Met Met Asn Asn Pro Asn Pro Tyr Gly Ser Pro
245 250 255
Tyr Thr Gln Asn Pro Gly Gln Gln Ile Gly Ala Ser Gly Leu Gly Leu
260 265 270
Gln Ile Gln Thr Lys Thr Val Leu Ser Asn Asn Leu Ser Pro Phe Ala
275 280 285
Met Asp Lys Lys Ala Val Pro Gly Gly Gly Met Pro Asn Met Gly Gln
290 295 300
Gln Pro Ala Pro Gln Val Gln Gln Pro Gly Leu Val Thr Pro Val Ala
305 310 315 320
Gln Gly Met Gly Ser Gly Ala His Thr Ala Asp Pro Glu Lys Arg Lys
325 330 335
Leu Ile Gln Gln Gln Leu Val Leu Leu Leu His Ala His Lys Cys Gln
340 345 350
Arg Arg Glu Gln Ala Asn Gly Glu Val Arg Gln Cys Asn Leu Pro His
355 360 365
Cys Arg Thr Met Lys Asn Val Leu Asn His Met Thr His Cys Gln Ser
370 375 380
Gly Lys Ser Cys Gln Val Ala His Cys Ala Ser Ser Arg Gln Ile Ile
385 390 395 400
Ser His Trp Lys Asn Cys Thr Arg His Asp Cys Pro Val Cys Leu Pro
405 410 415
Leu Lys Asn Ala Gly Asp Lys Arg Asn Gln Gln Pro Ile Leu Thr Gly
420 425 430
Ala Pro Val Gly Leu Gly Asn Pro Ser Ser Leu Gly Val Gly Gln Gln
435 440 445
Ser Ala Pro Asn Leu Ser Thr Val Ser Gln Ile Asp Pro Ser Ser Ile
450 455 460
Glu Arg Ala Tyr Ala Ala Leu Gly Leu Pro Tyr Gln Val Asn Gln Met
465 470 475 480
Pro Thr Gln Pro Gln Val Gln Ala Lys Asn Gln Gln Asn Gln Gln Pro
485 490 495
Gly Gln Ser Pro Gln Gly Met Arg Pro Met Ser Asn Met Ser Ala Ser
500 505 510
Pro Met Gly Val Asn Gly Gly Val Gly Val Gln Thr Pro Ser Leu Leu
515 520 525
Ser Asp Ser Met Leu His Ser Ala Ile Asn Ser Gln Asn Pro Met Met
530 535 540
Ser Glu Asn Ala Ser Val Pro Ser Leu Gly Pro Met Pro Thr Ala Ala
545 550 555 560
Gln Pro Ser Thr Thr Gly Ile Arg Lys Gln Trp His Glu Asp Ile Thr
565 570 575
Gln Asp Leu Arg Asn His Leu Val His Lys Leu Val Gln Ala Ile Phe
580 585 590
Pro Thr Pro Asp Pro Ala Ala Leu Lys Asp Arg Arg Met Glu Asn Leu
595 600 605
Val Ala Tyr Ala Arg Lys Val Glu Gly Asp Met Tyr Glu Ser Ala Asn
610 615 620
Asn Arg Ala Glu Tyr Tyr His Leu Leu Ala Glu Lys Ile Tyr Lys Ile
625 630 635 640
Gln Lys Glu Leu Glu Glu Lys Arg Arg Thr Arg Leu Gln Lys Gln Asn
645 650 655
Met Leu Pro Asn Ala Ala Gly Met Val Pro Val Ser Met Asn Pro Gly
660 665 670
Pro Asn Met Gly Gln Pro Gln Pro Gly Met Thr Ser Asn Gly Pro Leu
675 680 685
Pro Asp Pro Ser Met Ile Arg Gly Ser Val Pro Asn Gln Met Met Pro
690 695 700
Arg Ile Thr Pro Gln Ser Gly Leu Asn Gln Phe Gly Gln Met Ser Met
705 710 715 720
Ala Gln Pro Pro Ile Val Pro Arg Gln Thr Pro Pro Leu Gln His His
725 730 735
Gly Gln Leu Ala Gln Pro Gly Ala Leu Asn Pro Pro Met Gly Tyr Gly
740 745 750
Pro Arg Met Gln Gln Pro Ser Asn Gln Gly Gln Phe Leu Pro Gln Thr
755 760 765
Gln Phe Pro Ser Gln Gly Met Asn Val Thr Asn Ile Pro Leu Ala Pro
770 775 780
Ser Ser Gly Gln Ala Pro Val Ser Gln Ala Gln Met Ser Ser Ser Ser
785 790 795 800
Cys Pro Val Asn Ser Pro Ile Met Pro Pro Gly Ser Gln Gly Ser His
805 810 815
Ile His Cys Pro Gln Leu Pro Gln Pro Ala Leu His Gln Asn Ser Pro
820 825 830
Ser Pro Val Pro Ser Arg Thr Pro Thr Pro His His Thr Pro Pro Ser
835 840 845
Ile Gly Ala Gln Gln Pro Pro Ala Thr Thr Ile Pro Ala Pro Val Pro
850 855 860
Thr Pro Pro Ala Met Pro Pro Gly Pro Gln Ser Gln Ala Leu His Pro
865 870 875 880
Pro Pro Arg Gln Thr Pro Thr Pro Pro Thr Thr Gln Leu Pro Gln Gln
885 890 895
Val Gln Pro Ser Leu Pro Ala Ala Pro Ser Ala Asp Gln Pro Gln Gln
900 905 910
Gln Pro Arg Ser Gln Gln Ser Thr Ala Ala Ser Val Pro Thr Pro Thr
915 920 925
Ala Pro Leu Leu Pro Pro Gln Pro Ala Thr Pro Leu Ser Gln Pro Ala
930 935 940
Val Ser Ile Glu Gly Gln Val Ser Asn Pro Pro Ser Thr Ser Ser Thr
945 950 955 960
Glu Val Asn Ser Gln Ala Ile Ala Glu Lys Gln Pro Ser Gln Glu Val
965 970 975
Lys Met Glu Ala Lys Met Glu Val Asp Gln Pro Glu Pro Ala Asp Thr
980 985 990
Gln Pro Glu Asp Ile Ser Glu Ser Lys Val Glu Asp Cys Lys Met Glu
995 1000 1005
Ser Thr Glu Thr Glu Glu Arg Ser Thr Glu Leu Lys Thr Glu Ile
1010 1015 1020
Lys Glu Glu Glu Asp Gln Pro Ser Thr Ser Ala Thr Gln Ser Ser
1025 1030 1035
Pro Ala Pro Gly Gln Ser Lys Lys Lys Ile Phe Lys Pro Glu Glu
1040 1045 1050
Leu Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln
1055 1060 1065
Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu
1070 1075 1080
Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser Pro Met Asp
1085 1090 1095
Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu
1100 1105 1110
Pro Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn Ala
1115 1120 1125
Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser
1130 1135 1140
Lys Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln
1145 1150 1155
Ser Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln
1160 1165 1170
Thr Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp
1175 1180 1185
Ala Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys
1190 1195 1200
Cys Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp
1205 1210 1215
Pro Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys
1220 1225 1230
Arg Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr
1235 1240 1245
Glu Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu
1250 1255 1260
Ile Ile Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys
1265 1270 1275
Ser Ala Arg Thr Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu
1280 1285 1290
Pro Ser Thr Arg Leu Gly Thr Phe Leu Glu Asn Arg Val Asn Asp
1295 1300 1305
Phe Leu Arg Arg Gln Asn His Pro Glu Ser Gly Glu Val Thr Val
1310 1315 1320
Arg Val Val His Ala Ser Asp Lys Thr Val Glu Val Lys Pro Gly
1325 1330 1335
Met Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu Ser Phe
1340 1345 1350
Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly
1355 1360 1365
Val Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser
1370 1375 1380
Asp Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu
1385 1390 1395
Asp Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val
1400 1405 1410
Tyr His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu
1415 1420 1425
Gly Tyr Thr Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly
1430 1435 1440
Asp Asp Tyr Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro
1445 1450 1455
Lys Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys
1460 1465 1470
Ala Val Ser Glu Arg Ile Val His Asp Tyr Lys Asp Ile Phe Lys
1475 1480 1485
Gln Ala Thr Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro Tyr
1490 1495 1500
Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys
1505 1510 1515
Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Arg Glu Glu Asn Thr
1520 1525 1530
Ser Asn Glu Ser Thr Asp Val Thr Lys Gly Asp Ser Lys Asn Ala
1535 1540 1545
Lys Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn Lys Ser Ser Leu
1550 1555 1560
Ser Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn Val Ser Asn
1565 1570 1575
Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu
1580 1585 1590
Val Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn Ser
1595 1600 1605
Leu Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu
1610 1615 1620
Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His
1625 1630 1635
Leu Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys
1640 1645 1650
Met Leu Val Glu Leu His Thr Gln Ser Gln Asp Arg Phe Val Tyr
1655 1660 1665
Thr Cys Asn Glu Cys Lys His His Val Glu Thr Arg Trp His Cys
1670 1675 1680
Thr Val Cys Glu Asp Tyr Asp Leu Cys Ile Thr Cys Tyr Asn Thr
1685 1690 1695
Lys Asn His Asp His Lys Met Glu Lys Leu Gly Leu Gly Leu Asp
1700 1705 1710
Asp Glu Ser Asn Asn Gln Gln Ala Ala Ala Thr Gln Ser Pro Gly
1715 1720 1725
Asp Ser Arg Arg Leu Ser Ile Gln Arg Cys Ile Gln Ser Leu Val
1730 1735 1740
His Ala Cys Gln Cys Arg Asn Ala Asn Cys Ser Leu Pro Ser Cys
1745 1750 1755
Gln Lys Met Lys Arg Val Val Gln His Thr Lys Gly Cys Lys Arg
1760 1765 1770
Lys Thr Asn Gly Gly Cys Pro Ile Cys Lys Gln Leu Ile Ala Leu
1775 1780 1785
Cys Cys Tyr His Ala Lys His Cys Gln Glu Asn Lys Cys Pro Val
1790 1795 1800
Pro Phe Cys Leu Asn Ile Lys Gln Lys Leu Arg Gln Gln Gln Leu
1805 1810 1815
Gln His Arg Leu Gln Gln Ala Gln Met Leu Arg Arg Arg Met Ala
1820 1825 1830
Ser Met Gln Arg Thr Gly Val Val Gly Gln Gln Gln Gly Leu Pro
1835 1840 1845
Ser Pro Thr Pro Ala Thr Pro Thr Thr Pro Thr Gly Gln Gln Pro
1850 1855 1860
Thr Thr Pro Gln Thr Pro Gln Pro Thr Ser Gln Pro Gln Pro Thr
1865 1870 1875
Pro Pro Asn Ser Met Pro Pro Tyr Leu Pro Arg Thr Gln Ala Ala
1880 1885 1890
Gly Pro Val Ser Gln Gly Lys Ala Ala Gly Gln Val Thr Pro Pro
1895 1900 1905
Thr Pro Pro Gln Thr Ala Gln Pro Pro Leu Pro Gly Pro Pro Pro
1910 1915 1920
Ala Ala Val Glu Met Ala Met Gln Ile Gln Arg Ala Ala Glu Thr
1925 1930 1935
Gln Arg Gln Met Ala His Val Gln Ile Phe Gln Arg Pro Ile Gln
1940 1945 1950
His Gln Met Pro Pro Met Thr Pro Met Ala Pro Met Gly Met Asn
1955 1960 1965
Pro Pro Pro Met Thr Arg Gly Pro Ser Gly His Leu Glu Pro Gly
1970 1975 1980
Met Gly Pro Thr Gly Met Gln Gln Gln Pro Pro Trp Ser Gln Gly
1985 1990 1995
Gly Leu Pro Gln Pro Gln Gln Leu Gln Ser Gly Met Pro Arg Pro
2000 2005 2010
Ala Met Met Ser Val Ala Gln His Gly Gln Pro Leu Asn Met Ala
2015 2020 2025
Pro Gln Pro Gly Leu Gly Gln Val Gly Ile Ser Pro Leu Lys Pro
2030 2035 2040
Gly Thr Val Ser Gln Gln Ala Leu Gln Asn Leu Leu Arg Thr Leu
2045 2050 2055
Arg Ser Pro Ser Ser Pro Leu Gln Gln Gln Gln Val Leu Ser Ile
2060 2065 2070
Leu His Ala Asn Pro Gln Leu Leu Ala Ala Phe Ile Lys Gln Arg
2075 2080 2085
Ala Ala Lys Tyr Ala Asn Ser Asn Pro Gln Pro Ile Pro Gly Gln
2090 2095 2100
Pro Gly Met Pro Gln Gly Gln Pro Gly Leu Gln Pro Pro Thr Met
2105 2110 2115
Pro Gly Gln Gln Gly Val His Ser Asn Pro Ala Met Gln Asn Met
2120 2125 2130
Asn Pro Met Gln Ala Gly Val Gln Arg Ala Gly Leu Pro Gln Gln
2135 2140 2145
Gln Pro Gln Gln Gln Leu Gln Pro Pro Met Gly Gly Met Ser Pro
2150 2155 2160
Gln Ala Gln Gln Met Asn Met Asn His Asn Thr Met Pro Ser Gln
2165 2170 2175
Phe Arg Asp Ile Leu Arg Arg Gln Gln Met Met Gln Gln Gln Gln
2180 2185 2190
Gln Gln Gly Ala Gly Pro Gly Ile Gly Pro Gly Met Ala Asn His
2195 2200 2205
Asn Gln Phe Gln Gln Pro Gln Gly Val Gly Tyr Pro Pro Gln Gln
2210 2215 2220
Gln Gln Arg Met Gln His His Met Gln Gln Met Gln Gln Gly Asn
2225 2230 2235
Met Gly Gln Ile Gly Gln Leu Pro Gln Ala Leu Gly Ala Glu Ala
2240 2245 2250
Gly Ala Ser Leu Gln Ala Tyr Gln Gln Arg Leu Leu Gln Gln Gln
2255 2260 2265
Met Gly Ser Pro Val Gln Pro Asn Pro Met Ser Pro Gln Gln His
2270 2275 2280
Met Leu Pro Asn Gln Ala Gln Ser Pro His Leu Gln Gly Gln Gln
2285 2290 2295
Ile Pro Asn Ser Leu Ser Asn Gln Val Arg Ser Pro Gln Pro Val
2300 2305 2310
Pro Ser Pro Arg Pro Gln Ser Gln Pro Pro His Ser Ser Pro Ser
2315 2320 2325
Pro Arg Met Gln Pro Gln Pro Ser Pro His His Val Ser Pro Gln
2330 2335 2340
Thr Ser Ser Pro His Pro Gly Leu Val Ala Ala Gln Ala Asn Pro
2345 2350 2355
Met Glu Gln Gly His Phe Ala Ser Pro Asp Gln Asn Ser Met Leu
2360 2365 2370
Ser Gln Leu Ala Ser Asn Pro Gly Met Ala Asn Leu His Gly Ala
2375 2380 2385
Ser Ala Thr Asp Leu Gly Leu Ser Thr Asp Asn Ser Asp Leu Asn
2390 2395 2400
Ser Asn Leu Ser Gln Ser Thr Leu Asp Ile His
2405 2410
<210> 210
<211> 617
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 210
Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr Leu Glu
1 5 10 15
Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg Gln Pro Val
20 25 30
Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser
35 40 45
Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr
50 55 60
Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn
65 70 75 80
Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser
85 90 95
Lys Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln Ser
100 105 110
Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln Thr Leu
115 120 125
Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala Thr Tyr
130 135 140
Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys Phe Asn Glu
145 150 155 160
Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp Pro Ser Gln Pro Gln
165 170 175
Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys Arg Lys Asn Asp Thr Leu
180 185 190
Asp Pro Glu Leu Phe Val Glu Cys Thr Glu Cys Gly Arg Lys Met His
195 200 205
Gln Ile Cys Val Leu His His Glu Ile Ile Trp Pro Ala Gly Phe Val
210 215 220
Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg Thr Arg Lys Glu Asn Lys
225 230 235 240
Phe Ser Ala Lys Arg Leu Pro Ser Thr Arg Leu Gly Thr Phe Leu Glu
245 250 255
Asn Arg Val Asn Asp Phe Leu Arg Arg Gln Asn His Pro Glu Ser Gly
260 265 270
Glu Val Thr Val Arg Val Val His Ala Ser Asp Lys Thr Val Glu Val
275 280 285
Lys Pro Gly Met Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu
290 295 300
Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp
305 310 315 320
Gly Val Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser
325 330 335
Asp Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu Asp
340 345 350
Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val Tyr His
355 360 365
Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr Thr
370 375 380
Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile
385 390 395 400
Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu
405 410 415
Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala Val Ser Glu Arg Ile
420 425 430
Val His Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu
435 440 445
Thr Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn
450 455 460
Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu Arg
465 470 475 480
Lys Arg Glu Glu Asn Thr Ser Asn Glu Ser Thr Asp Val Thr Lys Gly
485 490 495
Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn
500 505 510
Lys Ser Ser Leu Ser Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn
515 520 525
Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His
530 535 540
Lys Glu Val Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn
545 550 555 560
Ser Leu Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu
565 570 575
Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Leu
580 585 590
Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys Met Leu
595 600 605
Val Glu Leu His Thr Gln Ser Gln Asp
610 615
<210> 211
<211> 308
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 211
Val Asn Lys Phe Leu Arg Arg Gln Asn His Pro Glu Ala Gly Glu Val
1 5 10 15
Phe Val Arg Val Val Ala Ser Ser Asp Lys Thr Val Glu Val Lys Pro
20 25 30
Gly Met Lys Ser Arg Phe Val Asp Ser Gly Glu Met Ser Glu Ser Phe
35 40 45
Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val
50 55 60
Asp Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Asp Cys
65 70 75 80
Pro Pro Pro Asn Thr Arg Arg Val Tyr Ile Ser Tyr Leu Asp Ser Ile
85 90 95
His Phe Phe Arg Pro Arg Cys Leu Arg Thr Ala Val Tyr His Glu Ile
100 105 110
Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr Val Thr Gly
115 120 125
His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His
130 135 140
Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu
145 150 155 160
Trp Tyr Lys Lys Met Leu Asp Lys Ala Phe Ala Glu Arg Ile Ile His
165 170 175
Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu Thr Ser
180 185 190
Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu
195 200 205
Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu Arg Lys Lys
210 215 220
Glu Glu Ser Thr Ala Ala Ser Glu Thr Thr Glu Gly Ser Gln Gly Asp
225 230 235 240
Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Asn Lys Asn Lys
245 250 255
Ser Ser Ile Ser Arg Ala Asn Lys Lys Lys Pro Ser Met Pro Asn Val
260 265 270
Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys
275 280 285
Glu Val Phe Phe Val Ile His Leu His Ala Gly Pro Val Ile Asn Thr
290 295 300
Leu Pro Pro Ile
305
<210> 212
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 212
Val Asn Asn Phe Leu Lys Lys Lys Glu Ala Gly Ala Gly Glu Val His
1 5 10 15
Ile Arg Val Val Ser Ser Ser Asp Lys Cys Val Glu Val Lys Pro Gly
20 25 30
Met Arg Arg Arg Phe Val Glu Gln Gly Glu Met Met Asn Glu Phe Pro
35 40 45
Tyr Arg Ala Lys Ala Leu Phe Ala Phe Glu Glu Val Asp Gly Ile Asp
50 55 60
Val Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Glu Cys Pro
65 70 75 80
Ala Pro Asn Thr Arg Arg Val Tyr Ile Ala Tyr Leu Asp Ser Val His
85 90 95
Phe Phe Arg Pro Arg Gln Tyr Arg Thr Ala Val Tyr His Glu Ile Leu
100 105 110
Leu Gly Tyr Met Asp Tyr Val Lys Gln Leu Gly Tyr Thr Met Ala His
115 120 125
Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys
130 135 140
His Pro Thr Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp
145 150 155 160
Tyr Lys Lys Met Leu Asp Lys Gly Met Ile Glu Arg Ile Ile Gln Asp
165 170 175
Tyr Lys Asp Ile Leu Lys Gln Ala Met Glu Asp Lys Leu Gly Ser Ala
180 185 190
Ala Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn Val Leu Glu
195 200 205
Glu Ser Ile Lys Glu Leu Asp Gln Glu Glu Glu Glu Lys Arg Lys Gln
210 215 220
Ala Glu Ala Ala Glu Ala Ala Ala Ala Ala Asn Leu Phe Ser Ile Glu
225 230 235 240
Glu Asn Glu Val Ser Gly Asp Gly Lys Lys Lys Gly Gln Lys Lys Ala
245 250 255
Lys Lys Ser Asn Lys Ser Lys Ala Ala Gln Arg Lys Asn Ser Lys Lys
260 265 270
Ser Asn Glu His Gln Ser Gly Asn Asp Leu Ser Thr Lys Ile Tyr Ala
275 280 285
Thr Met Glu Lys His Lys Glu Val Phe Phe Val Ile Arg Leu His Ser
290 295 300
Ala Gln Ser Ala Ala Ser Leu Ala Pro Ile
305 310
<210> 213
<211> 634
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 213
Asn Gly Lys Tyr Ser Asp Pro Trp Glu Tyr Val Asp Asp Val Trp Leu
1 5 10 15
Met Phe Asp Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr
20 25 30
Arg Tyr Cys Thr Lys Leu Ser Glu Val Phe Glu Ala Glu Ile Asp Pro
35 40 45
Val Met Gln Ala Leu Gly Tyr Cys Cys Gly Arg Lys Tyr Thr Phe Asn
50 55 60
Pro Gln Val Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg
65 70 75 80
Asp Ala Lys Tyr Tyr Ser Tyr Gln Asn Arg Tyr Thr Tyr Cys Gln Lys
85 90 95
Cys Phe Asn Asp Ile Gln Gly Asp Thr Val Thr Leu Gly Asp Asp Pro
100 105 110
Leu Gln Ser Gln Thr Gln Ile Lys Lys Asp Gln Phe Lys Glu Met Lys
115 120 125
Asn Asp His Leu Glu Leu Glu Pro Phe Val Asn Cys Gln Glu Cys Gly
130 135 140
Arg Lys Gln His Gln Ile Cys Val Leu Trp Leu Asp Ser Ile Trp Pro
145 150 155 160
Gly Gly Phe Val Cys Asp Asn Cys Leu Lys Lys Lys Asn Ser Lys Arg
165 170 175
Lys Glu Asn Lys Phe Asn Ala Lys Arg Leu Pro Thr Thr Lys Leu Gly
180 185 190
Val Tyr Ile Glu Thr Arg Val Asn Asn Phe Leu Lys Lys Lys Glu Ala
195 200 205
Gly Ala Gly Glu Val His Ile Arg Val Val Ser Ser Ser Asp Lys Cys
210 215 220
Val Glu Val Lys Pro Gly Met Arg Arg Arg Phe Val Glu Gln Gly Glu
225 230 235 240
Met Met Asn Glu Phe Pro Tyr Arg Ala Lys Ala Leu Phe Ala Phe Glu
245 250 255
Glu Val Asp Gly Ile Asp Val Cys Phe Phe Gly Met His Val Gln Glu
260 265 270
Tyr Gly Ser Glu Cys Pro Ala Pro Asn Thr Arg Arg Val Tyr Ile Ala
275 280 285
Tyr Leu Asp Ser Val His Phe Phe Arg Pro Arg Gln Tyr Arg Thr Ala
290 295 300
Val Tyr His Glu Ile Leu Leu Gly Tyr Met Asp Tyr Val Lys Gln Leu
305 310 315 320
Gly Tyr Thr Met Ala His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp
325 330 335
Asp Tyr Ile Phe His Cys His Pro Thr Asp Gln Lys Ile Pro Lys Pro
340 345 350
Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Gly Met Ile
355 360 365
Glu Arg Ile Ile Gln Asp Tyr Lys Asp Ile Leu Lys Gln Ala Met Glu
370 375 380
Asp Lys Leu Gly Ser Ala Ala Glu Leu Pro Tyr Phe Glu Gly Asp Phe
385 390 395 400
Trp Pro Asn Val Leu Glu Glu Ser Ile Lys Glu Leu Asp Gln Glu Glu
405 410 415
Glu Glu Lys Arg Lys Gln Ala Glu Ala Ala Glu Ala Ala Ala Ala Ala
420 425 430
Asn Leu Phe Ser Ile Glu Glu Asn Glu Val Ser Gly Asp Gly Lys Lys
435 440 445
Lys Gly Gln Lys Lys Ala Lys Lys Ser Asn Lys Ser Lys Ala Ala Gln
450 455 460
Arg Lys Asn Ser Lys Lys Ser Asn Glu His Gln Ser Gly Asn Asp Leu
465 470 475 480
Ser Thr Lys Ile Tyr Ala Thr Met Glu Lys His Lys Glu Val Phe Phe
485 490 495
Val Ile Arg Leu His Ser Ala Gln Ser Ala Ala Ser Leu Ala Pro Ile
500 505 510
Gln Asp Pro Asp Pro Leu Leu Thr Cys Asp Leu Met Asp Gly Arg Asp
515 520 525
Ala Phe Leu Thr Leu Ala Arg Asp Lys His Phe Glu Phe Ser Ser Leu
530 535 540
Arg Arg Ala Gln Phe Ser Thr Leu Ser Met Leu Tyr Glu Leu His Asn
545 550 555 560
Gln Gly Gln Asp Lys Phe Val Tyr Thr Cys Asn His Cys Lys Thr Ala
565 570 575
Val Glu Thr Arg Tyr His Cys Thr Val Cys Asp Asp Phe Asp Leu Cys
580 585 590
Ile Val Cys Lys Glu Lys Val Gly His Gln His Lys Met Glu Lys Leu
595 600 605
Gly Phe Asp Ile Asp Asp Gly Ser Ala Leu Ala Asp His Lys Gln Ala
610 615 620
Asn Pro Gln Glu Ala Arg Lys Gln Ser Ile
625 630
<210> 214
<211> 382
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 214
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Ser Gly Gly Gly Ser
65 70 75 80
Gly Gly Ser Gly Ser Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser
85 90 95
Val Gln Val Lys Arg Val Leu Glu Lys Ser Pro Gly Lys Leu Leu Val
100 105 110
Lys Met Pro Phe Gln Ala Ser Pro Gly Gly Lys Gly Glu Gly Gly Gly
115 120 125
Ala Thr Thr Ser Ala Gln Val Met Val Ile Lys Arg Pro Gly Arg Lys
130 135 140
Arg Lys Ala Glu Ala Asp Pro Gln Ala Ile Pro Lys Lys Arg Gly Arg
145 150 155 160
Lys Pro Gly Ser Val Val Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys
165 170 175
Ala Val Lys Glu Ser Ser Ile Arg Ser Val Gln Glu Thr Val Leu Pro
180 185 190
Ile Lys Lys Arg Lys Thr Arg Glu Thr Val Ser Ile Glu Val Lys Glu
195 200 205
Val Val Lys Pro Leu Leu Val Ser Thr Leu Gly Glu Lys Ser Gly Lys
210 215 220
Gly Leu Lys Thr Cys Lys Ser Pro Gly Arg Lys Ser Lys Glu Ser Ser
225 230 235 240
Pro Lys Gly Arg Ser Ser Ser Ala Ser Ser Pro Pro Lys Lys Glu His
245 250 255
His His His His His His Ala Glu Ser Pro Lys Ala Pro Met Pro Leu
260 265 270
Leu Pro Pro Pro Pro Pro Pro Glu Pro Gln Ser Ser Glu Asp Pro Ile
275 280 285
Ser Pro Pro Glu Pro Gln Asp Leu Ser Ser Ser Ile Cys Lys Glu Glu
290 295 300
Lys Met Pro Arg Ala Gly Ser Leu Glu Ser Asp Gly Cys Pro Lys Glu
305 310 315 320
Pro Ala Lys Thr Gln Pro Met Val Ala Ala Ala Ala Thr Thr Thr Thr
325 330 335
Thr Thr Thr Thr Thr Val Ala Glu Lys Tyr Lys His Arg Gly Glu Gly
340 345 350
Glu Arg Lys Asp Ile Val Ser Ser Ser Met Pro Arg Pro Asn Arg Glu
355 360 365
Glu Pro Val Asp Ser Arg Thr Pro Val Thr Glu Arg Val Ser
370 375 380
<210> 215
<211> 74
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 215
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val
65 70
<210> 216
<211> 296
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 216
Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Val Gln Val Lys Arg Val
1 5 10 15
Leu Glu Lys Ser Pro Gly Lys Leu Leu Val Lys Met Pro Phe Gln Ala
20 25 30
Ser Pro Gly Gly Lys Gly Glu Gly Gly Gly Ala Thr Thr Ser Ala Gln
35 40 45
Val Met Val Ile Lys Arg Pro Gly Arg Lys Arg Lys Ala Glu Ala Asp
50 55 60
Pro Gln Ala Ile Pro Lys Lys Arg Gly Arg Lys Pro Gly Ser Val Val
65 70 75 80
Ala Ala Ala Ala Ala Glu Ala Lys Lys Lys Ala Val Lys Glu Ser Ser
85 90 95
Ile Arg Ser Val Gln Glu Thr Val Leu Pro Ile Lys Lys Arg Lys Thr
100 105 110
Arg Glu Thr Val Ser Ile Glu Val Lys Glu Val Val Lys Pro Leu Leu
115 120 125
Val Ser Thr Leu Gly Glu Lys Ser Gly Lys Gly Leu Lys Thr Cys Lys
130 135 140
Ser Pro Gly Arg Lys Ser Lys Glu Ser Ser Pro Lys Gly Arg Ser Ser
145 150 155 160
Ser Ala Ser Ser Pro Pro Lys Lys Glu His His His His His His His
165 170 175
Ala Glu Ser Pro Lys Ala Pro Met Pro Leu Leu Pro Pro Pro Pro Pro
180 185 190
Pro Glu Pro Gln Ser Ser Glu Asp Pro Ile Ser Pro Pro Glu Pro Gln
195 200 205
Asp Leu Ser Ser Ser Ile Cys Lys Glu Glu Lys Met Pro Arg Ala Gly
210 215 220
Ser Leu Glu Ser Asp Gly Cys Pro Lys Glu Pro Ala Lys Thr Gln Pro
225 230 235 240
Met Val Ala Ala Ala Ala Thr Thr Thr Thr Thr Thr Thr Thr Thr Val
245 250 255
Ala Glu Lys Tyr Lys His Arg Gly Glu Gly Glu Arg Lys Asp Ile Val
260 265 270
Ser Ser Ser Met Pro Arg Pro Asn Arg Glu Glu Pro Val Asp Ser Arg
275 280 285
Thr Pro Val Thr Glu Arg Val Ser
290 295
<210> 217
<211> 792
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 217
Met Lys Gly Asp Thr Arg His Leu Asn Gly Glu Glu Asp Ala Gly Gly
1 5 10 15
Arg Glu Asp Ser Ile Leu Val Asn Gly Ala Cys Ser Asp Gln Ser Ser
20 25 30
Asp Ser Pro Pro Ile Leu Glu Ala Ile Arg Thr Pro Glu Ile Arg Gly
35 40 45
Arg Arg Ser Ser Ser Arg Leu Ser Lys Arg Glu Val Ser Ser Leu Leu
50 55 60
Ser Tyr Thr Gln Asp Leu Thr Gly Asp Gly Asp Gly Glu Asp Gly Asp
65 70 75 80
Gly Ser Asp Thr Pro Val Met Pro Lys Leu Phe Arg Glu Thr Arg Thr
85 90 95
Arg Ser Glu Ser Pro Ala Val Arg Thr Arg Asn Asn Asn Ser Val Ser
100 105 110
Ser Arg Glu Arg His Arg Pro Ser Pro Arg Ser Thr Arg Gly Arg Gln
115 120 125
Gly Arg Asn His Val Asp Glu Ser Pro Val Glu Phe Pro Ala Thr Arg
130 135 140
Ser Leu Arg Arg Arg Ala Thr Ala Ser Ala Gly Thr Pro Trp Pro Ser
145 150 155 160
Pro Pro Ser Ser Tyr Leu Thr Ile Asp Leu Thr Asp Asp Thr Glu Asp
165 170 175
Thr His Gly Thr Pro Gln Ser Ser Ser Thr Pro Tyr Ala Arg Leu Ala
180 185 190
Gln Asp Ser Gln Gln Gly Gly Met Glu Ser Pro Gln Val Glu Ala Asp
195 200 205
Ser Gly Asp Gly Asp Ser Ser Glu Tyr Gln Asp Gly Lys Glu Phe Gly
210 215 220
Ile Gly Asp Leu Val Trp Gly Lys Ile Lys Gly Phe Ser Trp Trp Pro
225 230 235 240
Ala Met Val Val Ser Trp Lys Ala Thr Ser Lys Arg Gln Ala Met Ser
245 250 255
Gly Met Arg Trp Val Gln Trp Phe Gly Asp Gly Lys Phe Ser Glu Val
260 265 270
Ser Ala Asp Lys Leu Val Ala Leu Gly Leu Phe Ser Gln His Phe Asn
275 280 285
Leu Ala Thr Phe Asn Lys Leu Val Ser Tyr Arg Lys Ala Met Tyr His
290 295 300
Ala Leu Glu Lys Ala Arg Val Arg Ala Gly Lys Thr Phe Pro Ser Ser
305 310 315 320
Pro Gly Asp Ser Leu Glu Asp Gln Leu Lys Pro Met Leu Glu Trp Ala
325 330 335
His Gly Gly Phe Lys Pro Thr Gly Ile Glu Gly Leu Lys Pro Asn Asn
340 345 350
Thr Gln Pro Glu Asn Lys Thr Arg Arg Arg Thr Ala Asp Asp Ser Ala
355 360 365
Thr Ser Asp Tyr Cys Pro Ala Pro Lys Arg Leu Lys Thr Asn Cys Tyr
370 375 380
Asn Asn Gly Lys Asp Arg Gly Asp Glu Asp Gln Ser Arg Glu Gln Met
385 390 395 400
Ala Ser Asp Val Ala Asn Asn Lys Ser Ser Leu Glu Asp Gly Cys Leu
405 410 415
Ser Cys Gly Arg Lys Asn Pro Val Ser Phe His Pro Leu Phe Glu Gly
420 425 430
Gly Leu Cys Gln Thr Cys Arg Asp Arg Phe Leu Glu Leu Phe Tyr Met
435 440 445
Tyr Asp Asp Asp Gly Tyr Gln Ser Tyr Cys Thr Val Cys Cys Glu Gly
450 455 460
Arg Glu Leu Leu Leu Cys Ser Asn Thr Ser Cys Cys Arg Cys Phe Cys
465 470 475 480
Val Glu Cys Leu Glu Val Leu Val Gly Thr Gly Thr Ala Ala Glu Ala
485 490 495
Lys Leu Gln Glu Pro Trp Ser Cys Tyr Met Cys Leu Pro Gln Arg Cys
500 505 510
His Gly Val Leu Arg Arg Arg Lys Asp Trp Asn Val Arg Leu Gln Ala
515 520 525
Phe Phe Thr Ser Asp Thr Gly Leu Glu Tyr Glu Ala Pro Lys Leu Tyr
530 535 540
Pro Ala Ile Pro Ala Ala Arg Arg Arg Pro Ile Arg Val Leu Ser Leu
545 550 555 560
Phe Asp Gly Ile Ala Thr Gly Tyr Leu Val Leu Lys Glu Leu Gly Ile
565 570 575
Lys Val Gly Lys Tyr Val Ala Ser Glu Val Cys Glu Glu Ser Ile Ala
580 585 590
Val Gly Thr Val Lys His Glu Gly Asn Ile Lys Tyr Val Asn Asp Val
595 600 605
Arg Asn Ile Thr Lys Lys Asn Ile Glu Glu Trp Gly Pro Phe Asp Leu
610 615 620
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Asn Val Asn Pro Ala
625 630 635 640
Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr
645 650 655
His Leu Leu Asn Tyr Ser Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe
660 665 670
Phe Trp Met Phe Glu Asn Val Val Ala Met Lys Val Gly Asp Lys Arg
675 680 685
Asp Ile Ser Arg Phe Leu Glu Cys Asn Pro Val Met Ile Asp Ala Ile
690 695 700
Lys Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro
705 710 715 720
Gly Met Asn Arg Pro Val Ile Ala Ser Lys Asn Asp Lys Leu Glu Leu
725 730 735
Gln Asp Cys Leu Glu Tyr Asn Arg Ile Ala Lys Asp Leu Trp Leu Ser
740 745 750
Cys Ala Leu His Arg Arg Val Gln His Gly Pro Trp Cys Pro Pro Glu
755 760 765
Ala Ala Gly Lys Val Leu Glu Arg Ala Cys His Pro Thr Pro Leu Arg
770 775 780
Pro Ser Glu Gly Leu Leu Cys Met
785 790
<210> 218
<211> 1084
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 218
Met Ser Ser Gln Ser His Pro Asp Gly Leu Ser Gly Arg Asp Gln Pro
1 5 10 15
Val Glu Leu Leu Asn Pro Ala Arg Val Asn His Met Pro Ser Thr Val
20 25 30
Asp Val Ala Thr Ala Leu Pro Leu Gln Val Ala Pro Ser Ala Val Pro
35 40 45
Met Asp Leu Arg Leu Asp His Gln Phe Ser Leu Pro Val Ala Glu Pro
50 55 60
Ala Leu Arg Glu Gln Gln Leu Gln Gln Glu Leu Leu Ala Leu Lys Gln
65 70 75 80
Lys Gln Gln Ile Gln Arg Gln Ile Leu Ile Ala Glu Phe Gln Arg Gln
85 90 95
His Glu Gln Leu Ser Arg Gln His Glu Ala Gln Leu His Glu His Ile
100 105 110
Lys Gln Gln Gln Glu Met Leu Ala Met Lys His Gln Gln Glu Leu Leu
115 120 125
Glu His Gln Arg Lys Leu Glu Arg His Arg Gln Glu Gln Glu Leu Glu
130 135 140
Lys Gln His Arg Glu Gln Lys Leu Gln Gln Leu Lys Asn Lys Glu Lys
145 150 155 160
Gly Lys Glu Ser Ala Val Ala Ser Thr Glu Val Lys Met Lys Leu Gln
165 170 175
Glu Phe Val Leu Asn Lys Lys Lys Ala Leu Ala His Arg Asn Leu Asn
180 185 190
His Cys Ile Ser Ser Asp Pro Arg Tyr Trp Tyr Gly Lys Thr Gln His
195 200 205
Ser Ser Leu Asp Gln Ser Ser Pro Pro Gln Ser Gly Val Ser Thr Ser
210 215 220
Tyr Asn His Pro Val Leu Gly Met Tyr Asp Ala Lys Asp Asp Phe Pro
225 230 235 240
Leu Arg Lys Thr Ala Ser Glu Pro Asn Leu Lys Leu Arg Ser Arg Leu
245 250 255
Lys Gln Lys Val Ala Glu Arg Arg Ser Ser Pro Leu Leu Arg Arg Lys
260 265 270
Asp Gly Pro Val Val Thr Ala Leu Lys Lys Arg Pro Leu Asp Val Thr
275 280 285
Asp Ser Ala Cys Ser Ser Ala Pro Gly Ser Gly Pro Ser Ser Pro Asn
290 295 300
Asn Ser Ser Gly Ser Val Ser Ala Glu Asn Gly Ile Ala Pro Ala Val
305 310 315 320
Pro Ser Ile Pro Ala Glu Thr Ser Leu Ala His Arg Leu Val Ala Arg
325 330 335
Glu Gly Ser Ala Ala Pro Leu Pro Leu Tyr Thr Ser Pro Ser Leu Pro
340 345 350
Asn Ile Thr Leu Gly Leu Pro Ala Thr Gly Pro Ser Ala Gly Thr Ala
355 360 365
Gly Gln Gln Asp Thr Glu Arg Leu Thr Leu Pro Ala Leu Gln Gln Arg
370 375 380
Leu Ser Leu Phe Pro Gly Thr His Leu Thr Pro Tyr Leu Ser Thr Ser
385 390 395 400
Pro Leu Glu Arg Asp Gly Gly Ala Ala His Ser Pro Leu Leu Gln His
405 410 415
Met Val Leu Leu Glu Gln Pro Pro Ala Gln Ala Pro Leu Val Thr Gly
420 425 430
Leu Gly Ala Leu Pro Leu His Ala Gln Ser Leu Val Gly Ala Asp Arg
435 440 445
Val Ser Pro Ser Ile His Lys Leu Arg Gln His Arg Pro Leu Gly Arg
450 455 460
Thr Gln Ser Ala Pro Leu Pro Gln Asn Ala Gln Ala Leu Gln His Leu
465 470 475 480
Val Ile Gln Gln Gln His Gln Gln Phe Leu Glu Lys His Lys Gln Gln
485 490 495
Phe Gln Gln Gln Gln Leu Gln Met Asn Lys Ile Ile Pro Lys Pro Ser
500 505 510
Glu Pro Ala Arg Gln Pro Glu Ser His Pro Glu Glu Thr Glu Glu Glu
515 520 525
Leu Arg Glu His Gln Ala Leu Leu Asp Glu Pro Tyr Leu Asp Arg Leu
530 535 540
Pro Gly Gln Lys Glu Ala His Ala Gln Ala Gly Val Gln Val Lys Gln
545 550 555 560
Glu Pro Ile Glu Ser Asp Glu Glu Glu Ala Glu Pro Pro Arg Glu Val
565 570 575
Glu Pro Gly Gln Arg Gln Pro Ser Glu Gln Glu Leu Leu Phe Arg Gln
580 585 590
Gln Ala Leu Leu Leu Glu Gln Gln Arg Ile His Gln Leu Arg Asn Tyr
595 600 605
Gln Ala Ser Met Glu Ala Ala Gly Ile Pro Val Ser Phe Gly Gly His
610 615 620
Arg Pro Leu Ser Arg Ala Gln Ser Ser Pro Ala Ser Ala Thr Phe Pro
625 630 635 640
Val Ser Val Gln Glu Pro Pro Thr Lys Pro Arg Phe Thr Thr Gly Leu
645 650 655
Val Tyr Asp Thr Leu Met Leu Lys His Gln Cys Thr Cys Gly Ser Ser
660 665 670
Ser Ser His Pro Glu His Ala Gly Arg Ile Gln Ser Ile Trp Ser Arg
675 680 685
Leu Gln Glu Thr Gly Leu Arg Gly Lys Cys Glu Cys Ile Arg Gly Arg
690 695 700
Lys Ala Thr Leu Glu Glu Leu Gln Thr Val His Ser Glu Ala His Thr
705 710 715 720
Leu Leu Tyr Gly Thr Asn Pro Leu Asn Arg Gln Lys Leu Asp Ser Lys
725 730 735
Lys Leu Leu Gly Ser Leu Ala Ser Val Phe Val Arg Leu Pro Cys Gly
740 745 750
Gly Val Gly Val Asp Ser Asp Thr Ile Trp Asn Glu Val His Ser Ala
755 760 765
Gly Ala Ala Arg Leu Ala Val Gly Cys Val Val Glu Leu Val Phe Lys
770 775 780
Val Ala Thr Gly Glu Leu Lys Asn Gly Phe Ala Val Val Arg Pro Pro
785 790 795 800
Gly His His Ala Glu Glu Ser Thr Pro Met Gly Phe Cys Tyr Phe Asn
805 810 815
Ser Val Ala Val Ala Ala Lys Leu Leu Gln Gln Arg Leu Ser Val Ser
820 825 830
Lys Ile Leu Ile Val Asp Trp Asp Val His His Gly Asn Gly Thr Gln
835 840 845
Gln Ala Phe Tyr Ser Asp Pro Ser Val Leu Tyr Met Ser Leu His Arg
850 855 860
Tyr Asp Asp Gly Asn Phe Phe Pro Gly Ser Gly Ala Pro Asp Glu Val
865 870 875 880
Gly Thr Gly Pro Gly Val Gly Phe Asn Val Asn Met Ala Phe Thr Gly
885 890 895
Gly Leu Asp Pro Pro Met Gly Asp Ala Glu Tyr Leu Ala Ala Phe Arg
900 905 910
Thr Val Val Met Pro Ile Ala Ser Glu Phe Ala Pro Asp Val Val Leu
915 920 925
Val Ser Ser Gly Phe Asp Ala Val Glu Gly His Pro Thr Pro Leu Gly
930 935 940
Gly Tyr Asn Leu Ser Ala Arg Cys Phe Gly Tyr Leu Thr Lys Gln Leu
945 950 955 960
Met Gly Leu Ala Gly Gly Arg Ile Val Leu Ala Leu Glu Gly Gly His
965 970 975
Asp Leu Thr Ala Ile Cys Asp Ala Ser Glu Ala Cys Val Ser Ala Leu
980 985 990
Leu Gly Asn Glu Leu Asp Pro Leu Pro Glu Lys Val Leu Gln Gln Arg
995 1000 1005
Pro Asn Ala Asn Ala Val Arg Ser Met Glu Lys Val Met Glu Ile
1010 1015 1020
His Ser Lys Tyr Trp Arg Cys Leu Gln Arg Thr Thr Ser Thr Ala
1025 1030 1035
Gly Arg Ser Leu Ile Glu Ala Gln Thr Cys Glu Asn Glu Glu Ala
1040 1045 1050
Glu Thr Val Thr Ala Met Ala Ser Leu Ser Val Gly Val Lys Pro
1055 1060 1065
Ala Glu Lys Arg Pro Asp Glu Glu Pro Met Glu Glu Glu Pro Pro
1070 1075 1080
Leu
<210> 219
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(9)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (11)..(23)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (25)..(30)
<223> Xaa can be any naturally occurring amino acid
<400> 219
Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa His
20 25 30
<210> 220
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (1)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(6)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (20)..(22)
<223> Xaa can be any naturally occurring amino acid
<400> 220
Xaa Xaa Xaa Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa His Xaa Xaa Xaa His
20
<210> 221
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (16)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (44)..(50)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (72)..(78)
<223> Xaa can be any naturally occurring amino acid
<400> 221
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 222
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (16)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (44)..(50)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (72)..(78)
<223> Xaa can be any naturally occurring amino acid
<400> 222
Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 223
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 223
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gly
1 5 10 15
Arg Gln Ala Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Asp Lys Ala Asn Leu
35 40 45
Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Gln Arg Asn Asn Leu Gly Arg His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 224
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 224
Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Arg
1 5 10 15
Gln Asp Arg Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gln Lys Glu His Leu
35 40 45
Ala Gly His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Arg Arg Asp Asn Leu Asn Arg His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 225
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 225
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Arg
1 5 10 15
Gln Asp Arg Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Gln Lys Glu His Leu
35 40 45
Ala Gly His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Arg Arg Asp Asn Leu Asn Arg His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 226
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 226
Gly Glu Ala Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Thr
1 5 10 15
Gly Gln Ile Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Val Ala His Ser Leu
35 40 45
Lys Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Asp Pro Ser Asn Leu Arg Arg His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 227
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 227
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Thr
1 5 10 15
Gly Gln Ile Leu Asp Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Ala Asn Phe Ser Val Ala His Ser Leu
35 40 45
Lys Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Ala Asn Phe Ser Asp Pro Ser Asn Leu Arg Arg His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 228
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 228
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg
1 5 10 15
Gln Ser Asn Leu Ser Arg His Thr Arg Thr His Thr Gly Glu Lys Pro
20 25 30
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Asn Glu His Leu
35 40 45
Val Leu His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
50 55 60
Ile Cys Met Arg Asn Phe Ser Gln Lys Thr Gly Leu Arg Val His Leu
65 70 75 80
Lys Thr His Leu Arg
85
<210> 229
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 229
cgaagacgct g 11
<210> 230
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 230
agagtgagga c 11
<210> 231
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 231
acagtgagga c 11
<210> 232
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 232
atagtgagga c 11
<210> 233
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 233
agacgctgct c 11
<210> 234
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 234
tgacgctgct t 11
<210> 235
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 235
agacggtgct c 11
<210> 236
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 236
acacgctgct c 11
<210> 237
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 237
agacgctact c 11
<210> 238
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 238
agacgctgct a 11
<210> 239
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 239
agactctgct c 11
<210> 240
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 240
attatgggag a 11
<210> 241
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 241
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg
180
<210> 242
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 242
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
50 55 60
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu
165 170 175
Thr Thr Met Arg
180
<210> 243
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 243
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr
1 5 10 15
Ile Val Val Ser Met Thr Gly Arg Asp Lys Thr Glu Gln Ala Gly Glu
20 25 30
Ile Gln Val Leu Ser Thr Val Thr Gln Ser Phe Leu Gly Thr Ser Ile
35 40 45
Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu
50 55 60
Ala Gly Ser Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu Gly
65 70 75 80
Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu Pro
85 90 95
Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu Ser
115 120 125
Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu
130 135 140
Cys Pro Arg Gly His Ala Val Gly Val Phe Arg Ala Ala Val Cys Ser
145 150 155 160
Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu Asp
165 170 175
Ile Val Thr Arg
180
<210> 244
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 244
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr
1 5 10 15
Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Val Val Thr Gly Glu
20 25 30
Val Gln Val Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Thr Thr Val
35 40 45
Gly Gly Val Ile Trp Thr Val Tyr His Gly Ala Gly Ser Arg Thr Leu
50 55 60
Ala Gly Ala Lys His Pro Ala Leu Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Lys Ser Leu Glu Pro
85 90 95
Cys Ala Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Asp Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Ser Thr Ala Ser Leu Leu Ser
115 120 125
Pro Arg Pro Leu Ala Cys Leu Lys Gly Ser Ser Gly Gly Pro Val Met
130 135 140
Cys Pro Ser Gly His Val Ala Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ser Leu Gln Phe Ile Pro Val Glu Thr Leu Ser
165 170 175
Thr Gln Ala Arg
180
<210> 245
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 245
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Phe Ser Thr
1 5 10 15
Ile Val Thr Ser Leu Thr Gly Arg Asp Thr Asn Glu Asn Cys Gly Glu
20 25 30
Val Gln Val Leu Ser Thr Ala Thr Gln Ser Phe Leu Gly Thr Ala Val
35 40 45
Asn Gly Val Met Trp Thr Val Tyr His Gly Ala Gly Ala Lys Thr Ile
50 55 60
Ser Gly Pro Lys Gly Pro Val Asn Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Val Arg Ser Leu Ala Pro
85 90 95
Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Thr Arg Gly Ala Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Ile Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Met Gly His Arg Ala Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Leu Glu
165 170 175
Thr Thr Met Arg
180
<210> 246
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 246
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Val Leu Gly Ala
1 5 10 15
Ile Val Leu Ser Leu Thr Gly Arg Asp Lys Asn Glu Ala Glu Gly Glu
20 25 30
Val Gln Phe Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Ile Cys Ile
35 40 45
Asn Gly Val Met Trp Thr Leu Phe His Gly Ala Gly Ser Lys Thr Leu
50 55 60
Ala Gly Pro Lys Gly Pro Val Val Gln Met Tyr Thr Asn Val Asp Lys
65 70 75 80
Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Lys Gly Ser Leu Thr Arg
85 90 95
Cys Thr Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Thr Arg Ala Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Ile Met
130 135 140
Cys Pro Ser Gly His Val Val Gly Val Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Leu Glu Phe Val Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg
180
<210> 247
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 247
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Val Gly Thr
1 5 10 15
Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Glu Ala Glu Gly Glu
20 25 30
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Thr Ile
35 40 45
Asn Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Ser Lys Asn Leu
50 55 60
Ala Gly Pro Lys Gly Pro Val Cys Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Leu Gly Ala Arg Ser Leu Ala Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Gly Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Thr Arg Ala Ala Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Leu Met
130 135 140
Cys Pro Ser Gly His Val Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Leu Asp Phe Ile Pro Val Glu Asn Met Asp
165 170 175
Thr Thr Met Arg
180
<210> 248
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 248
Ala Pro Ile Ser Ala Tyr Ala Gln Gln Thr Arg Gly Leu Ile Ser Thr
1 5 10 15
Leu Val Val Ser Leu Thr Gly Arg Asp Lys Asn Glu Thr Ala Gly Glu
20 25 30
Val Gln Val Leu Ser Thr Ser Thr Gln Thr Phe Leu Gly Thr Asn Val
35 40 45
Gly Gly Val Met Trp Gly Pro Tyr His Gly Ala Gly Thr Arg Thr Val
50 55 60
Ala Gly Arg Gly Gly Pro Val Leu Gln Met Tyr Thr Ser Val Ser Asp
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ser Lys Ser Leu Glu Pro
85 90 95
Cys Ser Cys Gly Ser Ala Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp
100 105 110
Val Leu Pro Leu Arg Arg Lys Gly Asp Gly Thr Ala Ser Leu Leu Ser
115 120 125
Pro Arg Pro Val Ser Ser Leu Lys Gly Ser Ser Gly Gly Pro Val Leu
130 135 140
Cys Pro Gln Ser His Cys Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Gln Phe Val Pro Ile Glu Lys Met Gln
165 170 175
Val Ala Gln Arg
180
<210> 249
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 249
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Thr Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg
180
<210> 250
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 250
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val
35 40 45
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu
50 55 60
Ala Ala Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Lys Pro Pro Gly Ala Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Phe Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu
165 170 175
Thr Thr Met Arg
180
<210> 251
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 251
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr
1 5 10 15
Ile Val Val Ser Met Thr Gly Arg Asp Lys Thr Glu Gln Ala Gly Glu
20 25 30
Ile Gln Val Leu Ser Thr Val Thr Gln Ser Phe Leu Gly Thr Thr Ile
35 40 45
Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu
50 55 60
Ala Gly Ser Arg Gly Pro Val Thr Gln Met Tyr Ser Ser Ala Glu Gly
65 70 75 80
Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Glu Pro
85 90 95
Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Lys Arg Gly Ala Leu Leu Ser
115 120 125
Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu
130 135 140
Cys Pro Arg Gly His Ala Val Gly Val Phe Arg Ala Ala Val Cys Ser
145 150 155 160
Arg Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Thr Leu Asp
165 170 175
Ile Val Thr Arg
180
<210> 252
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 252
Ala Pro Ile Thr Ala Tyr Thr Gln Gln Thr Arg Gly Leu Leu Gly Ala
1 5 10 15
Ile Val Val Ser Leu Thr Gly Arg Asp Lys Asn Glu Gln Ala Gly Gln
20 25 30
Val Gln Val Leu Ser Ser Val Thr Gln Thr Phe Leu Gly Thr Ser Ile
35 40 45
Ser Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Asn Lys Thr Leu
50 55 60
Ala Gly Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Ser Ala Glu Gly
65 70 75 80
Asp Leu Val Gly Trp Pro Ser Pro Pro Gly Thr Lys Ser Leu Asp Pro
85 90 95
Cys Thr Cys Gly Ala Val Asp Leu Tyr Leu Val Thr Arg Asn Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Lys Asp Asp Arg Arg Gly Ala Leu Leu Ser
115 120 125
Pro Arg Pro Leu Ser Thr Leu Lys Gly Ser Ser Gly Gly Pro Val Leu
130 135 140
Cys Ser Arg Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Ser Tyr
145 150 155 160
Asn Thr Phe Gly Val Ala Lys Ser Ile Asp Phe Ile Pro Val Glu Ser
165 170 175
Leu Asp Val Ala Thr Arg
180
<210> 253
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 253
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Thr
1 5 10 15
Ile Val Thr Ser Leu Thr Gly Arg Asp Lys Asn Val Val Thr Gly Glu
20 25 30
Val Gln Val Leu Ser Thr Ala Thr Gln Thr Phe Leu Gly Thr Thr Val
35 40 45
Gly Gly Val Ile Trp Thr Val Tyr His Gly Ala Gly Ser Arg Thr Leu
50 55 60
Ala Gly Ala Lys His Pro Ala Leu Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Pro Gly Ala Lys Ser Leu Glu Pro
85 90 95
Cys Ala Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg Asp Ala Asp
100 105 110
Val Ile Pro Ala Arg Arg Arg Gly Asp Ser Thr Ala Ser Leu Leu Ser
115 120 125
Pro Arg Pro Leu Ala Cys Leu Lys Gly Ser Ser Gly Gly Pro Val Met
130 135 140
Cys Pro Ser Gly His Val Ala Gly Ile Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ser Leu Gln Phe Ile Pro Val Glu Thr Leu Ser
165 170 175
Thr Gln Ala Arg
180
<210> 254
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 254
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Gln
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp
180 185
<210> 255
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 255
Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys
1 5 10 15
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu
20 25 30
Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu Ala Thr Cys Ile
35 40 45
Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg Thr Ile
50 55 60
Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys
65 70 75 80
Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro
85 90 95
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp
100 105 110
Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly Ser Leu Leu Ser
115 120 125
Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu
130 135 140
Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val Cys Thr
145 150 155 160
Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val Glu Asn Leu Glu
165 170 175
Thr Thr Met Arg Ser Pro Val Phe Thr Asp
180 185
<210> 256
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 256
Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser
1 5 10
<210> 257
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 257
Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Lys
1 5 10
<210> 258
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 258
Gly Cys Val Cys Ile Ile Gly Arg Leu His Ile Asn Gln Arg
1 5 10
<210> 259
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 259
Gly Cys Val Val Ile Val Gly His Ile Glu Leu Glu Gly Lys
1 5 10
<210> 260
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 260
Gly Ser Val Val Ile Val Gly Arg Val Val Leu Ser Gly Gln
1 5 10
<210> 261
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 261
Gly Ser Val Ala Ile Val Gly Arg Ile Ile Leu Ser Gly Arg
1 5 10
<210> 262
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 262
Gly Cys Val Val Ile Cys Gly Arg Ile Val Thr Ser Gly Lys
1 5 10
<210> 263
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 263
Gly Ser Val Val Val Val Gly Arg Val Val Leu Gly Ser Asn
1 5 10
<210> 264
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 264
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
20 25 30
Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 265
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 265
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Val Val Leu Ser
20 25 30
Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 266
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 266
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
20 25 30
Gly Arg Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Arg Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 267
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 267
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser
20 25 30
Gly Arg Pro Ala Ile Val Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 268
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 268
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser
20 25 30
Gly Arg Pro Ala Ile Ile Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 269
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 269
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser
20 25 30
Gly Lys Pro Ala Val Val Pro Asp Arg Glu Leu Leu Tyr Gln Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 270
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 270
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Thr Thr Gly Ser Val Val Ile Val Gly Arg Ile Ile Leu Ser
20 25 30
Gly Arg Pro Ala Val Ile Pro Asp Arg Glu Leu Leu Tyr Arg Glu Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 271
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 271
Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr
1 5 10 15
Cys Leu Ala Thr Gly Cys Val Cys Ile Ile Gly Arg Leu His Val Asn
20 25 30
Gln Arg Ala Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 272
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 272
Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr
1 5 10 15
Cys Leu Ala Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Ile Asn
20 25 30
Gly Arg Ala Val Val Ala Pro Asp Lys Glu Val Leu Tyr Glu Ala Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 273
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 273
Ser Ser Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr
1 5 10 15
Cys Leu Ala Thr Gly Cys Ile Ser Ile Ile Gly Arg Leu His Leu Asn
20 25 30
Asp Arg Val Val Val Ala Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 274
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 274
Ser Thr Trp Val Leu Ala Gly Gly Val Leu Ala Ala Val Ala Ala Tyr
1 5 10 15
Cys Leu Ala Thr Gly Cys Val Ser Ile Ile Gly Arg Leu His Leu Asn
20 25 30
Asp Gln Val Val Val Thr Pro Asp Lys Glu Ile Leu Tyr Glu Ala Phe
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 275
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 275
Ser Thr Trp Val Leu Leu Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
1 5 10 15
Cys Leu Ser Val Gly Cys Val Val Ile Val Gly His Ile Glu Leu Glu
20 25 30
Gly Lys Pro Ala Leu Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 276
<211> 54
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 276
Ser Thr Trp Val Leu Leu Gly Gly Val Leu Ala Ala Val Ala Ala Tyr
1 5 10 15
Cys Leu Ser Val Gly Cys Val Val Ile Val Gly His Ile Glu Leu Gly
20 25 30
Gly Lys Pro Ala Leu Val Pro Asp Lys Glu Val Leu Tyr Gln Gln Tyr
35 40 45
Asp Glu Met Glu Glu Cys
50
<210> 277
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 277
Ser Gly Thr Ser
1
<210> 278
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 278
Gly Ser Gly Ser
1
<210> 279
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 279
Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
1 5 10
<210> 280
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 280
Glu Asp Val Val Cys Cys His Ser Ile
1 5
<210> 281
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 281
Asp Glu Met Glu Glu Cys Ser Gln His
1 5
<210> 282
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 282
Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val
1 5 10 15
Gly Gly Val Leu
20
<210> 283
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 283
Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val
1 5 10 15
Gly Gly Val Leu
20
<210> 284
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 284
Cys Met Gln Ala Asp Leu Glu Val Met Thr Ser Thr Trp Val Leu Ala
1 5 10 15
Gly Gly Val Leu
20
<210> 285
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 285
Cys Met Gln Ala Asp Leu Glu Ile Met Thr Ser Ser Trp Val Leu Ala
1 5 10 15
Gly Gly Val Leu
20
<210> 286
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 286
Cys Met Ser Ala Asp Leu Glu Val Thr Thr Ser Thr Trp Val Leu Leu
1 5 10 15
Gly Gly Val Leu
20
<210> 287
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 287
Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Tyr
1 5 10 15
Ile Glu Gln Gly
20
<210> 288
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 288
Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser His Leu Pro Tyr
1 5 10 15
Ile Glu Gln Gly
20
<210> 289
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 289
Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser Arg Ala Ala Leu
1 5 10 15
Ile Glu Glu Gly
20
<210> 290
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 290
Tyr Glu Ala Phe Asp Glu Met Glu Glu Cys Ala Ser Lys Ala Ala Leu
1 5 10 15
Ile Glu Glu Gly
20
<210> 291
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 291
Tyr Gln Gln Tyr Asp Glu Met Glu Glu Cys Ser Gln Ala Ala Pro Tyr
1 5 10 15
Ile Glu Gln Ala
20
<210> 292
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 292
Trp Ile Ser Ser Glu Cys Thr Thr Pro Cys Ser Gly Ser Trp Leu Arg
1 5 10 15
Asp Val Trp Asp
20
<210> 293
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 293
Trp Ile Asn Glu Asp Cys Ser Thr Pro Cys Ser Gly Ser Trp Leu Arg
1 5 10 15
Asp Val Trp Asp
20
<210> 294
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 294
Trp Ile Thr Glu Asp Cys Pro Ile Pro Cys Ser Gly Ser Trp Leu Arg
1 5 10 15
Asp Val Trp Asp
20
<210> 295
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 295
Trp Ile Thr Glu Asp Cys Pro Val Pro Cys Ser Gly Ser Trp Leu Gln
1 5 10 15
Asp Ile Trp Asp
20
<210> 296
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 296
Trp Ile Asn Glu Asp Tyr Pro Ser Pro Cys Ser Asp Asp Trp Leu Arg
1 5 10 15
Thr Ile Trp Asp
20
<210> 297
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 297
Gly Ala Asp Thr Glu Asp Val Val Cys Cys Ser Met Ser Tyr Ser Trp
1 5 10 15
Thr Gly Ala Leu
20
<210> 298
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 298
Glu Glu Ala Ser Glu Asp Val Val Cys Cys Ser Met Ser Tyr Thr Trp
1 5 10 15
Thr Gly Ala Leu
20
<210> 299
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 299
Ser Glu Glu Asp Asp Ser Val Val Cys Cys Ser Met Ser Tyr Ser Trp
1 5 10 15
Thr Gly Ala Leu
20
<210> 300
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 300
Ser Asp Gln Glu Asp Ser Val Ile Cys Cys Ser Met Ser Tyr Ser Trp
1 5 10 15
Thr Gly Ala Leu
20
<210> 301
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 301
Asp Ser Glu Glu Gln Ser Val Val Cys Cys Ser Met Ser Tyr Ser Trp
1 5 10 15
Thr Gly Ala Leu
20
<210> 302
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 302
Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His
1 5 10
<210> 303
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 303
Gly Gly Ser Gly Gly
1 5
<210> 304
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 304
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
1 5 10 15
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
20 25 30
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
35 40 45
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
50 55 60
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
65 70 75 80
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
85 90 95
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
100 105 110
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
115 120 125
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu
130 135 140
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
145 150 155 160
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
165 170 175
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
180 185 190
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
195 200 205
Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser
210 215 220
<210> 305
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 305
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
1 5 10 15
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
20 25 30
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
35 40 45
Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr
50 55 60
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
65 70 75 80
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
85 90 95
Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
100 105 110
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
115 120 125
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly Ser Leu
130 135 140
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
145 150 155 160
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
165 170 175
Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Asn
180 185 190
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
195 200 205
Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser
210 215 220
<210> 306
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 306
Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly Ser Gly
1 5 10 15
Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu
20 25 30
Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu
35 40 45
Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu Ala Thr
50 55 60
Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly Thr Arg
65 70 75 80
Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val
85 90 95
Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu
100 105 110
Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His
115 120 125
Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly Ser Leu
130 135 140
Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro
145 150 155 160
Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala Ala Val
165 170 175
Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val Glu Asn
180 185 190
Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro
195 200 205
Pro Ala Val Thr Leu Thr His Gly Gly Ser Gly Gly Ser
210 215 220
<210> 307
<211> 182
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 307
Met Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly
1 5 10 15
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly
20 25 30
Glu Val Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys
35 40 45
Ile Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr
50 55 60
Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp
65 70 75 80
Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr
85 90 95
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala
100 105 110
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu
115 120 125
Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu
130 135 140
Leu Cys Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys
145 150 155 160
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu
165 170 175
Glu Thr Thr Met Arg Ser
180
<210> 308
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 308
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Asn
1 5 10 15
Gly Ala Tyr Ala Gln Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr
20 25 30
Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile
35 40 45
Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val
50 55 60
Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro
65 70 75 80
Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val
85 90 95
Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys
100 105 110
Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro
115 120 125
Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro
130 135 140
Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala
145 150 155 160
Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val
165 170 175
Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr Met
180 185 190
Arg Ser Pro
195
<210> 309
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 309
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Val Leu Asn
1 5 10 15
Gly Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln Glu Thr
20 25 30
Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile
35 40 45
Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val
50 55 60
Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro
65 70 75 80
Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val
85 90 95
Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys
100 105 110
Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro
115 120 125
Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg Pro
130 135 140
Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala
145 150 155 160
Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg Gly Val
165 170 175
Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr Met
180 185 190
Arg Ser Pro
195
<210> 310
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 310
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser
1 5 10 15
Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln
20 25 30
Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val
35 40 45
Gln Ile Val Ser Thr Ala Ala Gln Thr Phe Leu Ala Thr Cys Ile Asn
50 55 60
Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala
65 70 75 80
Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr Asn Val Asp Lys Asp
85 90 95
Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys
100 105 110
Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val
115 120 125
Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro
130 135 140
Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys
145 150 155 160
Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg
165 170 175
Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr
180 185 190
Thr Met Arg Ser Pro
195
<210> 311
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 311
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser
1 5 10 15
Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln
20 25 30
Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val
35 40 45
Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Cys Ile Asn
50 55 60
Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala
65 70 75 80
Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp
85 90 95
Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys
100 105 110
Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val
115 120 125
Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro
130 135 140
Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys
145 150 155 160
Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr Arg
165 170 175
Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr
180 185 190
Thr Met Arg Ser Pro
195
<210> 312
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 312
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser
1 5 10 15
Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln
20 25 30
Glu Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val
35 40 45
Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn
50 55 60
Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala
65 70 75 80
Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp
85 90 95
Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys
100 105 110
Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val
115 120 125
Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro
130 135 140
Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys
145 150 155 160
Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg
165 170 175
Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr
180 185 190
Thr Met Arg Ser Pro
195
<210> 313
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 313
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser
1 5 10 15
Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Gln Gly Cys Gln
20 25 30
Lys Thr Ser His Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val
35 40 45
Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn
50 55 60
Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala
65 70 75 80
Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp
85 90 95
Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys
100 105 110
Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val
115 120 125
Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro
130 135 140
Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys
145 150 155 160
Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg
165 170 175
Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr
180 185 190
Thr Met Arg Ser Pro
195
<210> 314
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 314
Met Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser
1 5 10 15
Gly Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Gln Gly Thr Gln
20 25 30
Lys Thr Ser His Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val
35 40 45
Gln Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn
50 55 60
Gly Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala
65 70 75 80
Ser Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp
85 90 95
Leu Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys
100 105 110
Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val
115 120 125
Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro
130 135 140
Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu Cys
145 150 155 160
Pro Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg
165 170 175
Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr
180 185 190
Thr Met Arg Ser Pro
195
<210> 315
<211> 196
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 315
Lys Lys Lys Gly Ser Val Val Ile Val Gly Arg Ile Asn Leu Ser Gly
1 5 10 15
Asp Thr Ala Tyr Ala Gln Gln Thr Arg Gly Glu Glu Gly Cys Gln Glu
20 25 30
Thr Ser Gln Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu Val Gln
35 40 45
Ile Val Ser Thr Ala Thr Gln Thr Phe Leu Ala Thr Ser Ile Asn Gly
50 55 60
Val Leu Trp Thr Val Tyr His Gly Ala Gly Thr Arg Thr Ile Ala Ser
65 70 75 80
Pro Lys Gly Pro Val Thr Gln Met Tyr Thr Asn Val Asp Lys Asp Leu
85 90 95
Val Gly Trp Gln Ala Pro Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr
100 105 110
Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp Val Ile
115 120 125
Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser Pro Arg
130 135 140
Pro Ile Ser Tyr Leu Lys Gly Ser Ala Gly Gly Pro Leu Leu Cys Pro
145 150 155 160
Ala Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Ser Thr Arg Gly
165 170 175
Val Ala Lys Ala Val Asp Phe Ile Pro Val Glu Ser Leu Glu Thr Thr
180 185 190
Met Arg Ser Pro
195
<210> 316
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 316
Gly Glu Leu Asp Glu Leu Val Tyr Leu Leu Asp Gly Pro Gly Tyr Asp
1 5 10 15
Pro Ile His Ser Asp
20
<210> 317
<211> 158
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 317
Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met Glu
1 5 10 15
Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys Arg
20 25 30
Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu Ser
35 40 45
Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser Gln
50 55 60
Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu Ala
65 70 75 80
Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly Gly
85 90 95
Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu Thr
100 105 110
His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr Glu
115 120 125
Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp Ala
130 135 140
Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145 150 155
<210> 318
<211> 107
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 318
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 319
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 319
Thr Arg Gly Val Glu Glu Val Ala Glu Gly Val Val Leu Leu Arg Arg
1 5 10 15
Arg Gly Asn
<210> 320
<211> 229
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 320
Met Met Gly Ser Val Glu Leu Asn Leu Arg Glu Thr Glu Leu Cys Leu
1 5 10 15
Gly Leu Pro Gly Gly Asp Thr Val Ala Pro Val Thr Gly Asn Lys Arg
20 25 30
Gly Phe Ser Glu Thr Val Asp Leu Lys Leu Asn Leu Asn Asn Glu Pro
35 40 45
Ala Asn Lys Glu Gly Ser Thr Thr His Asp Val Val Thr Phe Asp Ser
50 55 60
Lys Glu Lys Ser Ala Cys Pro Lys Asp Pro Ala Lys Pro Pro Ala Lys
65 70 75 80
Ala Gln Val Val Gly Trp Pro Pro Val Arg Ser Tyr Arg Lys Asn Val
85 90 95
Met Val Ser Cys Gln Lys Ser Ser Gly Gly Pro Glu Ala Ala Ala Phe
100 105 110
Val Lys Val Ser Met Asp Gly Ala Pro Tyr Leu Arg Lys Ile Asp Leu
115 120 125
Arg Met Tyr Lys Ser Tyr Asp Glu Leu Ser Asn Ala Leu Ser Asn Met
130 135 140
Phe Ser Ser Phe Thr Met Gly Lys His Gly Gly Glu Glu Gly Met Ile
145 150 155 160
Asp Phe Met Asn Glu Arg Lys Leu Met Asp Leu Val Asn Ser Trp Asp
165 170 175
Tyr Val Pro Ser Tyr Glu Asp Lys Asp Gly Asp Trp Met Leu Val Gly
180 185 190
Asp Val Pro Trp Pro Met Phe Val Asp Thr Cys Lys Arg Leu Arg Leu
195 200 205
Met Lys Gly Ser Asp Ala Ile Gly Leu Ala Pro Arg Ala Met Glu Lys
210 215 220
Cys Lys Ser Arg Ala
225
<210> 321
<211> 68
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 321
Lys Glu Lys Ser Ala Cys Pro Lys Asp Pro Ala Lys Pro Pro Ala Lys
1 5 10 15
Ala Gln Val Val Gly Trp Pro Pro Val Arg Ser Tyr Arg Lys Asn Val
20 25 30
Met Val Ser Cys Gln Lys Ser Ser Gly Gly Pro Glu Ala Ala Ala Phe
35 40 45
Val Lys Val Ser Met Asp Gly Ala Pro Tyr Leu Arg Lys Ile Asp Leu
50 55 60
Arg Met Tyr Lys
65
<210> 322
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 322
Pro Ile Thr Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala
1 5 10 15
Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu
20 25 30
Ala Ala Leu Ala Ala Tyr Cys Leu Ser Thr
35 40
<210> 323
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 323
Gly Ser Ser Gly Ser Ser
1 5
<210> 324
<211> 304
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 324
Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser
1 5 10 15
Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly
20 25 30
Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln
35 40 45
Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg
50 55 60
Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr
65 70 75 80
Gln Thr Phe Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr
85 90 95
His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile
100 105 110
Gln Met Tyr Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro
115 120 125
Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu
130 135 140
Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly
145 150 155 160
Asp Gly Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys
165 170 175
Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly
180 185 190
Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp
195 200 205
Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe
210 215 220
Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr
225 230 235 240
Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu
245 250 255
Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu
260 265 270
Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile
275 280 285
Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
290 295 300
<210> 325
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 325
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu
275 280 285
Asp Val Val Pro Cys Ser Met Gly Ser
290 295
<210> 326
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 326
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Met Ser Thr Ala Thr Gln Thr Phe Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Gly Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val
275 280 285
Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
290 295 300
<210> 327
<211> 304
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 327
Asp Glu Met Glu Glu Cys Ser Gln His Leu Pro Gly Ala Gly Ser Ser
1 5 10 15
Gly Asp Ile Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly
20 25 30
Thr Gly Ser Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln
35 40 45
Gln Thr Arg Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg
50 55 60
Asp Lys Asn Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr
65 70 75 80
Gln Thr Leu Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr
85 90 95
His Gly Ala Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile
100 105 110
Gln Met Tyr Thr Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro
115 120 125
Gln Gly Ser Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu
130 135 140
Tyr Leu Val Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly
145 150 155 160
Asp Arg Arg Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys
165 170 175
Gly Ser Ser Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly
180 185 190
Leu Phe Arg Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr
195 200 205
Phe Ile Pro Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe
210 215 220
Thr Asp Asn Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr
225 230 235 240
Lys Ile Asp Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu
245 250 255
Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu
260 265 270
Ala Ala Tyr Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile
275 280 285
Val Leu Ser Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr
290 295 300
<210> 328
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 328
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe Glu
275 280 285
Asp Val Val Pro Cys Ser Met Gly Ser
290 295
<210> 329
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 329
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser Gly
1 5 10 15
Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg Gly
20 25 30
Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln
35 40 45
Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Leu Leu
50 55 60
Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala Gly
65 70 75 80
Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr Thr
85 90 95
Asn Val Asp Lys Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser Arg
100 105 110
Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr
115 120 125
Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Arg Arg Gly
130 135 140
Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser Gly
145 150 155 160
Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg Ala
165 170 175
Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Tyr Phe Ile Pro Val
180 185 190
Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser
195 200 205
Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp Thr
210 215 220
Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr Ser
225 230 235 240
Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr Cys
245 250 255
Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser Gly
260 265 270
Lys Pro Ala Gly Ser Ser Gly Ser Ser Ile Ile Pro Asp Arg Glu Val
275 280 285
Leu Tyr Gln Glu Phe Glu Asp Val Val Pro Cys Ser Met Gly Ser
290 295 300
<210> 330
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 330
Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly
1 5 10 15
Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys
20 25 30
Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly
35 40 45
Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Thr Val Phe Cys Tyr Gly
50 55 60
Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys
65 70 75 80
Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met Asn Tyr Glu
85 90 95
Asp Gly Gly Ile Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp
100 105 110
Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn
115 120 125
Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Pro Ser Thr Glu
130 135 140
Lys Leu Tyr Val Arg Asp Gly Val Leu Lys Gly Asp Val Asn Met Ala
145 150 155 160
Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr
165 170 175
Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Phe Val Asp
180 185 190
His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn
195 200 205
Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Lys
210 215 220
<210> 331
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 331
Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly
1 5 10 15
Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys
20 25 30
Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly
35 40 45
Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Thr Val Phe Cys Tyr Gly
50 55 60
Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys
65 70 75 80
Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met Asn Tyr Glu
85 90 95
Asp Gly Gly Ile Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp
100 105 110
Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn
115 120 125
Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Pro Ser Thr Glu
130 135 140
Asn Leu Tyr Val Arg Asp Gly Val Leu Lys Gly Asp Val Asn Met Ala
145 150 155 160
Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr
165 170 175
Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Phe Val Asp
180 185 190
His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn
195 200 205
Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Lys
210 215 220
<210> 332
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 332
Met Ser Val Ile Lys Pro Asp Met Lys Ile Lys Leu Arg Met Glu Gly
1 5 10 15
Ala Val Asn Gly His Pro Phe Ala Ile Glu Gly Val Gly Leu Gly Lys
20 25 30
Pro Phe Glu Gly Lys Gln Ser Met Asp Leu Lys Val Lys Glu Gly Gly
35 40 45
Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Met Ala Phe Cys Tyr Gly
50 55 60
Asn Arg Val Phe Ala Lys Tyr Pro Glu Asn Ile Val Asp Tyr Phe Lys
65 70 75 80
Gln Ser Phe Pro Glu Gly Tyr Ser Trp Glu Arg Ser Met His Tyr Glu
85 90 95
Asp Gly Gly Ser Cys Asn Ala Thr Asn Asp Ile Thr Leu Asp Gly Asp
100 105 110
Cys Tyr Ile Tyr Glu Ile Arg Phe Asp Gly Val Asn Phe Pro Ala Asn
115 120 125
Gly Pro Val Met Gln Lys Arg Thr Val Lys Trp Glu Arg Ser Thr Glu
130 135 140
Asn Leu Tyr Val Arg Asp Gly Val Leu Lys Ser Asp Gly Asn Tyr Ala
145 150 155 160
Leu Ser Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr Thr
165 170 175
Tyr Lys Ala Lys Lys Val Val Gln Leu Pro Asp Tyr His Ser Val Asp
180 185 190
His His Ile Glu Ile Lys Ser His Asp Lys Asp Tyr Ser Asn Val Asn
195 200 205
Leu His Glu His Ala Glu Ala His Ser Glu Leu Pro Arg Gln Ala Asn
210 215 220
<210> 333
<211> 236
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 333
Met Val Ser Lys Gly Glu Glu Asn Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Ala Phe Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Val Tyr Ile Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Phe Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Arg Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Ile Ile His Val
100 105 110
Asn Gln Asp Ser Ser Leu Gln Asp Gly Val Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Glu Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala His Lys Ala Glu Ile Lys Lys Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Ala Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Ile Val Asp Ile Lys Leu Asp Ile Val Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 334
<211> 595
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 334
Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His
1 5 10 15
Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys
20 25 30
Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys
35 40 45
Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala
50 55 60
Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr
65 70 75 80
Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly
85 90 95
Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His
100 105 110
Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val
115 120 125
Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala
130 135 140
Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly
145 150 155 160
Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met
165 170 175
Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala
180 185 190
Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe
195 200 205
Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr
210 215 220
Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys
225 230 235 240
Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg
245 250 255
Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp
260 265 270
Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala
275 280 285
Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn
290 295 300
Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu
305 310 315 320
Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro
325 330 335
Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg
340 345 350
Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val
355 360 365
Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu
370 375 380
Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly
385 390 395 400
Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys
405 410 415
Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser
420 425 430
Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu
435 440 445
Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser
450 455 460
Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp
465 470 475 480
Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr
485 490 495
Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser
500 505 510
His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met
515 520 525
Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu
530 535 540
Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val
545 550 555 560
Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser
565 570 575
His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro
580 585 590
Ala Thr Val
595
<210> 335
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 335
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Gly Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Arg
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Met Leu Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Val
305 310
<210> 336
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 336
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Gly Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
305 310
<210> 337
<211> 314
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 337
Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met
1 5 10 15
Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp
20 25 30
Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser
35 40 45
Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu
50 55 60
Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala
65 70 75 80
Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His
85 90 95
Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp
100 105 110
Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu
115 120 125
Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe
130 135 140
Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln
145 150 155 160
Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly
165 170 175
Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp
180 185 190
His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu
195 200 205
Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala
210 215 220
Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly
225 230 235 240
Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr
245 250 255
Asp Ala Ala Leu Glu Met Leu Asp Ala His Arg Leu His Ala Pro Thr
260 265 270
Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala
275 280 285
Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr
290 295 300
Gly Glu Ala Glu Gly Phe Pro Ala Thr Val
305 310
<210> 338
<211> 306
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 338
Pro Pro Gln Ile Glu Glu Ala Cys Glu Leu Pro Glu Cys Gln Val Asp
1 5 10 15
Ala Gly Asn Lys Val Cys Asn Leu Gln Cys Asn Asn His Ala Cys Gly
20 25 30
Trp Asp Gly Gly Asp Cys Ser Leu Asn Phe Asn Asp Pro Trp Lys Asn
35 40 45
Cys Thr Gln Ser Leu Gln Cys Trp Lys Tyr Phe Ser Asp Gly His Cys
50 55 60
Asp Ser Gln Cys Asn Ser Ala Gly Cys Leu Phe Asp Gly Phe Asp Cys
65 70 75 80
Gln Leu Thr Glu Gly Gln Cys Asn Pro Leu Tyr Asp Gln Tyr Cys Lys
85 90 95
Asp His Phe Ser Asp Gly His Cys Asp Gln Gly Cys Asn Ser Ala Glu
100 105 110
Cys Glu Trp Asp Gly Leu Asp Cys Ala Glu His Val Pro Glu Arg Leu
115 120 125
Ala Ala Gly Thr Leu Val Leu Val Val Leu Leu Pro Pro Asp Gln Leu
130 135 140
Arg Asn Asn Ser Phe His Phe Leu Arg Glu Leu Ser His Val Leu His
145 150 155 160
Thr Asn Val Val Phe Lys Arg Asp Ala Gln Gly Gln Gln Met Ile Phe
165 170 175
Pro Tyr Tyr Gly His Glu Glu Glu Leu Arg Lys His Pro Ile Lys Arg
180 185 190
Ser Thr Val Gly Trp Ala Thr Ser Ser Leu Leu Pro Gly Thr Ser Gly
195 200 205
Gly Arg Gln Arg Arg Glu Leu Asp Pro Met Asp Ile Arg Gly Ser Ile
210 215 220
Val Tyr Leu Glu Ile Asp Asn Arg Gln Cys Val Gln Ser Ser Ser Gln
225 230 235 240
Cys Phe Gln Ser Ala Thr Asp Val Ala Ala Phe Leu Gly Ala Leu Ala
245 250 255
Ser Leu Gly Ser Leu Asn Ile Pro Tyr Lys Ile Glu Ala Val Lys Ser
260 265 270
Glu Pro Val Glu Pro Pro Leu Pro Ser Gln Leu His Leu Met Tyr Val
275 280 285
Ala Ala Ala Ala Phe Val Leu Leu Phe Phe Val Gly Cys Gly Val Leu
290 295 300
Leu Ser
305
<210> 339
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 339
Pro Cys Val Gly Ser Asn Pro Cys Tyr Asn Gln Gly Thr Cys Glu Pro
1 5 10 15
Thr Ser Glu Asn Pro Phe Tyr Arg Cys Leu Cys Pro Ala Lys Phe Asn
20 25 30
Gly Leu Leu Cys His Ile Leu Asp Tyr Ser Phe Thr Gly Gly Ala Gly
35 40 45
Arg Asp Ile Pro Pro Pro Gln Ile Glu Glu Ala Cys Glu Leu Pro Glu
50 55 60
Cys Gln Val Asp Ala Gly Asn Lys Val Cys Asn Leu Gln Cys Asn Asn
65 70 75 80
His Ala Cys Gly Trp Asp Gly Gly Asp Cys Ser Leu Asn Phe Asn Asp
85 90 95
Pro Trp Lys Asn Cys Thr Gln Ser Leu Gln Cys Trp Lys Tyr Phe Ser
100 105 110
Asp Gly His Cys Asp Ser Gln Cys Asn Ser Ala Gly Cys Leu Phe Asp
115 120 125
Gly Phe Asp Cys Gln Leu Thr Glu Gly Gln Cys Asn Pro Leu Tyr Asp
130 135 140
Gln Tyr Cys Lys Asp His Phe Ser Asp Gly His Cys Asp Gln Gly Cys
145 150 155 160
Asn Ser Ala Glu Cys Glu Trp Asp Gly Leu Asp Cys Ala Glu His Val
165 170 175
Pro Glu Arg Leu Ala Ala Gly Thr Leu Val Leu Val Val Leu Leu Pro
180 185 190
Pro Asp Gln Leu Arg Asn Asn Ser Phe His Phe Leu Arg Glu Leu Ser
195 200 205
His Val Leu His Thr Asn Val Val Phe Lys Arg Asp Ala Gln Gly Gln
210 215 220
Gln Met Ile Phe Pro Tyr Tyr Gly His Glu Glu Glu Leu Arg Lys His
225 230 235 240
Pro Ile Lys Arg Ser Thr Val Gly Trp Ala Thr Ser Ser Leu Leu Pro
245 250 255
Gly Thr Ser Gly Gly Arg Gln Arg Arg Glu Leu Asp Pro Met Asp Ile
260 265 270
Arg Gly Ser Ile Val Tyr Leu Glu Ile Asp Asn Arg Gln Cys Val Gln
275 280 285
Ser Ser Ser Gln Cys Phe Gln Ser Ala Thr Asp Val Ala Ala Phe Leu
290 295 300
Gly Ala Leu Ala Ser Leu Gly Ser Leu Asn Ile Pro Tyr Lys Ile Glu
305 310 315 320
Ala Val Lys Ser Glu Pro Val Glu Pro Pro Leu Pro Ser Gln Leu His
325 330 335
Leu Met Tyr Val Ala Ala Ala Ala Phe Val Leu Leu Phe Phe Val Gly
340 345 350
Cys Gly Val Leu Leu Ser
355
<210> 340
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 340
Pro Gly Glu Arg
1
<210> 341
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 341
Thr Gly Ser Gln Lys
1 5
<210> 342
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 342
Thr Gly Glu Lys Pro
1 5
<210> 343
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 343
Thr His Leu Arg
1
<210> 344
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 344
Thr Gly Gly Gly Glu Lys Pro
1 5
<210> 345
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 345
Phe His Tyr Asp Arg Asn Asn Ile Ala Val Gly Ala Asp Glu Ser Val
1 5 10 15
Val Lys Glu Ala His Arg Glu Val Ile Asn Ser Ser Thr Glu Gly Leu
20 25 30
Leu Leu Asn Ile Asp Lys Asp Ile Arg Lys Ile Leu Ser Gly Tyr Ile
35 40 45
Val Glu Ile Glu Asp Thr Glu
50 55
<210> 346
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 346
Val Glu Ile Glu Asp Thr Glu
1 5
<210> 347
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 347
Lys Asp Ile Arg Lys Ile Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp
1 5 10 15
Thr Glu
<210> 348
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 348
Ser Thr Glu Gly Leu Leu Leu Asn Ile Asp Lys Asp Ile Arg Lys Ile
1 5 10 15
Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp Thr Glu
20 25
<210> 349
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 349
Glu Val Lys Gln Glu Asn Arg Leu Leu Asn Glu Ser Glu Ser
1 5 10
<210> 350
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 350
Val Gly Ala Asp Glu Ser Val Val Lys Glu Ala His Arg Glu Val Ile
1 5 10 15
Asn Ser Ser Thr Glu Gly Leu Leu Leu Asn Ile Asp Lys Asp Ile Arg
20 25 30
Lys Ile Leu Ser Gly Tyr Ile Val Glu Ile Glu Asp Thr Glu
35 40 45
<210> 351
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 351
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly Ser
20
<210> 352
<211> 40
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 352
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser
35 40
<210> 353
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 353
Gly Gly Gly Gly Ser
1 5
<210> 354
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 354
Gly Gly Ser Gly Gly Ser
1 5
<210> 355
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 355
Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
1 5 10 15
<210> 356
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 356
Thr Gly Ser Lys Pro
1 5
<210> 357
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 357
Thr Gly Gln Lys Pro
1 5
<210> 358
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 358
Thr Gly Gly Lys Pro
1 5
<210> 359
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 359
Thr Gly Ser Gln Lys Pro
1 5
<210> 360
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 360
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro
20
<210> 361
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 361
Gly Ser Gly Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp
1 5 10 15
Val Glu Ser Asn Pro Gly Pro
20
<210> 362
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 362
Gly Ser Gly Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala
1 5 10 15
Gly Asp Val Glu Ser Asn Pro Gly Pro
20 25
<210> 363
<211> 494
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 363
ccgataaaat aaaagatttt atttagtctc cagaaaaagg ggggaatgaa agaccccacc 60
tgtaggttat ggcaagctag ctgcagtaac gccattattg caaggcatgg aaaaatacca 120
aaccaagaat agagaagttc agatcaaggg cgggtacatg aaaatagcta acgtagggcc 180
aaacaggata tctgcggtga gcagtttcgg ccccggcccg gggccaagaa cagatggtca 240
ccgcagtttc ggccccggcc cgaggccaag agcagatggt ccccagatat ggcccaaccc 300
tcagcagttt cttaagaccc atcagatgtt tccaggctcc cccaaggacc tgaaatgacc 360
ctgcgcctta tttgaattaa ccaatcagcc tgcttctcgc ttctgttcgc gcgcttctgc 420
ttcccgagct ctataaaaga gctcacaacc cctcactcgg cgcgccagtc ctccgacaga 480
ctgagtcgcc cggg 494
<210> 364
<211> 588
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 364
gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctc 588
<210> 365
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 365
taggcgtgta cggtgggagg cctatataag cagagctcgt ttagtgaacc gtcagatcgc 60
ctgga 65
<210> 366
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 366
ttcgcatatt aaggtgacgc gtgtggcctc gaacaccgag cgaccctgca gcgacccgct 60
taa 63
<210> 367
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 367
cgccaaatgg cagtattcat ccacaatttt aaaagaaaag gggggattgg ggggtacagt 60
gcaggggaaa gaatagtaga cataatagca acagacatac aaactaaaga attacaaaaa 120
caaattacaa aaattcaaaa ttttcgggtt tattacaggg acagcagaga tccagtttgg 180
<210> 368
<211> 592
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 368
taatcaacct ctggattaca aaatttgtga aagattgact ggtattctta actatgttgc 60
tccttttacg ctatgtggat acgctgcttt aatgcctttg tatcatgcta ttgcttcccg 120
tatggctttc attttctcct ccttgtataa atcctggttg ctgtctcttt atgaggagtt 180
gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg tttgctgacg caacccccac 240
tggttggggc attgccacca cctgtcagct cctttccggg actttcgctt tccccctccc 300
tattgccacg gcggaactca tcgccgcctg ccttgcccgc tgctggacag gggctcggct 360
gttgggcact gacaattccg tggtgttgtc ggggaaatca tcgtcctttc cttggctgct 420
cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc tgctacgtcc cttcggccct 480
caatccagcg gaccttcctt cccgcggcct gctgccggct ctgcggcctc ttccgcgtct 540
tcgccttcgc cctcagacga gtcggatctc cctttgggcc gcctccccgc at 592
<210> 369
<211> 636
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 369
gttggaaggg ctaattcact cccaaagaag acaagatatc cttgatctgt ggatctacca 60
cacacaaggc tacttccctg attagcagaa ctacacacca gggccagggg tcagatatcc 120
actgaccttt ggatggtgct acaagctagt accagttgag ccagataagg tagaagaggc 180
caataaagga gagaacacca gcttgttaca ccctgtgagc ctgcatggga tggatgaccc 240
ggagagagaa gtgttagagt ggaggtttga cagccgccta gcatttcatc acgtggcccg 300
agagctgcat ccggagtact tcaagaactg ctgatatcga gcttgctaca agggactttc 360
cgctggggac tttccaggga ggcgtggcct gggcgggact ggggagtggc gagccctcag 420
atcctgcata taagcagctg ctttttgcct gtactgggtc tctctggtta gaccagatct 480
gagcctggga gctctctggc taactaggga acccactgct taagcctcaa taaagcttgc 540
cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga ctctggtaac tagagatccc 600
tcagaccctt ttagtcagtg tggaaaatct ctagca 636
<210> 370
<211> 236
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 370
actggaaggg ctaattcact cccaacgaag acaagatctg ctttttgctt gtactgggtc 60
tctctggtta gaccagatct gagcctggga gctctctggc taactaggga acccactgct 120
taagcctcaa taaagcttgc cttgagtgct tcaagtagtg tgtgcccgtc tgttgtgtga 180
ctctggtaac tagagatccc tcagaccctt ttagtcagtg tggaaaatct ctagca 236
<210> 371
<211> 205
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic polynucleotide
<400> 371
tccttgggtt cttgggagca gcaggaagca ctatgggcgc agcgtcaatg acgctgacgg 60
tacaggccag acaattattg tctggtatag tgcagcagca gaacaatttg ctgagggcta 120
ttgaggcgca acagcatctg ttgcaactca cagtctgggg catcaagcag ctccaggcaa 180
gaatcctggc tgtgaaagat accta 205
<210> 372
<211> 235
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 372
Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe Met
1 5 10 15
Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe Glu
20 25 30
Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr Ala
35 40 45
Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp Ile
50 55 60
Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His Pro
65 70 75 80
Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe Lys
85 90 95
Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val Thr
100 105 110
Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys Leu
115 120 125
Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr
130 135 140
Met Gly Trp Gln Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly Ala
145 150 155 160
Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly His
165 170 175
Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val Gln
180 185 190
Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser His
195 200 205
Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly Arg
210 215 220
His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 373
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 373
Ala Leu Pro Val Thr Ala Leu Leu Leu Pro Leu Ala Leu Leu Leu His
1 5 10 15
Ala Ala Arg Pro Asp Ile Gln Met Thr Gln Thr Thr Ser Ser Leu Ser
20 25 30
Ala Ser Leu Gly Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Gln Asp
35 40 45
Ile Ser Lys Tyr Leu Asn Trp Tyr Gln Gln Lys Pro Asp Gly Thr Val
50 55 60
Lys Leu Leu Ile Tyr His Thr Ser Arg Leu His Ser Gly Val Pro Ser
65 70 75 80
Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Tyr Ser Leu Thr Ile Ser
85 90 95
Asn Leu Glu Gln Glu Asp Ile Ala Thr Tyr Phe Cys Gln Gln Gly Asn
100 105 110
Thr Leu Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Thr Gly
115 120 125
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val
130 135 140
Lys Leu Gln Glu Ser Gly Pro Gly Leu Val Ala Pro Ser Gln Ser Leu
145 150 155 160
Ser Val Thr Cys Thr Val Ser Gly Val Ser Leu Pro Asp Tyr Gly Val
165 170 175
Ser Trp Ile Arg Gln Pro Pro Arg Lys Gly Leu Glu Trp Leu Gly Val
180 185 190
Ile Trp Gly Ser Glu Thr Thr Tyr Tyr Asn Ser Ala Leu Lys Ser Arg
195 200 205
Leu Thr Ile Ile Lys Asp Asn Ser Lys Ser Gln Val Phe Leu Lys Met
210 215 220
Asn Ser Leu Gln Thr Asp Asp Thr Ala Ile Tyr Tyr Cys Ala Lys His
225 230 235 240
Tyr Tyr Tyr Gly Gly Ser Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr
245 250 255
Ser Val Thr Val Ser Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
260 265 270
Asn Gly Ala Ala Thr Thr Thr Pro Ala Pro Arg Pro Pro Thr Pro Ala
275 280 285
Pro Thr Ile Ala Leu Gln Pro Leu Ser Leu Arg Pro Glu Ala Cys Arg
290 295 300
Pro Ala Ala Gly Gly Ala Val His Thr Arg Gly Leu Asp Phe Ala Cys
305 310 315 320
Asp Phe Trp Val Leu Val Val Val Gly Gly Val Leu Ala Cys Tyr Ser
325 330 335
Leu Leu Val Thr Val Ala Phe Ile Ile Phe Trp Val Arg Ser Lys Arg
340 345 350
Ser Arg Leu Leu His Ser Asp Tyr Met Asn Met Thr Pro Arg Arg Pro
355 360 365
Gly Pro Thr Arg Lys His Tyr Gln Pro Tyr Ala Pro Pro Arg Asp Phe
370 375 380
Ala Ala Tyr Arg Ser Lys Arg Gly Arg Lys Lys Leu Leu Tyr Ile Phe
385 390 395 400
Lys Gln Pro Phe Met Arg Pro Val Gln Thr Thr Gln Glu Glu Asp Gly
405 410 415
Cys Ser Cys Arg Phe Pro Glu Glu Glu Glu Gly Gly Cys Glu Leu Arg
420 425 430
Val Lys Phe Ser Arg Ser Ala Asp Ala Pro Ala Tyr Lys Gln Gly Gln
435 440 445
Asn Gln Leu Tyr Asn Glu Leu Asn Leu Gly Arg Arg Glu Glu Tyr Asp
450 455 460
Val Leu Asp Lys Arg Arg Gly Arg Asp Pro Glu Met Gly Gly Lys Pro
465 470 475 480
Arg Arg Lys Asn Pro Gln Glu Gly Leu Tyr Asn Glu Leu Gln Lys Asp
485 490 495
Lys Met Ala Glu Ala Tyr Ser Glu Ile Gly Met Lys Gly Glu Arg Arg
500 505 510
Arg Gly Lys Gly His Asp Gly Leu Tyr Gln Gly Leu Ser Thr Ala Thr
515 520 525
Lys Asp Thr Tyr Asp Ala Leu His Met Gln Ala Leu Pro Pro Arg Gly
530 535 540
<210> 374
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 374
Met Gly Leu Thr Ser Gln Leu Leu Pro Pro Leu Phe Phe Leu Leu Ala
1 5 10 15
Cys Ala Gly Asn Phe Val His Gly His Lys Cys Asp Ile Thr Leu Gln
20 25 30
Glu Ile Ile Lys Thr Leu Asn Ser Leu Thr Glu Gln Lys Thr Leu Cys
35 40 45
Thr Glu Leu Thr Val Thr Asp Ile Phe Ala Ala Ser Lys Asn Thr Thr
50 55 60
Glu Lys Glu Thr Phe Cys Arg Ala Ala Thr Val Leu Arg Gln Phe Tyr
65 70 75 80
Ser His His Glu Lys Asp Thr Arg Cys Leu Gly Ala Thr Ala Gln Gln
85 90 95
Phe His Arg His Lys Gln Leu Ile Arg Phe Leu Lys Arg Leu Asp Arg
100 105 110
Asn Leu Trp Gly Leu Ala Gly Leu Asn Ser Cys Pro Val Lys Glu Ala
115 120 125
Asn Gln Ser Thr Leu Glu Asn Phe Leu Glu Arg Leu Lys Thr Ile Met
130 135 140
Arg Glu Lys Tyr Ser Lys Cys Ser Ser
145 150
<210> 375
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 375
His Ser Ser Ala Leu Leu Cys Cys Leu Val Leu Leu Thr Gly Val Arg
1 5 10 15
Ala Ser Pro Gly Gln Gly Thr Gln Ser Glu Asn Ser Cys Thr His Phe
20 25 30
Pro Gly Asn Leu Pro Asn Met Leu Arg Asp Leu Arg Asp Ala Phe Ser
35 40 45
Arg Val Lys Thr Phe Phe Gln Met Lys Asp Gln Leu Asp Asn Leu Leu
50 55 60
Leu Lys Glu Ser Leu Leu Glu Asp Phe Lys Gly Tyr Leu Gly Cys Gln
65 70 75 80
Ala Leu Ser Glu Met Ile Gln Phe Tyr Leu Glu Glu Val Met Pro Gln
85 90 95
Ala Glu Asn Gln Asp Pro Asp Ile Lys Ala His Val Asn Ser Leu Gly
100 105 110
Glu Asn Leu Lys Thr Leu Arg Leu Arg Leu Arg Arg Cys His Arg Phe
115 120 125
Leu Pro Cys Glu Asn Lys Ser Lys Ala Val Glu Gln Val Lys Asn Ala
130 135 140
Phe Asn Lys Leu Gln Glu Lys Gly Ile Tyr Lys Ala Met Ser Glu Phe
145 150 155 160
Asp Ile Phe Ile Asn Tyr Ile Glu Ala Tyr Met Thr Met Lys Ile Arg
165 170 175
Asn
<210> 376
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<400> 376
Arg Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu
1 5 10 15
Ser Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile
20 25 30
Ser Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe
35 40 45
Thr His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr
50 55 60
Val Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn
65 70 75 80
Arg Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg
85 90 95
Thr Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile
100 105 110
Thr Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val
115 120 125
Ile Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp
130 135 140
Lys Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn
145 150 155 160
Arg Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu
165 170 175
Cys Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser
180 185 190
Cys Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu
195 200 205
Leu Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln
210 215 220
Cys His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly
225 230 235 240
Arg Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro
245 250 255
His Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr
260 265 270
Leu Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His
275 280 285
Pro Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro
290 295 300
Thr Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala
305 310 315 320
Leu Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met
325 330 335
<210> 377
<211> 176
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (19)..(25)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (47)..(53)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (76)..(82)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (104)..(110)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (133)..(139)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (161)..(167)
<223> Xaa can be any naturally occurring amino acid
<400> 377
Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
1 5 10 15
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro
50 55 60
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
65 70 75 80
Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg
85 90 95
Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
100 105 110
Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met
115 120 125
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser
165 170 175
<210> 378
<211> 606
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (128)..(134)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (156)..(162)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (185)..(191)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (213)..(219)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (242)..(248)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (270)..(276)
<223> Xaa can be any naturally occurring amino acid
<400> 378
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1 5 10 15
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
20 25 30
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
35 40 45
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
50 55 60
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
65 70 75 80
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
85 90 95
Val Leu Glu Gly Gly Gly Gly Ser Gly Gly Thr Cys Arg Ser Arg Pro
100 105 110
Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys
165 170 175
Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His
180 185 190
Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met
195 200 205
Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His
210 215 220
Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
225 230 235 240
Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu
245 250 255
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa
260 265 270
Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Gln Leu Cys
275 280 285
Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro
290 295 300
Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser
305 310 315 320
Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro
325 330 335
Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser
340 345 350
Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met
355 360 365
Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His
370 375 380
Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile
385 390 395 400
Gly Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala
405 410 415
Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met
420 425 430
Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met
435 440 445
Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu
450 455 460
Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu
465 470 475 480
Glu Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr
485 490 495
Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His
500 505 510
Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met
515 520 525
Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val
530 535 540
Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu
545 550 555 560
His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln
565 570 575
Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys
580 585 590
Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
595 600 605
<210> 379
<211> 991
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (319)..(325)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (347)..(353)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (376)..(382)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (404)..(410)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (433)..(439)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (461)..(467)
<223> Xaa can be any naturally occurring amino acid
<400> 379
Met Asp Tyr Lys Asp Asp Asp Asp Lys Gly Ser Ser Gly Thr Gly Ser
1 5 10 15
Gly Ser Gly Thr Ser Ala Pro Ile Thr Ala Tyr Ala Gln Gln Thr Arg
20 25 30
Gly Leu Leu Gly Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn
35 40 45
Gln Val Glu Gly Glu Val Gln Ile Val Ser Thr Ala Thr Gln Thr Phe
50 55 60
Leu Ala Thr Cys Ile Asn Gly Val Cys Trp Ala Val Tyr His Gly Ala
65 70 75 80
Gly Thr Arg Thr Ile Ala Ser Pro Lys Gly Pro Val Ile Gln Met Tyr
85 90 95
Thr Asn Val Asp Gln Asp Leu Val Gly Trp Pro Ala Pro Gln Gly Ser
100 105 110
Arg Ser Leu Thr Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val
115 120 125
Thr Arg His Ala Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg
130 135 140
Gly Ser Leu Leu Ser Pro Arg Pro Ile Ser Tyr Leu Lys Gly Ser Ser
145 150 155 160
Gly Gly Pro Leu Leu Cys Pro Ala Gly His Ala Val Gly Leu Phe Arg
165 170 175
Ala Ala Val Cys Thr Arg Gly Val Ala Lys Ala Val Asp Phe Ile Pro
180 185 190
Val Glu Asn Leu Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn
195 200 205
Ser Ser Pro Pro Ala Val Thr Leu Thr His Pro Ile Thr Lys Ile Asp
210 215 220
Thr Lys Tyr Ile Met Thr Cys Met Ser Ala Asp Leu Glu Val Val Thr
225 230 235 240
Ser Thr Trp Val Leu Val Gly Gly Val Leu Ala Ala Leu Ala Ala Tyr
245 250 255
Cys Leu Ser Thr Gly Cys Val Val Ile Val Gly Arg Ile Val Leu Ser
260 265 270
Gly Lys Pro Ala Ile Ile Pro Asp Arg Glu Val Leu Tyr Gln Glu Phe
275 280 285
Glu Asp Val Val Pro Cys Ser Met Gly Ser Pro Gly Ser Arg Pro Gly
290 295 300
Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
305 310 315 320
Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys Pro Phe
325 330 335
Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa
340 345 350
Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg
355 360 365
Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu
370 375 380
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg
385 390 395 400
Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Lys Thr His Thr
405 410 415
Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
420 425 430
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Glu Lys
435 440 445
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
450 455 460
Xaa Xaa Xaa His Leu Arg Thr His Leu Arg Gly Ser Thr Cys Arg Asp
465 470 475 480
Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser
485 490 495
Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro
500 505 510
Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro
515 520 525
Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala
530 535 540
Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu
545 550 555 560
Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser
565 570 575
Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu
580 585 590
Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr
595 600 605
Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr
610 615 620
Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro
625 630 635 640
Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile
645 650 655
Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser Gln Leu
660 665 670
Cys Val Arg Gly Ser Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp
675 680 685
Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu
690 695 700
Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro
705 710 715 720
Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala
725 730 735
Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His
740 745 750
Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu
755 760 765
His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met
770 775 780
Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Val Lys Leu Leu Phe
785 790 795 800
Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly
805 810 815
Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg
820 825 830
Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile
835 840 845
Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser
850 855 860
Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp Lys Ile Thr Asp
865 870 875 880
Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln
885 890 895
His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser His Ile Arg His
900 905 910
Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn
915 920 925
Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg
930 935 940
Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp
945 950 955 960
Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln
965 970 975
Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala
980 985 990
<210> 380
<211> 172
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic polypeptide
<220>
<221> misc_feature
<222> (17)..(23)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (45)..(51)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (74)..(80)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (102)..(108)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (131)..(137)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (159)..(165)
<223> Xaa can be any naturally occurring amino acid
<400> 380
Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly Glu Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa His Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln
50 55 60
Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
65 70 75 80
His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys
85 90 95
Met Arg Asn Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr
100 105 110
His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
115 120 125
Phe Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Thr Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa His Leu Arg Thr His Leu Arg
165 170
Claims (69)
- 합성 전사 인자(synTF)로서:
a. 적어도 하나의 DNA 결합 도메인(DBD),
b. 전사 이펙터 도메인(ED),
c. 적어도 하나의 조절인자 단백질(RP)을 포함하며,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링(coupling) 또는 연결되고,
상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는
상기 ED의 세포 국재화는 상기 적어도 하나의 조절인자 단백질에 의해 조절되는,
합성 전사 인자(synTF). - 제1항에 있어서, 상기 전사 ED가 전사 액티베이터(TA) 도메인인, synTF.
- 제2항에 있어서, 상기 TA가 p65; Rta; 미니VPR; 전체 VPR; VP16; VP64; p300; p300 HAT 코어; 및 CBP HAT 도메인으로 이루어진 군에서 선택되는, synTF.
- 제2항에 있어서, 상기 TA가 p65 또는 이의 변이체인, synTF.
- 제4항에 있어서, 상기 p65가 서열식별번호: 69, 117-121, 193-197 중 하나 또는 서열식별번호: 69, 117-121, 193-197 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
- 제1항에 있어서, 상기 전사 ED가 전사 리프레서(TR) 도메인인, synTF.
- 제6항에 있어서, 상기 TR이 KRAB; KRAB-MeCP2; HP1a; DNMT3B; EED; 및 HDAC4로 이루어진 군에서 선택되는, synTF
- 제6항에 있어서, 상기 TR이 KRAB, 또는 이의 변이체인, synTF.
- 제8항에 있어서, 상기 KRAB가 서열식별번호: 72, 97, 또는 214-215 중 하나, 또는 서열식별번호: 72, 97, 또는 214-215 중 하나에 대해 적어도 85%의 서열 동일성을 갖는 단백질을 포함하는, synTF.
- 제1항에 있어서, 상기 적어도 하나의 DBD가 조작된 징크 핑거(ZF) 결합 도메인인, synTF.
- 제10항에 있어서, 상기 ZF-결합 도메인이 2개 이상의 ZF 모티프를 포함하는, synTF.
- 제11항에 있어서, 상기 ZF-결합 도메인이 일렬로 서로 인접하게 배열된 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18개 또는 그 이상의 ZF 모티프 중 어느 하나를 포함하여 ZF 어레이(ZFA)를 형성하는, synTF.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 ZF 결합 도메인이, ZF 1-1, ZF 1-2, ZF 1-3, ZF 1-4, ZF 1-5, ZF 1-6, ZF 1-7, ZF 1-8, ZF 2-1, ZF 2-2, ZF 2-3, ZF 2-4, ZF 2-5, ZF 2-6, ZF 2-7, ZF 2-8, ZF 3-1, ZF 3-2, ZF 3-3, ZF 3-4, ZF 3-5, ZF 3-6, ZF 3-7, ZF 3-8, ZF 4-1, ZF 4-2, ZF 4-3, ZF 4-4, ZF 4-5, ZF 4-6, ZF 4-7, ZF 4-8, ZF 5-1, ZF 5-2, ZF 5-3, ZF 5-4, ZF 5-5, ZF 5-6, ZF 5-7, ZF 5-8, ZF 6-1, ZF 6-2, ZF 6-3, ZF 6-4, ZF 6-5, ZF 6-6, ZF 6-7, ZF 6-8, ZF 7-1, ZF 7-2, ZF 7-3, ZF 7-4, ZF 7-5, ZF 7-6, ZF 7-7, ZF 7-8, ZF 8-1, ZF 8-2, ZF 8-3, ZF 8-4, ZF 9-1, ZF 9-2, ZF 9-3, ZF 9-4, ZF 10-1 및 ZF 11-1 중 어느 하나에서 선택되는, synTF.
- 제1항 내지 제13항 중 어느 한 항에 있어서, ZF 결합 도메인이 서열식별번호 1 내지 3, 76, 101, 377, 또는 380 중 어느 하나로부터 선택되는 것인, synTF.
- 제14항에 있어서, 상기 ZF 결합 도메인이 서열 181-191 중 적어도 하나를 포함하는 서열에 특이적으로 결합하는, synTF.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 적어도 하나의 DBD가 서열식별번호: 221 또는 222, 36-4(서열식별번호: 223), 43-8(서열식별번호: 224 또는 225), 42-10(서열식별번호: 226 또는 227), 97-4(서열식별번호: 228) 중의 임의의 것의 하나 이상에서 선택되거나, 또는 상기 DBD가 서열식별번호: 229-240 중 임의의 것을 포함하는 DNA 결합 모티프(DBM)에 결합하는, synTF.
- 제1항에 있어서, 상기 조절인자 단백질이 상기 DBD와 상기 전사 이펙터 도메인 사이에 위치하는, synTF.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 억제성 프로테아제인, synTF.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 NS3 프로테아제 단백질인, synTF.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 조절인자 단백질이 서열식별번호: 82, 85, 91, 102, 241-255, 304-315의 아미노산, 또는 서열식별번호: 82, 85, 91, 102, 241-255, 304-315에 대해 적어도 85% 서열 동일성의 상동체를 포함하는, synTF.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 프로테아제 저해제, 또는 NS3의 저해제의 존재 하에, 상기 NS3 프로테아제 단백질이 억제되어 상기 DBD와 상기 이펙터 도메인의 커플링을 유지하는, synTF.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 프로테아제 저해제 또는 NS3에 대한 저해제의 부재 하에, 상기 NS3 프로테아제 단백질은 활성이고 상기 DBD로부터의 이의 절제를 초래하며, 그로 인해 상기 DBD와 상기 이펙터 도메인 사이의 연결을 커플링해제하는, synTF.
- 제21항 또는 제22항에 있어서, NS3의 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 다사사리토나비르, 및 텔라프레비르 중의 어느 하나로부터 선택되는, synTF.
- 제1항에 있어서, 상기 적어도 하나의 RP가 한 쌍의 유도 근접 도메인(IPD 쌍)이고, 상기 IPD 쌍은,
제1 유도 근접 도메인(IPDA) 및 적어도 제2 상보 IPD(IPDB)를 포함하며,
인듀서 작용제 또는 인듀서 신호의 존재 하에, 상기 IPDA 및 IPDB는 함께 모여 상기 합성 TF의 상기 DBD에 대한 상기 ED의 연결을 초래하고,
인듀서 작용제 또는 인듀서 신호의 부재 하에, 상기 ED는 상기 합성 TF의 DBD에 대해 커플링해제되거나 연결해제되는, synTF. - 제24항에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 다음 중 어느 하나 이상으로부터 선택된 IPDA 및 IPDB를 포함하는, synTF:
a. GID1 도메인 또는 이의 단편을 포함하는 IPDA, 및 GAI 도메인을 포함하는 IPDB, 여기서 상기 GID1 도메인 및 GAI 도메인은 인듀서 작용제 지베렐린 에스테르(GIB)에 결합함;
b. FKBP 도메인 또는 이의 단편을 포함하는 IPDA, 및 FRB 도메인을 포함하는 IPDB, 여기서 상기 FKBP 도메인 및 FRB 도메인은 인듀서 작용제 라파로그(RAP)에 결합함;
c. PYL 도메인 또는 이의 단편을 포함하는 IPDA, 및 ABI 도메인을 포함하는 IPDB, 여기서, 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합함;
d. 광-유도가능 이량체화 도메인(Light-inducible Dimerization domain, LIDD)를 포함하는 IPDA, 여기서 상기 LIDD는 적절한 파장의 광 인듀서 신호에 노출시 상보적 LIDD(IPDB)와 이량체화됨. - 제24항에 있어서, 상기 유도 근접 도메인 쌍(IPD 쌍)은 PYL 도메인 또는 이의 단편 및 ABI 도메인을 포함하는 IPDA 및 IPDB를 포함하고, 여기서 상기 PYL 도메인 및 ABI 도메인은 인듀서 작용제 앱시스산(ABA)에 결합하는, synTF.
- 제24항에 있어서, 상기 LIDD가 nMag 또는 CIBN 또는 광변색성 단백질 도메인이고, 여기서 nMag는 청색광 인듀서 신호에 노출시 상기 상보적 LIDD pMag와 이량체화할 수 있고, CIBN은 청색 인듀서 광 신호에 노출시 상기 상보적 CRY2와 이량체화할 수 있고, 상기 광변색성 단백질은 청색 인듀서 광 신호에 노출시 이량체화할 수 있는, synTF.
- 제24항에 있어서, 상기 광 인듀서 신호는 펄스 광 신호인, synTF.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 적어도 하나의 RP가 세포질 격리 단백질인, synTF.
- 제29항에 있어서, 상기 격리 단백질이 리간드 결합 도메인(LBD)을 포함하고, 상기 리간드의 존재 하에, 상기 세포질에 대한 상기 단백질의 격리가 저해되는, synTF.
- 제29항에 있어서, 상기 세포질 격리 단백질이 리간드 결합 도메인 및 핵 국재화 신호(NLS)를 포함하고, 상기 리간드의 부재 하에 상기 NLS가 저해되어 상기 격리 단백질의 상기 핵으로의 전위를 방지하고, 상기 리간드의 존재 하에 상기 핵 국재화 신호가 노출되어 상기 격리 단백질이 상기 핵으로 전위할 수 있는, synTF.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 상기 격리 단백질이 에스트로겐 수용체(ER)의 적어도 일부를 포함하는, synTF.
- 제29항 내지 제32항 중 어느 한 항에 있어서, 상기 격리 단백질이 ERT2, ERT, 및 ERT3으로 이루어진 그룹으로부터 선택되는, 에스트로겐 리간드 결합 도메인(ERT) 또는 이의 변이체를 포함하는, synTF.
- 제33항에 있어서, 상기 ERT가 타목시펜, 4-하이드록시타목시펜(4OHT), 엔독시펜, 풀베스트란트로부터 선택된 하나 이상의 리간드에 결합하고, ERT에 대한 상기 리간드의 결합은 상기 NLS를 노출시키고, 상기 ERT의 핵내 전위를 초래하는, synTF.
- 제29항에 있어서, 상기 세포질 격리 단백질이 막통과 수용체 격리 단백질을 포함하는, synTF.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 synTF가 N-말단 DBD, 상기 격리 단백질, 및 C-말단 이펙터 도메인을 포함하는, synTF.
- 제36항에 있어서, 상기 이펙터 도메인이 전사 액티베이터(TA)인, synTF.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 synTF가 N-말단 이펙터 도메인, DBD 및 C-말단 세포질 격리 단백질을 포함하는, synTF.
- 제38항에 있어서, 상기 이펙터 도메인이 전사 리프레서(TR)인, synTF.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 NS3 단백질이 소분자-보조 차단(Small molecule-Assisted Shutoff; SMASh) 도메인의 일부이고, 여기서 상기 SMASh 도메인은 상기 NS3 단백질, 부분 프로테아제 나선 도메인 및 NS4A 도메인을 포함하는, synTF.
- 제1항 내지 제9항 및 제24항 내지 제40항 중 어느 한 항에 있어서, 상기 synTF가 소분자-보조 차단(SMASh) 태그를 추가로 포함하고, 여기서 상기 SMASh 태그가 억제성 프로테아제를 포함하는 N-말단 또는 C-말단 SMASh 도메인, 부분 프로테아제 나선 도메인 및 보조인자 도메인인, synTF.
- 제41항에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, NS3 절단 부위, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4A 도메인을 포함하는 C-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 상기 이펙터 도메인의 C-말단에 융합되는, synTF.
- 제41항에 있어서, 상기 SMASh 태그가 N-말단에서 C-말단 순서로, 적어도 하나의 링커, NS3 도메인, NS3 부분 헬리카제, NS4 도메인 및 NS3 절단 부위를 포함하는 N-말단 SMASh 도메인이고, 여기서 상기 SMASh 태그는 상기 synTF의 N-말단에 융합되는, synTF.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 상기 NS3 프로테아제에 대한 저해제의 부재 하에, 상기 NS3 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 그로 인해 상기 SMASh 태그가 분해를 위한 표적이 되는 것을 초래하고("SMASh-분해", synTF-켜짐/TA-켜짐/RP-켜짐),
NS3 프로테아제에 대한 저해제의 존재 하에, NS3 프로테아제 활성이 억제되며, 그로 인해 상기 SMASh 태깅된 synTF가 분해를 위한 표적이 되는 것을 초래하는("synTF-분해", synTF-꺼짐/TA-꺼짐/RP-꺼짐"), synTF. - 제44항에 있어서, NS3 프로테아제에 대한 상기 저해제가 그라조프레비르(GRZ/GZV), 다노프레비르, 시메프레비르, 아스나프레비르, 실루프레비르, 보세프레비르, 소바프레비르, 파리타프레비르, 옴비타스비르, 파리타프레비르, 리토나비르, 다사부비르 및 텔라프레비르 중 어느 하나로부터 선택되는, synTF.
- 제24항 내지 제45항 중 어느 한 항에 있어서, 상기 synTF가 SMASh 태그 및 세포질 격리 단백질을 포함하는, synTF.
- 제46항에 있어서, 상기 synTF가 상기 세포질 격리 단백질에 대한 리간드의 존재 및 상기 NS3 프로테아제에 대한 저해제의 부재 하에 활성이고; 상기 synTF가 상기 세포질 격리 단백질에 대한 상기 리간드의 부재 및 상기 NS3 프로테아제에 대한 저해제의 존재 하에 불활성인, synTF.
- 제1항 내지 제47항 중 어느 한 항에 있어서, 하기 링커 펩티드를 추가로 포함하고, 상기 링커 펩티드는 상기 DBD와 상기 조절인자 단백질 사이; 상기 조절인자 단백질과 상기 이펙터 도메인 사이; 상기 DBD와 상기 이펙터 도메인 사이; 상기 DBD, 이펙터 도메인 또는 조절인자 단백질 내; 또는 이들의 임의의 조합으로부터의 임의의 위치에 위치될 수 있는, synTF:
PGER(서열식별번호: 340), TGSQK(서열식별번호: 341), TGEKP(서열식별번호: 342), THLR(서열식별번호: 343), TGGGEKP(서열식별번호: 344), FHYDRNNIAVGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 345); VEIEDTE(서열식별번호: 346), KDIRKILSGYIVEIEDTE(서열식별번호: 347); STEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 348), EVKQENRLLNESES(서열식별번호: 349); VGADESVVKEAHREVINSSTEGLLLNIDKDIRKILSGYIVEIEDTE(서열식별번호: 350); GGSGG(서열식별번호: 67); GGGSG(서열식별번호: 70); CVRGS(서열식별번호: 73), GGGGSG(서열식별번호: 75), GGSGSGSAC(서열식별번호: 100), LEGGGGSGG(서열식별번호: 103), GGGGSGGT(서열식별번호: 104), SGGGSGGSGSS(서열식별번호: 345); PGAGSSGDIM(서열식별번호: 88) GSSGTGSGSGTS(서열식별번호: 90); SGTS(서열식별번호: 277); GSGS(서열식별번호: 278), GGSGGS(서열식별번호: 303), 및 GSSGSS(서열식별번호: 323). - 유전자 발현 제어 시스템으로서,
c. 적어도 하나의 DNA 결합 도메인(DBD), 전사 이펙터 도메인(ED), 및 적어도 하나의 조절인자 단백질(RP)을 포함하는 적어도 하나의 합성 전사 인자(synTF)로서,
상기 ED는 상기 DBD에 직접적으로 또는 간접적으로 커플링 또는 연결되고, 상기 커플링은 상기 적어도 하나의 RP에 의해 조절되거나, 또는 상기 DBD에 연결된 상기 ED의 세포 국재화는 상기 적어도 하나의 RP에 의해 조절되고,
상기 적어도 하나의 RP는 RP 인듀서에 의해 조절되고,
상기 DBD는 유전자에 작동가능하게 연결된 프로모터의 상류에 위치한 표적 DNA 결합 모티프(DBM)에 결합할 수 있는, synTF,
d. 핵산 구축물로서,
i. 상기 synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM), 및
ii. 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및
iii. 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자를 포함하는, 핵산 구출물,
을 포함하며,
상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접할 수 있고, 상기 ED는 상기 관심 유전자의 발현을 제어하거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 ED가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하며("ED-꺼짐"),
상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
상기 RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED는 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 이펙터 도메인(ED)이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 제어할 수 있거나("ED-켜짐"), 또는
상기 RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 synTF의 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 이펙터 도메인(ED)이 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 방지하는("ED-꺼짐"),
시스템. - 제49항에 있어서, 상기 전사 이펙터 도메인(ED)이 전사 액티베이터(TA)이고,
c. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어, 상기 TA가 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 때, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 방지하며("TA-꺼짐"),
d. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 RP에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 TA 도메인이 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 켜거나("TA-켜짐"), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 TA 도메인이 상기 프로모터 서열에 근접하는 것이 방지되고, 상기 관심 유전자의 발현을 방지하는("TA-꺼짐"), 시스템. - 제49항에 있어서, 상기 ED가 전사 리프레서(TR)이고, 여기서
c. 상기 DBD에 대한 상기 ED의 커플링이 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 유지되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어, 상기 TR이 상기 관심 유전자의 발현을 방지하거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 대한 상기 ED의 커플링이 절단되어, 상기 DBD가 DNA 결합 모티프(DBM)에 결합할 때, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것이 방지되어, 상기 관심 유전자의 발현을 허용하며("TR-꺼짐"(발현-있음)),
d. 상기 DBD에 연결된 상기 ED의 세포 국재화가 상기 적어도 하나의 조절인자 단백질에 의해 조절되는 synTF의 경우;
i. RP 인듀서의 존재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되지 않아, 상기 DBD가 상기 DNA 결합 모티프(DBM)에 결합할 수 있고 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접할 수 있어 상기 관심 유전자의 발현을 끄거나("TR-켜짐"(발현-없음)), 또는
ii. RP 인듀서의 부재 하에, 상기 synTF의 DBD에 커플링된 상기 ED가 상기 세포질에서 격리되어, 상기 DBD가 상기 DBM에 결합하는 것을 방지하고, 상기 전사 리프레서(TR)가 상기 프로모터 서열에 근접하는 것을 방지하여, 상기 관심 유전자의 발현을 허용하는("TR-꺼짐"(발현-있음)),
시스템. - 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 synTF가 제1항 내지 제48항 중 어느 한 항에서 선택되는, 시스템.
- 제49항 내지 제52항 중 어느 한 항에 있어서, 상기 적어도 하나의 synTF가 N-말단 또는 C-말단 소분자-보조 차단(SMASh) 도메인을 추가로 포함하고, 여기서 SMASh 도메인은 자가-절단 SMASh 프로테아제, 부분 프로테아제 나선 도메인 및 보조인자 도메인을 포함하고,
상기 SMASh 프로테아제에 대한 저해제의 존재 하에, 상기 SMASh 프로테아제 활성이 억제되어, 상기 synTF가 분해되는 것을 초래하고, 상기 DBM에 대한 상기 synTF의 DBD의 결합을 방지하고, 상기 관심 유전자의 발현 또는 억제를 제어하며("synTF-분해"; TA-꺼짐(발현 없음), TR-꺼짐(발현-있음)),
상기 SMASh 프로테아제에 대한 저해제의 부재 하에, 상기 SMASh 프로테아제가 활성이고 상기 synTF로부터 자가-절단/커플링해제되어, 상기 SMASh 도메인이 분해를 위한 표적이 되고, 상기 synTF의 DBD가 상기 synTF의 DBM 및 ED에 결합하도록 허용되어 상기 관심 유전자의 발현을 제어하는("SMASh-분해, TA-켜짐(발현-있음), TR-켜짐(발현-없음)), 시스템. - 제49항 내지 제53항 중 어느 한 항에 있어서, 상기 프로모터가 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, TATA 프로모터, pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터 , 및 베타 액틴/ACTB 프로모터 중 임의의 것으로부터 선택되는, 시스템.
- 세포로서,
a. synTF의 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 제1 핵산 서열, 상기 적어도 하나의 DBM의 3'에 위치한 프로모터 서열, 및 상기 프로모터 서열에 작동가능하게 연결된 관심 유전자(GOI)를 코딩하는 핵산, 및
b. 유도성 또는 구성적 프로모터에 작동가능하게 연결된 제1항 내지 제48항 중 어느 한 항에 따른 합성 전사 인자(synTF)를 코딩하는 핵산을 포함하는 제2 핵산 서열을 포함하는, 세포. - 제55항에 있어서, 상기 세포가 5'에서 3' 방향으로,
a. 역 배향으로 관심 유전자(GOI)를 코딩하는 핵산 서열,
b. 역 배향이고 GOI를 코딩하는 핵산에 작동가능하게 연결된 제1 프로모터 서열,
c. synTF의 상기 적어도 하나의 DBD의 결합을 위한 표적 핵산을 포함하는 적어도 하나의 표적 DNA 결합 모티프(DBM)를 포함하는 핵산 서열로서, 여기서 상기 synTF의 DBD의 결합은 상기 이펙터 도메인(ED)을 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열의 근처에 위치시키는, 핵산 서열,
d. 제2 프로모터 서열, 및
e. 상기 제2 프로모터 서열에 작동가능하게 연결된, 상기 합성 전사 인자(synTF)를 코딩하는 핵산 서열로서, 여기서 상기 코딩된 synTF는 (c)의 상기 핵산 서열의 상기 적어도 DBM에 결합하는 적어도 하나의 DBD를 포함하는, 핵산 서열,
을 포함하는 핵산 구축물을 포함하는, 세포. - 제55항 또는 제56항에 있어서, 상기 GOI에 작동가능하게 연결된 상기 프로모터 서열이 miniCMV 프로모터, miniTK 프로모터, ybTATA 프로모터, minSV40 프로모터, CMV53 프로모터, pJB42CAT5 프로모터, MLP 프로모터, 및 TATA 프로모터 중 임의의 것으로부터 선택되는, 세포.
- 제55항 또는 제56항에 있어서, 상기 synTF를 코딩하는 핵산에 작동가능하게 연결된 상기 프로모터 서열이 pSFFV 프로모터, CMV 프로모터, pUb/UbC 프로모터, EF1a 프로모터, PGK/pGK 프로모터, CAG/CAGG 프로모터, SV40 프로모터, 및 베타 액틴/ACTB 프로모터인, 세포.
- 제1항 내지 제48항 중 어느 한 항의 synTF, 또는 제49항 내지 제54항 중 어느 한 항의 synTF 시스템을 코딩하는 폴리뉴클레오티드.
- 제59항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항 내지 제48항 중 어느 한 항의 synTF, 제49항 내지 제54항 중 어느 한 항의 synTF 시스템, 제55항 내지 제58항 중 어느 한 항의 synTF 세포, 제59항의 폴리뉴클레오티드, 또는 제60항의 벡터를 포함하는 조성물.
- 제1항 내지 제48항 중 어느 한 항의 synTF, 제49항 내지 제54항 중 어느 한 항의 synTF 시스템, 제55항 내지 제58항 중 어느 한 항의 synTF 세포, 제59항의 폴리뉴클레오티드, 또는 제60항의 벡터, 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물.
- synTF의 활성을 조절하는 방법으로서,
a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법. - 관심 유전자의 발현을 조절하는 방법으로서,
a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 제공하는 단계; 및
b. 상기 세포 집단을 유효량의 조절인자 단백질 인듀서와 접촉시키는 단계
를 포함하는, 방법. - 세포 기반 요법을 필요로 하는 대상체를 치료하는 방법으로서,
a. 제55항 내지 제58항 중 어느 한 항의 세포 집단을 상기 대상체에게 투여하는 단계; 및
b. 상기 대상체에 유효량의 조절인자 단백질 인듀서를 투여하는 단계
를 포함하는, 방법. - 제63항 내지 제65항 중 어느 한 항에 있어서, 상기 세포 집단이 면역 세포를 포함하는, 방법.
- 제65항에 있어서, 상기 면역 세포의 집단이 CD4+ T 세포, CD8+ T 세포, Treg, 또는 NK 세포를 포함하는, 방법.
- 제65항 내지 제67항 중 어느 한 항에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여되는 것과 동시에 투여되는, 방법.
- 제65항 내지 제67항 중 어느 한 항에 있어서, 상기 조절인자 단백질 인듀서가 상기 세포 집단이 투여된 후에 투여되는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962848850P | 2019-05-16 | 2019-05-16 | |
US62/848,850 | 2019-05-16 | ||
PCT/US2020/033171 WO2020232366A2 (en) | 2019-05-16 | 2020-05-15 | Regulated synthetic gene expression systems |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220009980A true KR20220009980A (ko) | 2022-01-25 |
Family
ID=73288822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217040123A KR20220009980A (ko) | 2019-05-16 | 2020-05-15 | 조절된 합성 유전자 발현 시스템 |
Country Status (8)
Country | Link |
---|---|
US (2) | US11530246B2 (ko) |
EP (1) | EP3969037A4 (ko) |
JP (1) | JP2022532236A (ko) |
KR (1) | KR20220009980A (ko) |
CN (1) | CN114375198A (ko) |
AU (1) | AU2020275884A1 (ko) |
CA (1) | CA3138576A1 (ko) |
WO (1) | WO2020232366A2 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11572565B2 (en) | 2020-07-21 | 2023-02-07 | Trustees Of Boston University | Inducible control of gene expression |
CA3208497A1 (en) * | 2021-01-15 | 2022-07-21 | Outpace Bio, Inc. | Small molecule-regulated gene expression system |
JP2024513232A (ja) * | 2021-04-06 | 2024-03-22 | センティ バイオサイエンシズ インコーポレイテッド | 薬物で調節可能な転写リプレッサー |
US20230304062A1 (en) * | 2021-10-18 | 2023-09-28 | Regeneron Pharmaceuticals, Inc. | Controlled transcription of polynucleotides |
US20230151353A1 (en) * | 2021-11-12 | 2023-05-18 | Replace Therapeutics, Inc. | Direct replacement genome editing |
WO2023225482A2 (en) * | 2022-05-16 | 2023-11-23 | The Regents Of The University Of California | T cell activation responsive constructs for enhanced car-t cell therapy |
US20240110185A1 (en) * | 2022-08-15 | 2024-04-04 | Trustees Of Boston University | Inducible anti-sense repressor switches and uses thereof |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2814642B1 (fr) | 2000-10-03 | 2005-07-01 | Ass Pour Le Dev De La Rech En | Souris transgenique pour la recombinaison ciblee mediee par la cre-er modifiee |
US8173792B2 (en) | 2007-02-09 | 2012-05-08 | The Board Of Trustees Of The Leland Stanford Junior University | Method for regulating protein function in cells using synthetic small molecules |
US8530636B2 (en) | 2008-05-07 | 2013-09-10 | The Board Of Trustees Of The Leland Stanford Junior University | Method for regulating protein function in cells in vivo using synthetic small molecules |
US20120178647A1 (en) * | 2009-08-03 | 2012-07-12 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
CA2825064C (en) * | 2011-02-04 | 2022-08-30 | Genentech, Inc. | Fc variants and methods for their production |
WO2013022739A1 (en) | 2011-08-05 | 2013-02-14 | Leonard Joshua N | Modular extracellular sensor architecture for cell-based biosensors |
US8735096B2 (en) | 2012-03-22 | 2014-05-27 | The Board Of Trustees Of The Leland Stanford Junior University | Optical control of protein activity and localization by fusion to photochromic protein domains |
TW201514202A (zh) * | 2013-04-03 | 2015-04-16 | Aliophtha Ag | 經工程改造以克服內體捕獲之人工轉錄因子 |
EP3080271B1 (en) | 2013-12-12 | 2020-02-12 | The Broad Institute, Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
US11030531B2 (en) | 2014-06-06 | 2021-06-08 | Trustees Of Boston University | DNA recombinase circuits for logical control of gene expression |
AU2016222887B2 (en) | 2015-02-24 | 2022-07-14 | The Regents Of The University Of California | Binding-triggered transcriptional switches and methods of use thereof |
WO2017004022A2 (en) | 2015-06-29 | 2017-01-05 | The Board Of Trustees Of The Leland Stanford Junior University | Degron fusion constructs and methods for controlling protein production |
EP3331905B1 (en) | 2015-08-06 | 2022-10-05 | Dana-Farber Cancer Institute, Inc. | Targeted protein degradation to attenuate adoptive t-cell therapy associated adverse inflammatory responses |
WO2018039471A2 (en) * | 2016-08-25 | 2018-03-01 | Trustees Of Boston University | Synthetic transcriptional and epigenetic regulators based on engineered, orthogonal zinc finger proteins |
US20180163195A1 (en) | 2016-12-12 | 2018-06-14 | Trustees Of Boston University | Inducible dimerization of recombinases |
WO2018222880A1 (en) * | 2017-05-31 | 2018-12-06 | Trustees Of Boston University | Mechano-activated control of gene expression |
US20210087548A1 (en) | 2017-07-24 | 2021-03-25 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and Methods for Inducing Protein Function |
WO2020006409A1 (en) | 2018-06-28 | 2020-01-02 | Trustees Of Boston University | Systems and methods for control of gene expression |
-
2020
- 2020-05-15 WO PCT/US2020/033171 patent/WO2020232366A2/en active Application Filing
- 2020-05-15 JP JP2021568243A patent/JP2022532236A/ja active Pending
- 2020-05-15 EP EP20805147.4A patent/EP3969037A4/en active Pending
- 2020-05-15 KR KR1020217040123A patent/KR20220009980A/ko unknown
- 2020-05-15 AU AU2020275884A patent/AU2020275884A1/en active Pending
- 2020-05-15 CA CA3138576A patent/CA3138576A1/en active Pending
- 2020-05-15 US US16/875,591 patent/US11530246B2/en active Active
- 2020-05-15 CN CN202080051636.2A patent/CN114375198A/zh active Pending
-
2022
- 2022-10-07 US US17/938,787 patent/US20230159600A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2020275884A1 (en) | 2022-01-06 |
JP2022532236A (ja) | 2022-07-13 |
US11530246B2 (en) | 2022-12-20 |
CA3138576A1 (en) | 2020-11-19 |
US20200377564A1 (en) | 2020-12-03 |
WO2020232366A3 (en) | 2020-12-17 |
EP3969037A2 (en) | 2022-03-23 |
US20230159600A1 (en) | 2023-05-25 |
WO2020232366A2 (en) | 2020-11-19 |
EP3969037A4 (en) | 2024-01-17 |
CN114375198A (zh) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20220009980A (ko) | 조절된 합성 유전자 발현 시스템 | |
US20220089750A1 (en) | Car-expressing cells against multiple tumor antigens and uses thereof | |
KR20180097631A (ko) | 핵산을 와우 및 전정 세포에 전달하기 위한 물질 및 방법 | |
KR102550926B1 (ko) | 이중 항체 구축물을 발현하는 aav를 포함하는 조성물 및 이들의 용도 | |
RU2762359C2 (ru) | Химерные антигенные рецепторы, нацеленные на рецептор, связанный с g-белками, и их применение | |
KR20200032174A (ko) | 강화된 키메라 항원 수용체 및 이의 용도 | |
JP2023036921A (ja) | 蝸牛および前庭細胞に核酸を送達するための物質および方法 | |
KR20180108590A (ko) | 항-tcr-복합체 항체 또는 단편을 암호화하는 바이러스 | |
KR20210068485A (ko) | 노화를 역전시키고 기관 및 조직 재생을 촉진시키기 위한 세포 재프로그래밍 | |
TW200940563A (en) | Improved mammalian expression vectors and uses thereof | |
CN107849583B (zh) | 使用细胞分裂基因座控制细胞增殖的工具和方法 | |
KR20190100200A (ko) | 동종이형 종양 세포 백신 | |
AU2017240233A1 (en) | A highly sensitive and specific luciferase based reporter assay for antigen detection | |
KR20100128286A (ko) | 조혈계 기원의 종양 치료용 조성물 및 방법 | |
CN112262214A (zh) | 病毒载体及包装细胞系 | |
KR20210154176A (ko) | 표적화된 생체내 후성유전학적 억제에 의한 장기지속성 진통 | |
KR20220103928A (ko) | 시험관 내 활성화 및 연쇄 살해 t 세포 집단의 확장 및 종양 세포 사멸 세포로 암 환자의 수동 면역화를 위한 조성물 및 방법 | |
AU2024200495A1 (en) | Magea1 immunogenic peptides, binding proteins recognizing magea1 immunogenic peptides, and uses thereof | |
KR20220041214A (ko) | Il-1 수퍼패밀리의 사이토카인의 시공적 제한 활성으로 무장된 면역반응성 세포 | |
KR20230002681A (ko) | 대형 아데노바이러스 페이로드의 통합 | |
JP2023179549A (ja) | 腫瘍抗原をコードする麻疹ウイルス | |
CN114008209A (zh) | Aav介导的枫糖尿症(msud)基因疗法 | |
CN115768890A (zh) | 通过分子和物理启动对t细胞免疫疗法的热控制 | |
NL2027815B1 (en) | Genomic integration | |
RU2812852C2 (ru) | Невирусные днк-векторы и варианты их применения для экспрессии терапевтического средства на основе фактора viii (fviii) |