KR20190130613A - 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 - Google Patents
핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 Download PDFInfo
- Publication number
- KR20190130613A KR20190130613A KR1020197031141A KR20197031141A KR20190130613A KR 20190130613 A KR20190130613 A KR 20190130613A KR 1020197031141 A KR1020197031141 A KR 1020197031141A KR 20197031141 A KR20197031141 A KR 20197031141A KR 20190130613 A KR20190130613 A KR 20190130613A
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- seq
- domain
- fusion protein
- deaminase
- Prior art date
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 243
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 223
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 222
- 102000052510 DNA-Binding Proteins Human genes 0.000 title claims abstract description 64
- 108700020911 DNA-Binding Proteins Proteins 0.000 title claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 371
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 349
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 310
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 309
- 238000000034 method Methods 0.000 claims abstract description 171
- 101710096438 DNA-binding protein Proteins 0.000 claims abstract description 38
- 241000282414 Homo sapiens Species 0.000 claims abstract description 32
- 108091033409 CRISPR Proteins 0.000 claims description 469
- 230000035772 mutation Effects 0.000 claims description 323
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 247
- 210000004027 cell Anatomy 0.000 claims description 174
- 108020004414 DNA Proteins 0.000 claims description 124
- 150000001413 amino acids Chemical class 0.000 claims description 102
- 239000003795 chemical substances by application Substances 0.000 claims description 102
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 99
- 230000000694 effects Effects 0.000 claims description 85
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 84
- 101710163270 Nuclease Proteins 0.000 claims description 83
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 80
- 108020005004 Guide RNA Proteins 0.000 claims description 74
- 201000010099 disease Diseases 0.000 claims description 70
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 65
- 239000002773 nucleotide Substances 0.000 claims description 65
- 125000003729 nucleotide group Chemical group 0.000 claims description 65
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 55
- 102000053602 DNA Human genes 0.000 claims description 46
- 229940035893 uracil Drugs 0.000 claims description 44
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 claims description 41
- 102000054962 human APOBEC3G Human genes 0.000 claims description 41
- 108091000080 Phosphotransferase Proteins 0.000 claims description 37
- 102000020233 phosphotransferase Human genes 0.000 claims description 37
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 36
- 125000000896 monocarboxylic acid group Chemical group 0.000 claims description 36
- 229940104302 cytosine Drugs 0.000 claims description 32
- 230000000295 complement effect Effects 0.000 claims description 29
- 208000035475 disorder Diseases 0.000 claims description 29
- 229940113491 Glycosylase inhibitor Drugs 0.000 claims description 27
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 27
- 238000012937 correction Methods 0.000 claims description 22
- -1 cationic lipid Chemical class 0.000 claims description 21
- 238000006481 deamination reaction Methods 0.000 claims description 21
- 238000000338 in vitro Methods 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 230000009615 deamination Effects 0.000 claims description 19
- 108020004705 Codon Proteins 0.000 claims description 18
- 230000014509 gene expression Effects 0.000 claims description 18
- 101710095342 Apolipoprotein B Proteins 0.000 claims description 15
- 102100040202 Apolipoprotein B-100 Human genes 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 15
- 239000000203 mixture Substances 0.000 claims description 15
- 101710180243 Cytidine deaminase 1 Proteins 0.000 claims description 14
- 230000017156 mRNA modification Effects 0.000 claims description 14
- 230000030648 nucleus localization Effects 0.000 claims description 14
- 241000252212 Danio rerio Species 0.000 claims description 12
- 239000008194 pharmaceutical composition Substances 0.000 claims description 12
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 claims description 11
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 claims description 10
- 238000001727 in vivo Methods 0.000 claims description 10
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 claims description 9
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 9
- 102000002797 APOBEC-3G Deaminase Human genes 0.000 claims description 9
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 claims description 9
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 claims description 9
- 230000001580 bacterial effect Effects 0.000 claims description 9
- 102000040430 polynucleotide Human genes 0.000 claims description 9
- 108091033319 polynucleotide Proteins 0.000 claims description 9
- 239000002157 polynucleotide Substances 0.000 claims description 9
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 claims description 8
- 101000964330 Homo sapiens C->U-editing enzyme APOBEC-1 Proteins 0.000 claims description 8
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 claims description 8
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 claims description 8
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 claims description 8
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 claims description 8
- 108010021466 Mutant Proteins Proteins 0.000 claims description 8
- 102000008300 Mutant Proteins Human genes 0.000 claims description 8
- 102000046390 human APOBEC1 Human genes 0.000 claims description 8
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 claims description 7
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 claims description 7
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 claims description 7
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 claims description 7
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 claims description 7
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 claims description 7
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 claims description 7
- 241000894006 Bacteria Species 0.000 claims description 6
- 206010056370 Congestive cardiomyopathy Diseases 0.000 claims description 6
- 201000010046 Dilated cardiomyopathy Diseases 0.000 claims description 6
- 206010029260 Neuroblastoma Diseases 0.000 claims description 6
- 208000027276 Von Willebrand disease Diseases 0.000 claims description 6
- 210000002257 embryonic structure Anatomy 0.000 claims description 6
- 208000012137 von Willebrand disease (hereditary or acquired) Diseases 0.000 claims description 6
- 241000588724 Escherichia coli Species 0.000 claims description 5
- 241000124008 Mammalia Species 0.000 claims description 5
- 102000001253 Protein Kinase Human genes 0.000 claims description 5
- 230000002401 inhibitory effect Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 108060006633 protein kinase Proteins 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 4
- 241000251539 Vertebrata <Metazoa> Species 0.000 claims description 4
- 238000010367 cloning Methods 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- 210000003734 kidney Anatomy 0.000 claims description 4
- 239000011347 resin Substances 0.000 claims description 4
- 229920005989 resin Polymers 0.000 claims description 4
- 208000011580 syndromic disease Diseases 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 claims description 3
- 208000029323 Congenital myotonia Diseases 0.000 claims description 3
- 102100036912 Desmin Human genes 0.000 claims description 3
- 108010044052 Desmin Proteins 0.000 claims description 3
- 206010020649 Hyperkeratosis Diseases 0.000 claims description 3
- 208000021642 Muscular disease Diseases 0.000 claims description 3
- 201000009623 Myopathy Diseases 0.000 claims description 3
- 208000010316 Myotonia congenita Diseases 0.000 claims description 3
- 201000011252 Phenylketonuria Diseases 0.000 claims description 3
- 208000024777 Prion disease Diseases 0.000 claims description 3
- 108020004459 Small interfering RNA Proteins 0.000 claims description 3
- 206010002022 amyloidosis Diseases 0.000 claims description 3
- 230000001684 chronic effect Effects 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 210000005045 desmin Anatomy 0.000 claims description 3
- 210000003027 ear inner Anatomy 0.000 claims description 3
- 208000025688 early-onset autosomal dominant Alzheimer disease Diseases 0.000 claims description 3
- 208000015756 familial Alzheimer disease Diseases 0.000 claims description 3
- 201000006716 hereditary lymphedema Diseases 0.000 claims description 3
- 208000032300 lymphatic malformation Diseases 0.000 claims description 3
- 208000002502 lymphedema Diseases 0.000 claims description 3
- 230000000926 neurological effect Effects 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 2
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 claims description 2
- 241000251745 Petromyzon marinus Species 0.000 claims description 2
- 208000010641 Tooth disease Diseases 0.000 claims description 2
- 238000005341 cation exchange Methods 0.000 claims description 2
- 108020004999 messenger RNA Proteins 0.000 claims description 2
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 229920002704 polyhistidine Polymers 0.000 claims description 2
- 102000005381 Cytidine Deaminase Human genes 0.000 claims 32
- 239000007864 aqueous solution Substances 0.000 claims 14
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims 12
- 239000004055 small Interfering RNA Substances 0.000 claims 4
- 239000006166 lysate Substances 0.000 claims 3
- 210000001161 mammalian embryo Anatomy 0.000 claims 3
- 108700011259 MicroRNAs Proteins 0.000 claims 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 claims 2
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 claims 2
- 238000005277 cation exchange chromatography Methods 0.000 claims 2
- 210000003477 cochlea Anatomy 0.000 claims 2
- 239000003480 eluent Substances 0.000 claims 2
- 230000002934 lysing effect Effects 0.000 claims 2
- 239000002679 microRNA Substances 0.000 claims 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 claims 1
- 238000001042 affinity chromatography Methods 0.000 claims 1
- 230000000536 complexating effect Effects 0.000 claims 1
- 108091027963 non-coding RNA Proteins 0.000 claims 1
- 102000042567 non-coding RNA Human genes 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 238000000926 separation method Methods 0.000 claims 1
- 229910052709 silver Inorganic materials 0.000 claims 1
- 239000004332 silver Substances 0.000 claims 1
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 5
- 108020001580 protein domains Proteins 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 295
- 239000002585 base Substances 0.000 description 267
- 230000000875 corresponding effect Effects 0.000 description 98
- 229940024606 amino acid Drugs 0.000 description 97
- 235000001014 amino acid Nutrition 0.000 description 95
- 102000004190 Enzymes Human genes 0.000 description 72
- 108090000790 Enzymes Proteins 0.000 description 72
- 229940088598 enzyme Drugs 0.000 description 72
- 238000001712 DNA sequencing Methods 0.000 description 50
- 102100026846 Cytidine deaminase Human genes 0.000 description 46
- 239000012634 fragment Substances 0.000 description 41
- 239000013612 plasmid Substances 0.000 description 35
- 239000000047 product Substances 0.000 description 31
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 30
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 30
- 108090000765 processed proteins & peptides Proteins 0.000 description 30
- 238000012163 sequencing technique Methods 0.000 description 29
- 238000006243 chemical reaction Methods 0.000 description 28
- 238000010362 genome editing Methods 0.000 description 25
- 238000011282 treatment Methods 0.000 description 25
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 24
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 24
- 230000004927 fusion Effects 0.000 description 24
- 230000008685 targeting Effects 0.000 description 24
- 125000006850 spacer group Chemical group 0.000 description 22
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 21
- 238000002474 experimental method Methods 0.000 description 21
- 230000027455 binding Effects 0.000 description 20
- 239000000463 material Substances 0.000 description 20
- 108020004682 Single-Stranded DNA Proteins 0.000 description 19
- 238000003776 cleavage reaction Methods 0.000 description 19
- 230000007017 scission Effects 0.000 description 19
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 18
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 18
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 17
- 102100027281 Fanconi anemia group F protein Human genes 0.000 description 17
- 239000000758 substrate Substances 0.000 description 17
- 241000700159 Rattus Species 0.000 description 16
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 16
- 238000012165 high-throughput sequencing Methods 0.000 description 16
- 108091079001 CRISPR RNA Proteins 0.000 description 15
- 102220613443 Casein kinase II subunit alpha 3_E1006A_mutation Human genes 0.000 description 14
- 102220606875 Cytosolic arginine sensor for mTORC1 subunit 2_H840A_mutation Human genes 0.000 description 14
- 230000003197 catalytic effect Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 210000005260 human cell Anatomy 0.000 description 14
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 14
- 238000001890 transfection Methods 0.000 description 14
- 102220613830 Casein kinase II subunit alpha 3_D1255A_mutation Human genes 0.000 description 13
- 102220613440 Casein kinase II subunit alpha 3_D917A_mutation Human genes 0.000 description 13
- 206010028980 Neoplasm Diseases 0.000 description 13
- 238000003556 assay Methods 0.000 description 13
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 13
- 239000000499 gel Substances 0.000 description 13
- 102000004196 processed proteins & peptides Human genes 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 230000007018 DNA scission Effects 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 12
- 108091028113 Trans-activating crRNA Proteins 0.000 description 12
- 238000009826 distribution Methods 0.000 description 12
- 239000012636 effector Substances 0.000 description 12
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 11
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 11
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 11
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 11
- 201000011510 cancer Diseases 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 229920000642 polymer Polymers 0.000 description 11
- 229920001184 polypeptide Polymers 0.000 description 11
- 108010055325 EphB3 Receptor Proteins 0.000 description 10
- 102100031982 Ephrin type-B receptor 3 Human genes 0.000 description 10
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 10
- 239000012097 Lipofectamine 2000 Substances 0.000 description 10
- 210000004962 mammalian cell Anatomy 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 101710116602 DNA-Binding protein G5P Proteins 0.000 description 9
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 9
- 241000589601 Francisella Species 0.000 description 9
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 9
- 101710162453 Replication factor A Proteins 0.000 description 9
- 101710176758 Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 9
- 101710176276 SSB protein Proteins 0.000 description 9
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 9
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 230000033590 base-excision repair Effects 0.000 description 9
- 230000001771 impaired effect Effects 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 241000283690 Bos taurus Species 0.000 description 8
- 238000010442 DNA editing Methods 0.000 description 8
- 102000004533 Endonucleases Human genes 0.000 description 8
- 108010042407 Endonucleases Proteins 0.000 description 8
- 101900341982 Escherichia coli Uracil-DNA glycosylase Proteins 0.000 description 8
- 239000003112 inhibitor Substances 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 230000008439 repair process Effects 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 108091006106 transcriptional activators Proteins 0.000 description 8
- 239000004475 Arginine Substances 0.000 description 7
- 238000012512 characterization method Methods 0.000 description 7
- 239000013078 crystal Substances 0.000 description 7
- 230000001717 pathogenic effect Effects 0.000 description 7
- 229920002401 polyacrylamide Polymers 0.000 description 7
- 229940113082 thymine Drugs 0.000 description 7
- 229930024421 Adenine Natural products 0.000 description 6
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 6
- 208000024827 Alzheimer disease Diseases 0.000 description 6
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 6
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 6
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 6
- 208000026350 Inborn Genetic disease Diseases 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 229960000643 adenine Drugs 0.000 description 6
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 6
- 230000009849 deactivation Effects 0.000 description 6
- 208000016361 genetic disease Diseases 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 241000282575 Gorilla Species 0.000 description 5
- 241000282577 Pan troglodytes Species 0.000 description 5
- 239000004698 Polyethylene Substances 0.000 description 5
- 102000018120 Recombinases Human genes 0.000 description 5
- 108010091086 Recombinases Proteins 0.000 description 5
- 238000002679 ablation Methods 0.000 description 5
- 210000001130 astrocyte Anatomy 0.000 description 5
- 230000007711 cytoplasmic localization Effects 0.000 description 5
- 230000009395 genetic defect Effects 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 238000001638 lipofection Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- 239000013641 positive control Substances 0.000 description 5
- 230000002062 proliferating effect Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 102200085789 rs121913279 Human genes 0.000 description 5
- 102200102928 rs148924904 Human genes 0.000 description 5
- 108091006107 transcriptional repressors Proteins 0.000 description 5
- 102100029470 Apolipoprotein E Human genes 0.000 description 4
- 101710095339 Apolipoprotein E Proteins 0.000 description 4
- 241000203069 Archaea Species 0.000 description 4
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 4
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 description 4
- 101710088570 Flagellar hook-associated protein 1 Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 102000029812 HNH nuclease Human genes 0.000 description 4
- 108060003760 HNH nuclease Proteins 0.000 description 4
- 101000938351 Homo sapiens Ephrin type-A receptor 3 Proteins 0.000 description 4
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 4
- 102100039384 Huntingtin-associated protein 1 Human genes 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 4
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 4
- 241000194017 Streptococcus Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 230000032823 cell division Effects 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 230000035800 maturation Effects 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 108700014590 single-stranded DNA binding proteins Proteins 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 3
- 108010013043 Acetylesterase Proteins 0.000 description 3
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 3
- 108091032955 Bacterial small RNA Proteins 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 3
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 3
- 108091027305 Heteroduplex Proteins 0.000 description 3
- 101000807668 Homo sapiens Uracil-DNA glycosylase Proteins 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 241000282553 Macaca Species 0.000 description 3
- 101100445099 Mus musculus Emx1 gene Proteins 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 102000055027 Protein Methyltransferases Human genes 0.000 description 3
- 108700040121 Protein Methyltransferases Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 101710082933 Single-strand DNA-binding protein Proteins 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 102000005421 acetyltransferase Human genes 0.000 description 3
- 108020002494 acetyltransferase Proteins 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 150000001408 amides Chemical class 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 3
- 229910052786 argon Inorganic materials 0.000 description 3
- 230000008970 bacterial immunity Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 108020001778 catalytic domains Proteins 0.000 description 3
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 230000001613 neoplastic effect Effects 0.000 description 3
- 230000006780 non-homologous end joining Effects 0.000 description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000000344 soap Substances 0.000 description 3
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 2
- 241001147780 Alicyclobacillus Species 0.000 description 2
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 2
- 102000008682 Argonaute Proteins Human genes 0.000 description 2
- 108010088141 Argonaute Proteins Proteins 0.000 description 2
- 241000702199 Bacillus phage PBS2 Species 0.000 description 2
- 241000701844 Bacillus virus phi29 Species 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000918600 Corynebacterium ulcerans Species 0.000 description 2
- RGSFGYAAUTVSQA-UHFFFAOYSA-N Cyclopentane Chemical compound C1CCCC1 RGSFGYAAUTVSQA-UHFFFAOYSA-N 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 2
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 2
- 241000400604 Erwinia tasmaniensis Species 0.000 description 2
- 108091092584 GDNA Proteins 0.000 description 2
- 208000031448 Genomic Instability Diseases 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 2
- 108010015268 Integration Host Factors Proteins 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000186805 Listeria innocua Species 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 102220506341 N-alpha-acetyltransferase 40_W90A_mutation Human genes 0.000 description 2
- 241000204974 Natronobacterium Species 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 102100036007 Ribonuclease 3 Human genes 0.000 description 2
- 101710192197 Ribonuclease 3 Proteins 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 241000202917 Spiroplasma Species 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 241000167564 Sulfolobus islandicus Species 0.000 description 2
- 101800005109 Triakontatetraneuropeptide Proteins 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 238000002441 X-ray diffraction Methods 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 210000005006 adaptive immune system Anatomy 0.000 description 2
- 230000003140 astrocytic effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000008512 biological response Effects 0.000 description 2
- 108700023293 biotin carboxyl carrier Proteins 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000013592 cell lysate Substances 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 206010013023 diphtheria Diseases 0.000 description 2
- 208000016097 disease of metabolism Diseases 0.000 description 2
- 208000037765 diseases and disorders Diseases 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 239000012039 electrophile Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 230000002132 lysosomal effect Effects 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000035755 proliferation Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000013636 protein dimer Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 102220311930 rs1556885815 Human genes 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108010047303 von Willebrand Factor Proteins 0.000 description 2
- 102100036537 von Willebrand factor Human genes 0.000 description 2
- 229960001134 von willebrand factor Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- DOBIZWYVJFIYOV-UHFFFAOYSA-N 7-hydroxynaphthalene-1,3-disulfonic acid Chemical compound C1=C(S(O)(=O)=O)C=C(S(O)(=O)=O)C2=CC(O)=CC=C21 DOBIZWYVJFIYOV-UHFFFAOYSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- UBDHSURDYAETAL-UHFFFAOYSA-N 8-aminonaphthalene-1,3,6-trisulfonic acid Chemical compound OS(=O)(=O)C1=CC(S(O)(=O)=O)=C2C(N)=CC(S(O)(=O)=O)=CC2=C1 UBDHSURDYAETAL-UHFFFAOYSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- 241000158640 Acanthodactylus aureus Species 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 101000860094 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) CRISPR-associated endonuclease Cas12b Proteins 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 102100034452 Alternative prion protein Human genes 0.000 description 1
- 102000009081 Apolipoprotein A-II Human genes 0.000 description 1
- 108010087614 Apolipoprotein A-II Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000616876 Belliella baltica Species 0.000 description 1
- 206010060999 Benign neoplasm Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000683792 Burkholderia virus DC1 Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102100026550 Caspase-9 Human genes 0.000 description 1
- 108090000566 Caspase-9 Proteins 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102100023457 Chloride channel protein 1 Human genes 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241001662504 Desulfotalea psychrophila Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000382842 Flavobacterium psychrophilum Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 108050008753 HNH endonucleases Proteins 0.000 description 1
- 102000000310 HNH endonucleases Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000924727 Homo sapiens Alternative prion protein Proteins 0.000 description 1
- 101000906651 Homo sapiens Chloride channel protein 1 Proteins 0.000 description 1
- 101000742769 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 101001029302 Homo sapiens Forkhead box protein D4 Proteins 0.000 description 1
- 101000573901 Homo sapiens Major prion protein Proteins 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 101001092125 Homo sapiens Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 1
- 101000851030 Homo sapiens Vascular endothelial growth factor receptor 3 Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 102100022905 Keratin, type II cytoskeletal 1 Human genes 0.000 description 1
- 108010070514 Keratin-1 Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 241000029603 Leptotrichia shahii Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241000321600 Marinitoga Species 0.000 description 1
- 241001357706 Marinitoga piezophila Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100377883 Mus musculus Apobec1 gene Proteins 0.000 description 1
- 101100377889 Mus musculus Apobec2 gene Proteins 0.000 description 1
- 101100489911 Mus musculus Apobec3 gene Proteins 0.000 description 1
- 101000755751 Mus musculus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 102100022691 NACHT, LRR and PYD domains-containing protein 3 Human genes 0.000 description 1
- 101710126825 NACHT, LRR and PYD domains-containing protein 3 Proteins 0.000 description 1
- 241000169176 Natronobacterium gregoryi Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 241000207746 Nicotiana benthamiana Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091007960 PI3Ks Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101100214779 Pan troglodytes APOBEC3G gene Proteins 0.000 description 1
- 241001119551 Parcubacteria group Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010069013 Phenylalanine Hydroxylase Proteins 0.000 description 1
- 108090000430 Phosphatidylinositol 3-kinases Proteins 0.000 description 1
- 102000003993 Phosphatidylinositol 3-kinases Human genes 0.000 description 1
- 102000023159 Platelet Glycoprotein GPIb-IX Complex Human genes 0.000 description 1
- 108010045766 Platelet Glycoprotein GPIb-IX Complex Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 102000012412 Presenilin-1 Human genes 0.000 description 1
- 108010036933 Presenilin-1 Proteins 0.000 description 1
- 241001135221 Prevotella intermedia Species 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 241000355705 Psychrobacter arcticus Species 0.000 description 1
- 241000309106 Psychrobacter cryohalolentis Species 0.000 description 1
- 241000577544 Psychroflexus torquis Species 0.000 description 1
- 241000948194 Psychromonas Species 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102000018780 Replication Protein A Human genes 0.000 description 1
- 108010027643 Replication Protein A Proteins 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101710170912 SOSS complex subunit B1 Proteins 0.000 description 1
- 102100022380 SOSS complex subunit B2 Human genes 0.000 description 1
- 101710170904 SOSS complex subunit B2 Proteins 0.000 description 1
- 101710141933 Single-stranded DNA-binding protein 1 Proteins 0.000 description 1
- 101710141938 Single-stranded DNA-binding protein 2 Proteins 0.000 description 1
- 102100029719 Single-stranded DNA-binding protein, mitochondrial Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 102220497176 Small vasohibin-binding protein_T47D_mutation Human genes 0.000 description 1
- 241001606419 Spiroplasma syrphidicola Species 0.000 description 1
- 241000203029 Spiroplasma taiwanense Species 0.000 description 1
- 241000194056 Streptococcus iniae Species 0.000 description 1
- 241000694196 Streptococcus pneumoniae R6 Species 0.000 description 1
- 241001446311 Streptomyces coelicolor A3(2) Species 0.000 description 1
- 102220610854 Thialysine N-epsilon-acetyltransferase_D9A_mutation Human genes 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 150000001266 acyl halides Chemical class 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 150000001502 aryl halides Chemical class 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 229940000635 beta-alanine Drugs 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 125000000837 carbohydrate group Chemical group 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000010001 cellular homeostasis Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000003749 cleanliness Effects 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- UZUODNWWWUQRIR-UHFFFAOYSA-L disodium;3-aminonaphthalene-1,5-disulfonate Chemical compound [Na+].[Na+].C1=CC=C(S([O-])(=O)=O)C2=CC(N)=CC(S([O-])(=O)=O)=C21 UZUODNWWWUQRIR-UHFFFAOYSA-L 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 125000005313 fatty acid group Chemical group 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- DMEGYFMYUHOHGS-UHFFFAOYSA-N heptamethylene Natural products C1CCCCCC1 DMEGYFMYUHOHGS-UHFFFAOYSA-N 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 102000043482 human APOBEC2 Human genes 0.000 description 1
- 102000048646 human APOBEC3A Human genes 0.000 description 1
- 102000048415 human APOBEC3B Human genes 0.000 description 1
- 102000048419 human APOBEC3C Human genes 0.000 description 1
- 102000043429 human APOBEC3D Human genes 0.000 description 1
- 102000049338 human APOBEC3F Human genes 0.000 description 1
- 102000044839 human APOBEC3H Human genes 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 230000003463 hyperproliferative effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical group O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 210000004966 intestinal stem cell Anatomy 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000004898 kneading Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- YFVGRULMIQXYNE-UHFFFAOYSA-M lithium;dodecyl sulfate Chemical compound [Li+].CCCCCCCCCCCCOS([O-])(=O)=O YFVGRULMIQXYNE-UHFFFAOYSA-M 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 210000002220 organoid Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000001855 preneoplastic effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 102200106214 rs876660807 Human genes 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000030968 tissue homeostasis Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical compound CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- UGZADUVQMDAIAO-UHFFFAOYSA-L zinc hydroxide Chemical compound [OH-].[OH-].[Zn+2] UGZADUVQMDAIAO-UHFFFAOYSA-L 0.000 description 1
- 229940007718 zinc hydroxide Drugs 0.000 description 1
- 229910021511 zinc hydroxide Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Pharmacology & Pharmacy (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicinal Preparation (AREA)
Abstract
본 개시내용의 일부 측면은 세포 또는 대상체의 게놈 내에서, 예를 들어, 인간 게놈 내에서 단일 부위를 편집하는 것을 포함하는, 핵산의 표적화된 편집에 유용한 전략, 시스템, 시약, 방법, 및 키트를 제공한다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), 예를 들어, Cpf1 또는 그의 변이체, 및 핵산 편집 단백질 또는 단백질 도메인, 예를 들어, 데아미나제 도메인의 융합 단백질이 제공된다. 일부 실시양태에서, 표적화된 핵산 편집 방법이 제공된다. 일부 실시양태에서, 표적화된 핵산 편집 단백질, 예를 들어, napDNAbp (예를 들어, CasX, CasY, Cpf1, C2c1, C2c2, C2C3, 및 아르고노트) 및 핵산 편집 단백질 또는 도메인의 융합 단백질의 생성을 위한 시약 및 키트가 제공된다.
Description
핵산 서열의 표적화된 편집, 예를 들어, 게놈 DNA 내로의 특이적 변형의 표적화된 절단 또는 표적화된 도입은 유전자 기능의 연구를 위한 매우 유망한 접근법이며, 또한 인간 유전 질환에 대한 새로운 요법을 제공하는 잠재력을 갖는다.1 이상적인 핵산 편집 기술은 3가지 특징을 갖는다: (1) 목적하는 변형을 설치하는 높은 효율; (2) 최소의 오프-타겟(off-target) 활성; 및 (3) 주어진 핵산에서의 임의의 부위, 예를 들어, 인간 게놈 내의 임의의 부위를 정확하게 편집하도록 프로그램되는 능력.2 조작된 아연 핑거 뉴클레아제 (ZFN),3 전사 활성인자 유사 이펙터 뉴클레아제 (TALEN),4 및 가장 최근, RNA-가이드된 DNA 엔도뉴클레아제 Cas95를 포함한 현행 게놈 조작 도구는 게놈에서 서열-특이적 DNA 절단을 실시한다. 이 프로그램가능한 절단은 비-상동 말단 연결 (NHEJ)을 통한 절단 부위에서의 DNA의 돌연변이, 또는 상동성-지정 복구 (HDR)를 통한 절단 부위 주위의 DNA의 대체를 발생시킬 수 있다.6,7
현재의 기술에 대한 한 가지 결점은 NHEJ 및 HDR 둘 다가 전형적으로 보통의 유전자 편집 효율 뿐만 아니라, 목적하는 변경과 경쟁할 수 있는 원치 않는 유전자 변경을 발생시키는 확률적 과정라는 점이다.8 많은 유전 질환은 원칙적으로 게놈에서의 특이적 위치에서 특이적 뉴클레오티드 변화 (예를 들어, 질환과 연관된 유전자의 특이적 코돈에서의 C에서 T로의 변화)를 실시함으로써 치료될 수 있기 때문에,9 이러한 정확성 유전자 편집을 달성하기 위한 프로그램가능한 방식의 개발은 강한 새로운 연구 도구, 뿐만 아니라 유전자 편집-기반 인간 치료제에 대한 잠재적인 새로운 접근법 둘 다를 제시할 것이다.
핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), 예컨대 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 시스템은 다양한 유기체 및 세포주에서 강건하고 일반적인 게놈 조작을 가능하게 하도록 변형된11 최근 발견된 원핵생물 적응 면역계이다.10 CRISPR-Cas (CRISPR 연관된) 시스템은 염기-쌍형성을 통해 복합체를 표적 DNA 서열에 국재화하는 가이드로서 RNA 분자 (sgRNA)를 사용하는 단백질-RNA 복합체이다.12 천연 시스템에서, Cas 단백질은 그 후 표적화된 DNA 서열을 절단하는 엔도뉴클레아제로서 작용한다.13 표적 DNA 서열은 sgRNA에 양쪽 상보적이고, 또한 시스템이 기능하도록 하기 위해 상보적 영역의 3'-말단에 "프로토스페이서-인접 모티프" (PAM)를 함유해야 한다.14
공지된 Cas 단백질 중에서, 에스. 피오게네스(S. pyogenes) Cas9는 게놈 조작을 위한 도구로서 주로 광범위하게 사용되었다.15 이 Cas9 단백질은 2개의 별개의 뉴클레아제 도메인을 함유하는 큰 다중-도메인 단백질이다. 점 돌연변이는 Cas9 내로 도입되어 뉴클레아제 활성을 폐지할 수 있으며, 이는 sgRNA-프로그램된 방식으로 DNA에 결합하는 그의 능력을 여전히 보유하는 데드 Cas9 (dCas9)를 발생시킨다.16 원칙적으로, 또 다른 단백질 또는 도메인에 융합되는 경우, dCas9는 단순히 적절한 sgRNA와의 공동-발현에 의해 그 단백질 또는 도메인을 사실상 임의의 DNA 서열에 표적화할 수 있다.
게놈 조작 목적을 위한 dCas9 복합체의 잠재력은 엄청나다. 단백질을 sgRNA에 의해 프로그램된 게놈에서의 특이적 부위로 가져오는 그의 고유한 능력은 이론적으로 데아미나제 (예를 들어, 시티딘 데아미나제), 전사 활성인자, 전사 리프레서, 히스톤-변형 단백질, 인테그라제, 및 레콤비나제를 포함한 뉴클레아제를 넘어 다양한 부위-특이적 게놈 조작 도구로 개발될 수 있다.11 이들 잠재적 용도 중 일부는 최근 RNA-가이드된 전사 활성인자,17,18 전사 리프레서,16,19,20 및 크로마틴 변형 효소21를 제공하기 위한 전사 활성인자와의 dCas9 융합물을 통해 실행되었다. 다양한 sgRNA와의 이들 융합물의 단순한 공동-발현은 표적 유전자의 특이적 발현을 발생시킨다. 이들 중대한 연구는 게놈의 정확한 조작을 위한 용이하게 프로그램가능한 서열-특이적 이펙터의 설계 및 구축을 위한 방식을 조성하였다.
본 개시내용의 일부 측면은 링커에 의해 융합된 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp), 예를 들어 CasX, CasY, Cpf1, C2c1, C2c2, C2c3, 또는 아르고노트 단백질, 및 시티딘 데아미나제 도메인의 특정 구성이 표적 시티딘 잔기를 효율적으로 탈아미노화하는 데 유용하다는 인식에 기초한다. 본 개시내용의 다른 측면은 링커를 통해 napDNAbp의 N-말단에 융합된 시티딘 데아미나제 도메인을 갖는 핵염기 편집 융합 단백질이 이중 가닥 DNA 표적 분자에서 표적 핵산을 효율적으로 탈아미노화할 수 있었다는 인식에 관한 것이다. 예를 들어, 하기 실시예 3 및 4를 참조하며, 이는 본원에서 염기 편집제로도 지칭되는 융합 단백질이 다른 염기 편집제, 예컨대 UGI 도메인을 갖지 않는 염기 편집제보다 더 적은 indel을 생성하고, 더 효율적으로 표적 핵산을 탈아미노화한다는 것을 입증한다. 본 개시내용의 다른 측면은 링커를 통해 napDNAbp의 N-말단에 융합된 시티딘 데아미나제 도메인을 갖는 핵염기 편집 융합 단백질이, 융합 단백질이 1개 초과의 UGI 도메인으로 구성된 경우에 더 높은 효율 및 크게 개선된 생성물 순도를 갖는 염기 편집을 수행한다는 인식에 관한 것이다. 예를 들어, 실시예 17을 참조하며, 이는 2개의 UGI 도메인을 포함하는 융합 단백질 (예를 들어, 염기 편집제)이 다른 염기 편집제, 예컨대 1개의 UGI 도메인을 포함하는 것들보다 더 적은 indel을 생성하고 표적 핵산을 더 효율적으로 탈아미노화한다는 것을 입증한다.
일부 실시양태에서, 융합 단백질은 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp); (ii) 시티딘 데아미나제 도메인; 및 (iii) 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하며, 여기서 napDNAbp는 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질이다. 일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 CasX 단백질이다. 일부 실시양태에서, CasX 단백질은 서열식별번호: 29 또는 30과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, CasX 단백질은 서열식별번호: 29 또는 30의 아미노산 서열을 포함한다.
일부 실시양태에서, 융합 단백질은 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp); (ii) 시티딘 데아미나제 도메인; (iii) 제1 우라실 글리코실라제 억제제 (UGI) 도메인; 및 (iv) 제2 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하며, 여기서 napDNAbp는 Cas9, dCas9 또는 Cas9 니카제 단백질이다. 일부 실시양태에서, napDNAbp는 dCas9 단백질이다. 일부 실시양태에서, napDNAbp는 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질이다. 일부 실시양태에서, dCas9 단백질은 에스. 피오게네스 dCas9 (SpCas9d)이다. 일부 실시양태에서, dCas9 단백질은 D10A 돌연변이를 보유하는 에스. 피오게네스 dCas9이다. 일부 실시양태에서, dCas9 단백질은 서열식별번호: 6 또는 7과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, dCas9 단백질은 서열식별번호: 6 또는 7의 아미노산 서열을 포함한다. 일부 실시양태에서, dCas9 단백질은 에스. 아우레우스(S. aureus) dCas9 (SaCas9d)이다. 일부 실시양태에서, dCas9 단백질은 D10A 돌연변이를 보유하는 에스. 아우레우스 dCas9이다. 일부 실시양태에서, dCas9 단백질은 서열식별번호: 33-36과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, dCas9 단백질은 서열식별번호: 33-36의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 CasY 단백질이다. 일부 실시양태에서, CasY 단백질은 서열식별번호: 31과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, CasY 단백질은 서열식별번호: 31의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cpf1 또는 Cpf1 돌연변이체 단백질이다. 일부 실시양태에서, Cpf1 또는 Cpf1 돌연변이체 단백질은 서열식별번호: 9-24 중 어느 하나와 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cpf1 또는 Cpf1 돌연변이체 단백질은 서열식별번호: 9-24 중 어느 하나의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 C2c1 단백질이다. 일부 실시양태에서, C2c1 단백질은 서열식별번호: 26과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, C2c1 단백질은 서열식별번호: 26의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 C2c2 단백질이다. 일부 실시양태에서, C2c2 단백질은 서열식별번호: 27과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, C2c2 단백질은 서열식별번호: 27의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 C2c3 단백질이다. 일부 실시양태에서, C2c3 단백질은 서열식별번호: 28과 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, C2c3 단백질은 서열식별번호: 28의 아미노산 서열을 포함한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 아르고노트 단백질이다. 일부 실시양태에서, 아르고노트 단백질은 서열식별번호: 25와 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 아르고노트 단백질은 서열식별번호: 25의 아미노산 서열을 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 융합 단백질이 큰 비율의 indel을 생성하지 않으면서 1개 이상의 돌연변이 (예를 들어, C에서 T로의 돌연변이)를 생성할 수 있다는 인식에 기초한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 (예를 들어, 염기 편집 단백질) 중 임의의 것은 10% 미만의 indel을 생성한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 (예를 들어, 염기 편집 단백질) 중 임의의 것은 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5%, 또는 0.1% 미만의 indel을 생성한다.
일부 실시양태에서, 융합 단백질은 napDNAbp 및 아포지단백질 B mRNA-편집 복합체 1 (APOBEC1) 데아미나제 도메인을 포함하며, 여기서 데아미나제 도메인은 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 napDNAbp 도메인의 N-말단에 융합된다. 일부 실시양태에서, napDNAbp는 본원에 제공된 napDNAbp 중 임의의 것의 아미노산 서열을 포함한다. 일부 실시양태에서, 데아미나제는 래트 APOBEC1 (서열식별번호: 76)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC1 (서열식별번호: 74)이다. 일부 실시양태에서, 데아미나제는 pmCDA1 (서열식별번호: 81)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G (서열식별번호: 60)이다. 일부 실시양태에서, 데아미나제는 (서열식별번호: 82-84) 중 어느 하나의 인간 APOBEC3G 변이체이다. 일부 실시양태에서, 융합 단백질은 napDNAbp 및 아포지단백질 B mRNA-편집 복합체 1 촉매 폴리펩티드-유사 3G (APOBEC3G) 데아미나제 도메인을 포함하며, 여기서 데아미나제 도메인은 임의의 길이 또는 조성 (예를 들어, 아미노산 서열, 펩티드, 중합체, 또는 결합)의 링커를 통해 napDNAbp 도메인의 N-말단에 융합된다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605)를 포함한다.
일부 실시양태에서, 융합 단백질은 napDNAbp 및 시티딘 데아미나제 1 (CDA1) 데아미나제 도메인을 포함하며, 여기서 데아미나제 도메인은 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 napDNAbp 도메인의 N-말단에 융합된다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605)를 포함한다. 일부 실시양태에서, napDNAbp는 본원에 제공된 napDNAbp 중 임의의 것의 아미노산 서열을 포함한다.
일부 실시양태에서, 융합 단백질은 napDNAbp 및 활성화-유도된 시티딘 데아미나제 (AID) 데아미나제 도메인을 포함하며, 여기서 데아미나제 도메인은 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 napDNAbp 도메인의 N-말단에 융합된다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605)를 포함한다. 일부 실시양태에서, napDNAbp는 본원에 제공된 napDNAbp 중 임의의 것의 아미노산 서열을 포함한다.
본 개시내용의 일부 측면은 링커에 의해 융합된 napDNAbp, 및 시티딘 데아미나제 도메인의 특정 구성이 표적 시티딘 잔기를 효율적으로 탈아미노화하는 데 유용하다는 인식에 기초한다. 본 개시내용의 다른 측면은 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 napDNAbp의 N-말단에 융합된 아포지단백질 B mRNA-편집 복합체 1 (APOBEC1) 데아미나제 도메인을 갖는 핵염기 편집 융합 단백질이 이중 가닥 DNA 표적 분자에서 표적 핵산을 효율적으로 탈아미노화할 수 있었다는 인식에 관한 것이다. 일부 실시양태에서, 융합 단백질은 napDNAbp 도메인 및 아포지단백질 B mRNA-편집 복합체 1 (APOBEC1) 데아미나제 도메인을 포함하며, 여기서, 데아미나제 도메인은 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 napDNAbp의 N-말단에 융합된다.
본 개시내용의 일부 측면은 대상체의 게놈, 예를 들어, 인간의 게놈 내에서 단일 부위를 편집하는 것을 포함하는, 핵산의 표적화된 편집에 유용한 전략, 시스템, 시약, 방법, 및 키트를 제공한다. 일부 실시양태에서, napDNAbp (예를 들어, CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질) 및 데아미나제 또는 데아미나제 도메인의 융합 단백질이 제공된다. 일부 실시양태에서, 표적화된 핵산 편집 방법이 제공된다. 일부 실시양태에서, 표적화된 핵산 편집 단백질, 예를 들어, napDNAbp 및 데아미나제 또는 데아미나제 도메인의 융합 단백질의 생성을 위한 시약 및 키트가 제공된다.
본 개시내용의 일부 측면은 제2 단백질 (예를 들어, 효소 도메인, 예컨대 시티딘 데아미나제 도메인)에 융합되고, 따라서 융합 단백질을 형성하는 본원에 제공된 바와 같은 napDNAbp를 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 제2 단백질은 효소 도메인, 또는 결합 도메인을 포함한다. 일부 실시양태에서, 효소 도메인은 뉴클레아제, 니카제, 레콤비나제, 데아미나제, 메틸트랜스퍼라제, 메틸라제, 아세틸라제, 아세틸트랜스퍼라제, 전사 활성인자, 또는 전사 리프레서 도메인이다. 일부 실시양태에서, 효소 도메인은 핵산 편집 도메인이다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제는 시토신 데아미나제 또는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC2 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3A 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3B 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3C 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3D 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3E 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3F 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3G 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3H 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC4 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 데아미나제 (AID)이다. 데아미나제는 임의의 적합한 유기체 (예를 들어, 인간 또는 래트)로부터의 것일 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 데아미나제는 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 또는 마우스로부터의 것이다. 일부 실시양태에서, 데아미나제는 래트 APOBEC1 (서열식별번호: 76)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC1 (서열식별번호: 74)이다. 일부 실시양태에서, 데아미나제는 pmCDA1이다.
본 개시내용의 일부 측면은 (i) 서열식별번호: 32의 아미노산 서열을 포함하는 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질 도메인; 및 (ii) 아포지단백질 B mRNA-편집 복합체 1 (APOBEC1) 데아미나제 도메인을 포함하며, 데아미나제 도메인이 SGSETPGTSESATPES (서열식별번호: 604)의 아미노산 서열을 포함하는 링커를 통해 napDNAbp의 N-말단에 융합된 것인 융합 단백질을 제공한다. 일부 실시양태에서, 데아미나제는 래트 APOBEC1 (서열식별번호: 76)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC1 (서열식별번호: 74)이다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 591의 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 5737의 아미노산 서열을 포함한다. 일부 실시양태에서, 데아미나제는 pmCDA1 (서열식별번호: 81)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G (서열식별번호: 60)이다. 일부 실시양태에서, 데아미나제는 서열식별번호: 82-84 중 어느 하나의 인간 APOBEC3G 변이체이다.
본 개시내용의 다른 측면은 데아미나제 도메인, napDNAbp 도메인 및 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질이 핵산 분자에서 표적 뉴클레오티드를 탈아미노화하기 위한 개선된 효율을 입증한다는 인식에 관한 것이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, U:G 헤테로듀플렉스 DNA의 존재에 대한 세포의 DNA-복구 반응은 세포에서의 핵염기 편집 효율의 감소의 원인이 될 수 있다. 우라실 DNA 글리코실라제 (UDG)는 세포에서 DNA로부터 U의 제거를 촉매하며, 이는 가장 흔한 결과로서 U:G 쌍의 C:G 쌍으로의 복귀를 갖는 염기 절제 복구를 개시할 수 있다. 본원에 입증된 바와 같이, 우라실 DNA 글리코실라제 억제제 (UGI)는 인간 UDG 활성을 억제할 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 염기 절제 복구는 단일 가닥에 결합하고/거나, 편집된 염기를 차단하고/거나, UGI를 억제하고/거나, 염기 절제 복구를 억제하고/거나, 편집된 염기를 보호하고/거나, 비-편집단 가닥의 "고정"을 촉진시키는 등의 분자에 의해 억제될 수 있다. 따라서, 본 개시내용은 UGI 도메인에 융합된 napDNAbp-시티딘 데아미나제 도메인을 포함하는 융합 단백질을 고려한다.
본 개시내용의 추가 측면은 데아미나제 도메인, napDNAbp 도메인, 및 1개 초과의 우라실 글리코실라제 억제제 (UGI) 도메인 (예를 들어, 1, 2, 3, 4, 5개, 또는 그 초과의 UGI 도메인)을 포함하는 융합 단백질이 핵산 분자에서의 표적 뉴클레오티드를 탈아미노화하기 위한 개선된 효율 및/또는 개선된 핵산 생성물 순도를 입증한다는 인식에 관한 것이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 제2 UGI 도메인의 부가는 G:U 염기 편집 중간체에 대한 UDG의 접근을 실질적으로 감소시킴으로써 염기 편집의 효율을 개선시킬 수 있다.
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 비율의 indel을 생성하지 않고, 특이적 뉴클레오티드 염기를 변형할 수 있다는 인식에 기초한다. 본원에 사용된 "indel"은 핵산 내의 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내의 프레임 시프트 돌연변이를 야기할 수 있다. 일부 실시양태에서, 핵산에서 삽입 또는 결실 (즉, indel)을 생성하지 않고, 핵산 내에서 특이적 뉴클레오티드를 효율적으로 변형시키는 (예를 들어 돌연변이시키거나 탈아미노화하는) 염기 편집제를 생성하는 것이 바람직하다. 특정 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 indel에 비해 보다 큰 비율의 의도된 변형 (예를 들어, 점 돌연변이 또는 탈아미노화)을 생성할 수 있다.
특정 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 목적하는 돌연변이의 특정 백분율을 생성할 수 있다. 일부 실시양태에서, 목적하는 돌연변이는 C에서 T로의 돌연변이이다. 일부 실시양태에서, 목적하는 돌연변이는 C에서 A로의 돌연변이이다. 일부 실시양태에서, 목적하는 돌연변이는 C에서 G로의 돌연변이이다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 목적하는 돌연변이의 적어도 1%를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 목적하는 돌연변이의 적어도 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99%를 생성할 수 있다.
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 수의 비의도된 돌연변이, 예컨대 비의도된 점 돌연변이를 생성하지 않고, 핵산 (예를 들어 대상체의 게놈 내의 핵산)에서 의도된 돌연변이, 예컨대 점 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다.
일부 실시양태에서, 융합 단백질의 데아미나제 도메인은 napDNAbp 도메인의 N-말단에 융합된다. 일부 실시양태에서, UGI 도메인은 napDNAbp 도메인의 C-말단에 융합된다. 일부 실시양태에서, napDNAbp 및 핵산 편집 도메인은 링커를 통해 융합된다. 일부 실시양태에서, napDNAbp 도메인 및 UGI 도메인은 링커를 통해 융합된다. 일부 실시양태에서, 제2 UGI 도메인은 제1 UGI 도메인의 C-말단에 융합된다. 일부 실시양태에서, 제1 UGI 도메인 및 제2 UGI 도메인은 링커를 통해 융합된다.
특정 실시양태에서, 링커는 본 발명의 펩티드 또는 펩티드 도메인 중 임의의 것을 연결하는 데 사용될 수 있다. 링커는 공유 결합만큼 단순할 수 있거나, 이는 다수의 원자 길이의 중합체 링커일 수 있다. 특정 실시양태에서, 링커는 폴리펩티드이거나, 아미노산에 기초한다. 다른 실시양태에서, 링커는 펩티드-유사가 아니다. 특정 실시양태에서, 링커는 공유 결합 (예를 들어, 탄소-탄소 결합, 디술피드 결합, 탄소-헤테로원자 결합 등)이다. 특정 실시양태에서, 링커는 아미드 연결의 탄소-질소 결합이다. 특정 실시양태에서, 링커는 시클릭 또는 아시클릭, 치환된 또는 비치환된, 분지된 또는 비분지된 지방족 또는 헤테로지방족 링커이다. 특정 실시양태에서, 링커는 중합체 (예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르 등)이다. 특정 실시양태에서, 링커는 아미노알칸산의 단량체, 이량체, 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 아미노알칸산 (예를 들어, 글리신, 에탄산, 알라닌, 베타-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산 등)을 포함한다. 특정 실시양태에서, 링커는 아미노헥산산 (Ahx)의 단량체, 이량체, 또는 중합체를 포함한다. 특정 실시양태에서, 링커는 카르보시클릭 모이어티 (예를 들어, 시클로펜탄, 시클로헥산)에 기초한다. 다른 실시양태에서, 링커는 폴리에틸렌 글리콜 모이어티 (PEG)를 포함한다. 다른 실시양태에서, 링커는 아미노산을 포함한다. 특정 실시양태에서, 링커는 펩티드를 포함한다. 특정 실시양태에서, 링커는 아릴 또는 헤테로아릴 모이어티를 포함한다. 특정 실시양태에서, 링커는 페닐 고리에 기초한다. 링커는 펩티드에서 링커로 친핵체 (예를 들어, 티올, 아미노)의 부착을 용이하게 하는 관능화된 모이어티를 포함할 수 있다. 임의의 친전자체는 링커의 일부로서 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클 수용자, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 링커는 아미노산 서열 (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), (XP)n (서열식별번호: 611), SGGS(GGS)n (서열식별번호: 612), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605), 또는 그의 임의의 조합을 포함하며, 여기서 n은 독립적으로 정수 1 내지 30이고, X는 임의의 아미노산이다. 일부 실시양태에서, 링커는 아미노산 서열 (GGS)n (서열식별번호: 610)을 포함하며, 여기서 n은 1, 3 또는 7이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS(GGS)n (서열식별번호: 612)을 포함하며, 여기서 n은 2이다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605)를 포함한다.
일부 실시양태에서, 융합 단백질은 구조 [핵산 편집 도메인]-[임의적인 링커 서열]-[napDNAbp]-[임의적인 링커 서열]-[UGI]를 포함한다. 일부 실시양태에서, 융합 단백질은 구조 [핵산 편집 도메인]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[napDNAbp]; [UGI]-[임의적인 링커 서열]-[핵산 편집 도메인]-[임의적인 링커 서열]-[napDNAbp]; [UGI]-[임의적인 링커 서열]-[napDNAbp]-[임의적인 링커 서열]-[핵산 편집 도메인]; [napDNAbp]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[핵산 편집 도메인]; [napDNAbp]-[임의적인 링커 서열]-[핵산 편집 도메인]-[임의적인 링커 서열]-[UGI]; 또는 [핵산 편집 도메인]-[임의적인 링커 서열]-[napDNAbp]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]를 포함한다.
일부 실시양태에서, 핵산 편집 도메인은 데아미나제를 포함한다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제를 포함한다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 데아미나제, APOBEC2 데아미나제, APOBEC3A 데아미나제, APOBEC3B 데아미나제, APOBEC3C 데아미나제, APOBEC3D 데아미나제, APOBEC3F 데아미나제, APOBEC3G 데아미나제, APOBEC3H 데아미나제 또는 APOBEC4 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제 1 (CDA1)이다. 일부 실시양태에서, 데아미나제는 칠성장어 CDA1 (pmCDA1) 데아미나제이다.
일부 실시양태에서, 데아미나제는 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트 또는 마우스로부터의 것이다. 일부 실시양태에서, 데아미나제는 인간으로부터의 것이다. 일부 실시양태에서 데아미나제는 래트로부터의 것이다. 일부 실시양태에서, 데아미나제는 (서열식별번호: 76)에 제시된 아미노산 서열을 포함하는 래트 APOBEC1 데아미나제이다. 일부 실시양태에서, 데아미나제는 (서열식별번호: 74)에 제시된 아미노산 서열을 포함하는 인간 APOBEC1 데아미나제이다. 일부 실시양태에서, 데아미나제는 pmCDA1 (서열식별번호: 81)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G (서열식별번호: 60)이다. 일부 실시양태에서, 데아미나제는 (서열식별번호: 82-84) 중 어느 하나의 인간 APOBEC3G 변이체이다. 일부 실시양태에서, 데아미나제는 서열식별번호: 49-84에 제시된 아미노산 서열 중 어느 하나와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일하다.
일부 실시양태에서, UGI 도메인은 서열식별번호: 134와 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, UGI 도메인은 서열식별번호: 134에 제시된 바와 같은 아미노산 서열을 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 바와 같은 napDNAbp 융합 단백질, 및 napDNAbp에 결합된 가이드 RNA를 포함하는 복합체를 제공한다.
본 개시내용의 일부 측면은 본원에 제공된 napDNAbp, 융합 단백질 또는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 측면은 DNA 분자를 (a) 본원에 제공된 바와 같은 napDNAbp 또는 융합 단백질과, 및 가이드 RNA와 (여기서 가이드 RNA는 약 15-100 뉴클레오티드 길이이고, 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드를 포함함); (b) 또는 본원에 제공된 바와 같은 napDNAbp, napDNAbp 융합 단백질, 또는 gRNA를 갖는 napDNAbp 또는 napDNAbp 복합체와 접촉시키는 단계를 포함하는 방법을 제공한다.
본 개시내용의 일부 측면은 (a) 본원에 제공된 바와 같은 napDNAbp 또는 napDNAbp 융합 단백질을 코딩하는 뉴클레오티드 서열; 및 (b) (a)의 서열의 발현을 유도하는 이종 프로모터를 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 키트는 가이드 RNA 백본을 코딩하는 발현 구축물을 추가로 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 RNA 백본 내로의 클로닝을 허용하도록 위치된 클로닝 부위를 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 바와 같은 융합 단백질의 napDNAbp를 코딩하는 폴리뉴클레오티드를 제공한다. 본 개시내용의 일부 측면은 이러한 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 폴리뉴클레오티드의 발현을 유도하는 이종 프로모터를 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 바와 같은 napDNAbp 단백질, 융합 단백질, 핵산 분자 및/또는 벡터를 포함하는 세포를 제공한다.
Cas9 도메인 (예를 들어 Cas9, nCas9, 또는 dCas9)을 포함하는 본원에 제공된 융합 단백질 중 임의의 것은 본원에 제공된 napDNAbp 중 임의의 것, 예를 들어 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질로 대체될 수 있다는 것이 인지되어야 한다.
상기 리포터 시스템의 예시적 실시양태의 설명은 단지 예시적 목적으로 제공되며, 제한하는 것으로 비의도된다. 추가의 리포터 시스템, 예를 들어 상기 상세히 기재된 예시적 시스템의 변형이 또한 본 개시내용에 포괄된다.
상기 요약은 비제한적 방식으로 본원에 개시된 기술의 실시양태, 이점, 특색 및 용도의 일부를 예시하는 것으로 의도된다. 본원에 개시된 기술의 다른 실시양태, 이점, 특색 및 용도는 상세한 설명, 도면, 실시예 및 청구범위로부터 명백할 것이다.
도 1은 단일 가닥 DNA 기질에 대한 데아미나제의 데아미나제 활성을 나타낸다. 무작위화된 PAM 서열 (NNN PAM)을 사용한 단일 가닥 DNA 기질을 음성 대조군으로서 사용하였다. 사용된 정규 PAM 서열은 (NGG PAM)을 포함한다.
도 2는 단일 가닥 DNA 기질에 대한 Cas9:데아미나제 융합 단백질의 활성을 나타낸다.
도 3은 Cas9:데아미나제:sgRNA 복합체에 의한 이중 가닥 DNA 기질 결합을 예시한다.
도 4는 이중 가닥 DNA 탈아미노화 검정을 예시한다.
도 5는 Cas9 융합물이 이중-가닥 DNA 표적 서열의 위치 3-11 (도 5에서의 개략도에 따라 넘버링됨)을 표적화할 수 있다는 것을 입증한다. 상부 겔: 1 μM rAPOBEC1-GGS-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 중간 겔: 1 μM rAPOBEC1-(GGS)3(서열식별번호: 610)-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 하부 겔: 1.85 μM rAPOBEC1-XTEN-dCas9, 125 nM dsDNA, 1 당량 sgRNA.
도 6은 교정 가이드 RNA, 예를 들어, 교정 sgRNA가 데아미나제 활성에 요구된다는 것을 입증한다.
도 7은 데아미나제-dCas9:sgRNA 복합체에 의한 생체내 표적 서열의 표적 DNA 결합의 메카니즘을 예시한다.
도 8은 예시적인 질환-연관된 표적 서열의 성공적인 탈아미노화를 나타낸다.
도 9는 His6-rAPOBEC1-XTEN-dCas9를 사용한 시험관내 C→T 편집 효율을 나타낸다.
도 10은 HEK293T 세포에서의 C→T 편집 효율이 UGI와의 융합에 의해 크게 증진된다는 것을 나타낸다.
도 11a 내지 11c는 NBE1이 시험관내에서 특이적, 가이드 RNA-프로그램된 C에서 U로의 전환을 매개한다는 것을 나타낸다. 도 11a: 핵염기 편집 전략. 가이드 RNA에 의해 특정된 유전자좌에 표적 C를 갖는 DNA가 dCas9에 의해 결합되며, 이는 DNA 기질의 국소적 변성을 매개한다. 테더링된 APOBEC1 효소에 의한 시티딘 탈아미노화는 표적 C를 U로 전환시킨다. 생성된 G:U 헤테로듀플렉스는 DNA 복제 또는 복구 후에 A:T 염기 쌍으로 영구적으로 전환될 수 있다. U가 주형 DNA 가닥 중에 있는 경우, 이는 또한 전사 후에 G에서 A로의 돌연변이를 함유하는 RNA 전사체를 발생시킬 것이다. 도 11b: 대략 5개의 뉴클레오티드의 활성 윈도우를 나타내는 탈아미노화 검정. 37℃에서 2시간 동안 dsDNA 기질과 함께 NBE1-sgRNA 복합체의 인큐베이션 후, 5' 형광단-표지된 DNA를 단리하고, 37℃에서 1시간 동안 USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 인큐베이션하여 임의의 우라실의 부위에서 DNA 절단을 유도하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 임의의 형광단-연결된 가닥을 가시화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 "-"로 표지되며, 이는 PAM으로부터 원위의 염기를 위치 1로서 카운팅한다. 도 11c: NBE1의 서열 특이성 및 sgRNA-의존성을 나타내는 데아미나제 검정. 위치 7에 표적 C를 갖는 DNA 기질을 도 11b에서와 같이 교정 sgRNA, 미스매칭된 sgRNA와 함께, 또는 sgRNA 없이 NBE1과 함께 인큐베이션하였다. C에서 U로의 편집은 미스매칭된 sgRNA에서 또는 sgRNA가 없는 것에서 관찰되지 않는다. 양성 대조군 샘플은 위치 7에 합성적으로 혼입된 U를 갖는 DNA 서열을 함유한다.
도 12a 내지 12b는 시험관내에서의 핵염기 편집 효율에 대한 서열 컨텍스트 및 표적 C 위치의 효과를 나타낸다. 도 12a: 시험관내에서의 편집 효율에 대한 표적 C 주위의 서열을 변화시키는 것의 효과. 프로토스페이서 서열 5'-TTATTTCGTGGATTTATTTA-3' (서열식별번호: 591)에서 C7에 대한 표적화된 가닥의 80% (양쪽 가닥으로부터의 총 서열분석 판독물의 40%)의 탈아미노화 수율은 1.0으로서 정의되었으며, 위치 1-6 및 8-13에 모든 가능한 단일-염기 돌연변이를 함유하는 기질의 상대적 탈아미노화 효율이 나타나 있다. 값 및 오차 막대는 상이한 날에 수행된 2회 이상의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 12b: 시험관내에서의 편집 효율에 대한 각각의 NC 모티프의 위치적 효과. 각각의 NC 표적 모티프는 우측에 제시된 서열에 지시된 바와 같이 프로토스페이서 내의 위치 1에서 8까지 다양화되었다 (PAM은 적색으로 나타냄, 프로토스페이서 플러스 프로토스페이서에 대해 5'의 1개의 염기가 또한 제시됨). NBE1과 함께 인큐베이션 후의 넘버링된 표적 C 위치의 각각에 T를 함유하는 총 서열 판독물의 백분율이 그래프에 나타나 있다. 시험관내에서 최대 가능한 탈아미노화 수율은 총 서열분석 판독물의 50% (표적화된 가닥의 100%)라는 것에 주목한다. 값 및 오차 막대는 상이한 날에 수행된 2회 또는 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 12b는 위에서 아래로 각각 서열식별번호: 619 내지 626을 나타낸다.
도 13a 내지 13c는 인간 세포에서의 핵염기 편집을 나타낸다. 도 13a: 핵염기 편집제에 의해 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 표적 C는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수로 지시된다. 도 13a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 13b: HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 6개의 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는, 세포의 C에서 T로의 전환 백분율이 모든 6개의 게놈 유전자좌에서 NBE1, NBE2, 및 NBE3에 대해, 및 6개의 부위 중 3개 (EMX1, HEK293 부위 3, 및 HEK293 부위 4)에서 공여자 HDR 주형을 갖는 야생형 Cas9에 대해 나타나 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 13c: 모든 6개의 게놈 유전자좌에 대해 NBE2 및 NBE3으로의, 또는 6개의 부위 중 3개 (EMX1, HEK293 부위 3, 및 HEK293 부위 4)에서 야생형 Cas9 및 HDR에 대한 단일-가닥 DNA 주형으로의 HEK293T 세포의 처리 후의, 방법에 기재된 바와 같이 계산된 indel 형성의 빈도가 나타나 있다. 값은 상이한 날에 수행된 적어도 3회의 독립적인 생물학적 반복의 평균을 반영한다.
도 14a 내지 14c는 포유동물 세포에서의 3가지 질환-관련 돌연변이의 NBE2- 및 NBE3-매개된 교정을 나타낸다. 각각의 부위에 대해, 프로토스페이서의 서열은 돌연변이의 명칭의 우측에 지시되고, PAM 및 돌연변이의 원인이 되는 염기는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수를 갖는 볼드체로 지시된다. 각각의 질환-연관된 대립유전자 위의 아미노산 서열은 적색으로의 핵염기 편집 후에 교정된 아미노산 서열과 함께 나타나 있다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 NBE2 또는 NBE3 및 적절한 sgRNA를 코딩하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 2일 후에, 게놈 DNA를 추출하고, HTS에 의해 분석하여 병원성 돌연변이 교정을 평가하였다. 도 14a: 알츠하이머병-연관된 APOE4 대립유전자는 총 판독물의 11% (뉴클레오펙션된 성상세포의 44%)에서 NBE3에 의해 마우스 성상세포에서의 APOE3'로 전환된다. 2개의 인근의 C는 또한 T로 전환되지만, 생성된 단백질의 예측된 서열 (서열식별번호: 627)에 대한 변화는 없다. 도 14b: 암-연관된 p53 N239D 돌연변이는 돌연변이에 대해 이형접합성인 처리된 인간 림프종 세포의 11% (뉴클레오펙션된 세포의 12%)에서 NBE2에 의해 교정된다 (서열식별번호: 628). 도 14c: p53 Y163C 돌연변이는 뉴클레오펙션된 인간 유방암 세포의 7.6%에서 NBE3에 의해 교정된다 (서열식별번호: 629).
도 15a 내지 15d는 핵염기 편집에 대한 데아미나제-dCas9 링커 길이 및 조성의 효과를 나타낸다. GGS (도 15a), (GGS)3 (서열식별번호: 610) (도 15b), XTEN (도 15c), 또는 (GGS)7 (서열식별번호: 610)의 데아미나제-Cas9 링커를 갖는 핵염기 편집제의 탈아미노화 윈도우를 나타내는 겔-기반 데아미나제 검정 (도 15d). 37℃에서 2시간 동안 125 nM dsDNA 기질과 함께 1.85 μM 편집제-sgRNA 복합체의 인큐베이션 후, 염료-접합된 DNA를 단리하고, USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 37℃에서 추가의 1시간 동안 인큐베이션하여 임의의 우라실의 부위에서 DNA 백본을 절단하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 염료-접합된 가닥을 영상화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 -로 넘버링된다. 8U는 위치 8에 합성적으로 혼입된 U를 갖는 양성 대조군 서열이다.
도 16a 내지 16b는 NBE1이 시험관내에서 질환-관련 돌연변이를 교정할 수 있다는 것을 나타낸다. 도 16a: 7가지 질환-관련 돌연변이의 프로토스페이서 및 PAM 서열. 각 경우에 질환-연관된 표적 C는 프로토스페이서 내의 그의 위치를 반영하는 아래첨자 수로 지시된다. 둘 다의 APOE4 SNP를 제외한 모든 돌연변이에 대해, 표적 C는 주형 (비-코딩) 가닥에 있다. 도 16a는 위에서 아래로 각각 서열식별번호: 631 내지 636을 나타낸다. 도 16b: NBE1와 함께 인큐베이션, DNA 단리, 및 USER 효소와 함께 인큐베이션하여 U를 함유하는 위치에서 DNA를 절단하기 전 (-) 및 후 (+)의 각각의 dsDNA 올리고뉴클레오티드를 나타내는 데아미나제 검정. USER 효소를 갖는 프로토스페이서 내의 다양한 위치에 U를 함유하는 합성 올리고뉴클레오티드의 인큐베이션으로부터의 양성 대조군 레인이 U의 위치를 지시하는 상응하는 수와 함께 나타나 있다.
도 17은 NBE1의 프로세싱성을 나타낸다. 8개의 연속적 C를 함유하는 60량체 DNA 올리고뉴클레오티드의 프로토스페이서 및 PAM이 상부에 나타나 있다. 올리고뉴클레오티드 (125 nM)를 NBE1 (2 μM)과 함께 37℃에서 2시간 동안 인큐베이션하였다. DNA를 단리하고, 고처리량 서열분석에 의해 분석하였다. 관찰된 가장 빈번한 9개의 서열에 대한 총 판독물의 퍼센트가 나타나 있다. 대다수의 편집된 가닥 (>93%)은 T로 전환된 1개 초과의 C를 갖는다. 이 도면은 서열식별번호: 309를 나타낸다.
도 18a 내지 18h는 UGI를 NBE1에 융합시켜 NBE2를 생성하는 것의 효과를 나타낸다. 도 18a: 핵염기 편집제로 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 편집가능한 C는 프로토스페이서 내의 그의 위치에 상응하는 표지로 지시된다. 도 18a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 18b 내지 18g: HEK293T 세포를 NBE1, NBE2, 또는 NBE1 및 UGI, 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 6개의 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 모든 6개의 게놈 유전자좌에서 NBE1, NBE1 및 UGI, 및 NBE2에 대해 나타나 있다. 도 18h: NBE1, 별개의 플라스미드 상의 NBE1 플러스 UGI, NBE2, 및 비처리된 세포에 대한 관심 프로토스페이서 주위의 510개의 C에서의 C에서 T로의 돌연변이 비율이 나타나 있다. 데이터는 1.5x106개의 세포로부터의 3,000,000개의 DNA 서열분석 판독물의 결과를 나타낸다. 값은 상이한 날에 수행된 적어도 2회의 생물학적 실험의 평균을 반영한다.
도 19는 U2OS 및 HEK293T 세포에서의 NBE2의 핵염기 편집 효율을 나타낸다. NBE2에 의한 세포의 C에서 T로의 전환 백분율이 HEK293T 세포 및 U2OS 세포에서의 6개의 표적화된 게놈 유전자좌 각각에 대해 나타나 있다. HEK293T 세포를 리포펙타민 2000을 사용하여 형질감염시키고, U2OS 세포를 뉴클레오펙션시켰다. U2OS 뉴클레오펙션 효율은 74%였다. 플라스미드 전달 3일 후에, 게놈 DNA를 추출하고, HTS에 의해 6개의 게놈 유전자좌에서 핵염기 편집에 대해 분석하였다. 값 및 오차 막대는 상이한 날에 수행된 적어도 2회의 생물학적 실험의 평균 및 표준 편차를 반영한다.
도 20은 핵염기 편집이 다중 세포 분열에 걸쳐 지속된다는 것을 나타낸다. NBE2에 의한 세포의 C에서 T로의 전환 백분율이 세포를 계대하기 전 및 후의 HEK293T 세포에서의 2개의 게놈 유전자좌에서 제시된다. HEK293T 세포를 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 세포를 수거하고, 반으로 분할하였다. 하나의 반은 HTS 분석에 적용하고, 다른 반은 대략 5회의 세포 분열 동안 번식시킨 후, 수거하고, HTS 분석에 적용하였다.
도 21은 원칙적으로 핵염기 편집에 의해 교정될 수 있는 클린바(ClinVar)로부터의 유전적 변이체를 나타낸다. 인간 유전적 변이 및 그의 상응하는 표현형의 NCBI 클린바 데이터베이스68를 현행 핵염기 편집 기술에 의해 교정될 수 있는 유전 질환에 대해 조사하였다. 결과를 좌측에 열거된 연속적 제한을 시행함으로써 필터링하였다. x-축은 로그 스케일의 그 제한 및 모든 상기 제한들을 충족시키는 경우의 수를 나타낸다.
도 22는 6개의 게놈 유전자좌에서의 편집가능한 C의 시험관내 확인을 나타낸다. 6개의 상이한 게놈 부위를 매칭시키는 서열을 갖는 합성 80량체를 NBE1과 함께 인큐베이션한 후, HTS를 통해 핵염기 편집에 대해 분석하였다. 각각의 부위에 대해, 프로토스페이서의 서열은 부위의 명칭의 우측에 지시되고, PAM은 적색으로 강조된다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 표적 C는 시험관내 전환 효율이 >10%인 경우 "편집가능한" 것으로 간주되었다. 최대 수율은 비-표적화된 가닥이 핵염기 편집에 대한 기질이 아니기 때문에 총 DNA 서열분석 판독물의 50%이다. 이 도면은 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다.
도 23은 EMX1 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 EMX1 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 EMX1 sgRNA에 대한 온-타겟(on-target) 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. EMX1 오프-타겟 5개의 유전자좌는 증폭하지 않았으며, 나타내지 않는다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 127, 및 637 내지 645를 나타낸다.
도 24는 FANCF 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 FANCF 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 FANCF sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 128 및 646 내지 653을 나타낸다.
도 25는 HEK293 부위 2 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 2 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 2 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 129, 654, 및 655를 나타낸다.
도 26은 HEK293 부위 3 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 3 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 130 및 656 내지 660을 나타낸다.
도 27은 HEK293 부위 4 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 4 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 4 sgRNA에 대한 온-타겟 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 131 및 661 내지 670을 나타낸다.
도 28은 비-표적 C 돌연변이 비율을 나타낸다. 여기에는 시험된 6개의 온-타겟 및 34개의 오프-타겟 유전자좌 주위의 2,500개의 별개의 시토신에서의 C에서 T로의 돌연변이 비율이 나타나 있으며, 이는 대략 1.8x106개의 세포로부터 유래된 총 14,700,000개의 서열 판독물을 나타낸다.
도 29a 내지 29c는 인간 세포에서의 염기 편집을 나타낸다. 도 29a는 포유동물 세포에서의 가능한 염기 편집 결과물을 나타낸다. 초기 편집은 U:G 미스매치를 발생시켰다. 우라실 DNA 글리코실라제 (UDG)에 의한 U의 인식 및 절제는 염기 절제 복구 (BER)를 개시하였으며, 이는 C:G 출발 상태로의 복귀를 야기한다. BER은 BE2 및 BE3에 의해 저해되었으며, 이는 UDG를 억제하였다. U:G 미스매치는 또한 미스매치 복구 (MMR)에 의해 프로세싱되었으며, 이는 미스매치의 니킹된 가닥을 우선적으로 복구하였다. BE3은 G를 함유하는 비-편집된 가닥을 니킹하였으며, 이는 U:G 미스매치의 목적하는 U:A 또는 T:A 결과물로의 해결을 선호한다. 도 29b는 하기 실시예에서의 물질 및 방법에 기재된 바와 같이 처리된 HEK293T 세포를 나타낸다. 지시된 표적 위치에서 T를 갖는 총 DNA 서열분석 판독물의 백분율은 BE1, BE2, 또는 BE3으로의 처리, 또는 공여자 HDR 주형을 갖는 야생형 Cas9로의 처리에 대해 나타낸다. 도 29c는 도 29b에서의 처리 후의 indel 형성의 빈도를 나타낸다. 값은 도 34에 열거되어 있다. 도 29b 및 29c에 대해, 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 s.d.를 반영한다.
도 30a 내지 30b는 포유동물 세포에서의 2가지 질환-관련 돌연변이의 BE3-매개된 교정을 나타낸다. 프로토스페이서의 서열은 돌연변이의 우측에 나타나 있으며, PAM 및 표적 염기는 적색으로 프로토스페이서 내의 그의 위치를 지시하는 아래첨자 수와 함께 나타나 있다. 각각의 서열의 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 물질 및 방법에 기재된 바와 같이 처리하였다. 도 30a는 총 판독물의 74.9%에서 BE3에 의한 마우스 성상세포에서 APOE3r로 전환된 알츠하이머병-연관된 APOE4 대립유전자를 나타낸다. 2개의 인근의 C는 또한 T로 전환되었지만, 생성된 단백질의 예측된 서열에 대한 변화는 없었다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 26.1% indel 형성과 함께, 단지 0.3% 교정을 발생시킨다. 이 도면은 서열식별번호: 671 및 627을 나타낸다. 도 30b는 0.7% indel 형성을 갖는 뉴클레오펙션된 인간 유방암 세포의 7.6%에서 BE3에 의해 교정된 암 연관된 p53 Y163C 돌연변이를 나타낸다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 6.1% indel 형성과 함께, 돌연변이 교정을 발생시키지 않는다. 이 도면은 서열식별번호: 672 및 629를 나타낸다.
도 31은 HEK293 부위 2 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 2 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 2 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 및 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법을 사용하여 종(Joung) 및 동료들 (63), 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험을 사용하여 아들리(Adli) 및 동료들 (18)에 의해 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 129, 654, 655 및 673 내지 677을 나타낸다.
도 32는 HEK293 부위 3 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 3 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌 및 상부 5개의 공지된 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법54을 사용하여, 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험61을 사용하여 종 및 동료들에 의해 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 130, 656 내지 660 및 678-682를 나타낸다.
도 33은 HEK293 부위 4 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 4 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 4 sgRNA에 대한 온-타겟 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌 및 상부 5개의 공지된 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법54을 사용하여, 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험61을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 131, 661 내지 670, 683 및 684를 나타낸다.
도 34는 마우스 성상세포에서 알츠하이머병-연관된 APOE4 대립유전자의 APOE3r로의 BE3-매개된 교정 후의 비-프로토스페이서 염기의 돌연변이 비율을 나타낸다. 도 30a 및 도 34b로부터의 프로토스페이서의 어느 한 측 상의 50개의 염기의 DNA 서열이 프로토스페이서에 대한 각각의 염기의 위치와 함께 나타나 있다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM과 함께 PAM을 포함하는 측은 음수로 지정된다. 각각의 서열의 아래에는 비처리된 세포에 대한, BE3 및 APOE4 C158R 돌연변이를 표적화하는 sgRNA로 처리된 세포에 대한, 또는 BE3 및 VEGFA 유전자좌를 표적화하는 sgRNA로 처리된 세포에 대한 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 어떠한 BE3-처리된 샘플도 비처리된 대조군의 것 초과의 돌연변이 비율을 발생시키지 않았다. 이 도면은 위에서 아래로 각각 서열식별번호: 685 내지 688을 나타낸다.
도 35는 HCC1954 인간 세포에서의 암-연관된 p53 Y163C 돌연변이의 BE3-매개된 교정 후의 비-프로토스페이서 염기의 돌연변이 비율을 나타낸다. 도 30b 및 도 39b로부터의 프로토스페이서의 어느 한 측 상의 50개의 염기의 DNA 서열이 프로토스페이서에 대한 각각의 염기의 위치와 함께 나타나 있다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM과 함께 PAM을 포함하는 측은 음수로 지정된다. 각각의 서열의 아래에는 비처리된 세포에 대한, BE3 및 TP53 Y163C 돌연변이를 표적화하는 sgRNA로 처리된 세포에 대한, 또는 BE3 및 VEGFA 유전자좌를 표적화하는 sgRNA로 처리된 세포에 대한 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 어떠한 BE3-처리된 샘플도 비처리된 대조군의 것 초과의 돌연변이 비율을 발생시키지 않았다. 이 도면은 위에서 아래로 각각 서열식별번호: 689 내지 692를 나타낸다.
도 36a 내지 36f는 염기 편집에 대한 데아미나제, 링커 길이, 및 링커 조성의 효과를 나타낸다. 도 36a는 ssDNA에 대한 rAPOBEC1, pmCDA1, hAID, hAPOBEC3G, rAPOBEC1-GGS-dCas9, rAPOBEC1-(GGS)3(서열식별번호: 610)-dCas9, 및 dCas9-(GGS)3(서열식별번호: 610)-rAPOBEC1의 활성을 나타내는 겔-기반 데아미나제 검정을 나타낸다. 효소를 포유동물 세포 용해물-유래된 시험관내 전사-번역 시스템에서 발현시키고, 1.8 μM 염료-접합된 ssDNA 및 USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 37℃에서 2시간 동안 인큐베이션하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 영상화하였다. 양성 대조군은 표적 C와 동일한 위치에 합성적으로 혼입된 U를 갖는 서열이다. 도 36b는 도 36c 내지 36f에 사용된 발현되고 정제된 단백질의 쿠마시-염색된 변성 PAGE 겔을 나타낸다. 도 36c 내지 36f는 GGS (도 36c), (GGS)3 (서열식별번호: 610) (도 36d), XTEN (도 36e), 또는 (GGS)7 (서열식별번호: 610) (도 36f)의 데아미나제-Cas9 링커를 갖는 염기 편집제의 탈아미노화 윈도우를 나타내는 겔-기반 데아미나제 검정을 나타낸다. 125 nM dsDNA 기질과 함께 sgRNA와 복합체화된 1.85 μM 데아미나제-dCas9 융합물을 37℃에서 2시간 동안 인큐베이션한 후, 염료-접합된 DNA를 단리하고, USER 효소와 함게 37℃에서 1시간 동안 인큐베이션하여 임의의 우라실의 부위에서 DNA 백본을 절단하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분해하고, 염료-접합된 가닥을 영상화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 -로 넘버링된다. 8U는 위치 8에 합성적으로 혼입된 U를 갖는 양성 대조군 서열이다.
도 37a 내지 37c는 BE1 염기 편집 효율이 포유동물 세포에서 극적으로 감소되었음을 나타낸다. 도 37a: 염기 편집제에 의해 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 표적 C는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수와 함께 적색으로 지시된다. 도 37b는 6개의 상이한 게놈 부위를 매칭시키는 서열을 갖는 합성 80량체를 BE1과 함께 인큐베이션한 후, HTS에 의해 염기 편집에 대해 분석하였음을 나타낸다. 각각의 부위에 대해, PAM과 함께 프로토스페이서의 서열은 부위의 명칭의 우측에 지시된다. 각각의 서열의 아래에는 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 본 발명자들은 시험관내 전환 효율이 >10%인 경우 표적 C를 "편집가능한" 것으로 간주하였다. 최대 수율은 비-표적화된 가닥이 BE1에 의해 영향을 받지 않기 때문에 총 DNA 서열분석 판독물의 50%이다. 값은 단일 실험으로부터 나타나 있다. 도 37c는 HEK293T 세포를 BE1 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰음을 나타낸다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 고처리량 DNA 서열분석에 의해 6개의 유전자좌에서 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1에 대해 모든 6개의 게놈 유전자좌에서 나타나 있다. HEK293T 세포로부터의 모든 데이터의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 37a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 37b는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다.
도 38은 염기 편집이 다중 세포 분열에 걸쳐 지속된다는 것을 나타낸다. BE2 및 BE3에 의한 세포의 C에서 T로의 전환 백분율이 세포를 계대하기 전 및 후에 HEK293T 세포에서 HEK293 부위 3 및 4에 대해 나타나 있다. HEK293T 세포를 BE2 또는 BE3 및 HEK293 부위 3 또는 4를 표적화하는 sgRNA를 발현하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 3일 후에, 세포를 수거하고, 반으로 분할하였다. 하나의 반은 HTS 분석으로 처리하고, 다른 반은 대략 5회의 세포 분열 동안 번식시킨 후, 수거하고, HTS 분석에 적용하였다. 값 및 오차 막대는 적어도 2회의 생물학적 실험의 평균 및 표준 편차를 반영한다.
도 39a 내지 39c는 비-표적 C/G 돌연변이 비율을 나타낸다. 여기에는 시험된 6개의 온-타겟 및 34개의 오프-타겟 유전자좌 주위의 2,500개의 별개의 시토신 및 구아닌에서의 C에서 T로의 및 G에서 A로의 돌연변이 비율이 나타나 있으며, 이는 대략 1.8x106개의 세포로부터 유래된 총 14,700,000개의 서열 판독물을 나타낸다. 도 39a 및 39b는 BE1, BE2, 및 BE3에 의한 세포의 비-표적 C에서 T로의 및 G에서 A로의 전환 백분율이 모든 2,500개의 시토신/구아닌에 대한 프로토스페이서에 대한 그의 위치에 대해 개별적으로 플롯팅된다는 것을 나타낸다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM을 포함하는 측은 음수로 지정된다. 도 39c는 BE1, BE2, 및 BE3에 의한 평균 비-표적 세포의 C에서 T로의 및 G에서 A로의 전환 백분율, 뿐만 아니라 최고 및 최저 개별 전환 백분율이 나타나 있다는 것을 나타낸다.
도 40a 내지 40b는 포유동물 세포에서의 2가지 질환-관련 돌연변이의 BE3-매개된 교정의 추가적인 데이터 세트를 나타낸다. 각각의 부위에 대해, 프로토스페이서의 서열은 돌연변이의 명칭의 우측에 지시되고, PAM 및 돌연변이의 원인이 되는 염기는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수와 함께 적색 볼드체로 지시된다. 각각의 질환-연관된 대립유전자 위의 아미노산 서열이 염기 편집 후의 교정된 아미노산 서열과 함께 나타나 있다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 BE3 및 적절한 sgRNA를 코딩하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 2일 후에, 게놈 DNA를 뉴클레오펙션된 세포로부터 추출하고, HTS에 의해 분석하여 병원성 돌연변이 교정을 평가하였다. 도 40a는 알츠하이머병-연관된 APOE4 대립유전자가 단지 교정 sgRNA로 처리된 경우에만 총 판독물의 58.3%에서 BE3에 의해 마우스 성상세포에서 APOE3r로 전환된다는 것을 나타낸다. 2개의 인근의 C는 또한 T로 전환되지만, 생성된 단백질의 예측된 서열에 대한 변화는 없다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 26.7% indel 형성과 함께, 0.2% 교정을 발생시킨다. 도 40b는 암-연관된 p53 Y163C 돌연변이가 단지 교정 sgRNA로 처리된 경우에만 뉴클레오펙션된 인간 유방암 세포의 3.3%에서 BE3에 의해 교정된다는 것을 나타낸다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 8.0% indel 형성과 함께, 검출가능한 돌연변이 교정을 발생시키지 않는다. 도 40a 내지 40b는 서열식별번호: 671, 627, 672 및 629를 나타낸다.
도 41은 단일-가닥 DNA (ssDNA) 기질에 대한 다양한 데아미나제의 활성을 시험하는 데 사용될 수 있는 예시적인 USER (우라실-특이적 절제 시약) 효소-기반 검정의 개략적 표현을 나타낸다.
도 42는 pmCDA-nCas9-UGI-NLS 구축물 및 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-3 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 693을 나타낸다.
도 43은 pmCDA1-XTEN-nCas9-UGI-NLS 구축물 및 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-3 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 694를 나타낸다.
도 44는 시티딘 데아미나제 (CDA) 또는 APOBEC를 사용하여 T로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 45는 데아미나제 (CDA) 또는 APOBEC를 사용하여 A로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 46은 데아미나제 (CDA) 또는 APOBEC를 사용하여 G로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 47은 huAPOBEC3G-XTEN-nCas9-UGI-NLS 구축물, 및 돌연변이된 형태 (huAPOBEC3G*(D316R_D317R)-XTEN-nCas9-UGI-NLS, 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-2 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 695를 나타낸다.
도 48은 실시예 7의 선택 검정에 사용된 LacZ 구축물의 개략도를 나타낸다.
도 49은 상이한 플라스미드 및 구축물로부터의 복귀 데이터를 나타낸다.
도 50은 lacZ 복귀 및 복귀된 클론의 정제의 확인을 나타낸다.
도 51은 실시예 7에 사용된 탈아미노화 선택 플라스미드를 나타내는 개략도이다.
도 52는 클로람페니콜 복귀 검정 (pmCDA1 융합)의 결과를 나타낸다.
도 53a 내지 53b는 2개의 구축물의 DNA 교정 유도를 입증하였다.
도 54는 클로람페니콜 복귀 검정 (huAPOBEC3G 융합)의 결과를 나타낸다.
도 55는 EMX1 오프-타겟에서의 BE3 및 HF-BE3의 활성을 나타낸다. 서열은 위에서 아래로 서열식별번호: 127 및 637-645에 상응한다.
도 56은 BE3 및 HF-BE3의 온-타겟 염기 편집 효율을 나타낸다.
도 57은 돌연변이가 다양한 정도로 시티딘 탈아미노화에 영향을 미친다는 것을 입증하는 그래프이다. 각각이 촉매작용을 약간 손상시키는 돌연변이의 조합은 다른 것에 비해 한 위치에서 선택적 탈아미노화를 허용한다. FANCF 부위는 GGAATC6C7C8TTC11TGCAGCACCTGG (서열식별번호: 128)였다.
도 58은 차세대 염기 편집제를 나타내는 개략도이다.
도 59는 Cas9 변이체로부터 제조된 새로운 염기 편집제를 예시하는 개략도이다.
도 60은 상이한 NGA PAM 부위의 염기-편집된 백분율을 나타낸다.
도 61은 NGCG PAM EMX (VRER BE3) 및 C1TC3C4C5ATC8AC10ATCAACCGGT (서열식별번호: 696) 스페이서를 사용한 시티딘의 염기-편집된 백분율을 나타낸다.
도 62는 상이한 NNGRRT PAM 부위로부터 생성되는 염기화된-편집된 백분율을 나타낸다.
도 63은 상이한 NNHRRT PAM 부위로부터 생성되는 염기화된-편집된 백분율을 나타낸다.
도 64a 내지 64c는 Cpf1 BE2를 사용하여 상이한 TTTN PAM 부위로부터 생성되는 염기-편집된 백분율을 나타낸다. 사용된 스페이서는 TTTCCTC3C4C5C6C7C8C9AC11AGGTAGAACAT (도 64a, 서열식별번호: 697), TTTCC1C2TC4TGTC8C9AC11ACCCTCATCCTG (도 64b, 서열식별번호: 698), 및 TTTCC1C2C3AGTC7C8TC10C11AC13AC15C16C17TGAAAC (도 64c, 서열식별번호: 699)였다.
도 65는 시티딘 데아미나제 점 돌연변이유발의 동역학 조정을 통해 달성된 바와 같은 선택적 탈아미노화를 나타내는 개략도이다.
도 66은 스페이서에서 다중 시티딘으로의 세포 배양에서 프로빙된 탈아미노화 윈도우에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 TGC3C4C5C6TC8C9C10TC12C13C14TGGCCC (서열식별번호: 700)였다.
도 67은 스페이서에서 다중 시티딘으로의 세포 배양에서 프로빙된 탈아미노화 윈도우에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 AGAGC5C6C7C8C9C10C11TC13AAAGAGA (서열식별번호: 701)였다.
도 68은 제한된 수의 시티딘을 갖는 FANCF 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GGAATC6C7C8TTC11TGCAGCACCTGG (서열식별번호: 128)였다. 삼중 돌연변이체 (W90Y, R126E, R132E)는 제6 위치에서 시티딘을 우선적으로 편집한다는 것에 주의한다.
도 69는 제한된 수의 시티딘을 갖는 HEK3 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GGCC4C5AGACTGAGCACGTGATGG (서열식별번호: 702)였다. 이중 및 삼중 돌연변이체는 제4 위치에서의 시티딘에 비해 제5 위치에서의 시티딘을 우선적을 편집한다는 것에 주의한다.
도 70은 제한된 수의 시티딘을 갖는 EMX1 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GAGTC5C6GAGCAGAAGAAGAAGGG (서열식별번호: 703)였다. 삼중 돌연변이체는 제6이 아니라 단지 제5 위치에서의 시티딘을 편집한다는 것에 주의한다.
도 71은 제한된 수의 시티딘을 갖는 HEK2 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GAAC4AC6AAAGCATAGACTGCGGG (서열식별번호: 704)였다.
도 72는 불멸화 성상세포에서의 BE3 및 돌연변이 W90Y R132E를 포함하는 BE3의 온-타겟 염기 편집 효율을 나타낸다.
도 73은 3가지 Cpf1 융합 구축물의 개략도를 나타낸다.
도 74는 BE3 및 HF-BE3 (EMX1, FANCF, 및 RNF2)의 플라스미드 전달의 비교를 나타낸다.
도 75는 BE3 및 HF-BE3 (HEK3 및 HEK 4)의 플라스미드 전달의 비교를 나타낸다.
도 76은 모든 10개의 부위에서의 EMX-1의 오프-타겟 편집을 나타낸다. 이 도면은 서열식별번호: 127 및 637-645를 나타낸다.
도 77은 GAGTCCGAGCAGAAGAAGAAG (서열식별번호: 705) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. EMX-1 온-타겟 및 EMX-1 오프 타겟 부위 2를 조사하였다.
도 78은 GGAATCCCTTCTGCAGCACCTGG (서열식별번호: 706) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. FANCF 온 타겟 및 FANCF 오프 타겟 부위 1을 조사하였다.
도 79는 GGCCCAGACTGAGCACGTGA (서열식별번호: 707) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. HEK-3 온 타겟 부위를 조사하였다.
도 80은 GGCACTGCGGCTGGAGGTGGGGG (서열식별번호: 708) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. HEK-4 온 타겟, 오프 타겟 부위 1, 부위 3, 및 부위 4.
도 81은 sgHR_13 (GTCAGGTCGAGGGTTCTGTC (서열식별번호: 709) 스페이서; C8 표적: 정지를 위해 G51), sgHR_14 (GGGCCGCAGTATCCTCACTC (서열식별번호: 710) 스페이서; C7 표적; C7 표적: 정지를 위해 Q68), 및 sgHR_15 (CCGCCAGTCCCAGTACGGGA (서열식별번호: 711) 스페이서; C10 및 C11은 정지를 위한 표적: W239 또는 W237임)에 대한 sgRNA 활성에 대한 시험관내 검정의 결과를 나타낸다.
도 82는 sgHR_17 (CAACCACTGCTCAAAGATGC (서열식별번호: 712) 스페이서; C4 및 C5는 정지를 위한 표적: W410임), 및 sgHR_16 (CTTCCAGGATGAGAACACAG (서열식별번호: 713) 스페이서; C4 및 C5는 정지를 위한 표적: W273임)에 대한 시험관내 검정의 결과를 나타낸다.
도 83은 제브라피시 배아에서의 sgHR_13과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 84는 제브라피시 배아에서의 sgHR_16과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 85는 제브라피시 배아에서의 sgHR_17과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 86은 시토신에서 티민으로의 변화를 생성할 수 있는 염기 편집제를 사용하여 생성될 수 있는 예시적인 핵산 변화를 나타낸다.
도 87은 염기 편집제 (예를 들어, BE3)가 하나의 APOE 이소형 (예를 들어, APOE4)을 알츠하이머병의 감소된 위험과 연관된 또 다른 APOE 이소형 (예를 들어, APOE3r)으로 편집하는 데 사용될 수 있는 방법을 입증하는 아포지단백질 E (APOE) 이소형의 예시를 나타낸다.
도 88은 마우스 성상세포에서의 APOE4에서 APOE3r로의 염기 편집을 나타낸다. 이 도면은 서열식별번호: 671 및 627을 나타낸다.
도 89는 아르기닌 잔기 37에서의 단백질의 조기 말단절단을 유발하는 PRNP의 염기 편집을 나타낸다. 이 도면은 서열식별번호: 557 및 714를 나타낸다.
도 90은 (UGI가 억제하는) UDG를 녹아웃시키는 것이 C에서 T로의 염기 편집의 효율의 청결도를 극적으로 개선시킨다는 것을 나타낸다.
도 91은 니카제를 갖지만 UGI를 갖지 않는 염기 편집제의 사용이 결과물의 혼합물을 매우 높은 indel 비율로 야기한다는 것을 나타낸다.
도 92a 내지 92g는 SaBE3, SaKKH-BE3, VQR-BE3, EQR-BE3, 및 VRER-BE3이 인간 세포에서 비-NGG PAM을 함유하는 표적 부위에서의 효율적인 염기 편집을 매개한다는 것을 나타낸다. 도 92a는 에스. 피오게네스 및 에스. 아우레우스 Cas9를 사용한 염기 편집제 아키텍처를 나타낸다. 도 92b는 대안의 또는 완화된 PAM 요건을 갖는 최근 특징화된 Cas9 변이체를 나타낸다. 도 92c 및 92d는 실시예 12에 기재된 바와 같이 제시된 염기 편집제 변이체로 처리된 HEK293T 세포를 나타낸다. 지시된 표적 위치에 T로 전환된 C를 갖는 (형질감염된 세포에 대해 풍부화가 없는) 총 DNA 서열분석 판독물의 백분율이 나타나 있다. 시험된 각각의 표적의 PAM 서열은 X-축 아래에 나타나 있다. 차트는 NNGRRT PAM을 갖는 게놈 유전자좌에서의 SaBE3 및 SaKKH-BE3 (도 92c), NNNRRT PAM을 갖는 게놈 유전자좌에서의 SaBE3 및 SaKKH-BE3 (도 92d), NGAG PAM (도 92e), 및 NGAH PAM (도 92f)을 갖는 게놈 유전자좌에서의 VQR-BE3 및 EQR-BE3, 및 NGCG PAM을 갖는 게놈 유전자좌에서의 VRER-BE3 (도 92g)에 대한 결과를 나타낸다. 값 및 오차 막대는 적어도 2회의 생물학적 반복의 평균 및 표준 편차를 반영한다.
도 93a 내지 93c는 시티딘 데아미나제 도메인에서의 돌연변이를 갖는 염기 편집제가 좁혀진 편집 윈도우를 나타낸다는 것을 입증한다. 도 93a 내지 93c는 돌연변이체 염기 편집제 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염된 HEK293T 세포를 나타낸다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 고처리량 DNA 서열분석에 의해 지시된 유전자좌에서 분석하였다. 지시된 표적 위치에 T로 변화된 C를 갖는 (형질감염된 세포에 대한 풍부화가 없는) 총 DNA 서열분석 판독물의 백분율이 EMX1 부위 (서열식별번호: 721), HEK293 부위 3 (서열식별번호: 719), FANCF 부위 (서열식별번호: 722), HEK293 부위 2 (서열식별번호: 720), 부위 A (서열식별번호: 715), 및 부위 B (서열식별번호: 718) 유전자좌에 대해 나타나 있다. 도 93a는 염기 편집 윈도우를 좁히는 특정 시티딘 데아미나제 돌연변이를 예시한다. 추가의 돌연변이의 특징화에 대해서는 도 98을 참조한다. 도 93b는 게놈 유전자좌 상의 편집 윈도우 폭을 실시하는 시티딘 데아미나제 돌연변이의 효과를 나타낸다. 유익한 돌연변이를 조합하는 것은 편집 윈도우를 좁히는 것에 대해 상가 효과를 갖는다. 도 93c는 YE1-BE3, YE2-BE3, EE-BE3, 및 YEE-BE3이 염기 편집의 생성물 분포를 실시하여, BE3과 대조적으로 우세하게 단독으로-변형된 생성물을 생성한다는 것을 나타낸다. 값 및 오차 막대는 적어도 2회의 생물학적 반복의 평균 및 표준 편차를 반영한다.
도 94a 및 94b는 원칙적으로 이 연구에서 개발된 염기 편집제에 의해 교정될 수 있는 클린바로부터의 유전적 변이체를 나타낸다. 인간 유전적 변이 및 그의 상응하는 표현형의 NCBI 클린바 데이터베이스를 이론적으로 염기 편집에 의해 교정될 수 있는 유전 질환에 대해 조사하였다. 도 94a는 변경된 PAM 특이성을 갖는 염기 편집제의 사용을 통한 클린바 데이터베이스에서의 모든 병원성 T→C 돌연변이 중에서 염기 편집 표적화 범주의 개선을 입증한다. 백색 분획은 BE3, 또는 본 작업에서 개발된 5개의 변형된-PAM 염기 편집제와 함께의 BE3 중 어느 하나의 PAM 요건에 기초하여 접근가능한 병원성 T→C 돌연변이의 비율을 나타낸다. 도 94b는 좁혀진 활성 윈도우를 갖는 염기 편집제의 사용을 통한 클린바 데이터베이스에서의 모든 병원성 T→C 돌연변이 중에서 염기 편집 표적화 범주의 개선을 나타낸다. BE3은 도 93a 내지 93c에 나타낸 것과 대등한 효율로 위치 4-8에서 C를 편집하는 것으로 가정하였다. YEE-BE3은 그의 활성 윈도우 내에서 C5>C6>C7>다른 것들 선호도로 편집하는 것으로 가정하였다. 백색 분획은 다른 C와 대등한 편집을 갖지 않는 편집된 BE3일 수 있는 (좌측), 또는 다른 C와 대등한 편집을 갖지 않는 편집된 BE3 또는 YEE-BE3일 수 있는 (우측) 병원성 T→C 돌연변이의 비율을 나타낸다.
도 95a 내지 95b는 염기 편집 윈도우 폭에 대한 말단절단된 가이드 RNA의 효과를 나타낸다. HEK293T 세포를 상이한 5' 말단절단 길이의 BE3 및 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 도 95a는 EMX1 게놈 유전자좌 내의 부위에서의, 프로토스페이서 및 PAM 서열 (상부, 서열식별번호: 715) 및 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율을 나타낸다. 이 부위에서, 염기 편집 윈도우는 17-nt 말단절단된 gRNA의 사용을 통해 변경되었다. 도 95b는 HEK 부위 3 및 부위 4 게놈 유전자좌 내의 부위에서의, 프로토스페이서 및 PAM 서열 (상부, 서열식별번호: 715 및 716) 및 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율을 나타낸다. 이들 부위에서, 염기 편집 윈도우의 변화는 관찰되지 않았지만, sgRNA가 말단절단되는 경우 모든 기질 염기에 대한 편집 효율의 선형 감소가 주목되었다.
도 96은 염기 편집 윈도우 폭에 대한 APOBEC1-Cas9 링커 길이의 효과를 나타낸다. HEK293T 세포를 XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 또는 (GGS)7 (서열식별번호: 610) 및 sgRNA의 rAPOBEC1-Cas9 링커를 갖는 염기 편집제를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 상이한 링커를 갖는 다양한 염기 편집제에 대해 나타나 있다.
도 97a 내지 97c는 염기 편집 윈도우 폭에 대한 rAPOBEC 돌연변이의 효과를 나타낸다. 도 97c는 부위 A 또는 부위 B 중 어느 하나를 표적화하는 sgRNA 및 지시된 BE3 점 돌연변이체를 발현하는 플라스미드로 형질감염된 HEK293T 세포를 나타낸다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 프로토스페이서에서의 및 프로토스페이서의 3개의 염기 쌍 내의 모든 C가 제시되며, 세포의 C에서 T로의 전환 백분율이 나타나 있다. 그 내에서 편집 효율이 반수-최대 값을 초과하는 뉴클레오티드의 계산된 수로서 정의되는 '편집 윈도우 폭'이 모든 시험된 돌연변이체에 대해 제시된다.
도 98은 포유동물 세포에서의 염기 편집의 생성물 분포에 대한 APOBEC1 돌연변이의 효과를 나타낸다. HEK293T 세포를 BE3 또는 그의 돌연변이체 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 나타나 있다 (좌측). C에서 T로의 전환을 함유하는 총 서열분석 판독물의 퍼센트는 우측에 나타나 있다. BE3 점 돌연변이체는 단지 1개의 표적 시티딘을 갖는 부위인 HEK 부위 4에서 염기 편집 효율에 유의하게 영향을 미치지 않는다.
도 99는 BE3 및 HF-BE3에서의 온-타겟 편집 혈장 전달의 비교를 나타낸다.
도 100은 BE3의 단백질 및 혈장 전달에서의 온-타겟 편집의 비교를 나타낸다.
도 101은 HF-BE3의 단백질 및 혈장 전달에서의 온-타겟 편집의 비교를 나타낸다.
도 102는 리포펙션 및 HF 돌연변이를 설치하는 것 둘 다가 오프-타겟 탈아미노화 사건을 감소시킨다는 것을 나타낸다. 다이아몬드는 오프 타겟이 검출되지 않았음을 지시하며, 특이성 비는 100으로 설정되었다.
도 103은 프로토스페이서 (NNNNTC2TC4TC6TC8TC10TC12TC14TC16TC18TC20NGG, 서열식별번호: 723)에서의 짝수 위치에 놓인 C를 사용한 합성 기질 상의 시험관내 C에서 T로의 편집을 나타낸다.
도 104는 프로토스페이서 (NNNNTC2TC4TC6TC8TC10TC12TC14TC16TC18TC20NGG, 서열식별번호: 723)에서의 홀수 위치에 놓인 C를 사용한 합성 기질 상의 시험관내 C에서 T로의 편집을 나타낸다.
도 105는 플라스미드 대 단백질 전달을 갖는 염기 편집의 특이성 비를 나타내는 2개의 그래프를 포함한다.
도 106a 내지 106b는 비-NGG PAM 부위에 대한 BE3 활성을 나타낸다. HEK293T 세포를 BE3 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 도 106a는 부위에 대한 BE3 활성이 SaBE3 또는 SaKKH-BE3에 의해 효율적으로 표적화될 수 있다는 것을 나타낸다. BE3은 NAG PAM에 대해 낮지만 유의한 활성을 나타낸다. 이 도면은 서열식별번호: 728 및 729를 나타낸다. 도 106b는 BE3이 VQR-BE3 또는 VRER-BE3과는 대조적으로 NGA 또는 NGCG PAM을 갖는 부위에서 유의하게 감소된 편집을 갖는다는 것을 나타낸다. 이 도면은 서열식별번호: 730 및 731을 나타낸다.
도 107a 내지 107b는 VQR-BE3 및 SaKKH-BE3에 대한 APOBEC1 돌연변이의 효과를 나타낸다. HEK293T 세포를 VQR-BE3, SaKKH-BE3 또는 그의 돌연변이체 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 하기 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 나타나 있다. 도 107a는 윈도우-조정 돌연변이가 VQR-BE3에 적용되어 NGA PAM에 의해 표적화가능한 부위에서 선택적 염기 편집을 가능하게 할 수 있다는 것을 나타낸다. 이 도면은 서열식별번호: 732 및 733을 나타낸다. 도 107b는 SaKKH-BE3에 적용되는 경우, 돌연변이가 표적 윈도우 내의 염기 선택성을 부여하지 않고 염기 편집 효율의 전반적 감소를 유발한다는 것을 나타낸다. 이 도면은 서열식별번호: 728 및 734를 나타낸다.
도 108은 뉴클레오티드 편집의 개략적 표현을 나타낸다. 하기 약어가 사용된다: (MMR) - 미스매치 복구, (BE3 니카제) - Cas9 니카제 도메인을 포함하는 염기 편집제 3을 지칭함, (UGI) - 우라실 글리코실라제 억제제, UDG - 우라실 DNA 글리코실라제, (APOBEC) - APOBEC 시티딘 데아미나제를 지칭함.
도 109는 예시적인 염기 편집 구축물의 개략적 표현을 나타낸다. 염기 편집 구축물의 구조적 배열은 BE3, BE4-pmCDA1, BE4-hAID, BE4-3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE4-XTEN, BE4-32aa, BE4-2xUGI 및 BE4에 대해 나타나 있다. 링커는 회색으로 나타나 있다 (XTEN, SGGS (서열식별번호: 606), (GGS)3 (서열식별번호: 610), 및 32aa). 데아미나제가 제시된다 (rAPOBEC1, pmCDA1, hAID, 및 hAPOBEC3G). 우라실 DNA 글리코실라제 억제제 (UGI)가 제시된다. 단일-가닥 DNA 결합 단백질 (SSB)은 자주색으로 제시된다. Cas9 니카제인 dCas9 (A840H)는 적색으로 제시된다. 도 109에는 또한 하기 표적 서열이 나타나 있다: EMX1, FANCF, HEK2, HEK3, HEK4, 및 RNF2. 아미노산 서열은 위에서 아래로 서열식별번호: 127-132로 지시된다. PAM 서열은 마지막 3개의 뉴클레오티드이다. 표적 시토신 (C)은 넘버링되고 적색으로 지시된다.
도 110은 EMX1 서열, GAGTC5CGAGCAGAAGAAGAAGGG (서열식별번호: 127)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신(C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌 (A), 구아닌 (G) 또는 티민 (T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 111은 FANCF 서열, GGAATCCC8TTCTGCAGCACCTGG (서열식별번호: 128)의 표적화된 시토신 (C8) 상에 표시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C8)의 총 백분율은 "C8" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 112는 HEK2 서열 GAACAC6AAAGCATAGACTGCGGG (서열식별번호: 129)의 표적화된 시토신 (C6) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C6)의 총 백분율은 "C6" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 113은 HEK3 서열 GGCCC5AGACTGAGCACGTGATGG (서열식별번호: 130)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 114는 HEK4 서열 GGCAC5TGCGGCTGGAGGTCCGGG (서열식별번호: 131)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 115는 RNF2 서열 GTCATC6TTAGTCATTACCTGAGG (서열식별번호: 132)의 표적화된 시토신 (C6) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C6)의 총 백분율은 "C6" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 116은 표적 가닥을 니킹하는 Cpf1 돌연변이체에 대해 시험하기 위해 사용된 예시적인 형광 표지된 (Cy3 표지된) DNA 구축물을 보여준다. 1의 DNA 구축물에서, 비-표적 가닥 (상부 가닥) 및 표적 가닥 (하부 가닥)은 둘 다 형광 표지된다. 2의 DNA 구축물에서, 비-표적 가닥 (상부 가닥)은 형광 표지되고, 표적 가닥 (하부 가닥)은 형광 표지되지 않는다. 3의 DNA 구축물에서, 비-표적 가닥 (상부 가닥)은 형광 표지되지 않고, 표적 가닥 (하부 가닥)은 형광 표지된다.
도 117은 30분 (30 min) 또는 2시간 초과 (2h+)의 반응 시간에 걸쳐 도 116에 제시된 DNA 구축물의 표적 및 비-표적 가닥을 절단하는 다양한 Cpf1 구축물 (예를 들어, R836A, R1138A, 야생형)의 능력을 입증하는 데이터를 보여준다.
도 118은 아키텍처를 갖는 염기 편집제, APOBEC-AsCpf1(R912A)-UGI가 표적 서열의 제7에서 제11 염기의 윈도우를 갖는 C 잔기 (예를 들어, 표적 서열 FANCF1, FANCF2, HEK3-3 및 HEK3-4의 것)를 편집할 수 있다는 것을 입증하는 데이터를 보여준다. BG는 배경 돌연변이 수준 (비처리)을 나타낸다. AsCpf1은 AsCpf1 단독 처리군 (대조군)을 나타내고, APOBEC-AsCpf1 (R912A)-UGI는 표적 가닥을 우선적으로 절단하는 Cpf1을 함유하는 염기 편집제를 나타내고, APOBEC-AsCpf1 (R1225A)-UGI는 비-표적 가닥을 절단하는 Cpf1을 함유하는 자기-무력화 염기 편집제를 나타낸다. FANCF1, FANCF2, HEK3-3, 및 HEK3-4의 표적 서열은 하기와 같다:
도 119는 Cpf1 단백질 (예를 들어, AsCpf1 또는 LbCpf1)을 포함하는 염기 편집제의 개략적 표현을 나타낸다. 상이한 링커 서열 (예를 들어, XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 및 (GGS)7 (서열식별번호: 610))을 "링커"로 표지된 부분에 대해 시험하였고, 그 결과는 도 120에 제시된다.
도 120은 HEK3 부위 TGCTTCTC8CAGCCCTGGCCTGG (서열식별번호: 592)의 C8 잔기를 편집하는 도 119에 제시된 구축물의 능력을 입증하는 데이터를 보여준다. APOBEC 도메인을 Cpf1 도메인 (예를 들어, LbCpf1(R836A) 또는 AsCpf1(R912A))에 연결하는 상이한 링커 서열을 시험하였다. 시험된 예시적인 링커는 XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 및 (GGS)7 (서열식별번호: 610)을 포함한다.
도 121은, HEK3의 잔기 TGCTTCTC8C9AGCCCTGGCCTGG (서열식별번호: 592)의 C8 및 C9 편집을 위한, LbCpf1 도메인을 갖는 도 119에 제시된 구축물의 능력을 입증하는 데이터를 보여준다. APOBEC 도메인을 LbCpf1 도메인에 연결하는 통합 생물정보학 VU의 센터에 의해 유지된 데이터베이스로부터의 상이한 링커 서열을 시험하였다. 시험된 예시적인 링커는 1au7, 1c1k, 1c20, 1ee8, 1flz, 1ign, 1jmc, 1sfe, 2ezx 및 2reb를 포함한다.
도 122는 N 및 C 말단이 표시된 AsCpf1의 구조의 개략적 표현을 나타낸다.
도 123은 N 및 C 말단이 표시된 SpCas9의 구조의 개략적 표현을 나타낸다.
도 124는 AsCpf1의 개략적 표현을 나타내고, 여기서 적색 원은 편집 윈도우가 있다고 예측되는 면적을 나타낸다. 정사각형은 APOBEC 활성을 방해할 수 있는 나선 영역을 나타낸다.
도 125a 및 125b는 고충실도 염기 편집제 (HF-BE3)의 조작 및 시험관내 특징화를 보여준다. 도 125a는 HF-BE3의 개략적 표현을 보여준다. BE3에 도입되어 HF-BE3을 생성하는 점 돌연변이가 제시된다. 상기 표현은 PDB 구조 4UN3 (Cas9), 4ROV (시티딘 데아미나제) 및 1UGI (우라실 DNA 글리코실라제 억제제)를 사용하였다. 도 125b는 'TC' 반복 프로토스페이서를 함유하는 합성 기질의 시험관내 탈아미노화를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 2개의 독립적인 반복의 평균 및 범위를 반영한다.
도 126a 내지 126c는 염기 편집제 단백질의 정제를 보여준다. 도 126a는 염기 편집제 발현을 위한 최적 이. 콜라이 균주의 선택을 보여준다. 18℃에서 16시간 동안 IPTG-유도된 단백질 발현 후에, 조 세포 용해물을 단백질 함량에 대해 분석하였다. BL21 스타 (DE3) (써모 피셔(Thermo Fisher)) 세포는 BE3 및 HF-BE3 둘 다의 가장 유망한 발현후 수준을 보여주었고, 염기 편집제의 발현에 사용되었다. 도 126b는 발현된 염기 편집제 단백질의 정제를 보여준다. 염기 편집제의 C-말단 상에 His6 태그를 위치시키는 것은 BE3 및 HF-BE3 둘 다에 대한 말단절단 생성물의 생산을 유도한다 (레인 1 및 2). 예상외로, 이러한 말단절단 생성물은 His6 태그를 단백질의 N-말단에 위치시킴으로써 제거하였다 (레인 3-6). Cas9 발현에 최적인 것 (OD600 = 0.4)보다 늦게 OD600 = 0.7 (레인 4-5)의 세포 밀도로 염기 편집제의 발현을 유도하는 것은, 염기 편집 단백질의 수율을 개선시킨다. 수동 HisPur 수지 칼럼을 사용하여 정제를 수행한 후, 양이온 교환 FPLC (Akta)를 수행하였다. 도 126c는 정제된 BE3 및 HF-BE3을 보여준다. 상이한 농도의 정제된 BE3 및 HF-BE3을 열 및 LDS를 사용하여 변성시키고, 폴리아크릴아미드 겔 상에 로딩하였다. 단백질 샘플은 본 연구에 사용된 단백질을 대표한다. 도 126a 내지 126c의 겔은 BOLT 비스-트리스 플러스 4-12% 폴리아크릴아미드 (써모 피셔)이다. 전기영동 및 염색을 방법에 기재된 바와 같이 수행하였다.
도 127a 내지 127d는 인간 세포에서의 고충실도 염기 편집제 (HF-BE3)의 활성을 보여준다. 도 127a 내지 127c는 비-반복적 게놈 유전자좌 EMX1 (도 127a), FANCF (도 127b), 및 HEK293 부위 3 (도 127c)을 표적화하는 sgRNA로 처리된 HEK293T 세포로부터의 게놈 DNA의 고처리량 서열분석을 사용하여 BE3 및 HF-BE3의 플라스미드 형질감염과 연관된 온- 및 오프-타겟 편집을 검정하였다는 것을 보여준다. 각각의 sgRNA와 연관된 온- 및 오프-타겟 유전자좌는 수직선에 의해 분리된다. 도 127d는 VEGFA 부위 2를 표적화하는 고도로 반복되는 sgRNA와 연관된 온- 및 오프-타겟 편집을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 도 127a 내지 127c의 경우, 별은 처리된 샘플과 비처리된 대조군 사이의 비교에 기초한 유의한 편집을 나타낸다. * p ≤ 0.05, ** p ≤ 0.01 및 *** p ≤ 0.001 (스튜던트 양측 t-검정). 도 127d의 경우, 모든 처리된 샘플이 대조군에 비해 유의한 편집을 나타내었기 때문에 별표는 제시되지 않았다. 개별 p-값이 표 16에 열거되어 있다.
도 128a 내지 128c는 배양된 인간 세포에서 온-타겟 및 오프-타겟 염기 편집의 효율에 대한 BE3 단백질 또는 플라스미드의 투여량의 효과를 보여준다. 도 128a는 각각의 sgRNA에 대한 활성 윈도우에서의 모든 편집된 시토신에 걸쳐 각각의 4개의 게놈 유전자좌에서의 온-타겟 편집 효율을 평균내었음을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3개의 독립적인 생물학적 반복의 평균 ± S.E.M을 반영한다. 도 128b 및 128c는 HEK293T 세포에서의 BE3 플라스미드 적정 (도 128b) 또는 BE3 단백질 적정 (도 128c)으로부터 발생한 EMX1 부위에서의 온- 및 오프-타겟 편집을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 129a 내지 129b는 BE3 및 HF-BE3의 플라스미드 및 단백질 전달에 대한 온-표적:오프-타겟 염기 편집 빈도 비를 보여준다. 활성 윈도우 내의 특정한 시토신에서의 온-타겟 편집 백분율을 표시된 오프-타겟 유전자좌에 대한 상응하는 시토신에서의 오프-타겟 편집 백분율로 나눔으로써 염기 편집 온-타겟:오프-타겟 특이성 비를 계산하였다 (방법 참조). 오프-타겟 편집이 검출 한계값 미만인 경우 (서열분석 판독물의 0.025%), 본 발명자들은 오프-타겟 편집을 검출 한계 (0.025%)로 설정하고, 이 상한으로 온-타겟 편집 백분율을 나누었다. ◆로 표시되는 이들 경우에, 제시된 특이성 비는 하한을 나타낸다. 특이성 비가 비-반복적 sgRNA FANCF, HEK293 부위 3, 및 FANCF (도 129a) 및 고도로 반복적인 sgRNA VEGFA 부위 2 (도 129b)에 대해 제시된다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 130a 내지 130d는 배양된 인간 세포로의 염기 편집제의 단백질 전달을 보여준다. 도 130a 내지 130d는 EMX1 (도 130a), FANCF (도 130b), HEK293 부위 3 (도 130c) 및 VEGFA 부위 2 (도 130d)를 표적화하는 sgRNA와 복합체화된 염기 편집제의 RNP 전달과 연관된 온- 및 오프-타겟 편집을 보여준다. 오프-타겟 염기 편집은 비-반복적 sgRNA에 대한 모든 서열분석된 유전자좌에서 검출불가능하였다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 별은 처리된 샘플과 비처리 대조군 사이의 비교에 기초한 유의한 편집을 나타낸다. * p ≤ 0.05, ** p ≤ 0.01 및 *** p ≤ 0.001 (스튜던트 양측 t-검정).
도 131a 내지 131c는 게놈 유전자좌에서의 염기 편집과 연관된 indel 형성을 나타낸다. 도 131a는 VEGFA 부위 2, EMX1, FANCF, 및 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌에서의 indel 빈도를 보여준다. 도 131b는 염기 편집:indel 형성의 비를 보여준다. 다이아몬드 (◆)는 어떤 indel도 검출되지 않았음을 나타낸다 (처리된 샘플 및 비처리된 대조군에서 indel 빈도의 유의한 차이가 없음). 도 131c는 도 131a에서 조사된 온-타겟 부위와 연관된 오프-타겟 유전자좌에서 관찰된 indel을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 132a 내지 132d는 BE3의 RNP 전달을 사용하여 제브라피시 배아에서의 및 살아있는 마우스의 내이에서의 DNA-무함유 생체내 염기 편집을 보여준다. 도 132a는 표시된 sgRNA와 복합체화된 BE3의 주사 4일 후 수거된 제브라피쉬에서의 온-타겟 게놈 편집을 보여준다. 값 및 오차 막대는 평균 ± s.d.의 3개의 주사된 및 3개의 대조군 제브라피쉬를 반영한다. 대조군은 비관련된 sgRNA와 복합체화된 BE3을 주사하였다. 도 132b는 양이온성 지질 나노입자 내로 캡슐화된 BE3:sgRNA 복합체의 생체내 주사를 보여주는 개략도를 보여준다. 도 132c는 VEGFA 부위 2 게놈 유전자좌에서의 염기 편집제 윈도우 내의 시토신 잔기의 염기 편집을 보여준다. 도 132d는 VEGFA 부위 2 표적 유전자좌의 염기 편집 윈도우 내의 각각의 시토신에서의 온-타겟 편집을 보여준다. 도 132d (도 132c 및 132d)는 값 및 오차 막대가 VEGFA 부위 2를 표적화하는 sgRNA로 주사된 3마리의 마우스, 3마리의 주사되지 않은 마우스 및 비관련 sgRNA로 주사된 1마리의 마우스의 평균 ± S.E.M.을 반영한다.
도 133a 내지 133e는 뮤린 NIH/3T3 세포에서의 온- 및 오프-타겟 염기 편집을 보여준다. 도 133a는 'VEGFA 부위 2' sgRNA와 연관된 온-타겟 염기 편집을 보여준다 (서열에 대해서는 도 132e 참조). 음성 대조군은 BE3을 코딩하지만 sgRNA를 코딩하지는 않는 플라스미드로 처리된 세포에 상응한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 도 133b 내지 133e는 이러한 부위와 연관된 오프-타겟 편집이 이러한 sgRNA (도 132e에 제시된 서열)에 대한 상위 4개의 예측된 오프-타겟 유전자좌에서의 고처리량 DNA 서열분석을 사용하여 측정되었음을 보여준다. 도 133b는 오프-타겟 2를 보여주고, 도 133c는 오프-타겟 1을 보여주고, 도 133d는 오프-타겟 3을 보여주고, 도 133e는 오프-타겟 4를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 134a 내지 134b는 생체내-편집된 뮤린 조직으로부터의 오프-타겟 염기 편집 및 온-타겟 indel 분석을 보여준다. 도 134a는 VEGFA 부위 2와 연관된 오프-타겟 유전자좌의 염기 편집 윈도우 내의 각각의 시토신에 대해 플롯팅된 편집을 보여준다. 도 134b는 온-타겟 염기 편집제 유전자좌에서의 indel 비율을 보여준다. 값 및 오차 막대는 3개의 주사된 및 3개의 대조군 마우스의 평균 ± S.E.M을 반영한다.
도 135a 내지 135c는 UNG 녹아웃의 염기 편집 생성물 순도에 대한 효과를 보여준다. 도 135a는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3으로 처리된 HAP1 (UNG+) 및 HAP1 UNG- 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 135b는 시험된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 135a에서 분석된 표적 C는 적색으로 제시된다. 도 135c는 HAP1 세포 또는 HAP1 UNG- 세포에서 BE3으로 처리한 후의 indel 형성의 빈도를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 136a 내지 136d는 생성물 순도에 대한 다중-C 염기 편집의 효과를 보여준다. 도 136a는 비처리된, BE3-처리된, 및 AID-BE3-처리된 인간 HEK293T 세포의 대표적인 고처리량 서열분석 데이터를 보여준다. 프로토스페이서의 서열은 상부에 제시되고, PAM 및 표적 C는 적색으로 제시되고, 아래첨자처리된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 비-T 염기가 아니라 T로 명확하게 편집된 표적 C의 상대적인 백분율은 1개의 C만을 편집한 BE3-처리된 세포에서보다, 이 유전자에서 3개의 C를 편집한 AID-BE3-처리된 세포에서 훨씬 더 높다. 도 136b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, CDA1-BE3, 및 AID-BE3으로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 136c는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 136b에서 분석된 표적 C는 적색으로 제시된다. 도 136d는 도 136a에 제시된 처리 후의 indel 형성의 빈도를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 137a 내지 137c는 BE3의 아키텍처 변화의 C→T 편집 효율 및 생성물 순도에 대한 효과를 보여준다. 도 137a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 137c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 137b에서의 표적 C는 적색으로 제시된다. 도 137b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, SSB-BE3, N-UGI-BE3, 및 BE3-2xUGI로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 BE3, N-UGI-BE3 및 BE3-2xUGI에 대해 제시된다. 도 137c는 C→T 염기 편집 효율을 나타낸다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 138a 내지 138d는 C→T 편집 효율 및 생성물 순도에 대한 BE3에서의 링커 길이 변동의 효과를 보여준다. 도 138a는 BE3, BE3C, BE3D, 및 BE3E의 아키텍처를 보여주고, 도 138b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 138c에서의 표적 C는 자주색 및 적석으로 제시되고, 도 138d에서의 표적 C는 적색으로 제시된다. 도 138c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE3C, BE3D, 또는 BE3E로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 138d는 BE3, BE3C, BE3D 및 BE3E에 대한 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 139a 내지 139d는 BE4가 BE3과 비교하여 염기 편집 효율 및 생성물 순도를 증가시킨다는 것을 보여준다. 도 139a는 BE3, BE4, 및 표적-AID의 아키텍처를 나타낸다. 도 139b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 139c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 139d에서의 표적 C는 적색으로 제시된다. 도 139c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE4, 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 139d는 BE3 및 BE4에 대한 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의의 생성물 분포를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 140a 내지 140c는 CDA1-BE3 및 AID-BE3이 BE3에 비해 더 효율적으로 표적 G에 이은 C를 편집한다는 것을 보여준다. 도 140a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, BE3, CDA1-BE3, 및 AID-BE3에 의해 편집된 표적 C는 적색으로 제시되고, 오직 CDA1-BE3 및 AID-BE3에 의해 편집된 표적 C (G에 이어짐)는 자주색으로 제시된다. 도 140b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 140c는 HEK2 유전자좌를 표적화하는 BE3, CDA1-BE3, 또는 AID-BE3으로 처리되고 프로토스페이서의 서열에 따라 비닝되고 분석된 HEK293T 세포로부터의 개별 DNA 서열분석 판독물을 보여주고, 이는 CDA1-BE3 및 AID-BE3에 의한 명확한 C에서 T로의 편집을 갖는 서열분석 판독물의 > 85%가 둘 다 T로 편집된 C를 갖는다는 것을 밝혀냈다 (도 140c).
도 141a 내지 141c는 다수의 편집가능한 C를 갖는 부위에서의 불균일한 편집이 보다 낮은 생성물 순도를 발생시킨다는 것을 보여준다. 도 141a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 141c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 141b에서의 표적 C는 적색으로 제시된다. 도 141b 및 141c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3으로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. C에서 비-T로의 편집은 편집 효율이 동일한 유전자좌 내의 2개의 C에 대해 동일하지 않은 경우에 더 빈번하다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 142a 내지 142d는 다수의 C의 염기 편집이 보다 높은 염기 편집 생성물 순도를 발생시킨다는 것을 보여준다. 도 142a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 142b에서 조사된 표적 C는 적색으로 제시된다. 도 142b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3 또는 BE3B (UGI가 결여됨)로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 142c는 HEK2 유전자좌를 표적화하는 BE3 또는 BE3B (UGI가 결여됨)로 처리된 HEK293T 세포로부터의 HTS 판독물이 위치 6의 1차 표적 C의 정체에 따라 비닝된 것을 나타낸다. 이어서, 생성된 판독물을 위치 4에서 2차 표적 C에서의 염기의 정체에 대해 분석하였다. 상기 판독물에서 단일 편집 사건만이 있는 경우, C6은 비-T로 부정확하게 편집될 가능성이 더 크다. 도 142d는 HEK4 유전자좌 (오직 단일 편집가능한 C를 갖는 부위)를 표적화하는 BE3 또는 BE3B로 처리된 세포에서, C5에서 A, G, 및 T를 갖는 편집된 판독물의 분포를 보여주고, 이는 단일 G:U 미스매치가 UNG-개시된 염기 절제 복구를 통해 프로세싱되어 생성물의 혼합물을 제공한다는 것을 예시한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 143은 다수의 C의 염기 편집이 HEK3 및 RNF2 유전자좌에서 보다 높은 염기 편집 생성물 순도를 발생시키는 것을 보여준다. HEK3 및 RNF2 유전자좌를 표적화하는 BE3 또는 BE3B (UGI 없음)로 처리된 HEK293T 세포로부터의 DNA 서열분석 판독물을 1차 표적 C 위치 (적색)에서의 염기의 정체에 따라 분리하였다. 이어서, 서열분석 판독물의 4개 군을 2차 표적 C 위치 (자주색)에서의 염기의 정체에 대해 조사하였다. BE3의 경우, 1차 표적 C (적색)가 부정확하게 G로 편집될 경우, 2차 표적 C는 C로 유지될 가능성이 더 크다. 반대로, 1차 표적 C (적색)가 T로 전환되는 경우, 2차 표적 C는 또한 동일한 서열분석 판독물에서 T로 편집될 가능성이 더 크다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 144a 내지 144c는 BE4가 BE3보다 더 낮은 indel 빈도를 유도하고, 표적-AID는 CDA1-BE3과 유사한 생성물 순도를 나타낸다. 도 144a는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE4, 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. indel 형성의 빈도 (실시예 17의 물질 및 방법 참조)가 제시된다. 도 144b는 실시예 17의 물질 및 방법에 기재된 바와 같은 CDA1-BE3 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 144c는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 144b에서 조사된 표적 C는 적색으로 제시된다. 값 및 오차 막대는 상이한 날에 수행된 3개의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 145a 내지 145c는 SaBE4가 SaBE3과 비교하여 증가된 염기 편집 수율 및 생성물 순도를 나타낸다는 것을 보여준다. 도 145a는 실시예 17의 물질 및 방법에 기재된 바와 같은 SaBE3 및 SaBE4로 처리된 HEK293T 세포를 보여준다. 나타난 표적 위치에서 T를 갖는 총 DNA 서열분석 판독물의 백분율이 제시된다. 도 145b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 145a에서의 표적 C는 자주색 및 적색으로 제시되고, 도 145c에서 연구된 표적 C는 적색으로 제시된다. 도 145c는 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포를 나타낸다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 146은 EMX1 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자 수는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 147은 FANCF 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 148은 HEK2 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 149는 HEK3 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 150은 HEK4 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 151은 RNF2 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 152는 LBCpf1 융합 구축물의 개략도를 보여준다. 구축물 10은 [Apobec]-[LbCpf1]-[UGI]-[UGI]의 도메인 배열을 갖고; 구축물 11은 [Apobec]-[LbCpf1]-[UGI]의 도메인 배열을 갖고; 구축물 12는 [UGI]-[Apobec]-[LbCpf1]의 도메인 배열을 갖고; 구축물 13은 [Apobec]-[UGI]-[LbCpf1]의 도메인 배열을 갖고; 구축물 14는 [LbCpf1]-[UGI]-[Apobec]의 도메인 배열을 갖고; 구축물 15는 [LbCpf1]-[Apobec]-[UGI]의 도메인 배열을 갖는다. 각각의 구축물에 대해, 3개의 상이한 LbCpf1 단백질 (D/N/A, 이는 뉴클레아제 데드 LbCpf1 (D); LbCpf1 니카제 (N) 및 뉴클레아제 활성 LbCpf1 (A)을 지칭함)을 사용하였다.
도 153은 19개 뉴클레오티드 길이의 가이드, 즉 EMX19: TACTTTGTCCTCCGGTTCT (서열식별번호: 744)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 154는 18개 뉴클레오티드 길이의 가이드, 즉 EMX18: TACTTTGTCCTCCGGTTC (서열식별번호: 745)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 155는 17개 뉴클레오티드 길이의 가이드, 즉 EMX17: TACTTTGTCCTCCGGTT (서열식별번호: 746)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 156은 23개 뉴클레오티드의 길이의 가이드, 즉, Hek2_23: CAGCCCGCTGGCCCTGTAAAGGA (서열식별번호: 747)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 157은 20개 뉴클레오티드 길이의 가이드, 즉, Hek2_20: CAGCCCGCTGGCCCTGTAAA (서열식별번호: 748)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 158은 19개 뉴클레오티드 길이의 가이드, 즉, Hek2_19: CAGCCCGCTGGCCCTGTAA (서열식별번호: 749)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 159는 18개 뉴클레오티드의 길이의 가이드, 즉, Hek2_18: CAGCCCGCTGGCCCTGTA (서열식별번호: 750)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 160은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 153에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 161은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 154에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 162는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 155에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 163은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 156에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 164는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 157에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 165는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 158에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 166은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 159에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 2는 단일 가닥 DNA 기질에 대한 Cas9:데아미나제 융합 단백질의 활성을 나타낸다.
도 3은 Cas9:데아미나제:sgRNA 복합체에 의한 이중 가닥 DNA 기질 결합을 예시한다.
도 4는 이중 가닥 DNA 탈아미노화 검정을 예시한다.
도 5는 Cas9 융합물이 이중-가닥 DNA 표적 서열의 위치 3-11 (도 5에서의 개략도에 따라 넘버링됨)을 표적화할 수 있다는 것을 입증한다. 상부 겔: 1 μM rAPOBEC1-GGS-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 중간 겔: 1 μM rAPOBEC1-(GGS)3(서열식별번호: 610)-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 하부 겔: 1.85 μM rAPOBEC1-XTEN-dCas9, 125 nM dsDNA, 1 당량 sgRNA.
도 6은 교정 가이드 RNA, 예를 들어, 교정 sgRNA가 데아미나제 활성에 요구된다는 것을 입증한다.
도 7은 데아미나제-dCas9:sgRNA 복합체에 의한 생체내 표적 서열의 표적 DNA 결합의 메카니즘을 예시한다.
도 8은 예시적인 질환-연관된 표적 서열의 성공적인 탈아미노화를 나타낸다.
도 9는 His6-rAPOBEC1-XTEN-dCas9를 사용한 시험관내 C→T 편집 효율을 나타낸다.
도 10은 HEK293T 세포에서의 C→T 편집 효율이 UGI와의 융합에 의해 크게 증진된다는 것을 나타낸다.
도 11a 내지 11c는 NBE1이 시험관내에서 특이적, 가이드 RNA-프로그램된 C에서 U로의 전환을 매개한다는 것을 나타낸다. 도 11a: 핵염기 편집 전략. 가이드 RNA에 의해 특정된 유전자좌에 표적 C를 갖는 DNA가 dCas9에 의해 결합되며, 이는 DNA 기질의 국소적 변성을 매개한다. 테더링된 APOBEC1 효소에 의한 시티딘 탈아미노화는 표적 C를 U로 전환시킨다. 생성된 G:U 헤테로듀플렉스는 DNA 복제 또는 복구 후에 A:T 염기 쌍으로 영구적으로 전환될 수 있다. U가 주형 DNA 가닥 중에 있는 경우, 이는 또한 전사 후에 G에서 A로의 돌연변이를 함유하는 RNA 전사체를 발생시킬 것이다. 도 11b: 대략 5개의 뉴클레오티드의 활성 윈도우를 나타내는 탈아미노화 검정. 37℃에서 2시간 동안 dsDNA 기질과 함께 NBE1-sgRNA 복합체의 인큐베이션 후, 5' 형광단-표지된 DNA를 단리하고, 37℃에서 1시간 동안 USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 인큐베이션하여 임의의 우라실의 부위에서 DNA 절단을 유도하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 임의의 형광단-연결된 가닥을 가시화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 "-"로 표지되며, 이는 PAM으로부터 원위의 염기를 위치 1로서 카운팅한다. 도 11c: NBE1의 서열 특이성 및 sgRNA-의존성을 나타내는 데아미나제 검정. 위치 7에 표적 C를 갖는 DNA 기질을 도 11b에서와 같이 교정 sgRNA, 미스매칭된 sgRNA와 함께, 또는 sgRNA 없이 NBE1과 함께 인큐베이션하였다. C에서 U로의 편집은 미스매칭된 sgRNA에서 또는 sgRNA가 없는 것에서 관찰되지 않는다. 양성 대조군 샘플은 위치 7에 합성적으로 혼입된 U를 갖는 DNA 서열을 함유한다.
도 12a 내지 12b는 시험관내에서의 핵염기 편집 효율에 대한 서열 컨텍스트 및 표적 C 위치의 효과를 나타낸다. 도 12a: 시험관내에서의 편집 효율에 대한 표적 C 주위의 서열을 변화시키는 것의 효과. 프로토스페이서 서열 5'-TTATTTCGTGGATTTATTTA-3' (서열식별번호: 591)에서 C7에 대한 표적화된 가닥의 80% (양쪽 가닥으로부터의 총 서열분석 판독물의 40%)의 탈아미노화 수율은 1.0으로서 정의되었으며, 위치 1-6 및 8-13에 모든 가능한 단일-염기 돌연변이를 함유하는 기질의 상대적 탈아미노화 효율이 나타나 있다. 값 및 오차 막대는 상이한 날에 수행된 2회 이상의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 12b: 시험관내에서의 편집 효율에 대한 각각의 NC 모티프의 위치적 효과. 각각의 NC 표적 모티프는 우측에 제시된 서열에 지시된 바와 같이 프로토스페이서 내의 위치 1에서 8까지 다양화되었다 (PAM은 적색으로 나타냄, 프로토스페이서 플러스 프로토스페이서에 대해 5'의 1개의 염기가 또한 제시됨). NBE1과 함께 인큐베이션 후의 넘버링된 표적 C 위치의 각각에 T를 함유하는 총 서열 판독물의 백분율이 그래프에 나타나 있다. 시험관내에서 최대 가능한 탈아미노화 수율은 총 서열분석 판독물의 50% (표적화된 가닥의 100%)라는 것에 주목한다. 값 및 오차 막대는 상이한 날에 수행된 2회 또는 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 12b는 위에서 아래로 각각 서열식별번호: 619 내지 626을 나타낸다.
도 13a 내지 13c는 인간 세포에서의 핵염기 편집을 나타낸다. 도 13a: 핵염기 편집제에 의해 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 표적 C는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수로 지시된다. 도 13a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 13b: HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 6개의 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는, 세포의 C에서 T로의 전환 백분율이 모든 6개의 게놈 유전자좌에서 NBE1, NBE2, 및 NBE3에 대해, 및 6개의 부위 중 3개 (EMX1, HEK293 부위 3, 및 HEK293 부위 4)에서 공여자 HDR 주형을 갖는 야생형 Cas9에 대해 나타나 있다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 13c: 모든 6개의 게놈 유전자좌에 대해 NBE2 및 NBE3으로의, 또는 6개의 부위 중 3개 (EMX1, HEK293 부위 3, 및 HEK293 부위 4)에서 야생형 Cas9 및 HDR에 대한 단일-가닥 DNA 주형으로의 HEK293T 세포의 처리 후의, 방법에 기재된 바와 같이 계산된 indel 형성의 빈도가 나타나 있다. 값은 상이한 날에 수행된 적어도 3회의 독립적인 생물학적 반복의 평균을 반영한다.
도 14a 내지 14c는 포유동물 세포에서의 3가지 질환-관련 돌연변이의 NBE2- 및 NBE3-매개된 교정을 나타낸다. 각각의 부위에 대해, 프로토스페이서의 서열은 돌연변이의 명칭의 우측에 지시되고, PAM 및 돌연변이의 원인이 되는 염기는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수를 갖는 볼드체로 지시된다. 각각의 질환-연관된 대립유전자 위의 아미노산 서열은 적색으로의 핵염기 편집 후에 교정된 아미노산 서열과 함께 나타나 있다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 NBE2 또는 NBE3 및 적절한 sgRNA를 코딩하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 2일 후에, 게놈 DNA를 추출하고, HTS에 의해 분석하여 병원성 돌연변이 교정을 평가하였다. 도 14a: 알츠하이머병-연관된 APOE4 대립유전자는 총 판독물의 11% (뉴클레오펙션된 성상세포의 44%)에서 NBE3에 의해 마우스 성상세포에서의 APOE3'로 전환된다. 2개의 인근의 C는 또한 T로 전환되지만, 생성된 단백질의 예측된 서열 (서열식별번호: 627)에 대한 변화는 없다. 도 14b: 암-연관된 p53 N239D 돌연변이는 돌연변이에 대해 이형접합성인 처리된 인간 림프종 세포의 11% (뉴클레오펙션된 세포의 12%)에서 NBE2에 의해 교정된다 (서열식별번호: 628). 도 14c: p53 Y163C 돌연변이는 뉴클레오펙션된 인간 유방암 세포의 7.6%에서 NBE3에 의해 교정된다 (서열식별번호: 629).
도 15a 내지 15d는 핵염기 편집에 대한 데아미나제-dCas9 링커 길이 및 조성의 효과를 나타낸다. GGS (도 15a), (GGS)3 (서열식별번호: 610) (도 15b), XTEN (도 15c), 또는 (GGS)7 (서열식별번호: 610)의 데아미나제-Cas9 링커를 갖는 핵염기 편집제의 탈아미노화 윈도우를 나타내는 겔-기반 데아미나제 검정 (도 15d). 37℃에서 2시간 동안 125 nM dsDNA 기질과 함께 1.85 μM 편집제-sgRNA 복합체의 인큐베이션 후, 염료-접합된 DNA를 단리하고, USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 37℃에서 추가의 1시간 동안 인큐베이션하여 임의의 우라실의 부위에서 DNA 백본을 절단하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 염료-접합된 가닥을 영상화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 -로 넘버링된다. 8U는 위치 8에 합성적으로 혼입된 U를 갖는 양성 대조군 서열이다.
도 16a 내지 16b는 NBE1이 시험관내에서 질환-관련 돌연변이를 교정할 수 있다는 것을 나타낸다. 도 16a: 7가지 질환-관련 돌연변이의 프로토스페이서 및 PAM 서열. 각 경우에 질환-연관된 표적 C는 프로토스페이서 내의 그의 위치를 반영하는 아래첨자 수로 지시된다. 둘 다의 APOE4 SNP를 제외한 모든 돌연변이에 대해, 표적 C는 주형 (비-코딩) 가닥에 있다. 도 16a는 위에서 아래로 각각 서열식별번호: 631 내지 636을 나타낸다. 도 16b: NBE1와 함께 인큐베이션, DNA 단리, 및 USER 효소와 함께 인큐베이션하여 U를 함유하는 위치에서 DNA를 절단하기 전 (-) 및 후 (+)의 각각의 dsDNA 올리고뉴클레오티드를 나타내는 데아미나제 검정. USER 효소를 갖는 프로토스페이서 내의 다양한 위치에 U를 함유하는 합성 올리고뉴클레오티드의 인큐베이션으로부터의 양성 대조군 레인이 U의 위치를 지시하는 상응하는 수와 함께 나타나 있다.
도 17은 NBE1의 프로세싱성을 나타낸다. 8개의 연속적 C를 함유하는 60량체 DNA 올리고뉴클레오티드의 프로토스페이서 및 PAM이 상부에 나타나 있다. 올리고뉴클레오티드 (125 nM)를 NBE1 (2 μM)과 함께 37℃에서 2시간 동안 인큐베이션하였다. DNA를 단리하고, 고처리량 서열분석에 의해 분석하였다. 관찰된 가장 빈번한 9개의 서열에 대한 총 판독물의 퍼센트가 나타나 있다. 대다수의 편집된 가닥 (>93%)은 T로 전환된 1개 초과의 C를 갖는다. 이 도면은 서열식별번호: 309를 나타낸다.
도 18a 내지 18h는 UGI를 NBE1에 융합시켜 NBE2를 생성하는 것의 효과를 나타낸다. 도 18a: 핵염기 편집제로 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 편집가능한 C는 프로토스페이서 내의 그의 위치에 상응하는 표지로 지시된다. 도 18a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 18b 내지 18g: HEK293T 세포를 NBE1, NBE2, 또는 NBE1 및 UGI, 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 6개의 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 모든 6개의 게놈 유전자좌에서 NBE1, NBE1 및 UGI, 및 NBE2에 대해 나타나 있다. 도 18h: NBE1, 별개의 플라스미드 상의 NBE1 플러스 UGI, NBE2, 및 비처리된 세포에 대한 관심 프로토스페이서 주위의 510개의 C에서의 C에서 T로의 돌연변이 비율이 나타나 있다. 데이터는 1.5x106개의 세포로부터의 3,000,000개의 DNA 서열분석 판독물의 결과를 나타낸다. 값은 상이한 날에 수행된 적어도 2회의 생물학적 실험의 평균을 반영한다.
도 19는 U2OS 및 HEK293T 세포에서의 NBE2의 핵염기 편집 효율을 나타낸다. NBE2에 의한 세포의 C에서 T로의 전환 백분율이 HEK293T 세포 및 U2OS 세포에서의 6개의 표적화된 게놈 유전자좌 각각에 대해 나타나 있다. HEK293T 세포를 리포펙타민 2000을 사용하여 형질감염시키고, U2OS 세포를 뉴클레오펙션시켰다. U2OS 뉴클레오펙션 효율은 74%였다. 플라스미드 전달 3일 후에, 게놈 DNA를 추출하고, HTS에 의해 6개의 게놈 유전자좌에서 핵염기 편집에 대해 분석하였다. 값 및 오차 막대는 상이한 날에 수행된 적어도 2회의 생물학적 실험의 평균 및 표준 편차를 반영한다.
도 20은 핵염기 편집이 다중 세포 분열에 걸쳐 지속된다는 것을 나타낸다. NBE2에 의한 세포의 C에서 T로의 전환 백분율이 세포를 계대하기 전 및 후의 HEK293T 세포에서의 2개의 게놈 유전자좌에서 제시된다. HEK293T 세포를 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 세포를 수거하고, 반으로 분할하였다. 하나의 반은 HTS 분석에 적용하고, 다른 반은 대략 5회의 세포 분열 동안 번식시킨 후, 수거하고, HTS 분석에 적용하였다.
도 21은 원칙적으로 핵염기 편집에 의해 교정될 수 있는 클린바(ClinVar)로부터의 유전적 변이체를 나타낸다. 인간 유전적 변이 및 그의 상응하는 표현형의 NCBI 클린바 데이터베이스68를 현행 핵염기 편집 기술에 의해 교정될 수 있는 유전 질환에 대해 조사하였다. 결과를 좌측에 열거된 연속적 제한을 시행함으로써 필터링하였다. x-축은 로그 스케일의 그 제한 및 모든 상기 제한들을 충족시키는 경우의 수를 나타낸다.
도 22는 6개의 게놈 유전자좌에서의 편집가능한 C의 시험관내 확인을 나타낸다. 6개의 상이한 게놈 부위를 매칭시키는 서열을 갖는 합성 80량체를 NBE1과 함께 인큐베이션한 후, HTS를 통해 핵염기 편집에 대해 분석하였다. 각각의 부위에 대해, 프로토스페이서의 서열은 부위의 명칭의 우측에 지시되고, PAM은 적색으로 강조된다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 표적 C는 시험관내 전환 효율이 >10%인 경우 "편집가능한" 것으로 간주되었다. 최대 수율은 비-표적화된 가닥이 핵염기 편집에 대한 기질이 아니기 때문에 총 DNA 서열분석 판독물의 50%이다. 이 도면은 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다.
도 23은 EMX1 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 EMX1 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 EMX1 sgRNA에 대한 온-타겟(on-target) 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. EMX1 오프-타겟 5개의 유전자좌는 증폭하지 않았으며, 나타내지 않는다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 127, 및 637 내지 645를 나타낸다.
도 24는 FANCF 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 FANCF 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 FANCF sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 128 및 646 내지 653을 나타낸다.
도 25는 HEK293 부위 2 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 2 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 2 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 129, 654, 및 655를 나타낸다.
도 26은 HEK293 부위 3 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 3 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 130 및 656 내지 660을 나타낸다.
도 27은 HEK293 부위 4 오프-타겟에서의 NBE1, NBE2, 및 NBE3의 활성을 나타낸다. HEK293T 세포를 NBE1, NBE2, 또는 NBE3 및 HEK293 부위 4 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 4 sgRNA에 대한 온-타겟 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌에서, GUIDE-seq 방법55을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 NBE1, NBE2, 및 NBE3에 대해 나타나 있다. 맨 우측에는 각각의 서열에 대해 보고된 서열분석 판독물의 총 수가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 131 및 661 내지 670을 나타낸다.
도 28은 비-표적 C 돌연변이 비율을 나타낸다. 여기에는 시험된 6개의 온-타겟 및 34개의 오프-타겟 유전자좌 주위의 2,500개의 별개의 시토신에서의 C에서 T로의 돌연변이 비율이 나타나 있으며, 이는 대략 1.8x106개의 세포로부터 유래된 총 14,700,000개의 서열 판독물을 나타낸다.
도 29a 내지 29c는 인간 세포에서의 염기 편집을 나타낸다. 도 29a는 포유동물 세포에서의 가능한 염기 편집 결과물을 나타낸다. 초기 편집은 U:G 미스매치를 발생시켰다. 우라실 DNA 글리코실라제 (UDG)에 의한 U의 인식 및 절제는 염기 절제 복구 (BER)를 개시하였으며, 이는 C:G 출발 상태로의 복귀를 야기한다. BER은 BE2 및 BE3에 의해 저해되었으며, 이는 UDG를 억제하였다. U:G 미스매치는 또한 미스매치 복구 (MMR)에 의해 프로세싱되었으며, 이는 미스매치의 니킹된 가닥을 우선적으로 복구하였다. BE3은 G를 함유하는 비-편집된 가닥을 니킹하였으며, 이는 U:G 미스매치의 목적하는 U:A 또는 T:A 결과물로의 해결을 선호한다. 도 29b는 하기 실시예에서의 물질 및 방법에 기재된 바와 같이 처리된 HEK293T 세포를 나타낸다. 지시된 표적 위치에서 T를 갖는 총 DNA 서열분석 판독물의 백분율은 BE1, BE2, 또는 BE3으로의 처리, 또는 공여자 HDR 주형을 갖는 야생형 Cas9로의 처리에 대해 나타낸다. 도 29c는 도 29b에서의 처리 후의 indel 형성의 빈도를 나타낸다. 값은 도 34에 열거되어 있다. 도 29b 및 29c에 대해, 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 s.d.를 반영한다.
도 30a 내지 30b는 포유동물 세포에서의 2가지 질환-관련 돌연변이의 BE3-매개된 교정을 나타낸다. 프로토스페이서의 서열은 돌연변이의 우측에 나타나 있으며, PAM 및 표적 염기는 적색으로 프로토스페이서 내의 그의 위치를 지시하는 아래첨자 수와 함께 나타나 있다. 각각의 서열의 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 물질 및 방법에 기재된 바와 같이 처리하였다. 도 30a는 총 판독물의 74.9%에서 BE3에 의한 마우스 성상세포에서 APOE3r로 전환된 알츠하이머병-연관된 APOE4 대립유전자를 나타낸다. 2개의 인근의 C는 또한 T로 전환되었지만, 생성된 단백질의 예측된 서열에 대한 변화는 없었다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 26.1% indel 형성과 함께, 단지 0.3% 교정을 발생시킨다. 이 도면은 서열식별번호: 671 및 627을 나타낸다. 도 30b는 0.7% indel 형성을 갖는 뉴클레오펙션된 인간 유방암 세포의 7.6%에서 BE3에 의해 교정된 암 연관된 p53 Y163C 돌연변이를 나타낸다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 6.1% indel 형성과 함께, 돌연변이 교정을 발생시키지 않는다. 이 도면은 서열식별번호: 672 및 629를 나타낸다.
도 31은 HEK293 부위 2 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 2 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 2 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 및 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법을 사용하여 종(Joung) 및 동료들 (63), 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험을 사용하여 아들리(Adli) 및 동료들 (18)에 의해 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 129, 654, 655 및 673 내지 677을 나타낸다.
도 32는 HEK293 부위 3 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 3 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌, 플러스 모든 공지된 Cas9 오프-타겟 유전자좌 및 상부 5개의 공지된 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법54을 사용하여, 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험61을 사용하여 종 및 동료들에 의해 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 130, 656 내지 660 및 678-682를 나타낸다.
도 33은 HEK293 부위 4 오프-타겟에서의 BE1, BE2, 및 BE3의 활성을 나타낸다. HEK293T 세포를 BE1, BE2, 또는 BE3 및 HEK293 부위 4 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 고처리량 DNA 서열분석에 의해 HEK293 부위 4 sgRNA에 대한 온-타겟 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌 및 상부 5개의 공지된 dCas9 오프-타겟 유전자좌에서, GUIDE-seq 방법54을 사용하여, 및 크로마틴 면역침전 고처리량 서열분석 (ChIP-seq) 실험61을 사용하여 이전에 결정된 바와 같이 분석하였다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다. 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1, BE2, 및 BE3에 대해 나타나 있다. 맨 우측에는 보고된 서열분석 판독물의 총 수, 및 각각의 서열에 대해 보고된 ChIP-seq 신호 강도가 제시된다. 이 도면은 위에서 아래로 각각 서열식별번호: 131, 661 내지 670, 683 및 684를 나타낸다.
도 34는 마우스 성상세포에서 알츠하이머병-연관된 APOE4 대립유전자의 APOE3r로의 BE3-매개된 교정 후의 비-프로토스페이서 염기의 돌연변이 비율을 나타낸다. 도 30a 및 도 34b로부터의 프로토스페이서의 어느 한 측 상의 50개의 염기의 DNA 서열이 프로토스페이서에 대한 각각의 염기의 위치와 함께 나타나 있다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM과 함께 PAM을 포함하는 측은 음수로 지정된다. 각각의 서열의 아래에는 비처리된 세포에 대한, BE3 및 APOE4 C158R 돌연변이를 표적화하는 sgRNA로 처리된 세포에 대한, 또는 BE3 및 VEGFA 유전자좌를 표적화하는 sgRNA로 처리된 세포에 대한 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 어떠한 BE3-처리된 샘플도 비처리된 대조군의 것 초과의 돌연변이 비율을 발생시키지 않았다. 이 도면은 위에서 아래로 각각 서열식별번호: 685 내지 688을 나타낸다.
도 35는 HCC1954 인간 세포에서의 암-연관된 p53 Y163C 돌연변이의 BE3-매개된 교정 후의 비-프로토스페이서 염기의 돌연변이 비율을 나타낸다. 도 30b 및 도 39b로부터의 프로토스페이서의 어느 한 측 상의 50개의 염기의 DNA 서열이 프로토스페이서에 대한 각각의 염기의 위치와 함께 나타나 있다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM과 함께 PAM을 포함하는 측은 음수로 지정된다. 각각의 서열의 아래에는 비처리된 세포에 대한, BE3 및 TP53 Y163C 돌연변이를 표적화하는 sgRNA로 처리된 세포에 대한, 또는 BE3 및 VEGFA 유전자좌를 표적화하는 sgRNA로 처리된 세포에 대한 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 어떠한 BE3-처리된 샘플도 비처리된 대조군의 것 초과의 돌연변이 비율을 발생시키지 않았다. 이 도면은 위에서 아래로 각각 서열식별번호: 689 내지 692를 나타낸다.
도 36a 내지 36f는 염기 편집에 대한 데아미나제, 링커 길이, 및 링커 조성의 효과를 나타낸다. 도 36a는 ssDNA에 대한 rAPOBEC1, pmCDA1, hAID, hAPOBEC3G, rAPOBEC1-GGS-dCas9, rAPOBEC1-(GGS)3(서열식별번호: 610)-dCas9, 및 dCas9-(GGS)3(서열식별번호: 610)-rAPOBEC1의 활성을 나타내는 겔-기반 데아미나제 검정을 나타낸다. 효소를 포유동물 세포 용해물-유래된 시험관내 전사-번역 시스템에서 발현시키고, 1.8 μM 염료-접합된 ssDNA 및 USER 효소 (우라실 DNA 글리코실라제 및 엔도뉴클레아제 VIII)와 함께 37℃에서 2시간 동안 인큐베이션하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분할하고, 영상화하였다. 양성 대조군은 표적 C와 동일한 위치에 합성적으로 혼입된 U를 갖는 서열이다. 도 36b는 도 36c 내지 36f에 사용된 발현되고 정제된 단백질의 쿠마시-염색된 변성 PAGE 겔을 나타낸다. 도 36c 내지 36f는 GGS (도 36c), (GGS)3 (서열식별번호: 610) (도 36d), XTEN (도 36e), 또는 (GGS)7 (서열식별번호: 610) (도 36f)의 데아미나제-Cas9 링커를 갖는 염기 편집제의 탈아미노화 윈도우를 나타내는 겔-기반 데아미나제 검정을 나타낸다. 125 nM dsDNA 기질과 함께 sgRNA와 복합체화된 1.85 μM 데아미나제-dCas9 융합물을 37℃에서 2시간 동안 인큐베이션한 후, 염료-접합된 DNA를 단리하고, USER 효소와 함게 37℃에서 1시간 동안 인큐베이션하여 임의의 우라실의 부위에서 DNA 백본을 절단하였다. 생성된 DNA를 변성 폴리아크릴아미드 겔 상에서 분해하고, 염료-접합된 가닥을 영상화하였다. 각각의 레인은 프로토스페이서 내의 표적 C의 위치에 따라, 또는 표적 C가 존재하지 않는 경우 -로 넘버링된다. 8U는 위치 8에 합성적으로 혼입된 U를 갖는 양성 대조군 서열이다.
도 37a 내지 37c는 BE1 염기 편집 효율이 포유동물 세포에서 극적으로 감소되었음을 나타낸다. 도 37a: 염기 편집제에 의해 표적화된 6개의 포유동물 세포 게놈 유전자좌의 프로토스페이서 및 PAM 서열. 표적 C는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수와 함께 적색으로 지시된다. 도 37b는 6개의 상이한 게놈 부위를 매칭시키는 서열을 갖는 합성 80량체를 BE1과 함께 인큐베이션한 후, HTS에 의해 염기 편집에 대해 분석하였음을 나타낸다. 각각의 부위에 대해, PAM과 함께 프로토스페이서의 서열은 부위의 명칭의 우측에 지시된다. 각각의 서열의 아래에는 상응하는 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 있다. 본 발명자들은 시험관내 전환 효율이 >10%인 경우 표적 C를 "편집가능한" 것으로 간주하였다. 최대 수율은 비-표적화된 가닥이 BE1에 의해 영향을 받지 않기 때문에 총 DNA 서열분석 판독물의 50%이다. 값은 단일 실험으로부터 나타나 있다. 도 37c는 HEK293T 세포를 BE1 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰음을 나타낸다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 고처리량 DNA 서열분석에 의해 6개의 유전자좌에서 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE1에 대해 모든 6개의 게놈 유전자좌에서 나타나 있다. HEK293T 세포로부터의 모든 데이터의 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 및 표준 편차를 반영한다. 도 37a는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다. 도 37b는 위에서 아래로 각각 서열식별번호: 127 내지 132를 나타낸다.
도 38은 염기 편집이 다중 세포 분열에 걸쳐 지속된다는 것을 나타낸다. BE2 및 BE3에 의한 세포의 C에서 T로의 전환 백분율이 세포를 계대하기 전 및 후에 HEK293T 세포에서 HEK293 부위 3 및 4에 대해 나타나 있다. HEK293T 세포를 BE2 또는 BE3 및 HEK293 부위 3 또는 4를 표적화하는 sgRNA를 발현하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 3일 후에, 세포를 수거하고, 반으로 분할하였다. 하나의 반은 HTS 분석으로 처리하고, 다른 반은 대략 5회의 세포 분열 동안 번식시킨 후, 수거하고, HTS 분석에 적용하였다. 값 및 오차 막대는 적어도 2회의 생물학적 실험의 평균 및 표준 편차를 반영한다.
도 39a 내지 39c는 비-표적 C/G 돌연변이 비율을 나타낸다. 여기에는 시험된 6개의 온-타겟 및 34개의 오프-타겟 유전자좌 주위의 2,500개의 별개의 시토신 및 구아닌에서의 C에서 T로의 및 G에서 A로의 돌연변이 비율이 나타나 있으며, 이는 대략 1.8x106개의 세포로부터 유래된 총 14,700,000개의 서열 판독물을 나타낸다. 도 39a 및 39b는 BE1, BE2, 및 BE3에 의한 세포의 비-표적 C에서 T로의 및 G에서 A로의 전환 백분율이 모든 2,500개의 시토신/구아닌에 대한 프로토스페이서에 대한 그의 위치에 대해 개별적으로 플롯팅된다는 것을 나타낸다. PAM에 대해 원위의 프로토스페이서의 측은 양수로 지정되는 반면, PAM을 포함하는 측은 음수로 지정된다. 도 39c는 BE1, BE2, 및 BE3에 의한 평균 비-표적 세포의 C에서 T로의 및 G에서 A로의 전환 백분율, 뿐만 아니라 최고 및 최저 개별 전환 백분율이 나타나 있다는 것을 나타낸다.
도 40a 내지 40b는 포유동물 세포에서의 2가지 질환-관련 돌연변이의 BE3-매개된 교정의 추가적인 데이터 세트를 나타낸다. 각각의 부위에 대해, 프로토스페이서의 서열은 돌연변이의 명칭의 우측에 지시되고, PAM 및 돌연변이의 원인이 되는 염기는 프로토스페이서 내의 그의 위치에 상응하는 아래첨자 수와 함께 적색 볼드체로 지시된다. 각각의 질환-연관된 대립유전자 위의 아미노산 서열이 염기 편집 후의 교정된 아미노산 서열과 함께 나타나 있다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 BE3 및 적절한 sgRNA를 코딩하는 플라스미드로 뉴클레오펙션시켰다. 뉴클레오펙션 2일 후에, 게놈 DNA를 뉴클레오펙션된 세포로부터 추출하고, HTS에 의해 분석하여 병원성 돌연변이 교정을 평가하였다. 도 40a는 알츠하이머병-연관된 APOE4 대립유전자가 단지 교정 sgRNA로 처리된 경우에만 총 판독물의 58.3%에서 BE3에 의해 마우스 성상세포에서 APOE3r로 전환된다는 것을 나타낸다. 2개의 인근의 C는 또한 T로 전환되지만, 생성된 단백질의 예측된 서열에 대한 변화는 없다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 26.7% indel 형성과 함께, 0.2% 교정을 발생시킨다. 도 40b는 암-연관된 p53 Y163C 돌연변이가 단지 교정 sgRNA로 처리된 경우에만 뉴클레오펙션된 인간 유방암 세포의 3.3%에서 BE3에 의해 교정된다는 것을 나타낸다. 야생형 Cas9 및 공여자 ssDNA로의 이들 세포의 동일한 처리는 8.0% indel 형성과 함께, 검출가능한 돌연변이 교정을 발생시키지 않는다. 도 40a 내지 40b는 서열식별번호: 671, 627, 672 및 629를 나타낸다.
도 41은 단일-가닥 DNA (ssDNA) 기질에 대한 다양한 데아미나제의 활성을 시험하는 데 사용될 수 있는 예시적인 USER (우라실-특이적 절제 시약) 효소-기반 검정의 개략적 표현을 나타낸다.
도 42는 pmCDA-nCas9-UGI-NLS 구축물 및 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-3 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 693을 나타낸다.
도 43은 pmCDA1-XTEN-nCas9-UGI-NLS 구축물 및 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-3 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 694를 나타낸다.
도 44는 시티딘 데아미나제 (CDA) 또는 APOBEC를 사용하여 T로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 45는 데아미나제 (CDA) 또는 APOBEC를 사용하여 A로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 46은 데아미나제 (CDA) 또는 APOBEC를 사용하여 G로 전환된 표적 C를 갖는 총 서열분석 판독물의 퍼센트를 나타낸다.
도 47은 huAPOBEC3G-XTEN-nCas9-UGI-NLS 구축물, 및 돌연변이된 형태 (huAPOBEC3G*(D316R_D317R)-XTEN-nCas9-UGI-NLS, 염기 편집제 (rAPOBEC1) 및 음성 대조군 (비처리)에 비한 HeK-2 부위에서의 그의 활성의 개략도이다. 이 도면은 서열식별번호: 695를 나타낸다.
도 48은 실시예 7의 선택 검정에 사용된 LacZ 구축물의 개략도를 나타낸다.
도 49은 상이한 플라스미드 및 구축물로부터의 복귀 데이터를 나타낸다.
도 50은 lacZ 복귀 및 복귀된 클론의 정제의 확인을 나타낸다.
도 51은 실시예 7에 사용된 탈아미노화 선택 플라스미드를 나타내는 개략도이다.
도 52는 클로람페니콜 복귀 검정 (pmCDA1 융합)의 결과를 나타낸다.
도 53a 내지 53b는 2개의 구축물의 DNA 교정 유도를 입증하였다.
도 54는 클로람페니콜 복귀 검정 (huAPOBEC3G 융합)의 결과를 나타낸다.
도 55는 EMX1 오프-타겟에서의 BE3 및 HF-BE3의 활성을 나타낸다. 서열은 위에서 아래로 서열식별번호: 127 및 637-645에 상응한다.
도 56은 BE3 및 HF-BE3의 온-타겟 염기 편집 효율을 나타낸다.
도 57은 돌연변이가 다양한 정도로 시티딘 탈아미노화에 영향을 미친다는 것을 입증하는 그래프이다. 각각이 촉매작용을 약간 손상시키는 돌연변이의 조합은 다른 것에 비해 한 위치에서 선택적 탈아미노화를 허용한다. FANCF 부위는 GGAATC6C7C8TTC11TGCAGCACCTGG (서열식별번호: 128)였다.
도 58은 차세대 염기 편집제를 나타내는 개략도이다.
도 59는 Cas9 변이체로부터 제조된 새로운 염기 편집제를 예시하는 개략도이다.
도 60은 상이한 NGA PAM 부위의 염기-편집된 백분율을 나타낸다.
도 61은 NGCG PAM EMX (VRER BE3) 및 C1TC3C4C5ATC8AC10ATCAACCGGT (서열식별번호: 696) 스페이서를 사용한 시티딘의 염기-편집된 백분율을 나타낸다.
도 62는 상이한 NNGRRT PAM 부위로부터 생성되는 염기화된-편집된 백분율을 나타낸다.
도 63은 상이한 NNHRRT PAM 부위로부터 생성되는 염기화된-편집된 백분율을 나타낸다.
도 64a 내지 64c는 Cpf1 BE2를 사용하여 상이한 TTTN PAM 부위로부터 생성되는 염기-편집된 백분율을 나타낸다. 사용된 스페이서는 TTTCCTC3C4C5C6C7C8C9AC11AGGTAGAACAT (도 64a, 서열식별번호: 697), TTTCC1C2TC4TGTC8C9AC11ACCCTCATCCTG (도 64b, 서열식별번호: 698), 및 TTTCC1C2C3AGTC7C8TC10C11AC13AC15C16C17TGAAAC (도 64c, 서열식별번호: 699)였다.
도 65는 시티딘 데아미나제 점 돌연변이유발의 동역학 조정을 통해 달성된 바와 같은 선택적 탈아미노화를 나타내는 개략도이다.
도 66은 스페이서에서 다중 시티딘으로의 세포 배양에서 프로빙된 탈아미노화 윈도우에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 TGC3C4C5C6TC8C9C10TC12C13C14TGGCCC (서열식별번호: 700)였다.
도 67은 스페이서에서 다중 시티딘으로의 세포 배양에서 프로빙된 탈아미노화 윈도우에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 AGAGC5C6C7C8C9C10C11TC13AAAGAGA (서열식별번호: 701)였다.
도 68은 제한된 수의 시티딘을 갖는 FANCF 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GGAATC6C7C8TTC11TGCAGCACCTGG (서열식별번호: 128)였다. 삼중 돌연변이체 (W90Y, R126E, R132E)는 제6 위치에서 시티딘을 우선적으로 편집한다는 것에 주의한다.
도 69는 제한된 수의 시티딘을 갖는 HEK3 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GGCC4C5AGACTGAGCACGTGATGG (서열식별번호: 702)였다. 이중 및 삼중 돌연변이체는 제4 위치에서의 시티딘에 비해 제5 위치에서의 시티딘을 우선적을 편집한다는 것에 주의한다.
도 70은 제한된 수의 시티딘을 갖는 EMX1 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GAGTC5C6GAGCAGAAGAAGAAGGG (서열식별번호: 703)였다. 삼중 돌연변이체는 제6이 아니라 단지 제5 위치에서의 시티딘을 편집한다는 것에 주의한다.
도 71은 제한된 수의 시티딘을 갖는 HEK2 부위에 대한 다양한 돌연변이의 효과를 나타내는 그래프이다. 사용된 스페이서는 GAAC4AC6AAAGCATAGACTGCGGG (서열식별번호: 704)였다.
도 72는 불멸화 성상세포에서의 BE3 및 돌연변이 W90Y R132E를 포함하는 BE3의 온-타겟 염기 편집 효율을 나타낸다.
도 73은 3가지 Cpf1 융합 구축물의 개략도를 나타낸다.
도 74는 BE3 및 HF-BE3 (EMX1, FANCF, 및 RNF2)의 플라스미드 전달의 비교를 나타낸다.
도 75는 BE3 및 HF-BE3 (HEK3 및 HEK 4)의 플라스미드 전달의 비교를 나타낸다.
도 76은 모든 10개의 부위에서의 EMX-1의 오프-타겟 편집을 나타낸다. 이 도면은 서열식별번호: 127 및 637-645를 나타낸다.
도 77은 GAGTCCGAGCAGAAGAAGAAG (서열식별번호: 705) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. EMX-1 온-타겟 및 EMX-1 오프 타겟 부위 2를 조사하였다.
도 78은 GGAATCCCTTCTGCAGCACCTGG (서열식별번호: 706) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. FANCF 온 타겟 및 FANCF 오프 타겟 부위 1을 조사하였다.
도 79는 GGCCCAGACTGAGCACGTGA (서열식별번호: 707) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. HEK-3 온 타겟 부위를 조사하였다.
도 80은 GGCACTGCGGCTGGAGGTGGGGG (서열식별번호: 708) 스페이서를 사용한 HEK 세포에의 데아미나제 단백질 리포펙션을 나타낸다. HEK-4 온 타겟, 오프 타겟 부위 1, 부위 3, 및 부위 4.
도 81은 sgHR_13 (GTCAGGTCGAGGGTTCTGTC (서열식별번호: 709) 스페이서; C8 표적: 정지를 위해 G51), sgHR_14 (GGGCCGCAGTATCCTCACTC (서열식별번호: 710) 스페이서; C7 표적; C7 표적: 정지를 위해 Q68), 및 sgHR_15 (CCGCCAGTCCCAGTACGGGA (서열식별번호: 711) 스페이서; C10 및 C11은 정지를 위한 표적: W239 또는 W237임)에 대한 sgRNA 활성에 대한 시험관내 검정의 결과를 나타낸다.
도 82는 sgHR_17 (CAACCACTGCTCAAAGATGC (서열식별번호: 712) 스페이서; C4 및 C5는 정지를 위한 표적: W410임), 및 sgHR_16 (CTTCCAGGATGAGAACACAG (서열식별번호: 713) 스페이서; C4 및 C5는 정지를 위한 표적: W273임)에 대한 시험관내 검정의 결과를 나타낸다.
도 83은 제브라피시 배아에서의 sgHR_13과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 84는 제브라피시 배아에서의 sgHR_16과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 85는 제브라피시 배아에서의 sgHR_17과 복합체화된 BE3 단백질의 직접 주사를 나타낸다.
도 86은 시토신에서 티민으로의 변화를 생성할 수 있는 염기 편집제를 사용하여 생성될 수 있는 예시적인 핵산 변화를 나타낸다.
도 87은 염기 편집제 (예를 들어, BE3)가 하나의 APOE 이소형 (예를 들어, APOE4)을 알츠하이머병의 감소된 위험과 연관된 또 다른 APOE 이소형 (예를 들어, APOE3r)으로 편집하는 데 사용될 수 있는 방법을 입증하는 아포지단백질 E (APOE) 이소형의 예시를 나타낸다.
도 88은 마우스 성상세포에서의 APOE4에서 APOE3r로의 염기 편집을 나타낸다. 이 도면은 서열식별번호: 671 및 627을 나타낸다.
도 89는 아르기닌 잔기 37에서의 단백질의 조기 말단절단을 유발하는 PRNP의 염기 편집을 나타낸다. 이 도면은 서열식별번호: 557 및 714를 나타낸다.
도 90은 (UGI가 억제하는) UDG를 녹아웃시키는 것이 C에서 T로의 염기 편집의 효율의 청결도를 극적으로 개선시킨다는 것을 나타낸다.
도 91은 니카제를 갖지만 UGI를 갖지 않는 염기 편집제의 사용이 결과물의 혼합물을 매우 높은 indel 비율로 야기한다는 것을 나타낸다.
도 92a 내지 92g는 SaBE3, SaKKH-BE3, VQR-BE3, EQR-BE3, 및 VRER-BE3이 인간 세포에서 비-NGG PAM을 함유하는 표적 부위에서의 효율적인 염기 편집을 매개한다는 것을 나타낸다. 도 92a는 에스. 피오게네스 및 에스. 아우레우스 Cas9를 사용한 염기 편집제 아키텍처를 나타낸다. 도 92b는 대안의 또는 완화된 PAM 요건을 갖는 최근 특징화된 Cas9 변이체를 나타낸다. 도 92c 및 92d는 실시예 12에 기재된 바와 같이 제시된 염기 편집제 변이체로 처리된 HEK293T 세포를 나타낸다. 지시된 표적 위치에 T로 전환된 C를 갖는 (형질감염된 세포에 대해 풍부화가 없는) 총 DNA 서열분석 판독물의 백분율이 나타나 있다. 시험된 각각의 표적의 PAM 서열은 X-축 아래에 나타나 있다. 차트는 NNGRRT PAM을 갖는 게놈 유전자좌에서의 SaBE3 및 SaKKH-BE3 (도 92c), NNNRRT PAM을 갖는 게놈 유전자좌에서의 SaBE3 및 SaKKH-BE3 (도 92d), NGAG PAM (도 92e), 및 NGAH PAM (도 92f)을 갖는 게놈 유전자좌에서의 VQR-BE3 및 EQR-BE3, 및 NGCG PAM을 갖는 게놈 유전자좌에서의 VRER-BE3 (도 92g)에 대한 결과를 나타낸다. 값 및 오차 막대는 적어도 2회의 생물학적 반복의 평균 및 표준 편차를 반영한다.
도 93a 내지 93c는 시티딘 데아미나제 도메인에서의 돌연변이를 갖는 염기 편집제가 좁혀진 편집 윈도우를 나타낸다는 것을 입증한다. 도 93a 내지 93c는 돌연변이체 염기 편집제 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염된 HEK293T 세포를 나타낸다. 형질감염 3일 후에, 게놈 DNA를 추출하고, 고처리량 DNA 서열분석에 의해 지시된 유전자좌에서 분석하였다. 지시된 표적 위치에 T로 변화된 C를 갖는 (형질감염된 세포에 대한 풍부화가 없는) 총 DNA 서열분석 판독물의 백분율이 EMX1 부위 (서열식별번호: 721), HEK293 부위 3 (서열식별번호: 719), FANCF 부위 (서열식별번호: 722), HEK293 부위 2 (서열식별번호: 720), 부위 A (서열식별번호: 715), 및 부위 B (서열식별번호: 718) 유전자좌에 대해 나타나 있다. 도 93a는 염기 편집 윈도우를 좁히는 특정 시티딘 데아미나제 돌연변이를 예시한다. 추가의 돌연변이의 특징화에 대해서는 도 98을 참조한다. 도 93b는 게놈 유전자좌 상의 편집 윈도우 폭을 실시하는 시티딘 데아미나제 돌연변이의 효과를 나타낸다. 유익한 돌연변이를 조합하는 것은 편집 윈도우를 좁히는 것에 대해 상가 효과를 갖는다. 도 93c는 YE1-BE3, YE2-BE3, EE-BE3, 및 YEE-BE3이 염기 편집의 생성물 분포를 실시하여, BE3과 대조적으로 우세하게 단독으로-변형된 생성물을 생성한다는 것을 나타낸다. 값 및 오차 막대는 적어도 2회의 생물학적 반복의 평균 및 표준 편차를 반영한다.
도 94a 및 94b는 원칙적으로 이 연구에서 개발된 염기 편집제에 의해 교정될 수 있는 클린바로부터의 유전적 변이체를 나타낸다. 인간 유전적 변이 및 그의 상응하는 표현형의 NCBI 클린바 데이터베이스를 이론적으로 염기 편집에 의해 교정될 수 있는 유전 질환에 대해 조사하였다. 도 94a는 변경된 PAM 특이성을 갖는 염기 편집제의 사용을 통한 클린바 데이터베이스에서의 모든 병원성 T→C 돌연변이 중에서 염기 편집 표적화 범주의 개선을 입증한다. 백색 분획은 BE3, 또는 본 작업에서 개발된 5개의 변형된-PAM 염기 편집제와 함께의 BE3 중 어느 하나의 PAM 요건에 기초하여 접근가능한 병원성 T→C 돌연변이의 비율을 나타낸다. 도 94b는 좁혀진 활성 윈도우를 갖는 염기 편집제의 사용을 통한 클린바 데이터베이스에서의 모든 병원성 T→C 돌연변이 중에서 염기 편집 표적화 범주의 개선을 나타낸다. BE3은 도 93a 내지 93c에 나타낸 것과 대등한 효율로 위치 4-8에서 C를 편집하는 것으로 가정하였다. YEE-BE3은 그의 활성 윈도우 내에서 C5>C6>C7>다른 것들 선호도로 편집하는 것으로 가정하였다. 백색 분획은 다른 C와 대등한 편집을 갖지 않는 편집된 BE3일 수 있는 (좌측), 또는 다른 C와 대등한 편집을 갖지 않는 편집된 BE3 또는 YEE-BE3일 수 있는 (우측) 병원성 T→C 돌연변이의 비율을 나타낸다.
도 95a 내지 95b는 염기 편집 윈도우 폭에 대한 말단절단된 가이드 RNA의 효과를 나타낸다. HEK293T 세포를 상이한 5' 말단절단 길이의 BE3 및 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 도 95a는 EMX1 게놈 유전자좌 내의 부위에서의, 프로토스페이서 및 PAM 서열 (상부, 서열식별번호: 715) 및 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율을 나타낸다. 이 부위에서, 염기 편집 윈도우는 17-nt 말단절단된 gRNA의 사용을 통해 변경되었다. 도 95b는 HEK 부위 3 및 부위 4 게놈 유전자좌 내의 부위에서의, 프로토스페이서 및 PAM 서열 (상부, 서열식별번호: 715 및 716) 및 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율을 나타낸다. 이들 부위에서, 염기 편집 윈도우의 변화는 관찰되지 않았지만, sgRNA가 말단절단되는 경우 모든 기질 염기에 대한 편집 효율의 선형 감소가 주목되었다.
도 96은 염기 편집 윈도우 폭에 대한 APOBEC1-Cas9 링커 길이의 효과를 나타낸다. HEK293T 세포를 XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 또는 (GGS)7 (서열식별번호: 610) 및 sgRNA의 rAPOBEC1-Cas9 링커를 갖는 염기 편집제를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 상이한 링커를 갖는 다양한 염기 편집제에 대해 나타나 있다.
도 97a 내지 97c는 염기 편집 윈도우 폭에 대한 rAPOBEC 돌연변이의 효과를 나타낸다. 도 97c는 부위 A 또는 부위 B 중 어느 하나를 표적화하는 sgRNA 및 지시된 BE3 점 돌연변이체를 발현하는 플라스미드로 형질감염된 HEK293T 세포를 나타낸다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 프로토스페이서에서의 및 프로토스페이서의 3개의 염기 쌍 내의 모든 C가 제시되며, 세포의 C에서 T로의 전환 백분율이 나타나 있다. 그 내에서 편집 효율이 반수-최대 값을 초과하는 뉴클레오티드의 계산된 수로서 정의되는 '편집 윈도우 폭'이 모든 시험된 돌연변이체에 대해 제시된다.
도 98은 포유동물 세포에서의 염기 편집의 생성물 분포에 대한 APOBEC1 돌연변이의 효과를 나타낸다. HEK293T 세포를 BE3 또는 그의 돌연변이체 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 나타나 있다 (좌측). C에서 T로의 전환을 함유하는 총 서열분석 판독물의 퍼센트는 우측에 나타나 있다. BE3 점 돌연변이체는 단지 1개의 표적 시티딘을 갖는 부위인 HEK 부위 4에서 염기 편집 효율에 유의하게 영향을 미치지 않는다.
도 99는 BE3 및 HF-BE3에서의 온-타겟 편집 혈장 전달의 비교를 나타낸다.
도 100은 BE3의 단백질 및 혈장 전달에서의 온-타겟 편집의 비교를 나타낸다.
도 101은 HF-BE3의 단백질 및 혈장 전달에서의 온-타겟 편집의 비교를 나타낸다.
도 102는 리포펙션 및 HF 돌연변이를 설치하는 것 둘 다가 오프-타겟 탈아미노화 사건을 감소시킨다는 것을 나타낸다. 다이아몬드는 오프 타겟이 검출되지 않았음을 지시하며, 특이성 비는 100으로 설정되었다.
도 103은 프로토스페이서 (NNNNTC2TC4TC6TC8TC10TC12TC14TC16TC18TC20NGG, 서열식별번호: 723)에서의 짝수 위치에 놓인 C를 사용한 합성 기질 상의 시험관내 C에서 T로의 편집을 나타낸다.
도 104는 프로토스페이서 (NNNNTC2TC4TC6TC8TC10TC12TC14TC16TC18TC20NGG, 서열식별번호: 723)에서의 홀수 위치에 놓인 C를 사용한 합성 기질 상의 시험관내 C에서 T로의 편집을 나타낸다.
도 105는 플라스미드 대 단백질 전달을 갖는 염기 편집의 특이성 비를 나타내는 2개의 그래프를 포함한다.
도 106a 내지 106b는 비-NGG PAM 부위에 대한 BE3 활성을 나타낸다. HEK293T 세포를 BE3 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 실시예에 기재된 바와 같이 분석하였다. 도 106a는 부위에 대한 BE3 활성이 SaBE3 또는 SaKKH-BE3에 의해 효율적으로 표적화될 수 있다는 것을 나타낸다. BE3은 NAG PAM에 대해 낮지만 유의한 활성을 나타낸다. 이 도면은 서열식별번호: 728 및 729를 나타낸다. 도 106b는 BE3이 VQR-BE3 또는 VRER-BE3과는 대조적으로 NGA 또는 NGCG PAM을 갖는 부위에서 유의하게 감소된 편집을 갖는다는 것을 나타낸다. 이 도면은 서열식별번호: 730 및 731을 나타낸다.
도 107a 내지 107b는 VQR-BE3 및 SaKKH-BE3에 대한 APOBEC1 돌연변이의 효과를 나타낸다. HEK293T 세포를 VQR-BE3, SaKKH-BE3 또는 그의 돌연변이체 및 적절한 sgRNA를 발현하는 플라스미드로 형질감염시켰다. 처리된 세포를 하기 실시예에 기재된 바와 같이 분석하였다. 지시된 표적 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 나타나 있다. 도 107a는 윈도우-조정 돌연변이가 VQR-BE3에 적용되어 NGA PAM에 의해 표적화가능한 부위에서 선택적 염기 편집을 가능하게 할 수 있다는 것을 나타낸다. 이 도면은 서열식별번호: 732 및 733을 나타낸다. 도 107b는 SaKKH-BE3에 적용되는 경우, 돌연변이가 표적 윈도우 내의 염기 선택성을 부여하지 않고 염기 편집 효율의 전반적 감소를 유발한다는 것을 나타낸다. 이 도면은 서열식별번호: 728 및 734를 나타낸다.
도 108은 뉴클레오티드 편집의 개략적 표현을 나타낸다. 하기 약어가 사용된다: (MMR) - 미스매치 복구, (BE3 니카제) - Cas9 니카제 도메인을 포함하는 염기 편집제 3을 지칭함, (UGI) - 우라실 글리코실라제 억제제, UDG - 우라실 DNA 글리코실라제, (APOBEC) - APOBEC 시티딘 데아미나제를 지칭함.
도 109는 예시적인 염기 편집 구축물의 개략적 표현을 나타낸다. 염기 편집 구축물의 구조적 배열은 BE3, BE4-pmCDA1, BE4-hAID, BE4-3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE4-XTEN, BE4-32aa, BE4-2xUGI 및 BE4에 대해 나타나 있다. 링커는 회색으로 나타나 있다 (XTEN, SGGS (서열식별번호: 606), (GGS)3 (서열식별번호: 610), 및 32aa). 데아미나제가 제시된다 (rAPOBEC1, pmCDA1, hAID, 및 hAPOBEC3G). 우라실 DNA 글리코실라제 억제제 (UGI)가 제시된다. 단일-가닥 DNA 결합 단백질 (SSB)은 자주색으로 제시된다. Cas9 니카제인 dCas9 (A840H)는 적색으로 제시된다. 도 109에는 또한 하기 표적 서열이 나타나 있다: EMX1, FANCF, HEK2, HEK3, HEK4, 및 RNF2. 아미노산 서열은 위에서 아래로 서열식별번호: 127-132로 지시된다. PAM 서열은 마지막 3개의 뉴클레오티드이다. 표적 시토신 (C)은 넘버링되고 적색으로 지시된다.
도 110은 EMX1 서열, GAGTC5CGAGCAGAAGAAGAAGGG (서열식별번호: 127)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신(C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌 (A), 구아닌 (G) 또는 티민 (T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 111은 FANCF 서열, GGAATCCC8TTCTGCAGCACCTGG (서열식별번호: 128)의 표적화된 시토신 (C8) 상에 표시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C8)의 총 백분율은 "C8" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 112는 HEK2 서열 GAACAC6AAAGCATAGACTGCGGG (서열식별번호: 129)의 표적화된 시토신 (C6) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C6)의 총 백분율은 "C6" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율이 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 113은 HEK3 서열 GGCCC5AGACTGAGCACGTGATGG (서열식별번호: 130)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 114는 HEK4 서열 GGCAC5TGCGGCTGGAGGTCCGGG (서열식별번호: 131)의 표적화된 시토신 (C5) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C5)의 총 백분율은 "C5" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 115는 RNF2 서열 GTCATC6TTAGTCATTACCTGAGG (서열식별번호: 132)의 표적화된 시토신 (C6) 상에서 지시된 염기 편집 구축물 (BE3, pmCDA1 hAID, hAPOBEC3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE-XTEN, BE4-32aa, 및 BE4-2xUGI)에 대한 염기 편집 결과를 보여준다. 돌연변이된 표적화된 시토신 (C6)의 총 백분율은 "C6" 하에 각각의 염기 편집 구축물에 대해 지시된다. indel의 총 백분율은 "indel" 하에 각각의 염기 편집 구축물에 대해 지시된다. 아데닌(A), 구아닌(G) 또는 티민(T)으로 돌연변이된 돌연변이된 시토신의 비율을 파이 차트에서 각각의 염기 편집 구축물에 대해 지시된다.
도 116은 표적 가닥을 니킹하는 Cpf1 돌연변이체에 대해 시험하기 위해 사용된 예시적인 형광 표지된 (Cy3 표지된) DNA 구축물을 보여준다. 1의 DNA 구축물에서, 비-표적 가닥 (상부 가닥) 및 표적 가닥 (하부 가닥)은 둘 다 형광 표지된다. 2의 DNA 구축물에서, 비-표적 가닥 (상부 가닥)은 형광 표지되고, 표적 가닥 (하부 가닥)은 형광 표지되지 않는다. 3의 DNA 구축물에서, 비-표적 가닥 (상부 가닥)은 형광 표지되지 않고, 표적 가닥 (하부 가닥)은 형광 표지된다.
도 117은 30분 (30 min) 또는 2시간 초과 (2h+)의 반응 시간에 걸쳐 도 116에 제시된 DNA 구축물의 표적 및 비-표적 가닥을 절단하는 다양한 Cpf1 구축물 (예를 들어, R836A, R1138A, 야생형)의 능력을 입증하는 데이터를 보여준다.
도 118은 아키텍처를 갖는 염기 편집제, APOBEC-AsCpf1(R912A)-UGI가 표적 서열의 제7에서 제11 염기의 윈도우를 갖는 C 잔기 (예를 들어, 표적 서열 FANCF1, FANCF2, HEK3-3 및 HEK3-4의 것)를 편집할 수 있다는 것을 입증하는 데이터를 보여준다. BG는 배경 돌연변이 수준 (비처리)을 나타낸다. AsCpf1은 AsCpf1 단독 처리군 (대조군)을 나타내고, APOBEC-AsCpf1 (R912A)-UGI는 표적 가닥을 우선적으로 절단하는 Cpf1을 함유하는 염기 편집제를 나타내고, APOBEC-AsCpf1 (R1225A)-UGI는 비-표적 가닥을 절단하는 Cpf1을 함유하는 자기-무력화 염기 편집제를 나타낸다. FANCF1, FANCF2, HEK3-3, 및 HEK3-4의 표적 서열은 하기와 같다:
도 119는 Cpf1 단백질 (예를 들어, AsCpf1 또는 LbCpf1)을 포함하는 염기 편집제의 개략적 표현을 나타낸다. 상이한 링커 서열 (예를 들어, XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 및 (GGS)7 (서열식별번호: 610))을 "링커"로 표지된 부분에 대해 시험하였고, 그 결과는 도 120에 제시된다.
도 120은 HEK3 부위 TGCTTCTC8CAGCCCTGGCCTGG (서열식별번호: 592)의 C8 잔기를 편집하는 도 119에 제시된 구축물의 능력을 입증하는 데이터를 보여준다. APOBEC 도메인을 Cpf1 도메인 (예를 들어, LbCpf1(R836A) 또는 AsCpf1(R912A))에 연결하는 상이한 링커 서열을 시험하였다. 시험된 예시적인 링커는 XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 및 (GGS)7 (서열식별번호: 610)을 포함한다.
도 121은, HEK3의 잔기 TGCTTCTC8C9AGCCCTGGCCTGG (서열식별번호: 592)의 C8 및 C9 편집을 위한, LbCpf1 도메인을 갖는 도 119에 제시된 구축물의 능력을 입증하는 데이터를 보여준다. APOBEC 도메인을 LbCpf1 도메인에 연결하는 통합 생물정보학 VU의 센터에 의해 유지된 데이터베이스로부터의 상이한 링커 서열을 시험하였다. 시험된 예시적인 링커는 1au7, 1c1k, 1c20, 1ee8, 1flz, 1ign, 1jmc, 1sfe, 2ezx 및 2reb를 포함한다.
도 122는 N 및 C 말단이 표시된 AsCpf1의 구조의 개략적 표현을 나타낸다.
도 123은 N 및 C 말단이 표시된 SpCas9의 구조의 개략적 표현을 나타낸다.
도 124는 AsCpf1의 개략적 표현을 나타내고, 여기서 적색 원은 편집 윈도우가 있다고 예측되는 면적을 나타낸다. 정사각형은 APOBEC 활성을 방해할 수 있는 나선 영역을 나타낸다.
도 125a 및 125b는 고충실도 염기 편집제 (HF-BE3)의 조작 및 시험관내 특징화를 보여준다. 도 125a는 HF-BE3의 개략적 표현을 보여준다. BE3에 도입되어 HF-BE3을 생성하는 점 돌연변이가 제시된다. 상기 표현은 PDB 구조 4UN3 (Cas9), 4ROV (시티딘 데아미나제) 및 1UGI (우라실 DNA 글리코실라제 억제제)를 사용하였다. 도 125b는 'TC' 반복 프로토스페이서를 함유하는 합성 기질의 시험관내 탈아미노화를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 2개의 독립적인 반복의 평균 및 범위를 반영한다.
도 126a 내지 126c는 염기 편집제 단백질의 정제를 보여준다. 도 126a는 염기 편집제 발현을 위한 최적 이. 콜라이 균주의 선택을 보여준다. 18℃에서 16시간 동안 IPTG-유도된 단백질 발현 후에, 조 세포 용해물을 단백질 함량에 대해 분석하였다. BL21 스타 (DE3) (써모 피셔(Thermo Fisher)) 세포는 BE3 및 HF-BE3 둘 다의 가장 유망한 발현후 수준을 보여주었고, 염기 편집제의 발현에 사용되었다. 도 126b는 발현된 염기 편집제 단백질의 정제를 보여준다. 염기 편집제의 C-말단 상에 His6 태그를 위치시키는 것은 BE3 및 HF-BE3 둘 다에 대한 말단절단 생성물의 생산을 유도한다 (레인 1 및 2). 예상외로, 이러한 말단절단 생성물은 His6 태그를 단백질의 N-말단에 위치시킴으로써 제거하였다 (레인 3-6). Cas9 발현에 최적인 것 (OD600 = 0.4)보다 늦게 OD600 = 0.7 (레인 4-5)의 세포 밀도로 염기 편집제의 발현을 유도하는 것은, 염기 편집 단백질의 수율을 개선시킨다. 수동 HisPur 수지 칼럼을 사용하여 정제를 수행한 후, 양이온 교환 FPLC (Akta)를 수행하였다. 도 126c는 정제된 BE3 및 HF-BE3을 보여준다. 상이한 농도의 정제된 BE3 및 HF-BE3을 열 및 LDS를 사용하여 변성시키고, 폴리아크릴아미드 겔 상에 로딩하였다. 단백질 샘플은 본 연구에 사용된 단백질을 대표한다. 도 126a 내지 126c의 겔은 BOLT 비스-트리스 플러스 4-12% 폴리아크릴아미드 (써모 피셔)이다. 전기영동 및 염색을 방법에 기재된 바와 같이 수행하였다.
도 127a 내지 127d는 인간 세포에서의 고충실도 염기 편집제 (HF-BE3)의 활성을 보여준다. 도 127a 내지 127c는 비-반복적 게놈 유전자좌 EMX1 (도 127a), FANCF (도 127b), 및 HEK293 부위 3 (도 127c)을 표적화하는 sgRNA로 처리된 HEK293T 세포로부터의 게놈 DNA의 고처리량 서열분석을 사용하여 BE3 및 HF-BE3의 플라스미드 형질감염과 연관된 온- 및 오프-타겟 편집을 검정하였다는 것을 보여준다. 각각의 sgRNA와 연관된 온- 및 오프-타겟 유전자좌는 수직선에 의해 분리된다. 도 127d는 VEGFA 부위 2를 표적화하는 고도로 반복되는 sgRNA와 연관된 온- 및 오프-타겟 편집을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 도 127a 내지 127c의 경우, 별은 처리된 샘플과 비처리된 대조군 사이의 비교에 기초한 유의한 편집을 나타낸다. * p ≤ 0.05, ** p ≤ 0.01 및 *** p ≤ 0.001 (스튜던트 양측 t-검정). 도 127d의 경우, 모든 처리된 샘플이 대조군에 비해 유의한 편집을 나타내었기 때문에 별표는 제시되지 않았다. 개별 p-값이 표 16에 열거되어 있다.
도 128a 내지 128c는 배양된 인간 세포에서 온-타겟 및 오프-타겟 염기 편집의 효율에 대한 BE3 단백질 또는 플라스미드의 투여량의 효과를 보여준다. 도 128a는 각각의 sgRNA에 대한 활성 윈도우에서의 모든 편집된 시토신에 걸쳐 각각의 4개의 게놈 유전자좌에서의 온-타겟 편집 효율을 평균내었음을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3개의 독립적인 생물학적 반복의 평균 ± S.E.M을 반영한다. 도 128b 및 128c는 HEK293T 세포에서의 BE3 플라스미드 적정 (도 128b) 또는 BE3 단백질 적정 (도 128c)으로부터 발생한 EMX1 부위에서의 온- 및 오프-타겟 편집을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 129a 내지 129b는 BE3 및 HF-BE3의 플라스미드 및 단백질 전달에 대한 온-표적:오프-타겟 염기 편집 빈도 비를 보여준다. 활성 윈도우 내의 특정한 시토신에서의 온-타겟 편집 백분율을 표시된 오프-타겟 유전자좌에 대한 상응하는 시토신에서의 오프-타겟 편집 백분율로 나눔으로써 염기 편집 온-타겟:오프-타겟 특이성 비를 계산하였다 (방법 참조). 오프-타겟 편집이 검출 한계값 미만인 경우 (서열분석 판독물의 0.025%), 본 발명자들은 오프-타겟 편집을 검출 한계 (0.025%)로 설정하고, 이 상한으로 온-타겟 편집 백분율을 나누었다. ◆로 표시되는 이들 경우에, 제시된 특이성 비는 하한을 나타낸다. 특이성 비가 비-반복적 sgRNA FANCF, HEK293 부위 3, 및 FANCF (도 129a) 및 고도로 반복적인 sgRNA VEGFA 부위 2 (도 129b)에 대해 제시된다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 130a 내지 130d는 배양된 인간 세포로의 염기 편집제의 단백질 전달을 보여준다. 도 130a 내지 130d는 EMX1 (도 130a), FANCF (도 130b), HEK293 부위 3 (도 130c) 및 VEGFA 부위 2 (도 130d)를 표적화하는 sgRNA와 복합체화된 염기 편집제의 RNP 전달과 연관된 온- 및 오프-타겟 편집을 보여준다. 오프-타겟 염기 편집은 비-반복적 sgRNA에 대한 모든 서열분석된 유전자좌에서 검출불가능하였다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 별은 처리된 샘플과 비처리 대조군 사이의 비교에 기초한 유의한 편집을 나타낸다. * p ≤ 0.05, ** p ≤ 0.01 및 *** p ≤ 0.001 (스튜던트 양측 t-검정).
도 131a 내지 131c는 게놈 유전자좌에서의 염기 편집과 연관된 indel 형성을 나타낸다. 도 131a는 VEGFA 부위 2, EMX1, FANCF, 및 HEK293 부위 3 sgRNA에 대한 온-타겟 유전자좌에서의 indel 빈도를 보여준다. 도 131b는 염기 편집:indel 형성의 비를 보여준다. 다이아몬드 (◆)는 어떤 indel도 검출되지 않았음을 나타낸다 (처리된 샘플 및 비처리된 대조군에서 indel 빈도의 유의한 차이가 없음). 도 131c는 도 131a에서 조사된 온-타겟 부위와 연관된 오프-타겟 유전자좌에서 관찰된 indel을 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 132a 내지 132d는 BE3의 RNP 전달을 사용하여 제브라피시 배아에서의 및 살아있는 마우스의 내이에서의 DNA-무함유 생체내 염기 편집을 보여준다. 도 132a는 표시된 sgRNA와 복합체화된 BE3의 주사 4일 후 수거된 제브라피쉬에서의 온-타겟 게놈 편집을 보여준다. 값 및 오차 막대는 평균 ± s.d.의 3개의 주사된 및 3개의 대조군 제브라피쉬를 반영한다. 대조군은 비관련된 sgRNA와 복합체화된 BE3을 주사하였다. 도 132b는 양이온성 지질 나노입자 내로 캡슐화된 BE3:sgRNA 복합체의 생체내 주사를 보여주는 개략도를 보여준다. 도 132c는 VEGFA 부위 2 게놈 유전자좌에서의 염기 편집제 윈도우 내의 시토신 잔기의 염기 편집을 보여준다. 도 132d는 VEGFA 부위 2 표적 유전자좌의 염기 편집 윈도우 내의 각각의 시토신에서의 온-타겟 편집을 보여준다. 도 132d (도 132c 및 132d)는 값 및 오차 막대가 VEGFA 부위 2를 표적화하는 sgRNA로 주사된 3마리의 마우스, 3마리의 주사되지 않은 마우스 및 비관련 sgRNA로 주사된 1마리의 마우스의 평균 ± S.E.M.을 반영한다.
도 133a 내지 133e는 뮤린 NIH/3T3 세포에서의 온- 및 오프-타겟 염기 편집을 보여준다. 도 133a는 'VEGFA 부위 2' sgRNA와 연관된 온-타겟 염기 편집을 보여준다 (서열에 대해서는 도 132e 참조). 음성 대조군은 BE3을 코딩하지만 sgRNA를 코딩하지는 않는 플라스미드로 처리된 세포에 상응한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다. 도 133b 내지 133e는 이러한 부위와 연관된 오프-타겟 편집이 이러한 sgRNA (도 132e에 제시된 서열)에 대한 상위 4개의 예측된 오프-타겟 유전자좌에서의 고처리량 DNA 서열분석을 사용하여 측정되었음을 보여준다. 도 133b는 오프-타겟 2를 보여주고, 도 133c는 오프-타겟 1을 보여주고, 도 133d는 오프-타겟 3을 보여주고, 도 133e는 오프-타겟 4를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 134a 내지 134b는 생체내-편집된 뮤린 조직으로부터의 오프-타겟 염기 편집 및 온-타겟 indel 분석을 보여준다. 도 134a는 VEGFA 부위 2와 연관된 오프-타겟 유전자좌의 염기 편집 윈도우 내의 각각의 시토신에 대해 플롯팅된 편집을 보여준다. 도 134b는 온-타겟 염기 편집제 유전자좌에서의 indel 비율을 보여준다. 값 및 오차 막대는 3개의 주사된 및 3개의 대조군 마우스의 평균 ± S.E.M을 반영한다.
도 135a 내지 135c는 UNG 녹아웃의 염기 편집 생성물 순도에 대한 효과를 보여준다. 도 135a는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3으로 처리된 HAP1 (UNG+) 및 HAP1 UNG- 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 135b는 시험된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 135a에서 분석된 표적 C는 적색으로 제시된다. 도 135c는 HAP1 세포 또는 HAP1 UNG- 세포에서 BE3으로 처리한 후의 indel 형성의 빈도를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 136a 내지 136d는 생성물 순도에 대한 다중-C 염기 편집의 효과를 보여준다. 도 136a는 비처리된, BE3-처리된, 및 AID-BE3-처리된 인간 HEK293T 세포의 대표적인 고처리량 서열분석 데이터를 보여준다. 프로토스페이서의 서열은 상부에 제시되고, PAM 및 표적 C는 적색으로 제시되고, 아래첨자처리된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 비-T 염기가 아니라 T로 명확하게 편집된 표적 C의 상대적인 백분율은 1개의 C만을 편집한 BE3-처리된 세포에서보다, 이 유전자에서 3개의 C를 편집한 AID-BE3-처리된 세포에서 훨씬 더 높다. 도 136b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, CDA1-BE3, 및 AID-BE3으로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 136c는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 136b에서 분석된 표적 C는 적색으로 제시된다. 도 136d는 도 136a에 제시된 처리 후의 indel 형성의 빈도를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 137a 내지 137c는 BE3의 아키텍처 변화의 C→T 편집 효율 및 생성물 순도에 대한 효과를 보여준다. 도 137a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 137c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 137b에서의 표적 C는 적색으로 제시된다. 도 137b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, SSB-BE3, N-UGI-BE3, 및 BE3-2xUGI로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 BE3, N-UGI-BE3 및 BE3-2xUGI에 대해 제시된다. 도 137c는 C→T 염기 편집 효율을 나타낸다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 138a 내지 138d는 C→T 편집 효율 및 생성물 순도에 대한 BE3에서의 링커 길이 변동의 효과를 보여준다. 도 138a는 BE3, BE3C, BE3D, 및 BE3E의 아키텍처를 보여주고, 도 138b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 138c에서의 표적 C는 자주색 및 적석으로 제시되고, 도 138d에서의 표적 C는 적색으로 제시된다. 도 138c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE3C, BE3D, 또는 BE3E로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 138d는 BE3, BE3C, BE3D 및 BE3E에 대한 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 139a 내지 139d는 BE4가 BE3과 비교하여 염기 편집 효율 및 생성물 순도를 증가시킨다는 것을 보여준다. 도 139a는 BE3, BE4, 및 표적-AID의 아키텍처를 나타낸다. 도 139b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 139c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 139d에서의 표적 C는 적색으로 제시된다. 도 139c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE4, 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 139d는 BE3 및 BE4에 대한 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의의 생성물 분포를 보여준다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 140a 내지 140c는 CDA1-BE3 및 AID-BE3이 BE3에 비해 더 효율적으로 표적 G에 이은 C를 편집한다는 것을 보여준다. 도 140a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, BE3, CDA1-BE3, 및 AID-BE3에 의해 편집된 표적 C는 적색으로 제시되고, 오직 CDA1-BE3 및 AID-BE3에 의해 편집된 표적 C (G에 이어짐)는 자주색으로 제시된다. 도 140b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로 처리된 HEK293T 세포를 보여준다. C→T 염기 편집 효율이 제시된다. 도 140c는 HEK2 유전자좌를 표적화하는 BE3, CDA1-BE3, 또는 AID-BE3으로 처리되고 프로토스페이서의 서열에 따라 비닝되고 분석된 HEK293T 세포로부터의 개별 DNA 서열분석 판독물을 보여주고, 이는 CDA1-BE3 및 AID-BE3에 의한 명확한 C에서 T로의 편집을 갖는 서열분석 판독물의 > 85%가 둘 다 T로 편집된 C를 갖는다는 것을 밝혀냈다 (도 140c).
도 141a 내지 141c는 다수의 편집가능한 C를 갖는 부위에서의 불균일한 편집이 보다 낮은 생성물 순도를 발생시킨다는 것을 보여준다. 도 141a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 141c에서의 표적 C는 자주색 및 적색으로 제시되고, 도 141b에서의 표적 C는 적색으로 제시된다. 도 141b 및 141c는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3으로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. C에서 비-T로의 편집은 편집 효율이 동일한 유전자좌 내의 2개의 C에 대해 동일하지 않은 경우에 더 빈번하다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 142a 내지 142d는 다수의 C의 염기 편집이 보다 높은 염기 편집 생성물 순도를 발생시킨다는 것을 보여준다. 도 142a는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 142b에서 조사된 표적 C는 적색으로 제시된다. 도 142b는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3 또는 BE3B (UGI가 결여됨)로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 142c는 HEK2 유전자좌를 표적화하는 BE3 또는 BE3B (UGI가 결여됨)로 처리된 HEK293T 세포로부터의 HTS 판독물이 위치 6의 1차 표적 C의 정체에 따라 비닝된 것을 나타낸다. 이어서, 생성된 판독물을 위치 4에서 2차 표적 C에서의 염기의 정체에 대해 분석하였다. 상기 판독물에서 단일 편집 사건만이 있는 경우, C6은 비-T로 부정확하게 편집될 가능성이 더 크다. 도 142d는 HEK4 유전자좌 (오직 단일 편집가능한 C를 갖는 부위)를 표적화하는 BE3 또는 BE3B로 처리된 세포에서, C5에서 A, G, 및 T를 갖는 편집된 판독물의 분포를 보여주고, 이는 단일 G:U 미스매치가 UNG-개시된 염기 절제 복구를 통해 프로세싱되어 생성물의 혼합물을 제공한다는 것을 예시한다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 143은 다수의 C의 염기 편집이 HEK3 및 RNF2 유전자좌에서 보다 높은 염기 편집 생성물 순도를 발생시키는 것을 보여준다. HEK3 및 RNF2 유전자좌를 표적화하는 BE3 또는 BE3B (UGI 없음)로 처리된 HEK293T 세포로부터의 DNA 서열분석 판독물을 1차 표적 C 위치 (적색)에서의 염기의 정체에 따라 분리하였다. 이어서, 서열분석 판독물의 4개 군을 2차 표적 C 위치 (자주색)에서의 염기의 정체에 대해 조사하였다. BE3의 경우, 1차 표적 C (적색)가 부정확하게 G로 편집될 경우, 2차 표적 C는 C로 유지될 가능성이 더 크다. 반대로, 1차 표적 C (적색)가 T로 전환되는 경우, 2차 표적 C는 또한 동일한 서열분석 판독물에서 T로 편집될 가능성이 더 크다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 144a 내지 144c는 BE4가 BE3보다 더 낮은 indel 빈도를 유도하고, 표적-AID는 CDA1-BE3과 유사한 생성물 순도를 나타낸다. 도 144a는 실시예 17의 물질 및 방법에 기재된 바와 같은 BE3, BE4, 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. indel 형성의 빈도 (실시예 17의 물질 및 방법 참조)가 제시된다. 도 144b는 실시예 17의 물질 및 방법에 기재된 바와 같은 CDA1-BE3 또는 표적-AID로 처리된 HEK293T 세포를 보여준다. 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포가 제시된다. 도 144c는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 144b에서 조사된 표적 C는 적색으로 제시된다. 값 및 오차 막대는 상이한 날에 수행된 3개의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 145a 내지 145c는 SaBE4가 SaBE3과 비교하여 증가된 염기 편집 수율 및 생성물 순도를 나타낸다는 것을 보여준다. 도 145a는 실시예 17의 물질 및 방법에 기재된 바와 같은 SaBE3 및 SaBE4로 처리된 HEK293T 세포를 보여준다. 나타난 표적 위치에서 T를 갖는 총 DNA 서열분석 판독물의 백분율이 제시된다. 도 145b는 연구된 게놈 유전자좌의 프로토스페이서 및 PAM 서열을 보여주고, 도 145a에서의 표적 C는 자주색 및 적색으로 제시되고, 도 145c에서 연구된 표적 C는 적색으로 제시된다. 도 145c는 편집된 DNA 서열분석 판독물 (표적 C가 돌연변이된 판독물) 중에서의 생성물 분포를 나타낸다. 값 및 오차 막대는 상이한 날에 수행된 3회의 독립적인 생물학적 반복의 평균 ± S.D.를 반영한다.
도 146은 EMX1 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자 수는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 147은 FANCF 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 148은 HEK2 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 149는 HEK3 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 150은 HEK4 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 151은 RNF2 유전자좌에서의 BE3, CDA1-BE3, AID-BE3, 또는 APOBEC3G-BE3으로의 처리로부터의 염기 편집 결과를 보여준다. 프로토스페이서의 서열은 상단에 제시되고, PAM 및 표적 염기는 적색으로 표시되고, 아래첨자표시된 숫자는 프로토스페이서 내에서의 그의 위치를 나타낸다. 각각의 서열 아래에는 상응하는 염기를 갖는 총 서열분석 판독물의 백분율이 있다. 세포를 실시예 17의 물질 및 방법에 기재된 바와 같이 처리하였다. 제시된 값은 하나의 대표적인 실험으로부터의 것이다.
도 152는 LBCpf1 융합 구축물의 개략도를 보여준다. 구축물 10은 [Apobec]-[LbCpf1]-[UGI]-[UGI]의 도메인 배열을 갖고; 구축물 11은 [Apobec]-[LbCpf1]-[UGI]의 도메인 배열을 갖고; 구축물 12는 [UGI]-[Apobec]-[LbCpf1]의 도메인 배열을 갖고; 구축물 13은 [Apobec]-[UGI]-[LbCpf1]의 도메인 배열을 갖고; 구축물 14는 [LbCpf1]-[UGI]-[Apobec]의 도메인 배열을 갖고; 구축물 15는 [LbCpf1]-[Apobec]-[UGI]의 도메인 배열을 갖는다. 각각의 구축물에 대해, 3개의 상이한 LbCpf1 단백질 (D/N/A, 이는 뉴클레아제 데드 LbCpf1 (D); LbCpf1 니카제 (N) 및 뉴클레아제 활성 LbCpf1 (A)을 지칭함)을 사용하였다.
도 153은 19개 뉴클레오티드 길이의 가이드, 즉 EMX19: TACTTTGTCCTCCGGTTCT (서열식별번호: 744)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 154는 18개 뉴클레오티드 길이의 가이드, 즉 EMX18: TACTTTGTCCTCCGGTTC (서열식별번호: 745)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 155는 17개 뉴클레오티드 길이의 가이드, 즉 EMX17: TACTTTGTCCTCCGGTT (서열식별번호: 746)를 사용한 EMX 표적 TTTGTAC3TTTGTC9C10TC12C13GGTTC18TG (서열식별번호: 738) 내 6개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 156은 23개 뉴클레오티드의 길이의 가이드, 즉, Hek2_23: CAGCCCGCTGGCCCTGTAAAGGA (서열식별번호: 747)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 157은 20개 뉴클레오티드 길이의 가이드, 즉, Hek2_20: CAGCCCGCTGGCCCTGTAAA (서열식별번호: 748)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 158은 19개 뉴클레오티드 길이의 가이드, 즉, Hek2_19: CAGCCCGCTGGCCCTGTAA (서열식별번호: 749)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 159는 18개 뉴클레오티드의 길이의 가이드, 즉, Hek2_18: CAGCCCGCTGGCCCTGTA (서열식별번호: 750)를 사용한 HEK2 표적 TTTCC1AGC4C5C6GC8TGGC12C13C14TGTAAA (서열식별번호: 739) 내 8개 C 잔기의 C에서 T로의 편집의 백분율을 보여준다. 편집을 도 152에 제시된 몇몇 구축물에 대해 시험하였다.
도 160은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 153에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 161은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 154에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 162는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 155에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 163은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 156에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 164는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 157에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 165는 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 158에 도시된 실험에 대한 indel의 백분율을 나타낸다.
도 166은 (indel 카운트에 기초한 조정 후의) 편집 백분율 값, 및 도 159에 도시된 실험에 대한 indel의 백분율을 나타낸다.
정의
본원 및 청구범위에 사용된 단수 형태는 문맥이 달리 명백하게 나타내지 않는 한 단수 및 복수 지시대상을 포함한다. 따라서, 예를 들어, "작용제"에 대한 언급은 단일 작용제 및 복수의 이러한 작용제를 포함한다.
용어 "핵산 프로그램가능한 DNA 결합 단백질" 또는 "napDNAbp"는 핵산 (예를 들어, DNA 또는 RNA), 예컨대 napDNAbp를 특정 핵산 서열로 가이드하는 가이드 핵산 (예를 들어, gRNA)과 예를 들어 표적 핵산 서열에 혼성화함으로써 회합되는 단백질을 지칭한다. 예를 들어, Cas9 단백질은 Cas9 단백질을 가이드 RNA에 상보적인 특정 DNA 서열로 가이드하는 가이드 RNA와 회합될 수 있다. 일부 실시양태에서, napDNAbp는 부류 2 미생물 CRISPR-Cas 이펙터이다. 일부 실시양태에서, napDNAbp는 Cas9 도메인, 예를 들어 뉴클레아제 활성 Cas9, Cas9 니카제 (nCas9) 또는 뉴클레아제 불활성 Cas9 (dCas9)이다. 핵산 프로그램가능한 DNA 결합 단백질의 예는, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3 및 아르고노트를 포함한다. 그러나, 핵산 프로그램가능한 DNA 결합 단백질은 또한 RNA에 결합하는 핵산 프로그램가능한 단백질을 포함한다는 것이 인지되어야 한다. 예를 들어, napDNAbp는 napDNAbp를 RNA로 가이드하는 핵산과 회합될 수 있다. 다른 핵산 프로그램가능한 DNA 결합 단백질은 이들이 본 개시내용에 구체적으로 기재되어 있지 않을 수 있더라도 또한 본 개시내용의 범주 내에 있다.
일부 실시양태에서, napDNAbp는 "RNA-프로그램가능한 뉴클레아제" 또는 "RNA-가이드된 뉴클레아제"이다. 용어는 본원에서 상호교환가능하게 사용되며, 절단을 위한 표적이 아닌 1개 이상의 RNA(들)와 복합체를 형성하는 (예를 들어, 그와 결합하거나 회합하는) 뉴클레아제를 지칭한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는, RNA와의 복합체로 존재하는 경우, 뉴클레아제:RNA 복합체로 지칭될 수 있다. 전형적으로, 결합된 RNA(들)는 가이드 RNA (gRNA)로 지칭된다. gRNA는 2개 이상의 RNA의 복합체로서, 또는 단일 RNA 분자로서 존재할 수 있다. 단일 RNA 분자로서 존재하는 gRNA는 단일-가이드 RNA (sgRNA)로 지칭될 수 있지만, "gRNA"는 또한 단일 분자로서 또는 2개 이상의 분자의 복합체로서 존재하는 가이드 RNA를 지칭하는 데 사용된다. 전형적으로, 단일 RNA 종으로서 존재하는 gRNA는 2개의 도메인을 포함한다: (1) 표적 핵산에 대한 상동성을 공유하는 (즉, 표적에 대한 Cas9 복합체의 결합을 지시하는) 도메인; 및 (2) Cas9 단백질에 결합하는 도메인. 일부 실시양태에서, 도메인 (2)는 tracrRNA로 공지된 서열에 상응하며, 스템-루프 구조를 포함한다. 일부 실시양태에서, 도메인 (2)는 문헌 [Jinek et al., Science 337:816-821 (2012)] (이의 전체 내용은 본원에 참조로 포함됨)에 제공된 바와 같은 tracrRNA와 동일하거나 상동이다. gRNA의 다른 예 (예를 들어, 도메인 2를 포함하는 것)는 2013년 9월 6일에 출원된 발명의 명칭 "스위칭가능한 Cas9 뉴클레아제 및 그의 용도"인 미국 특허 가출원 U.S.S.N. 61/874,682, 및 2013년 9월 6일에 출원된 발명의 명칭 "기능적 뉴클레아제를 위한 전달 시스템"인 미국 특허 가출원 U.S.S.N. 61/874,746에서 찾아볼 수 있으며, 각각의 전체 내용은 그 전문이 본원에 참조로 포함된다. 일부 실시양태에서, gRNA는 도메인 (1) 및 (2) 중 2개 이상을 포함하며, "연장된 gRNA"로 지칭될 수 있다. 예를 들어, 연장된 gRNA는, 본원에 기재된 바와 같이, 2개 이상의 Cas9 단백질과 결합될 것이고, 2개 이상의 별개의 영역에서 표적 핵산과 결합될 것이다. gRNA는 표적 부위에 상보적인 뉴클레오티드 서열을 포함하며, 이는 상기 표적 부위에 대한 뉴클레아제/RNA 복합체의 결합을 매개하여, 뉴클레아제:RNA 복합체의 서열 특이성을 제공한다. 일부 실시양태에서, RNA-프로그램가능한 뉴클레아제는 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)로부터의 (CRISPR-회합된 시스템) Cas9 엔도뉴클레아제, 예를 들어, Cas9 (Csn1)이다 (예를 들어, 각각의 전체 내용이 본원에 참조로 포함된 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663 (2001); "CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607 (2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821 (2012)] 참조).
일부 실시양태에서, 본원에 제공된 sgRNA 중 임의의 것은 napDNAbp에 결합하는 서열, 예를 들어, sgRNA 백본 서열을 포함한다. 예를 들어 sgRNA는 문헌 [Jinek M, Chylinski K, Fonfara I, Hauer M, Doudna JA, and Charpentier E (2012) A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science, 337, 816-812; Mali P, Esvelt KM, Church GM (2013) Cas9 as a versatile tool for engineering biology. Nature Methods, 10, 957-963; Li JF, Norville JE, Aach J, McCromack M, Zhang D, Bush J, Church GM, and Sheen J (2013) Multiplex and homologous recombination-mediated genome editing in Arabidopsis and Nicotiana benthamiana using guide RNA and Cas9. Nature Biotech, 31, 688-691; Hwang WY, Fu Y, Reyon D, Maeder ML, Tsai SQ, Sander JD, Peterson RT, Yeh JRJ, Joung JK (2013) Efficient in vivo genome editing using RNA-guided nucleases. Nat Biotechnol, 31, 227-229; Cong L, Ran FA, Cox D, Lin S, Barretto R, Habib N, Hsu PD, Wu X, Jiang W, Marraffini LA, Zhang F (2013) Multiplex genome engineering using CRIPSR/Cas systems. Science, 339, 819-823; Cho SW, Kim S, Kim JM, Kim JS (2013) Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nat Biotechnol, 31, 230-232; Jinek MJ, East A, Cheng A, Lin S, Ma E, Doudna J (2013) RNA-programmed genome editing in human cells. eLIFE, 2:e00471; DiCarlo JE, Norville JE, Mali P, Rios, Aach J, Church GM (2013) Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucl Acids Res, 41, 4336-4343; Briner AE, Donohoue PD, Gomaa AA, Selle K, Slorach EM, Nye CH, Haurwitz RE, Beisel CL, May AP, and Barrangou R (2014) Guide RNA functional modules direct Cas9 activity and orthogonality. Mol Cell, 56, 333-339]에 기재되어 있으며, 이들 각각의 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 본원에 제공된 gRNA (예를 들어, sgRNA) 중 임의의 것은 GTAATTTCTACTAAGTGTAGAT (서열식별번호: 741)의 핵산 서열 (여기서 서열식별번호: 741의 각각의 T는 우라실 (U)이며, 즉, GUAAUUUCUACUAAGUGUAGAU임), 또는 서열 GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUU-3' (서열식별번호: 618)를 포함한다.
RNA-프로그램가능한 뉴클레아제 (예를 들어, Cas9)는 DNA 절단 부위를 표적화하기 위해 RNA:DNA 혼성화를 사용하기 때문에, 이들 단백질은 원칙적으로 가이드 RNA에 의해 특정된 임의의 서열을 표적화할 수 있다. 부위-특이적 절단을 위해 (예를 들어, 게놈을 변형시키기 위해) RNA-프로그램가능한 뉴클레아제, 예컨대 Cas9를 사용하는 방법이 관련 기술분야에 공지되어 있다 (예를 들어, 각각의 전체 내용이 본원에 참조로 포함된 문헌 [Cong, L. et al., Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013); Mali, P. et al., RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013); Hwang, W.Y. et al., Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology 31, 227-229 (2013); Jinek, M. et al. RNA-programmed genome editing in human cells. eLife 2, e00471 (2013); Dicarlo, J.E. et al., Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Research (2013); Jiang, W. et al., RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nature Biotechnology 31, 233-239 (2013)] 참조).
용어 "Cas9" 또는 "Cas9 뉴클레아제"는 Cas9 단백질, 또는 그의 단편 (예를 들어, Cas9의 활성, 불활성, 또는 부분적 활성 DNA 절단 도메인, 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는 RNA-가이드된 뉴클레아제를 지칭한다. Cas9 뉴클레아제는 또한 때때로 casn1 뉴클레아제 또는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)-연관된 뉴클레아제로 지칭된다. CRISPR은 이동성 유전 요소 (바이러스, 수송가능한 요소 및 접합성 플라스미드)에 대한 보호를 제공하는 적응 면역계이다. CRISPR 클러스터는 스페이서, 선행 이동성 요소에 상보적인 서열, 및 표적 침입 핵산을 함유한다. CRISPR 클러스터는 전사되고, CRISPR RNA (crRNA)로 프로세싱된다. 유형 II CRISPR 시스템에서, 프리-crRNA의 교정 프로세싱은 트랜스-코딩된 소형 RNA (tracrRNA), 내인성 리보뉴클레아제 3 (rnc) 및 Cas9 단백질을 요구한다. tracrRNA는 프리-crRNA의 리보뉴클레아제 3-보조된 프로세싱을 위한 가이드로서 작용한다. 이어서, Cas9/crRNA/tracrRNA는 스페이서에 상보적인 선형 또는 원형 dsDNA 표적을 내핵분해적으로 절단한다. crRNA에 상보적이지 않은 표적 가닥은 먼저 내핵분해적으로 절단된 후, 외핵분해적으로 3'-5' 트리밍된다. 사실상, DNA-결합 및 절단은 전형적으로 단백질 및 둘 다의 RNA를 요구한다. 그러나, 단일 가이드 RNA ("sgRNA", 또는 간단히 "gNRA")는 crRNA 및 tracrRNA 둘 다의 측면을 단일 RNA 종 내로 혼입하도록 조작될 수 있다. 예를 들어, 문헌 [Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다. Cas9는 자기 대 비-자기를 구별하는 것을 돕기 위한 CRISPR 반복 서열 (PAM 또는 프로토스페이서 인접 모티프)에서의 짧은 모티프를 인식한다. Cas9 뉴클레아제 서열 및 구조는 관련 기술분야의 통상의 기술자에게 널리 공지되어 있다 (예를 들어, 문헌 ["Complete genome sequence of an M1 strain of Streptococcus pyogenes." Ferretti et al., J.J., McShan W.M., Ajdic D.J., Savic D.J., Savic G., Lyon K., Primeaux C., Sezate S., Suvorov A.N., Kenton S., Lai H.S., Lin S.P., Qian Y., Jia H.G., Najar F.Z., Ren Q., Zhu H., Song L., White J., Yuan X., Clifton S.W., Roe B.A., McLaughlin R.E., Proc. Natl. Acad. Sci. U.S.A. 98:4658-4663(2001)]; ["CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III." Deltcheva E., Chylinski K., Sharma C.M., Gonzales K., Chao Y., Pirzada Z.A., Eckert M.R., Vogel J., Charpentier E., Nature 471:602-607(2011); 및 "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity." Jinek M., Chylinski K., Fonfara I., Hauer M., Doudna J.A., Charpentier E. Science 337:816-821(2012)] 참조, 이들 각각의 전체 내용은 본원에 참조로 포함됨). Cas9 오르톨로그는 에스. 피오게네스 및 에스. 써모필루스(S. thermophilus)를 포함하나 이에 제한되지 않는 다양한 종에서 기재되었다. 추가의 적합한 Cas9 뉴클레아제 및 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이며, 이러한 Cas9 뉴클레아제 및 서열은 문헌 [Chylinski, Rhun, and Charpentier, "The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems" (2013) RNA Biology 10:5, 726-737] (그의 전체 내용은 본원에 참조로 포함됨)에 개시된 유기체 및 유전자좌로부터의 Cas9 서열을 포함한다. 일부 실시양태에서, Cas9 뉴클레아제는 불활성 (예를 들어, 불활성화된) DNA 절단 도메인을 가지며, 즉, Cas9는 니카제이다.
뉴클레아제-불활성화된 Cas9 단백질은 상호교환가능하게 (뉴클레아제-"데드" Cas9에 대해) "dCas9" 단백질로 지칭될 수 있다. 불활성 DNA 절단 도메인을 갖는 Cas9 단백질 (또는 그의 단편)을 생성하는 방법은 공지되어 있다 (예를 들어, 문헌 [Jinek et al., Science. 337:816-821(2012); Qi et al., "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" (2013) Cell. 28;152(5):1173-83] 참조, 이들 각각의 전체 내용은 본원에 참조로 포함됨). 예를 들어, Cas9의 DNA 절단 도메인은 2개의 서브도메인, 즉, HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하는 반면, RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H840A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, Cas9의 단편을 포함하는 단백질이 제공된다. 예를 들어, 일부 실시양태에서, 단백질은 2개의 Cas9 도메인 중 1개를 포함한다: (1) Cas9의 gRNA 결합 도메인; 또는 (2) Cas9의 DNA 절단 도메인. 일부 실시양태에서, Cas9 또는 그의 단편을 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9, 또는 그의 단편에 대한 상동성을 공유한다. 예를 들어 Cas9 변이체는 야생형 Cas9와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는 야생형 Cas9와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개, 또는 그 초과의 아미노산 변화를 가질 수 있다. 일부 실시양태에서, Cas9 변이체는 단편이 야생형 Cas9의 상응하는 단편과 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일하도록 Cas9의 단편 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함한다. 일부 실시양태에서, 단편은 상응하는 야생형 Cas9의 아미노산 길이의 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 동일하거나, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5%이다.
일부 실시양태에서, 단편은 적어도 100개 아미노산 길이이다. 일부 실시양태에서, 단편은 적어도 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 또는 적어도 1300개 아미노산 길이이다. 일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_017053.1, 서열식별번호: 1 (뉴클레오티드); 서열식별번호: 2 (아미노산))에 상응한다.
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, 야생형 Cas9는 서열식별번호:3 (뉴클레오티드) 및/또는 서열식별번호: 4 (아미노산)에 상응하거나, 이를 포함한다:
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, 야생형 Cas9는 스트렙토코쿠스 피오게네스로부터의 Cas9 (NCBI 참조 서열: NC_002737.2, 서열식별번호: 5 (뉴클레오티드); 및 유니프롯 참조 서열: Q99ZW2, 서열식별번호: 6 (아미노산))에 상응한다.
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인)
일부 실시양태에서, Cas9는 코리네박테리움 울세란스(Corynebacterium ulcerans) (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아(Corynebacterium diphtheria) (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라(Spiroplasma syrphidicola) (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아(Prevotella intermedia) (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨스(Spiroplasma taiwanense) (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에(Streptococcus iniae) (NCBI Ref: NC_021314.1); 벨리엘라 발티카(Belliella baltica) (NCBI Ref: NC_018010.1); 시크로플렉수스 토르퀴스I(Psychroflexus torquisI) (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) (NCBI Ref: YP_820832.1), 리스테리아 인노쿠아(Listeria innocua) (NCBI Ref: NP_472073.1), 캄필로박터 제주니(Campylobacter jejuni) (NCBI Ref: YP_002344900.1) 또는 네이세리아 메닝기티디스(Neisseria meningitidis) (NCBI Ref: YP_002342100.1)로부터의 Cas9 또는 실시예 5에 열거된 유기체 중 임의의 것으로부터의 Cas9를 지칭한다.
일부 실시양태에서, dCas9는 Cas9 뉴클레아제 활성을 불활성화시키는 1개 이상의 돌연변이를 갖는 Cas9 아미노산 서열에 상응하거나, 부분적으로 또는 전체적으로 이를 포함한다. 예를 들어, 일부 실시양태에서, dCas9 도메인은 D10A 및/또는 H840A 돌연변이를 포함한다.
dCas9 (D10A 및 H840A):
(단일 밑줄: HNH 도메인; 이중 밑줄: RuvC 도메인).
일부 실시양태에서, Cas9 도메인은 D10A 돌연변이를 포함하는 반면, 위치 840에서의 잔기는 서열식별번호: 6에 제공된 아미노산 서열에, 또는 또 다른 Cas9 도메인, 예컨대 본원에 제공된 Cas9 단백질 중 임의의 것에 제공된 아미노산 서열 중 임의의 것에서의 상응하는 위치에 히스티딘을 보유한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 촉매 잔기 H840의 존재는 Cas9의 활성을 복원하여 표적화된 C와 대향하는 G를 함유하는 비-편집된 (예를 들어, 비-탈아미노화된) 가닥을 절단한다. H840의 (예를 들어, A840으로부터의) 복원은 C를 함유하는 표적 가닥의 절단을 발생시키지 않는다. 이러한 Cas9 변이체는 gRNA-한정된 표적 서열에 기초하여 특이적 위치에서 단일-가닥 DNA 파괴 (닉)를 생성할 수 있으며, 이는 비-편집된 가닥의 복구를 발생시키고, 궁극적으로 비-편집된 가닥 상의 G에서 A로의 변화를 발생시킨다. 이 과정의 개략적 표현은 도 108에 나타나 있다. 간략하게, C-G 염기 쌍의 C를 데아미나제, 예를 들어, APOBEC 데아미나제에 의해 U로 탈아미노화할 수 있다. G를 갖는 비-편집된 가닥을 니킹하는 것은 미스매치 복구 메카니즘을 통한 G의 제거를 용이하게 한다. UGI는 UDG를 억제하고, 이는 U의 제거를 방지한다.
다른 실시양태에서, 예를 들어, 뉴클레아제 불활성화된 Cas9 (dCas9)를 발생시키는, D10A 및 H840A 이외의 돌연변이를 갖는 dCas9 변이체가 제공된다. 이러한 돌연변이는, 예로서, D10 및 H820에 다른 아미노산 치환, 또는 Cas9의 뉴클레아제 도메인 내에 다른 치환 (예를 들어, HNH 뉴클레아제 서브도메인 및/또는 RuvC1 서브도메인에서의 치환)을 포함한다. 일부 실시양태에서, 서열식별번호: 6과 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일한 dCas9의 변이체 또는 상동체 (예를 들어, 서열식별번호: 6의 변이체)가 제공된다. 일부 실시양태에서, 서열식별번호: 6보다 약 5개 아미노산, 약 10개 아미노산, 약 15개 아미노산, 약 20개 아미노산, 약 25개 아미노산, 약 30개 아미노산, 약 40개 아미노산, 약 50개 아미노산, 약 75개 아미노산, 약 100개 아미노산 이상 더 짧거나, 더 긴 아미노산 서열을 갖는 dCas9의 변이체 (예를 들어, 서열식별번호: 6의 변이체)가 제공된다.
일부 실시양태에서, 본원에 제공된 바와 같은 Cas9 융합 단백질은 Cas9 단백질의 전장 아미노산 서열, 예를 들어, 본원에 제공된 Cas9 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 바와 같은 융합 단백질은 전장 Cas9 서열을 포함하지 않지만, 단지 그의 단편을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 Cas9 융합 단백질은 Cas9 단편을 포함하고, 단편은 crRNA 및 tracrRNA 또는 sgRNA에 결합하지만, 예를 들어, 그것이 단지 뉴클레아제 도메인의 말단절단된 형태만을 포함하거나, 뉴클레아제 도메인을 전혀 포함하지 않는다는 점에서 기능적 뉴클레아제 도메인을 포함하지 않는다. 적합한 Cas9 도메인 및 Cas9 단편의 예시적인 아미노산 서열은 본원에 제공되며, Cas9 도메인 및 단편의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 명백할 것이다.
일부 실시양태에서, Cas9는 코리네박테리움 울세란스 (NCBI Ref: NC_015683.1, NC_017317.1); 코리네박테리움 디프테리아 (NCBI Ref: NC_016782.1, NC_016786.1); 스피로플라스마 시르피디콜라 (NCBI Ref: NC_021284.1); 프레보텔라 인터메디아 (NCBI Ref: NC_017861.1); 스피로플라스마 타이와넨스 (NCBI Ref: NC_021846.1); 스트렙토코쿠스 이니아에 (NCBI Ref: NC_021314.1); 벨리엘라 발티카 (NCBI Ref: NC_018010.1); 시크로플렉수스 토르퀴스I (NCBI Ref: NC_018721.1); 스트렙토코쿠스 써모필루스 (NCBI Ref: YP_820832.1); 리스테리아 인노쿠아 (NCBI Ref: NP_472073.1); 캄필로박터 제주니 (NCBI Ref: YP_002344900.1); 또는 네이세리아 메닝기티디스 (NCBI Ref: YP_002342100.1)로부터의 Cas9를 지칭한다.
본원에 사용된 용어 "데아미나제" 또는 "데아미나제 도메인"은 탈아미노화 반응을 촉매하는 단백질 또는 효소를 지칭한다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 각각 시티딘 또는 데옥시시티딘의 우리딘 또는 데옥시우리딘으로의 가수분해적 탈아미노화를 촉매하는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 시토신의 우라실로의 가수분해적 탈아미노화를 촉매하는 시티딘 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 유기체, 예컨대 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 또는 마우스로부터의 자연-발생 데아미나제이다. 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 자연에서 발생하지 않는 유기체로부터의 자연-발생 데아미나제의 변이체이다. 예를 들어, 일부 실시양태에서, 데아미나제 또는 데아미나제 도메인은 유기체로부터의 자연-발생 데아미나제와 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75% 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일하다.
본원에 사용된 용어 "유효량"은 목적하는 생물학적 반응을 유발하는 데 충분한 생물학적 활성제의 양을 지칭한다. 예를 들어, 일부 실시양태에서, 뉴클레아제의 유효량은 뉴클레아제에 의해 특이적으로 결합되고 절단되는 표적 부위의 절단을 유도하는 데 충분한 뉴클레아제의 양을 지칭할 수 있다. 일부 실시양태에서, 본원에 제공된 융합 단백질의, 예를 들어, 뉴클레아제-불활성 Cas9 도메인 및 핵산 편집 도메인 (예를 들어, 데아미나제 도메인)을 포함하는 융합 단백질의 유효량은 융합 단백질에 의해 특이적으로 결합되고 편집되는 표적 부위의 편집을 유도하는 데 충분한 융합 단백질의 양을 지칭할 수 있다. 통상의 기술자에 의해 인지될 바와 같이, 작용제, 예를 들어, 융합 단백질, 뉴클레아제, 데아미나제, 레콤비나제, 혼성 단백질, 단백질 이량체, 단백질 (또는 단백질 이량체) 및 폴리뉴클레오티드의 복합체, 또는 폴리뉴클레오티드의 유효량은 예를 들어, 목적하는 생물학적 반응, 예를 들어, 편집될 특이적 대립유전자, 게놈, 또는 표적 부위, 표적화되는 세포 또는 조직, 및 사용되는 작용제와 같은 다양한 인자에 의존할 수 있다.
본원에 사용된 용어 "링커"는 2개의 분자 또는 모이어티, 예를 들어, 융합 단백질의 2개의 도메인, 예컨대, 예를 들어, 뉴클레아제-불활성 Cas9 도메인 및 핵산 편집 도메인 (예를 들어, 데아미나제 도메인)을 연결하는 화학적 기 또는 분자를 지칭한다. 링커는 예를 들어 임의의 길이 및 조성의 아미노산 서열, 펩티드, 또는 중합체일 수 있다. 일부 실시양태에서, 링커는 Cas9 뉴클레아제 도메인, 및 핵산 편집 단백질의 촉매 도메인을 포함한 RNA-프로그램가능한 뉴클레아제의 gRNA 결합 도메인을 연결한다. 일부 실시양태에서, 링커는 dCas9 및 핵산 편집 단백질을 연결한다. 전형적으로, 링커는 2개의 기, 분자, 또는 다른 모이어티 사이에 위치되거나, 그에 의해 플랭킹되고, 공유 결합을 통해 각각의 것에 대해 연결되며, 따라서 2개를 연결한다. 일부 실시양태에서, 링커는 아미노산 또는 복수의 아미노산 (예를 들어, 펩티드 또는 단백질)이다. 일부 실시양태에서, 링커는 유기 분자, 기, 중합체, 또는 화학적 모이어티이다. 일부 실시양태에서, 링커는 1 내지 100개 아미노산 길이, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30 내지 35, 35 내지 40, 40 내지 45, 45 내지 50, 50 내지 60, 60 내지 70, 70 내지 80, 80 내지 90, 90 내지 100, 100 내지 150, 또는 150 내지 200개 아미노산 길이이다. 보다 긴 또는 보다 짧은 링커가 또한 고려된다.
본원에 사용된 용어 "돌연변이"는 서열, 예를 들어, 핵산 또는 아미노산 서열 내의 잔기의 또 다른 잔기로의 치환, 또는 서열 내의 1개 이상의 잔기의 결실 또는 삽입을 지칭한다. 돌연변이는 전형적으로 서열 내의 잔기의 위치에 의해 이어지는 원래 잔기를 확인함으로써, 및 새롭게 치환된 잔기의 확인에 의해 본원에 기재된다. 본원에 제공된 아미노산 치환 (돌연변이)을 생성하는 다양한 방법은 관련 기술분야에 널리 공지되어 있으며, 예를 들어, 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))]에 의해 제공된다.
본원에 사용된 용어 "핵산" 및 "핵산 분자"는 핵염기 및 산성 모이어티, 예를 들어, 뉴클레오시드, 뉴클레오티드, 또는 뉴클레오티드의 중합체를 포함하는 화합물을 지칭한다. 전형적으로, 중합체 핵산, 예를 들어, 3개 이상의 뉴클레오티드를 포함하는 핵산 분자는 인접한 뉴클레오티드가 포스포디에스테르 연결을 통해 서로 연결된 선형 분자이다. 일부 실시양태에서, "핵산"은 개별 핵산 잔기 (예를 들어 뉴클레오티드 및/또는 뉴클레오시드)를 지칭한다. 일부 실시양태에서, "핵산"은 3개 이상의 개별 뉴클레오티드 잔기를 포함하는 올리고뉴클레오티드 쇄를 지칭한다. 본원에 사용된 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 상호교환가능하게 뉴클레오티드 (예를 들어, 일련의 적어도 3개의 뉴클레오티드)의 중합체를 지칭한다. 일부 실시양태에서, "핵산"은 RNA 뿐만 아니라 단일 및/또는 이중-가닥 DNA를 포괄한다. 핵산은 예를 들어, 게놈, 전사체, mRNA, tRNA, rRNA, siRNA, snRNA, 플라스미드, 코스미드, 염색체, 크로마티드 또는 다른 자연 발생 핵산 분자의 맥락에서 자연 발생일 수 있다. 한편, 핵산 분자는 비-자연 발생 분자, 예를 들어, 재조합 DNA 또는 RNA, 인공 염색체, 조작된 게놈, 또는 그의 단편, 또는 합성 DNA, RNA, DNA/RNA 하이브리드이거나, 비-자연 발생 뉴클레오티드 또는 뉴클레오시드를 포함할 수 있다. 게다가, 용어 "핵산", "DNA", "RNA", 및/또는 유사한 용어는 핵산 유사체, 예를 들어, 포스포디에스테르 백본 이외의 것을 갖는 유사체를 포함한다. 핵산은 천연 공급원으로부터 정제되고, 재조합 발현 시스템을 사용하여 생성되고, 임의로 정제되고, 화학적으로 합성되는 등을 할 수 있다. 적절한 경우, 예를 들어, 화학적으로 합성된 분자의 경우, 핵산은 뉴클레오시드 유사체, 예컨대 화학적으로 변형된 염기 또는 당, 및 백본 변형을 갖는 유사체를 포함할 수 있다. 핵산 서열은 달리 나타내지 않는 한 5'에서 3' 방향으로 제시된다. 일부 실시양태에서, 핵산은 천연 뉴클레오시드 (예를 들어 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 및 데옥시시티딘); 뉴클레오시드 유사체 (예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오시티딘); 화학적으로 변형된 염기; 생물학적으로 변형된 염기 (예를 들어, 메틸화된 염기); 개재된 염기; 변형된 당 (예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스); 및/또는 변형된 포스페이트 기 (예를 들어, 포스포로티오에이트 및 5'-N-포스포르아미다이트 연결)이거나, 이를 포함한다.
본원에 사용된 용어 "핵산 편집 도메인"은 핵산 (예를 들어, DNA 또는 RNA)에 대해 1개 이상의 변형 (예를 들어, 시티딘 잔기의 탈아미노화)을 생성할 수 있는 단백질 또는 효소를 지칭한다. 예시적인 핵산 편집 도메인은 데아미나제, 뉴클레아제, 니카제, 레콤비나제, 메틸트랜스퍼라제, 메틸라제, 아세틸라제, 아세틸트랜스퍼라제, 전사 활성인자, 또는 전사 리프레서 도메인을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제 (예를 들어, 시티딘 데아미나제, 예컨대 APOBEC 또는 AID 데아미나제)이다.
본원에 사용된 용어 "증식성 질환"은 세포 또는 세포 집단이 비정상적으로 상승된 증식 속도를 나타낸다는 점에서 세포 또는 조직 항상성이 교란된 임의의 질환을 지칭한다. 증식성 질환은 과다증식성 질환, 예컨대 전-신생물성 과다형성 상태 및 신생물성 질환을 포함한다. 신생물성 질환은 세포의 비정상적 증식을 특징으로 하며, 양성 및 악성 신생물 둘 다를 포함한다. 악성 신생물은 또한 암으로 지칭된다.
용어 "단백질", "펩티드", 및 "폴리펩티드"는 본원에서 상호교환가능하게 사용되며, 펩티드 (아미드) 결합에 의해 함께 연결된 아미노산 잔기의 중합체를 지칭한다. 용어는 임의의 크기, 구조, 또는 기능의 단백질, 펩티드, 또는 폴리펩티드를 지칭한다. 전형적으로, 단백질, 펩티드, 또는 폴리펩티드는 적어도 3개 아미노산 길이일 것이다. 단백질, 펩티드, 또는 폴리펩티드는 개별 단백질 또는 단백질의 집합을 지칭할 수 있다. 단백질, 펩티드, 또는 폴리펩티드에서의 아미노산 중 1개 이상은 예를 들어, 화학 물질, 예컨대 탄수화물 기, 히드록실 기, 포스페이트 기, 파르네실 기, 이소파르네실 기, 지방산 기, 접합용 링커의 첨가, 관능화, 또는 다른 변형 등에 의해 변형될 수 있다. 단백질, 펩티드, 또는 폴리펩티드는 또한 단일 분자일 수 있거나, 다중-분자 복합체일 수 있다. 단백질, 펩티드, 또는 폴리펩티드는 단지 자연 발생 단백질 또는 펩티드의 단편일 수 있다. 단백질, 펩티드, 또는 폴리펩티드는 자연 발생, 재조합, 또는 합성, 또는 그의 임의의 조합일 수 있다. 본원에 사용된 용어 "융합 단백질"은 적어도 2종의 상이한 단백질로부터의 단백질 도메인을 포함하는 하이브리드 폴리펩티드를 지칭한다. 1종의 단백질은 융합 단백질의 아미노-말단 (N-말단) 부분에 또는 카르복시-말단 (C-말단) 단백질에 위치하며, 따라서 각각 "아미노-말단 융합 단백질" 또는 "카르복시-말단 융합 단백질"을 형성할 수 있다. 단백질은 핵산 편집 단백질의 상이한 도메인, 예를 들어, 핵산 결합 도메인 (예를 들어, 표적 부위에의 단백질의 결합을 지정하는 Cas9의 gRNA 결합 도메인) 및 핵산 절단 도메인 또는 촉매 도메인을 포함할 수 있다. 일부 실시양태에서, 단백질은 단백질성 부분, 예를 들어, 핵산 결합 도메인을 구성하는 아미노산 서열, 및 유기 화합물, 예를 들어, 핵산 절단제로서 작용할 수 있는 화합물을 포함한다. 일부 실시양태에서, 단백질은 핵산, 예를 들어, RNA와의 복합체에 있거나, 그와 회합된다. 본원에 제공된 단백질 중 임의의 것은 관련 기술분야에 공지된 임의의 방법에 의해 생성될 수 있다. 예를 들어, 본원에 제공된 단백질은 펩티드 링커를 포함하는 융합 단백질에 특히 적합한 재조합 단백질 발현 및 정제를 통해 생성될 수 있다. 재조합 단백질 발현 및 정제를 위한 방법은 널리 공지되어 있으며, 그의 전체 내용이 본원에 참조로 포함되는 문헌 [Green and Sambrook, Molecular Cloning: A Laboratory Manual (4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))]에 기재된 것들을 포함한다.
본원에 사용된 용어 "대상체"는 개별 유기체, 예를 들어, 개별 포유동물을 지칭한다. 일부 실시양태에서, 대상체는 인간이다. 일부 실시양태에서, 대상체는 비-인간 포유동물이다. 일부 실시양태에서, 대상체는 비-인간 영장류이다. 일부 실시양태에서, 대상체는 설치류이다. 일부 실시양태에서, 대상체는 양, 염소, 소, 고양이, 또는 개이다. 일부 실시양태에서, 대상체는 척추동물, 양서류, 파충류, 어류, 곤충류, 파리, 또는 선충류이다. 일부 실시양태에서, 대상체는 연구 동물이다. 일부 실시양태에서, 대상체는 유전자 조작된, 예를 들어, 유전자 조작된 비-인간 대상체이다. 대상체는 양쪽 성별의 및 임의의 발달 단계의 것일 수 있다.
용어 "표적 부위"는 데아미나제 또는 데아미나제를 포함하는 융합 단백질 (예를 들어, 본원에 제공된 dCas9-데아미나제 융합 단백질)에 의해 탈아미노화되는 핵산 분자 내의 서열을 지칭한다.
용어 "치료", "치료하다", 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 경감시키거나, 그의 발병을 지연시키거나, 그의 진행을 억제하는 것을 목표로 하는 임상적 개입을 지칭한다. 본원에 사용된 용어 "치료", "치료하다", 및 "치료하는"은 본원에 기재된 바와 같은 질환 또는 장애, 또는 그의 1종 이상의 증상을 역전시키거나, 경감시키거나, 그의 발병을 지연시키거나, 그의 진행을 억제하는 것을 목표로 하는 임상적 개입을 지칭한다. 일부 실시양태에서, 치료는 1종 이상의 증상이 발달된 후에 및/또는 질환이 진단된 후에 투여될 수 있다. 다른 실시양태에서, 치료는 증상의 부재 하에서, 예를 들어, 증상의 발병을 예방하거나 지연시키거나, 또는 질환의 발병 또는 진행을 억제하기 위해 투여될 수 있다. 예를 들어, 치료는 증상의 발병 전에 (예를 들어, 증상의 병력의 관점에서 및/또는 유전적 또는 다른 감수성 인자의 관점에서) 감수성 개체에게 투여될 수 있다. 치료는 또한 증상이 해결된 후에, 예를 들어, 그의 재발을 예방하거나 지연시키기 위해 계속될 수 있다.
단백질 또는 핵산과 관련하여 본원에 사용된 용어 "재조합"은 자연에서 발생하지 않지만, 인간 조작의 생성물인 단백질 또는 핵산을 지칭한다. 예를 들어, 일부 실시양태에서, 재조합 단백질 또는 핵산 분자는 임의의 자연 발생 서열과 비교하여 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 또는 적어도 7개의 돌연변이를 포함하는 아미노산 또는 뉴클레오티드 서열을 포함한다.
본원에 사용된 용어 "제약 조성물"은 질환 또는 장애의 치료와 관련하여 대상체에게 투여될 수 있는 조성물을 지칭한다. 일부 실시양태에서, 제약 조성물은 활성 성분, 예를 들어 뉴클레아제 또는 뉴클레아제를 코딩하는 핵산, 및 제약상 허용되는 부형제를 포함한다.
본원에 사용된 용어 "염기 편집제 (BE)" 또는 "핵염기 편집제 (NBE)"는 핵산 서열 (예를 들어, DNA 또는 RNA) 내의 염기 (예를 들어, A, T, C, G 또는 U)에 변형을 가할 수 있는 폴리펩티드를 포함하는 작용제를 지칭한다. 일부 실시양태에서, 염기 편집제는 핵산 내의 염기를 탈아미노화할 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 분자 내의 염기를 탈아미노화할 수 있다. 일부 실시양태에서, 염기 편집제는 DNA 중 시토신 (C)을 탈아미노화할 수 있다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제 도메인에 융합된 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함하는 융합 단백질이다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2c3, 또는 아르고노트 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 Cas9 니카제 (nCas9)이다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 뉴클레아제-불활성 Cas9 (dCas9)이다. 일부 실시양태에서, 염기 편집제는 염기 절제 복구의 억제제, 예를 들어 UGI 도메인에 융합된다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 CasX 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 CasY 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 Cpf1 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 C2c1 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 C2c2 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 C2c3 단백질을 포함한다. 일부 실시양태에서, 염기 편집제는 시티딘 데아미나제에 융합된 아르고노트 단백질을 포함한다.
본원에 사용된 용어 "우라실 글리코실라제 억제제" 또는 "UGI"는 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 수 있는 단백질을 지칭한다.
본원에 사용된 용어 "Cas9 니카제"는 듀플렉스 핵산 분자 (예를 들어, 듀플렉스 DNA 분자)의 단지 1개의 가닥만을 절단할 수 있는 Cas9 단백질을 지칭한다. 일부 실시양태에서, Cas9 니카제는 D10A 돌연변이를 포함하고, 서열식별번호: 6의 위치 H840에 히스티딘, 또는 또 다른 Cas9 도메인, 예컨대 본원에 제공된 Cas9 단백질 중 임의의 것에서의 상응하는 돌연변이를 갖는다. 예를 들어, Cas9 니카제는 서열식별번호: 8에 제시된 바와 같은 아미노산 서열을 포함할 수 있다. 이러한 Cas9 니카제는 활성 HNH 뉴클레아제 도메인을 가지며, DNA의 비-표적화된 가닥, 즉, gRNA에 의해 결합된 가닥을 절단할 수 있다. 또한, 이러한 Cas9 니카제는 불활성 RuvC 뉴클레아제 도메인을 가지며, DNA의 표적화된 가닥, 즉, 염기 편집을 목적하는 하는 가닥을 절단할 수 없다.
예시적인 Cas9 니카제 (클로닝 벡터 pPlatTET-gRNA2; 수탁 번호 BAV54124).
발명의 특정 실시양태의 상세한 설명
본 개시내용의 일부 측면은 뉴클레오티드 서열에 결합할 수 있는 도메인 (예를 들어, Cas9, 또는 Cpf1 단백질) 및 효소 도메인, 예를 들어, DNA-편집 도메인, 예컨대, 예를 들어, 데아미나제 도메인을 포함하는 융합 단백질을 제공한다. 데아미나제에 의한 핵염기의 탈아미노화는 각각의 잔기에서 점 돌연변이를 발생시킬 수 있으며, 이는 본원에서 핵산 편집으로 지칭된다. 따라서, Cas9 변이체 또는 도메인 및 DNA 편집 도메인을 포함하는 융합 단백질은 핵산 서열의 표적화된 편집에 사용될 수 있다. 이러한 융합 단백질은 시험관내에서 DNA의 표적화된 편집에, 예를 들어, 돌연변이체 세포 또는 동물의 생성에; 표적화된 돌연변이의 도입에, 예를 들어, 생체외에서의 세포에서의, 예를 들어, 동일한 또는 또 다른 대상체 내로 후속적으로 재-도입된 대상체로부터 얻어진 세포에서의 유전적 결함의 교정에; 및 표적화된 돌연변이의 도입, 예를 들어 대상체에서 질환-연관된 유전자에서의 유전적 결함의 교정 또는 탈활성화 돌연변이의 도입에 유용하다. 전형적으로, 본원에 기재된 융합 단백질의 Cas9 도메인은 임의의 뉴클레아제 활성을 갖지 않지만, 대신 Cas9 단편 또는 dCas9 단백질 또는 도메인이다. 본 발명의 다른 측면은 (i) 핵산 서열에 결합할 수 있는 도메인 (예를 들어, Cas9 또는 Cpf1 단백질); (ii) 효소 도메인, 예를 들어, DNA-편집 도메인 (예를 들어, 데아미나제 도메인); 및 (iii) 1개 이상의 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질을 제공한다. 적어도 1개의 UGI 도메인의 존재는 UGI 도메인이 없는 융합 단백질과 비교하여 염기 편집 효율을 증가시킨다. 2개의 UGI 도메인을 포함하는 융합 단백질은 1개의 UGI 도메인을 갖거나 UGI 도메인을 갖지 않는 융합 단백질과 비교하여 염기 편집 효율 및 생성물 순도를 추가로 증가시킨다. 본원에 기재된 바와 같은 Cas9 융합 단백질의 사용 방법이 또한 제공된다.
핵산 프로그램가능한 DNA 결합 단백질
본 개시내용의 일부 측면은 단백질, 예컨대 염기 편집제를 특정 핵산 (예를 들어, DNA 또는 RNA) 서열에 가이드하는 데 사용될 수 있는 핵산 프로그램가능한 DNA 결합 단백질을 제공한다. 본원에 제공된 융합 단백질 (예를 들어, 염기 편집제) 중 임의의 것은 임의의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)을 포함할 수 있다는 것이 인지되어야 한다. 예를 들어, Cas9 도메인을 포함하는 본원에 기재된 융합 단백질 중 임의의 것은 Cas9 도메인 대신 또 다른 napDNAbp, 예컨대 CasX, CasY, Cpf1, C2c1, C2c2, C2c3, 및 아르고노트를 사용할 수 있다. 핵산 프로그램가능한 DNA 결합 단백질은, 비제한적으로, Cas9 (예를 들어, dCas9 및 nCas9), CasX, CasY, Cpf1, C2c1, C2c2, C2C3, 및 아르고노트를 포함한다. Cas9와 상이한 PAM 특이성을 갖는 핵산 프로그램가능한 DNA 결합 단백질의 한 예는 프레보텔라 및 프란시셀라 1로부터의 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (Cpf1)이다. Cas9와 유사하게, Cpf1도 또한 부류 2 CRISPR 이펙터이다. Cpf1은 Cas9와 구분되는 특색을 가지면서 강건한 DNA 간섭을 매개한다. Cpf1은 tracrRNA가 결여된 단일 RNA-가이드 엔도뉴클레아제이고, 이는 T-풍부 프로토스페이서-인접 모티프 (TTN, TTTN 또는 YTN)를 사용한다. 더욱이, Cpf1은 엇갈린 DNA 이중-가닥 파괴를 통해 DNA를 절단한다. 16종의 Cpf1-패밀리 단백질 중에서, 아시다미노코쿠스 및 라크노스피라세아에로부터의 2종의 효소는 인간 세포에서 효율적인 게놈-편집 활성을 갖는 것으로 밝혀졌다. Cpf1 단백질은 관련 기술분야에 공지되어 있고, 예를 들어 문헌 [Yamano et al., "Crystal structure of Cpf1 in complex with guide RNA and target DNA." Cell (165) 2016, p. 949-962]에 이전에 기재되어 있으며; 이들 전체 내용은 본원에 참조로 포함된다.
가이드 뉴클레오티드 서열-프로그램가능한 DNA 결합 단백질 도메인으로서 사용될 수 있는 뉴클레아제-불활성 Cpf1 (dCpf1) 변이체가 또한 본 발명의 조성물 및 방법에 유용하다. Cpf1 단백질은 Cas9의 RuvC 도메인과 유사한 RuvC-유사 엔도뉴클레아제 도메인을 갖지만, HNH 엔도뉴클레아제 도메인은 갖지 않고, Cpf1의 N-말단은 Cas9의 알파-나선 인식 로브를 갖지 않는다. Cpf1의 RuvC-유사 도메인은 양쪽 DNA 가닥의 절단을 담당하고, RuvC-유사 도메인의 불활성화는 Cpf1 뉴클레아제 활성을 불활성화한다는 것이 문헌 [Zetsche et al., Cell, 163, 759-771, 2015 (이는 본원에 참조로 포함됨)]에 제시되었다. 예를 들어, 프란시셀라 노비시다(Francisella novicida) Cpf1 (서열식별번호: 15)에서 D917A, E1006A, 또는 D1255A에 상응하는 돌연변이는 Cpf1 뉴클레아제 활성을 불활성화한다. 일부 실시양태에서, 데드 Cpf1 (dCpf1)은 서열식별번호: 9에서 D917A, E1006A, D1255A, D917A/E1006A, D917A/D1255A, E1006A/D1255A, 또는 D917A/E1006A/D1255A에 상응하는 돌연변이를 포함한다. Cpf1의 RuvC 도메인을 불활성화하는 임의의 돌연변이, 예를 들어 치환 돌연변이, 결실 또는 삽입이 본 개시내용에 따라 사용될 수 있다는 것이 이해되어야 한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cpf1 단백질이다. 일부 실시양태에서, Cpf1 단백질은 Cpf1 니카제 (nCpf1)이다. 일부 실시양태에서, Cpf1 단백질은 뉴클레아제 불활성 Cpf1 (dCpf1)이다. 일부 실시양태에서, Cpf1, nCpf1, 또는 dCpf1은 서열식별번호: 9-24 중 어느 하나와 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, dCpf1은 서열식별번호: 9-16 중 어느 하나와 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함하고, 서열식별번호: 9에서 D917A, E1006A, D1255A, D917A/E1006A, D917A/D1255A, E1006A/D1255A 또는 D917A/ E1006A/D1255A에 상응하는 돌연변이를 포함한다. 일부 실시양태에서, dCpf1 단백질은 서열식별번호: 9-16 중 어느 하나의 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 Cpf1도 또한 본 개시내용에 따라 사용될 수 있다는 것이 인지되어야 한다.
야생형 프란시셀라 노비시다 Cpf1 (서열식별번호: 9) (D917, E1006, 및 D1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 D917A (서열식별번호: 10) (A917, E1006, 및 D1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 E1006A (서열식별번호: 11) (D917, A1006, 및 D1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 D1255A (서열식별번호: 12) (D917, E1006, 및 A1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 D917A/E1006A (서열식별번호: 13) (A917, A1006, 및 D1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 D917A/D1255A (서열식별번호: 14) (A917, E1006, 및 A1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 E1006A/D1255A (서열식별번호: 15) (D917, A1006, 및 A1255는 볼드체 및 밑줄표시됨)
프란시셀라 노비시다 Cpf1 D917A/E1006A/D1255A (서열식별번호: 16) (A917, A1006, 및 A1255는 볼드체 및 밑줄표시됨)
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질은 아시다미노코쿠스(Acidaminococcus) 종 (AsCpf1)으로부터의 Cpf1 단백질이다. 아시다미노코쿠스 종으로부터의 Cpf1 단백질이 이전에 기재되었고, 통상의 기술자에게 명백할 것이다. 예시적인 아시다미노코쿠스 Cpf1 단백질 (AsCpf1)은, 비제한적으로, 본원에 제공된 AsCpf1 단백질 중 임의의 것을 포함한다.
야생형 AsCpf1- 잔기 R912는 볼드체로 밑줄표시되어 제시되고, 잔기 661-667은 이탤릭체로 밑줄표시되어 제시된다.
AsCpf1(R912A)- 잔기 A912는 볼드체로 밑줄표시되어 제시되고, 잔기 661-667은 이탤릭체로 밑줄표시되어 제시된다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질은 라크노스피라세아에(Lachnospiraceae) 종 (LbCpf1)으로부터의 Cpf1 단백질이다. 라크노스피라세아에 종으로부터의 Cpf1 단백질이 이전에 기재되었고, 통상의 기술자에게 명백할 것이다. 예시적인 라크노스피라세아에 Cpf1 단백질 (LbCpf1)은, 비제한적으로, 본원에 제공된 LbCpf1 단백질 중 임의의 것을 포함한다.
일부 실시양태에서, LbCpf1은 니카제이다. 일부 실시양태에서, LbCpf1 니카제는 서열식별번호: 18과 관련하여 R836X 돌연변이체를 포함하며, 여기서 X는 R을 제외한 임의의 아미노산이다. 일부 실시양태에서, LbCpf1 니카제는 서열식별번호: 18과 관련하여 R836A 돌연변이체를 포함한다. 일부 실시양태에서, LbCpf1은 뉴클레아제 불활성 LbCpf1 (dLbCpf1)이다. 일부 실시양태에서, dLbCpf1은 서열식별번호: 18과 관련하여 D832X 돌연변이체를 포함하며, 여기서 X는 D를 제외한 임의의 아미노산이다. 일부 실시양태에서, dLbCpf1은 서열식별번호: 18과 관련하여 D832A 돌연변이체를 포함한다. 추가의 dCpf1 단백질은 관련 기술분야, 예를 들어, 문헌 [Li et al. "Base editing with a Cpf1-cytidine deaminase fusion" Nature Biotechnology; March 2018 DOI: 10.1038/nbt.4102]에 기재되어 있으며; 그의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, dCpf1은 문헌 [Li et al.]에 기재된 Cpf1의 점 돌연변이 D832A, E1006A, D1125A 중 1, 2 또는 3개를 포함한다.
야생형 LbCpf1 - 잔기 R836 및 R1138은 볼드체로 밑줄표시되어 제시된다.
LbCpf1 (R836A)- 잔기 A836은 볼드체로 밑줄표시되어 제시된다.
LbCpf1 (R1138A)- 잔기 A1138은 볼드체로 밑줄표시되어 제시된다.
일부 실시양태에서, Cpf1 단백질은 손상된 Cpf1 단백질이다. 본원에 사용된 "손상된 Cpf1" 단백질은 야생형 Cpf1 단백질과 비교하여 감소된 뉴클레아제 활성을 갖는 Cpf1 단백질이다. 일부 실시양태에서, 손상된 Cpf1 단백질은 비-표적 가닥보다 표적 가닥을 더 효율적으로 우선적으로 절단한다. 예를 들어, Cpf1 단백질은 편집될 뉴클레오티드가 상주하는 듀플렉싱된 핵산 분자의 가닥을 우선적으로 절단한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 표적 가닥보다 비-표적 가닥을 더 효율적으로 우선적으로 절단한다. 예를 들어, Cpf1 단백질은 편집될 뉴클레오티드가 상주하지 않는 듀플렉싱된 핵산 분자의 가닥을 우선적으로 절단한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 그것이 비-표적 가닥을 절단하는 것보다 표적 가닥을 적어도 5% 더 효율적으로 우선적으로 절단한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 그것이 비-표적 가닥을 절단하는 것보다 표적 가닥을 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 적어도 100% 더 효율적으로 우선적으로 절단한다.
일부 실시양태에서, 손상된 Cpf1 단백질은 비-자연 발생 Cpf1 단백질이다. 일부 실시양태에서, 손상된 Cpf1 단백질은 야생형 Cpf1 단백질에 비해 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 야생형 Cpf1 단백질에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 돌연변이를 포함한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 서열식별번호: 18에, 또는 또 다른 Cpf1 단백질 내의 상응하는 아미노산에 제시된 바와 같은 R836A 돌연변이를 포함한다. 서열식별번호: 18의 R836A에 대한 상동 잔기 (예를 들어, 상응하는 아미노산)를 포함하는 Cpf1이 또한 유사한 결과를 달성하기 위해 돌연변이될 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 서열식별번호: 18에, 또는 또 다른 Cpf1 단백질 내의 상응하는 아미노산에 제시된 바와 같은 R1138A 돌연변이를 포함한다. 일부 실시양태에서, 손상된 Cpf1 단백질은 서열식별번호: 17에, 또는 또 다른 Cpf1 단백질 내의 상응하는 아미노산에 제시된 바와 같은 R912A 돌연변이를 포함한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 서열식별번호: 18 (LbCpf1)의 잔기 R836 및 서열식별번호: 17 (AsCpf1)의 잔기 R912는 상응하는 (예를 들어, 상동) 잔기의 예이다. 예를 들어, 서열식별번호: 17 및 18 사이의 정렬 부분은 R912 및 R836이 상응하는 잔기임을 보여준다.
일부 실시양태에서, 본원에 제공된 Cpf1 단백질 중 임의의 것은 1개 이상의 아미노산 결실을 포함한다. 일부 실시양태에서, 본원에 제공된 Cpf1 단백질 중 임의의 것은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 아미노산 결실을 포함한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, Cpf1에 융합된 데아미나제 (예를 들어, APOBEC)의 기능을 폐쇄할 수 있는, AsCpf1 (서열식별번호: 17)의 잔기 661-667을 포함하는 Cpf1 내의 나선 영역이 존재한다. 이러한 영역은 아미노산 서열 KKTGDQK를 포함한다. 따라서, 본 개시내용의 측면은 Cpf1에서의 이러한 나선 영역을 방해하는 돌연변이 (예를 들어, 결실)를 포함하는 Cpf1 단백질을 제공한다. 일부 실시양태에서, Cpf1 단백질은 서열식별번호: 17에서 하기 잔기 중 1개 이상의 결실, 또는 또 다른 Cpf1 단백질에서 1개 이상의 상응하는 결실을 포함한다: K661, K662, T663, G664, D665, Q666 및 K667. 일부 실시양태에서, Cpf1 단백질은 서열식별번호: 17에서 T663 및 D665 결실, 또는 또 다른 Cpf1 단백질에서 상응하는 결실을 포함한다. 일부 실시양태에서, Cpf1 단백질은 서열식별번호: 17에서 K662, T663, D665, 및 Q666 결실, 또는 또 다른 Cpf1 단백질에서 상응하는 결실을 포함한다. 일부 실시양태에서, Cpf1 단백질은 서열식별번호: 17에서 K661, K662, T663, D665, Q666 및 K667 결실, 또는 또 다른 Cpf1 단백질에서 상응하는 결실을 포함한다.
AsCpf1 (T663 및 D665 결실됨)
AsCpf1 (K662, T663, D665, 및 Q666 결실됨)
AsCpf1 (K661, K662, T663, D665, Q666, 및 K667 결실됨)
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 표적 서열에서 정규 (NGG) PAM 서열을 필요로 하지 않는 핵산 프로그램가능한 DNA 결합 단백질이다. 일부 실시양태에서, napDNAbp는 아르고노트 단백질이다. 이러한 핵산 프로그램가능한 DNA 결합 단백질의 한 예는 나트로노박테리움 그레고리(Natronobacterium gregoryi)로부터의 아르고노트 단백질 (NgAgo)이다. NgAgo는 ssDNA-가이드 엔도뉴클레아제이다. NgAgo는 ~24개 뉴클레오티드 (gDNA) 길이의 5'-인산화된 ssDNA에 결합하여 그것을 그의 표적 부위로 가이드하고, gDNA 부위에서 DNA 이중-가닥 파괴를 만든다. Cas9와 대조적으로, NgAgo-gDNA 시스템은 프로토스페이서-인접 모티프 (PAM)를 필요로 하지 않는다. 뉴클레아제 불활성 NgAgo (dNgAgo)를 사용하는 것은 표적화될 수 있는 염기를 크게 확장시킬 수 있다. NgAgo의 특징화 및 용도는 문헌 [Gao et al., Nat. Biotechnol., 2016 Jul;34(7):768-73. PubMed PMID: 27136078; Swarts et al., Nature 507(7491) (2014):258-61; 및 Swarts et al., Nucleic Acids Res. 43(10) (2015):5120-9]에 기재되어 있으며, 이들 각각은 본원에 참조로 포함된다. 나트로노박테리움 그레고리 아르고노트의 서열은 서열식별번호: 25에 제공된다.
일부 실시양태에서, napDNAbp는 아르고노트 단백질이다. 일부 실시양태에서, napDNAbp는 자연 발생 아르고노트 단백질과 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 자연 발생 아르고노트 단백질이다. 일부 실시양태에서, napDNAbp는 서열식별번호: 25 중 어느 하나와 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 서열식별번호: 25 중 어느 하나의 아미노산 서열을 포함한다.
야생형 나트로노박테리움 그레고리 아르고노트 (서열식별번호: 25)
일부 실시양태에서, napDNAbp는 아르고노트 단백질의 원핵 상동체이다. 아르고노트 단백질의 원핵 상동체는 공지되어 있고, 예를 들어, 문헌 [Makarova K., et al., "Prokaryotic homologs of Argonaute proteins are predicted to function as key components of a novel system of defense against mobile genetic elements", Biol. Direct. 2009 Aug 25;4:29. doi: 10.1186/1745-6150-4-29]에 기재되어 있으며, 이는 본원에 참조로 포함된다. 일부 실시양태에서, napDNAbp는 마리니토가 피에조필라(Marinitoga piezophila) 아르고노트 (MpAgo) 단백질이다. CRISPR-회합된 마리니토가 피에조필라 아르고노트 (MpAgo) 단백질은 5'-인산화된 가이드를 사용하여 단일-가닥 표적 서열을 절단한다. 5' 가이드는 모든 공지된 아르고노트에 의해 사용된다. MpAgo-RNA 복합체의 결정 구조는 5' 포스페이트 상호작용을 차단하는 잔기를 포함하는 가이드 가닥 결합 부위를 보여준다. 이러한 데이터는 5'-히드록실화된 가이드에 대한 비정규 특이성을 갖는 아르고노트 하위부류의 진화를 시사한다. 예를 들어, 문헌 [Kaya et al., "A bacterial Argonaute with noncanonical guide RNA specificity", Proc Natl Acad Sci U S A. 2016 Apr 12;113(15):4057-62]을 참조하고, 그의 전체 내용은 본원에 참조로 포함된다. 다른 아르고노트 단백질이, 예를 들어 데아미나제 (예를 들어, 시티딘 데아미나제)를 표적 핵산 (예를 들어, ssRNA)으로 가이드하기 위해, 본원에 기재된 융합 단백질 (예를 들어, 염기 편집제) 중 임의의 것에서 사용될 수 있다는 것이 인지되어야 한다.
일부 실시양태에서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 미생물 CRISPR-Cas 시스템의 단일 이펙터이다. 미생물 CRISPR-Cas 시스템의 단일 이펙터는, 비제한적으로, Cas9, Cpf1, C2c1, C2c2, 및 C2c3을 포함한다. 전형적으로, 미생물 CRISPR-Cas 시스템은 부류 1 및 부류 2 시스템으로 나뉜다. 부류 1 시스템은 멀티서브유닛 이펙터 복합체를 갖는 반면에, 부류 2 시스템은 단일 단백질 이펙터를 갖는다. Cas9 및 Cpf1은 부류 2 이펙터이다. Cas9 및 Cpf1 이외에, 3종의 별개의 부류 2 CRISPR-Cas 시스템 (C2c1, C2c2, 및 C2c3)은 문헌 [Shmakov et al., "Discovery and Functional Characterization of Diverse Class 2 CRISPR Cas Systems", Mol. Cell, 2015 Nov 5; 60(3): 385-397]에 기재되어 있으며, 그의 전체 내용은 본원에 참조로 포함된다. 상기 시스템 중 2종인 C2c1 및 C2c3의 이펙터는 Cpf1과 관련된 RuvC-유사 엔도뉴클레아제 도메인을 함유한다. 제3 시스템인 C2c2는 2개의 예측된 HEPN RNase 도메인을 갖는 이펙터를 함유한다. 성숙 CRISPR RNA의 생산은, C2c1에 의한 CRISPR RNA의 생산과 달리 tracrRNA-비의존성이다. C2c1은 DNA 절단을 위해 CRISPR RNA 및 tracrRNA 둘 다에 의존한다. 박테리아 C2c2는 그의 RNA-활성화된 단일-가닥 RNA 분해 활성과 구분되는, CRISPR RNA 성숙을 위한 고유한 RNase 활성을 보유하는 것으로 밝혀졌다. 이들 RNase 기능은 서로 상이하고, Cpf1의 CRISPR RNA-프로세싱 거동과 상이하다. 예를 들어, 문헌 [East-Seletsky, et al., "Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection", Nature, 2016 Oct 13;538(7624):270-273]을 참조하고, 그의 전체 내용은 본원에 참조로 포함된다. 렙토트리키아 샤히이(Leptotrichia shahii)의 C2c2의 시험관내 생화학적 분석은 C2c2가 단일 CRISPR RNA에 의해 가이드되고 상보적 프로토스페이서를 보유하는 ssRNA 표적을 절단하도록 프로그램화될 수 있다는 것을 밝혀냈다. 2개의 보존된 HEPN 도메인 내의 촉매 잔기는 절단을 매개한다. 촉매 잔기 내의 돌연변이는 촉매 불활성 RNA-결합 단백질을 생성한다. 예를 들어, 문헌 [Abudayyeh et al., "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector," Science, 2016 Aug 5; 353(6299)]을 참조하고, 그의 전체 내용은 본원에 참조로 포함된다.
알리시클로바실루스 아시도테레스트리스(Alicyclobaccillus acidoterrastris) C2c1 (AacC2c1)의 결정 구조는 키메라 단일-분자 가이드 RNA (sgRNA)와의 복합체로 보고되었다. 예를 들어, 본원에 참조로 포함된 문헌 [Liu et al., "C2c1-sgRNA Complex Structure Reveals RNA-Guided DNA Cleavage Mechanism", Mol. Cell, 2017 Jan 19;65(2):310-322]을 참조한다. 또한 3원 복합체로서 표적 DNA에 결합된 알리시클로바실루스 아시도테레스트리스 C2c1에 대한 결정 구조가 보고되었다. 예를 들어, 문헌 [Yang et al., "PAM-dependent Target DNA Recognition and Cleavage by C2C1 CRISPR-Cas endonuclease", Cell, 2016 Dec 15;167(7):1814-1828]을 참조하고, 그의 전체 내용은 본원에 참조로 포함된다. AacC2c1의 촉매 적격 입체형태는 표적 및 비-표적 DNA 가닥 둘 다와 함께, 단일 RuvC 촉매 포켓 내에 독립적으로 위치된 채로 포획되었고, 이때 C2c1-매개 절단은 표적 DNA의 엇갈린 7개-뉴클레오티드 파괴를 일으켰다. C2c1 3원 복합체와 이전에 확인된 Cas9 및 Cpf1 대응부 사이의 구조적 비교는 CRISPR-Cas9 시스템에 의해 사용된 메카니즘의 다양성을 입증한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 C2c1, C2c2 또는 C2c3 단백질이다. 일부 실시양태에서, napDNAbp는 C2c1 단백질이다. 일부 실시양태에서, napDNAbp는 C2c2 단백질이다. 일부 실시양태에서, napDNAbp는 C2c3 단백질이다. 일부 실시양태에서, napDNAbp는 자연 발생 C2c1, C2c2 또는 C2c3 단백질과 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 자연 발생 C2c1, C2c2 또는 C2c3 단백질이다. 일부 실시양태에서, napDNAbp는 서열식별번호: 26-28 중 어느 하나와 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 서열식별번호: 26-28 중 어느 하나의 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 C2c1, C2c2, 또는 C2c3이 또한 본 개시내용에 따라 사용될 수 있다는 것이 인지되어야 한다.
C2c1 (uniprot.org/uniprot/T0D7A2#)
sp|T0D7A2|C2C1_ALIAG CRISPR-회합된 엔도뉴클레아제 C2c1 OS=알리시클로바실루스 아시도테레스트리스 (균주 ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) GN=c2c1 PE=1 SV=1
C2c2 (uniprot.org/uniprot/P0DOC6)
>sp|P0DOC6|C2C2_LEPSD CRISPR-회합된 엔도뉴클레아제 C2c2 OS=렙토트리키아 샤히이 (균주 DSM 19757 / CCUG 47503 / CIP 107916 / JCM 16776 / LB37) GN=c2c2 PE=1 SV=1
C2c3, >CEPX01008730.1 해양 메타게놈 게놈 어셈블리 TARA_037_MES_0.1-0.22, 콘티그 TARA_037_MES_0.1-0.22_스캐폴드22115_1, 전체 게놈 샷건 서열로부터 번역됨.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 단세포 원핵 미생물의 역 및 계를 구성하는 고세균 (예를 들어 나노고세균)으로부터의 Cas9이다. 일부 실시양태에서, napDNAbp는 예를 들어 본원에 참조로 포함된 문헌 [Burstein et al., "New CRISPR-Cas systems from uncultivated microbes." Cell Res. 2017 Feb 21. doi: 10.1038/cr.2017.21]에 기재되어 있는 CasX 또는 CasY이다. 게놈-분해 메타게놈학을 사용하여, 생명체의 고세균 역에서 최초 보고된 Cas9를 포함한, 수많은 CRISPR-Cas 시스템이 확인되었다. 이러한 분기 Cas9 단백질은 나노고세균에서 활성 CRISPR-Cas 시스템의 일부로서 발견되었다. 박테리아에서, 2종의 이전에 공지되지 않은 시스템인 CRISPR-CasX 및 CRISPR-CasY가 발견되었으며, 이는 이제껏 발견된 시스템 중 가장 소형이다. 일부 실시양태에서, Cas9는 CasX 또는 CasX의 변이체를 지칭한다. 일부 실시양태에서, Cas9는 CasY 또는 CasY의 변이체를 지칭한다. 다른 RNA-가이드 DNA 결합 단백질은 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)로서 사용될 수 있고 본 개시내용의 범주 내에 있다는 것이 인지되어야 한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 CasX 또는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 CasX 단백질이다. 일부 실시양태에서, napDNAbp는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질과 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 자연 발생 CasX 또는 CasY 단백질이다. 일부 실시양태에서, napDNAbp는 서열식별번호: 29-31 중 어느 하나와 적어도 85% 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, napDNAbp는 서열식별번호: 29-31 중 어느 하나의 아미노산 서열을 포함한다. 다른 박테리아 종으로부터의 CasX 및 CasY가 또한 본 개시내용에 따라 사용될 수 있다는 것이 인지되어야 한다.
CasX (uniprot.org/uniprot/F0NN87; uniprot.org/uniprot/F0NH53)
>tr|F0NN87|F0NN87_SULIH CRISPR-회합된 Casx 단백질 OS=술폴로부스 이슬란디쿠스 (균주 HVE10/4) GN=SiH_0402 PE=4 SV=1
>tr|F0NH53|F0NH53_SULIR CRISPR 회합된 단백질, Casx OS=술폴로부스 이슬란디쿠스 (균주 REY15A) GN=SiRe_0771 PE=4 SV=1
CasY (ncbi.nlm.nih.gov/protein/APG80656.1)
>APG80656.1 CRISPR-회합된 단백질 CasY [배양되지 않은 파르쿠박테리아 군 박테리아]
핵염기 편집제의 Cas9 도메인
비제한적, 예시적인 Cas9 도메인이 본원에 제공된다. Cas9 도메인은 뉴클레아제 활성 Cas9 도메인, 뉴클레아제 불활성 Cas9 도메인, 또는 Cas9 니카제일 수 있다. 일부 실시양태에서, Cas9 도메인은 뉴클레아제 활성 도메인이다. 예를 들어, Cas9 도메인은 듀플렉싱된 핵산의 양쪽 가닥 (예를 들어, 듀플렉싱된 DNA 분자의 양쪽 가닥)을 절단하는 Cas9 도메인일 수 있다. 일부 실시양태에서, Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나를 포함한다. 일부 실시양태에서 Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나와 적어도 60% 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개, 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100, 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, Cas9 도메인은 뉴클레아제-불활성 Cas9 도메인 (dCas9)이다. 예를 들어, dCas9 도메인은 듀플렉싱된 핵산 분자의 어느 하나의 가닥을 절단하지 않고 듀플렉싱된 핵산 분자에 (예를 들어, gRNA 분자를 통해) 결합할 수 있다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 6에 제시된 아미노산 서열의 D10X 돌연변이 및 H840X 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산 변화이다. 일부 실시양태에서, 뉴클레아제-불활성 dCas9 도메인은 서열식별번호: 6에 제시된 아미노산 서열의 D10A 돌연변이 및 H840A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 한 예로서, 뉴클레아제-불활성 Cas9 도메인은 서열식별번호: 32에 제시된 아미노산 서열을 포함한다 (클로닝 벡터 pPlatTET-gRNA2, 수탁 번호 BAV54124).
추가의 적합한 뉴클레아제-불활성 dCas9 도메인은 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이며, 이는 본 개시내용의 범주 내에 있다. 이러한 추가의 예시적인 적합한 뉴클레아제-불활성 Cas9 도메인은 D10A/H840A, D10A/D839A/H840A 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하나 이에 제한되지는 않는다 (예를 들어, 전체 내용이 본원에 참조로 포함된 문헌 [Prashant et al., CAS9 transcriptional activators for target specificity screening 및 paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838] 참조). 일부 실시양태에서 dCas9 도메인은 본원에 제공된 dCas9 도메인 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나와 비교하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 또는 그 초과의 돌연변이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, Cas9 도메인은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나와 비교하여 적어도 10, 적어도 15, 적어도 20, 적어도 30, at leat 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 250, 적어도 300, 적어도 350, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100, 또는 적어도 1200개의 동일한 인접 아미노산 잔기를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, Cas9 도메인은 Cas9 니카제이다. Cas9 니카제는 듀플렉싱된 핵산 분자 (예를 들어, 듀플렉싱된 DNA 분자)의 단지 1개의 가닥만을 절단할 수 있는 Cas9 단백질일 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 표적 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성된 (그에 상보적인) 가닥을 절단한다는 것을 의미한다. 일부 실시양태에서, Cas9 니카제는 D10A 돌연변이를 포함하며, 서열식별번호: 6의 위치 840에 히스티딘, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 돌연변이를 갖는다. 예를 들어, Cas9 니카제는 서열식별번호: 8에 제시된 바와 같은 아미노산 서열을 포함할 수 있다. 일부 실시양태에서, Cas9 니카제는 듀플렉스 핵산 분자의 비-표적, 비-염기-편집된 가닥을 절단하며, 이는 Cas9 니카제가 Cas9에 결합된 gRNA (예를 들어, sgRNA)에 염기 쌍형성되지 않은 가닥을 절단한다는 것을 의미한다. 일부 실시양태에서, Cas9 니카제는 H840A 돌연변이를 포함하며, 서열식별번호: 6의 위치 10에 아스파르트산 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 갖는다. 일부 실시양태에서, Cas9 니카제는 본원에 제공된 Cas9 니카제 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 추가의 적합한 Cas9 니카제는 본 개시내용 및 관련 기술분야의 지식에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이며, 본 개시내용의 범위 내에 있다.
감소된 PAM 배타성을 갖는 Cas9 도메인
본 개시내용의 일부 측면은 상이한 PAM 특이성을 갖는 Cas9 도메인을 제공한다. 전형적으로, Cas9 단백질, 예컨대 에스. 피오게네스로부터의 Cas9 (spCas9)는 특정한 핵산 영역에 결합하는 정규 NGG PAM 서열을 요구한다. 이는 게놈 내에서 목적하는 염기를 편집하는 능력을 제한할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집 융합 단백질은 예를 들어 표적 염기가 PAM의 대략 15 염기 상류인 4개의 염기 영역 (예를 들어, "탈아미노화 윈도우") 내에 놓이는 정확한 위치에 놓일 필요가 있을 수 있다. 문헌 [Komor, A.C., et al., "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage" Nature 533, 420-424 (2016)]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다. 따라서, 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 정규 (예를 들어, NGG) PAM 서열을 함유하지 않는 뉴클레오티드 서열에 결합할 수 있는 Cas9 도메인을 함유할 수 있다. 비-정규 PAM 서열에 결합하는 Cas9 도메인은 관련 기술분야에 기재되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, 비-정규 PAM 서열에 결합하는 Cas9 도메인은 문헌 [Kleinstiver, B. P., et al., "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" Nature 523, 481-485 (2015); 및 Kleinstiver, B. P., et al., "Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" Nature Biotechnology 33, 1293-1298 (2015)]에 기재되어 있으며; 각각의 전체 내용은 본원에 참조로 포함된다.
일부 실시양태에서, Cas9 도메인은 스타필로코쿠스 아우레우스로부터의 Cas9 도메인 (SaCas9)이다. 일부 실시양태에서, SaCas9 도메인은 뉴클레아제 활성 SaCas9, 뉴클레아제 불활성 SaCas9 (SaCas9d), 또는 SaCas9 니카제 (SaCas9n)이다. 일부 실시양태에서, SaCas9는 아미노산 서열 서열식별번호: 33을 포함한다. 일부 실시양태에서, SaCas9는 서열식별번호: 33의 N579X 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 N을 제외한 임의의 아미노산이다. 일부 실시양태에서, SaCas9는 서열식별번호: 33의 N579A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SaCas9 도메인, SaCas9d 도메인, 또는 SaCas9n 도메인은 NNGRRT PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 33의 E781X, N967X, 및 R1014X 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 33의 E781K, N967K, 및 R1014H 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 1개 이상의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SaCas9 도메인은 서열식별번호: 33의 E781K, N967K, 또는 R1014H 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 33-36 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 33-36 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 33-36 중 어느 하나의 아미노산 서열로 이루어진다.
예시적인 SaCas9 서열
밑줄표시되어 있고, 볼드체인 서열식별번호: 33의 잔기 N579는 돌연변이되어 (예를 들어, A579로) SaCas9 니카제를 생성할 수 있다.
예시적인 SaCas9d 서열
밑줄표시되어 있고, 볼드체인 서열식별번호: 34의 잔기 D10은 돌연변이되어 (예를 들어, A10으로) 뉴클레아제 불활성 SaCas9d를 생성할 수 있다.
예시적인 SaCas9n 서열
서열식별번호: 33의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 35의 잔기 A579는 밑줄표시되어 있고, 볼드체이다.
예시적인 SaKKH Cas9
서열식별번호: 36의 N579로부터 돌연변이되어 SaCas9 니카제를 생성할 수 있는 서열식별번호: 36의 잔기 A579는 밑줄표시되어 있고, 볼드체이다. 서열식별번호: 36의 E781, N967, 및 R1014로부터 돌연변이되어 SaKKH Cas9를 생성할 수 있는 서열식별번호: 36의 잔기 K781, K967, 및 H1014는 밑줄표시되어 있고, 이탤릭체이다.
일부 실시양태에서, Cas9 도메인은 스트렙토코쿠스 피오게네스로부터의 Cas9 도메인 (SpCas9)이다. 일부 실시양태에서, SpCas9 도메인은 뉴클레아제 활성 SpCas9, 뉴클레아제 불활성 SpCas9 (SpCas9d), 또는 SpCas9 니카제 (SpCas9n)이다. 일부 실시양태에서, SpCas9는 아미노산 서열 서열식별번호: 37을 포함한다. 일부 실시양태에서, SpCas9는 서열식별번호: 37의 D9X 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 D를 제외한 임의의 아미노산이다. 일부 실시양태에서, SpCas9는 서열식별번호: 37의 D9A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 비-정규 PAM을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인, SpCas9d 도메인, 또는 SpCas9n 도메인은 NGG, NGA, 또는 NGCG PAM 서열을 갖는 핵산 서열에 결합할 수 있다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134X, R1334X, 및 T1336X 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134E, R1334Q, 및 T1336R 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134E, R1334Q, 및 T1336R 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134X, R1334X, 및 T1336X 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134V, R1334Q, 및 T1336R 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134V, R1334Q, 및 T1336R 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134X, G1217X, R1334X, 및 T1336X 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134V, G1217R, R1334Q, 및 T1336R 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, SpCas9 도메인은 서열식별번호: 37의 D1134V, G1217R, R1334Q, 및 T1336R 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 37-41 중 어느 하나와 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 37-41 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것의 Cas9 도메인은 서열식별번호: 37-41 중 어느 하나의 아미노산 서열로 이루어진다.
예시적인 SpCas9
예시적인 SpCas9n
예시적인 SpEQR Cas9
서열식별번호: 39의 D1134, R1334, 및 T1336로부터 돌연변이되어 SpEQR Cas9를 생성할 수 있는 서열식별번호: 39의 잔기 E1134, Q1334, 및 R1336은 밑줄표시되어 있고, 볼드체이다.
예시적인 SpVQR Cas9
서열식별번호: 40의 D1134, R1334, 및 T1336으로부터 돌연변이되어 SpVQR Cas9를 생성할 수 있는 서열식별번호: 40의 잔기 V1134, Q1334, 및 R1336은 밑줄표시되어 있고, 볼드체이다.
예시적인 SpVRER Cas9
서열식별번호: 41의 D1134, G1217, R1334, 및 T1336으로부터 돌연변이되어 SpVRER Cas9를 생성할 수 있는 서열식별번호: 41의 잔기 V1134, R1217, Q1334, 및 R1336은 밑줄표시되어 있고, 볼드체이다.
하기는 비-정규 (예를 들어, 비-NGG) PAM 서열을 갖는 핵산 서열에 결합할 수 있는 예시적인 융합 단백질 (예를 들어, 염기 편집 단백질)이다:
예시적인 SaBE3 (rAPOBEC1-XTEN-SaCas9n-UGI-NLS)
예시적인 SaKKH-BE3 (rAPOBEC1-XTEN-SaCas9n-UGI-NLS)
예시적인 EQR-BE3 (rAPOBEC1-XTEN-Cas9n-UGI-NLS)
VQR-BE3 (rAPOBEC1-XTEN-Cas9n-UGI-NLS)
VRER-BE3 (rAPOBEC1-XTEN-Cas9n-UGI-NLS)
고 충실도 염기 편집제
본 개시내용의 일부 측면은 고 충실도를 갖는 Cas9 도메인을 포함하는 Cas9 융합 단백질 (예를 들어, 본원에 제공된 융합 단백질 중 임의의 것)을 제공한다. 본 개시내용의 추가의 측면은 야생형 Cas9 도메인과 비교하여 Cas9 도메인 및 DNA의 당-포스페이트 백본 사이의 감소된 정전기적 상호작용을 갖는 Cas9 도메인을 포함하는 Cas9 융합 단백질 (예를 들어, 본원에 제공된 융합 단백질 중 임의의 것)을 제공한다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 야생형 Cas9 도메인)은 Cas9 도메인 및 DNA의 당-포스페이트 백본 사이의 회합을 감소시키는 1개 이상의 돌연변이를 포함한다. 일부 실시양태에서, 본원에 제공된 Cas9 융합 단백질 중 임의의 것은 서열식별번호: 6에 제공된 아미노산 서열의 N497X, R661X, Q695X, 및/또는 Q926X 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, 본원에 제공된 Cas9 융합 단백질 중 임의의 것은 서열식별번호: 6에 제공된 아미노산 서열의 N497A, R661A, Q695A, 및/또는 Q926A 돌연변이 중 1개 이상, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9 도메인은 서열식별번호: 6에 제공된 아미노산 서열의 D10A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, (예를 들어, 본원에 제공된 융합 단백질 중 임의의 것의) Cas9 도메인은 서열식별번호: 47에 제시된 바와 같은 아미노산 서열을 포함한다. 일부 실시양태에서, 융합 단백질은 서열식별번호: 48에 제시된 바와 같은 아미노산 서열을 포함한다. 고 충실도를 갖는 Cas9 도메인은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, 고 충실도를 갖는 Cas9 도메인은 문헌 [Kleinstiver, B.P., et al. "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects." Nature 529, 490-495 (2016); 및 Slaymaker, I.M., et al. "Rationally engineered Cas9 nucleases with improved specificity." Science 351, 84-88 (2015)]에 기재되어 있으며; 각각의 전체 내용은 본원에 참조로 포함된다.
본원에 제공된 염기 편집제, 예를 들어 염기 편집제 2 (BE2) 또는 염기 편집제 3 (BE3)은 본원에 기재된 바와 같은 Cas9 도메인을 변형시켜 고 충실도 염기 편집제, 예를 들어 고 충실도 염기 편집제 2 (HF-BE2) 또는 고 충실도 염기 편집제 3 (HF-BE3)을 생성함으로써 고 충실도 염기 편집제로 전환될 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 염기 편집제 2 (BE2)는 데아미나제 도메인, dCas9, 및 UGI 도메인을 포함한다. 일부 실시양태에서, 염기 편집제 3 (BE3)은 데아미나제 도메인, nCas9 도메인 및 UGI 도메인을 포함한다.
서열식별번호: 6의 Cas9에 대한 돌연변이가 볼드체 및 밑줄표시되어 있는 Cas9 도메인
HF-BE3
Cas9 융합 단백질
본원에 개시된 Cas9 도메인 (예를 들어, 뉴클레아제 활성 Cas9 단백질, 뉴클레아제-불활성 dCas9 단백질, 또는 Cas9 니카제 단백질) 중 임의의 것은 제2 단백질에 융합될 수 있으며, 따라서 본원에 제공된 융합 단백질은 본원에 제공된 Cas9 도메인 및 제2 단백질, 또는 "융합 파트너"를 포함한다. 일부 실시양태에서, 제2 단백질은 Cas9 도메인의 N-말단에 융합된다. 그러나, 다른 실시양태에서, 제2 단백질은 Cas9 도메인의 C-말단에 융합된다. 일부 실시양태에서, Cas9 도메인에 융합되는 제2 단백질은 핵산 편집 도메인이다. 일부 실시양태에서, Cas9 도메인 및 핵산 편집 도메인은 링커를 통해 융합되는 반면, 다른 실시양태에서, Cas9 도메인 및 핵산 편집 도메인은 서로에게 직접적으로 융합된다. 일부 실시양태에서, Cas9 도메인 및 핵산 편집 도메인은 임의의 길이 또는 조성의 링커를 통해 융합된다. 예를 들어, 링커는 임의의 길이 및 조성의 결합, 1개 이상의 아미노산, 펩티드, 또는 중합체일 수 있다. 일부 실시양태에서, 링커는 (GGGS)n (서열식별번호: 613), (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), SGGS(GGS)n (서열식별번호: 612), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이고, X는 임의의 아미노산이다. 일부 실시양태에서, 링커는 (GGS)n 모티프를 포함하며, 여기서 n은 1, 3, 또는 7이다. 일부 실시양태에서, 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 또는 15이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS(GGS)n (서열식별번호: 612)을 포함하며, 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다. 일부 실시양태에서, 링커는 아미노산 서열 SGGS(GGS)n (서열식별번호: 612)을 포함하며, 여기서 n은 2이다. 일부 실시양태에서, 링커는 SGSETPGTSESATPES의 아미노산 서열 (서열식별번호: 604) (실시예에서 XTEN 링커로도 지칭됨)을 포함한다. 일부 실시양태에서, 링커는 아미노산 서열 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605) (실시예에서 32개 아미노산 링커로도 지칭됨)를 포함한다. 링커의 길이는 실시예에 예시된 바와 같이 편집되는 염기에 영항을 미칠 수 있다. 예를 들어, 3-아미노산 길이의 링커 (예를 들어, (GGS)1)는 PAM 서열에 대해 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 4개 염기 편집 윈도우를 줄 수 있는 반면, 9-아미노산 링커 (예를 들어, (GGS)3 (서열식별번호: 610))는 PAM 서열에 대해 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 6, 4 내지 5, 5 내지 6개 염기 편집 윈도우를 줄 수 있다. 16-아미노산 링커 (예를 들어, XTEN 링커)는 예외적으로 강한 활성으로 PAM 서열에 대해 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 7, 5 내지 6, 6 내지 7개 염기 윈도우를 줄 수 있으며, 21-아미노산 링커 (예를 들어, (GGS)7 (서열식별번호: 610))는 PAM 서열에 대해 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 8, 6 내지 7, 7 내지 8개 염기 편집 윈도우를 줄 수 있다. 링커 길이를 다양화하는 것은 본 개시내용의 dCas9 융합 단백질이 PAM 서열과 상이한 거리의 핵염기를 편집하는 것을 허용한다는 신규한 발견은, PAM 서열이 유전자에서 교정되는 질환-유발 돌연변이에 대한 거리를 다양화하는 것일 수 있기 때문에 상당한 임상적 중요성을 부여한다. 여기서 실시예에 기재된 바와 같은 링커 길이는 제한적인 것을 의미하지 않는 것으로 이해되어야 한다.
일부 실시양태에서, 제2 단백질은 효소 도메인을 포함한다. 일부 실시양태에서, 효소 도메인은 핵산 편집 도메인이다. 이러한 핵산 편집 도메인은 비제한적으로 뉴클레아제, 니카제, 레콤비나제, 데아미나제, 메틸트랜스퍼라제, 메틸라제, 아세틸라제, 또는 아세틸트랜스퍼라제일 수 있다. 본 개시내용에 따라 사용될 수 있는 비제한적 예시적인 결합 도메인은 전사 활성인자 도메인 및 전사 리프레서 도메인을 포함한다.
데아미나제 도메인
일부 실시양태에서, 제2 단백질은 핵산 편집 도메인을 포함한다. 일부 실시양태에서, 핵산 편집 도메인은 C에서 U로의 염기 변화를 촉매할 수 있다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제 또는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC2 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3A 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3B 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3C 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3D 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3E 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3F 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3G 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3H 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC4 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 척추동물 데아미나제이다. 일부 실시양태에서, 데아미나제는 무척추동물 데아미나제이다. 일부 실시양태에서, 데아미나제는 인간, 침팬지, 고릴라, 원숭이, 소, 개, 래트, 또는 마우스 데아미나제이다. 일부 실시양태에서, 데아미나제는 인간 데아미나제이다. 일부 실시양태에서, 데아미나제는 래트 데아미나제, 예를 들어, rAPOBEC1이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 시티딘 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제 1 (CDA1)이다. 일부 실시양태에서, 데아미나제는 페트로미존 마리누스 (Petromyzon marinus) 시티딘 데아미나제 1 (pmCDA1)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G (서열식별번호: 60)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G의 단편 (서열식별번호: 83)이다. 일부 실시양태에서, 데아미나제는 D316R_D317R 돌연변이를 포함하는 인간 APOBEC3G 변이체 (서열식별번호: 82)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G 및 서열식별번호: 60에서의 D316R_D317R 돌연변이에 상응하는 돌연변이를 포함하는 단편 (서열식별번호: 84)이다.
일부 실시양태에서, 핵산 편집 도메인은 서열식별번호: 49-84 중 어느 하나의 데아미나제 도메인과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일하다. 일부 실시양태에서, 핵산 편집 도메인은 서열식별번호: 49-84 중 어느 하나의 아미노산 서열을 포함한다.
염기 편집제의 편집 윈도우를 조정하는 데아미나제 도메인
본 개시내용의 일부 측면은 예를 들어 데아미나제 도메인에서의 점 돌연변이를 생성함으로써 본원에 제공된 융합 단백질 중 임의의 것의 데아미나제 도메인 촉매 활성을 조정하는 것이 융합 단백질 (예를 들어, 염기 편집제)의 프로세싱성에 영향을 미친다는 인식에 기초한다. 예를 들어, 염기 편집 융합 단백질 내의 데아미나제 도메인의 촉매 활성을 감소시키지만 제거하지는 않는 돌연변이는 데아미나제 도메인이 표적 잔기에 인접한 잔기의 탈아미노화를 촉매함으로써, 탈아미노화 윈도우를 좁힐 가능성을 적게 할 수 있다. 탈아미노화 윈도우를 좁히는 능력은 특이적 표적 잔기의 인접한 잔기의 원치 않는 탈아미노화를 방지할 수 있으며, 이는 오프-타겟 효과를 감소시키거나 방지할 수 있다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 촉매 데아미나제 활성을 감소시킨 데아미나제 도메인 (예를 들어, 시티딘 데아미나제 도메인)을 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 적절한 대조군과 비교하여 촉매 데아미나제 활성을 감소시킨 데아미나제 도메인 (예를 들어, 시티딘 데아미나제 도메인)을 포함한다. 예를 들어, 적절한 대조군은 1개 이상의 돌연변이를 데아미나제 내로 도입하기 전의 데아미나제의 데아미나제 활성일 수 있다. 다른 실시양태에서, 적절한 대조군은 야생형 데아미나제일 수 있다. 일부 실시양태에서, 적절한 대조군은 야생형 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 적절한 대조군은 APOBEC1 데아미나제, APOBEC2 데아미나제, APOBEC3A 데아미나제, APOBEC3B 데아미나제, APOBEC3C 데아미나제, APOBEC3D 데아미나제, APOBEC3F 데아미나제, APOBEC3G 데아미나제, 또는 APOBEC3H 데아미나제이다. 일부 실시양태에서, 적절한 대조군은 활성화 유도된 데아미나제 (AID)이다. 일부 실시양태에서, 적절한 대조군은 페트로미존 마리누스로부터의 시티딘 데아미나제 1 (pmCDA1)이다. 일부 실시양태에서, 데아미나제 도메인은 적절한 대조군과 비교하여 적어도 1%, 적어도 5%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95% 더 적은 촉매 데아미나제 활성을 갖는 데아미나제 도메인일 수 있다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 H121X, H122X, R126X, R126X, R118X, W90X, W90X, 및 R132X로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 H121R, H122R, R126A, R126E, R118A, W90A, W90Y, 및 R132E로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 D316X, D317X, R320X, R320X, R313X, W285X, W285X, R326X로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함하며, 여기서 X는 임의의 아미노산이다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 D316R, D317R, R320A, R320E, R313A, W285A, W285Y, R326E로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 H121R 및 H122R돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 R126A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 R126E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 R118A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 W90A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 W90Y 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 W90Y 및 R126E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 R126E 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 W90Y 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 rAPOBEC1 (서열식별번호: 76)의 W90Y, R126E, 및 R132E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 D316R 및 D317R 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 R320A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 R313A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 W285A 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 W285Y 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 W285Y 및 R320E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 R320E 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 W285Y 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질 중 임의의 것은 hAPOBEC3G (서열식별번호: 60)의 W285Y, R320E, 및 R326E 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 APOBEC 데아미나제를 포함한다.
본 개시내용의 일부 측면은 (i) 뉴클레아제-불활성 Cas9 도메인; 및 (ii) 핵산 편집 도메인을 포함하는 융합 단백질을 제공한다. 일부 실시양태에서, 뉴클레아제-불활성 Cas9 도메인 (dCas9)은 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에 의해 제공된 바와 같은 Cas9의 아미노산 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 92%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5% 동일한 아미노산 서열을 포함하고, Cas9의 뉴클레아제 활성을 불활성화시키는 돌연변이를 포함한다. Cas9의 뉴클레아제 도메인을 불활성이 되게 하는 돌연변이는 관련 기술분야에 널리 공지되어 있다. 예를 들어, Cas9의 DNA 절단 도메인은 2가지 서브도메인, 즉, HNH 뉴클레아제 서브도메인 및 RuvC1 서브도메인을 포함하는 것으로 공지되어 있다. HNH 서브도메인은 gRNA에 상보적인 가닥을 절단하는 반면, RuvC1 서브도메인은 비-상보적 가닥을 절단한다. 이들 서브도메인 내의 돌연변이는 Cas9의 뉴클레아제 활성을 침묵시킬 수 있다. 예를 들어, 돌연변이 D10A 및 H840A는 에스. 피오게네스 Cas9의 뉴클레아제 활성을 완전히 불활성화시킨다 (Jinek et al., Science. 337:816-821(2012); Qi et al., Cell. 28;152(5):1173-83 (2013)). 일부 실시양태에서, 본 개시내용의 dCas9는 서열식별번호: 6에 제공된 아미노산 서열의 D10A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 본 개시내용의 dCas9는 서열식별번호: 6에 제공된 아미노산 서열의 H840A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, 본 개시내용의 dCas9는 서열식별번호: 6에 제공된 아미노산 서열의 D10A 및 H840A 돌연변이 둘 다, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 일부 실시양태에서, Cas9는 서열식별번호: 6에 제공된 아미노산 서열의 위치 840에 히스티딘 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 추가로 포함한다. 촉매 잔기 H840의 존재는 Cas9의 활성을 복원하여 표적화된 C에 대향하는 G를 함유하는 비-편집된 가닥을 절단한다. H840의 복원은 C를 함유하는 표적 가닥의 절단을 발생시키지 않는다. 일부 실시양태에서, dCas9는 서열식별번호: 32의 아미노산 서열을 포함한다. Cas9의 뉴클레아제 도메인을 불활성화시키는 다른 돌연변이는 또한 본 개시내용의 dCas9에 포함될 수 있다는 것이 이해되어야 한다.
본원에 개시된 돌연변이를 포함하는 Cas9 또는 dCas9 도메인은 전장 Cas9, 또는 그의 단편일 수 있다. 일부 실시양태에서, Cas9, 또는 그의 단편을 포함하는 단백질은 "Cas9 변이체"로 지칭된다. Cas9 변이체는 Cas9, 또는 그의 단편과 상동성을 공유한다. 예를 들어 Cas9 변이체는 야생형 Cas9와 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일하다. 일부 실시양태에서, Cas9 변이체는 단편이 야생형 Cas9, 예를 들어, 서열식별번호: 6의 아미노산 서열을 포함하는 Cas9의 상응하는 단편과 적어도 약 70% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 96% 동일하거나, 적어도 약 97% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나, 적어도 약 99.5% 동일하거나, 적어도 약 99.9% 동일하도록 Cas9의 단편 (예를 들어, gRNA 결합 도메인 또는 DNA-절단 도메인)을 포함한다.
본 개시내용의 Cas9 융합 단백질 중 임의의 것은 핵산 편집 도메인 (예를 들어, 핵산을 변형시킬 수 있는 효소, 예컨대 데아미나제)을 추가로 포함할 수 있다. 일부 실시양태에서, 핵산 편집 도메인은 DNA-편집 도메인이다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제 활성을 갖는다. 일부 실시양태에서, 핵산 편집 도메인은 데아미나제 또는 데아미나제 도메인을 포함하거나, 이로 이루어진다. 일부 실시양태에서, 데아미나제는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 시티딘 데아미나제 (AID)이다. 일부 핵산 편집 도메인 뿐만 아니라 이러한 도메인을 포함하는 Cas9 융합 단백질은 본원에 상세히 기재되어 있다. 추가의 적합한 핵산 편집 도메인은 본 개시내용 및 관련 기술분야의 지식에 기초하여 통상의 기술자에게 명백할 것이다.
본 개시내용의 일부 측면은 핵산 편집 도메인에 융합된 Cas9 도메인을 포함하며, 핵산 편집 도메인이 Cas9 도메인의 N-말단에 융합된 것인 융합 단백질을 제공한다. 일부 실시양태에서, Cas9 도메인 및 핵산 편집-편집 도메인은 링커를 통해 융합된다. 일부 실시양태에서, 링커는 (GGGS)n (서열식별번호: 613), (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604) 모티프 (예를 들어, 문헌 [Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82] 참조; 전체 내용은 본원에 참조로 포함됨), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이다. 일부 실시양태에서, n은 독립적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30이거나, 1개 초과의 링커 또는 1개 초과의 링커 모티프가 존재하는 경우, 그의 임의의 조합이다. 일부 실시양태에서, 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15이다. 일부 실시양태에서, 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1, 3, 또는 7이다. 일부 실시양태에서, 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함한다. 추가의 적합한 링커 모티프 및 링커 배위는 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 적합한 링커 모티프 및 배위는 문헌 [Chen et al., Fusion protein linkers: property, design and functionality. Adv Drug Deliv Rev. 2013; 65(10):1357-69]에 기재된 것들을 포함하며, 그의 전체 내용은 본원에 참조로 포함된다. 추가의 적합한 링커 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 본원에 제공된 예시적인 Cas9 융합 단백질의 일반적 아키텍처는 구조:
[NH2]-[핵산 편집 도메인]-[Cas9]-[COOH] 또는
[NH2]-[핵산 편집 도메인]-[링커]-[Cas9]-[COOH]
를 포함하며, 여기서 NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다.
본 개시내용의 융합 단백질은 하나 이상의 추가의 특색을 포함할 수 있다. 예를 들어, 일부 실시양태에서, 융합 단백질은 핵 국재화 서열 (NLS)을 포함한다. 일부 실시양태에서, 융합 단백질의 NLS는 핵산 편집 도메인 및 Cas9 도메인 사이에 국재화된다. 일부 실시양태에서, 융합 단백질의 NLS는 Cas9 도메인의 C-말단에 국재화된다.
존재할 수 있는 다른 예시적인 특색은 국재화 서열, 예컨대 세포질 국재화 서열, 방출 서열, 예컨대 핵 방출 서열, 또는 다른 국재화 서열, 뿐만 아니라 융합 단백질의 가용화, 정제, 또는 검출에 유용한 서열 태그이다. 본원에 제공된 적합한 단백질 태그는 비오틴 카르복실라제 운반체 단백질 (BCCP) 태그, myc-태그, 칼모둘린-태그, FLAG-태그, 헤마글루티닌 (HA)-태그, 히스티딘 태그 또는 His-태그로도 지칭되는 폴리히스티딘 태그, 말토스 결합 단백질 (MBP)-태그, nus-태그, 글루타티온-S-트랜스퍼라제 (GST)-태그, 녹색 형광 단백질 (GFP)-태그, 티오레독신-태그, S-태그, 소프태그 (예를 들어, 소프태그 1, 소프태그 3), 스트렙-태그, 비오틴 리가제 태그, FlAsH 태그, V5 태그, 및 SBP-태그를 포함하나 이에 제한되지는 않는다. 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 융합 단백질은 1개 이상의 His 태그를 포함한다.
일부 실시양태에서, 핵산 편집 도메인은 데아미나제이다. 예를 들어, 일부 실시양태에서, 데아미나제 도메인을 갖는 예시적인 Cas9 융합 단백질의 일반적 아키텍처는 구조:
[NH2]-[NLS]-[데아미나제]-[Cas9]-[COOH],
[NH2]-[Cas9]-[데아미나제]-[COOH],
[NH2]-[데아미나제]-[Cas9]-[COOH], 또는
[NH2]-[데아미나제]-[Cas9]-[NLS]-[COOH]
를 포함하며; 여기서 NLS는 핵 국재화 서열이고, NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 핵 국재화 서열은 관련 기술분야에 공지되어 있으며, 통상의 기술자에게 명백할 것이다. 예를 들어, NLS 서열은 플랭크(Plank) 등, PCT/EP2000/011690에 기재되어 있으며, 그의 내용은 예시적인 핵 국재화 서열의 그의 개시내용에 대해 본원에 참조로 포함된다. 일부 실시양태에서, NLS는 아미노산 서열 PKKKRKV (서열식별번호: 614) 또는 MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 615)를 포함한다. 일부 실시양태에서, 링커는 Cas9 및 데아미나제 사이에 삽입된다. 일부 실시양태에서, NLS는 Cas9 도메인의 C-말단에 위치한다. 일부 실시양태에서, NLS는 Cas9 도메인의 N-말단에 위치한다. 일부 실시양태에서, NLS는 데아미나제 및 Cas9 도메인 사이에 위치한다. 일부 실시양태에서, NLS는 데아미나제 도메인의 N-말단에 위치한다. 일부 실시양태에서, NLS는 데아미나제 도메인의 C-말단에 위치한다.
핵산 편집 도메인의 한 예시적인 적합한 유형은 예를 들어, APOBEC 패밀리의 시티딘 데아미나제이다. 시티딘 데아미나제 효소의 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리는 제어되고 유익한 방식으로 돌연변이유발을 개시하는 기능을 하는 11개의 단백질을 포괄한다.29 한 패밀리 구성원인 활성화-유도된 시티딘 데아미나제 (AID)는 ssDNA에서의 시토신을 전사-의존성, 가닥-편형된 방식으로 우라실로 전환시킴으로써 항체의 성숙을 담당한다.30 아포지단백질 B 편집 복합체 3 (APOBEC3) 효소는 역전사된 바이러스 ssDNA에서의 시토신의 탈아미노화를 통해 특정 HIV-1 균주에 대해 인간 세포에 보호를 제공한다.31 이들 단백질 모두는 촉매 활성을 위해 Zn2+-배위 모티프 (His-X-Glu-X23-26-Pro-Cys-X2-4-Cys; 서열식별번호: 616) 및 결합된 물 분자를 요구한다. Glu 잔기는 탈아미노화 반응에서 친핵성 공격을 위해 물 분자를 수산화아연으로 활성화시키는 작용을 한다. 각각의 패밀리 구성원은 그 자신의 특정 "핫스팟"에서 우선적으로 탈아미노화하며, 이는 hAID에 대해 WRC (W는 A 또는 T이고, R은 A 또는 G임), 내지 hAPOBEC3F에 대해 TTC의 범위이다.32 APOBEC3G의 촉매 도메인의 최근의 결정 구조는 6개의 α-나선에 의해 플랭킹된 5-가닥 β-시트 코어로 구성된 2차 구조를 밝혀내었으며, 이는 전체 패밀리에 걸쳐 보존되는 것으로 여겨진다.33 활성 중심 루프는 ssDNA 결합 및 "핫스팟" 동일성을 측정하는 것 둘 다를 담당하는 것으로 나타났다.34 이들 효소의 과다발현은 게놈 불안정성 및 암과 관련되었으며, 따라서, 서열-특이적 표적화의 중요성을 강조한다.35
본 개시내용의 일부 측면은 시티딘 데아미나제 효소, 예컨대 APOBEC 효소의 활성이 게놈 DNA에서의 특이적 부위에 지정될 수 있다는 인식에 관한 것이다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, Cas9를 인식제로서 사용하는 것의 이점은 (1) Cas9의 서열 특이성이 sgRNA 서열을 간단히 변화시킴으로써 용이하게 변경될 수 있고; (2) Cas9가 dsDNA를 변성시킴으로써 그의 표적 서열에 결합하고, 이는 단일-가닥인 DNA의 신장, 및 따라서 데아미나제에 대한 생존성 기질을 발생시킨다는 것을 포함한다. 다른 촉매 도메인, 또는 다른 데아미나제로부터의 촉매 도메인은 또한 Cas9와 융합 단백질을 생성하는 데 사용될 수 있으며, 본 개시내용은 이와 관련하여 제한되지 않는 것으로 이해되어야 한다.
본 개시내용의 일부 측면은 Cas9:데아미나제 융합 단백질이 도 3에서의 넘버링 스킴에 따른 위치 3 내지 11에서 뉴클레오티드를 효율적으로 탈아미노화할 수 있다는 인식에 기초한다. Cas9:데아미나제 융합 단백질에 의해 표적화될 수 있는 뉴클레오티드에 관하여 본원에 제공된 결과의 관점에서, 관련 기술분야의 통상의 기술자는 융합 단백질을 탈아미노화되는 뉴클레오티드를 포함하는 표적 서열에 표적화하기 위한 적합한 가이드 RNA를 설계할 수 있을 것이다.
일부 실시양태에서, 데아미나제 도메인 및 Cas9 도메인은 링커를 통해 서로에게 융합된다. 특정 용도를 위해 데아미나제 활성을 위한 최적 길이를 달성하기 위해, 데아미나제 도메인 (예를 들어, AID) 및 Cas9 도메인 사이의 다양한 링커 길이 및 유연성이 사용될 수 있다 (예를 들어, 형태 (GGGGS)n (서열식별번호: 607), (GGS)n (서열식별번호: 610), 및 (G)n (서열식별번호: 608)의 매우 유연한 링커 내지 형태 (EAAAK)n (서열식별번호: 609), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604) (예를 들어, 문헌 [Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82] 참조; 전체 내용은 본원에 참조로 포함됨) 및 (XP)n (서열식별번호: 611)의 보다 단단한 링커)36. 일부 실시양태에서, 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1, 3, 또는 7이다. 일부 실시양태에서, 링커는 (SGSETPGTSESATPES (서열식별번호: 604) 모티프를 포함한다.
본 개시내용의 측면에 따른 Cas9 도메인에 융합될 수 있는 일부 예시적인 적합한 핵산 편집 도메인, 예를 들어, 데아미나제 및 데아미나제 도메인이 하기 제공된다. 일부 실시양태에서, 각각의 서열의 활성 도메인, 예를 들어, 국재화 신호가 없는 도메인 (핵 방출 신호, 세포질 국재화 신호가 없는 핵 국재화 서열)이 사용될 수 있다는 것이 이해되어야 한다.
인간 AID:
(밑줄: 핵 국재화 서열; 이중 밑줄: 핵 방출 신호)
마우스 AID:
(밑줄: 핵 국재화 서열; 이중 밑줄: 핵 방출 신호)
개 AID:
(밑줄: 핵 국재화 서열; 이중 밑줄: 핵 방출 신호)
소 AID:
(밑줄: 핵 국재화 서열; 이중 밑줄: 핵 방출 신호)
래트 AID:
(밑줄: 핵 국재화 서열; 이중 밑줄: 핵 방출 신호)
마우스 APOBEC-3:
(이탤릭체: 핵산 편집 도메인)
래트 APOBEC-3:
(이탤릭체: 핵산 편집 도메인)
레수스 마카크 APOBEC-3G:
(이탤릭체: 핵산 편집 도메인; 밑줄: 세포질 국재화 신호)
침팬지 APOBEC-3G:
(이탤릭체: 핵산 편집 도메인; 밑줄: 세포질 국재화 신호)
녹색 원숭이 APOBEC-3G:
(이탤릭체: 핵산 편집 도메인; 밑줄: 세포질 국재화 신호)
인간 APOBEC-3G:
(이탤릭체: 핵산 편집 도메인; 밑줄: 세포질 국재화 신호)
인간 APOBEC-3F:
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3B:
(이탤릭체: 핵산 편집 도메인)
래트 APOBEC-3B:
소 APOBEC-3B:
침팬지 APOBEC-3B:
인간 APOBEC-3C:
(이탤릭체: 핵산 편집 도메인)
고릴라 APOBEC3C:
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3A:
(이탤릭체: 핵산 편집 도메인)
레수스 마카크 APOBEC-3A:
(이탤릭체: 핵산 편집 도메인)
소 APOBEC-3A:
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-3H:
(이탤릭체: 핵산 편집 도메인)
레수스 마카크 APOBEC-3H:
인간 APOBEC-3D:
(이탤릭체: 핵산 편집 도메인)
인간 APOBEC-1:
마우스 APOBEC-1:
래트 APOBEC-1:
인간 APOBEC-2:
마우스 APOBEC-2:
래트 APOBEC-2:
소 APOBEC-2:
페트로미존 마리누스 CDA1 (pmCDA1)
인간 APOBEC3G D316R_D317R
인간 APOBEC3G 쇄 A
인간 APOBEC3G 쇄 A D120R_D121R
일부 실시양태에서, 본원에 제공된 바와 같은 융합 단백질은 핵산 편집 효소의 전장 아미노산, 예를 들어, 상기 제공된 서열 중 하나를 포함한다. 그러나, 다른 실시양태에서, 본원에 제공된 바와 같은 융합 단백질은 핵산 편집 효소의 전장 서열을 포함하지 않고, 단지 그의 단편만을 포함한다. 예를 들어, 일부 실시양태에서, 본원에 제공된 융합 단백질은 Cas9 도메인 및 핵산 편집 효소의 단편을 포함하고, 예를 들어, 단편은 핵산 편집 도메인을 포함한다. 핵산 편집 도메인의 예시적인 아미노산 서열은 상기 서열에서 이탤릭체 문자로 나타나 있으며, 이러한 도메인의 추가의 적합한 서열은 관련 기술분야의 통상의 기술자에게 명백할 것이다.
예를 들어, 뉴클레아제-불활성 Cas9 도메인에 융합될 수 있는 본 발명의 측면에 따라 사용될 수 있는 추가의 적합한 핵산 편집 효소 서열, 예를 들어, 데아미나제 효소 및 도메인 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 일부 실시양태에서, 이러한 추가의 효소 서열은 본원에 제공된 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 유사한 데아미나제 효소 또는 데아미나제 도메인 서열을 포함한다. 추가의 적합한 Cas9 도메인, 변이체, 및 서열은 또한 관련 기술분야의 통상의 기술자에게 명백할 것이다. 이러한 추가의 적합한 Cas9 도메인의 예는 D10A, D10A/D839A/H840A, 및 D10A/D839A/H840A/N863A 돌연변이체 도메인을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Prashant et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nature Biotechnology. 2013; 31(9): 833-838] 참조; 그의 전체 내용은 본원에 참조로 포함됨). 일부 실시양태에서, Cas9는 서열식별번호: 6에 제공된 아미노산 서열의 위치 840에 히스티딘 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함한다. 촉매 잔기 H840의 존재는 Cas9의 활성을 복원하여 표적화된 C에 대향하는 G를 함유하는 비-편집된 가닥을 절단한다. H840의 복원은 C를 함유하는 표적 가닥의 절단을 발생시키지 않는다.
Cas9 도메인 및 데아미나제 도메인을 포함하는 융합 단백질을 생성하기 위한 추가의 적합한 전략은 관련 기술분야의 일반적 지식과 조합으로 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 링커를 사용한 또는 링커를 사용하지 않는 본 개시내용의 측면에 따른 융합 단백질을 생성하기 위한 적합한 전략은 또한 본 개시내용 및 관련 기술분야의 지식의 관점에서 관련 기술분야의 통상의 기술자에게 명백할 것이다. 예를 들어, 문헌 [Gilbert et al., CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes. Cell. 2013; 154(2):442-51]은 링커로서 2개의 NLS (SPKKKRKVEAS, 서열식별번호: 617)를 사용한 VP64와의 Cas9의 C-말단 융합이 전사 활성화에 사용될 수 있다는 것을 보여주었다. 문헌 [Mali et al., CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol. 2013; 31(9):833-8]은 링커 없이 VP64와의 C-말단 융합물이 전사 활성화에 사용될 수 있다는 것을 보고하였다. 그리고, 문헌 [Maeder et al., CRISPR RNA-guided activation of endogenous human genes. Nat Methods. 2013; 10: 977-979]은 Gly4Ser (서열식별번호: 613) 링커를 사용한 VP64와의 C-말단 융합물이 전사 활성인자로서 사용될 수 있다는 것을 보고하였다. 최근, dCas9-FokI 뉴클레아제 융합물은 성공적으로 생성되었으며, 모 Cas9 효소와 비교하여 개선된 효소적 특이성을 나타낸다 (문헌 [Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification. Nat. Biotechnol. 2014; 32(6): 577-82, 및 Tsai SQ, Wyvekens N, Khayter C, Foden JA, Thapar V, Reyon D, Goodwin MJ, Aryee MJ, Joung JK. Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing. Nat Biotechnol. 2014; 32(6):569-76]. PMID: 24770325 SGSETPGTSESATPES (서열식별번호: 604) 또는 GGGGS (서열식별번호: 607) 링커는 각각 FokI-dCas9 융합 단백질에 사용됨).
본 개시내용의 일부 측면은 (i) Cas9 효소 또는 도메인 (예를 들어, 제1 단백질); 및 (ii) 핵산-편집 효소 또는 도메인 (예를 들어, 제2 단백질)을 포함하는 융합 단백질을 제공한다. 일부 측면에서, 본원에 제공된 융합 단백질은 (iii) 프로그램가능한 DNA-결합 단백질, 예를 들어, 아연-핑거 도메인, TALE, 또는 제2 Cas9 단백질 (예를 들어, 제3 단백질)을 추가로 포함한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 프로그램가능한 DNA-결합 단백질 (예를 들어, 제2 Cas9 단백질)을 (i) Cas9 효소 또는 도메인 (예를 들어, 제1 단백질); 및 (ii) 핵산-편집 효소 또는 도메인 (예를 들어, 제2 단백질)을 포함하는 융합 단백질에 융합시키는 것은 표적 핵산 서열에 대한 융합 단백질의 특이성을 개선시키는 데, 또는 정규 PAM (NGG) 서열을 함유하지 않는 표적 핵산 서열에 결합하는 융합 단백질의 특이성 또는 결합 친화도를 개선시키는 데 유용할 수 있다. 일부 실시양태에서, 제3 단백질은 Cas9 단백질 (예를 들어, 제2 Cas9 단백질)이다. 일부 실시양태에서, 제3 단백질은 본원에 제공된 Cas9 단백질 중 임의의 것이다. 일부 실시양태에서, 제3 단백질은 Cas9 단백질 (예를 들어, 제1 단백질)에 대한 융합 단백질 N-말단에 융합된다. 일부 실시양태에서, 제3 단백질은 Cas9 단백질 (예를 들어, 제1 단백질)에 대한 융합 단백질 C-말단에 융합된다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 제1 단백질) 및 제3 단백질 (예를 들어, 제2 Cas9 단백질)은 링커 (예를 들어, 제2 링커)를 통해 융합된다. 일부 실시양태에서, 링커는 (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), SGGS(GGS)n (서열식별번호: 612), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이다. 일부 실시양태에서, 본원에 제공된 예시적인 napDNAbp 융합 단백질의 일반적 아키텍처는 구조:
[NH2]-[핵산-편집 효소 또는 도메인]-[napDNAbp]-[제3 단백질]-[COOH];
[NH2]-[제3 단백질]-[napDNAbp]-[핵산-편집 효소 또는 도메인]-[COOH];
[NH2]-[napDNAbp]-[핵산-편집 효소 또는 도메인]-[제3 단백질]-[COOH];
[NH2]-[제3 단백질]-[핵산-편집 효소 또는 도메인]-[napDNAbp]-[COOH];
[NH2]-[UGI]-[핵산-편집 효소 또는 도메인]-[napDNAbp]-[제3 단백질]-[COOH];
[NH2]-[UGI]-[제3 단백질]-[napDNAbp]-[핵산-편집 효소 또는 도메인]-[COOH];
[NH2]-[UGI]-[napDNAbp]-[핵산-편집 효소 또는 도메인]-[제3 단백질]-[COOH];
[NH2]-[UGI]-[제3 단백질]-[핵산-편집 효소 또는 도메인]-[napDNAbp]-[COOH];
[NH2]-[핵산-편집 효소 또는 도메인]-[napDNAbp]-[제3 단백질]-[UGI]-[COOH];
[NH2]-[제3 단백질]-[napDNAbp]-[핵산-편집 효소 또는 도메인]-[UGI]-[COOH];
[NH2]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[제3 단백질]-[UGI]-[COOH];
[NH2]-[제3 단백질]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[UGI]-[COOH]; 또는
[NH2]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[제1 UGI 도메인]-[제2 UGI 도메인]-[COOH]
를 포함하며; 여기서 NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "]-["는 임의적인 링커 서열의 존재를 나타낸다. 다른 예에서, 본원에 제공된 예시적인 NapDNAbp 융합 단백질의 일반적 아키텍처는 구조:
[NH2]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[제2 NapDNAbp 단백질]-[COOH];
[NH2]-[제2 NapDNAbp 단백질]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[COOH];
[NH2]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[제2 NapDNAbp 단백질]-[COOH];
[NH2]-[제2 NapDNAbp 단백질]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[COOH];
[NH2]-[UGI]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[제2 NapDNAbp 단백질]-[COOH],
[NH2]-[UGI]-[제2 NapDNAbp 단백질]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[COOH];
[NH2]-[UGI]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[제2 NapDNAbp 단백질]-[COOH];
[NH2]-[UGI]-[제2 NapDNAbp 단백질]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[COOH];
[NH2]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[제2 NapDNAbp 단백질]-[UGI]-[COOH];
[NH2]-[제2 NapDNAbp 단백질]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[UGI]-[COOH];
[NH2]-[NapDNAbp]-[핵산-편집 효소 또는 도메인]-[제2 NapDNAbp 단백질]-[UGI]-[COOH]; 또는
[NH2]-[제2 NapDNAbp 단백질]-[핵산-편집 효소 또는 도메인]-[NapDNAbp]-[UGI]-[COOH]
를 포함하며; 여기서 NH2는 융합 단백질의 N-말단이고, COOH는 융합 단백질의 C-말단이다. 일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "]-["는 임의적인 링커 서열의 존재를 나타낸다. 일부 실시양태에서, 제2 NapDNAbp는 dCas9 단백질이다. 일부 예에서, 본원에 제공된 예시적인 Cas9 융합 단백질의 일반적 아키텍처는 도 3에 제시된 바와 같은 구조를 포함한다. 예시적인 Cas9 융합 단백질의 일반적 아키텍처 중 임의의 것에 제공된 단백질 중 임의의 것은 본원에 제공된 링커 중 1종 이상에 의해 연결될 수 있다는 것이 인지되어야 한다. 일부 실시양태에서, 링커는 동일하다. 일부 실시양태에서, 링커는 상이하다. 일부 실시양태에서, 예시적인 Cas9 융합 단백질의 일반적 아키텍처 중 임의의 것에 제공된 단백질 중 1종 이상은 링커를 통해 융합되지 않는다. 일부 실시양태에서, 융합 단백질은 핵 표적화 서열, 예를 들어 핵 국재화 서열을 추가로 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 제3 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 제3 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 핵산-편집 효소 또는 도메인의 N-말단에 융합된다. 일부 실시양태에서, NLS는 핵산-편집 효소 또는 도메인의 C-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 1종 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커 없이 융합 단백질에 융합된다.
우라실 글리코실라제 억제제 융합 단백질
본 개시내용의 일부 측면은 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질에 관한 것이다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 뉴클레아제 활성 Cas9 도메인, 뉴클레아제 불활성 dCas9 도메인, 또는 Cas9 니카제)을 포함하는 본원에 제공된 융합 단백질 중 임의의 것은 직접적으로 또는 링커를 통해 UGI 도메인에 추가로 융합될 수 있다. 본 개시내용의 일부 측면은 증가된 핵염기 편집 효율을 갖는 데아미나제-dCas9 융합 단백질, 데아미나제-뉴클레아제 활성 Cas9 융합 단백질 및 데아미나제-Cas9 니카제 융합 단백질을 제공한다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, U:G 헤테로듀플렉스 DNA의 존재에 대한 세포의 DNA-복구 반응은 세포에서의 핵염기 편집 효율의 감소의 원인이 될 수 있다. 예를 들어, 우라실 DNA 글리코실라제 (UDG)는 세포에서의 DNA로부터의 U의 제거를 촉매하며, 이는 염기 절제 복구를 개시할 수 있고, 가장 흔한 결과물로서 U:G 쌍의 C:G 쌍으로의 복귀를 갖는다. 하기 실시예에서 입증된 바와 같이, 우라실 DNA 글리코실라제 억제제 (UGI)는 인간 UDG 활성을 억제할 수 있다. 따라서, 본 개시내용은 UGI 도메인에 추가로 융합된 dCas9-핵산 편집 도메인을 포함하는 융합 단백질을 고려한다. 본 개시내용은 또한 UGI 도메인에 추가로 융합된 Cas9 니카제-핵산 편집 도메인을 포함하는 융합 단백질을 고려한다. UGI 도메인의 사용은 C에서 U로의 변화를 촉매할 수 있는 핵산 편집 도메인의 편집 효율을 증가시킬 수 있다는 것이 이해되어야 한다. 예를 들어, UGI 도메인을 포함하는 융합 단백질은 C 잔기를 탈아미노화하는 데 보다 효율적일 수 있다. 일부 실시양태에서, 융합 단백질은 구조:
[데아미나제]-[임의적인 링커 서열]-[dCas9]-[임의적인 링커 서열]-[UGI];
[데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[dCas9];
[UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[dCas9];
[UGI]-[임의적인 링커 서열]-[dCas9]-[임의적인 링커 서열]-[데아미나제];
[dCas9]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI];
[dCas9]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제];
[데아미나제]-[임의적인 링커 서열]-[dCas9]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI];
[데아미나제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[dCas9];
[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[dCas9];
[제1 UGI]-[임의적인 링커 서열]-[제2 UGi]-[임의적인 링커 서열]-[dCas9]-[임의적인 링커 서열]-[데아미나제];
[dCas9]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]; 또는
[dCas9]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[데아미나제]
를 포함한다.
다른 실시양태에서, 융합 단백질은 구조:
[데아미나제]-[임의적인 링커 서열]-[Cas9 니카제]-[임의적인 링커 서열]-[UGI];
[데아미나제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[Cas9 니카제];
[UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[Cas9 니카제];
[UGI]-[임의적인 링커 서열]-[Cas9 니카제]-[임의적인 링커 서열]-[데아미나제];
[Cas9 니카제]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[UGI];
[Cas9 니카제]-[임의적인 링커 서열]-[UGI]-[임의적인 링커 서열]-[데아미나제];
[데아미나제]-[임의적인 링커 서열]-[Cas9 니카제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI];
[데아미나제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[Cas9 니카제];
[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[Cas9 니카제];
[제1 UGI]-[임의적인 링커 서열]-[제2 UGi]-[임의적인 링커 서열]-[Cas9 니카제]-[임의적인 링커 서열]-[데아미나제];
[Cas9 니카제]-[임의적인 링커 서열]-[데아미나제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]; 또는
[Cas9 니카제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]-[임의적인 링커 서열]-[데아미나제]
를 포함한다.
상기 기재된 융합 단백질 중 임의의 것은 (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp); (ii) 시티딘 데아미나제 도메인; 및 (iii) 2개 이상의 UGI 도메인으로 구성될 수 있으며, 여기서 2개 이상의 UGI 도메인은 구축물에서 서로 인접할 수 있거나 (예를 들어, [제1 UGI]-[제2 UGI], 여기서 "-"는 임의적인 링커임), 또는 2개 이상의 UGI 도메인은 (i)의 napDNAbp 및/또는 (ii)의 시티딘 데아미나제 도메인에 의해 분리될 수 있다는 것 (예를 들어, [제1 UGI]-[데아미나제]-[제2 UGI], [제1 UGI]-[napDNAbp]-[제2 UGI], [제1 UGI]-[데아미나제]-[napDNAbp]-[제2 UGI] 등, 여기서 "-"는 임의적인 링커임)이 인지되어야 한다.
또 다른 측면에서, 융합 단백질은 (i) Cas9 효소 또는 도메인; (ii) 핵산-편집 효소 또는 도메인 (예를 들어, 제2 단백질) (예를 들어, 시티딘 데아미나제 도메인); (iii) 제1 우라실 글리코실라제 억제제 도메인 (UGI) (예를 들어, 제3 단백질); 및 (iv) 제2 우라실 글리코실라제 억제제 도메인 (UGI) (예를 들어, 제4 단백질)을 포함한다. 제1 및 제2 우라실 글리코실라제 억제제 도메인 (UGI)은 동일하거나 상이할 수 있다. 일부 실시양태에서, Cas9 도메인 (예를 들어, 제1 단백질) 및 데아미나제 (예를 들어, 제2 단백질)는 링커를 통해 융합된다. 일부 실시양태에서, Cas9 도메인은 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, Cas9 단백질 (예를 들어, 제1 단백질) 및 제1 UGI 도메인 (예를 들어, 제3 단백질)은 링커 (예를 들어, 제2 링커)를 통해 융합된다. 일부 실시양태에서, 제1 UGI 도메인은 Cas9 단백질의 C-말단에 융합된다. 일부 실시양태에서, 제1 UGI 도메인 (예를 들어, 제3 단백질) 및 제2 UGI 도메인 (예를 들어, 제4 단백질)은 링커 (예를 들어, 제3 링커)를 통해 융합된다. 일부 실시양태에서, 제2 UGI 도메인은 제1 UGI 도메인의 C-말단에 융합된다. 일부 실시양태에서, 링커는 (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), SGGS(GGS)n (서열식별번호: 612), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605) 또는 (XP)n (서열식별번호: 611) 모티프 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이다. 일부 실시양태에서, 제1 링커는 1-50개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 1-40개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 1-35개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 1-30개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 1-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 10-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 30-40개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 14, 16 또는 18개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 16개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 30, 32 또는 34개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 32개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제1 링커는 SGSETPGTSESATPES (서열식별번호: 604) 모티프를 포함한다. 일부 실시양태에서, 제1 링커는 SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605) 모티프를 포함한다. 일부 실시양태에서, 제2 링커는 1-50개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 1-40개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 1-35개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 1-30개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 1-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 2-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 2-10개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 10-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 2, 4 또는 6개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 7, 9 또는 11개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 14, 16 또는 18개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 4개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 9개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 16개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제2 링커는 (SGGS)n (서열식별번호: 606) 모티프를 포함하며, 여기서 n은 1 내지 30 (양끝값 포함)의 정수이다. 일부 실시양태에서, 제2 링커는 (SGGS)n (서열식별번호: 606) 모티프를 포함하며, 여기서 n은 1이다. 일부 실시양태에서, 제2 링커는 SGGS(GGS)n (서열식별번호: 612) 모티프를 포함하며, 여기서 n은 1 내지 30 (양끝값 포함)의 정수이다. 일부 실시양태에서, 제2 링커는 SGGS(GGS)n (서열식별번호: 612) 모티프를 포함하며, 여기서 n은 2이다. 일부 실시양태에서, 제3 링커는 포함하고 1-50개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 1-40개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 1-35개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 1-30개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 1-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 2-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 2-10개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 10-20개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 2, 4 또는 6개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 7, 9 또는 11개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 14, 16 또는 18개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 4개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 9개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 16개 아미노산의 아미노산 서열을 포함한다. 일부 실시양태에서, 제3 링커는 (SGGS)n (서열식별번호: 606) 모티프를 포함하며, 여기서 n은 1 내지 30 (양끝값 포함)의 정수이다. 일부 실시양태에서, 제3 링커는 (SGGS)n (서열식별번호: 606) 모티프를 포함하며, 여기서 n은 1이다. 일부 실시양태에서, 제3 링커는 SGGS(GGS)n (서열식별번호: 612) 모티프를 포함하며, 여기서 n은 1 내지 30 (양끝값 포함)의 정수이다. 일부 실시양태에서, 제3 링커는 SGGS(GGS)n (서열식별번호: 612) 모티프를 포함하며, 여기서 n은 2이다.
일부 실시양태에서, 융합 단백질은 하기 구조:
[데아미나제]-[임의적인 링커 서열]-[dCas9]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI];
[데아미나제]-[임의적인 링커 서열]-[Cas9 니카제]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]; 또는
[데아미나제]-[임의적인 링커 서열]-[Cas9]-[임의적인 링커 서열]-[제1 UGI]-[임의적인 링커 서열]-[제2 UGI]
를 포함한다.
또 다른 측면에서, 융합 단백질은 (i) Cas9 효소 또는 도메인; (ii) 핵산-편집 효소 또는 도메인 (예를 들어, 제2 단백질) (예를 들어, 시티딘 데아미나제 도메인); (iii) 2개 초과의 우라실 글리코실라제 억제제 (UGI) 도메인을 포함한다.
일부 실시양태에서, 본원에 제공된 융합 단백질은 링커 서열을 포함하지 않는다. 일부 실시양태에서, 임의적인 링커 서열 중 하나 또는 둘 다가 존재한다. 일부 실시양태에서, 임의적인 링커 서열 중 1, 2, 또는 3개가 존재한다.
일부 실시양태에서, 상기 일반적 아키텍처에 사용된 "-"는 임의적인 링커 서열의 존재를 나타낸다. 일부 실시양태에서, UGI를 포함하는 융합 단백질은 핵 표적화 서열, 예를 들어 핵 국재화 서열을 추가로 포함한다. 일부 실시양태에서, 본원에 제공된 융합 단백질은 핵 국재화 서열 (NLS)을 추가로 포함한다. 일부 실시양태에서, NLS는 융합 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 융합 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 UGI 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질의 N-말단에 융합된다. 일부 실시양태에서, NLS는 Cas9 단백질의 C-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 N-말단에 융합된다. 일부 실시양태에서, NLS는 데아미나제의 C-말단에 융합된다. 일부 실시양태에서, NLS는 제2 Cas9의 N-말단에 융합된다. 일부 실시양태에서, NLS는 제2 Cas9의 C-말단에 융합된다. 일부 실시양태에서, NLS는 1종 이상의 링커를 통해 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 링커 없이 융합 단백질에 융합된다. 일부 실시양태에서, NLS는 본원에 제공되거나 언급된 NLS 서열 중 어느 하나의 아미노산 서열을 포함한다. 일부 실시양태에서, NLS는 서열식별번호: 614 또는 서열식별번호: 615에 제시된 바와 같은 아미노산 서열을 포함한다.
일부 실시양태에서, UGI 도메인은 야생형 UGI 또는 서열식별번호: 134에 제시된 바와 같은 UGI를 포함한다. 일부 실시양태에서, 본원에 제공된 UGI 단백질은 UGI의 단편 및 UGI 또는 UGI 단편에 상동인 단백질을 포함한다. 예를 들어, 일부 실시양태에서, UGI 도메인은 서열식별번호: 134에 제시된 아미노산 서열의 단편을 포함한다. 일부 실시양태에서, UGI 단편은 서열식별번호: 134에 제시된 바와 같은 아미노산 서열의 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.5%를 포함하는 아미노산 서열을 포함한다. 일부 실시양태에서, UGI는 서열식별번호: 134에 제시된 아미노산 서열에 상동인 아미노산 서열 또는 서열식별번호: 134에 제시된 아미노산 서열의 단편에 상동인 아미노산 서열을 포함한다. 일부 실시양태에서, UGI 또는 UGI의 단편 또는 UGI 또는 UGI 단편의 상동체를 포함하는 단백질은 "UGI 변이체"로 지칭된다. UGI 변이체는 UGI, 또는 그의 단편과 상동성을 공유한다. 예를 들어 UGI 변이체는 야생형 UGI 또는 서열식별번호: 134에 제시된 바와 같은 UGI와 적어도 70% 동일하거나, 적어도 75% 동일하거나, 적어도 80% 동일하거나, 적어도 85% 동일하거나, 적어도 90% 동일하거나, 적어도 95% 동일하거나, 적어도 96% 동일하거나, 적어도 97% 동일하거나, 적어도 98% 동일하거나, 적어도 99% 동일하거나, 적어도 99.5% 동일하거나, 적어도 99.9% 동일하다. 일부 실시양태에서, UGI 변이체는 단편이 야생형 UGI 또는 서열식별번호: 134에 제시된 바와 같은 UGI의 상응하는 단편과 적어도 70% 동일하거나, 적어도 80% 동일하거나, 적어도 90% 동일하거나, 적어도 95% 동일하거나, 적어도 96% 동일하거나, 적어도 97% 동일하거나, 적어도 98% 동일하거나, 적어도 99% 동일하거나, 적어도 99.5% 동일하거나, 적어도 99.9% 동일하도록 UGI의 단편을 포함한다. 일부 실시양태에서, UGI는 하기 아미노산 서열을 포함한다:
>sp|P14739|UNGI_BPPB2 우라실-DNA 글리코실라제 억제제
적합한 UGI 단백질 및 뉴클레오티드 서열은 본원에 제공되며, 추가의 적합한 UGI 서열은 관련 기술분야의 통상의 기술자에게 공지되어 있고, 예를 들어, 문헌 [Wang et al., Uracil-DNA glycosylase inhibitor gene of bacteriophage PBS2 encodes a binding protein specific for uracil-DNA glycosylase. J. Biol. Chem. 264:1163-1171(1989); Lundquist et al., Site-directed mutagenesis and characterization of uracil-DNA glycosylase inhibitor protein. Role of specific carboxylic amino acids in complex formation with Escherichia coli uracil-DNA glycosylase. J. Biol. Chem. 272:21408-21419(1997); Ravishankar et al., X-ray analysis of a complex of Escherichia coli uracil DNA glycosylase (EcUDG) with a proteinaceous inhibitor. The structure elucidation of a prokaryotic UDG. Nucleic Acids Res. 26:4880-4887(1998); 및 Putnam et al., Protein mimicry of DNA from crystal structures of the uracil-DNA glycosylase inhibitor protein and its complex with Escherichia coli uracil-DNA glycosylase. J. Mol. Biol. 287:331-346(1999)]에 공개된 것들을 포함하며, 각각의 전체 내용은 본원에 참조로 포함된다.
추가의 단백질은 우라실 글리코실라제 억제제일 수 있다는 것이 인지되어야 한다. 예를 들어, 우라실-DNA 글리코실라제 염기-절제 복구 효소를 억제할 (예를 들어, 입체적으로 차단할) 수 있는 다른 단백질은 본 개시내용의 범주 내에 있다. 추가적으로, 염기-절제 복구를 차단하거나 억제하는 임의의 단백질은 또한 본 개시내용의 범주 내에 있다. 일부 실시양태에서, 본원에 기재된 융합 단백질은 1개의 UGI 도메인을 포함한다. 일부 실시양태에서, 본원에 기재된 융합 단백질은 1개 초과의 UGI 도메인을 포함한다. 일부 실시양태에서, 본원에 기재된 융합 단백질은 2개의 UGI 도메인을 포함한다. 일부 실시양태에서, 본원에 기재된 융합 단백질은 2개 초과의 UGI 도메인을 포함한다. 일부 실시양태에서, DNA에 결합하는 단백질이 사용된다. 또 다른 실시양태에서, UGI에 대한 치환이 사용된다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 단일-가닥 DNA에 결합하는 단백질이다. 예를 들어, 우라실 글리코실라제 억제제는 에르위니아 타스마니엔시스(Erwinia tasmaniensis) 단일-가닥 결합 단백질일 수 있다. 일부 실시양태에서, 단일-가닥 결합 단백질은 아미노산 서열 (서열식별번호: 135)을 포함한다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 우라실에 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA에서 우라실에 결합하는 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 DNA로부터 우라실을 절제하지 않는 촉매적으로 불활성인 우라실 DNA-글리코실라제 단백질이다. 예를 들어, 우라실 글리코실라제 억제제는 UdgX이다. 일부 실시양태에서, UdgX는 아미노산 서열 (서열식별번호: 136)을 포함한다. 또 다른 예로서, 우라실 글리코실라제 억제제는 촉매적으로 불활성인 UDG이다. 일부 실시양태에서, 촉매적으로 불활성인 UDG는 아미노산 서열 (서열식별번호: 137)을 포함한다. 다른 우라실 글리코실라제 억제제는 통상의 기술자에게 명백할 것이며, 본 개시내용의 범위 내에 있다는 것이 인지되어야 한다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 서열식별번호: 135-137 또는 143-148 중 어느 하나와 상동인 단백질이다. 일부 실시양태에서, 우라실 글리코실라제 억제제는 서열식별번호: 135-137 또는 143-148 중 어느 하나와 적어도 50% 동일하거나, 적어도 55% 동일하거나, 적어도 60% 동일하거나, 적어도 65% 동일하거나, 적어도 70% 동일하거나, 적어도 75% 동일하거나, 적어도 80% 동일하거나, 적어도 85% 동일하거나, 적어도 90% 동일하거나, 적어도 95% 동일하거나, 적어도 96% 동일하거나, 적어도 98% 동일하거나, 적어도 99% 동일하거나, 적어도 99.5% 동일한 단백질이다.
에르위니아 타스마니엔시스 SSB (열안정성 단일-가닥 DNA 결합 단백질)
UdgX (DNA에서 우라실에 결합하지만 절제하지 않음)
UDG (촉매적으로 불활성인 인간 UDG, DNA에서 우라실에 결합하지만, 절제하지 않음)
UGI로서 사용될 수 있는 추가의 단일-가닥 DNA 결합 단백질이 하기 제시된다. 다른 단일-가닥 결합 단백질, 예를 들어 전체 내용이 본원에 참조로 포함된 문헌 [Dickey TH, Altschuler SE, Wuttke DS. Single-stranded DNA-binding proteins:multiple domains for multiple functions. Structure. 2013 Jul 2;21(7):1074-84. doi: 10.1016/j.str.2013.05.013. Review.; Marceau AH. Functions of single-strand DNA-binding proteins in DNA replication, recombination, and repair. Methods Mol Biol. 2012;922:1-21. doi: 10.1007/978-1-62703-032-8_1.; Mijakovic, Ivan, et al.; Bacterial single-stranded DNA-binding proteins are phosphorylated on tyrosine. Nucleic Acids Res 2006; 34 (5): 1588-1596. doi: 10.1093/nar/gkj514; Mumtsidu E, Makhov AM, Konarev PV, Svergun DI, Griffith JD, Tucker PA. Structural features of the single-stranded DNA-binding protein of Epstein-Barrvirus. J Struct Biol. 2008 Feb;161(2):172-87. Epub 2007 Nov 1; Nowak M, Olszewski M, Spibida M, Kur J. Characterization of single-strandedDNA-binding proteins from the psychrophilic bacteria Desulfotalea psychrophila, Flavobacterium psychrophilum, Psychrobacter arcticus, Psychrobactercryohalolentis, Psychromonas ingrahamii, Psychroflexus torquis, and Photobacterium profundum. BMC Microbiol. 2014 Apr 14;14:91. doi: 10.1186/1471-2180-14-91; Tone T, Takeuchi A, Makino O. Single-stranded DNA binding protein Gp5 of Bacillus subtilis phage Φ29 is required for viral DNA replication in growth-temperature dependent fashion. Biosci Biotechnol Biochem. 2012;76(12):2351-3. Epub 2012 Dec 7; Wold. REPLICATION PROTEIN A:A Heterotrimeric, Single-Stranded DNA-Binding Protein Required for Eukaryotic DNA Metabolism. Annual Review of Biochem. 1997; 66:61-92. doi: 10.1146/annurev.biochem.66.1.61; Wu Y, Lu J, Kang T. Human single-stranded DNA binding proteins: guardians of genome stability. Acta Biochim Biophys Sin (Shanghai). 2016 Jul;48(7):671-7. doi: 10.1093/abbs/gmw044. Epub 2016 May 23. Review]에 기재된 것들이 UGI로서 사용될 수 있다는 것이 인지되어야 한다.
mtSSB - SSBP1 단일 가닥 DNA 결합 단백질 1 [ 호모 사피엔스 (인간) ] (유니프롯KB: Q04837; NP_001243439.1)
단일-가닥 DNA 결합 단백질 3 이소형 A [무스 무스쿨루스] (유니프롯KB - Q9D032-1; NCBI Ref: NP_076161.2)
RPA 1 - 복제 단백질 A 70 kDa DNA 결합 서브유닛 (유니프롯KB: P27694; NCBI Ref: NM_002945.3)
RPA 2 - 복제 단백질 A 32 kDa 서브유닛 (유니프롯KB: P15927; NCBI Ref: NM_002946)
RPA 3 - 복제 단백질 A 14 kDa 서브유닛 (유니프롯KB: P35244; NCBI Ref: NM_002947.4)
박테리아 단일-가닥 DNA 결합 단백질:
ssbA - 단일-가닥 DNA-결합 단백질 [바실루스 서브틸리스 아종 서브틸리스 균주 168] (유니프롯KB: P37455; NCBI Ref: )
단일-가닥 DNA 결합 단백질 2 [스트렙토미세스 코엘리콜로르 A3(2)] (유니프롯KB: Q9X8U3; NCBI Ref: NP_628093.1)
단일-가닥 DNA 결합 단백질 [스트렙토코쿠스 뉴모니아에 R6] (유니프롯KB: P66855; NCBI Ref: NP_358988.1)
바이러스 단일-가닥 DNA 결합 단백질:
단일-가닥 DNA 결합 단백질 [인간 알파헤르페스바이러스 1] (유니프롯KB: P04296; NCBI Ref: YP_009137104.1)
바실루스 바이러스 phi29로부터의 단일-가닥 DNA 결합 단백질 (유니프롯KB: Q38504.1; NCBI Ref: YP_002004532.1)
단일 가닥 DNA 결합 단백질 [부르크홀데리아 바이러스 DC1] (유니프롯KB: I6NRL7; NCBI Ref: YP_006589943.1)
일부 실시양태에서, 핵산 편집 도메인은 데아미나제 도메인이다. 일부 실시양태에서, 데아미나제는 시토신 데아미나제 또는 시티딘 데아미나제이다. 일부 실시양태에서, 데아미나제는 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC1 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC2 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3A 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3B 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3C 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3D 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3E 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3F 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3G 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC3H 데아미나제이다. 일부 실시양태에서, 데아미나제는 APOBEC4 데아미나제이다. 일부 실시양태에서, 데아미나제는 활성화-유도된 데아미나제 (AID)이다. 일부 실시양태에서, 데아미나제는 래트 APOBEC1 (서열식별번호: 74)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC1 (서열식별번호: 76)이다. 일부 실시양태에서, 데아미나제는 페트로미존 마리누스 시티딘 데아미나제 1 (pmCDA1)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G (서열식별번호: 60)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G의 단편 (서열식별번호: 83)이다. 일부 실시양태에서, 데아미나제는 D316R_D317R 돌연변이를 포함하는 인간 APOBEC3G 변이체 (서열식별번호: 82)이다. 일부 실시양태에서, 데아미나제는 인간 APOBEC3G 및 서열식별번호: 60에서의 D316R_D317R 돌연변이에 상응하는 돌연변이를 포함하는 단편 (서열식별번호: 84)이다.
일부 실시양태에서, 링커는 (GGGS)n (서열식별번호: 613), (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), SGSETPGTSESATPES (서열식별번호: 604), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 이들 중 임의의 것의 조합을 포함하며, 여기서 n은 독립적으로 1 내지 30의 정수이다.
적합한 UGI 단백질 및 뉴클레오티드 서열은 본원에 제공되며, 추가의 적합한 UGI 서열은 관련 기술분야의 통상의 기술자에게 공지되어 있고, 예를 들어, 문헌 [Wang et al., Uracil-DNA glycosylase inhibitor gene of bacteriophage PBS2 encodes a binding protein specific for uracil-DNA glycosylase. J. Biol. Chem. 264:1163-1171(1989)]; [Lundquist et al., Site-directed mutagenesis and characterization of uracil-DNA glycosylase inhibitor protein. Role of specific carboxylic amino acids in complex formation with Escherichia coli uracil-DNA glycosylase. J. Biol. Chem. 272:21408-21419(1997)]; [Ravishankar et al., X-ray analysis of a complex of Escherichia coli uracil DNA glycosylase (EcUDG) with a proteinaceous inhibitor. The structure elucidation of a prokaryotic UDG. Nucleic Acids Res. 26:4880-4887(1998)]; 및 [Putnam et al., Protein mimicry of DNA from crystal structures of the uracil-DNA glycosylase inhibitor protein and its complex with Escherichia coli uracil-DNA glycosylase. J. Mol. Biol. 287:331-346(1999)]에 공개된 것들을 포함하며, 그의 전체 내용은 본원에 참조로 포함된다. 일부 실시양태에서, 임의적 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9, 19, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20이다. 일부 실시양태에서, 임의적 링커는 (GGS)n (서열식별번호: 610) 모티프를 포함하며, 여기서 n은 1, 3, 또는 7이다. 일부 실시양태에서, 임의적 링커는 아미노산 서열 SGSETPGTSESATPES (서열식별번호: 604)를 포함하며, 이는 또한 실시예에서 XTEN 링커로 지칭된다.
일부 실시양태에서, Cas9 니카제는 그의 게놈이 생체내에서 편집되는 유기체에서 비-편집된 가닥 상의 염기의 제거를 추가로 용이하게 할 수 있다. 본원에 기재된 바와 같이 Cas9 니카제는 서열식별번호: 6에서의 D10A 돌연변이, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이를 포함할 수 있다. 일부 실시양태에서, 본 개시내용의 Cas9 니카제는 서열식별번호: 6의 돌연변이 840, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 잔기에 히스티딘을 포함할 수 있다. Cas9 니카제를 포함하는 이러한 융합 단백질은 표적 DNA 서열의 단일 가닥, 예를 들어, 편집되지 않는 가닥을 절단할 수 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 이 절단은 데아미나제에 의해 생성된 C에서 U로의 편집을 역전시키는 미스-매치 복구 매커니즘을 억제할 수 있다.
가이드 RNA와의 Cas9 복합체
본 개시내용의 일부 측면은 본원에 제공된 융합 단백질 중 임의의 것, 및 융합 단백질의 Cas9 도메인 (예를 들어, dCas9, 뉴클레아제 활성 Cas9, 또는 Cas9 니카제)에 결합된 가이드 RNA를 포함하는 복합체를 제공한다.
일부 실시양태에서, 가이드 RNA는 15 내지 100개 뉴클레오티드 길이이고, 표적 서열에 상보적인 적어도 10개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 실시양태에서, 가이드 RNA는 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개 뉴클레오티드 길이이다. 일부 실시양태에서, 가이드 RNA는 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 인접한 뉴클레오티드의 서열을 포함한다. 일부 실시양태에서, 표적 서열은 DNA 서열이다. 일부 실시양태에서, 표적 서열은 포유동물의 게놈에서의 서열이다. 일부 실시양태에서, 표적 서열은 인간의 게놈에서의 서열이다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접한다. 일부 실시양태에서, 가이드 RNA는 질환 또는 장애와 연관된 서열에 상보적이다.
Cas9 융합 단백질을 사용하는 방법
본 개시내용의 일부 측면은 본원에 제공된 Cas9 단백질, 융합 단백질, 또는 복합체를 사용하는 방법을 제공한다. 예를 들어, 본 개시내용의 일부 측면은 DNA 분자를 (a) 본원에 제공된 Cas9 단백질 또는 융합 단백질과, 및 적어도 1종의 가이드 RNA와 (여기서, 가이드 RNA는 약 15 내지 100개 뉴클레오티드 길이이고, 표적 서열에 상보적인 적어도 10개의 인접한 뉴클레오티드의 서열을 포함함); 또는 (b) 본원에 제공된 바와 같은 Cas9 단백질, Cas9 융합 단백질, 또는 적어도 1종의 gRNA를 갖는 Cas9 단백질 또는 융합 단백질 복합체와 접촉시키는 단계를 포함하는 방법을 제공한다. 일부 실시양태에서, 표적 서열의 3' 말단은 정규 PAM 서열 (NGG)에 바로 인접하지 않는다. 일부 실시양태에서, 표적 서열의 3' 말단은 AGC, GAG, TTT, GTG, 또는 CAA 서열에 바로 인접한다.
일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 서열을 포함한다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 점 돌연변이를 포함한다. 일부 실시양태에서, Cas9 단백질, Cas9 융합 단백질, 또는 복합체의 활성은 점 돌연변이의 교정을 발생시킨다. 일부 실시양태에서, 표적 DNA 서열은 질환 또는 장애와 연관된 T→C 점 돌연변이를 포함하고, 여기서, 돌연변이체 C 염기의 탈아미노화는 질환 또는 장애와 연관되지 않은 서열을 발생시킨다. 일부 실시양태에서, 표적 DNA 서열은 단백질을 코딩하고, 여기서, 점 돌연변이는 코돈에 있으며, 야생형 코돈에 비해 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 발생시킨다. 일부 실시양태에서, 돌연변이체 C의 탈아미노화는 돌연변이체 코돈에 의해 코딩되는 아미노산의 변화를 발생시킨다. 일부 실시양태에서, 돌연변이체 C의 탈아미노화는 야생형 아미노산을 코딩하는 코돈을 발생시킨다. 일부 실시양태에서, 접촉은 대상체의 생체내에서 이루어진다. 일부 실시양태에서, 대상체는 질환 또는 장애를 갖거나, 이로 진단되었다. 일부 실시양태에서, 질환 또는 장애는 낭성 섬유증, 페닐케톤뇨, 표피박리성 과다각화증 (EHK), 샤르코-마리-투스병 유형 4J, 신경모세포종 (NB), 폰 빌레브란트병 (vWD), 선천성 근긴장증, 유전성 신장 아밀로이드증, 확장성 심근병증 (DCM), 유전성 림프부종, 가족성 알츠하이머병, HIV, 프리온 질환, 만성 영아 신경학적 피부 관절 증후군 (CINCA), 데스민-관련 근병증 (DRM), 돌연변이체 PI3KCA 단백질, 돌연변이체 CTNNB1 단백질, 돌연변이체 HRAS 단백질, 또는 돌연변이체 p53 단백질과 연관된 신생물성 질환이다.
일부 실시양태는 본원에 제공된 Cas9 DNA 편집 융합 단백질을 사용하는 방법을 제공한다. 일부 실시양태에서, 융합 단백질은 표적 핵염기, 예를 들어, C 잔기를 탈아미노화함으로써 점 돌연변이를 핵산 내로 도입하는 데 사용된다. 일부 실시양태에서, 표적 핵염기의 탈아미노화는 유전적 결함의 교정, 예를 들어, 유전자 생성물에서의 기능의 상실을 발생시키는 점 돌연변이의 교정을 발생시킨다. 일부 실시양태에서, 유전적 결함은 질환 또는 장애, 예를 들어, 리소솜 축적 장애 또는 대사 질환, 예컨대, 예를 들어, 유형 I 당뇨병과 연관된다. 일부 실시양태에서, 본원에 제공된 방법은 탈활성화 점 돌연변이를 질환 또는 장애와 연관된 유전자 생성물을 코딩하는 유전자 또는 대립유전자 내로 도입하는 데 사용된다. 예를 들어, 일부 실시양태에서, (예를 들어, 증식성 질환의 치료에서) Cas9 DNA 편집 융합 단백질을 사용하여 탈활성화 점 돌연변이를 종양유전자 내로 도입하는 방법이 본원에 제공된다. 탈활성화 돌연변이는 일부 실시양태에서, 코딩 서열에서의 조기 정지 코돈을 생성할 수 있으며, 이는 말단절단된 유전자 산물, 예를 들어, 전장 단백질의 기능이 결여된 말단절단된 단백질의 발현을 발생시킨다.
일부 실시양태에서, 본원에 제공된 방법의 목적은 게놈 편집을 통해 기능이상 유전자의 기능을 복원하는 것이다. 본원에 제공된 Cas9 데아미나제 융합 단백질은 예를 들어, 인간 세포 배양물에서 질환-연관된 돌연변이를 교정함으로써, 시험관내에서 유전자 편집-기반 인간 치료제에 대해 확인될 수 있다. 본원에 제공된 융합 단백질, 예를 들어, Cas9 도메인 및 핵산 데아미나제 도메인을 포함하는 융합 단백질은 임의의 단일 점 T -> C 또는 A -> G 돌연변이를 교정하는 데 사용될 수 있다는 것이 통상의 기술자에 의해 이해될 것이다. 첫번째 경우, 돌연변이체 C에서 다시 U로의 탈아미노화는 돌연변이를 교정하고, 후자의 경우, 돌연변이체 G와 염기-쌍형성된 C의 탈아미노화, 그 후 반복 라운드는 돌연변이를 교정한다.
제공된 융합 단백질에 의해 시험관내에서 또는 생체내에서 교정될 수 있는 예시적인 질환-관련 돌연변이는 PI3KCA 단백질에서의 H1047R (A3140G) 다형성이다. 포스포이노시티드-3-키나제, 즉, 촉매 알파 서브유닛 (PI3KCA) 단백질은 포스파티딜이노시톨의 이노시톨 고리의 3-OH 기를 인산화하는 작용을 한다. PI3KCA 유전자는 많은 상이한 암종에서 돌연변이되는 것으로 밝혀졌으며, 따라서 이는 강력한 종양유전자인 것으로 간주된다.37 사실, A3140G 돌연변이는 몇몇 NCI-60 암 세포주, 예컨대, 예를 들어, HCT116, SKOV3, 및 T47D 세포주에 존재하며, 이들은 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (ATCC)으로부터 용이하게 입수가능하다.38
일부 실시양태에서, 교정되는 돌연변이를 운반하는 세포, 예를 들어, PI3KCA 유전자의 엑손 20에서 점 돌연변이, 예를 들어, A3140G 점 돌연변이를 운반하는 세포 (PI3KCA 단백질에서의 H1047R 치환을 발생시킴)는 Cas9 데아미나제 융합 단백질 및 융합 단백질을 표적화하는 적절하게 설계된 sgRNA를 코딩 PI3KCA 유전자에서의 각각의 돌연변이 부위에 코딩하는 발현 구축물과 접촉된다. sgRNA가 융합 효소를 PI3KCA 유전자 내에 있는 비-C 잔기에 표적화하도록 설계된 대조 실험이 수행될 수 있다. 처리된 세포의 게놈 DNA를 추출하고, PI3KCA 유전자의 관련 서열을 PCR 증폭시키고, 서열분석하여 인간 세포 배양물에서의 융합 단백질의 활성을 평가할 수 있다.
PI3KCA에서의 점 돌연변이를 교정하는 실시예는 예시 목적으로 제공되며, 본 개시내용을 제한하는 것을 의미하지 않는 것으로 이해될 것이다. 통상의 기술자는 본원에 개시된 DNA-편집 융합 단백질이 다른 점 돌연변이 및 다른 암과, 및 다른 증식성 질환을 포함한 암 이외의 질환과 연관된 돌연변이를 교정하는 데 사용될 수 있다는 것을 이해할 것이다.
질환-연관된 유전자 및 대립유전자에서의 점 돌연변이의 성공적인 교정은 치료제 및 기본적 연구에서의 적용과 함께 유전자 교정을 위한 새로운 전략을 열고 있다. Cas9 및 데아미나제 효소 또는 도메인의 개시된 융합물과 같은 부위-특이적 단일-염기 변형 시스템은 또한 "역" 유전자 요법에서의 적용을 가지며, 여기서, 특정 유전자 기능은 고의로 억제되거나 폐지된다. 이들 경우에, Trp (TGG), Gln (CAA 및 CAG), 또는 Arg (CGA) 잔기를 조기 정지 코돈 (TAA, TAG, TGA)으로 부위-특이적으로 돌연변이시키는 것은 시험관내에서, 생체외에서, 또는 생체내에서 단백질 기능을 폐지하는 데 사용될 수 있다.
본 개시내용은 본원에 제공된 Cas9 DNA 편집 융합 단백질에 의해 교정될 수 있는 점 돌연변이와 연관되거나 그에 의해 유발되는 질환으로 진단된 대상체의 치료 방법을 제공한다. 예를 들어, 일부 실시양태에서, 이러한 질환, 예를 들어, 상기 기재된 바와 같은 PI3KCA 점 돌연변이와 연관된 암을 갖는 대상체에게, 점 돌연변이를 교정하거나, 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입하는 Cas9 데아미나제 융합 단백질의 유효량을 투여하는 단계를 포함하는 방법이 제공된다. 일부 실시양태에서, 질환은 증식성 질환이다. 일부 실시양태에서, 질환은 유전 질환이다. 일부 실시양태에서, 질환은 신생물성 질환이다. 일부 실시양태에서, 질환은 대사 질환이다. 일부 실시양태에서, 질환은 리소솜 축적 질환이다. 점 돌연변이를 교정하거나, 탈활성화 돌연변이를 질환-연관된 유전자 내로 도입함으로써 치료될 수 있는 다른 질환은 관련 기술분야의 통상의 기술자에게 공지되어 있을 것이며, 본 개시내용은 이와 관련하여 제한되지 않는다.
본 개시내용은 추가의 질환 또는 장애, 예를 들어, 데아미나제-매개된 유전자 편집에 의해 교정될 수 있는 점 돌연변이와 연관되거나 그에 의해 유발되는 질환 또는 장애의 치료 방법을 제공한다. 일부 이러한 질환은 본원에 기재되어 있으며, 본원에 제공된 전략 및 융합 단백질로 치료될 수 있는 추가의 적합한 질환은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 예시적인 적합한 질환 및 장애는 하기에 열거된다. 각각의 서열에서의 특정 위치 또는 잔기의 넘버링은 특정한 단백질 및 사용되는 넘버링 스킴에 따라 달라지는 것으로 이해될 것이다. 넘버링은 예를 들어, 성숙 단백질의 전구체 및 성숙 단백질 그 자체에서 상이할 수 있으며, 종에서 종까지의 서열의 차이는 넘버링에 영향을 미칠 수 있다. 관련 기술분야이 통상의 기술자는 관련 기술분야에 널리 공지된 방법에 의해, 예를 들어 서열 정렬 및 상동 잔기의 측정에 의해 임의의 상동 단백질에서 및 각각의 코딩 핵산에서 각각의 잔기를 확인할 수 있을 것이다. 예시적인 적합한 질환 및 장애로는 비제한적으로 낭성 섬유증 (예를 들어, 문헌 [Schwank et al., Functional repair of CFTR by CRISPR/Cas9 in intestinal stem cell organoids of cystic fibrosis patients. Cell stem cell. 2013; 13: 653-658; 및 Wu et al., Correction of a genetic disease in mouse via use of CRISPR-Cas9. Cell stem cell. 2013; 13: 659-662] 참조, 이들 중 어느 것도 유전적 결한다는 것을 교정하기 위해 데아미나제 융합 단백질을 사용하지 않음); 페닐케톤뇨 - 예를 들어, 페닐알라닌 히드록실라제 유전자에서의 위치 835 (마우스) 또는 240 (인간) 또는 상동 잔기에서 페닐알라닌에서 세린으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [McDonald et al., Genomics. 1997; 39:402-405] 참조; 버나드-술리에 증후군 (BSS) - 예를 들어, 혈소판 막 당단백질 IX에서의 위치 55 또는 상동 잔기에서 페닐알라닌에서 세린으로의 돌연변이, 또는 잔기 24 또는 상동 잔기에서 시스테인에서 아르기닌으로의 (T>C 돌연변이) - 예를 들어, 문헌 [Noris et al., British Journal of Haematology. 1997; 97: 312-320, 및 Ali et al., Hematol. 2014; 93: 381-384] 참조; 표피박리성 과다각화증 (EHK) - 예를 들어, 케라틴 1에서의 위치 160 또는 161 (개시제 메티오닌을 카운팅하는 경우) 또는 상동 잔기에서 류신에서 프롤린으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Chipev et al., Cell. 1992; 70: 821-828] 참조, 또한 www[dot]uniprot[dot]org에서 유니프롯 데이터베이스에서 수탁 번호 P04264 참조; 만성 폐쇄성 폐 질환 (COPD) - 예를 들어, α1-항티로신의 프로세싱된 형태에서의 위치 54 또는 55 (개시제 메티오닌을 카운팅하는 경우) 또는 상동 잔기에서, 또는 비프로세싱된 형태에서의 잔기 78 또는 상동 잔기에서 류신에서 프롤린으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Poller et al., Genomics. 1993; 17: 740-743] 참조, 또한 유니프롯 데이터베이스에서 수탁 번호 P01011 참조; 샤르코-마리-투스병 유형 4J - 예를 들어, FIG4에서의 위치 41 또는 상동 잔기에서 이소류신에서 트레오닌으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Lenk et al., PLoS Genetics. 2011; 7: e1002104] 참조; 신경모세포종 (NB) - 예를 들어, 카스파제-9에서의 위치 197 또는 상동 잔기에서 류신의 프롤린으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Kundu et al., 3 Biotech. 2013, 3:225-234] 참조; 폰 빌레브란트병 (vWD) - 예를 들어, 폰 빌레브란트 인자의 프로세싱된 형태에서의 위치 509 또는 상동 잔기에서, 또는 폰 빌레브란트 인자의 비프로세싱된 형태에서의 위치 1272 또는 상동 잔기에서 시스테인에서 아르기닌으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Lavergne et al., Br. J. Haematol. 1992; 82: 66-72] 참조, 또한 유니프롯 데이터베이스에서 수탁 번호 P04275 참조; 선천성 근긴장증 - 예를 들어, 근육 클로라이드 채널 유전자 CLCN1에서의 위치 277 또는 상동 잔기에서 시스테인에서 아르기닌으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Weinberger et al., The J. of Physiology. 2012; 590: 3449-3464] 참조; 유전성 신장 아밀로이드증 - 예를 들어, 아포지단백질 AII의 프로세싱된 형태에서의 위치 78 또는 상동 잔기에서, 또는 비프로세싱된 형태에서의 위치 101 또는 상동 잔기에서 정지 코돈에서 아르기닌으로의 돌연변이 (T>C 돌연변이) - 예를 들어, 문헌 [Yazaki et al., Kidney Int. 2003; 64: 11-16] 참조; 확장성 심근병증 (DCM) - 예를 들어, FOXD4 유전자에서의 위치 148 또는 상동 잔기에서 트립토판에서 아르기닌으로의 돌연변이 (T>C 돌연변이), 예를 들어, 문헌 [Minoretti et al., Int. J. of Mol. Med. 2007; 19: 369-372] 참조; 유전성 림프부종 - 예를 들어, VEGFR3 티로신 키나제에서의 위치 1035 또는 상동 잔기에서 히스티딘에서 아르기닌으로의 돌연변이 (A>G 돌연변이), 예를 들어, 문헌 [Irrthum et al., Am. J. Hum. Genet. 2000; 67: 295-301] 참조; 가족성 알츠하이머병 - 예를 들어, 프레세닐린1에서의 위치 143 또는 상동 잔기에서 이소류신에서 발린으로의 돌연변이 (A>G 돌연변이), 예를 들어, 문헌 [Gallo et al., J. Alzheimer's disease. 2011; 25: 425-431] 참조; 프리온 질환 - 예를 들어, 프리온 단백질에서의 위치 129 또는 상동 잔기에서 메티오닌에서 발린으로의 돌연변이 (A>G 돌연변이) - 예를 들어, 문헌 [Lewis et al., J. of General Virology. 2006; 87: 2443-2449] 참조; 만성 영아 신경학적 피부 관절 증후군 (CINCA) - 예를 들어, 크리오피린에서의 위치 570 또는 상동 잔기에서 티로신에서 시스테인으로의 돌연변이 (A>G 돌연변이) - 예를 들어, 문헌 [Fujisawa et al. Blood. 2007; 109: 2903-2911] 참조; 및 데스민-관련 근병증 (DRM) - 예를 들어, αβ 크리스탈린에서의 위치 120 또는 상동 잔기에서 아르기닌에서 글리신으로의 돌연변이 (A>G 돌연변이) - 예를 들어, 문헌 [Kumar et al., J. Biol. Chem. 1999; 274: 24137-24141] 참조를 포함한다. 모든 참고문헌 및 데이터베이스 엔트리의 전체 내용은 본원에 참조로 포함된다.
본원에 개시된 바와 같은 Cas9:핵산 편집 효소/도메인 융합 단백질을 표적 부위, 예를 들어, 편집되는 점 돌연변이를 포함하는 부위에 표적화하기 위해, 전형적으로 Cas9:핵산 편집 효소/도메인 융합 단백질을 가이드 RNA, 예를 들어, sgRNA와 함께 공동-발현시킬 필요가 있다는 것이 관련 기술분야의 통상의 기술자에게 명백할 것이다. 본원의 다른 곳에서 보다 상세히 설명된 바와 같이, 가이드 RNA는 전형적으로 Cas9 결합을 허용하는 tracrRNA 프레임워크, 및 가이드 서열을 포함하며, 이는 Cas9:핵산 편집 효소/도메인 융합 단백질에 서열 특이성을 부여한다. 일부 실시양태에서, 가이드 RNA는 구조 5'-[가이드 서열]-guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3' (서열식별번호: 618)를 포함하고, 여기서, 가이드 서열은 표적 서열에 상보적인 서열을 포함한다. 가이드 서열은 전형적으로 20개 뉴클레오티드 길이이다. Cas9:핵산 편집 효소/도메인 융합 단백질을 특이적 게놈 표적 부위에 표적화하는 데 적합한 가이드 RNA의 서열은 본 개시내용에 기초하여 관련 기술분야의 통상의 기술자에게 명백할 것이다. 이러한 적합한 가이드 RNA 서열은 전형적으로 편집되는 표적 뉴클레오티드의 50개 뉴클레오티드 상류 또는 하류 내의 핵산 서열에 상보적인 가이드 서열을 포함한다. Cas9:핵산 편집 효소/도메인 융합 단백질을 특이적 표적 서열에 표적화하는 데 적합한 일부 예시적인 가이드 RNA 서열은 하기에 제공된다.
염기 편집제 효율
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 비율의 indel을 생성하지 않고 특이적 뉴클레오티드 염기를 변형시킬 수 있다는 인식에 기초한다. 본원에 사용된 "indel"은 핵산 내의 뉴클레오티드 염기의 삽입 또는 결실을 지칭한다. 이러한 삽입 또는 결실은 유전자의 코딩 영역 내의 격자 이동 돌연변이를 발생시킬 수 있다. 일부 실시양태에서, 핵산에서 다수의 삽입 또는 결실 (즉, indel)을 생성하지 않고, 핵산 내의 특이적 뉴클레오티드를 효율적으로 변형시키는 (예를 들어 돌연변이시키거나 탈아미노화하는) 염기 편집제를 생성하는 것이 바람직하다. 특정 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 보다 큰 비율의 의도된 변형 (예를 들어, 점 돌연변이 또는 탈아미노화) 대 indel을 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 1:1 초과인 의도된 점 돌연변이 대 indel의 비를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제는 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 200:1, 적어도 300:1, 적어도 400:1, 적어도 500:1, 적어도 600:1, 적어도 700:1, 적어도 800:1, 적어도 900:1, 또는 적어도 1000:1, 또는 그보다 큰 의도된 점 돌연변이 대 indel의 비를 생성할 수 있다. 의도된 돌연변이 및 indel의 수는 임의의 적합한 방법, 예를 들어 하기 실시예에서 사용된 방법을 사용하여 측정될 수 있다.
일부 실시양태에서, 본원에 제공된 염기 편집제는 핵산의 영역에서의 indel의 형성을 제한할 수 있다. 일부 실시양태에서, 영역은 염기 편집제에 의해 표적화된 뉴클레오티드, 또는 염기 편집제에 의해 표적화된 뉴클레오티드의 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 뉴클레오티드 내의 영역에 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 핵산의 영역에서의 indel의 형성을 1% 미만, 1.5% 미만, 2% 미만, 2.5% 미만, 3% 미만, 3.5% 미만, 4% 미만, 4.5% 미만, 5% 미만, 6% 미만, 7% 미만, 8% 미만, 9% 미만, 10% 미만, 12% 미만, 15% 미만, 또는 20% 미만으로 제한할 수 있다. 핵산 영역에서 형성된 indel의 수는 핵산 (예를 들어, 세포의 게놈 내의 핵산)이 염기 편집제에 노출된 시간의 양에 따라 달라질 수 있다. 일부 실시양태에서, indel의 수 또는 비율은 핵산 (예를 들어, 세포의 게놈 내의 핵산)을 염기 편집제에 노출시킨 후 적어도 1시간, 적어도 2시간, 적어도 6시간, 적어도 12시간, 적어도 24시간, 적어도 36시간, 적어도 48시간, 적어도 3일, 적어도 4일, 적어도 5일, 적어도 7일, 적어도 10일, 또는 적어도 14일에 측정된다.
본 개시내용의 일부 측면은 본원에 제공된 염기 편집제 중 임의의 것이 유의한 수의 비의도된 돌연변이, 예컨대 비의도된 점 돌연변이를 생성하지 않고 핵산 (예를 들어 대상체의 게놈 내의 핵산)에서 의도된 돌연변이, 예컨대 점 돌연변이를 효율적으로 생성할 수 있다는 인식에 기초한다. 일부 실시양태에서, 의도된 돌연변이는 의도된 돌연변이를 생성하도록 특이적으로 설계된 gRNA에 결합된 특이적 염기 편집제에 의해 생성된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 시토신 (C)에서 티민 (T)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 질환 또는 장애와 연관된 구아닌 (G)에서 아데닌 (A)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 시토신 (C)에서 티민 (T)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 코딩 영역 내의 구아닌 (G)에서 아데닌 (A)으로의 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈, 예를 들어, 유전자의 코딩 영역 내의 조기 정지 코돈을 생성하는 점 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 정지 코돈을 제거하는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 스플라이싱을 변경시키는 돌연변이이다. 일부 실시양태에서, 의도된 돌연변이는 유전자의 조절 서열 (예를 들어, 유전자 프로모터 또는 유전자 리프레서)을 변경시키는 돌연변이이다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 1:1 초과인 의도된 돌연변이 대 비의도된 돌연변이의 비 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)를 생성할 수 있다. 일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 적어도 1.5:1, 적어도 2:1, 적어도 2.5:1, 적어도 3:1, 적어도 3.5:1, 적어도 4:1, 적어도 4.5:1, 적어도 5:1, 적어도 5.5:1, 적어도 6:1, 적어도 6.5:1, 적어도 7:1, 적어도 7.5:1, 적어도 8:1, 적어도 10:1, 적어도 12:1, 적어도 15:1, 적어도 20:1, 적어도 25:1, 적어도 30:1, 적어도 40:1, 적어도 50:1, 적어도 100:1, 적어도 150:1, 적어도 200:1, 적어도 250:1, 적어도 500:1, 또는 적어도 1000:1, 또는 그보다 큰 의도된 돌연변이 대 비의도된 돌연변이의 비 (예를 들어, 의도된 점 돌연변이:비의도된 점 돌연변이)를 생성할 수 있다. 본원에서 "염기 편집제 효율" 섹션에 기재된 염기 편집제의 특징은 본원에 제공된 융합 단백질, 또는 융합 단백질을 사용하는 방법 중 임의의 것에 적용될 수 있다는 것이 인지되어야 한다.
핵산을 편집하는 방법
본 개시내용의 일부 측면은 핵산을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 핵산의 핵염기 (예를 들어, 이중-가닥 DNA 서열의 염기 쌍)를 편집하는 방법이다. 일부 실시양태에서, 방법은 a) 핵산의 표적 영역 (예를 들어, 이중-가닥 DNA 서열)을 염기 편집제 (예를 들어, 시티딘 데아미나제 도메인에 융합된 Cas9 도메인) 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적화된 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, 및 d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계이며, 여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체된 것인 단계를 포함하고; 방법은 핵산에서 20% 미만의 indel 형성을 발생시킨다. 일부 실시양태에서, 단계 b는 생략됨이 인지되어야 한다. 일부 실시양태에서, 제1 핵염기는 시토신이다. 일부 실시양태에서, 제2 핵염기는 탈아미노화된 시토신, 또는 우라실이다. 일부 실시양태에서, 제3 핵염기는 구아닌이다. 일부 실시양태에서, 제4 핵염기는 아데닌이다. 일부 실시양태에서, 제1 핵염기는 시토신이고, 제2 핵염기는 탈아미노화된 시토신, 또는 우라실이고, 제3 핵염기는 구아닌이고, 제4 핵염기는 아데닌이다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만, 또는 0.1% 미만의 indel 형성을 발생시킨다. 일부 실시양태에서, 방법은 제2 핵염기를 제4 핵염기에 상보적인 제5 핵염기로 대체함으로써, 의도된 편집된 염기 쌍 (예를 들어, C:G -> T:A)을 생성하는 것을 추가로 포함한다. 일부 실시양태에서, 제5 핵염기는 티민이다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%가 편집된다.
일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 또는 200:1, 또는 그보다 크다. 일부 실시양태에서, 의도된 점 돌연변이 대 indel 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1, 또는 1000:1 초과, 또는 그보다 크다. 일부 실시양태에서, 절단된 단일 가닥 (니킹된 가닥)은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 염기 편집제는 Cas9 도메인을 포함한다. 일부 실시양태에서, 제1 염기는 시토신이고, 제2 염기는 G, C, A, 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 우라실이다. 일부 실시양태에서, 제1 염기는 시토신이다. 일부 실시양태에서, 제2 염기는 G, C, A, 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 우라실이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집된 가닥을 보호하거나 그에 결합한다. 일부 실시양태에서, 염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 상류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 하류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 하류 스트림이다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 아미노산 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하고, 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1 내지 10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 또는 1개 뉴클레오티드 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에 있다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 방법은 본원에 제공된 염기 편집제 중 임의의 것을 사용하여 수행된다. 일부 실시양태에서, 표적 윈도우는 탈아미노화 윈도우이다.
일부 실시양태에서, 본 개시내용은 뉴클레오티드를 편집하는 방법을 제공한다. 일부 실시양태에서, 본 개시내용은 이중-가닥 DNA 서열의 핵염기 쌍을 편집하는 방법을 제공한다. 일부 실시양태에서, 방법은 a) 이중-가닥 DNA 서열의 표적 영역을 염기 편집제 및 가이드 핵산 (예를 들어, gRNA)을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적 핵염기 쌍을 포함하는 것인 단계, b) 상기 표적 영역의 가닥 분리를 유도하는 단계, c) 표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계, d) 상기 표적 영역의 1개 이하의 가닥을 절단하는 단계를 포함하고, 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되고, 제2 핵염기는 제4 핵염기에 상보적인 제5 핵염기로 대체됨으로써, 의도된 편집된 염기 쌍을 생성하고, 의도된 편집된 염기 쌍을 생성하는 효율은 적어도 5%이다. 일부 실시양태에서, 단계 b는 생략됨이 인지되어야 한다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 5%가 편집된다. 일부 실시양태에서, 의도된 염기 쌍의 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 또는 50%가 편집된다. 일부 실시양태에서, 방법은 19%, 18%, 16%, 14%, 12%, 10%, 8%, 6%, 4%, 2%, 1%, 0.5%, 0.2% 미만, 또는 0.1% 미만의 indel 형성을 유발한다. 일부 실시양태에서, 표적 뉴클레오티드에서의 의도된 생성물 대 비의도된 생성물의 비는 적어도 2:1, 5:1, 10:1, 20:1, 30:1, 40:1, 50:1, 60:1, 70:1, 80:1, 90:1, 100:1, 또는 200:1, 또는 그보다 크다. 일부 실시양태에서, 의도된 점 돌연변이 대 indel 형성의 비는 1:1, 10:1, 50:1, 100:1, 500:1, 또는 1000:1 초과, 또는 그보다 크다. 일부 실시양태에서, 절단된 단일 가닥은 가이드 핵산에 혼성화된다. 일부 실시양태에서, 절단된 단일 가닥은 제1 핵염기를 포함하는 가닥에 대향한다. 일부 실시양태에서, 제1 염기는 시토신이다. 일부 실시양태에서, 제2 핵염기는 G, C, A, 또는 T가 아니다. 일부 실시양태에서, 제2 염기는 우라실이다. 일부 실시양태에서, 염기 편집제는 편집된 가닥의 염기 절제 복구를 억제한다. 일부 실시양태에서, 염기 편집제는 비-편집된 가닥을 보호하거나 그에 결합한다. 일부 실시양태에서, 핵염기 편집제는 UGI 활성을 포함한다. 일부 실시양태에서, 핵염기 편집제는 니카제 활성을 포함한다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 상류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 상류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 하류이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 하류 스트림이다. 일부 실시양태에서, 방법은 정규 (예를 들어, NGG) PAM 부위를 요구하지 않는다. 일부 실시양태에서, 핵염기 편집제는 링커를 포함한다. 일부 실시양태에서, 링커는 1 내지 25개 아미노산 길이이다. 일부 실시양태에서, 링커는 5 내지 20개 아미노산 길이이다. 일부 실시양태에서, 링커는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 아미노산 길이이다. 일부 실시양태에서, 표적 영역은 표적 윈도우를 포함하고, 표적 윈도우는 표적 핵염기 쌍을 포함한다. 일부 실시양태에서, 표적 윈도우는 1 내지 10개의 뉴클레오티드를 포함한다. 일부 실시양태에서, 표적 윈도우는 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 또는 1개 뉴클레오티드 길이이다. 일부 실시양태에서, 표적 윈도우는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드 길이이다. 일부 실시양태에서, 의도된 편집된 염기 쌍은 표적 윈도우 내에서 발생한다. 일부 실시양태에서, 표적 윈도우는 의도된 편집된 염기 쌍을 포함한다. 일부 실시양태에서, 핵염기 편집제는 본원에 제공된 염기 편집제 중 어느 하나이다.
제약 조성물
일부 실시양태에서, 본원에 기재된 융합 단백질, gRNA, 및/또는 복합체 중 임의의 것은 제약 조성물의 일부로서 제공된다. 일부 실시양태에서, 제약 조성물은 본원에 제공된 융합 단백질 중 임의의 것을 포함한다. 일부 실시양태에서, 제약 조성물은 본원에 제공된 복합체 중 임의의 것을 포함한다. 일부 실시양태에서, 제약 조성물은 gRNA 및 양이온성 지질과의 복합체를 형성하는 RNA-가이드된 뉴클레아제 (예를 들어, Cas9)를 포함하는 리보핵단백질을 포함한다. 일부 실시양태에서 제약 조성물은 gRNA, 핵산 프로그램가능한 DNA 결합 단백질, 양이온성 지질, 및 제약상 허용되는 부형제를 포함한다. 제약 조성물은 1종 이상의 추가의 치료 활성 물질을 임의로 포함할 수 있다.
일부 실시양태에서, 본원에 제공된 조성물은 대상체 내에서 표적화된 게놈 변형을 실시하기 위해 대상체, 예를 들어 인간 대상체에게 투여된다. 일부 실시양태에서, 세포는 대상체로부터 수득되고 본원에 제공된 제약 조성물 중 임의의 것과 접촉된다. 일부 실시양태에서, 대상체로부터 제거되고, 생체외에서 제약 조성물과 접촉된 세포는 임의로 목적하는 게놈 변형이 세포에서 실시되거나 검출된 후, 대상체 내로 재-도입된다. 뉴클레아제를 포함하는 제약 조성물을 전달하는 방법은 공지되어 있고, 예를 들어, 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기재되며, 이들 모두의 개시내용은 그 전문이 본원에 참조로 포함된다. 본원에 제공된 제약 조성물의 설명은 원칙적으로 인간에의 투여에 적합한 제약 조성물에 관한 것이지만, 이러한 조성물은 일반적으로 모든 종류의 동물 또는 유기체에의 투여에 적합하다는 것이 통상의 기술자에 의해 이해될 것이다. 인간에 대한 투여에 적합한 제약 조성물을 다양한 동물에게 투여하기에 적합하게 만들기 위해 조성물을 변형시키는 것은 널리 이해되며, 통상의 숙련된 수의학 약리학자는, 존재하는 경우, 단지 통상의 실험에 의해 이러한 변형을 설계하고/거나 수행할 수 있다. 제약 조성물이 투여되는 것으로 고려되는 대상체는 인간 및/또는 다른 영장류; 포유동물, 가축, 애완용 동물, 및 상업적으로 관련된 포유동물, 예컨대 소, 돼지, 말, 양, 고양이, 개, 마우스, 및/또는 래트; 및/또는 조류 (상업적으로 관련된 조류, 예컨대 치킨, 오리, 거위 및/또는 칠면조 포함)를 포함하나 이에 제한되지는 않는다.
본원에 기재된 제약 조성물의 제제는 약리학 기술분야에 공지되어 있거나 또는 이후에 개발된 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 활성 성분(들)을 부형제 및/또는 1종 이상의 보조 성분과 회합시킨 후, 필요할 경우 및/또는 바람직할 경우, 생성물을 목적하는 단일- 또는 다중-투여 단위로 성형 및/또는 패키징하는 단계를 포함한다.
제약 제제는 추가로 제약상 허용되는 부형제를 추가로 포함할 수 있고, 이는 본원에 사용된 바와 같은, 임의의 모든 용매, 분산 매질, 희석제, 또는 다른 액체 비히클, 분산액 또는 현탁 보조제, 표면 활성제, 등장화제, 증점 또는 유화제, 보존제, 고체 결합제, 윤활제 등을 목적하는 특정한 투여에 적합한 것으로서 포함한다. 그 전문이 본원에 참조로 포함된 문헌 [Remington's The Science and Practice of Pharmacy, 21st Edition, A. R. Gennaro (Lippincott, Williams & Wilkins, Baltimore, MD, 2006)]에는 제약 조성물을 제형화하는 데 사용된 각종 부형제 및 그의 제조를 위한 공지된 기술이 개시되어 있다. 또한, 뉴클레아제를 포함하는 제약 조성물을 제조하기 위한 추가의 적합한 방법, 시약, 부형제 및 용매에 대해 그 전문이 본원에 참조로 포함된 PCT 출원 PCT/US2010/055131 (공개 번호 WO2011053982 A8, 2010년 11월 2일에 출원됨)을 참조한다. 임의의 통상적인 부형제 매질이, 예컨대 임의의 목적하지 않은 생물학적 효과를 생성하거나 또는 달리 제약 조성물의 임의의 다른 성분(들)과 유해한 방식으로 상호작용함으로써 물질 또는 그의 유도체와 비상용성인 경우를 제외하고, 그의 사용은 본 개시내용의 범주 내에 있는 것으로 고려된다.
일부 실시양태에서, 본 발명에 따르는 조성물은 하기 중 1종 이상을 포함하나 이에 제한되지는 않는 다양한 질환, 장애 및/또는 상태 중 임의의 것을 치료하는 데 사용될 수 있다: 자가면역 장애 (예를 들어, 당뇨병, 루푸스, 다발성 경화증, 건선, 류마티스성 관절염); 염증성 장애 (예를 들어, 관절염, 골반 염증성 질환); 감염성 질환 (예를 들어, 바이러스 감염 (예를 들어, HIV, HCV, RSV), 박테리아 감염, 진균 감염, 패혈증); 신경계 장애 (예를 들어, 알츠하이머병, 헌팅턴병; 자폐증; 뒤시엔느 근육 이영양증); 심혈관 장애 (예를 들어, 아테롬성동맥경화증, 고콜레스테롤혈증, 혈전증, 응고 장애, 혈관신생 장애, 예컨대 황반 변성); 증식성 장애 (예를 들어, 암, 양성 신생물); 호흡기 장애 (예를 들어, 만성 폐쇄성 폐 질환); 소화 장애 (예를 들어, 염증성 장 질환, 궤양); 근골격 장애 (예를 들어, 섬유근육통, 관절염); 내분비, 대사 및 영양 장애 (예를 들어, 당뇨병, 골다공증); 비뇨기 장애 (예를 들어, 신질환); 심리 장애 (예를 들어, 우울증, 정신분열증); 피부 장애 (예를 들어, 상처, 습진); 혈액 및 림프성 장애 (예를 들어, 빈혈, 혈우병) 등.
키트, 벡터, 세포
본 개시내용의 일부 측면은 (a) 본원에 제공된 바와 같은 Cas9 단백질 또는 Cas9 융합 단백질을 코딩하는 뉴클레오티드 서열; 및 (b) (a)의 서열의 발현을 유도하는 이종 프로모터를 포함하는 핵산 구축물을 포함하는 키트를 제공한다. 일부 실시양태에서, 키트는 가이드 RNA 백본을 코딩하는 발현 구축물을 추가로 포함하고, 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 RNA 백본 내로의 클로닝을 허용하도록 위치된 클로닝 부위를 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 바와 같은 융합 단백질의 Cas9 단백질을 코딩하는 폴리뉴클레오티드를 제공한다. 본 개시내용의 일부 측면은 이러한 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 일부 실시양태에서, 벡터는 폴리뉴클레오티드의 발현을 유도하는 이종 프로모터를 포함한다.
본 개시내용의 일부 측면은 본원에 제공된 바와 같은 Cas9 단백질, 융합 단백질, 융합 단백질을 코딩하는 핵산 분자, Cas9 단백질 및 gRNA를 포함하는 복합체, 및/또는 벡터를 포함하는 세포를 제공한다.
상기 리포터 시스템의 예시적인 실시양태의 설명은 단지 예시 목적으로 제공되며, 제한하는 것으로 의도되지 않는다. 추가의 리포터 시스템, 예를 들어, 상기 상세히 기재된 예시적인 시스템의 변형이 또한 본 개시내용에 의해 포함된다.
실시예
실시예 1: Cas9 데아미나제 융합 단백질
다수의 Cas9:데아미나제 융합 단백질을 생성하고, 생성된 융합물의 데아미나제 활성을 특징화하였다. 하기 데아미나제를 시험하였다:
인간 AID (hAID):
인간 AID-DC (hAID-DC, 7-배 증가된 활성을 갖는 hAID의 말단절단된 버전):
래트 APOBEC1 (rAPOBEC1):
인간 APOBEC1 (hAPOBEC1)
페트로미존 마리누스 (칠성장어) CDA1 (pmCDA1):
인간 APOBEC3G (hAPOBEC3G):
ssDNA에 대한 데아미나제 활성. 탈아미노화를 위한 USER (우라실-특이적 절제 시약) 효소-기반 검정을 사용하여 단일-가닥 DNA (ssDNA) 기질에 대한 다양한 데아미나제의 활성을 시험하였다. USER 효소는 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 입수하였다. 상이한 위치에 표적 시토신 잔기를 갖는 ssDNA 기질을 제공받았다. ssDNA 시토신 표적 잔기의 탈아미노화는 표적 시토신의 우라실로의 전환을 발생시킨다. USER 효소는 우라실 염기를 절제하고, 그 위치에서 ssDNA 백본을 절단하며, 이는 ssDNA 기질을 DNA의 2개의 보다 짧은 단편으로 절단한다. 일부 검정에서, ssDNA 기질은 한 말단 상에 염료로, 예를 들어, 5' Cy3 표지 (하기 식에서 *)로 표지된다. 탈아미노화, 절제, 및 가닥의 절단시, 기질은 전기영동으로 처리될 수 있으며, 기질 및 그로부터 방출된 임의의 단편은 표지를 검출함으로써 가시화될 수 있다. Cy5가 영상인 경우, 단지 표지를 갖는 단편만이 영상화를 통해 가시적일 것이다.
한 USER 효소 검정에서, 시험된 다양한 데아미나제의 표적 서열을 매칭시킨 ssDNA 기질을 사용하였다. 시험되는 데아미나제를 코딩하는 발현 카세트를 실험실에서 이전에 사용된 CMV 백본 플라스미드 (애드진(Addgene) 플라스미드 52970) 내로 삽입하였다. 데아미나제 단백질을 TNT 퀵 커플드(Quick Coupled) 전사/번역 시스템 (프로메가(Promega))을 제조업체의 권장사항에 따라 사용하여 발현시켰다. 90분의 인큐베이션 후, 5 mL의 용해물을 5' Cy3-표지된 ssDNA 기질 및 1 단위의 USER 효소 (NEB)와 함께 3시간 동안 인큐베이션하였다. DNA를 10% TBE PAGE 겔 상에서 분해하고, DNA를 Cy-염료 영상화를 사용하여 영상화하였다. USER 효소 검정의 개략적 표현이 도 41에 나타나 있다.
도 1은 ssDNA 기질, 예컨대 도엔치(Doench) 1, 도엔치 2, G7' 및 VEGF 표적 2에 대한 시험된 데아미나제의 데아미나제 활성을 나타낸다. rAPOBEC1 효소는 정규 NGG PAM으로는 단일-가닥 DNA 기질에 대해 실질적인 양의 탈아미노화를 나타내었지만, 음성 대조군 비-정규 NNN PAM으로는 그렇지 않았다. APOBEC 패밀리 데아미나제를 갖는 Cas9 융합 단백질을 생성하였다. 하기 융합 아키텍처를 구축하고, ssDNA에 대해 시험하였다:
도 2는 N-말단 데아미나제 융합물이 단일 가닥 DNA 기질에 대해 유의한 활성을 나타내었음을 나타낸다. 이러한 이유로, 단지 N-말단 아키텍처만을 추가의 실험을 위해 선택하였다.
도 3은 데아미나제-dCas9:sgRNA 복합체에 의한 이중 가닥 DNA 기질 결합을 예시한다. 다수의 이중 가닥 데아미나제 기질 서열을 생성하였다. 서열은 하기에 제공된다. 도 3에 따른 구조는 이들 서열에서 확인된다 (36bp: 밑줄표시됨, sgRNA 표적 서열: 볼드체; PAM: 박스표시됨; 21bp: 이탤릭체). 모든 기질은 5'-Cy3 표지로 표지하였다:
*"8U"를 제외한 모든 기질에서, 도 3에서의 상부 가닥은 여기에 특정된 서열의 보체이다. "8U"의 경우, U 반대편에는 "G"가 있다.
도 4는 이중 가닥 DNA 탈아미노화 검정의 결과를 나타낸다. 융합물을 발현시키고, Ni-NTA 및 세파로스 크로마토그래피 둘 다를 통해 N-말단 His6 태그로 정제하였다. dsDNA 기질에 대한 탈아미노화를 평가하기 위해, 이전의 슬라이드 상에 나타난 다양한 dsDNA 기질을 1:8 dsDNA:융합 단백질 비로 인큐베이션하고, 37℃에서 2시간 동안 인큐베이션하였다. 융합물의 dCas9 부분이 DNA에 결합하면, 이는 DNA에의 USER 효소의 접근을 차단한다. 따라서, 융합 단백질을 인큐베이션 후에 변성시키고, dsDNA를 스핀 칼럼 상에서 정제한 후, USER 효소와 함께 45분 동안 인큐베이션하고, 생성된 DNA 기질 및 기질 단편을 10% TBE-우레아 겔 상에서 분해하였다.
도 5는 Cas9 융합물이 이중-가닥 DNA 표적 서열의 위치 3 내지 11 (도 3에서의 개략도에 따라 넘버링됨)을 표적화할 수 있다는 것을 입증한다. 상부 겔: 1 μM rAPOBEC1-GGS-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 중간 겔: 1 μM rAPOBEC1-(GGS)3-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 하부 겔: 1.85 μM rAPOBEC1-XTEN-dCas9, 125 nM dsDNA, 1 당량 sgRNA. 이들 겔로부터의 데이터에 기초하여, 위치 3 내지 11 (도 3에서의 넘버링에 따름)은 시험된 융합 단백질에 의해 표적화되는 데아미나제의 활성에 충분히 노출된다. 다른 위치에의 데아미나제의 접근은 가장 가능성 있게는 dCas9 단백질에 의해 차단된다.
데이터는 추가로 단지 3개 아미노산의 링커 (GGS)가 데아미나제가 DNA의 단일 가닥 부분에 접근하는 것을 허용하는 데 최적이지 않다는 것을 나타낸다. 9개 아미노산 링커 [(GGS)3] (서열식별번호: 610) 및 보다 구조화된 16개 아미노산 링커 (XTEN)는 보다 효율적인 탈아미노화를 허용한다.
도 6은 교정 가이드 RNA, 예를 들어, 교정 sgRNA가 데아미나제 활성에 요구된다는 것을 입증한다. 겔은 데아미나제를 dCas9, 데아미나제 효소에 융합시키는 것이 서열 특이적이 되고 (예를 들어, eGFP sgRNA와의 융합물을 사용하는 것이 탈아미노화를 발생시키지 않음), 또한 dsDNA를 탈아미노화하는 능력을 데아미나제에 부여한다는 것을 나타낸다. 데아미나제 효소의 천연 기질은 ssDNA이고, sgRNA가 첨가되지 않았을 경우 탈아미노화는 발생하지 않았다. 이는 APOBEC 데아미나제 단독은 dsDNA를 탈아미노화하지 않는다는 보고된 지식과 일치한다. 데이터는 Cas9가 짧은 윈도우 내의 이중-가닥 DNA 나선을 개방하고, 이는 그 후, 시티딘 탈아미노화를 위해 APOBEC 데아미나제에 접근가능한 단일-가닥 DNA를 노출시킨다는 것을 나타낸다. 사용된 sgRNA 서열은 하기에 제공된다. 서열 (36bp: 밑줄표시됨, sgRNA 표적 서열: 볼드체; PAM: 박스표시됨; 21bp: 이탤릭체)
DNA 서열 8:
교정 sgRNA 서열 (부분적 3' 서열):
eGFP sgRNA 서열 (부분적 3'-서열):
실시예 2: DNA 표적 서열의 탈아미노화
예시적인 탈아미노화 표적. 본원에 기재된 dCas9:데아미나제 융합 단백질은 시험관내에서 또는 생체외에서 세포에, 또는 생체내에서 대상체에 전달될 수 있으며, 표적 뉴클레오티드가 PAM에 관하여 위치 3 내지 11에 있는 경우, C에서 T로의 또는 G에서 A로의 전위를 실시하는 데 사용될 수 있다. 예시적인 탈아미노화 표적은 비제한적으로 하기를 포함한다: CCR5 말단절단: CCR5의 Q93, Q102, Q186, R225, W86, 또는 Q261을 코딩하는 코돈 중 임의의 것은 탈아미노화되어 정지 코돈을 생성할 수 있으며, 이는 HIV 치료에서 적용되는 CCR5의 비관능적 말단절단을 발생시킨다. APOE4 돌연변이: C11R 및 C57R 돌연변이체 APOE4 단백질을 코딩하는 돌연변이체 코돈은 탈아미노화되어 알츠하이머 치료에서 적용되는 야생형 아미노산으로 복귀될 수 있다. eGFP 말단절단: Q158, Q184, Q185를 코딩하는 코돈 중 임의의 것은 탈아미노화되어 정지 코돈을 생성할 수 있거나, M1을 코딩하는 코돈은 탈아미노화되어 I을 코딩할 수 있으며, 이들 모두는 eGFP 형광의 상실을 발생시키고, 리포터 시스템에서 적용된다. eGFP 복원: 실질적 형광을 나타내지 않는 T65A 또는 Y66C 돌연변이체 GFP를 코딩하는 돌연변이체 코돈은 탈아미노화되어 야생형 아미노산을 복원하고, 형광을 부여할 수 있다. PIK3CA 돌연변이: K111E 돌연변이체 PIK3CA를 코딩하는 돌연변이체 코돈은 탈아미노화되어 암에서 적용되는 야생형 아미노산 잔기를 복원할 수 있다. CTNNB1 돌연변이: T41A 돌연변이체 CTNNB1을 코딩하는 돌연변이체 코돈은 탈아미노화되어 암에서 적용되는 야생형 아미노산 잔기를 복원할 수 있다. HRAS 돌연변이: Q61R 돌연변이체 HRAS를 코딩하는 돌연변이체 코돈은 탈아미노화되어 암에서 적용되는 야생형 아미노산 잔기를 복원할 수 있다. P53 돌연변이: Y163C, Y236C, 또는 N239D 돌연변이체 p53을 코딩하는 돌연변이체 코돈 중 임의의 것은 탈아미노화되어 암에서 적용되는 야생형 아미노산 서열을 코딩할 수 있다. 이중-가닥 DNA에서의 이들 표적 서열을 탈아미노화하는 것의 실시가능성은 도 7 및 8에서 입증된다. 도 7은 데아미나제-dCas9:sgRNA 복합체에 의한 생체내 표적 서열의 표적 DNA 결합의 메카니즘을 예시한다.
도 8은 예시적인 질환-연관된 표적 서열의 성공적인 탈아미노화를 나타낸다. 상부 겔: CCR5 Q93: 위치 10에서의 코딩 가닥 표적 (위치 2, 5, 6, 8, 9에서의 잠재적 오프-타겟); CCR5 Q102: 위치 9에서의 코딩 가닥 표적 (위치 1, 12, 14에서의 잠재적 오프-타겟); CCR5 Q186: 위치 9에서의 코딩 가닥 표적 (위치 1, 5, 15에서의 잠재적 오프-타겟); CCR5 R225: 위치 6에서의 코딩 가닥 표적 (잠재적 오프-타겟 없음); eGFP Q158: 위치 5에서의 코딩 가닥 표적 (위치 1, 13, 16에서의 잠재적 오프-타겟); eGFP Q184 /185: 위치 4 및 7에서의 코딩 가닥 표적 (위치 3, 12, 14, 15, 16, 17, 18에서의 잠재적 오프-타겟); eGFP M1: 위치 12에서의 주형 가닥 표적 (위치 2, 3, 7, 9, 11에서의 잠재적 오프-타겟) (표적 위치 7 및 9를 작은 정도로 표적화함); eGFP T65A: 위치 7에서의 주형 가닥 표적 (위치 1, 8, 17에서의 잠재적 오프-타겟); PIK3CA K111E: 위치 2에서의 주형 가닥 표적 (위치 5, 8, 10, 16, 17에서의 잠재적 오프-타겟); PIK3CA K111E: 위치 13에서의 주형 가닥 표적 (위치 11, 16, 19에서의 잠재적 오프-타겟) X. 하부 겔: CCR5 W86: 위치 2 및 3에서의 주형 가닥 표적 (위치 1, 13에서의 잠재적 오프-타겟) X; APOE4 C11R: 위치 11에서의 코딩 가닥 표적 (위치 7, 13, 16, 17에서의 잠재적 오프-타겟); APOE4 C57R: 위치 5에서의 코딩 가닥 표적) (위치 7, 8, 12에서의 잠재적 오프-타겟); eGFP Y66C: 위치 11에서의 주형 가닥 표적 (위치 1, 4 ,6, 8, 9, 16에서의 잠재적 오프-타겟); eGFP Y66C: 위치 3에서의 주형 가닥 표적 (위치 1, 8, 17에서의 잠재적 오프-타겟); CCR5 Q261: 위치 10에서의 코딩 가닥 표적 (위치 3, 5, 6, 9, 18에서의 잠재적 오프-타겟); CTNNB1 T41A: 위치 7에서의 주형 가닥 표적 (위치 1, 13, 15, 16에서의 잠재적 오프-타겟) X; HRAS Q61R: 위치 6에서의 주형 가닥 표적 (위치 1, 2, 4, 5, 9, 10, 13에서의 잠재적 오프-타겟); p53 Y163C: 위치 6에서의 주형 가닥 표적 (위치 2, 13, 14에서의 잠재적 오프-타겟); p53 Y236C: 위치 8에서의 주형 가닥 표적 (위치 2, 4에서의 잠재적 오프-타겟); p53 N239D: 위치 4에서의 주형 가닥 표적 (위치 6, 8에서의 잠재적 오프-타겟). 질환 표적의 예시적인 DNA 서열은 하기에 제공된다 (PAM (5'-NGG-3') 및 표적 위치는 박스표시됨):
실시예 3: 우라실 글리코실라제 억제제 융합물은 탈아미노화 효율을 개선시킨다
dCas9:데아미나제 융합 단백질에 의한 포유동물 세포에서의 직접적 프로그램가능한 핵염기 편집 효율은 우라실 글리코실라제 억제제 (UGI)를 dCas9:데아미나제 융합 단백질에 융합시킴으로써 유의하게 개선될 수 있다.
도 9는 rAPOBEC1-XTEN-dCas9를 사용한 인간 HEK293 세포에서의 시험관내 C→T 편집 효율을 나타낸다:
프로토스페이서 서열은 하기와 같았다:
*PAM은 박스표시되어 있고, 표적 윈도우 (위치 3 내지 11) 내의 C 잔기는 넘버링되고, 볼드체이다.
도 10은 HEK293T 세포에서의 동일한 프로토스페이서 서열에 대한 C→T 편집 효율이 UGI 도메인이 rAPOBEC1:dCas9 융합 단백질에 융합되는 경우 크게 증진된다는 것을 입증한다.
도 9 및 10에서의 백분율은 표적 서열의 둘 다의 가닥의 서열분석으로부터 제시된다. 가닥 중 단지 1개만이 탈아미노화를 위한 기질이기 때문에, 이 검정에서 최대 가능한 탈아미노화 값은 50%이다. 따라서, 탈아미노화 효율은 표에 제시된 백분율의 2배이다. 예를 들어, 50%의 값은 이중-가닥 표적 서열의 100%의 탈아미노화와 관련된다. 우라실 글리코실라제 억제제 (UGI)가 dCas9:데아미나제 융합 단백질 (예를 들어, rAPOBEC1-XTEN-dCas9-[UGI]-NLS)에 융합된 경우, 세포에서의 편집 효율의 유의한 증가가 관찰되었다. 이 결과는 포유동물 세포에서, U:G 염기 쌍에서 우라실 염기를 절단해 내는 DNA 복구 기구가 DNA 편집에서의 속도-제한적 과정이라는 것을 나타낸다. UGI를 dVas9:데아미나제 융합 단백질에 테더링하는 것은 편집 수율을 크게 증가시킨다.
UGI 없이, 인간 세포에서의 전형적인 편집 효율은 ~2-14% 수율 범위였다 (도 9 및 도 10, "XTEN" 엔트리). UGI (도 10, "UGI" 엔트리)로는, 편집은 ~6-40% 범위에서 관찰되었다. 따라서, UGI 융합을 사용하는 것은 HDR을 통해 점 돌연변이를 교정하는 현재의 대안적인 방법보다 더 효율적이며, 이는 또한 점 돌연변이를 교정하는 것 이외에 과량의 indel을 생성한다. cas9:데아미나제:UGI 융합물로의 처리로부터 생성되는 indel은 관찰되지 않았다.
실시예 4: 이중-가닥 DNA 절단 없는 게놈 DNA에서의 표적 뉴클레오티드의 직접적, 프로그램가능한 전환
현재의 게놈-편집 기술은 유전자 교정에 대한 제1 단계로서 이중-가닥 DNA 파괴를 관심 표적 유전자좌에서 도입한다.39,40 대부분의 유전 질환은 단일 핵염기의 상이한 핵염기로의 돌연변이로부터 발생하지만, 이러한 변화를 복귀시키기 위한 현재의 접근법은 매우 비효율적이며, 전형적으로 이중-가닥 DNA 파괴에 대한 세포의 반응의 결과로서 표적 유전자좌에서 풍부한 무작위 삽입 및 결실 (indel)을 유도한다.39,40 핵염기 편집, 즉, 이중-가닥 DNA 백본 절단을 요구하지 않고, 프로그램가능한 방식으로 하나의 표적 핵염기의 또 다른 것으로의 직접적 전환을 가능하게 하는 게놈 편집을 위한 새로운 전략의 개발이 본원에 보고된다. CRISPR/Cas9의 융합물을 조작하였으며, 가이드 RNA로 프로그램되는 능력을 보유하는 시티딘 데아미나제 효소 APOBEC1은 이중-가닥 DNA 파괴를 유도하지 않고, 시티딘의 우라실로의 직접적 전환을 매개함으로써, 주형 가닥이 표적화되는 경우, DNA 복제, DNA 복구, 또는 전사 후의 C→T (또는 G→A) 치환을 실시한다. 생성된 "핵염기 편집제"는 대략 5개 뉴클레오티드의 윈도우 내에서 시티딘을 전환시키며, 시험관내에서 인간 질환과 관련된 다양한 점 돌연변이를 효율적으로 교정할 수 있다. 4가지 형질전환된 인간 및 뮤린 세포주에서, 각각 우라실 글리코실라제 억제제 (UGI)를 융합시키고, 비-편집된 가닥을 표적화하는 Cas9 니카제를 사용하는 제2- 및 제3-세대 핵염기 편집제는 핵염기 편집에 대한 세포의 DNA 복구 반응을 극복할 수 있으며, 이는 최소 (전형적으로 1% 이하) indel 형성으로 인간 세포에서 총 세포의 DNA의 37% 이하 또는 (약 15 내지 75%)의 영구적 교정을 발생시킨다. 대조적으로, 동일한 표적 상의 정규 Cas9-매개된 HDR은 4% indel 형성으로 평균 0.7% 교정을 수득하였다. 핵염기 편집제를 사용하여 인간 유방암 및 림프종 세포에서 2가지 종양형성 p53 돌연변이를 야생형 대립유전자로 복귀시켰으며, 마우스 성상세포에서 ApoE4에서의 알츠하이머병 연관된 Arg 코돈을 비-질환-연관된 Cys 코돈으로 전환시켰다. 염기 편집은 점 돌연변이의 게놈 편집의 범위 및 효율을 확장시킨다.
클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 시스템은 다양한 유기체 및 세포주에서 게놈 조작을 매개하도록 적응된 원핵생물 적응 면역계이다.41 CRISPR/Cas9 단백질-RNA 복합체는 가이드 RNA와의 염기 쌍형성을 통해 표적 DNA 서열에 국재화하며, 가이드 RNA에 의해 특정된 유전자좌에서 자연적으로 DNA 이중-가닥 파괴 (DSB)를 생성한다. DSB에 대한 반응에서, 내인성 DNA 복구 과정은 주로 비-상동 말단 연결 (NHEJ)을 통해 DNA 절단의 부위에서 무작위 삽입 또는 결실 (indel)을 발생시킨다. 상동 DNA 주형의 존재 하에서, 절단 부위 주위의 DNA는 상동성-지정 복구 (HDR)를 통해 대체될 수 있다. 질환-연관된 유전자의 간단한 교란이 충분한 경우 (예를 들어, 일부 기능 획득 질환을 치료하기 위해), 표적화된 DNA 절단, 그 후 indel 형성은 효과적일 수 있다. 그러나, 대부분의 공지된 유전 질환에 대해, 유전자의 확률적 교란이라기 보다 표적 유전자좌에서의 점 돌연변이의 교정은 질환의 기저를 이루는 원인을 다루거나 연구하는 데 필요하다.68
이 필요에 의해 동기부여되어, 연구자들은 HDR의 효율을 증가시키고, NHEJ를 억제하기 위해 깊은 노력을 투자하였다. 예를 들어, NHEJ 경로에서 필수적 효소인 리가제 IV의 소분자 억제제는 HDR 효율을 증가시키는 것으로 나타났다.42,43 그러나, 이 전략은 유사분열후 세포에서 도전중이며, 이는 전형적으로 HDR을 하향-조절하고, 그의 치료적 타당성은 비-표적 세포에서의 리가제 IV를 억제하는 것의 잠재적 위험에 의해 제한된다. 증진된 HDR 효율은 또한 화학적으로 동기화된 세포 내로의 Cas9-가이드 RNA 복합체의 시의적절한 전달에 의해 달성될 수 있으며, 이는 HDR 효율이 매우 세포-주기 의존성이기 때문이다.44 그러나, 이러한 접근법은 세포를 동기화하는 것이 매우 방해적이기 때문에 세포 배양물에서의 연구 적용에 제한된다. 이들 개발에도 불구하고, 대부분의 맥락에서 HDR을 사용하여 점 돌연변이를 대체하는 현재의 전략은 특히 비변형된, 비-분열하는 세포에서 매우 비효율적이다 (전형적으로 약 0.1 내지 5%).42,43,45,46,75 또한, HDR은 이중-가닥 파괴의 해결 동안 NHEJ와 경쟁하며, indel은 일반적으로 유전자 대체보다 더 풍부한 결과물이다. 이들 관찰은 이중-가닥 DNA 파괴를 생성하는 것에 의존하지 않는 게놈 DNA에서의 특이적 변형을 설치하는 대안적인 접근법을 개발할 필요를 강조한다. NHEJ 경로에서 필수적인 효소인 리가제 IV의 소분자 억제제는 HDR 효율을 증가시키는 것으로 나타났다.42,43 그러나, 이 전략은 유사분열후 세포에서 도전중이며, 이는 전형적으로 HDR을 하향-조절하고, 그의 치료적 타당성은 비-표적 세포에서 리가제 IV를 억제하는 것의 잠재적 위험에 의해 제한된다. 증진된 HDR 효율은 또한 화학적으로 동기화된 세포 내로의 Cas9-가이드 RNA 복합체의 시의적절한 전달에 의해 달성될 수 있으며, 이는 HDR 효율이 매우 세포-주기 의존성이기 때문이다.44 그러나, 이러한 접근법은 세포를 동기화하는 것이 매우 방해적이기 때문에 세포 배양물에서의 연구 적용에 제한된다. 일부의 경우, 성공적인 HDR의 생성물이 PAM 서열에서의 돌연변이를 함유하고, 따라서 더 이상 후속의 Cas9 변형을 위한 기질이 아니도록 HDR 주형을 설계하는 것이 가능하며, 이는 이러한 접근법이 생성물 서열에 대한 제약을 부과하긴 하지만, HDR 생성물의 전반적 수율을 증가시킨다.75 최근, 이 전략은 비-표적 가닥에 상보적인 ssDNA 공여자의 사용 및 HDR의 효율을 실질적으로 증가시키는 고-효율 리보핵단백질 (RNP) 전달에 결합되었지만, 심지어 이들 경우에도, HDR 대 NHEJ 결과의 비는 상대적으로 낮다 (< 2).83
DNA 백본 절단을 요구하지 않는 프로그램가능한 표적 유전자좌에서 하나의 핵염기의 또 다른 것으로의 전환의 직접적 촉매작용은 관심 유전자좌에서 목적하지 않은 무작위 indel을 도입하지 않는 HDR에 비한 유전자 교정의 효율을 증가시킬 수 있는 것으로 고려되었다. 그의 뉴클레아제 활성을 불활성화시키는 Asp10Ala 및 His840Ala 돌연변이를 함유하는 촉매적 데드 Cas9 (dCas9)는 가이드 RNA-프로그램된 방식으로 DNA에 결합하는 그의 능력을 보유하지만, DNA 백본을 절단하지 않는다.16,47 원칙적으로, 하나의 핵염기의 또 다른 것으로의 직접적 전환을 매개하는 효소적 또는 화학적 촉매와의 dCas9의 접합은 RNA-프로그램된 핵염기 편집을 가능하게 할 수 있다. 시토신 (C)의 탈아미노화는 시티딘 데아미나제에 의해 촉매되고29, 우라실 (U)을 발생시키며, 이는 티민 (T)의 염기 쌍형성 특성을 갖는다. 가이드 RNA-특정된 DNA 유전자좌에서 C를 U로 전환시키는 그의 능력을 시험하기 위해, dCas9를 시티딘 데아미나제 효소에 융합시켰다. 대부분의 공지된 시티딘 데아미나제는 RNA 상에서 작동하며, DNA를 수용하는 것으로 공지된 소수의 예는 단일-가닥 DNA를 요구한다.48 dCas9-표적 DNA 복합체에 대한 최근의 연구는 대체된 DNA 가닥의 적어도 9개의 뉴클레오티드가 Cas9:가이드 RNA:DNA "R-루프" 복합체의 형성시 쌍형성되지 않는다는 것을 밝혀낸다.12 사실, Cas9 R-루프 복합체의 구조에서, 대체된 DNA 가닥 상의 프로토스페이서의 최초 11개의 뉴클레오티드는 무질서하며, 이는 그의 이동이 매우 제한되지 않음을 시사한다.76 또한, 비-주형 가닥에서의 시토신에서 Cas9 니카제-유도된 돌연변이는 세포의 시티딘 데아미나제 효소에 의한 그의 접근가능성으로부터 발생할 수 있다고 추측되었다.77 dCas9-표적 DNA 복합체에 대한 최근의 연구는 비-주형 가닥 상의 적어도 26개의 염기가 Cas9가 그의 표적 DNA 서열에 결합하는 경우 쌍형성되지 않음을 밝혀내었다.49 R-루프에서의 단일-가닥 DNA의 이 스트레치의 하위세트는 dCas9-테더링된 시티딘 데아미나제가 DNA에서 C의 U로의 직접적, 프로그램가능한 전환을 실시하기 위한 기질로서 기능할 수 있다고 추론되었다 (도 11a).
4가지 상이한 시티딘 데아미나제 효소 (hAID, hAPOBEC3G, rAPOBEC1, 및 pmCDA1)를 포유동물 세포 용해물-유래된 시험관내 전사-번역 시스템에서 발현시키고, ssDNA 탈아미노화에 대해 평가하였다. 4가지 효소 중에서, rAPOBEC1은 시험된 조건 하에서 가장 높은 데아미나제 활성을 나타내었으며, dCas9 융합 실험을 위해 선택되었다 (도 36a). rAPOBEC1을 dCas9의 C-말단에 첨부하는 것은 데아미나제 활성을 폐지하지만, dCas9의 N-말단에의 융합은 ssDNA에 대한 데아미나제 활성을 비융합된 효소의 것과 대등한 수준에서 보존한다. 4가지 rAPOBEC1-dCas9 융합물을 발현시키고, 상이한 길이 및 조성의 링커로 정제하고 (도 36b), 각각의 융합물을 단일 가이드 RNA (sgRNA)-프로그램된 dsDNA 탈아미노화에 대해 시험관내에서 평가하였다 (도 11a 내지 11c 및 도 15a 내지 15d).
효율적인, 서열-특이적, sgRNA-의존성 C에서 U로의 전환이 시험관내에서 관찰되었다 (도 11a 내지 11c). 전환 효율은 9개 아미노산 길이에 걸친 rAPOBEC1-dCas9 링커를 사용한 것이 가장 컸다. 탈아미노화에 감수성인 위치 (탈아미노화 "활성 윈도우")의 수는 링커 길이가 3에서 21개 아미노산으로 확장됨에 따라 증가한다 (도 36c 내지 36f, 15a 내지 15d). 16-잔기 XTEN 링커50는 이들 2가지 특징 사이의 유망한 균형을 제공하는 것으로 밝혀졌으며, 프로토스페이서-인접 모티프 (PAM)에 원위인 말단을 위치 1로서 카운팅하여 프로토스페이서 내의 위치 4 내지 8에서 대략 5개의 뉴클레오티드의 효율적인 탈아미노화 윈도우를 갖는다. rAPOBEC1-XTEN-dCas9 단백질은 제1-세대 핵염기 편집제 (NBE1)로서 기능하였다.
이론적으로 C에서 T로의 핵염기 편집에 의해 교정될 수 있는 인간 질환과 관련된 7가지 돌연변이를 선택하고, 상응하는 서열의 이중-가닥 DNA 80량체를 합성하고, 시험관내에서 이들 돌연변이를 교정하는 NBE1의 능력을 평가하였다 (도 16a 내지 16b). NBE1은 시험관내에서 이들 7개의 표적 중 6개에서, 표적 C의, 또는 다중 C가 존재한 경우 활성 윈도우 내의 적어도 1개의 C의 효율적인 편집과 일치하는 생성물을 수득하였으며, 평균 겉보기 편집 효율은 44%였다 (도 16a 내지 16b). 다중 C가 탈아미노화 윈도우 내에 존재한 3가지 경우에, 이들 시토신의 일부 또는 전부의 탈아미노화의 증거가 관찰되었다. 시험된 7가지 경우 중 단지 1가지에서, 편집된 생성물의 실질적인 수율이 관찰되었다 (도 16a 내지 16b). APOBEC1 기질에 대한 바람직한 서열 컨텍스트는 CC 또는 TC인 것으로 보고되어 있지만,51 표적 유전자좌에 결합하는 dCas9에 의해 매개되는 데아미나제 및 그의 단일-가닥 DNA 기질의 증가된 유효 몰농도는 이 제한을 완화시킬 수 있는 것으로 예상되었다. NBE1의 서열 컨텍스트 일반성을 조명하기 위해, 프로토스페이서 내의 위치 7에 단일 고정된 C를 함유하는 60량체 이중-가닥 DNA 올리고뉴클레오티드, 뿐만 아니라 프로토스페이서 염기 1 내지 6 및 8 내지 13이 다른 3개의 염기의 각각으로 개별적으로 다양화된 모든 36개의 단일 돌연변이된 변이체를 편집하는 그의 능력을 검정하였다. 이들 37개의 서열의 각각을 1.9 μM NBE1, 1.9 μM의 상응하는 sgRNA, 및 125 nM DNA로 2시간 동안, 시험관내 Cas9 검정에 대한 표준 조건과 유사하게 처리하였다52. 고처리량 DNA 서열분석 (HTS)은 표적화된 가닥의 50 내지 80% C에서 U로의 전환을 밝혀내었다 (둘 다의 DNA 가닥 (이들 중 하나는 NBE1에 대한 기질이 아님)으로부터 발생한 총 서열 판독물의 25 내지 40%) (도 12a). 표적 C 주위의 뉴클레오티드는 표적 C의 바로 5'의 염기가 G가 아니라면 서열 컨텍스트에 독립적인 편집 효율에 거의 효과를 갖지 않았으며, 이 경우, 편집 효율은 실질적으로 더 낮았다 (도 12a 내지 12b). 시험관내에서의 NBE1 활성을 프로토스페이서 내의 위치 1 내지 8에서 모든 4개의 NC 모티프에 대해 평가하였다 (도 12a 내지 12b). 일반적으로, 기질에 대한 NBE1 활성은 순서 TC ≥ CC ≥ AC >GC를 따르는 것으로 관찰되었으며, 최대 편집 효율은 표적 C가 위치 7에 또는 부근에 있는 경우 달성되었다. 또한, 핵염기 편집제는 매우 혁신적인 것으로 관찰되었으며, 5-염기 활성 윈도우 내에서 동일한 DNA 가닥 상에서 모든 C의 대부분을 U로 효율적으로 전환시킬 것이다 (도 17).
BE1은 시험 튜브에서 기질을 효율적으로 프로세싱하는 반면, 세포에서, 가능한 DNA 복구 결과물의 트리는 염기 편집의 초기 U:G 생성물의 운명을 결정한다 (도 29a). 인간 세포에서의 핵염기 편집의 유효성을 시험하기 위해, NBE1 코돈 용법을 포유동물 발현에 대해 최적화하고, C-말단 핵 국재화 서열 (NLS)을 첨부하고,53 인간 게놈 전반에 걸쳐 6개의 널리 연구된 표적 부위에서 14개의 C 상의 인간 세포에서 C를 T로 전환시키는 그의 능력을 검정하였다 (도 37a).54 NBE1을 6개의 상이한 게놈 부위에 상응하는 합성 80량체와 함께 인큐베이션한 후, HTS함으로써 편집가능한 C를 시험관내에서 각각의 프로토스페이서 내에서 확인하였다 (도 13a 내지 13c, 도 29b 및 도 25). 다음으로, HEK293T 세포를 NBE1 및 6개의 표적 sgRNA 중 1개를 코딩하는 플라스미드로 형질감염시키고, 3일 동안 핵염기 편집이 일어나게 하고, 게놈 DNA를 세포로부터 추출하고, 유전자좌를 HTS에 의해 분석하였다. 표적 유전자좌에서 세포에서의 C에서 T로의 편집은 모든 6가지 경우에 대해 관찰되었지만, 핵염기 편집의 효율은 총 DNA 서열의 1.1% 내지 6.3% 또는 0.8% 내지 7.7% (표적화된 가닥의 2.2% 내지 12.6%에 상응함)이며, 시험관내 핵염기 편집의 그것에 비해 효율의 6.3-배 내지 37-배 또는 5-배 내지 36-배 감소였다 (도 13a 내지 13c, 도 29b 및 도 25). T가 기질 C에 선행하는 경우 위치 4 내지 8의 전형적인 윈도우의 외부의 일부 염기 편집이 관찰되었으며, 본 발명자들은 이를 TC 기질에 대한 APOBEC1의 비통상적으로 높은 활성에 기인한다고 본다.48
U:G 헤테로듀플렉스 DNA의 존재에 대한 세포의 DNA 복구 반응이 세포에서의 핵염기 편집 효율의 큰 감소의 원인인지 질문하였다 (도 29a). 우라실 DNA 글리코실라제 (UDG)는 세포에서 DNA로부터 U의 제거를 촉매하며, 염기 절제 복구 (BER)를 개시하고, U:G 쌍의 C:G 쌍으로의 복귀가 가장 통상적인 결과물이다 (도 29a).55 비. 서브틸리스 박테리오파지 PBS1로부터의 83-잔기 단백질인 우라실 DNA 글리코실라제 억제제 (UGI)는 인간 UDG 활성을 강력하게 차단한다 (IC50 = 12 pM).56 UGI를 NBE1의 C-말단에 융합시켜 제2-세대 핵염기 편집제 NBE2를 생성하고, 모든 6개의 게놈 유전자좌에 대한 편집 검정을 반복하였다. 인간 세포에서의 편집 효율은 NBE1에서보다 NBE2에서 평균 3-배 더 높았으며, 이는 서열분석된 총 DNA의 22.8% 이하 (표적화된 가닥의 45.6% 이하)의 유전자 전환 효율을 발생시킨다 (도 13a 내지 13c 및 도 29b). 인간 세포에서의 염기 편집을 시험하기 위해, BE1 코돈 용법을 포유동물 발현에 대해 최적화하고, C-말단 핵 국재화 서열 (NLS)을 첨부하였다.53
UGI를 과다발현하는 별개의 플라스미드를 NBE1과 공동-형질감염시켰을 경우, 유사한 편집 효율이 관찰되었다 (도 18a 내지 18h). 그러나, NBE1에의 UGI의 직접적 융합은 모니터링된 비-표적화된 게놈 위치에서 C에서 T로의 돌연변이의 유의한 증가를 발생시키지 않은 반면, 비융합된 UGI의 과다발현은 게놈의 다른 곳에서 C에서 T로의 돌연변이의 빈도를 검출가능하게 증가시켰다 (도 18a 내지 18h). NBE2-매개된 핵염기 편집의 일반성을 U2OS 세포에서의 동일한 6개의 게놈 표적에 대한 편집 효율을 평가함으로써 확인하고, HEK293T 세포에서의 것들과 유사한 결과를 관찰하였다 (도 19). 중요하게는, NBE2는 전형적으로 임의의 검출가능한 indel을 발생시키지 않았으며 (도 13c 및 도 29c), 이는 이중-가닥 DNA 파괴에 대한 NHEJ의 공지된 기계론적 의존성과 일치한다.57,78 함께, 이들 결과는 UGI를 NBE1에 접합시키는 것이 인간 세포에서의 핵염기 편집의 효율을 크게 증가시킬 수 있다는 것을 나타낸다.
인간 세포에서의 핵염기 편집의 영구성을, 시험된 게놈 유전자좌 중 2개에서 HEK293T 세포에서의 다중 세포 분열에 걸친 편집 효율을 모니터링함으로써 확인하였다. 게놈 DNA를 2개의 시점에서 수거하였다: NBE2 및 적절한 sgRNA를 발현하는 플라스미드로의 형질감염 후 3일, 및 세포를 계대하고, 그들을 추가의 4일 동안 성장시킨 (대략 5회의 후속적 세포 분열) 후. 비-계대된 세포 (편집은 3개의 상이한 표적 C에 대한 표적화된 가닥의 4.6% 내지 6.6%에서 관찰됨) 및 계대된 세포 (편집은 동일한 3개의 표적 C에 대한 표적화된 가닥의 4.6% 내지 6.4%에서 관찰됨) 사이에 편집 효율의 유의한 변화는 관찰되지 않았으며, 이는 핵염기 편집이 세포 분열 후 영구적이 된다는 것을 확인시켜 준다 (도 20). indel은 드문 경우에 세포의 복구 과정에 의한 U:G 병변의 프로세싱으로부터 발생할 것이며, 이는 indel을 발생시키는 것으로 공지된 단일-가닥 파괴 중간체를 포함한다.84 수백개의 내인성 U:G 병변이 자발적 시티딘 데아미나제로부터 인간 세포당 매일 생성된다는 것을 고려할 때,85 U:G 병변 복구로부터의 총 indel 빈도는 단일 표적 유전자좌에서 BE1 또는 BE2 활성을 증가시킬 가능성이 적을 것으로 예상되었다.
세포에서의 핵염기 편집의 효율을 추가로 증가시키기 위해, 비-편집된 가닥을 니킹시키는 것은, 진핵생물 미스매치 복구 기구가 미스매칭된 듀플렉스의 임의의 파괴된 가닥에 대한 직접적 DNA 복구에 대한 가닥 불연속성을 사용하기 때문에, 세포에 의해 제거되는 보다 작은 분율의 편집된 U를 발생시킬 수 있을 것으로 예상되었다 (도 29a).58, 79, 80 촉매 His 잔기는 Cas9 HNH 도메인에서의 위치 840에서 복원되었으며,47,59 이는 표적화된 C에 대향하는 G를 함유하는 비-편집된 가닥을 니킹하지만, C를 함유하는 표적 가닥을 절단하지 않는 제3-세대 핵염기 편집제 NBE3을 발생시킨다. NBE3은 Cas9에서의 Asp10Ala 돌연변이를 여전히 함유하기 때문에, 이는 이중-가닥 DNA 절단을 유도하지 않는다. 비-편집된 가닥을 니킹하는 이 전략은 인간 세포에서의 핵염기 편집 효율을 NBE2에 비해 추가의 1.4- 내지 4.8-배 증강시켰으며, 이는 HEK293T 세포에서의 동일한 6개의 인간 게놈 표적 상에 표적화된 C에서 T로의 전환을 함유하는 총 DNA 서열의 36.3% 이하를 발생시킨다 (도 13a 내지 13c 및 도 29b). 중요하게는, 평균 0.8% (6개의 상이한 유전자좌에 대해 0.2% 내지 1.6%의 범위)의 단지 작은 빈도의 indel이 NBE3 처리로부터 관찰되었다 (도 13c, 도 29c, 및 도 34). 대조적으로, 세포를 야생형 Cas9, sgRNA, 및 단일-가닥 DNA 공여자 주형으로 처리하여 이들 유전자좌 중 3개에서 HDR을 매개한 경우, 평균 단지 0.7%의 C에서 T로의 전환 효율이 관찰되었으며, 평균 3.9%의 indel 형성에 비해 훨씬 더 높았다 (도 13a 내지 13c 및 도 29c). 대립유전자 전환 대 NHEJ 결과물의 비는 BE2에 대해 평균 >1,000, BE3에 대해 23, 및 야생형 Cas9에 대해 0.17 초과였다 (도 3c). 본 발명자들은 HEK293 부위 3 및 4 게놈 유전자좌에서 HEK293T 세포에서의 다중 세포 분열에 걸친 편집 효율을 모니터링함으로써 인간 세포에서의 염기 편집의 영구성을 확인하였다 (도 38). 이들 결과는 집합적으로 핵염기 편집이 Cas9-매개된 HDR보다 인간 세포에서 훨씬 더 효율적인 표적화된 단일-염기 편집을 실시할 수 있으며, 훨씬 적거나 (NBE3), 없는 (NBE2) indel 형성을 갖는다는 것을 확립한다.
다음으로, 인간 세포에서의 NBE1, NBE2, 및 NBE3의 오프-타겟 활성을 평가하였다. Cas9, dCas9, 및 Cas9 니카제의 오프-타겟 활성은 광범위하게 연구되었다 (도 23 내지 24 및 31 내지 33).54,60-62 rAPOBEC1의 서열 선호도는 도 12a 내지 12b에서 관찰된 서열 컨텍스트 독립성과 일치하는 표적 C로부터 1개 초과의 염기의 DNA 염기에 독립적인 것으로 나타났기 때문에,63 핵염기 편집제의 잠재적 오프-타겟 활성은 오프-타겟 Cas9 결합으로부터 발생하는 것으로 가정되었다. 단지 한 부분의 Cas9 오프-타겟 부위만이 핵염기 편집을 위한 활성 윈도우 내에 C를 가질 것이기 때문에, 오프-타겟 핵염기 편집 부위는 정규 Cas9 변이체의 오프-타겟 부위의 하위세트이어야 한다. 연구된 6개의 부위의 각각에 대해, GUIDE-seq 방법을 사용하여 이전에 측정된 인간 세포에서의 상부 10개의 공지된 Cas9 오프-타겟 유전자좌를 서열분석하였다 (도 23 내지 27 및 31 내지 33).54, 61 공지된 dCas9 오프-타겟 유전자좌의 단지 하위세트에서의 검출가능한 오프-타겟 핵염기 편집 (NBE1 및 NBE2에 대해 16/34, 47%, 및 NBE3에 대해 17/34, 50%)이 관찰되었다. 모든 경우, 오프-타겟 염기-편집 기질은 5-염기 표적 윈도우 내에 C를 함유하였다. 일반적으로, 오프-타겟 C에서 T로의 전환은 오프-타겟 Cas9 뉴클레아제-매개된 게놈 변형 빈도와 평행하였다 (도 23 내지 27). 또한, 시험된 6개의 온-타겟 및 34개의 오프-타겟 유전자좌 주위의 2,500개의 별개의 시토신에서 C에서 T로의 전환을 모니터링하였으며, 이는 대략 1.8x106개의 세포로부터 유래된 총 14,700,000개의 서열 판독물을 나타내고, 비처리된 세포의 것에 비해 NBE1, NBE2, 또는 NBE3 처리시 이들 다른 부위 중 임의의 것에서 C에서 T로의 전환의 검출가능한 증가는 관찰되지 않았다 (도 28). 종합하면, 이들 발견은 핵염기 편집제의 오프-타겟 기질이 Cas9 오프-타겟 기질의 하위세트를 포함하고, 인간 세포에서의 핵염기 편집제가 여기서 사용된 방법에 의해 검출될 수 있는 수준에서 게놈 전반에 걸쳐 비표적화된 C에서 T로의 전환을 유도하지 않음을 시사한다. 비-계대된 HEK293T 세포 (편집은 BE2로는 3개의 표적 C에 대해 서열분석된 가닥의 1.8% 내지 2.6%, 및 BE3으로는 6.2% 내지 14.3%에서 관찰됨) 및 염기 편집 후 대략 5회의 세포 분열을 겪은 세포 (편집은 BE2로는 동일한 표적 C에 대해 서열분석된 가닥의 1.9% 내지 2.3%, 및 BE3으로는 6.4% 내지 14.5%에서 관찰됨) 사이에 편집 효율의 실질적인 변화는 관찰되지 않았으며, 이는 이들 세포에서의 염기 편집이 내구성이 있다는 것을 확인시켜 준다 (확장된 데이터 도 6).
마지막으로, 포유동물 세포에서의 3가지 질환-관련 돌연변이를 교정하는 핵염기 편집의 잠재력을 시험하였다. 아포지단백질 E 유전자 변이체 APOE4는 아미노산 위치 112 및 158에서 2개의 Arg 잔기를 코딩하며, 후기-발병 알츠하이머병에 대한 가장 크고 가장 통상적인 유전적 위험 인자이다.64 APOE2 (Cys112/Cys158), APOE3 (Cys112/Arg158), 및 APOE3' (Arg112/Cys158)를 포함한 위치 112 또는 158에 Cys 잔기를 갖는 ApoE 변이체는 APOE4보다 실질적으로 더 낮은 알츠하이머병 위험을 부여하는 것으로 나타났거나,65 그렇게 추정되었다.81 시험관내에서 APOE4를 APOE3'로 전환시키는 NBE1의 능력에 의해 고무되어 (도 16a 내지 16b), 이 전환은 내인성 뮤린 APOE 유전자가 인간 APOE4에 의해 대체된 불멸화 마우스 성상세포 (타코닉(Taconic))에서 시도되었다. NBE3 및 적절한 sgRNA를 코딩하는 DNA를 뉴클레오펙션에 의해 이들 성상세포 내로 전달하고 (25%의 뉴클레오펙션 효율), 게놈 DNA를 2일 후 모든 처리된 세포로부터 추출하고, 편집 효율을 HTS에 의해 측정하였다. Arg158의 Cys158로의 전환이 총 DNA 서열분석 판독물의 58 내지 75% (뉴클레오펙션된 성상세포의 44%)에서 관찰되었다 (도 14a 내지 14c 및 도 30a). 또한, 이들 C 중 모든 3개가 활성 핵염기 편집 윈도우 내에 있기 때문에 예상된 바와 같이, 코돈 158의 제3 위치에서 총 DNA의 36 내지 50% 편집 및 Leu159의 제1 위치에서 총 DNA의 38 내지 55% 편집이 관찰되었다. 그러나, 다른 2개의 C→T 전환 중 어느 것도 ApoE3' 단백질의 아미노산 서열의 변화를 발생시키지 않는데, 이는 TGC 및 TGT 둘 다가 Cys를 코딩하고, CTG 및 TTG 둘 다가 Leu를 코딩하기 때문이다. 1x106개의 세포로부터 유래된 1,500,000개 초과의 서열분석 판독물로부터, NBE3 처리 후 표적화된 유전자좌에서 1.7% indel의 증거가 관찰되었다 (도 35). 대조적으로, 야생형 Cas9 및 공여자 ssDNA로의 성상세포의 동일한 처리는 표적화된 유전자좌에서 0.1 내지 0.3% APOE4 교정 및 26 내지 40% indel을 발생시켰으며, 이는 Cas9 및 HDR을 사용한 단일-염기 교정의 이전의 보고와 일치하는 효율이다45,75 (도 30a 및 도 40a). 동일하게 처리되었지만 VEGFA 유전자좌를 표적화하는 sgRNA를 갖는 성상세포는 APOE4 염기 편집의 증거를 나타내지 않았다 (도 34 및 도 40a). 이들 결과는 어떻게 핵염기 편집제가, 심지어 그의 프로세싱성이 게놈 DNA에서 1개 초과의 뉴클레오티드 변화를 발생시키는 경우에도, 편집의 주요 생성물로서 단백질의 코딩 서열의 정확한, 단일-아미노산 변화를 실시할 수 있는 지를 입증한다. Cas9, dCas9, 및 Cas9 니카제의 오프-타겟 활성은 광범위하게 연구되었다.54, 60-62 일반적으로, BE1, BE2, 및 BE3에 의한 오프-타겟 C에서 T로의 전환은 오프-타겟 Cas9 뉴클레아제-매개된 게놈 변형 빈도와 평행하였다.
우성-음성 p53 돌연변이 Tyr163Cys 및 Asn239Asp는 여러 유형의 암과 강하게 연관된다.66-67 이들 돌연변이 둘 다는 주형 가닥 상에서 C에서 T로의 전환에 의해 교정될 수 있다 (도 16a 내지 16b). p53 Tyr163Cys 돌연변이에 대해 동형접합성인 인간 유방암 세포주 (HCC1954 세포)를 Tyr163Cys를 교정하도록 프로그램된 NBE3 및 sgRNA을 코딩하는 DNA로 뉴클레오펙션시켰다. HCC1954 세포의 뉴클레오펙션 효율은 10% 미만이었기 때문에, IRFP를 발현하는 플라스미드를 이들 세포 내로 공동-뉴클레오펙션시켜, 처리 2일 후에 형광-활성화된 세포 분류에 의해 뉴클레오펙션된 세포의 단리를 가능하게 하였다. 게놈 DNA의 HTS는 뉴클레오펙션된 HCC1954 세포의 7.6%에서 Tyr163Cys 돌연변이의 교정을 밝혀내었다 (도 30b 및 도 40a 내지 40b). 또한, p53 Asn239Asp에 대해 이형접합성인 인간 림프종 세포주 (ST486 세포)를 Asn239Asp를 교정하도록 프로그램된 NBE2 및 sgRNA를 코딩하는 DNA로 92% 뉴클레오펙션 효율로 뉴클레오펙션시켰다. Asn239Asp 돌연변이의 교정은 처리된 ST486 세포의 11% (뉴클레오펙션된 ST486 세포의 12%)에서 관찰되었다. HEK 세포에서의 발견과 일치하게, ST486 세포의 NBE2로의 처리로부터 indel이 관찰되지 않았으며, HCC1954 세포의 NBE3으로의 처리로부터 0.6% indel 형성이 관찰되었다. 프로토스페이서의 양 측의 적어도 50개 염기 쌍 내에 다른 DNA 변화는 2x105개의 세포로부터 유래된 2,000,000개 초과의 서열분석 판독물 중에서 비처리된 대조군의 것 초과의 빈도에서 검출되지 않았다 (도 14a 내지 14c, 도 30b). 이들 결과는 집합적으로, 본 발명자들의 지식으로, 다른 방법을 사용하여 현재 달성가능하지 않은 효율 및 다른 게놈 변형 사건의 결여를 갖는, 게놈 DNA에서의 3가지 질환-연관된 대립유전자의 그의 야생형 형태로의 전환을 나타낸다.
인간 유전 질환을 다루기 위한 핵염기 편집제의 잠재적 타당성을 조명하기 위해, NCBI 클린바 데이터베이스68를 원칙적으로 이 접근법에 의해 교정될 수 있는 공지된 유전 질환에 대해 조사하였다. 클린바를, 먼저 단지 단일 뉴클레오티드 다형성 (SNP)을 조사한 후, 임의의 비병원성 변이체를 제거함으로써 필터링하였다. 24,670개의 병원성 SNP 중에서, 3,956개는 T에서 C로의, 또는 A에서 G로의 치환 중 어느 하나에 의해 유발된다. 이 목록을, SNP를 탈아미노화 활성 윈도우 내에 위치시킬 인근의 NGG PAM을 갖는 변이체만을 포함하도록 필터링하였으며, 이는 원칙적으로 여기에 기재된 핵염기 편집제에 의해 교정될 수 있는 1,089개의 임상적으로 관련된 병원성 유전자 변이체를 발생시킨다 (도 21).
일부 실시양태에서, 본원에 제공된 염기 편집제 중 임의의 것은 질환 또는 장애를 치료하는 데 사용될 수 있다. 예를 들어, 본원에 제공된 임의의 염기 편집제는 본원에 제공된 질환 또는 장애 중 임의의 것과 연관된 1개 이상의 돌연변이를 교정하는 데 사용될 수 있다. 치료될 수 있는 예시적인 질환 또는 장애는 비제한적으로 3-메틸글루타콘산 산뇨 유형 2, 46,XY 생식선 이발생증, 4-알파-히드록시페닐피루베이트 히드록실라제 결핍, 6-피루보일-테트라하이드로프테린 신타제 결핍, 완전색맹, 산-불안정성 서브유닛 결핍, 선단이골증, 말단홍색각피증, ACTH 저항성, ACTH-독립성 대결절성 부신 증식증, 활성화 PI3K-델타 증후군, 급성 간헐성 포르피린증, 급성 골수성 백혈병, 아담스-올리버 증후군 1/5/6, 아데닐로숙시네이트 리아제 결핍, 부신백질이영양증, 성인 신경 세로이드 리포푸신증, 안구운동 실시증을 갖는 성인 발병 운동실조, 전진성 수면 위상 증후군, 연령-관련 황반 변성, 알라질 증후군, 알렉산더병, 알란-헌던-더들리 증후군, X-연관 열성 알포트 증후군, 소아기 교대 편마비, 폐정맥의 오정렬을 갖는 폐포 모세관 이형성증, 불완전 법랑질형성, 아밀로이드생성 트랜스티레틴 아밀로이드증, 근위축성 측삭 경화증, 빈혈 (G6PD 결핍으로 인한 비구형 용혈성), 빈혈 (상염색체 열성 피리독신-불응성 철적아구성), 무조증, 항트롬빈 III 결핍, 대동맥류, 재생불량성 빈혈, 아포지단백질 C2 결핍, 겉보기 미네랄로코르티코이드 과잉, 아로마타제 결핍, 부정맥유발성 우심실 심근병증, 가족성 비대성 심근병증, 비대성 심근병증, 선천성 다발성 관절구축, 아스파르틸글라이코사민뇨, 질식형 가슴 이영양증, 비타민 E 결핍을 갖는 운동실조, 운동실조 (경직성), 심방 세동, 심방 중격 결손, 비정형 용혈성-요독성 증후군, 상염색체 우성 CD11C+/CD1C+ 수지상 세포 결핍, 미토콘드리아 DNA 결실을 갖는 상염색체 우성 진행성 외안근마비, 바라이트서-윈터 증후군, 바터 증후군, 기저 신경절 석회화, 베크위드-위드만 증후군, 양성 가족성 신생아 발작, 양성 견갑골 비골 근육 이영양증, 버나드 술리에 증후군, 베타 중간성 지중해빈혈, 베타-D-만노시드축적증, 비에티 결정질 각막망막 이영양증, 담즙산 흡수장애, 바이오티니다제 결핍, 보제슨-포스만-레만 증후군, 부셰 노이하우저 증후군, 보언-콘라디 증후군, 단지증, 브라운-비알레토-반 라에레 증후군, 브루가다 증후군, 심장 부정맥, 심장얼굴피부 증후군, 심근병증, 카르네발레 증후군, 카르니틴 팔미토일트랜스퍼라제 II 결핍, 카펜터 증후군, 백내장, 카테콜아민 다형성 심실성 빈맥, 중심핵병, 염색체 1,9 및 16의 중심립 불안정성 및 면역결핍, 뇌 상염색체 우성 동맥병증, 뇌-눈-얼굴-골격 증후군, 세로이드 리포푸신증, 샤르코-마리-투스병, 콜레스타놀 축적 질환, 연골석회증, 연골영양장애, 만성 진행성 다발성 경화증, 조효소 Q10 결핍, 코헨 증후군, 인자 V 및 인자 VIII의 복합 결핍, 복합 면역결핍, 복합 산화성 인산화 결핍, 복합 부분적 17-알파-히드록실라제/17,20-리아제 결핍, 보체 인자 d 결핍, 완전 복합 17-알파-히드록실라제/17,20-리아제 결핍, 추체-간체 이영양증, 선천성 구축성 거미가락증, 글리코실화의 선천성 장애, 선천성 지방종증성 과도성장, 난소의 신생물, PIK3CA 관련된 과도성장 스펙트럼, 선천성 긴 QT 증후군, 선천성 근육 이영양증, 선천성 근육 비대-뇌 증후군, 선천성 근무력 증후군, 섬유 유형 불균형을 갖는 선천성 근병증, 아이쉬펠트 유형 선천성 근육 이영양증, 선천성 비진행성 야맹증, 각막 이영양증, 코넬리아 드 랑쥐 증후군, 두개골골간단 이형성증, 크리글러 나자르 증후군, 크루존 증후군, 골이영양증을 갖는 이완성 피부증, 청색증, 낭성 섬유증, 시스틴축적증, 시토크롬-c 옥시다제 결핍, 미토콘드리아 복합체 I 결핍, D-2-히드록시글루타르산 산뇨, 다논병, 미로 무형성 작은귀증 및 작은치아증을 갖는 난청 (LAMM), 난청, 아세틸-코에이 아세틸트랜스퍼라제의 결핍, 페록시다제의 결핍, UDP글루코스-헥소스-1-포스페이트 유리딜일트랜스퍼라아제의 결핍, 데제린-소타스 질환, 데스부쿠오이스 증후군, DFNA, 당뇨병 유형 2, 당뇨병-난청 증후군, 다이아몬드-블랙판 빈혈, 이영양성 이형성증, 디하이드로프테리딘 리덕타제 결핍, 디하이드로피리미디나제 결핍, 확장성 심근병증, 파종성 비정형 미코박테리아 감염, 원위 관절구축, 원위 유전성 운동신경 뉴런병증, 돈나이 바로우 증후군, 뒤시엔느 근육 이영양증, 베커 근육 이영양증, 전신성 유전 색소이상, 선천성 이상각화증, 이상긴장증, 조기 영아 간질성 뇌병증, 엘러스-단로스 증후군, 아이쉬펠트 유형 선천성 근육 이영양증, 에머리-드레이퓨스 근육 이영양증, 에나멜-신장 증후군, 역성 위축성 수포성 표피박리증, 포진성 수포성 표피박리증, 간질, 간헐성 운동실조, 가변성 홍반각피증, 적혈구생성 프로토포르피린증, 운동 불내성, 삼출성 유리체망막병증, 파브리병, 인자 V 결핍, 인자 VII 결핍, 인자 xiii 결핍, 가족성 선종성 폴립증, 유방암, 난소암, 한랭 두드러기, 만성 영아 신경학적 피부 관절 증후군, 편마비성 편두통, 고콜레스테롤혈증, 비대성 심근병증, 저알파지단백혈증, 저칼륨혈증-저마그네슘혈증, 소아 통풍, 고지단백혈증, 내장 아밀로이드증, 저인산혈증 비타민 D 불응성 구루병, FG 증후군, 외안근의 섬유증, 핀란드 선천성 신증후군, 초점성 간질, 초점성 분절성 사구체경화증, 이마코 이형성증, 전두측두엽 치매, 프룩토스-바이포스파타제 결핍, 감스토르프-볼파르트 증후군, 강글리오시드 시알리다제 결핍, GATA-1-관련 혈소판감소증, 고셔병, 거대 축삭 신경병증, 글라즈만 혈소판무력증, 사구체낭성 신장 질환, 사구체병증, 글루코코르티코이드 저항성, 글루코스-6-포스페이트 수송 결손, 글루타르산 산뇨, 글리코겐 축적 질환, 골린 증후군, 완전전뇌증, 그라실 증후군, 출혈성 모세혈관확장증, 혈색소증, 헤모글로빈 H 질환, 용혈성 빈혈, 혈구포식성 림프조직구증식증, 결장의 암종, 미레 증후군, 백질뇌병증, 유전성 인자 IX 결핍 질환, 유전성 인자 VIII 결핍 질환, 유전성 인자 XI 결핍 질환, 유전성 프룩토스뇨증, 유전성 비용종증 결장직장 신생물, 유전성 췌장염, 유전성 열변형 적혈구증, 타원적혈구증, 내장위치이상증, 이소증, 조직구성 수질성 망상세포증다증, 조직구증-림프절병증 플러스 증후군, 알돌라제 A 결핍으로 인한 HNSHA, 호로카르복실라제 신테타제 결핍, 호모시스테인증, 호웰-에반스 증후군, 포상 기태, 고칼슘뇨성 고칼슘혈증, 과면역글로불린 D, 메발론산 산뇨, 고인슐린성 저혈당증, 고칼륨혈증성 주기성 마비, 폰 오일렌부르크의 선천성 이상근긴장증, 고지단백혈증, 고망간혈증, 고메티오닌혈증, 고포스파타제혈증, 고혈압, 저마그네슘혈증, 저베타지단백혈증, 저칼슘혈증, 저생식선자극성 생식선기능저하증, 저생식선자극성 생식선기능저하증, 땀저하 외배엽 이형성증, 고-IgM 면역결핍, 땀저하 X-연관 외배엽 이형성증, 저마그네슘혈증, 부갑상선기능저하증, 특발성 섬유화 폐포염, 면역결핍, 이뮤노글로불린 A 결핍, 영아 저포스파타제증, 영아 파킨슨증-이상긴장증, 인슐린 의존성 당뇨병, 중간성 메이플 시럽뇨 질환, 좌골슬개 이형성증, 도세포 증식증, 분리성 성장 호르몬 결핍, 분리성 루트로핀 결핍, 이소발레르산 산혈증, 주버트 증후군, 소아 폴립증 증후군, 소아 망막층간분리, 칼만 증후군, 카르타게너 증후군, 쿠겔베르그-벨란더 질환, 레티스 각막 이영양증, 레베르 선천성 흑암시, 레베르 시신경 위축, 좌심실 비조밀, 라이병, 미토콘드리아 복합체 I 결핍, 요정증 증후군, 관절구축, 전각 세포 질환, 백혈구 부착 결핍, 백질이영양증, 백질뇌병증, 난소백질이영양증, L-페리틴 결핍, 리-프라우메니 증후군, 지대형 근육 이영양증-디스트로글리칸병증, 로에이스-디에쯔 증후군, 긴 QT 증후군, 대두증/자폐 증후군, 황반 각막 이영양증, 황반 이영양증, 악성 고체온 민감성, 전립선의 악성 종양, 메이플 시럽뇨 질환, 마르덴 워커 유사 증후군, 마르팡 증후군, 마리 운나 유전성 털감소증, 비만 세포 질환, 태변성 장폐쇄증, 중간-쇄 아실-코엔자임 A 데히드로게나제 결핍, 멜닉-프레이저 증후군, 정신 지체, 메로신 결함성 선천성 근육 이영양증, 중피종, 이염성 백질이영양증, 골간단 연골영양장애, 메트헤모글로빈혈증, 메틸말론산 산뇨, 호모시스틴뇨증, 소두증, 맥락망막병증, 림프부종, 소안구증, 경도 비-PKU 고페닐알라닌혈증, 미첼-릴리 증후군, 미토콘드리아 3-히드록시-3-메틸글루타릴-코에이 신타제 결핍, 미토콘드리아 복합체 I 결핍, 미토콘드리아 복합체 III 결핍, 미토콘드리아 근병증, 점액지질증 III, 뮤코폴리사카라이드증, 다중 술파타제 결핍, 근무력 증후군, 미코박테리움 투베르쿨로시스, 미엘로퍼옥시다제 결핍, 미레 증후군, 근간대성 간질, 근원섬유성 근병증, 미오글로빈뇨증, 근병증, 근시, 선천성 근긴장증, 나바조 신경간병증, 네말린 근병증, 위의 신생물, 신원성 요붕증, 신결석증, 신증후군, 신경섬유종증, 중성 지질 축적 질환, 니만-피크 질환, 비-케톤성 고글라이신혈증, 누난 증후군, 누난 증후군-유사 장애, 노룸병, 황반 변성, N-말단 아세틸트랜스퍼라제 결핍, 눈피부 백색증, 눈코치아골격 이형성증, 오도 증후군, 시신경 무형성증, 오르니틴 카르바모일트랜스퍼라제 결핍, 입얼굴손발가락 증후군, 골형성 부전증, 골화석증, 난소 이상발육, 손발톱비대증, 비표피박리성 수장족저 각피증, 파피용-르페브르 증후군, 하임-멍크 증후군, 치주염, 피부 박피 증후군, 펜드레드 증후군, 퍼옥시솜 지방 아실-코에이 리덕타제 1 장애, 퍼옥시솜 생물발생 장애, 파이퍼 증후군, 페닐케톤뇨, 페닐케톤뇨, 비-PKU 고페닐알라닌혈증, 뇌하수체 호르몬 결핍, 모공성 홍색 비강진, 결절성 다발동맥염, 다낭성 신장 질환, 다낭성 지방막형성 골발육부전, 다왜소뇌회증, 교뇌소뇌 저형성증, 한공각화증, 후측 칼럼 운동실조, 원발성 지단홍통증, 과옥살산뇨증, 진행성 가족성 간내 담즙정체, 진행성 가성 류마티스 이형성증, 프로피온산 산혈증, 가성반음양증, 가성저알도스테론증, 가성황색종 탄성섬유-유사 장애, 퓨린-뉴클레오시드 포스포릴라제 결핍, 피리독살 5-포스페이트-의존성 간질, 신장 이형성증, 망막 색소형 이영양증, 소뇌 운동실조, 골격 이형성증, 망상 이발생증, 색소성 망막염, 어셔 증후군, 망막모세포종, 망막병증, RRM2B-관련 미토콘드리아 질환, 루빈스타인-타이비 증후군, 신더 결정질 각막 이영양증, 피지 종양, 중증 선천성 호중구감소증, 중증 영아기 근간대성 간질, 중증 X-연관 근세관성 근병증, 손발톱이형성증, 얼굴 이형증, 털감소증, 단락-늑골 가슴 이형성증, 시알산 축적 질환, 시알리다제결핍증, 철적혈모구성 빈혈, 소섬유 신경병증, 스미스-마제니스 증후군, 소르스비 안저 이영양증, 경직성 운동실조, 경직성 하반신마비, 정자발생 부전, 구상적혈구증, 스핑고미엘린/콜레스테롤 지질증, 척수소뇌성 운동실조, 갈림-손/발 기형, 척추골단골간단 이형성증, 편평추 치사성 골격 이형성증, 두경부의 편평 세포 암종, 스타르가르트병, 수크라제-이소말타제 결핍, 영아 돌연사 증후군, 판상부 대동맥 협착, 계면활성제 대사 기능장애, 탄지에르병, 타톤-브라운-라아만 증후군, 가슴 대동맥류 및 대동맥 박리, 혈전성향증, 갑상선 호르몬 저항성, TNF 수용체-연관 주기성 발열 증후군 (TRAPS), 치아 무발생증, 토르사드 드 포인트, 대동맥의 전위, 트리처 콜린스 증후군, 결절성 경화증 증후군, 티로시나제-음성 눈피부 백색증, 티로시나제-양성 눈피부 백색증, 티로신혈증, UDP글루코스-4-에피머라제 결핍, 울리히 선천성 근육 이영양증, 베스렘 근병증 어셔 증후군, UV-민감성 증후군, 반 데르 우드 증후군, 슬와 익상편 증후군, 초장쇄 아실-코에이 데히드로게나제 결핍, 방광요관 역류, 유리망막맥락막증, 폰 히펠-린다우 증후군, 폰 빌레브란트병, 바르덴부르크 증후군, 바르샤바 손상 증후군, WFS1-관련 장애, 윌슨병, 색소성 건피증, X-연관 무감마글로불린혈증, X-연관 유전성 운동 및 감각 신경병증, X-연관 중증 복합 면역결핍, 및 젤베거 증후군을 포함한다.
핵염기 편집의 개발은 게놈 편집의 범위 및 유효성 둘 다를 진전시킨다. 여기에 기재된 핵염기 편집제는 연구자들에게 사실상 indel 형성을 갖지 않는 편집 (NBE2), 또는 낮은 빈도 (여기서, 전형적으로 1% 이하)의 indel 형성을 갖는 보다 효율적인 편집 (NBE3)의 선택을 제공한다. 염기 편집의 생성물이 정의상 더 이상 기질이 아닌 것은 전통적인 Cas9 적용을 방해할 수 있는 후속의 생성물 형질전환을 방지함으로써 편집 효율에 기여할 가능성이 있다. 세포 상태 및 세포 유형에 의해 크게 다양한 이중-가닥 DNA 절단 및 확률적 DNA 복구 과정에 대한 의존성을 제거함으로써, 핵염기 편집은 깨끗하게 설치될 수 있는 게놈 변형의 유형, 및 이들 변형의 효율, 편집을 잘 받아들이는 세포의 유형을 확장하는 잠재력을 갖는다. 개선된 DNA 특이성을 갖는 최근의 조작된 Cas9 변이체69,70, 82 또는 전달 방법71, 뿐만 아니라 변경된 PAM 특이성을 갖는 Cas9 변이체72는 추가의 핵염기 편집제에게 개선된 DNA 특이성을 제공하는 이 전략 내로 통합될 수 있거나, 훨씬 더 넓은 범위의 질환-연관된 돌연변이를 표적화할 수 있는 가능성이 있다. 이들 발견은 또한 추가의 핵염기 형질전환을 촉매하는 효소로 dCas9의 추가의 융합물을 조작하는 것이 핵염기 편집을 통해 생성될 수 있는 가능한 DNA 염기 변화의 분율을 증가시킬 것임을 시사한다. 이들 결과는 또한 추가의 유형의 프로그램가능한 게놈 및 에피게놈 염기 편집을 가능하게 할 수 있는 메틸라제 및 데메틸라제를 포함한 다른 DNA-변형 효소의 융합을 위한 아키텍처를 시사한다.
물질 및 방법
클로닝. 이 명세서에 사용된 모든 구축물의 DNA 서열 및 프라이머는 보충적 서열에 열거된다. NBE1, NBE2, 및 NBE3을 코딩하는 유전자를 함유하는 플라스미드는 애드진으로부터 입수가능할 것이다. PCR을 베라섹 울트라(VeraSeq ULtra) DNA 폴리머라제 (엔지매틱스), 또는 Q5 핫 스타트(Hot Start) 고-충실도 DNA 폴리머라제 (뉴 잉글랜드 바이오랩스)를 사용하여 수행하였다. NBE 플라스미드를 USER 클로닝 (뉴 잉글랜드 바이오랩스)을 사용하여 구축하였다. 데아미나제 유전자를 g블록스(gBlocks) 유전자 단편 (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies))로서 합성하고, Cas9 유전자를 이전에 보고된 플라스미드로부터 수득하였다.18 데아미나제 및 융합 유전자를 pCMV (포유동물 코돈-최적화된) 또는 pET28b (이. 콜라이 코돈-최적화된) 백본 내로 클로닝하였다. sgRNA 발현 플라스미드를 부위-지정 돌연변이유발을 사용하여 구축하였다. 간략하게, 보충적 서열에 열거된 프라이머를 T4 폴리뉴클레오티드 키나제 (뉴 잉글랜드 바이오랩스)를 제조업체의 지침에 따라 사용하여 5' 인산화하였다. 다음으로, PCR을, 인산화된 프라이머 및 주형으로서 플라스미드 pFYF1320 (EGFP sgRNA 발현 플라스미드)을 갖는 Q5 핫 스타트 고-충실도 폴리머라제 (뉴 잉글랜드 바이오랩스)를 제조업체의 지침에 따라 사용하여 수행하였다. PCR 생성물을 DpnI (20 U, 뉴 잉글랜드 바이오랩스)과 함께 37℃에서 1시간 동안 인큐베이션하고, 퀴아프렙(QIAprep) 스핀 칼럼 (퀴아젠 (Qiagen)) 상에서 정제하고, 퀵리가제(QuickLigase) (뉴 잉글랜드 바이오랩스)를 제조업체의 지침에 따라 사용하여 라이게이션하였다. DNA 벡터 증폭을 Mach1 적격 세포 (써모피셔 사이언티픽(ThermoFisher Scientific))를 사용하여 수행하였다.
ssDNA에 대한 시험관내 데아미나제 검정. 모든 ssDNA 기질의 서열은 보충적 서열에 열거된다. 모든 Cy3-표지된 기질은 인테그레이티드 DNA 테크놀로지스 (IDT)로부터 얻었다. 데아미나제를 TNT T7 퀵 커플드 전사/번역 키트 (프로메가)를 제조업체의 지침에 따라 사용하여 1 μg의 플라스미드를 사용하여 시험관내에서 발현시켰다. 단백질 발현 후, 5 μL의 용해물을 컷스마트(CutSmart) 완충제 (뉴 잉글랜드 바이오랩스) (50 mM 아세트산칼륨, 29 mM 트리스아세테이트, 10 mM 아세트산마그네슘, 100 ug/mL BSA, pH 7.9) 중 35 μL의 ssDNA (1.8 μM) 및 USER 효소 (1 유닛)와 합하고, 37℃에서 2시간 동안 인큐베이션하였다. 절단된 U-함유 기질을 10% TBE-우레아 겔 (바이오-라드(Bio-Rad)) 상의 전장 비변형된 기질로부터 분할하였다.
His6-rAPOBEC1-링커-dCas9 융합물의 발현 및 정제. 이. 콜라이 BL21 STAR (DE3)-적격 세포 (써모피셔 사이언티픽)를 GGS, (GGS)3, (서열식별번호: 610) XTEN, 또는 (GGS)7 (서열식별번호: 610) 링커를 갖는 pET28b-His6-rAPOBEC-링커-dCas9를 코딩하는 플라스미드로 형질전환시켰다. 생성된 발현 균주를 밤새 100 μg/mL의 카나마이신을 함유하는 루리아-베르타니 (LB) 브로쓰에서 37℃에서 성장시켰다. 세포를 동일한 성장 배지 내로 1:100 희석하고, 37℃에서 OD600 = 약 0.6으로 성장시켰다. 배양물을 2시간의 기간에 걸쳐 4℃로 냉각시키고, 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG)를 0.5 mM에서 첨가하여 단백질 발현을 유도하였다. 약 16시간 후, 세포를 4,000 g에서의 원심분리에 의해 수집하고, 용해 완충제 (50 mM 트리스(히드록시메틸)-아미노메탄 (트리스 (Tris))-HCl, pH 7.0, 1 M NaCl, 20% 글리세롤, 10 mM 트리스(2-카르복시에틸)포스핀 (TCEP, 솔텍 벤처스(Soltec Ventures)))에 재현탁시켰다. 세포를 초음파처리 (20초 펄스-온, 20초 펄스-오프, 6 W 출력에서 총 8분 동안)에 의해 용해시키고, 용해물 상청액을 25,000 g에서 15분 동안의 원심분리 후 단리하였다. 용해물을 His-Pur 니켈-니트릴로아세트산 (니켈-NTA) 수지 (써모피셔 사이언티픽)와 함께 4℃에서 1시간 동안 인큐베이션하여 His-태그부착된 융합 단백질을 포획하였다. 수지를 칼럼에 옮기고, 40 mL의 용해 완충제로 세척하였다. His-태그부착된 융합 단백질을 285 mM 이미다졸로 보충된 용해 완충제에서 용리시키고, 한외여과 (아미콘-밀리포어(Amicon-Millipore), 100-kDa 분자량 컷-오프)에 의해 1 mL 총 부피로 농축시켰다. 단백질을 50 mM 트리스(히드록시메틸)-아미노메탄 (트리스)-HCl, pH 7.0, 0.1 M NaCl, 20% 글리세롤, 10 mM TCEP를 함유하는 저염 정제 완충제에 20 mL로 희석하고, SP 세파로스 고속 유동 수지 (지이 라이프 사이언시스(GE Life Sciences)) 상에 로딩하였다. 수지를 40 mL의 이 저염 완충제로 세척하고, 단백질을 50 mM 트리스(히드록시메틸)-아미노메탄 (트리스)-HCl, pH 7.0, 0.5 M NaCl, 20% 글리세롤, 10 mM TCEP를 함유하는 활성 완충제 5 mL로 용리시켰다. 용리된 단백질을 SDSPAGE 겔 상에서 정량화하였다.
sgRNA의 시험관내 전사. 20-bp sgRNA 표적 서열에 이어진 T7 프로모터를 함유하는 선형 DNA 단편을 보충적 서열에 열거된 프라이머를 사용하여 트랜스크립트에이드(TranscriptAid) T7 고 수율 전사 키트 (써모피셔 사이언티픽)로 제조업체의 지침에 따라 시험관내에서 전사하였다. sgRNA 생성물을 메가클리어(MEGAclear) 키트 (써모피셔 사이언티픽)를 제조업체의 지침에 따라 사용하여 정제하고, UV 흡광도에 의해 정량화하였다.
Cy3-접합된 dsDNA 기질의 제조. 80-뉴클레오티드 비표지된 가닥의 서열은 보충적 서열에 열거되며, IDT로부터 PAGE-정제된 올리고뉴클레오티드로서 주문하였다. 보충적 서열에 열거된 25-nt Cy3-표지된 프라이머는 각각의 80-nt 기질의 3' 말단에 상보적이다. 이 프라이머는 IDT로부터 HPLC-정제된 올리고뉴클레오티드로서 주문하였다. Cy3-표지된 dsDNA 기질을 생성하기 위해, 80-nt 가닥 (5 μL의 100 μM 용액)을 dNTP (0.75 μL의 100 mM 용액)를 갖는 NE완충제 2 (38.25 μL의 50 mM NaCl, 10 mM 트리스-HCl, 10 mM MgCl2, 1 mM DTT, pH 7.9 용액, 뉴 잉글랜드 바이오랩스) 중 Cy3-표지된 프라이머 (5 μL의 100 μM 용액)와 합하고, 95℃로 5분 동안 가열한 후, 0.1℃/초의 속도로 45℃로 점차 냉각시켰다. 이 어닐링 기간 후, 클레노브(Klenow) 엑소- (5 U, 뉴 잉글랜드 바이오랩스)를 첨가하고, 반응물을 37℃에서 1시간 동안 인큐베이션하였다. 용액을 완충제 PB (250 μL, 퀴아젠) 및 이소프로판올 (50 μL)로 희석하고, 50 μL의 트리스 완충제로 용리시키는 퀴아프렙 스핀 칼럼 (퀴아젠) 상에서 정제하였다.
dsDNA에 대한 데아미나제 검정. 정제된 융합 단백질 (활성 완충제 중 1.9 μM 20 μL)을 1 당량의 적절한 sgRNA와 합하고, 주위 온도에서 5분 동안 인큐베이션하였다. Cy3-표지된 dsDNA 기질을 125 nM의 최종 농도로 첨가하고, 생성된 용액을 37℃에서 2시간 동안 인큐베이션하였다. dsDNA를 완충제 PB (100 μL, 퀴아젠) 및 이소프로판올 (25 μL)의 첨가에 의해 융합물로부터 분리하고, 20 μL의 컷스마트 완충제 (뉴 잉글랜드 바이오랩스)로 용리시키는 이코노스핀(EconoSpin) 마이크로 스핀 칼럼 (에포치 라이프 사이언스(Epoch Life Science)) 상에서 정제하였다. USER 효소 (1 U, 뉴 잉글랜드 바이오랩스)를 정제된, 편집된 dsDNA에 첨가하고, 37℃에서 1시간 동안 인큐베이션하였다. Cy3-표지된 가닥을, 5 μL의 반응 용액을 15 μL의 DMSO-기반 로딩 완충제 (5 mM 트리스, 0.5 mM EDTA, 12.5% 글리세롤, 0.02% 브로모페놀 블루, 0.02% 크실렌 시안, 80% DMSO)와 합함으로써 그의 보체로부터 완전히 변성시켰다. 전장 C-함유 기질을 10% TBE-우레아 겔 (바이오-라드) 상의 임의의 절단된, U-함유 편집된 기질로부터 분리하고, 지이 아머샴 타이푼(GE Amersham Typhoon) 영상화기 상에서 영상화하였다.
고처리량 서열분석 (HTS)을 위한 시험관내-편집된 dsDNA의 제조. 보충적 서열에 열거된 올리고뉴클레오티드는 IDT로부터 수득하였다. 상보적 서열을 트리스 완충제 중에서 합하고 (5 μL의 100 μM 용액), 95℃로 5분 동안 가열함으로써 어닐링한 후, 0.1℃/초의 속도로 45℃로 점차 냉각시켜 60-bp dsDNA 기질을 생성하였다. 정제된 융합 단백질 (활성 완충제 중 1.9 μM 20 μL)을 1 당량의 적절한 sgRNA와 합하고, 주위 온도에서 5분 동안 인큐베이션하였다. 60량체 dsDNA 기질을 125 nM의 최종 농도로 첨가하고, 생성된 용액을 37℃에서 2시간 동안 인큐베이션하였다. dsDNA를 완충제 PB (100 μL, 퀴아젠) 및 이소프로판올 (25 μL)의 첨가에 의해 융합물로부터 분리하고, 20 μL의 트리스 완충제로 용리시키는 이코노스핀 마이크로 스핀 칼럼 (에포치 라이프 사이언스) 상에서 정제하였다. 생성된 편집된 DNA (1 μL는 주형으로서 사용됨)를 보충적 서열로 특정된 HTS 프라이머 쌍 및 베라섹 울트라 (엔지매틱스)를 제조업체의 지침에 따라 사용하여 13 주기의 증폭으로 PCR에 의해 증폭시켰다. PCR 반응 생성물을 래피드팁스(RapidTips) (디피니티 게노믹스(Diffinity Genomics))를 사용하여 정제하고, 정제된 DNA를 서열분석 어댑터를 함유하는 프라이머로 PCR에 의해 증폭시키고, 정제하고, 이전에 기재된 바와 같이 MiSeq 고처리량 DNA 시퀀서 (일루미나(Illumina)) 상에서 서열분석하였다.73
세포 배양. HEK293T (ATCC CRL-3216), U2OS (ATCC-HTB-96) 및 ST486 세포 (ATCC)를 10% (v/v) 소 태아 혈청 (FBS) 및 페니실린/스트렙토마이신 (1x, 암레스코(Amresco))으로 보충된 둘베코 변형 이글 배지(Dulbecco's Modified Eagle's Medium) 플러스 글루타맥스(GlutaMax) (써모피셔)에서 37℃에서 5% CO2로 유지하였다. HCC1954 세포 (ATCC CRL-2338)를 상기 기재된 바와 같이 보충된 RPMI-1640 배지 (써모피셔 사이언티픽)에서 유지하였다. APOE 유전자의 ApoE4 이소형을 함유하는 불멸화 래트 성상세포 (타코닉 바이오사이언시스(Taconic Biosciences))를 10% (v/v) 소 태아 혈청 (FBS) 및 200 μg/mL 제네티신 (써모피셔 사이언티픽)으로 보충된 둘베코 변형 이글 배지 플러스 글루타맥스 (써모피셔 사이언티픽)에서 배양하였다.
형질감염. HEK293T 세포를 48-웰 콜라겐-코팅된 바이오코트(BioCoat) 플레이트 (코닝(Corning)) 상에 시딩하고, 대략 85% 융합도에서 형질감염시켰다. 간략하게, 750 ng의 NBE 및 250 ng의 sgRNA 발현 플라스미드를 웰당 1.5 μL의 리포펙타민 2000 (써모피셔 사이언티픽)을 제조업체의 프로토콜에 따라 사용하여 형질감염시켰다. 성상세포, U2OS, HCC1954, HEK293T 및 ST486 세포를 적절한 아막사 뉴클레오펙터(AMAXA NUCLEOFECTOR)™ II 프로그램을 제조업체의 지침에 따라 사용하여 형질감염시켰다. 40 ng의 적외선 RFP (애드진 플라스미드 45457)74를 뉴클레오펙션 용액에 첨가하여 이들 세포주에서의 뉴클레오펙션 효율을 평가하였다. 성상세포, U2OS, 및 ST486 세포에 대해, 뉴클레오펙션 효율은 각각 25%, 74%, 및 92%였다. HCC1954 세포에 대해, 뉴클레오펙션 효율은 10% 미만이었다. 따라서, 트립신화 후, HCC1954 세포를 40 마이크로미터 여과기 (피셔 사이언티픽(Fisher Scientific))를 통해 여과하고, 뉴클레오펙션된 HCC1954 세포를 iRFP 신호 (흡수 643 nm, 방출 670 nm)를 사용하여 베크만 쿨터(Beckman Coulter) 모플로 XDP 세포 분류기 상에서 수집하였다. 다른 세포는 뉴클레오펙션된 세포의 풍부화 없이 사용하였다.
게놈 DNA 샘플의 고처리량 DNA 서열분석. 형질감염된 세포를 3일 후에 수거하고, 게놈 DNA를 아젠코트(Agencourt) DNAdvance 게놈 DNA 단리 키트 (베크만 쿨터)를 제조업체의 지침에 따라 사용하여 단리하였다. 관심 온-타겟 및 오프-타겟 게놈 영역을 보충적 서열에 열거된 플랭킹 HTS 프라이머 쌍으로 PCR에 의해 증폭시켰다. PCR 증폭은 푸션(Phusion) 고-충실도 DNA 폴리머라제 (써모피셔)로 제조업체의 지침에 따라 5 ng의 게놈 DNA를 주형으로서 사용하여 수행하였다. 주기 수는 각각의 프라이머 쌍에 대해 별개로 측정하여, 반응이 선형 범위의 증폭에서 중단되도록 하였다 (EMX1, FANCF, HEK293 부위 2, HEK293 부위 3, HEK293 부위 4, 및 RNF2 프라이머에 대해 각각 30, 28, 28, 28, 32, 및 32 주기). PCR 생성물을 래피드팁스 (디피니티 게노믹스)를 사용하여 정제하였다. 정제된 DNA를 서열분석 어댑터를 함유하는 프라이머로 PCR에 의해 증폭시켰다. 생성물을 겔-정제하고, 퀀트-잇(QUANT-IT)™ 피코그린 dsDNA 검정 키트 (써모피셔) 및 카파 라이브러리 정량화 키트-일루미나 (카파 바이오시스템즈(KAPA Biosystems))를 사용하여 정량화하였다. 샘플을 이전에 기재된 바와 같이 일루미나 MiSeq 상에서 서열분석하였다.73
데이터 분석. 서열분석 판독물을 MiSeq 리포터 (일루미나)를 사용하여 자동으로 역다중화하고, 개별 FASTQ 파일을 보충 노트에 제공된 주문제작 매트랩 스크립트로 분석하였다. 각각의 판독물을 스미스-워터만(Smith-Waterman) 알고리즘을 사용하여 적절한 참조 서열에 대해 쌍별로 정렬하였다. 31 미만의 Q-점수를 갖는 염기 호출을 N으로 대체하고, 따라서 뉴클레오티드 빈도를 계산하는 데 있어서 제외하였다. 이 처리는 1,000 중 대략 1의 예상된 MiSeq 염기-호출 오차율을 생성한다. 판독물 및 참조 서열이 갭을 함유하지 않은 정렬된 서열을 염기 빈도가 각각의 유전자좌에 대해 표로 제시될 수 있는 정렬 표에 저장하였다.
indel 빈도를 이전에 기재된 기준71을 사용하여 보충 노트에 제시된 주문제작 매트랩 스크립트로 정량화하였다. 서열분석 판독물을 indel이 일어날 수 있는 윈도우의 양 측에 플랭킹된 2개의 10-bp 서열에의 정확한 매치를 위해 스캐닝하였다. 정확한 매치가 위치하지 않은 경우, 판독물을 분석으로부터 제외하였다. 이 indel 윈도우의 길이가 참조 서열을 정확하게 매칭시킨 경우, 판독물을 indel을 함유하지 않는 것으로서 분류하였다. indel 윈도우가 참조 서열보다 더 길거나 더 짧은 2개 이상의 염기인 경우, 서열분석 판독물을 각각 삽입 또는 결실로서 분류하였다.
본원에, 예를 들어, 배경기술, 요약, 상세한 설명, 실시예, 및/또는 참고문헌 섹션에 언급된 모든 공개, 특허, 특허 출원, 공개, 및 데이터베이스 엔트리 (예를 들어, 서열 데이터베이스 엔트리)는 각각의 개별 공개, 특허, 특허 출원, 공개, 및 데이터베이스 엔트리가 구체적으로 및 개별적으로 본원에 참조로 포함되는 것처럼 그 전문이 본원에 참조로 포함된다. 상충하는 경우, 본원의 임의의 정의를 포함하여 본 출원이 우선할 것이다.
보충 서열
sgRNA 형질감염 플라스미드를 생성하는 데 사용된 프라이머. rev_sgRNA_플라스미드를 모든 경우에 사용하였다. pFYF1320 플라스미드를 물질 및 방법 섹션에 언급된 바와 같이 주형으로서 사용하였다. 서열식별번호: 187-196은 각각 하기에 위에서 아래로 나타난다.
시험관내 데아미나제 검정에 사용된 모든 ssDNA 기질의 서열. 서열식별번호: 197-199는 각각 하기에 위에서 아래로 나타난다.
겔-기반 데아미나제 검정을 위한 sgRNA의 T7 전사를 위한 기질로서 기능하는 PCR 생성물을 생성하는 데 사용된 프라이머. rev_gRNA_T7을 모든 경우에 사용하였다. pFYF1320 플라스미드를 물질 및 방법 섹션에 언급된 바와 같이 주형으로서 사용하였다. 서열식별번호: 200-223은 각각 하기에 위에서 아래로 나타난다.
겔-기반 dsDNA 데아미나제 검정에 사용된 80-뉴클레오티드 비표지된 가닥 및 Cy3-표지된 유니버셜 프라이머의 서열. 서열식별번호: 224-248은 각각 하기에 위에서 아래로 나타난다.
고처리량 서열분석을 위한 sgRNA의 T7 전사를 위한 기질로서 기능하는 PCR 생성물을 생성하는 데 사용된 프라이머. rev_gRNA_T7 (상기)을 모든 경우에 사용하였다. pFYF1320 플라스미드를 물질 및 방법 섹션에 언급된 바와 같이 주형으로서 사용하였다. 서열식별번호: 249-300은 각각 하기에 위에서 아래로 나타낸다.
고처리량 서열분석 (HTS)을 위한 시험관내-편집된 dsDNA의 서열. 편집된 가닥의 서열이 제시된다. 제시된 모든 서열의 역방향 보체를 또한 얻었다. dsDNA 기질을 물질 및 방법에 기재된 바와 같이 상보적 가닥을 어닐링함으로써 얻었다. EMX1, FANCF, HEK293 부위 2, HEK293 부위 3, HEK293 부위 4, 및 RNF2 유전자좌를 나타내는 올리고뉴클레오티드는 원래 겔-기반 데아미나제 검정에 사용하기 위해 설계되었으며, 따라서 그의 5'-말단 상에 동일한 25-nt 서열을 갖는다 (Cy3-프라이머의 것과 매칭시킴). 서열식별번호: 301-352는 각각 하기에 위에서 아래로 나타난다.
시험관내 편집된 dsDNA의 HTS를 위한 프라이머. 서열식별번호: 353-361은 각각 하기에 위에서 아래로 나타난다.
모든 포유동물 세포 배양 실험으로부터의 온-타겟 및 오프-타겟 부위의 HTS를 위한 프라이머. 서열식별번호: 362-469는 각각 하기에 위에서 아래로 나타난다.
HDR 연구에 사용된 단일-가닥 올리고뉴클레오티드 공여자 주형 (ssODN)의 서열.
EMX1 센스 (서열식별번호: 470)
EMX1 안티센스 (서열식별번호: 471)
HEK293 부위 3 센스 (서열식별번호: 472)
HEK293 부위 3 안티센스 (서열식별번호: 473)
HEK 부위 4 센스 (서열식별번호: 474)
HEK 부위 4 안티센스 (서열식별번호: 475)
APOE4 센스 (서열식별번호: 476)
APOE4 안티센스 (서열식별번호: 477)
p53 Y163C 센스 (서열식별번호: 478)
p53 Y163C 안티센스 (서열식별번호: 479)
데아미나제 유전자 g블록스 유전자 단편
hAID (서열식별번호: 169)
rAPOBEC1 (포유동물)(서열식별번호: 170)
pmCDA1 (서열식별번호: 171)
haPOBEC3G (서열식별번호: 172)
rAPOBEC1(이. 콜라이) (서열식별번호: 173)
NBE1, NBE2 및 NBE3의 아미노산 서열.
이. 콜라이 발현을 위한 NBE1 (His6-rAPOBEC1-XTEN-dCas9) (서열식별번호: 154)
포유동물 발현을 위한 NBE1 (rAPOBEC1-XTEN-dCas9-NLS) (서열식별번호: 155)
인간 APOBEC1로의 포유동물 발현을 위한 대안적인 NBE1 (hAPOBEC1-XTEN-dCas9-NLS) (서열식별번호: 158)
NBE2 (rAPOBEC1-XTEN-dCas9-UGI-NLS) (서열식별번호: 156)
NBE3 (rAPOBEC1-XTEN-Cas9n-UGI-NLS) (서열식별번호: 157)
pmCDA1-XTEN-dCas9-UGI (박테리아) (서열식별번호: 159)
pmCDA1-XTEN-nCas9-UGI-NLS (포유동물 구축물) (서열식별번호: 160)
huAPOBEC3G-XTEN-dCas9-UGI (박테리아) (서열식별번호: 161)
huAPOBEC3G-XTEN-nCas9-UGI-NLS (포유동물 구축물) (서열식별번호: 162)
huAPOBEC3G (D316R_D317R)-XTEN-nCas9-UGI-NLS (포유동물 구축물) (서열식별번호: 163)
염기 호출 매트랩 스크립트
INDEL 검출 매트랩 스크립트
실시예 5: Cas9 변이체 서열
본 개시내용은 1개 이상의 돌연변이 (예를 들어, dCas9 또는 Cas9 니카제를 생성하기 위한)를 포함할 수 있는 1종 이상의 유기체로부터의 Cas9 변이체, 예를 들어 Cas9 단백질을 제공한다. 일부 실시양태에서, Cas9 단백질의 별표에 의해 하기 확인되는 아미노산 잔기 중 1개 이상은 돌연변이될 수 있다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 D10 및/또는 H840 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이는 돌연변이된다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 D10 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이는 D를 제외한 임의의 아미노산 잔기로 돌연변이된다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 D10 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이는 A로 돌연변이된다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 H840 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 잔기는 H이다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 H840 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이는 H를 제외한 임의의 아미노산 잔기로 돌연변이된다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 H840 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 돌연변이는 A로 돌연변이된다. 일부 실시양태에서, 서열식별번호: 6에 제공된 아미노산 서열의 D10 잔기, 또는 임의의 Cas9 단백질, 예컨대 본원에 제공된 바와 같은 Cas9 아미노산 서열 중 어느 하나에서의 상응하는 잔기는 D이다.
다양한 종으로부터의 다수의 Cas9 서열을 정렬하여 서열식별번호: 6 또는 서열식별번호: 567의 D10 및 H840의 상응하는 상동 아미노산 잔기가 다른 Cas9 단백질에서 확인되어, 상동 아미노산 잔기의 상응하는 돌연변이를 갖는 Cas9 변이체의 생성을 허용할 수 있는지 측정하였다. 정렬은 NCBI 제약-기반 다중 정렬 도구(Constraint-based Multiple Alignment Tool) (COBALT (st-va.ncbi.nlm.nih.gov/tools/cobalt에서 접근가능함))를 사용하여 하기 파라미터로 수행하였다. 정렬 파라미터: 갭 패널티 -11,-1; 말단-갭 패널티 -5,-1. CDD 파라미터: RPS BLAST 온을 사용; 블라스트 E-값 0.003; 보존된 칼럼 발견 및 리컴퓨트 온. 쿼리 클러스터링 파라미터: 쿼리 클러스터 온 사용; 워드 크기 4; 최대 클러스터 거리 0.8; 알파벳 규칙적.
4가지 Cas9 서열의 예시적인 정렬이 하기에 제공된다. 정렬에서 Cas9 서열은 서열 1 (S1): 서열식별번호: 567 | WP_010922251| gi 499224711 | 유형 II CRISPR RNA-가이드된 엔도뉴클레아제 Cas9 [스트렙토코쿠스 피오게네스]; 서열 2 (S2): 서열식별번호: 568 | WP_039695303 | gi 746743737 | 유형 II CRISPR RNA-가이드된 엔도뉴클레아제 Cas9 [스트렙토코쿠스 갈롤리티쿠스 (Streptococcus gallolyticus)]; 서열 3 (S3): 서열식별번호: 569 | WP_045635197 | gi 782887988 | 유형 II CRISPR RNA-가이드된 엔도뉴클레아제 Cas9 [스트렙토코쿠스 미티스 (Streptococcus mitis)]; 서열 4 (S4): 서열식별번호: 570 | 5AXW_A | gi 924443546 | 스타필로코쿠스 아우레우스 Cas9이다. HNH 도메인 (볼드체 및 밑줄표시됨) 및 RuvC 도메인 (박스표시됨)은 4가지 서열의 각각에 대해 확인된다. S1에서의 아미노산 잔기 10 및 840 및 정렬된 서열에서의 상동 아미노산은 하기 각각의 아미노산 잔기에서 별표로 확인된다.
정렬은 참조 Cas9 아미노산 서열 또는 아미노산 잔기에 상동인 아미노산 서열 및 아미노산 잔기가, 정렬되는 아미노산 서열 또는 잔기를 관련 기술분야에 공지된 정렬 프로그램 및 알고리즘을 사용하여 참조 서열 또는 참조 잔기로 확인함으로써, 상이한 종으로부터의 Cas9 서열을 포함하나 이에 제한되지 않는 Cas9 서열 변이체에 걸쳐 확인될 수 있다는 것을 입증한다. 본 개시내용은 서열식별번호: 567-570에서 별표에 의해 확인되는 아미노산 잔기 중 1개 이상 (예를 들어, 각각 S1, S2, S3, 및 S4)이 본원에 기재된 바와 같이 돌연변이된 Cas9 변이체를 제공한다. 서열식별번호: 567-570에서 별표에 의해 확인되는 잔기에 상응하는 서열식별번호: 6의 Cas9에서의 잔기 D10 및 H840은 본원에서 "상동" 또는 "상응하는" 잔기로 지칭된다. 이러한 상동 잔기는 예를 들어, 상기 기재된 바와 같은 서열 정렬에 의해, 및 정렬되는 서열 또는 잔기를 참조 서열 또는 잔기로 확인함으로써 확인될 수 있다. 유사하게, 본원에서 서열식별번호: 6에서 확인되는 돌연변이, 예를 들어, 서열식별번호: 6에서의 잔기 10, 및 840의 돌연변이에 상응하는 Cas9 서열에서의 돌연변이는 본원에서 "상동" 또는 "상응하는" 돌연변이로 지칭된다. 예를 들어, 상기 4개의 정렬된 서열에 대해 서열식별번호: 6 또는 S1 (서열식별번호: 567)에서의 D10A 돌연변이에 상응하는 돌연변이는 S2에 대해 D11A, S3에 대해 D10A, 및 S4에 대해 D13A이고; 서열식별번호: 6 또는 S1 (서열식별번호: 567)에서의 H840A에 대한 상응하는 돌연변이는 S2에 대해 H850A, S3에 대해 H842A, 및 S4에 대해 H560A이다.
실시예 6: 차세대 C에서 T로의 편집제
염기 편집제 3 (BE3) 구축물에 대한 대안으로서 시티딘 데아미나제의 다른 패밀리를 조사하였다. 좁거나 상이한 편집 윈도우, 표적화가능한 기질을 확장하는 대안의 서열 특이성을 갖고, 보다 높은 활성을 갖는 상이한 C에서 T로의 편집제를 개발하였다.
실시예 4에 기재된 방법을 사용하여, HeK-3 부위에서의 pmCDA1 (페트로미존 마리누스로부터의 시티딘 데아미나제 1) 활성을 평가한다 (도 42). pmCDA1-nCas9-UGI-NLS (nCas9는 본원에 기재된 Cas9 니카제를 지시함) 구축물은 rAPOBEC1 (BE3)로 접근가능하지 않은 일부 부위 (예를 들어, 위치 9, 5, 4, 및 3에서 상보적 가닥 상의 C 염기) 상에서 활성이다.
HeK-2 부위에서의 pmCDA1 활성은 도 43에 주어진다. pmCDA1-XTEN-nCas9-UGI-NLS 구축물은 "G"에 인접한 부위 상에서 활성인 반면, rAPOBEC1 유사체 (BE3 구축물)는 "G"에 인접한 "C", 예를 들어, 상보적 가닥 상의 위치 11에서의 C 염기 상에서 낮은 활성을 갖는다.
T로 전환된 표적 C (도 44), A로 전환된 C (도 45), 및 G로 전환된 C (도 46)를 갖는 총 서열분석 판독물의 퍼센트가 CDA 및 APOBEC1 (BE3 구축물)에 대해 나타나 있다.
HeK-2 부위에서의 huAPOBEC3G 활성은 도 47에 나타나 있다. 2가지 구축물을 사용하였다: huAPOBEC3G-XTEN-nCas9-UGI-NLS 및 huAPOBEC3G*(D316R_D317R)-XTEN-nCas9-UGI-NLS. huAPOBEC3G-XTEN-nCas9-UGI-NLS 구축물은 도 47에 나타난 바와 같이 rAPOBEC1 (BE3)과 상이한 서열 특이성을 가지며, 편집 윈도우는 APOBEC1에 비해 위치 4에서 APOBEC3G의 감소된 활성에 의해 지시된 바와 같이 좁게 나타난다. huAPOBEC3G에서 생성된 돌연변이 (D316R 및 D317R)는 ssDNA 결합을 증가시켰으며, 편집된 부위를 확장하는 데 대해 관찰가능한 효과를 발생시켰다 (도 47에서 APOBEC3G를 APOBEC3G_RR과 비교함). 돌연변이는 APOBEC3G 결정 구조에 기초하여 선택하였고, 문헌 [Holden et al., Crystal structure of the anti-viral APOBEC3G catalytic domain and functional implication. Nature. (2008); 121-4]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다.
실시예 7: 이. 콜라이에서의 pmCDA1/huAPOBEC3G/rAPOBEC1 연구
A에서 I로의 전환을 위한 LacZ 선택 최적화를 F 플라스미드 상에서 코딩된 lacZ를 갖는 박테리아 균주를 사용하여 수행하였다. 중요한 글루탐산 잔기를, 시티딘 데아미나제에 의한 G에서 A로가 lacZ 활성을 복원하도록 돌연변이시켰다 (예를 들어, GAG에서 GGG로의, Glu에서 Gly로의 돌연변이) (도 48). 균주 CC102를 선택 검정을 위해 선택하였다. APOBEC1 및 CDA 구축물을 G에서 A로의 전환을 최적화하기 위해 선택 검정에 사용하였다.
lacZ 복귀 빈도에 대한 데아미나제 구축물을 코딩하는 플라스미드의 카피 수의 효과를 평가하기 위해, CDA 및 APOBEC1 데아미나제를 상이한 복제 원점 (따라서 상이한 카피 수)을 갖는 4가지의 플라스미드, 즉 SC101, CloDF3, RSF1030, 및 PUC (카피 수: PUC>RSF1030>CloDF3>SC101) 내로 클로닝하고, 유도성 프로모터 아래에 정치하였다. 플라스미드를 돌연변이된 LacZ 유전자를 함유하는 F 플라스미드를 갖는 이. 콜라이 세포 내로 개별적으로 형질전환시켰다. 데아미나제의 발현을 유도하고, LacZ 활성을 각각의 구축물에 대해 검출하였다 (도 49). 도 49에 나타난 바와 같이, CDA는 데아미나제가 클로닝된 플라스미드 카피 수와 무관하게, 모든 예에서 APOBEC1보다 유의하게 더 높은 활성을 나타내었다. 또한, 카피 수의 관점에서, 데아미나제 활성은 클로닝되는 플라스미드의 카피 수와 양의 상관관계가 있었다 (즉, PUC> CloDF3>SC101).
LacZ 복귀를 lacZ 유전자좌에서 게놈 DNA의 서열분석에 의해 확인하였다. 교정된 LacZ 유전자를 함유하는 게놈 DNA를 얻기 위해, 세포를 X-gal을 함유하는 배지에서 성장시켰으며, 여기서, LacZ 활성을 갖는 세포는 청색 콜로니를 형성한다. 청색 콜로니를 선택하고, 락토스를 함유하는 최소 배지에서 성장시켰다. 세포를 스핀 다운시키고, 세척하고, 최소 배지 플레이트 (락토스) 상에 재-플레이팅하였다. 그 후, 최고 희석에서의 청색 콜로니를 선택하고, 그의 게놈 DNA를 lacZ 유전자좌에서 서열분석하였다 (도 50).
상이한 시티딘 데아미나제 (예를 들어, CDA, 및 APOBEC1)의 활성을 시험하기 위한 클로람페니콜 복귀 검정을 설계하였다. 박테라아에 대한 클로람페니콜 저항성을 부여하는 돌연변이체 CAT1 유전자를 갖는 플라스미드를 복제 원점으로서 RSF1030으로 구축하였다. 돌연변이체 CAT1 유전자는 단백질 불활성을 제공하는 H195R (CAC에서 CGC로의) 돌연변이를 갖는 CAT1 단백질을 코딩한다 (도 51). CGC 코돈에서의 G 염기에 염기-쌍형성된 C의 탈아미노화는 코돈을 다시 CAC 코돈으로 전환시킬 것이며, 이는 단백질의 활성을 복원한다. 도 52에 나타난 바와 같이, CDA는 이. 콜라이에서 클로람페니콜 저항성 유전자의 활성을 복원하는 데 있어서 rAPOBEC를 능가한다. 선택 플라스미드 (pNMG_ch_5)를 갖는 S1030에서의 chlor의 최소 억제 농도 (MIC)는 대략 1 μg/mL였다. rAPOBEC-XTEN-dCas9-UGI 및 CDA-XTEN-dCas9-UGI 둘 다는 선택 플라스미드 상에서 DNA 교정을 유도하였다 (도 53).
다음으로, huAPOBEC3G-XTEN-dCas9-UGI 단백질을 동일한 검정에서 시험하였다. 흥미롭게도, huAPOBEC3G-XTEN-dCas9-UGI는 rAPOBEC1-XTEN-dCas9-UGI 융합 단백질과 상이한 서열 특이성을 나타내었다. rAPOBEC11-XTEN-dCas9-UGI 융합물 (여기서, 위치 3, 6, 및 8이 편집되었음)에 비해, 단지 위치 8만을 APOBEC3G-XTEN-dCas9-UGI 융합물로 편집하였다 (도 54).
실시예 8: 더 적은 오프 타겟 편집을 갖는 C에서 T로의 염기 편집제
현재의 염기 편집 기술은 게놈 DNA에서 C:G 염기 쌍의 T:A 염기 쌍으로의 서열-특이적 전환을 허용한다. 이는 시티딘 데아미나제 효소에 의한 시토신의 우라실로의 직접적 촉매 전환을 통해 수행되며, 따라서, 전통적인 게놈 편집 기술과는 달리 제1 단계로서 DNA 내로 이중-가닥 DNA 파괴 (DSB)를 도입하지 않는다. 문헌 [Komor, A.C., Kim, Y.B., Packer, M.S., Zuris, J.A., and Liu, D.R. (2016), "Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage." Nature 533, 420-424]을 참조하며; 그의 전체 내용은 본원에 참조로 포함된다. 대신, 촉매적으로 사멸된 SpCas9 (dCas9) 또는 SpCas9 니카제 (dCas9(A840H))를 시티딘 데아미나제 효소, 예컨대 rAPOBEC1, pmCDA1, 또는 hAPOBEC3G에 테더링한다. 관심 게놈 유전자좌는 sgRNA에 의해 코딩되며, DNA 결합 및 국부 변성은 융합물의 dCas9 부분에 의해 용이해진다. 그러나, 야생형 dCas9 및 야생형 Cas9는 오프-타겟 DNA 결합 및 절단을 나타내는 것처럼, 현재의 염기 편집제는 또한 Cas9 오프-타겟 유전자좌에서 C에서 T로의 편집을 나타내며, 이는 그의 치료적 유용성을 제한한다.
그의 표적 DNA의 단백질 및 당-포스페이트 백본 사이의 비특이적 정전기적 상호작용을 중화시키는 단지 3 내지 4개의 돌연변이의 SpCas9 내로의 도입은 SpCas9의 DNA 결합 특이성을 증가시키는 것으로 보고되었다. 문헌 [Kleinstiver, B.P., Pattanayak, V., Prew, M.S., Tsai, S.Q., Nguyen, N.T., Zheng, Z., and Joung, J.K. (2016) "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects." Nature 529, 490-495]; 및 [Slaymaker, I.M., Gao, L., Zetsche, B., Scott, D.A., Yan, W.X., and Zhang, F. (2015) "Rationally engineered Cas9 nucleases with improved specificity. Science 351, 84-88]을 참조하며; 각각의 전체 내용은 본원에 참조로 포함된다. 따라서, 4가지 보고된 중화 돌연변이를 초기에 보고된 염기 편집제 BE3 (서열식별번호: 48) 내로 혼입하였고, 이 효소의 오프-타겟 C에서 T로의 편집은 또한 극적으로 감소되는 것으로 밝혀졌으며 (도 55), 온-타겟 편집의 감소는 없었다 (도 56).
도 55에 나타난 바와 같이, HEK293T 세포를 BE3 또는 HF-BE3 및 EMX1 서열을 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, GUIDE-seq 방법을 사용하여 종 및 동료들에 의해 이전에 측정된 바와 같이 EMX1 sgRNA에 대한 온-타겟 유전자좌, 플러스 상부 10개의 공지된 Cas9 오프-타겟 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 문헌 [Tsai, S.Q., Zheng, Z., Nguyen, N.T., Liebers, M., Topkar, V.V., Thapar, V., Wyvekens, N., Khayter, C., Iafrate, A.J., Le, L.P., et al. (2015) "GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases." Nat Biotech 33, 187-197]을 참조하며, 그의 전체 내용은 본원에 참조로 포함된다. EMX1 오프-타겟 5 유전자좌는 증폭하지 않았으며, 나타내지 않는다. 온-타겟 및 오프-타겟 프로토스페이서 및 프로토스페이서 인접 모티프 (PAM)의 서열이 제시된다 (도 55). 프로토스페이서 내의 원래 C의 각각의 위치에 T를 갖는 총 DNA 서열분석 판독물의 백분율로서 정의되는 세포의 C에서 T로의 전환 백분율이 BE3 및 HF-BE3에 대해 나타나 있다.
도 56에서, HEK293T 세포를 BE3 또는 HF-BE3 및 지시된 게놈 유전자좌를 매칭시키는 sgRNA를 발현하는 플라스미드로 리포펙타민 2000을 사용하여 형질감염시켰다. 형질감염 3일 후에, 게놈 DNA를 추출하고, PCR에 의해 증폭시키고, 온-타겟 유전자좌에서 고처리량 DNA 서열분석에 의해 분석하였다. 각각의 프로토스페이서 내의 표적 C에 모든 4개의 염기를 갖는 총 DNA 서열분석 판독물의 백분율이 BE3 또는 HF-BE3으로의 처리에 대해 나타나 있다 (도 56). indel 형성의 빈도가 또한 나타나 있다.
HF-BE3의 1차 단백질 서열 (서열식별번호: 48):
실시예 9: Cas9 변이체를 사용하는 염기 편집제의 개발 및 염기 편집 기술의 표적 범위 및 정확성을 증가시키기 위한 염기 편집제 프로세싱성의 조정
전통적인 게놈 편집 플랫폼과는 달리, 염기 편집 기술은 이중-가닥 파괴 (DSB)를 유도하지 않고 DNA에서의 정확한 단일 뉴클레오티드 변화를 허용한다. 문헌 [Komor, A. C. et al. Nature 533, 420-424 (2016)]을 참조한다. 현세대의 염기 편집제는 NGG PAM을 배타적으로 사용한다. 이는 게놈 내에서 목적하는 염기를 편집하는 그의 능력을 제한하는데, 이는 염기 편집제가 표적 염기가 PAM의 대략 15 염기 상류의 4-염기 영역 ('탈아미노화 윈도우') 내에 놓이는 정확한 위치에 놓일 필요가 있기 때문이다. 문헌 [Komor, A. C. et al. Nature 533, 420-424 (2016)]을 참조한다. 더욱이, 시티딘 데아미나제의 높은 프로세싱성으로 인해, 염기 편집제는 그의 탈아미노화 윈도우 내에서 모든 시티딘을 티미딘으로 전환시킬 수 있으며, 이는 연구자에 의해 목적하는 것 외의 아미노산 변화를 유도할 수 있다. 문헌 [Komor, A. C. et al. Nature 533, 420-424 (2016)]을 참조한다.
Cas9 변이체를 갖는 염기 편집제의 개발을 통한 염기 편집의 범위의 확장
상이한 PAM 특이성을 갖는 Cas9 상동체 및 다른 RNA-가이드된 DNA 결합제를 염기 편집제 아키텍처 내로 혼입하였다. 문헌 [Kleinstiver, B. P. et al. Nature 523, 481-485 (2015)]; [Kleinstiver, B. P. et al. Nature Biotechnology 33, 1293-1298 (2015)]; 및 [Zetsche, B. et al. Cell 163, 759-771 (2015)]을 참조하며; 각각의 전체 내용은 본원에 참조로 포함된다. 더욱이, 다양한 Cas9 단백질의 PAM 특이성을 넓힌 혁신을 또한 도입하여 염기 편집제의 표적 도달을 훨씬 더 확장시켰다. 문헌 [Kleinstiver, B. P. et al. Nature 523, 481-485 (2015)]; 및 [Kleinstiver, B. P. et al. Nature Biotechnology 33, 1293-1298 (2015)]을 참조한다. 염기 편집제의 현재의 팔레트는 표 4에 요약된다.
표 4. Cas9 변이체로부터 제조된 새로운 염기 편집제
rAPOBEC1의 부위-지정 돌연변이유발을 통한 염기 편집제의 프로세싱성의 조정
염기 편집제의 프로세싱성은 데아미나제 효소에서 점 돌연변이를 생성함으로써 조정될 수 있다. 염기 편집제가 여전히 평균 1 라운드의 시티딘 탈아미노화를 촉매할 수 있었지만, 관련 기간 내에 또 다른 탈아미노화를 접근하고 촉매할 가능성은 적었던 데아미나제의 촉매 활성을 약간 감소시키는 돌연변이의 혼입이 추구되었다. 사실상, 생성된 염기 편집제는 보다 좁은 탈아미노화 윈도우를 가질 것이다.
이 연구에서 탐색된 rAPOBEC1 돌연변이는 표 5에 열거된다. 돌연변이의 일부는 rAPOBEC1 촉매작용의 약간 명백한 손상을 발생시켰으며, 이는 다중 시티딘이 탈아미노화 윈도우 내에서 발견되는 경우, 한 시티딘의 또 다른 것에 비한 우선적 편집으로서 분명해졌다. 이들 돌연변이의 일부를 조합하는 것은 상가 효과를 가졌으며, 이는 염기 편집제가 보다 높은 엄격성으로 기질 시티딘을 식별하는 것을 허용한다. 이중 돌연변이체 및 삼중 돌연변이체의 일부는 서로에 대해 바로 옆에 있는 다중 시티딘 중에서 1개의 시티딘의 선택적 편집을 허용하였다 (도 57).
표 5. 조사된 rAPOBEC1 점 돌연변이
염기 편집제 PAM 확장 및 프로세싱성 조정
다른 RNA-가이드된 DNA 결합제를 사용함으로써 게놈에서 편집가능한 시티딘을 확장하기 위해 차세대의 염기 편집제를 설계하였다 (도 58). NGG PAM을 사용하는 것은 단지 "윈도우" 내에서 단일 표적을 허용하는 반면, 다중 상이한 PAM의 사용은 Cas9가 선택적 탈아미노화를 실시하기 위해 어디에도 위치되는 것을 허용한다. 다양한 새로운 염기 편집제를 Cas9 변이체로부터 생성하였다 (도 59 및 표 4). 상이한 PAM 부위 (NGA, 도 60; NGCG, 도 61; NNGRRT, 도 62; 및 NNHRRT, 도 63)를 탐구하였다. 선택적 탈아미노화는 시티딘 데아미나제 점 돌연변이유발의 동역학 조정을 통해 성공적으로 달성되었다 (도 65 및 표 5).
그 후, 탈아미노화 윈도우에 대한 다양한 돌연변이의 효과를 세포 배양물에서 다중 시티딘을 갖는 스페이서를 사용하여 조사하였다 (도 66 및 67).
또한, 제한된 수의 시티딘을 갖는 상이한 게놈 부위에 대한 다양한 돌연변이의 효과를 조사하였다 (도 68 내지 71). 대략 1개의 시티딘이 스페이서에서의 탈아미노화 윈도우 내에서 편집될 것인 반면, 나머지 시티딘은 무손상으로 남아 있을 것임이 밝혀졌다. 전체적으로, 편집에 대한 선호도는 하기와 같다: C6 > C5 >> C7 C4.
Cpf1을 사용한 염기 편집
Cas9 상동체인 Cpf1은 AsCpf1, LbCpf1로서, 또는 임의의 다른 종으로부터 얻을 수 있다. BE2 및 BE3 등가물을 포함한 융합 구축물의 개략도는 도 73에 나타나 있다. BE2 등가물은 Cas9 대신 촉매적으로 불활성인 Cpf2 효소 (dCpf1)를 사용하는 반면, BE3 등가물은 표적 가닥을 니킹하는 Cpf1 돌연변이체를 포함한다. 하부 개략도는 그것 위에 예시된 2가지 혁신을 조합하는 상이한 융합 아키텍처를 나타낸다 (도 73). Cpf1 BE2를 사용한 HEK293T 세포 TTTN PAM 부위의 염기 편집 결과를 상이한 스페이서로 조사하였다 (도 64a 내지 64c). 일부 실시양태에서, Cpf1은 본원에 제공된 염기 편집제 중 임의의 것에서의 Cas9 도메인 대신 사용될 수 있다. 일부 실시양태에서, Cpf1은 서열식별번호: 9와 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 99.5% 동일한 단백질이다.
Cpf1의 전체 단백질 서열 (서열식별번호: 9):
실시예 10: 염기 편집의 증가된 충실도
BE3 및 HF-BE3의 플라스미드 전달 사이의 차이를 조사하여, 2개가 대등한 효율로 온-타겟 유전자좌를 편집한다는 것을 밝혀내었다 (도 74 및 75). 그러나, HF-BE3은 오프-타겟 유전자좌를 BE3보다 훨씬 더 적게 편집하였으며, 이는 HF-BE3이 BE3보다 훨씬 더 높은 DNA 특이성을 갖는다는 것을 의미한다 (도 76). HEK 세포에의 데아미나제 단백질 리포펙션은 BE3의 단백질 전달이 BE3의 플라스미드 DNA 전달과 대등한 온-타겟 활성, 그러나 그보다 훨씬 더 양호한 특이성을 발생시킨다는 것을 입증하였다. 개선된 형질감염 절차 및 보다 양호한 플라스미드를 사용하여 (n=2), 실험은 하기 조건을 사용하였다: 단백질 전달은 125 nM Cas9:sgRNA 복합체였고, 플라스미드 전달은 750 ng BE3/HF-BE3 플라스미드 + 250 ng sgRNA 플라스미드였고, 리포펙션은 웰당 1.5μL의 리포펙타민 2000으로였다. EMX-1 오프 타겟 부위 2 및 FANCF 오프-타겟 부위 1은 검정된 모든 오프-타겟에 비해, BE3으로 가장 큰 오프-타겟 편집을 나타낸 반면 (도 77 및 78), HEK-3은 전달 방법 중 임의의 것에 대해 오프-타겟에서 유의한 편집을 나타내지 않았다 (도 79). HEK-4는 온-타겟 부위 상에서 일부 C에서 G로의 편집을 나타내는 반면, 그의 오프-타겟 부위 1, 3, 및 4는 모든 검정된 부위의 가장 큰 오프-타겟 편집을 나타내었다 (도 80).
제브라피시에의 미세-주사를 통한 BE3 단백질의 전달
TYR 가이드 RNA를 sgRNA 활성에 대해 시험관내 검정에서 시험하였다 (도 81 및 82). % HTS 판독물은 얼마나 많은 C 잔기가 정제된 BE3 단백질과의 2시간 인큐베이션 및 생성된 생성물의 PCR 동안 T 잔기로 전환되었는지를 나타낸다. 실험은 60bp의 그의 게놈 컨텍스트에서 표적 탈아미노화 부위를 갖는 80량체 합성 DNA 기질을 사용하였다. 이는 단지 1개의 가닥이 니킹되고, 따라서 생성물이 PCR에 의해 증폭되지 않기 때문에 % 편집된 DNA 가닥과 동일하지 않다. 편집된 HTS 판독물의 비율은 x/(2-x)와 동일하며, 여기서, x는 편집된 THS 판독물의 실제 비율이다. 60% 편집에 대해, 편집된 염기의 실제 비율은 75%이다. "오프 타겟"은 오프-타겟 sgRNA에 결합되는 동안 동일한 DNA 기질과 함께 인큐베이션된 BE3을 나타낸다. sgRNA sgRH_13, sgHR_17, 및 가능하게는 sgHR_16은 생체내 주사 실험을 위한 유망한 표적으로 나타난 것으로 밝혀졌다.
BE3 단백질의 전달을 제브라피쉬에서 생체내에서 시험하였다. 제브라피시 배아 (n=16 내지 24)를 스크램블링된 sgRNA, sgHR_13, sgHR_16, 또는 sgHR_17 중 어느 하나로 주사하고, BE3을 정제하였다. 각각의 조건으로부터의 3개의 배아를 독립적으로 분석하고 (단일 배아), 각각의 조건에 대해, 모든 주사된 배아를 풀링하고, 풀로서 서열분석하였다. 결과는 도 83 내지 85에 나타나 있다.
실시예 11: 질환을 치료하기 위한 염기 편집제의 용도
본원에 제공된 염기 편집제 또는 복합체 (예를 들어, BE3)는 핵산을 변형시키는 데 사용될 수 있다. 예를 들어, 염기 편집제는 핵산 (예를 들어, DNA)에서 시토신을 티민으로 변화시키는 데 사용될 수 있다. 이러한 변화는 그 중에서도 단백질의 아미노산 서열을 변경시키거나, 출발 코돈을 파괴하거나 생성하거나, 정지 코돈을 생성하거나, 스플라이싱 공여자를 교란시키거나, 스플라이싱 수용자를 교란시키거나, 조절 서열을 편집하기 위해 생성될 수 있다. 가능한 뉴클레오티드 변화의 예는 도 86에 나타나 있다.
본원에 제공된 염기 편집제 또는 복합체 (예를 들어, BE3)는 대상체에서 아포지단백질 E의 이소형을 편집하는 데 사용될 수 있다. 예를 들어, 아포지단백질 E 이소형은 알츠하이머병을 발달시킬 보다 낮은 위험과 연관된 이소형을 생성하도록 편집될 수 있다. 아포지단백질 E는 아미노산 112 및 158에서 상이한 4개의 이소형을 갖는다. APOE4는 후기-발병 알츠하이머병에 대한 가장 크고 가장 통상적인 유전적 위험 인자이다. 핵산 서열 CGC에 의해 코딩되는 APOE4의 아르기닌 잔기 158은 염기 편집제 (예를 들어, BE3)를 사용함으로써 시스테인으로 변화되어 CGC 핵산 서열을 TGC로 변화시킬 수 있으며, 이는 잔기 158에서 시스테인을 코딩한다. 이 변화는 보다 낮은 알츠하이머병 위험과 연관된 APOE3r 이소형을 생성한다. 도 87을 참조한다.
염기 편집제 BE3이 마우스 성상세포에서 APOE4를 APOE3r로 편집하는 데 사용될 수 있는지 시험하였다 (도 88). APOE4 마우스 성상세포를 APOE4의 아르기닌 158을 코딩하는 핵산을 표적화하는 Cas9 + 주형 또는 BE3으로 뉴클레오펙션시켰다. Cas9 + 주형은 26% indel로 단지 0.3% 편집을 수득한 반면, BE3은 5% indel로 75% 편집을 수득하였다. 2개의 추가의 염기-편집된 시토신은 침묵되고, 아미노산 서열에 대한 변화를 생성하지 않는다 (도 88).
본원에 제공된 염기 편집제 또는 복합체는 예를 들어, 돌연변이를 PRNP 유전자 내로 도입함으로써 프리온 단백질 질환, 예컨대 크로이츠펠트-야콥병 및 태아 가족성 불면증을 치료하는 데 사용될 수 있다. PRNP 돌연변이를 복귀시키는 것은 치료적 결과를 생성하지 않을 수 있으며, PRNP에서의 indel은 병원성일 수 있다. 따라서, PRNP를 염기 편집제 (예를 들어, BE3)를 사용하여 돌연변이시켜 PRNP 유전자에서 조기 정지 코돈을 도입할 수 있는지 시험하였다. 그의 가이드 RNA와 회합된 BE3을 HEK 세포 또는 교모세포종 세포 내로 도입하고, PRNP 유전자를 편집하여 잔기 37에서 코딩된 아르기닌을 정지 코돈으로 변화시킬 수 있었다. BE3은 41% 편집을 수득하였다 (도 89).
편집될 수 있는 추가의 유전자는 하기를 포함한다: 증가된 알츠하이머 위험을 치료하기 위한 Arg 112 및 Arg 158의 APOE 편집; 알츠하이머 위험을 감소시키기 위한 Ala 673의 APP 편집; 태아 가족성 불면증 및 다른 프리온 단백질 질환을 치료하기 위한 Arg 37의 PRNP 편집; 뒤시엔느 근육 이영양증을 치료하기 위한 엑손 23 및 51 스플라이스 부위의 DMD 편집; 비만 위험을 치료하기 위한 인트론 1의 FTO 편집; 펜드레드 증후군 (유전적 난청)을 치료하기 위한 엑손 8의 PDS 편집; 선천성 청력 상실을 치료하기 위한 엑손 8의 TMC1 편집; 만성 육아종 질환을 치료하기 위한 다양한 환자-관련 돌연변이의 CYBB 편집. 본원에 제공된 염기 편집제를 사용하여 치료될 수 있는 추가의 질환은 하기 표 6에 나타나 있다.
UGI는 또한 핵심적 역할을 한다. UDG (UGI가 억제하는)를 녹아웃시키는 것은 C에서 T로의 염기 편집의 청결도 및 효율을 극적으로 개선시키는 것으로 나타났다 (도 90). 게다가, 니카제를 갖고 UGI가 없는 염기 편집제는 매우 높은 indel 비율로 결과물의 혼합물을 생성하는 것으로 나타났다 (도 91).
실시예 12: 염기 편집의 표적화 범위의 확장
염기 편집은 이중-가닥 DNA 파괴를 생성하지 않고, 공여자 DNA 주형을 요구하지 않고, 과량의 확률적 삽입 및 결실을 유도하지 않고, DNA에서 프로그램가능한, 단일-뉴클레오티드 C→T (또는 G→A) 변화를 유도하는 촉매적으로 결함성 스트렙토코쿠스 피오게네스 Cas9, 시티딘 데아미나제, 및 염기 절제 복구의 억제제를 함유하는 융합 단백질을 사용하는 게놈 편집에 대한 새로운 접근법이다1. 염기 편집에 의해 표적화될 수 있는 부위의 수를 2.5-배 확장시키기 위해 상이한 프로토스페이서-인접 모티프 (PAM) 특이성을 갖는 천연 및 조작된 Cas9 변이체를 사용하는 5가지 새로운 C→T (또는 G→A) 염기 편집제의 개발이 본원에 기재되어 있다. 추가적으로, 대략 5 뉴클레오티드 내지 1 또는 2개 뉴클레오티드의 겉보기 편집 윈도우의 폭을 좁히는 돌연변이된 시티딘 데아미나제 도메인을 함유하는 새로운 염기 편집제를 조작하여, 이전에 대등한 효율로 편집되었을 이웃하는 C 뉴클레오티드의 식별을 가능하게 하였다. 함께, 이들 개발은 염기 편집의 표적화 범위를 실질적으로 증가시킨다.
CRISPR-Cas9 뉴클레아제는 표적화된 게놈 편집을 매개하는 데 광범위하게 사용되었다2. 대부분의 게놈 편집 적용에서, Cas9는 단일 가이드 RNA (sgRNA)와 복합체를 형성하며, sgRNA 서열에 의해 특정된 표적 부위에서 이중-가닥 DNA 파괴 (DSB)를 유도한다. 세포는 주로 비-상동 말단-연결 (NHEJ) 복구 경로를 통해 이 DSB에 반응하며, 이는 유전자를 교란시키는 격자이동 돌연변이를 유발할 수 있는 확률적 삽입 또는 결실 (indel)을 발생시킨다. DSB에 플랭킹된 서열과 높은 정도의 상동성을 갖는 공여자 DNA 주형의 존재 하에서, 유전자 교정은 상동성 지정 복구 (HDR)로 공지된 대안적인 경로를 통해 달성될 수 있다.3,4 불행하게도, 대부분의 비-섭동 조건 하에서, HDR은 비효율적이고, 세포 상태 및 세포 유형에 의존하며, 보다 큰 빈도의 indel에 의해 지배된다.3,4 인간 질환과 연관된 공지된 유전적 변이의 대부분은 점 돌연변이이기 때문에5, 정확한 점 돌연변이를 보다 효율적이고 명확하게 생성할 수 있는 방법이 필요하다.
DSB를 유도하지 않고 프로그램가능한 방식으로 C:G 염기 쌍의 T:A 염기 쌍으로의 표적화된 대체를 가능하게 하는 염기 편집1이 최근 기재되었다. 염기 편집은 스트렙토코쿠스 피오게네스 Cas9 (SpCas9)의 촉매적으로 불활성화된 (dCas9) 또는 니카제 형태, 시티딘 데아미나제, 예컨대 APOBEC1, 및 염기 절제 복구의 억제제, 예컨대 우라실 글리코실라제 억제제 (UGI) 사이의 융합 단백질을 사용하여 sgRNA에 의해 특정된 5-뉴클레오티드 윈도우 내에서 시티딘을 우리딘으로 전환시킨다.1 제3-세대 염기 편집제인 BE3은 다른 게놈 편집 방법을 사용하여 달성될 수 있는 것보다 더 높은 효율 및 더 낮은 indel 빈도로 다양한 세포주에서 질환-관련 점 돌연변이를 포함하여 C:G 염기 쌍을 T:A 염기 쌍으로 전환시킨다1. 후속 연구는 다양한 설정에서의 데아미나제-dCas9 융합 접근법을 확인하였다6,7.
BE3에 의한 효율적인 편집은 표적 C를 프로토스페이서의 PAM-원위 말단 (위치 4 내지 8, PAM을 위치 21 내지 23으로서 카운팅함) 부근의 5-뉴클레오티드 윈도우 내에 정치시키는 NGG PAM의 존재를 요구한다1. 이 PAM 요구는 BE3에 의해 효율적으로 표적화될 수 있는 인간 게놈에서의 부위의 수를 실질적으로 제한하며, 이는 관심 많은 부위가 표적 C의 13- 내지 17- 뉴클레오티드 하류에 NGG가 결여되기 때문이다. 더욱이, BE3의 높은 활성 및 프로세싱성은 편집 윈도우 내의 모든 C의 T로의 전환을 발생시키며, 이는 표적 유전자좌에 대한 목적하지 않은 변화를 잠재적으로 도입할 수 있다. 본원에는, 이들 제한 둘 다를 다루는 새로운 C:G에서 T:A로의 염기 편집제가 기재되어 있다.
DNA에 결합하고, 단일-가닥 DNA 버블을 함유하는 "R-루프" 복합체8를 형성하는 임의의 Cas9 상동체는 원칙적으로 염기 편집제로 전환될 수 있는 것으로 생각되었다. 이들 새로운 염기 편집제는 비-NGG PAM 부위가 편집되는 것을 허용함으로써 표적화가능한 유전자좌의 수를 확장시킬 것이다. 스타필로코쿠스 아우레우스로부터의 Cas9 상동체 (SaCas9)는 SpCas9보다 상당히 더 작고 (1053 대 1368 잔기), 포유동물 세포에서 효율적인 게놈 편집을 매개할 수 있으며, NNGRRT PAM을 요구한다9. SpCas9를 BE3에서 SaCas9로 대체하여 SaBE3을 생성하고, HEK293T 세포를 SaBE3 및 6개의 인간 게놈 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시켰다 (도 92a 및 92b). 3일 후, 게놈 유전자좌를 고처리량 DNA 서열분석 (HTS)으로 처리하여 염기 편집 효율을 정량화하였다. SaBE3은 인간 세포에서의 다양한 게놈 부위에서 표적 C의 C에서 T로의 염기 편집을, 위치 6 내지 11에서의 C의 표적화로부터 발생한 매우 높은 전환 효율 (형질감염된 세포에 대한 풍부화 없이, C에서 T로 전환된 총 DNA 서열의 대략 50 내지 75%)로 가능하게 하였다. NNGRRT-함유 표적 부위에 대한 SaBE3의 효율은 일반적으로 NGG-함유 표적 부위에 대한 BE3의 것을 초과하였다1. 아마도 그의 보다 높은 평균 효율로 인해, SaBE3은 또한 정규 BE3 활성 윈도우의 외부의 위치에서의 표적 C에서 검출가능한 염기 편집을 발생시킬 수 있다 (도 92c). 이에 비해, BE3은 공지된 SpCas9 PAM 선호도에 따라, 동일한 조건 하에서 유의하게 감소된 편집을 나타내었다 (0 내지 11%) (도 106a)10. 이들 데이터는 SaBE3이 BE3에 접근가능하지 않은 부위에서 매우 효율적인 염기 편집을 용이하게 할 수 있다는 것을 나타낸다.
염기 편집제의 표적화 범위는 PAM 특이성을 확장하거나 변경시키는 최근에 조작된 Cas9 변이체를 적용함으로써 추가로 확장되었다. 종 및 동료들은 최근 NGA (VQR-Cas9), NGAG (EQR-Cas9), 또는 NGCG(VRER-Cas9) PAM 서열을 수용하는 3개의 SpCas9 돌연변이체를 보고하였다11. 또한, 종 및 동료들은 NNNRRT에 대한 그의 PAM 요건을 완화시키는 3개의 돌연변이를 함유하는 SaCas9 변이체 (SaKKH-Cas9)를 조작하였다12. BE3의 SpCas9 부분을 이들 4가지 Cas9 변이체로 대체하여 VQR-BE3, EQR-BE3, VRER-BE3, 및 SaKKH-BE3을 생성하였으며, 이는 각각 NNNRRT, NGA, NGAG, 및 NGCG PAM을 표적화한다. HEK293T 세포를 이들 구축물 및 각각의 새로운 염기 편집제에 대한 6개의 게놈 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시키고, HTS를 사용하여 C에서 T로의 염기 전환을 측정하였다.
SaKKH-BE3은 처리된, 비-풍부화된 세포의 62% 이하의 효율로 NNNRRT PAM을 갖는 부위를 편집하였다 (도 92d). 예상된 바와 같이, SaBE3은 NNNHRRT (여기서, H = A, C, 또는 T)인 PAM을 함유하는 표적을 효율적으로 편집할 수 없었다 (도 92d). VQR-BE3, EQR-BE3, 및 VRER-BE3은 BE3의 것과 유사한 편집 윈도우를 갖는 예상된 PAM 요건을 갖는 게놈 유전자좌에서 처리된, 비-풍부화된 세포의 50% 이하의 보다 보통의, 그러나 여전히 실질적인 염기 편집 효율을 나타내었다 (도 92e 및 92f). VQR-BE3, EQR-BE3, 및 VRER-BE3의 염기 편집 효율은 일반적으로 상응하는 Cas9 뉴클레아제의 보고된 PAM 요구와 밀접하게 평행하며; 예를 들어, EQR-BE3은 NGAH PAM 서열을 함유하는 표적을 효율적으로 편집할 수 없었다 (도 92f). 대조적으로, BE3은 아마도 그의 PAM 제한으로 인해, NGA 또는 NGCG PAM을 갖는 부위를 효율적으로 편집할 수 없었다 (0 내지 3%) (도 106b).
집합적으로, SaBE3, SaKKH-BE3, VQR-BE3, EQR-BE3, 및 VRER-BE3의 특성은 Cas9 상동체 및 조작된 변이체를 이용하는 그의 능력을 용이하게 하는 조정성을 나타내는 염기 편집제를 확립한다.
다음으로, 변경된 활성 윈도우 폭을 갖는 염기 편집제를 개발하였다. BE3의 활성 윈도우 내의 모든 C는 T로 효율적으로 전환될 수 있다1. 이 윈도우의 폭을 조정하는 능력은 단지 BE3 활성 윈도우에 존재하는 C의 하위세트를 편집하는 것이 중요한 경우에 유용할 것이다.
APOBEC1 및 dCas9 사이의 링커의 길이는 시험관내에서 APOBEC1에 의해 접근가능한 염기의 수를 조정하는 것으로 이전에 관찰되었다1. 그러나, HEK293T 세포에서, 링커 길이를 다양화하는 것은 편집 윈도우의 폭을 유의하게 조정하지 않았으며, 이는 복잡한 세포 환경에서, dCas9 및 시티딘 데아미나제의 상대적 배향 및 유연성이 링커 길이에 의해 강하게 결정되지 않음을 시사한다 (도 96). 다음으로, sgRNA의 5' 말단을 말단절단하는 것은 RNA-DNA 헤테로듀플렉스의 형성시 데아미나제에 접근가능한 단일-가닥 DNA의 길이를 감소시킴으로써 염기 편집 윈도우를 좁힐 수 있는 것으로 생각되었다. HEK293T 세포를 BE3 및 편집 윈도우에서의 다중 C를 갖는 유전자좌를 표적화하는 상이한 스페이서 길이의 sgRNA를 코딩하는 플라스미드로 공동-형질감염시켰다. 17- 내지 19-염기 스페이서를 갖는 말단절단된 sgRNA를 사용하는 경우 염기 편집의 폭의 일치하는 변화는 관찰되지 않았다 (도 95a 내지 95c). sgRNA 스페이서를 17 염기 미만으로 말단절단하는 것은 활성의 큰 상실을 발생시켰다 (도 95a).
대안적인 접근법으로서, 데아미나제 도메인에 대한 돌연변이는 다중 가능한 메카니즘을 통해 편집 윈도우의 폭을 좁힐 수 있는 것으로 생각되었다. 첫째로, 일부 돌연변이는 기질 결합, 결합된 DNA의 형태, 또는 활성 부위에 대한 기질 접근성을 데아미나제 활성 부위에 대한 C의 비-최적 제시에 대한 내약성을 감소시키는 방식으로 변경시킬 수 있다. 둘째로, APOBEC1의 높은 활성은 DNA 결합 사건당 다중 C의 탈아미노화에 기여할 가능성이 있기 때문에,1,13,14 염기 편집제의 데아미나제 도메인의 촉매 효율을 감소시키는 돌연변이는 그것을 DNA로부터 해리되기 전에 연속적 라운드의 탈아미노화를 촉매하는 것으로부터 방지할 수 있다. 일단 임의의 C:G에서 T:A로의 편집 사건이 발생하면, sgRNA는 표적 DNA 서열을 더 이상 완벽하게 매칭시킬 수 없으며, 표적 유전자좌에의 염기 편집제의 재-결합은 덜 선호되어야 한다. 원래 편집 윈도우 내의 다중 시티딘 중에서 구별하는 새로운 염기 편집제를 개발하기 위한 노력으로 둘 다의 전략을 시험하였다.
이용가능한 APOBEC1 구조의 부재를 고려하여, APOBEC3G의 촉매 활성을 조정하는 몇몇 돌연변이가 이전에 보고되었으며, APOBEC1의 그것과 그의 활성 부위-함유 도메인의 42% 서열 유사성을 공유하는 동일한 패밀리로부터의 시티딘 데아미나제가 확인되었다15. 상응하는 APOBEC1 돌연변이를 BE3 내로 혼입하고, HEK293T 세포에서 위치 3, 4, 5, 6, 8, 9, 10, 12, 13, 및 14 (부위 A)에 C를 함유하거나; 위치 5 ,6, 7, 8, 9, 10, 11, 및 13 (부위 B)에 C를 함유하는 2개의 C-풍부 게놈 부위에서 염기 편집 효율 및 편집 윈도우 폭에 대한 그의 효과를 평가하였다.
APOBEC1 돌연변이 R118A 및 W90A 각각은 염기 편집 효율의 극적인 상실을 발생시켰다 (도 97c). R132E는 편집 효율의 일반적 감소를 발생시켰지만, 편집 윈도우의 형상을 실질적으로 좁히도록 변화하지 않았다 (도 97c). 대조적으로, 실질적인 편집 효율을 유지하면서 편집 윈도우의 폭을 좁힌 몇몇 돌연변이가 밝혀졌다 (도 93a 및 97c). "편집 윈도우 폭"은 그 내에서 편집 효율이 그 표적에 대한 반수-최대 값을 초과하는 인위적으로 계산된 윈도우 폭을 나타나는 것으로 정의되었다. 시험된 2개의 C-풍부 게놈 부위에 대한 BE3의 편집 윈도우 폭은 5.0개 (부위 A) 및 6.1개 (부위 B) 뉴클레오티드였다.
APOBEC1에서의 R126은 ssDNA의 포스페이트 백본과 상호작용할 것으로 예측된다13. 이전의 연구는 APOBEC3G 내로 상응하는 돌연변이를 도입하는 것이 촉매작용을 적어도 5-배 감소시켰음을 보여주었다14. 흥미롭게도, BE3에서의 APOBEC1 내로 도입되는 경우, R126A 및 R126E는 다른 위치에서의 편집 활성을 감소시키면서, 가장 강하게 편집된 위치 (C5, C6, 및 C7)에서 BE3에 비해 활성을 증가시키거나 유지하였다 (도 93a 및 97c). 따라서, 이들 2가지 돌연변이의 각각은 부위 A 및 부위 B에서의 편집 윈도우의 폭을 각각 4.4 및 3.4개 뉴클레오티드 (R126A)로, 또는 4.2 및 3.1개 뉴클레오티드 (R126E)로 좁혔다 (도 93a 및 97c).
APOBEC1에서의 W90 (APOBEC3G에서의 W285에 상응함)은 APOBEC3G 활성 부위에서 소수성 포켓을 형성하고, 기질 결합에 보조할 것으로 예측된다13. 이 잔기를 Ala로 돌연변이시키는 것은 APOBEC3G의 촉매 활성을 폐지하였다13. BE3에서, W90A는 염기 편집 효율을 거의 완전히 폐지하였다 (도 97c). 대조적으로, W90Y는 부위 A 및 부위 B에서의 편집 윈도우 폭을 각각 3.8 및 4.9개 뉴클레오티드로 좁히면서 염기 편집 활성을 단지 보통으로 감소시킨 것으로 밝혀졌다 (도 93a). 이들 결과는 시티딘 데아미나제 도메인에 대한 돌연변이가 상응하는 염기 편집제의 활성 윈도우 폭을 좁힐 수 있다는 것을 입증한다.
염기 편집 활성을 대폭 감소시키지 않고 편집 윈도우를 좁힌 3가지 돌연변이인 W90Y, R126E, 및 R132E를 이중으로 및 삼중으로 돌연변이된 염기 편집제 내로 조합하였다. 이중 돌연변이체 W90Y+R126E는 BE3-유사 최대 편집 효율을 갖는 염기 편집제 (YE1-BE3)를 발생시켰지만, 편집 윈도우 폭을 실질적으로 좁혔다 (부위 A 및 부위 B에서의 폭 = 각각 2.9 및 3.0개 뉴클레오티드) (도 93a). W90Y+R132E 염기 편집제 (YE2-BE3)는 보통으로 더 낮은 편집 효율을 나타내었으며 (BE3에 비해 시험된 5개의 부위에 걸쳐 평균 1.4-배 더 낮은 최대 편집 수율), 또한 편집 윈도우 폭을 실질적으로 좁혔다 (부위 A 및 부위 B에서의 폭 = 각각 2.7 및 2.8개 뉴클레오티드) (도 97c). R126E+R132E 이중 돌연변이체 (EE-BE3)는 YE2-BE3과 유사한 최대 편집 효율 및 편집 윈도우 폭을 나타내었다 (도 97c). 삼중 돌연변이체 W90Y+R126E+R132E (YEE-BE3)는 2.0-배 더 낮은 평균 최대 편집 수율, 그러나 C6 위치 넘어 매우 적은 편집 및 부위 A 및 부위 B에 대해 각각 2.1 및 1.4개 뉴클레오티드의 편집 윈도우 폭을 나타내었다 (도 97c). 종합하면 이들 데이터는 시티딘 데아미나제 도메인에서의 돌연변이가, 일부의 경우 편집 효율에 대한 최소 또는 단지 보통의 효과로 편집 윈도우 폭에 강하게 영향을 미칠 수 있다는 것을 나타낸다.
BE3, YE1-BE3, YE2-BE3, EE-BE3, 및 YEE-BE3의 염기 편집 결과물을 BE3 활성 윈도우 내에 다중 C를 함유하는 4개의 널리-연구된 인간 게놈 부위를 표적화하는 HEK293T 세포에서 추가로 비교하였다1. 이들 표적 유전자좌는 위치 4 및 5 (HEK 부위 3), 위치 4 및 6 (HEK 부위 2), 위치 5 및 6 (EMX1), 또는 위치 6, 7, 8, 및 11 (FANCF)에 표적 C를 함유하였다. BE3은 위치 4 내지 8 활성 윈도우 내의 임의의 C를 편집하는 데 대해 거의 (1.2-배 미만) 선호도를 나타내지 않았다. 대조적으로, YE1-BE3은 C4에 비해 C5를 편집하는 데 1.3-배 선호도 (HEK 부위 3), C4에 비해 C6에 대해 2.6-배 선호도 (HEK 부위 2), C6에 비해 C5에 대해 2.0-배 선호도 (EMX1), 및 C7에 비해 C6에 대해 1.5-배 선호도 (FANCF)를 나타내었다 (도 93b). YE2-BE3 및 EE-BE3은 YE1-BE3보다 다소 더 큰 위치적 특이성 (더 좁은 활성 윈도우)을 나타내었으며, C4에 비해 C5를 편집하는 데 평균 2.4-배 선호도 (HEK 부위 3), C4에 비해 C6에 대해 9.5-배 선호도 (HEK 부위 2), C6에 비해 C5에 대해 2.9-배 선호도 (EMX1), 및 C6에 비해 C7에 대해 2.6-배 선호도 (FANCF)였다 (도 93b). YEE-BE3은 가장 큰 위치적 선택성을 나타내었으며, C4에 비해 C5를 편집하는 데 2.9-배 선호도 (HEK 부위 3), C4에 비해 C6에 대해 29.7-배 선호도 (HEK 부위 2), C6에 비해 C5에 대해 7.9-배 선호도 (EMX1), 및 C6에 비해 C7에 대해 7.9-배 선호도 (FANCF)를 가졌다 (도 93b). 상기 발견은 돌연변이체 염기 편집제가 둘 다의 뉴클레오티드가 BE3 편집 윈도우 내에 있는 경우에도 인접한 C 사이를 식별할 수 있다는 것을 확립한다.
이들 4가지 돌연변이체 및 BE3의 생성물 분포를 HTS에 의해 추가로 분석하여 그의 겉보기 프로세싱성을 평가하였다. BE3은 처리된 HEK293T 세포에서 현저하게 T4-T5 (HEK 부위 3), T4-T6 (HEK 부위 2), 및 T5-T6 (EMX1) 생성물을 생성하였으며, 이는 평균적으로 단일 T를 함유하는 생성물보다 7.4-배 더 많은 2개의 T를 함유하는 생성물을 발생시킨다. 대조적으로, YE1-BE3, YE2-BE3, EE-BE3, 및 YEE-BE3은 단독을 편집된 C4-T5, C4-T6, 및 T5-C6 생성물에 대해 실질적으로 더 높은 선호도를 나타내었다 (도 93c). YE1-BE3은 1.4의 평균 단일-T 대 이중-T 생성물 비를 갖는 생성물을 생성하였다. YE2-BE3 및 EE-BE3은 각각 4.3 및 5.1의 평균 단일-T 대 이중-T 생성물 비를 갖는 생성물을 생성하였다 (도 93c). 상기 결과와 일치하게, YEE-BE3 삼중 돌연변이체는 3개의 게놈 유전자좌에 걸쳐 단일-T 생성물을 평균 14.3-배 선호하였다 (도 93c). 단지 1개의 C가 표적 윈도우 내에 있는 표적 부위 (HEK 부위 4, 위치 C5에서)에 대해, 모든 4가지 돌연변이체는 BE3과 대등한 편집 효율을 나타내었다 (도 98). 이들 발견은 이들 BE3 돌연변이체가 감소된 겉보기 프로세싱성을 가지며, BE3 편집 윈도우 내에 다중 C를 함유하는 표적 부위에서의 단지 단일 C의 전환을 선호할 수 있다는 것을 나타낸다. 이들 데이터는 또한 이들 돌연변이체 염기 편집제에 대해 C5 > C6 > C7 C4의 위치적 선호도를 시사하지만, 이 선호도는 표적 서열에 따라 상이할 수 있다.
APOBEC1에서의 윈도우-조정 돌연변이를 VQR-BE3에 적용하였으며, 이는 NGA PAM에 의해 표적화된 부위에서 기질의 선택적 염기 편집을 허용하였다 (도 107a). 그러나, 이들 돌연변이를 SaKKH-BE3에 적용한 경우, 기질 선택성의 개선 없이 염기 편집 효율의 선형 감소가 관찰되었으며, 이는 BE3 및 그의 변이체의 것들과는 이 염기 편집제의 상이한 동역학적 평형 및 기질 접근성을 시사한다 (도 107b).
이 연구에 기재된 변경된 PAM 특이성을 갖는 5가지 염기 편집제는 함께, 원칙적으로 염기 편집에 의해 2.5-배 교정될 수 있는 클린바 데이터베이스에서의 질환-연관된 돌연변이의 수를 증가시킨다 (도 94a 및 94b). 유사하게, 좁혀진 편집 윈도우를 갖는 염기 편집제의 개발은 비-표적 C의 대등한 변형 없이 염기 편집에 의해 교정될 수 있는 적절하게 위치된 NGG PAM을 갖는 클린바 엔트리의 분율을 대략 배가시킨다 (BE3에 대해 31% 내지 YEE-BE3에 대해 59%) (도 94a 및 94b).
요약하면, 염기 편집의 표적화 범위는 상이한 PAM 특이성을 갖는 Cas9 변이체를 사용하는 염기 편집제를 개발함으로써, 및 다양한 편집 윈도우 폭을 갖는 데아미나제 돌연변이체의 집합을 개발함으로써 실질적으로 확장되었다. 이론적으로, 염기 편집은 단일-가닥-특이적 뉴클레오티드 데아미나제 효소에 대한 기질로서 기능할 수 있는 단일-가닥 DNA의 버블을 생성하는 다른 프로그램가능한 DNA-결합 단백질 (예컨대 Cpf116)을 사용하여 가능해야 할 것이다.
물질 및 방법
클로닝. PCR을 Q5 핫 스타트 고-충실도 DNA 폴리머라제 (뉴 잉글랜드 바이오랩스)를 사용하여 수행하였다. BE 및 sgRNA에 대한 플라스미드를 이전에 보고된 플라스미드1로부터 수득된 USER 클로닝 (뉴 잉글랜드 바이오랩스)을 사용하여 구축하였다. DNA 벡터 증폭을 NEB 10베타 적격 세포 (뉴 잉글랜드 바이오랩스)를 사용하여 수행하였다.
세포 배양. HEK293T (ATCC CRL-3216)를 10% (v/v) 소 태아 혈청 (FBS)으로 보충된 둘베코 변형 이글 배지 플러스 글루타맥스 (써모피셔)에서 37℃에서 5% CO2로 배양하였다. APOE 유전자의 ApoE4 이소형을 함유하는 불멸화 래트 성상세포 (타코닉 바이오사이언시즈)를 10% (v/v) 소 태아 혈청 (FBS) 및 200 μg/mL 제네티신 (써모피셔 사이언티픽)으로 보충된 둘베코 변형 이글 배지 플러스 글루타맥스 (써모피셔 사이언티픽)에서 유지하였다.
형질감염. HEK293T 세포를 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 85% 융합도로 형질감염시켰다. 750 ng의 BE 및 250 ng의 sgRNA 발현 플라스미드를 웰당 1.5 μl의 리포펙타민 2000 (써모피셔 사이언티픽)을 제조자의 프로토콜에 따라 사용하여 형질감염시켰다.
게놈 DNA 샘플의 고처리량 DNA 서열분석. 형질감염된 세포를 3일 후에 수거하고, 게놈 DNA를 아젠코트 DN어드밴스 게놈 DNA 단리 키트 (베크만 쿨터)를 제조업체의 지침에 따라 사용하여 단리하였다. 관심 게놈 영역을 보충적 서열에 열거된 플랭킹 HTS 프라이머 쌍으로 PCR에 의해 증폭시켰다. PCR 증폭을 푸션 핫-스타트 II DNA 폴리머라제 (써모피셔)로 제조업체의 지침에 따라 수행하였다. PCR 생성물을 래피드팁스 (디피니티 게노믹스)를 사용하여 정제하였다. 2차 PCR을 수행하여 서열분석 어댑터를 부착시켰다. 생성물을 겔-정제하고, 카파 라이브러리 정량화 키트-일루미나 (카파 바이오시스템즈)를 사용하여 정량화하였다. 샘플을 이전에 기재된 바와 같이 일루미나 MiSeq 상에서 서열분석하였다1.
데이터 분석. 뉴클레오티드 빈도를 이전에 기재된 매트랩 스크립트를 사용하여 평가하였다1. 간략하게, 판독물을 스미스-워터만 알고리즘을 통해 참조 서열에 대해 정렬하였다. 30 미만의 Q-점수를 갖는 염기 호출을 플레이스홀더 뉴클레오티드 (N)로 대체하였다. 이 품질 역치는 1000 중 1의 예상된 이론적 오차 비율을 갖는 뉴클레오티드 빈도를 발생시킨다.
염기 편집 프로세싱성의 분석을 주문제작 피톤 스크립트를 사용하여 수행하였다. 이 프로그램은 표적 부위에 플랭킹되어야 하는 7개 뉴클레오티드 서열에 대한 완벽한 매치에 의해 측정되는 바와 같이 서열분석 판독물을 20개 뉴클레오티드 프로토스페이서 서열에 대해 트리밍한다. 그 후, 이들 표적을 통합하고, 풍부도에 의해 분류하여 염기 편집 생성물의 빈도를 평가하였다.
인간 질환-연관된 돌연변이의 클린바 데이터베이스의 생물정보학적 분석을 작은 수정을 제외하고 이전에 기재된 것과 유사한 방식으로 수행하였다1. 이들 수정은 주문제작가능한 길이 및 서열의 PAM을 갖는 표적의 확인을 가능하게 한다. 또한, 이 개선된 스크립트는 표적 C 위치의 우선순위 랭킹 (C5 > C6 > C7 >C8 C4)을 포함하며, 따라서 온-타겟 C가 윈도우 내에서 단지 시토신이거나, 편집 윈도우 내에서 임의의 오프-타겟 C보다 더 높은 예측된 편집 효율을 갖는 위치에 놓이는 표적 부위의 확인을 가능하게 한다.
실시예 12에 대한 참고문헌
실시예 13
개선된 형질감염 절차 및 보다 양호한 플라스미드를 사용하여, 생물학적 반복 (n=3)을 사용하여 4가지 HF 돌연변이를 BE3의 Cas9 부분 내로 설치하였다. 돌연변이는 플라스미드 전달로 온-타겟팅 편집을 유의하게 실시하지 않는다 (도 99). 시험된 농도에서, BE3 단백질 전달은 작용하지만; 그러나, 온-타겟 편집은 플라스미드 전달에 대해서보다 더 낮다 (도 100). 설치된 HF 돌연변이를 갖는 BE3의 단백질 전달은 온-타겟팅 편집 효율을 감소시키지만, 여전히 일부 편집된 세포를 생성한다 (도 101).
리포펙션 및 HF 돌연변이의 설치 둘 다는 오프-타겟 탈아미노화 사건을 감소시키는 것으로 나타났다. 도 102에 제시된 4개의 부위에 대해, 가장 높은 GUIDE-Seq 판독물 및 탈아미노화 사건을 갖는 오프-타겟 부위 (OT)를 검정하였다 (Komor et al., Nature, 2016). 가장 가까운 상응하는 C에서의 오프-타겟 편집을 온-타겟 편집으로 나눔으로써 특이성 비를 계산하였다. 오프-타겟 편집이 검출가능하지 않은 경우, 비는 100으로 설정되었다. 따라서, 보다 높은 특이성 비는 보다 많은 특이적 구축물을 나타낸다. BE3 플라스미드 전달은 BE3의 단백질 전달, HF-BE3의 플라스미드 전달, 또는 HF-BE3의 단백질 전달보다 훨씬 더 높은 오프-타겟/온-타겟 편집을 나타내었다 (도 102 및 105).
정제된 단백질 HF-BE3 및 BE3을 가장 허용적인 모티프를 갖는 스페이서에서의 상이한 위치에서 C를 T 잔기로 전환시키는 그의 능력에 대해 시험관내에서 분석하였다. BE3 및 HF-BE3 단백질 둘 다는 염기 편집에 대해 동일한 "윈도우"을 갖는 것으로 밝혀졌다 (도 103 및 104).
질환 표적의 목록이 표 8에 주어진다. 표 8에서 편집되는 염기는 볼드체 및 밑줄표시로 지시된다.
표 8. 염기 편집제 질환 표적
표 6. 염기 편집제를 사용하여 치료될 수 있는 예시적인 질환. 프로토스페이서 및 PAM 서열 (서열식별번호: 577-589)은 sgRNA (PAM) 열에 나타나 있다. PAM 서열은 괄호 안에 및 밑줄표시됨으로써 지시되는 편집되는 염기와 함께 나타나 있다.
실시예 14: 염기 편집 구축물의 시험
BE3, BE4-pmCDA1, BE4-hAID, BE4-3G, BE4-N, BE4-SSB, BE4-(GGS)3, BE4-XTEN, BE4-32aa, BE4-2xUGI, 및 BE4를 포함한 여러 염기 편집 구축물을 상이한 표적 서열 (즉, EMX1, FANCF, HEK2, HEK3, HEK4, 및 RNF2) 내의 시토신 (C) 잔기를 편집하는 그의 능력에 대해 시험하였다. 예를 들어, 이들 구축물이 C에서 T로의 돌연변이를 생성할 수 있는지 시험하였다. 염기 편집 구축물의 개략적 표현이 도 109에 제시된다. 시험된 표적 서열이 또한 도 109에 제시되고, 표적화된 시토신은 넘버링되고 적색으로 표시된다.
하기 아미노산 서열을 본 실시예의 염기 편집 구축물에서 사용하였다:
도 109에 제시된 구축물의 아미노산 서열이 하기에 제시된다:
EMX1, FANCF, HEK2, HEK3, HEK4, 및 RNF2의 표적 시토신 잔기를 돌연변이시키는 도 109의 염기 편집 구축물의 능력이 도 110-115에 제시된다. 편집된 표적 시토신의 백분율 (T, A 또는 G로 돌연변이된 C 잔기의 비율 포함), 뿐만 아니라 생성된 indel의 %가 도 110-115에 제시된다. 편집된 표적 시토신의 백분율을 하기 식을 사용하여 계산하였다: 100-[C를 갖는 서열분석 판독물의 %]. 도 110-115의 파이 차트는 표시된 다양한 염기를 갖는 판독물의 분포를 보여주며, 이는 모든 염기 편집된 판독물 (표시된 염기에서 C 이외의 뉴클레오티드를 갖는 판독물) 중 A, G, 또는 T를 갖는 것들의 백분율이 얼마인지 살펴보는 것을 의미한다. 하기 표 9 내지 표 14는 도 110-115의 파이 차트에 의해 표시되는 돌연변이 백분율의 값을 나타낸다.
관찰된 C에서 비-T로의 편집은 UDG (우라실 DNA 글리코실라제)로 인한 것일 가능성이 있다. 예를 들어, C가 우라실 중간체로 전환되면, UDG는 이를 무염기성 부위로 전환시킬 수 있다. 이어서, 이러한 무염기성 부위는 다른 내인성 효소에 의해 프로세싱되고, 결국 indel 또는 다른 염기 (예컨대 G 또는 A)가 C를 대체하는 것을 야기한다. 본 발명자들은 UDG 녹-아웃 세포주에서 indel을 거의 내지 전혀 갖지 않는 증가된 C에서 T로의 편집을 보여준다는 것을 밝혀냈다.
실시예 15: 표적화된 가닥을 절단하는 Cpf1 니카제를 포함하는 염기 편집제.
상기 논의된 바와 같이, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 Cpf1 단백질일 수 있다. 일부 실시양태에서, Cpf1 단백질은 Cpf1 니카제 (nCpf1)이다. Cpf1 니카제, 예를 들어 비-표적 가닥을 절단하는 Cpf1 니카제 (AsCpf1 내의 R1225A; 및 LbCpf1 내의 R1138A)는 문헌 [Yamano et al., "Crystal structure of Cpf1 in complex with guide RNA and target DNA." Cell (165) 2016, p. 949-962]에 기재되어 있으며, 그의 전체 내용은 본원에 참조로 포함된다. 그러나, 표적 가닥을 절단하는 니카제 (예를 들어, 염기 편집제 단백질의 Cpf1 니카제)는 염기 편집 효율을 개선시킬 것으로 예상된다.
형광 표지된 DNA를 사용하여 비-표적 가닥보다는 표적 가닥을 우선적으로 니킹하는 Cpf1 돌연변이체를 확인하였다 (도 116 참조). 도 116에서, DNA 구축물 1-3의 상부 가닥은 비-표적 가닥이고, 하부 가닥은 표적 가닥이다. 야생형 LbCpf1, R836A (LbCpf1), 및 R1138A (LbCpf1)를 사용하여 시험관내 검정을 수행한다. R836A (LbCpf1)는 "손상된" 니카제인 것으로 보이며, 이는 그것이 비-표적 가닥보다 더 효율적으로 표적 가닥을 절단한다는 것을 의미한다. 도 117에 제시된 바와 같이, 비-표적 가닥은 절단되지 않았고, 형광 350 조각이 관찰되지 않았다. 2시간 후, 가닥 둘 다를 절단하였다. 상이한 강도는 비-표적 가닥보다 더 많은 표적 가닥이 절단된다는 것을 시사한다.
AsCp1-BE3을 사용한 염기 편집 윈도우의 확립
napDNAbp로서 LbCpf1(R836A) 또는 AsCpf1(R912A)을 갖는 염기 편집 단백질 (예를 들어, BE3 (SpCas9-BE3))은 낮은 효율로 (0.1% 내지 0.4%) 염기를 편집하는 것으로 밝혀졌다. AsCpf1 (R912A) napDNAbp를 갖는 염기 편집제는 EMX1, FANCF, HEK3 및 HEK4 부위에서 표적 C를 더 효율적으로 돌연변이시켰다. 시험된 구축물의 편집 윈도우는 제7 염기에서 제11 염기인 것으로 보인다. 숫자는 가장 높은 수를 갖는 BE3 및 보다 낮은 수를 갖는 자기-무력화 BE (비-표적 가닥을 절단하는 APOBEC-AsCpf1(R1225A)-UGI)와 경향이 일치한다. 도 118 참조 EMX1 상에 Cas9-BE3를 갖는 양성 대조군: 5-6%. AsCpf1에 대한 indel 값: >20%. AsCpf1 내의 R912는 Cpf1 패밀리의 많은 구성원에 걸쳐 보존된다. LbCpf1 내의 상응하는 잔기는 R836이고, 이는 R이 A로 돌연변이되는 경우에 "손상된" 니카제인 것으로 여겨진다.
Cpf1-BE (링커)의 최적화
indel 데이터는 Cpf1이 DNA 표적 부위에 접근할 수 있다는 것을 시사한다. 따라서, Cpf1 염기 편집 단백질의 최적화는 특정 APOBEC 단백질, 링커, 및/또는 UGI 도메인에 초점을 맞추었다. LbCpf1 (R836A) 및 AsCpf1 (R912A) 둘 다를 사용하여 다양한 링커를 사용하여 도 119에 제시된 구축물을 시험하였다. 간략하게, APOBEC와 Cpf1 도메인 (예를 들어, AsCpf1 또는 LbCpf1) 사이의 상이한 링커 서열 (즉, XTEN, GGS, (GGS)3 (서열식별번호: 610), (GGS)5 (서열식별번호: 610), 및 (GGS)7 (서열식별번호: 610))을 시험하였다. 도 120을 참조한다. 구축물을 TGCTTCTC8CAGCCCTGGCCTGG (서열식별번호: 592)인 HEK3 부위의 C8 잔기를 돌연변이시키는 그의 능력에 대해 시험하였다. AsCpf1을 사용한 염기 편집 단백질에 대한 편집 수준은 1% 초과에 도달한 반면, LbCpf1을 사용한 염기 편집 단백질은 염기 편집 효율의 상대 감소를 보여주었다. 도 121에 제시된 바와 같이, 통합 생물정보학 VU 센터에 의해 유지된 데이터베이스로부터의 링커는 AsCpf1-BE3에 대해 GGS-유형 링커만큼 유의한 개선을 보여주지 않았다. 도 121에 제시된 링커는 하기에 제시된다:
Cpf1-BE (배향)의 최적화
Cas9는 C와 N 말단 사이의 아미노산의 스트레치를 갖는 반면 (적색 사각형, 도 123 참조), AsCpf1은 그렇지 않다 (도 122 참조). 또한, AsCpf1은 N과 C 말단 사이의 거리가 더 짧다. 이러한 관찰은 UGI가 비-표적 가닥에 대한 APOBEC 접근을 방해할 수 있는 (N 말단 상의) APOBEC와 (C 말단 상의) UGI 사이의 잠재적 간섭을 나타낸다. 하나의 해결책은 APOBEC 및 UGI를 N 또는 C의, 동일한 말단 상으로 이동시키는 것이다. 따라서, 아키텍처 NLS-UGI-APOBEC-XTEN-AsCpf1; UGI-APOBEC-XTEN-AsCpf1-NLS; 및 AsCpf1-XTEN-APOBEC-NLS를 갖는 구축물이 시험될 것이다.
Cpf1-BE (내부 말단절단)의 최적화
비-표적 가닥이 풀려 있는 Cpf1의 공지된 결정 구조는 존재하지 않는다 (도 124, 시안색 참조). 편집 윈도우는 도 124에 제시된 바와 같은 적색 원 내에 있어야 한다고 여겨진다. APOBEC를 방해할 수 있는 나선 영역이 존재한다 (도 124의 정사각형 참조). 이러한 영역은 아미노산 서열 K(661)KTGDQK(667) (서열식별번호: 603)을 포함한다.
2, 4 또는 6개의 잔기의 제거가 염기 편집 효율을 개선시키는지 시험하기 위해, 표적 부위로서 HEK3을 사용하여 AsCpf1(R912A) napDNAbp를 갖는 염기 편집제로 실험을 수행하였다. 편집 수준은 T663 및 D665가 결실된 경우에 대조군 수준으로부터 대략 2.6%로 증가한다 (- 6배 증가) (하기 표 7 참조). 본 실험에서 사용된 구축물은 APOBEC-XTEN-AsCpf1(R912A)-SGGS-UGI였다.
표 7
참고문헌
실시예 16: 단백질 조작 및 단백질 전달을 통한 염기 편집의 DNA 특이성 및 적용가능성 개선
염기 편집, 이중 가닥 DNA 절단이 없는 한 염기 쌍의 또 다른 것으로의 프로그램가능한 전환을 가능하게 하는 게놈 편집 접근법, 과도한 확률적 삽입 및 결실, 또는 상동성-지정 복구에 대한 의존이 개발되었다. 염기 편집의 적용은 오프-타겟 활성 및 세포내 DNA 전달에 대한 의존에 의해 제한된다. 여기서, 이러한 한계를 해결하는 2가지 진전이 기재된다. 먼저, 오프-타겟 염기 편집은 고충실도 염기 편집제 (HF-BE3)를 생성하기 위해 돌연변이를 제3 세대 염기 편집제 (BE3) 내에 설치함으로써 감소되었다. 다음으로, BE3 및 HF-BE3을 정제하고, 리보핵단백질 (RNP) 복합체로서 포유동물 세포 내로 전달하고, DNA-무함유 염기 편집을 확립한다. BE3의 RNP 전달은 대등한 온-타겟 편집 수준을 유지하면서 HF-BE3의 플라스미드 형질감염보다 훨씬 더 높은 특이성을 부여한다. 마지막으로, 이들 진전을 적용하여 BE3 RNP를 제브라피쉬 배아 및 살아있는 마우스의 내이 둘 다로 전달하여, 생체내에서 특이적인 DNA-무함유 염기 편집을 달성한다.
도입
전통적인 게놈 편집제는 게놈 편집의 제1 단계로서 이중-가닥 DNA 파괴 (DSB)를 도입한다1-4. 세포는 주로 비-상동 말단 연결 (NHEJ)을 통해 DSB에 반응하여, 절단 부위에서 확률적 삽입 또는 결실 (indel)을 발생시킨다1,5. 게놈 DNA에서 보다 정확한 변화를 생성하기 위해, 상동성-지정 복구 (HDR)는 절단 부위를 둘러싼 게놈 DNA를 외인성으로 공급된 DNA 공여자 주형의 것으로 대체하는 데 사용될 수 있다6-8. 불행히도, HDR은 전형적으로 NHEJ와 경쟁하여 생성된 과량의 indel을 동반하고, 이는 주로 유사분열 세포로 제한된다. 또한, 대부분의 게놈 편집 방법은 외인성 플라스미드 또는 바이러스 DNA의 포유동물 세포 내로의 전달에 이어서 작용제의 세포내 발현에 의존한다9-12. 이들 전달 방법은 온-타겟 유전자좌가 편집된 후에도 연속적인 제어되지 않은 Cas9 및 sgRNA 발현을 발생시켜, 오프-타겟 유전자좌에서의 게놈 편집의 기회를 증가시킨다1,13.
염기 편집, C:G 염기 쌍의 T:A 염기 쌍으로의 직접적 프로그램가능한 표적화된 전환을 가능하게 하는 게놈 편집에 대한 상이한 접근법이 최근에 기재되었다3,14. 제3 세대 염기 편집제 BE3은 단일 단백질 내에 (i) 가이드 RNA-특정된 유전자좌에서 소형 단일 가닥 DNA 버블을 개방하는 촉매적으로 손상된 Cas9, (ii) 단일 가닥 DNA 버블 내의 대략 5개 뉴클레오티드의 윈도우 내에서 C를 U로 전환시키는 테더링된 단일 가닥-특이적 시티딘 데아미나제, (iii) 염기 절제 복구를 억제함으로써 염기 편집의 효율 및 생성물 선택성을 개선시키는 우라실 글리코실라제 억제제 (UGI), 및 (iv) G-함유 DNA 가닥을 대체하는 것으로 세포 미스매치 복구를 조작하기 위한 니카제 활성을 함유한다. 이들 성분의 조합은 최소의 indel을 형성하면서 포유동물 세포에서 효율적이고 영구적인 C에서 T로의 (또는 G에서 A로의) 전환을 가능하게 한다. 이전에 보고된 이후로14, 다른 연구자들이 포유동물 세포15-17 및 식물18에서의 Cas9-지정 C에서 T로의 전환을 용이하게 하는 이러한 전략 및 관련 접근법의 능력을 확인하였다.
여기서, 염기 편집의 DNA 특이성을 크게 개선시키고, 시험관내에서 및 생체내에서 외인성 DNA를 공급하지 않으면서, 숙주 게놈과의 재조합 및 세포독성의 위험과 연관된 염기 편집을 허용하는 2가지 진전이 기재된다18,19. 먼저, 온-타겟 편집 활성에서 오직 보통의 감소를 가지면서 오프-타겟 편집 사건을 감소시키는 Cas920의 DNA 친화도를 감소시키는 것으로 공지된 돌연변이를 혼입시키는 BE3의 돌연변이체 형태가 조작된다. 이어서, 가이드 RNA와 복합체화된 염기 편집제 단백질의 지질-매개 전달이 플라스미드 DNA 전달과 비교하여 온-타겟 염기 편집에서 명백한 감소 없이 훨씬 더 큰 특이성 증진을 발생시킨다는 것이 밝혀졌다. RNP로서의 염기 편집제의 전달은 전형적으로, 배양된 인간 및 마우스 세포에서 고도로 반복되는 게놈 DNA 서열을 표적화하는 상당히 혼재성인 가이드 RNA에 대해서도, 오프-타겟 편집을 측정가능한 수준 미만으로 감소시킨다. 이러한 진전은 마우스 및 제브라피쉬에서 고도로 특이적인 DNA-무함유 생체내 염기 편집이 입증되도록 한다.
결과
고충실도 염기 편집제의 조작
Cas9 뉴클레아제 및 그의 연관된 융합 구축물은 오프-타겟 게놈 유전자좌에서 DNA에 결합하고 그를 절단하는 것으로 밝혀졌다21-24. 종 및 동료들은 4개의 점 돌연변이 (N497A, R661A, Q695A, Q926A)를 함유하는 고충실도 SpCas9 변이체인 HF-Cas9을 개발하였으며, 이는 그의 DNA 절단 특이성을 크게 증가시킨 TALEN에서의 비-특이적 DNA 상호작용의 이전 폐기와 일치하는25, Cas9와 DNA 표적 가닥의 포스페이트 백본 사이의 비-특이적 상호작용을 제거하도록 설계되었다 (도 125a)20. 염기 편집제가 Cas9에 의해 생성되는 단일 가닥 DNA 버블 내에서 비-표적 가닥 상에 작용하기 때문에14, "HF-BE3"을 생성하기 위해 HF-Cas9에서 BE3으로 이들 4개의 점 돌연변이를 도입하는 것이 그의 염기 전환 능력을 변경시키지 않으면서 오프-타겟 염기 편집을 감소시킬 수 있는 것으로 가설화될 수 있다 (도 125a 및 125c).
His6-태그부착된 단백질로서의 BE3 및 HF-BE3을 코딩하는 플라스미드를 이. 콜라이에서 과다발현시키고, 먼저 니켈 친화도 크로마토그래피에 이어서 양이온 교환 크로마토그래피에 의해 정제하였다 (도 126a-126b). 발현 및 정제 조건의 광범위한 최적화 후에, BE3 및 HF-BE3 단백질은 상용적으로 배양 배지 리터당 ~2 mg의 수율로 생성될 수 있다 (도 126a-126c).
정제된 염기 편집제 단백질을 사용하여 염기 편집 효율 및 HF-BE3 및 BE3의 편집 윈도우의 폭을 생화학적으로 비교하였다. TC 반복부로 구성된 프로토스페이서를 갖는 합성 dsDNA 79량체에서 시험관내 C에서 U로의 전환 효율을 측정하였다. 표적 dsDNA (250 nM)를 30분 동안 37℃에서 BE3:sgRNA 또는 HF-BE3:sgRNA (2 μM)와 함께 인큐베이션하였다. 인큐베이션 후, 편집된 DNA를 우라실-내성 폴리머라제를 사용하여 증폭시키고, 고처리량 DNA 서열분석 (HTS)에 의해 서열분석하였다. 시험관내에서 HF-BE3 및 BE3에 대한 비교 편집 효율 및 활성 윈도우 폭이 관찰되었다 (도 125b). 이러한 발견은 고충실도 돌연변이를 BE3에 도입하는 것이 내재된 온-타겟 염기 편집 효율을 손상시키지 않거나, 시험관내에서 생성된 HF-BE3 단백질의 편집 윈도우의 폭을 변화시킨다는 것을 나타낸다.
HF-BE3은 DNA 형질감염 후 편집 특이성을 증진시킨다
다음으로, 플라스미드 DNA 형질감염 후에 포유동물 세포에서의 BE3 및 HF-BE3의 염기 편집 효율, 특이성 및 편집 윈도우 폭을 비교하였다. 4개의 널리 연구된 내인성 게놈 유전자좌 (HEK293 부위 3, FANCF, EMX1 및 VEGFA 부위 2)를 포유동물 세포에서 온- 및 오프-타겟 염기 편집을 조사하기 위해 선택하였다14,24. VEGFA 부위 2는 20개의 프로토스페이서 뉴클레오티드 중 14개 C를 함유하여 고도로 반복적이고, 상당히 높은 비율의 공지된 오프-타겟 게놈 편집과 연관된다20,22,24,26. 이 부위는 그것이 강력한 특이성 문제를 제기하기 때문에 포함되도록 선택되었다. 대부분의 뉴클레아제-기반 게놈 편집 적용과는 대조적으로, 염기 편집은 프로토스페이서의 정확한 위치에 의존하여 편집 윈도우 내에 표적 뉴클레오티드를 위치시키고, 통상적으로 가이드 RNA의 선택에서 이용가능한 가요성이 거의 또는 전혀 없다. 따라서, 고도로 반복적인 혼재성 sgRNA 표적에 대해서도 증진된 특이성을 갖는 염기 편집제의 개발이 중요하다3,14.
온-타겟 유전자좌 및 공지된 오프-타겟 유전자좌를 PCR에 의해 증폭시키고, 4개의 염기 편집제:sgRNA 쌍 각각으로의 플라스미드 형질감염24 후 HTS에 의해 분석하였다. 이들 4개의 내인성 게놈 유전자좌에 대한 HEK293T 세포에서의 온-타겟 편집은 HF 돌연변이의 도입에 의해 약간 감소되었고; 편집은 BE3에서 29±5%, 및 HF-BE3에서 21±3%로 평균내어졌다 (n = 3개의 생물학적 반복에 대해 평균 ± s.e.m.) (도 127a-127d, 128a).
3개의 표준, 비-반복적 표적 부위 (HEK293 부위 3, FANCF, 및 EMX1) 각각에 대해, Cas9 및 동일한 가이드 RNA를 사용한 처리로부터 변형된 것으로 이전에 보고된 오프-타겟 유전자좌로부터의 편집 윈도우 내의 C를 함유하는 3개의 가장 빈번하게 변형된 오프-타겟 유전자좌를 시험하였다 (표 15)24. 세포를 BE3 플라스미드로 형질감염시킨 경우에, HEK293 부위 3, FANCF, 및 EMX1에 대한 9개의 가장 빈번하게 변형된 Cas9 오프-타겟 유전자좌에 걸친 C→T 전환은 1.1±0.3%로 평균내어졌다 (도 127a-c; n = 3개의 생물학적 반복에 대해 평균 ± s.d.). HF 돌연변이의 설치는 평균 오프-타겟 편집의 절대 수준을 0.03±0.005%로 37배만큼 감소시켰고, 단 1개의 경우의 측정가능한 오프-타겟 C→T 전환을 갖는다 (도 127a; 오프-타겟 1에서 EMX1 C5).
표 15: 본 작업에서 연구된 온- 및 오프-타겟 인간 게놈 유전자좌에 대한 프로토스페이서 및 PAM 서열. 오프-타겟 부위를 그의 GUIDE-Seq 판독 카운트에 기초하여 선택하였다45. 특정한 sgRNA에 대한 편집 윈도우 내의 시토신을 넘버링하였다. PAM 서열은 볼드체로 나타나 있다. 그의 각각의 온-타겟 유전자좌와 상이한 오프-타겟 유전자좌 내의 프로토스페이서 염기가 밑줄표시되어 있다. 게놈 서열에 대해 뮤린 샘플에서 조사하였다 (도 132e 참조).
극도로 어려운 부위에 대한 HF-BE3 특이성을 특징화하기 위해, 고도로 반복적인 VEGFA 부위 2 유전자좌를 표적화하는 경우에 BE3 및 HF-BE3 오프-타겟 활성을 비교하였다. BE3 처리는 이러한 sgRNA와 연관된 4개의 시험된 오프-타겟 부위의 활성 윈도우에 위치한 시토신의 평균 15±5% 편집을 야기한다 (이 단락에서 인용된 모든 평균 값은 n = 3개의 생물학적 반복에 대해 평균 ± s.d.를 나타냄). 대조적으로, HF-BE3은 동일한 오프-타겟 부위에서 절대 오프-타겟 편집 (5.0±2.3%)의 3배 감소를 생성한다 (도 127d). BE3의 형질감염과 비교한 경우에, HF-BE3은 유의하게 (p < 0.05, 양측 스튜던트 t 검정) 오프-타겟 유전자좌에 위치한 57개의 시토신 중 27개에서 오프-타겟 편집을 감소시킨 반면 (표 16), HF-BE3 처리는 16개의 조사된 온-타겟 시토신 잔기 중 오직 3개에서 온-타겟 편집의 유의한 감소 (p < 0.05 양측 스튜던트 t 검정)를 야기하였다.
표 16: 본 연구에서 평가된 모든 유전자좌에서의 상이한 처리 조건 하의 염기 편집의 차이에 대한 P-값. 물질 및 방법에 기재된 바와 같은 스튜던트 양측 t-검정을 사용하여 p-값을 계산하였다. p-값이 유의한 차이를 나타내는 경우에 (p < 0.05), 상응하는 엔트리가 강조되었다.
오프-타겟 유전자좌에서의 절대 편집 사이의 차이를 고려하는 것 이외에도, 관찰된 온-타겟 효율을 오프-타겟 효율로 나누어 온-타겟:오프-타겟 편집 특이성 비를 또한 계산하였다 (도 129a-129b). 이러한 메트릭은 HF-돌연변이의 설치와 연관된 온-타겟 편집의 임의의 감소를 고려하고, 염기 편집의 효율 및 특이성 둘 다에 대해 감수성인 적용에 유용하다. HF-BE3에 의한 오프-타겟 편집은 여러 오프-타겟 유전자좌에 대한 고처리량 서열분석의 검출 한계 미만이었다. 이들 경우에 대해, 검출 상한과 동일한 보존적 오프-타겟 편집 효율을 가정하였다 (0.025% C→T 전환; 방법 참조). 이러한 분석에 기초하여, 본원에서 조사된 모든 34개의 표적 시토신에 걸친 HF 돌연변이의 설치시 특이성 비율의 평균 개선은 2개의 구축물의 플라스미드 전달이 수행된 경우에 19배였다. 이러한 결과는 비-반복적 부위 (도 129a) 뿐만 아니라 고도로 반복적인 부위 (도 129b)에 대해, HF-BE3이 BE3과 비교하여 온-타겟 편집 효율의 보통의 감소만을 가지면서 실질적으로 증진된 염기 편집 특이성을 발생시킨다는 것을 집합적으로 확립한다.
BE3의 RNP 전달은 DNA-무함유 염기 편집을 가능하게 한다
다음으로, 배양된 인간 세포 내로 직접 전달된 경우에 염기 편집을 매개하는 DNA-무함유, RNP 형태의 BE3의 능력을 연구하였다. 최근에 양이온성 지질 시약이 음으로 하전된 단백질 또는 단백질:핵산 복합체를 리보핵단백질 (RNP) 복합체를 포함하는 포유동물 세포 내로 강력하게 전달할 수 있고, RNP 전달은 오프-타겟 게놈 편집을 실질적으로 감소시킬 수 있는 것으로 확립되었다27-29.
상업적으로 입수가능한 양이온성 지질 리포펙타민 2000을 EMX1, HEK293 부위 3, FANCF, 또는 VEGFA 부위 2 유전자좌를 표적화하는 가이드 RNA와 사전-복합체화한 후 정제된 BE3 단백질 또는 HF-BE3 단백질과 조합하고, 생성된 지질:RNP 복합체를 HEK293T 세포와 함께 인큐베이션하였다. 72시간 후, 게놈 DNA를 수거하고, 온-타겟 및 오프-타겟 염기 편집을 고처리량 DNA 서열분석에 의해 분석하였다. 모든 Cas9-기반 기술에서와 같이, 실질적인 변이가 상이한 게놈 유전자좌에서의 편집 효율에서 관찰되었다 (도 127 및 130). 상이한 처리 사이의 온-타겟 편집 효율과 연관된 경향을 나타내기 위해, 평균 온-타겟 염기 편집 효율을 4개의 시험된 유전자좌에서 계산하였다 (도 128a). BE3 (200nM)의 단백질 전달은 플라스미드 형질감염에서 관찰된 것과 대등한 온-타겟 편집 효율을 생성한다 (각각 26±4% 대 29±5%; n = 3개의 생물학적 반복에 대해 평균 ± s.e.m.; 도 128a).
대조적으로, HF-BE3의 단백질 전달은 연구된 4개의 게놈 유전자좌에서의 BE3의 단백질 전달과 비교하여 온-타겟 편집을 감소시켰다 (각각 13±3% 대 26±4%의 평균 편집 효율; n = 3의 생물학적 반복에 대해 평균 ± s.e.m.; 도 128a). HF-BE3 및 BE3은 시험 튜브에서 대등한 편집 효율을 갖고 (도 125b), 편집은 HF-BE3이 HEK293T 세포에서 플라스미드로부터 발현되는 경우에 단지 약간 감소되기 때문에 (도 127a-d), HF-BE3 단백질 전달로부터의 편집의 감소된 효율이 포유동물 세포에서의 감소된 HF-BE3 안정성의 결과일 수 있다는 것을 추측하는 것이 그럴듯하다. 보다 낮은 안정성은 플라스미드로부터의 연속적인 발현에 의해 오프셋될 수 있지만, 1회 단백질 전달 후에는 그렇지 않다. 이러한 관찰은 CD34+ 조혈 줄기 및 전구 세포로 뉴클레오펙션된 경우에 정제된 Cas9와 비교하여 정제된 HF-Cas9를 사용한 감소된 온-타겟 indel 형성의 최근 보고와 일치하였다30. 본 연구를 검토하는 동안, 킴(Kim) 등은 전기천공법을 사용하여 BE3의 마우스 배아로의 RNP 전달을 입증하였다31. 본 발명자들의 지식이 미치는 한, 본 접근법은 전기천공 없이 포유동물 세포에서의 개별 뉴클레오티드에 대한 정확한 변화를 생성할 수 있는 제1 DNA-무함유 기술이고, 이는 제한된 생체내 치료적 관련성을 갖는다.
염기 편집제의 RNP 전달은 DNA 특이성을 크게 증진시킨다
중요하게는, BE3 및 HF-BE3의 RNP 전달이 실질적인 온-타겟 염기 편집을 야기하는 반면, 어떠한 경우의 측정가능한 염기 편집 (< 0.025%)도 EMX1, FANCF 및 HEK293 부위 3과 연관된 9개의 시험된 오프-타겟 유전자좌 중 임의의 것에서 관찰되지 않았다 (도 130a-130c). 대조적으로, BE3의 플라스미드 전달은 염기 편집 활성 윈도우 내의 모든 서열분석된 시토신에 걸쳐 평균 1.1±0.3% (n = 3개의 생물학적 반복에 대해 평균 ± s.d.) 오프-편집 및, 이들 9개의 오프-타겟 유전자좌에 위치한 16개 오프-타겟 시토신 중 11개에서 검출가능한 오프-타겟 편집을 야기한다 (도 127a-127d). 시험된 3개의 비-반복적 유전자좌의 오프-타겟 유전자좌에서, BE3 단백질 전달은 플라스미드 전달의 것보다 26배 더 높은 평균 특이성 비를 야기한다 (도 127a). 이러한 결과는 염기 편집제의 RNP 전달이 염기 편집의 DNA 특이성을 극적으로 증가시킨다는 것을 밝혀냈다.
BE3 또는 HF-BE3의 단백질 전달은 또한 BE3 또는 HF-BE3의 플라스미드 전달과 비교하여 고도로 혼재성인 VEGFA 부위 2 유전자좌에서 크게 개선된 염기 편집 특이성을 발생시켰다 (도 127 및 130 참조; 표 16 참조). 이러한 부위와 연관된 오프-타겟 유전자좌에서의 염기 편집의 절대 빈도는 BE3 (플라스미드 전달: 15±4% 오프-타겟 편집; 단백질 전달: 1.3±0.4% 오프-타겟 편집; 이 단락에서의 모든 값은 n = 3개의 생물학적 반복에 대해 평균 ± s.d.를 나타냄) 및 HF-BE3 (플라스미드 전달: 5±2% 오프-타겟 편집; 단백질 전달: 0.5±0.1% 오프-타겟 편집) 둘 다에 대해 단백질 전달시 적어도 10배 감소되었다. 모든 4개의 연구된 유전자좌에 걸쳐, 온-타겟:오프-타겟 편집에 대한 염기 편집 특이성 비는 BE3의 플라스미드 전달과 비교하여 BE3의 단백질 전달에 대해 평균 66배 증가하였다 (도 129). 집합적으로, 이들 결과는 반복적 및 비-반복적 표적 부위 둘 다에 대해, DNA 전달에 비해 RNP 전달이 고충실도 Cas9 돌연변이의 존재 또는 부재보다 염기 편집 특이성의 더 강한 결정인자라는 것을 밝혀냈다.
HF 돌연변이의 도입도 전달 방법도 염기 편집과 연관된 낮은 indel 비율을 실질적으로 변경시키지 않았다. 본 연구에서 모든 처리 조건에 걸친 모든 온-타겟 유전자좌에서의 indel 빈도는 낮게 유지되었고 (전형적으로 ≤ 5%; 도 131a), 편집:indel 비는 최적화된 HDR 프로토콜을 사용한 이전 연구에서보다 시험된 모든 경우에서 더 높게 유지되었다 (전형적으로 ≥ 10-배; 도 131b)30,32,33. 비-반복적 sgRNA의 경우, BE3의 플라스미드 전달이 VEGFA 부위 2와 연관된 오프-타겟 유전자좌에 대해 최대 5% indel을 생성하였다는 것에 주목하더라도 (도 131c), 매우 적은 indel이 오프-타겟 유전자좌에서 관찰되었다 (도 131c).
종합하면, 이들 결과는 염기 편집제의 단백질 전달이 온-타겟 염기 편집 효율을 유지하고 플라스미드 DNA의 전달에 비해 편집 특이성을 크게 증진시킨다는 것을 확립한다.
RNP 전달은 온- 및 오프-타겟 편집을 탈커플링시킨다
BE3의 단백질 전달과 연관된 염기 편집 특이성의 현저한 증진을 고려할 때, 이러한 개선이 세포 내로 전달된 활성 게놈 편집제의 총량을 감소시키는지 조사하였다. EMX1을 표적화하는 sgRNA를 사용하여, 플라스미드 (도 128b) 및 단백질 전달 (도 128c)에 대한 용량 반응 연구를 수행하였다. 처리 조건 사이의 형질감염 효율을 최대화하기 위해, 리포펙타민 2000의 부피는 모든 시험에 대해 1.5 μL였고, 염기 편집제 단백질:sgRNA 몰비는 단백질 전달을 위해 1:1.1로 유지하였다. 플라스미드 전달을 위해, 1:3 (몰비 ~1:1)의 sgRNA 플라스미드:BE3 플라스미드의 질량 비 및 1.5 μL의 리포펙타민 2000을 사용하였다. 오프-타겟 염기 편집은 플라스미드 전달에 대해 시험된 모든 조건 하에 관찰되었지만 (도 128b), 시험된 모든 단백질 전달 조건 하에서는 실질적으로 오프-타겟 편집이 관찰되지 않았다 (도 128c).
플라스미드 및 단백질 전달에 대한 온- 및 오프-타겟 편집 사이의 관계를 평가하기 위해 선형 회귀 분석을 수행하였다. 플라스미드 전달을 위해, 오프-타겟 편집은 온-타겟 편집 비율와 밀접하게 연관되었지만 (비-0 기울기, F-시험에 대해 R2 = 0.95, p = 0.0012), 단백질 전달을 사용한 오프-타겟과 온-타겟 편집 사이에 유의한 연관이 없었다 (비-0 기울기, F-시험에 대해 R2 = 0.078, p = 0.59).
이들 데이터는 염기 편집제의 단백질 전달이 투여량과는 독립적인 고유한 특이성 이점을 제공한다는 것을 나타낸다. 이전 관찰과 함께29,34, 이러한 발견은 DNA 전달과 비교하여 단백질 전달로부터의 염기 편집의 보다 높은 DNA 특이성이 염기 편집제에 대한 게놈의 연장된 노출을 피함으로써, 온-타겟 유전자좌가 이미 변형된 후에 오프-타겟 유전자좌를 프로세싱하는 염기 편집제의 기회를 최소화하는 단백질 전달의 능력으로부터 발생한다는 모델을 지지한다.
제브라피쉬 및 마우스에서의 DNA-무함유 염기 편집
상기 관찰은 검출가능한 오프-타겟 염기 편집을 제거하면서 온-타겟 염기 편집을 유지하기 위한 BE3의 단백질 전달의 가능성을 제안하였다. 따라서, BE3의 단백질 전달이 수정된 제브라피쉬 배아 내로 티로시나제 유전자좌를 표적화하는 BE3:sgRNA 복합체를 주사함으로써 제브라피쉬 내의 특정 점 돌연변이를 생성하는 데 사용될 수 있는지 시험하였다. 주사 4일 후에 생성된 제브라피쉬 유충으로부터 게놈 DNA를 수거하고, 고처리량 서열분석에 의해 염기 편집 및 indel 빈도를 측정하였다 (도 132a). 시험된 3개의 BE3:sgRNA 복합체 중 2개는 생체내에서 실질적인 점 돌연변이를 유도하였다 (TYR1: C3→T3 5.3±1.8%, TYR2: C4→T4 4.3±2.1%; n = 3개의 주사된 배아의 평균 ± s.d.; 도 132a). 제브라피쉬 유전자좌의 서열이 표 17에 열거되어 있다.
표 17: 참조 서열에 정렬되고 물질 및 방법에 기재된 품질 필터를 통과하는 HTS 판독물의 수.
마지막으로, 이러한 개발을 적용하여 마우스에서 DNA-무함유, 고-특이성 염기 편집을 달성하였다. 생체내에서 온- 및 오프-타겟 염기 편집을 관찰할 가능성을 최대화하기 위해, VEGFA 부위 2를 표적화하는 고도로 반복적인 sgRNA를 사용하였고; 편리하게는, 뮤린 및 인간 게놈은 이 표적 부위에서 동일하다.
배양된 뮤린 NIH/3T3 세포를 사용하여, BE3 단백질 전달이 이 유전자좌에서 효율적인 온-타겟 염기 편집 34±11%를 생성하였다는 것이 확인되었다 (도 133a; 본 단락에서의 모든 편집 백분율은 n = 3개의 생물학적 반복에 대해 평균 ± s.d.를 나타냄). 절단 빈도 결정인자 (CFD) 알고리즘29,34을 사용하여 VEGFA 부위 2 sgRNA와 연관된 마우스 게놈 내의 오프-타겟 유전자좌를 예측하였다 (표 18). 배양된 NIH/3T3 세포를 사용하여, 상위 4개의 예측된 오프-타겟 유전자좌 중 2개가 실제로 배양된 뮤린 세포에서의 BE3의 플라스미드 전달에 의해 변형된 것으로 확인되었다 (CFD 오프-타겟 유전자좌 1, 9±5% 편집; 및 CFD 오프-타겟 유전자좌 4, 3±2% 편집; 도 133b-133e). 인간 세포로부터의 결과와 일치하게, BE3의 단백질 전달은 오프-타겟 편집을 음성 대조군과 유사한 수준으로 감소시켰다 (도 133c 및 133e). CFD 오프-타겟 유전자좌 1 및 4에 대한 평균 염기 편집 특이성 비는 BE3의 플라스미드 전달의 경우 28±13에서 BE3의 단백질 전달의 경우 ≥ 780±300으로 증가하였다 (값은 평균 ± s.e.m.; n = 3개의 생물학적 반복을 나타냄).
표 18: VEGFA 부위 2 sgRNA와 연관된 마우스 게놈 내의 예측된 오프-타겟 유전자좌에 대한 프로토스페이서 및 PAM 서열. CFD 점수46는 CRISPOR를 사용하여 계산하였다47. 온-타겟 서열과 상이한 오프-타겟 프로토스페이서 내의 위치는 밑줄표시된다.
마우스에서 DNA-무함유 염기 편집을 확립하기 위해, BE3:sgRNA 복합체를 리포펙타민 2000과 조합하고 (도 132b), 와우내 주사를 P1-P2에서 마우스 새끼에게 수행하였다. 주사된 와우 조직을 주사 3-4일 후에 수거하고, 와우 영역당 5-7개의 샘플로 미세 해부하였다. 주사되지 않은 마우스로부터의 대조군 와우를 동시에 수거하였다. 수거된 조직으로부터 게놈 DNA를 추출하고, qPCR에 의해 후기-지수기로 증폭시키고, C→T 전환을 측정하기 위해 고처리량 DNA 서열분석에 적용하였다. 염기 편집제 단백질에 노출된 세포로부터 독점적으로 DNA를 회수하는 것이 가능하지 않기 때문에 처리된 세포 중에서 염기 편집 효율을 정량화하는 것은 불가능하지만, 와우의 3개 영역에서의 조직으로부터 명백한 염기 편집이 관찰되었다: 코르티 기관의 기저 말단, 혈관조 및 와우축 (도 132c-132d). 처리된 조직 샘플에서 유의한 indel 형성이 검출되지 않았다 (< 0.1% indel; 도 134b).
표적 C→T 전환을 함유하는 와우 세포의 백분율 (도 132c)은 배양물 내의 처리된 NIH/3T3 세포에서 관찰된 것보다 유의하게 더 낮았고 (도 133a), 이는 지질-기반 단백질 전달의 고도로 국재화된 성질 및 염기 편집제에 노출된 세포로부터 독점적으로 DNA를 단리할 수 없다는 것과 일치한다. 그럼에도 불구하고, 국부 전달은 세포 유형이 편집되는 제어, 및 제조 및 투여의 용이성을 포함한, 접근가능한 용도에 대한 주요 이점을 제공한다.
마지막으로, BE3:sgRNA:지질 복합체의 와우내 주사 후 오프-타겟 편집을 분석하였다. BE3:VEGFA 부위 2 sgRNA:지질 복합체를 주사한 마우스의 와우 조직으로부터의 게놈 DNA에서 확인된 오프-타겟 부위 CFD 유전자좌 1 및 CFD 유전자좌 4를 포함한 모든 4개의 예측된 오프-타겟 유전자좌의 분석은 시험된 오프-타겟 유전자좌 중 임의의 것에 대해 비처리 대조군 샘플에서 관찰된 것 초과의 검출가능한 C→T 전환 또는 indel 형성을 나타내지 않았다 (도 134a).
함께, 이들 생체내 염기 편집 결과는 높은 DNA 서열 특이성을 갖는 동물의 게놈 DNA에서의 개별 뉴클레오티드의 정확한 전환을 위한 바이러스-무함유, DNA-무함유 전략을 확립한다.
논의
본 연구에서 개발되고 실시되는 전략은 오프-타겟 염기 편집을 제거하거나 감소시키고, 생체내 염기 편집을 지지하는 DNA-무함유 전달 방법을 확립함으로써 염기 편집의 유용성 및 적용가능성을 확장시킨다. 단백질 전달은 동일한 구축물의 플라스미드 전달과 비교하여 인간 및 뮤린 세포에서 염기 편집 특이성을 개선시키고 (도 137,130, 및 133), 제브라피시 및 마우스 와우에서 특이적 염기 편집을 가능하게 한다 (도 132).
Cas9의 DNA 특이성을 증진시키는 것으로 공지된 BE3 돌연변이를 설치함으로써 고충실도 염기 편집제가 생성되었다20. 이러한 돌연변이의 Cas9 내로의 설치는, 여기서 조사된 EMX1 유전자좌를 포함한 비-반복적 sgRNA와 연관된 오프 타겟 유전자좌에에서 검출불가능한 indel 형성을 발생시키는 것으로 보고되었다 (도 127a)20. HF-BE3에서 관찰된 특이성 증진은 실질적이지만, 보다 보통이었고; HF-BE3은 플라스미드 DNA로서 포유동물 세포 내로 전달되는 경우에 반복적 및 비-반복적 유전자좌 둘 다에서 검출가능한 오프-타겟 염기 편집을 나타내었다 (도 127a, 127d, 133c 및 133e). 이러한 특이성 증진 차이는 염기 편집이 Cas9-매개 indel 형성과 달리 DNA 절단을 필요로 하지 않고, 단지 DNA-결합 및 R-루프 형성을 필요로 한다는 사실로부터 발생할 수 있고14, HF-Cas9의 증진된 특이성 중 일부가 이미-결합된 오프-타겟 유전자좌에서의 손상된 DNA 절단으로부터 발생할 수 있는 것으로 추측되는 것이 그럴듯하다.
오프-타겟 염기 편집을 감소시키기 위한 제2 시도에서, 염기 편집제의 RNP 전달은 온- 및 오프-타겟 편집의 탈커플링을 야기하는 것으로 입증되었다 (도 128b-128c). RNP 전달은 온-타겟 편집을 플라스미드 전달과 대등하게 유지하면서 비-반복적 부위에서의 오프-타겟 편집을 제거하였고 (도 130a-130c 및 128a), 고도로 반복적인 VEGFA 부위 2에서도 오프-타겟 편집을 크게 감소시켰다 (도 130d). 염기 편집제의 RNP 전달은 특히, 세포 투여량이 전형적으로 제어 또는 특징화되기 어려운 생체내 편집 용도에 유용할 수 있다.
공여자 DNA 주형의 전달과 커플링된 Cas9의 RNP 전달은 이전에 포유동물 세포에서 HDR-기반 게놈 편집을 수행하는 데 사용되었다. 그러나, 이들 접근법은 낮은 효율, 세포-상태 의존성, 및 전형적으로 특히 점 돌연변이 교정에 대해 목적하는 HDR 결과의 것을 초과하는 indel 형성 효율에 의해 제한되어 있다29,30,32,35. DNA-무함유 염기 편집은 대조적으로 생체내 및 세포 둘 다에서 확률적 indel에 비해 실질적인 과량의 편집된 생성물을 생성한다 (도 132a, 134a, 및 134b). 본 발명자들의 지식이 미치는 한, 염기 편집제의 RNP 전달은 외인성 DNA를 필요로 하지 않으면서 게놈 DNA에 대한 특이적이고 정확한 변형을 생성하기 위한 제1 전략을 나타낸다.
방법
플라스미드의 클로닝
본 연구에서 플라스미드는 USER 클로닝에 의해 생성되었다. 퓨션 U 핫 스타트 폴리머라제 (써모 피셔)를 사용하여 점 돌연변이를 설치하고, 이전에 보고된 구축물로부터 단백질 발현 플라스미드를 구축하였다36. 단백질 서열은 보충 정보에 열거되어 있고, BE3 및 HF-BE3의 발현을 위한 플라스미드는 애드진으로부터 입수가능하다.
BE3 및 HF-BE3의 발현 및 정제
BL21 스타 (DE3)-적격 이. 콜라이 세포를 His6 N-말단 정제 태그를 갖는 박테리아 코돈 최적화된 염기 편집제를 코딩하는 플라스미드로 형질전환시켰다. 단일 콜로니를 밤새 50 μg mL-1 카나마이신을 함유하는 루리아-베르타니 (LB) 브로쓰에서 37℃에서 성장시켰다. 세포를 2L의 동일 배지 내로 1:200 희석하고, OD600 = 0.70-0.75가 될 때까지 37℃에서 성장시켰다. 배양물을 얼음 상에서 60분 동안 인큐베이션하고, 단백질 발현을 0.5 mM 이소프로필-β-D-1-티오갈락토피라노시드 (IPTG, 골드바이오(GoldBio))로 유도하였다. 18℃에서 진탕시키면서 14-16시간 동안 발현을 지속하였다. 후속 정제 단계를 4℃에서 수행하였다. 세포를 6,000 g에서 20분 동안 원심분리에 의해 수집하고, 세포 수집 완충제 (100 mM 트리스(히드록시메틸)-아미노메탄 (트리스)-HCl, pH 8.0, 1M NaCl, 20% 글리세롤, 5 mM 트리스(2-카르복시에틸)포스핀 (TCEP; 골드바이오), 0.4 mM 페닐메탄 술포닐 플루오라이드 (PMSF; 시그마 알드리치) 및 사용된 50 mL 완충제당 1개의 컴플리트(cOmplete) EDTA-무함유 프로테아제 억제제 펠릿 (로슈(Roche)) 중에 재현탁시켰다. 세포를 초음파처리에 의해 용해시키고 (총 6분, 3초 온, 3초 오프), 용해물을 25,000 g (20분)에서 원심분리에 의해 정화하였다.
정화한 용해물을 His-Pur 니켈 니트릴로아세트산 (니켈-NTA) 수지 (배양물 리터당 1 mL 수지, 써모 피셔)와 함께 60-90분 동안 4℃에서 회전시키면서 인큐베이션하였다. 수지를 20 칼럼 부피의 세포 수집 완충제로 세척한 후에 결합된 단백질을 용리 완충제 (100 mM 트리스(히드록시메틸)-아미노메탄 (트리스)-HCl, pH 8.0, 0.5 M NaCl, 20% 글리세롤, 5 mM 트리스(2-카르복시에틸) 포스핀 (TCEP; 골드바이오), 200 mM 이미다졸)로 용리시켰다. 생성된 단백질 분획을 Akta 퓨어 FPLC를 사용하여 5 mL 하이-트랩(Hi-Trap) HP SP (지이 헬스케어(GE Healthcare)) 양이온 교환 칼럼 상에서 추가로 정제하였다. 단백질-함유 분획을 3,000 g에서 원심분리되는 100,000 kDa 컷오프를 갖는 칼럼 (밀리포어(Millipore))을 사용하여 농축시키고, 농축된 용액을 .22 μm PVDF 막 (밀리포어)을 통해 멸균 여과하였다.
멸균 여과 후, 단백질을 환원제 상용성 비신코닌산 (BCA) 검정 (피어스 바이오테크놀로지(Pierce Biotechnology))으로 정량화하고, 액체 질소에서 급속 동결시키고, -80℃에서 분취액으로 저장하였다. 발현된 단백질의 서열은 보충 노트 2에 열거된다.
sgRNA의 시험관내 전사
sgRNA 백본 및 목적하는 20 bp sgRNA 프로토스페이서 상류에 T7 RNA 폴리머라제 프로모터 서열을 함유하는 선형 DNA 단편을 보충 정보에 열거된 바와 같은 프라이머를 사용하여 PCR (Q5 핫 스타트 마스터믹스, 뉴 잉글랜드 바이오랩스)에 의해 생성하고, 민일루트(minelute) 칼럼 (퀴아젠) 상에서 농축시켰다. sgRNA를 20 μL 반응물당 1 μg의 선형 주형을 사용하여 14-16시간 동안 하이스크라이브(HiScribe) T7 고수율 RNA 합성 키트 (뉴 잉글랜드 바이오랩스)로 16℃에서 전사하였다. sgRNA를 제조업체의 지침에 따라 메가클리어(MEGAClear) 전사 클린 업 키트 (써모 피셔)를 사용하여 정제하였다. 정제된 sgRNA를 -80℃에서 분취액으로 저장하였다.
시험관내 탈아미노화 검정
시험관내 탈아미노화 검정을 위한 주형으로서 사용된 DNA 올리고뉴클레오티드의 서열은 보충 노트 3에 제시된다. 모든 올리고뉴클레오티드는 IDT로부터 구입하였다. 상보적 서열을 사용하여 합성된 단일-가닥 올리고뉴클레오티드를 트리스 완충제 pH 8.0 내에서 합하고 (100 μM 용액 5 μL), 95℃로 5분 동안 가열함으로써 어닐링하고, 이어서 0.1℃/초-1의 속도로 37℃로 서서히 냉각시켜 79개 염기 쌍 (bp) dsDNA 기질을 생성하였다. 새로 해동된 염기-편집 단백질 (10 μL 반응 부피 중 2 μM 최종 농도)을 실온에서 5분 동안 반응 완충제 (20 mM HEPES pH 7.5, 150 mM KCl, 0.5 mM DTT, 0.1 mM EDTA, 10 mM MgCl2)에서 지시된 sgRNA (2.2 μM 최종 농도)와 복합체화하였다37. 이어서, 어닐링된 dsDNA 기질을 250 nM의 최종 농도로 첨가하였다. 반응을 37℃에서 30분 동안 진행시킨 후, 단백질 변성을 99℃에서 5분 동안 가열함으로써 수행하였다. PB 완충제 (퀴아젠, 100 μL) 및 이소프로판올 (25 μL)을 첨가하여 단백질이 기질 DNA로부터 해리되도록 하였다. DNA를 민엘루트 칼럼 (퀴아젠)으로 정제하고, 생성된 생성물을 U-내성 폴리머라제 (퓨션 U 핫 스타트, 써모피셔) 및 보충 정보에 열거된 바와 같은 프라이머를 사용하여 15 사이클의 qPCR (12ng 투입 DNA, 50 μL 반응 부피)로 선형 범위의 상단으로 증폭시켰다. 증폭된 DNA를 래피드팁2 (디피니티 게노믹스)를 사용하여 정제하고, 하기 기재된 바와 같이 일루미나 MiSeq 상에서의 서열분석을 위해 제조하기 전에 제2 라운드의 PCR (8 사이클, 5 ng 투입)로 바코딩하였다.
게놈 DNA의 정제 및 서열분석
제조업체의 지침에 따라 아젠코트 DNAdvance 게놈 DNA 단리 키트 (베크만 쿨터)를 사용하여 게놈 DNA를 단리하였다. 제1 PCR을 위해, DNA를 제조업체의 지침에 따라, 그러나 3% DMSO 및 SYBR 골드 핵산 스테인 (써모 피셔)을 첨가하여 Q5 핫 스타트 DNA 폴리머라제 (NEB)를 사용하여 선형 범위의 상단으로 증폭시켰다. 모든 앰플리콘에 대해, 사용된 PCR 프로토콜은 98℃에서 2분의 초기 가열 단계에 이어서 최적화된 수의 증폭 사이클 (98℃에서 12초, 61℃에서 25초, 72℃에서 30초)이었다. 제브라피쉬 및 형질감염된 세포 샘플에 대해, 30 ng의 투입 DNA를 50 μL 반응물에 사용하였고, 와우 샘플에 대해 20 ng을 25 μL 반응물에 사용하였다. 각각의 앰플리콘에 대한 최적 사이클 수를 결정하기 위해 qPCR을 수행하였다. 증폭된 DNA를 래피드팁2 (디피니티 게노믹스)를 사용하여 정제하고, 추가의 PCR (8 사이클, 5ng 투입)로 바코딩하였다. 제1 라운드 PCR에 사용된 고유한 정방향 및 역방향 프라이머는 어닐링 영역의 5'에 불변 영역을 함유하였고 (정방향: 5'-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNN-3' (서열식별번호: 502), 역방향: 5'-TGGAGTTCAGACGTGTGCTCTTCCGATCT-3' (서열식별번호: 503)), 이는 제2 라운드 PCR을 위한 바코딩 프라이머의 증폭된 DNA에 대한 결합을 용이하게 한다.
제2 라운드 PCR은 3개 영역을 갖는 프라이머를 사용하였다: 앰플리콘이 일루미나 유동 세포 (이탤릭체)에 결합하도록 하는 5' 불변 영역, 8-염기 바코딩 영역 (X), 및 바코딩 프라이머가 제1 라운드 PCR 앰플리콘 (볼드체)에 결합하도록 하는 3' 불변 영역. 프라이머 서열의 예는 하기와 같다:
서열분석 어댑터 및 이중-바코딩 서열은 TruSeq 인덱싱 어댑터 (일루미나)에 기초한다. 바코딩된 샘플을 풀링하고, 겔 추출 (퀴아젠)에 의해 정제한 다음, 암퓨어(Ampure) 비드 (베크만 쿨터)를 사용하여 정제한 후, 큐비트(Qubit) dsDNA HS 키트 (써모 피셔) 및 qPCR (카파 바이오시스템즈)를 사용하여 제조업체의 지침에 따라 정량화하였다. 제조업자의 지침에 따라 MiSeq (일루미나) 상에서 180-250개 염기 (앰플리콘 크기에 따름)로부터의 단일-말단 판독물을 사용하여 풀링된 샘플의 서열분석을 수행하였다.
PCR 증폭에 사용된 올리고뉴클레오티드의 서열은 보충 노트 3에 제시된다. 모든 올리고뉴클레오티드는 IDT로부터 입수하였다. 본 연구에서 각각의 앰플리콘에 대한 최적화된 수의 PCR 사이클은 하기와 같다: VEGFA 부위 2 인간 게놈 DNA (어닐링 온도는 모든 연장 단계에 대해 25초 동안 61℃임): 온-타겟: 29 사이클, 오프-타겟 #1: 32 사이클, 오프-타겟 #2: 28 사이클, 오프-타겟 #3: 27 사이클, 오프-타겟 #4: 27 사이클, VEGFA 부위 2 뮤린 게놈 DNA: 온-타겟: 31 사이클, 오프-타겟 #1, #2, #3 및 #4: 31 사이클. HEK293 부위 3: 오프-타겟 #1: 29 사이클, 오프-타겟 #2: 28 사이클, 오프-타겟 #3: 28 사이클. FANCF 오프-타겟 #1: 29 사이클, 오프-타겟 #2: 28 사이클, 오프-타겟 3: 28 사이클. EMX1 오프-타겟 #1, #2 및 #3: 28 사이클. 제브라피쉬 DNA의 증폭을 위한 TYR1, TYR2 및 TYR3 sgRNA: 32 사이클. EMX1, FANCF 및 HEK293 부위 3 유전자좌의 온-타겟 증폭을 위한 최적화된 프로토콜은 이전에 기재된 바와 같이 이어졌다14.
게놈 DNA 서열분석 판독물의 분석 및 정렬
서열분석 판독물을 이전에 기재된 바와 같이 분석하였다14. 간략하게, 서열분석 판독물을 MiSeq 리포터 (일루미나)를 사용하여 디멀티플렉싱하고, 개별 FASTQ 파일을 이전에 보고된 주문제작 매트랩 스크립트로 분석하였다14. 스미스-워터만 알고리즘을 사용하여 판독물을 참조 서열에 정렬시켰다. 30 미만의 Q-점수를 갖는 염기 호출을 플레이스홀더 뉴클레오티드 (N)로 대체하였다. 이러한 품질 역치는 1,000 중 1의 예상 오차율을 갖는 뉴클레오티드 빈도를 발생시킨다. indel 빈도는 nCas9 절단 부위 주위의 30-염기 윈도우에서 발생하고 최소 2-염기 삽입 또는 결실인 indel을 카운팅하는 이전에 공개된 주문제작 매트랩 스크립트로 정량화하였다14. indel은 처리된 샘플 및 비처리 대조군에서의 indel 형성 사이의 유의한 차이 (스튜던트 양측 t-검정, p < 0.05)가 존재하는 경우 검출가능한 것으로 정의하였다.
뮤린 게놈 내의 VEGFA 부위 2 sgRNA와 연관된 서열분석된 앰플리콘 중 하나인 CFD 오프-타겟 #3의 경우, indel 형성을 정확하게 측정하는 것이 가능하지 않았다. 이 유전자좌에서 프로토스페이서는 12개의 구아닌 염기에 직전에 선행하고, 이는 이 부위의 PCR 및 고처리량 서열분석을 무작위 삽입 또는 결실에 취약하게 만들고; 서열분석 판독물의 20%만큼 높은 결실 비율은 다중 독립적 비처리 대조군 샘플에서 관찰되었다. 어떠한 유의한 염기 편집도 임의의 처리 조건 하에 이 오프-타겟 유전자좌에서 검출되지 않았기 때문에 (도 132 및 133), indel 형성이 또한 이 유전자좌에서 무시할만한 것으로 의심된다.
phred.II Q30 점수는 염기호출에서 추정 99.9% 정확도에 상응한다38. 주어진 위치에서의 부정확한 염기 호출의 0.1% 확률은 염기 호출 오류가 4개의 염기에 걸쳐 무작위로 분포되는 것으로 가정되는 경우 0.1/4 = 0.025%의 염기 호출에 대한 하한에 상응한다. 이러한 역치 미만에 속하는 C→T 편집 백분율은 검출불가능한 것으로 분류되었다. PCR 동안의 자발적 탈아미노화39 또는 폴리머라제 오차는 또한 인공 C→T 편집을 도입할 수 있다. 염기 편집제-유도된 C→T 편집을 인공 C→T 편집 비율로부터 구별하기 위해, 비처리 대조군 세포를 각각의 앰플리콘에 대해 서열분석하였고, 특정한 조건 하에 C→T 편집이 역치로서 p < 0.05를 갖는 스튜던트 양측 t-검정을 사용하여 통계적으로 유의한지 계산하였다. 통계적으로 유의한 편집 비율이 >0.025%인 오프-타겟 부위를 측정가능한 것으로 간주하였다. 각각의 샘플에 대한 정렬된 및 품질 여과된 판독물의 수를 표 17에 포함시켰다.
게놈 DNA 서열 정렬의 통계적 분석
달리 언급되지 않는 한, 본문 전체에 걸쳐 언급된 평균 값은 n≥3개의 독립적인 생물학적 반복을 대표하고, 평균 ± 표준 편차가 언급되어 있다.
처리된 샘플에서 온- 및 오프-타겟 편집 백분율을 음성 대조군 샘플 (비처리)에서 측정된 임의의 편집과 비교함으로써 도 2 및 3에 나타낸 고처리량 서열분석 데이터의 통계적 분석을 수행하였다. 스튜던트 양측 t 검정이 사용되었고, 개별 p-값은 표 16에 제시된다. * p ≤ 0.05, ** p ≤ 0.01 및 *** p ≤ 0.001. 편집이 검출 한계 (0.025%) 미만인 경우, 유의성은 계산되지 않았고; 모든 비처리 대조군 샘플은 검출불가능한 편집을 보여주었다.
도 128a의 경우, 평균 온-타겟 염기 편집은 염기 편집 활성 윈도우 내의 시토신의 편집을 평균냄으로써 계산하였다 (HEK293 부위 3 및 EMX1에 대해 C4-C8, FANCF 및 VEGFA 부위 2에 대해 C4-C9).
염기 편집 활성에서의 sgRNA-의존성 차이를 설명하기 위해, 염기 편집:indel 비를 계산하였다 (도 130b). 이 비는 C→T 전환을 갖는 HTS 판독물의 백분율 (각각의 부위에 대해 염기 편집 윈도우에 걸쳐 평균냄)을 indel을 함유하는 HTS 판독물의 백분율로 나눔으로써 생성하였다. 상기 기재된 바와 같이, 특정한 유전자좌에 대한 오프-타겟 편집이 검출 한계 미만인 경우, 특이성 비율을 계산하기 위한 목적으로 검출 방법의 추정 상한 (0.025%)을 보존적으로 가정하였다.
시험관내 편집된 DNA의 데이터 분석
서열분석 판독물을 MiSeq 리포터 (일루미나)를 사용하여 자동으로 디멀티플렉싱하였다. 온라인 패키지 usegalaxy.org를 사용하여 품질 필터링을 수행하였다40. 30이하의 일루미나 품질 점수를 갖는 개별 염기를 FASTQ 그루머에 이어서 FASTA 마스커를 사용하여 플레이스홀더 뉴클레오티드 'N'으로 전환시켰다41. 생성된 품질-필터링된 FASTQ 파일을 후속적으로 보충 노트 1에 제공된 주문제작 피톤 스크립트로 분석하였다. 서열분석 판독물을 표적 DNA 서열의 양쪽 면에 플랭킹하는 2개의 14-염기 서열에 대한 정확한 매치에 대해 스캐닝하였다. 정확한 매치가 발견되지 않는 경우, 판독물을 분석에서 배제하였다. 14-염기 서열 둘 다가 위치하고 이들 사이의 서열 길이가 예상된 프로토스페이서 길이 (20개 염기)와 동일한 경우, 플랭킹 영역 사이에서 발견된 프로토스페이서 서열을 저장하고, 프로토스페이서 내 각각의 부위에서 고처리량 서열분석에 의해 호출된 염기를 집계하였다.
세포 배양
HEK293T (ATCC CRL-3216) 및 NIH/3T3 (ATCC CRL-1658) 둘 다를 10% (v/v) 소 태아 혈청 (FBS)이 보충된 둘베코 변형 이글 배지 + 글루타맥스 (써모피셔) 중에서 37℃에서 5% CO2 하에 유지시켰다. 세포는 ATCC로부터 입수하였고, 구매시 ATCC에 의해 미코플라스마가 없는 것으로 인증 및 검증되었다.
염기 편집제의 HEK293T 세포로의 플라스미드 형질감염
HEK293T 세포를 항생제 무함유 배지에서 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 70% 전면생장률로 형질감염시켰다. 달리 언급되지 않는 한, 750 ng의 BE 및 250 ng의 sgRNA 발현 플라스미드를 제조업체의 프로토콜에 따라 웰당 1.5 μl의 리포펙타민 2000 (써모 피셔)을 사용하여 형질감염시켰다.
염기 편집제의 HEK293T 세포로의 단백질 형질감염
HEK293T 세포를 250 μL 항생제 무함유 배지 중에서 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 70% 전면성장률로 형질감염시켰다. 염기 편집제 단백질을 실온에서 5분 동안 1.1X 몰 과량의 필요한 sgRNA와 함께 인큐베이션하였다. 이어서, 복합체를 1.5 μL 리포펙타민 2000 (써모 피셔)과 함께 인큐베이션하고, 플라스미드 전달을 위해 제조업체의 프로토콜에 따라 형질감염시켰다. 달리 언급되지 않는 한, BE 단백질을 200 nM의 최종 농도로 첨가하였다 (275 μL의 총 웰 부피에 기초함).
염기 편집제의 NIH/3T3 세포로의 플라스미드 형질감염
NIH/3T3 세포를 항생제-무함유 DMEM 배지에서 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 75% 전면생장률로 형질감염시켰다. 달리 언급되지 않는 한, 600 ng의 BE 및 200 ng의 sgRNA 발현 플라스미드를 제조업체의 프로토콜에 따라 웰당 1.4 μL의 리포펙타민 3000과 1 μL의 P3000 시약 (써모 피셔)을 사용하여 형질감염시켰다.
염기 편집제의 NIH/3T3 세포로의 단백질 형질감염
NIH/3T3 세포를 항생제 무함유 DMEM 배지에서 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 75% 전면성장률로 형질감염시켰다. 염기 편집제 단백질을 1.1배 몰 과량의 지시된 sgRNA와 함께 25℃에서 5분 동안 인큐베이션하였다. 이어서, 복합체를 1.4 μL 리포펙타민 3000 (써모 피셔)과 함께 인큐베이션하고, 플라스미드 전달을 위해 제조업체의 프로토콜에 따라 형질감염시켰다. P3000 시약은 그의 첨가가 단백질 침전 및 염기 편집 효율의 감소를 야기하기 때문에 사용되지 않았다. 달리 언급되지 않는 한, BE 단백질을 400 nM의 최종 농도로 첨가하였다 (275 μL의 총 웰 부피에 기초함).
양이온성 지질 내에 캡슐화된 BE3 단백질:가이드 RNA의 와우내 전달
모든 동물 실험은 매사추세츠 안과 및 이과 병원의 동물 실험 윤리 위원회에 의해 승인되었다. 이전에 기재된 바와 같이 혼합 유전자 배경의 P1-P2 마우스에서 와우내 전달을 수행하였다42. 마우스를 수술 절차 전에 체온을 낮춤으로써 마취시켰다. 오른쪽 귀 근처에서 이후부 절개를 수행하고, 낭포를 들어올려 와우를 노출시켰다. BE3 단백질 (57.7 μM)을 1:1.1 몰비로 sgRNA (100 μM)와 사전-복합체화한 다음, 리포펙타민 2000 (써모 피셔)과 1:1 부피 비로 혼합하였다. 생성된 용액 (1.2-1.5 μL)을, 나노리터 마이크로펌프 (WPI, UMP3 + 마이크로4 + 나노필)에 250 nL/분-1의 속도로 부착된 와우 기저 회전에서, 와우 캡슐을 통해 유리 피펫 (말단 직경, 5 μm)을 사용하여 와우관 내로 주입하였다. 주사 후, 절개부를 닫고, 마우스를 가열 패드에 넣어 회복시켰다. 3-4일 후, 마우스의 와우를 코르티 기관, 혈관조 및 와우축으로 해부하였다. 각각의 조직을 5 내지 7개의 별개의 조각으로 추가로 미세-해부하고, DNA 추출을 각각의 샘플에 대해 개별적으로 수행하고, 이어서 상기 기재된 바와 같이 고처리량 서열분석을 수행하였다. 도 132 및 도 134에 제시된 데이터는 각각의 와우 영역에 대한 하나의 미세-해부된 샘플의 추출로부터 생성된 서열분석 데이터를 보여준다.
BE3 단백질:가이드 RNA의 제브라피쉬 배아 내로의 미세주사
제브라피쉬 (튀빙겐 계통)를 보스톤 아동 병원의 내부 규제 검토에 준하여 표준 조건 하에 유지하였다. 1-세포 단계 제브라피쉬 배아에 적절한 sgRNA 또는 비관련된 sgRNA 대조군과 사전-복합체화된 대략 2 nL의 BE3 단백질을 1:1 몰비 (4.5 μM 최종 농도)로 주사하였다. 수정 4일 후, DNA를 50 mM NaOH 중에서 30분 동안 95℃에서 이전에 기재된 바와 같은 유충으로부터 추출하고43, 생성된 용액을 트리스-HCl로 중화시켰다. 게놈 DNA를 상기 기재된 바와 같이 정량화하고, PCR에 의해 증폭시키고, 서열분석하였다.
단백질 겔 분석
제시된 모든 단백질 겔은 사전 성형된 4-12% 폴리아크릴아미드 비스-트리스 플러스 (써모 피셔)였다. 이들을 MOPS 완충제 (써모 피셔) 중에서 180 V에서 50분 동안 구동시켰다. 샘플을 변성을 위한 100mM DTT 및 1X 리튬 도데실 술페이트 (LDS) 샘플 완충제 중에서 99℃로 10분 동안 가열함으로써 로딩을 위해 제조하였다. 제조업체의 지침에 따라 인스턴트 블루 단백질 염색 (엑스페디온(Expedion))을 사용하여 겔을 염색하였다.
세포 용해물 분석을 위해, 2 mL의 유도후 밤샘 배양물을 15,000 g에서 펠릿화한 후, 제조업체의 지침에 따라 100 μL B-PER (써모 피셔)에서 용해시켰다.
데이터 이용가능성
본 연구의 발견을 지지하는 고처리량 서열분석 데이터를 수탁 번호 SRP097884 하에 NCBI 서열 판독 아카이브 데이터베이스에 기탁하였다. 단백질 발현을 위한 HF-BE3 및 BE3, 뿐만 아니라 포유동물 발현을 위한 HF-BE3을 코딩하는 플라스미드는 애드진으로부터 수탁 ID 87439 (pCMV-HF-BE3), 87438 (pET42b-HF-BE3), 87437 (pET42b-BE3)으로 입수가능하다.
참고문헌
보충 정보
보충 노트 1: 품질-필터링된 시험관내-편집된 DNA를 분석하는 데 사용된 피톤 스크립트.
보충 노트 2: 본 연구에 사용된 단백질의 서열
발현된 BE3의 단백질 서열
발현된 HF-BE3의 단백질 서열
보충 노트 3: 본 연구에 사용된 올리고뉴클레오티드의 서열
보충 표 1. 본 연구에서 연구된 제브라피쉬 게놈 유전자좌에 대한 프로토스페이서 및 PAM 서열.
실시예 17: 보다 높은 효율 및 생성물 순도를 갖는 C:G에서 T:A로의 염기 편집제
염기 편집은 이중-가닥 DNA 파괴를 유도하거나 또는 Cas9 변이체 및 시티딘 데아미나제의 조작된 융합을 사용한 상동성-지정 복구를 필요로 하지 않으면서 표적 C:G 염기 쌍의 T:A 염기 쌍으로의 프로그램가능한 전환이다 (1). 제3 세대 염기 편집제 (BE3) 및 관련 기술은 광범위한 유기체에서 많은 연구자들에 의해 성공적으로 사용되었다 (2-13). 염기 편집의 생성물 분포-표적 C:G 염기 쌍이 목적하는 T:A 생성물과 함께 목적하지 않은 부산물의 혼합물로 전환되는 빈도-는 표적 부위-의존성 방식으로 달라진다 (2, 3, 6-8). 여기서 본 발명자들은 인간 세포에서의 염기 편집 결과의 결정인자를 특징화하고, 목적하지 않은 생성물의 형성이 우라실 N-글리코실라제 (UNG)에 의존성이고 염기 편집 활성 윈도우 내의 단일 C만을 함유하는 표적 부위에서 발생할 가능성이 더 크다는 것을 확립한다. 일부 서열에 대해 염기 편집 효율을 증가시키는 시티딘 데아미나제 상동체를 사용하는 구축물 CDA1-BE3 및 AID-BE3을 조작하였다. 추가적으로, 염기 편집된 중간체에 대한 UNG의 접근을 보다 효율적으로 차단하는 제4 세대 에스. 피오게네스 Cas9-유래 염기 편집제 (BE4)를 또한 조작하였다. BE3과 비교하여, BE4는 목적하지 않은 부산물의 빈도를 반으로 줄이면서 C:G에서 T:A로의 염기 편집의 효율을 대략 50%만큼 증가시킨다. 이러한 개선을 또한 적용하여, 에스. 아우레우스 Cas9-유래 BE4 (SaBE4)를 생성하였고, 이는 BE4보다 실질적으로 더 작고 대안적 표적화 범주를 갖는다.
도입
전통적인 게놈 편집 방법은 게놈 표적 유전자좌에서 이중 가닥 DNA 파괴 (DSB)를 도입한다 (14). DSB 병변에 대한 세포 반응은 주로 비-상동 말단 연결 (NHEJ) 및 관련 과정을 통해 진행된다 (15). NHEJ는 통상적으로 DSB에 플랭킹된 2개의 말단을 재연결하지만, 전형적인 게놈 편집 조건 하에 DSB는 연속적으로 재도입되어 결국 삽입 및 결실 (indel)의 축적 또는 DSB 부위에서의 전위 및 상응하는 게놈 유전자좌의 파괴를 발생시킨다 (16). 활발하게 분열하는 세포는 또한 DSB를 둘러싸는 영역에 대한 상동성을 함유하는 공여자 DNA 주형의 존재 하에 상동성-지정 복구 (HDR)를 개시함으로써 DSB에 반응할 수 있고, 이는 연구자가 NHEJ를 통해 가능한 것보다 더 정확하고 예측가능하게 게놈을 조작할 수 있게 한다 (17). HDR-의존성 게놈 편집은 NHEJ 결과와의 경쟁, 및 유사분열에 대한 HDR의 의존성으로부터 발생하는 낮은 효율에 의해 제한된다 (18).
HDR 또는 DSB의 도입을 필요로 하지 않으면서 프로그램가능한 방식으로 C:G 염기 쌍의 T:A 염기 쌍으로의 직접적인 비가역적 전환을 가능하게 하는 염기 편집의 개발이 보고되었다 (1). 염기 편집제는 촉매적으로 손상된 Cas9 단백질에 테더링된 단일-가닥 DNA-특이적 시티딘 데아미나제 효소 및 염기 절제 복구 억제제로 이루어진다 (1, 4, 9, 10). Cas9 변이체는 상응하는 가이드 RNA에 의해 프로그램된 관심 게놈 유전자좌에 결합한다. 단백질:RNA:DNA 3원 "R-루프" 복합체의 형성 (19)은 테더링된 시티딘 데아미나제 효소에 대한 기질로서의 역할을 하는 단일 가닥 DNA의 작은 (~5-nt) 윈도우를 노출시킨다. 이 윈도우 내의 임의의 시티딘은 우라실로 가수분해성으로 탈아미노화되어 G:U 중간체를 생성한다.
염기 절제 복구 (BER)는 G:U 미스매치에 대한 세포의 일차 반응이고 우라실 N-글리코실라제 (UNG)에 의한 우라실의 절제에 의해 개시된다 (20). UNG에 의한 절제로부터 편집된 G:U 중간체를 보호하기 위한 노력으로, 83-아미노산 우라실 글리코실라제 억제제 (UGI)를 촉매적 데드 Cas9 (dCas9)의 C-말단에 직접 융합시켰다 (1). 세포 DNA 미스매치 복구 시스템을 G:U 미스매치 내의 G를 A로 우선적으로 대체하도록 조작하기 위해, dCas9 내의 Ala 840 아미노산을 His로 복귀시키고, 이로써 Cas9 단백질이 새로 형성된 우라실에 대향하는 DNA 가닥을 니킹하도록 하여, G:U 중간체의 목적하는 A:U 및 A:T 생성물로의 훨씬 더 효율적인 전환을 발생시켰다 (1). 이들 2가지 조작 노력을 조합하여 16-아미노산 링커를 통해 에스. 피오게네스 dCas9 (A840H)에 테더링된 APOBEC1 시티딘 데아미나제 효소의 3-부분 융합체로 이루어진 단일 단백질인 BE3을 생성하였고, 이는 4-아미노산 링커를 통해 UGI에 공유 연결된다 (1). BE3 및 관련 염기 편집제는 현재 식물 게놈 편집, 생체내 포유동물 게놈 편집, 표적화된 돌연변이유발 및 녹아웃 연구를 포함한 다양한 용도에 사용되어 왔다 (2-13). 염기 편집의 범주는 변경된 PAM 요건 (4), 좁아진 편집 윈도우 (4), 감소된 오프-타겟 편집 (10), 및 소분자 의존성 (21)을 갖는 BE3 변이체를 보고함으로써 최근에 확장되었다.
일부 유전자좌에서, 염기 편집제 예컨대 BE3은 표적 C:G 염기 쌍이 목적하는 T:A 생성물보다는 G:C 또는 A:T 염기 쌍으로 전환되는 목적하지 않은 부산물을 생성한다 (2, 3, 6-8). 여기서, 본 발명자들은 염기 편집 생성물 순도의 결정인자를 조명하고, UNG 활성이 목적하지 않은 부산물의 형성에 요구된다는 것을 확립한다. 우라실 중간체에 대한 UNG 접근을 차단하는 것은 목적하지 않은 생성물을 최소화하기 위해 단일 C가 편집 윈도우 내에 있는 표적 유전자좌에 특히 중요한 것으로 결정되었다. BE3을 포함한 이전에 기재된 염기 편집제와 비교하여 더 높은 효율 및 크게 개선된 생성물 순도를 갖는 염기 편집을 수행하는 제4-세대 염기 편집제인 BE4 및 SaBE4를조작하였다.
결과
UNG 활성은 부산물 형성에 요구된다
목적하지 않은 염기 편집 부산물은 우라실-함유 DNA 가닥 내의 무염기성 부위의 형성 및 오류-유발 분해로 인한 염기 절제 복구 동안 발생할 수 있다. 우라실 N-글리코실라제 (UNG)가 결여된 세포에서의 염기 편집의 생성물 순도가 개선되는지 결정하기 위해, HAP1 세포 (반수체 인간 세포주) 및 HAP1 UNG- 세포를 EMX1, FANCF, HEK2, HEK3, HEK4 또는 RNF2 유전자좌를 표적화하는 BE3 및 sgRNA를 코딩하는 플라스미드로 뉴클레오펙션하였다 (표적 서열에 대해서는 도 135b 참조). 뉴클레오펙션 3일 후, 게놈 DNA를 추출하고, 표적 유전자좌를 PCR에 의해 증폭시키고, 고처리량 DNA 서열분석 (HTS)에 의해 분석하였다. 염기 편집 생성물 순도는, 표적 C가 T로 편집된, 편집된 서열분석 판독물 (표적 C가 A, G 또는 T로 전환된 판독물)의 퍼센트로서 정의된다. BE3-처리된 HAP1 세포의 염기 편집 생성물 순도는 6개의 유전자좌에서 12개의 표적 C를 걸쳐 68 ± 6%로 평균되었다 (n = 3개의 생물학적 반복에 대해 평균 ± S.D.). HAP1 UNG- 세포에서, 시험된 모든 12개의 표적 C는 생성물 순도 > 98%로 염기 편집되었다 (도 135a). 또한, 모든 6개의 시험된 유전자좌에서의 indel 빈도는 UNG 녹아웃시 7 내지 100배 감소하였다 (도 135c). 이들 데이터는 UNG 활성이 염기 편집 동안 목적하지 않은 생성물 형성에 필요하다는 것을 강하게 암시하며, 이는 무염기성 부위 형성 및 오류-유발 폴리머라제를 사용한 후속 염기 절제 복구가 표적 뉴클레오티드의 무작위화 및 때때로 indel을 생성하는 가닥 파괴를 야기하는 모델과 일치한다.
다중 편집가능한 C를 갖는 표적은 보다 높은 생성물 순도를 나타낸다
BE3에 의한 염기 편집 효율은 G의 바로 하류인 일부 (전부는 아님) 표적 C에 대해 더 낮을 수 있고 (1), 이는 APOBEC1의 공지된 서열 선호도와 일치한다 (22) (도 136a). 이러한 표적을 효율적으로 편집하기 위한 노력으로, APOBEC1 데아미나제를 대체한 BE3 변이체를 CDA1 (CDA1-BE3을 생성하기 위함), AID (AID-BE3을 생성하기 위함), 또는 APOBEC3G (APOBEC3G-BE3을 생성하기 위함)로 대체하여, 상이한 서열 선호도를 갖는 3개의 단일 가닥 DNA-특이적 시티딘 데아미나제 효소를 생성하였다 (23). HEK293T 세포를 이들 BE3 변이체 및 EMX1, FANCF, HEK2, HEK3, HEK4, 또는 RNF2 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시켰다. 형질감염 3일 후, 게놈 DNA를 추출하고, 표적 유전자좌를 PCR에 의해 증폭시키고, HTS를 사용하여 염기 편집에 대해 평가하였다. G에 바로 이어지는 표적 C의 보다 효율적인 편집이 BE3과 비교하여 CDA1-BE3 및 AID-BE3에서 관찰되었다 (도 136a, 도 140a-d, 및 도 146-151). 일반적으로, CDA1-BE3 및 AID-BE3은 G에 이어지지 않는 표적 C에서 BE3보다 더 낮은 편집 효율을 나타내었다 (도 140a-d). 대조적으로, APOBEC3G-BE3은 예측가능하지 않은 서열 선호도를 나타내었으며, 이때 전체적으로 BE3과 비교하여 더 낮은 C에서 T로의 편집의 수율을 가졌다. 이러한 발견은 CDA1-BE3 및 AID-BE3이 일부 표적 5'-GC-3' 서열에 대해 BE3에 비해 더 높은 편집 효율을 제공할 수 있다는 것을 시사한다.
이들 데이터를 분석하면서, CDA1-BE3 및 AID-BE3의 생성물 순도는 전형적으로 CDA1-BE3 및 AID-BE3이 BE3보다 더 많은 C를 편집하는 그러한 부위에서 BE3의 생성물 순도보다 더 높다는 것에 주목하였다 (도 136a-d). 예를 들어, HEK4 유전자좌에서, BE3은 단지 단일 C만을 효율적으로 편집하지만 (G가 C에 선행하지 않음), CDA1-BE3 및 AID-BE3 둘 다는 3개의 C를 편집한다 (도 140a-c). 이러한 유전자좌에서의 BE3의 생성물 순도는 50 ± 7% (n = 3개의 생물학적 반복에 대해 평균 ± S.D.)인 반면, CDA1-BE3 및 AID-BE3의 생성물 순도는 각각 97 ± 2% 및 93 ± 2%이다. 더욱이, 각각 84 ± 3% 및 91 ± 2%의 생성물 순도를 갖는, BE3에 의해 편집된 EMX1 및 FANCF는 대등한 효율로 편집된 다중 C를 함유하는 반면 (도 S2), 각각 28 ± 3% 및 64 ± 3%의 훨씬 더 낮은 생성물 순도를 갖는, BE3에 의해 편집된 HEK2 및 RNF2는 동일하지 않은 효율로 편집된 다중 C를 함유한다 (도 141a-c). 대등한 효율을 갖는, HEK2 유전자좌 내에서 두 C를 편집하는 CDA1-BE3 및 AID-BE3은 이 유전자좌에서 훨씬 더 높은 생성물 순도를 나타낸다 (각각 85 ± 5% 및 81 ± 4%) (도 136a-d 및 도 140c). HEK2 및 RNF2 부위에서 다중 C가 초기에 대등한 효율로 BE3에 의해 U로 전환된 다음, DNA 복구 시스템에 의해 상이한 효율로 프로세싱될 가능성이 배제되었다. 이를 고려할 때, 이들 부위가 CDA1-BE3 또는 AID-BE3에 비해 BE3으로 처리되는 경우에 상이한 생성물 분포가 관찰되기 보다는 유사한 생성물 분포가 예상될 것이다 (도 136b 및 도 146-151). 대신에, 단리된 G:U는 G:U 병변의 클러스터보다 UNG에 의해 보다 용이하게 프로세싱될 수 있다. BE3에서의 시티딘 데아미나제 도메인의 프로세싱성 (1, 24)은 다중 편집가능한 C를 함유하는 유전자좌에서의 BE3의 체류 시간을 증가시킴으로써, 단일 편집가능한 C를 함유하는 유전자좌에서보다 더 효과적으로 UNG에 의한 접근을 차단할 수 있다는 것이 가능하다.
생성물 순도, 개별 서열분석 판독물에서의 편집된 C의 수, 및 UNG 활성 사이의 관계를 추가로 분석하였다. 명백한 UNG 억제의 부재 하에 염기 편집된 DNA의 운명을 밝혀내기 위해, BE3의 UGI 성분을 제거하여 BE3B를 생성하였다. HEK293T 세포를 BE3 또는 BE3B 및 EMX1, FANCF, HEK2, HEK3, HEK4 또는 RNF2 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시켰다. 상기 확립된 염기 편집 결과를 다양화하는 데 있어서의 UNG의 역할을 고려할 때 예상되는 바와 같이, 모든 표적 C에서의 생성물 순도는 BE3-처리된 DNA와 비교하여 BE3B-처리된 DNA에서 크게 감소하였고, 비-T를 함유하는 편집 생성물의 분율은 평균 1.8 ± 0.4배만큼 증가하였다 (도 142b).
다중-C 부위 HEK2, HEK3, 및 RNF2를 표적화하는 sgRNA 및 BE3 또는 BE3B로 처리된 HEK293T 세포로부터의 개별 DNA 서열분석 판독물을 분석하였다. 각각의 부위에 대해, 1차 표적 C가 가장 효율적으로 변형된 뉴클레오티드로서 지정되었다. 모든 3개의 부위에 걸쳐, 1차 표적 C의 목적하지 않은 C에서 비-T로의 편집을 함유하는 서열분석 판독물의 평균 80 ± 10%는 단일 염기 편집 사건만을 나타내었다 (도 142a-d 및 도 143). 대조적으로, 동일한 3개의 다중-C 부위에 걸쳐, 1차 표적 C의 명확한 C에서 T로의 편집을 함유하는 서열분석 판독물의 훨씬 더 낮은 평균 32 ± 4%는 단일 명확한 염기 편집 사건만을 나타내었다 (도 142a-d 및 도 143). 또한, 편집 윈도우 내에서 오직 1개의 C를 함유하는 부위인 BE3B-처리된 HEK4 DNA에 대한 생성물의 분포는 대략적으로 A:G:T에 대해 1:3:1의 비를 따른다 (도 143d). 이러한 관찰은, 주어진 표적 내의 단일 시티딘이 UGI의 부재 하에 U로 전환되는 경우, 이는 UNG-개시된 BER에 의해 효율적으로 프로세싱되어 생성물의 혼합물을 제공한다는 것을 집합적으로 나타낸다.
이들 데이터는 클러스터링된 G:U 미스매치가 단리된 G:U 미스매치와는 상이하게 프로세싱되고, 명확한 C에서 T로의 편집을 생성할 가능성이 더 크다는 모델과 일치한다. 단지 단일 C에서 T로의 편집 사건을 목적하는 경우, 상기 관찰은 UNG 억제가 목적하지 않은 부산물을 최소화하는 데 중요하다는 것을 시사한다. 그러나, dCas9-데아미나제 융합체, 예컨대 TAM(8) 및 CRISPR-X(2)를 사용하여 표적화된 무작위 돌연변이유발을 수행하는 경우, 상기 관찰은 단지 단일 편집가능한 C를 갖는 표적 부위가 생성물 혼합물을 최대화할 것임을 시사한다.
개선된 생성물 순도를 위한 BE3 아키텍처의 최적화
SSB-BE3을 생성하기 위해 BE3의 UGI 성분을 단일-가닥 DNA 결합 (SSB) 단백질로 대체하여, SSB가 R-루프의 우라실-함유 ssDNA 부분에 UNG가 접근하는 것을 차단할 수 있도록 하였다. SSB-BE3에 의한 염기 편집 효율의 큰 감소가 관찰되었고, 여기서 4개의 부위에 걸쳐 모든 7개의 C가 단지 평균 1.9 ± 0.5% C에서 T로의 전환을 나타내었다 (도 137c).
염기 편집 결과를 결정하는 단계 동안 APOBEC, UGI, 및 UNG의 상대적인 배치가 공지되어 있지 않기 때문에, UGI는 UNG 억제를 개선시키기 위한 노력으로 BE3의 N-말단으로 재배치되었다 (N-UGI-BE3). UGI를 BE3의 N-말단으로 이동시켜, BE3과 비교하여 2.3 ± 0.6배의 모든 7개의 시험된 표적 C에 걸쳐 C에서 T로의 편집 백분율의 평균 감소 (도 137c), 및 BE3과 비교하여 평균 2.2 ± 0.5배의 4개의 모든 부위에서의 전체 생성물 순도의 감소가 생성되었다 (도 137b).
대조적으로, BE3의 C-말단에 UGI의 추가의 카피를 부가하여 (BE3-2xUGI), BE3에 비해 생성물 순도의 큰 증가 및 BE3의 것과 대등한 C에서 T로의 편집 백분율을 발생시켰다. 비-T 편집 생성물은 시험된 4개의 유전자좌에 걸쳐 평균 2.2 ± 0.8배 감소하였다 (도 137b). 이들 관찰은 UGI의 제2 카피의 부가가 G:U 염기 편집 중간체에 대한 UNG의 접근을 실질적으로 감소시킴으로써 생성물 순도를 크게 개선시킨다는 것을 시사한다.
상기 실험이 또한 성분의 아키텍처에 대한 염기 편집 결과의 감수성을 밝혀냈기 때문에, 다음으로 본 발명자들은 생성물 순도 및 편집 효율을 추가로 증가시키기 위해 BE3 성분 사이의 링커를 최적화하였다. 본 발명자들은 rAPOBEC1-dCas9(A840H) 링커를 16개의 아미노산 (BE3)에서 32개의 아미노산(BE3C)으로 다양화하고, dCas9(A840H)-UGI 링커를 4개 (BE3)에서 9개 (BE3D)에서 16개의 아미노산 (BE3E, 도 138a)으로 다양화하였다. dCas9(A840H)-UGI 링커가 4개 아미노산 (BE3) 대신에 9개 아미노산 잔기 길이 (BE3D)인 경우에 비-T 생성물 형성은 평균적으로 1.3 ± 0.1배 감소하였고 (도 138d), C에서 T로의 편집 효율에서의 명백한 차이는 없었다 (도 138c). rAPOBEC1-dCas9 (A840H) 링커를 16개의 아미노산 (BE3)에서 32개의 아미노산 (BE3C)으로 증가시키는 것은 C에서 T로의 편집 효율을 HEK2 유전자좌에서 평균 1.2 ± 0.1배 상승시켰다 (도 138c). 이러한 유전자좌는 이전에 가장 불균일하게 편집된 시험된 다중-C 부위였고 (도 141a-c), 이 링커를 확장시켜 C4에 비한 C6의 우선적인 편집을 2.6 ± 0.2배에서 1.8 ± 0.1배로 감소시켰다 (C6에서 편집된 서열분석 판독물의 백분율 대 C4의 것의 비). 본 발명자들은 이러한 보다 긴 링커가 데아미나제가 R-루프 내의 ssDNA에 보다 잘 접근할 수 있게 하고, 다중 표적 C가 염기 편집 윈도우 내에 존재하는 경우에 보다 균일한 탈아미노화를 발생시킬 수 있다는 것을 추론하였다. BE3C는 또한 시험된 다른 유전자좌에서 대등하거나 개선된 염기 편집 효율 및 생성물 순도를 나타내었다 (도 138c-d).
증진된 효율 및 생성물 순도를 갖는 C:G에서 T:A로의 염기 편집제인 BE4
염기 편집제 구축물 BE4는 모든 3가지 개선을 조합함으로써-rAPOBEC1-dCas9 링커를 32개의 아미노산으로 연장시키고, dCas9-UGI 링커를 9개의 아미노산으로 연장시키고, UGI의 제2 카피를 또 다른 9-아미노산 링커로 구축물의 C-말단에 부가함으로써 조작하였다. 문헌 [Nishida et al.]에 의해 보고된 대안적 염기 편집제 구축물인 표적-AID (9)를 또한 BE4와 동일한 플라스미드 백본 내로 클로닝하였다. HEK293T 세포를 BE3, BE4, 또는 표적-AID 및 EMX1, FANCF, HEK2, HEK3, HEK4, 또는 RNF2 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시켰다. 형질감염 3일 후, 게놈 DNA를 추출하고, 표적 유전자좌를 PCR에 의해 증폭시키고, HTS에 의해 분석하였다. BE3에 비해 BE4에 대한 모든 12개의 편집된 C에 걸쳐 1.5 ± 0.3배의 C에서 T로의 편집 효율의 평균 증가가 관찰되었다 (도 139c). 분석된 동일한 위치에서의 표적-AID에 대한 C에서 T로의 편집의 평균 효율은 BE3의 것보다 1.5 ± 0.5배 더 낮았고, BE4의 것보다 2.1 ± 0.5배 더 낮았지만, CDA1 데아미나제를 사용하는 표적-AID는, 위치 C3 및 C4에 대해 최적의 편집을 가지면서 편집 윈도우가 BE3 및 BE4에 비해 이동하는 것으로 보이는 것으로 보인다는 것에 주목하는 것이 중요하다 (도 139c). 이러한 이동된 편집 윈도우는 표적-AID와 BE3 또는 BE4 사이의 효율 및 생성물 순도의 비교를 어렵게 하는데, 이는 주어진 표적 C가 동일한 가이드 RNA를 사용하는 경우에도 상이한 편집 윈도우 내의 더 최적인 또는 덜 최적인 위치에 놓일 수 있기 때문이다.
더 큰 C에서 T로의 편집 효율 이외에도, BE4는 또한 시험된 모든 게놈 유전자좌에서 BE3에 비해 실질적으로 개선된 생성물 순도를 나타내었고, 2.3 ± 0.3배의 비-T 생성물 형성에서의 평균 감소를 나타내었다 (도 139d). indel을 야기할 수 있는 염기 절제 복구를 추가로 방해하는 것에서 예상되는 바와 같이 (25), BE3과 비교하여 BE4 처리 후 모든 6개의 유전자좌에 걸쳐 평균 2.3 ± 1.1배의 indel 비율의 감소가 또한 관찰되었다 (도 144a-c). 종합하면, 이들 결과는 BE4가 시험된 모든 유전자좌에서 C에서 T로의 편집의 높은 효율, 높은 생성물 순도, 및 낮은 indel 형성 비율을 제공한다는 것을 나타낸다.
BE4 개선을 에스. 아우레우스 Cas9와 통합하여 (26) SaBE4를 생성하였고, 이는 에스. 피오게네스 dCas9(A840H)를 더 작은 에스. 아우레우스 dCas9(A580N)로 대체하고, 그의 대안적 PAM 요건으로 인해 상이한 표적에 접근할 수 있다. HEK293T 세포를 SaBE3 (4) 또는 SaBE4 및 FANCF, HEK3, 또는 HEK4 유전자좌를 표적화하는 sgRNA를 코딩하는 플라스미드로 형질감염시켰다. BE4 및 BE3을 비교하는 결과와 일치하게, 본 발명자들은 SaBE3에 비해 SaBE4에 대한 모든 10개의 편집된 C에 걸쳐 1.4 ± 0.2배의 C에서 T로의 편집 효율의 평균 증가를 관찰하였고 (도 145a), 목적하지 않은 비-T 편집 생성물에서는 1.8 ± 0.5배 평균 감소를 관찰하였다 (도 145b). 이들 결과는 BE4 증진으로부터 발생하는 염기 편집 효율 및 생성물 순도의 이득이 또한 다른 Cas9 상동체로부터 유래된 염기 편집제에도 적용된다는 것을 나타낸다.
물질 및 방법
플라스미드의 클로닝
본 연구에서 모든 플라스미드는 퓨션 U 핫 스타트 폴리머라제 (써모 피셔)를 사용하여 USER 클로닝에 의해 생성하였다. 데아미나제 및 SSB 유전자를 g블록스 유전자 단편 (인테그레이티드 DNA 테크놀로지스)으로서 합성하고, 표적-AID를 애드진으로부터 입수하였다 (플라스미드 # 79620). 단백질 서열은 보충 노트에 열거된다.
세포 배양
HEK293T (ATCC CRL-3216) 세포를 10% (v/v) 소 태아 혈청 (FBS)이 보충된 둘베코 변형 이글 배지 + 글루타맥스 (써모피셔) 중에서 37℃에서 5% CO2 하에 유지하였다. HAP1 (호리즌 디스커버리(Horizon Discovery) C631) 및 HAP1 UNG- (호리즌 디스커버리 HZGHC001531c012)를 10% (v/v) 소 태아 혈청 (FBS)이 보충된 이스코브 변형 둘베코 배지 + 글루타맥스 (써모피셔 사이언티픽) 중에서 37℃에서 5% CO2 하에 유지하였다.
형질감염
HEK293T 세포를 48-웰 콜라겐-코팅된 바이오코트 플레이트 (코닝) 상에 시딩하고, 대략 75% 전면생장률로 형질감염시켰다. 간략하게, 750 ng의 BE 및 250 ng의 sgRNA 발현 플라스미드를 제조업체의 프로토콜에 따라 웰당 1.5 μL의 리포펙타민 2000 (써모피셔 사이언티픽)을 사용하여 형질감염시켰다.
HAP1 및 HAP1 UNG- 세포를 SE 세포주 4D뉴클레오펙터™ X 키트 S (론자(Lonza))를 사용하여 제조업체의 프로토콜에 따라 뉴클레오펙션시켰다. 간략하게, 4 x 105개의 세포를 4D뉴클레오펙터™ 프로그램 DZ-113을 사용하여 300 ng의 BE 및 100 ng의 sgRNA 발현 플라스미드로 뉴클레오펙션시켰다.
게놈 DNA 샘플의 고처리량 DNA 서열분석
형질감염된 세포를 3일 후에 수거하고, 세포를 용해 완충제 (10 mM 트리스-HCl pH 8.0, 0.05% SDS, 25 μg/mL 프로테이나제 K) 중에서 37℃에서 1시간 동안, 이어서 80℃에서 30분 동안 인큐베이션함으로써 게놈 DNA를 단리하였다. 관심 게놈 영역을 이전에 기재된 바와 같이 플랭킹 HTS 프라이머 쌍을 사용하여 PCR에 의해 증폭시켰다 (6, 1). PCR 증폭을 제조업체의 지침에 따라, 및 이전에 기재된 바와 같이 퓨션 고충실도 DNA 폴리머라제 (써모피셔)를 사용하여 수행하였다. 정제된 DNA를 서열분석 어댑터를 함유하는 프라이머를 사용하여 PCR에 의해 증폭시켰다. 생성물을 겔-정제하고, 퀀티T™ 피코그린 dsDNA 검정 키트 (써모피셔) 및 카파 라이브러리 정량화 키트-일루미나 (카파 바이오시스템즈)를 사용하여 정량화하였다. 샘플을 이전에 기재된 바와 같이 일루미나 MiSeq 상에서 서열분석하였다.
데이터 분석
서열분석 판독물을 MiSeq 리포터 (일루미나)를 사용하여 자동으로 디멀티플렉싱하고, 개별 FASTQ 파일을 이전에 기재된 바와 같이 주문제작 매트랩 스크립트로 분석하였다 (1). 각각의 판독물을 스미스-워터만 알고리즘을 사용하여 적절한 참조 서열에 쌍별 정렬시켰다. 31 미만의 Q-점수를 갖는 염기 호출을 N으로 대체하고, 따라서 뉴클레오티드 빈도를 계산하는 것에서 제외하였다. 이러한 처리는 대략 1,000 중 1의 예상된 MiSeq 염기-호출 오류율을 생성한다. 판독 및 참조 서열이 갭을 함유하지 않는 정렬된 서열을, 염기 빈도가 각각의 유전자좌에 대해 표로 제시될 수 있는 정렬 표에 저장하였다.
indel 빈도는 이전에 기재된 매트랩 스크립트로 정량화하였다 (5, 6, 1). 간략하게, 서열분석 판독물을 indel이 발생할 수 있는 윈도우의 양 측에 플랭킹하는 2개의 10-bp 서열에 대한 정확한 매치에 대해 스캐닝하였다. 정확한 매치가 위치하지 않으면, 판독물을 분석으로부터 제외하였다. 이러한 indel 윈도우의 길이가 참조 서열과 정확하게 매칭되는 경우, 판독물을 indel을 함유하지 않는 것으로 분류하였다. indel 윈도우가 참조 서열보다 2개 이상의 염기가 더 길거나 또는 더 짧은 경우, 서열분석 판독물은 각각 삽입 또는 결실로서 분류되었다.
편집 윈도우 내의 다중 표적 시티딘에서의 염기 편집 결과 사이의 상호의존성 (연결 불균형)을 평가하기 위해, BE 처리된 세포로부터의 표적 부위 서열을 주문제작 피톤 스크립트에 의해 분석하였다 (보충 노트 1). 간략하게, 서열분석 판독물을 프로토스페이서의 각 측에 플랭킹하는 2개의 7-bp 서열에 대한 정확한 매치에 대해 스캐닝하였다. 개재 영역이 정확히 20-bp가 아닌 경우, 이를 추가의 분석에서 제외하였다. 프로토스페이서 서열을 가장 비-T 편집 결과 (1차 표적 C)를 갖는 위치에서 뉴클레오티드의 정체에 기초하여 4개의 군으로 추가로 필터링하였다. 이들 4개의 군 각각 뿐만 아니라 전체 풀에 대해, 프로토스페이서 내의 20개의 위치 각각에서 뉴클레오티드 존재비를 집계하였다.
실시예 18: LbCpf1 (뉴클레아제 데드, 뉴클레아제 활성 및 니카제)을 포함하는 염기 편집제.
상기 논의된 바와 같이, 본원에 제공된 융합 단백질 중 임의의 것의 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)은 LbCpf1 단백질일 수 있다. 일부 실시양태에서, LbCpf1 단백질은 뉴클레아제 불활성, 뉴클레아제 활성, 또는 LbCpf1 니카제이다. LbCpf1의 형태를 포함하는 융합 단백질의 여러 구축물을 상이한 표적 서열에서 C에서 T로의 편집을 생성하는 그의 능력에 대해 시험하였다. 시험된 구축물의 개략적 표현이 도 152에 나타나 있다. 구축물 10은 [Apobec]-[LbCpf1]-[UGI]-[UGI]의 도메인 배열을 갖고; 구축물 11은 [Apobec]-[LbCpf1]-[UGI]의 도메인 배열을 갖고; 구축물 12는 [UGI]-[Apobec]-[LbCpf1]의 도메인 배열을 갖고; 구축물 13은 [Apobec]-[UGI]-[LbCpf1]의 도메인 배열을 갖고; 구축물 14는 [LbCpf1]-[UGI]-[Apobec]의 도메인 배열을 갖고; 구축물 15는 [LbCpf1]-[Apobec]-[UGI]의 도메인 배열을 갖는다. 각각의 구축물에 대해, 3개의 상이한 LbCpf1 단백질 (D/N/A, 이는 뉴클레아제 데드 LbCpf1 (D); LbCpf1 니카제 (N) 및 뉴클레아제 활성 LbCpf1 (A)을 지칭함)을 사용하였다. 각각의 이들 구축물에 대해, 도메인을 연결하는 링커가 하기에 제시되고, 여기서 XTEN은 서열 SGSETPGTSESATPES (서열식별번호: 604)를 갖는 XTEN 링커를 지칭하고, BPNLS는 서열 KRTADGSEFEPKKKRKV (서열식별번호: 740)를 갖는 핵 국재화 서열을 지칭한다. 구축물은 N-말단 (좌측)에서 C-말단 (우측)으로 제시된다.
실험에서 사용된 공통 가이드 백본 (sgRNA)은 GTAATTTCTACTAAGTGTAGAT (서열식별번호: 741)[가이드 서열]TTTTTTT이고, 여기서 서열식별번호: 741의 각각의 T는 우라실 (U)이고, 구축물을 특정 뉴클레오티드 서열로 표적화하는 가이드 서열은 괄호 사이에 제시된다. 일부 실시양태에서, 본원에 제공된 구축물 중 임의의 것은 GTAATTTCTACTAAGTGTAGAT (서열식별번호: 741)의 백본 서열을 포함하는 sgRNA와 복합체화되고, 여기서 서열식별번호: 741의 각각의 T는 우라실 (U)이다. 일부 실시양태에서, 본원에 제공된 가이드 RNA 중 임의의 것은 서열, 예를 들어 표적 DNA 서열에 완벽하게 상보적인 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 뉴클레오티드를 포함하는 가이드 서열을 포함한다. 수행된 실험에서, 시험된 가이드 서열이 하기에 제시된다:
다양한 구축물 및 표적 서열을 사용한 C에서 T로의 염기 쌍 편집 백분율을 입증하는 데이터가 도 153-159에 제시되고, 편집 백분율 값 (indel 카운트에 기초한 조정 후), 및 실험을 위한 indel의 백분율이 도 160-166에 제시된다.
보충 서열
CDA1-BE3, AID-BE3, BE4, 및 SaBE4 융합 단백질의 아미노산 서열.
실시예 17에 대한 참고문헌
등가물 및 범위
관련 기술분야의 통상의 기술자는 상용 실험을 사용하여 본원에 기재된 실시양태의 많은 등가물을 인식하거나, 확인할 수 있을 것이다. 본 개시내용의 범주는 상기 설명에 제한되는 것으로 의도되지 않지만, 오히려 첨부된 청구범위에 제시된 바와 같다.
단수 형태는 달리 나타내거나 또는 달리 문맥으로부터 명백하지 않는 한 1개 또는 1개 초과를 의미할 수 있다. 군의 2개 이상의 구성원 사이에 "또는"을 포함하는 청구항 또는 설명은 달리 나타내거나 또는 달리 문맥으로부터 명백하지 않는 한 군 구성원 중 1개, 1개 초과, 또는 전부가 존재하는 경우 충족되는 것으로 간주된다. 2개 이상의 군 구성원 사이에 "또는"을 포함하는 군의 개시내용은 군의 정확하게 1개의 구성원이 존재하는 실시양태, 군의 1개 초과의 구성원이 존재하는 실시양태, 및 군 구성원의 전부가 존재하는 실시양태를 제공한다. 간결성의 목적으로 이들 실시양태는 본원에 개별적으로 설명되지 않았지만, 이들 실시양태 각각은 본원에 제공되며, 구체적으로 청구되거나 비청구될 수 있는 것으로 이해될 것이다.
본 발명은 청구항 중 하나 이상으로부터 또는 설명의 하나 이상의 관련 부분으로부터, 하나 이상의 제한, 요소, 조항, 또는 설명적 용어가 또 다른 청구항 내로 도입되는 모든 변형, 조합, 및 순열을 포괄하는 것으로 이해되어야 한다. 예를 들어, 또 다른 청구항에 종속되는 청구항은 동일한 기초 청구항에 종속되는 임의의 다른 청구항에서 발견되는 제한 중 하나 이상을 포함하도록 변형될 수 있다. 게다가, 청구항이 조성물을 인용하는 경우, 달리 나타내거나 또는 모순 또는 불일치가 발생할 것이 관련 기술분야의 통상의 기술자에게 명백하지 않는 한, 본원에 개시된 제조 또는 사용 방법 중 임의의 것에 따라 또는 존재하는 경우 관련 기술분야에 공지된 방법에 따라 조성물을 제조하거나 사용하는 방법이 포함되는 것으로 이해되어야 한다.
요소가 목록으로서, 예를 들어 마쿠쉬 군 포맷으로 제공되는 경우, 요소의 모든 가능한 하위군이 또한 개시되고, 임의의 요소 또는 요소의 하위군은 군으로부터 제거될 수 있는 것으로 이해되어야 한다. 또한, 용어 "포함하는"은 개방적이며, 추가의 요소 또는 단계의 포한다는 것을 허용하는 것으로 의도되는 것에 주목한다. 일반적으로, 실시양태, 생성물, 또는 방법이 특정한 요소를 포함하는 것으로 언급되는 경우, 이러한 요소, 특색, 또는 단계로 이루어지거나, 이로 본질적으로 이루어지는 특정한 요소, 특색, 또는 단계, 실시양태, 생성물, 또는 방법이 또한 제공되는 것으로 이해되어야 한다. 간결성의 목적으로 이들 실시양태는 본원에 개별적으로 설명되지 않았지만, 이들 실시양태 각각은 본원에 제공되며, 구체적으로 청구되거나 비청구될 수 있는 것으로 이해될 것이다.
범위가 주어지는 경우, 종점이 포함된다. 게다가, 달리 나타내거나 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 일부 실시양태에서 언급된 범위 내의 임의의 특정 값을, 문맥이 달리 명백하게 나타내지 않는 한, 범위의 하한의 단위의 1/10까지 가정할 수 있다는 것이 이해되어야 한다. 간결성의 목적으로 각각의 범위 중의 값은 본원에 개별적으로 설명되지 않았지만, 이들 값 각각은 본원에 제공되며, 구체적으로 청구되거나 비청구될 수 있는 것으로 이해될 것이다. 또한, 달리 나타내거나 또는 달리 문맥 및/또는 관련 기술분야의 통상의 기술자의 이해로부터 명백하지 않는 한, 범위로서 표현된 값은 주어진 범위 내의 임의의 하위범위를 가정할 수 있으며, 여기서, 하위범위의 종점은 범위의 하한의 단위의 1/10만큼 동일한 정도의 정확성으로 표현되는 것으로 이해되어야 한다. 또한, 본 발명의 임의의 특정한 실시양태는 청구항 중 어느 하나 이상으로부터 명백히 제외될 수 있는 것으로 이해되어야 한다. 범위가 주어지는 경우, 범위 내의 임의의 값은 청구항 중 어느 하나 이상으로부터 명백히 제외될 수 있다. 본 발명의 조성물 및/또는 방법의 임의의 실시양태, 요소, 특색, 적용, 또는 측면은 임의의 하나 이상의 청구항으로부터 제외될 수 있다. 간결성의 목적으로, 하나 이상의 요소, 특색, 목적, 또는 측면이 제외되는 모든 실시양태는 본원에 명백하게 제시되지 않는다.
SEQUENCE LISTING
<110> PRESIDENT AND FELLOWS OF HARVARD COLLEGE
<120> NUCLEOBASE EDITORS COMPRISING NUCLEIC ACID PROGRAMMABLE DNA
BINDING PROTEINS
<130> H0824.70257WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> 62/475,830
<151> 2017-03-23
<150> 62/490,587
<151> 2017-04-26
<150> 62/551,951
<151> 2017-08-30
<150> 62/511,934
<151> 2017-05-26
<160> 751
<170> PatentIn version 3.5
<210> 1
<211> 4104
<212> DNA
<213> Streptococcus pyogenes
<400> 1
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg attataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg gcagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggcag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa atctacaatc aattatttga agaaaaccct 600
attaacgcaa gtagagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga gaaatggctt gtttgggaat 720
ctcattgctt tgtcattggg attgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatagt gaaataacta aggctcccct atcagcttca 960
atgattaagc gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgagggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggcgcct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agataggggg atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga tattcaaaaa gcacaggtgt ctggacaagg ccatagttta 2160
catgaacaga ttgctaactt agctggcagt cctgctatta aaaaaggtat tttacagact 2220
gtaaaaattg ttgatgaact ggtcaaagta atggggcata agccagaaaa tatcgttatt 2280
gaaatggcac gtgaaaatca gacaactcaa aagggccaga aaaattcgcg agagcgtatg 2340
aaacgaatcg aagaaggtat caaagaatta ggaagtcaga ttcttaaaga gcatcctgtt 2400
gaaaatactc aattgcaaaa tgaaaagctc tatctctatt atctacaaaa tggaagagac 2460
atgtatgtgg accaagaatt agatattaat cgtttaagtg attatgatgt cgatcacatt 2520
gttccacaaa gtttcattaa agacgattca atagacaata aggtactaac gcgttctgat 2580
aaaaatcgtg gtaaatcgga taacgttcca agtgaagaag tagtcaaaaa gatgaaaaac 2640
tattggagac aacttctaaa cgccaagtta atcactcaac gtaagtttga taatttaacg 2700
aaagctgaac gtggaggttt gagtgaactt gataaagctg gttttatcaa acgccaattg 2760
gttgaaactc gccaaatcac taagcatgtg gcacaaattt tggatagtcg catgaatact 2820
aaatacgatg aaaatgataa acttattcga gaggttaaag tgattacctt aaaatctaaa 2880
ttagtttctg acttccgaaa agatttccaa ttctataaag tacgtgagat taacaattac 2940
catcatgccc atgatgcgta tctaaatgcc gtcgttggaa ctgctttgat taagaaatat 3000
ccaaaacttg aatcggagtt tgtctatggt gattataaag tttatgatgt tcgtaaaatg 3060
attgctaagt ctgagcaaga aataggcaaa gcaaccgcaa aatatttctt ttactctaat 3120
atcatgaact tcttcaaaac agaaattaca cttgcaaatg gagagattcg caaacgccct 3180
ctaatcgaaa ctaatgggga aactggagaa attgtctggg ataaagggcg agattttgcc 3240
acagtgcgca aagtattgtc catgccccaa gtcaatattg tcaagaaaac agaagtacag 3300
acaggcggat tctccaagga gtcaatttta ccaaaaagaa attcggacaa gcttattgct 3360
cgtaaaaaag actgggatcc aaaaaaatat ggtggttttg atagtccaac ggtagcttat 3420
tcagtcctag tggttgctaa ggtggaaaaa gggaaatcga agaagttaaa atccgttaaa 3480
gagttactag ggatcacaat tatggaaaga agttcctttg aaaaaaatcc gattgacttt 3540
ttagaagcta aaggatataa ggaagttaaa aaagacttaa tcattaaact acctaaatat 3600
agtctttttg agttagaaaa cggtcgtaaa cggatgctgg ctagtgccgg agaattacaa 3660
aaaggaaatg agctggctct gccaagcaaa tatgtgaatt ttttatattt agctagtcat 3720
tatgaaaagt tgaagggtag tccagaagat aacgaacaaa aacaattgtt tgtggagcag 3780
cataagcatt atttagatga gattattgag caaatcagtg aattttctaa gcgtgttatt 3840
ttagcagatg ccaatttaga taaagttctt agtgcatata acaaacatag agacaaacca 3900
atacgtgaac aagcagaaaa tattattcat ttatttacgt tgacgaatct tggagctccc 3960
gctgctttta aatattttga tacaacaatt gatcgtaaac gatatacgtc tacaaaagaa 4020
gttttagatg ccactcttat ccatcaatcc atcactggtc tttatgaaac acgcattgat 4080
ttgagtcagc taggaggtga ctga 4104
<210> 2
<211> 1367
<212> PRT
<213> Streptococcus pyogenes
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 4212
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 3
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aaggctgcag ga 4212
<210> 4
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 5
<211> 4107
<212> DNA
<213> Streptococcus pyogenes
<400> 5
atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60
atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120
cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180
gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240
tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300
cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360
aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420
aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480
atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540
gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600
attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660
cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720
ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780
gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840
caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900
ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960
atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020
caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080
ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140
gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200
aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260
gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320
gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380
cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440
gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500
aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560
tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620
tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680
gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740
tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860
ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920
cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980
cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040
gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100
agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160
catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220
gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280
attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340
atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400
gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460
gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520
attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580
gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640
aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700
acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760
ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820
actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880
aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940
taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000
tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060
atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120
aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180
cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240
gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300
cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360
gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420
tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480
aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540
tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600
tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660
caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720
cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780
cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840
attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900
ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960
cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020
gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080
gatttgagtc agctaggagg tgactga 4107
<210> 6
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 6
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 7
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 7
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 8
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 8
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 9
<211> 1300
<212> PRT
<213> Francisella novicida
<400> 9
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 10
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 10
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 11
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 11
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 12
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 12
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 13
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 13
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 14
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 14
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 15
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 15
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 16
<211> 1300
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 16
Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys
20 25 30
Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys
35 40 45
Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu
50 55 60
Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser
65 70 75 80
Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys
85 90 95
Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr
100 105 110
Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile
115 120 125
Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln
130 135 140
Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr
145 150 155 160
Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr
165 170 175
Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser
180 185 190
Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu
195 200 205
Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys
210 215 220
Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu
225 230 235 240
Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg
245 250 255
Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr
260 265 270
Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys
275 280 285
Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile
290 295 300
Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys
305 310 315 320
Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser
325 330 335
Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met
340 345 350
Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys
355 360 365
Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln
370 375 380
Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr
385 390 395 400
Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala
405 410 415
Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn
420 425 430
Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala
435 440 445
Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn
450 455 460
Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala
465 470 475 480
Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys
485 490 495
Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys
500 505 510
Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp
515 520 525
Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His
530 535 540
Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His
545 550 555 560
Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val
565 570 575
Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser
580 585 590
Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly
595 600 605
Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys
610 615 620
Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile
625 630 635 640
Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys
645 650 655
Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val
660 665 670
Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile
675 680 685
Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln
690 695 700
Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe
705 710 715 720
Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp
725 730 735
Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu
740 745 750
Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn
755 760 765
Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr
770 775 780
Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg
785 790 795 800
Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn
805 810 815
Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr
820 825 830
Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala
835 840 845
Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu
850 855 860
Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe
865 870 875 880
His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe
885 890 895
Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His
900 905 910
Ile Leu Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu
915 920 925
Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile
930 935 940
Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile
945 950 955 960
Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn
965 970 975
Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile
980 985 990
Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Ala Asp Leu
995 1000 1005
Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val
1010 1015 1020
Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu
1025 1030 1035
Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg
1040 1045 1050
Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly
1055 1060 1065
Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser
1070 1075 1080
Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys
1085 1090 1095
Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp
1100 1105 1110
Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe
1115 1120 1125
Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr
1130 1135 1140
Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp
1145 1150 1155
Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu
1160 1165 1170
Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly
1175 1180 1185
Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe
1190 1195 1200
Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg
1205 1210 1215
Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val
1220 1225 1230
Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys
1235 1240 1245
Asn Met Pro Gln Asp Ala Ala Ala Asn Gly Ala Tyr His Ile Gly
1250 1255 1260
Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu
1265 1270 1275
Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu
1280 1285 1290
Phe Val Gln Asn Arg Asn Asn
1295 1300
<210> 17
<211> 1307
<212> PRT
<213> Acidaminococcus species
<400> 17
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Met Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 18
<211> 1228
<212> PRT
<213> Lachnospiraceae species
<400> 18
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 19
<211> 1307
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 19
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Met Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Ala
900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990
Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 20
<211> 1228
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 20
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Ala Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 21
<211> 1228
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 21
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1 5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp
820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn
915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Ala Asn Ser Ile Thr Gly
1130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 1225
<210> 22
<211> 1305
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 22
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Met Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Lys Gly Gln Lys Gly Tyr Arg Glu Ala Leu Cys
660 665 670
Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr
675 680 685
Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp
690 695 700
Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser
705 710 715 720
Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly
725 730 735
Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His
740 745 750
His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser
755 760 765
Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu
770 775 780
Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu
785 790 795 800
Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile
805 810 815
Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu
820 825 830
Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile
835 840 845
Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser
850 855 860
Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala
865 870 875 880
Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu
885 890 895
His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu
900 905 910
Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg
915 920 925
Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn
930 935 940
Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly
945 950 955 960
Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu
965 970 975
Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn
980 985 990
Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala
995 1000 1005
Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys
1010 1015 1020
Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu
1025 1030 1035
Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met
1040 1045 1050
Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr
1055 1060 1065
Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp
1070 1075 1080
Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly
1085 1090 1095
Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu
1100 1105 1110
His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro
1115 1120 1125
Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu Thr
1130 1135 1140
Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg Ile
1145 1150 1155
Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg Asp
1160 1165 1170
Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly
1175 1180 1185
Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu
1190 1195 1200
Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg
1205 1210 1215
Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp
1220 1225 1230
Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp
1235 1240 1245
Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn
1250 1255 1260
Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His
1265 1270 1275
Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn
1280 1285 1290
Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 1305
<210> 23
<211> 1303
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 23
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Met Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Lys Gly Lys Gly Tyr Arg Glu Ala Leu Cys Lys Trp
660 665 670
Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser
675 680 685
Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly
690 695 700
Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln
705 710 715 720
Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu
725 730 735
Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly
740 745 750
Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu
755 760 765
Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe
770 775 780
Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu
785 790 795 800
Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp
805 810 815
Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His
820 825 830
Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys
835 840 845
Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys
850 855 860
Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser
865 870 875 880
Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro
885 890 895
Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr
900 905 910
Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu
915 920 925
Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu
930 935 940
Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile
945 950 955 960
Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val
965 970 975
Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn
980 985 990
Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr
995 1000 1005
Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val
1010 1015 1020
Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro
1025 1030 1035
Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr
1040 1045 1050
Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys
1055 1060 1065
Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr
1070 1075 1080
Ile Lys Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp
1085 1090 1095
Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe
1100 1105 1110
Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe
1115 1120 1125
Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe
1130 1135 1140
Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg Ile Val Pro
1145 1150 1155
Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr
1160 1165 1170
Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly Ile Val
1175 1180 1185
Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp
1190 1195 1200
Asp Ser His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val
1205 1210 1215
Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile
1220 1225 1230
Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg
1235 1240 1245
Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala
1250 1255 1260
Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys
1265 1270 1275
Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp
1280 1285 1290
Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300
<210> 24
<211> 1301
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 24
Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr Leu
1 5 10 15
Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln Glu
20 25 30
Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys Glu
35 40 45
Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln Cys
50 55 60
Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile Asp
65 70 75 80
Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile Glu
85 90 95
Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly Arg
100 105 110
Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile Tyr
115 120 125
Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys Gln
130 135 140
Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg Ser
145 150 155 160
Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg Lys
165 170 175
Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg Ile
180 185 190
Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe Thr
195 200 205
Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn Val
210 215 220
Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val Phe
225 230 235 240
Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp Leu
245 250 255
Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu Lys
260 265 270
Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn Asp
275 280 285
Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro Leu
290 295 300
Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu Glu
305 310 315 320
Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr Lys
325 330 335
Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu Phe
340 345 350
Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His Lys
355 360 365
Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr Leu
370 375 380
Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys Ile
385 390 395 400
Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu Asp
405 410 415
Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser Glu
420 425 430
Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala Ala
435 440 445
Leu Asp Gln Pro Leu Pro Thr Thr Met Leu Lys Lys Gln Glu Glu Lys
450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655
Thr Ala Tyr Ala Gly Gly Tyr Arg Glu Ala Leu Cys Lys Trp Ile Asp
660 665 670
Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr Lys Thr Thr Ser Ile Asp
675 680 685
Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr Lys Asp Leu Gly Glu Tyr
690 695 700
Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His Ile Ser Phe Gln Arg Ile
705 710 715 720
Ala Glu Lys Glu Ile Met Asp Ala Val Glu Thr Gly Lys Leu Tyr Leu
725 730 735
Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys Gly His His Gly Lys Pro
740 745 750
Asn Leu His Thr Leu Tyr Trp Thr Gly Leu Phe Ser Pro Glu Asn Leu
755 760 765
Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln Ala Glu Leu Phe Tyr Arg
770 775 780
Pro Lys Ser Arg Met Lys Arg Met Ala His Arg Leu Gly Glu Lys Met
785 790 795 800
Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr Pro Ile Pro Asp Thr Leu
805 810 815
Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His Arg Leu Ser His Asp Leu
820 825 830
Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn Val Ile Thr Lys Glu Val
835 840 845
Ser His Glu Ile Ile Lys Asp Arg Arg Phe Thr Ser Asp Lys Phe Phe
850 855 860
Phe His Val Pro Ile Thr Leu Asn Tyr Gln Ala Ala Asn Ser Pro Ser
865 870 875 880
Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu Lys Glu His Pro Glu Thr
885 890 895
Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr Ile Thr
900 905 910
Val Ile Asp Ser Thr Gly Lys Ile Leu Glu Gln Arg Ser Leu Asn Thr
915 920 925
Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu Asp Asn Arg Glu Lys Glu
930 935 940
Arg Val Ala Ala Arg Gln Ala Trp Ser Val Val Gly Thr Ile Lys Asp
945 950 955 960
Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile His Glu Ile Val Asp Leu
965 970 975
Met Ile His Tyr Gln Ala Val Val Val Leu Glu Asn Leu Asn Phe Gly
980 985 990
Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu Lys Ala Val Tyr Gln Gln
995 1000 1005
Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Cys Leu Val Leu Lys
1010 1015 1020
Asp Tyr Pro Ala Glu Lys Val Gly Gly Val Leu Asn Pro Tyr Gln
1025 1030 1035
Leu Thr Asp Gln Phe Thr Ser Phe Ala Lys Met Gly Thr Gln Ser
1040 1045 1050
Gly Phe Leu Phe Tyr Val Pro Ala Pro Tyr Thr Ser Lys Ile Asp
1055 1060 1065
Pro Leu Thr Gly Phe Val Asp Pro Phe Val Trp Lys Thr Ile Lys
1070 1075 1080
Asn His Glu Ser Arg Lys His Phe Leu Glu Gly Phe Asp Phe Leu
1085 1090 1095
His Tyr Asp Val Lys Thr Gly Asp Phe Ile Leu His Phe Lys Met
1100 1105 1110
Asn Arg Asn Leu Ser Phe Gln Arg Gly Leu Pro Gly Phe Met Pro
1115 1120 1125
Ala Trp Asp Ile Val Phe Glu Lys Asn Glu Thr Gln Phe Asp Ala
1130 1135 1140
Lys Gly Thr Pro Phe Ile Ala Gly Lys Arg Ile Val Pro Val Ile
1145 1150 1155
Glu Asn His Arg Phe Thr Gly Arg Tyr Arg Asp Leu Tyr Pro Ala
1160 1165 1170
Asn Glu Leu Ile Ala Leu Leu Glu Glu Lys Gly Ile Val Phe Arg
1175 1180 1185
Asp Gly Ser Asn Ile Leu Pro Lys Leu Leu Glu Asn Asp Asp Ser
1190 1195 1200
His Ala Ile Asp Thr Met Val Ala Leu Ile Arg Ser Val Leu Gln
1205 1210 1215
Met Arg Asn Ser Asn Ala Ala Thr Gly Glu Asp Tyr Ile Asn Ser
1220 1225 1230
Pro Val Arg Asp Leu Asn Gly Val Cys Phe Asp Ser Arg Phe Gln
1235 1240 1245
Asn Pro Glu Trp Pro Met Asp Ala Asp Ala Asn Gly Ala Tyr His
1250 1255 1260
Ile Ala Leu Lys Gly Gln Leu Leu Leu Asn His Leu Lys Glu Ser
1265 1270 1275
Lys Asp Leu Lys Leu Gln Asn Gly Ile Ser Asn Gln Asp Trp Leu
1280 1285 1290
Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300
<210> 25
<211> 887
<212> PRT
<213> Natronobacterium gregoryi
<400> 25
Met Thr Val Ile Asp Leu Asp Ser Thr Thr Thr Ala Asp Glu Leu Thr
1 5 10 15
Ser Gly His Thr Tyr Asp Ile Ser Val Thr Leu Thr Gly Val Tyr Asp
20 25 30
Asn Thr Asp Glu Gln His Pro Arg Met Ser Leu Ala Phe Glu Gln Asp
35 40 45
Asn Gly Glu Arg Arg Tyr Ile Thr Leu Trp Lys Asn Thr Thr Pro Lys
50 55 60
Asp Val Phe Thr Tyr Asp Tyr Ala Thr Gly Ser Thr Tyr Ile Phe Thr
65 70 75 80
Asn Ile Asp Tyr Glu Val Lys Asp Gly Tyr Glu Asn Leu Thr Ala Thr
85 90 95
Tyr Gln Thr Thr Val Glu Asn Ala Thr Ala Gln Glu Val Gly Thr Thr
100 105 110
Asp Glu Asp Glu Thr Phe Ala Gly Gly Glu Pro Leu Asp His His Leu
115 120 125
Asp Asp Ala Leu Asn Glu Thr Pro Asp Asp Ala Glu Thr Glu Ser Asp
130 135 140
Ser Gly His Val Met Thr Ser Phe Ala Ser Arg Asp Gln Leu Pro Glu
145 150 155 160
Trp Thr Leu His Thr Tyr Thr Leu Thr Ala Thr Asp Gly Ala Lys Thr
165 170 175
Asp Thr Glu Tyr Ala Arg Arg Thr Leu Ala Tyr Thr Val Arg Gln Glu
180 185 190
Leu Tyr Thr Asp His Asp Ala Ala Pro Val Ala Thr Asp Gly Leu Met
195 200 205
Leu Leu Thr Pro Glu Pro Leu Gly Glu Thr Pro Leu Asp Leu Asp Cys
210 215 220
Gly Val Arg Val Glu Ala Asp Glu Thr Arg Thr Leu Asp Tyr Thr Thr
225 230 235 240
Ala Lys Asp Arg Leu Leu Ala Arg Glu Leu Val Glu Glu Gly Leu Lys
245 250 255
Arg Ser Leu Trp Asp Asp Tyr Leu Val Arg Gly Ile Asp Glu Val Leu
260 265 270
Ser Lys Glu Pro Val Leu Thr Cys Asp Glu Phe Asp Leu His Glu Arg
275 280 285
Tyr Asp Leu Ser Val Glu Val Gly His Ser Gly Arg Ala Tyr Leu His
290 295 300
Ile Asn Phe Arg His Arg Phe Val Pro Lys Leu Thr Leu Ala Asp Ile
305 310 315 320
Asp Asp Asp Asn Ile Tyr Pro Gly Leu Arg Val Lys Thr Thr Tyr Arg
325 330 335
Pro Arg Arg Gly His Ile Val Trp Gly Leu Arg Asp Glu Cys Ala Thr
340 345 350
Asp Ser Leu Asn Thr Leu Gly Asn Gln Ser Val Val Ala Tyr His Arg
355 360 365
Asn Asn Gln Thr Pro Ile Asn Thr Asp Leu Leu Asp Ala Ile Glu Ala
370 375 380
Ala Asp Arg Arg Val Val Glu Thr Arg Arg Gln Gly His Gly Asp Asp
385 390 395 400
Ala Val Ser Phe Pro Gln Glu Leu Leu Ala Val Glu Pro Asn Thr His
405 410 415
Gln Ile Lys Gln Phe Ala Ser Asp Gly Phe His Gln Gln Ala Arg Ser
420 425 430
Lys Thr Arg Leu Ser Ala Ser Arg Cys Ser Glu Lys Ala Gln Ala Phe
435 440 445
Ala Glu Arg Leu Asp Pro Val Arg Leu Asn Gly Ser Thr Val Glu Phe
450 455 460
Ser Ser Glu Phe Phe Thr Gly Asn Asn Glu Gln Gln Leu Arg Leu Leu
465 470 475 480
Tyr Glu Asn Gly Glu Ser Val Leu Thr Phe Arg Asp Gly Ala Arg Gly
485 490 495
Ala His Pro Asp Glu Thr Phe Ser Lys Gly Ile Val Asn Pro Pro Glu
500 505 510
Ser Phe Glu Val Ala Val Val Leu Pro Glu Gln Gln Ala Asp Thr Cys
515 520 525
Lys Ala Gln Trp Asp Thr Met Ala Asp Leu Leu Asn Gln Ala Gly Ala
530 535 540
Pro Pro Thr Arg Ser Glu Thr Val Gln Tyr Asp Ala Phe Ser Ser Pro
545 550 555 560
Glu Ser Ile Ser Leu Asn Val Ala Gly Ala Ile Asp Pro Ser Glu Val
565 570 575
Asp Ala Ala Phe Val Val Leu Pro Pro Asp Gln Glu Gly Phe Ala Asp
580 585 590
Leu Ala Ser Pro Thr Glu Thr Tyr Asp Glu Leu Lys Lys Ala Leu Ala
595 600 605
Asn Met Gly Ile Tyr Ser Gln Met Ala Tyr Phe Asp Arg Phe Arg Asp
610 615 620
Ala Lys Ile Phe Tyr Thr Arg Asn Val Ala Leu Gly Leu Leu Ala Ala
625 630 635 640
Ala Gly Gly Val Ala Phe Thr Thr Glu His Ala Met Pro Gly Asp Ala
645 650 655
Asp Met Phe Ile Gly Ile Asp Val Ser Arg Ser Tyr Pro Glu Asp Gly
660 665 670
Ala Ser Gly Gln Ile Asn Ile Ala Ala Thr Ala Thr Ala Val Tyr Lys
675 680 685
Asp Gly Thr Ile Leu Gly His Ser Ser Thr Arg Pro Gln Leu Gly Glu
690 695 700
Lys Leu Gln Ser Thr Asp Val Arg Asp Ile Met Lys Asn Ala Ile Leu
705 710 715 720
Gly Tyr Gln Gln Val Thr Gly Glu Ser Pro Thr His Ile Val Ile His
725 730 735
Arg Asp Gly Phe Met Asn Glu Asp Leu Asp Pro Ala Thr Glu Phe Leu
740 745 750
Asn Glu Gln Gly Val Glu Tyr Asp Ile Val Glu Ile Arg Lys Gln Pro
755 760 765
Gln Thr Arg Leu Leu Ala Val Ser Asp Val Gln Tyr Asp Thr Pro Val
770 775 780
Lys Ser Ile Ala Ala Ile Asn Gln Asn Glu Pro Arg Ala Thr Val Ala
785 790 795 800
Thr Phe Gly Ala Pro Glu Tyr Leu Ala Thr Arg Asp Gly Gly Gly Leu
805 810 815
Pro Arg Pro Ile Gln Ile Glu Arg Val Ala Gly Glu Thr Asp Ile Glu
820 825 830
Thr Leu Thr Arg Gln Val Tyr Leu Leu Ser Gln Ser His Ile Gln Val
835 840 845
His Asn Ser Thr Ala Arg Leu Pro Ile Thr Thr Ala Tyr Ala Asp Gln
850 855 860
Ala Ser Thr His Ala Thr Lys Gly Tyr Leu Val Gln Thr Gly Ala Phe
865 870 875 880
Glu Ser Asn Val Gly Phe Leu
885
<210> 26
<211> 1129
<212> PRT
<213> Alicyclobacillus acidoterrestris
<400> 26
Met Ala Val Lys Ser Ile Lys Val Lys Leu Arg Leu Asp Asp Met Pro
1 5 10 15
Glu Ile Arg Ala Gly Leu Trp Lys Leu His Lys Glu Val Asn Ala Gly
20 25 30
Val Arg Tyr Tyr Thr Glu Trp Leu Ser Leu Leu Arg Gln Glu Asn Leu
35 40 45
Tyr Arg Arg Ser Pro Asn Gly Asp Gly Glu Gln Glu Cys Asp Lys Thr
50 55 60
Ala Glu Glu Cys Lys Ala Glu Leu Leu Glu Arg Leu Arg Ala Arg Gln
65 70 75 80
Val Glu Asn Gly His Arg Gly Pro Ala Gly Ser Asp Asp Glu Leu Leu
85 90 95
Gln Leu Ala Arg Gln Leu Tyr Glu Leu Leu Val Pro Gln Ala Ile Gly
100 105 110
Ala Lys Gly Asp Ala Gln Gln Ile Ala Arg Lys Phe Leu Ser Pro Leu
115 120 125
Ala Asp Lys Asp Ala Val Gly Gly Leu Gly Ile Ala Lys Ala Gly Asn
130 135 140
Lys Pro Arg Trp Val Arg Met Arg Glu Ala Gly Glu Pro Gly Trp Glu
145 150 155 160
Glu Glu Lys Glu Lys Ala Glu Thr Arg Lys Ser Ala Asp Arg Thr Ala
165 170 175
Asp Val Leu Arg Ala Leu Ala Asp Phe Gly Leu Lys Pro Leu Met Arg
180 185 190
Val Tyr Thr Asp Ser Glu Met Ser Ser Val Glu Trp Lys Pro Leu Arg
195 200 205
Lys Gly Gln Ala Val Arg Thr Trp Asp Arg Asp Met Phe Gln Gln Ala
210 215 220
Ile Glu Arg Met Met Ser Trp Glu Ser Trp Asn Gln Arg Val Gly Gln
225 230 235 240
Glu Tyr Ala Lys Leu Val Glu Gln Lys Asn Arg Phe Glu Gln Lys Asn
245 250 255
Phe Val Gly Gln Glu His Leu Val His Leu Val Asn Gln Leu Gln Gln
260 265 270
Asp Met Lys Glu Ala Ser Pro Gly Leu Glu Ser Lys Glu Gln Thr Ala
275 280 285
His Tyr Val Thr Gly Arg Ala Leu Arg Gly Ser Asp Lys Val Phe Glu
290 295 300
Lys Trp Gly Lys Leu Ala Pro Asp Ala Pro Phe Asp Leu Tyr Asp Ala
305 310 315 320
Glu Ile Lys Asn Val Gln Arg Arg Asn Thr Arg Arg Phe Gly Ser His
325 330 335
Asp Leu Phe Ala Lys Leu Ala Glu Pro Glu Tyr Gln Ala Leu Trp Arg
340 345 350
Glu Asp Ala Ser Phe Leu Thr Arg Tyr Ala Val Tyr Asn Ser Ile Leu
355 360 365
Arg Lys Leu Asn His Ala Lys Met Phe Ala Thr Phe Thr Leu Pro Asp
370 375 380
Ala Thr Ala His Pro Ile Trp Thr Arg Phe Asp Lys Leu Gly Gly Asn
385 390 395 400
Leu His Gln Tyr Thr Phe Leu Phe Asn Glu Phe Gly Glu Arg Arg His
405 410 415
Ala Ile Arg Phe His Lys Leu Leu Lys Val Glu Asn Gly Val Ala Arg
420 425 430
Glu Val Asp Asp Val Thr Val Pro Ile Ser Met Ser Glu Gln Leu Asp
435 440 445
Asn Leu Leu Pro Arg Asp Pro Asn Glu Pro Ile Ala Leu Tyr Phe Arg
450 455 460
Asp Tyr Gly Ala Glu Gln His Phe Thr Gly Glu Phe Gly Gly Ala Lys
465 470 475 480
Ile Gln Cys Arg Arg Asp Gln Leu Ala His Met His Arg Arg Arg Gly
485 490 495
Ala Arg Asp Val Tyr Leu Asn Val Ser Val Arg Val Gln Ser Gln Ser
500 505 510
Glu Ala Arg Gly Glu Arg Arg Pro Pro Tyr Ala Ala Val Phe Arg Leu
515 520 525
Val Gly Asp Asn His Arg Ala Phe Val His Phe Asp Lys Leu Ser Asp
530 535 540
Tyr Leu Ala Glu His Pro Asp Asp Gly Lys Leu Gly Ser Glu Gly Leu
545 550 555 560
Leu Ser Gly Leu Arg Val Met Ser Val Asp Leu Gly Leu Arg Thr Ser
565 570 575
Ala Ser Ile Ser Val Phe Arg Val Ala Arg Lys Asp Glu Leu Lys Pro
580 585 590
Asn Ser Lys Gly Arg Val Pro Phe Phe Phe Pro Ile Lys Gly Asn Asp
595 600 605
Asn Leu Val Ala Val His Glu Arg Ser Gln Leu Leu Lys Leu Pro Gly
610 615 620
Glu Thr Glu Ser Lys Asp Leu Arg Ala Ile Arg Glu Glu Arg Gln Arg
625 630 635 640
Thr Leu Arg Gln Leu Arg Thr Gln Leu Ala Tyr Leu Arg Leu Leu Val
645 650 655
Arg Cys Gly Ser Glu Asp Val Gly Arg Arg Glu Arg Ser Trp Ala Lys
660 665 670
Leu Ile Glu Gln Pro Val Asp Ala Ala Asn His Met Thr Pro Asp Trp
675 680 685
Arg Glu Ala Phe Glu Asn Glu Leu Gln Lys Leu Lys Ser Leu His Gly
690 695 700
Ile Cys Ser Asp Lys Glu Trp Met Asp Ala Val Tyr Glu Ser Val Arg
705 710 715 720
Arg Val Trp Arg His Met Gly Lys Gln Val Arg Asp Trp Arg Lys Asp
725 730 735
Val Arg Ser Gly Glu Arg Pro Lys Ile Arg Gly Tyr Ala Lys Asp Val
740 745 750
Val Gly Gly Asn Ser Ile Glu Gln Ile Glu Tyr Leu Glu Arg Gln Tyr
755 760 765
Lys Phe Leu Lys Ser Trp Ser Phe Phe Gly Lys Val Ser Gly Gln Val
770 775 780
Ile Arg Ala Glu Lys Gly Ser Arg Phe Ala Ile Thr Leu Arg Glu His
785 790 795 800
Ile Asp His Ala Lys Glu Asp Arg Leu Lys Lys Leu Ala Asp Arg Ile
805 810 815
Ile Met Glu Ala Leu Gly Tyr Val Tyr Ala Leu Asp Glu Arg Gly Lys
820 825 830
Gly Lys Trp Val Ala Lys Tyr Pro Pro Cys Gln Leu Ile Leu Leu Glu
835 840 845
Glu Leu Ser Glu Tyr Gln Phe Asn Asn Asp Arg Pro Pro Ser Glu Asn
850 855 860
Asn Gln Leu Met Gln Trp Ser His Arg Gly Val Phe Gln Glu Leu Ile
865 870 875 880
Asn Gln Ala Gln Val His Asp Leu Leu Val Gly Thr Met Tyr Ala Ala
885 890 895
Phe Ser Ser Arg Phe Asp Ala Arg Thr Gly Ala Pro Gly Ile Arg Cys
900 905 910
Arg Arg Val Pro Ala Arg Cys Thr Gln Glu His Asn Pro Glu Pro Phe
915 920 925
Pro Trp Trp Leu Asn Lys Phe Val Val Glu His Thr Leu Asp Ala Cys
930 935 940
Pro Leu Arg Ala Asp Asp Leu Ile Pro Thr Gly Glu Gly Glu Ile Phe
945 950 955 960
Val Ser Pro Phe Ser Ala Glu Glu Gly Asp Phe His Gln Ile His Ala
965 970 975
Asp Leu Asn Ala Ala Gln Asn Leu Gln Gln Arg Leu Trp Ser Asp Phe
980 985 990
Asp Ile Ser Gln Ile Arg Leu Arg Cys Asp Trp Gly Glu Val Asp Gly
995 1000 1005
Glu Leu Val Leu Ile Pro Arg Leu Thr Gly Lys Arg Thr Ala Asp
1010 1015 1020
Ser Tyr Ser Asn Lys Val Phe Tyr Thr Asn Thr Gly Val Thr Tyr
1025 1030 1035
Tyr Glu Arg Glu Arg Gly Lys Lys Arg Arg Lys Val Phe Ala Gln
1040 1045 1050
Glu Lys Leu Ser Glu Glu Glu Ala Glu Leu Leu Val Glu Ala Asp
1055 1060 1065
Glu Ala Arg Glu Lys Ser Val Val Leu Met Arg Asp Pro Ser Gly
1070 1075 1080
Ile Ile Asn Arg Gly Asn Trp Thr Arg Gln Lys Glu Phe Trp Ser
1085 1090 1095
Met Val Asn Gln Arg Ile Glu Gly Tyr Leu Val Lys Gln Ile Arg
1100 1105 1110
Ser Arg Val Pro Leu Gln Asp Ser Ala Cys Glu Asn Thr Gly Asp
1115 1120 1125
Ile
<210> 27
<211> 1389
<212> PRT
<213> Leptotrichia shahii
<400> 27
Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys
1 5 10 15
Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp
20 25 30
Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys
35 40 45
Ile Asp Asn Asn Lys Phe Ile Arg Lys Tyr Ile Asn Tyr Lys Lys Asn
50 55 60
Asp Asn Ile Leu Lys Glu Phe Thr Arg Lys Phe His Ala Gly Asn Ile
65 70 75 80
Leu Phe Lys Leu Lys Gly Lys Glu Gly Ile Ile Arg Ile Glu Asn Asn
85 90 95
Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Ala Tyr
100 105 110
Gly Lys Ser Glu Lys Leu Lys Ala Leu Gly Ile Thr Lys Lys Lys Ile
115 120 125
Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile
130 135 140
Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg
145 150 155 160
Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg
165 170 175
Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile
180 185 190
Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile
195 200 205
Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His
210 215 220
Leu Arg Glu Lys Leu Leu Lys Asp Asp Lys Ile Asp Val Ile Leu Thr
225 230 235 240
Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Leu
245 250 255
Gly Phe Val Lys Phe Tyr Leu Asn Val Gly Gly Asp Lys Lys Lys Ser
260 265 270
Lys Asn Lys Lys Met Leu Val Glu Lys Ile Leu Asn Ile Asn Val Asp
275 280 285
Leu Thr Val Glu Asp Ile Ala Asp Phe Val Ile Lys Glu Leu Glu Phe
290 295 300
Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Val Asn Asn Glu
305 310 315 320
Phe Leu Glu Lys Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu
325 330 335
Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp
340 345 350
Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys
355 360 365
Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asp Glu Leu Ile
370 375 380
Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile
385 390 395 400
Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys
405 410 415
Phe Ser Lys Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr
420 425 430
Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys
435 440 445
Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn
450 455 460
Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr
465 470 475 480
Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Asp
485 490 495
Met Thr Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu
500 505 510
Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu
515 520 525
Leu Asn Lys Ile Phe Ser Arg Glu Asn Ile Asn Asn Asp Glu Asn Ile
530 535 540
Asp Phe Phe Gly Gly Asp Arg Glu Lys Asn Tyr Val Leu Asp Lys Lys
545 550 555 560
Ile Leu Asn Ser Lys Ile Lys Ile Ile Arg Asp Leu Asp Phe Ile Asp
565 570 575
Asn Lys Asn Asn Ile Thr Asn Asn Phe Ile Arg Lys Phe Thr Lys Ile
580 585 590
Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala Ile Ser Lys Glu Arg
595 600 605
Asp Leu Gln Gly Thr Gln Asp Asp Tyr Asn Lys Val Ile Asn Ile Ile
610 615 620
Gln Asn Leu Lys Ile Ser Asp Glu Glu Val Ser Lys Ala Leu Asn Leu
625 630 635 640
Asp Val Val Phe Lys Asp Lys Lys Asn Ile Ile Thr Lys Ile Asn Asp
645 650 655
Ile Lys Ile Ser Glu Glu Asn Asn Asn Asp Ile Lys Tyr Leu Pro Ser
660 665 670
Phe Ser Lys Val Leu Pro Glu Ile Leu Asn Leu Tyr Arg Asn Asn Pro
675 680 685
Lys Asn Glu Pro Phe Asp Thr Ile Glu Thr Glu Lys Ile Val Leu Asn
690 695 700
Ala Leu Ile Tyr Val Asn Lys Glu Leu Tyr Lys Lys Leu Ile Leu Glu
705 710 715 720
Asp Asp Leu Glu Glu Asn Glu Ser Lys Asn Ile Phe Leu Gln Glu Leu
725 730 735
Lys Lys Thr Leu Gly Asn Ile Asp Glu Ile Asp Glu Asn Ile Ile Glu
740 745 750
Asn Tyr Tyr Lys Asn Ala Gln Ile Ser Ala Ser Lys Gly Asn Asn Lys
755 760 765
Ala Ile Lys Lys Tyr Gln Lys Lys Val Ile Glu Cys Tyr Ile Gly Tyr
770 775 780
Leu Arg Lys Asn Tyr Glu Glu Leu Phe Asp Phe Ser Asp Phe Lys Met
785 790 795 800
Asn Ile Gln Glu Ile Lys Lys Gln Ile Lys Asp Ile Asn Asp Asn Lys
805 810 815
Thr Tyr Glu Arg Ile Thr Val Lys Thr Ser Asp Lys Thr Ile Val Ile
820 825 830
Asn Asp Asp Phe Glu Tyr Ile Ile Ser Ile Phe Ala Leu Leu Asn Ser
835 840 845
Asn Ala Val Ile Asn Lys Ile Arg Asn Arg Phe Phe Ala Thr Ser Val
850 855 860
Trp Leu Asn Thr Ser Glu Tyr Gln Asn Ile Ile Asp Ile Leu Asp Glu
865 870 875 880
Ile Met Gln Leu Asn Thr Leu Arg Asn Glu Cys Ile Thr Glu Asn Trp
885 890 895
Asn Leu Asn Leu Glu Glu Phe Ile Gln Lys Met Lys Glu Ile Glu Lys
900 905 910
Asp Phe Asp Asp Phe Lys Ile Gln Thr Lys Lys Glu Ile Phe Asn Asn
915 920 925
Tyr Tyr Glu Asp Ile Lys Asn Asn Ile Leu Thr Glu Phe Lys Asp Asp
930 935 940
Ile Asn Gly Cys Asp Val Leu Glu Lys Lys Leu Glu Lys Ile Val Ile
945 950 955 960
Phe Asp Asp Glu Thr Lys Phe Glu Ile Asp Lys Lys Ser Asn Ile Leu
965 970 975
Gln Asp Glu Gln Arg Lys Leu Ser Asn Ile Asn Lys Lys Asp Leu Lys
980 985 990
Lys Lys Val Asp Gln Tyr Ile Lys Asp Lys Asp Gln Glu Ile Lys Ser
995 1000 1005
Lys Ile Leu Cys Arg Ile Ile Phe Asn Ser Asp Phe Leu Lys Lys
1010 1015 1020
Tyr Lys Lys Glu Ile Asp Asn Leu Ile Glu Asp Met Glu Ser Glu
1025 1030 1035
Asn Glu Asn Lys Phe Gln Glu Ile Tyr Tyr Pro Lys Glu Arg Lys
1040 1045 1050
Asn Glu Leu Tyr Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly
1055 1060 1065
Asn Pro Asn Phe Asp Lys Ile Tyr Gly Leu Ile Ser Asn Asp Ile
1070 1075 1080
Lys Met Ala Asp Ala Lys Phe Leu Phe Asn Ile Asp Gly Lys Asn
1085 1090 1095
Ile Arg Lys Asn Lys Ile Ser Glu Ile Asp Ala Ile Leu Lys Asn
1100 1105 1110
Leu Asn Asp Lys Leu Asn Gly Tyr Ser Lys Glu Tyr Lys Glu Lys
1115 1120 1125
Tyr Ile Lys Lys Leu Lys Glu Asn Asp Asp Phe Phe Ala Lys Asn
1130 1135 1140
Ile Gln Asn Lys Asn Tyr Lys Ser Phe Glu Lys Asp Tyr Asn Arg
1145 1150 1155
Val Ser Glu Tyr Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr
1160 1165 1170
Leu Asn Lys Ile Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu
1175 1180 1185
Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1190 1195 1200
Asn Gly Leu Arg Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn
1205 1210 1215
Thr Gly Ile Ser Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly
1220 1225 1230
Phe Tyr Thr Thr Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser
1235 1240 1245
Tyr Lys Lys Phe Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu
1250 1255 1260
Ser Glu Asn Ser Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg
1265 1270 1275
Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp
1280 1285 1290
Tyr Ser Ile Ala Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser
1295 1300 1305
Tyr Ser Thr Arg Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu
1310 1315 1320
Val Phe Lys Lys Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys
1325 1330 1335
Lys Phe Lys Leu Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met
1340 1345 1350
Lys Pro Lys Lys Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser
1355 1360 1365
Asp Tyr Ile Lys Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu
1370 1375 1380
Asn Thr Asn Asp Thr Leu
1385
<210> 28
<211> 1050
<212> PRT
<213> Marine metagenome
<400> 28
Met Arg Ser Asn Tyr His Gly Gly Arg Asn Ala Arg Gln Trp Arg Lys
1 5 10 15
Gln Ile Ser Gly Leu Ala Arg Arg Thr Lys Glu Thr Val Phe Thr Tyr
20 25 30
Lys Phe Pro Leu Glu Thr Asp Ala Ala Glu Ile Asp Phe Asp Lys Ala
35 40 45
Val Gln Thr Tyr Gly Ile Ala Glu Gly Val Gly His Gly Ser Leu Ile
50 55 60
Gly Leu Val Cys Ala Phe His Leu Ser Gly Phe Arg Leu Phe Ser Lys
65 70 75 80
Ala Gly Glu Ala Met Ala Phe Arg Asn Arg Ser Arg Tyr Pro Thr Asp
85 90 95
Ala Phe Ala Glu Lys Leu Ser Ala Ile Met Gly Ile Gln Leu Pro Thr
100 105 110
Leu Ser Pro Glu Gly Leu Asp Leu Ile Phe Gln Ser Pro Pro Arg Ser
115 120 125
Arg Asp Gly Ile Ala Pro Val Trp Ser Glu Asn Glu Val Arg Asn Arg
130 135 140
Leu Tyr Thr Asn Trp Thr Gly Arg Gly Pro Ala Asn Lys Pro Asp Glu
145 150 155 160
His Leu Leu Glu Ile Ala Gly Glu Ile Ala Lys Gln Val Phe Pro Lys
165 170 175
Phe Gly Gly Trp Asp Asp Leu Ala Ser Asp Pro Asp Lys Ala Leu Ala
180 185 190
Ala Ala Asp Lys Tyr Phe Gln Ser Gln Gly Asp Phe Pro Ser Ile Ala
195 200 205
Ser Leu Pro Ala Ala Ile Met Leu Ser Pro Ala Asn Ser Thr Val Asp
210 215 220
Phe Glu Gly Asp Tyr Ile Ala Ile Asp Pro Ala Ala Glu Thr Leu Leu
225 230 235 240
His Gln Ala Val Ser Arg Cys Ala Ala Arg Leu Gly Arg Glu Arg Pro
245 250 255
Asp Leu Asp Gln Asn Lys Gly Pro Phe Val Ser Ser Leu Gln Asp Ala
260 265 270
Leu Val Ser Ser Gln Asn Asn Gly Leu Ser Trp Leu Phe Gly Val Gly
275 280 285
Phe Gln His Trp Lys Glu Lys Ser Pro Lys Glu Leu Ile Asp Glu Tyr
290 295 300
Lys Val Pro Ala Asp Gln His Gly Ala Val Thr Gln Val Lys Ser Phe
305 310 315 320
Val Asp Ala Ile Pro Leu Asn Pro Leu Phe Asp Thr Thr His Tyr Gly
325 330 335
Glu Phe Arg Ala Ser Val Ala Gly Lys Val Arg Ser Trp Val Ala Asn
340 345 350
Tyr Trp Lys Arg Leu Leu Asp Leu Lys Ser Leu Leu Ala Thr Thr Glu
355 360 365
Phe Thr Leu Pro Glu Ser Ile Ser Asp Pro Lys Ala Val Ser Leu Phe
370 375 380
Ser Gly Leu Leu Val Asp Pro Gln Gly Leu Lys Lys Val Ala Asp Ser
385 390 395 400
Leu Pro Ala Arg Leu Val Ser Ala Glu Glu Ala Ile Asp Arg Leu Met
405 410 415
Gly Val Gly Ile Pro Thr Ala Ala Asp Ile Ala Gln Val Glu Arg Val
420 425 430
Ala Asp Glu Ile Gly Ala Phe Ile Gly Gln Val Gln Gln Phe Asn Asn
435 440 445
Gln Val Lys Gln Lys Leu Glu Asn Leu Gln Asp Ala Asp Asp Glu Glu
450 455 460
Phe Leu Lys Gly Leu Lys Ile Glu Leu Pro Ser Gly Asp Lys Glu Pro
465 470 475 480
Pro Ala Ile Asn Arg Ile Ser Gly Gly Ala Pro Asp Ala Ala Ala Glu
485 490 495
Ile Ser Glu Leu Glu Glu Lys Leu Gln Arg Leu Leu Asp Ala Arg Ser
500 505 510
Glu His Phe Gln Thr Ile Ser Glu Trp Ala Glu Glu Asn Ala Val Thr
515 520 525
Leu Asp Pro Ile Ala Ala Met Val Glu Leu Glu Arg Leu Arg Leu Ala
530 535 540
Glu Arg Gly Ala Thr Gly Asp Pro Glu Glu Tyr Ala Leu Arg Leu Leu
545 550 555 560
Leu Gln Arg Ile Gly Arg Leu Ala Asn Arg Val Ser Pro Val Ser Ala
565 570 575
Gly Ser Ile Arg Glu Leu Leu Lys Pro Val Phe Met Glu Glu Arg Glu
580 585 590
Phe Asn Leu Phe Phe His Asn Arg Leu Gly Ser Leu Tyr Arg Ser Pro
595 600 605
Tyr Ser Thr Ser Arg His Gln Pro Phe Ser Ile Asp Val Gly Lys Ala
610 615 620
Lys Ala Ile Asp Trp Ile Ala Gly Leu Asp Gln Ile Ser Ser Asp Ile
625 630 635 640
Glu Lys Ala Leu Ser Gly Ala Gly Glu Ala Leu Gly Asp Gln Leu Arg
645 650 655
Asp Trp Ile Asn Leu Ala Gly Phe Ala Ile Ser Gln Arg Leu Arg Gly
660 665 670
Leu Pro Asp Thr Val Pro Asn Ala Leu Ala Gln Val Arg Cys Pro Asp
675 680 685
Asp Val Arg Ile Pro Pro Leu Leu Ala Met Leu Leu Glu Glu Asp Asp
690 695 700
Ile Ala Arg Asp Val Cys Leu Lys Ala Phe Asn Leu Tyr Val Ser Ala
705 710 715 720
Ile Asn Gly Cys Leu Phe Gly Ala Leu Arg Glu Gly Phe Ile Val Arg
725 730 735
Thr Arg Phe Gln Arg Ile Gly Thr Asp Gln Ile His Tyr Val Pro Lys
740 745 750
Asp Lys Ala Trp Glu Tyr Pro Asp Arg Leu Asn Thr Ala Lys Gly Pro
755 760 765
Ile Asn Ala Ala Val Ser Ser Asp Trp Ile Glu Lys Asp Gly Ala Val
770 775 780
Ile Lys Pro Val Glu Thr Val Arg Asn Leu Ser Ser Thr Gly Phe Ala
785 790 795 800
Gly Ala Gly Val Ser Glu Tyr Leu Val Gln Ala Pro His Asp Trp Tyr
805 810 815
Thr Pro Leu Asp Leu Arg Asp Val Ala His Leu Val Thr Gly Leu Pro
820 825 830
Val Glu Lys Asn Ile Thr Lys Leu Lys Arg Leu Thr Asn Arg Thr Ala
835 840 845
Phe Arg Met Val Gly Ala Ser Ser Phe Lys Thr His Leu Asp Ser Val
850 855 860
Leu Leu Ser Asp Lys Ile Lys Leu Gly Asp Phe Thr Ile Ile Ile Asp
865 870 875 880
Gln His Tyr Arg Gln Ser Val Thr Tyr Gly Gly Lys Val Lys Ile Ser
885 890 895
Tyr Glu Pro Glu Arg Leu Gln Val Glu Ala Ala Val Pro Val Val Asp
900 905 910
Thr Arg Asp Arg Thr Val Pro Glu Pro Asp Thr Leu Phe Asp His Ile
915 920 925
Val Ala Ile Asp Leu Gly Glu Arg Ser Val Gly Phe Ala Val Phe Asp
930 935 940
Ile Lys Ser Cys Leu Arg Thr Gly Glu Val Lys Pro Ile His Asp Asn
945 950 955 960
Asn Gly Asn Pro Val Val Gly Thr Val Ala Val Pro Ser Ile Arg Arg
965 970 975
Leu Met Lys Ala Val Arg Ser His Arg Arg Arg Arg Gln Pro Asn Gln
980 985 990
Lys Val Asn Gln Thr Tyr Ser Thr Ala Leu Gln Asn Tyr Arg Glu Asn
995 1000 1005
Val Ile Gly Asp Val Cys Asn Arg Ile Asp Thr Leu Met Glu Arg
1010 1015 1020
Tyr Asn Ala Phe Pro Val Leu Glu Phe Gln Ile Lys Asn Phe Gln
1025 1030 1035
Ala Gly Ala Lys Gln Leu Glu Ile Val Tyr Gly Ser
1040 1045 1050
<210> 29
<211> 345
<212> PRT
<213> Sulfolobus islandicus
<400> 29
Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln
1 5 10 15
Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu
20 25 30
Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile
35 40 45
Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys
50 55 60
Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu
65 70 75 80
Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys
85 90 95
Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe
100 105 110
Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys
115 120 125
Pro Glu Phe Tyr Glu Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr
130 135 140
Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Ile Ala Ala
145 150 155 160
Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly
165 170 175
Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr
180 185 190
Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu
195 200 205
Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr
210 215 220
Asn Pro Asn Val Ser Val Val Arg Ile Tyr Thr Ile Ser Asp Ala Val
225 230 235 240
Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr
245 250 255
Lys Leu Leu Glu Lys Arg Tyr Leu Leu Ser Glu Arg Leu Glu Ala Ile
260 265 270
Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile
275 280 285
Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu
290 295 300
Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn
305 310 315 320
Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val
325 330 335
Asn Gly Glu Leu Ile Arg Gly Glu Gly
340 345
<210> 30
<211> 345
<212> PRT
<213> Sulfolobus islandicus
<400> 30
Met Glu Val Pro Leu Tyr Asn Ile Phe Gly Asp Asn Tyr Ile Ile Gln
1 5 10 15
Val Ala Thr Glu Ala Glu Asn Ser Thr Ile Tyr Asn Asn Lys Val Glu
20 25 30
Ile Asp Asp Glu Glu Leu Arg Asn Val Leu Asn Leu Ala Tyr Lys Ile
35 40 45
Ala Lys Asn Asn Glu Asp Ala Ala Ala Glu Arg Arg Gly Lys Ala Lys
50 55 60
Lys Lys Lys Gly Glu Glu Gly Glu Thr Thr Thr Ser Asn Ile Ile Leu
65 70 75 80
Pro Leu Ser Gly Asn Asp Lys Asn Pro Trp Thr Glu Thr Leu Lys Cys
85 90 95
Tyr Asn Phe Pro Thr Thr Val Ala Leu Ser Glu Val Phe Lys Asn Phe
100 105 110
Ser Gln Val Lys Glu Cys Glu Glu Val Ser Ala Pro Ser Phe Val Lys
115 120 125
Pro Glu Phe Tyr Lys Phe Gly Arg Ser Pro Gly Met Val Glu Arg Thr
130 135 140
Arg Arg Val Lys Leu Glu Val Glu Pro His Tyr Leu Ile Met Ala Ala
145 150 155 160
Ala Gly Trp Val Leu Thr Arg Leu Gly Lys Ala Lys Val Ser Glu Gly
165 170 175
Asp Tyr Val Gly Val Asn Val Phe Thr Pro Thr Arg Gly Ile Leu Tyr
180 185 190
Ser Leu Ile Gln Asn Val Asn Gly Ile Val Pro Gly Ile Lys Pro Glu
195 200 205
Thr Ala Phe Gly Leu Trp Ile Ala Arg Lys Val Val Ser Ser Val Thr
210 215 220
Asn Pro Asn Val Ser Val Val Ser Ile Tyr Thr Ile Ser Asp Ala Val
225 230 235 240
Gly Gln Asn Pro Thr Thr Ile Asn Gly Gly Phe Ser Ile Asp Leu Thr
245 250 255
Lys Leu Leu Glu Lys Arg Asp Leu Leu Ser Glu Arg Leu Glu Ala Ile
260 265 270
Ala Arg Asn Ala Leu Ser Ile Ser Ser Asn Met Arg Glu Arg Tyr Ile
275 280 285
Val Leu Ala Asn Tyr Ile Tyr Glu Tyr Leu Thr Gly Ser Lys Arg Leu
290 295 300
Glu Asp Leu Leu Tyr Phe Ala Asn Arg Asp Leu Ile Met Asn Leu Asn
305 310 315 320
Ser Asp Asp Gly Lys Val Arg Asp Leu Lys Leu Ile Ser Ala Tyr Val
325 330 335
Asn Gly Glu Leu Ile Arg Gly Glu Gly
340 345
<210> 31
<211> 1210
<212> PRT
<213> uncultured Parcubacteria group bacterium
<400> 31
Met Ser Lys Arg His Pro Arg Ile Ser Gly Val Lys Gly Tyr Arg Leu
1 5 10 15
His Ala Gln Arg Leu Glu Tyr Thr Gly Lys Ser Gly Ala Met Arg Thr
20 25 30
Ile Lys Tyr Pro Leu Tyr Ser Ser Pro Ser Gly Gly Arg Thr Val Pro
35 40 45
Arg Glu Ile Val Ser Ala Ile Asn Asp Asp Tyr Val Gly Leu Tyr Gly
50 55 60
Leu Ser Asn Phe Asp Asp Leu Tyr Asn Ala Glu Lys Arg Asn Glu Glu
65 70 75 80
Lys Val Tyr Ser Val Leu Asp Phe Trp Tyr Asp Cys Val Gln Tyr Gly
85 90 95
Ala Val Phe Ser Tyr Thr Ala Pro Gly Leu Leu Lys Asn Val Ala Glu
100 105 110
Val Arg Gly Gly Ser Tyr Glu Leu Thr Lys Thr Leu Lys Gly Ser His
115 120 125
Leu Tyr Asp Glu Leu Gln Ile Asp Lys Val Ile Lys Phe Leu Asn Lys
130 135 140
Lys Glu Ile Ser Arg Ala Asn Gly Ser Leu Asp Lys Leu Lys Lys Asp
145 150 155 160
Ile Ile Asp Cys Phe Lys Ala Glu Tyr Arg Glu Arg His Lys Asp Gln
165 170 175
Cys Asn Lys Leu Ala Asp Asp Ile Lys Asn Ala Lys Lys Asp Ala Gly
180 185 190
Ala Ser Leu Gly Glu Arg Gln Lys Lys Leu Phe Arg Asp Phe Phe Gly
195 200 205
Ile Ser Glu Gln Ser Glu Asn Asp Lys Pro Ser Phe Thr Asn Pro Leu
210 215 220
Asn Leu Thr Cys Cys Leu Leu Pro Phe Asp Thr Val Asn Asn Asn Arg
225 230 235 240
Asn Arg Gly Glu Val Leu Phe Asn Lys Leu Lys Glu Tyr Ala Gln Lys
245 250 255
Leu Asp Lys Asn Glu Gly Ser Leu Glu Met Trp Glu Tyr Ile Gly Ile
260 265 270
Gly Asn Ser Gly Thr Ala Phe Ser Asn Phe Leu Gly Glu Gly Phe Leu
275 280 285
Gly Arg Leu Arg Glu Asn Lys Ile Thr Glu Leu Lys Lys Ala Met Met
290 295 300
Asp Ile Thr Asp Ala Trp Arg Gly Gln Glu Gln Glu Glu Glu Leu Glu
305 310 315 320
Lys Arg Leu Arg Ile Leu Ala Ala Leu Thr Ile Lys Leu Arg Glu Pro
325 330 335
Lys Phe Asp Asn His Trp Gly Gly Tyr Arg Ser Asp Ile Asn Gly Lys
340 345 350
Leu Ser Ser Trp Leu Gln Asn Tyr Ile Asn Gln Thr Val Lys Ile Lys
355 360 365
Glu Asp Leu Lys Gly His Lys Lys Asp Leu Lys Lys Ala Lys Glu Met
370 375 380
Ile Asn Arg Phe Gly Glu Ser Asp Thr Lys Glu Glu Ala Val Val Ser
385 390 395 400
Ser Leu Leu Glu Ser Ile Glu Lys Ile Val Pro Asp Asp Ser Ala Asp
405 410 415
Asp Glu Lys Pro Asp Ile Pro Ala Ile Ala Ile Tyr Arg Arg Phe Leu
420 425 430
Ser Asp Gly Arg Leu Thr Leu Asn Arg Phe Val Gln Arg Glu Asp Val
435 440 445
Gln Glu Ala Leu Ile Lys Glu Arg Leu Glu Ala Glu Lys Lys Lys Lys
450 455 460
Pro Lys Lys Arg Lys Lys Lys Ser Asp Ala Glu Asp Glu Lys Glu Thr
465 470 475 480
Ile Asp Phe Lys Glu Leu Phe Pro His Leu Ala Lys Pro Leu Lys Leu
485 490 495
Val Pro Asn Phe Tyr Gly Asp Ser Lys Arg Glu Leu Tyr Lys Lys Tyr
500 505 510
Lys Asn Ala Ala Ile Tyr Thr Asp Ala Leu Trp Lys Ala Val Glu Lys
515 520 525
Ile Tyr Lys Ser Ala Phe Ser Ser Ser Leu Lys Asn Ser Phe Phe Asp
530 535 540
Thr Asp Phe Asp Lys Asp Phe Phe Ile Lys Arg Leu Gln Lys Ile Phe
545 550 555 560
Ser Val Tyr Arg Arg Phe Asn Thr Asp Lys Trp Lys Pro Ile Val Lys
565 570 575
Asn Ser Phe Ala Pro Tyr Cys Asp Ile Val Ser Leu Ala Glu Asn Glu
580 585 590
Val Leu Tyr Lys Pro Lys Gln Ser Arg Ser Arg Lys Ser Ala Ala Ile
595 600 605
Asp Lys Asn Arg Val Arg Leu Pro Ser Thr Glu Asn Ile Ala Lys Ala
610 615 620
Gly Ile Ala Leu Ala Arg Glu Leu Ser Val Ala Gly Phe Asp Trp Lys
625 630 635 640
Asp Leu Leu Lys Lys Glu Glu His Glu Glu Tyr Ile Asp Leu Ile Glu
645 650 655
Leu His Lys Thr Ala Leu Ala Leu Leu Leu Ala Val Thr Glu Thr Gln
660 665 670
Leu Asp Ile Ser Ala Leu Asp Phe Val Glu Asn Gly Thr Val Lys Asp
675 680 685
Phe Met Lys Thr Arg Asp Gly Asn Leu Val Leu Glu Gly Arg Phe Leu
690 695 700
Glu Met Phe Ser Gln Ser Ile Val Phe Ser Glu Leu Arg Gly Leu Ala
705 710 715 720
Gly Leu Met Ser Arg Lys Glu Phe Ile Thr Arg Ser Ala Ile Gln Thr
725 730 735
Met Asn Gly Lys Gln Ala Glu Leu Leu Tyr Ile Pro His Glu Phe Gln
740 745 750
Ser Ala Lys Ile Thr Thr Pro Lys Glu Met Ser Arg Ala Phe Leu Asp
755 760 765
Leu Ala Pro Ala Glu Phe Ala Thr Ser Leu Glu Pro Glu Ser Leu Ser
770 775 780
Glu Lys Ser Leu Leu Lys Leu Lys Gln Met Arg Tyr Tyr Pro His Tyr
785 790 795 800
Phe Gly Tyr Glu Leu Thr Arg Thr Gly Gln Gly Ile Asp Gly Gly Val
805 810 815
Ala Glu Asn Ala Leu Arg Leu Glu Lys Ser Pro Val Lys Lys Arg Glu
820 825 830
Ile Lys Cys Lys Gln Tyr Lys Thr Leu Gly Arg Gly Gln Asn Lys Ile
835 840 845
Val Leu Tyr Val Arg Ser Ser Tyr Tyr Gln Thr Gln Phe Leu Glu Trp
850 855 860
Phe Leu His Arg Pro Lys Asn Val Gln Thr Asp Val Ala Val Ser Gly
865 870 875 880
Ser Phe Leu Ile Asp Glu Lys Lys Val Lys Thr Arg Trp Asn Tyr Asp
885 890 895
Ala Leu Thr Val Ala Leu Glu Pro Val Ser Gly Ser Glu Arg Val Phe
900 905 910
Val Ser Gln Pro Phe Thr Ile Phe Pro Glu Lys Ser Ala Glu Glu Glu
915 920 925
Gly Gln Arg Tyr Leu Gly Ile Asp Ile Gly Glu Tyr Gly Ile Ala Tyr
930 935 940
Thr Ala Leu Glu Ile Thr Gly Asp Ser Ala Lys Ile Leu Asp Gln Asn
945 950 955 960
Phe Ile Ser Asp Pro Gln Leu Lys Thr Leu Arg Glu Glu Val Lys Gly
965 970 975
Leu Lys Leu Asp Gln Arg Arg Gly Thr Phe Ala Met Pro Ser Thr Lys
980 985 990
Ile Ala Arg Ile Arg Glu Ser Leu Val His Ser Leu Arg Asn Arg Ile
995 1000 1005
His His Leu Ala Leu Lys His Lys Ala Lys Ile Val Tyr Glu Leu
1010 1015 1020
Glu Val Ser Arg Phe Glu Glu Gly Lys Gln Lys Ile Lys Lys Val
1025 1030 1035
Tyr Ala Thr Leu Lys Lys Ala Asp Val Tyr Ser Glu Ile Asp Ala
1040 1045 1050
Asp Lys Asn Leu Gln Thr Thr Val Trp Gly Lys Leu Ala Val Ala
1055 1060 1065
Ser Glu Ile Ser Ala Ser Tyr Thr Ser Gln Phe Cys Gly Ala Cys
1070 1075 1080
Lys Lys Leu Trp Arg Ala Glu Met Gln Val Asp Glu Thr Ile Thr
1085 1090 1095
Thr Gln Glu Leu Ile Gly Thr Val Arg Val Ile Lys Gly Gly Thr
1100 1105 1110
Leu Ile Asp Ala Ile Lys Asp Phe Met Arg Pro Pro Ile Phe Asp
1115 1120 1125
Glu Asn Asp Thr Pro Phe Pro Lys Tyr Arg Asp Phe Cys Asp Lys
1130 1135 1140
His His Ile Ser Lys Lys Met Arg Gly Asn Ser Cys Leu Phe Ile
1145 1150 1155
Cys Pro Phe Cys Arg Ala Asn Ala Asp Ala Asp Ile Gln Ala Ser
1160 1165 1170
Gln Thr Ile Ala Leu Leu Arg Tyr Val Lys Glu Glu Lys Lys Val
1175 1180 1185
Glu Asp Tyr Phe Glu Arg Phe Arg Lys Leu Lys Asn Ile Lys Val
1190 1195 1200
Leu Gly Gln Met Lys Lys Ile
1205 1210
<210> 32
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 32
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 33
<211> 1052
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 33
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 34
<211> 1052
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 34
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 35
<211> 1052
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 35
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 36
<211> 1052
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 36
Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val Gly
1 5 10 15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
20 25 30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
35 40 45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
50 55 60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65 70 75 80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
85 90 95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
100 105 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
115 120 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
130 135 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145 150 155 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
165 170 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
180 185 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
195 200 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
210 215 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225 230 235 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
245 250 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
260 265 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
275 280 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
290 295 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305 310 315 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
325 330 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
340 345 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
355 360 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
370 375 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385 390 395 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
405 410 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
420 425 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
435 440 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
450 455 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465 470 475 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
485 490 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
500 505 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
515 520 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
530 535 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545 550 555 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
565 570 575
Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
580 585 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
595 600 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
610 615 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625 630 635 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
645 650 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
660 665 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
675 680 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
690 695 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705 710 715 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
725 730 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
740 745 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
755 760 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn
770 775 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785 790 795 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
805 810 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
820 825 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
835 840 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865 870 875 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
885 890 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
915 920 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
930 935 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu
965 970 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
980 985 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
995 1000 1005
Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr
1010 1015 1020
Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr
1025 1030 1035
Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 37
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 37
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 38
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 38
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 39
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 39
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 40
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 40
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Gln Tyr Arg Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 41
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 41
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Val Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Arg Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Glu Tyr Arg Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 42
<211> 1395
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 42
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly
245 250 255
Ile Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val
260 265 270
Ile Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn
275 280 285
Glu Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg
290 295 300
Arg His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu
305 310 315 320
Leu Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg
325 330 335
Val Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala
340 345 350
Leu Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val
355 360 365
Glu Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg
370 375 380
Asn Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu
385 390 395 400
Arg Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys
405 410 415
Thr Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys
420 425 430
Ala Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu
435 440 445
Leu Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro
450 455 460
Phe Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His
465 470 475 480
Cys Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn
485 490 495
Ala Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr
500 505 510
Arg Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile
515 520 525
Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala
530 535 540
Lys Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr
545 550 555 560
Ser Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile
565 570 575
Lys Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu
580 585 590
Asp Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile
595 600 605
Gln Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile
610 615 620
Glu Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser
625 630 635 640
Leu Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp
645 650 655
Asn Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val
660 665 670
Asp Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe
675 680 685
Ile Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val
690 695 700
Ile Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile
705 710 715 720
Glu Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn
725 730 735
Glu Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile
740 745 750
Ile Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile
755 760 765
Lys Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala
770 775 780
Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp
785 790 795 800
His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys
805 810 815
Val Leu Val Lys Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro
820 825 830
Phe Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe
835 840 845
Lys Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys
850 855 860
Thr Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser
865 870 875 880
Val Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala
885 890 895
Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn
900 905 910
Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu
915 920 925
Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His
930 935 940
His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys
945 950 955 960
Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met
965 970 975
Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln
980 985 990
Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys
995 1000 1005
Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro
1010 1015 1020
Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp
1025 1030 1035
Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr
1040 1045 1050
Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro
1055 1060 1065
Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys
1070 1075 1080
Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu
1085 1090 1095
Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
1100 1105 1110
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
1115 1120 1125
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn
1130 1135 1140
Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe
1145 1150 1155
Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
1160 1165 1170
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
1175 1180 1185
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
1190 1195 1200
Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile
1205 1210 1215
Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu
1220 1225 1230
Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr
1235 1240 1245
Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr
1250 1255 1260
Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile
1265 1270 1275
Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile
1280 1285 1290
Ile Lys Lys Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1295 1300 1305
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1310 1315 1320
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1325 1330 1335
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1340 1345 1350
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1355 1360 1365
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1370 1375 1380
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1385 1390 1395
<210> 43
<211> 1395
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 43
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly
245 250 255
Ile Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val
260 265 270
Ile Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn
275 280 285
Glu Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg
290 295 300
Arg His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu
305 310 315 320
Leu Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg
325 330 335
Val Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala
340 345 350
Leu Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val
355 360 365
Glu Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg
370 375 380
Asn Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu
385 390 395 400
Arg Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys
405 410 415
Thr Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys
420 425 430
Ala Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu
435 440 445
Leu Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro
450 455 460
Phe Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His
465 470 475 480
Cys Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn
485 490 495
Ala Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr
500 505 510
Arg Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile
515 520 525
Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala
530 535 540
Lys Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr
545 550 555 560
Ser Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile
565 570 575
Lys Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu
580 585 590
Asp Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile
595 600 605
Gln Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile
610 615 620
Glu Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser
625 630 635 640
Leu Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp
645 650 655
Asn Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val
660 665 670
Asp Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe
675 680 685
Ile Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val
690 695 700
Ile Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile
705 710 715 720
Glu Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn
725 730 735
Glu Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile
740 745 750
Ile Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile
755 760 765
Lys Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala
770 775 780
Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp
785 790 795 800
His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys
805 810 815
Val Leu Val Lys Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro
820 825 830
Phe Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe
835 840 845
Lys Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys
850 855 860
Thr Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser
865 870 875 880
Val Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala
885 890 895
Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn
900 905 910
Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu
915 920 925
Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His
930 935 940
His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys
945 950 955 960
Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met
965 970 975
Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln
980 985 990
Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys
995 1000 1005
Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro
1010 1015 1020
Asn Arg Lys Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp
1025 1030 1035
Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr
1040 1045 1050
Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro
1055 1060 1065
Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys
1070 1075 1080
Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu
1085 1090 1095
Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser
1100 1105 1110
Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
1115 1120 1125
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn
1130 1135 1140
Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe
1145 1150 1155
Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
1160 1165 1170
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
1175 1180 1185
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
1190 1195 1200
Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile
1205 1210 1215
Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu
1220 1225 1230
Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr
1235 1240 1245
Leu Glu Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr
1250 1255 1260
Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile
1265 1270 1275
Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile
1280 1285 1290
Ile Lys Lys Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1295 1300 1305
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1310 1315 1320
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1325 1330 1335
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1340 1345 1350
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1355 1360 1365
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1370 1375 1380
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1385 1390 1395
<210> 44
<211> 1710
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 44
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Glu Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Gln Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 45
<211> 1710
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 45
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Gln Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 46
<211> 1710
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 46
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Val Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Arg Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Glu Tyr Arg Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 47
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 47
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Ala
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 48
<211> 1612
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 48
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Ala Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Ala Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Ala Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Ala Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp
1610
<210> 49
<211> 198
<212> PRT
<213> Homo sapiens
<400> 49
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 50
<211> 181
<212> PRT
<213> Homo sapiens
<400> 50
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu
180
<210> 51
<211> 198
<212> PRT
<213> Mus musculus
<400> 51
Met Asp Ser Leu Leu Met Lys Gln Lys Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Cys Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Glu
85 90 95
Phe Leu Arg Trp Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Gly Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Thr Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Met Leu Gly Phe
195
<210> 52
<211> 198
<212> PRT
<213> Canis lupus familiaris
<400> 52
Met Asp Ser Leu Leu Met Lys Gln Arg Lys Phe Leu Tyr His Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Ala Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn Arg Glu Lys Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 53
<211> 199
<212> PRT
<213> Bos taurus
<400> 53
Met Asp Ser Leu Leu Lys Lys Gln Arg Gln Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Pro Thr Ser Phe Ser Leu Asp Phe Gly His
35 40 45
Leu Arg Asn Lys Ala Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Tyr Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Asp Lys Glu Arg Lys Ala Glu Pro Glu Gly Leu Arg
115 120 125
Arg Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp
130 135 140
Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe
145 150 155 160
Lys Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln
165 170 175
Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp
180 185 190
Ala Phe Arg Thr Leu Gly Leu
195
<210> 54
<211> 239
<212> PRT
<213> Rattus norvegicus
<400> 54
Met Ala Val Gly Ser Lys Pro Lys Ala Ala Leu Val Gly Pro His Trp
1 5 10 15
Glu Arg Glu Arg Ile Trp Cys Phe Leu Cys Ser Thr Gly Leu Gly Thr
20 25 30
Gln Gln Thr Gly Gln Thr Ser Arg Trp Leu Arg Pro Ala Ala Thr Gln
35 40 45
Asp Pro Val Ser Pro Pro Arg Ser Leu Leu Met Lys Gln Arg Lys Phe
50 55 60
Leu Tyr His Phe Lys Asn Val Arg Trp Ala Lys Gly Arg His Glu Thr
65 70 75 80
Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser
85 90 95
Leu Asp Phe Gly Tyr Leu Arg Asn Lys Ser Gly Cys His Val Glu Leu
100 105 110
Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys
115 120 125
Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala
130 135 140
Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg
145 150 155 160
Ile Phe Thr Ala Arg Leu Thr Gly Trp Gly Ala Leu Pro Ala Gly Leu
165 170 175
Met Ser Pro Ala Arg Pro Ser Asp Tyr Phe Tyr Cys Trp Asn Thr Phe
180 185 190
Val Glu Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu
195 200 205
Asn Ser Val Arg Leu Ser Arg Arg Leu Arg Arg Ile Leu Leu Pro Leu
210 215 220
Tyr Glu Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu
225 230 235
<210> 55
<211> 429
<212> PRT
<213> Mus musculus
<400> 55
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Gly Tyr Ala Lys Gly Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Ile
100 105 110
Val Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Val Gln Asp Pro Glu Thr Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Arg Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Gly Arg Arg Met Asp Pro Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Arg Met Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Thr Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 56
<211> 429
<212> PRT
<213> Rattus norvegicus
<400> 56
Met Gly Pro Phe Cys Leu Gly Cys Ser His Arg Lys Cys Tyr Ser Pro
1 5 10 15
Ile Arg Asn Leu Ile Ser Gln Glu Thr Phe Lys Phe His Phe Lys Asn
20 25 30
Leu Arg Tyr Ala Ile Asp Arg Lys Asp Thr Phe Leu Cys Tyr Glu Val
35 40 45
Thr Arg Lys Asp Cys Asp Ser Pro Val Ser Leu His His Gly Val Phe
50 55 60
Lys Asn Lys Asp Asn Ile His Ala Glu Ile Cys Phe Leu Tyr Trp Phe
65 70 75 80
His Asp Lys Val Leu Lys Val Leu Ser Pro Arg Glu Glu Phe Lys Ile
85 90 95
Thr Trp Tyr Met Ser Trp Ser Pro Cys Phe Glu Cys Ala Glu Gln Val
100 105 110
Leu Arg Phe Leu Ala Thr His His Asn Leu Ser Leu Asp Ile Phe Ser
115 120 125
Ser Arg Leu Tyr Asn Ile Arg Asp Pro Glu Asn Gln Gln Asn Leu Cys
130 135 140
Arg Leu Val Gln Glu Gly Ala Gln Val Ala Ala Met Asp Leu Tyr Glu
145 150 155 160
Phe Lys Lys Cys Trp Lys Lys Phe Val Asp Asn Gly Gly Arg Arg Phe
165 170 175
Arg Pro Trp Lys Lys Leu Leu Thr Asn Phe Arg Tyr Gln Asp Ser Lys
180 185 190
Leu Gln Glu Ile Leu Arg Pro Cys Tyr Ile Pro Val Pro Ser Ser Ser
195 200 205
Ser Ser Thr Leu Ser Asn Ile Cys Leu Thr Lys Gly Leu Pro Glu Thr
210 215 220
Arg Phe Cys Val Glu Arg Arg Arg Val His Leu Leu Ser Glu Glu Glu
225 230 235 240
Phe Tyr Ser Gln Phe Tyr Asn Gln Arg Val Lys His Leu Cys Tyr Tyr
245 250 255
His Gly Val Lys Pro Tyr Leu Cys Tyr Gln Leu Glu Gln Phe Asn Gly
260 265 270
Gln Ala Pro Leu Lys Gly Cys Leu Leu Ser Glu Lys Gly Lys Gln His
275 280 285
Ala Glu Ile Leu Phe Leu Asp Lys Ile Arg Ser Met Glu Leu Ser Gln
290 295 300
Val Ile Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
305 310 315 320
Trp Gln Leu Ala Ala Phe Lys Arg Asp Arg Pro Asp Leu Ile Leu His
325 330 335
Ile Tyr Thr Ser Arg Leu Tyr Phe His Trp Lys Arg Pro Phe Gln Lys
340 345 350
Gly Leu Cys Ser Leu Trp Gln Ser Gly Ile Leu Val Asp Val Met Asp
355 360 365
Leu Pro Gln Phe Thr Asp Cys Trp Thr Asn Phe Val Asn Pro Lys Arg
370 375 380
Pro Phe Trp Pro Trp Lys Gly Leu Glu Ile Ile Ser Arg Arg Thr Gln
385 390 395 400
Arg Arg Leu His Arg Ile Lys Glu Ser Trp Gly Leu Gln Asp Leu Val
405 410 415
Asn Asp Phe Gly Asn Leu Gln Leu Gly Pro Pro Met Ser
420 425
<210> 57
<211> 370
<212> PRT
<213> Macaca mulatta
<400> 57
Met Val Glu Pro Met Asp Pro Arg Thr Phe Val Ser Asn Phe Asn Asn
1 5 10 15
Arg Pro Ile Leu Ser Gly Leu Asn Thr Val Trp Leu Cys Cys Glu Val
20 25 30
Lys Thr Lys Asp Pro Ser Gly Pro Pro Leu Asp Ala Lys Ile Phe Gln
35 40 45
Gly Lys Val Tyr Ser Lys Ala Lys Tyr His Pro Glu Met Arg Phe Leu
50 55 60
Arg Trp Phe His Lys Trp Arg Gln Leu His His Asp Gln Glu Tyr Lys
65 70 75 80
Val Thr Trp Tyr Val Ser Trp Ser Pro Cys Thr Arg Cys Ala Asn Ser
85 90 95
Val Ala Thr Phe Leu Ala Lys Asp Pro Lys Val Thr Leu Thr Ile Phe
100 105 110
Val Ala Arg Leu Tyr Tyr Phe Trp Lys Pro Asp Tyr Gln Gln Ala Leu
115 120 125
Arg Ile Leu Cys Gln Lys Arg Gly Gly Pro His Ala Thr Met Lys Ile
130 135 140
Met Asn Tyr Asn Glu Phe Gln Asp Cys Trp Asn Lys Phe Val Asp Gly
145 150 155 160
Arg Gly Lys Pro Phe Lys Pro Arg Asn Asn Leu Pro Lys His Tyr Thr
165 170 175
Leu Leu Gln Ala Thr Leu Gly Glu Leu Leu Arg His Leu Met Asp Pro
180 185 190
Gly Thr Phe Thr Ser Asn Phe Asn Asn Lys Pro Trp Val Ser Gly Gln
195 200 205
His Glu Thr Tyr Leu Cys Tyr Lys Val Glu Arg Leu His Asn Asp Thr
210 215 220
Trp Val Pro Leu Asn Gln His Arg Gly Phe Leu Arg Asn Gln Ala Pro
225 230 235 240
Asn Ile His Gly Phe Pro Lys Gly Arg His Ala Glu Leu Cys Phe Leu
245 250 255
Asp Leu Ile Pro Phe Trp Lys Leu Asp Gly Gln Gln Tyr Arg Val Thr
260 265 270
Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala
275 280 285
Lys Phe Ile Ser Asn Asn Glu His Val Ser Leu Cys Ile Phe Ala Ala
290 295 300
Arg Ile Tyr Asp Asp Gln Gly Arg Tyr Gln Glu Gly Leu Arg Ala Leu
305 310 315 320
His Arg Asp Gly Ala Lys Ile Ala Met Met Asn Tyr Ser Glu Phe Glu
325 330 335
Tyr Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe Gln Pro
340 345 350
Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg
355 360 365
Ala Ile
370
<210> 58
<211> 384
<212> PRT
<213> Pan troglodytes
<400> 58
Met Lys Pro His Phe Arg Asn Pro Val Glu Arg Met Tyr Gln Asp Thr
1 5 10 15
Phe Ser Asp Asn Phe Tyr Asn Arg Pro Ile Leu Ser His Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Lys Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Glu Leu Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Leu His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu His Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Asn Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Lys Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser
355 360 365
Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 59
<211> 377
<212> PRT
<213> Chlorocebus sabaeus
<400> 59
Met Asn Pro Gln Ile Arg Asn Met Val Glu Gln Met Glu Pro Asp Ile
1 5 10 15
Phe Val Tyr Tyr Phe Asn Asn Arg Pro Ile Leu Ser Gly Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Asp Pro Ser Gly Pro Pro
35 40 45
Leu Asp Ala Asn Ile Phe Gln Gly Lys Leu Tyr Pro Glu Ala Lys Asp
50 55 60
His Pro Glu Met Lys Phe Leu His Trp Phe Arg Lys Trp Arg Gln Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Val Ser Trp Ser Pro
85 90 95
Cys Thr Arg Cys Ala Asn Ser Val Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Lys
115 120 125
Pro Asp Tyr Gln Gln Ala Leu Arg Ile Leu Cys Gln Glu Arg Gly Gly
130 135 140
Pro His Ala Thr Met Lys Ile Met Asn Tyr Asn Glu Phe Gln His Cys
145 150 155 160
Trp Asn Glu Phe Val Asp Gly Gln Gly Lys Pro Phe Lys Pro Arg Lys
165 170 175
Asn Leu Pro Lys His Tyr Thr Leu Leu His Ala Thr Leu Gly Glu Leu
180 185 190
Leu Arg His Val Met Asp Pro Gly Thr Phe Thr Ser Asn Phe Asn Asn
195 200 205
Lys Pro Trp Val Ser Gly Gln Arg Glu Thr Tyr Leu Cys Tyr Lys Val
210 215 220
Glu Arg Ser His Asn Asp Thr Trp Val Leu Leu Asn Gln His Arg Gly
225 230 235 240
Phe Leu Arg Asn Gln Ala Pro Asp Arg His Gly Phe Pro Lys Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Leu Ile Pro Phe Trp Lys Leu Asp
260 265 270
Asp Gln Gln Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe
275 280 285
Ser Cys Ala Gln Lys Met Ala Lys Phe Ile Ser Asn Asn Lys His Val
290 295 300
Ser Leu Cys Ile Phe Ala Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys
305 310 315 320
Gln Glu Gly Leu Arg Thr Leu His Arg Asp Gly Ala Lys Ile Ala Val
325 330 335
Met Asn Tyr Ser Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Asp Arg
340 345 350
Gln Gly Arg Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln
355 360 365
Ala Leu Ser Gly Arg Leu Arg Ala Ile
370 375
<210> 60
<211> 384
<212> PRT
<213> Homo sapiens
<400> 60
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 61
<211> 373
<212> PRT
<213> Homo sapiens
<400> 61
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Arg
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Gln Pro Glu His
50 55 60
His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu Pro
65 70 75 80
Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro Cys
85 90 95
Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ala Glu His Pro Asn
100 105 110
Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu Arg
115 120 125
Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg Val
130 135 140
Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe Val
145 150 155 160
Tyr Ser Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn
165 170 175
Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met
180 185 190
Glu Ala Met Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Arg
195 200 205
Lys Ala Tyr Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val
210 215 220
Val Lys His His Ser Pro Val Ser Trp Lys Arg Gly Val Phe Arg Asn
225 230 235 240
Gln Val Asp Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser
245 250 255
Trp Phe Cys Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr
260 265 270
Trp Tyr Thr Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala
275 280 285
Glu Phe Leu Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala
290 295 300
Arg Leu Tyr Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Arg Ser
305 310 315 320
Leu Ser Gln Glu Gly Ala Ser Val Glu Ile Met Gly Tyr Lys Asp Phe
325 330 335
Lys Tyr Cys Trp Glu Asn Phe Val Tyr Asn Asp Asp Glu Pro Phe Lys
340 345 350
Pro Trp Lys Gly Leu Lys Tyr Asn Phe Leu Phe Leu Asp Ser Lys Leu
355 360 365
Gln Glu Ile Leu Glu
370
<210> 62
<211> 382
<212> PRT
<213> Homo sapiens
<400> 62
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Val Tyr Phe Lys Pro Gln
50 55 60
Tyr His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Pro Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Glu Phe Leu Ser Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Thr Ile Met Asp Tyr Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Gln Phe Met Pro Trp Tyr Lys Phe Asp Glu
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Leu Arg Tyr Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg Arg Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
370 375 380
<210> 63
<211> 396
<212> PRT
<213> Rattus norvegicus
<400> 63
Met Gln Pro Gln Gly Leu Gly Pro Asn Ala Gly Met Gly Pro Val Cys
1 5 10 15
Leu Gly Cys Ser His Arg Arg Pro Tyr Ser Pro Ile Arg Asn Pro Leu
20 25 30
Lys Lys Leu Tyr Gln Gln Thr Phe Tyr Phe His Phe Lys Asn Val Arg
35 40 45
Tyr Ala Trp Gly Arg Lys Asn Asn Phe Leu Cys Tyr Glu Val Asn Gly
50 55 60
Met Asp Cys Ala Leu Pro Val Pro Leu Arg Gln Gly Val Phe Arg Lys
65 70 75 80
Gln Gly His Ile His Ala Glu Leu Cys Phe Ile Tyr Trp Phe His Asp
85 90 95
Lys Val Leu Arg Val Leu Ser Pro Met Glu Glu Phe Lys Val Thr Trp
100 105 110
Tyr Met Ser Trp Ser Pro Cys Ser Lys Cys Ala Glu Gln Val Ala Arg
115 120 125
Phe Leu Ala Ala His Arg Asn Leu Ser Leu Ala Ile Phe Ser Ser Arg
130 135 140
Leu Tyr Tyr Tyr Leu Arg Asn Pro Asn Tyr Gln Gln Lys Leu Cys Arg
145 150 155 160
Leu Ile Gln Glu Gly Val His Val Ala Ala Met Asp Leu Pro Glu Phe
165 170 175
Lys Lys Cys Trp Asn Lys Phe Val Asp Asn Asp Gly Gln Pro Phe Arg
180 185 190
Pro Trp Met Arg Leu Arg Ile Asn Phe Ser Phe Tyr Asp Cys Lys Leu
195 200 205
Gln Glu Ile Phe Ser Arg Met Asn Leu Leu Arg Glu Asp Val Phe Tyr
210 215 220
Leu Gln Phe Asn Asn Ser His Arg Val Lys Pro Val Gln Asn Arg Tyr
225 230 235 240
Tyr Arg Arg Lys Ser Tyr Leu Cys Tyr Gln Leu Glu Arg Ala Asn Gly
245 250 255
Gln Glu Pro Leu Lys Gly Tyr Leu Leu Tyr Lys Lys Gly Glu Gln His
260 265 270
Val Glu Ile Leu Phe Leu Glu Lys Met Arg Ser Met Glu Leu Ser Gln
275 280 285
Val Arg Ile Thr Cys Tyr Leu Thr Trp Ser Pro Cys Pro Asn Cys Ala
290 295 300
Arg Gln Leu Ala Ala Phe Lys Lys Asp His Pro Asp Leu Ile Leu Arg
305 310 315 320
Ile Tyr Thr Ser Arg Leu Tyr Phe Tyr Trp Arg Lys Lys Phe Gln Lys
325 330 335
Gly Leu Cys Thr Leu Trp Arg Ser Gly Ile His Val Asp Val Met Asp
340 345 350
Leu Pro Gln Phe Ala Asp Cys Trp Thr Asn Phe Val Asn Pro Gln Arg
355 360 365
Pro Phe Arg Pro Trp Asn Glu Leu Glu Lys Asn Ser Trp Arg Ile Gln
370 375 380
Arg Arg Leu Arg Arg Ile Lys Glu Ser Trp Gly Leu
385 390 395
<210> 64
<211> 227
<212> PRT
<213> Bos taurus
<400> 64
Asp Gly Trp Glu Val Ala Phe Arg Ser Gly Thr Val Leu Lys Ala Gly
1 5 10 15
Val Leu Gly Val Ser Met Thr Glu Gly Trp Ala Gly Ser Gly His Pro
20 25 30
Gly Gln Gly Ala Cys Val Trp Thr Pro Gly Thr Arg Asn Thr Met Asn
35 40 45
Leu Leu Arg Glu Val Leu Phe Lys Gln Gln Phe Gly Asn Gln Pro Arg
50 55 60
Val Pro Ala Pro Tyr Tyr Arg Arg Lys Thr Tyr Leu Cys Tyr Gln Leu
65 70 75 80
Lys Gln Arg Asn Asp Leu Thr Leu Asp Arg Gly Cys Phe Arg Asn Lys
85 90 95
Lys Gln Arg His Ala Glu Ile Arg Phe Ile Asp Lys Ile Asn Ser Leu
100 105 110
Asp Leu Asn Pro Ser Gln Ser Tyr Lys Ile Ile Cys Tyr Ile Thr Trp
115 120 125
Ser Pro Cys Pro Asn Cys Ala Asn Glu Leu Val Asn Phe Ile Thr Arg
130 135 140
Asn Asn His Leu Lys Leu Glu Ile Phe Ala Ser Arg Leu Tyr Phe His
145 150 155 160
Trp Ile Lys Ser Phe Lys Met Gly Leu Gln Asp Leu Gln Asn Ala Gly
165 170 175
Ile Ser Val Ala Val Met Thr His Thr Glu Phe Glu Asp Cys Trp Glu
180 185 190
Gln Phe Val Asp Asn Gln Ser Arg Pro Phe Gln Pro Trp Asp Lys Leu
195 200 205
Glu Gln Tyr Ser Ala Ser Ile Arg Arg Arg Leu Gln Arg Ile Leu Thr
210 215 220
Ala Pro Ile
225
<210> 65
<211> 490
<212> PRT
<213> Pan troglodytes
<400> 65
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Trp Met Tyr Gln Arg Thr
1 5 10 15
Phe Tyr Tyr Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Arg Arg Gly His Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Gln Met Tyr Ser Gln Pro Glu
50 55 60
His His Ala Glu Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Gln Leu
65 70 75 80
Ser Ala Tyr Lys Cys Phe Gln Ile Thr Trp Phe Val Ser Trp Thr Pro
85 90 95
Cys Pro Asp Cys Val Ala Lys Leu Ala Lys Phe Leu Ala Glu His Pro
100 105 110
Asn Val Thr Leu Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Trp Glu
115 120 125
Arg Asp Tyr Arg Arg Ala Leu Cys Arg Leu Ser Gln Ala Gly Ala Arg
130 135 140
Val Lys Ile Met Asp Asp Glu Glu Phe Ala Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Glu Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp
165 170 175
Asn Tyr Ala Phe Leu His Arg Thr Leu Lys Glu Ile Ile Arg His Leu
180 185 190
Met Asp Pro Asp Thr Phe Thr Phe Asn Phe Asn Asn Asp Pro Leu Val
195 200 205
Leu Arg Arg His Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp
210 215 220
Asn Gly Thr Trp Val Leu Met Asp Gln His Met Gly Phe Leu Cys Asn
225 230 235 240
Glu Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu
245 250 255
Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile
260 265 270
Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly
275 280 285
Cys Ala Gly Gln Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg
290 295 300
Leu Arg Ile Phe Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys
305 310 315 320
Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met
325 330 335
Thr Tyr Asp Glu Phe Glu Tyr Cys Trp Asp Thr Phe Val Tyr Arg Gln
340 345 350
Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Glu Glu His Ser Gln Ala
355 360 365
Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Val Arg Ala Ser Ser Leu
370 375 380
Cys Met Val Pro His Arg Pro Pro Pro Pro Pro Gln Ser Pro Gly Pro
385 390 395 400
Cys Leu Pro Leu Cys Ser Glu Pro Pro Leu Gly Ser Leu Leu Pro Thr
405 410 415
Gly Arg Pro Ala Pro Ser Leu Pro Phe Leu Leu Thr Ala Ser Phe Ser
420 425 430
Phe Pro Pro Pro Ala Ser Leu Pro Pro Leu Pro Ser Leu Ser Leu Ser
435 440 445
Pro Gly His Leu Pro Val Pro Ser Phe His Ser Leu Thr Ser Cys Ser
450 455 460
Ile Gln Pro Pro Cys Ser Ser Arg Ile Arg Glu Thr Glu Gly Trp Ala
465 470 475 480
Ser Val Ser Lys Glu Gly Arg Asp Leu Gly
485 490
<210> 66
<211> 190
<212> PRT
<213> Homo sapiens
<400> 66
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Lys Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Asp Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Tyr
115 120 125
Pro Cys Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Glu Ile Met Asp Tyr Glu Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asn Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Thr
165 170 175
Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ser Leu Gln
180 185 190
<210> 67
<211> 190
<212> PRT
<213> Gorilla gorilla
<400> 67
Met Asn Pro Gln Ile Arg Asn Pro Met Lys Ala Met Tyr Pro Gly Thr
1 5 10 15
Phe Tyr Phe Gln Phe Lys Asn Leu Trp Glu Ala Asn Asp Arg Asn Glu
20 25 30
Thr Trp Leu Cys Phe Thr Val Glu Gly Ile Lys Arg Arg Ser Val Val
35 40 45
Ser Trp Lys Thr Gly Val Phe Arg Asn Gln Val Asp Ser Glu Thr His
50 55 60
Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys Asp Asp Ile Leu
65 70 75 80
Ser Pro Asn Thr Asn Tyr Gln Val Thr Trp Tyr Thr Ser Trp Ser Pro
85 90 95
Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu Ala Arg His Ser
100 105 110
Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Tyr Tyr Phe Gln Asp
115 120 125
Thr Asp Tyr Gln Glu Gly Leu Arg Ser Leu Ser Gln Glu Gly Val Ala
130 135 140
Val Lys Ile Met Asp Tyr Lys Asp Phe Lys Tyr Cys Trp Glu Asn Phe
145 150 155 160
Val Tyr Asn Asp Asp Glu Pro Phe Lys Pro Trp Lys Gly Leu Lys Tyr
165 170 175
Asn Phe Arg Phe Leu Lys Arg Arg Leu Gln Glu Ile Leu Glu
180 185 190
<210> 68
<211> 199
<212> PRT
<213> Homo sapiens
<400> 68
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn
195
<210> 69
<211> 202
<212> PRT
<213> Macaca mulatta
<400> 69
Met Asp Gly Ser Pro Ala Ser Arg Pro Arg His Leu Met Asp Pro Asn
1 5 10 15
Thr Phe Thr Phe Asn Phe Asn Asn Asp Leu Ser Val Arg Gly Arg His
20 25 30
Gln Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Trp
35 40 45
Val Pro Met Asp Glu Arg Arg Gly Phe Leu Cys Asn Lys Ala Lys Asn
50 55 60
Val Pro Cys Gly Asp Tyr Gly Cys His Val Glu Leu Arg Phe Leu Cys
65 70 75 80
Glu Val Pro Ser Trp Gln Leu Asp Pro Ala Gln Thr Tyr Arg Val Thr
85 90 95
Trp Phe Ile Ser Trp Ser Pro Cys Phe Arg Arg Gly Cys Ala Gly Gln
100 105 110
Val Arg Val Phe Leu Gln Glu Asn Lys His Val Arg Leu Arg Ile Phe
115 120 125
Ala Ala Arg Ile Tyr Asp Tyr Asp Pro Leu Tyr Gln Glu Ala Leu Arg
130 135 140
Thr Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Glu Glu
145 150 155 160
Phe Lys His Cys Trp Asp Thr Phe Val Asp Arg Gln Gly Arg Pro Phe
165 170 175
Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg
180 185 190
Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn
195 200
<210> 70
<211> 185
<212> PRT
<213> Bos taurus
<400> 70
Met Asp Glu Tyr Thr Phe Thr Glu Asn Phe Asn Asn Gln Gly Trp Pro
1 5 10 15
Ser Lys Thr Tyr Leu Cys Tyr Glu Met Glu Arg Leu Asp Gly Asp Ala
20 25 30
Thr Ile Pro Leu Asp Glu Tyr Lys Gly Phe Val Arg Asn Lys Gly Leu
35 40 45
Asp Gln Pro Glu Lys Pro Cys His Ala Glu Leu Tyr Phe Leu Gly Lys
50 55 60
Ile His Ser Trp Asn Leu Asp Arg Asn Gln His Tyr Arg Leu Thr Cys
65 70 75 80
Phe Ile Ser Trp Ser Pro Cys Tyr Asp Cys Ala Gln Lys Leu Thr Thr
85 90 95
Phe Leu Lys Glu Asn His His Ile Ser Leu His Ile Leu Ala Ser Arg
100 105 110
Ile Tyr Thr His Asn Arg Phe Gly Cys His Gln Ser Gly Leu Cys Glu
115 120 125
Leu Gln Ala Ala Gly Ala Arg Ile Thr Ile Met Thr Phe Glu Asp Phe
130 135 140
Lys His Cys Trp Glu Thr Phe Val Asp His Lys Gly Lys Pro Phe Gln
145 150 155 160
Pro Trp Glu Gly Leu Asn Val Lys Ser Gln Ala Leu Cys Thr Glu Leu
165 170 175
Gln Ala Ile Leu Lys Thr Gln Gln Asn
180 185
<210> 71
<211> 200
<212> PRT
<213> Homo sapiens
<400> 71
Met Ala Leu Leu Thr Ala Glu Thr Phe Arg Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Leu Arg Arg Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly Tyr Phe Glu
35 40 45
Asn Lys Lys Lys Cys His Ala Glu Ile Cys Phe Ile Asn Glu Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Ser Ser Cys Ala Trp Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Asp His Leu Asn Leu Gly Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Cys Lys Pro Gln Gln Lys Gly Leu Arg Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Phe Pro Lys Phe Ala Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Glu Lys Pro Leu Ser Phe Asn Pro Tyr
145 150 155 160
Lys Met Leu Glu Glu Leu Asp Lys Asn Ser Arg Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ile Pro Gly Val Arg Ala Gln Gly Arg Tyr Met
180 185 190
Asp Ile Leu Cys Asp Ala Glu Val
195 200
<210> 72
<211> 210
<212> PRT
<213> Macaca mulatta
<400> 72
Met Ala Leu Leu Thr Ala Lys Thr Phe Ser Leu Gln Phe Asn Asn Lys
1 5 10 15
Arg Arg Val Asn Lys Pro Tyr Tyr Pro Arg Lys Ala Leu Leu Cys Tyr
20 25 30
Gln Leu Thr Pro Gln Asn Gly Ser Thr Pro Thr Arg Gly His Leu Lys
35 40 45
Asn Lys Lys Lys Asp His Ala Glu Ile Arg Phe Ile Asn Lys Ile Lys
50 55 60
Ser Met Gly Leu Asp Glu Thr Gln Cys Tyr Gln Val Thr Cys Tyr Leu
65 70 75 80
Thr Trp Ser Pro Cys Pro Ser Cys Ala Gly Glu Leu Val Asp Phe Ile
85 90 95
Lys Ala His Arg His Leu Asn Leu Arg Ile Phe Ala Ser Arg Leu Tyr
100 105 110
Tyr His Trp Arg Pro Asn Tyr Gln Glu Gly Leu Leu Leu Leu Cys Gly
115 120 125
Ser Gln Val Pro Val Glu Val Met Gly Leu Pro Glu Phe Thr Asp Cys
130 135 140
Trp Glu Asn Phe Val Asp His Lys Glu Pro Pro Ser Phe Asn Pro Ser
145 150 155 160
Glu Lys Leu Glu Glu Leu Asp Lys Asn Ser Gln Ala Ile Lys Arg Arg
165 170 175
Leu Glu Arg Ile Lys Ser Arg Ser Val Asp Val Leu Glu Asn Gly Leu
180 185 190
Arg Ser Leu Gln Leu Gly Pro Val Thr Pro Ser Ser Ser Ile Arg Asn
195 200 205
Ser Arg
210
<210> 73
<211> 386
<212> PRT
<213> Homo sapiens
<400> 73
Met Asn Pro Gln Ile Arg Asn Pro Met Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Tyr Asp Asn Phe Glu Asn Glu Pro Ile Leu Tyr Gly Arg Ser Tyr
20 25 30
Thr Trp Leu Cys Tyr Glu Val Lys Ile Lys Arg Gly Arg Ser Asn Leu
35 40 45
Leu Trp Asp Thr Gly Val Phe Arg Gly Pro Val Leu Pro Lys Arg Gln
50 55 60
Ser Asn His Arg Gln Glu Val Tyr Phe Arg Phe Glu Asn His Ala Glu
65 70 75 80
Met Cys Phe Leu Ser Trp Phe Cys Gly Asn Arg Leu Pro Ala Asn Arg
85 90 95
Arg Phe Gln Ile Thr Trp Phe Val Ser Trp Asn Pro Cys Leu Pro Cys
100 105 110
Val Val Lys Val Thr Lys Phe Leu Ala Glu His Pro Asn Val Thr Leu
115 120 125
Thr Ile Ser Ala Ala Arg Leu Tyr Tyr Tyr Arg Asp Arg Asp Trp Arg
130 135 140
Trp Val Leu Leu Arg Leu His Lys Ala Gly Ala Arg Val Lys Ile Met
145 150 155 160
Asp Tyr Glu Asp Phe Ala Tyr Cys Trp Glu Asn Phe Val Cys Asn Glu
165 170 175
Gly Gln Pro Phe Met Pro Trp Tyr Lys Phe Asp Asp Asn Tyr Ala Ser
180 185 190
Leu His Arg Thr Leu Lys Glu Ile Leu Arg Asn Pro Met Glu Ala Met
195 200 205
Tyr Pro His Ile Phe Tyr Phe His Phe Lys Asn Leu Leu Lys Ala Cys
210 215 220
Gly Arg Asn Glu Ser Trp Leu Cys Phe Thr Met Glu Val Thr Lys His
225 230 235 240
His Ser Ala Val Phe Arg Lys Arg Gly Val Phe Arg Asn Gln Val Asp
245 250 255
Pro Glu Thr His Cys His Ala Glu Arg Cys Phe Leu Ser Trp Phe Cys
260 265 270
Asp Asp Ile Leu Ser Pro Asn Thr Asn Tyr Glu Val Thr Trp Tyr Thr
275 280 285
Ser Trp Ser Pro Cys Pro Glu Cys Ala Gly Glu Val Ala Glu Phe Leu
290 295 300
Ala Arg His Ser Asn Val Asn Leu Thr Ile Phe Thr Ala Arg Leu Cys
305 310 315 320
Tyr Phe Trp Asp Thr Asp Tyr Gln Glu Gly Leu Cys Ser Leu Ser Gln
325 330 335
Glu Gly Ala Ser Val Lys Ile Met Gly Tyr Lys Asp Phe Val Ser Cys
340 345 350
Trp Lys Asn Phe Val Tyr Ser Asp Asp Glu Pro Phe Lys Pro Trp Lys
355 360 365
Gly Leu Gln Thr Asn Phe Arg Leu Leu Lys Arg Arg Leu Arg Glu Ile
370 375 380
Leu Gln
385
<210> 74
<211> 236
<212> PRT
<213> Homo sapiens
<400> 74
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg
225 230 235
<210> 75
<211> 229
<212> PRT
<213> Mus musculus
<400> 75
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Val Trp Arg His Thr Ser Gln Asn Thr Ser Asn His Val Glu Val
50 55 60
Asn Phe Leu Glu Lys Phe Thr Thr Glu Arg Tyr Phe Arg Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg His Pro Tyr Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Thr Asp Gln Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Tyr Cys Tyr Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Ser Asn Glu Ala Tyr Trp Pro Arg Tyr Pro His Leu Trp Val Lys
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Lys Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Thr Leu Gln Thr Cys His Tyr Gln Arg Ile Pro Pro His Leu Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 76
<211> 229
<212> PRT
<213> Rattus norvegicus
<400> 76
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys
225
<210> 77
<211> 60
<212> PRT
<213> Homo sapiens
<400> 77
Met Ala Gln Lys Glu Glu Ala Ala Val Ala Thr Glu Ala Ala Ser Gln
1 5 10 15
Asn Gly Glu Asp Leu Glu Asn Leu Asp Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu
50 55 60
<210> 78
<211> 164
<212> PRT
<213> Mus musculus
<400> 78
Tyr Ser Ser Gly Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala
1 5 10 15
Gln Gly Lys Gly Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp
20 25 30
Glu His Ala Ala Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu
35 40 45
Pro Ala Phe Asp Pro Ala Leu Arg Tyr Asn Val Thr Trp Tyr Val Ser
50 55 60
Ser Ser Pro Cys Ala Ala Cys Ala Asp Arg Ile Ile Lys Thr Leu Ser
65 70 75 80
Lys Thr Lys Asn Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met
85 90 95
Trp Glu Glu Pro Glu Ile Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala
100 105 110
Gly Cys Lys Leu Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Val Trp
115 120 125
Gln Asn Phe Val Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Gln Pro
130 135 140
Trp Glu Asp Ile Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala
145 150 155 160
Asp Ile Leu Lys
<210> 79
<211> 224
<212> PRT
<213> Rattus norvegicus
<400> 79
Met Ala Gln Lys Glu Glu Ala Ala Glu Ala Ala Ala Pro Ala Ser Gln
1 5 10 15
Asn Gly Asp Asp Leu Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Asp Leu Pro Pro Phe Glu Ile Val Thr Gly Val Arg Leu Pro
35 40 45
Val Asn Phe Phe Lys Phe Gln Phe Arg Asn Val Glu Tyr Ser Ser Gly
50 55 60
Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala Gln Ser Lys Gly
65 70 75 80
Gly Gln Val Gln Ala Thr Gln Gly Tyr Leu Glu Asp Glu His Ala Gly
85 90 95
Ala His Ala Glu Glu Ala Phe Phe Asn Thr Ile Leu Pro Ala Phe Asp
100 105 110
Pro Ala Leu Lys Tyr Asn Val Thr Trp Tyr Val Ser Ser Ser Pro Cys
115 120 125
Ala Ala Cys Ala Asp Arg Ile Leu Lys Thr Leu Ser Lys Thr Lys Asn
130 135 140
Leu Arg Leu Leu Ile Leu Val Ser Arg Leu Phe Met Trp Glu Glu Pro
145 150 155 160
Glu Val Gln Ala Ala Leu Lys Lys Leu Lys Glu Ala Gly Cys Lys Leu
165 170 175
Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Leu Trp Gln Asn Phe Val
180 185 190
Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro Trp Glu Asp Ile
195 200 205
Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala Asp Ile Leu Lys
210 215 220
<210> 80
<211> 60
<212> PRT
<213> Bos taurus
<400> 80
Met Ala Gln Lys Glu Glu Ala Ala Ala Ala Ala Glu Pro Ala Ser Gln
1 5 10 15
Asn Gly Glu Glu Val Glu Asn Leu Glu Asp Pro Glu Lys Leu Lys Glu
20 25 30
Leu Ile Glu Leu Pro Pro Phe Glu Ile Val Thr Gly Glu Arg Leu Pro
35 40 45
Ala His Tyr Phe Lys Phe Gln Phe Arg Asn Val Glu
50 55 60
<210> 81
<211> 164
<212> PRT
<213> Petromyzon marinus
<400> 81
Tyr Ser Ser Gly Arg Asn Lys Thr Phe Leu Cys Tyr Val Val Glu Ala
1 5 10 15
Gln Ser Lys Gly Gly Gln Val Gln Ala Ser Arg Gly Tyr Leu Glu Asp
20 25 30
Glu His Ala Thr Asn His Ala Glu Glu Ala Phe Phe Asn Ser Ile Met
35 40 45
Pro Thr Phe Asp Pro Ala Leu Arg Tyr Met Val Thr Trp Tyr Val Ser
50 55 60
Ser Ser Pro Cys Ala Ala Cys Ala Asp Arg Ile Val Lys Thr Leu Asn
65 70 75 80
Lys Thr Lys Asn Leu Arg Leu Leu Ile Leu Val Gly Arg Leu Phe Met
85 90 95
Trp Glu Glu Pro Glu Ile Gln Ala Ala Leu Arg Lys Leu Lys Glu Ala
100 105 110
Gly Cys Arg Leu Arg Ile Met Lys Pro Gln Asp Phe Glu Tyr Ile Trp
115 120 125
Gln Asn Phe Val Glu Gln Glu Glu Gly Glu Ser Lys Ala Phe Glu Pro
130 135 140
Trp Glu Asp Ile Gln Glu Asn Phe Leu Tyr Tyr Glu Glu Lys Leu Ala
145 150 155 160
Asp Ile Leu Lys
<210> 82
<211> 384
<212> PRT
<213> Homo sapiens
<400> 82
Met Lys Pro His Phe Arg Asn Thr Val Glu Arg Met Tyr Arg Asp Thr
1 5 10 15
Phe Ser Tyr Asn Phe Tyr Asn Arg Pro Ile Leu Ser Arg Arg Asn Thr
20 25 30
Val Trp Leu Cys Tyr Glu Val Lys Thr Lys Gly Pro Ser Arg Pro Pro
35 40 45
Leu Asp Ala Lys Ile Phe Arg Gly Gln Val Tyr Ser Glu Leu Lys Tyr
50 55 60
His Pro Glu Met Arg Phe Phe His Trp Phe Ser Lys Trp Arg Lys Leu
65 70 75 80
His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr Ile Ser Trp Ser Pro
85 90 95
Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe Leu Ala Glu Asp Pro
100 105 110
Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu Tyr Tyr Phe Trp Asp
115 120 125
Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys Gln Lys Arg Asp Gly
130 135 140
Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp Glu Phe Gln His Cys
145 150 155 160
Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu Phe Glu Pro Trp Asn
165 170 175
Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile Met Leu Gly Glu Ile
180 185 190
Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn
195 200 205
Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val
210 215 220
Glu Arg Met His Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly
225 230 235 240
Phe Leu Cys Asn Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg
245 250 255
His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp
260 265 270
Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys
275 280 285
Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His
290 295 300
Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg
305 310 315 320
Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser
325 330 335
Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp
340 345 350
His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser
355 360 365
Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Glu Asn
370 375 380
<210> 83
<211> 184
<212> PRT
<213> Homo sapiens
<400> 83
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 84
<211> 184
<212> PRT
<213> Homo sapiens
<400> 84
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln
180
<210> 85
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 85
gtaggtagtt aggatgaatg gaaggttggt atagtcccgc ggatttattt atttaatgga 60
tgacctctgg atccatggac 80
<210> 86
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 86
gtaggtagtt aggatgaatg gaaggttggt atagcttccg cggatttatt tatttatgga 60
tgacctctgg atccatggac 80
<210> 87
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 87
gtaggtagtt aggatgaatg gaaggttggt atagccttcc gcggatttat ttattatgga 60
tgacctctgg atccatggac 80
<210> 88
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 88
gtaggtagtt aggatgaatg gaaggttggt atagccattc cgcggattta tttatttgga 60
tgacctctgg atccatggac 80
<210> 89
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 89
gtaggtagtt aggatgaatg gaaggttggt atagcctatt ccgcggattt atttattgga 60
tgacctctgg atccatggac 80
<210> 90
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 90
gtaggtagtt aggatgaatg gaaggttggt atagccttat tccgcggatt tatttatgga 60
tgacctctgg atccatggac 80
<210> 91
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 91
gtaggtagtt aggatgaatg gaaggttggt atagccatta ttccgcggat ttattttgga 60
tgacctctgg atccatggac 80
<210> 92
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 92
gtaggtagtt aggatgaatg gaaggttggt atagcctatt attccgcgga tttatttgga 60
tgacctctgg atccatggac 80
<210> 93
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 93
gtaggtagtt aggatgaatg gaaggttggt atagccatta tattccgcgg atttattgga 60
tgacctctgg atccatggac 80
<210> 94
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 94
gtaggtagtt aggatgaatg gaaggttggt atagcctatt atattccgcg gatttatgga 60
tgacctctgg atccatggac 80
<210> 95
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 95
gtaggtagtt aggatgaatg gaaggttggt atagccttat tatattccgc ggattttgga 60
tgacctctgg atccatggac 80
<210> 96
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 96
gtaggtagtt aggatgaatg gaaggttggt atagccatta ttatattccg cggatttgga 60
tgacctctgg atccatggac 80
<210> 97
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 97
gtaggtagtt aggatgaatg gaaggttggt atagcctatt attatattcc gcggattgga 60
tgacctctgg atccatggac 80
<210> 98
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 98
gtaggtagtt aggatgaatg gaaggttggt atagccatta ttattattac cgcggatgga 60
tgacctctgg atccatggac 80
<210> 99
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 99
gtaggtagtt aggatgaatg gaaggttggt atagccatta ttattattat taccgctgga 60
tgacctctgg atccatggac 80
<210> 100
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 100
gtaggtagtt aggatgaatg gaaggttggt atagtaatat taatttattt atttaatgga 60
tgacctctgg atccatggac 80
<210> 101
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 101
gtaggtagtt aggatgaatg gaaggttggt gtagattatt atctgcggat ttattggatg 60
acctctggat ccatggacat 80
<210> 102
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 102
gtaggtagtt aggatgaatg gaaggttggt atagccatta ttccgcggat ttattttgga 60
tgacctctgg atccatggac 80
<210> 103
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 103
auuauuccgc ggauuuauuu guuuuagagc uag 33
<210> 104
<211> 33
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 104
cguaggccag gguggucacg guuuuagagc uag 33
<210> 105
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 105
gtaggtagtt aggatgaatg gaaggttggt aactatgctg ccgcccagtg ggactttgga 60
aatacaatgt gtcaactctt 80
<210> 106
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 106
gtaggtagtt aggatgaatg gaaggttggt aaaatacaat gtgtcaactc ttgacagggc 60
tctattttat aggcttcttc 80
<210> 107
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 107
gtaggtagtt aggatgaatg gaaggttggt attttccata cagtcagtat caattctgga 60
agaatttcca gacattaaag 80
<210> 108
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 108
gtaggtagtt aggatgaatg gaaggttggt agcttcggtg tcgaaatgag aagaagaggc 60
acagggctgt gaggcttatc 80
<210> 109
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 109
gtaggtagtt aggatgaatg gaaggttggt agtgagccca gaaggggaca gtaagaagga 60
aaaacaggtc agagatggcc 80
<210> 110
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 110
gtaggtagtt aggatgaatg gaaggttggt atcctgaaca ccttccagga attctttggc 60
ctgaataatt gcagtagctc 80
<210> 111
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 111
gtaggtagtt aggatgaatg gaaggttggt agacatggag gacgtgcgcg gccgcctggt 60
gcagtaccgc ggcgaggtgc 80
<210> 112
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 112
gtaggtagtt aggatgaatg gaaggttggt actgcagaag cgcctggcag tgtaccaggc 60
cggggcccgc gagggcgccg 80
<210> 113
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 113
gtaggtagtt aggatgaatg gaaggttggt agccgacaag cagaagaacg gcatcaaggt 60
gaacttcaag atccgccaca 80
<210> 114
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 114
gtaggtagtt aggatgaatg gaaggttggt aaccactacc agcagaacac ccccatcggc 60
gacggccccg tgctgctgcc 80
<210> 115
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 115
gtaggtagtt aggatgaatg gaaggttggt acctcgccct tgctcaccat ctcgagtcgg 60
ccgccagtgt gatggatatc t 81
<210> 116
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 116
gtaggtagtt aggatgaatg gaaggttggt acacgcgtag gccagggtgg tcacgagggt 60
gggccagggc acgggcagc 79
<210> 117
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 117
gtaggtagtt aggatgaatg gaaggttggt aaagcactgc actccgcagg tcagggtggt 60
cacgagggtt ggccagggca 80
<210> 118
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 118
gtaggtagtt aggatgaatg gaaggttggt acactccgca ggtcagggtg gtcacgaggg 60
ttggccaggg cacgggcagg 80
<210> 119
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 119
gtaggtagtt aggatgaatg gaaggttggt aggatctctt cttcacggtt gcctactggt 60
tcaattactt ttaaaaatgg 80
<210> 120
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 120
gtaggtagtt aggatgaatg gaaggttggt attctcgatt gaggatctct tcttcacggt 60
tgcctactgg ttcaattact 80
<210> 121
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 121
gtaggtagtt aggatgaatg gaaggttggt aaggagctgt ggcagtggca ccagaatgga 60
ttccagagtc caggtaagac 80
<210> 122
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 122
gtaggtagtt aggatgaatg gaaggttggt agtactcctc ccggccggcg gtatccagga 60
tgtccaacag gcacgtctcc 80
<210> 123
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 123
gtaggtagtt aggatgaatg gaaggttggt atgactgctt gcagatggcc atggcgcgga 60
cgcgggtgcc gggcgggggt 80
<210> 124
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 124
gtaggtagtt aggatgaatg gaaggttggt actgttacac atgcagttgt agtggatggt 60
ggtacagtca gagccaacct 80
<210> 125
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 125
gtaggtagtt aggatgaatg gaaggttggt aggaactgtc acacatgtag ttgtagtgga 60
tggtggtaca gtcagagcca 80
<210> 126
<211> 1623
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 126
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1610 1615 1620
<210> 127
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 127
gagtccgagc agaagaagaa ggg 23
<210> 128
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 128
ggaatccctt ctgcagcacc tgg 23
<210> 129
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 129
gaacacaaag catagactgc ggg 23
<210> 130
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 130
ggcccagact gagcacgtga tgg 23
<210> 131
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 131
ggcactgcgg ctggaggtcc ggg 23
<210> 132
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 132
gtcatcttag tcattacctg agg 23
<210> 133
<211> 1710
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 133
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 134
<211> 84
<212> PRT
<213> Bacillus phage PBS2
<400> 134
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 135
<211> 181
<212> PRT
<213> Erwinia tasmaniensis
<400> 135
Met Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly
1 5 10 15
Gln Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
20 25 30
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Gln Thr Gly Glu
35 40 45
Thr Lys Glu Lys Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu
50 55 60
Ala Glu Val Ala Gly Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile
65 70 75 80
Glu Gly Ala Leu Gln Thr Arg Lys Trp Thr Asp Gln Ala Gly Val Glu
85 90 95
Lys Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met
100 105 110
Leu Gly Gly Arg Ser Gln Gly Gly Gly Ala Ser Ala Gly Gly Gln Asn
115 120 125
Gly Gly Ser Asn Asn Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Gln Gln Ala Arg Pro Gln Gln Gln
145 150 155 160
Pro Gln Gln Asn Asn Ala Pro Ala Asn Asn Glu Pro Pro Ile Asp Phe
165 170 175
Asp Asp Asp Ile Pro
180
<210> 136
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 136
Met Ala Gly Ala Gln Asp Phe Val Pro His Thr Ala Asp Leu Ala Glu
1 5 10 15
Leu Ala Ala Ala Ala Gly Glu Cys Arg Gly Cys Gly Leu Tyr Arg Asp
20 25 30
Ala Thr Gln Ala Val Phe Gly Ala Gly Gly Arg Ser Ala Arg Ile Met
35 40 45
Met Ile Gly Glu Gln Pro Gly Asp Lys Glu Asp Leu Ala Gly Leu Pro
50 55 60
Phe Val Gly Pro Ala Gly Arg Leu Leu Asp Arg Ala Leu Glu Ala Ala
65 70 75 80
Asp Ile Asp Arg Asp Ala Leu Tyr Val Thr Asn Ala Val Lys His Phe
85 90 95
Lys Phe Thr Arg Ala Ala Gly Gly Lys Arg Arg Ile His Lys Thr Pro
100 105 110
Ser Arg Thr Glu Val Val Ala Cys Arg Pro Trp Leu Ile Ala Glu Met
115 120 125
Thr Ser Val Glu Pro Asp Val Val Val Leu Leu Gly Ala Thr Ala Ala
130 135 140
Lys Ala Leu Leu Gly Asn Asp Phe Arg Val Thr Gln His Arg Gly Glu
145 150 155 160
Val Leu His Val Asp Asp Val Pro Gly Asp Pro Ala Leu Val Ala Thr
165 170 175
Val His Pro Ser Ser Leu Leu Arg Gly Pro Lys Glu Glu Arg Glu Ser
180 185 190
Ala Phe Ala Gly Leu Val Asp Asp Leu Arg Val Ala Ala Asp Val Arg
195 200 205
Pro
<210> 137
<211> 313
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 137
Met Ile Gly Gln Lys Thr Leu Tyr Ser Phe Phe Ser Pro Ser Pro Ala
1 5 10 15
Arg Lys Arg His Ala Pro Ser Pro Glu Pro Ala Val Gln Gly Thr Gly
20 25 30
Val Ala Gly Val Pro Glu Glu Ser Gly Asp Ala Ala Ala Ile Pro Ala
35 40 45
Lys Lys Ala Pro Ala Gly Gln Glu Glu Pro Gly Thr Pro Pro Ser Ser
50 55 60
Pro Leu Ser Ala Glu Gln Leu Asp Arg Ile Gln Arg Asn Lys Ala Ala
65 70 75 80
Ala Leu Leu Arg Leu Ala Ala Arg Asn Val Pro Val Gly Phe Gly Glu
85 90 95
Ser Trp Lys Lys His Leu Ser Gly Glu Phe Gly Lys Pro Tyr Phe Ile
100 105 110
Lys Leu Met Gly Phe Val Ala Glu Glu Arg Lys His Tyr Thr Val Tyr
115 120 125
Pro Pro Pro His Gln Val Phe Thr Trp Thr Gln Met Cys Asp Ile Lys
130 135 140
Asp Val Lys Val Val Ile Leu Gly Gln Glu Pro Tyr His Gly Pro Asn
145 150 155 160
Gln Ala His Gly Leu Cys Phe Ser Val Gln Arg Pro Val Pro Pro Pro
165 170 175
Pro Ser Leu Glu Asn Ile Tyr Lys Glu Leu Ser Thr Asp Ile Glu Asp
180 185 190
Phe Val His Pro Gly His Gly Asp Leu Ser Gly Trp Ala Lys Gln Gly
195 200 205
Val Leu Leu Leu Asn Ala Val Leu Thr Val Arg Ala His Gln Ala Asn
210 215 220
Ser His Lys Glu Arg Gly Trp Glu Gln Phe Thr Asp Ala Val Val Ser
225 230 235 240
Trp Leu Asn Gln Asn Ser Asn Gly Leu Val Phe Leu Leu Trp Gly Ser
245 250 255
Tyr Ala Gln Lys Lys Gly Ser Ala Ile Asp Arg Lys Arg His His Val
260 265 270
Leu Gln Thr Ala His Pro Ser Pro Leu Ser Val Tyr Arg Gly Phe Phe
275 280 285
Gly Cys Arg His Phe Ser Lys Thr Asn Glu Leu Leu Gln Lys Ser Gly
290 295 300
Lys Lys Pro Ile Asp Trp Lys Glu Leu
305 310
<210> 138
<211> 148
<212> PRT
<213> Homo sapiens
<400> 138
Met Phe Arg Arg Pro Val Leu Gln Val Leu Arg Gln Phe Val Arg His
1 5 10 15
Glu Ser Glu Thr Thr Thr Ser Leu Val Leu Glu Arg Ser Leu Asn Arg
20 25 30
Val His Leu Leu Gly Arg Val Gly Gln Asp Pro Val Leu Arg Gln Val
35 40 45
Glu Gly Lys Asn Pro Val Thr Ile Phe Ser Leu Ala Thr Asn Glu Met
50 55 60
Trp Arg Ser Gly Asp Ser Glu Val Tyr Gln Leu Gly Asp Val Ser Gln
65 70 75 80
Lys Thr Thr Trp His Arg Ile Ser Val Phe Arg Pro Gly Leu Arg Asp
85 90 95
Val Ala Tyr Gln Tyr Val Lys Lys Gly Ser Arg Ile Tyr Leu Glu Gly
100 105 110
Lys Ile Asp Tyr Gly Glu Tyr Met Asp Lys Asn Asn Val Arg Arg Gln
115 120 125
Ala Thr Thr Ile Ile Ala Asp Asn Ile Ile Phe Leu Ser Asp Gln Thr
130 135 140
Lys Glu Lys Glu
145
<210> 139
<211> 388
<212> PRT
<213> Mus musculus
<400> 139
Met Phe Ala Lys Gly Lys Gly Ser Ala Val Pro Ser Asp Gly Gln Ala
1 5 10 15
Arg Glu Lys Leu Ala Leu Tyr Val Tyr Glu Tyr Leu Leu His Val Gly
20 25 30
Ala Gln Lys Ser Ala Gln Thr Phe Leu Ser Glu Ile Arg Trp Glu Lys
35 40 45
Asn Ile Thr Leu Gly Glu Pro Pro Gly Phe Leu His Ser Trp Trp Cys
50 55 60
Val Phe Trp Asp Leu Tyr Cys Ala Ala Pro Glu Arg Arg Asp Thr Cys
65 70 75 80
Glu His Ser Ser Glu Ala Lys Ala Phe His Asp Tyr Ser Ala Ala Ala
85 90 95
Ala Pro Ser Pro Val Leu Gly Asn Ile Pro Pro Asn Asp Gly Met Pro
100 105 110
Gly Gly Pro Ile Pro Pro Gly Phe Phe Gln Gly Pro Pro Gly Ser Gln
115 120 125
Pro Ser Pro His Ala Gln Pro Pro Pro His Asn Pro Ser Ser Met Met
130 135 140
Gly Pro His Ser Gln Pro Phe Met Ser Pro Arg Tyr Ala Gly Gly Pro
145 150 155 160
Arg Pro Pro Ile Arg Met Gly Asn Gln Pro Pro Gly Gly Val Pro Gly
165 170 175
Thr Gln Pro Leu Leu Pro Asn Ser Met Asp Pro Thr Arg Gln Gln Gly
180 185 190
His Pro Asn Met Gly Gly Ser Met Gln Arg Met Asn Pro Pro Arg Gly
195 200 205
Met Gly Pro Met Gly Pro Gly Pro Gln Asn Tyr Gly Ser Gly Met Arg
210 215 220
Pro Pro Pro Asn Ser Leu Gly Pro Ala Met Pro Gly Ile Asn Met Gly
225 230 235 240
Pro Gly Ala Gly Arg Pro Trp Pro Asn Pro Asn Ser Ala Asn Ser Ile
245 250 255
Pro Tyr Ser Ser Ser Ser Pro Gly Thr Tyr Val Gly Pro Pro Gly Gly
260 265 270
Gly Gly Pro Pro Gly Thr Pro Ile Met Pro Ser Pro Ala Asp Ser Thr
275 280 285
Asn Ser Ser Asp Asn Ile Tyr Thr Met Ile Asn Pro Val Pro Pro Gly
290 295 300
Gly Ser Arg Ser Asn Phe Pro Met Gly Pro Gly Ser Asp Gly Pro Met
305 310 315 320
Gly Gly Met Gly Gly Met Glu Pro His His Met Asn Gly Ser Leu Gly
325 330 335
Ser Gly Asp Ile Asp Gly Leu Pro Lys Asn Ser Pro Asn Asn Ile Ser
340 345 350
Gly Ile Ser Asn Pro Pro Gly Thr Pro Arg Asp Asp Gly Glu Leu Gly
355 360 365
Gly Asn Phe Leu His Ser Phe Gln Asn Asp Asn Tyr Ser Pro Ser Met
370 375 380
Thr Met Ser Val
385
<210> 140
<211> 616
<212> PRT
<213> Homo sapiens
<400> 140
Met Val Gly Gln Leu Ser Glu Gly Ala Ile Ala Ala Ile Met Gln Lys
1 5 10 15
Gly Asp Thr Asn Ile Lys Pro Ile Leu Gln Val Ile Asn Ile Arg Pro
20 25 30
Ile Thr Thr Gly Asn Ser Pro Pro Arg Tyr Arg Leu Leu Met Ser Asp
35 40 45
Gly Leu Asn Thr Leu Ser Ser Phe Met Leu Ala Thr Gln Leu Asn Pro
50 55 60
Leu Val Glu Glu Glu Gln Leu Ser Ser Asn Cys Val Cys Gln Ile His
65 70 75 80
Arg Phe Ile Val Asn Thr Leu Lys Asp Gly Arg Arg Val Val Ile Leu
85 90 95
Met Glu Leu Glu Val Leu Lys Ser Ala Glu Ala Val Gly Val Lys Ile
100 105 110
Gly Asn Pro Val Pro Tyr Asn Glu Gly Leu Gly Gln Pro Gln Val Ala
115 120 125
Pro Pro Ala Pro Ala Ala Ser Pro Ala Ala Ser Ser Arg Pro Gln Pro
130 135 140
Gln Asn Gly Ser Ser Gly Met Gly Ser Thr Val Ser Lys Ala Tyr Gly
145 150 155 160
Ala Ser Lys Thr Phe Gly Lys Ala Ala Gly Pro Ser Leu Ser His Thr
165 170 175
Ser Gly Gly Thr Gln Ser Lys Val Val Pro Ile Ala Ser Leu Thr Pro
180 185 190
Tyr Gln Ser Lys Trp Thr Ile Cys Ala Arg Val Thr Asn Lys Ser Gln
195 200 205
Ile Arg Thr Trp Ser Asn Ser Arg Gly Glu Gly Lys Leu Phe Ser Leu
210 215 220
Glu Leu Val Asp Glu Ser Gly Glu Ile Arg Ala Thr Ala Phe Asn Glu
225 230 235 240
Gln Val Asp Lys Phe Phe Pro Leu Ile Glu Val Asn Lys Val Tyr Tyr
245 250 255
Phe Ser Lys Gly Thr Leu Lys Ile Ala Asn Lys Gln Phe Thr Ala Val
260 265 270
Lys Asn Asp Tyr Glu Met Thr Phe Asn Asn Glu Thr Ser Val Met Pro
275 280 285
Cys Glu Asp Asp His His Leu Pro Thr Val Gln Phe Asp Phe Thr Gly
290 295 300
Ile Asp Asp Leu Glu Asn Lys Ser Lys Asp Ser Leu Val Asp Ile Ile
305 310 315 320
Gly Ile Cys Lys Ser Tyr Glu Asp Ala Thr Lys Ile Thr Val Arg Ser
325 330 335
Asn Asn Arg Glu Val Ala Lys Arg Asn Ile Tyr Leu Met Asp Thr Ser
340 345 350
Gly Lys Val Val Thr Ala Thr Leu Trp Gly Glu Asp Ala Asp Lys Phe
355 360 365
Asp Gly Ser Arg Gln Pro Val Leu Ala Ile Lys Gly Ala Arg Val Ser
370 375 380
Asp Phe Gly Gly Arg Ser Leu Ser Val Leu Ser Ser Ser Thr Ile Ile
385 390 395 400
Ala Asn Pro Asp Ile Pro Glu Ala Tyr Lys Leu Arg Gly Trp Phe Asp
405 410 415
Ala Glu Gly Gln Ala Leu Asp Gly Val Ser Ile Ser Asp Leu Lys Ser
420 425 430
Gly Gly Val Gly Gly Ser Asn Thr Asn Trp Lys Thr Leu Tyr Glu Val
435 440 445
Lys Ser Glu Asn Leu Gly Gln Gly Asp Lys Pro Asp Tyr Phe Ser Ser
450 455 460
Val Ala Thr Val Val Tyr Leu Arg Lys Glu Asn Cys Met Tyr Gln Ala
465 470 475 480
Cys Pro Thr Gln Asp Cys Asn Lys Lys Val Ile Asp Gln Gln Asn Gly
485 490 495
Leu Tyr Arg Cys Glu Lys Cys Asp Thr Glu Phe Pro Asn Phe Lys Tyr
500 505 510
Arg Met Ile Leu Ser Val Asn Ile Ala Asp Phe Gln Glu Asn Gln Trp
515 520 525
Val Thr Cys Phe Gln Glu Ser Ala Glu Ala Ile Leu Gly Gln Asn Ala
530 535 540
Ala Tyr Leu Gly Glu Leu Lys Asp Lys Asn Glu Gln Ala Phe Glu Glu
545 550 555 560
Val Phe Gln Asn Ala Asn Phe Arg Ser Phe Ile Phe Arg Val Arg Val
565 570 575
Lys Val Glu Thr Tyr Asn Asp Glu Ser Arg Ile Lys Ala Thr Val Met
580 585 590
Asp Val Lys Pro Val Asp Tyr Arg Glu Tyr Gly Arg Arg Leu Val Met
595 600 605
Ser Ile Arg Arg Ser Ala Leu Met
610 615
<210> 141
<211> 270
<212> PRT
<213> Homo sapiens
<400> 141
Met Trp Asn Ser Gly Phe Glu Ser Tyr Gly Ser Ser Ser Tyr Gly Gly
1 5 10 15
Ala Gly Gly Tyr Thr Gln Ser Pro Gly Gly Phe Gly Ser Pro Ala Pro
20 25 30
Ser Gln Ala Glu Lys Lys Ser Arg Ala Arg Ala Gln His Ile Val Pro
35 40 45
Cys Thr Ile Ser Gln Leu Leu Ser Ala Thr Leu Val Asp Glu Val Phe
50 55 60
Arg Ile Gly Asn Val Glu Ile Ser Gln Val Thr Ile Val Gly Ile Ile
65 70 75 80
Arg His Ala Glu Lys Ala Pro Thr Asn Ile Val Tyr Lys Ile Asp Asp
85 90 95
Met Thr Ala Ala Pro Met Asp Val Arg Gln Trp Val Asp Thr Asp Asp
100 105 110
Thr Ser Ser Glu Asn Thr Val Val Pro Pro Glu Thr Tyr Val Lys Val
115 120 125
Ala Gly His Leu Arg Ser Phe Gln Asn Lys Lys Ser Leu Val Ala Phe
130 135 140
Lys Ile Met Pro Leu Glu Asp Met Asn Glu Phe Thr Thr His Ile Leu
145 150 155 160
Glu Val Ile Asn Ala His Met Val Leu Ser Lys Ala Asn Ser Gln Pro
165 170 175
Ser Ala Gly Arg Ala Pro Ile Ser Asn Pro Gly Met Ser Glu Ala Gly
180 185 190
Asn Phe Gly Gly Asn Ser Phe Met Pro Ala Asn Gly Leu Thr Val Ala
195 200 205
Gln Asn Gln Val Leu Asn Leu Ile Lys Ala Cys Pro Arg Pro Glu Gly
210 215 220
Leu Asn Phe Gln Asp Leu Lys Asn Gln Leu Lys His Met Ser Val Ser
225 230 235 240
Ser Ile Lys Gln Ala Val Asp Phe Leu Ser Asn Glu Gly His Ile Tyr
245 250 255
Ser Thr Val Asp Asp Asp His Phe Lys Ser Thr Asp Ala Glu
260 265 270
<210> 142
<211> 121
<212> PRT
<213> Homo sapiens
<400> 142
Met Val Asp Met Met Asp Leu Pro Arg Ser Arg Ile Asn Ala Gly Met
1 5 10 15
Leu Ala Gln Phe Ile Asp Lys Pro Val Cys Phe Val Gly Arg Leu Glu
20 25 30
Lys Ile His Pro Thr Gly Lys Met Phe Ile Leu Ser Asp Gly Glu Gly
35 40 45
Lys Asn Gly Thr Ile Glu Leu Met Glu Pro Leu Asp Glu Glu Ile Ser
50 55 60
Gly Ile Val Glu Val Val Gly Arg Val Thr Ala Lys Ala Thr Ile Leu
65 70 75 80
Cys Thr Ser Tyr Val Gln Phe Lys Glu Asp Ser His Pro Phe Asp Leu
85 90 95
Gly Leu Tyr Asn Glu Ala Val Lys Ile Ile His Asp Phe Pro Gln Phe
100 105 110
Tyr Pro Leu Gly Ile Val Gln His Asp
115 120
<210> 143
<211> 171
<212> PRT
<213> Bacillus subtilis
<400> 143
Met Leu Asn Arg Val Val Leu Val Gly Arg Leu Thr Lys Asp Pro Glu
1 5 10 15
Leu Arg Tyr Thr Pro Asn Gly Ala Ala Val Ala Thr Phe Thr Leu Ala
20 25 30
Val Asn Arg Thr Phe Thr Asn Gln Gly Glu Arg Glu Ala Asp Phe Ile
35 40 45
Asn Cys Val Thr Trp Arg Arg Gln Ala Glu Asn Val Ala Asn Phe Leu
50 55 60
Lys Lys Gly Ser Leu Ala Gly Val Asp Gly Arg Leu Gln Thr Arg Asn
65 70 75 80
Tyr Glu Asn Gln Gln Gly Gln Arg Val Phe Val Thr Glu Val Gln Ala
85 90 95
Glu Ser Val Gln Phe Leu Glu Pro Lys Asn Gly Gly Gly Ser Gly Ser
100 105 110
Gly Gly Tyr Asn Glu Gly Asn Ser Gly Gly Gly Gln Tyr Phe Gly Gly
115 120 125
Gly Gln Asn Asp Asn Pro Phe Gly Gly Asn Gln Asn Asn Gln Arg Arg
130 135 140
Asn Gln Gly Asn Ser Phe Asn Asp Asp Pro Phe Ala Asn Asp Gly Lys
145 150 155 160
Pro Ile Asp Ile Ser Asp Asp Asp Leu Pro Phe
165 170
<210> 144
<211> 199
<212> PRT
<213> Streptomyces coelicolor
<400> 144
Met Ala Gly Glu Thr Val Ile Thr Val Val Gly Asn Leu Val Asp Asp
1 5 10 15
Pro Glu Leu Arg Phe Thr Pro Ser Gly Ala Ala Val Ala Lys Phe Arg
20 25 30
Val Ala Ser Thr Pro Arg Thr Phe Asp Arg Gln Thr Asn Glu Trp Lys
35 40 45
Asp Gly Glu Ser Leu Phe Leu Thr Cys Ser Val Trp Arg Gln Ala Ala
50 55 60
Glu Asn Val Ala Glu Ser Leu Gln Arg Gly Met Arg Val Ile Val Gln
65 70 75 80
Gly Arg Leu Lys Gln Arg Ser Tyr Glu Asp Arg Glu Gly Val Lys Arg
85 90 95
Thr Val Tyr Glu Leu Asp Val Asp Glu Val Gly Ala Ser Leu Arg Ser
100 105 110
Ala Thr Ala Lys Val Thr Lys Thr Ser Gly Gln Gly Arg Gly Gly Gln
115 120 125
Gly Gly Tyr Gly Gly Gly Gly Gly Gly Gln Gly Gly Gly Gly Trp Gly
130 135 140
Gly Gly Pro Gly Gly Gly Gln Gln Gly Gly Gly Ala Pro Ala Asp Asp
145 150 155 160
Pro Trp Ala Thr Gly Gly Ala Pro Ala Gly Gly Gln Gln Gly Gly Gly
165 170 175
Gly Gln Gly Gly Gly Gly Trp Gly Gly Gly Ser Gly Gly Gly Gly Gly
180 185 190
Tyr Ser Asp Glu Pro Pro Phe
195
<210> 145
<211> 156
<212> PRT
<213> Streptococcus pneumoniae
<400> 145
Met Ile Asn Asn Val Val Leu Val Gly Arg Met Thr Arg Asp Ala Glu
1 5 10 15
Leu Arg Tyr Thr Pro Ser Asn Val Ala Val Ala Thr Phe Thr Leu Ala
20 25 30
Val Asn Arg Thr Phe Lys Ser Gln Asn Gly Glu Arg Glu Ala Asp Phe
35 40 45
Ile Asn Val Val Met Trp Arg Gln Gln Ala Glu Asn Leu Ala Asn Trp
50 55 60
Ala Lys Lys Gly Ser Leu Ile Gly Val Thr Gly Arg Ile Gln Thr Arg
65 70 75 80
Ser Tyr Asp Asn Gln Gln Gly Gln Arg Val Tyr Val Thr Glu Val Val
85 90 95
Ala Glu Asn Phe Gln Met Leu Glu Ser Arg Ser Val Arg Glu Gly His
100 105 110
Thr Gly Gly Ala Tyr Ser Ala Pro Thr Ala Asn Tyr Ser Ala Pro Thr
115 120 125
Asn Ser Val Pro Asp Phe Ser Arg Asn Glu Asn Pro Phe Gly Ala Thr
130 135 140
Asn Pro Leu Asp Ile Ser Asp Asp Asp Leu Pro Phe
145 150 155
<210> 146
<211> 1196
<212> PRT
<213> Human alphaherpesvirus
<400> 146
Met Glu Thr Lys Pro Lys Thr Ala Thr Thr Ile Lys Val Pro Pro Gly
1 5 10 15
Pro Leu Gly Tyr Val Tyr Ala Arg Ala Cys Pro Ser Glu Gly Ile Glu
20 25 30
Leu Leu Ala Leu Leu Ser Ala Arg Ser Gly Asp Ser Asp Val Ala Val
35 40 45
Ala Pro Leu Val Val Gly Leu Thr Val Glu Ser Gly Phe Glu Ala Asn
50 55 60
Val Ala Val Val Val Gly Ser Arg Thr Thr Gly Leu Gly Gly Thr Ala
65 70 75 80
Val Ser Leu Lys Leu Thr Pro Ser His Tyr Ser Ser Ser Val Tyr Val
85 90 95
Phe His Gly Gly Arg His Leu Asp Pro Ser Thr Gln Ala Pro Asn Leu
100 105 110
Thr Arg Leu Cys Glu Arg Ala Arg Arg His Phe Gly Phe Ser Asp Tyr
115 120 125
Thr Pro Arg Pro Gly Asp Leu Lys His Glu Thr Thr Gly Glu Ala Leu
130 135 140
Cys Glu Arg Leu Gly Leu Asp Pro Asp Arg Ala Leu Leu Tyr Leu Val
145 150 155 160
Val Thr Glu Gly Phe Lys Glu Ala Val Cys Ile Asn Asn Thr Phe Leu
165 170 175
His Leu Gly Gly Ser Asp Lys Val Thr Ile Gly Gly Ala Glu Val His
180 185 190
Arg Ile Pro Val Tyr Pro Leu Gln Leu Phe Met Pro Asp Phe Ser Arg
195 200 205
Val Ile Ala Glu Pro Phe Asn Ala Asn His Arg Ser Ile Gly Glu Asn
210 215 220
Phe Thr Tyr Pro Leu Pro Phe Phe Asn Arg Pro Leu Asn Arg Leu Leu
225 230 235 240
Phe Glu Ala Val Val Gly Pro Ala Ala Val Ala Leu Arg Cys Arg Asn
245 250 255
Val Asp Ala Val Ala Arg Ala Ala Ala His Leu Ala Phe Asp Glu Asn
260 265 270
His Glu Gly Ala Ala Leu Pro Ala Asp Ile Thr Phe Thr Ala Phe Glu
275 280 285
Ala Ser Gln Gly Lys Thr Pro Arg Gly Gly Arg Asp Gly Gly Gly Lys
290 295 300
Gly Pro Ala Gly Gly Phe Glu Gln Arg Leu Ala Ser Val Met Ala Gly
305 310 315 320
Asp Ala Ala Leu Ala Leu Glu Ser Ile Val Ser Met Ala Val Phe Asp
325 330 335
Glu Pro Pro Thr Asp Ile Ser Ala Trp Pro Leu Phe Glu Gly Gln Asp
340 345 350
Thr Ala Ala Ala Arg Ala Asn Ala Val Gly Ala Tyr Leu Ala Arg Ala
355 360 365
Ala Gly Leu Val Gly Ala Met Val Phe Ser Thr Asn Ser Ala Leu His
370 375 380
Leu Thr Glu Val Asp Asp Ala Gly Pro Ala Asp Pro Lys Asp His Ser
385 390 395 400
Lys Pro Ser Phe Tyr Arg Phe Phe Leu Val Pro Gly Thr His Val Ala
405 410 415
Ala Asn Pro Gln Val Asp Arg Glu Gly His Val Val Pro Gly Phe Glu
420 425 430
Gly Arg Pro Thr Ala Pro Leu Val Gly Gly Thr Gln Glu Phe Ala Gly
435 440 445
Glu His Leu Ala Met Leu Cys Gly Phe Ser Pro Ala Leu Leu Ala Lys
450 455 460
Met Leu Phe Tyr Leu Glu Arg Cys Asp Gly Gly Val Ile Val Gly Arg
465 470 475 480
Gln Glu Met Asp Val Phe Arg Tyr Val Ala Asp Ser Asn Gln Thr Asp
485 490 495
Val Pro Cys Asn Leu Cys Thr Phe Asp Thr Arg His Ala Cys Val His
500 505 510
Thr Thr Leu Met Arg Leu Arg Ala Arg His Pro Lys Phe Ala Ser Ala
515 520 525
Ala Arg Gly Ala Ile Gly Val Phe Gly Thr Met Asn Ser Met Tyr Ser
530 535 540
Asp Cys Asp Val Leu Gly Asn Tyr Ala Ala Phe Ser Ala Leu Lys Arg
545 550 555 560
Ala Asp Gly Ser Glu Thr Ala Arg Thr Ile Met Gln Glu Thr Tyr Arg
565 570 575
Ala Ala Thr Glu Arg Val Met Ala Glu Leu Glu Thr Leu Gln Tyr Val
580 585 590
Asp Gln Ala Val Pro Thr Ala Met Gly Arg Leu Glu Thr Ile Ile Thr
595 600 605
Asn Arg Glu Ala Leu His Thr Val Val Asn Asn Val Arg Gln Val Val
610 615 620
Asp Arg Glu Val Glu Gln Leu Met Arg Asn Leu Val Glu Gly Arg Asn
625 630 635 640
Phe Lys Phe Arg Asp Gly Leu Gly Glu Ala Asn His Ala Met Ser Leu
645 650 655
Thr Leu Asp Pro Tyr Ala Cys Gly Pro Cys Pro Leu Leu Gln Leu Leu
660 665 670
Gly Arg Arg Ser Asn Leu Ala Val Tyr Gln Asp Leu Ala Leu Ser Gln
675 680 685
Cys His Gly Val Phe Ala Gly Gln Ser Val Glu Gly Arg Asn Phe Arg
690 695 700
Asn Gln Phe Gln Pro Val Leu Arg Arg Arg Val Met Asp Met Phe Asn
705 710 715 720
Asn Gly Phe Leu Ser Ala Lys Thr Leu Thr Val Ala Leu Ser Glu Gly
725 730 735
Ala Ala Ile Cys Ala Pro Ser Leu Thr Ala Gly Gln Thr Ala Pro Ala
740 745 750
Glu Ser Ser Phe Glu Gly Asp Val Ala Arg Val Thr Leu Gly Phe Pro
755 760 765
Lys Glu Leu Arg Val Lys Ser Arg Val Leu Phe Ala Gly Ala Ser Ala
770 775 780
Asn Ala Ser Glu Ala Ala Lys Ala Arg Val Ala Ser Leu Gln Ser Ala
785 790 795 800
Tyr Gln Lys Pro Asp Lys Arg Val Asp Ile Leu Leu Gly Pro Leu Gly
805 810 815
Phe Leu Leu Lys Gln Phe His Ala Ala Ile Phe Pro Asn Gly Lys Pro
820 825 830
Pro Gly Ser Asn Gln Pro Asn Pro Gln Trp Phe Trp Thr Ala Leu Gln
835 840 845
Arg Asn Gln Leu Pro Ala Arg Leu Leu Ser Arg Glu Asp Ile Glu Thr
850 855 860
Ile Ala Phe Ile Lys Lys Phe Ser Leu Asp Tyr Gly Ala Ile Asn Phe
865 870 875 880
Ile Asn Leu Ala Pro Asn Asn Val Ser Glu Leu Ala Met Tyr Tyr Met
885 890 895
Ala Asn Gln Ile Leu Arg Tyr Cys Asp His Ser Thr Tyr Phe Ile Asn
900 905 910
Thr Leu Thr Ala Ile Ile Ala Gly Ser Arg Arg Pro Pro Ser Val Gln
915 920 925
Ala Ala Ala Ala Trp Ser Ala Gln Gly Gly Ala Gly Leu Glu Ala Gly
930 935 940
Ala Arg Ala Leu Met Asp Ala Val Asp Ala His Pro Gly Ala Trp Thr
945 950 955 960
Ser Met Phe Ala Ser Cys Asn Leu Leu Arg Pro Val Met Ala Ala Arg
965 970 975
Pro Met Val Val Leu Gly Leu Ser Ile Ser Lys Tyr Tyr Gly Met Ala
980 985 990
Gly Asn Asp Arg Val Phe Gln Ala Gly Asn Trp Ala Ser Leu Met Gly
995 1000 1005
Gly Lys Asn Ala Cys Pro Leu Leu Ile Phe Asp Arg Thr Arg Lys
1010 1015 1020
Phe Val Leu Ala Cys Pro Arg Ala Gly Phe Val Cys Ala Ala Ser
1025 1030 1035
Ser Leu Gly Gly Gly Ala His Glu Ser Ser Leu Cys Glu Gln Leu
1040 1045 1050
Arg Gly Ile Ile Ser Glu Gly Gly Ala Ala Val Ala Ser Ser Val
1055 1060 1065
Phe Val Ala Thr Val Lys Ser Leu Gly Pro Arg Thr Gln Gln Leu
1070 1075 1080
Gln Ile Glu Asp Trp Leu Ala Leu Leu Glu Asp Glu Tyr Leu Ser
1085 1090 1095
Glu Glu Met Met Glu Leu Thr Ala Arg Ala Leu Glu Arg Gly Asn
1100 1105 1110
Gly Glu Trp Ser Thr Asp Ala Ala Leu Glu Val Ala His Glu Ala
1115 1120 1125
Glu Ala Leu Val Ser Gln Leu Gly Asn Ala Gly Glu Val Phe Asn
1130 1135 1140
Phe Gly Asp Phe Gly Cys Glu Asp Asp Asn Ala Thr Pro Phe Gly
1145 1150 1155
Gly Pro Gly Ala Pro Gly Pro Ala Phe Ala Gly Arg Lys Arg Ala
1160 1165 1170
Phe His Gly Asp Asp Pro Phe Gly Glu Gly Pro Pro Asp Lys Lys
1175 1180 1185
Gly Asp Leu Thr Leu Asp Met Leu
1190 1195
<210> 147
<211> 124
<212> PRT
<213> Bacillus virus phi29
<400> 147
Met Glu Asn Thr Asn Ile Val Lys Ala Thr Phe Asp Thr Glu Thr Leu
1 5 10 15
Glu Gly Gln Ile Lys Ile Phe Asn Ala Gln Thr Gly Gly Gly Gln Ser
20 25 30
Phe Lys Asn Leu Pro Asp Gly Thr Ile Ile Glu Ala Asn Ala Ile Ala
35 40 45
Gln Tyr Lys Gln Val Ser Asp Thr Tyr Gly Asp Ala Lys Glu Glu Thr
50 55 60
Val Thr Thr Ile Phe Ala Ala Asp Gly Ser Leu Tyr Ser Ala Ile Ser
65 70 75 80
Lys Thr Val Ala Glu Ala Ala Ser Asp Leu Ile Asp Leu Val Thr Arg
85 90 95
His Lys Leu Glu Thr Phe Lys Val Lys Val Val Gln Gly Thr Ser Ser
100 105 110
Lys Gly Asn Val Phe Phe Ser Leu Gln Leu Ser Leu
115 120
<210> 148
<211> 162
<212> PRT
<213> Burkholderia virus
<400> 148
Met Ala Ser Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Ala Asp
1 5 10 15
Pro Glu Thr Arg Tyr Leu Pro Ser Gly Asp Ala Ile Ser Asn Ile Arg
20 25 30
Leu Ala Thr Thr Asp Arg Tyr Lys Asp Lys Ala Ser Gly Glu Met Lys
35 40 45
Glu Ser Thr Glu Trp His Arg Val Ser Phe Phe Gly Arg Leu Ala Glu
50 55 60
Ile Val Asp Glu Tyr Leu Arg Lys Gly Ala Pro Val Tyr Ile Glu Gly
65 70 75 80
Arg Ile Arg Thr Arg Lys Trp Gln Asp Asn Ala Gly Gln Asp Arg Tyr
85 90 95
Thr Thr Glu Ile Val Ala Glu Lys Met Gln Met Leu Gly Asp Arg Arg
100 105 110
Asp Gly Gly Glu Arg Gln Gln Arg Ala Pro Gln Gln Gln Gln Gln Arg
115 120 125
Thr Gln Arg Asn Gly Tyr Ala Asp Ala Thr Gly Arg Ala Gln Pro Ser
130 135 140
Gln Arg Pro Ala Ala Gly Gly Gly Phe Asp Glu Met Asp Asp Asp Ile
145 150 155 160
Pro Phe
<210> 149
<211> 1599
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 149
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu
225 230 235 240
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
245 250 255
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
260 265 270
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
275 280 285
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
290 295 300
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
305 310 315 320
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
325 330 335
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
340 345 350
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
355 360 365
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
370 375 380
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
385 390 395 400
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
405 410 415
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
420 425 430
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
435 440 445
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
450 455 460
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
465 470 475 480
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
485 490 495
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
500 505 510
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
515 520 525
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
530 535 540
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
545 550 555 560
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
565 570 575
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
580 585 590
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
595 600 605
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
610 615 620
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
625 630 635 640
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
645 650 655
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
660 665 670
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
675 680 685
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
690 695 700
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
705 710 715 720
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
725 730 735
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
740 745 750
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
755 760 765
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
770 775 780
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
785 790 795 800
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
805 810 815
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
820 825 830
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
835 840 845
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
850 855 860
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
865 870 875 880
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
885 890 895
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
900 905 910
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
915 920 925
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
930 935 940
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
945 950 955 960
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
965 970 975
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
980 985 990
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
995 1000 1005
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
1010 1015 1020
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln
1025 1030 1035
Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met
1040 1045 1050
Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp
1055 1060 1065
Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile
1070 1075 1080
Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser
1085 1090 1095
Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
1100 1105 1110
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
1115 1120 1125
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
1130 1135 1140
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile
1145 1150 1155
Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
1160 1165 1170
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
1175 1180 1185
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1190 1195 1200
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala
1205 1210 1215
Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1220 1225 1230
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1235 1240 1245
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala
1250 1255 1260
Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys
1265 1270 1275
Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu
1280 1285 1290
Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly
1295 1300 1305
Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
1310 1315 1320
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys
1325 1330 1335
Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg
1340 1345 1350
Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1355 1360 1365
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1370 1375 1380
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
1385 1390 1395
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu
1400 1405 1410
Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys
1415 1420 1425
Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1430 1435 1440
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala
1445 1450 1455
Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1460 1465 1470
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1475 1480 1485
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln
1490 1495 1500
Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu
1505 1510 1515
Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile
1520 1525 1530
Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn
1535 1540 1545
Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
1550 1555 1560
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu
1565 1570 1575
Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu
1580 1585 1590
Ser Gln Leu Gly Gly Asp
1595
<210> 150
<211> 1606
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 150
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Gly Gly Ser Gly Gly Ser Gly Gly Ser Met Asp
225 230 235 240
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
245 250 255
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
260 265 270
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
275 280 285
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
290 295 300
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
305 310 315 320
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
325 330 335
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
340 345 350
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
355 360 365
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
370 375 380
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
385 390 395 400
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
405 410 415
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
420 425 430
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
435 440 445
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
450 455 460
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
465 470 475 480
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
485 490 495
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
500 505 510
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
515 520 525
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
530 535 540
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
545 550 555 560
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
565 570 575
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
580 585 590
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
595 600 605
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
610 615 620
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
625 630 635 640
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
645 650 655
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
660 665 670
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
675 680 685
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
690 695 700
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
705 710 715 720
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
725 730 735
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
740 745 750
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
755 760 765
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
770 775 780
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
785 790 795 800
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
805 810 815
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
820 825 830
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
835 840 845
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
850 855 860
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
865 870 875 880
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
885 890 895
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
900 905 910
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
915 920 925
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
930 935 940
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
945 950 955 960
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
965 970 975
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
980 985 990
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
995 1000 1005
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
1010 1015 1020
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1025 1030 1035
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1040 1045 1050
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1055 1060 1065
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
1070 1075 1080
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1085 1090 1095
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1100 1105 1110
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1115 1120 1125
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1130 1135 1140
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1145 1150 1155
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1160 1165 1170
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1175 1180 1185
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1190 1195 1200
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1205 1210 1215
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1220 1225 1230
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1235 1240 1245
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1250 1255 1260
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1265 1270 1275
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1280 1285 1290
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1295 1300 1305
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1310 1315 1320
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1325 1330 1335
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1340 1345 1350
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1355 1360 1365
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1370 1375 1380
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1385 1390 1395
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1400 1405 1410
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1415 1420 1425
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1430 1435 1440
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1445 1450 1455
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1460 1465 1470
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1475 1480 1485
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1490 1495 1500
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1505 1510 1515
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1520 1525 1530
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1535 1540 1545
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1550 1555 1560
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1565 1570 1575
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1580 1585 1590
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1595 1600 1605
<210> 151
<211> 1599
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 151
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly
1355 1360 1365
Gly Ser Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr
1370 1375 1380
Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp
1385 1390 1395
Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn
1400 1405 1410
Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
1415 1420 1425
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
1430 1435 1440
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu
1445 1450 1455
Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe
1460 1465 1470
Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg
1475 1480 1485
Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp
1490 1495 1500
Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu
1505 1510 1515
Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn
1520 1525 1530
Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr
1535 1540 1545
Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
1550 1555 1560
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
1565 1570 1575
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu
1580 1585 1590
Trp Ala Thr Gly Leu Lys
1595
<210> 152
<211> 1605
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 152
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Gly
1355 1360 1365
Gly Ser Gly Gly Ser Gly Gly Ser Met Ser Ser Glu Thr Gly Pro
1370 1375 1380
Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu
1385 1390 1395
Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys
1400 1405 1410
Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg
1415 1420 1425
His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile
1430 1435 1440
Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys
1445 1450 1455
Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
1460 1465 1470
Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
1475 1480 1485
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn
1490 1495 1500
Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln
1505 1510 1515
Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val
1520 1525 1530
Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His
1535 1540 1545
Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu
1550 1555 1560
Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
1565 1570 1575
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
1580 1585 1590
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys
1595 1600 1605
<210> 153
<211> 1612
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 153
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp
1610
<210> 154
<211> 772
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 154
Met Gly Ser Ser His His His His His His Met Ser Ser Glu Thr Gly
1 5 10 15
Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu
20 25 30
Phe Glu Val Glu Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu
35 40 45
Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr
50 55 60
Ser Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe
65 70 75 80
Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp
85 90 95
Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu
100 105 110
Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg
115 120 125
Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Val Lys Val
130 135 140
Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu
145 150 155 160
Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
165 170 175
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
180 185 190
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
195 200 205
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
210 215 220
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe
225 230 235 240
Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys
245 250 255
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
260 265 270
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
275 280 285
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
290 295 300
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
305 310 315 320
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys
325 330 335
Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
340 345 350
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
355 360 365
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
370 375 380
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
385 390 395 400
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
405 410 415
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
420 425 430
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Leu Ala Asn Gly
435 440 445
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
450 455 460
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu
465 470 475 480
Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
485 490 495
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
500 505 510
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
515 520 525
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
530 535 540
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr
545 550 555 560
Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
565 570 575
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
580 585 590
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
595 600 605
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
610 615 620
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
625 630 635 640
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
645 650 655
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
660 665 670
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
675 680 685
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
690 695 700
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe
705 710 715 720
Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
725 730 735
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
740 745 750
Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys
755 760 765
Lys Arg Lys Val
770
<210> 155
<211> 1622
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 155
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Phe Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Lys Leu Ile Asn Gly
900 905 910
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
915 920 925
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
930 935 940
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
945 950 955 960
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
965 970 975
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
980 985 990
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
995 1000 1005
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1010 1015 1020
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
1025 1030 1035
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1040 1045 1050
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1055 1060 1065
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala
1070 1075 1080
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1085 1090 1095
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1100 1105 1110
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1115 1120 1125
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1130 1135 1140
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1145 1150 1155
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1160 1165 1170
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1175 1180 1185
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1190 1195 1200
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1205 1210 1215
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1220 1225 1230
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1235 1240 1245
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1250 1255 1260
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1265 1270 1275
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1280 1285 1290
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1295 1300 1305
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1310 1315 1320
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1325 1330 1335
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1340 1345 1350
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1355 1360 1365
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1370 1375 1380
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1385 1390 1395
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1400 1405 1410
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1415 1420 1425
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1430 1435 1440
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1445 1450 1455
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1460 1465 1470
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1475 1480 1485
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1490 1495 1500
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1505 1510 1515
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1520 1525 1530
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1535 1540 1545
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1550 1555 1560
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1565 1570 1575
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1580 1585 1590
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1595 1600 1605
Gly Gly Asp Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1610 1615 1620
<210> 156
<211> 1709
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 156
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Glu
580 585 590
Ile Leu Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Tyr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Tyr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1670 1675 1680
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1685 1690 1695
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705
<210> 157
<211> 1708
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 157
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
290 295 300
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
305 310 315 320
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
325 330 335
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
340 345 350
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
355 360 365
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
370 375 380
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
385 390 395 400
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
405 410 415
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
420 425 430
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
435 440 445
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
450 455 460
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
465 470 475 480
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
485 490 495
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
500 505 510
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
515 520 525
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
530 535 540
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
545 550 555 560
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
565 570 575
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
580 585 590
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
595 600 605
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
610 615 620
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
625 630 635 640
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
645 650 655
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
660 665 670
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Asp Ile Glu Lys Ile Leu Thr
675 680 685
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
690 695 700
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
705 710 715 720
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
725 730 735
Arg Met Thr Asn Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys
740 745 750
His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys
755 760 765
Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Ser
770 775 780
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
785 790 795 800
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
805 810 815
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
820 825 830
Ser Leu Gly Thr Tyr Gly Asp Leu Leu Lys Ile Ile Lys Asp Ile Asp
835 840 845
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
850 855 860
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
865 870 875 880
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
885 890 895
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
900 905 910
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
915 920 925
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
930 935 940
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
945 950 955 960
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
965 970 975
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
980 985 990
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
995 1000 1005
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1010 1015 1020
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
1025 1030 1035
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1040 1045 1050
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1055 1060 1065
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1070 1075 1080
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1085 1090 1095
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1100 1105 1110
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1115 1120 1125
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Leu Thr
1130 1135 1140
Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe
1145 1150 1155
Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val
1160 1165 1170
Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn
1175 1180 1185
Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
1190 1195 1200
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
1205 1210 1215
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala
1220 1225 1230
Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser
1235 1240 1245
Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met
1250 1255 1260
Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1265 1270 1275
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr
1280 1285 1290
Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1295 1300 1305
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1310 1315 1320
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys
1325 1330 1335
Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu
1340 1345 1350
Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp
1355 1360 1365
Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr
1370 1375 1380
Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
1385 1390 1395
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg
1400 1405 1410
Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly
1415 1420 1425
Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1430 1435 1440
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1445 1450 1455
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys
1460 1465 1470
Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys
1475 1480 1485
Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln
1490 1495 1500
His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1505 1510 1515
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu
1520 1525 1530
Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1535 1540 1545
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1550 1555 1560
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr
1565 1570 1575
Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser
1580 1585 1590
Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly
1595 1600 1605
Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys
1610 1615 1620
Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
1625 1630 1635
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp
1640 1645 1650
Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val
1655 1660 1665
Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu
1670 1675 1680
Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser
1685 1690 1695
Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705
<210> 158
<211> 1629
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 158
Met Thr Ser Glu Lys Gly Pro Ser Thr Gly Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro Trp Glu Phe Asp Val Phe Tyr Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Ala Cys Leu Leu Tyr Glu Ile Lys Trp Gly Met Ser Arg
35 40 45
Lys Ile Trp Arg Ser Ser Gly Lys Asn Thr Thr Asn His Val Glu Val
50 55 60
Asn Phe Ile Lys Lys Phe Thr Ser Glu Arg Asp Phe His Pro Ser Met
65 70 75 80
Ser Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Trp Glu Cys
85 90 95
Ser Gln Ala Ile Arg Glu Phe Leu Ser Arg His Pro Gly Val Thr Leu
100 105 110
Val Ile Tyr Val Ala Arg Leu Phe Trp His Met Asp Gln Gln Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Val Asn Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Arg Ala Ser Glu Tyr Tyr His Cys Trp Arg Asn Phe Val Asn Tyr Pro
145 150 155 160
Pro Gly Asp Glu Ala His Trp Pro Gln Tyr Pro Pro Leu Trp Met Met
165 170 175
Leu Tyr Ala Leu Glu Leu His Cys Ile Ile Leu Ser Leu Pro Pro Cys
180 185 190
Leu Lys Ile Ser Arg Arg Trp Gln Asn His Leu Thr Phe Phe Arg Leu
195 200 205
His Leu Gln Asn Cys His Tyr Gln Thr Ile Pro Pro His Ile Leu Leu
210 215 220
Ala Thr Gly Leu Ile His Pro Ser Val Ala Trp Arg Gly Ser Glu Thr
225 230 235 240
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser
245 250 255
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
260 265 270
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
275 280 285
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
290 295 300
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
305 310 315 320
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
325 330 335
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
340 345 350
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
355 360 365
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
370 375 380
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
385 390 395 400
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
405 410 415
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
420 425 430
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
435 440 445
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
450 455 460
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
465 470 475 480
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
485 490 495
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
500 505 510
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
515 520 525
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
530 535 540
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
545 550 555 560
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
565 570 575
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
580 585 590
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
595 600 605
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
610 615 620
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
625 630 635 640
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
645 650 655
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
660 665 670
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
675 680 685
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
690 695 700
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
705 710 715 720
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
725 730 735
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
740 745 750
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
755 760 765
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
770 775 780
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
785 790 795 800
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
805 810 815
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
820 825 830
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
835 840 845
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp
850 855 860
Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu
865 870 875 880
Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys
885 890 895
Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
900 905 910
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr
915 920 925
Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
930 935 940
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys
945 950 955 960
Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn
965 970 975
Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys
980 985 990
Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
995 1000 1005
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1010 1015 1020
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1025 1030 1035
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1040 1045 1050
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1055 1060 1065
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1070 1075 1080
Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
1085 1090 1095
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1100 1105 1110
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1115 1120 1125
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1130 1135 1140
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1145 1150 1155
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1160 1165 1170
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1175 1180 1185
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1190 1195 1200
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1205 1210 1215
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1220 1225 1230
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1235 1240 1245
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1250 1255 1260
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1265 1270 1275
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1280 1285 1290
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1295 1300 1305
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1310 1315 1320
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1325 1330 1335
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1340 1345 1350
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1355 1360 1365
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1370 1375 1380
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1385 1390 1395
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1400 1405 1410
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1415 1420 1425
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1430 1435 1440
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1445 1450 1455
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1460 1465 1470
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1475 1480 1485
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1490 1495 1500
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1505 1510 1515
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1520 1525 1530
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1535 1540 1545
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1550 1555 1560
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1565 1570 1575
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1580 1585 1590
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1595 1600 1605
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Pro
1610 1615 1620
Lys Lys Lys Arg Lys Val
1625
<210> 159
<211> 1679
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 159
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
210 215 220
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
225 230 235 240
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
245 250 255
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
260 265 270
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
275 280 285
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
290 295 300
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
305 310 315 320
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
325 330 335
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
340 345 350
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
355 360 365
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
370 375 380
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
385 390 395 400
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
405 410 415
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
420 425 430
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
435 440 445
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
450 455 460
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
465 470 475 480
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
485 490 495
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
500 505 510
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
515 520 525
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
530 535 540
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
545 550 555 560
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
565 570 575
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
580 585 590
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
595 600 605
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
610 615 620
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
625 630 635 640
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
645 650 655
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
660 665 670
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
675 680 685
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
690 695 700
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
705 710 715 720
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
725 730 735
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
740 745 750
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
755 760 765
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
770 775 780
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
785 790 795 800
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
805 810 815
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
820 825 830
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
835 840 845
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
850 855 860
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
865 870 875 880
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
885 890 895
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
900 905 910
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
915 920 925
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
930 935 940
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
945 950 955 960
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
965 970 975
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
980 985 990
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
995 1000 1005
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1010 1015 1020
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1025 1030 1035
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1040 1045 1050
Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
1055 1060 1065
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1070 1075 1080
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1085 1090 1095
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1100 1105 1110
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1115 1120 1125
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1130 1135 1140
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1145 1150 1155
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1160 1165 1170
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1175 1180 1185
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1190 1195 1200
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1205 1210 1215
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1220 1225 1230
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1235 1240 1245
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1250 1255 1260
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1265 1270 1275
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1280 1285 1290
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1295 1300 1305
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1310 1315 1320
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1325 1330 1335
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1340 1345 1350
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1355 1360 1365
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1370 1375 1380
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1385 1390 1395
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1400 1405 1410
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1415 1420 1425
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1430 1435 1440
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1445 1450 1455
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1460 1465 1470
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1475 1480 1485
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1490 1495 1500
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1505 1510 1515
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1520 1525 1530
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1535 1540 1545
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1550 1555 1560
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1565 1570 1575
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1580 1585 1590
Gly Ser Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1595 1600 1605
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
1610 1615 1620
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
1625 1630 1635
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
1640 1645 1650
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
1655 1660 1665
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1670 1675
<210> 160
<211> 1689
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 160
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
210 215 220
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
225 230 235 240
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
245 250 255
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
260 265 270
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
275 280 285
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
290 295 300
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
305 310 315 320
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
325 330 335
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
340 345 350
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
355 360 365
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
370 375 380
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
385 390 395 400
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
405 410 415
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
420 425 430
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
435 440 445
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
450 455 460
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
465 470 475 480
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
485 490 495
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
500 505 510
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
515 520 525
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
530 535 540
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
545 550 555 560
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
565 570 575
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
580 585 590
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
595 600 605
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
610 615 620
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
625 630 635 640
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
645 650 655
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
660 665 670
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
675 680 685
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
690 695 700
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
705 710 715 720
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
725 730 735
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
740 745 750
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
755 760 765
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
770 775 780
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
785 790 795 800
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
805 810 815
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
820 825 830
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
835 840 845
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
850 855 860
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
865 870 875 880
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
885 890 895
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
900 905 910
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
915 920 925
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
930 935 940
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
945 950 955 960
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
965 970 975
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
980 985 990
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
995 1000 1005
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1010 1015 1020
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1025 1030 1035
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1040 1045 1050
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1055 1060 1065
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1070 1075 1080
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1085 1090 1095
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1100 1105 1110
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1115 1120 1125
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1130 1135 1140
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1145 1150 1155
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1160 1165 1170
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1175 1180 1185
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1190 1195 1200
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1205 1210 1215
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1220 1225 1230
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1235 1240 1245
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1250 1255 1260
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1265 1270 1275
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1280 1285 1290
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1295 1300 1305
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1310 1315 1320
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1325 1330 1335
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1340 1345 1350
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1355 1360 1365
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1370 1375 1380
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1385 1390 1395
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1400 1405 1410
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1415 1420 1425
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1430 1435 1440
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1445 1450 1455
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1460 1465 1470
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1475 1480 1485
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1490 1495 1500
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1505 1510 1515
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1520 1525 1530
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1535 1540 1545
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1550 1555 1560
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1565 1570 1575
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1580 1585 1590
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1595 1600 1605
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1610 1615 1620
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1625 1630 1635
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1640 1645 1650
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1655 1660 1665
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1670 1675 1680
Lys Lys Lys Arg Lys Val
1685
<210> 161
<211> 1655
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 161
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu
195 200 205
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
210 215 220
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
225 230 235 240
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
245 250 255
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
260 265 270
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
275 280 285
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
290 295 300
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
305 310 315 320
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
325 330 335
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
340 345 350
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
355 360 365
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
370 375 380
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
385 390 395 400
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
405 410 415
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
420 425 430
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
435 440 445
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
450 455 460
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
465 470 475 480
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
485 490 495
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
500 505 510
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
515 520 525
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
530 535 540
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
545 550 555 560
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
565 570 575
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
580 585 590
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
595 600 605
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
610 615 620
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
625 630 635 640
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
645 650 655
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
660 665 670
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
675 680 685
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
690 695 700
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
705 710 715 720
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
725 730 735
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
740 745 750
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
755 760 765
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
770 775 780
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
785 790 795 800
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
805 810 815
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
820 825 830
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
835 840 845
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
850 855 860
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
865 870 875 880
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
885 890 895
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
900 905 910
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
915 920 925
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
930 935 940
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
945 950 955 960
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
965 970 975
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
980 985 990
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
995 1000 1005
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1010 1015 1020
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1025 1030 1035
Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1040 1045 1050
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1055 1060 1065
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1070 1075 1080
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1085 1090 1095
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1100 1105 1110
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1115 1120 1125
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1130 1135 1140
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1145 1150 1155
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1160 1165 1170
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1175 1180 1185
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1190 1195 1200
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1205 1210 1215
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1220 1225 1230
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1235 1240 1245
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1250 1255 1260
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1265 1270 1275
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1280 1285 1290
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1295 1300 1305
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1310 1315 1320
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1325 1330 1335
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1340 1345 1350
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1355 1360 1365
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1370 1375 1380
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1385 1390 1395
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1400 1405 1410
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1415 1420 1425
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1430 1435 1440
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1445 1450 1455
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1460 1465 1470
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1475 1480 1485
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1490 1495 1500
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1505 1510 1515
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1520 1525 1530
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1535 1540 1545
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1550 1555 1560
Leu Gly Gly Asp Ser Gly Gly Ser Met Thr Asn Leu Ser Asp Ile
1565 1570 1575
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile
1580 1585 1590
Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
1595 1600 1605
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp
1610 1615 1620
Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
1625 1630 1635
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
1640 1645 1650
Met Leu
1655
<210> 162
<211> 1665
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 162
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Asp Asp Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu
195 200 205
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
210 215 220
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
225 230 235 240
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
245 250 255
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
260 265 270
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
275 280 285
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
290 295 300
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
305 310 315 320
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
325 330 335
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
340 345 350
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
355 360 365
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
370 375 380
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
385 390 395 400
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
405 410 415
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
420 425 430
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
435 440 445
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
450 455 460
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
465 470 475 480
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
485 490 495
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
500 505 510
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
515 520 525
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
530 535 540
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
545 550 555 560
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
565 570 575
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
580 585 590
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
595 600 605
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
610 615 620
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
625 630 635 640
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
645 650 655
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
660 665 670
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
675 680 685
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
690 695 700
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
705 710 715 720
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
725 730 735
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
740 745 750
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
755 760 765
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
770 775 780
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
785 790 795 800
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
805 810 815
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
820 825 830
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
835 840 845
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
850 855 860
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
865 870 875 880
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
885 890 895
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
900 905 910
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
915 920 925
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
930 935 940
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
945 950 955 960
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
965 970 975
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
980 985 990
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
995 1000 1005
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1010 1015 1020
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1025 1030 1035
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1040 1045 1050
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1055 1060 1065
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1070 1075 1080
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1085 1090 1095
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1100 1105 1110
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1115 1120 1125
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1130 1135 1140
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1145 1150 1155
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1160 1165 1170
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1175 1180 1185
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1190 1195 1200
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1205 1210 1215
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1220 1225 1230
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1235 1240 1245
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1250 1255 1260
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1265 1270 1275
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1280 1285 1290
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1295 1300 1305
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1310 1315 1320
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1325 1330 1335
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1340 1345 1350
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1355 1360 1365
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1370 1375 1380
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1385 1390 1395
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1400 1405 1410
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1415 1420 1425
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1430 1435 1440
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1445 1450 1455
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1460 1465 1470
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1475 1480 1485
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1490 1495 1500
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1505 1510 1515
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1520 1525 1530
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1535 1540 1545
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1550 1555 1560
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1565 1570 1575
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1580 1585 1590
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1595 1600 1605
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1610 1615 1620
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1625 1630 1635
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1640 1645 1650
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1655 1660 1665
<210> 163
<211> 1665
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 163
Met Asp Pro Pro Thr Phe Thr Phe Asn Phe Asn Asn Glu Pro Trp Val
1 5 10 15
Arg Gly Arg His Glu Thr Tyr Leu Cys Tyr Glu Val Glu Arg Met His
20 25 30
Asn Asp Thr Trp Val Leu Leu Asn Gln Arg Arg Gly Phe Leu Cys Asn
35 40 45
Gln Ala Pro His Lys His Gly Phe Leu Glu Gly Arg His Ala Glu Leu
50 55 60
Cys Phe Leu Asp Val Ile Pro Phe Trp Lys Leu Asp Leu Asp Gln Asp
65 70 75 80
Tyr Arg Val Thr Cys Phe Thr Ser Trp Ser Pro Cys Phe Ser Cys Ala
85 90 95
Gln Glu Met Ala Lys Phe Ile Ser Lys Asn Lys His Val Ser Leu Cys
100 105 110
Ile Phe Thr Ala Arg Ile Tyr Arg Arg Gln Gly Arg Cys Gln Glu Gly
115 120 125
Leu Arg Thr Leu Ala Glu Ala Gly Ala Lys Ile Ser Ile Met Thr Tyr
130 135 140
Ser Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
145 150 155 160
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Asp Leu Ser
165 170 175
Gly Arg Leu Arg Ala Ile Leu Gln Ser Gly Ser Glu Thr Pro Gly Thr
180 185 190
Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu
195 200 205
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
210 215 220
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
225 230 235 240
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
245 250 255
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
260 265 270
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
275 280 285
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
290 295 300
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
305 310 315 320
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
325 330 335
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
340 345 350
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
355 360 365
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
370 375 380
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
385 390 395 400
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
405 410 415
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
420 425 430
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
435 440 445
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
450 455 460
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
465 470 475 480
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
485 490 495
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
500 505 510
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
515 520 525
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
530 535 540
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
545 550 555 560
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
565 570 575
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
580 585 590
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
595 600 605
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
610 615 620
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
625 630 635 640
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
645 650 655
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
660 665 670
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
675 680 685
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
690 695 700
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
705 710 715 720
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
725 730 735
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
740 745 750
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
755 760 765
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
770 775 780
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
785 790 795 800
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
805 810 815
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
820 825 830
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
835 840 845
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
850 855 860
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
865 870 875 880
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
885 890 895
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
900 905 910
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
915 920 925
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
930 935 940
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
945 950 955 960
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
965 970 975
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
980 985 990
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
995 1000 1005
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1010 1015 1020
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1025 1030 1035
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1040 1045 1050
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1055 1060 1065
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1070 1075 1080
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1085 1090 1095
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1100 1105 1110
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1115 1120 1125
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1130 1135 1140
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1145 1150 1155
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1160 1165 1170
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1175 1180 1185
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1190 1195 1200
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1205 1210 1215
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1220 1225 1230
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1235 1240 1245
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1250 1255 1260
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1265 1270 1275
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1280 1285 1290
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1295 1300 1305
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1310 1315 1320
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1325 1330 1335
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1340 1345 1350
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1355 1360 1365
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1370 1375 1380
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1385 1390 1395
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1400 1405 1410
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1415 1420 1425
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1430 1435 1440
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1445 1450 1455
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1460 1465 1470
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1475 1480 1485
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1490 1495 1500
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1505 1510 1515
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1520 1525 1530
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1535 1540 1545
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1550 1555 1560
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1565 1570 1575
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1580 1585 1590
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1595 1600 1605
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1610 1615 1620
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1625 1630 1635
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1640 1645 1650
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1655 1660 1665
<210> 164
<211> 246
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 164
gcggacatgg aggacgtgcg cggccgcctg gtgcagtacc gcggcgaggt gcaggccatg 60
ctcggccaga gcaccgagga gctgcgggtg cgcctcgcct cccacctgcg caagctgcgt 120
aagcggctcc tccgcgatgc cgatgacctg cagaagcgcc tggcagtgta ccaggccggg 180
gcccgcgagg gcgccgagcg cggcctcagc gccatccgcg agcgcctggg gcccctggtg 240
gaacag 246
<210> 165
<211> 1689
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 165
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
210 215 220
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
225 230 235 240
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
245 250 255
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
260 265 270
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
275 280 285
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
290 295 300
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
305 310 315 320
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
325 330 335
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
340 345 350
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
355 360 365
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
370 375 380
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
385 390 395 400
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
405 410 415
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
420 425 430
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
435 440 445
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
450 455 460
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
465 470 475 480
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
485 490 495
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
500 505 510
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
515 520 525
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
530 535 540
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
545 550 555 560
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
565 570 575
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
580 585 590
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
595 600 605
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
610 615 620
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
625 630 635 640
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
645 650 655
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
660 665 670
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
675 680 685
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
690 695 700
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
705 710 715 720
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
725 730 735
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
740 745 750
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
755 760 765
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
770 775 780
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
785 790 795 800
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
805 810 815
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
820 825 830
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
835 840 845
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
850 855 860
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
865 870 875 880
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
885 890 895
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
900 905 910
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
915 920 925
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
930 935 940
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
945 950 955 960
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
965 970 975
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
980 985 990
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
995 1000 1005
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1010 1015 1020
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1025 1030 1035
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1040 1045 1050
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1055 1060 1065
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1070 1075 1080
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1085 1090 1095
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1100 1105 1110
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1115 1120 1125
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1130 1135 1140
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1145 1150 1155
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1160 1165 1170
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1175 1180 1185
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1190 1195 1200
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1205 1210 1215
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1220 1225 1230
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1235 1240 1245
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1250 1255 1260
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1265 1270 1275
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1280 1285 1290
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1295 1300 1305
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1310 1315 1320
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1325 1330 1335
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1340 1345 1350
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1355 1360 1365
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1370 1375 1380
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1385 1390 1395
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1400 1405 1410
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1415 1420 1425
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1430 1435 1440
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1445 1450 1455
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1460 1465 1470
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1475 1480 1485
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1490 1495 1500
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1505 1510 1515
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1520 1525 1530
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1535 1540 1545
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1550 1555 1560
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1565 1570 1575
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1580 1585 1590
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1595 1600 1605
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1610 1615 1620
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1625 1630 1635
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1640 1645 1650
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1655 1660 1665
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1670 1675 1680
Lys Lys Lys Arg Lys Val
1685
<210> 166
<211> 1679
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 166
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
195 200 205
Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile
210 215 220
Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val
225 230 235 240
Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile
245 250 255
Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala
260 265 270
Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg
275 280 285
Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala
290 295 300
Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val
305 310 315 320
Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val
325 330 335
Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg
340 345 350
Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr
355 360 365
Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu
370 375 380
Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln
385 390 395 400
Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala
405 410 415
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser
420 425 430
Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn
435 440 445
Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn
450 455 460
Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser
465 470 475 480
Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly
485 490 495
Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala
500 505 510
Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala
515 520 525
Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp
530 535 540
Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr
545 550 555 560
Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile
565 570 575
Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
580 585 590
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg
595 600 605
Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro
610 615 620
His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu
625 630 635 640
Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile
645 650 655
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn
660 665 670
Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro
675 680 685
Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe
690 695 700
Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val
705 710 715 720
Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu
725 730 735
Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe
740 745 750
Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr
755 760 765
Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys
770 775 780
Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe
785 790 795 800
Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp
805 810 815
Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
820 825 830
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg
835 840 845
Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu
850 855 860
Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile
865 870 875 880
Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
885 890 895
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp
900 905 910
Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly
915 920 925
Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro
930 935 940
Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
945 950 955 960
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
965 970 975
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
980 985 990
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
995 1000 1005
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1010 1015 1020
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1025 1030 1035
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1040 1045 1050
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1055 1060 1065
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1070 1075 1080
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1085 1090 1095
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1100 1105 1110
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1115 1120 1125
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1130 1135 1140
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1145 1150 1155
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1160 1165 1170
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1175 1180 1185
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1190 1195 1200
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1205 1210 1215
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1220 1225 1230
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1235 1240 1245
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1250 1255 1260
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1265 1270 1275
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1280 1285 1290
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1295 1300 1305
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1310 1315 1320
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1325 1330 1335
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1340 1345 1350
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1355 1360 1365
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1370 1375 1380
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1385 1390 1395
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1400 1405 1410
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1415 1420 1425
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1430 1435 1440
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1445 1450 1455
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1460 1465 1470
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1475 1480 1485
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1490 1495 1500
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1505 1510 1515
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1520 1525 1530
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1535 1540 1545
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1550 1555 1560
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1565 1570 1575
Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
1580 1585 1590
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1595 1600 1605
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1610 1615 1620
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
1625 1630 1635
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1640 1645 1650
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1655 1660 1665
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1670 1675
<210> 167
<211> 1824
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 167
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
245 250 255
Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
260 265 270
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
275 280 285
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
290 295 300
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
305 310 315 320
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
325 330 335
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
340 345 350
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
355 360 365
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
370 375 380
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
385 390 395 400
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
405 410 415
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
420 425 430
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
435 440 445
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
450 455 460
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
465 470 475 480
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
485 490 495
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
500 505 510
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
515 520 525
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
530 535 540
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
545 550 555 560
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
565 570 575
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
580 585 590
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
595 600 605
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
610 615 620
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
625 630 635 640
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
645 650 655
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
660 665 670
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
675 680 685
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
690 695 700
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
705 710 715 720
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
725 730 735
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
740 745 750
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
755 760 765
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
770 775 780
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
785 790 795 800
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
805 810 815
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
820 825 830
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
835 840 845
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
850 855 860
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
865 870 875 880
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
885 890 895
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
900 905 910
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
915 920 925
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
930 935 940
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
945 950 955 960
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
965 970 975
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
980 985 990
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
995 1000 1005
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1010 1015 1020
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1025 1030 1035
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1040 1045 1050
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1055 1060 1065
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1070 1075 1080
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1085 1090 1095
Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1100 1105 1110
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1115 1120 1125
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1130 1135 1140
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1145 1150 1155
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1160 1165 1170
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1175 1180 1185
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1190 1195 1200
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1205 1210 1215
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1220 1225 1230
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1235 1240 1245
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1250 1255 1260
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1265 1270 1275
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1280 1285 1290
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1295 1300 1305
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1310 1315 1320
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1325 1330 1335
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1340 1345 1350
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1355 1360 1365
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1370 1375 1380
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1385 1390 1395
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1400 1405 1410
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1415 1420 1425
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1430 1435 1440
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1445 1450 1455
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1460 1465 1470
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1475 1480 1485
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1490 1495 1500
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1505 1510 1515
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1520 1525 1530
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1535 1540 1545
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1550 1555 1560
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1565 1570 1575
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1580 1585 1590
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1595 1600 1605
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1610 1615 1620
Gln Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1625 1630 1635
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1640 1645 1650
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
1655 1660 1665
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
1670 1675 1680
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
1685 1690 1695
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn
1700 1705 1710
Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
1715 1720 1725
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1730 1735 1740
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
1745 1750 1755
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
1760 1765 1770
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
1775 1780 1785
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
1790 1795 1800
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser
1805 1810 1815
Pro Lys Lys Lys Arg Lys
1820
<210> 168
<211> 1544
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 168
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
245 250 255
Ser Ser Gly Gly Ser Gly Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile
260 265 270
Gly Ile Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp
275 280 285
Val Ile Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn
290 295 300
Asn Glu Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg
305 310 315 320
Arg Arg His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn
325 330 335
Leu Leu Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala
340 345 350
Arg Val Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala
355 360 365
Ala Leu Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu
370 375 380
Val Glu Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser
385 390 395 400
Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu
405 410 415
Glu Arg Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe
420 425 430
Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln
435 440 445
Lys Ala Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp
450 455 460
Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser
465 470 475 480
Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly
485 490 495
His Cys Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr
500 505 510
Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile
515 520 525
Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile
530 535 540
Ile Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile
545 550 555 560
Ala Lys Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val
565 570 575
Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp
580 585 590
Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu
595 600 605
Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp
610 615 620
Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu
625 630 635 640
Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu
645 650 655
Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn
660 665 670
Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys
675 680 685
Val Asp Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp
690 695 700
Phe Ile Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys
705 710 715 720
Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile
725 730 735
Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile
740 745 750
Asn Glu Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu
755 760 765
Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys
770 775 780
Ile Lys Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu
785 790 795 800
Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val
805 810 815
Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn
820 825 830
Lys Val Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr
835 840 845
Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr
850 855 860
Phe Lys Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser
865 870 875 880
Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe
885 890 895
Ser Val Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr
900 905 910
Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn
915 920 925
Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe
930 935 940
Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys
945 950 955 960
His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe
965 970 975
Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln
980 985 990
Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu
995 1000 1005
Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His
1010 1015 1020
Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys
1025 1030 1035
Lys Pro Asn Arg Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg
1040 1045 1050
Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly
1055 1060 1065
Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys
1070 1075 1080
Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr
1085 1090 1095
Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn
1100 1105 1110
Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys
1115 1120 1125
Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr
1130 1135 1140
Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
1145 1150 1155
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
1160 1165 1170
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr
1175 1180 1185
Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val
1190 1195 1200
Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser
1205 1210 1215
Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile
1220 1225 1230
Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp
1235 1240 1245
Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg
1250 1255 1260
Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile
1265 1270 1275
Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr
1280 1285 1290
Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro
1295 1300 1305
Gln Ile Ile Lys Lys Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1310 1315 1320
Ser Ser Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp
1325 1330 1335
Ile Asp Tyr Lys Asp Asp Asp Asp Lys Ser Gly Gly Ser Gly Gly
1340 1345 1350
Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr
1355 1360 1365
Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
1370 1375 1380
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu
1385 1390 1395
Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
1400 1405 1410
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile
1415 1420 1425
Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly
1430 1435 1440
Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
1445 1450 1455
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1460 1465 1470
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1475 1480 1485
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
1490 1495 1500
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1505 1510 1515
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1520 1525 1530
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1535 1540
<210> 169
<211> 661
<212> DNA
<213> Homo sapiens
<400> 169
catccttggt accgagctcg gatccagcca ccatggatag cctcttgatg aatagacgca 60
agttcctgta tcagtttaaa aacgtgagat gggcaaaagg ccgacgagag acatatctgt 120
gctatgtcgt taagcgcaga gattcagcca ccagtttctc tctcgacttc ggctacctgc 180
ggaacaagaa tggttgccat gttgagctcc tgttcctgag gtatatcagc gactgggatt 240
tggacccagg gcggtgctat agggtgacat ggtttacctc ctggtcacct tgttatgact 300
gcgcgcggca tgttgccgat tttctgagag ggaaccctaa cctgtctctg aggatcttca 360
ccgcgcgact gtacttctgt gaggaccgga aagccgaacc cgagggactg agacgcctcc 420
acagagcggg tgtgcagatt gccataatga cctttaagga ctacttctac tgctggaaca 480
ccttcgtcga aaatcacgag cggactttca aggcttggga aggattgcat gaaaacagcg 540
tcaggctttc caggcagctt cgccgcattc ttctcccgtt gtacgaggtt gatgacctca 600
gagatgcctt tagaacactg ggactgtagg cggccgctcg attggtttgg tgtggctcta 660
a 661
<210> 170
<211> 755
<212> DNA
<213> Homo sapiens
<400> 170
catccttggt accgagctcg gatccagcca ccatgagctc agagactggc ccagtggctg 60
tggaccccac attgagacgg cggatcgagc cccatgagtt tgaggtattc ttcgatccga 120
gagagctccg caaggagacc tgcctgcttt acgaaattaa ttgggggggc cggcactcca 180
tttggcgaca tacatcacag aacactaaca agcacgtcga agtcaacttc atcgagaagt 240
tcacgacaga aagatatttc tgtccgaaca caaggtgcag cattacctgg tttctcagct 300
ggagcccatg cgggcgaatg tagtagggcc atcactgaat tcctgtcaag gtatccccac 360
gtcactctgt ttatttacat cgcaaggctg taccaccacg ctgacccccg caatcgacaa 420
ggcctgcggg atttgatctc ttcaggtgtg actatccaaa ttatgactga gcaggagtca 480
ggatactgct ggagaaactt tctgaattat agcccgagta atgaagccca ctggcctagg 540
tatccccatc tgtgggtacg actgtacgtt cttgaactgt actgcatcat actgggcctg 600
cctccttgtc tcaacattct gagaaggaag cagccacagc tgacattctt taccatcgct 660
cttcagtctt gtcattacca gcgactgccc ccacacattc tctgggccac cgggttgaaa 720
tgagcggccg ctcgattggt ttggtgtggc tctaa 755
<210> 171
<211> 574
<212> DNA
<213> Petromyzon marinus
<400> 171
ctcacagatg ctatgtcctg ttcgaactca agagaagagg agagaaaggc gggcctgttt 60
ctgggggtac gcggttaata aaccccagtc cgggaccgag aggggggatt cacgccgaga 120
tcttttcaat taggaaggtt gaagagtatc ttcgcgacaa tcccggtcag ttcacaatta 180
actggtacag ctcctggagc ccttgcgctg attgcgccga gaaaatactc gaatggtaca 240
accaggactt gagaggcaat ggccacactc tcaagatttg ggcttgcaag ctttactacg 300
agaagaacgc gagaaatcag attggcttgt ggaacctcag ggacaacggg gtcgggttga 360
atgttatggt gtccgaacat taccagtgct gtagaaagat cttcattcag tccagtcaca 420
atcagctgaa cgagaacaga tggctggaga aaacactgaa acgggcagag aaaaggcgct 480
cagagctgag tatcatgatc caggtcaaaa tcctgcatac aaccaaaagc ccggctgtat 540
aagcggccgc tcgattggtt tggtgtggct ctaa 574
<210> 172
<211> 1045
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 172
catccttggt accgagctcg gatccagcca ccatggagct gaagtatcac cctgagatgc 60
ggtttttcca ctggtttagt aagtggcgca aacttcatcg ggatcaggag tatgaagtga 120
cctggtatat ctcttggtct ccctgcacaa aatgtacacg cgavatggaa acatttctgg 180
ccgaggatcc aaaggtgacg ctcacaaatc tttgtggccc gcctgtatta tttctgggac 240
ccggattatc aggaggcact taggtcattg tgccaaaagc gcgacggacc acgggcgact 300
atgaaaatca tgaattatga cgaattccag cattgctgga gtaagtttgt gtacagccag 360
cgggagctgt tcgagccctg gaacaatctt cccaagtact acatactgct tcacattatg 420
ttgggggaga tccttcggca ctctatggat cctcctaccc tttacgttta aactttaata 480
atgagccttg ggttcgcggg cgccatgaaa cctatttgtg ctacgaggtc gagcggatcc 540
ataatgatac gtgggtcctg ctgaatcaga ggagggggtt tctgtgtaac caggctccac 600
ataaagatgg atttctcgag gggcggcacg ccgaactgtg tttccttgat gtgatacctt 660
tctggaagct cgaccttgat caagattaca gggtgacgtg tttcacctcc tggtcaccct 720
gcttcagttg cgcccaagag atggctaaat ttagcagtaa gaacaagcat gtgtccctct 780
gtatttttac agccagaatt tatgatgacc agggccggtg ccaggagggg ctgcggacac 840
tcgctgaggc gggcgcgaag atcagcataa tgacatactc cgaattcaaa cactgttggg 900
acacttttgt ggaccaccag ggctgcccat ttcagccgtg ggatgggctc gacgaacata 960
gtcaggatct ctcaggccgg ctgcgagcca tattgcagaa ccaggagaat taggcggccg 1020
ctcgattggt ttggtgtggc tctaa 1045
<210> 173
<211> 785
<212> DNA
<213> Escherichia coli
<400> 173
ggccggggat tctagaaata attttgttta actttaagaa ggagatatac catggatgtc 60
ttctgaaacc ggtccggttg cggttgaccc gaccctgcgt cgtcgtatcg aaccgcacga 120
attcgaagtt ttcttcgacc ccgcgtgaac tgcgtaaaga aacctgcctg ctgtacgaaa 180
tcaactgggg tggtcgtcac tctatctggc gtcacacctc tcagaacacc aacaaacacg 240
ttgaagttaa cttcatcgaa aaattcacca ccgaacgtta cttctgcccg aacacccgtt 300
gctctatcac ctggttcctg tcttggtctc cgtgcggtga atgctcctcg tgcgatcacc 360
gaattcctgt ctcgttaccc gcacgttacc ctgttcatct acatcgcgcg tctgtaccac 420
cacgcggacc cgcgtaaccg tcagggtctg cgtgacctga tctcttctgg tgttaccatc 480
cagatcatga ccgaacagga atctggttac tgctggcgta acttcgttaa ctactctccg 540
tctaacgaag cgcactggcc gcgttacccg cacctgtggg ttcgtctgta cgttctggaa 600
ctgtactgca tcatcctggg tctgccgccg tgcctgaaca tcctgcgtcg taaacagccg 660
cagctgacct cttcaccatc gcgctgcagt cttgccacta ccagcgtctg ccgccgcaca 720
tcctgtgggc gaccggtctg aaaggtggta gtggagggag cggcggttca atggataaga 780
aatac 785
<210> 174
<211> 1710
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 174
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 175
<211> 1689
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 175
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Arg Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
210 215 220
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
225 230 235 240
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
245 250 255
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
260 265 270
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
275 280 285
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
290 295 300
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
305 310 315 320
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
325 330 335
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
340 345 350
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
355 360 365
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
370 375 380
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
385 390 395 400
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
405 410 415
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
420 425 430
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
435 440 445
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
450 455 460
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
465 470 475 480
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
485 490 495
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
500 505 510
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
515 520 525
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
530 535 540
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
545 550 555 560
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
565 570 575
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
580 585 590
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
595 600 605
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
610 615 620
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
625 630 635 640
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
645 650 655
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
660 665 670
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
675 680 685
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
690 695 700
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
705 710 715 720
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
725 730 735
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
740 745 750
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
755 760 765
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
770 775 780
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
785 790 795 800
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
805 810 815
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
820 825 830
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
835 840 845
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
850 855 860
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
865 870 875 880
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
885 890 895
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
900 905 910
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
915 920 925
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
930 935 940
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
945 950 955 960
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
965 970 975
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
980 985 990
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
995 1000 1005
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1010 1015 1020
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1025 1030 1035
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1040 1045 1050
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1055 1060 1065
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1070 1075 1080
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1085 1090 1095
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1100 1105 1110
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1115 1120 1125
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1130 1135 1140
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1145 1150 1155
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1160 1165 1170
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1175 1180 1185
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1190 1195 1200
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1205 1210 1215
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1220 1225 1230
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1235 1240 1245
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1250 1255 1260
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1265 1270 1275
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1280 1285 1290
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1295 1300 1305
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1310 1315 1320
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1325 1330 1335
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1340 1345 1350
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1355 1360 1365
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1370 1375 1380
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1385 1390 1395
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1400 1405 1410
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1415 1420 1425
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1430 1435 1440
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1445 1450 1455
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1460 1465 1470
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1475 1480 1485
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1490 1495 1500
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1505 1510 1515
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1520 1525 1530
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1535 1540 1545
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1550 1555 1560
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1565 1570 1575
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1580 1585 1590
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1595 1600 1605
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1610 1615 1620
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1625 1630 1635
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1640 1645 1650
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1655 1660 1665
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1670 1675 1680
Lys Lys Lys Arg Lys Val
1685
<210> 176
<211> 1679
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 176
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
195 200 205
Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile
210 215 220
Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val
225 230 235 240
Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile
245 250 255
Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala
260 265 270
Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg
275 280 285
Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala
290 295 300
Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val
305 310 315 320
Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val
325 330 335
Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg
340 345 350
Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr
355 360 365
Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu
370 375 380
Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln
385 390 395 400
Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala
405 410 415
Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser
420 425 430
Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn
435 440 445
Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn
450 455 460
Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser
465 470 475 480
Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly
485 490 495
Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala
500 505 510
Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala
515 520 525
Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp
530 535 540
Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr
545 550 555 560
Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile
565 570 575
Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
580 585 590
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg
595 600 605
Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro
610 615 620
His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu
625 630 635 640
Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile
645 650 655
Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn
660 665 670
Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro
675 680 685
Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe
690 695 700
Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val
705 710 715 720
Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu
725 730 735
Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe
740 745 750
Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr
755 760 765
Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys
770 775 780
Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe
785 790 795 800
Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp
805 810 815
Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
820 825 830
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg
835 840 845
Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu
850 855 860
Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile
865 870 875 880
Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
885 890 895
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp
900 905 910
Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly
915 920 925
Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro
930 935 940
Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu
945 950 955 960
Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
965 970 975
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
980 985 990
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile
995 1000 1005
Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1010 1015 1020
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
1025 1030 1035
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His
1040 1045 1050
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys
1055 1060 1065
Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val
1070 1075 1080
Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln
1085 1090 1095
Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu
1100 1105 1110
Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly
1115 1120 1125
Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
1130 1135 1140
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1145 1150 1155
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1160 1165 1170
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1175 1180 1185
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1190 1195 1200
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1205 1210 1215
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1220 1225 1230
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1235 1240 1245
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1250 1255 1260
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1265 1270 1275
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1280 1285 1290
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1295 1300 1305
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1310 1315 1320
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1325 1330 1335
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1340 1345 1350
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1355 1360 1365
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1370 1375 1380
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1385 1390 1395
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1400 1405 1410
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1415 1420 1425
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1430 1435 1440
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1445 1450 1455
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1460 1465 1470
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1475 1480 1485
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1490 1495 1500
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1505 1510 1515
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1520 1525 1530
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1535 1540 1545
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1550 1555 1560
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1565 1570 1575
Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
1580 1585 1590
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met
1595 1600 1605
Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser
1610 1615 1620
Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn
1625 1630 1635
Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala
1640 1645 1650
Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu
1655 1660 1665
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1670 1675
<210> 177
<211> 1806
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 177
Met Glu Leu Lys Tyr His Pro Glu Met Arg Phe Phe His Trp Phe Ser
1 5 10 15
Lys Trp Arg Lys Leu His Arg Asp Gln Glu Tyr Glu Val Thr Trp Tyr
20 25 30
Ile Ser Trp Ser Pro Cys Thr Lys Cys Thr Arg Asp Met Ala Thr Phe
35 40 45
Leu Ala Glu Asp Pro Lys Val Thr Leu Thr Ile Phe Val Ala Arg Leu
50 55 60
Tyr Tyr Phe Trp Asp Pro Asp Tyr Gln Glu Ala Leu Arg Ser Leu Cys
65 70 75 80
Gln Lys Arg Asp Gly Pro Arg Ala Thr Met Lys Ile Met Asn Tyr Asp
85 90 95
Glu Phe Gln His Cys Trp Ser Lys Phe Val Tyr Ser Gln Arg Glu Leu
100 105 110
Phe Glu Pro Trp Asn Asn Leu Pro Lys Tyr Tyr Ile Leu Leu His Ile
115 120 125
Met Leu Gly Glu Ile Leu Arg His Ser Met Asp Pro Pro Thr Phe Thr
130 135 140
Phe Asn Phe Asn Asn Glu Pro Trp Val Arg Gly Arg His Glu Thr Tyr
145 150 155 160
Leu Cys Tyr Glu Val Glu Arg Met His Asn Asp Thr Trp Val Leu Leu
165 170 175
Asn Gln Arg Arg Gly Phe Leu Cys Asn Gln Ala Pro His Lys His Gly
180 185 190
Phe Leu Glu Gly Arg His Ala Glu Leu Cys Phe Leu Asp Val Ile Pro
195 200 205
Phe Trp Lys Leu Asp Leu Asp Gln Asp Tyr Arg Val Thr Cys Phe Thr
210 215 220
Ser Trp Ser Pro Cys Phe Ser Cys Ala Gln Glu Met Ala Lys Phe Ile
225 230 235 240
Ser Lys Asn Lys His Val Ser Leu Cys Ile Phe Thr Ala Arg Ile Tyr
245 250 255
Asp Asp Gln Gly Arg Cys Gln Glu Gly Leu Arg Thr Leu Ala Glu Ala
260 265 270
Gly Ala Lys Ile Ser Ile Met Thr Tyr Ser Glu Phe Lys His Cys Trp
275 280 285
Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly
290 295 300
Leu Asp Glu His Ser Gln Asp Leu Ser Gly Arg Leu Arg Ala Ile Leu
305 310 315 320
Gln Asn Gln Glu Asn Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
325 330 335
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
340 345 350
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
355 360 365
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
370 375 380
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
385 390 395 400
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
405 410 415
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
420 425 430
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
435 440 445
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
450 455 460
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
465 470 475 480
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
485 490 495
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
500 505 510
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
515 520 525
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
530 535 540
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
545 550 555 560
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
565 570 575
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
580 585 590
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
595 600 605
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
610 615 620
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
625 630 635 640
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
645 650 655
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
660 665 670
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
675 680 685
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
690 695 700
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
705 710 715 720
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
725 730 735
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
740 745 750
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
755 760 765
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
770 775 780
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
785 790 795 800
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
805 810 815
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
820 825 830
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
835 840 845
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
850 855 860
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
865 870 875 880
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
885 890 895
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
900 905 910
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
915 920 925
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
930 935 940
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
945 950 955 960
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
965 970 975
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
980 985 990
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
995 1000 1005
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
1010 1015 1020
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1025 1030 1035
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1040 1045 1050
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1055 1060 1065
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1070 1075 1080
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1085 1090 1095
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1100 1105 1110
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1115 1120 1125
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1130 1135 1140
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1145 1150 1155
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1160 1165 1170
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
1175 1180 1185
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1190 1195 1200
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1205 1210 1215
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1220 1225 1230
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1235 1240 1245
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1250 1255 1260
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1265 1270 1275
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1280 1285 1290
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1295 1300 1305
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1310 1315 1320
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1325 1330 1335
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1340 1345 1350
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1355 1360 1365
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1370 1375 1380
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1385 1390 1395
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1400 1405 1410
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1415 1420 1425
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1430 1435 1440
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1445 1450 1455
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1460 1465 1470
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1475 1480 1485
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1490 1495 1500
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1505 1510 1515
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1520 1525 1530
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1535 1540 1545
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1550 1555 1560
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1565 1570 1575
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1580 1585 1590
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1595 1600 1605
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1610 1615 1620
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1625 1630 1635
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1640 1645 1650
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1655 1660 1665
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1670 1675 1680
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1685 1690 1695
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Thr
1700 1705 1710
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1715 1720 1725
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1730 1735 1740
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1745 1750 1755
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1760 1765 1770
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1775 1780 1785
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys
1790 1795 1800
Arg Lys Val
1805
<210> 178
<211> 1709
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 178
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala Val
85 90 95
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
100 105 110
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
115 120 125
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
130 135 140
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
145 150 155 160
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
165 170 175
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
180 185 190
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
195 200 205
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
210 215 220
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
225 230 235 240
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
245 250 255
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
260 265 270
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
275 280 285
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
290 295 300
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr
305 310 315 320
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser
325 330 335
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
340 345 350
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
355 360 365
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
370 375 380
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
385 390 395 400
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
405 410 415
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
420 425 430
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
435 440 445
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
450 455 460
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
465 470 475 480
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
485 490 495
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
500 505 510
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
515 520 525
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
530 535 540
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
545 550 555 560
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
565 570 575
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
580 585 590
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
595 600 605
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
610 615 620
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
625 630 635 640
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
645 650 655
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
660 665 670
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
675 680 685
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
690 695 700
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
705 710 715 720
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
725 730 735
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
740 745 750
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
755 760 765
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
770 775 780
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
785 790 795 800
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
805 810 815
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
820 825 830
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
835 840 845
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
850 855 860
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
865 870 875 880
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
885 890 895
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
900 905 910
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
915 920 925
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp
930 935 940
Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu
945 950 955 960
Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys
965 970 975
Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
980 985 990
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr
995 1000 1005
Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe
1010 1015 1020
Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile
1025 1030 1035
Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
1040 1045 1050
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
1055 1060 1065
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
1070 1075 1080
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
1085 1090 1095
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg
1100 1105 1110
Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu
1115 1120 1125
His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
1130 1135 1140
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
1145 1150 1155
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro
1160 1165 1170
Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
1175 1180 1185
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
1190 1195 1200
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn
1205 1210 1215
Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala
1220 1225 1230
Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys
1235 1240 1245
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln
1250 1255 1260
Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys
1265 1270 1275
Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val
1280 1285 1290
Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile
1295 1300 1305
Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
1310 1315 1320
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
1325 1330 1335
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1340 1345 1350
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1355 1360 1365
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1370 1375 1380
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1385 1390 1395
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1400 1405 1410
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1415 1420 1425
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1430 1435 1440
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1445 1450 1455
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1460 1465 1470
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1475 1480 1485
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1490 1495 1500
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1505 1510 1515
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1520 1525 1530
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1535 1540 1545
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1550 1555 1560
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1565 1570 1575
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1580 1585 1590
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1595 1600 1605
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1610 1615 1620
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1625 1630 1635
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1640 1645 1650
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1655 1660 1665
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1670 1675 1680
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1685 1690 1695
Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705
<210> 179
<211> 1810
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 179
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Ala
1610 1615 1620
Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
1625 1630 1635
Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn
1640 1645 1650
Ile Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly
1655 1660 1665
Glu Met Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly
1670 1675 1680
Lys Leu Ala Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln
1685 1690 1695
Val Tyr Ile Glu Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln
1700 1705 1710
Ser Gly Gln Asp Arg Tyr Thr Thr Glu Val Val Val Asn Val Gly
1715 1720 1725
Gly Thr Met Gln Met Leu Gly Gly Arg Gln Gly Gly Gly Ala Pro
1730 1735 1740
Ala Gly Gly Asn Ile Gly Gly Gly Gln Pro Gln Gly Gly Trp Gly
1745 1750 1755
Gln Pro Gln Gln Pro Gln Gly Gly Asn Gln Phe Ser Gly Gly Ala
1760 1765 1770
Gln Ser Arg Pro Gln Gln Ser Ala Pro Ala Ala Pro Ser Asn Glu
1775 1780 1785
Pro Pro Met Asp Phe Asp Asp Asp Ile Pro Phe Ser Gly Gly Ser
1790 1795 1800
Pro Lys Lys Lys Arg Lys Val
1805 1810
<210> 180
<211> 1716
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 180
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr
1610 1615 1620
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1625 1630 1635
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1640 1645 1650
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1655 1660 1665
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1670 1675 1680
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1685 1690 1695
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys
1700 1705 1710
Arg Lys Val
1715
<210> 181
<211> 1722
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 181
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
1610 1615 1620
Ala Thr Pro Glu Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1625 1630 1635
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1640 1645 1650
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1655 1660 1665
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1670 1675 1680
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1685 1690 1695
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1700 1705 1710
Gly Ser Pro Lys Lys Lys Arg Lys Val
1715 1720
<210> 182
<211> 1726
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 182
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
245 250 255
Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
260 265 270
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
275 280 285
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
290 295 300
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
305 310 315 320
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
325 330 335
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
340 345 350
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
355 360 365
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
370 375 380
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
385 390 395 400
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
405 410 415
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
420 425 430
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
435 440 445
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
450 455 460
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
465 470 475 480
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
485 490 495
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
500 505 510
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
515 520 525
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
530 535 540
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
545 550 555 560
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
565 570 575
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
580 585 590
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
595 600 605
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
610 615 620
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
625 630 635 640
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
645 650 655
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
660 665 670
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
675 680 685
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
690 695 700
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
705 710 715 720
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
725 730 735
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
740 745 750
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
755 760 765
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
770 775 780
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
785 790 795 800
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
805 810 815
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
820 825 830
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
835 840 845
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
850 855 860
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
865 870 875 880
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
885 890 895
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
900 905 910
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
915 920 925
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
930 935 940
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
945 950 955 960
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
965 970 975
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
980 985 990
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
995 1000 1005
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1010 1015 1020
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1025 1030 1035
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1040 1045 1050
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1055 1060 1065
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1070 1075 1080
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1085 1090 1095
Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1100 1105 1110
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1115 1120 1125
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1130 1135 1140
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1145 1150 1155
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1160 1165 1170
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1175 1180 1185
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1190 1195 1200
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1205 1210 1215
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1220 1225 1230
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1235 1240 1245
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1250 1255 1260
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1265 1270 1275
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1280 1285 1290
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1295 1300 1305
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1310 1315 1320
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1325 1330 1335
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1340 1345 1350
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1355 1360 1365
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1370 1375 1380
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1385 1390 1395
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1400 1405 1410
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1415 1420 1425
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1430 1435 1440
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1445 1450 1455
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1460 1465 1470
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1475 1480 1485
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1490 1495 1500
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1505 1510 1515
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1520 1525 1530
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1535 1540 1545
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1550 1555 1560
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1565 1570 1575
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1580 1585 1590
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1595 1600 1605
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1610 1615 1620
Gln Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile
1625 1630 1635
Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile
1640 1645 1650
Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro
1655 1660 1665
Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp
1670 1675 1680
Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
1685 1690 1695
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys
1700 1705 1710
Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1715 1720 1725
<210> 183
<211> 1797
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 183
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu
1010 1015 1020
Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
1025 1030 1035
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
1040 1045 1050
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
1055 1060 1065
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp
1070 1075 1080
His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn
1085 1090 1095
Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn
1100 1105 1110
Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg
1115 1120 1125
Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn
1130 1135 1140
Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
1145 1150 1155
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
1160 1165 1170
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
1175 1180 1185
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys
1190 1195 1200
Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys
1205 1210 1215
Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu
1220 1225 1230
Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg
1250 1255 1260
Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1265 1270 1275
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1280 1285 1290
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu
1295 1300 1305
Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp
1310 1315 1320
Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile
1325 1330 1335
Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1340 1345 1350
Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
1355 1360 1365
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val
1370 1375 1380
Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser
1385 1390 1395
Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1400 1405 1410
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1415 1420 1425
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro
1430 1435 1440
Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu
1445 1450 1455
Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro
1460 1465 1470
Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val
1490 1495 1500
Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1505 1510 1515
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1520 1525 1530
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu
1535 1540 1545
Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly
1550 1555 1560
Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys
1565 1570 1575
Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His
1580 1585 1590
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
1595 1600 1605
Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile
1610 1615 1620
Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu
1625 1630 1635
Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu
1640 1645 1650
Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu
1655 1660 1665
Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp
1670 1675 1680
Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
1685 1690 1695
Leu Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
1700 1705 1710
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro
1715 1720 1725
Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1730 1735 1740
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met
1745 1750 1755
Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val
1760 1765 1770
Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly
1775 1780 1785
Gly Ser Pro Lys Lys Lys Arg Lys Val
1790 1795
<210> 184
<211> 1825
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 184
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser
225 230 235 240
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly
245 250 255
Ser Ser Gly Gly Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
260 265 270
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
275 280 285
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
290 295 300
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
305 310 315 320
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
325 330 335
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
340 345 350
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
355 360 365
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
370 375 380
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
385 390 395 400
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
405 410 415
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
420 425 430
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
435 440 445
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
450 455 460
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
465 470 475 480
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
485 490 495
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
500 505 510
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
515 520 525
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
530 535 540
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
545 550 555 560
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
565 570 575
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
580 585 590
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
595 600 605
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
610 615 620
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
625 630 635 640
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
645 650 655
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
660 665 670
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
675 680 685
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
690 695 700
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
705 710 715 720
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
725 730 735
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
740 745 750
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
755 760 765
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
770 775 780
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
785 790 795 800
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
805 810 815
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
820 825 830
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
835 840 845
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
850 855 860
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
865 870 875 880
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
885 890 895
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
900 905 910
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
915 920 925
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
930 935 940
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
945 950 955 960
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
965 970 975
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
980 985 990
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
995 1000 1005
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1010 1015 1020
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1025 1030 1035
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1040 1045 1050
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1055 1060 1065
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1070 1075 1080
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1085 1090 1095
Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1100 1105 1110
Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp
1115 1120 1125
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1130 1135 1140
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1145 1150 1155
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1160 1165 1170
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1175 1180 1185
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1190 1195 1200
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1205 1210 1215
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1220 1225 1230
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1235 1240 1245
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1250 1255 1260
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1265 1270 1275
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1280 1285 1290
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1295 1300 1305
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1310 1315 1320
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1325 1330 1335
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1340 1345 1350
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1355 1360 1365
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1370 1375 1380
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1385 1390 1395
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1400 1405 1410
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1415 1420 1425
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1430 1435 1440
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1445 1450 1455
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1460 1465 1470
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1475 1480 1485
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1490 1495 1500
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1505 1510 1515
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1520 1525 1530
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1535 1540 1545
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1550 1555 1560
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1565 1570 1575
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1580 1585 1590
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1595 1600 1605
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1610 1615 1620
Gln Leu Gly Gly Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1625 1630 1635
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1640 1645 1650
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
1655 1660 1665
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
1670 1675 1680
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp
1685 1690 1695
Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn
1700 1705 1710
Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
1715 1720 1725
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly
1730 1735 1740
Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu
1745 1750 1755
Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
1760 1765 1770
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu
1775 1780 1785
Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
1790 1795 1800
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser
1805 1810 1815
Pro Lys Lys Lys Arg Lys Val
1820 1825
<210> 185
<211> 1719
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 185
Met Gly Ser Ser His His His His His His Ser Ser Glu Thr Gly Pro
1 5 10 15
Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe
20 25 30
Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser
50 55 60
Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr
65 70 75 80
Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe
100 105 110
Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu
115 120 125
Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile
130 135 140
Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp
165 170 175
Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr
180 185 190
Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys
195 200 205
Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr
210 215 220
Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly
225 230 235 240
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys
245 250 255
Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala
260 265 270
Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu
275 280 285
Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu
290 295 300
Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr
305 310 315 320
Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln
325 330 335
Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His
340 345 350
Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg
355 360 365
His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys
370 375 380
Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp
385 390 395 400
Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys
405 410 415
Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser
420 425 430
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
435 440 445
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
450 455 460
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
465 470 475 480
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
485 490 495
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
500 505 510
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
515 520 525
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
530 535 540
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
545 550 555 560
Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
565 570 575
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val
580 585 590
Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
595 600 605
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu
610 615 620
Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu
625 630 635 640
Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
645 650 655
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu
660 665 670
His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
675 680 685
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr
690 695 700
Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
705 710 715 720
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp
725 730 735
Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
740 745 750
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr
755 760 765
Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr
770 775 780
Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala
785 790 795 800
Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
805 810 815
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu
820 825 830
Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
835 840 845
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu
850 855 860
Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
865 870 875 880
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
885 890 895
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp
900 905 910
Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
915 920 925
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg
930 935 940
Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
945 950 955 960
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
965 970 975
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
980 985 990
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys
995 1000 1005
Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
1010 1015 1020
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
1025 1030 1035
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1040 1045 1050
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1055 1060 1065
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1070 1075 1080
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1085 1090 1095
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1100 1105 1110
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1115 1120 1125
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1130 1135 1140
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1145 1150 1155
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1160 1165 1170
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu
1175 1180 1185
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1190 1195 1200
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1205 1210 1215
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1220 1225 1230
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1235 1240 1245
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1250 1255 1260
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1265 1270 1275
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1280 1285 1290
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1295 1300 1305
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1310 1315 1320
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1325 1330 1335
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1340 1345 1350
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1355 1360 1365
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1370 1375 1380
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1385 1390 1395
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1400 1405 1410
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1415 1420 1425
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1430 1435 1440
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1445 1450 1455
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1460 1465 1470
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1475 1480 1485
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1490 1495 1500
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1505 1510 1515
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1520 1525 1530
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1535 1540 1545
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1550 1555 1560
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1565 1570 1575
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1580 1585 1590
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1595 1600 1605
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1610 1615 1620
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1625 1630 1635
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1640 1645 1650
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1655 1660 1665
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1670 1675 1680
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1685 1690 1695
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1700 1705 1710
Lys Lys Lys Arg Lys Val
1715
<210> 186
<211> 1719
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 186
Met Gly Ser Ser His His His His His His Ser Ser Glu Thr Gly Pro
1 5 10 15
Val Ala Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe
20 25 30
Glu Val Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu
35 40 45
Tyr Glu Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser
50 55 60
Gln Asn Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr
65 70 75 80
Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe
85 90 95
Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe
100 105 110
Leu Ser Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu
115 120 125
Tyr His His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile
130 135 140
Ser Ser Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr
145 150 155 160
Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp
165 170 175
Pro Arg Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr
180 185 190
Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys
195 200 205
Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr
210 215 220
Gln Arg Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly
225 230 235 240
Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asp Lys
245 250 255
Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala
260 265 270
Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu
275 280 285
Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu
290 295 300
Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr
305 310 315 320
Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln
325 330 335
Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His
340 345 350
Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg
355 360 365
His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys
370 375 380
Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp
385 390 395 400
Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys
405 410 415
Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser
420 425 430
Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu
435 440 445
Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile
450 455 460
Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala
465 470 475 480
Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala
485 490 495
Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
500 505 510
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu
515 520 525
Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu
530 535 540
Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg
545 550 555 560
Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys
565 570 575
Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val
580 585 590
Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser
595 600 605
Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu
610 615 620
Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu
625 630 635 640
Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg
645 650 655
Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu
660 665 670
His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp
675 680 685
Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr
690 695 700
Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg
705 710 715 720
Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp
725 730 735
Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Ala Phe Asp
740 745 750
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr
755 760 765
Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr
770 775 780
Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala
785 790 795 800
Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln
805 810 815
Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu
820 825 830
Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
835 840 845
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu
850 855 860
Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu
865 870 875 880
Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
885 890 895
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp
900 905 910
Gly Ala Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser
915 920 925
Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg
930 935 940
Asn Phe Met Ala Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
945 950 955 960
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His
965 970 975
Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
980 985 990
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys
995 1000 1005
Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
1010 1015 1020
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
1025 1030 1035
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
1040 1045 1050
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr
1055 1060 1065
Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile
1070 1075 1080
Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser
1085 1090 1095
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1100 1105 1110
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val
1115 1120 1125
Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1130 1135 1140
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
1145 1150 1155
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
1160 1165 1170
Leu Val Glu Thr Arg Ala Ile Thr Lys His Val Ala Gln Ile Leu
1175 1180 1185
Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile
1190 1195 1200
Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp
1205 1210 1215
Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn
1220 1225 1230
Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr
1235 1240 1245
Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr
1250 1255 1260
Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1265 1270 1275
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1280 1285 1290
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly
1295 1300 1305
Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly
1310 1315 1320
Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys
1325 1330 1335
Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1340 1345 1350
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn
1355 1360 1365
Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1370 1375 1380
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1385 1390 1395
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val
1400 1405 1410
Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu
1415 1420 1425
Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val
1430 1435 1440
Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu
1445 1450 1455
Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
1460 1465 1470
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe
1475 1480 1485
Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu
1490 1495 1500
Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1505 1510 1515
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1520 1525 1530
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn
1535 1540 1545
Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile
1550 1555 1560
His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys
1565 1570 1575
Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1580 1585 1590
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu
1595 1600 1605
Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1610 1615 1620
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
1625 1630 1635
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val
1640 1645 1650
Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His
1655 1660 1665
Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
1670 1675 1680
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp
1685 1690 1695
Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
1700 1705 1710
Lys Lys Lys Arg Lys Val
1715
<210> 187
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 187
ggtgtttcgt cctttccaca ag 22
<210> 188
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 188
gcttgcagat ggccatggcg gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 189
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 189
tgtcacacat gtagttgtag gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 190
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 190
gaagcgcctg gcagtgtacc gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 191
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 191
gagtccgagc agaagaagaa gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 192
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 192
ggaatccctt ctgcagcacc gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 193
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 193
gaacacaaag catagactgc gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 194
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 194
ggcccagact gagcacgtag agttttagag ctagaaatag caagttaaaa taaggc 56
<210> 195
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 195
ggcactgcgg ctggaggtgg gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 196
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 196
gtcatcttag tcattacctg gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 197
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 197
attattatta ttccgcggat ttatttattt atttatttat tt 42
<210> 198
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 198
attattatta ttagctattt atttatttat ttatttattt 40
<210> 199
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 199
attattatta ttcccggatt tatttattta tttatttatt t 41
<210> 200
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 200
aaaaaaagca ccgactcggt g 21
<210> 201
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 201
taatacgact cactataggc cgcggattta tttatttaag ttttagagct agaaatagca 60
<210> 202
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 202
taatacgact cactataggt ccgcggattt atttatttag ttttagagct agaaatagca 60
<210> 203
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 203
taatacgact cactataggt tccgcggatt tatttattag ttttagagct agaaatagca 60
<210> 204
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 204
taatacgact cactatagga ttccgcggat ttatttattg ttttagagct agaaatagca 60
<210> 205
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 205
taatacgact cactataggt attccgcgga tttatttatg tttttagagc tagaaatagc 60
a 61
<210> 206
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 206
taataacgac tcactatagg ttattccgcg gatttattta gtttagagct agaaatagca 60
<210> 207
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 207
taatacgact cactatagga ttattccgcg gatttatttg ttttagagct agaaatagca 60
<210> 208
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 208
taatacgact cactataggt attattccgc ggatttattg ttttagagct agaaatagca 60
<210> 209
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 209
taatacgact cactatagga ttattatccg cggatttatg ttttagagct agaaatagca 60
<210> 210
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 210
taatacgact cactataggt attatattcc gcggatttag ttttagagct agaaatagca 60
<210> 211
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 211
taatacgact cactataggt tattatattc cgcggatttg ttttagagct agaaatagca 60
<210> 212
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 212
taatacgact cactatagga ttattatatt ccgcggattg ttttagagct agaaatagca 60
<210> 213
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 213
taatacgact cactataggt attattatat tccgcggatg ttttagagct agaaatagca 60
<210> 214
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 214
taatacgact cactatagga ttattattat taccgcggag ttttagagct agaaatagca 60
<210> 215
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 215
taatacgact cactatagga ttattattat tattaccgcg ttttagagct agaaatagca 60
<210> 216
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 216
taatacgact cactatagga tattaattta tttatttaag ttttagagct agaaatagca 60
<210> 217
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 217
taatacgact cactataggg gaggacgtgc gcggccgccg ttttagagct agaaatagca 60
<210> 218
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 218
taatacgact cactataggc tgtggcagtg gcaccagaag ttttagagct agaaatagca 60
<210> 219
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 219
taatacgact cactataggg aagcgcctgg cagtgtaccg ttttagagct agaaatagca 60
<210> 220
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 220
taatacgact cactataggc ctcccggccg gcggtatccg ttttagagct agaaatagca 60
<210> 221
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 221
taatacgact cactataggg cttgcagatg gccatggcgg ttttagagct agaaatagca 60
<210> 222
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 222
taatacgact cactatagga cacatgcagt tgtagtggag ttttagagct agaaatagca 60
<210> 223
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 223
taatacgact cactataggt gtcacacatg tagttgtagg ttttagagct agaaatagca 60
<210> 224
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 224
gtaggtagtt aggatgaatg gaaggttggt a 31
<210> 225
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 225
gtccatggat ccagaggtca tccattaaat aaataaatcc gcggggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 226
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 226
gtccatggat ccagaggtca tccataaata aataaatccg cggaagctat accaaccttc 60
cattcatcct aactacctac 80
<210> 227
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 227
gtccatggat ccagaggtca tccataataa ataaatccgc ggaaggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 228
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 228
gtccatggat ccagaggtca tccaaataaa taaatccgcg gaatggctat accaaccttc 60
cattcatcct aaactaccta c 81
<210> 229
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 229
gtccatggat ccagaggtca tccaataaat aaatccgcgg aataggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 230
<211> 82
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 230
gtccatggat ccagaggtca tccaataaat aaatccgcgg aataaggcta tatccaacct 60
tccattcatc ctaactacct ac 82
<210> 231
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 231
gtccatggat ccagaggtca tccaaaataa tccgcggaat aatggctata ccaaccttcc 60
attcatccta actacctac 79
<210> 232
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 232
gtccatggat ccagaggtca tccaaataaa tccgcggaat aataggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 233
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 233
gtccatggat ccagaggtca tccaataaat ccgcggataa taatggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 234
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 234
gtccatggat ccagaggtca tccataaatc cgcggaatat aataggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 235
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 235
gtccatggat ccagaggtca tccaaaatcc gcggaatata ataaggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 236
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 236
gtccatggat ccagaggtca tccaaatccg cggaatataa taatggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 237
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 237
gtccatggat ccagaggtca tccaatccgc ggaatataat aataggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 238
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 238
gtccatggat ccagaggtca tccatccgcg gtaataataa taatggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 239
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 239
gtccatggat ccagaggtca tccagcggta ataataataa taatggctat accaaccttc 60
cattcatcct aactacctac 80
<210> 240
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 240
gtccatggat ccagaggtca tccattaaat aaataaatta atattactat aaccaacctt 60
ccattcatcc taactaccta c 81
<210> 241
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 241
gtaggtagtt aggatgaatg gaaggttggt gtagattatt atcugcggat ttattggatg 60
acctctggat ccatggacat 80
<210> 242
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 242
gcacctcgcc gcggtactgc accaggcggc cgcgcacgtc ctccatgtct accaaccttc 60
cattcatcct aactacctac 80
<210> 243
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 243
cggcgccctc gcgggccccg gcctggtaca ctgccaggcg cttctgcagt accaaccttc 60
cattcatcct aactacctac 80
<210> 244
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 244
ctcttacctg gactctggaa tccattctgg tgccactgcc acagctcctt accaaccttc 60
cattcatcct aactacctac 80
<210> 245
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 245
ggagacgtgc ctgttggaac atcctggata ccgccggccg ggaggagtac taccaacctt 60
ccattcatcc taactaccta c 81
<210> 246
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 246
acccccgccc ggcacccgcg tccgcgccat ggccatctgc aagcagtcat accaaccttc 60
cattcatcct aactacctac 80
<210> 247
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 247
aggttggctc tgactgtacc accatccact acaactgcat gtgtaacagt accaaggttc 60
cattcatcct aactacctac 80
<210> 248
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 248
tggctctgac tgtaccacca tccactacaa ctacatgtgt gacagttcct accaaccttc 60
cattcatcct aactacctac 80
<210> 249
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 249
taatacgact cactataggt tatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 250
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 250
taatacgact cactatagga tatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 251
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 251
taatacgact cactataggc tatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 252
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 252
taatacgact cactataggg tatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 253
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 253
taatacgact cactataggt aatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 254
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 254
taatacgact cactataggt catttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 255
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 255
taatacgact cactataggt gatttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 256
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 256
taatacgact cactataggt tttttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 257
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 257
taatacgact cactataggt tctttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 258
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 258
taatacgact cactataggt tgtttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 259
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 259
taatacgact cactataggt taattcgtgg atttatttag ttttagagct agaaatagca 60
<210> 260
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 260
taatacgact cactataggt tacttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 261
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 261
taatacgact cactataggt tagttcgtgg atttatttag ttttagagct agaaatagca 60
<210> 262
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 262
taatacgact cactataggt tatatcgtgg atttatttag ttttagagct agaaatagca 60
<210> 263
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 263
taatacgact cactataggt tatctcgtgg atttatttag ttttagagct agaaatagca 60
<210> 264
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 264
taatacgact cactataggt tatgtcgtgg atttatttag ttttagagct agaaatagca 60
<210> 265
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 265
taatacgact cactataggt tattatcgtg gatttattta gttttagagc tagaaatagc 60
a 61
<210> 266
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 266
taatacgact cactataggt tattctcgtg gatttattta gttttagagc tagaaatagc 60
a 61
<210> 267
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 267
taatacgact cactataggt tattgtcgtg gatttattta gttttagagc tagaaatagc 60
a 61
<210> 268
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 268
taatacgact cactataggt tatttcatgg atttatttag ttttagagct agaaatagca 60
<210> 269
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 269
taatacgact cactataggt tatttcttgg atttatttag ttttagagct agaaatagca 60
<210> 270
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 270
taatacgact cactataggt tatttcctgg atttatttag ttttagagct agaaatagca 60
<210> 271
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 271
taatacgact cactataggt tatttcgagg atttatttag ttttagagct agaaatagca 60
<210> 272
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 272
taatacgact cactataggt tatttcgcgg atttatttag ttttagagct agaaatagca 60
<210> 273
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 273
taatacgact cactataggt tatttcgggg atttatttag ttttagagct agaaatagca 60
<210> 274
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 274
taatacgact cactataggt tatttcgtag atttatttag ttttagagct agaaatagca 60
<210> 275
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 275
taatacgact cactataggt tatttcgttg atttatttag ttttagagct agaaatagca 60
<210> 276
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 276
taatacgact cactataggt tatttcgtcg atttatttag ttttagagct agaaatagca 60
<210> 277
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 277
taatacgact cactataggt tatttcgtga atttatttag ttttagagct agaaatagca 60
<210> 278
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 278
taatacgact cactataggt tatttcgtgt atttatttag ttttagagct agaaatagca 60
<210> 279
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 279
taatacgact cactataggt tatttcgtgc atttatttag ttttagagct agaaatagca 60
<210> 280
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 280
taatacgact cactataggt tatttcgtgg ttttatttag ttttagagct agaaatagca 60
<210> 281
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 281
taatacgact cactataggt tatttcgtgg ctttatttag ttttagagct agaaatagca 60
<210> 282
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 282
taatacgact cactataggt tatttcgtgg gtttatttag ttttagagct agaaatagca 60
<210> 283
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 283
taatacgact cactataggt tatttcgtgg aattatttag ttttagagct agaaatagca 60
<210> 284
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 284
taatacgact cactataggt tatttcgtgg acttatttag ttttagagct agaaatagca 60
<210> 285
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 285
taatacgact cactataggt tatttcgtgg agttatttag ttttagagct agaaatagca 60
<210> 286
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 286
taatacgact cactataggt tccccccccg atttatttag ttttagagct agaaatagca 60
<210> 287
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 287
taatacgact cactataggc gcacccgtgg atttatttag ttttagagct agaaatagca 60
<210> 288
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 288
taatacgact cactataggc tcgcacgtgg atttatttag ttttagagct agaaatagca 60
<210> 289
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 289
taatacgact cactataggc cctcgcgtgg atttatttag ttttagagct agaaatagca 60
<210> 290
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 290
taatacgact cactataggc accctcgtgg atttatttag ttttagagct agaaatagca 60
<210> 291
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 291
taatacgact cactataggt cgcacccgtg gatttattag ttttagagct agaaatagca 60
<210> 292
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 292
taatacgact cactataggc ctcgcacgtg gatttattag ttttagagct agaaatagca 60
<210> 293
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 293
taatacgact cactatagga ccctcgcgtg gatttattag ttttagagct agaaatagca 60
<210> 294
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 294
taatacgact cactataggg caccctcgtg gatttattag ttttagagct agaaatagca 60
<210> 295
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 295
taatacgact cactataggg agtccgagca gaagaagaag ttttagagct agaaatagca 60
<210> 296
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 296
taatacgact cactataggg gaatcccttc tgcagcaccg ttttagagct agaaatagca 60
<210> 297
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 297
taatacgact cactataggg aacacaaagc atagactgcg ttttagagct agaaatagca 60
<210> 298
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 298
taatacgact cactataggg gcccagactg agcacgtgag ttttagagct agaaatagca 60
<210> 299
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 299
taatacgact cactataggg gcactgcggc tggaggtggg ttttagagct agaaatagca 60
<210> 300
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 300
taatacgact cactataggg tcatcttagt cattacctgg ttttagagct agaaatagca 60
<210> 301
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 301
acgtaaacgg ccacaagttc ttatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 302
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 302
acgtaaacgg ccacaagttc atatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 303
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 303
acgtaaacgg ccacaagttc ctatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 304
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 304
acgtaaacgg ccacaagttc gtatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 305
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 305
acgtaaacgg ccacaagttc taatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 306
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 306
acgtaaacgg ccacaagttc tcatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 307
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 307
acgtaaacgg ccacaagttc tgatttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 308
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 308
acgtaaacgg ccacaagttc ttttttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 309
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 309
acgtaaacgg ccacaagttc ttctttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 310
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 310
acgtaaacgg ccacaagttc ttgtttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 311
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 311
acgtaaacgg ccacaagttc ttaattcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 312
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 312
acgtaaacgg ccacaagttc ttacttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 313
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 313
acgtaaacgg ccacaagttc ttagttcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 314
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 314
acgtaaacgg ccacaagttc ttatatcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 315
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 315
acgtaaacgg ccacaagttc ttatctcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 316
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 316
acgtaaacgg ccacaagttc ttatgtcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 317
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 317
acgtaaacgg ccacaagttc ttattacgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 318
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 318
acgtaaacgg ccacaagttc ttattccgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 319
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 319
acgtaaacgg ccacaagttc ttattgcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 320
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 320
acgtaaacgg ccacaagttc ttatttcatg gatttattta tggcatcttc ttcaaggacg 60
<210> 321
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 321
acgtaaacgg ccacaagttc ttatttcttg gatttattta tggcatcttc ttcaaggacg 60
<210> 322
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 322
acgtaaacgg ccacaagttc ttatttcctg gatttattta tggcatcttc ttcaaggacg 60
<210> 323
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 323
acgtaaacgg ccacaagttc ttatttcgaa gatttattta tggcatcttc ttcaaggacg 60
<210> 324
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 324
acgtaaacgg ccacaagttc ttatttcgac gatttattta tggcatcttc ttcaaggacg 60
<210> 325
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 325
acgtaaacgg ccacaagttc ttatttcgag gatttattta tggcatcttc ttcaaggacg 60
<210> 326
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 326
acgtaaacgg ccacaagttc ttatttcgta gatttattta tggcatcttc ttcaaggacg 60
<210> 327
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 327
acgtaaacgg ccacaagttc ttatttcgtt gatttattta tggcatcttc ttcaaggacg 60
<210> 328
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 328
acgtaaacgg ccacaagttc ttatttcgtc gatttattta tggcatcttc ttcaaggacg 60
<210> 329
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 329
acgtaaacgg ccacaagttc ttatttcgtg aatttattta tggcatcttc ttcaaggacg 60
<210> 330
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 330
acgtaaacgg ccacaagttc ttatttcgtg tatttattta tggcatcttc ttcaaggacg 60
<210> 331
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 331
acgtaaacgg ccacaagttc ttatttcgtg catttattta tggcatcttc ttcaaggacg 60
<210> 332
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 332
acgtaaacgg ccacaagttc ttatttcgtg gttttattta tggcatcttc ttcaaggacg 60
<210> 333
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 333
acgtaaacgg ccacaagttc ttatttcgtg gctttattta tggcatcttc ttcaaggacg 60
<210> 334
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 334
acgtaaacgg ccacaagttc ttatttcgtg ggtttattta tggcatcttc ttcaaggacg 60
<210> 335
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 335
acgtaaacgg ccacaagttc ttatttcgtg gaattattta tggcatcttc ttcaaggacg 60
<210> 336
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 336
acgtaaacgg ccacaagttc ttatttcgtg gacttattta tggcatcttc ttcaaggacg 60
<210> 337
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 337
acgtaaacgg ccacaagttc ttatttcgtg gagttattta tggcatcttc ttcaaggacg 60
<210> 338
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 338
acgtaaacgg ccacaaagtt tcgcacccgt ggatttattt atggcatctt cttcaaggac 60
g 61
<210> 339
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 339
acgtaaacgg ccacaagttc ctcgcacgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 340
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 340
acgtaaacgg ccacaagtta ccctcgcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 341
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 341
acgtaaacgg ccacaagttg caccctcgtg gatttattta tggcatcttc ttcaaggacg 60
<210> 342
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 342
acgtaaacgg ccacaagtat tcgcacccgt ggatttatta tggcatcttc ttcaaggacg 60
<210> 343
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 343
acgtaaacgg ccacaagtat cctcgcacgt ggatttatta tggcatcttc ttcaaggacg 60
<210> 344
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 344
acgtaaacgg ccacaagtat accctcgcgt ggatttatta tggcatcttc ttcaaggacg 60
<210> 345
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 345
acgtaaacgg ccacaagtat gcaccctcgt ggatttatta tggcatcttc ttcaaggacg 60
<210> 346
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 346
gtaggtagtt aggatgaatg gaaggttggt aggcctgagt ccgagcagaa gaagaagggc 60
tcccatcaca tcaaccggtg 80
<210> 347
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 347
gtaggtagtt aggatgaatg gaaggttggt actcatggaa tcccttctgc agcacctgga 60
tcgcttttcc gagcttctgg 80
<210> 348
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 348
gtaggtagtt aggatgaatg gaaggttggt aaactggaac acaaagcata gactgcgggg 60
cgggccagcc tgaatagctg 80
<210> 349
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 349
gtaggtagtt aggatgaatg gaaggttggt acttggggcc cagactgagc acgtgatggc 60
agaggaaagg aagccctgct 80
<210> 350
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 350
gtaggtagtt aggatgaatg gaaggttggt accggtggca ctgcggctgg aggtgggggt 60
taaagcggag actctggtgc 80
<210> 351
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 351
gtaggtagtt aggatgaatg gaaggttggt atggcagtca tcttagtcat tacctgaggt 60
gttcgttgta actcatataa 80
<210> 352
<211> 81
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 352
gtaggtagtt aggatgaatg gaaggttggt atggcagtca tcttagtcat taccttgagg 60
tgttcgttgt aactcatata a 81
<210> 353
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 353
acactctttc cctacacgac gctcttccga tctnnnnacg taaacggcca caa 53
<210> 354
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 354
tggagttcag acgtgtgctc ttccgatctc gtccttgaag aagatgc 47
<210> 355
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 355
acactctttc cctacacgac gctcttccga tctnnnngta ggtagttagg atgaatggaa 60
<210> 356
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 356
tggagttcag acgtgtgctc ttccgatctc accggttgat gtgatgg 47
<210> 357
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 357
tggagttcag acgtgtgctc ttccgatctc cagaagctcg gaaaagc 47
<210> 358
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 358
tggagttcag acgtgtgctc ttccgatctc agctattcag gctggc 46
<210> 359
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 359
tggagttcag acgtgtgctc ttccgatcta gcagggcttc ctttc 45
<210> 360
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 360
tggagttcag acgtgtgctc ttccgatctg caccagagtc tccg 44
<210> 361
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 361
tggagttcag acgtgtgctc ttccgatctt tatatgagtt acaacgaaca cc 52
<210> 362
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 362
acactctttc cctacacgac gctcttccga tctnnnncag ctcagcctga gtgttga 57
<210> 363
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 363
tggagttcag acgtgtgctc ttccgatctc tcgtgggttt gtggttgc 48
<210> 364
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 364
acactctttc cctacacgac gctcttccga tctnnnncat tgcagagagg cgtatca 57
<210> 365
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 365
tggagttcag acgtgtgctc ttccgatctg gggtcccagg tgctgac 47
<210> 366
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 366
acactctttc cctacacgac gctcttccga tctnnnncca gccccatctg tcaaact 57
<210> 367
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 367
tggagttcag acgtgtgctc ttccgatctt gaatggattc ttggaaacaa tga 53
<210> 368
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 368
acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57
<210> 369
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 369
tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49
<210> 370
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 370
acactctttc cctacacgac gctcttccga tctnnnngaa cccaggtagc cagagac 57
<210> 371
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 371
tggagttcag acgtgtgctc ttccgatctt cctttcaacc cgaacggag 49
<210> 372
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 372
acactctttc cctacacgac gctcttccga tctnnnnctc ttctttattt ccagcaatgt 60
<210> 373
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 373
tggagttcag acgtgtgctc ttccgatctg ttttcatgtt ctaaaaatgt atccca 56
<210> 374
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 374
acactctttc cctacacgac gctcttccga tctnnnntac agtactcccc tgccctc 57
<210> 375
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 375
tggagttcag acgtgtgctc ttccgatctg ctgctcacca tcgctatct 49
<210> 376
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 376
acactctttc cctacacgac gctcttccga tctnnnncct catcttgggc ctgtgtt 57
<210> 377
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 377
tggagttcag acgtgtgctc ttccgatcta aatcggtaag aggtgggcc 49
<210> 378
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 378
acactctttc cctacacgac gctcttccga tctnnnngcg gacatggagg acgtg 55
<210> 379
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 379
tggagttcag acgtgtgctc ttccgatctc tgttccacca ggggccc 47
<210> 380
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 380
acactctttc cctacacgac gctcttccga tctnnnntgc ccaatcattg atgctttt 58
<210> 381
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 381
tggagttcag acgtgtgctc ttccgatcta gaaacattta ccatagacta tcacct 56
<210> 382
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 382
acactctttc cctacacgac gctcttccga tctnnnnagt agcctctttc tcaatgtgc 59
<210> 383
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 383
tggagttcag acgtgtgctc ttccgatctg ctttcacaag gatgcagtct 50
<210> 384
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 384
acactctttc cctacacgac gctcttccga tctnnnngag ctagactccg agggga 56
<210> 385
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 385
tggagttcag acgtgtgctc ttccgatctt cctcgtcctg ctctcactt 49
<210> 386
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 386
acactctttc cctacacgac gctcttccga tctnnnnaga ggctgaagag gaagacca 58
<210> 387
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 387
tggagttcag acgtgtgctc ttccgatctg gcccagctgt gcattctat 49
<210> 388
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 388
acactctttc cctacacgac gctcttccga tctnnnncca agagggccaa gtcctg 56
<210> 389
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 389
tggagttcag acgtgtgctc ttccgatctc agcgaggagt gacagcc 47
<210> 390
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 390
acactctttc cctacacgac gctcttccga tctnnnncac tccacctgat ctcgggg 57
<210> 391
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 391
tggagttcag acgtgtgctc ttccgatctc gaggagggag ggagcag 47
<210> 392
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 392
acactctttc cctacacgac gctcttccga tctnnnnacc acaaatgccc aagagac 57
<210> 393
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 393
tggagttcag acgtgtgctc ttccgatctg acacagtcaa gggccgg 47
<210> 394
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 394
acactctttc cctacacgac gctcttccga tctnnnnccc acctttgagg aggcaaa 57
<210> 395
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 395
tggagttcag acgtgtgctc ttccgatctt tccatctgag aagagagtgg t 51
<210> 396
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 396
acactctttc cctacacgac gctcttccga tctnnnngtc ataccttggc ccttcct 57
<210> 397
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 397
tggagttcag acgtgtgctc ttccgatctt ccctaggccc acaccag 47
<210> 398
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 398
acactctttc cctacacgac gctcttccga tctnnnnaac ccactgaaga agcaggg 57
<210> 399
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 399
tggagttcag acgtgtgctc ttccgatctg gtgcttaatc cggctccat 49
<210> 400
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 400
acactctttc cctacacgac gctcttccga tctnnnntcc agtgtttcca tcccgaa 57
<210> 401
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 401
tggagttcag acgtgtgctc ttccgatctc ctctgacctc cacaactct 49
<210> 402
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 402
acactctttc cctacacgac gctcttccga tctnnnnctg ggtacagttc tgcgtgt 57
<210> 403
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 403
tggagttcag acgtgtgctc ttccgatctt cactctgagc atcgccaag 49
<210> 404
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 404
acactctttc cctacacgac gctcttccga tctnnnnggt ttagagccag tgaactagag 60
<210> 405
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 405
tggagttcag acgtgtgctc ttccgatctg caagacaaaa tcctctttat actttg 56
<210> 406
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 406
acactctttc cctacacgac gctcttccga tctnnnnggg aggggacggc cttac 55
<210> 407
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 407
tggagttcag acgtgtgctc ttccgatctg cctctggcga acatggc 47
<210> 408
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 408
acactctttc cctacacgac gctcttccga tctnnnntcc tggttaagag catgggc 57
<210> 409
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 409
tggagttcag acgtgtgctc ttccgatctg attgagtccc cacagcaca 49
<210> 410
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 410
acactctttc cctacacgac gctcttccga tctnnnncca gtgtttccca tccccaa 57
<210> 411
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 411
tggagttcag acgtgtgctc ttccgatctt gacctccaca actggaaaat 50
<210> 412
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 412
acactctttc cctacacgac gctcttccga tctnnnngct tccagaccca cctgaag 57
<210> 413
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 413
tggagttcag acgtgtgctc ttccgatcta ccgaggaaaa ttgcttgtcg 50
<210> 414
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 414
acactctttc cctacacgac gctcttccga tctnnnngtg tggagagtga gtaagcca 58
<210> 415
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 415
tggagttcag acgtgtgctc ttccgatcta cggtaggatg atttcaggca 50
<210> 416
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 416
acactctttc cctacacgac gctcttccga tctnnnncac aaagcagtgt agctcagg 58
<210> 417
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 417
tggagttcag acgtgtgctc ttccgatctt ttttggtact cgagtgttat tcag 54
<210> 418
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 418
acactctttc cctacacgac gctcttccga tctnnnntcc cctgttgacc tggagaa 57
<210> 419
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 419
tggagttcag acgtgtgctc ttccgatctc actgtacttg ccctgacca 49
<210> 420
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 420
acactctttc cctacacgac gctcttccga tctnnnnttg gtgttgacag ggagcaa 57
<210> 421
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 421
tggagttcag acgtgtgctc ttccgatctc tgagatgtgg gcagaaggg 49
<210> 422
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 422
acactctttc cctacacgac gctcttccga tctnnnntga gagggaacag aagggct 57
<210> 423
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 423
tggagttcag acgtgtgctc ttccgatgtg tccaaaggcc caagaacct 49
<210> 424
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 424
acactctttc cctacacgac gctcttccga tctnnnntcc tagcactttg gaaggtcg 58
<210> 425
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 425
tggagttcag acgtgtgctc ttccgatctg ctcatcttaa tctgctcagc c 51
<210> 426
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 426
acactctttc cctacacgac gctcttccga tctnnnnaaa ggagcagctc ttcctgg 57
<210> 427
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 427
tggagttcag acgtgtgctc ttccgatctg tctgcaccat ctcccacaa 49
<210> 428
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 428
acactctttc cctacacgac gctcttccga tctnnnnggc atggcttctg agactca 57
<210> 429
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 429
tggagttcag acgtgtgctc ttccgatctg tctcccttgc actccctgtc ttt 53
<210> 430
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 430
acactctttc cctacacgac gctcttccga tctnnnnttt ggcaatggag gcattgg 57
<210> 431
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 431
tggagttcag acgtgtgctc ttccgatctg aagaggctgc ccatgagag 49
<210> 432
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 432
acactctttc cctacacgac gctcttccga tctnnnnggt ctgaggctcg aatcctg 57
<210> 433
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 433
tggagttcag acgtgtgctc ttccgatctc tgtggcctcc atatccctg 49
<210> 434
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 434
acactctttc cctacacgac gctcttccga tctnnnnttt ccaccagaac tcagccc 57
<210> 435
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 435
tggagttcag acgtgtgctc ttccgatctc ctcggttcct ccacaacac 49
<210> 436
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 436
acactctttc cctacacgac gctcttccga tctnnnncac gggaaggaca ggagaag 57
<210> 437
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 437
tggagttcag acgtgtgctc ttccgatctg caggggaggg ataaagcag 49
<210> 438
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 438
acactctttc cctacacgac gctcttccga tctnnnngtc agtctcggcc cctca 55
<210> 439
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 439
tggagttcag acgtgtgctc ttccgatctg ccactgtaaa gctcttggg 49
<210> 440
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (35)..(38)
<223> n is a, c, g, or t
<400> 440
acactctttc cctacacgaa cgctcttccg atctnnnnag ggtagaggga cagagctg 58
<210> 441
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 441
tggagttcag acgtgtgctc ttccgatctg gaccccacat agtcagtgc 49
<210> 442
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 442
acactctttc cctacacgac gctcttccga tctnnnngct gtcagcccta tctccatc 58
<210> 443
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 443
tggagttcag acgtgtgctc ttccgatctt gggcaattag gacagggac 49
<210> 444
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 444
acactctttc cctacacgac gctcttccga tctnnnngca gcggaggagg tagattg 57
<210> 445
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 445
tggagttcag acgtgtgctc ttccgatctc tcagtacctg gagtcccga 49
<210> 446
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 446
acactctttc cctacacgac gctcttccga tctnnnngac aggctcagga aagctgt 57
<210> 447
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 447
tggagttcag acgtgtgctc ttccgatcta cacaagcctt tctccaggg 49
<210> 448
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 448
acactctttc cctacacgac gctcttccga tctnnnnaat agggggtgag actgggg 57
<210> 449
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 449
tggagttcag acgtgtgctc ttccgatctg cctcagacga gacttgagg 49
<210> 450
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 450
acactctttc cctacacgac gctcttccga tctnnnnggc cagcaggaaa ggaatct 57
<210> 451
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 451
tggagttcag acgtgtgctc ttccgatctt gactgcacct gtagccatg 49
<210> 452
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 452
acactctttc cctacacgac gctcttccga tctnnnntca aggaaatcac cctgccc 57
<210> 453
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 453
tggagttcag acgtgtgctc ttccgatcta acttccttgg tgtgcagct 49
<210> 454
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 454
acactctttc cctacacgac gctcttccga tctnnnnatg ggctcagcta cgtcatg 57
<210> 455
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 455
tggagttcag acgtgtgctc ttccgatcta atcgcagtgt ggtgggcaa 49
<210> 456
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 456
acactctttc cctacacgac gctcttccga tctnnnncgc acatcccttg tctctct 57
<210> 457
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 457
tggagttcag acgtgtgctc ttccgatctc tactggagca caccccaag 49
<210> 458
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 458
acactctttc cctacacgac gctcttccga tctnnnntgg gtcacgtagc tttggtc 57
<210> 459
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 459
tggagttcag acgtgtgctc ttccgatctt gtggccatgt gcaactaa 48
<210> 460
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 460
acactctttc cctacacgac gctcttccga tctnnnncta ctacgtgcca gctcagg 57
<210> 461
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 461
tggagttcag acgtgtgctc ttccgatcta cctcccctcc tcactaacc 49
<210> 462
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 462
acactctttc cctacacgac gctcttccga tctnnnngcc tcagctccat ttcctgt 57
<210> 463
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 463
tggagttcag acgtgtgctc ttccgatcta acctttatgg caccagggg 49
<210> 464
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 464
acactctttc cctacacgac gctcttccga tctnnnngag ctcagcatta gcaggct 57
<210> 465
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 465
tggagttcag acgtgtgctc ttccgatctt tcctggcttt ccgattccc 49
<210> 466
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 466
acactctttc cctacacgac gctcttccga tctnnnngtg caattggagg aggagct 57
<210> 467
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 467
tggagttcag acgtgtgctc ttccgatctc accagctaca ggcagaaca 49
<210> 468
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 468
acactctttc cctacacgac gctcttccga tctnnnncct acccccaaca cagatgg 57
<210> 469
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 469
tggagttcag acgtgtgctc ttccgatctc cacacaactc aggtcctcc 49
<210> 470
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 470
tcatctgtgc ccctccctcc ctggcccagg tgaaggtgtg gttccagaac cggaggacaa 60
agtacaaacg gcagaagctg gaggaggaag ggcctgagtt tgagcagaag aagaagggct 120
cccatcacat caaccggtgg cgcattgcca cgaagcaggc caatggggag gacatcgatg 180
tcacctccaa tgactagggt 200
<210> 471
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 471
accctagtca ttggaggtga catcgatctc ctccccattg gcctgcttcg tggcaatgcg 60
ccaccggttg atgtgatggg agcccttctt cttctgctca aactcaggcc cttcctcctc 120
cagcttctgc cgtttgtact ttgtcctccg gttctggaac cacaccttca cctgggccag 180
ggagggaggg gcacagatga 200
<210> 472
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 472
catgcaatta gtctatttct gctgcaagta agcatgcatt tgtaggcttg atgctttttt 60
tctgcttctc cagccctggc ctgggtcaat ccttggggct tagactgagc acgtgatggc 120
agaggaaagg aagccctgct tcctccagag ggcgtcgcag gacagctttt cctagacagg 180
gggctagtat gtgcagctcc t 201
<210> 473
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 473
aggagctgca catactagcc cctgtctagg aaaagctgtc ctgcgacgcc ctctggagga 60
agcagggctt cctttcctct gccatcacgt gctcagtcta agccccaagg attgacccag 120
gccagggctg gagaagcaga aaaaaagcat caagcctaca aatgcatgct tacttgcagc 180
agaaatagac taattgcatc 200
<210> 474
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 474
ggctgacaaa ggccgggctg ggtggaagga agggaggaag ggcgaggcag agggtccaaa 60
gcaggatgac aggcaggggc accgcggcgc cccggtggca ttgcggctgg aggtgggggt 120
taaagcggag actctggtgc tgtgtgacta cagtgggggc cctgccctct ctgagccccc 180
gcctccaggc ctgtgtgtgt 200
<210> 475
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 475
acacacacag gcctggaggc gggggctcag agagggcagg gcccccactg tagtcacaca 60
gcaccagagt ctccgcttta acccccacct ccagccgcaa tgccaccggg gcgccgcggt 120
gcccctgcct gtcatcctgc tttggaccct ctgcctcgcc cttcctccct tccttccacc 180
cagcccggcc tttgtcagcc 200
<210> 476
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 476
agcaccgagg agctgcgggt gcgcctcgcc tcccacctgc gcaagctgcg taagcggctc 60
ctccgcgatg ccgatgacct gcagaagtgc ctggcagtgt accaggccgg ggcccgcgag 120
ggcgccgagc gcggcctcag cgccatccgc gagcgcctgg ggcccctggt ggaacagggc 180
cgcgtgcggg ccgccactgt 200
<210> 477
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 477
acagtggcgg cccgcacgcg gccctgttcc accaggggcc ccaggcgctc gcggatggcg 60
ctgaggccgc gctcggcgcc ctcgcgggcc ccggcctggt acactgccag gcacttctgc 120
aggtcatcgg catcgcggag gagccgctta cgcagcttgc gcaggtggga ggcgaggcgc 180
acccgcagct cctcggtgct 200
<210> 478
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 478
actcccctgc cctcaacaag atgttttgcc aactggccaa gacctgccct gtgcagctgt 60
gggttgattc cacacccccg cccggcaccc gcgtccgcgc catggccatc tacaagcagt 120
cacagcacat gacggaggtt gtgaggcgct gcccccacca tgagcgctgc tcagatagcg 180
atggtgagca gctggggctg 200
<210> 479
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 479
cagccccagc tgctcaccat cgctatctga gcagcgctca tggtgggggc agcgcctcac 60
aacctccgtc atgtgctgtg actgcttgta gatggccatg gcgcggacgc gggtgccggg 120
cgggggtgtg gaatcaaccc acagctgcac agggcaggtc ttggccagtt ggcaaaacat 180
cttgttgagg gcaggggagt 200
<210> 480
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 480
gagtccgagc agaagaagaa ggg 23
<210> 481
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 481
gagtctaagc agaagaagaa gag 23
<210> 482
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 482
gaggccgagc agaagaaaga cgg 23
<210> 483
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 483
gagtcctagc aggagaagaa gag 23
<210> 484
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 484
ggcccagact gagcacgtga tgg 23
<210> 485
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 485
cacccagact gagcacgtgc tgg 23
<210> 486
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 486
gacacagact gggcacgtga ggg 23
<210> 487
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 487
agctcagact gagcaagtga ggg 23
<210> 488
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 488
gaccccctcc accccgcctc cgg 23
<210> 489
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 489
ctacccctcc accccgcctc cgg 23
<210> 490
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 490
attccccccc accccgcctc agg 23
<210> 491
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 491
acaccccccc accccgcctc agg 23
<210> 492
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 492
tgcccccccc accccacctc tgg 23
<210> 493
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 493
ggaatccctt ctgcagcacc tgg 23
<210> 494
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 494
ggaaccccgt ctgcagcacc agg 23
<210> 495
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 495
ggagtccctc ctacagcacc agg 23
<210> 496
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 496
agaggcccct ctgcagcacc agg 23
<210> 497
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 497
gaccccctcc accccgcctc cgg 23
<210> 498
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 498
tcccccctcc accccacctc cgg 23
<210> 499
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 499
tgcccacctc accccgcctc tgg 23
<210> 500
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 500
gcccctccca accccacctc tgg 23
<210> 501
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 501
cacccccctc accccgcctc agg 23
<210> 502
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 502
acactctttc cctacacgac gctcttccga tctnnnn 37
<210> 503
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 503
tggagttcag acgtgtgctc ttccgatct 29
<210> 504
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (30)..(37)
<223> n is a, c, g, or t
<400> 504
aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgac 57
<210> 505
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (25)..(31)
<223> n is a, c, g, or t
<400> 505
caagcagaag acggcatacg agatnnnnnn ngtgactgga gttcagacgt gtgctcttc 59
<210> 506
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 506
acactctttc cctacacgac gctcttccga tctnnnntcc tacaagtaac agtccaagaa 60
<210> 507
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 507
tggagttcag acgtgtgctc ttccgatctt tctgcaactt aacttacgtg aaa 53
<210> 508
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 508
acactctttc cctacacgac gctcttccga tctnnnnacc aagcccattt gtccagg 57
<210> 509
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 509
tggagttcag acgtgtgctc ttccgatctt ccttcttttt gagctttggg c 51
<210> 510
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 510
acactctttc cctacacgac gctcttccga tctnnnntcc ataccagcag cagttcc 57
<210> 511
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 511
tggagttcag acgtgtgctc ttccgatctc tcacctcagc tcctgcac 48
<210> 512
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 512
acactctttc cctacacgac gctcttccga tctnnnnccc actgattcta caccatggt 59
<210> 513
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 513
tggagttcag acgtgtgctc ttccgatctg gagttcccaa cctttttgac a 51
<210> 514
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 514
acactctttc cctacacgac gctcttccga tctnnnnctg gctggagatt cagagacac 59
<210> 515
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 515
tggagttcag acgtgtgctc ttccgatctc tgccccttct gacacacata c 51
<210> 516
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 516
acactctttc cctacacgac gctcttccga tctnnnnacc cctcaaggct tgacatttc 59
<210> 517
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 517
tggagttcag acgtgtgctc ttccgatctt gaaaagttgg gagaggggat g 51
<210> 518
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 518
acactctttc cctacacgac gctcttccga tctnnnnttt gtaccccagt cccctcatc 59
<210> 519
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 519
tggagttcag acgtgtgctc ttccgatctt gaagttacgg ggatgtcact tg 52
<210> 520
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 520
acactctttc cctacacgac gctcttccga tctnnnntta acatccagtc tcccaaacac 60
a 61
<210> 521
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 521
tggagttcag acgtgtgctc ttccgatcta cacacacaca ctactaggac a 51
<210> 522
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 522
acactctttc cctacacgac gctcttccga tctnnnncgc tactacggag cgagaag 57
<210> 523
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 523
tggagttcag acgtgtgctc ttccgatcta caggggcaaa gtgagtgac 49
<210> 524
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 524
aaaaaaagca ccgactcggt gccac 25
<210> 525
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 525
taatacgact cactataggg agtccgagca gaagaagaag ttttagagct agaaatagca 60
<210> 526
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 526
taatacgact cactataggg gaatcccttc tgcagcaccg ttttagagct agaaatagca 60
<210> 527
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 527
taatacgact cactataggg gcccagactg agcacgtgag ttttagagct agaaatagca 60
<210> 528
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 528
taatacgact cactatagga ccccctccac cccgcctcgt tttagagcta gaaatagca 59
<210> 529
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 529
taatacgact cactataggt ctctctctct ctctctctcg ttttagagct agaaatagca 60
<210> 530
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 530
ggtgtttcgt cctttccaca ag 22
<210> 531
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 531
gaccccctcc accccgcctc gttttagagc tagaaatagc aagttaaaat aaggc 55
<210> 532
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 532
acgtaaacgg ccacaagttc gcggcgatcg tctctctctc tctctctctc tggatcgcct 60
ggcatcttct tcaaggacg 79
<210> 533
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 533
cgtccttgaa gaagatgcca ggcgatccag agagagagag agagagagac gatcgccgcg 60
aacttgtggc cgtttacgt 79
<210> 534
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 534
acactctttc cctacacgac gctcttccga tctnnnncag ctcagcctga gtgttga 57
<210> 535
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 535
tggagttcag acgtgtgctc ttccgatctc tcgtgggttt gtggttgc 48
<210> 536
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 536
acactctttc cctacacgac gctcttccga tctnnnncat tgcagagagg cgtatca 57
<210> 537
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 537
tggagttcag acgtgtgctc ttccgatctg gggtcccagg tgctgac 47
<210> 538
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 538
acactctttc cctacacgac gctcttccga tctnnnnatg tgggctgcct agaaagg 57
<210> 539
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 539
tggagttcag acgtgtgctc ttccgatctc ccagccaaac ttgtcaacc 49
<210> 540
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 540
acactctttc cctacacgac gctcttccga tctnnnnagt agcctctttc tcaatgtgc 59
<210> 541
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 541
tggagttcag acgtgtgctc ttccgatctg ctttcacaag gatgcagtct 50
<210> 542
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 542
acactctttc cctacacgac gctcttccga tctnnnngag ctagactccg agggga 56
<210> 543
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 543
tggagttcag acgtgtgctc ttccgatctt cctcgtcctg ctctcactt 49
<210> 544
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 544
acactctttc cctacacgac gctcttccga tctnnnnaga ggctgaagag gaagacca 58
<210> 545
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 545
tggagttcag acgtgtgctc ttccgatctg gcccagctgt gcattctat 49
<210> 546
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 546
acactctttc cctacacgac gctcttccga tctnnnnaac ccactgaaga agcaggg 57
<210> 547
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 547
tggagttcag acgtgtgctc ttccgatctg gtgcttaatc cggctccat 49
<210> 548
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 548
acactctttc cctacacgac gctcttccga tctnnnntcc agtgtttcca tcccgaa 57
<210> 549
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 549
tggagttcag acgtgtgctc ttccgatctc ctctgacctc cacaactct 49
<210> 550
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 550
acactctttc cctacacgac gctcttccga tctnnnnctg ggtacagttc tgcgtgt 57
<210> 551
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 551
tggagttcag acgtgtgctc ttccgatctt cactctgagc atcgccaag 49
<210> 552
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 552
acactctttc cctacacgac gctcttccga tctnnnntcc cctgttgacc tggagaa 57
<210> 553
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 553
tggagttcag acgtgtgctc ttccgatctc actgtacttg ccctgacca 49
<210> 554
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 554
acactctttc cctacacgac gctcttccga tctnnnnttg gtgttgacag ggagcaa 57
<210> 555
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 555
tggagttcag acgtgtgctc ttccgatctc tgagatgtgg gcagaaggg 49
<210> 556
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 556
acactctttc cctacacgac gctcttccga tctnnnntga gagggaacag aagggct 57
<210> 557
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 557
tggagttcag acgtgtgctc ttccgatctg tccaaaggcc caagaacct 49
<210> 558
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 558
acactctttc cctacacgac gctcttccga tctnnnngtt cccccgagtc tgcacct 57
<210> 559
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 559
tggagttcag acgtgtgctc ttccgatctc gaacttgcat tcgccgcaa 49
<210> 560
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 560
acactctttc cctacacgac gctcttccga tctnnnnttc tgccttggca tcgggtg 57
<210> 561
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 561
tggagttcag acgtgtgctc ttccgatctc accataccgc ccctagaact aacattc 57
<210> 562
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (34)..(37)
<223> n is a, c, g, or t
<400> 562
acactctttc cctacacgac gctcttccga tctnnnnaca actgctttcc atggtgtgt 59
<210> 563
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 563
tggagttcag acgtgtgctc ttccgatctt cccagggctt tcgtggaga 49
<210> 564
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 564
gtcaggtcga gggttctgtc agg 23
<210> 565
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 565
cttccaggat gagaacacag agg 23
<210> 566
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 566
caaccactgc tcaaagatgc tgg 23
<210> 567
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 567
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 568
<211> 1372
<212> PRT
<213> Streptococcus gallolyticus
<400> 568
Met Thr Lys Lys Asn Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser
1 5 10 15
Val Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ala Lys Lys
20 25 30
Met Lys Val Leu Gly Asn Thr Asp Lys Lys Tyr Ile Lys Lys Asn Leu
35 40 45
Leu Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
50 55 60
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Leu
65 70 75 80
Arg Tyr Leu Gln Glu Ile Phe Ala Asn Glu Ile Ala Lys Val Asp Glu
85 90 95
Ser Phe Phe Gln Arg Leu Asp Glu Ser Phe Leu Thr Asp Asp Asp Lys
100 105 110
Thr Phe Asp Ser His Pro Ile Phe Gly Asn Lys Ala Glu Glu Asp Ala
115 120 125
Tyr His Gln Lys Phe Pro Thr Ile Tyr His Leu Arg Lys His Leu Ala
130 135 140
Asp Ser Ser Glu Lys Ala Asp Leu Arg Leu Val Tyr Leu Ala Leu Ala
145 150 155 160
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Glu Leu Asn
165 170 175
Ala Glu Asn Thr Asp Val Gln Lys Ile Phe Ala Asp Phe Val Gly Val
180 185 190
Tyr Asn Arg Thr Phe Asp Asp Ser His Leu Ser Glu Ile Thr Val Asp
195 200 205
Val Ala Ser Ile Leu Thr Glu Lys Ile Ser Lys Ser Arg Arg Leu Glu
210 215 220
Asn Leu Ile Lys Tyr Tyr Pro Thr Glu Lys Lys Asn Thr Leu Phe Gly
225 230 235 240
Asn Leu Ile Ala Leu Ala Leu Gly Leu Gln Pro Asn Phe Lys Thr Asn
245 250 255
Phe Lys Leu Ser Glu Asp Ala Lys Leu Gln Phe Ser Lys Asp Thr Tyr
260 265 270
Glu Glu Asp Leu Glu Glu Leu Leu Gly Lys Ile Gly Asp Asp Tyr Ala
275 280 285
Asp Leu Phe Thr Ser Ala Lys Asn Leu Tyr Asp Ala Ile Leu Leu Ser
290 295 300
Gly Ile Leu Thr Val Asp Asp Asn Ser Thr Lys Ala Pro Leu Ser Ala
305 310 315 320
Ser Met Ile Lys Arg Tyr Val Glu His His Glu Asp Leu Glu Lys Leu
325 330 335
Lys Glu Phe Ile Lys Ala Asn Lys Ser Glu Leu Tyr His Asp Ile Phe
340 345 350
Lys Asp Lys Asn Lys Asn Gly Tyr Ala Gly Tyr Ile Glu Asn Gly Val
355 360 365
Lys Gln Asp Glu Phe Tyr Lys Tyr Leu Lys Asn Ile Leu Ser Lys Ile
370 375 380
Lys Ile Asp Gly Ser Asp Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp
385 390 395 400
Phe Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
405 410 415
Ile His Leu Gln Glu Met His Ala Ile Leu Arg Arg Gln Gly Asp Tyr
420 425 430
Tyr Pro Phe Leu Lys Glu Lys Gln Asp Arg Ile Glu Lys Ile Leu Thr
435 440 445
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Val Arg Lys Asp Ser Arg
450 455 460
Phe Ala Trp Ala Glu Tyr Arg Ser Asp Glu Lys Ile Thr Pro Trp Asn
465 470 475 480
Phe Asp Lys Val Ile Asp Lys Glu Lys Ser Ala Glu Lys Phe Ile Thr
485 490 495
Arg Met Thr Leu Asn Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro
500 505 510
Lys His Ser His Val Tyr Glu Thr Tyr Ala Val Tyr Asn Glu Leu Thr
515 520 525
Lys Ile Lys Tyr Val Asn Glu Gln Gly Lys Glu Ser Phe Phe Asp Ser
530 535 540
Asn Met Lys Gln Glu Ile Phe Asp His Val Phe Lys Glu Asn Arg Lys
545 550 555 560
Val Thr Lys Glu Lys Leu Leu Asn Tyr Leu Asn Lys Glu Phe Pro Glu
565 570 575
Tyr Arg Ile Lys Asp Leu Ile Gly Leu Asp Lys Glu Asn Lys Ser Phe
580 585 590
Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Lys Lys Ile Leu Asp Lys
595 600 605
Ala Phe Leu Asp Asp Lys Val Asn Glu Glu Val Ile Glu Asp Ile Ile
610 615 620
Lys Thr Leu Thr Leu Phe Glu Asp Lys Asp Met Ile His Glu Arg Leu
625 630 635 640
Gln Lys Tyr Ser Asp Ile Phe Thr Ala Asn Gln Leu Lys Lys Leu Glu
645 650 655
Arg Arg His Tyr Thr Gly Trp Gly Arg Leu Ser Tyr Lys Leu Ile Asn
660 665 670
Gly Ile Arg Asn Lys Glu Asn Asn Lys Thr Ile Leu Asp Tyr Leu Ile
675 680 685
Asp Asp Gly Ser Ala Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp
690 695 700
Thr Leu Pro Phe Lys Gln Ile Ile Gln Lys Ser Gln Val Val Gly Asp
705 710 715 720
Val Asp Asp Ile Glu Ala Val Val His Asp Leu Pro Gly Ser Pro Ala
725 730 735
Ile Lys Lys Gly Ile Leu Gln Ser Val Lys Ile Val Asp Glu Leu Val
740 745 750
Lys Val Met Gly Gly Asn Pro Asp Asn Ile Val Ile Glu Met Ala Arg
755 760 765
Glu Asn Gln Thr Thr Asn Arg Gly Arg Ser Gln Ser Gln Gln Arg Leu
770 775 780
Lys Lys Leu Gln Asn Ser Leu Lys Glu Leu Gly Ser Asn Ile Leu Asn
785 790 795 800
Glu Glu Lys Pro Ser Tyr Ile Glu Asp Lys Val Glu Asn Ser His Leu
805 810 815
Gln Asn Asp Gln Leu Phe Leu Tyr Tyr Ile Gln Asn Gly Lys Asp Met
820 825 830
Tyr Thr Gly Asp Glu Leu Asp Ile Asp His Leu Ser Asp Tyr Asp Ile
835 840 845
Asp His Ile Ile Pro Gln Ala Phe Ile Lys Asp Asp Ser Ile Asp Asn
850 855 860
Arg Val Leu Thr Ser Ser Ala Lys Asn Arg Gly Lys Ser Asp Asp Val
865 870 875 880
Pro Ser Leu Asp Ile Val Arg Ala Arg Lys Ala Glu Trp Val Arg Leu
885 890 895
Tyr Lys Ser Gly Leu Ile Ser Lys Arg Lys Phe Asp Asn Leu Thr Lys
900 905 910
Ala Glu Arg Gly Gly Leu Thr Glu Ala Asp Lys Ala Gly Phe Ile Lys
915 920 925
Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
930 935 940
Leu Asp Ala Arg Phe Asn Thr Glu His Asp Glu Asn Asp Lys Val Ile
945 950 955 960
Arg Asp Val Lys Val Ile Thr Leu Lys Ser Asn Leu Val Ser Gln Phe
965 970 975
Arg Lys Asp Phe Glu Phe Tyr Lys Val Arg Glu Ile Asn Asp Tyr His
980 985 990
His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Leu
995 1000 1005
Lys Lys Tyr Pro Lys Leu Ala Ser Glu Phe Val Tyr Gly Glu Tyr
1010 1015 1020
Lys Lys Tyr Asp Ile Arg Lys Phe Ile Thr Asn Ser Ser Asp Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Leu Met Asn Phe Phe
1040 1045 1050
Lys Thr Lys Val Lys Tyr Ala Asp Gly Thr Val Phe Glu Arg Pro
1055 1060 1065
Ile Ile Glu Thr Asn Ala Asp Gly Glu Ile Ala Trp Asn Lys Gln
1070 1075 1080
Ile Asp Phe Glu Lys Val Arg Lys Val Leu Ser Tyr Pro Gln Val
1085 1090 1095
Asn Ile Val Lys Lys Val Glu Thr Gln Thr Gly Gly Phe Ser Lys
1100 1105 1110
Glu Ser Ile Leu Pro Lys Gly Asp Ser Asp Lys Leu Ile Pro Arg
1115 1120 1125
Lys Thr Lys Lys Val Tyr Trp Asp Thr Lys Lys Tyr Gly Gly Phe
1130 1135 1140
Asp Ser Pro Thr Val Ala Tyr Ser Val Phe Val Val Ala Asp Val
1145 1150 1155
Glu Lys Gly Lys Ala Lys Lys Leu Lys Thr Val Lys Glu Leu Val
1160 1165 1170
Gly Ile Ser Ile Met Glu Arg Ser Phe Phe Glu Glu Asn Pro Val
1175 1180 1185
Glu Phe Leu Glu Asn Lys Gly Tyr His Asn Ile Arg Glu Asp Lys
1190 1195 1200
Leu Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Phe Glu Gly Gly
1205 1210 1215
Arg Arg Arg Leu Leu Ala Ser Ala Ser Glu Leu Gln Lys Gly Asn
1220 1225 1230
Glu Met Val Leu Pro Gly Tyr Leu Val Glu Leu Leu Tyr His Ala
1235 1240 1245
His Arg Ala Asp Asn Phe Asn Ser Thr Glu Tyr Leu Asn Tyr Val
1250 1255 1260
Ser Glu His Lys Lys Glu Phe Glu Lys Val Leu Ser Cys Val Glu
1265 1270 1275
Asp Phe Ala Asn Leu Tyr Val Asp Val Glu Lys Asn Leu Ser Lys
1280 1285 1290
Ile Arg Ala Val Ala Asp Ser Met Asp Asn Phe Ser Ile Glu Glu
1295 1300 1305
Ile Ser Asn Ser Phe Ile Asn Leu Leu Thr Leu Thr Ala Leu Gly
1310 1315 1320
Ala Pro Ala Asp Phe Asn Phe Leu Gly Glu Lys Ile Pro Arg Lys
1325 1330 1335
Arg Tyr Thr Ser Thr Lys Glu Cys Leu Asn Ala Thr Leu Ile His
1340 1345 1350
Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Lys
1355 1360 1365
Leu Gly Glu Glu
1370
<210> 569
<211> 1370
<212> PRT
<213> Streptococcus gordonii
<400> 569
Met Lys Lys Gly Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Phe Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Met
20 25 30
Lys Val Leu Gly Asn Thr Asp Lys Arg Phe Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Glu Gly Thr Thr Ala Glu Ala Arg Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Leu Arg
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Glu Glu Met Ser Lys Val Asp Ser Ser
85 90 95
Phe Phe His Arg Leu Asp Asp Ser Phe Leu Ile Pro Glu Asp Lys Arg
100 105 110
Glu Ser Lys Tyr Pro Ile Phe Ala Thr Leu Thr Glu Glu Lys Glu Tyr
115 120 125
His Lys Gln Phe Pro Thr Ile Tyr His Leu Arg Lys Gln Leu Ala Asp
130 135 140
Ser Lys Glu Lys Thr Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Tyr Arg Gly His Phe Leu Tyr Glu Glu Ala Phe Asp Ile
165 170 175
Lys Asn Asn Asp Ile Gln Lys Ile Phe Asn Glu Phe Ile Ser Ile Tyr
180 185 190
Asp Asn Thr Phe Glu Gly Ser Ser Leu Ser Gly Gln Asn Ala Gln Val
195 200 205
Glu Ala Ile Phe Thr Asp Lys Ile Ser Lys Ser Ala Lys Arg Glu Arg
210 215 220
Val Leu Lys Leu Phe Pro Asp Glu Lys Ser Thr Gly Leu Phe Ser Glu
225 230 235 240
Phe Leu Lys Leu Ile Val Gly Asn Gln Ala Asp Phe Lys Lys His Phe
245 250 255
Asp Leu Glu Asp Lys Ala Pro Leu Gln Phe Ser Lys Asp Thr Tyr Asp
260 265 270
Glu Asp Leu Glu Asn Leu Leu Gly Gln Ile Gly Asp Asp Phe Thr Asp
275 280 285
Leu Phe Val Ser Ala Lys Lys Leu Tyr Asp Ala Ile Leu Leu Ser Gly
290 295 300
Ile Leu Thr Val Thr Asp Pro Ser Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Glu Arg Tyr Glu Asn His Gln Asn Asp Leu Ala Ala Leu Lys
325 330 335
Gln Phe Ile Lys Asn Asn Leu Pro Glu Lys Tyr Asp Glu Val Phe Ser
340 345 350
Asp Gln Ser Lys Asp Gly Tyr Ala Gly Tyr Ile Asp Gly Lys Thr Thr
355 360 365
Gln Glu Thr Phe Tyr Lys Tyr Ile Lys Asn Leu Leu Ser Lys Phe Glu
370 375 380
Gly Thr Asp Tyr Phe Leu Asp Lys Ile Glu Arg Glu Asp Phe Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gln Glu Met Asn Ala Ile Leu Arg Arg Gln Gly Glu Tyr Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Lys Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Arg Asp Phe Ala Trp
450 455 460
Leu Thr Arg Asn Ser Asp Glu Ala Ile Arg Pro Trp Asn Phe Glu Glu
465 470 475 480
Ile Val Asp Lys Ala Ser Ser Ala Glu Asp Phe Ile Asn Lys Met Thr
485 490 495
Asn Tyr Asp Leu Tyr Leu Pro Glu Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Thr Phe Ala Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Phe Ile Ala Glu Gly Leu Arg Asp Tyr Gln Phe Leu Asp Ser Gly Gln
530 535 540
Lys Lys Gln Ile Val Asn Gln Leu Phe Lys Glu Asn Arg Lys Val Thr
545 550 555 560
Glu Lys Asp Ile Ile His Tyr Leu His Asn Val Asp Gly Tyr Asp Gly
565 570 575
Ile Glu Leu Lys Gly Ile Glu Lys Gln Phe Asn Ala Ser Leu Ser Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Glu Phe Met Asp Asp
595 600 605
Ala Lys Asn Glu Ala Ile Leu Glu Asn Ile Val His Thr Leu Thr Ile
610 615 620
Phe Glu Asp Arg Glu Met Ile Lys Gln Arg Leu Ala Gln Tyr Asp Ser
625 630 635 640
Leu Phe Asp Glu Lys Val Ile Lys Ala Leu Thr Arg Arg His Tyr Thr
645 650 655
Gly Trp Gly Lys Leu Ser Ala Lys Leu Ile Asn Gly Ile Cys Asp Lys
660 665 670
Gln Thr Gly Asn Thr Ile Leu Asp Tyr Leu Ile Asp Asp Gly Lys Ile
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile Asn Asp Asp Gly Leu Ser Phe Lys
690 695 700
Glu Ile Ile Gln Lys Ala Gln Val Ile Gly Lys Thr Asp Asp Val Lys
705 710 715 720
Gln Val Val Gln Glu Leu Ser Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Ser Ile Lys Ile Val Asp Glu Leu Val Lys Val Met Gly His
740 745 750
Ala Pro Glu Ser Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
755 760 765
Ala Arg Gly Lys Lys Asn Ser Gln Gln Arg Tyr Lys Arg Ile Glu Asp
770 775 780
Ser Leu Lys Ile Leu Ala Ser Gly Leu Asp Ser Asn Ile Leu Lys Glu
785 790 795 800
Asn Pro Thr Asp Asn Asn Gln Leu Gln Asn Asp Arg Leu Phe Leu Tyr
805 810 815
Tyr Leu Gln Asn Gly Lys Asp Met Tyr Thr Gly Glu Ala Leu Asp Ile
820 825 830
Asn Gln Leu Ser Ser Tyr Asp Ile Asp His Ile Ile Pro Gln Ala Phe
835 840 845
Ile Lys Asp Asp Ser Leu Asp Asn Arg Val Leu Thr Ser Ser Lys Asp
850 855 860
Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Ile Glu Val Val Gln Lys
865 870 875 880
Arg Lys Ala Phe Trp Gln Gln Leu Leu Asp Ser Lys Leu Ile Ser Glu
885 890 895
Arg Lys Phe Asn Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Asp Glu
900 905 910
Arg Asp Lys Val Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln
915 920 925
Ile Thr Lys His Val Ala Gln Ile Leu Asp Ala Arg Tyr Asn Thr Glu
930 935 940
Val Asn Glu Lys Asp Lys Lys Asn Arg Thr Val Lys Ile Ile Thr Leu
945 950 955 960
Lys Ser Asn Leu Val Ser Asn Phe Arg Lys Glu Phe Arg Leu Tyr Lys
965 970 975
Val Arg Glu Ile Asn Asp Tyr His His Ala His Asp Ala Tyr Leu Asn
980 985 990
Ala Val Val Ala Lys Ala Ile Leu Lys Lys Tyr Pro Lys Leu Glu Pro
995 1000 1005
Glu Phe Val Tyr Gly Glu Tyr Gln Lys Tyr Asp Leu Lys Arg Tyr
1010 1015 1020
Ile Ser Arg Ser Lys Asp Pro Lys Glu Val Glu Lys Ala Thr Glu
1025 1030 1035
Lys Tyr Phe Phe Tyr Ser Asn Leu Leu Asn Phe Phe Lys Glu Glu
1040 1045 1050
Val His Tyr Ala Asp Gly Thr Ile Val Lys Arg Glu Asn Ile Glu
1055 1060 1065
Tyr Ser Lys Asp Thr Gly Glu Ile Ala Trp Asn Lys Glu Lys Asp
1070 1075 1080
Phe Ala Ile Ile Lys Lys Val Leu Ser Leu Pro Gln Val Asn Ile
1085 1090 1095
Val Lys Lys Arg Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser
1100 1105 1110
Ile Leu Pro Lys Gly Asn Ser Asp Lys Leu Ile Pro Arg Lys Thr
1115 1120 1125
Lys Asp Ile Leu Leu Asp Thr Thr Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Val Ile Ala Tyr Ser Ile Leu Leu Ile Ala Asp Ile Glu Lys
1145 1150 1155
Gly Lys Ala Lys Lys Leu Lys Thr Val Lys Thr Leu Val Gly Ile
1160 1165 1170
Thr Ile Met Glu Lys Ala Ala Phe Glu Glu Asn Pro Ile Thr Phe
1175 1180 1185
Leu Glu Asn Lys Gly Tyr His Asn Val Arg Lys Glu Asn Ile Leu
1190 1195 1200
Cys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Arg
1205 1210 1215
Arg Leu Leu Ala Ser Ala Lys Glu Leu Gln Lys Gly Asn Glu Ile
1220 1225 1230
Val Leu Pro Val Tyr Leu Thr Thr Leu Leu Tyr His Ser Lys Asn
1235 1240 1245
Val His Lys Leu Asp Glu Pro Gly His Leu Glu Tyr Ile Gln Lys
1250 1255 1260
His Arg Asn Glu Phe Lys Asp Leu Leu Asn Leu Val Ser Glu Phe
1265 1270 1275
Ser Gln Lys Tyr Val Leu Ala Asp Ala Asn Leu Glu Lys Ile Lys
1280 1285 1290
Ser Leu Tyr Ala Asp Asn Glu Gln Ala Asp Ile Glu Ile Leu Ala
1295 1300 1305
Asn Ser Phe Ile Asn Leu Leu Thr Phe Thr Ala Leu Gly Ala Pro
1310 1315 1320
Ala Ala Phe Lys Phe Phe Gly Lys Asp Ile Asp Arg Lys Arg Tyr
1325 1330 1335
Thr Thr Val Ser Glu Ile Leu Asn Ala Thr Leu Ile His Gln Ser
1340 1345 1350
Ile Thr Gly Leu Tyr Glu Thr Trp Ile Asp Leu Ser Lys Leu Gly
1355 1360 1365
Glu Asp
1370
<210> 570
<211> 1056
<212> PRT
<213> Staphylococcus aureus
<400> 570
Gly Ser His Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile
1 5 10 15
Thr Ser Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile
20 25 30
Asp Ala Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu
35 40 45
Gly Arg Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg
50 55 60
His Arg Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu
65 70 75 80
Thr Asp His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val
85 90 95
Lys Gly Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu
100 105 110
Leu His Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu
115 120 125
Glu Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn
130 135 140
Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg
145 150 155 160
Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr
165 170 175
Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala
180 185 190
Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu
195 200 205
Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe
210 215 220
Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys
225 230 235 240
Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala
245 250 255
Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg
260 265 270
Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu
275 280 285
Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys
290 295 300
Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser
305 310 315 320
Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys
325 330 335
Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp
340 345 350
Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln
355 360 365
Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu
370 375 380
Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu
385 390 395 400
Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn
405 410 415
Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp
420 425 430
Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile
435 440 445
Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile
450 455 460
Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu
465 470 475 480
Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu
485 490 495
Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile
500 505 510
Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys
515 520 525
Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile
530 535 540
Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His
545 550 555 560
Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val
565 570 575
Leu Val Lys Gln Glu Glu Ala Ser Lys Lys Gly Asn Arg Thr Pro Phe
580 585 590
Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys
595 600 605
Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr
610 615 620
Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val
625 630 635 640
Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr
645 650 655
Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu
660 665 670
Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg
675 680 685
Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His
690 695 700
Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu
705 710 715 720
Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe
725 730 735
Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu
740 745 750
Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp
755 760 765
Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg
770 775 780
Glu Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly
785 790 795 800
Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn
805 810 815
Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met
820 825 830
Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu
835 840 845
Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr
850 855 860
Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile
865 870 875 880
Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile
885 890 895
Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu
900 905 910
Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe
915 920 925
Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu
930 935 940
Val Asn Ser Lys Ala Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser
945 950 955 960
Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys
965 970 975
Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu
980 985 990
Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu
995 1000 1005
Glu Asn Met Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile
1010 1015 1020
Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu
1025 1030 1035
Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile
1040 1045 1050
Lys Lys Gly
1055
<210> 571
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 571
aatctagtaa ataaattgat gt 22
<210> 572
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 572
gaccaacggc taagtgaaga 20
<210> 573
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 573
tcctttcttc acggttgcct 20
<210> 574
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 574
ctcctgctca gtgatttcag 20
<210> 575
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 575
tgtcacacat gtagttgtag 20
<210> 576
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 576
cctcccggcc ggcggtatcc 20
<210> 577
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 577
ggcagccgat acccggggca ggg 23
<210> 578
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 578
gggcagccga tacccggggc agg 23
<210> 579
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 579
ttattgtccg aaataaaaga aga 23
<210> 580
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 580
attgtccgaa ataaaagaag agg 23
<210> 581
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 581
ttgtccgaaa taaaagaaga gga 23
<210> 582
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 582
gtccgaaata aaagaagagg aaaaaat 27
<210> 583
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 583
gtccgaaata aaagaagagg aaaaaatt 28
<210> 584
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 584
caggaagcac gaggccactg agg 23
<210> 585
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 585
aacaggaagc acgaggccac tga 23
<210> 586
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 586
aggaagcacg aggccactga gga 23
<210> 587
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 587
ttggattctg gaatccattc tgg 23
<210> 588
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 588
tctgcatcca tcttcacttc aga 23
<210> 589
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 589
cttacagcca gtaatgtcac cga 23
<210> 590
<211> 177
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 590
Ala Ser Arg Gly Val Asn Lys Val Ile Leu Val Gly Asn Leu Gly Gln
1 5 10 15
Asp Pro Glu Val Arg Tyr Met Pro Asn Gly Gly Ala Val Ala Asn Ile
20 25 30
Thr Leu Ala Thr Ser Glu Ser Trp Arg Asp Lys Ala Thr Gly Glu Met
35 40 45
Lys Glu Gln Thr Glu Trp His Arg Val Val Leu Phe Gly Lys Leu Ala
50 55 60
Glu Val Ala Ser Glu Tyr Leu Arg Lys Gly Ser Gln Val Tyr Ile Glu
65 70 75 80
Gly Gln Leu Arg Thr Arg Lys Trp Thr Asp Gln Ser Gly Gln Asp Arg
85 90 95
Tyr Thr Thr Glu Val Val Val Asn Val Gly Gly Thr Met Gln Met Leu
100 105 110
Gly Gly Arg Gln Gly Gly Gly Ala Pro Ala Gly Gly Asn Ile Gly Gly
115 120 125
Gly Gln Pro Gln Gly Gly Trp Gly Gln Pro Gln Gln Pro Gln Gly Gly
130 135 140
Asn Gln Phe Ser Gly Gly Ala Gln Ser Arg Pro Gln Gln Ser Ala Pro
145 150 155 160
Ala Ala Pro Ser Asn Glu Pro Pro Met Asp Phe Asp Asp Asp Ile Pro
165 170 175
Phe
<210> 591
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 591
ttatttcgtg gatttattta 20
<210> 592
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 592
tgcttctcca gccctggcct gg 22
<210> 593
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 593
Lys Arg Arg Thr Thr Ile Ser Ile Ala Ala
1 5 10
<210> 594
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 594
Ala Leu Val Phe Tyr Arg Glu Tyr Ile Gly Arg Leu Lys Gln Ile Lys
1 5 10 15
Phe Lys Phe
<210> 595
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 595
Leu Pro Ile Met Ala Lys Ser Val Leu Asp Leu Tyr Glu Leu
1 5 10
<210> 596
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 596
Leu Leu Arg Leu Gly
1 5
<210> 597
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 597
Thr Asp Lys Glu Ile Asn Pro Val Val Lys Glu Asn Ile Glu Trp
1 5 10 15
<210> 598
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 598
Pro Pro Ser Ile Lys Arg Lys Phe
1 5
<210> 599
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 599
Leu Pro Thr Val Gln Phe Asp Phe Thr
1 5
<210> 600
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 600
Leu Pro Leu Asp Ile Arg Gly Thr Ala Phe Gln Gln Gln Val
1 5 10
<210> 601
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 601
Ala Tyr Val Val Leu Gly Gln Phe
1 5
<210> 602
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 602
Ile Asn Phe Tyr Gly Glu Leu Val
1 5
<210> 603
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 603
Lys Lys Thr Gly Asp Gln Lys
1 5
<210> 604
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 604
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 605
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 605
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr
1 5 10 15
Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
<210> 606
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (5)..(120)
<223> May be absent
<400> 606
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
1 5 10 15
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
20 25 30
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
35 40 45
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
50 55 60
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
65 70 75 80
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
85 90 95
Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Gly Ser
100 105 110
Ser Gly Gly Ser Ser Gly Gly Ser
115 120
<210> 607
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (6)..(150)
<223> May be absent
<400> 607
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
50 55 60
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
85 90 95
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
100 105 110
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
115 120 125
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
130 135 140
Ser Gly Gly Gly Gly Ser
145 150
<210> 608
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (2)..(30)
<223> May be absent
<400> 608
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
1 5 10 15
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly
20 25 30
<210> 609
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (6)..(150)
<223> May be absent
<400> 609
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
20 25 30
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
35 40 45
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
50 55 60
Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
65 70 75 80
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
85 90 95
Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala
100 105 110
Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala
115 120 125
Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala
130 135 140
Lys Glu Ala Ala Ala Lys
145 150
<210> 610
<211> 90
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (4)..(90)
<223> May be absent
<400> 610
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
20 25 30
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
35 40 45
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
50 55 60
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
65 70 75 80
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
85 90
<210> 611
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> misc_feature
<222> (1)..(1)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (3)..(60)
<223> May be absent
<400> 611
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
1 5 10 15
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
20 25 30
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
35 40 45
Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro Xaa Pro
50 55 60
<210> 612
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (8)..(94)
<223> May be absent
<400> 612
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10 15
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
20 25 30
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly
35 40 45
Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
50 55 60
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly
65 70 75 80
Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
85 90
<210> 613
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic polypeptide
<220>
<221> MISC_FEATURE
<222> (5)..(120)
<223> May be absent
<400> 613
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
20 25 30
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
35 40 45
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
50 55 60
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
65 70 75 80
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
85 90 95
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
100 105 110
Gly Gly Gly Ser Gly Gly Gly Ser
115 120
<210> 614
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 614
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 615
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 615
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys
20 25 30
<210> 616
<211> 36
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (4)..(29)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (32)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (27)..(29)
<223> May be absent
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> May be absent
<400> 616
His Xaa Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Cys Xaa
20 25 30
Xaa Xaa Xaa Cys
35
<210> 617
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 617
Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser
1 5 10
<210> 618
<211> 81
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 618
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcuuuu u 81
<210> 619
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 619
tcgcacccgt ggatttattt atgg 24
<210> 620
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 620
ttcgcacccg tggatttatt atgg 24
<210> 621
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 621
cctcgcacgt ggatttattt atgg 24
<210> 622
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 622
tcctcgcacg tggatttatt atgg 24
<210> 623
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 623
accctcgcgt ggatttattt atgg 24
<210> 624
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 624
taccctcgcg tggatttatt atgg 24
<210> 625
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 625
gcaccctcgt ggatttattt atgg 24
<210> 626
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 626
tgcaccctcg tggatttatt atgg 24
<210> 627
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 627
gaagcgcctg gcagtgtacc agg 23
<210> 628
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 628
ccactacaac tacatgtgtg aca 23
<210> 629
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 629
ccgcgccatg gccatctgca agc 23
<210> 630
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 630
ggaggacgtg cgcggccgcc tgg 23
<210> 631
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 631
gaagcgcctg gcagtgtacc agg 23
<210> 632
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 632
ctgtggcagt ggcaccagaa tgg 23
<210> 633
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 633
cctcccggcc ggcggtatcc agg 23
<210> 634
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 634
gcttgcagat ggccatggcg cgg 23
<210> 635
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 635
acacatgcag ttgtagtgga tgg 23
<210> 636
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 636
tgtcacacat gtagttgtag tgg 23
<210> 637
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 637
gagttagagc agaagaagaa agg 23
<210> 638
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 638
gagtctaagc agaagaagaa gag 23
<210> 639
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 639
gaggccgagc agaagaaaga cgg 23
<210> 640
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 640
gagtcctagc aggagaagaa gag 23
<210> 641
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 641
gagtccggga aggagaagaa agg 23
<210> 642
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 642
gagccggagc agaagaagga ggg 23
<210> 643
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 643
aagtccgagg agaggaagaa agg 23
<210> 644
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 644
gaatccaagc aggagaagaa gga 23
<210> 645
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 645
acgtctgagc agaagaagaa tgg 23
<210> 646
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 646
ggaaccccgt ctgcagcacc agg 23
<210> 647
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 647
ggagtccctc ctacagcacc agg 23
<210> 648
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 648
agaggcccct ctgcagcacc agg 23
<210> 649
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 649
accatccctc ctgcagcacc agg 23
<210> 650
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 650
ggattgccat ccgcagcacc tgg 23
<210> 651
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 651
tgaatcccat ctccagcacc agg 23
<210> 652
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 652
ggagtccctc ctacagcacc agg 23
<210> 653
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 653
ggagtccctc ctgcagcacc tga 23
<210> 654
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 654
gaacacaatg catagattgc cgg 23
<210> 655
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 655
aaacataaag catagactgc aaa 23
<210> 656
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 656
cacccagact gagcacgtgc tgg 23
<210> 657
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 657
gacacagact gggcacgtga ggg 23
<210> 658
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 658
agctcagact gagcaagtga ggg 23
<210> 659
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 659
agaccagact gagcaagaga ggg 23
<210> 660
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 660
gagccagaat gagcacgtga ggg 23
<210> 661
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 661
tgcactgcgg ccggaggagg tgg 23
<210> 662
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 662
ggctctgcgg ctggaggggg tgg 23
<210> 663
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 663
ggcacgacgg ctggaggtgg ggg 23
<210> 664
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 664
ggcatcacgg ctggaggtgg agg 23
<210> 665
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 665
ggcgctgcgg cgggaggtgg agg 23
<210> 666
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 666
ggcactgaga ctgggggtgg ggg 23
<210> 667
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 667
agcagtgcgg ctagaggtgg tgg 23
<210> 668
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 668
ggcactgcta ctgggggtgg tgg 23
<210> 669
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 669
ggcactgggg ctgggggagg ggg 23
<210> 670
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 670
ggcactgggg ttggaggtgg ggg 23
<210> 671
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 671
Lys Arg Leu Ala Val Tyr Gln
1 5
<210> 672
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 672
Arg Ala Met Ala Ile Cys Lys
1 5
<210> 673
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 673
tcagggtgag catagactgc cgg 23
<210> 674
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 674
gaatcgggag gggagactgc ggg 23
<210> 675
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 675
tgaagtgttg catagactgc agg 23
<210> 676
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 676
ggagagagag catagactgc tgg 23
<210> 677
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 677
ccaaacaaaa catagactgc tgg 23
<210> 678
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 678
caggaagctg gagcacgtga ggg 23
<210> 679
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 679
aaggctgagg gagcacgtga agg 23
<210> 680
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 680
gtcaggggaa gagcacgtga cgg 23
<210> 681
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 681
gttgtgaact gagcacgtga ggg 23
<210> 682
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 682
atatttgctg gagcacgtga agg 23
<210> 683
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 683
gtggctggag gtggaggtgg ggg 23
<210> 684
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 684
gagggaaggg ctggaggtgg agg 23
<210> 685
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 685
cacctgcgca agctgcgtaa gcggc 25
<210> 686
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 686
tcctccgcga tgccgatgac ctgca 25
<210> 687
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 687
aggccggggc ccgcgagggc gccga 25
<210> 688
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 688
gcgcggcctc agcgccatcc gcgag 25
<210> 689
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 689
cctgtgcagc tgtgggttga ttcca 25
<210> 690
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 690
cacccccgcc cggcacccgc gtccg 25
<210> 691
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 691
agtcacagca catgacggag gttgt 25
<210> 692
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 692
gaggcgctgc ccccaccatg agcgc 25
<210> 693
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 693
tgccatcacg tgctcaatcg gggcccca 28
<210> 694
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 694
cgccccgcag tctatgcttt gtgttccag 29
<210> 695
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 695
cccgcagtct atgctttgtg ttc 23
<210> 696
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 696
ctcccatcac atcaaccggt 20
<210> 697
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 697
tttcctcccc cccacaggta gaacat 26
<210> 698
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 698
tttccctctg tccacaccct catcctg 27
<210> 699
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 699
tttccccagt cctccacacc ctgaaac 27
<210> 700
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 700
tgcccctccc tccctggccc 20
<210> 701
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 701
agagcccccc ctcaaagaga 20
<210> 702
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 702
ggcccagact gagcacgtga tgg 23
<210> 703
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 703
gagtccgagc agaagaagaa ggg 23
<210> 704
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 704
gaacacaaag catagactgc ggg 23
<210> 705
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 705
gagtccgagc agaagaagaa g 21
<210> 706
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 706
ggaatccctt ctgcagcacc tgg 23
<210> 707
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 707
ggcccagact gagcacgtga 20
<210> 708
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 708
ggcactgcgg ctggaggtgg ggg 23
<210> 709
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 709
gtcaggtcga gggttctgtc 20
<210> 710
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 710
gggccgcagt atcctcactc 20
<210> 711
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 711
ccgccagtcc cagtacggga 20
<210> 712
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 712
caaccactgc tcaaagatgc 20
<210> 713
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 713
cttccaggat gagaacacag 20
<210> 714
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 714
Gly Ser Arg Tyr Pro Gly Glu
1 5
<210> 715
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 715
tgcccctccc tccctggccc agg 23
<210> 716
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 716
ttttcctccc ccccacaggt aga 23
<210> 717
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 717
gccccccctc aaagagaggg tgg 23
<210> 718
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 718
agagcccccc ctcaaagaga ggg 23
<210> 719
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 719
ggcccagact gagcacgtga tgg 23
<210> 720
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 720
gaacacaaag catagactgc ggg 23
<210> 721
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 721
gagtccgagc agaagaagaa ggg 23
<210> 722
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 722
ggaatccctt ctgcagcacc tgg 23
<210> 723
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<220>
<221> misc_feature
<222> (1)..(4)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (25)..(25)
<223> n is a, c, g, or t
<400> 723
nnnntctctc tctctctctc tctcngg 27
<210> 724
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 724
gcggatgttc caatcagtac gca 23
<210> 725
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 725
cgagcttctg gcggtctcaa gca 23
<210> 726
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 726
tgcttctcca gccctggcct gg 22
<210> 727
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 727
agactgagca cgtgatggca gag 23
<210> 728
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 728
gatgttccaa tcagtacgca gagagt 26
<210> 729
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 729
cttctccagc cctggcctgg gtcaat 26
<210> 730
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 730
gccgtctcca aggtgaaagc ggaa 24
<210> 731
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 731
gtcgccgtct ccaaggtgaa agcg 24
<210> 732
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 732
ggtgcatttt caggaggaag cgat 24
<210> 733
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 733
gccgtctcca aggtgaaagc ggaa 24
<210> 734
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 734
gccgtctcca aggtgaaagc ggaagt 26
<210> 735
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 735
ggcactgcgg ctggaggtgg ggg 23
<210> 736
<211> 83
<212> PRT
<213> Bacillus phage PBS2
<400> 736
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1 5 10 15
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
20 25 30
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
35 40 45
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
50 55 60
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
65 70 75 80
Lys Met Leu
<210> 737
<211> 228
<212> PRT
<213> Rattus norvegicus
<400> 737
Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg Arg
1 5 10 15
Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu Arg
20 25 30
Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His Ser
35 40 45
Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val Asn
50 55 60
Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr Arg
65 70 75 80
Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys Ser
85 90 95
Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu Phe
100 105 110
Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg Gln
115 120 125
Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met Thr
130 135 140
Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser Pro
145 150 155 160
Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg Leu
165 170 175
Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys Leu
180 185 190
Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile Ala
195 200 205
Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp Ala
210 215 220
Thr Gly Leu Lys
225
<210> 738
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 738
tttgtacttt gtcctccggt tctg 24
<210> 739
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 739
tttccagccc gctggccctg taaa 24
<210> 740
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic Polypeptide
<400> 740
Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys
1 5 10 15
Val
<210> 741
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 741
gtaatttcta ctaagtgtag at 22
<210> 742
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 742
tactttgtcc tccggttctg gaa 23
<210> 743
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 743
tactttgtcc tccggttctg 20
<210> 744
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 744
tactttgtcc tccggttct 19
<210> 745
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 745
tactttgtcc tccggttc 18
<210> 746
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 746
tactttgtcc tccggtt 17
<210> 747
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 747
cagcccgctg gccctgtaaa gga 23
<210> 748
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 748
cagcccgctg gccctgtaaa 20
<210> 749
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 749
cagcccgctg gccctgtaa 19
<210> 750
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 750
cagcccgctg gccctgta 18
<210> 751
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic Polynucleotide
<400> 751
cagcccgctg gccctgt 17
Claims (207)
- (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp); (ii) 시티딘 데아미나제 도메인; 및 (iii) 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하며, 여기서 napDNAbp는 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트 단백질인 융합 단백질.
- 제1항에 있어서, 2, 3, 4 또는 5개의 UGI 도메인을 포함하는 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 CasX 단백질인 융합 단백질.
- 제3항에 있어서, CasX 단백질이
(i) 서열식별번호: 29 또는 30과 적어도 90% 동일한 아미노산 서열; 또는
(ii) 서열식별번호: 29 또는 30의 아미노산 서열
을 포함하는 것인 융합 단백질. - 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 CasY 단백질인 융합 단백질.
- 제5항에 있어서, CasY 단백질이 서열식별번호: 31과 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제5항 또는 제6항에 있어서, CasY 단백질이 서열식별번호: 31의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 Cpf1 또는 Cpf1 돌연변이체 단백질인 융합 단백질.
- 제8항에 있어서, Cpf1 또는 Cpf1 돌연변이체 단백질이 서열식별번호: 9-16 중 어느 하나와 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제8항 또는 제9항에 있어서, Cpf1 또는 Cpf1 돌연변이체 단백질이 서열식별번호: 9-16 중 어느 하나의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 C2c1 단백질인 융합 단백질.
- 제11항에 있어서, C2c1 단백질이 서열식별번호: 26과 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제11항 또는 제12항에 있어서, C2c1 단백질이 서열식별번호: 26의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 C2c2 단백질인 융합 단백질.
- 제14항에 있어서, C2c2 단백질이 서열식별번호: 27과 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제14항 또는 제15항에 있어서, C2c2 단백질이 서열식별번호: 27의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 C2c3 단백질인 융합 단백질.
- 제17항에 있어서, C2c3 단백질이 서열식별번호: 28과 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제17항 또는 제18항에 있어서, C2c3 단백질이 서열식별번호: 28의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 또는 제2항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 아르고노트 단백질인 융합 단백질.
- 제20항에 있어서, 아르고노트 단백질이 서열식별번호: 25와 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제20항 또는 제21항에 있어서, 아르고노트 단백질이 서열식별번호: 25의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제로부터의 데아미나제인 융합 단백질.
- 제23항에 있어서, APOBEC 패밀리 데아미나제가 APOBEC1 데아미나제, APOBEC2 데아미나제, APOBEC3A 데아미나제, APOBEC3B 데아미나제, APOBEC3C 데아미나제, APOBEC3D 데아미나제, APOBEC3F 데아미나제, APOBEC3G 데아미나제 및 APOBEC3H 데아미나제로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 49-84의 아미노산 서열과 적어도 85% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 내지 제25항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 49-84의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 76의 W90Y, R126E, 및 R132E로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 래트 APOBEC1 (rAPOBEC1) 데아미나제인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 74의 W90Y, Q126E, 및 R132E로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 인간 APOBEC1 (hAPOBEC1) 데아미나제인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 60의 W285Y, R320E, 및 R326E로 이루어진 군으로부터 선택되는 1개 이상의 돌연변이, 또는 또 다른 APOBEC 데아미나제에서의 1개 이상의 상응하는 돌연변이를 포함하는 인간 APOBEC3G (hAPOBEC3G) 데아미나제인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 활성화-유도된 데아미나제 (AID)인 융합 단백질.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 페트로미존 마리누스(Petromyzon marinus)로부터의 시티딘 데아미나제 1 (pmCDA1)인 융합 단백질.
- 제1항 내지 제31항 중 어느 한 항에 있어서, UGI 도메인이 UDG 활성을 억제할 수 있는 도메인을 포함하는 것인 융합 단백질.
[청구항 32]
제1항 내지 제32항 중 어느 한 항에 있어서, UGI 도메인이 서열식별번호: 134와 적어도 85% 동일한 아미노산 서열을 포함하는 것인 융합 단백질. - 제132항에 있어서, UGI 도메인이 서열식별번호: 134에 제시된 바와 같은 아미노산 서열을 포함하는 것인 융합 단백질.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 하기 구조:
NH2-[시티딘 데아미나제 도메인]-[napDNAbp]-[UGI 도메인]-COOH;
NH2-[시티딘 데아미나제 도메인]-[napDNAbp]-[UGI]-[UGI]-COOH;
NH2-[시티딘 데아미나제 도메인]-[napDNAbp]-[UGI]-COOH;
NH2-[UGI]-[Apobec]-[napDNAbp]-COOH;
NH2-[시티딘 데아미나제 도메인]-[UGI]-[napDNAbp]-COOH;
NH2-[napDNAbp]-[UGI]-[시티딘 데아미나제 도메인]-COOH; 또는
NH2-[napDNAbp]-[시티딘 데아미나제 도메인]-[UGI]-COOH
를 포함하며;
여기서 각 경우의 "-"는 임의적인 링커를 포함하는 것인
융합 단백질. - 제34항에 있어서, (ii)의 시티딘 데아미나제 도메인 및 (i)의 napDNAbp 도메인이 아미노산 서열 (GGGS)n (서열식별번호: 613), (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 그의 조합을 포함하는 링커를 통해 연결되며, 여기서 n은 독립적으로 1 내지 30의 정수 (양끝값 포함)이고, X는 임의의 아미노산인 융합 단백질.
- 제1항 내지 제35항 중 어느 한 항에 있어서, (ii)의 시티딘 데아미나제 도메인 및 (i)의 napDNAbp가 아미노산 서열: SGSETPGTSESATPES (서열식별번호: 604)를 포함하는 링커를 통해 연결된 것인 융합 단백질.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 핵 국재화 서열 (NLS)을 추가로 포함하는 융합 단백질.
- 제37항에 있어서, NLS가 아미노산 서열 PKKKRKV (서열식별번호: 614), MDSLLMNRRKFLYQFKNVRWAKGRRETYLC (서열식별번호: 615) 또는 KRTADGSEFEPKKKRKV (서열식별번호: 740)를 포함하는 것인 융합 단백질.
- 제37항 또는 제38항에 있어서, 융합 단백질이 하기 구조:
NH2-[시티딘 데아미나제 도메인]-[napDNAbp]-[UGI 도메인]-[NLS]-COOH
를 포함하며, 여기서 각 경우의 "-"는 임의적인 링커를 포함하는 것인
융합 단백질 - 제37항 내지 제39항 중 어느 한 항에 있어서, UGI 도메인 및 NLS가 아미노산 서열: SGGS (서열식별번호: 606)를 포함하는 링커를 통해 연결되거나, 또는 napDNAbp 및 UGI 도메인이 아미노산 서열: SGGS (서열식별번호: 606)를 포함하는 링커를 통해 연결된 것인 융합 단백질.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질 및 융합 단백질의 napDNAbp에 결합된 가이드 RNA를 포함하는 복합체.
- 핵산 분자를 제1항 내지 제40항 중 어느 한 항의 융합 단백질 및 가이드 RNA와 접촉시키는 단계를 포함하며, 여기서 가이드 RNA는 유기체의 게놈에서의 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드의 서열을 포함하고, 표적 염기 쌍을 포함하는 것인 방법.
- 제42항에 있어서, 표적 염기 쌍이 질환 또는 장애와 연관된 T에서 C로의 점 돌연변이를 포함하고, 돌연변이체 C 염기의 탈아미노화가 질환 또는 장애와 연관되지 않은 서열을 발생시키는 것인 방법.
- 제42항 또는 제43항에 있어서, 접촉이 염기 편집시 20% 미만의 indel 형성을 발생시키는 것인 방법.
- 제42항 내지 제44항 중 어느 한 항에 있어서, 접촉이 염기 편집시 적어도 2:1의 의도된 대 비의도된 생성물을 발생시키는 것인 방법.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 및 napDNAbp에 결합된 RNA를 포함하는 복합체.
- 제46항에 있어서, RNA가 가이드 RNA (gRNA)인 복합체.
- 제46항에 있어서, RNA가 비-코딩 RNA이고/거나, RNA가 서열식별번호: 741의 아미노산 서열을 포함하며, 여기서 서열식별번호: 741의 각각의 T는 우라실 (U)인 복합체.
- 제46항에 있어서, RNA가 마이크로RNA (miRNA)인 복합체.
- 제46항에 있어서, RNA가 소형 간섭 RNA (siRNA)인 복합체.
- 제46항에 있어서, RNA가 Piwi-상호작용 RNA (piRNA)인 복합체.
- 제46항 내지 제51항 중 어느 한 항에 있어서, RNA가 10-100개 뉴클레오티드 길이이고, 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드의 서열을 포함하는 것인 복합체.
- 제52항에 있어서, RNA가 10, 11, 12, 13, 14,15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개 뉴클레오티드 길이인 복합체.
- 제46항 내지 제53항 중 어느 한 항에 있어서, RNA가 표적 서열에 상보적인 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 인접 뉴클레오티드의 서열을 포함하는 것인 복합체.
- 제46항 내지 제54항 중 어느 한 항에 있어서, 표적 서열이 DNA 서열인 복합체.
- 제46항 내지 제54항 중 어느 한 항에 있어서, 표적 서열이 RNA 서열인 복합체.
- 제55항에 있어서, 표적 서열이 유기체의 게놈 내에 있는 것인 복합체.
- 제56항에 있어서, 표적 서열이 유기체의 게놈으로부터 전사되는 것인 복합체.
- 제57항 또는 제58항에 있어서, 유기체가 원핵생물인 복합체.
- 제59항에 있어서, 원핵생물이 박테리아인 복합체.
- 제57항 또는 제58항에 있어서, 유기체가 진핵생물인 복합체.
- 제61항에 있어서, 유기체가 식물인 복합체.
- 제61항에 있어서, 유기체가 척추동물인 복합체.
- 제63항에 있어서, 척추동물이 포유동물인 복합체.
- 제64항에 있어서, 포유동물이 마우스 또는 래트인 복합체.
- 제64항에 있어서, 포유동물이 인간인 복합체.
- 핵산 분자를 제46항 내지 제66항 중 어느 한 항의 복합체와 접촉시키는 단계를 포함하는 방법.
- 제67항에 있어서, 핵산이 DNA인 방법.
- 제68항에 있어서, 핵산이 이중-가닥 DNA인 방법.
- 제67항에 있어서, 핵산이 RNA인 방법.
- 제70항에 있어서, RNA가 mRNA인 방법.
- 제67항 내지 제71항 중 어느 한 항에 있어서, 핵산이 질환 또는 장애와 연관된 표적 서열을 포함하는 것인 방법.
- 제72항에 있어서, 표적 서열이 질환 또는 장애와 연관된 점 돌연변이를 포함하는 것인 방법.
- 제73항에 있어서, 융합 단백질 또는 복합체의 활성이 점 돌연변이의 교정을 발생시키는 것인 방법.
- 제73항 또는 제74항에 있어서, 표적 서열이 질환 또는 장애와 연관된 T에서 C로의 점 돌연변이를 포함하고, 돌연변이체 C 염기의 탈아미노화는 질환 또는 장애와 연관되지 않은 서열을 발생시키는 것인 방법.
- 제75항에 있어서, 표적 서열이 단백질을 코딩하고, 점 돌연변이가 코돈 내에 있고, 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩된 아미노산의 변화를 발생시키는 것인 방법.
- 제75항 또는 제76항에 있어서, 돌연변이체 C의 탈아미노화가 돌연변이체 코돈에 의해 코딩된 아미노산의 변화를 발생시키는 것인 방법.
- 제75항 또는 제76항에 있어서, 돌연변이체 C의 탈아미노화가 야생형 아미노산을 코딩하는 코돈을 발생시키는 것인 방법.
- 제67항 내지 제78항 중 어느 한 항에 있어서, 접촉을 대상체의 생체내에서 수행하는 것인 방법.
- 제67항 내지 제78항 중 어느 한 항에 있어서, 접촉이 시험관내에서 수행하는 것인 방법.
- 제79항에 있어서, 대상체가 질환 또는 장애로 진단된 것인 방법.
- 제72항 내지 제82항 중 어느 한 항에 있어서, 질환 또는 장애가 낭성 섬유증, 페닐케톤뇨, 표피박리성 과다각화증 (EHK), 샤르코-마리-투스병 유형 4J, 신경모세포종 (NB), 폰 빌레브란트병 (vWD), 선천성 근긴장증, 유전성 신장 아밀로이드증, 확장성 심근병증 (DCM), 유전성 림프부종, 가족성 알츠하이머병, HIV, 프리온 질환, 만성 영아 신경학적 피부 관절 증후군 (CINCA), 데스민-관련 근병증 (DRM), 돌연변이체 PI3KCA 단백질, 돌연변이체 CTNNB1 단백질, 돌연변이체 HRAS 단백질, 또는 돌연변이체 p53 단백질과 연관된 신생물성 질환인 방법.
- (a) 제1항 내지 제40항 중 어느 한 항의 융합 단백질을 코딩하는 핵산 서열; 및
(b) (a)의 서열의 발현을 유도하는 이종 프로모터
를 포함하는 핵산 구축물을 포함하는 키트. - 제83항에 있어서, 가이드 RNA 백본을 코딩하는 발현 구축물을 추가로 포함하며, 여기서 구축물은 표적 서열과 동일하거나 그에 상보적인 핵산 서열의 가이드 RNA 백본 내로의 클로닝을 허용하도록 위치된 클로닝 부위를 포함하는 것인 키트.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질을 코딩하는 폴리뉴클레오티드.
- 제85항의 폴리뉴클레오티드를 포함하는 벡터.
- 제86항에 있어서, 폴리뉴클레오티드의 발현을 유도하는 이종 프로모터를 포함하는 벡터.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질을 포함하는 세포.
- 제46항 내지 제66항 중 어느 한 항의 복합체를 포함하는 세포.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질을 코딩하는 핵산 분자를 포함하는 세포.
- (i) 수용액에서 염기 편집제 단백질을 RNA와 복합체화함으로써 수용액에서 염기 편집제 및 RNA를 포함하는 복합체를 형성하는 단계; 및
(ii) (i)의 복합체를 양이온성 지질과 접촉시키는 단계
를 포함하는, 리보핵단백질 (RNP) 복합체를 생산하는 방법. - 제91항에 있어서, (i)의 염기 편집제 단백질 및 RNA를 1:1 내지 1:1.5의 몰비로 복합체화하는 것인 방법.
- 제91항 또는 제92항에 있어서, (i)의 염기 편집제 단백질 및 RNA를 1:1.05 내지 1:1.2의 몰비로 복합체화하는 것인 방법.
- 제91항 내지 제93항 중 어느 한 항에 있어서, (i)의 염기 편집제 단백질 및 RNA를 약 1:1.1의 몰비로 복합체화하는 것인 방법.
- 제91항 내지 제94항 중 어느 한 항에 있어서, (i)의 염기 편집제 단백질 및 RNA를 1:1.1의 몰비로 복합체화하는 것인 방법.
- 제91항 내지 제95항 중 어느 한 항에 있어서, 염기 편집제 단백질이 10 μM 내지 100 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제96항 중 어느 한 항에 있어서, 염기 편집제 단백질이 20 μM 내지 50 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제97항 중 어느 한 항에 있어서, 염기 편집제 단백질이 30 μM 내지 40 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제98항 중 어느 한 항에 있어서, 염기 편집제 단백질이 11 μM 내지 110 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제99항 중 어느 한 항에 있어서, 염기 편집제 단백질이 22 μM 내지 55 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제100항 중 어느 한 항에 있어서, 염기 편집제 단백질이 33 μM 내지 44 μM의 농도로 수용액에 존재하는 것인 방법.
- 제91항 내지 제101항 중 어느 한 항에 있어서, RNA가 sgRNA인 방법.
- 제91항 내지 제102항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 1:2 내지 2:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제103항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 1:1.5 내지 1.5:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제104항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 1:1.2 내지 1.2:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제105항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 1:1.1 내지 1.1:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제106항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 약 1:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제107항 중 어느 한 항에 있어서, (i)의 수용액에서의 복합체를 1:1의 부피비로 (ii)의 양이온성 지질과 접촉시키는 것인 방법.
- 제91항 내지 제108항 중 어느 한 항에 있어서, 양이온성 지질이 리포펙타민®인 방법.
- 제109항에 있어서, 리포펙타민®이 리포펙타민® 2000, 리포펙타민®3000, 리포펙타민® 메신저MAX, 리포펙타민® LTX 및 리포펙타민®RNAiMAX로 이루어진 군으로부터 선택되는 것인 방법.
- 제91항 내지 제110항 중 어느 한 항에 있어서, 염기 편집제가 제1항 내지 제40항 중 어느 한 항의 융합 단백질인 방법.
- 제91항 내지 제111항 중 어느 한 항에 있어서, (i)의 복합체가 제46항 내지 제66항 중 어느 한 항의 복합체인 방법.
- 제91항 내지 제112항 중 어느 한 항의 방법에 의해 생산되는 제약 조성물.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질을 포함하는 제약 조성물.
- 제41항의 복합체를 포함하는 제약 조성물.
- 제46항 내지 제66항 중 어느 한 항의 복합체를 포함하는 제약 조성물.
- 제113항 내지 제116항 중 어느 한 항에 있어서, 제약상 허용되는 부형제를 추가로 포함하는 제약 조성물.
- (i) 세포에서 염기 편집제 단백질을 발현시키는 단계이며, 여기서 염기 편집제 단백질은 친화성 태그를 포함하는 것인 단계;
(ii) (i)의 세포를 용해시킴으로써 용해물을 생성하는 단계; 및
(iii) 용해물을 친화성 크로마토그래피에 적용함으로써 정제된 염기 편집제 단백질을 포함하는 용리액을 생산하는 단계
를 포함하는, 염기 편집제 단백질을 정제하는 방법. - 제118항에 있어서, 세포가 박테리아 세포인 방법.
- 제119항에 있어서, 박테리아 세포가 이. 콜라이(E. coli) 세포인 방법.
- 제120항에 있어서, 이. 콜라이 세포가 BL21 DE3 적격 세포인 방법.
- 제118항 내지 제121항 중 어느 한 항에 있어서, 친화성 태그가 폴리히스티딘 태그인 방법.
- 제118항 내지 제122항 중 어느 한 항에 있어서, 단계 (iii)이 (ii)의 용해물을 니켈-NTA 수지와 접촉시키는 것을 포함하며, 여기서 염기 편집제 단백질은 니켈-NTA 수지에 결합된 것인 방법.
- 제123항에 있어서,
(iv) 니켈-NTA 수지로부터 염기 편집제 단백질을 용리시킴으로써 염기 편집제 단백질을 포함하는 용리액을 생성하는 단계
를 추가로 포함하는 방법. - 제118항 내지 제124항 중 어느 한 항에 있어서, 염기 편집제 단백질을 포함하는 용리액을 양이온 교환 크로마토그래피에 적용하는 것인 방법.
- 제125항에 있어서, 양이온 교환 크로마토그래피가 염기 편집제 단백질을 포함하는 용리액을 양이온 교환 칼럼과 접촉시키는 단계를 포함하는 것인 방법.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 대상체의 내이로 전달하는 단계를 포함하는 방법.
- 제127항에 있어서, 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 대상체의 와우로 전달하는 단계를 포함하는 방법.
- 제127항 또는 제128항에 있어서, 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 대상체의 내이에 주사하는 것인 방법.
- 제127항 내지 제129항 중 어느 한 항에 있어서, 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 대상체의 와우에 주사하는 것인 방법.
- 제127항 내지 제130항 중 어느 한 항에 있어서, 대상체의 귀에 이후부절개를 생성하는 단계를 추가로 포함하는 방법.
- 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 제브라피쉬 배아로 전달하는 단계를 포함하는 방법.
- 제132항에 있어서, 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 1-세포 단계에서 제브라피쉬 배아에 주사하는 것인 방법.
- 제132항 또는 제133항에 있어서, 제1항 내지 제40항 중 어느 한 항의 융합 단백질, 제41항의 복합체, 제46항 내지 제66항 중 어느 한 항의 복합체 또는 제113항 내지 제117항 중 어느 한 항의 제약 조성물을 2-세포, 4-세포, 8-세포 또는 16-세포 단계에서 제브라피쉬 배아에 주사하는 것인 방법.
- 제132항 내지 제134항 중 어느 한 항에 있어서, gRNA와 복합체화된 염기 편집제 단백질의 0.5 nmol 내지 50 nmol을 제브라피쉬 배아에 주사하는 것인 방법.
- 제132항 내지 제135항 중 어느 한 항에 있어서, gRNA와 복합체화된 염기 편집제 단백질의 2 nmol 내지 30 nmol을 제브라피쉬 배아에 주사하는 것인 방법.
- (i) 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp); (ii) 시티딘 데아미나제 도메인; (iii) 제1 우라실 글리코실라제 억제제 (UGI) 도메인; 및 (iv) 제2 우라실 글리코실라제 억제제 (UGI) 도메인을 포함하는 융합 단백질.
- 제137항에 있어서, 핵산 프로그램가능한 DNA 결합 단백질 (napDNAbp)이 CasX, CasY, Cpf1, Cpf1 니카제, dCpf1, C2c1, C2c2, C2c3, Cas9, dCas9, Cas9 니카제 또는 아르고노트 단백질인 융합 단백질.
- 제138항에 있어서, dCas9 단백질이 서열식별번호: 6 또는 7과 적어도 90% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 또는 제138항에 있어서, dCas9 단백질이 서열식별번호: 7의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제138항에 있어서, dCas9 단백질이 뉴클레아제 불활성 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 (SaCas9d) 단백질인 융합 단백질.
- 제141항에 있어서, SaCas9d 단백질이 서열식별번호: 33-36과 적어도 85%, 90%, 95% 또는 98% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제141항 또는 제142항에 있어서, SaCas9d 단백질이 서열식별번호: 34의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 내지 제143항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 아포지단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 데아미나제로부터의 데아미나제인 융합 단백질.
- 제144항에 있어서, APOBEC 패밀리 데아미나제가 APOBEC1 데아미나제, APOBEC2 데아미나제, APOBEC3A 데아미나제, APOBEC3B 데아미나제, APOBEC3C 데아미나제, APOBEC3D 데아미나제, APOBEC3F 데아미나제, APOBEC3G 데아미나제 및 APOBEC3H 데아미나제로 이루어진 군으로부터 선택되는 것인 융합 단백질.
- 제137항 내지 제145항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 49-84의 아미노산 서열과 적어도 85%, 90%, 95% 또는 98% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 내지 제146항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 서열식별번호: 49-84의 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 내지 제143항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 활성화-유도된 데아미나제 (AID)인 융합 단백질.
- 제137항 내지 제143항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인이 시티딘 데아미나제 1 (CDA1)인 융합 단백질.
- 제137항 내지 제149항 중 어느 한 항에 있어서, UGI 도메인이 UDG 활성을 억제할 수 있는 도메인을 포함하는 것인 융합 단백질.
- 제137항 내지 제150항 중 어느 한 항에 있어서, UGI 도메인이 서열식별번호: 134와 적어도 85%, 90%, 95% 또는 98% 동일한 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 내지 제150항 중 어느 한 항에 있어서, UGI 도메인이 서열식별번호: 134에 제시된 바와 같은 아미노산 서열을 포함하는 것인 융합 단백질.
- 제137항 내지 제152항 중 어느 한 항에 있어서, 하기 구조:
NH2-[시티딘 데아미나제 도메인]-[napDNAbp]-[제1 UGI 도메인]-[제2 UGI 도메인]-COOH;
NH2-[제1 UGI 도메인]-[제2 UGI 도메인]-[시티딘 데아미나제 도메인]-[napDNAbp]-COOH;
NH2-[napDNAbp]-[시티딘 데아미나제 도메인]-[제1 UGI 도메인]-[제2 UGI 도메인]-COOH; 또는
NH2-[제1 UGI 도메인]-[제2 UGI 도메인]-[napDNAbp]-[시티딘 데아미나제 도메인]-COOH
를 포함하며;
여기서 각 경우의 "-"는 임의적인 링커를 포함하는 것인
융합 단백질. - 제153항에 있어서, 시티딘 데아미나제 도메인 및 napDNAbp 도메인이 아미노산 서열 (GGGS)n (서열식별번호: 613), (GGGGS)n (서열식별번호: 607), (G)n (서열식별번호: 608), (EAAAK)n (서열식별번호: 609), (GGS)n (서열식별번호: 610), (SGGS)n (서열식별번호: 606), SGSETPGTSESATPES (서열식별번호: 604), SGGS(GGS)n (서열식별번호: 612), SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605), 또는 (XP)n (서열식별번호: 611) 모티프, 또는 그의 조합을 포함하는 링커를 통해 연결되며, 여기서 n은 독립적으로 1 내지 30의 정수 (양끝값 포함)이고, X는 임의의 아미노산인 융합 단백질.
- 제137항 내지 제154항 중 어느 한 항에 있어서, 시티딘 데아미나제 도메인 및 napDNAbp가 아미노산 서열: SGGSSGGSSGSETPGTSESATPESSGGSSGGS (서열식별번호: 605)를 포함하는 링커를 통해 연결된 것인 융합 단백질.
- 제137항 내지 제154항 중 어느 한 항에 있어서, napDNAbp 및 제1 UGI 도메인이 아미노산 서열: SGGS(GGS)n (서열식별번호: 612)을 포함하는 링커를 통해 연결되며, 여기서 n은 2인 융합 단백질.
- 제137항 내지 제154항 중 어느 한 항에 있어서, 제1 UGI 도메인 및 제2 UGI 도메인이 아미노산 서열: SGGS(GGS)n (서열식별번호: 612)을 포함하는 링커를 통해 연결되며, 여기서 n은 2인 융합 단백질.
- 제137항 내지 제157항 중 어느 한 항에 있어서, 핵 국재화 서열 (NLS)을 추가로 포함하는 융합 단백질.
- 제158항에 있어서, NLS가 아미노산 서열 PKKKRKV (서열식별번호: 614) 또는 KRTADGSEFEPKKKRKV (서열식별번호: 740)를 포함하는 것인 융합 단백질.
- 제158항 또는 제159항에 있어서, 하기 구조:
[NH2]-[시티딘 데아미나제 도메인]-[napDNAbp]-[제1 UGI 도메인]-[제2 UGI 도메인]-[NLS]-[COOH]
를 포함하고, 각 경우의 "-"는 임의적인 링커를 포함하는 것인
융합 단백질. - 제158항 내지 제160항 중 어느 한 항에 있어서, 하기 구조:
[시티딘 데아미나제 도메인]-[dCas9]-[제1 UGI 도메인]-[제2 UGI 도메인]-[NLS]
를 포함하고, 각 경우의 "-"는 임의적인 링커를 포함하는 것인
융합 단백질. - 제160항 또는 제161항에 있어서, 제2 UGI 도메인 및 NLS가 아미노산 서열: SGGS (서열식별번호: 606)를 포함하는 링커를 통해 연결된 것인 융합 단백질.
- 제137항 내지 제162항 중 어느 한 항의 융합 단백질 및 융합 단백질의 napDNAbp에 결합된 가이드 RNA를 포함하는 복합체.
- 핵산 분자를 제137항 내지 제162항 중 어느 한 항의 융합 단백질 및 가이드 RNA와 접촉시키는 단계를 포함하며, 여기서 가이드 RNA는 유기체의 게놈에서의 표적 서열에 상보적인 적어도 10개의 인접 뉴클레오티드의 서열을 포함하고, 표적 염기 쌍을 포함하는 것인 방법.
- 제164항에 있어서, 표적 염기 쌍이 질환 또는 장애와 연관된 T에서 C로의 점 돌연변이를 포함하고, 돌연변이체 C 염기의 탈아미노화가 질환 또는 장애와 연관되지 않은 서열을 발생시키는 것인 방법.
- 제164항 또는 제165항에 있어서, 접촉이 염기 편집 시 20% 미만의 indel 형성을 발생시키는 것인 방법.
- 제164항 또는 제165항에 있어서, 표적 서열이 질환 또는 장애와 연관된 점 돌연변이를 포함하는 것인 방법.
- 제164항 내지 제167항 중 어느 한 항에 있어서, 융합 단백질 또는 복합체의 활성이 점 돌연변이의 교정을 발생시키는 것인 방법.
- 제164항 또는 제165항에 있어서, 표적 서열이 질환 또는 장애와 연관된 T에서 C로의 점 돌연변이를 포함하고, 돌연변이체 C 염기의 탈아미노화가 질환 또는 장애와 연관되지 않은 서열을 발생시키는 것인 방법.
- 제169항에 있어서, 표적 서열이 단백질을 코딩하고, 점 돌연변이가 코돈 내에 있고, 야생형 코돈과 비교하여 돌연변이체 코돈에 의해 코딩된 아미노산의 변화를 발생시키는 것인 방법.
- 제169항 또는 제170항에 있어서, 돌연변이체 C의 탈아미노화가 돌연변이체 코돈에 의해 코딩된 아미노산의 변화를 발생시키는 것인 방법.
- 제169항 또는 제170항에 있어서, 돌연변이체 C의 탈아미노화가 야생형 아미노산을 코딩하는 코돈을 발생시키는 것인 방법.
- 제164항 내지 제172항 중 어느 한 항에 있어서, 접촉을 대상체의 생체내에서 수행하는 것인 방법.
- 제164항 내지 제172항 중 어느 한 항에 있어서, 접촉을 시험관내에서 수행하는 것인 방법.
- 제173항에 있어서, 대상체가 질환 또는 장애로 진단된 것인 방법.
- 이중-가닥 DNA 서열의 표적 영역을 핵염기 편집제 및 가이드 핵산을 포함하는 복합체와 접촉시키는 단계이며, 여기서 표적 영역은 표적 핵염기 쌍을 포함하는 것인 단계;
상기 표적 영역의 가닥 분리를 유도하는 단계;
표적 영역의 단일 가닥에서의 상기 표적 핵염기 쌍의 제1 핵염기를 제2 핵염기로 전환시키는 단계; 및
상기 표적 영역의 1개 이하의 가닥을 절단하는 단계
를 포함하는, 이중-가닥 DNA 서열의 핵염기 쌍을 편집하는 방법이며;
여기서 제1 핵염기 염기에 상보적인 제3 핵염기는 제2 핵염기에 상보적인 제4 핵염기에 의해 대체되고;
여기서 방법은 이중-가닥 DNA 서열에서 20% 미만의 indel 형성을 유발하고;
여기서 핵염기 편집제는 CasX, CasY, Cpf1, C2c1, C2c2, C2c3 또는 아르고노트를 포함하는 것인 방법. - 제176항에 있어서, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2% 또는 1% 미만의 indel 형성을 유발하는 방법.
- 제176항에 있어서, 제2 핵염기를 제4 핵염기에 상보적인 제5 핵염기로 대체함으로써 의도된 편집된 염기 쌍을 생성하는 것을 추가로 포함하는 방법.
- 제178항에 있어서, 의도된 편집된 염기 쌍을 생성하는 효율이 적어도 5%인 방법.
- 제179항에 있어서, 효율이 적어도 10%, 20%, 30%, 40% 또는 50%인 방법.
- 제178항에 있어서, 의도된 편집된 염기 쌍 대 비의도된 편집된 염기 쌍의 비가 2:1, 3:1, 4:1, 5:1, 6:1, 7:1 또는 8:1인 방법.
- 제178항에 있어서, 의도된 편집된 염기 쌍 대 indel 형성의 비가 2:1 내지 1000:1인 방법.
- 제176항에 있어서, 절단된 단일 가닥이 가이드 핵산에 혼성화되는 것인 방법.
- 제176항에 있어서, 절단된 단일 가닥이 제1 핵염기를 포함하는 가닥에 대향하는 것인 방법.
- 제176항에 있어서, 상기 제1 염기가 시토신인 방법.
- 제176항에 있어서, 제2 핵염기가 비-표준 핵염기인 방법.
- 제176항에 있어서, 제2 핵염기가 G, C, A 또는 T 이외의 것인 방법.
- 제176항에 있어서, 상기 제2 염기가 우라실인 방법.
- 제176항에 있어서, 핵염기 편집제가 UGI 활성을 포함하는 것인 방법.
- 제176항에 있어서, 핵염기 편집제가 UGI 도메인을 포함하는 것인 방법.
- 제176항에 있어서, 핵염기 편집제가 2개의 UGI 도메인을 포함하는 것인 방법.
- 제176항에 있어서, 핵염기 편집제가 니카제 활성을 포함하는 것인 방법.
- 제178항에 있어서, 의도된 편집된 염기 쌍이 PAM 부위의 상류에 있는 것인 방법.
- 제193항에 있어서, 의도된 편집된 염기 쌍이 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 상류에 있는 것인 방법.
- 제178항에 있어서, 의도된 편집된 염기 쌍이 PAM 부위의 하류에 있는 것인 방법.
- 제195항에 있어서, 의도된 편집된 염기 쌍이 PAM 부위의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 하류에 있는 것인 방법.
- 제176항에 있어서, 정규 PAM 부위를 필요로 하지 않는 방법.
- 제176항에 있어서, 핵염기 편집제가 링커를 포함하는 것인 방법.
- 제198항에 있어서, 링커가 1-25개 아미노산 길이인 방법.
- 제198항에 있어서, 링커가 5-20개 아미노산 길이인 방법.
- 제198항에 있어서, 링커가 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 아미노산 길이인 방법.
- 제178항에 있어서, 표적 영역이 표적 윈도우를 포함하며, 여기서 표적 윈도우는 표적 핵염기 쌍을 포함하는 것인 방법.
- 제202항에 있어서, 표적 윈도우가 1-10개 뉴클레오티드를 포함하는 것인 방법.
- 제202항에 있어서, 표적 윈도우가 1-9, 1-8, 1-7, 1-6, 1-5, 1-4, 1-3, 1-2 또는 1개 뉴클레오티드 길이인 방법.
- 제202항에 있어서, 표적 윈도우가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 뉴클레오티드 길이인 방법.
- 제202항 내지 제205항 중 어느 한 항에 있어서, 의도된 편집된 염기 쌍이 표적 윈도우 내에서 발생하는 것인 방법.
- 제202항 내지 제206항 중 어느 한 항에 있어서, 표적 윈도우가 의도된 편집된 염기 쌍을 포함하는 것인 방법.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762475830P | 2017-03-23 | 2017-03-23 | |
US62/475,830 | 2017-03-23 | ||
US201762490587P | 2017-04-26 | 2017-04-26 | |
US62/490,587 | 2017-04-26 | ||
US201762511934P | 2017-05-26 | 2017-05-26 | |
US62/511,934 | 2017-05-26 | ||
US201762551951P | 2017-08-30 | 2017-08-30 | |
US62/551,951 | 2017-08-30 | ||
PCT/US2018/024208 WO2018176009A1 (en) | 2017-03-23 | 2018-03-23 | Nucleobase editors comprising nucleic acid programmable dna binding proteins |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190130613A true KR20190130613A (ko) | 2019-11-22 |
Family
ID=62028102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197031141A KR20190130613A (ko) | 2017-03-23 | 2018-03-23 | 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11268082B2 (ko) |
EP (1) | EP3601562A1 (ko) |
JP (2) | JP7191388B2 (ko) |
KR (1) | KR20190130613A (ko) |
CN (1) | CN110914426A (ko) |
AU (1) | AU2018240571A1 (ko) |
BR (1) | BR112019019655A2 (ko) |
CA (1) | CA3057192A1 (ko) |
CL (2) | CL2019002679A1 (ko) |
GB (1) | GB2575930A (ko) |
IL (2) | IL269458B2 (ko) |
SG (1) | SG11201908658TA (ko) |
WO (1) | WO2018176009A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023008887A1 (ko) * | 2021-07-26 | 2023-02-02 | 서울대학교산학협력단 | 염기 편집기 및 이의 용도 |
Families Citing this family (129)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US20150165054A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting caspase-9 point mutations |
AU2015298571B2 (en) | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
JP7109784B2 (ja) | 2015-10-23 | 2022-08-01 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 遺伝子編集のための進化したCas9蛋白質 |
EP3494215A1 (en) | 2016-08-03 | 2019-06-12 | President and Fellows of Harvard College | Adenosine nucleobase editors and uses thereof |
JP7201153B2 (ja) | 2016-08-09 | 2023-01-10 | プレジデント アンド フェローズ オブ ハーバード カレッジ | プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用 |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
KR20190141657A (ko) | 2017-02-28 | 2019-12-24 | 보르 바이오파마, 인크. | 계통 특이적 단백질의 억제를 위한 조성물 및 방법 |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
EP3630198A4 (en) | 2017-05-25 | 2021-04-21 | The General Hospital Corporation | USE OF CLIVED DESAMINASES TO LIMIT UNWANTED OUT-OF-TARGET DESAMINATION FROM BASE EDITING |
WO2019023648A1 (en) | 2017-07-28 | 2019-01-31 | Applied Therapeutics Inc. | COMPOSITIONS AND METHODS FOR TREATING GALACTOSEMIA |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
WO2019051097A1 (en) | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
WO2019161251A1 (en) | 2018-02-15 | 2019-08-22 | The Broad Institute, Inc. | Cell data recorders and uses thereof |
GB2589246A (en) | 2018-05-16 | 2021-05-26 | Synthego Corp | Methods and systems for guide RNA design and use |
MX2021002415A (es) | 2018-08-28 | 2021-09-21 | Vor Biopharma Inc | Celulas madre hematopoyeticas modificadas geneticamente y usos de las mismas. |
US20210395730A1 (en) * | 2018-10-10 | 2021-12-23 | The General Hospital Corporation | Selective Curbing of Unwanted RNA Editing (SECURE) DNA Base Editor Variants |
US20220290113A1 (en) * | 2018-10-15 | 2022-09-15 | University Of Massachusetts | Programmable dna base editing by nme2cas9-deaminase fusion proteins |
US20220380740A1 (en) * | 2018-10-24 | 2022-12-01 | The Broad Institute, Inc. | Constructs for improved hdr-dependent genomic editing |
CN114072509A (zh) * | 2019-01-31 | 2022-02-18 | 比姆医疗股份有限公司 | 脱氨反应脱靶减低的核碱基编辑器和使用其修饰核碱基靶序列的方法 |
WO2020160514A1 (en) * | 2019-01-31 | 2020-08-06 | Beam Therapeutics Inc. | Nucleobase editors having reduced non-target deamination and assays for characterizing nucleobase editors |
EP3921417A4 (en) | 2019-02-04 | 2022-11-09 | The General Hospital Corporation | ADENINE DNA BASE EDITOR VARIANTS WITH REDUCED OFF-TARGET RNA EDITING |
CN116497067A (zh) | 2019-02-13 | 2023-07-28 | 比姆医疗股份有限公司 | 治疗血红素病变的组合物和方法 |
CN114190093A (zh) * | 2019-02-13 | 2022-03-15 | 比姆医疗股份有限公司 | 使用腺苷酸脱氨酶碱基编辑器破坏疾病相关基因的剪接受体位点,包括用于治疗遗传性疾病 |
CN110804628B (zh) * | 2019-02-28 | 2023-05-12 | 中国科学院脑科学与智能技术卓越创新中心 | 高特异性无脱靶单碱基基因编辑工具 |
US20220177877A1 (en) * | 2019-03-04 | 2022-06-09 | President And Fellows Of Harvard College | Highly multiplexed base editing |
US20220170013A1 (en) | 2019-03-06 | 2022-06-02 | The Broad Institute, Inc. | T:a to a:t base editing through adenosine methylation |
WO2020181195A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | T:a to a:t base editing through adenine excision |
WO2020181178A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | T:a to a:t base editing through thymine alkylation |
WO2020181202A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | A:t to t:a base editing through adenine deamination and oxidation |
WO2020181180A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | A:t to c:g base editors and uses thereof |
CN110526993B (zh) * | 2019-03-06 | 2020-06-16 | 山东舜丰生物科技有限公司 | 一种用于基因编辑的核酸构建物 |
WO2020182368A1 (en) * | 2019-03-13 | 2020-09-17 | MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. | High-precision base editors |
SG11202109882VA (en) * | 2019-03-19 | 2021-10-28 | Broad Inst Inc | Methods and compositions for editing nucleotide sequences |
US20220170006A1 (en) * | 2019-04-05 | 2022-06-02 | The Broad Institute, Inc. | A pseudo-random dna editor for efficient and continuous nucleotide diversification in human cells |
US20220307003A1 (en) | 2019-04-17 | 2022-09-29 | The Broad Institute, Inc. | Adenine base editors with reduced off-target effects |
JP2022531466A (ja) * | 2019-05-07 | 2022-07-06 | ユニバーシティ オブ マイアミ | 遺伝性ニューロパチーおよび関連障害の処置および検出 |
EP3973054A1 (en) | 2019-05-20 | 2022-03-30 | The Broad Institute Inc. | Aav delivery of nucleobase editors |
JP2022534813A (ja) | 2019-05-23 | 2022-08-03 | ブイオーアール バイオファーマ インコーポレーテッド | Cd33改変のための組成物および方法 |
CN111304180B (zh) * | 2019-06-04 | 2023-05-26 | 山东舜丰生物科技有限公司 | 一种新的dna核酸切割酶及其应用 |
CN112239756B (zh) * | 2019-07-01 | 2022-04-19 | 科稷达隆(北京)生物技术有限公司 | 一组来源于植物的胞嘧啶脱氨酶和其在碱基编辑系统中的应用 |
CN114375335A (zh) * | 2019-07-19 | 2022-04-19 | 成对植物服务股份有限公司 | 经优化的蛋白质连接体以及使用方法 |
WO2021025750A1 (en) | 2019-08-08 | 2021-02-11 | The Broad Institute, Inc. | Base editors with diversified targeting scope |
WO2021030666A1 (en) | 2019-08-15 | 2021-02-18 | The Broad Institute, Inc. | Base editing by transglycosylation |
US20220380749A1 (en) * | 2019-08-20 | 2022-12-01 | Tianjin Institute Of Industrial Biotechnology, Chinese Academy Of Sciences | Base editing systems for achieving c to a and c to g base mutation and application thereof |
AU2020336211A1 (en) | 2019-08-28 | 2022-03-10 | Vor Biopharma Inc. | Compositions and methods for CD123 modification |
JP2022545956A (ja) | 2019-08-28 | 2022-11-01 | ブイオーアール バイオファーマ インコーポレーテッド | Cll1改変ための組成物および方法 |
EP4022051A4 (en) * | 2019-08-29 | 2024-01-10 | Beam Therapeutics Inc. | COMPOSITIONS AND METHODS FOR NON-TOXIC CONDITIONING |
US20220290121A1 (en) * | 2019-08-30 | 2022-09-15 | The General Hospital Corporation | Combinatorial Adenine and Cytosine DNA Base Editors |
WO2021046155A1 (en) | 2019-09-03 | 2021-03-11 | Voyager Therapeutics, Inc. | Vectorized editing of nucleic acids to correct overt mutations |
WO2021056302A1 (en) * | 2019-09-26 | 2021-04-01 | Syngenta Crop Protection Ag | Methods and compositions for dna base editing |
US20230002746A1 (en) * | 2019-10-31 | 2023-01-05 | Inari Agriculture Technology, Inc. | Base-editing systems |
WO2021108717A2 (en) | 2019-11-26 | 2021-06-03 | The Broad Institute, Inc | Systems and methods for evaluating cas9-independent off-target editing of nucleic acids |
CN110964742B (zh) * | 2019-12-20 | 2022-03-01 | 北京市农林科学院 | 一种抗除草剂水稻的制备方法 |
EP4081635A4 (en) * | 2019-12-26 | 2024-03-27 | Agency for Science, Technology and Research | NUCLEOBASE EDITORS |
CA3166153A1 (en) | 2020-01-28 | 2021-08-05 | The Broad Institute, Inc. | Base editors, compositions, and methods for modifying the mitochondrial genome |
WO2021158999A1 (en) | 2020-02-05 | 2021-08-12 | The Broad Institute, Inc. | Gene editing methods for treating spinal muscular atrophy |
WO2021158995A1 (en) | 2020-02-05 | 2021-08-12 | The Broad Institute, Inc. | Base editor predictive algorithm and method of use |
WO2021158921A2 (en) | 2020-02-05 | 2021-08-12 | The Broad Institute, Inc. | Adenine base editors and uses thereof |
EP4118206A1 (en) | 2020-03-11 | 2023-01-18 | The Broad Institute Inc. | Stat3-targeted base editor therapeutics for the treatment of melanoma and other cancers |
WO2021183504A1 (en) * | 2020-03-11 | 2021-09-16 | North Carolina State University | Compositions, methods, and systems for genome editing technology |
AU2021236683A1 (en) | 2020-03-19 | 2022-11-17 | Intellia Therapeutics, Inc. | Methods and compositions for directed genome editing |
CN111518794B (zh) * | 2020-04-13 | 2023-05-16 | 中山大学 | 基于激活诱导性胞苷脱氨酶的诱导突变蛋白的制备和用途 |
WO2021216625A1 (en) * | 2020-04-20 | 2021-10-28 | Integrated Dna Technologies, Inc. | Optimized protein fusions and linkers |
WO2021222318A1 (en) | 2020-04-28 | 2021-11-04 | The Broad Institute, Inc. | Targeted base editing of the ush2a gene |
JP2023525304A (ja) | 2020-05-08 | 2023-06-15 | ザ ブロード インスティテュート,インコーポレーテッド | 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物 |
EP4185699A1 (en) * | 2020-07-21 | 2023-05-31 | Pairwise Plants Services, Inc. | Optimized protein linkers and methods of use |
JP2023540277A (ja) | 2020-08-28 | 2023-09-22 | ブイオーアール バイオファーマ インコーポレーテッド | Cd123改変のための組成物および方法 |
WO2022047168A1 (en) | 2020-08-28 | 2022-03-03 | Vor Biopharma Inc. | Compositions and methods for cll1 modification |
EP4209589A1 (en) * | 2020-09-04 | 2023-07-12 | National University Corporation Kobe University | Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna |
JP2023541457A (ja) | 2020-09-14 | 2023-10-02 | ブイオーアール バイオファーマ インコーポレーテッド | Cd38修飾のための化合物および方法 |
JP2023541458A (ja) | 2020-09-14 | 2023-10-02 | ブイオーアール バイオファーマ インコーポレーテッド | Cd5修飾のための化合物および方法 |
EP4214318A1 (en) | 2020-09-18 | 2023-07-26 | Vor Biopharma Inc. | Compositions and methods for cd7 modification |
WO2022067240A1 (en) | 2020-09-28 | 2022-03-31 | Vor Biopharma, Inc. | Compositions and methods for cd6 modification |
US20230364146A1 (en) | 2020-09-30 | 2023-11-16 | Vor Biopharma Inc. | Compositions and methods for cd30 gene modification |
CN112322655B (zh) * | 2020-10-22 | 2023-06-30 | 肇庆华夏凯奇生物技术有限公司 | 一种不受基因序列限制的碱基编辑系统及其制备方法和应用 |
KR20230097089A (ko) | 2020-10-27 | 2023-06-30 | 보르 바이오파마 인크. | 조혈 악성종양을 치료하기 위한 조성물 및 방법 |
WO2022094245A1 (en) | 2020-10-30 | 2022-05-05 | Vor Biopharma, Inc. | Compositions and methods for bcma modification |
CA3201003A1 (en) | 2020-11-13 | 2022-05-19 | Vor Biopharma Inc. | Methods and compositions relating to genetically engineered cells expressing chimeric antigen receptors |
IT202000028688A1 (it) | 2020-11-27 | 2022-05-27 | Consiglio Nazionale Ricerche | Varianti della citidina deaminasi per l’editazione di basi |
AU2021403027A1 (en) * | 2020-12-17 | 2023-06-29 | Monsanto Technology Llc | Engineered ssdnase-free crispr endonucleases |
CN112538500A (zh) * | 2020-12-25 | 2021-03-23 | 佛山科学技术学院 | 一种碱基编辑器及其制备方法和应用 |
KR20230126707A (ko) | 2020-12-31 | 2023-08-30 | 보르 바이오파마 인크. | Cd34 유전자 변형을 위한 조성물 및 방법 |
CN113322254B (zh) * | 2021-01-06 | 2022-05-20 | 南京诺唯赞生物科技股份有限公司 | 多靶点蛋白质-dna相互作用的研究方法和工具 |
WO2022155265A2 (en) * | 2021-01-12 | 2022-07-21 | Mitolab Inc. | Context-dependent, double-stranded dna-specific deaminases and uses thereof |
CN117083389A (zh) * | 2021-02-17 | 2023-11-17 | 密苏里大学管委会 | 植物叶绿体胞嘧啶碱基编辑器与线粒体胞嘧啶碱基编辑器 |
US20240200059A1 (en) | 2021-04-09 | 2024-06-20 | Vor Biopharma Inc. | Photocleavable guide rnas and methods of use thereof |
US20220372497A1 (en) * | 2021-05-18 | 2022-11-24 | Shanghaitech University | Base Editing Tool And Use Thereof |
CN117396602A (zh) | 2021-05-27 | 2024-01-12 | 阿斯利康(瑞典)有限公司 | 具有增强的稳定性的cas9效应蛋白 |
CN113178229B (zh) * | 2021-05-31 | 2022-03-08 | 吉林大学 | 一种基于深度学习的rna和蛋白质结合位点的识别方法 |
WO2022261509A1 (en) | 2021-06-11 | 2022-12-15 | The Broad Institute, Inc. | Improved cytosine to guanine base editors |
CN113462717A (zh) * | 2021-06-28 | 2021-10-01 | 郑州大学 | BSMV投送splited-Sacas9和sgRNA介导的基因编辑方法 |
WO2023279118A2 (en) * | 2021-07-02 | 2023-01-05 | University Of Maryland, College Park | Cytidine deaminases and methods of genome editing using the same |
WO2023283585A2 (en) | 2021-07-06 | 2023-01-12 | Vor Biopharma Inc. | Inhibitor oligonucleotides and methods of use thereof |
CN113621634B (zh) * | 2021-07-07 | 2023-09-15 | 浙江大学杭州国际科创中心 | 一种增加基因组突变率的碱基编辑系统及碱基编辑方法 |
EP4381062A1 (en) | 2021-08-02 | 2024-06-12 | Vor Biopharma Inc. | Compositions and methods for gene modification |
WO2023049926A2 (en) | 2021-09-27 | 2023-03-30 | Vor Biopharma Inc. | Fusion polypeptides for genetic editing and methods of use thereof |
AU2022382975A1 (en) * | 2021-11-03 | 2024-05-02 | Intellia Therapeutics, Inc. | Polynucleotides, compositions, and methods for genome editing |
CA3234217A1 (en) * | 2021-11-05 | 2023-05-11 | Brian C. Thomas | Base editing enzymes |
AU2022387087A1 (en) | 2021-11-09 | 2024-05-02 | Vor Biopharma Inc. | Compositions and methods for erm2 modification |
CA3239381A1 (en) * | 2021-12-03 | 2023-06-08 | David R. Liu | Compositions and methods for efficient in vivo delivery |
AU2022400961A1 (en) | 2021-12-03 | 2024-05-30 | President And Fellows Of Harvard College | Self-assembling virus-like particles for delivery of nucleic acid programmable fusion proteins and methods of making and using same |
WO2023155924A1 (en) * | 2022-02-21 | 2023-08-24 | Huidagene Therapeutics Co., Ltd. | Guide rna and uses thereof |
WO2023187027A1 (en) | 2022-03-30 | 2023-10-05 | BASF Agricultural Solutions Seed US LLC | Optimized base editors |
WO2023196816A1 (en) | 2022-04-04 | 2023-10-12 | Vor Biopharma Inc. | Compositions and methods for mediating epitope engineering |
WO2023196802A1 (en) | 2022-04-04 | 2023-10-12 | The Broad Institute, Inc. | Cas9 variants having non-canonical pam specificities and uses thereof |
WO2023212715A1 (en) | 2022-04-28 | 2023-11-02 | The Broad Institute, Inc. | Aav vectors encoding base editors and uses thereof |
WO2023207607A1 (zh) * | 2022-04-29 | 2023-11-02 | 北京大学 | 用于修饰线粒体dna的脱氨酶突变体、组合物和方法 |
WO2023230613A1 (en) | 2022-05-27 | 2023-11-30 | The Broad Institute, Inc. | Improved mitochondrial base editors and methods for editing mitochondrial dna |
WO2023240137A1 (en) | 2022-06-08 | 2023-12-14 | The Board Institute, Inc. | Evolved cas14a1 variants, compositions, and methods of making and using same in genome editing |
WO2024006772A2 (en) * | 2022-06-27 | 2024-01-04 | Beam Therapeutics Inc. | Adenosine deaminase base editors and methods for use thereof |
WO2024015925A2 (en) | 2022-07-13 | 2024-01-18 | Vor Biopharma Inc. | Compositions and methods for artificial protospacer adjacent motif (pam) generation |
WO2024030432A1 (en) | 2022-08-01 | 2024-02-08 | Gensaic, Inc. | Therapeutic phage-derived particles |
WO2024040083A1 (en) | 2022-08-16 | 2024-02-22 | The Broad Institute, Inc. | Evolved cytosine deaminases and methods of editing dna using same |
WO2024052681A1 (en) | 2022-09-08 | 2024-03-14 | The University Court Of The University Of Edinburgh | Rett syndrome therapy |
WO2024073751A1 (en) | 2022-09-29 | 2024-04-04 | Vor Biopharma Inc. | Methods and compositions for gene modification and enrichment |
WO2024077247A1 (en) | 2022-10-07 | 2024-04-11 | The Broad Institute, Inc. | Base editing methods and compositions for treating triplet repeat disorders |
Family Cites Families (1714)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4182449A (en) | 1978-04-18 | 1980-01-08 | Kozlow William J | Adhesive bandage and package |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4663290A (en) | 1982-01-21 | 1987-05-05 | Molecular Genetics, Inc. | Production of reverse transcriptase |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US4880635B1 (en) | 1984-08-08 | 1996-07-02 | Liposome Company | Dehydrated liposomes |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4921757A (en) | 1985-04-26 | 1990-05-01 | Massachusetts Institute Of Technology | System for delayed and pulsed release of biologically active substances |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US4737323A (en) | 1986-02-13 | 1988-04-12 | Liposome Technology, Inc. | Liposome extrusion method |
US5017492A (en) | 1986-02-27 | 1991-05-21 | Life Technologies, Inc. | Reverse transcriptase and method for its production |
EP0264166B1 (en) | 1986-04-09 | 1996-08-21 | Genzyme Corporation | Transgenic animals secreting desired proteins into milk |
US5079352A (en) | 1986-08-22 | 1992-01-07 | Cetus Corporation | Purified thermostable enzyme |
US4889818A (en) | 1986-08-22 | 1989-12-26 | Cetus Corporation | Purified thermostable enzyme |
US5374553A (en) | 1986-08-22 | 1994-12-20 | Hoffmann-La Roche Inc. | DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima |
US4920016A (en) | 1986-12-24 | 1990-04-24 | Linear Technology, Inc. | Liposomes with enhanced circulation time |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
JPH0825869B2 (ja) | 1987-02-09 | 1996-03-13 | 株式会社ビタミン研究所 | 抗腫瘍剤包埋リポソ−ム製剤 |
US4917951A (en) | 1987-07-28 | 1990-04-17 | Micro-Pak, Inc. | Lipid vesicles formed of surfactants and steroids |
US4911928A (en) | 1987-03-13 | 1990-03-27 | Micro-Pak, Inc. | Paucilamellar lipid vesicles |
EP0357610B1 (en) | 1987-04-23 | 1992-09-16 | FMC Corporation | Insecticidal cyclopropyl-substituted di(aryl) compounds |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
US5244797B1 (en) | 1988-01-13 | 1998-08-25 | Life Technologies Inc | Cloned genes encoding reverse transcriptase lacking rnase h activity |
US4965185A (en) | 1988-06-22 | 1990-10-23 | Grischenko Valentin I | Method for low-temperature preservation of embryos |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
ATE151110T1 (de) | 1988-09-02 | 1997-04-15 | Protein Eng Corp | Herstellung und auswahl von rekombinantproteinen mit verschiedenen bindestellen |
US5047342A (en) | 1989-08-10 | 1991-09-10 | Life Technologies, Inc. | Cloning and expression of T5 DNA polymerase |
US5270179A (en) | 1989-08-10 | 1993-12-14 | Life Technologies, Inc. | Cloning and expression of T5 DNA polymerase reduced in 3'- to-5' exonuclease activity |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
US5427908A (en) | 1990-05-01 | 1995-06-27 | Affymax Technologies N.V. | Recombinant library screening methods |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5637459A (en) | 1990-06-11 | 1997-06-10 | Nexstar Pharmaceuticals, Inc. | Systematic evolution of ligands by exponential enrichment: chimeric selex |
US5580737A (en) | 1990-06-11 | 1996-12-03 | Nexstar Pharmaceuticals, Inc. | High-affinity nucleic acid ligands that discriminate between theophylline and caffeine |
EP0894860B1 (en) | 1990-09-28 | 2012-12-12 | F. Hoffmann-La Roche AG | Thermostable DNA polymerases and deletion mutants thereof |
DE553264T1 (de) | 1990-10-05 | 1994-04-28 | Wayne M Barnes | Thermostabile dna polymerase. |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
DK1471142T3 (da) | 1991-04-10 | 2009-03-09 | Scripps Research Inst | Heterodimere receptor-biblioteker under anvendelse af fagemider |
US6872816B1 (en) | 1996-01-24 | 2005-03-29 | Third Wave Technologies, Inc. | Nucleic acid detection kits |
JPH05274181A (ja) | 1992-03-25 | 1993-10-22 | Nec Corp | ブレークポイント設定・解除方式 |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5834247A (en) | 1992-12-09 | 1998-11-10 | New England Biolabs, Inc. | Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein |
US5496714A (en) | 1992-12-09 | 1996-03-05 | New England Biolabs, Inc. | Modification of protein by use of a controllable interveining protein sequence |
US5434058A (en) | 1993-02-09 | 1995-07-18 | Arch Development Corporation | Apolipoprotein B MRNA editing protein compositions and methods |
US5436149A (en) | 1993-02-19 | 1995-07-25 | Barnes; Wayne M. | Thermostable DNA polymerase with enhanced thermostability and enhanced length and efficiency of primer extension |
US5670361A (en) | 1993-05-17 | 1997-09-23 | The Regents Of The University Of California | HIV-specific ribozymes |
US5512462A (en) | 1994-02-25 | 1996-04-30 | Hoffmann-La Roche Inc. | Methods and reagents for the polymerase chain reaction amplification of long DNA sequences |
US5651981A (en) | 1994-03-29 | 1997-07-29 | Northwestern University | Cationic phospholipids for transfection |
US5912155A (en) | 1994-09-30 | 1999-06-15 | Life Technologies, Inc. | Cloned DNA polymerases from Thermotoga neapolitana |
US5614365A (en) | 1994-10-17 | 1997-03-25 | President & Fellow Of Harvard College | DNA polymerase having modified nucleotide binding site for DNA sequencing |
US5449639A (en) | 1994-10-24 | 1995-09-12 | Taiwan Semiconductor Manufacturing Company Ltd. | Disposable metal anti-reflection coating process used together with metal dry/wet etch |
US5767099A (en) | 1994-12-09 | 1998-06-16 | Genzyme Corporation | Cationic amphiphiles containing amino acid or dervatized amino acid groups for intracellular delivery of therapeutic molecules |
US6057153A (en) | 1995-01-13 | 2000-05-02 | Yale University | Stabilized external guide sequences |
US5795587A (en) | 1995-01-23 | 1998-08-18 | University Of Pittsburgh | Stable lipid-comprising drug delivery complexes and methods for their production |
US5830430A (en) | 1995-02-21 | 1998-11-03 | Imarx Pharmaceutical Corp. | Cationic lipids and the use thereof |
US5851548A (en) | 1995-06-07 | 1998-12-22 | Gen-Probe Incorporated | Liposomes containing cationic lipids and vitamin D |
US5773258A (en) | 1995-08-25 | 1998-06-30 | Roche Molecular Systems, Inc. | Nucleic acid amplification using a reversibly inactivated thermostable enzyme |
US5962313A (en) | 1996-01-18 | 1999-10-05 | Avigen, Inc. | Adeno-associated virus vectors comprising a gene encoding a lyosomal enzyme |
US6887707B2 (en) | 1996-10-28 | 2005-05-03 | University Of Washington | Induction of viral mutation by incorporation of miscoding ribonucleoside analogs into viral RNA |
GB9701425D0 (en) | 1997-01-24 | 1997-03-12 | Bioinvent Int Ab | A method for in vitro molecular evolution of protein function |
US5981182A (en) | 1997-03-13 | 1999-11-09 | Albert Einstein College Of Medicine Of Yeshiva University | Vector constructs for the selection and identification of open reading frames |
US20040203109A1 (en) | 1997-06-06 | 2004-10-14 | Incyte Corporation | Human regulatory proteins |
US5849528A (en) | 1997-08-21 | 1998-12-15 | Incyte Pharmaceuticals, Inc.. | Polynucleotides encoding a human S100 protein |
US6156509A (en) | 1997-11-12 | 2000-12-05 | Genencor International, Inc. | Method of increasing efficiency of directed evolution of a gene using phagemid |
US6183998B1 (en) | 1998-05-29 | 2001-02-06 | Qiagen Gmbh Max-Volmer-Strasse 4 | Method for reversible modification of thermostable enzymes |
US8097648B2 (en) | 1998-06-17 | 2012-01-17 | Eisai R&D Management Co., Ltd. | Methods and compositions for use in treating cancer |
WO2000022115A2 (en) | 1998-10-13 | 2000-04-20 | Board Of Regents, The University Of Texas System | Assays for identifying functional alterations in the p53 tumor suppressor |
CA2350882C (en) | 1998-11-12 | 2011-02-22 | Invitrogen Corporation | Transfection reagents |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7013219B2 (en) | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US20090130718A1 (en) | 1999-02-04 | 2009-05-21 | Diversa Corporation | Gene site saturation mutagenesis |
AU3330700A (en) | 1999-03-29 | 2000-10-16 | Tasuku Honjo | Novel cytidine deaminase |
US6365410B1 (en) | 1999-05-19 | 2002-04-02 | Genencor International, Inc. | Directed evolution of microorganisms |
GB9920194D0 (en) | 1999-08-27 | 1999-10-27 | Advanced Biotech Ltd | A heat-stable thermostable DNA polymerase for use in nucleic acid amplification |
CA2386341A1 (en) | 1999-11-18 | 2001-05-25 | Epimmune Inc. | Heteroclitic analogs and related methods |
CA2392490A1 (en) | 1999-11-24 | 2001-05-31 | Mcs Micro Carrier Systems Gmbh | Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells |
WO2001040798A2 (en) | 1999-12-06 | 2001-06-07 | Sangamo Biosciences, Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
AU5077401A (en) | 2000-02-08 | 2001-08-20 | Sangamo Biosciences Inc | Cells for drug discovery |
US7378248B2 (en) | 2000-03-06 | 2008-05-27 | Rigel Pharmaceuticals, Inc. | In vivo production of cyclic peptides for inhibiting protein-protein interaction |
US7078208B2 (en) | 2000-05-26 | 2006-07-18 | Invitrogen Corporation | Thermostable reverse transcriptases and uses thereof |
US6573092B1 (en) | 2000-10-10 | 2003-06-03 | Genvec, Inc. | Method of preparing a eukaryotic viral vector |
EP2189473A3 (en) | 2000-10-27 | 2010-08-11 | Novartis Vaccines and Diagnostics S.r.l. | Nucleic and proteins from streptococcus groups A & B |
AU2738302A (en) | 2000-10-30 | 2002-05-15 | Euro Celtique Sa | Controlled release hydrocodone formulations |
US20040003420A1 (en) | 2000-11-10 | 2004-01-01 | Ralf Kuhn | Modified recombinase |
EP1360308B1 (en) | 2001-01-25 | 2007-10-10 | Evolva Ltd. | Concatemers of differentially expressed multiple genes |
US20050222030A1 (en) | 2001-02-21 | 2005-10-06 | Anthony Allison | Modified annexin proteins and methods for preventing thrombosis |
WO2002068676A2 (en) | 2001-02-27 | 2002-09-06 | University Of Rochester | METHODS AND COMPOSITIONS FOR MODIFYING APOLIPOPROTEIN B mRNA EDITING |
EP1456360B1 (en) | 2001-04-19 | 2015-06-03 | The Scripps Research Institute | Methods and composition for the production of orthoganal trna-aminoacyltrna synthetase pairs |
WO2002103028A2 (en) | 2001-05-30 | 2002-12-27 | Biomedical Center | In silico screening for phenotype-associated expressed sequences |
JP4473573B2 (ja) | 2001-07-26 | 2010-06-02 | ストラタジーン カリフォルニア | 多部位突然変異誘発 |
US20030167533A1 (en) | 2002-02-04 | 2003-09-04 | Yadav Narendra S. | Intein-mediated protein splicing |
DK1506288T3 (da) | 2002-05-10 | 2013-07-22 | Medical Res Council | Aktiveringsinduceret deaminase (aid) |
US9388459B2 (en) | 2002-06-17 | 2016-07-12 | Affymetrix, Inc. | Methods for genotyping |
WO2004007684A2 (en) | 2002-07-12 | 2004-01-22 | Affymetrix, Inc. | Synthetic tag genes |
EP1546170A4 (en) | 2002-09-20 | 2007-08-29 | Univ Yale | RIBOSWITCHS, METHODS OF USE, AND COMPOSITIONS FOR USE WITH RIBOSWITCHES |
ES2317016T3 (es) | 2003-04-14 | 2009-04-16 | Caliper Life Sciences, Inc. | Reduccion de la interferencia en uin ensayo de desplazamiento por migracion. |
US20050136429A1 (en) | 2003-07-03 | 2005-06-23 | Massachusetts Institute Of Technology | SIRT1 modulation of adipogenesis and adipose function |
ATE386133T1 (de) | 2003-07-07 | 2008-03-15 | Scripps Research Inst | Zusammensetzungen der orthogonalen lysyl-trna und aminoacyl-trna synthetase paaren und ihre verwendungen |
JP4555292B2 (ja) | 2003-08-08 | 2010-09-29 | サンガモ バイオサイエンシズ インコーポレイテッド | 標的化された切断及び組換えの方法及び組成物 |
US7670807B2 (en) | 2004-03-10 | 2010-03-02 | East Tennessee State Univ. Research Foundation | RNA-dependent DNA polymerase from Geobacillus stearothermophilus |
WO2005098043A2 (en) | 2004-03-30 | 2005-10-20 | The President And Fellows Of Harvard College | Ligand-dependent protein splicing |
US7595179B2 (en) | 2004-04-19 | 2009-09-29 | Applied Biosystems, Llc | Recombinant reverse transcriptases |
US7919277B2 (en) | 2004-04-28 | 2011-04-05 | Danisco A/S | Detection and typing of bacterial strains |
CA2632216C (en) | 2004-07-06 | 2013-11-12 | Societe De Commercialisation Des Produits De La Recherche Appliquee Socpra Sciences Sante Et Humaines S.E.C. | A target-dependent nucleic acid adapter |
US8728526B2 (en) | 2004-08-19 | 2014-05-20 | The United States of America, Represented by Secretary of Department of Health and Human Services, NIH | Coacervate microparticles useful for the sustained release administration of therapeutic agents |
WO2006042112A2 (en) | 2004-10-05 | 2006-04-20 | California Institute Of Technology | Aptamer regulated nucleic acids and uses thereof |
US8178291B2 (en) | 2005-02-18 | 2012-05-15 | Monogram Biosciences, Inc. | Methods and compositions for determining hypersusceptibility of HIV-1 to non-nucleoside reverse transcriptase inhibitors |
JP2006248978A (ja) | 2005-03-10 | 2006-09-21 | Mebiopharm Co Ltd | 新規なリポソーム製剤 |
US9783791B2 (en) | 2005-08-10 | 2017-10-10 | Agilent Technologies, Inc. | Mutant reverse transcriptase and methods of use |
DK2336362T3 (en) | 2005-08-26 | 2019-01-21 | Dupont Nutrition Biosci Aps | USE OF CRISPR-ASSOCIATED GENES (CAS) |
AU2015252023B2 (en) | 2005-08-26 | 2017-06-29 | Dupont Nutrition Biosciences Aps | Use |
KR100784478B1 (ko) | 2005-12-05 | 2007-12-11 | 한국과학기술원 | 기능요소의 동시 삽입에 의한 신기능을 갖는 단백질을제조하는 방법 |
US20080051317A1 (en) | 2005-12-15 | 2008-02-28 | George Church | Polypeptides comprising unnatural amino acids, methods for their production and uses therefor |
EP2015780B1 (en) | 2006-05-05 | 2012-12-12 | Molecular Transfer, Inc. | Novel reagents for transfection of eukaryotic cells |
DK2426220T3 (en) | 2006-05-19 | 2016-09-26 | Dupont Nutrition Biosci Aps | Labeled microorganisms, and methods for labeling |
AU2007256780B2 (en) | 2006-06-02 | 2013-08-29 | President And Fellows Of Harvard College | Protein surface remodeling |
WO2008005529A2 (en) | 2006-07-07 | 2008-01-10 | The Trustees Columbia University In The City Of New York | Cell-mediated directed evolution |
EP2126130B1 (en) | 2007-03-02 | 2015-03-25 | DuPont Nutrition Biosciences ApS | Cultures with improved phage resistance |
WO2009033027A2 (en) | 2007-09-05 | 2009-03-12 | Medtronic, Inc. | Suppression of scn9a gene expression and/or function for the treatment of pain |
WO2009042163A2 (en) | 2007-09-27 | 2009-04-02 | Sangamo Biosciences, Inc. | Rapid in vivo identification of biologically active nucleases |
US9029524B2 (en) | 2007-12-10 | 2015-05-12 | California Institute Of Technology | Signal activated RNA interference |
EP2087789A1 (en) | 2008-02-06 | 2009-08-12 | Heinrich-Heine-Universität Düsseldorf | Fto-modified non-human mammal |
EP2250184A4 (en) | 2008-02-08 | 2011-05-04 | Sangamo Biosciences Inc | TREATMENT OF CHRONIC PAIN WITH ZINC FINGER PROTEINS |
GB0806562D0 (en) | 2008-04-10 | 2008-05-14 | Fermentas Uab | Production of nucleic acid |
WO2009146179A1 (en) | 2008-04-15 | 2009-12-03 | University Of Iowa Research Foundation | Zinc finger nuclease for the cftr gene and methods of use thereof |
CA2725601A1 (en) | 2008-04-28 | 2009-11-05 | President And Fellows Of Harvard College | Supercharged proteins for cell penetration |
WO2009132455A1 (en) | 2008-04-30 | 2009-11-05 | Paul Xiang-Qin Liu | Protein splicing using short terminal split inteins |
WO2010011961A2 (en) | 2008-07-25 | 2010-01-28 | University Of Georgia Research Foundation, Inc. | Prokaryotic rnai-like system and methods of use |
JP2010033344A (ja) | 2008-07-29 | 2010-02-12 | Azabu Jui Gakuen | 核酸構成塩基の偏在性を表す方法 |
EP2159286A1 (en) | 2008-09-01 | 2010-03-03 | Consiglio Nazionale Delle Ricerche | Method for obtaining oligonucleotide aptamers and uses thereof |
EP2342336B1 (en) | 2008-09-05 | 2016-12-14 | President and Fellows of Harvard College | Continuous directed evolution of proteins and nucleic acids |
EP2331071A1 (en) | 2008-09-05 | 2011-06-15 | Institut National De La Sante Et De La Recherche Medicale | Novel multimodular assembly useful for intracellular delivery |
US8636884B2 (en) | 2008-09-15 | 2014-01-28 | Abbott Diabetes Care Inc. | Cationic polymer based wired enzyme formulations for use in analyte sensors |
US20100076057A1 (en) | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
WO2010054154A2 (en) | 2008-11-07 | 2010-05-14 | Danisco A/S | Bifidobacteria crispr sequences |
US20110016540A1 (en) | 2008-12-04 | 2011-01-20 | Sigma-Aldrich Co. | Genome editing of genes associated with trinucleotide repeat expansion disorders in animals |
WO2010068289A2 (en) | 2008-12-11 | 2010-06-17 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
US9175338B2 (en) | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
WO2010075424A2 (en) | 2008-12-22 | 2010-07-01 | The Regents Of University Of California | Compositions and methods for downregulating prokaryotic genes |
WO2010091294A2 (en) | 2009-02-05 | 2010-08-12 | The Regents Of The University Of California | New targeted antimicrobial moieties |
US20100305197A1 (en) | 2009-02-05 | 2010-12-02 | Massachusetts Institute Of Technology | Conditionally Active Ribozymes And Uses Thereof |
CA2754476A1 (en) | 2009-03-04 | 2010-09-10 | Alan M. Lambowitz | Stabilized reverse transcriptase fusion proteins |
SG10201704868RA (en) | 2009-03-06 | 2017-07-28 | Synthetic Genomics Inc | Methods For Cloning And Manipulating Genomes |
CA2760155A1 (en) | 2009-04-27 | 2010-11-11 | Pacific Biosciences Of California, Inc. | Real-time sequencing methods and systems |
US9221886B2 (en) | 2009-04-28 | 2015-12-29 | President And Fellows Of Harvard College | Supercharged proteins for cell penetration |
WO2010132092A2 (en) | 2009-05-12 | 2010-11-18 | The Scripps Research Institute | Cytidine deaminase fusions and related methods |
US9063156B2 (en) | 2009-06-12 | 2015-06-23 | Pacific Biosciences Of California, Inc. | Real-time analytical methods and systems |
WO2011002503A1 (en) | 2009-06-30 | 2011-01-06 | Sangamo Biosciences, Inc. | Rapid screening of biologically active nucleases and isolation of nuclease-modified cells |
WO2011000106A1 (en) | 2009-07-01 | 2011-01-06 | Protiva Biotherapeutics, Inc. | Improved cationic lipids and methods for the delivery of therapeutic agents |
US20120178647A1 (en) | 2009-08-03 | 2012-07-12 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
NZ598457A (en) | 2009-08-03 | 2014-06-27 | Recombinetics Inc | Methods and compositions for targeted gene modification |
GB0913681D0 (en) | 2009-08-05 | 2009-09-16 | Glaxosmithkline Biolog Sa | Immunogenic composition |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
DK2494060T3 (en) | 2009-10-30 | 2016-08-01 | Synthetic Genomics Inc | Coding of text for nucleic acid sequences |
KR20240007725A (ko) | 2009-11-02 | 2024-01-16 | 유니버시티 오브 워싱톤 스루 이츠 센터 포 커머셜리제이션 | 치료학적 뉴클레아제 조성물 및 방법 |
US20110104787A1 (en) | 2009-11-05 | 2011-05-05 | President And Fellows Of Harvard College | Fusion Peptides That Bind to and Modify Target Nucleic Acid Sequences |
US20110142886A1 (en) | 2009-12-01 | 2011-06-16 | Intezyne Technologies, Incorporated | Pegylated polyplexes for polynucleotide delivery |
EP3318248B1 (en) | 2009-12-01 | 2019-04-10 | Translate Bio, Inc. | Delivery of mrna for the augmentation of proteins and enzymes in human genetic diseases |
HUE041436T2 (hu) | 2009-12-10 | 2019-05-28 | Univ Minnesota | Tal-effektor-közvetített DNS-módosítás |
WO2011075627A1 (en) | 2009-12-18 | 2011-06-23 | The Board Of Trustees Of The Leland Stanford Junior University | Use of cytidine deaminase-related agents to promote demethylation and cell reprogramming |
MX2012008485A (es) | 2010-01-22 | 2012-08-17 | Dow Agrosciences Llc | Remocion de transgenes en organismos geneticamente modificados. |
EP2542676A1 (en) | 2010-03-05 | 2013-01-09 | Synthetic Genomics, Inc. | Methods for cloning and manipulating genomes |
US8557961B2 (en) | 2010-04-02 | 2013-10-15 | Amunix Operating Inc. | Alpha 1-antitrypsin compositions and methods of making and using same |
EP3078753B1 (en) | 2010-05-10 | 2018-04-18 | The Regents of The University of California | Methods using endoribonuclease compositions |
JP6208580B2 (ja) | 2010-05-17 | 2017-10-04 | サンガモ セラピューティクス, インコーポレイテッド | 新規のdna結合タンパク質及びその使用 |
GB201008267D0 (en) | 2010-05-18 | 2010-06-30 | Univ Edinburgh | Cationic lipids |
WO2011147590A2 (en) | 2010-05-27 | 2011-12-01 | Heinrich-Pette-Institut | Tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains |
EP2575767B1 (en) | 2010-06-04 | 2017-01-04 | Sirna Therapeutics, Inc. | Novel low molecular weight cationic lipids for oligonucleotide delivery |
AU2011265733B2 (en) | 2010-06-14 | 2014-04-17 | Iowa State University Research Foundation, Inc. | Nuclease activity of TAL effector and Foki fusion protein |
US8822663B2 (en) | 2010-08-06 | 2014-09-02 | Moderna Therapeutics, Inc. | Engineered nucleic acids and methods of use thereof |
WO2012020759A1 (ja) | 2010-08-13 | 2012-02-16 | 国立大学法人京都大学 | 変異型逆転写酵素 |
KR101869114B1 (ko) | 2010-09-20 | 2018-06-19 | 다이앤 골 | 마이크로캡슐화 방법 및 제품 |
US9951341B2 (en) | 2010-10-20 | 2018-04-24 | Dupont Nutrition Biosciences Aps | Lactococcus CRISPR-Cas sequences |
US9458484B2 (en) | 2010-10-22 | 2016-10-04 | Bio-Rad Laboratories, Inc. | Reverse transcriptase mixtures with improved storage stability |
CN103327970A (zh) | 2010-11-26 | 2013-09-25 | 约翰内斯堡威特沃特斯兰德大学 | 聚合物-脂质纳米粒子的聚合基质作为药物剂型 |
KR101255338B1 (ko) | 2010-12-15 | 2013-04-16 | 포항공과대학교 산학협력단 | 표적 세포에 대한 폴리뉴클레오티드 전달체 |
WO2012083017A2 (en) | 2010-12-16 | 2012-06-21 | Celgene Corporation | Controlled release oral dosage forms of poorly soluble drugs and uses thereof |
JP6088438B2 (ja) | 2010-12-22 | 2017-03-01 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 連続的定向進化 |
US9499592B2 (en) | 2011-01-26 | 2016-11-22 | President And Fellows Of Harvard College | Transcription activator-like effectors |
KR101818126B1 (ko) | 2011-02-09 | 2018-01-15 | (주)바이오니아 | 열안정성이 증가된 역전사효소 |
US9528124B2 (en) | 2013-08-27 | 2016-12-27 | Recombinetics, Inc. | Efficient non-meiotic allele introgression |
WO2012125445A2 (en) | 2011-03-11 | 2012-09-20 | President And Fellows Of Harvard College | Small molecule-dependent inteins and uses thereof |
US9164079B2 (en) | 2011-03-17 | 2015-10-20 | Greyledge Technologies Llc | Systems for autologous biological therapeutics |
US20120244601A1 (en) | 2011-03-22 | 2012-09-27 | Bertozzi Carolyn R | Riboswitch based inducible gene expression platform |
US8709466B2 (en) | 2011-03-31 | 2014-04-29 | International Business Machines Corporation | Cationic polymers for antimicrobial applications and delivery of bioactive materials |
SG10201602651YA (en) | 2011-04-05 | 2016-05-30 | Cellectis | Method for the generation of compact tale-nucleases and uses thereof |
WO2012148953A1 (en) | 2011-04-25 | 2012-11-01 | Stc.Unm | Solid compositions for pharmaceutical use |
EP2702160B1 (en) | 2011-04-27 | 2020-05-27 | Amyris, Inc. | Methods for genomic modification |
US8691750B2 (en) | 2011-05-17 | 2014-04-08 | Axolabs Gmbh | Lipids and compositions for intracellular delivery of biologically active compounds |
WO2012158985A2 (en) | 2011-05-17 | 2012-11-22 | Transposagen Biopharmaceuticals, Inc. | Methods for site-specific genetic modification in spermatogonial stem cells using zinc finger nuclease (zfn) for the creation of model organisms |
WO2012158986A2 (en) | 2011-05-17 | 2012-11-22 | Transposagen Biopharmaceuticals, Inc. | Methods for site-specific genetic modification in stem cells using xanthomonas tal nucleases (xtn) for the creation of model organisms |
US20140113376A1 (en) | 2011-06-01 | 2014-04-24 | Rotem Sorek | Compositions and methods for downregulating prokaryotic genes |
NZ719345A (en) | 2011-06-08 | 2023-03-31 | Translate Bio Inc | Lipid nanoparticle compositions and methods for mrna delivery |
CA2841710C (en) | 2011-07-15 | 2021-03-16 | The General Hospital Corporation | Methods of transcription activator like effector assembly |
CN103857797A (zh) | 2011-07-19 | 2014-06-11 | 帷幄生物技术公司 | 用于修复软骨损伤的非遗传修饰性重编程细胞的组合物和方法 |
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
WO2013039857A1 (en) | 2011-09-12 | 2013-03-21 | modeRNA Therapeutics | Engineered nucleic acids and methods of use thereof |
WO2013039861A2 (en) | 2011-09-12 | 2013-03-21 | modeRNA Therapeutics | Engineered nucleic acids and methods of use thereof |
DK2762569T3 (en) | 2011-09-28 | 2018-08-27 | Ribomic Inc | NGF aptamer and its use. |
US10100080B2 (en) | 2011-09-28 | 2018-10-16 | Era Biotech, S.A. | Split inteins and uses thereof |
GB2496687A (en) | 2011-11-21 | 2013-05-22 | Gw Pharma Ltd | Tetrahydrocannabivarin (THCV) in the protection of pancreatic islet cells |
WO2013086441A2 (en) | 2011-12-08 | 2013-06-13 | Sarepta Therapeutics, Inc. | Oligonucleotide analogues targeting human lmna |
UA115772C2 (uk) | 2011-12-16 | 2017-12-26 | Таргітджин Байотекнолоджиз Лтд | Композиція програмованого нуклеопротеїнового молекулярного комплексу і спосіб модифікування заданої послідовності нуклеїнової кислоти-мішені |
CA2859387A1 (en) | 2011-12-16 | 2013-06-20 | Moderna Therapeutics, Inc. | Modified nucleoside, nucleotide, and nucleic acid compositions |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
WO2013119602A1 (en) | 2012-02-06 | 2013-08-15 | President And Fellows Of Harvard College | Arrdc1-mediated microvesicles (armms) and uses thereof |
KR101833589B1 (ko) | 2012-02-24 | 2018-03-02 | 프레드 헛친슨 켄서 리서치 센터 | 이상혈색소증 치료를 위한 조성물 및 방법 |
WO2013130824A1 (en) | 2012-02-29 | 2013-09-06 | Sangamo Biosciences, Inc. | Methods and compositions for treating huntington's disease |
AU2013235340B2 (en) | 2012-03-17 | 2019-05-23 | The Regents Of The University Of California | Fast diagnosis and personalized treatments for acne |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
WO2013152359A1 (en) | 2012-04-06 | 2013-10-10 | The Regents Of The University Of California | Novel tetrazines and method of synthesizing the same |
AU2013254857B2 (en) | 2012-04-23 | 2018-04-26 | Bayer Cropscience Nv | Targeted genome engineering in plants |
BR112014027227B1 (pt) | 2012-05-02 | 2022-04-19 | Sangamo Biosciences, Inc. | Métodos para produzir uma planta que apresenta expressão reduzida do gene endógeno de malato desidrogenase (mdh), e para aumentar o rendimento da cultura |
AU2013259647B2 (en) | 2012-05-07 | 2018-11-08 | Corteva Agriscience Llc | Methods and compositions for nuclease-mediated targeted integration of transgenes |
WO2013169398A2 (en) | 2012-05-09 | 2013-11-14 | Georgia Tech Research Corporation | Systems and methods for improving nuclease specificity and activity |
DK3401400T3 (da) | 2012-05-25 | 2019-06-03 | Univ California | Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering |
US20150017136A1 (en) | 2013-07-15 | 2015-01-15 | Cellectis | Methods for engineering allogeneic and highly active t cell for immunotherapy |
EP3473707A1 (en) | 2012-05-25 | 2019-04-24 | Cellectis | Methods for engineering allogeneic and immunosuppressive resistant t cell for immunotherapy |
MX2014014650A (es) | 2012-05-30 | 2015-10-14 | Univ Washington | Minivectores superenrollados como una herramienta para la reparacion, alteración y reemplazo de ácido desoxirribonucleico. |
WO2013188037A2 (en) * | 2012-06-11 | 2013-12-19 | Agilent Technologies, Inc | Method of adaptor-dimer subtraction using a crispr cas6 protein |
JP6279562B2 (ja) | 2012-06-12 | 2018-02-14 | ジェネンテック, インコーポレイテッド | 条件付きノックアウト対立遺伝子を生成するための方法および組成物 |
EP2674501A1 (en) | 2012-06-14 | 2013-12-18 | Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail | Method for detecting and identifying enterohemorrhagic Escherichia coli |
US9688971B2 (en) | 2012-06-15 | 2017-06-27 | The Regents Of The University Of California | Endoribonuclease and methods of use thereof |
CA2877290A1 (en) | 2012-06-19 | 2013-12-27 | Daniel F. Voytas | Gene targeting in plants using dna viruses |
US9267127B2 (en) | 2012-06-21 | 2016-02-23 | President And Fellows Of Harvard College | Evolution of bond-forming enzymes |
US20150344549A1 (en) | 2012-06-27 | 2015-12-03 | The Trustees Of Princeton University | Split inteins, conjugates and uses thereof |
CA2877962C (en) | 2012-06-29 | 2018-06-05 | Massachusetts Institute Of Technology | Massively parallel combinatorial genetics |
US9125508B2 (en) | 2012-06-30 | 2015-09-08 | Seasons 4, Inc. | Collapsible tree system |
WO2014011901A2 (en) | 2012-07-11 | 2014-01-16 | Sangamo Biosciences, Inc. | Methods and compositions for delivery of biologics |
ES2697912T3 (es) | 2012-07-11 | 2019-01-29 | Sangamo Therapeutics Inc | Métodos y composiciones para el tratamiento de enfermedades monogénicas |
PL3494997T3 (pl) | 2012-07-25 | 2020-04-30 | The Broad Institute, Inc. | Indukowalne białka wiążące dna i narzędzia perturbacji genomu oraz ich zastosowania |
US10058078B2 (en) | 2012-07-31 | 2018-08-28 | Recombinetics, Inc. | Production of FMDV-resistant livestock by allele substitution |
CN104684558A (zh) | 2012-07-31 | 2015-06-03 | 耶达研究及发展有限公司 | 诊断和治疗运动神经元疾病的方法 |
EP2880171B1 (en) | 2012-08-03 | 2018-10-03 | The Regents of The University of California | Methods and compositions for controlling gene expression by rna processing |
KR20220164090A (ko) | 2012-08-29 | 2022-12-12 | 상가모 테라퓨틱스, 인코포레이티드 | 유전적 병태를 치료하기 위한 방법 및 조성물 |
AU2013312838B2 (en) | 2012-09-04 | 2018-11-29 | Cellectis | Multi-chain chimeric antigen receptor and uses thereof |
US9937205B2 (en) | 2012-09-04 | 2018-04-10 | The Trustees Of The University Of Pennsylvania | Inhibition of diacylglycerol kinase to augment adoptive T cell transfer |
EP4148134A1 (en) | 2012-09-04 | 2023-03-15 | The Scripps Research Institute | Chimeric polypeptides having targeted binding specificity |
RU2665811C2 (ru) | 2012-09-07 | 2018-09-04 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Локусы fad3 для выполнения операций и соответствующие связывающиеся со специфическими сайтами-мишенями белки, способные к вызову направленных разрывов |
UA118090C2 (uk) | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
AR092482A1 (es) | 2012-09-07 | 2015-04-22 | Dow Agrosciences Llc | Enriquecimiento de la clasificacion de las celulas activadas por fluorescencia (facs) para generar plantas |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
WO2014043143A1 (en) | 2012-09-11 | 2014-03-20 | Life Technologies Corporation | Nucleic acid amplification |
GB201216564D0 (en) | 2012-09-17 | 2012-10-31 | Univ Edinburgh | Genetically edited animal |
WO2014047103A2 (en) | 2012-09-18 | 2014-03-27 | The Translational Genomics Research Institute | Isolated genes and transgenic organisms for producing biofuels |
US9181535B2 (en) | 2012-09-24 | 2015-11-10 | The Chinese University Of Hong Kong | Transcription activator-like effector nucleases (TALENs) |
AU2013326972B2 (en) | 2012-10-03 | 2019-08-08 | Agrivida, Inc. | Intein-modified proteases, their production and industrial applications |
JO3470B1 (ar) | 2012-10-08 | 2020-07-05 | Merck Sharp & Dohme | مشتقات 5- فينوكسي-3h-بيريميدين-4-أون واستخدامها كمثبطات ناسخ عكسي ل hiv |
US9597357B2 (en) | 2012-10-10 | 2017-03-21 | Sangamo Biosciences, Inc. | T cell modifying compounds and uses thereof |
US20150267176A1 (en) | 2012-10-12 | 2015-09-24 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
CN116064532A (zh) | 2012-10-23 | 2023-05-05 | 基因工具股份有限公司 | 用于切割靶dna的组合物及其用途 |
US20140115728A1 (en) | 2012-10-24 | 2014-04-24 | A. Joseph Tector | Double knockout (gt/cmah-ko) pigs, organs and tissues |
AU2013337951B2 (en) | 2012-10-30 | 2019-10-03 | Recombinetics, Inc. | Control of sexual maturation in animals |
AR093296A1 (es) | 2012-10-31 | 2015-05-27 | Kiss György Botond | Identificacion de un gen de resistencia a xanthomonas euvesicatoria de pimienta (capsicum annuum) y metodo para generar plantas a esa resistencia |
CA2890160A1 (en) | 2012-10-31 | 2014-05-08 | Cellectis | Coupling herbicide resistance with targeted insertion of transgenes in plants |
CN104769112A (zh) | 2012-11-01 | 2015-07-08 | 菲克特生物科学股份有限公司 | 用于在细胞中表达蛋白质的方法和产品 |
WO2014071235A1 (en) | 2012-11-01 | 2014-05-08 | Massachusetts Institute Of Technology | Genetic device for the controlled destruction of dna |
US20140127752A1 (en) | 2012-11-07 | 2014-05-08 | Zhaohui Zhou | Method, composition, and reagent kit for targeted genomic enrichment |
CA2890824A1 (en) | 2012-11-09 | 2014-05-15 | Marco Archetti | Diffusible factors and cancer cells |
EP2922960A4 (en) | 2012-11-20 | 2016-06-29 | Cold Spring Harbor Lab | MUTATIONS FOR SOLANACEAE PLANTS FOR MODULATING SPRING ARCHITECTURE AND IMPROVING PERFORMANCE-RELATED PHENOTYPES |
AU2013348113A1 (en) | 2012-11-20 | 2015-06-11 | J.R. Simplot Company | TAL-mediated transfer DNA insertion |
US20140140969A1 (en) | 2012-11-20 | 2014-05-22 | Sangamo Biosciences, Inc. | Methods and compositions for muscular dystrophies |
PT3502240T (pt) | 2012-11-27 | 2021-08-11 | Childrens Medical Ct Corp | Elementos reguladores distais de bcl11a como alvo para a reindução de hemoglobina fetal |
CA2892551A1 (en) | 2012-11-29 | 2014-06-05 | North Carolina State University | Synthetic pathway for biological carbon dioxide sequestration |
US20160010154A1 (en) | 2012-11-30 | 2016-01-14 | The Parkinson's Institute | Screening assays for therapeutics for parkinson's disease |
WO2014082644A1 (en) | 2012-11-30 | 2014-06-05 | WULFF, Peter, Samuel | Circular rna for inhibition of microrna |
US9255250B2 (en) | 2012-12-05 | 2016-02-09 | Sangamo Bioscience, Inc. | Isolated mouse or human cell having an exogenous transgene in an endogenous albumin gene |
KR101844123B1 (ko) | 2012-12-06 | 2018-04-02 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
WO2014089513A1 (en) | 2012-12-06 | 2014-06-12 | Synthetic Genomics, Inc. | Autonomous replication sequences and episomal dna molecules |
PT2929029T (pt) | 2012-12-06 | 2018-10-04 | Synthetic Genomics Inc | Mutantes de algas tendo um fenótipo de aclimatação a luminosidade intensa incluido |
US10272163B2 (en) | 2012-12-07 | 2019-04-30 | The Regents Of The University Of California | Factor VIII mutation repair and tolerance induction |
WO2014089348A1 (en) | 2012-12-07 | 2014-06-12 | Synthetic Genomics, Inc. | Nannochloropsis spliced leader sequences and uses therefor |
WO2014093479A1 (en) | 2012-12-11 | 2014-06-19 | Montana State University | Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation |
ES2701749T3 (es) | 2012-12-12 | 2019-02-25 | Broad Inst Inc | Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
ES2883590T3 (es) | 2012-12-12 | 2021-12-09 | Broad Inst Inc | Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas |
US20140242664A1 (en) | 2012-12-12 | 2014-08-28 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
DK2931898T3 (en) | 2012-12-12 | 2016-06-20 | Massachusetts Inst Technology | CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS |
ES2635244T3 (es) | 2012-12-12 | 2017-10-03 | The Broad Institute, Inc. | Sistemas, métodos y composiciones de componentes de CRISPR-Cas para manipulación de secuencias |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP3064585B1 (en) | 2012-12-12 | 2020-02-05 | The Broad Institute, Inc. | Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation |
KR20150105634A (ko) | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 개선된 시스템, 방법 및 효소 조성물의 유전자 조작 및 최적화 |
WO2014093595A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
CA2894710A1 (en) | 2012-12-13 | 2014-06-19 | Massachusetts Institute Of Technology | Recombinase-based logic and memory systems |
US20140173783A1 (en) | 2012-12-13 | 2014-06-19 | Dow Agrosciences Llc | Precision gene targeting to a particular locus in maize |
CA2893579A1 (en) | 2012-12-13 | 2014-06-19 | Dow Agrosciences Llc | Dna detection methods for site specific nuclease activity |
ES2741951T3 (es) | 2012-12-17 | 2020-02-12 | Harvard College | Modificación por ingeniería genética del genoma humano guiada por ARN |
US20140178561A1 (en) | 2012-12-21 | 2014-06-26 | Cellectis | Potatoes with reduced cold-induced sweetening |
EP2938184B1 (en) | 2012-12-27 | 2018-10-31 | Keygene N.V. | Method for removing genetic linkage in a plant |
CA2897390A1 (en) | 2013-01-10 | 2014-07-17 | Ge Healthcare Dharmacon, Inc. | Templates, libraries, kits and methods for generating molecules |
CN105142396A (zh) | 2013-01-14 | 2015-12-09 | 重组股份有限公司 | 缺角家畜 |
WO2014113493A1 (en) | 2013-01-16 | 2014-07-24 | Emory University | Cas9-nucleic acid complexes and uses related thereto |
CN103233028B (zh) | 2013-01-25 | 2015-05-13 | 南京徇齐生物技术有限公司 | 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列 |
CA2899928A1 (en) | 2013-02-05 | 2014-08-14 | University Of Georgia Research Foundation, Inc. | Cell lines for virus production and methods of use |
US10660943B2 (en) | 2013-02-07 | 2020-05-26 | The Rockefeller University | Sequence specific antimicrobials |
ES2768291T3 (es) | 2013-02-14 | 2020-06-22 | Univ Osaka | Método para aislar una región genómica específica utilizando una molécula que se une específicamente a una secuencia de ADN endógena |
WO2014127287A1 (en) | 2013-02-14 | 2014-08-21 | Massachusetts Institute Of Technology | Method for in vivo tergated mutagenesis |
WO2014130706A1 (en) | 2013-02-20 | 2014-08-28 | Regeneron Pharmaceuticals, Inc. | Genetic modification of rats |
WO2014128659A1 (en) | 2013-02-21 | 2014-08-28 | Cellectis | Method to counter-select cells or organisms by linking loci to nuclease components |
ES2522765B2 (es) | 2013-02-22 | 2015-03-18 | Universidad De Alicante | Método para dectectar inserciones de espaciadores en estructuras CRISPR |
WO2014130955A1 (en) | 2013-02-25 | 2014-08-28 | Sangamo Biosciences, Inc. | Methods and compositions for enhancing nuclease-mediated gene disruption |
EP2922393B2 (en) | 2013-02-27 | 2022-12-28 | Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) | Gene editing in the oocyte by cas9 nucleases |
US10047366B2 (en) | 2013-03-06 | 2018-08-14 | The Johns Hopkins University | Telomerator-a tool for chromosome engineering |
WO2014143381A1 (en) | 2013-03-09 | 2014-09-18 | Agilent Technologies, Inc. | Methods of in vivo engineering of large sequences using multiple crispr/cas selections of recombineering events |
EP2970886B1 (en) | 2013-03-12 | 2018-05-23 | Sangamo Therapeutics, Inc. | Methods and compositions for modification of hla |
UA123532C2 (uk) | 2013-03-12 | 2021-04-21 | Е. І. Дю Пон Де Немур Енд Компані | Спосіб ідентифікації варіантного сайта розпізнавання для сконструйованого засобу, що рідко розщеплює, для індукції двониткового розриву |
WO2014158593A1 (en) | 2013-03-13 | 2014-10-02 | President And Fellows Of Harvard College | Mutants of cre recombinase |
WO2014152940A1 (en) | 2013-03-14 | 2014-09-25 | Shire Human Genetic Therapies, Inc. | Mrna therapeutic compositions and use to treat diseases and disorders |
WO2014153118A1 (en) | 2013-03-14 | 2014-09-25 | The Board Of Trustees Of The Leland Stanford Junior University | Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1) |
RU2018122288A (ru) | 2013-03-14 | 2019-03-06 | Карибо Биосайенсиз, Инк. | Композиции и способы с участием нуклеиновых кислот, нацеленных на нуклеиновые кислоты |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
WO2014145736A2 (en) | 2013-03-15 | 2014-09-18 | Transposagen Biopharmaceuticals, Inc. | Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm) |
US20140349400A1 (en) | 2013-03-15 | 2014-11-27 | Massachusetts Institute Of Technology | Programmable Modification of DNA |
JP6591394B2 (ja) | 2013-03-15 | 2019-10-16 | サイバス ユーエス エルエルシー | オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物 |
MX2015011985A (es) | 2013-03-15 | 2016-04-07 | Univ Minnesota | Ingenieria genomica de plantas utilizando sistemas crispr/cas. |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
US20140363561A1 (en) | 2013-03-15 | 2014-12-11 | J.R. Simplot Company | Tal-mediated transfer dna insertion |
EP2970986B1 (en) | 2013-03-15 | 2020-05-06 | The General Hospital Corporation | Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
CN105208866B (zh) | 2013-03-21 | 2018-11-23 | 桑格摩生物治疗股份有限公司 | 使用工程化锌指蛋白核酸酶靶向断裂t细胞受体基因 |
CA2908403A1 (en) | 2013-04-02 | 2014-10-09 | Bayer Cropscience Nv | Targeted genome engineering in eukaryotes |
AU2014248119B2 (en) | 2013-04-03 | 2019-06-20 | Memorial Sloan-Kettering Cancer Center | Effective generation of tumor-targeted T-cells derived from pluripotent stem cells |
CN115261411A (zh) | 2013-04-04 | 2022-11-01 | 哈佛学院校长同事会 | 利用CRISPR/Cas系统的基因组编辑的治疗性用途 |
US11274305B2 (en) | 2013-04-04 | 2022-03-15 | Trustees Of Dartmouth College | Compositions and methods for in vivo excision of HIV-1 proviral DNA |
AU2014248208C1 (en) | 2013-04-05 | 2023-04-27 | Corteva Agriscience Llc | Methods and compositions for integration of an exogenous sequence within the genome of plants |
US20150056629A1 (en) | 2013-04-14 | 2015-02-26 | Katriona Guthrie-Honea | Compositions, systems, and methods for detecting a DNA sequence |
KR20200136508A (ko) | 2013-04-16 | 2020-12-07 | 리제너론 파마슈티칼스 인코포레이티드 | 랫트 게놈의 표적화된 변형 |
US20160040155A1 (en) | 2013-04-16 | 2016-02-11 | University Of Washington Through Its Center For Commercialization | Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering |
WO2014172470A2 (en) | 2013-04-16 | 2014-10-23 | Whitehead Institute For Biomedical Research | Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal |
EP2796558A1 (en) | 2013-04-23 | 2014-10-29 | Rheinische Friedrich-Wilhelms-Universität Bonn | Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants |
CN103224947B (zh) | 2013-04-28 | 2015-06-10 | 陕西师范大学 | 一种基因打靶系统 |
EP3546484B1 (en) | 2013-05-10 | 2021-09-08 | Whitehead Institute for Biomedical Research | In vitro production of red blood cells with sortaggable proteins |
WO2014182700A1 (en) | 2013-05-10 | 2014-11-13 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
WO2014184744A1 (en) | 2013-05-13 | 2014-11-20 | Cellectis | Methods for engineering highly active t cell for immunotherapy |
RS65484B1 (sr) | 2013-05-13 | 2024-05-31 | Cellectis | Cd19 specifični himerni antigenski receptor i njegove primene |
EP2997146A4 (en) | 2013-05-15 | 2017-04-26 | Sangamo BioSciences, Inc. | Methods and compositions for treatment of a genetic condition |
WO2014186686A2 (en) | 2013-05-17 | 2014-11-20 | Two Blades Foundation | Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases |
WO2014190181A1 (en) | 2013-05-22 | 2014-11-27 | Northwestern University | Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis |
US9873907B2 (en) | 2013-05-29 | 2018-01-23 | Agilent Technologies, Inc. | Method for fragmenting genomic DNA using CAS9 |
CA2913865C (en) | 2013-05-29 | 2022-07-19 | Cellectis | A method for producing precise dna cleavage using cas9 nickase activity |
US11685935B2 (en) | 2013-05-29 | 2023-06-27 | Cellectis | Compact scaffold of Cas9 in the type II CRISPR system |
AU2014273490B2 (en) | 2013-05-29 | 2019-05-09 | Cellectis | Methods for engineering T cells for immunotherapy by using RNA-guided Cas nuclease system |
WO2014194190A1 (en) | 2013-05-30 | 2014-12-04 | The Penn State Research Foundation | Gene targeting and genetic modification of plants via rna-guided genome editing |
CA2913871C (en) | 2013-05-31 | 2021-07-13 | Cellectis | A laglidadg homing endonuclease cleaving the c-c chemokine receptor type-5 (ccr5) gene and uses thereof |
JP6450371B2 (ja) | 2013-05-31 | 2019-01-09 | セレクティスCellectis | T細胞受容体α遺伝子を開裂するLAGLIDADGホーミングエンドヌクレアーゼおよびその用途 |
US20140359796A1 (en) | 2013-05-31 | 2014-12-04 | Recombinetics, Inc. | Genetically sterile animals |
US20140356956A1 (en) | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
SG10201710030QA (en) | 2013-06-04 | 2018-01-30 | Harvard College | Rna-guided transcriptional regulation |
JP7085716B2 (ja) | 2013-06-05 | 2022-06-17 | デューク ユニバーシティ | Rnaガイド遺伝子編集及び遺伝子調節 |
JP6525971B2 (ja) | 2013-06-11 | 2019-06-05 | タカラ バイオ ユーエスエー, インコーポレイテッド | タンパク質富化微細小胞、タンパク質富化微細小胞の作製方法及び使用方法 |
US20150315252A1 (en) | 2013-06-11 | 2015-11-05 | Clontech Laboratories, Inc. | Protein enriched microvesicles and methods of making and using the same |
WO2014201015A2 (en) | 2013-06-11 | 2014-12-18 | The Regents Of The University Of California | Methods and compositions for target dna modification |
JP2016521561A (ja) | 2013-06-14 | 2016-07-25 | セレクティス | 植物における非トランスジェニックのゲノム編集のための方法 |
WO2014204723A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions |
CA2915842C (en) | 2013-06-17 | 2022-11-29 | The Broad Institute, Inc. | Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy |
EP3011032B1 (en) | 2013-06-17 | 2019-10-16 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
RU2716421C2 (ru) | 2013-06-17 | 2020-03-11 | Те Брод Инститьют Инк. | Доставка, применение и применения в терапии систем crispr-cas и композиций для целенаправленного воздействия на нарушения и заболевания с использованием вирусных компонентов |
EP3674411A1 (en) | 2013-06-17 | 2020-07-01 | The Broad Institute, Inc. | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
EP3011033B1 (en) | 2013-06-17 | 2020-02-19 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
AU2014281027A1 (en) | 2013-06-17 | 2016-01-28 | Massachusetts Institute Of Technology | Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation |
RU2016101246A (ru) | 2013-06-19 | 2017-07-24 | СИГМА-ЭЛДРИЧ КО. ЭлЭлСи | Направленная интеграция |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
AU2014301147B2 (en) | 2013-06-25 | 2020-07-30 | Cellectis | Modified diatoms for biofuel production |
US20160369268A1 (en) | 2013-07-01 | 2016-12-22 | The Board Of Regents Of The University Of Texas System | Transcription activator-like effector (tale) libraries and methods of synthesis and use |
CA2917638A1 (en) | 2013-07-09 | 2015-01-15 | President And Fellows Of Harvard College | Multiplex rna-guided genome engineering |
JP2016528890A (ja) | 2013-07-09 | 2016-09-23 | プレジデント アンド フェローズ オブ ハーバード カレッジ | CRISPR/Cas系を用いるゲノム編集の治療用の使用 |
AU2014287397B2 (en) | 2013-07-10 | 2019-10-10 | President And Fellows Of Harvard College | Orthogonal Cas9 proteins for RNA-guided gene regulation and editing |
JP6443811B2 (ja) | 2013-07-10 | 2018-12-26 | エフストック リミテッド ライアビリティ カンパニー | Mrap2ノックアウト |
WO2015004241A2 (en) | 2013-07-10 | 2015-01-15 | Novartis Ag | Multiple proteases deficient filamentous fungal cells and methods of use thereof |
HRP20211563T1 (hr) | 2013-07-11 | 2022-01-07 | Modernatx, Inc. | Pripravci koji sadrže sintetske polinukleotide koji kodiraju proteine srodne crispr-u i sintetske sgrna, te postupci njihove uporabe |
US20160264982A1 (en) | 2013-07-16 | 2016-09-15 | Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences | Method for plant genome site-directed modification |
CN105392885B (zh) | 2013-07-19 | 2020-11-03 | 赖瑞克斯生物科技公司 | 用于产生双等位基因敲除的方法和组合物 |
GB201313235D0 (en) | 2013-07-24 | 2013-09-04 | Univ Edinburgh | Antiviral Compositions Methods and Animals |
CN103388006B (zh) | 2013-07-26 | 2015-10-28 | 华东师范大学 | 一种基因定点突变的构建方法 |
US10563225B2 (en) | 2013-07-26 | 2020-02-18 | President And Fellows Of Harvard College | Genome engineering |
US10421957B2 (en) | 2013-07-29 | 2019-09-24 | Agilent Technologies, Inc. | DNA assembly using an RNA-programmable nickase |
US9944925B2 (en) | 2013-08-02 | 2018-04-17 | Enevolv, Inc. | Processes and host cells for genome, pathway, and biomolecular engineering |
ITTO20130669A1 (it) | 2013-08-05 | 2015-02-06 | Consiglio Nazionale Ricerche | Vettore adeno-associato ricombinante muscolo-specifico e suo impiego nel trattamento di patologie muscolari |
US20150044772A1 (en) | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | Crispr/cas system-based novel fusion protein and its applications in genome editing |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
WO2015024017A2 (en) | 2013-08-16 | 2015-02-19 | President And Fellows Of Harvard College | Rna polymerase, methods of purification and methods of use |
WO2015021990A1 (en) | 2013-08-16 | 2015-02-19 | University Of Copenhagen | Rna probing method and reagents |
AU2014310564B2 (en) | 2013-08-20 | 2020-04-09 | Katholieke Universiteit Leuven, K.U.Leuven R&D | Inhibition of a lncRNA for treatment of melanoma |
CA2922090C (en) | 2013-08-22 | 2021-05-18 | Pioneer Hi-Bred International, Inc. | Genome modification using guide polynucleotide/cas endonuclease systems and methods of use |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
GB201315321D0 (en) | 2013-08-28 | 2013-10-09 | Koninklijke Nederlandse Akademie Van Wetenschappen | Transduction Buffer |
EP3039136B8 (en) | 2013-08-28 | 2020-12-16 | Sangamo Therapeutics, Inc. | Compositions for linking dna-binding domains and cleavage domains |
WO2015031775A1 (en) | 2013-08-29 | 2015-03-05 | Temple University Of The Commonwealth System Of Higher Education | Methods and compositions for rna-guided treatment of hiv infection |
SG10201801782PA (en) | 2013-09-04 | 2018-04-27 | Csir | Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression |
WO2015032494A2 (de) | 2013-09-04 | 2015-03-12 | Kws Saat Ag | Helminthosporium turcicum-resistente pflanze |
KR102238137B1 (ko) | 2013-09-04 | 2021-04-09 | 다우 아그로사이언시즈 엘엘씨 | 공여자 삽입을 결정하기 위한 작물에서의 신속 표적화 분석 |
EP4074330A1 (en) | 2013-09-05 | 2022-10-19 | Massachusetts Institute of Technology | Tuning microbial populations with programmable nucleases |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
WO2016070129A1 (en) | 2014-10-30 | 2016-05-06 | President And Fellows Of Harvard College | Delivery of negatively charged proteins using cationic lipids |
US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
EP3988649A1 (en) | 2013-09-18 | 2022-04-27 | Kymab Limited | Methods, cells and organisms |
WO2015040075A1 (en) | 2013-09-18 | 2015-03-26 | Genome Research Limited | Genomic screening methods using rna-guided endonucleases |
JP6595459B2 (ja) | 2013-09-23 | 2019-10-23 | レンセラール ポリテクニック インスティチュート | 種々の細胞集団におけるナノ粒子媒介遺伝子送達、ゲノム編集およびリガンド標的化修飾 |
WO2015048577A2 (en) | 2013-09-27 | 2015-04-02 | Editas Medicine, Inc. | Crispr-related methods and compositions |
US10822606B2 (en) | 2013-09-27 | 2020-11-03 | The Regents Of The University Of California | Optimized small guide RNAs and methods of use |
JP2016540033A (ja) | 2013-09-30 | 2016-12-22 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニアThe Regents Of The University Of California | 新規ケモカイン受容体、cxcr8の同定 |
US20160237451A1 (en) | 2013-09-30 | 2016-08-18 | Regents Of The University Of Minnesota | Conferring resistance to geminiviruses in plants using crispr/cas systems |
EP3052110A4 (en) | 2013-10-02 | 2017-07-12 | Northeastern University | Methods and compositions for generation of developmentally-incompetent eggs in recipients of nuclear genetic transfer |
JP5774657B2 (ja) | 2013-10-04 | 2015-09-09 | 国立大学法人京都大学 | エレクトロポレーションを利用した哺乳類の遺伝子改変方法 |
CN105916977A (zh) | 2013-10-07 | 2016-08-31 | 东北大学 | 用于使用自体细胞系统从生殖系细胞离体产生有发育能力的卵的方法和组合物 |
WO2015052231A2 (en) | 2013-10-08 | 2015-04-16 | Technical University Of Denmark | Multiplex editing system |
US20150098954A1 (en) | 2013-10-08 | 2015-04-09 | Elwha Llc | Compositions and Methods Related to CRISPR Targeting |
DE102013111099B4 (de) | 2013-10-08 | 2023-11-30 | Eberhard Karls Universität Tübingen Medizinische Fakultät | Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA |
WO2015052335A1 (en) | 2013-10-11 | 2015-04-16 | Cellectis | Methods and kits for detecting nucleic acid sequences of interest using dna-binding protein domain |
WO2015057671A1 (en) | 2013-10-14 | 2015-04-23 | The Broad Institute, Inc. | Artificial transcription factors comprising a sliding domain and uses thereof |
ES2845924T3 (es) | 2013-10-15 | 2021-07-28 | Scripps Research Inst | Interruptores de células T con receptores de antígenos quiméricos peptídicos y usos de los mismos |
WO2015057852A1 (en) | 2013-10-15 | 2015-04-23 | The California Institute For Biomedical Research | Chimeric antigen receptor t cell switches and uses thereof |
US9957526B2 (en) | 2013-10-17 | 2018-05-01 | Sangamo Therapeutics, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
US10117899B2 (en) | 2013-10-17 | 2018-11-06 | Sangamo Therapeutics, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells |
US10508289B2 (en) | 2013-10-25 | 2019-12-17 | Cellectis | Rare-cutting endonucleases for efficient and specific targeting DNA sequences comprising highly repetitive motives |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
US10584358B2 (en) | 2013-10-30 | 2020-03-10 | North Carolina State University | Compositions and methods related to a type-II CRISPR-Cas system in Lactobacillus buchneri |
KR102248730B1 (ko) | 2013-11-04 | 2021-05-07 | 코르테바 애그리사이언스 엘엘씨 | 유전자 표적화를 위한 범용 공여자 시스템 |
AP2016009227A0 (en) | 2013-11-04 | 2016-05-31 | Dow Agrosciences Llc | Optimal maize loci |
CN107223156A (zh) | 2013-11-04 | 2017-09-29 | 美国陶氏益农公司 | 最优玉米座位 |
US9909131B2 (en) | 2013-11-04 | 2018-03-06 | Dow Agrosciences Llc | Optimal soybean loci |
CA2926822C (en) | 2013-11-04 | 2022-12-13 | Dow Agrosciences Llc | Optimal soybean loci |
WO2015069682A2 (en) | 2013-11-05 | 2015-05-14 | President And Fellows Of Harvard College | Precise microbiota engineering at the cellular level |
WO2015070083A1 (en) | 2013-11-07 | 2015-05-14 | Editas Medicine,Inc. | CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS |
US20160282354A1 (en) | 2013-11-08 | 2016-09-29 | The Broad Institute, Inc. | Compositions and methods for selecting a treatment for b-cell neoplasias |
WO2015070193A1 (en) | 2013-11-11 | 2015-05-14 | Liu Oliver | Compositions and methods for targeted gene disruption in prokaryotes |
WO2015070212A1 (en) | 2013-11-11 | 2015-05-14 | Sangamo Biosciences, Inc. | Methods and compositions for treating huntington's disease |
HRP20211706T1 (hr) | 2013-11-13 | 2022-02-04 | The Children's Medical Center Corporation | Nukleazom posredovana regulacija ekspresije gena |
CA2930590C (en) | 2013-11-15 | 2021-02-16 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Engineering neural stem cells using homologous recombination |
AU2014350051A1 (en) | 2013-11-18 | 2016-07-07 | Crispr Therapeutics Ag | CRISPR-Cas system materials and methods |
JP2016538342A (ja) | 2013-11-18 | 2016-12-08 | イエール ユニバーシティ | トランスポゾンを使用する組成物および方法 |
US10787684B2 (en) | 2013-11-19 | 2020-09-29 | President And Fellows Of Harvard College | Large gene excision and insertion |
WO2015075056A1 (en) | 2013-11-19 | 2015-05-28 | Thermo Fisher Scientific Baltics Uab | Programmable enzymes for isolation of specific dna fragments |
US9074199B1 (en) | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
US11098094B2 (en) | 2013-11-20 | 2021-08-24 | Fondazione Telethon | Artificial DNA-binding proteins and uses thereof |
US10813951B2 (en) | 2013-11-22 | 2020-10-27 | Cellectis | Method of engineering chemotherapy drug resistant T-cells for immunotherapy |
AU2014351871B2 (en) | 2013-11-22 | 2020-02-13 | Cellectis | Method for generating batches of allogeneic T-cells with averaged potency |
JP6621409B2 (ja) | 2013-11-22 | 2019-12-18 | ミナ セラピューティクス リミテッド | C/EBPα小分子活性化RNA組成物 |
CN103642836A (zh) | 2013-11-26 | 2014-03-19 | 苏州同善生物科技有限公司 | 一种基于crispr基因敲除技术建立脆性x综合症灵长类动物模型的方法 |
CN103614415A (zh) | 2013-11-27 | 2014-03-05 | 苏州同善生物科技有限公司 | 一种基于crispr基因敲除技术建立肥胖症大鼠动物模型的方法 |
US10450586B2 (en) | 2013-11-28 | 2019-10-22 | Horizon Discovery Limited | Somatic haploid human cell line |
US9771403B2 (en) | 2013-12-09 | 2017-09-26 | Sangamo Therapeutics, Inc. | Methods and compositions for treating hemophilia |
CA2933433C (en) | 2013-12-11 | 2020-11-17 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for the targeted modification of a genome |
SG10201804976YA (en) | 2013-12-12 | 2018-07-30 | Broad Inst Inc | Delivery, Use and Therapeutic Applications of the Crispr-Cas Systems and Compositions for Genome Editing |
CN111269902A (zh) | 2013-12-12 | 2020-06-12 | 布罗德研究所有限公司 | Crispr-cas系统和组合物的递送及用途 |
EP3080266B1 (en) | 2013-12-12 | 2021-02-03 | The Regents of The University of California | Methods and compositions for modifying a single stranded target nucleic acid |
WO2015089351A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
US20150165054A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting caspase-9 point mutations |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
CA2932439A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute, Inc. | Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes |
WO2015089486A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
EP4219699A1 (en) | 2013-12-12 | 2023-08-02 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
WO2015089419A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components |
EP3080256B1 (en) | 2013-12-13 | 2018-06-13 | Cellectis | Cas9 nuclease platform for microalgae genome engineering |
WO2015086798A2 (en) | 2013-12-13 | 2015-06-18 | Cellectis | New method of selection of algal-transformed cells using nuclease |
US20150191744A1 (en) | 2013-12-17 | 2015-07-09 | University Of Massachusetts | Cas9 effector-mediated regulation of transcription, differentiation and gene editing/labeling |
CN106029886B (zh) | 2013-12-19 | 2021-02-05 | 阿迈瑞斯公司 | 基因组整合的方法 |
EP3090044B1 (en) | 2013-12-26 | 2021-11-03 | The General Hospital Corporation | Multiplex guide rnas |
WO2015103057A1 (en) | 2013-12-30 | 2015-07-09 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Fusion genes associated with progressive prostate cancer |
EP3089989B1 (en) | 2013-12-31 | 2020-06-24 | The Regents of The University of California | Cas9 crystals and methods of use thereof |
CN103668472B (zh) | 2013-12-31 | 2014-12-24 | 北京大学 | 利用CRISPR/Cas9系统构建真核基因敲除文库的方法 |
WO2015105928A1 (en) | 2014-01-08 | 2015-07-16 | President And Fellows Of Harvard College | Rna-guided gene drives |
US20150197759A1 (en) | 2014-01-14 | 2015-07-16 | Lam Therapeutics, Inc. | Mutagenesis methods |
US10774338B2 (en) | 2014-01-16 | 2020-09-15 | The Regents Of The University Of California | Generation of heritable chimeric plant traits |
WO2015134121A2 (en) | 2014-01-20 | 2015-09-11 | President And Fellows Of Harvard College | Negative selection and stringency modulation in continuous evolution systems |
GB201400962D0 (en) | 2014-01-21 | 2014-03-05 | Kloehn Peter C | Screening for target-specific affinity binders using RNA interference |
US10557146B2 (en) | 2014-01-21 | 2020-02-11 | The Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences | Modified plants |
EP3097212A4 (en) | 2014-01-24 | 2017-10-04 | North Carolina State University | Methods and compositions for sequences guiding cas9 targeting |
EP3096609B1 (en) | 2014-01-24 | 2021-09-22 | Children's Medical Center Corporation | High-throughput mouse model for optimizing antibody affinities |
WO2015113063A1 (en) | 2014-01-27 | 2015-07-30 | Georgia Tech Research Corporation | Methods and systems for identifying crispr/cas off-target sites |
CN104805078A (zh) | 2014-01-28 | 2015-07-29 | 北京大学 | 用于高效基因组编辑的rna分子的设计、合成及其应用 |
WO2015116686A1 (en) | 2014-01-29 | 2015-08-06 | Agilent Technologies, Inc. | Cas9-based isothermal method of detection of specific dna sequence |
WO2015116969A2 (en) | 2014-01-30 | 2015-08-06 | The Board Of Trustees Of The University Of Arkansas | Method, vectors, cells, seeds and kits for stacking genes into a single genomic site |
US20150291969A1 (en) | 2014-01-30 | 2015-10-15 | Chromatin, Inc. | Compositions for reduced lignin content in sorghum and improving cell wall digestibility, and methods of making the same |
GB201401707D0 (en) | 2014-01-31 | 2014-03-19 | Sec Dep For Health The | Adeno-associated viral vectors |
EP4249036A3 (en) | 2014-01-31 | 2023-10-25 | Factor Bioscience Inc. | Methods and products for nucleic acid production and delivery |
ES2796087T3 (es) | 2014-02-03 | 2020-11-25 | Sangamo Therapeutics Inc | Métodos y composiciones para el tratamiento de beta talasemia |
WO2015115903A1 (en) | 2014-02-03 | 2015-08-06 | Academisch Ziekenhuis Leiden H.O.D.N. Lumc | Site-specific dna break-induced genome editing using engineered nucleases |
CA2938669A1 (en) | 2014-02-04 | 2015-08-13 | Igenomx International Genomics Corporation | Genome fractioning |
CN105960459B (zh) | 2014-02-07 | 2021-04-20 | 非营利性组织佛兰芒综合大学生物技术研究所 | 抑制neat1用于治疗实体肿瘤 |
EP3105328B1 (en) | 2014-02-11 | 2020-04-08 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
CN113265394A (zh) | 2014-02-13 | 2021-08-17 | 宝生物工程(美国) 有限公司 | 从核酸的初始集合中耗尽靶分子的方法、以及用于实践其的组合物和试剂盒 |
BR112016017806B1 (pt) | 2014-02-14 | 2023-05-02 | Cellectis | Uso de células t engenheiradas para imunoterapia contra células patológicas, e método ex vivo para preparação das mesmas |
JP2017506893A (ja) | 2014-02-18 | 2017-03-16 | デューク ユニバーシティ | ウイルス複製不活化組成物並びにその製造方法及び使用 |
EP3116994B1 (en) | 2014-02-20 | 2019-07-24 | DSM IP Assets B.V. | Phage-insensitive streptococcus thermophilus |
US10196608B2 (en) | 2014-02-21 | 2019-02-05 | Cellectis | Method for in situ inhibition of regulatory T cells |
WO2015127428A1 (en) | 2014-02-24 | 2015-08-27 | Massachusetts Institute Of Technology | Methods for in vivo genome editing |
JP6606088B2 (ja) | 2014-02-24 | 2019-11-13 | サンガモ セラピューティクス, インコーポレイテッド | ヌクレアーゼ媒介性標的化組み込みのための方法および組成物 |
JP6521669B2 (ja) | 2014-02-25 | 2019-05-29 | 国立研究開発法人農業・食品産業技術総合研究機構 | 標的dnaに変異が導入された植物細胞、及びその製造方法 |
ES2898460T3 (es) | 2014-02-27 | 2022-03-07 | Monsanto Technology Llc | Composiciones y procedimientos para la modificación genómica dirigida al sitio |
CN103820441B (zh) | 2014-03-04 | 2017-05-17 | 黄行许 | CRISPR‑Cas9特异性敲除人CTLA4基因的方法以及用于特异性靶向CTLA4基因的sgRNA |
CN103820454B (zh) | 2014-03-04 | 2016-03-30 | 上海金卫生物技术有限公司 | CRISPR-Cas9特异性敲除人PD1基因的方法以及用于特异性靶向PD1基因的sgRNA |
EP3957735A1 (en) | 2014-03-05 | 2022-02-23 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa |
CN111471675A (zh) | 2014-03-05 | 2020-07-31 | 国立大学法人神户大学 | 特异性转变靶向dna序列的核酸碱基的基因组序列的修饰方法、及其使用的分子复合体 |
DK3116997T3 (da) | 2014-03-10 | 2019-08-19 | Editas Medicine Inc | Crispr/cas-relaterede fremgangsmåder og sammensætninger til behandling af lebers kongenitale amaurose 10 (lca10) |
WO2015136001A1 (en) | 2014-03-11 | 2015-09-17 | Cellectis | Method for generating t-cells compatible for allogenic transplantation |
ES2821149T3 (es) | 2014-03-12 | 2021-04-23 | Prec Biosciences Inc | Eliminación del exón del gen de la distrofina mediante nucleasas modificadas genéticamente |
WO2015138870A2 (en) | 2014-03-13 | 2015-09-17 | The Trustees Of The University Of Pennsylvania | Compositions and methods for targeted epigenetic modification |
EP3116305B1 (en) | 2014-03-14 | 2023-12-06 | Cibus US LLC | Methods and compositions for increasing efficiency of targeted gene modification using oligonucleotide-mediated gene repair |
US20170088845A1 (en) | 2014-03-14 | 2017-03-30 | The Regents Of The University Of California | Vectors and methods for fungal genome engineering by crispr-cas9 |
CN106459894B (zh) | 2014-03-18 | 2020-02-18 | 桑格摩生物科学股份有限公司 | 用于调控锌指蛋白表达的方法和组合物 |
US10323073B2 (en) | 2014-03-20 | 2019-06-18 | UNIVERSITé LAVAL | CRISPR-based methods and products for increasing frataxin levels and uses thereof |
MX2016011690A (es) | 2014-03-21 | 2016-11-07 | Univ Leland Stanford Junior | Edicion del genoma sin nucleasas. |
EP3122878B1 (en) | 2014-03-24 | 2018-10-24 | Translate Bio, Inc. | Mrna therapy for the treatment of ocular diseases |
CA2942347C (en) | 2014-03-24 | 2023-03-14 | IMMCO Diagnostics, Inc. | Improved anti-nuclear antibody detection and diagnostics for systemic and non-systemic autoimmune disorders |
CA2943622A1 (en) | 2014-03-25 | 2015-10-01 | Editas Medicine Inc. | Crispr/cas-related methods and compositions for treating hiv infection and aids |
US20170173086A1 (en) | 2014-03-25 | 2017-06-22 | Ginkgo Bioworks, Inc. | Methods and Genetic Systems for Cell Engineering |
EP3981876A1 (en) | 2014-03-26 | 2022-04-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
CA2943794C (en) | 2014-03-26 | 2023-01-24 | University Of Maryland, College Park | Targeted genome editing in zygotes of domestic large animals |
WO2015148860A1 (en) | 2014-03-26 | 2015-10-01 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating beta-thalassemia |
US9993563B2 (en) | 2014-03-28 | 2018-06-12 | Aposense Ltd. | Compounds and methods for trans-membrane delivery of molecules |
EP3125946B1 (en) | 2014-03-28 | 2022-12-07 | Aposense Ltd. | Compounds and methods for trans-membrane delivery of molecules |
WO2015153791A1 (en) | 2014-04-01 | 2015-10-08 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating herpes simplex virus type 2 (hsv-2) |
EP3498845B1 (en) | 2014-04-01 | 2022-06-22 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating herpes simplex virus type 1 (hsv-1) |
WO2015153760A2 (en) | 2014-04-01 | 2015-10-08 | Sangamo Biosciences, Inc. | Methods and compositions for prevention or treatment of a nervous system disorder |
WO2015153889A2 (en) | 2014-04-02 | 2015-10-08 | University Of Florida Research Foundation, Incorporated | Materials and methods for the treatment of latent viral infection |
EP3540061A1 (en) | 2014-04-02 | 2019-09-18 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating primary open angle glaucoma |
WO2015153940A1 (en) | 2014-04-03 | 2015-10-08 | Massachusetts Institute Of Technology | Methods and compositions for the production of guide rna |
CN103911376B (zh) | 2014-04-03 | 2017-02-15 | 黄行许 | CRISPR‑Cas9靶向敲除乙肝病毒cccDNA及其特异性sgRNA |
JP2017512481A (ja) | 2014-04-08 | 2017-05-25 | ノースカロライナ ステート ユニバーシティーNorth Carolina State University | Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物 |
EP3129485B2 (en) | 2014-04-09 | 2022-12-21 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating cystic fibrosis |
WO2015157534A1 (en) | 2014-04-10 | 2015-10-15 | The Regents Of The University Of California | Methods and compositions for using argonaute to modify a single stranded target nucleic acid |
JP2017513472A (ja) | 2014-04-11 | 2017-06-01 | セレクティスCellectis | アルギニンおよび/またはトリプトファン枯渇微小環境に対して抵抗性を有する免疫細胞を作製するための方法 |
CN103923911B (zh) | 2014-04-14 | 2016-06-08 | 上海金卫生物技术有限公司 | CRISPR-Cas9特异性敲除人CCR5基因的方法以及用于特异性靶向CCR5基因的sgRNA |
HUE051354T2 (hu) | 2014-04-14 | 2021-03-01 | Nemesis Bioscience Ltd | Terapeutikum |
ES2962509T3 (es) | 2014-04-14 | 2024-03-19 | Maxcyte Inc | Métodos y composiciones para modificar ADN genómico |
GB201406968D0 (en) | 2014-04-17 | 2014-06-04 | Green Biologics Ltd | Deletion mutants |
GB201406970D0 (en) | 2014-04-17 | 2014-06-04 | Green Biologics Ltd | Targeted mutations |
IL292512B1 (en) | 2014-04-18 | 2024-03-01 | Editas Medicine Inc | CRISPR-CAS-related methods, compositions and components for cancer immunotherapy |
CN105039399A (zh) | 2014-04-23 | 2015-11-11 | 复旦大学 | 多能干细胞-遗传性心肌病心肌细胞及其制备方法 |
ES2730325T3 (es) | 2014-04-24 | 2019-11-11 | Univ Texas | Aplicación de citoblastos pluripotentes inducidos para generar productos de terapia celular adoptiva |
US20170076039A1 (en) | 2014-04-24 | 2017-03-16 | Institute For Basic Science | A Method of Selecting a Nuclease Target Sequence for Gene Knockout Based on Microhomology |
WO2015164748A1 (en) | 2014-04-24 | 2015-10-29 | Sangamo Biosciences, Inc. | Engineered transcription activator like effector (tale) proteins |
WO2015168158A1 (en) | 2014-04-28 | 2015-11-05 | Fredy Altpeter | Targeted genome editing to modify lignin biosynthesis and cell wall composition |
WO2015168125A1 (en) | 2014-04-28 | 2015-11-05 | Recombinetics, Inc. | Multiplex gene editing in swine |
CN106455512A (zh) | 2014-04-28 | 2017-02-22 | 美国陶氏益农公司 | 单倍体玉米转化 |
WO2015167766A1 (en) | 2014-04-29 | 2015-11-05 | Seattle Children's Hospital (dba Seattle Children's Research Institute) | Ccr5 disruption of cells expressing anti-hiv chimeric antigen receptor (car) derived from broadly neutralizing antibodies |
CN104178506B (zh) | 2014-04-30 | 2017-03-01 | 清华大学 | Taler蛋白通过空间位阻发挥转录抑制作用及其应用 |
EP3156493B1 (en) | 2014-04-30 | 2020-05-06 | Tsinghua University | Use of tale transcriptional repressor for modular construction of synthetic gene line in mammalian cell |
WO2015165276A1 (zh) | 2014-04-30 | 2015-11-05 | 清华大学 | 利用tale转录抑制子在哺乳动物细胞中模块化构建合成基因线路的试剂盒 |
WO2015168404A1 (en) | 2014-04-30 | 2015-11-05 | Massachusetts Institute Of Technology | Toehold-gated guide rna for programmable cas9 circuitry with rna input |
JP2017514476A (ja) | 2014-05-01 | 2017-06-08 | ユニバーシティ・オブ・ワシントン | アデノウイルスベクターを用いたインビボでの遺伝子操作 |
GB201407852D0 (en) | 2014-05-02 | 2014-06-18 | Iontas Ltd | Preparation of libraries od protein variants expressed in eukaryotic cells and use for selecting binding molecules |
WO2015171603A1 (en) | 2014-05-06 | 2015-11-12 | Two Blades Foundation | Methods for producing plants with enhanced resistance to oomycete pathogens |
RU2691102C2 (ru) | 2014-05-08 | 2019-06-11 | Сангамо Байосайенсиз, Инк. | Способы и композиции для лечения болезни хантингтона |
AU2015255656A1 (en) | 2014-05-09 | 2016-11-10 | Assembly Biosciences, Inc. | Methods and compositions for treating hepatitis B virus infections |
WO2015168800A1 (en) | 2014-05-09 | 2015-11-12 | UNIVERSITé LAVAL | Prevention and treatment of alzheimer's disease by genome editing using the crispr/cas system |
WO2015171894A1 (en) | 2014-05-09 | 2015-11-12 | The Regents Of The University Of California | Methods for selecting plants after genome editing |
WO2015175642A2 (en) | 2014-05-13 | 2015-11-19 | Sangamo Biosciences, Inc. | Methods and compositions for prevention or treatment of a disease |
CN103981212B (zh) | 2014-05-16 | 2016-06-01 | 安徽省农业科学院水稻研究所 | 将黄色颖壳的水稻品种的颖壳颜色改为褐色的育种方法 |
CN104004782B (zh) | 2014-05-16 | 2016-06-08 | 安徽省农业科学院水稻研究所 | 一种延长水稻生育期的育种方法 |
CN104017821B (zh) | 2014-05-16 | 2016-07-06 | 安徽省农业科学院水稻研究所 | 定向编辑颖壳颜色决定基因OsCHI创制褐壳水稻材料的方法 |
CN103981211B (zh) | 2014-05-16 | 2016-07-06 | 安徽省农业科学院水稻研究所 | 一种创制闭颖授粉水稻材料的育种方法 |
EP3142706A1 (en) | 2014-05-16 | 2017-03-22 | Vrije Universiteit Brussel | Genetic correction of myotonic dystrophy type 1 |
CA2949697A1 (en) | 2014-05-20 | 2015-11-26 | Regents Of The University Of Minnesota | Method for editing a genetic sequence |
CA2852593A1 (en) | 2014-05-23 | 2015-11-23 | Universite Laval | Methods for producing dopaminergic neurons and uses thereof |
US10653123B2 (en) | 2014-05-27 | 2020-05-19 | Dana-Farber Cancer Institute, Inc. | Methods and compositions for perturbing gene expression in hematopoietic stem cell lineages in vivo |
JP2017516500A (ja) | 2014-05-28 | 2017-06-22 | ツールゲン インコーポレイテッドToolgen Incorporated | 標的特異的ヌクレアーゼを用いた標的dnaの敏感な検出方法 |
SG11201610028TA (en) | 2014-05-30 | 2016-12-29 | Univ Leland Stanford Junior | Compositions and methods of delivering treatments for latent viral infections |
EP3152319A4 (en) | 2014-06-05 | 2017-12-27 | Sangamo BioSciences, Inc. | Methods and compositions for nuclease design |
JP2017518049A (ja) | 2014-06-06 | 2017-07-06 | ザ カリフォルニア インスティテュート フォー バイオメディカル リサーチ | アミノ末端免疫グロブリン融合タンパク質とその組成物を構築する方法 |
US11030531B2 (en) | 2014-06-06 | 2021-06-08 | Trustees Of Boston University | DNA recombinase circuits for logical control of gene expression |
WO2015188109A1 (en) | 2014-06-06 | 2015-12-10 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for modifying a targeted locus |
CN104004778B (zh) | 2014-06-06 | 2016-03-02 | 重庆高圣生物医药有限责任公司 | 含有CRISPR/Cas9系统的靶向敲除载体及其腺病毒和应用 |
WO2015188135A1 (en) | 2014-06-06 | 2015-12-10 | The California Institute For Biomedical Research | Constant region antibody fusion proteins and compositions thereof |
US20170198307A1 (en) | 2014-06-06 | 2017-07-13 | President And Fellows Of Harvard College | Methods for targeted modification of genomic dna |
EP3155116A4 (en) | 2014-06-10 | 2017-12-27 | Massachusetts Institute Of Technology | Method for gene editing |
US11274302B2 (en) | 2016-08-17 | 2022-03-15 | Diacarta Ltd | Specific synthetic chimeric Xenonucleic acid guide RNA; s(XNA-gRNA) for enhancing CRISPR mediated genome editing efficiency |
EP3155098A4 (en) | 2014-06-11 | 2018-01-03 | Howard, Tom E. | FACTOR VIII MUTATION REPAIR AND TOLERANCE INDUCTION AND RELATED CDNAs, COMPOSITIONS, METHODS AND SYSTEMS |
ES2937642T3 (es) | 2014-06-11 | 2023-03-30 | Univ Duke | Composiciones y métodos para el control de flujo rápido y dinámico usando válvulas metabólicas sintéticas |
US11584936B2 (en) | 2014-06-12 | 2023-02-21 | King Abdullah University Of Science And Technology | Targeted viral-mediated plant genome editing using CRISPR /Cas9 |
WO2015191911A2 (en) | 2014-06-12 | 2015-12-17 | Clontech Laboratories, Inc. | Protein enriched microvesicles and methods of making and using the same |
EA039693B1 (ru) | 2014-06-16 | 2022-02-28 | Дзе Джонс Хопкинс Юниверсити | Композиции и способы для экспрессии рнк-проводников crispr с использованием промотора h1 |
WO2015195547A1 (en) | 2014-06-16 | 2015-12-23 | University Of Washington | Methods for controlling stem cell potential and for gene editing in stem cells |
AU2015277180A1 (en) | 2014-06-17 | 2017-01-12 | Poseida Therapeutics, Inc. | A method for directing proteins to specific loci in the genome and uses thereof |
WO2015193858A1 (en) | 2014-06-20 | 2015-12-23 | Cellectis | Potatoes with reduced granule-bound starch synthase |
ES2888976T3 (es) | 2014-06-23 | 2022-01-10 | Massachusetts Gen Hospital | Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.) |
RU2707911C2 (ru) | 2014-06-23 | 2019-12-02 | Регенерон Фармасьютикалз, Инк. | Опосредованная нуклеазой сборка днк |
WO2015200555A2 (en) | 2014-06-25 | 2015-12-30 | Caribou Biosciences, Inc. | Rna modification to engineer cas9 activity |
WO2015200805A2 (en) | 2014-06-26 | 2015-12-30 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for targeted genetic modifications and methods of use |
GB201411344D0 (en) | 2014-06-26 | 2014-08-13 | Univ Leicester | Cloning |
JP6342491B2 (ja) | 2014-06-30 | 2018-06-13 | 花王株式会社 | 冷却用貼付シート |
WO2016001988A1 (ja) | 2014-06-30 | 2016-01-07 | 日産自動車株式会社 | 内燃機関 |
WO2016004010A1 (en) | 2014-07-01 | 2016-01-07 | Board Of Regents, The University Of Texas System | Regulated gene expression from viral vectors |
EP3164112A1 (en) | 2014-07-02 | 2017-05-10 | Shire Human Genetic Therapies, Inc. | Encapsulation of messenger rna |
EP3167071B1 (en) | 2014-07-09 | 2020-10-07 | Gen9, Inc. | Compositions and methods for site-directed dna nicking and cleaving |
EP2966170A1 (en) | 2014-07-10 | 2016-01-13 | Heinrich-Pette-Institut Leibniz-Institut für experimentelle Virologie-Stiftung bürgerlichen Rechts - | HBV inactivation |
US20170183677A1 (en) | 2014-07-11 | 2017-06-29 | Pioneer Hi-Bred International, Inc. | Agronomic trait modification using guide rna/cas endonuclease systems and methods of use |
EP3166391A1 (en) | 2014-07-11 | 2017-05-17 | E. I. du Pont de Nemours and Company | Compositions and methods for producing plants resistant to glyphosate herbicide |
US11254933B2 (en) | 2014-07-14 | 2022-02-22 | The Regents Of The University Of California | CRISPR/Cas transcriptional modulation |
CN104109687A (zh) | 2014-07-14 | 2014-10-22 | 四川大学 | 运动发酵单胞菌CRISPR-Cas9系统的构建与应用 |
JP7113618B2 (ja) | 2014-07-15 | 2022-08-05 | ジュノー セラピューティクス インコーポレイテッド | 養子細胞療法用の操作された細胞 |
EP3193944B1 (en) | 2014-07-17 | 2021-04-07 | University of Pittsburgh - Of the Commonwealth System of Higher Education | Methods of treating cells containing fusion genes |
US9944933B2 (en) | 2014-07-17 | 2018-04-17 | Georgia Tech Research Corporation | Aptamer-guided gene targeting |
US10975406B2 (en) | 2014-07-18 | 2021-04-13 | Massachusetts Institute Of Technology | Directed endonucleases for repeatable nucleic acid cleavage |
US20160053304A1 (en) | 2014-07-18 | 2016-02-25 | Whitehead Institute For Biomedical Research | Methods Of Depleting Target Sequences Using CRISPR |
US20160053272A1 (en) | 2014-07-18 | 2016-02-25 | Whitehead Institute For Biomedical Research | Methods Of Modifying A Sequence Using CRISPR |
WO2016014565A2 (en) | 2014-07-21 | 2016-01-28 | Novartis Ag | Treatment of cancer using humanized anti-bcma chimeric antigen receptor |
AU2015294354B2 (en) | 2014-07-21 | 2021-10-28 | Illumina, Inc. | Polynucleotide enrichment using CRISPR-Cas systems |
DE112015003386T5 (de) | 2014-07-22 | 2017-03-30 | Panasonic Intellectual Property Management Co., Ltd. | Magnetisches Verbundmaterial, Spulenkomponente, die dasselbe verwendet und Herstellungsverfahren für das magnetische Verbundmaterial |
DK3172315T3 (da) | 2014-07-24 | 2020-12-21 | Dsm Ip Assets Bv | Fagresistente mælkesyrebakterier |
EP3172316A2 (en) | 2014-07-25 | 2017-05-31 | Boehringer Ingelheim International GmbH | Enhanced reprogramming to ips cells |
WO2016014837A1 (en) | 2014-07-25 | 2016-01-28 | Sangamo Biosciences, Inc. | Gene editing for hiv gene therapy |
US9816074B2 (en) | 2014-07-25 | 2017-11-14 | Sangamo Therapeutics, Inc. | Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells |
EP3194600B1 (en) | 2014-07-26 | 2019-08-28 | Consiglio Nazionale Delle Ricerche | Compositions and methods for treatment of muscular dystrophy |
WO2016019144A2 (en) | 2014-07-30 | 2016-02-04 | Sangamo Biosciences, Inc. | Gene correction of scid-related genes in hematopoietic stem and progenitor cells |
AU2015298571B2 (en) | 2014-07-30 | 2020-09-03 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
FR3024464A1 (fr) | 2014-07-30 | 2016-02-05 | Centre Nat Rech Scient | Ciblage de vecteurs integratifs non-viraux dans les sequences d'adn nucleolaires chez les eucaryotes |
US9850521B2 (en) | 2014-08-01 | 2017-12-26 | Agilent Technologies, Inc. | In vitro assay buffer for Cas9 |
EP2982758A1 (en) | 2014-08-04 | 2016-02-10 | Centre Hospitalier Universitaire Vaudois (CHUV) | Genome editing for the treatment of huntington's disease |
US20160076093A1 (en) | 2014-08-04 | 2016-03-17 | University Of Washington | Multiplex homology-directed repair |
CN106922154B (zh) | 2014-08-06 | 2022-01-07 | 基因工具股份有限公司 | 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑 |
ES2865275T3 (es) | 2014-08-06 | 2021-10-15 | College Of Medicine Pochon Cha Univ Industry Academic Cooperation Foundation | Células inmunocompatibles creadas por edición mediada por nucleasas, de genes que codifican HLA |
US11299732B2 (en) | 2014-08-07 | 2022-04-12 | The Rockefeller University | Compositions and methods for transcription-based CRISPR-Cas DNA editing |
US9932566B2 (en) | 2014-08-07 | 2018-04-03 | Agilent Technologies, Inc. | CIS-blocked guide RNA |
JP6837429B2 (ja) | 2014-08-11 | 2021-03-03 | ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム | Crispr/cas9媒介遺伝子編集による筋ジストロフィーの予防 |
US10513711B2 (en) | 2014-08-13 | 2019-12-24 | Dupont Us Holding, Llc | Genetic targeting in non-conventional yeast using an RNA-guided endonuclease |
CN107429241A (zh) | 2014-08-14 | 2017-12-01 | 北京百奥赛图基因生物技术有限公司 | Dna敲入系统 |
CN104178461B (zh) | 2014-08-14 | 2017-02-01 | 北京蛋白质组研究中心 | 携带cas9的重组腺病毒及其应用 |
US9879270B2 (en) | 2014-08-15 | 2018-01-30 | Wisconsin Alumni Research Foundation | Constructs and methods for genome editing and genetic engineering of fungi and protists |
DK3180426T3 (da) | 2014-08-17 | 2020-03-30 | Broad Inst Inc | Genomredigering ved anvendelse af cas9-nickaser |
AU2015305570C1 (en) | 2014-08-19 | 2020-07-23 | President And Fellows Of Harvard College | RNA-guided systems for probing and mapping of nucleic acids |
EP3633047B1 (en) | 2014-08-19 | 2022-12-28 | Pacific Biosciences of California, Inc. | Method of sequencing nucleic acids based on an enrichment of nucleic acids |
WO2016026444A1 (en) | 2014-08-20 | 2016-02-25 | Shanghai Institutes For Biological Sciences, Chinese Academy Of Sciences | Biomarker and therapeutic target for triple negative breast cancer |
ES2778727T3 (es) | 2014-08-25 | 2020-08-11 | Geneweave Biosciences Inc | Partículas de transducción no replicativas y sistemas indicadores basados en partículas de transducción |
WO2016033230A1 (en) | 2014-08-26 | 2016-03-03 | The Regents Of The University Of California | Hypersensitive aba receptors |
EP3186376B1 (en) | 2014-08-27 | 2019-03-20 | Caribou Biosciences, Inc. | Methods for increasing cas9-mediated engineering efficiency |
WO2016033298A1 (en) | 2014-08-28 | 2016-03-03 | North Carolina State University | Novel cas9 proteins and guiding features for dna targeting and genome editing |
US10570418B2 (en) | 2014-09-02 | 2020-02-25 | The Regents Of The University Of California | Methods and compositions for RNA-directed target DNA modification |
EP3189140B1 (en) | 2014-09-05 | 2019-10-23 | Vilnius University | Programmable rna shredding by the type iii-a crispr-cas system of streptococcus thermophilus |
EP3188746B1 (en) | 2014-09-05 | 2024-06-19 | The Johns Hopkins University | Targeting capn9 activity as a therapeutic strategy for the treatment of myofibroblast differentiation and associated pathologies |
WO2016040594A1 (en) | 2014-09-10 | 2016-03-17 | The Regents Of The University Of California | Reconstruction of ancestral cells by enzymatic recording |
MX2017002930A (es) | 2014-09-12 | 2017-06-06 | Du Pont | Generacion de sitios de integracion especifica de sitio para loci de rasgos complejos en maiz y soja, y metodos de uso. |
UY36298A (es) | 2014-09-16 | 2016-04-29 | Gilead Science Inc | Formas sólidas de un modulador del receptor tipo toll |
RS62334B1 (sr) | 2014-09-16 | 2021-10-29 | Sangamo Therapeutics Inc | Postupci i sastavi za inženjering genoma posredovan nukleazom i korekciju kod matičnih ćelija hematopoeze |
WO2016049251A1 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes |
WO2016049024A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo |
EP3198018B1 (en) | 2014-09-24 | 2020-12-09 | City of Hope | Adeno-associated virus vector variants for high efficiency genome editing and methods thereof |
WO2016049163A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
WO2016046635A1 (en) | 2014-09-25 | 2016-03-31 | Institut Pasteur | Methods for characterizing human papillomavirus associated cervical lesions |
WO2016049258A2 (en) | 2014-09-25 | 2016-03-31 | The Broad Institute Inc. | Functional screening with optimized functional crispr-cas systems |
US20160090603A1 (en) | 2014-09-30 | 2016-03-31 | Sandia Corporation | Delivery platforms for the domestication of algae and plants |
AU2015324935B2 (en) | 2014-10-01 | 2021-04-08 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
EP3998344A1 (en) | 2014-10-09 | 2022-05-18 | Life Technologies Corporation | Crispr oligonucleotides and gene editing |
WO2016057850A1 (en) | 2014-10-09 | 2016-04-14 | Seattle Children' S Hospital (Dba Seattle Children' S Research Institute) | Long poly (a) plasmids and methods for introduction of long poly (a) sequences into the plasmid |
EP3204496A1 (en) | 2014-10-10 | 2017-08-16 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
US10583201B2 (en) | 2014-10-10 | 2020-03-10 | Massachusetts Eye And Ear Infirmary | Efficient delivery of therapeutic molecules in vitro and in vivo |
WO2016061073A1 (en) | 2014-10-14 | 2016-04-21 | Memorial Sloan-Kettering Cancer Center | Composition and method for in vivo engineering of chromosomal rearrangements |
EP3207124B1 (en) | 2014-10-15 | 2019-06-26 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for generating or maintaining pluripotent cells |
WO2016061523A1 (en) | 2014-10-17 | 2016-04-21 | Howard Hughes Medical Institute | Genomic probes |
US10308947B2 (en) | 2014-10-17 | 2019-06-04 | The Penn State Research Foundation | Methods and compositions for multiplex RNA guided genome editing and other RNA technologies |
JP2017536813A (ja) | 2014-10-20 | 2017-12-14 | エンバイロロジックス インコーポレイテッド | Rnaウイルスを検出するための組成物及び方法 |
EP3212788A2 (en) | 2014-10-27 | 2017-09-06 | The Broad Institute, Inc. | Compositions, methods and use of synthetic lethal screening |
DK3212778T3 (da) | 2014-10-28 | 2019-11-04 | Agrivida Inc | Fremgangsmåder og sammensætninger til stabilisering af trans-splejsning af intein-modificerede proteaser |
WO2016069912A1 (en) | 2014-10-29 | 2016-05-06 | Massachusetts Eye And Ear Infirmary | Efficient delivery of therapeutic molecules in vitro and in vivo |
MA40880A (fr) | 2014-10-30 | 2017-09-05 | Temple Univ Of The Commonwealth | Éradication guidée par l'arn du virus jc humain et d'autres polyomavirus |
US9816080B2 (en) | 2014-10-31 | 2017-11-14 | President And Fellows Of Harvard College | Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs) |
DK3212789T3 (da) | 2014-10-31 | 2020-07-27 | Massachusetts Inst Technology | Massiv parallel kombinatorisk genetik til crispr |
KR20230098910A (ko) | 2014-10-31 | 2023-07-04 | 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 | 변형된 t 세포에서 유전자 발현의 변경 및 그의 용도 |
US10435697B2 (en) | 2014-11-03 | 2019-10-08 | Nanyang Technological University | Recombinant expression system that senses pathogenic microorganisms |
CN104504304B (zh) | 2014-11-03 | 2017-08-25 | 深圳先进技术研究院 | 一种成簇的规律间隔的短回文重复序列识别方法及装置 |
CN104404036B (zh) | 2014-11-03 | 2017-12-01 | 赛业(苏州)生物科技有限公司 | 基于CRISPR/Cas9技术的条件性基因敲除方法 |
PL3216867T3 (pl) | 2014-11-04 | 2020-11-02 | National University Corporation Kobe University | Sposób modyfikowania sekwencji genomu w celu wprowadzania swoistej mutacji do docelowej sekwencji DNA poprzez reakcję usuwania zasady i stosowany w nim kompleks cząsteczkowy |
WO2016073559A1 (en) | 2014-11-05 | 2016-05-12 | The Regents Of The University Of California | Methods for autocatalytic genome editing and neutralizing autocatalytic genome editing |
EA038321B1 (ru) | 2014-11-06 | 2021-08-09 | Е.И. Дюпон Де Немур Энд Компани | Опосредуемая пептидом доставка направляемой рнк эндонуклеазы в клетки |
CA2963820A1 (en) | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
ES2706531T3 (es) | 2014-11-11 | 2019-03-29 | Illumina Inc | Amplificación de polinucleótidos empleando sistemas CRISPR-Cas |
WO2016077273A1 (en) | 2014-11-11 | 2016-05-19 | Q Therapeutics, Inc. | Engineering mesenchymal stem cells using homologous recombination |
EP3219810B1 (en) | 2014-11-14 | 2022-01-05 | Institute for Basic Science | Method for detecting off-target site of genetic scissors in genome |
EP3218490B1 (en) | 2014-11-15 | 2018-10-31 | Zumutor Biologics, Inc. | Dna-binding domain of crispr system for production of non-fucosylated and partially fucosylated proteins |
US11470826B2 (en) | 2014-11-17 | 2022-10-18 | National University Corporation Tokyo Medical And Dental University | Method of conveniently producing genetically modified non-human mammal with high efficiency |
JP2017534294A (ja) | 2014-11-19 | 2017-11-24 | インスティチュート フォー ベーシック サイエンスInstitute For Basic Science | 二つのベクターから発現されたcas9タンパク質を利用した遺伝子発現調節方法 |
US11319555B2 (en) | 2014-11-20 | 2022-05-03 | Duke University | Compositions, systems and methods for cell therapy |
CA3176380A1 (en) | 2014-11-21 | 2016-05-26 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for targeted genetic modification using paired guide rnas |
US10227661B2 (en) | 2014-11-21 | 2019-03-12 | GeneWeave Biosciences, Inc. | Sequence-specific detection and phenotype determination |
US20180334732A1 (en) | 2014-11-25 | 2018-11-22 | Drexel University | Compositions and methods for hiv quasi-species excision from hiv-1-infected patients |
EP3224353B9 (en) | 2014-11-26 | 2023-08-09 | Technology Innovation Momentum Fund (Israel) Limited Partnership | Targeted elimination of bacterial genes |
CN105695485B (zh) | 2014-11-27 | 2020-02-21 | 中国科学院上海生命科学研究院 | 一种用于丝状真菌Crispr-Cas系统的Cas9编码基因及其应用 |
WO2016082135A1 (zh) | 2014-11-27 | 2016-06-02 | 中国农业科学院北京畜牧兽医研究所 | 一种利用定点切割系统对猪h11位点定点插入的方法 |
GB201421096D0 (en) | 2014-11-27 | 2015-01-14 | Imp Innovations Ltd | Genome editing methods |
KR20170081268A (ko) | 2014-11-27 | 2017-07-11 | 단지거 이노베이션즈 엘티디. | 게놈 편집용 핵산 구조체 |
EP3227446A1 (en) | 2014-12-01 | 2017-10-11 | Novartis AG | Compositions and methods for diagnosis and treatment of prostate cancer |
US20170266320A1 (en) | 2014-12-01 | 2017-09-21 | President And Fellows Of Harvard College | RNA-Guided Systems for In Vivo Gene Editing |
WO2016089433A1 (en) | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
CN104450774A (zh) | 2014-12-04 | 2015-03-25 | 中国农业科学院作物科学研究所 | 一种大豆CRISPR/Cas9体系的构建及其在大豆基因修饰中的应用 |
US10975392B2 (en) | 2014-12-05 | 2021-04-13 | Abcam Plc | Site-directed CRISPR/recombinase compositions and methods of integrating transgenes |
CN104531704B (zh) | 2014-12-09 | 2019-05-21 | 中国农业大学 | 利用CRISPR-Cas9系统敲除动物FGF5基因的方法 |
CN104531705A (zh) | 2014-12-09 | 2015-04-22 | 中国农业大学 | 利用CRISPR-Cas9系统敲除动物myostatin基因的方法 |
US9888673B2 (en) | 2014-12-10 | 2018-02-13 | Regents Of The University Of Minnesota | Genetically modified cells, tissues, and organs for treating disease |
CN107532162A (zh) | 2014-12-12 | 2018-01-02 | 托德·M·伍尔夫 | 用于利用寡核苷酸编辑细胞中核酸的组合物和方法 |
WO2016094874A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Escorted and functionalized guides for crispr-cas systems |
CN104480144B (zh) | 2014-12-12 | 2017-04-12 | 武汉大学 | 用于艾滋病基因治疗的CRISPR/Cas9重组慢病毒载体及其慢病毒 |
WO2016094888A1 (en) | 2014-12-12 | 2016-06-16 | James Zhu | Methods and compositions for selectively eliminating cells of interest |
EP3230452A1 (en) | 2014-12-12 | 2017-10-18 | The Broad Institute Inc. | Dead guides for crispr transcription factors |
WO2016094880A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs) |
EP3889260A1 (en) | 2014-12-12 | 2021-10-06 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
WO2016100389A1 (en) | 2014-12-16 | 2016-06-23 | Synthetic Genomics, Inc. | Compositions of and methods for in vitro viral genome engineering |
US11427829B2 (en) | 2014-12-16 | 2022-08-30 | Danisco Us Inc | Fungal genome modification systems and methods of use |
WO2016097212A1 (en) | 2014-12-17 | 2016-06-23 | Proqr Therapeutics Ii B.V. | Targeted rna editing |
EP3234117B1 (en) | 2014-12-17 | 2021-03-03 | DuPont US Holding, LLC | Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates |
CA2969384A1 (en) | 2014-12-17 | 2016-06-23 | Cellectis | Inhibitory chimeric antigen receptor (icar or n-car) expressing non-t cell transduction domain |
WO2016097751A1 (en) | 2014-12-18 | 2016-06-23 | The University Of Bath | Method of cas9 mediated genome engineering |
JP2017538427A (ja) | 2014-12-18 | 2017-12-28 | インテグレイテッド ディーエヌエイ テクノロジーズ インコーポレイテッド | Crispr系組成物及び使用方法 |
WO2016100974A1 (en) | 2014-12-19 | 2016-06-23 | The Broad Institute Inc. | Unbiased identification of double-strand breaks and genomic rearrangement by genome-wide insert capture sequencing |
CN104745626B (zh) | 2014-12-19 | 2018-05-01 | 中国航天员科研训练中心 | 一种条件性基因敲除动物模型的快速构建方法及应用 |
AU2015364286B2 (en) | 2014-12-20 | 2021-11-04 | Arc Bio, Llc | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins |
US10190106B2 (en) | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
CN104560864B (zh) | 2014-12-22 | 2017-08-11 | 中国科学院微生物研究所 | 利用CRISPR‑Cas9系统构建的敲除IFN‑β基因的293T细胞系 |
WO2016106236A1 (en) | 2014-12-23 | 2016-06-30 | The Broad Institute Inc. | Rna-targeting system |
US11053271B2 (en) | 2014-12-23 | 2021-07-06 | The Regents Of The University Of California | Methods and compositions for nucleic acid integration |
US20170369855A1 (en) | 2014-12-24 | 2017-12-28 | Dana-Farber Cancer Institute, Inc. | Systems and methods for genome modification and regulation |
AU2015101792A4 (en) | 2014-12-24 | 2016-01-28 | Massachusetts Institute Of Technology | Engineering of systems, methods and optimized enzyme and guide scaffolds for sequence manipulation |
CN104651398A (zh) | 2014-12-24 | 2015-05-27 | 杭州师范大学 | 利用CRISPR-Cas9特异敲出microRNA基因家族的方法 |
CA2970370A1 (en) | 2014-12-24 | 2016-06-30 | Massachusetts Institute Of Technology | Crispr having or associated with destabilization domains |
US10863730B2 (en) | 2014-12-26 | 2020-12-15 | Riken | Gene knockout method |
WO2016108926A1 (en) | 2014-12-30 | 2016-07-07 | The Broad Institute Inc. | Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis |
CN104498493B (zh) | 2014-12-30 | 2017-12-26 | 武汉大学 | CRISPR/Cas9特异性敲除乙型肝炎病毒的方法以及用于特异性靶向HBV DNA的gRNA |
WO2016109255A1 (en) | 2014-12-30 | 2016-07-07 | University Of South Florida | Methods and compositions for cloning into large vectors |
CN104651399B (zh) | 2014-12-31 | 2018-11-16 | 广西大学 | 一种利用CRISPR/Cas系统在猪胚胎细胞中实现基因敲除的方法 |
SG11201704272YA (en) | 2014-12-31 | 2017-06-29 | Synthetic Genomics Inc | Compositions and methods for high efficiency in vivo genome editing |
CN108064287A (zh) | 2015-01-06 | 2018-05-22 | 帝斯曼知识产权资产管理有限公司 | 用于解脂酵母宿主细胞的crispr-cas系统 |
US11396665B2 (en) | 2015-01-06 | 2022-07-26 | Dsm Ip Assets B.V. | CRISPR-CAS system for a filamentous fungal host cell |
CN104651392B (zh) | 2015-01-06 | 2018-07-31 | 华南农业大学 | 一种利用CRISPR/Cas9系统定点突变P/TMS12-1获得温敏不育系的方法 |
EP3242949B1 (en) | 2015-01-06 | 2021-11-03 | DSM IP Assets B.V. | A crispr-cas system for a yeast host cell |
ES2842151T3 (es) | 2015-01-06 | 2021-07-13 | Univ Yonsei Iacf | Endonucleasa dirigida al gen del factor VIII de coagulación sanguínea y composición para el tratamiento de la hemofilia que comprende el mismo |
CN104593422A (zh) | 2015-01-08 | 2015-05-06 | 中国农业大学 | 一种抗蓝耳病克隆猪的制备方法 |
US20180155708A1 (en) | 2015-01-08 | 2018-06-07 | President And Fellows Of Harvard College | Split Cas9 Proteins |
US10280451B2 (en) | 2015-01-09 | 2019-05-07 | Bio-Rad Laboratories, Inc. | Detection of genome editing |
CA2971626A1 (en) | 2015-01-12 | 2016-07-21 | Massachusetts Institute Of Technology | Gene editing through microfluidic delivery |
EP3245232B1 (en) | 2015-01-12 | 2021-04-21 | The Regents of The University of California | Heterodimeric cas9 and methods of use thereof |
WO2016112963A1 (en) | 2015-01-13 | 2016-07-21 | Riboxx Gmbh | Delivery of biomolecules into cells |
MA41349A (fr) | 2015-01-14 | 2017-11-21 | Univ Temple | Éradication de l'herpès simplex de type i et d'autres virus de l'herpès associés guidée par arn |
JP2018503632A (ja) | 2015-01-14 | 2018-02-08 | ユニヴェルシテ デクス−マルセイユ | 非分解性異常タンパク質の蓄積に関連した障害またはがんの治療のためのプロテアソーム阻害剤 |
CN107429263A (zh) | 2015-01-15 | 2017-12-01 | 斯坦福大学托管董事会 | 调控基因组编辑的方法 |
CN104611370A (zh) | 2015-01-16 | 2015-05-13 | 深圳市科晖瑞生物医药有限公司 | 一种剔除β2-微球蛋白基因片段的方法 |
EA201791633A1 (ru) | 2015-01-19 | 2018-03-30 | Инститьют Оф Дженетикс Энд Девелопментал Байолоджи, Чайниз Акэдеми Оф Сайенсиз | Способ точной модификации растения посредством транзиентной экспрессии гена |
CN104725626B (zh) | 2015-01-22 | 2016-06-29 | 漳州亚邦化学有限公司 | 一种适用于人造石英石的不饱和树脂的制备方法 |
CN105821072A (zh) | 2015-01-23 | 2016-08-03 | 深圳华大基因研究院 | 用于DNA组装的CRISPR-Cas9系统及DNA组装方法 |
US20180023139A1 (en) | 2015-01-26 | 2018-01-25 | Cold Spring Harbor Laboratory | Methods of identifying essential protein domains |
CN104561095B (zh) | 2015-01-27 | 2017-08-22 | 深圳市国创纳米抗体技术有限公司 | 一种能够生产人神经生长因子的转基因小鼠的制备方法 |
US10059940B2 (en) | 2015-01-27 | 2018-08-28 | Minghong Zhong | Chemically ligated RNAs for CRISPR/Cas9-lgRNA complexes as antiviral therapeutic agents |
EP3250689B1 (en) | 2015-01-28 | 2020-11-04 | The Regents of The University of California | Methods and compositions for labeling a single-stranded target nucleic acid |
KR20170126875A (ko) | 2015-01-28 | 2017-11-20 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | Crispr 하이브리드 dna/rna 폴리뉴클레오티드 및 사용 방법 |
EP3798302A1 (fr) | 2015-01-29 | 2021-03-31 | Meiogenix | Procede pour induire des recombinaisons meiotiques ciblees |
SG11201706059SA (en) | 2015-01-30 | 2017-08-30 | Univ California | Protein delivery in primary hematopoietic cells |
BR112017016639A2 (pt) | 2015-02-02 | 2018-06-19 | Meiragtx Uk Ii Ltd | regulação da expressão genética pela modulação mediada de aptâmero de espalhamento alternativo |
CN104593418A (zh) | 2015-02-06 | 2015-05-06 | 中国医学科学院医学实验动物研究所 | 一种人源化大鼠药物评价动物模型建立的方法 |
WO2016130600A2 (en) | 2015-02-09 | 2016-08-18 | Duke University | Compositions and methods for epigenome editing |
KR101584933B1 (ko) | 2015-02-10 | 2016-01-13 | 성균관대학교산학협력단 | 항생제 내성 억제용 재조합 벡터 및 이의 용도 |
WO2016130697A1 (en) | 2015-02-11 | 2016-08-18 | Memorial Sloan Kettering Cancer Center | Methods and kits for generating vectors that co-express multiple target molecules |
CN104726494B (zh) | 2015-02-12 | 2018-10-23 | 中国人民解放军第二军医大学 | CRISPR-Cas9技术构建染色体易位干细胞及动物模型的方法 |
CN104928321B (zh) | 2015-02-12 | 2018-06-01 | 中国科学院西北高原生物研究所 | 一种由Crispr/Cas9诱导的鳞片缺失斑马鱼模式及建立方法 |
US10584321B2 (en) | 2015-02-13 | 2020-03-10 | University Of Massachusetts | Compositions and methods for transient delivery of nucleases |
US20160244784A1 (en) | 2015-02-15 | 2016-08-25 | Massachusetts Institute Of Technology | Population-Hastened Assembly Genetic Engineering |
WO2016132122A1 (en) | 2015-02-17 | 2016-08-25 | University Of Edinburgh | Assay construct |
US20180064073A1 (en) | 2015-02-19 | 2018-03-08 | Tokushima University | Method for Transferring Cas9 mRNA Into Mammalian Fertilized Egg by Electroporation |
WO2016135558A2 (en) | 2015-02-23 | 2016-09-01 | Crispr Therapeutics Ag | Materials and methods for treatment of hemoglobinopathies |
WO2016135559A2 (en) | 2015-02-23 | 2016-09-01 | Crispr Therapeutics Ag | Materials and methods for treatment of human genetic diseases including hemoglobinopathies |
EP3262162A4 (en) | 2015-02-23 | 2018-08-08 | Voyager Therapeutics, Inc. | Regulatable expression using adeno-associated virus (aav) |
US20160244829A1 (en) | 2015-02-25 | 2016-08-25 | University-Industry Foundation, Yonsei University | Method for target dna enrichment using crispr system |
EP3262176A1 (en) | 2015-02-25 | 2018-01-03 | Pioneer Hi-Bred International, Inc. | Composition and methods for regulated expression of a guide rna/cas endonuclease complex |
WO2016135507A1 (en) | 2015-02-27 | 2016-09-01 | University Of Edinburgh | Nucleic acid editing systems |
CN104805099B (zh) | 2015-03-02 | 2018-04-13 | 中国人民解放军第二军医大学 | 一种安全编码Cas9蛋白的核酸分子及其表达载体 |
EP3265559B1 (en) | 2015-03-03 | 2021-01-06 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
CN104673816A (zh) | 2015-03-05 | 2015-06-03 | 广东医学院 | 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用 |
CN104651401B (zh) | 2015-03-05 | 2019-03-08 | 东华大学 | 一种mir-505双等位基因敲除的方法 |
US20160264934A1 (en) | 2015-03-11 | 2016-09-15 | The General Hospital Corporation | METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS |
EP3268044A2 (en) | 2015-03-11 | 2018-01-17 | The Broad Institute Inc. | Prmt5 inhibitors for the treatment of cancer with reduced mtap activty |
GB201504223D0 (en) | 2015-03-12 | 2015-04-29 | Genome Res Ltd | Biallelic genetic modification |
EA201791991A1 (ru) | 2015-03-12 | 2018-07-31 | Институт Генетики И Биологии Развития Академии Наук Китая | Способ улучшения способности противодействовать внедренным днк-содержащим вирусам растения |
SG11201707393SA (en) | 2015-03-13 | 2017-10-30 | Jackson Lab | A three-component crispr/cas complex system and uses thereof |
CN106032540B (zh) | 2015-03-16 | 2019-10-25 | 中国科学院上海生命科学研究院 | CRISPR/Cas9核酸内切酶体系的腺相关病毒载体构建及其用途 |
CN105985943B (zh) | 2015-03-16 | 2021-07-06 | 中国科学院遗传与发育生物学研究所 | 一种利用非遗传物质对植物基因组进行定点改造的方法 |
CN107430646B (zh) | 2015-03-17 | 2021-10-22 | 生物辐射实验室股份有限公司 | 检测基因组编辑 |
WO2016149484A2 (en) | 2015-03-17 | 2016-09-22 | Temple University Of The Commonwealth System Of Higher Education | Compositions and methods for specific reactivation of hiv latent reservoir |
MA41382A (fr) | 2015-03-20 | 2017-11-28 | Univ Temple | Édition génique basée sur le système crispr/endonucléase à induction par tat |
WO2016150855A1 (en) | 2015-03-20 | 2016-09-29 | Danmarks Tekniske Universitet | Crispr/cas9 based engineering of actinomycetal genomes |
CN104726449A (zh) | 2015-03-23 | 2015-06-24 | 国家纳米科学中心 | 一种用于预防和/或治疗HIV的CRISPR-Cas9系统及其制备方法和用途 |
CN106148416B (zh) | 2015-03-24 | 2019-12-17 | 华东师范大学 | Cyp基因敲除大鼠的培育方法及其肝微粒体的制备方法 |
US20180112213A1 (en) | 2015-03-25 | 2018-04-26 | Editas Medicine, Inc. | Crispr/cas-related methods, compositions and components |
US20160281111A1 (en) | 2015-03-26 | 2016-09-29 | Editas Medicine, Inc. | Crispr/cas-mediated gene conversion |
WO2016161004A1 (en) | 2015-03-30 | 2016-10-06 | The Board Of Regents Of The Nevada System Of Higher Educ. On Behalf Of The University Of Nevada, La | Compositions comprising talens and methods of treating hiv |
EP3277805A1 (en) | 2015-03-31 | 2018-02-07 | Exeligen Scientific, Inc. | Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism |
CA2981508A1 (en) | 2015-04-01 | 2016-10-06 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating duchenne muscular dystrophy and becker muscular dystrophy |
US20160287678A1 (en) | 2015-04-02 | 2016-10-06 | Agenovir Corporation | Gene delivery methods and compositions |
US20170166928A1 (en) | 2015-04-03 | 2017-06-15 | Whitehead Institute For Biomedical Research | Compositions And Methods For Genetically Modifying Yeast |
CN106167810A (zh) | 2015-04-03 | 2016-11-30 | 内蒙古中科正标生物科技有限责任公司 | 基于CRISPR/Cas9技术的单子叶植物基因敲除载体及其应用 |
EP4335918A3 (en) | 2015-04-03 | 2024-04-17 | Dana-Farber Cancer Institute, Inc. | Composition and methods of genome editing of b-cells |
KR20240038141A (ko) | 2015-04-06 | 2024-03-22 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna |
WO2016164797A1 (en) | 2015-04-08 | 2016-10-13 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Activatable crispr/cas9 for spatial and temporal control of genome editing |
EP3284749A4 (en) | 2015-04-13 | 2018-11-14 | The University of Tokyo | Set of polypeptides exhibiting nuclease activity or nickase activity with dependence on light or in presence of drug or suppressing or activating expression of target gene |
US10155938B2 (en) | 2015-04-14 | 2018-12-18 | City Of Hope | Coexpression of CAS9 and TREX2 for targeted mutagenesis |
GB201506509D0 (en) | 2015-04-16 | 2015-06-03 | Univ Wageningen | Nuclease-mediated genome editing |
US11299729B2 (en) | 2015-04-17 | 2022-04-12 | President And Fellows Of Harvard College | Vector-based mutagenesis system |
US10738290B2 (en) | 2015-04-21 | 2020-08-11 | Novartis Ag | RNA-guided gene editing system and uses thereof |
CN104762321A (zh) | 2015-04-22 | 2015-07-08 | 东北林业大学 | 基于CRISPR/Cas9系统靶向敲除KHV基因的敲除载体构建方法及其crRNA原件 |
CN104805118A (zh) | 2015-04-22 | 2015-07-29 | 扬州大学 | 一种苏禽黄鸡胚胎干细胞特定基因进行靶向敲除方法 |
US11180793B2 (en) | 2015-04-24 | 2021-11-23 | Editas Medicine, Inc. | Evaluation of Cas9 molecule/guide RNA molecule complexes |
WO2016172359A2 (en) | 2015-04-24 | 2016-10-27 | The Regents Of The University Of California | Systems for detecting, monitoring or treating diseases or conditions using engineered cells and methods for making and using them |
US11268158B2 (en) | 2015-04-24 | 2022-03-08 | St. Jude Children's Research Hospital, Inc. | Assay for safety assessment of therapeutic genetic manipulations, gene therapy vectors and compounds |
US11104897B2 (en) | 2015-04-27 | 2021-08-31 | Genethon | Compositions and methods for the treatment of nucleotide repeat expansion disorders |
WO2016176191A1 (en) | 2015-04-27 | 2016-11-03 | The Trustees Of The University Of Pennsylvania | Dual aav vector system for crispr/cas9 mediated correction of human disease |
EP3087974A1 (en) | 2015-04-29 | 2016-11-02 | Rodos BioTarget GmbH | Targeted nanocarriers for targeted drug delivery of gene therapeutics |
EP4008780A1 (en) | 2015-04-30 | 2022-06-08 | The Trustees of Columbia University in the City of New York | Gene therapy for autosomal dominant diseases |
US20190002920A1 (en) | 2015-04-30 | 2019-01-03 | The Brigham And Women's Hospital, Inc. | Methods and kits for cloning-free genome editing |
WO2016179038A1 (en) | 2015-05-01 | 2016-11-10 | Spark Therapeutics, Inc. | ADENO-ASSOCIATED VIRUS-MEDIATED CRISPR-Cas9 TREATMENT OF OCULAR DISEASE |
US20180344817A1 (en) | 2015-05-01 | 2018-12-06 | Precision Biosciences, Inc. | Precise deletion of chromosomal sequences in vivo and treatment of nucleotide repeat expansion disorders using engineered nucleases |
WO2016178207A1 (en) | 2015-05-04 | 2016-11-10 | Ramot At Tel-Aviv University Ltd. | Methods and kits for fragmenting dna |
CN104894068A (zh) | 2015-05-04 | 2015-09-09 | 南京凯地生物科技有限公司 | 一种利用CRISPR/Cas9制备CAR-T细胞的方法 |
GB2531454A (en) | 2016-01-10 | 2016-04-20 | Snipr Technologies Ltd | Recombinogenic nucleic acid strands in situ |
AU2016257306B2 (en) | 2015-05-06 | 2019-06-27 | Snipr Technologies Limited | Altering microbial populations and modifying microbiota |
WO2016182917A1 (en) | 2015-05-08 | 2016-11-17 | Children's Medical Center Corporation | Targeting bcl11a enhancer functional regions for fetal hemoglobin reinduction |
WO2016182893A1 (en) | 2015-05-08 | 2016-11-17 | Teh Broad Institute Inc. | Functional genomics using crispr-cas systems for saturating mutagenesis of non-coding elements, compositions, methods, libraries and applications thereof |
CA2985615A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating hiv infection and aids |
WO2016182959A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
CA2984013A1 (en) | 2015-05-12 | 2016-11-17 | Sangamo Therapeutics, Inc. | Nuclease-mediated regulation of gene expression |
KR101785847B1 (ko) | 2015-05-12 | 2017-10-17 | 연세대학교 산학협력단 | 선형 이중가닥 DNA를 활용한 CRISPR/Cas9 시스템을 이용한 표적 유전체 교정 |
WO2016181357A1 (en) | 2015-05-13 | 2016-11-17 | Zumutor Biologics, Inc. | Afucosylated protein, cell expressing said protein and associated methods |
WO2016183345A1 (en) | 2015-05-13 | 2016-11-17 | Seattle Children' S Hospital (Dba Seattle Children 's Research Institute) | Enhancing endonuclease based gene editing in primary cells |
CN105886498A (zh) | 2015-05-13 | 2016-08-24 | 沈志荣 | CRISPR-Cas9特异性敲除人PCSK9基因的方法以及用于特异性靶向PCSK9基因的sgRNA |
WO2016183402A2 (en) | 2015-05-13 | 2016-11-17 | President And Fellows Of Harvard College | Methods of making and using guide rna for use with cas9 systems |
WO2016183448A1 (en) | 2015-05-14 | 2016-11-17 | University Of Southern California | Optimized gene editing utilizing a recombinant endonuclease system |
US20180291372A1 (en) | 2015-05-14 | 2018-10-11 | Massachusetts Institute Of Technology | Self-targeting genome editing system |
JP2018515142A (ja) | 2015-05-15 | 2018-06-14 | ダーマコン,インコーポレイテッド. | Cas9介在遺伝子編集用の合成シングルガイドrna |
EP3294878A1 (en) | 2015-05-15 | 2018-03-21 | Pioneer Hi-Bred International, Inc. | Guide rna/cas endonuclease systems |
CA2986021A1 (en) | 2015-05-16 | 2016-11-24 | Genzyme Corporation | Gene editing of deep intronic mutations |
EP3298149A1 (en) | 2015-05-18 | 2018-03-28 | King Abdullah University Of Science And Technology | Method of inhibiting plant virus pathogen infections by crispr/cas9-mediated interference |
CN104846010B (zh) | 2015-05-18 | 2018-07-06 | 安徽省农业科学院水稻研究所 | 一种删除转基因水稻筛选标记基因的方法 |
EP3095870A1 (en) | 2015-05-19 | 2016-11-23 | Kws Saat Se | Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom |
CN106011104B (zh) | 2015-05-21 | 2019-09-27 | 清华大学 | 利用拆分Cas系统进行基因编辑和表达调控方法 |
WO2016187904A1 (zh) | 2015-05-22 | 2016-12-01 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA |
US20160340622A1 (en) | 2015-05-22 | 2016-11-24 | Nabil Radi Abdou | Bar Soap Anchoring Core |
CN105518135B (zh) | 2015-05-22 | 2020-11-24 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪CMAH基因的方法及用于特异性靶向CMAH基因的sgRNA |
WO2016187717A1 (en) | 2015-05-26 | 2016-12-01 | Exerkine Corporation | Exosomes useful for genome editing |
EP3302575A4 (en) | 2015-05-28 | 2019-01-16 | Coda Biotherapeutics | GENOME EDITION VECTORS |
CN104894075B (zh) | 2015-05-28 | 2019-08-06 | 华中农业大学 | CRISPR/Cas9和Cre/lox系统编辑伪狂犬病毒基因组制备疫苗方法和应用 |
CN105624146B (zh) | 2015-05-28 | 2019-02-15 | 中国科学院微生物研究所 | 基于CRISPR/Cas9和酿酒酵母细胞内源的同源重组的分子克隆方法 |
GB2542653A (en) | 2015-05-29 | 2017-03-29 | Agenovir Corp | Methods and compositions for treating cells for transplant |
US10117911B2 (en) | 2015-05-29 | 2018-11-06 | Agenovir Corporation | Compositions and methods to treat herpes simplex virus infections |
EP3302556A4 (en) | 2015-05-29 | 2018-12-05 | Clark Atlanta University | Human cell lines mutant for zic2 |
US20160346362A1 (en) | 2015-05-29 | 2016-12-01 | Agenovir Corporation | Methods and compositions for treating cytomegalovirus infections |
EA201792663A1 (ru) | 2015-05-29 | 2018-04-30 | Норт Каролина Стейт Юниверсити | Способы скрининга бактерий, архей, водорослей и дрожжей с использованием нуклеиновых кислот crispr |
GB2543873A (en) | 2015-05-29 | 2017-05-03 | Agenovir Corp | Compositions and methods for cell targeted HPV treatment |
CA3000170A1 (en) | 2015-05-29 | 2016-12-08 | Agenovir Corporation | Antiviral methods and compositions |
WO2016196273A1 (en) | 2015-05-29 | 2016-12-08 | Agenovir Corporation | Compositions and methods to treat viral infections |
KR102553518B1 (ko) | 2015-06-01 | 2023-07-07 | 템플 유니버시티-오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 | Hiv 감염의 rna-가이드된 치료를 위한 방법 및 조성물 |
WO2016191869A1 (en) | 2015-06-01 | 2016-12-08 | The Hospital For Sick Children | Delivery of structurally diverse polypeptide cargo into mammalian cells by a bacterial toxin |
CN105112445B (zh) | 2015-06-02 | 2018-08-10 | 广州辉园苑医药科技有限公司 | 一种基于CRISPR-Cas9基因敲除技术的miR-205基因敲除试剂盒 |
EP3303585A4 (en) | 2015-06-03 | 2018-10-31 | Board of Regents of the University of Nebraska | Dna editing using single-stranded dna |
EP3303634B1 (en) | 2015-06-03 | 2023-08-30 | The Regents of The University of California | Cas9 variants and methods of use thereof |
US20180245074A1 (en) | 2015-06-04 | 2018-08-30 | Protiva Biotherapeutics, Inc. | Treating hepatitis b virus infection using crispr |
WO2016197133A1 (en) | 2015-06-04 | 2016-12-08 | Protiva Biotherapeutics, Inc. | Delivering crispr therapeutics with lipid nanoparticles |
CN105039339B (zh) | 2015-06-05 | 2017-12-19 | 新疆畜牧科学院生物技术研究所 | 一种以RNA介导的特异性敲除绵羊FecB基因的方法及其专用sgRNA |
US11279926B2 (en) | 2015-06-05 | 2022-03-22 | The Regents Of The University Of California | Methods and compositions for generating CRISPR/Cas guide RNAs |
US11911415B2 (en) | 2015-06-09 | 2024-02-27 | Editas Medicine, Inc. | CRISPR/Cas-related methods and compositions for improving transplantation |
WO2016198500A1 (en) | 2015-06-10 | 2016-12-15 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods and compositions for rna-guided treatment of human cytomegalovirus (hcmv) infection |
WO2016201153A1 (en) | 2015-06-10 | 2016-12-15 | Firmenich Sa | Cell lines for screening odorant and aroma receptors |
US20160362667A1 (en) | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
ES2807440T3 (es) | 2015-06-10 | 2021-02-23 | Firmenich & Cie | Procedimiento de identificación de compuestos de almizcle |
CN105518134A (zh) | 2015-06-11 | 2016-04-20 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪SLA-2基因的方法及用于特异性靶向SLA-2基因的sgRNA |
WO2016197360A1 (zh) | 2015-06-11 | 2016-12-15 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪GFRA1基因的方法及用于特异性靶向GFRA1基因的sgRNA |
WO2016197358A1 (zh) | 2015-06-11 | 2016-12-15 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪FGL2基因的方法及用于特异性靶向FGL2基因的sgRNA |
WO2016197357A1 (zh) | 2015-06-11 | 2016-12-15 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪SLA-3基因的方法及用于特异性靶向SLA-3基因的sgRNA |
CN105518140A (zh) | 2015-06-11 | 2016-04-20 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪vWF基因的方法及用于特异性靶向vWF基因的sgRNA |
CN105492608B (zh) | 2015-06-11 | 2021-07-23 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪PDX1基因的方法及用于特异性靶向PDX1基因的sgRNA |
CN105492609A (zh) | 2015-06-11 | 2016-04-13 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪GGTA1基因的方法及用于特异性靶向GGTA1基因的sgRNA |
WO2016197355A1 (zh) | 2015-06-11 | 2016-12-15 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪SALL1基因的方法及用于特异性靶向SALL1基因的sgRNA |
WO2016197359A1 (zh) | 2015-06-11 | 2016-12-15 | 深圳市第二人民医院 | CRISPR-Cas9特异性敲除猪SLA-1基因的方法及用于特异性靶向SLA-1基因的sgRNA |
US20180187190A1 (en) | 2015-06-12 | 2018-07-05 | Erasmus University Medical Center Rotterdam | New crispr assays |
US20180142222A1 (en) | 2015-06-12 | 2018-05-24 | The Regents Of The University Of California | Reporter cas9 variants and methods of use thereof |
GB201510296D0 (en) | 2015-06-12 | 2015-07-29 | Univ Wageningen | Thermostable CAS9 nucleases |
KR20220158846A (ko) | 2015-06-15 | 2022-12-01 | 노쓰 캐롤라이나 스테이트 유니버시티 | 핵산 및 rna-기반 항미생물제를 효율적으로 전달하기 위한 방법 및 조성물 |
CA2989831A1 (en) | 2015-06-17 | 2016-12-22 | The Uab Research Foundation | Crispr/cas9 complex for genomic editing |
CA2989858A1 (en) | 2015-06-17 | 2016-12-22 | The Uab Research Foundation | Crispr/cas9 complex for introducing a functional polypeptide into cells of blood cell lineage |
WO2016205623A1 (en) | 2015-06-17 | 2016-12-22 | North Carolina State University | Methods and compositions for genome editing in bacteria using crispr-cas9 systems |
WO2016205728A1 (en) | 2015-06-17 | 2016-12-22 | Massachusetts Institute Of Technology | Crispr mediated recording of cellular events |
WO2016205745A2 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Cell sorting |
WO2016205688A2 (en) | 2015-06-18 | 2016-12-22 | Bowles Robert D | Rna-guided transcriptional regulation and methods of using the same for the treatment of back pain |
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
CN109536474A (zh) | 2015-06-18 | 2019-03-29 | 布罗德研究所有限公司 | 降低脱靶效应的crispr酶突变 |
US9957501B2 (en) | 2015-06-18 | 2018-05-01 | Sangamo Therapeutics, Inc. | Nuclease-mediated regulation of gene expression |
EP4159856A1 (en) | 2015-06-18 | 2023-04-05 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
AU2016279062A1 (en) | 2015-06-18 | 2019-03-28 | Omar O. Abudayyeh | Novel CRISPR enzymes and systems |
GB201511376D0 (en) | 2015-06-29 | 2015-08-12 | Ecolab Usa Inc | Process for the treatment of produced water from chemical enhanced oil recovery |
WO2017004279A2 (en) | 2015-06-29 | 2017-01-05 | Massachusetts Institute Of Technology | Compositions comprising nucleic acids and methods of using the same |
WO2017004261A1 (en) | 2015-06-29 | 2017-01-05 | Ionis Pharmaceuticals, Inc. | Modified crispr rna and modified single crispr rna and uses thereof |
EP3317399B1 (en) | 2015-06-30 | 2024-06-26 | Cellectis | Methods for improving functionality in nk cell by gene inactivation using specific endonuclease |
CN108350446A (zh) | 2015-07-02 | 2018-07-31 | 约翰霍普金斯大学 | 基于crispr/cas9的治疗 |
CN108026523B (zh) | 2015-07-06 | 2021-11-30 | 帝斯曼知识产权资产管理有限公司 | 向导rna组装载体 |
US20170009242A1 (en) | 2015-07-06 | 2017-01-12 | Whitehead Institute For Biomedical Research | CRISPR-Mediated Genome Engineering for Protein Depletion |
CN105132451B (zh) | 2015-07-08 | 2019-07-23 | 电子科技大学 | 一种CRISPR/Cas9单一转录单元定向修饰骨架载体及其应用 |
WO2017009399A1 (en) | 2015-07-13 | 2017-01-19 | Institut Pasteur | Improving sequence-specific antimicrobials by blocking dna repair |
WO2017011519A1 (en) | 2015-07-13 | 2017-01-19 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
US20170014449A1 (en) | 2015-07-13 | 2017-01-19 | Elwha LLC, a limited liability company of the State of Delaware | Site-specific epigenetic editing |
EP3323890A4 (en) | 2015-07-14 | 2019-01-30 | Fukuoka University | METHOD FOR INDUCING SITE SPECIFIC RNA MUTATIONS, TARGET EDITION GUIDING RNA-GUIDE USED IN THE METHOD, AND TARGET EDITING GUID-RNA TARGET RNA COMPLEX |
MA42895A (fr) | 2015-07-15 | 2018-05-23 | Juno Therapeutics Inc | Cellules modifiées pour thérapie cellulaire adoptive |
US11479793B2 (en) | 2015-07-15 | 2022-10-25 | Rutgers, The State University Of New Jersey | Nuclease-independent targeted gene editing platform and uses thereof |
US20170020922A1 (en) | 2015-07-16 | 2017-01-26 | Batu Biologics Inc. | Gene editing for immunological destruction of neoplasia |
WO2017015015A1 (en) | 2015-07-17 | 2017-01-26 | Emory University | Crispr-associated protein from francisella and uses related thereto |
WO2017015101A1 (en) | 2015-07-17 | 2017-01-26 | University Of Washington | Methods for maximizing the efficiency of targeted gene correction |
US10392674B2 (en) | 2015-07-22 | 2019-08-27 | President And Fellows Of Harvard College | Evolution of site-specific recombinases |
EP3325018A4 (en) | 2015-07-22 | 2019-04-24 | Duke University | HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES |
US20190024073A1 (en) | 2015-07-23 | 2019-01-24 | Mayo Foundation For Medical Education And Research | Editing mitochondrial dna |
CN116212052A (zh) | 2015-07-25 | 2023-06-06 | 哈比卜·弗罗斯特 | 用于为癌症和其他病理状态提供治疗或治愈的系统、装置和方法 |
CN106399360A (zh) | 2015-07-27 | 2017-02-15 | 上海药明生物技术有限公司 | 基于crispr技术敲除fut8基因的方法 |
CN105063061B (zh) | 2015-07-28 | 2018-10-30 | 华南农业大学 | 一种水稻千粒重基因tgw6突变体及其制备方法与应用 |
CN107849562B (zh) | 2015-07-28 | 2021-10-26 | 丹尼斯科美国公司 | 基因组编辑系统及使用方法 |
CN106701808A (zh) | 2015-07-29 | 2017-05-24 | 深圳华大基因研究院 | Dna聚合酶i缺陷型菌株及其构建方法 |
US10612011B2 (en) | 2015-07-30 | 2020-04-07 | President And Fellows Of Harvard College | Evolution of TALENs |
WO2017069829A2 (en) | 2015-07-31 | 2017-04-27 | The Trustees Of Columbia University In The City Of New York | High-throughput strategy for dissecting mammalian genetic interactions |
WO2017023801A1 (en) | 2015-07-31 | 2017-02-09 | Regents Of The University Of Minnesota | Intracellular genomic transplant and methods of therapy |
WO2017024047A1 (en) | 2015-08-03 | 2017-02-09 | Emendobio Inc. | Compositions and methods for increasing nuclease induced recombination rate in cells |
WO2017023974A1 (en) | 2015-08-03 | 2017-02-09 | President And Fellows Of Harvard College | Cas9 genome editing and transcriptional regulation |
CA2995036A1 (en) | 2015-08-06 | 2017-02-09 | Dana-Farber Cancer Institute, Inc. | Tunable endogenous protein degradation |
CN104962523B (zh) | 2015-08-07 | 2018-05-25 | 苏州大学 | 一种测定非同源末端连接修复活性的方法 |
CN108474007A (zh) | 2015-08-07 | 2018-08-31 | 联邦科学技术研究组织 | 产生包含种系遗传修饰的动物的方法 |
US9580727B1 (en) | 2015-08-07 | 2017-02-28 | Caribou Biosciences, Inc. | Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides |
JP2018522907A (ja) | 2015-08-11 | 2018-08-16 | セレクティスCellectis | Cd38抗原を標的とするためおよびcd38遺伝子を不活化するために操作された、免疫療法用の細胞 |
JP2018527920A (ja) | 2015-08-14 | 2018-09-27 | インスティテュート・オブ・ジェネティクス・アンド・ディヴェロプメンタル・バイオロジー、チャイニーズ・アカデミー・オブ・サイエンシズInstitute of Genetics and Developmental Biology, Chinese Academy of Sciences | 部位特異的ヌクレオチド置換によりグリホサート耐性イネを取得するための方法 |
CN105255937A (zh) | 2015-08-14 | 2016-01-20 | 西北农林科技大学 | 一种真核细胞III型启动子表达CRISPR sgRNA的方法及其应用 |
EP3985111A1 (en) | 2015-08-19 | 2022-04-20 | Arc Bio, LLC | Capture of nucleic acids using a nucleic acid-guided nuclease-based system |
WO2017031483A1 (en) | 2015-08-20 | 2017-02-23 | Applied Stemcell, Inc. | Nuclease with enhanced efficiency of genome editing |
CN105112519A (zh) | 2015-08-20 | 2015-12-02 | 郑州大学 | 一种基于crispr的大肠杆菌o157:h7菌株检测试剂盒及检测方法 |
CN105177126B (zh) | 2015-08-21 | 2018-12-04 | 东华大学 | 一种利用荧光pcr技术对小鼠的分型鉴定方法 |
BR112018003625A2 (pt) | 2015-08-25 | 2018-09-25 | Univ Duke | composições e métodos de aprimoramento da especificidade em engenharia genômica usando endonucleases guiadas por rna |
CN106480083B (zh) | 2015-08-26 | 2021-12-14 | 中国科学院分子植物科学卓越创新中心 | CRISPR/Cas9介导的大片段DNA拼接方法 |
CN108350449B (zh) | 2015-08-28 | 2022-05-31 | 通用医疗公司 | 工程化的CRISPR-Cas9核酸酶 |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
WO2017040709A1 (en) | 2015-08-31 | 2017-03-09 | Caribou Biosciences, Inc. | Directed nucleic acid repair |
CN105087620B (zh) | 2015-08-31 | 2017-12-29 | 中国农业大学 | 一种过表达猪共刺激受体4‑1bb载体及其应用 |
WO2017040511A1 (en) | 2015-08-31 | 2017-03-09 | Agilent Technologies, Inc. | Compounds and methods for crispr/cas-based genome editing by homologous recombination |
AU2016316027B2 (en) | 2015-09-01 | 2022-04-07 | Dana-Farber Cancer Institute Inc. | Systems and methods for selection of gRNA targeting strands for Cas9 localization |
US11390908B2 (en) | 2015-09-02 | 2022-07-19 | University Of Massachusetts | Detection of gene loci with CRISPR arrayed repeats and/or polychromatic single guide ribonucleic acids |
WO2017040786A1 (en) | 2015-09-04 | 2017-03-09 | Massachusetts Institute Of Technology | Multilayer genetic safety kill circuits based on single cas9 protein and multiple engineered grna in mammalian cells |
CN105400810B (zh) | 2015-09-06 | 2019-05-07 | 吉林大学 | 采用敲除技术建立低磷性佝偻病模型的方法 |
WO2017044419A1 (en) | 2015-09-08 | 2017-03-16 | University Of Massachusetts | Dnase h activity of neisseria meningitidis cas9 |
EP3348636B1 (en) | 2015-09-09 | 2021-12-01 | National University Corporation Kobe University | Method for modifying genome sequence that specifically converts nucleobase of targeted dna sequence, and molecular complex used in said method |
US10767173B2 (en) | 2015-09-09 | 2020-09-08 | National University Corporation Kobe University | Method for converting genome sequence of gram-positive bacterium by specifically converting nucleic acid base of targeted DNA sequence, and molecular complex used in same |
WO2017044857A2 (en) | 2015-09-10 | 2017-03-16 | Youhealth Biotech, Limited | Methods and compositions for the treatment of glaucoma |
WO2017044776A1 (en) | 2015-09-10 | 2017-03-16 | Texas Tech University System | Single-guide rna (sgrna) with improved knockout efficiency |
CN105274144A (zh) | 2015-09-14 | 2016-01-27 | 徐又佳 | 通过CRISPR/Cas9技术得到敲除铁调素基因斑马鱼的制备方法 |
US10301613B2 (en) | 2015-09-15 | 2019-05-28 | Arizona Board Of Regents On Behalf Of Arizona State University | Targeted remodeling of prokaryotic genomes using CRISPR-nickases |
US10109551B2 (en) | 2015-09-15 | 2018-10-23 | Intel Corporation | Methods and apparatuses for determining a parameter of a die |
CN105210981B (zh) | 2015-09-15 | 2018-09-28 | 中国科学院生物物理研究所 | 建立可应用于人类疾病研究的雪貂模型的方法及其应用 |
CN105112422B (zh) | 2015-09-16 | 2019-11-08 | 中山大学 | 基因miR408和UCL在培育高产水稻中的应用 |
WO2017049129A2 (en) | 2015-09-18 | 2017-03-23 | President And Fellows Of Harvard College | Methods of making guide rna |
ES2959815T3 (es) | 2015-09-21 | 2024-02-28 | Arcturus Therapeutics Inc | Edición génica selectiva de alelo y usos de la misma |
CN105132427B (zh) | 2015-09-21 | 2019-01-08 | 新疆畜牧科学院生物技术研究所 | 一种以RNA介导的特异性敲除双基因获得基因编辑绵羊的方法及其专用sgRNA |
US20180237800A1 (en) | 2015-09-21 | 2018-08-23 | The Regents Of The University Of California | Compositions and methods for target nucleic acid modification |
KR20180054672A (ko) | 2015-09-23 | 2018-05-24 | 상가모 테라퓨틱스, 인코포레이티드 | Htt 리프레서 및 이의 용도 |
EP3337909B1 (en) | 2015-09-24 | 2020-03-18 | Sigma Aldrich Co. LLC | Methods and reagents for molecular proximity detection using rna-guided nucleic acid binding proteins |
EP3786294A1 (en) | 2015-09-24 | 2021-03-03 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
JP2018532402A (ja) | 2015-09-24 | 2018-11-08 | クリスパー セラピューティクス アーゲー | Rnaプログラム可能エンドヌクレアーゼの新規のファミリーならびにゲノム編集および他の適用におけるそれらの使用 |
WO2017053713A1 (en) | 2015-09-25 | 2017-03-30 | Tarveda Therapeutics, Inc. | Compositions and methods for genome editing |
KR101795999B1 (ko) | 2015-09-25 | 2017-11-09 | 전남대학교산학협력단 | Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체 |
WO2017053729A1 (en) | 2015-09-25 | 2017-03-30 | The Board Of Trustees Of The Leland Stanford Junior University | Nuclease-mediated genome editing of primary cells and enrichment thereof |
KR101745863B1 (ko) | 2015-09-25 | 2017-06-12 | 전남대학교산학협력단 | Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체 |
EP3147363B1 (en) | 2015-09-26 | 2019-10-16 | B.R.A.I.N. Ag | Activation of taste receptor genes in mammalian cells using crispr-cas-9 |
WO2017058658A2 (en) | 2015-09-28 | 2017-04-06 | Temple University - Of The Commonwealth System Of Higher Education | Methods and compositions for rna-guided treatment of hiv infection |
CN105177038B (zh) | 2015-09-29 | 2018-08-24 | 中国科学院遗传与发育生物学研究所 | 一种高效定点编辑植物基因组的CRISPR/Cas9系统 |
US20170088828A1 (en) | 2015-09-29 | 2017-03-30 | Agenovir Corporation | Compositions and methods for treatment of latent viral infections |
CN108603192A (zh) | 2015-09-29 | 2018-09-28 | 埃吉诺维亚公司 | 用于调节潜伏的病毒转录的组合物和方法 |
US20170087224A1 (en) | 2015-09-29 | 2017-03-30 | Agenovir Corporation | Delivery methods and compositions |
WO2017058796A1 (en) | 2015-09-29 | 2017-04-06 | Agenovir Corporation | Antiviral fusion proteins and genes |
CN105331627B (zh) | 2015-09-30 | 2019-04-02 | 华中农业大学 | 一种利用内源CRISPR-Cas系统进行原核生物基因组编辑的方法 |
WO2017059241A1 (en) | 2015-10-02 | 2017-04-06 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Lentiviral protein delivery system for rna-guided genome editing |
WO2017062605A1 (en) | 2015-10-06 | 2017-04-13 | The Children's Hospital Of Philadelphia | Compositions and methods for treating fragile x syndrome and related syndromes |
US10760081B2 (en) | 2015-10-07 | 2020-09-01 | New York University | Compositions and methods for enhancing CRISPR activity by POLQ inhibition |
WO2017062886A1 (en) | 2015-10-08 | 2017-04-13 | Cellink Corporation | Battery interconnects |
WO2017062723A1 (en) | 2015-10-08 | 2017-04-13 | President And Fellows Of Harvard College | Multiplexed genome editing |
EP3359662A4 (en) | 2015-10-09 | 2019-06-19 | The Children's Hospital of Philadelphia | COMPOSITIONS AND METHODS OF TREATING HUNTINGTON DISEASE AND RELATED DISEASES |
CN116555254A (zh) | 2015-10-09 | 2023-08-08 | 孟山都技术公司 | 新颖的rna导向性核酸酶及其用途 |
WO2017066175A1 (en) | 2015-10-12 | 2017-04-20 | E. I. Du Pont De Nemours And Company | Protected dna templates for gene modification and increased homologous recombination in cells and methods of use |
EP3362571A4 (en) | 2015-10-13 | 2019-07-10 | Duke University | GENOMIC ENGINEERING WITH TYPE I CRISPRISMS IN EUKARYOTIC CELLS |
WO2017066707A1 (en) | 2015-10-14 | 2017-04-20 | Life Technologies Corporation | Ribonucleoprotein transfection agents |
CN105400779A (zh) | 2015-10-15 | 2016-03-16 | 芜湖医诺生物技术有限公司 | 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用 |
ES2914225T3 (es) | 2015-10-16 | 2022-06-08 | Modernatx Inc | Análogos de cap de ARNm con enlace de fosfato modificado |
AU2016337408B2 (en) | 2015-10-16 | 2022-11-03 | Astrazeneca Ab | Inducible modification of a cell genome |
WO2017066588A2 (en) | 2015-10-16 | 2017-04-20 | Temple University - Of The Commonwealth System Of Higher Education | Methods and compositions utilizing cpf1 for rna-guided gene editing |
FR3042506B1 (fr) | 2015-10-16 | 2018-11-30 | IFP Energies Nouvelles | Outil genetique de transformation de bacteries clostridium |
CN105331607A (zh) | 2015-10-19 | 2016-02-17 | 芜湖医诺生物技术有限公司 | 嗜热链球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用 |
WO2017070169A1 (en) | 2015-10-19 | 2017-04-27 | The Methodist Hospital | Crispr-cas9 delivery to hard-to-transfect cells via membrane deformation |
JP7059179B2 (ja) | 2015-10-20 | 2022-04-25 | アンスティチュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル | 遺伝子操作のための方法及び製品 |
CN105316324A (zh) | 2015-10-20 | 2016-02-10 | 芜湖医诺生物技术有限公司 | 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用 |
CN105331608A (zh) | 2015-10-20 | 2016-02-17 | 芜湖医诺生物技术有限公司 | 脑膜炎双球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用 |
CN105331609A (zh) | 2015-10-20 | 2016-02-17 | 芜湖医诺生物技术有限公司 | 脑膜炎双球菌CRISPR-Cas9系统识别的人CCR5基因的靶序列和sgRNA及其应用 |
CN105316337A (zh) | 2015-10-20 | 2016-02-10 | 芜湖医诺生物技术有限公司 | 嗜热链球菌CRISPR-Cas9系统识别的人CXCR4基因的靶序列和sgRNA及其应用 |
KR20180069832A (ko) | 2015-10-20 | 2018-06-25 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 유도 cas 시스템을 통한 비기능성 유전자 산물에 대한 기능 회복 및 이용 방법 |
AU2016341919A1 (en) | 2015-10-21 | 2018-04-19 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating hepatitis b virus |
CN105219799A (zh) | 2015-10-22 | 2016-01-06 | 天津吉诺沃生物科技有限公司 | 一种基于CRISPR/Cas系统的多年生黑麦草的育种方法 |
AU2016342038B2 (en) | 2015-10-22 | 2022-09-08 | Massachusetts Institute Of Technology | Type VI-B CRISPR enzymes and systems |
JP7109784B2 (ja) | 2015-10-23 | 2022-08-01 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 遺伝子編集のための進化したCas9蛋白質 |
ES2699848T3 (es) | 2015-10-23 | 2019-02-13 | Caribou Biosciences Inc | Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos |
EP3159407A1 (en) | 2015-10-23 | 2017-04-26 | Silence Therapeutics (London) Ltd | Guide rnas, methods and uses |
US9988637B2 (en) | 2015-10-26 | 2018-06-05 | National Tsing Hua Univeristy | Cas9 plasmid, genome editing system and method of Escherichia coli |
TW201715041A (zh) | 2015-10-26 | 2017-05-01 | 國立清華大學 | 細菌基因編輯方法 |
US20170152526A1 (en) | 2015-10-27 | 2017-06-01 | Recombinetics, Inc. | Engineering of humanized car t-cell and platelets by genetic complementation |
US10280411B2 (en) | 2015-10-27 | 2019-05-07 | Pacific Biosciences of California, In.c | Methods, systems, and reagents for direct RNA sequencing |
SG11201803547RA (en) | 2015-10-28 | 2018-05-30 | Sangamo Therapeutics Inc | Liver-specific constructs, factor viii expression cassettes and methods of use thereof |
CA3000931A1 (en) | 2015-10-28 | 2017-05-04 | Crispr Therapeutics Ag | Materials and methods for treatment of duchenne muscular dystrophy |
EP3368054A4 (en) | 2015-10-28 | 2019-07-03 | Voyager Therapeutics, Inc. | REGULATORY EXPRESSION USING THE ADENO-ASSOCIATED VIRUS (AAV) |
US11111508B2 (en) | 2015-10-30 | 2021-09-07 | Brandeis University | Modified CAS9 compositions and methods of use |
AU2016343991B2 (en) | 2015-10-30 | 2022-12-01 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating herpes simplex virus |
CN105238806B (zh) | 2015-11-02 | 2018-11-27 | 中国科学院天津工业生物技术研究所 | 一种用于微生物的CRISPR/Cas9基因编辑载体的构建及其应用 |
CN105316327B (zh) | 2015-11-03 | 2019-01-29 | 中国农业科学院作物科学研究所 | 小麦TaAGO4a基因CRISPR/Cas9载体及其应用 |
EP3370741A4 (en) | 2015-11-04 | 2019-04-24 | The Trustees of The University of Pennsylvania | METHODS AND COMPOSITIONS FOR EDITING GENES IN HEMATOPOIETIC STEM CELLS |
WO2017079428A1 (en) | 2015-11-04 | 2017-05-11 | President And Fellows Of Harvard College | Site specific germline modification |
EP4249074A3 (en) | 2015-11-04 | 2024-01-10 | Fate Therapeutics, Inc. | Genomic engineering of pluripotent cells |
WO2017077135A1 (en) | 2015-11-05 | 2017-05-11 | Centro De Investigación Biomédica En Red | Process of gene-editing of cells isolated from a subject suffering from a metabolic disease affecting the erythroid lineage, cells obtained by said process and uses thereof. |
GB2544270A (en) | 2015-11-05 | 2017-05-17 | Fundació Centre De Regulació Genòmica | Nucleic acids, peptides and methods |
CA3004497A1 (en) | 2015-11-06 | 2017-05-11 | The Jackson Laboratory | Large genomic dna knock-in and uses thereof |
WO2017078751A1 (en) | 2015-11-06 | 2017-05-11 | The Methodist Hospital | Micoluidic cell deomailiy assay for enabling rapid and efficient kinase screening via the crispr-cas9 system |
EP3374507A1 (en) | 2015-11-09 | 2018-09-19 | IFOM Fondazione Istituto Firc di Oncologia Molecolare | Crispr-cas sgrna library |
EP3374494A4 (en) | 2015-11-11 | 2019-05-01 | Coda Biotherapeutics, Inc. | CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY |
WO2017081288A1 (en) | 2015-11-11 | 2017-05-18 | Lonza Ltd | Crispr-associated (cas) proteins with reduced immunogenicity |
TW201737944A (zh) | 2015-11-12 | 2017-11-01 | 輝瑞大藥廠 | 使用crispr-cas9之組織特異性基因組工程 |
WO2017083766A1 (en) | 2015-11-13 | 2017-05-18 | Massachusetts Institute Of Technology | High-throughput crispr-based library screening |
US20170191047A1 (en) | 2015-11-13 | 2017-07-06 | University Of Georgia Research Foundation, Inc. | Adenosine-specific rnase and methods of use |
KR101885901B1 (ko) | 2015-11-13 | 2018-08-07 | 기초과학연구원 | 5' 말단의 인산기가 제거된 rna를 포함하는 리보핵산단백질 전달용 조성물 |
MX2018006116A (es) | 2015-11-16 | 2019-04-04 | Res Institute At Nationwide Children´S Hospital | Materiales y metodos para el tratamiento de miopatias basadas en titina y otras titinopatias. |
US11905521B2 (en) | 2015-11-17 | 2024-02-20 | The Chinese University Of Hong Kong | Methods and systems for targeted gene manipulation |
CN105602987A (zh) | 2015-11-23 | 2016-05-25 | 深圳市默赛尔生物医学科技发展有限公司 | 一种高效的dc细胞xbp1基因敲除方法 |
US20170145394A1 (en) | 2015-11-23 | 2017-05-25 | The Regents Of The University Of California | Tracking and manipulating cellular rna via nuclear delivery of crispr/cas9 |
US20170145438A1 (en) | 2015-11-24 | 2017-05-25 | University Of South Carolina | Viral Vectors for Gene Editing |
EP3382018B1 (en) | 2015-11-25 | 2022-03-30 | National University Corporation Gunma University | Dna methylation editing kit and dna methylation editing method |
US10240145B2 (en) | 2015-11-25 | 2019-03-26 | The Board Of Trustees Of The Leland Stanford Junior University | CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer |
US20180346940A1 (en) | 2015-11-27 | 2018-12-06 | The Regents Of The University Of California | Compositions and methods for the production of hydrocarbons, hydrogen and carbon monoxide using engineered azotobacter strains |
CN105505979A (zh) | 2015-11-28 | 2016-04-20 | 湖北大学 | 一种以CRISPR/Cas9基因编辑技术打靶Badh2基因获得香稻品系的方法 |
WO2017095111A1 (ko) | 2015-11-30 | 2017-06-08 | 기초과학연구원 | F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물 |
CN106811479B (zh) | 2015-11-30 | 2019-10-25 | 中国农业科学院作物科学研究所 | 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用 |
CN105296518A (zh) | 2015-12-01 | 2016-02-03 | 中国农业大学 | 一种用于CRISPR/Cas9技术的同源臂载体构建方法 |
RU2634395C1 (ru) | 2015-12-01 | 2017-10-26 | Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Балтийский Федеральный Университет имени Иммануила Канта" (БФУ им. И. Канта) | Генетическая конструкция на основе системы редактирования генома crispr/cas9, кодирующая нуклеазу cas9, специфически импортируемую в митохондрии клеток человека |
US11085057B2 (en) | 2015-12-02 | 2021-08-10 | The Regents Of The University Of California | Compositions and methods for modifying a target nucleic acid |
WO2017096237A1 (en) | 2015-12-02 | 2017-06-08 | Ceres, Inc. | Methods for genetic modification of plants |
WO2017093370A1 (en) | 2015-12-03 | 2017-06-08 | Technische Universität München | T-cell specific genome editing |
EP3384027A1 (en) | 2015-12-04 | 2018-10-10 | Novartis AG | Compositions and methods for immunooncology |
CN105779448B (zh) | 2015-12-04 | 2018-11-27 | 新疆农业大学 | 一种棉花启动子GbU6-7PS及应用 |
CN105779449B (zh) | 2015-12-04 | 2018-11-27 | 新疆农业大学 | 一种棉花启动子GbU6-5PS及应用 |
CN105462968B (zh) | 2015-12-07 | 2018-10-16 | 北京信生元生物医学科技有限公司 | 一种靶向apoCⅢ的CRISPR-Cas9系统及其应用 |
CN106845151B (zh) | 2015-12-07 | 2019-03-26 | 中国农业大学 | CRISPR-Cas9系统sgRNA作用靶点的筛选方法及装置 |
AU2016366229A1 (en) | 2015-12-09 | 2018-05-17 | Excision Biotherapeutics, Inc. | Gene editing methods and compositions for eliminating risk of JC virus activation and PML (progressive multifocal leukoencephalopathy) during immunosuppresive therapy |
CN105463003A (zh) | 2015-12-11 | 2016-04-06 | 扬州大学 | 一种消除卡那霉素耐药基因活性的重组载体及其构建方法 |
EP3387134B1 (en) | 2015-12-11 | 2020-10-14 | Danisco US Inc. | Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects |
CN105296537A (zh) | 2015-12-12 | 2016-02-03 | 西南大学 | 一种基于睾丸内注射的基因定点编辑技术 |
WO2017105350A1 (en) | 2015-12-14 | 2017-06-22 | Cellresearch Corporation Pte Ltd | A method of generating a mammalian stem cell carrying a transgene, a mammalian stem cell generated by the method and pharmaceuticals uses of the mammalian stem cell |
CN105400773B (zh) | 2015-12-14 | 2018-06-26 | 同济大学 | 应用于大规模筛选癌症基因的CRISPR/Cas9富集测序方法 |
NO343153B1 (en) | 2015-12-17 | 2018-11-19 | Hydra Systems As | A method of assessing the integrity status of a barrier plug |
WO2017106616A1 (en) | 2015-12-17 | 2017-06-22 | The Regents Of The University Of Colorado, A Body Corporate | Varicella zoster virus encoding regulatable cas9 nuclease |
CN105463027A (zh) | 2015-12-17 | 2016-04-06 | 中国农业大学 | 一种高肌肉量及肥厚型心肌病模型克隆猪的制备方法 |
WO2017105991A1 (en) | 2015-12-18 | 2017-06-22 | Danisco Us Inc. | Methods and compositions for t-rna based guide rna expression |
WO2017106657A1 (en) | 2015-12-18 | 2017-06-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
EP3390624A4 (en) | 2015-12-18 | 2019-07-10 | The Regents of The University of California | MODIFIED POLYPEPTIDES AND METHOD OF USE THEREOF |
JP2018537112A (ja) | 2015-12-18 | 2018-12-20 | サンガモ セラピューティクス, インコーポレイテッド | Mhc細胞受容体の標的化破壊 |
AU2016370726B2 (en) | 2015-12-18 | 2022-12-08 | Danisco Us Inc. | Methods and compositions for polymerase II (Pol-II) based guide RNA expression |
AU2016369490C1 (en) | 2015-12-18 | 2021-12-23 | Sangamo Therapeutics, Inc. | Targeted disruption of the T cell receptor |
WO2017106767A1 (en) | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
EP3392337B1 (en) | 2015-12-18 | 2024-03-06 | Japan Science and Technology Agency | Genetic modification non-human organism, egg cells, fertilized eggs, and method for modifying target genes |
WO2017109134A1 (en) | 2015-12-22 | 2017-06-29 | Curevac Ag | Method for producing rna molecule compositions |
US11542466B2 (en) | 2015-12-22 | 2023-01-03 | North Carolina State University | Methods and compositions for delivery of CRISPR based antimicrobials |
MX2018007840A (es) | 2015-12-23 | 2019-05-02 | Crispr Therapeutics Ag | Materiales y metodos para el tratamiento de la esclerosis lateral amiotrofica y/o la degeneracion lobar frontotemporal. |
CN105543270A (zh) | 2015-12-24 | 2016-05-04 | 中国农业科学院作物科学研究所 | 双抗性CRISPR/Cas9载体及应用 |
CN105505976A (zh) | 2015-12-25 | 2016-04-20 | 安徽大学 | 一种维吉尼亚链霉菌ibl14产青霉素重组菌株的构建方法 |
CN105543266A (zh) | 2015-12-25 | 2016-05-04 | 安徽大学 | 一种维吉尼亚链霉菌IBL14中的CRISPR-Cas系统及应用其进行基因编辑的方法 |
US20190010495A1 (en) | 2015-12-28 | 2019-01-10 | Novartis Ag | Compositions and methods for the treatment of hemoglobinopathies |
EP4159848A1 (en) | 2015-12-29 | 2023-04-05 | Monsanto Technology LLC | Novel crispr-associated transposases and uses thereof |
CN105441451B (zh) | 2015-12-31 | 2019-03-22 | 暨南大学 | 一种特异靶向人ABCB1基因的sgRNA导向序列及应用 |
CN105567735A (zh) | 2016-01-05 | 2016-05-11 | 华东师范大学 | 一种凝血因子基因突变的定点修复载体系统及方法 |
CN108473986A (zh) | 2016-01-08 | 2018-08-31 | 诺维信公司 | 芽孢杆菌宿主细胞的基因组编辑 |
US11441146B2 (en) | 2016-01-11 | 2022-09-13 | Christiana Care Health Services, Inc. | Compositions and methods for improving homogeneity of DNA generated using a CRISPR/Cas9 cleavage system |
CN105647922A (zh) | 2016-01-11 | 2016-06-08 | 中国人民解放军疾病预防控制所 | 基于一种新gRNA序列的CRISPR-Cas9系统在制备乙肝治疗药物中的应用 |
US11427837B2 (en) | 2016-01-12 | 2022-08-30 | The Regents Of The University Of California | Compositions and methods for enhanced genome editing |
WO2017123910A1 (en) | 2016-01-14 | 2017-07-20 | The Brigham And Women's Hospital, Inc. | Genome editing for treating glioblastoma |
WO2017124100A1 (en) | 2016-01-14 | 2017-07-20 | Memphis Meats, Inc. | Methods for extending the replicative capacity of somatic cells during an ex vivo cultivation process |
WO2017124086A1 (en) | 2016-01-15 | 2017-07-20 | The Jackson Laboratory | Genetically modified non-human mammals by multi-cycle electroporation of cas9 protein |
CN105567738A (zh) | 2016-01-18 | 2016-05-11 | 南开大学 | 使用基因组编辑技术CRISPR-Cas9诱导CCR5Δ32缺失的方法 |
WO2017126987A1 (ru) | 2016-01-18 | 2017-07-27 | Анатолий Викторович ЗАЗУЛЯ | Эритроциты для направленного транспорта лекарственного средства |
CN105567734A (zh) | 2016-01-18 | 2016-05-11 | 丹弥优生物技术(湖北)有限公司 | 一种基因组dna序列精准编辑方法 |
JP6914274B2 (ja) | 2016-01-22 | 2021-08-04 | ザ・ブロード・インスティテュート・インコーポレイテッド | Crisprcpf1の結晶構造 |
JP2019506156A (ja) | 2016-01-25 | 2019-03-07 | エクシジョン バイオセラピューティクス インコーポレイテッド | Hiv感染症のrna誘導型治療のための方法及び組成物 |
CN105543228A (zh) | 2016-01-25 | 2016-05-04 | 宁夏农林科学院 | 一种快速将水稻转化为香稻的方法 |
JP2019512458A (ja) | 2016-01-25 | 2019-05-16 | エクシジョン バイオセラピューティクス インコーポレイテッド | Rnaによって誘導された、ヒトjcウイルス及び他のポリオーマウイルスの根絶 |
CN105567689B (zh) | 2016-01-25 | 2019-04-09 | 重庆威斯腾生物医药科技有限责任公司 | CRISPR/Cas9靶向敲除人TCAB1基因及其特异性gRNA |
EP3199632A1 (en) | 2016-01-26 | 2017-08-02 | ACIB GmbH | Temperature-inducible crispr/cas system |
CN105567688A (zh) | 2016-01-27 | 2016-05-11 | 武汉大学 | 一种可用于艾滋病基因治疗的CRISPR/SaCas9系统 |
PT3408292T (pt) | 2016-01-29 | 2023-07-19 | Univ Princeton | Inteínas divididas com excecional atividade de splicing |
US11518994B2 (en) | 2016-01-30 | 2022-12-06 | Bonac Corporation | Artificial single guide RNA and use thereof |
CN107022562B (zh) | 2016-02-02 | 2020-07-17 | 中国种子集团有限公司 | 利用CRISPR/Cas9系统对玉米基因定点突变的方法 |
CN105647968B (zh) | 2016-02-02 | 2019-07-23 | 浙江大学 | 一种CRISPR/Cas9工作效率快速测试系统及其应用 |
WO2017136794A1 (en) | 2016-02-03 | 2017-08-10 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
CN105671083B (zh) | 2016-02-03 | 2017-09-29 | 安徽柯顿生物科技有限公司 | PD‑1基因重组病毒质粒及构建、重组逆转录病毒Lenti‑PD‑1‑Puro及包装与应用 |
WO2017136520A1 (en) | 2016-02-04 | 2017-08-10 | President And Fellows Of Harvard College | Mitochondrial genome editing and regulation |
WO2017136629A1 (en) | 2016-02-05 | 2017-08-10 | Regents Of The University Of Minnesota | Vectors and system for modulating gene expression |
US11746349B2 (en) | 2016-02-09 | 2023-09-05 | President And Fellows Of Harvard College | DNA-guided gene editing and regulation |
RU2016104674A (ru) | 2016-02-11 | 2017-08-16 | Анатолий Викторович Зазуля | Устройство модификации эритроцита с механизмом направленного транспорта лекарственного средства для функций генной терапии crispr/cas9 |
JP6998313B2 (ja) | 2016-02-11 | 2022-02-04 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 細胞のゲノムにおける変異ジストロフィン遺伝子を修飾する方法及び組成物 |
US9896696B2 (en) | 2016-02-15 | 2018-02-20 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
CN105647962A (zh) | 2016-02-15 | 2016-06-08 | 浙江大学 | 运用CRISPR-Cas9系统敲除水稻MIRNA393b茎环序列的基因编辑方法 |
EP3417062B1 (en) | 2016-02-15 | 2024-06-26 | Temple University - Of The Commonwealth System of Higher Education | Excision of retroviral nucleic acid sequences |
US11136597B2 (en) | 2016-02-16 | 2021-10-05 | Yale University | Compositions for enhancing targeted gene editing and methods of use thereof |
CN105594664B (zh) | 2016-02-16 | 2018-10-02 | 湖南师范大学 | 一种基因敲除选育stat1a基因缺失型斑马鱼的方法 |
CN105647969B (zh) | 2016-02-16 | 2020-12-15 | 湖南师范大学 | 一种基因敲除选育stat1a基因缺失型斑马鱼的方法 |
CN105624187A (zh) | 2016-02-17 | 2016-06-01 | 天津大学 | 酿酒酵母基因组定点突变的方法 |
EP3417065A4 (en) | 2016-02-18 | 2019-07-17 | President and Fellows of Harvard College | METHOD AND SYSTEMS FOR MOLECULAR RECORDING BY CRISPR-CAS SYSTEM |
EP3653709B1 (en) | 2016-02-22 | 2020-12-09 | Caribou Biosciences, Inc. | Methods for modulating dna repair outcomes |
CN105646719B (zh) | 2016-02-24 | 2019-12-20 | 无锡市妇幼保健院 | 一种高效定点转基因的工具及其应用 |
US20170275665A1 (en) | 2016-02-24 | 2017-09-28 | Board Of Regents, The University Of Texas System | Direct crispr spacer acquisition from rna by a reverse-transcriptase-cas1 fusion protein |
US20170246260A1 (en) | 2016-02-25 | 2017-08-31 | Agenovir Corporation | Modified antiviral nuclease |
CA3015353A1 (en) | 2016-02-25 | 2017-08-31 | Agenovir Corporation | Viral and oncoviral nuclease treatment |
US20170247703A1 (en) | 2016-02-25 | 2017-08-31 | Agenovir Corporation | Antiviral nuclease methods |
WO2017147278A1 (en) | 2016-02-25 | 2017-08-31 | The Children's Medical Center Corporation | Customized class switch of immunoglobulin genes in lymphoma and hybridoma by crispr/cas9 technology |
CA3015665C (en) | 2016-02-26 | 2020-09-22 | Lanzatech New Zealand Limited | Crispr/cas systems for c1-fixing bacteria |
WO2017151444A1 (en) | 2016-02-29 | 2017-09-08 | Agilent Technologies, Inc. | Methods and compositions for blocking off-target nucleic acids from cleavage by crispr proteins |
WO2017151719A1 (en) | 2016-03-01 | 2017-09-08 | University Of Florida Research Foundation, Incorporated | Molecular cell diary system |
CN105671070B (zh) | 2016-03-03 | 2019-03-19 | 江南大学 | 一种用于枯草芽孢杆菌基因组编辑的CRISPRCas9系统及其构建方法 |
WO2017152015A1 (en) | 2016-03-04 | 2017-09-08 | Editas Medicine, Inc. | Crispr-cpf1-related methods, compositions and components for cancer immunotherapy |
CN107177591A (zh) | 2016-03-09 | 2017-09-19 | 北京大学 | 利用CRISPR技术编辑CCR5基因的sgRNA序列及其用途 |
CN105821040B (zh) | 2016-03-09 | 2018-12-14 | 李旭 | 联合免疫基因抑制高危型HPV表达的sgRNA、基因敲除载体及其应用 |
CN105821039B (zh) | 2016-03-09 | 2020-02-07 | 李旭 | 联合免疫基因抑制HBV复制的特异性sgRNA、表达载体及其应用 |
CN105861547A (zh) | 2016-03-10 | 2016-08-17 | 黄捷 | 身份证号码永久嵌入基因组的方法 |
EP3426778A1 (en) | 2016-03-11 | 2019-01-16 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
US20200255857A1 (en) | 2016-03-14 | 2020-08-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating beta hemoglobinopathies |
WO2017160752A1 (en) | 2016-03-14 | 2017-09-21 | Intellia Therapeutics, Inc. | Methods and compositions for gene editing |
EP3430332B1 (en) | 2016-03-15 | 2020-01-01 | Carrier Corporation | Refrigerated sales cabinet |
CA3029735A1 (en) | 2016-03-15 | 2017-09-21 | University Of Massachusetts | Anti-crispr compounds and methods of use |
EP3219799A1 (en) | 2016-03-17 | 2017-09-20 | IMBA-Institut für Molekulare Biotechnologie GmbH | Conditional crispr sgrna expression |
WO2017161068A1 (en) | 2016-03-18 | 2017-09-21 | President And Fellows Of Harvard College | Mutant cas proteins |
WO2017165826A1 (en) | 2016-03-25 | 2017-09-28 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
US11512311B2 (en) | 2016-03-25 | 2022-11-29 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (A1AT) deficiency |
CN106047803A (zh) | 2016-03-28 | 2016-10-26 | 青岛市胶州中心医院 | CRISPR/Cas9靶向敲除兔BMP2基因的细胞模型及其应用 |
WO2017172645A2 (en) | 2016-03-28 | 2017-10-05 | The Charles Stark Draper Laboratory, Inc. | Bacteriophage engineering methods |
WO2017173004A1 (en) | 2016-03-30 | 2017-10-05 | Mikuni Takayasu | A method for in vivo precise genome editing |
WO2017173054A1 (en) | 2016-03-30 | 2017-10-05 | Intellia Therapeutics, Inc. | Lipid nanoparticle formulations for crispr/cas components |
GB2565461B (en) | 2016-03-31 | 2022-04-13 | Harvard College | Methods and compositions for the single tube preparation of sequencing libraries using Cas9 |
US20190093128A1 (en) | 2016-03-31 | 2019-03-28 | The Regents Of The University Of California | Methods for genome editing in zygotes |
US10301619B2 (en) | 2016-04-01 | 2019-05-28 | New England Biolabs, Inc. | Compositions and methods relating to synthetic RNA polynucleotides created from synthetic DNA oligonucleotides |
CN106167525B (zh) | 2016-04-01 | 2019-03-19 | 北京康明百奥新药研发有限公司 | 筛选超低岩藻糖细胞系的方法和应用 |
BR112018070353A2 (pt) | 2016-04-04 | 2019-01-29 | Eth Zuerich | linhagem de célula de mamífero para produção de proteína e geração de biblioteca |
WO2017176529A1 (en) | 2016-04-06 | 2017-10-12 | Temple Univesity-Of The Commonwealth System Of Higher Education | Compositions for eradicating flavivirus infections in subjects |
CN105802980A (zh) | 2016-04-08 | 2016-07-27 | 北京大学 | Gateway兼容性CRISPR/Cas9系统及其应用 |
CN106399306B (zh) | 2016-04-12 | 2019-11-05 | 西安交通大学第一附属医院 | 靶向人lncRNA-UCA1抑制膀胱癌的sgRNA、基因载体及其应用 |
US20190127713A1 (en) | 2016-04-13 | 2019-05-02 | Duke University | Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use |
EP4047092A1 (en) | 2016-04-13 | 2022-08-24 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
US20190062734A1 (en) | 2016-04-13 | 2019-02-28 | Editas Medicine, Inc. | Grna fusion molecules, gene editing systems, and methods of use thereof |
US20170298348A1 (en) | 2016-04-14 | 2017-10-19 | The Board Of Trustees Of The Leland Stanford Junior University | Genome editing of human neural stem cells using nucleases |
US20190167814A1 (en) | 2016-04-14 | 2019-06-06 | Université de Lausanne | Treatment And/Or Prevention Of DNA-Triplet Repeat Diseases Or Disorders |
CN105821116A (zh) | 2016-04-15 | 2016-08-03 | 扬州大学 | 一种绵羊mstn基因定向敲除及其影响成肌分化的检测方法 |
WO2017181107A2 (en) | 2016-04-16 | 2017-10-19 | Ohio State Innovation Foundation | Modified cpf1 mrna, modified guide rna, and uses thereof |
WO2017184334A1 (en) | 2016-04-18 | 2017-10-26 | The Board Of Regents Of The University Of Texas System | Generation of genetically engineered animals by crispr/cas9 genome editing in spermatogonial stem cells |
US20190119678A1 (en) | 2016-04-18 | 2019-04-25 | Ruprecht-Karls-Universität Heidelberg | Means and methods for inactivating therapeutic dna in a cell |
US11286478B2 (en) | 2016-04-19 | 2022-03-29 | The Broad Institute, Inc. | Cpf1 complexes with reduced indel activity |
US20200263190A1 (en) | 2016-04-19 | 2020-08-20 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
CN106086062A (zh) | 2016-04-19 | 2016-11-09 | 上海市农业科学院 | 一种获得番茄基因组定点敲除突变体的方法 |
KR102670601B1 (ko) | 2016-04-19 | 2024-05-29 | 더 브로드 인스티튜트, 인코퍼레이티드 | 신규한 crispr 효소 및 시스템 |
CN105886616B (zh) | 2016-04-20 | 2020-08-07 | 广东省农业科学院农业生物基因研究中心 | 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法 |
CN107304435A (zh) | 2016-04-22 | 2017-10-31 | 中国科学院青岛生物能源与过程研究所 | 一种Cas9/RNA系统及其应用 |
CN105821075B (zh) | 2016-04-22 | 2017-09-12 | 湖南农业大学 | 一种茶树咖啡因合成酶CRISPR/Cas9基因组编辑载体的构建方法 |
CN105861552B (zh) | 2016-04-25 | 2019-10-11 | 西北农林科技大学 | 一种T7 RNA聚合酶介导的CRISPR/Cas9基因编辑系统的构建方法 |
US11248216B2 (en) | 2016-04-25 | 2022-02-15 | The Regents Of The University Of California | Methods and compositions for genomic editing |
CN107326046A (zh) | 2016-04-28 | 2017-11-07 | 上海邦耀生物科技有限公司 | 一种提高外源基因同源重组效率的方法 |
CN105886534A (zh) | 2016-04-29 | 2016-08-24 | 苏州溯源精微生物科技有限公司 | 一种抑制肿瘤转移的方法 |
EP3449000A1 (en) | 2016-04-29 | 2019-03-06 | Sarepta Therapeutics, Inc. | Oligonucleotide analogues targeting human lmna |
WO2017186550A1 (en) | 2016-04-29 | 2017-11-02 | Basf Plant Science Company Gmbh | Improved methods for modification of target nucleic acids |
CN105821049B (zh) | 2016-04-29 | 2019-06-04 | 中国农业大学 | 一种Fbxo40基因敲除猪的制备方法 |
WO2017190257A1 (en) | 2016-05-01 | 2017-11-09 | Neemo Inc | Harnessing heterologous and endogenous crispr-cas machineries for efficient markerless genome editing in clostridium |
WO2017192544A1 (en) | 2016-05-02 | 2017-11-09 | Massachusetts Institute Of Technology | AMPHIPHILIC NANOPARTICLES FOR CODELIVERY OF WATER-INSOLUBLE SMALL MOLECULES AND RNAi |
CN105950639A (zh) | 2016-05-04 | 2016-09-21 | 广州美格生物科技有限公司 | 金黄色葡萄球菌CRISPR/Cas9系统的制备及其在构建小鼠模型中的应用 |
WO2017191210A1 (en) | 2016-05-04 | 2017-11-09 | Novozymes A/S | Genome editing by crispr-cas9 in filamentous fungal host cells |
US11078247B2 (en) | 2016-05-04 | 2021-08-03 | Curevac Ag | RNA encoding a therapeutic protein |
WO2017190664A1 (zh) | 2016-05-05 | 2017-11-09 | 苏州吉玛基因股份有限公司 | 化学合成的crRNA和修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用 |
CN106244591A (zh) | 2016-08-23 | 2016-12-21 | 苏州吉玛基因股份有限公司 | 修饰crRNA在CRISPR/Cpf1基因编辑系统中的应用 |
US20190093092A1 (en) | 2016-05-05 | 2019-03-28 | Temple University - Of The Commonwealth System Of Higher Education | Rna guided eradication of varicella zoster virus |
EP3452498B1 (en) | 2016-05-05 | 2023-07-05 | Duke University | Crispr/cas-related compositions for treating duchenne muscular dystrophy |
CN105907785B (zh) | 2016-05-05 | 2020-02-07 | 苏州吉玛基因股份有限公司 | 化学合成的crRNA用于CRISPR/Cpf1系统在基因编辑中的应用 |
US20190300872A1 (en) | 2016-05-06 | 2019-10-03 | Tod M. Woolf | Improved Methods of Genome Editing with and without Programmable Nucleases |
CN105985985B (zh) | 2016-05-06 | 2019-12-31 | 苏州大学 | Crispr技术编辑并用igf优化的异体间充质干细胞的制备方法及在治疗心梗中应用 |
US20190161743A1 (en) | 2016-05-09 | 2019-05-30 | President And Fellows Of Harvard College | Self-Targeting Guide RNAs in CRISPR System |
WO2017197038A1 (en) | 2016-05-10 | 2017-11-16 | United States Government As Represented By The Department Of Veterans Affairs | Lentiviral delivery of crispr/cas constructs that cleave genes essential for hiv-1 infection and replication |
CN105861554B (zh) | 2016-05-10 | 2020-01-31 | 华南农业大学 | 一种基于对Rbmy基因进行编辑来实现动物性别控制的方法和应用 |
WO2017197301A1 (en) | 2016-05-12 | 2017-11-16 | Hanley Brian P | Safe delivery of crispr and other gene therapies to large fractions of somatic cells in humans and animals |
WO2017197238A1 (en) | 2016-05-12 | 2017-11-16 | President And Fellows Of Harvard College | Aav split cas9 genome editing and transcriptional regulation |
CN107365786A (zh) | 2016-05-12 | 2017-11-21 | 中国科学院微生物研究所 | 一种将spacer序列克隆至CRISPR-Cas9系统中的方法及其应用 |
CN106011171B (zh) | 2016-05-18 | 2019-10-11 | 西北农林科技大学 | 一种利用CRISPR/Cas9技术基于SSA修复的基因无缝编辑方法 |
CN105838733A (zh) | 2016-05-18 | 2016-08-10 | 云南省农业科学院花卉研究所 | Cas9 介导的香石竹基因编辑载体和应用 |
CN105907758B (zh) | 2016-05-18 | 2020-06-05 | 世翱(上海)生物医药科技有限公司 | CRISPR-Cas9引导序列及其引物、转基因表达载体及其构建方法 |
CA3022997C (en) | 2016-05-20 | 2023-07-18 | Regeneron Pharmaceuticals, Inc. | Methods for breaking immunological tolerance using multiple guide rnas |
CN106446600B (zh) | 2016-05-20 | 2019-10-18 | 同济大学 | 一种基于CRISPR/Cas9的sgRNA的设计方法 |
US20190300867A1 (en) | 2016-05-23 | 2019-10-03 | The Trustees Of Columbia University In The City Of New York | Bypassing the pam requirement of the crispr-cas system |
US20190201551A1 (en) | 2016-05-23 | 2019-07-04 | Washington University | Pulmonary targeted cas9/crispr for in vivo editing of disease genes |
CN105950560B (zh) | 2016-05-24 | 2019-07-23 | 苏州系统医学研究所 | 人源化pd-l1肿瘤细胞系及具有该细胞系的动物模型与应用 |
CN106011167B (zh) | 2016-05-27 | 2019-11-01 | 上海交通大学 | 雄性不育基因OsDPW2的应用及水稻育性恢复的方法 |
EP3464594A1 (en) | 2016-06-01 | 2019-04-10 | Kws Saat Se | Hybrid nucleic acid sequences for genome engineering |
US10266851B2 (en) | 2016-06-02 | 2019-04-23 | Sigma-Aldrich Co. Llc | Using programmable DNA binding proteins to enhance targeted genome modification |
WO2017208247A1 (en) | 2016-06-02 | 2017-12-07 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Assay for the removal of methyl-cytosine residues from dna |
JP2019517503A (ja) | 2016-06-03 | 2019-06-24 | テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション | 遺伝子編集戦略によるhiv−1のネガティブフィードバック調節 |
US11140883B2 (en) | 2016-06-03 | 2021-10-12 | Auburn University | Gene editing of reproductive hormones to sterilize aquatic animals |
CN106119275A (zh) | 2016-06-07 | 2016-11-16 | 湖北大学 | 基于CRISPR/Cas9技术将非糯性水稻株系改造成糯性株系的打靶载体和方法 |
US20190256844A1 (en) | 2016-06-07 | 2019-08-22 | Temple University - Of The Commonwealth System Of Higher Education | Rna guided compositions for preventing and treating hepatitis b virus infections |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
CN106086008B (zh) | 2016-06-10 | 2019-03-12 | 中国农业科学院植物保护研究所 | 烟粉虱MED隐种TRP基因的CRISPR/cas9系统及其应用 |
US11779657B2 (en) | 2016-06-10 | 2023-10-10 | City Of Hope | Compositions and methods for mitochondrial genome editing |
BR112018076027A2 (pt) | 2016-06-14 | 2019-03-26 | Pioneer Hi-Bred International, Inc. | método para modificar uma sequência-alvo no genoma de uma célula vegetal; método para editar uma sequência de nucleotídeos no genoma de uma célula vegetal; método para modificar simultaneamente múltiplas sequências-alvo no genoma de uma célula vegetal; método para modificar uma sequênciaalvo de dna no genoma de uma célula vegetal e modelo de modificação de polinucleotídeo |
CN106434752A (zh) | 2016-06-14 | 2017-02-22 | 南通大学附属医院 | 敲除Wnt3a基因的过程及其验证方法 |
CN106167821A (zh) | 2016-06-16 | 2016-11-30 | 郑州大学 | 一种金黄色葡萄球菌crispr位点检测试剂盒及检测方法 |
CN105950633B (zh) | 2016-06-16 | 2019-05-03 | 复旦大学 | 基因OsARF4在控制水稻粒长和千粒重中的应用 |
CN106167808A (zh) | 2016-06-16 | 2016-11-30 | 郑州大学 | 一种基于CRISPR/Cas9技术消除mecA质粒的方法 |
WO2017219033A1 (en) | 2016-06-17 | 2017-12-21 | Montana State University | Bidirectional targeting for genome editing |
US20190330603A1 (en) | 2016-06-17 | 2019-10-31 | Genesis Technologies Limited | Crispr-cas system, materials and methods |
CN105950626B (zh) | 2016-06-17 | 2018-09-28 | 新疆畜牧科学院生物技术研究所 | 基于CRISPR/Cas9获得不同毛色绵羊的方法及靶向ASIP基因的sgRNA |
KR20230156150A (ko) | 2016-06-17 | 2023-11-13 | 더 브로드 인스티튜트, 인코퍼레이티드 | 제vi형 crispr 오솔로그 및 시스템 |
FI3472325T3 (fi) | 2016-06-20 | 2024-06-18 | Keygene Nv | Menetelmä kohdennettuun dna:n muuttamiseen kasvisoluissa |
WO2017222773A1 (en) | 2016-06-20 | 2017-12-28 | Pioneer Hi-Bred International, Inc. | Novel cas systems and methods of use |
US20170362635A1 (en) | 2016-06-20 | 2017-12-21 | University Of Washington | Muscle-specific crispr/cas9 editing of genes |
WO2017223107A1 (en) | 2016-06-20 | 2017-12-28 | Unity Biotechnology, Inc. | Genome modifying enzyme therapy for diseases modulated by senescent cells |
CN106148370A (zh) | 2016-06-21 | 2016-11-23 | 苏州瑞奇生物医药科技有限公司 | 肥胖症大鼠动物模型和构建方法 |
WO2017223330A1 (en) | 2016-06-22 | 2017-12-28 | Icahn School Of Medicine At Mount Sinai | Viral delivery of rna utilizing self-cleaving ribozymes and crispr-based applications thereof |
CA3024944A1 (en) | 2016-06-22 | 2017-12-28 | Proqr Therapeutics Ii B.V. | Single-stranded rna-editing oligonucleotides |
CN106119283A (zh) | 2016-06-24 | 2016-11-16 | 广西壮族自治区水牛研究所 | 一种利用CRISPR‑Cas9靶向敲除MSTN基因的方法 |
CN106047877B (zh) | 2016-06-24 | 2019-01-11 | 中山大学附属第一医院 | 一种靶向敲除FTO基因的sgRNA及CRISPR/Cas9慢病毒系统与应用 |
CN105925608A (zh) | 2016-06-24 | 2016-09-07 | 广西壮族自治区水牛研究所 | 一种利用CRISPR-Cas9靶向敲除ALK6基因的方法 |
CN106148286B (zh) | 2016-06-29 | 2019-10-29 | 牛刚 | 一种用于检测热原的细胞模型的构建方法和细胞模型及热原检测试剂盒 |
WO2018005873A1 (en) | 2016-06-29 | 2018-01-04 | The Broad Institute Inc. | Crispr-cas systems having destabilization domain |
AU2017286835B2 (en) | 2016-06-29 | 2023-12-14 | Crispr Therapeutics Ag | Compositions and methods for gene editing |
WO2018005691A1 (en) | 2016-06-29 | 2018-01-04 | The Regents Of The University Of California | Efficient genetic screening method |
US10927383B2 (en) | 2016-06-30 | 2021-02-23 | Ethris Gmbh | Cas9 mRNAs |
WO2018005117A1 (en) | 2016-07-01 | 2018-01-04 | Microsoft Technology Licensing, Llc | Storage through iterative dna editing |
US20180004537A1 (en) | 2016-07-01 | 2018-01-04 | Microsoft Technology Licensing, Llc | Molecular State Machines |
US10892034B2 (en) | 2016-07-01 | 2021-01-12 | Microsoft Technology Licensing, Llc | Use of homology direct repair to record timing of a molecular event |
SG10202109385QA (en) | 2016-07-05 | 2021-10-28 | Univ Johns Hopkins | Crispr/cas9-based compositions and methods for treating retinal degenerations |
CN106191057B (zh) | 2016-07-06 | 2018-12-25 | 中山大学 | 一种用于敲除人CYP2E1基因的sgRNA序列、CYP2E1基因缺失细胞株的构建方法及其应用 |
WO2018009520A1 (en) | 2016-07-06 | 2018-01-11 | Novozymes A/S | Improving a microorganism by crispr-inhibition |
CN106051058A (zh) | 2016-07-07 | 2016-10-26 | 上海格昆机电科技有限公司 | 用于航天贮箱和粒子治疗仪的旋转机架及其传动机构 |
CN107586777A (zh) | 2016-07-08 | 2018-01-16 | 上海吉倍生物技术有限公司 | 人PDCD1基因sgRNA的用途及其相关药物 |
US11845929B2 (en) | 2016-07-08 | 2023-12-19 | Ohio State Innovation Foundation | Modified nucleic acids, hybrid guide RNAs, and uses thereof |
CN106047930B (zh) | 2016-07-12 | 2020-05-19 | 北京百奥赛图基因生物技术有限公司 | 一种PS1基因条件性敲除flox大鼠的制备方法 |
EP3484994A4 (en) | 2016-07-13 | 2020-01-22 | DSM IP Assets B.V. | CRISPR-CAS-SYSTEM FOR AN ALGENE CELL |
US20190330659A1 (en) | 2016-07-15 | 2019-10-31 | Zymergen Inc. | Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase |
EP3485023B1 (en) | 2016-07-15 | 2023-11-15 | Salk Institute for Biological Studies | Methods and compositions for genome editing in non-dividing cells |
CN106191062B (zh) | 2016-07-18 | 2019-06-14 | 广东华南疫苗股份有限公司 | 一种tcr-/pd-1-双阴性t细胞及其构建方法 |
CN106191061B (zh) | 2016-07-18 | 2019-06-18 | 暨南大学 | 一种特异靶向人ABCG2基因的sgRNA导向序列及其应用 |
CN106190903B (zh) | 2016-07-18 | 2019-04-02 | 华中农业大学 | 鸭疫里氏杆菌Cas9基因缺失突变株及其应用 |
CN106434651B (zh) | 2016-07-19 | 2021-05-18 | 广西大学 | 根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法及其应用 |
EP3487523B1 (en) | 2016-07-19 | 2023-09-06 | Duke University | Therapeutic applications of cpf1-based genome editing |
KR20190031306A (ko) | 2016-07-21 | 2019-03-25 | 맥스시티 인코포레이티드 | 게놈 dna를 변경하기 위한 방법 및 조성물 |
CN106191064B (zh) | 2016-07-22 | 2019-06-07 | 中国农业大学 | 一种制备mc4r基因敲除猪的方法 |
WO2018015444A1 (en) | 2016-07-22 | 2018-01-25 | Novozymes A/S | Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi |
CN106191107B (zh) | 2016-07-22 | 2020-03-20 | 湖南农业大学 | 一种降低水稻籽粒落粒性的分子改良方法 |
EP3488001A4 (en) | 2016-07-25 | 2019-05-29 | Mayo Foundation for Medical Education and Research | TREATMENT OF CANCER |
CN106222193B (zh) | 2016-07-26 | 2019-09-20 | 浙江大学 | 一种重组载体及无转基因基因编辑植株的筛选方法 |
WO2018022634A1 (en) | 2016-07-26 | 2018-02-01 | The General Hospital Corporation | Variants of crispr from prevotella and francisella 1 (cpf1) |
WO2018018979A1 (zh) | 2016-07-26 | 2018-02-01 | 浙江大学 | 植物重组载体及无转基因成分的基因编辑植株的筛选方法 |
CN106086061A (zh) | 2016-07-27 | 2016-11-09 | 苏州泓迅生物科技有限公司 | 一种基于CRISPR‑Cas9系统的酿酒酵母基因组编辑载体及其应用 |
CN106191099A (zh) | 2016-07-27 | 2016-12-07 | 苏州泓迅生物科技有限公司 | 一种基于CRISPR‑Cas9系统的酿酒酵母基因组并行多重编辑载体及其应用 |
WO2018021878A1 (ko) | 2016-07-28 | 2018-02-01 | 주식회사 비엠티 | 옥외 배관용 히팅재킷 |
CN106434748A (zh) | 2016-07-29 | 2017-02-22 | 中国科学院重庆绿色智能技术研究院 | 一种热激诱导型 Cas9 酶转基因斑马鱼的研制及应用 |
CN106191113B (zh) | 2016-07-29 | 2020-01-14 | 中国农业大学 | 一种mc3r基因敲除猪的制备方法 |
GB201613135D0 (en) | 2016-07-29 | 2016-09-14 | Medical Res Council | Genome editing |
CN106191124B (zh) | 2016-07-29 | 2019-10-11 | 中国科学院重庆绿色智能技术研究院 | 一种利用鱼卵保存液提高CRISPR-Cas9基因编辑和传代效率的鱼类育种方法 |
CN106191114B (zh) | 2016-07-29 | 2020-02-11 | 中国科学院重庆绿色智能技术研究院 | 利用CRISPR-Cas9系统敲除鱼类MC4R基因的育种方法 |
WO2018026723A1 (en) | 2016-08-01 | 2018-02-08 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | Human induced pluripotent stem cells for high efficiency genetic engineering |
CN106434688A (zh) | 2016-08-01 | 2017-02-22 | 云南纳博生物科技有限公司 | 一种水稻直立密穗dep1基因人工定点突变体及其应用 |
CN106011150A (zh) | 2016-08-01 | 2016-10-12 | 云南纳博生物科技有限公司 | 一种水稻穗粒数Gn1a基因人工定点突变体及其应用 |
JP7184364B2 (ja) | 2016-08-02 | 2022-12-06 | 国立大学法人京都大学 | ゲノム編集のための方法 |
BR112019001887A2 (pt) | 2016-08-02 | 2019-07-09 | Editas Medicine Inc | composições e métodos para o tratamento de doença associada a cep290 |
EP3494215A1 (en) | 2016-08-03 | 2019-06-12 | President and Fellows of Harvard College | Adenosine nucleobase editors and uses thereof |
CN106282241A (zh) | 2016-08-05 | 2017-01-04 | 无锡市第二人民医院 | 通过CRISPR/Cas9得到敲除bmp2a基因的斑马鱼的方法 |
JP7201153B2 (ja) | 2016-08-09 | 2023-01-10 | プレジデント アンド フェローズ オブ ハーバード カレッジ | プログラム可能cas9-リコンビナーゼ融合タンパク質およびその使用 |
CN106222203A (zh) | 2016-08-10 | 2016-12-14 | 云南纳博生物科技有限公司 | 利用CRISPR/Cas技术获得家蚕丝素重链基因突变体及突变方法和应用 |
KR101710026B1 (ko) | 2016-08-10 | 2017-02-27 | 주식회사 무진메디 | Cas9 단백질 및 가이드 RNA의 혼성체를 함유하는 나노 리포좀 전달체 조성물 |
CN106172238B (zh) | 2016-08-12 | 2019-01-22 | 中南大学 | miR-124基因敲除小鼠动物模型的构建方法和应用 |
CN106222177B (zh) | 2016-08-13 | 2018-06-26 | 江苏集萃药康生物科技有限公司 | 一种靶向人STAT6的CRISPR-Cas9系统及其用于治疗过敏性疾病的应用 |
US11810649B2 (en) | 2016-08-17 | 2023-11-07 | The Broad Institute, Inc. | Methods for identifying novel gene editing elements |
WO2018035250A1 (en) | 2016-08-17 | 2018-02-22 | The Broad Institute, Inc. | Methods for identifying class 2 crispr-cas systems |
WO2018035300A1 (en) | 2016-08-17 | 2018-02-22 | The Regents Of The University Of California | Split trans-complementing gene-drive system for suppressing aedes aegypti mosquitos |
EP3500667A4 (en) | 2016-08-18 | 2020-09-02 | The Regents of the University of California | CRISPR-CAS-GENOME-ENGINEERING VIA A MODULAR AAV DEPLOYMENT SYSTEM |
US20190169597A1 (en) | 2016-08-19 | 2019-06-06 | Bluebird Bio, Inc. | Genome editing enhancers |
WO2018039145A1 (en) | 2016-08-20 | 2018-03-01 | Avellino Lab Usa, Inc. | Single guide rna, crispr/cas9 systems, and methods of use thereof |
CN106191116B (zh) | 2016-08-22 | 2019-10-08 | 西北农林科技大学 | 基于CRISPR/Cas9的外源基因敲入整合系统及其建立方法和应用 |
CN106191071B (zh) | 2016-08-22 | 2018-09-04 | 广州资生生物科技有限公司 | 一种CRISPR-Cas9系统及其用于治疗乳腺癌疾病的应用 |
CN106086028B (zh) | 2016-08-23 | 2019-04-23 | 中国农业科学院作物科学研究所 | 一种通过基因组编辑提高水稻抗性淀粉含量的方法及其专用sgRNA |
CN106244555A (zh) | 2016-08-23 | 2016-12-21 | 广州医科大学附属第三医院 | 一种提高基因打靶的效率的方法及β‑球蛋白基因位点的碱基原位修复方法 |
CN106244609A (zh) | 2016-08-24 | 2016-12-21 | 浙江理工大学 | 一种调节pi3k‑akt信号通路的非编码基因的筛选系统及筛选方法 |
KR101856345B1 (ko) | 2016-08-24 | 2018-06-20 | 경상대학교산학협력단 | CRISPR/Cas9 시스템을 이용하여 APOBEC3H 및 APOBEC3CH 이중-넉아웃 고양이를 제조하는 방법 |
WO2018039438A1 (en) * | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
EP3995574A1 (en) | 2016-08-24 | 2022-05-11 | Sangamo Therapeutics, Inc. | Regulation of gene expression using engineered nucleases |
CN106109417A (zh) | 2016-08-24 | 2016-11-16 | 李因传 | 一种肝细胞膜仿生脂质体药物载体、制作方法及其应用 |
BR112019003327A2 (pt) | 2016-08-24 | 2019-07-02 | Sangamo Therapeutics Inc | nucleases manipuladas de alvo específico |
CN106544357B (zh) | 2016-08-25 | 2018-08-21 | 湖南杂交水稻研究中心 | 一种培育镉低积累籼稻品种的方法 |
CN106318973B (zh) | 2016-08-26 | 2019-09-13 | 深圳市第二人民医院 | 一种基于CRISPR-Cas9的基因调控装置及基因调控方法 |
CN106350540A (zh) | 2016-08-26 | 2017-01-25 | 苏州系统医学研究所 | 一种由慢病毒介导的高效可诱导型CRISPR/Cas9基因敲除载体及其应用 |
CN107784200B (zh) | 2016-08-26 | 2020-11-06 | 深圳华大生命科学研究院 | 一种筛选新型CRISPR-Cas系统的方法和装置 |
CN106480097A (zh) | 2016-10-13 | 2017-03-08 | 南京凯地生物科技有限公司 | 利用CRISPR/Cas9技术敲除人PD‑1基因构建可靶向MSLN新型CAR‑T细胞的方法及其应用 |
CN106399367A (zh) | 2016-08-31 | 2017-02-15 | 深圳市卫光生物制品股份有限公司 | 提高crispr介导的同源重组效率的方法 |
CN106399375A (zh) | 2016-08-31 | 2017-02-15 | 南京凯地生物科技有限公司 | 利用CRISPR/Cas9敲除人PD‑1基因构建靶向CD19CAR‑T细胞的方法 |
CN107794272B (zh) | 2016-09-06 | 2021-10-12 | 中国科学院上海营养与健康研究所 | 一种高特异性的crispr基因组编辑体系 |
CN106399311A (zh) | 2016-09-07 | 2017-02-15 | 同济大学 | 用于Chip‑seq全基因组结合谱的内源蛋白标记的方法 |
CN106367435B (zh) | 2016-09-07 | 2019-11-08 | 电子科技大学 | 一种水稻miRNA定向敲除的方法 |
US20180105806A1 (en) | 2016-09-07 | 2018-04-19 | Massachusetts Institute Of Technology | Method for rna-guided endonuclease-based dna assembly |
CN106399377A (zh) | 2016-09-07 | 2017-02-15 | 同济大学 | 一种基于CRISPR/Cas9高通量技术筛选药物靶点基因的方法 |
JP2019531763A (ja) | 2016-09-07 | 2019-11-07 | フラッグシップ パイオニアリング, インコーポレイテッド | 遺伝子発現をモジュレートするための方法および組成物 |
CN107574179B (zh) | 2016-09-09 | 2018-07-10 | 康码(上海)生物科技有限公司 | 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统 |
WO2018049168A1 (en) | 2016-09-09 | 2018-03-15 | The Board Of Trustees Of The Leland Stanford Junior University | High-throughput precision genome editing |
WO2018051347A1 (en) | 2016-09-14 | 2018-03-22 | Yeda Research And Development Co. Ltd. | Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens |
CN106318934B (zh) | 2016-09-21 | 2020-06-05 | 上海交通大学 | 胡萝卜β(1,2)木糖转移酶的基因全序列及用于转染双子叶植物的CRISPR/CAS9的质粒构建 |
CN106957858A (zh) | 2016-09-23 | 2017-07-18 | 西北农林科技大学 | 一种利用CRISPR/Cas9系统共同敲除绵羊MSTN、ASIP、BCO2基因的方法 |
US20180127786A1 (en) | 2016-09-23 | 2018-05-10 | Casebia Therapeutics Limited Liability Partnership | Compositions and methods for gene editing |
CN109715804A (zh) | 2016-09-23 | 2019-05-03 | 帝斯曼知识产权资产管理有限公司 | 用于宿主细胞的指导rna表达系统 |
US9580698B1 (en) | 2016-09-23 | 2017-02-28 | New England Biolabs, Inc. | Mutant reverse transcriptase |
WO2018062866A2 (en) | 2016-09-28 | 2018-04-05 | Cellivery Therapeutics, Inc. | CELL-PERMEABLE (CP)-Cas9 RECOMBINANT PROTEIN AND USES THEREOF |
CN106480027A (zh) | 2016-09-30 | 2017-03-08 | 重庆高圣生物医药有限责任公司 | CRISPR/Cas9 靶向敲除人PD‑1基因及其特异性gRNA |
WO2018064352A1 (en) | 2016-09-30 | 2018-04-05 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
CN107881184B (zh) | 2016-09-30 | 2021-08-27 | 中国科学院分子植物科学卓越创新中心 | 一种基于Cpf1的DNA体外拼接方法 |
CN107880132B (zh) | 2016-09-30 | 2022-06-17 | 北京大学 | 一种融合蛋白及使用其进行同源重组的方法 |
GB2569733B (en) | 2016-09-30 | 2022-09-14 | Univ California | RNA-guided nucleic acid modifying enzymes and methods of use thereof |
EP3518656A4 (en) | 2016-09-30 | 2020-09-30 | Monsanto Technology LLC | METHOD OF SELECTING TARGETS FOR SITE-SPECIFIC GENOME MODIFICATION IN PLANTS |
EP3518981A4 (en) | 2016-10-03 | 2020-06-10 | President and Fellows of Harvard College | DELIVERING THERAPEUTIC RNAS VIA ARRDC1-MEDIATED MICROVESICLES |
US20190241899A1 (en) | 2016-10-05 | 2019-08-08 | President And Fellows Of Harvard College | Methods of Crispr Mediated Genome Modulation in V. Natriegens |
US10669539B2 (en) | 2016-10-06 | 2020-06-02 | Pioneer Biolabs, Llc | Methods and compositions for generating CRISPR guide RNA libraries |
JP2019533996A (ja) | 2016-10-07 | 2019-11-28 | インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド | S.ピオゲネスcas9変異遺伝子及びこれによってコードされるポリペプチド |
CN106479985A (zh) | 2016-10-09 | 2017-03-08 | 上海吉玛制药技术有限公司 | 病毒介导的Cpf1蛋白在CRISPR/Cpf1基因编辑系统中的应用 |
CN106434663A (zh) | 2016-10-12 | 2017-02-22 | 遵义医学院 | CRISPR/Cas9靶向敲除人ezrin基因增强子关键区的方法及其特异性gRNA |
WO2018071623A2 (en) | 2016-10-12 | 2018-04-19 | Temple University - Of The Commonwealth System Of Higher Education | Combination therapies for eradicating flavivirus infections in subjects |
IT201600102542A1 (it) | 2016-10-12 | 2018-04-12 | Univ Degli Studi Di Trento | Plasmide e sistema lentivirale contenente un circuito autolimitante della Cas9 che ne incrementa la sicurezza. |
US20190330620A1 (en) | 2016-10-14 | 2019-10-31 | Emendobio Inc. | Rna compositions for genome editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
US20200172899A1 (en) | 2016-10-14 | 2020-06-04 | The General Hospital Corporation | Epigenetically Regulated Site-Specific Nucleases |
CN106434782B (zh) | 2016-10-14 | 2020-01-10 | 南京工业大学 | 一种产顺式-4-羟脯氨酸的方法 |
SG10201913505WA (en) | 2016-10-17 | 2020-02-27 | Univ Nanyang Tech | Truncated crispr-cas proteins for dna targeting |
US10640810B2 (en) | 2016-10-19 | 2020-05-05 | Drexel University | Methods of specifically labeling nucleic acids using CRISPR/Cas |
EP3532616A1 (en) | 2016-10-28 | 2019-09-04 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating herpes simplex virus |
WO2018081535A2 (en) | 2016-10-28 | 2018-05-03 | Massachusetts Institute Of Technology | Dynamic genome engineering |
US20180119141A1 (en) | 2016-10-28 | 2018-05-03 | Massachusetts Institute Of Technology | Crispr/cas global regulator screening platform |
US20190198214A1 (en) | 2016-10-31 | 2019-06-27 | Eguchi High Frequency Co., Ltd. | Reactor |
WO2018081728A1 (en) | 2016-10-31 | 2018-05-03 | Emendobio Inc. | Compositions for genome editing |
EP3535396A1 (en) | 2016-11-01 | 2019-09-11 | Novartis AG | Methods and compositions for enhancing gene editing |
US11787795B2 (en) | 2016-11-01 | 2023-10-17 | President And Fellows Of Harvard College | Inhibitors of RNA guided nucleases and uses thereof |
US11732258B2 (en) | 2016-11-02 | 2023-08-22 | President And Fellows Of Harvard College | Engineered guide RNA sequences for in situ detection and sequencing |
GB201618507D0 (en) | 2016-11-02 | 2016-12-14 | Stichting Voor De Technische Wetenschappen And Wageningen Univ | Microbial genome editing |
CN106544353A (zh) | 2016-11-08 | 2017-03-29 | 宁夏医科大学总医院 | 一种利用CRISPR‑Cas9清除鲍曼不动杆菌耐药性基因的方法 |
WO2018089664A1 (en) | 2016-11-11 | 2018-05-17 | The Regents Of The University Of California | Variant rna-guided polypeptides and methods of use |
CN106755088A (zh) | 2016-11-11 | 2017-05-31 | 广东万海细胞生物科技有限公司 | 一种自体car‑t细胞制备方法及应用 |
CN108070611B (zh) | 2016-11-14 | 2021-06-29 | 中国科学院遗传与发育生物学研究所 | 植物碱基编辑方法 |
CN106566838B (zh) | 2016-11-14 | 2019-11-01 | 上海伯豪生物技术有限公司 | 一种基于CRISPR-Cas9技术的miR-126全长基因敲除试剂盒及其应用 |
CN106554969A (zh) | 2016-11-15 | 2017-04-05 | 陕西理工学院 | 基于抑菌杀菌的多靶点CRISPR/Cas9表达载体 |
CN106754912B (zh) | 2016-11-16 | 2019-11-08 | 上海交通大学 | 一类定向清除肝细胞中HBVcccDNA的质粒及制剂 |
AU2017361379B2 (en) | 2016-11-16 | 2023-06-08 | The Regents Of The University Of California | Inhibitors of CRISPR-Cas9 |
US20180282722A1 (en) | 2016-11-21 | 2018-10-04 | Massachusetts Institute Of Technology | Chimeric DNA:RNA Guide for High Accuracy Cas9 Genome Editing |
CN106480067A (zh) | 2016-11-21 | 2017-03-08 | 中国农业科学院烟草研究所 | 烟草NtNAC096基因控制烟草衰老的应用 |
WO2018098383A1 (en) | 2016-11-22 | 2018-05-31 | Integrated Dna Technologies, Inc. | Crispr/cpf1 systems and methods |
MX2019006157A (es) | 2016-11-28 | 2019-11-21 | Univ Texas | Prevención de la distrofia muscular mediante la edición de genes mediada por crispr/cpf1. |
CN106755091A (zh) | 2016-11-28 | 2017-05-31 | 中国人民解放军第三军医大学第附属医院 | 基因敲除载体,mh7a细胞nlrp1基因敲除方法 |
CN106480036B (zh) | 2016-11-30 | 2019-04-09 | 华南理工大学 | 一种具有启动子功能的dna片段及其应用 |
CN107043779B (zh) | 2016-12-01 | 2020-05-12 | 中国农业科学院作物科学研究所 | 一种CRISPR/nCas9介导的定点碱基替换在植物中的应用 |
CN106834323A (zh) | 2016-12-01 | 2017-06-13 | 安徽大学 | 一种基于维吉尼亚链霉菌IBL14基因cas7‑5‑3的基因编辑方法 |
WO2018098587A1 (en) | 2016-12-01 | 2018-06-07 | UNIVERSITé LAVAL | Crispr-based treatment of friedreich ataxia |
US9816093B1 (en) | 2016-12-06 | 2017-11-14 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
WO2018103686A1 (zh) | 2016-12-07 | 2018-06-14 | 中国科学院上海生命科学研究院 | 叶绿体基因组编辑方法 |
CN106701830B (zh) | 2016-12-07 | 2020-01-03 | 湖南人文科技学院 | 一种敲除猪胚胎p66shc基因的方法 |
CN110291198A (zh) | 2016-12-08 | 2019-09-27 | 因特利亚治疗公司 | 经修饰的指导rna |
US11192929B2 (en) | 2016-12-08 | 2021-12-07 | Regents Of The University Of Minnesota | Site-specific DNA base editing using modified APOBEC enzymes |
CN106544351B (zh) | 2016-12-08 | 2019-09-10 | 江苏省农业科学院 | CRISPR-Cas9体外敲除耐药基因mcr-1的方法及其专用细胞穿透肽 |
WO2018107103A1 (en) | 2016-12-09 | 2018-06-14 | The Broad Institute, Inc. | Crispr-systems for modifying a trait of interest in a plant |
EP4119663A1 (en) | 2016-12-09 | 2023-01-18 | The Broad Institute, Inc. | Crispr effector system based diagnostics |
WO2018111946A1 (en) | 2016-12-12 | 2018-06-21 | Integrated Dna Technologies, Inc. | Genome editing detection |
US11293022B2 (en) | 2016-12-12 | 2022-04-05 | Integrated Dna Technologies, Inc. | Genome editing enhancement |
CN107893074A (zh) | 2016-12-13 | 2018-04-10 | 广东赤萌医疗科技有限公司 | 一种用于敲除CXCR4基因的gRNA、表达载体、敲除系统、试剂盒 |
US11242513B2 (en) | 2016-12-14 | 2022-02-08 | Wageningen Universiteit | Thermostable Cas9 nucleases |
WO2018109101A1 (en) | 2016-12-14 | 2018-06-21 | Wageningen Universiteit | Thermostable cas9 nucleases |
WO2018112336A1 (en) | 2016-12-16 | 2018-06-21 | Ohio State Innovation Foundation | Systems and methods for dna-guided rna cleavage |
KR101748575B1 (ko) | 2016-12-16 | 2017-06-20 | 주식회사 엠젠플러스 | Ins 유전자 녹아웃 당뇨병 또는 당뇨병 합병증 동물모델 및 이의 제조방법 |
WO2018112446A2 (en) | 2016-12-18 | 2018-06-21 | Selonterra, Inc. | Use of apoe4 motif-mediated genes for diagnosis and treatment of alzheimer's disease |
CN106755026A (zh) | 2016-12-18 | 2017-05-31 | 吉林大学 | sgRNA表达载体的构建及牙釉质钙化不全模型的建立 |
GB2572918B (en) | 2016-12-23 | 2023-02-15 | Harvard College | Gene editing of PCSK9 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
CN106755424B (zh) | 2016-12-26 | 2020-11-06 | 郑州大学 | 一种基于crispr的大肠杆菌st131系菌株检测引物、试剂盒及检测方法 |
CN107354173A (zh) | 2016-12-26 | 2017-11-17 | 浙江省医学科学院 | 基于crispr技术和水动力尾静脉注射建立肝脏特异性敲除小鼠模型的方法 |
CN106755097A (zh) | 2016-12-27 | 2017-05-31 | 安徽省农业科学院畜牧兽医研究所 | 一种山羊tlr4基因敲除载体及其构建方法 |
CN106834347A (zh) | 2016-12-27 | 2017-06-13 | 安徽省农业科学院畜牧兽医研究所 | 一种山羊cdk2基因敲除载体及其构建方法 |
CN106597260B (zh) | 2016-12-29 | 2020-04-03 | 合肥工业大学 | 基于连续小波分析和elm网络的模拟电路故障诊断方法 |
CN106755077A (zh) | 2016-12-30 | 2017-05-31 | 华智水稻生物技术有限公司 | 利用crispr‑cas9技术对水稻cenh3基因定点突变的方法 |
CN106701763B (zh) | 2016-12-30 | 2019-07-19 | 重庆高圣生物医药有限责任公司 | CRISPR/Cas9靶向敲除人乙肝病毒P基因及其特异性gRNA |
CN106868008A (zh) | 2016-12-30 | 2017-06-20 | 重庆高圣生物医药有限责任公司 | CRISPR/Cas9靶向敲除人Lin28A基因及其特异性gRNA |
CN106834341B (zh) | 2016-12-30 | 2020-06-16 | 中国农业大学 | 一种基因定点突变载体及其构建方法和应用 |
CN106701818B (zh) | 2017-01-09 | 2020-04-24 | 湖南杂交水稻研究中心 | 一种培育水稻普通核不育系的方法 |
WO2018130830A1 (en) | 2017-01-11 | 2018-07-19 | Oxford University Innovation Limited | Crispr rna |
CN107012164B (zh) | 2017-01-11 | 2023-03-03 | 电子科技大学 | CRISPR/Cpf1植物基因组定向修饰功能单元、包含该功能单元的载体及其应用 |
CN110234770A (zh) | 2017-01-17 | 2019-09-13 | 基础科学研究院 | 通过dna单链断裂识别碱基编辑脱靶位点的方法 |
CN106701823A (zh) | 2017-01-18 | 2017-05-24 | 上海交通大学 | 生产无岩藻糖单克隆抗体的cho细胞系建立及其应用 |
CN107058372A (zh) | 2017-01-18 | 2017-08-18 | 四川农业大学 | 一种应用于植物上的CRISPR/Cas9载体的构建方法 |
WO2018136396A2 (en) | 2017-01-18 | 2018-07-26 | Excision Biotherapeutics, Inc. | Crisprs |
CN106801056A (zh) | 2017-01-24 | 2017-06-06 | 中国科学院广州生物医药与健康研究院 | 一种sgRNA及其构建的慢病毒载体和应用 |
CN110475866A (zh) | 2017-01-30 | 2019-11-19 | 科沃施种子欧洲股份两合公司 | 用于基因组工程的与核酸内切酶相连的修复模板 |
TWI608100B (zh) | 2017-02-03 | 2017-12-11 | 國立清華大學 | Cas9表達質體、大腸桿菌基因剪輯系統及其方法 |
TW201839136A (zh) | 2017-02-06 | 2018-11-01 | 瑞士商諾華公司 | 治療血色素異常症之組合物及方法 |
US20190345501A1 (en) | 2017-02-07 | 2019-11-14 | Massachusetts Institute Of Technology | Methods and compositions for rna-guided genetic circuits |
EP3579858A4 (en) | 2017-02-07 | 2020-12-23 | The Regents of The University of California | GENE THERAPY AGAINST HAPLOINSUFFICIENCY |
US11866699B2 (en) | 2017-02-10 | 2024-01-09 | University Of Washington | Genome editing reagents and their use |
IT201700016321A1 (it) | 2017-02-14 | 2018-08-14 | Univ Degli Studi Di Trento | Mutanti di cas9 ad alta specificita' e loro applicazioni. |
JP2020505937A (ja) | 2017-02-15 | 2020-02-27 | キージーン ナムローゼ フェンノートシャップ | 植物細胞における標的遺伝子変化の方法 |
US20200063127A1 (en) | 2017-02-15 | 2020-02-27 | Massachusetts Institute Of Technology | Dna writers, molecular recorders and uses thereof |
CN106957855B (zh) | 2017-02-16 | 2020-04-17 | 上海市农业科学院 | 使用CRISPR/Cas9技术靶向敲除水稻矮杆基因SD1的方法 |
WO2018152418A1 (en) | 2017-02-17 | 2018-08-23 | Temple University - Of The Commonwealth System Of Higher Education | Gene editing therapy for hiv infection via dual targeting of hiv genome and ccr5 |
CN108546716A (zh) | 2017-02-20 | 2018-09-18 | 中国科学院遗传与发育生物学研究所 | 一种基因组编辑方法 |
US20190365929A1 (en) | 2017-02-22 | 2019-12-05 | Crispr Therapeutics Ag | Materials and methods for treatment of dystrophic epidermolysis bullosa (deb) and other collagen type vii alpha 1 chain (col7a1) gene related conditions or disorders |
US20200040061A1 (en) | 2017-02-22 | 2020-02-06 | Crispr Therapeutics Ag | Materials and methods for treatment of early onset parkinson's disease (park1) and other synuclein, alpha (snca) gene related conditions or disorders |
US20200248168A1 (en) | 2017-02-22 | 2020-08-06 | Crispr Therapeutics Ag | Compositions and methods for treatment of proprotein convertase subtilisin/kexin type 9 (pcsk9)-related disorders |
EP3585896A1 (en) | 2017-02-22 | 2020-01-01 | CRISPR Therapeutics AG | Materials and methods for treatment of merosin-deficient cogenital muscular dystrophy (mdcmd) and other laminin, alpha 2 (lama2) gene related conditions or disorders |
WO2018154387A1 (en) | 2017-02-22 | 2018-08-30 | Crispr Therapeutics Ag | Compositions and methods for gene editing |
US20200216857A1 (en) | 2017-02-22 | 2020-07-09 | Crispr Therapeutics Ag | Materials and methods for treatment of spinocerebellar ataxia type 2 (sca2) and other spinocerebellar ataxia type 2 protein (atxn2) gene related conditions or disorders |
US11407997B2 (en) | 2017-02-22 | 2022-08-09 | Crispr Therapeutics Ag | Materials and methods for treatment of primary hyperoxaluria type 1 (PH1) and other alanine-glyoxylate aminotransferase (AGXT) gene related conditions or disorders |
WO2018156372A1 (en) | 2017-02-22 | 2018-08-30 | The Regents Of The University Of California | Genetically modified non-human animals and products thereof |
WO2018154439A1 (en) | 2017-02-22 | 2018-08-30 | Crispr Therapeutics Ag | Materials and methods for treatment of spinocerebellar ataxia type 1 (sca1) and other spinocerebellar ataxia type 1 protein (atxn1) gene related conditions or disorders |
CN106868031A (zh) | 2017-02-24 | 2017-06-20 | 北京大学 | 一种基于分级组装的多个sgRNA串联并行表达的克隆方法及应用 |
WO2018161009A1 (en) | 2017-03-03 | 2018-09-07 | Yale University | Aav-mediated direct in vivo crispr screen in glioblastoma |
US11111492B2 (en) | 2017-03-06 | 2021-09-07 | Florida State University Research Foundation, Inc. | Genome engineering methods using a cytosine-specific Cas9 |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
KR20190123328A (ko) | 2017-03-09 | 2019-10-31 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 암 백신 |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
GB2574561A (en) | 2017-03-14 | 2019-12-11 | Univ California | Engineering CRISPR CAS9 immune stealth |
CN106978428A (zh) | 2017-03-15 | 2017-07-25 | 上海吐露港生物科技有限公司 | 一种Cas蛋白特异结合靶标DNA、调控靶标基因转录的方法及试剂盒 |
BR112019019087A2 (pt) | 2017-03-15 | 2020-05-12 | The Broad Institute, Inc. | Diagnóstico baseado em sistema efetor de crispr para detecção de vírus |
CN106906242A (zh) | 2017-03-16 | 2017-06-30 | 重庆高圣生物医药有限责任公司 | 一种提高CRIPSR/Cas9靶向敲除基因产生非同源性末端接合效率的方法 |
EP3600382A4 (en) | 2017-03-21 | 2020-12-30 | Anthony P. Shuber | TREATMENT OF CANCER WITH CAS ENDONUCLEASE COMPLEXES |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
CN107012213A (zh) | 2017-03-24 | 2017-08-04 | 南开大学 | 结直肠癌的生物标记物 |
CN106947780A (zh) | 2017-03-28 | 2017-07-14 | 扬州大学 | 一种兔mstn基因的编辑方法 |
EP3985113A1 (en) | 2017-03-28 | 2022-04-20 | Locanabio, Inc. | Crispr-associated (cas) protein |
CN106906240A (zh) | 2017-03-29 | 2017-06-30 | 浙江大学 | 运用CRISPR‑Cas9系统敲除大麦VE合成通路中的关键基因HPT的方法 |
EP3617311A4 (en) | 2017-03-30 | 2021-04-21 | Kyoto University | METHOD FOR THE INDUCTION OF EXON SKIPPING BY GENOME EDITIING |
CN108660161B (zh) | 2017-03-31 | 2023-05-09 | 中国科学院脑科学与智能技术卓越创新中心 | 基于CRISPR/Cas9技术的制备无嵌合基因敲除动物的方法 |
CN107058358B (zh) | 2017-04-01 | 2020-06-09 | 中国科学院微生物研究所 | 一种双spacer序列识别切割CRISPR-Cas9载体构建及其在疣孢菌中的应用 |
US9938288B1 (en) | 2017-04-05 | 2018-04-10 | President And Fellows Of Harvard College | Macrocyclic compound and uses thereof |
CN106967726B (zh) | 2017-04-05 | 2020-12-29 | 华南农业大学 | 一种创建亚洲栽培稻与非洲栽培稻种间杂种亲和系的方法和应用 |
CN107142282A (zh) | 2017-04-06 | 2017-09-08 | 中山大学 | 一种利用CRISPR/Cas9在哺乳动物细胞中实现大片段DNA定点整合的方法 |
CN107034229A (zh) | 2017-04-07 | 2017-08-11 | 江苏贝瑞利生物科技有限公司 | 一种植物中高效筛选CRISPR/CAS9基因编辑系统候选sgRNA系统及应用 |
WO2018189184A1 (en) | 2017-04-11 | 2018-10-18 | Roche Diagnostics Gmbh | Mutant reverse transcriptase with increased thermal stability as well as products, methods and uses involving the same |
JP2020516285A (ja) | 2017-04-12 | 2020-06-11 | ザ・ブロード・インスティテュート・インコーポレイテッド | 新規vi型crisprオルソログ及び系 |
CN107058320B (zh) | 2017-04-12 | 2019-08-02 | 南开大学 | Il7r基因缺失斑马鱼突变体的制备及其应用 |
CN106916852B (zh) | 2017-04-13 | 2020-12-04 | 上海科技大学 | 一种碱基编辑系统及其构建和应用方法 |
CN108728476A (zh) | 2017-04-14 | 2018-11-02 | 复旦大学 | 一种利用crispr系统产生多样性抗体文库的方法 |
CN107298701B (zh) | 2017-04-18 | 2020-10-30 | 上海大学 | 玉米转录因子ZmbZIP22及其应用 |
CN106957844A (zh) | 2017-04-20 | 2017-07-18 | 华侨大学 | 一种能有效敲除HTLV‑1病毒基因组的CRISPR/Cas9的gRNA序列 |
CA3060630A1 (en) | 2017-04-20 | 2018-10-25 | Egenesis, Inc. | Methods for generating genetically modified animals |
BR112019021719A2 (pt) | 2017-04-21 | 2020-06-16 | The General Hospital Corporation | Variantes de cpf1 (cas12a) com especificidade para pam alterada |
US11773409B2 (en) | 2017-04-21 | 2023-10-03 | The Board Of Trustees Of The Leland Stanford Junior University | CRISPR/Cas 9-mediated integration of polynucleotides by sequential homologous recombination of AAV donor vectors |
EP3615665A1 (en) | 2017-04-24 | 2020-03-04 | DuPont Nutrition Biosciences ApS | Novel anti-crispr genes and proteins and methods of use |
CN107043775B (zh) | 2017-04-24 | 2020-06-16 | 中国农业科学院生物技术研究所 | 一种能促进棉花侧根发育的sgRNA及其应用 |
US20180312822A1 (en) | 2017-04-26 | 2018-11-01 | 10X Genomics, Inc. | Mmlv reverse transcriptase variants |
CN206970581U (zh) | 2017-04-26 | 2018-02-06 | 重庆威斯腾生物医药科技有限责任公司 | 一种用于辅助CRISPR/cas9基因敲除的试剂盒 |
WO2018197020A1 (en) | 2017-04-27 | 2018-11-01 | Novozymes A/S | Genome editing by crispr-cas9 using short donor oligonucleotides |
US20200407737A1 (en) | 2017-05-03 | 2020-12-31 | KWS SAAT SE & Co. KGaA | Use of crispr-cas endonucleases for plant genome engineering |
CN107012174A (zh) | 2017-05-04 | 2017-08-04 | 昆明理工大学 | CRISPR/Cas9技术在获得家蚕锌指蛋白基因突变体中的应用 |
US20200054679A1 (en) | 2017-05-04 | 2020-02-20 | The Trustees Of The University Of Pennsylvania | Compositions and Methods for Gene Editing in T cells using CRISPR/Cpf1 |
CN107254485A (zh) | 2017-05-08 | 2017-10-17 | 南京农业大学 | 一种能够快速构建植物基因定点敲除载体的新反应体系 |
WO2018208755A1 (en) | 2017-05-09 | 2018-11-15 | The Regents Of The University Of California | Compositions and methods for tagging target proteins in proximity to a nucleotide sequence of interest |
CN107129999A (zh) | 2017-05-09 | 2017-09-05 | 福建省农业科学院畜牧兽医研究所 | 利用稳转CRISPR/Cas9系统对病毒基因组进行靶向编辑的方法 |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
CN110869498A (zh) | 2017-05-10 | 2020-03-06 | 加利福尼亚大学董事会 | 经由核递送crispr/cas9导向编辑细胞rna |
CN107130000B (zh) | 2017-05-12 | 2019-12-17 | 浙江卫未生物医药科技有限公司 | 一种同时敲除KRAS基因和EGFR基因的CRISPR-Cas9系统及其应用 |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
CN106939303B (zh) | 2017-05-16 | 2021-02-23 | 上海交通大学 | 一种Cas9核酸酶R919P及其用途 |
CN106987570A (zh) | 2017-05-16 | 2017-07-28 | 上海交通大学 | 一种Cas9核酸酶R780A及其用途 |
CN107012250B (zh) | 2017-05-16 | 2021-01-29 | 上海交通大学 | 一种适用于CRISPR/Cas9系统的基因组DNA片段编辑精准度的分析方法及应用 |
CN106916820B (zh) | 2017-05-16 | 2019-09-27 | 吉林大学 | 能有效编辑猪ROSA26基因的sgRNA及其应用 |
CN106957831B (zh) | 2017-05-16 | 2021-03-12 | 上海交通大学 | 一种Cas9核酸酶K918A及其用途 |
CN106967697B (zh) | 2017-05-16 | 2021-03-26 | 上海交通大学 | 一种Cas9核酸酶G915F及其用途 |
CN106947750B (zh) | 2017-05-16 | 2020-12-08 | 上海交通大学 | 一种Cas9核酸酶Q920P及其用途 |
CN107326042A (zh) | 2017-05-16 | 2017-11-07 | 上海交通大学 | 水稻tms10基因的定点敲除系统及其应用 |
WO2018213351A1 (en) | 2017-05-16 | 2018-11-22 | The Regents Of The University Of California | Thermostable rna-guided endonucleases and methods of use thereof |
CN106957830B (zh) | 2017-05-16 | 2020-12-25 | 上海交通大学 | 一种Cas9核酸酶ΔF916及其用途 |
CN111417727A (zh) | 2017-05-18 | 2020-07-14 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
US20200171068A1 (en) | 2017-05-18 | 2020-06-04 | Children's National Medical Center | Compositions comprising aptamers and nucleic acid payloads and methods of using the same |
US11591620B2 (en) | 2017-05-18 | 2023-02-28 | Cargill, Incorporated | Genome editing system |
EP3625342B1 (en) | 2017-05-18 | 2022-08-24 | The Broad Institute, Inc. | Systems, methods, and compositions for targeted nucleic acid editing |
CN107043787B (zh) | 2017-05-19 | 2017-12-26 | 南京医科大学 | 一种基于CRISPR/Cas9获得MARF1定点突变小鼠模型的构建方法和应用 |
CN107236737A (zh) | 2017-05-19 | 2017-10-10 | 上海交通大学 | 特异靶向拟南芥ILK2基因的sgRNA序列及其应用 |
WO2018217852A1 (en) | 2017-05-23 | 2018-11-29 | Gettysburg College | Crispr based tool for characterizing bacterial serovar diversity |
CN107034188B (zh) | 2017-05-24 | 2018-07-24 | 中山大学附属口腔医院 | 一种靶向骨的外泌体载体、CRISPR/Cas9基因编辑系统及应用 |
EP3630198A4 (en) | 2017-05-25 | 2021-04-21 | The General Hospital Corporation | USE OF CLIVED DESAMINASES TO LIMIT UNWANTED OUT-OF-TARGET DESAMINATION FROM BASE EDITING |
CN107177625B (zh) | 2017-05-26 | 2021-05-25 | 中国农业科学院植物保护研究所 | 一种定点突变的人工载体系统及定点突变方法 |
US20200263186A1 (en) | 2017-05-26 | 2020-08-20 | North Carolina State University | Altered guide rnas for modulating cas9 activity and methods of use |
CN107287245B (zh) | 2017-05-27 | 2020-03-17 | 南京农业大学 | 一种基于CRISPR/Cas9技术的Glrx1基因敲除动物模型的构建方法 |
CN107142272A (zh) | 2017-06-05 | 2017-09-08 | 南京金斯瑞生物科技有限公司 | 一种控制大肠杆菌中质粒复制的方法 |
CN107177595A (zh) | 2017-06-07 | 2017-09-19 | 浙江大学 | 用于猪CD163基因编辑的靶向sgRNA、修饰载体及其制备方法和应用 |
CN107034218A (zh) | 2017-06-07 | 2017-08-11 | 浙江大学 | 用于猪APN基因编辑的靶向sgRNA、修饰载体及其制备方法和应用 |
CN107119071A (zh) | 2017-06-07 | 2017-09-01 | 江苏三黍生物科技有限公司 | 一种降低植物直链淀粉含量的方法及应用 |
CN107236739A (zh) | 2017-06-12 | 2017-10-10 | 上海捷易生物科技有限公司 | CRISPR/SaCas9特异性敲除人CXCR4基因的方法 |
CN106987757A (zh) | 2017-06-12 | 2017-07-28 | 苏州双金实业有限公司 | 一种耐腐蚀型奥氏体镍基合金 |
CN107227352A (zh) | 2017-06-13 | 2017-10-03 | 西安医学院 | 基于eGFP的GPR120基因表达的检测方法及应用 |
CN107083392B (zh) | 2017-06-13 | 2020-09-08 | 中国医学科学院病原生物学研究所 | 一种CRISPR/Cpf1基因编辑系统及其在分枝杆菌中的应用 |
CN107245502B (zh) | 2017-06-14 | 2020-11-03 | 中国科学院武汉病毒研究所 | Cd2结合蛋白(cd2ap)和其相互作用蛋白 |
CN107312798B (zh) | 2017-06-16 | 2020-06-23 | 武汉大学 | 含特异靶向CCR5基因的gRNA序列的CRISPR/Cas9重组慢病毒载体及应用 |
CN107099850B (zh) | 2017-06-19 | 2018-05-04 | 东北农业大学 | 一种通过酶切基因组构建CRISPR/Cas9基因组敲除文库的方法 |
CN107446951B (zh) | 2017-06-20 | 2021-01-08 | 温氏食品集团股份有限公司 | 一种通过CRISPR/Cas9系统快速筛选重组鸡痘病毒的方法及其应用 |
CN107266541B (zh) | 2017-06-20 | 2021-06-04 | 上海大学 | 玉米转录因子ZmbHLH167及其应用 |
CN107058328A (zh) | 2017-06-22 | 2017-08-18 | 江苏三黍生物科技有限公司 | 一种提高植物直链淀粉含量的方法及应用 |
CN107227307A (zh) | 2017-06-23 | 2017-10-03 | 东北农业大学 | 一种特异靶向猪IRS1基因的sgRNA导向序列及其应用 |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
CN107119053A (zh) | 2017-06-23 | 2017-09-01 | 东北农业大学 | 一种特异靶向猪MC4R基因的sgRNA导向序列及其应用 |
CN107099533A (zh) | 2017-06-23 | 2017-08-29 | 东北农业大学 | 一种特异靶向猪IGFBP3基因的sgRNA导向序列及应用 |
US20210093667A1 (en) | 2017-06-26 | 2021-04-01 | The Broad Institute, Inc. | Crispr/cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing |
CN107177631B (zh) | 2017-06-26 | 2020-11-24 | 中国农业大学 | 利用CRISPR-CAS9技术敲除NRK细胞Slc22a2基因的方法 |
US20200248169A1 (en) | 2017-06-26 | 2020-08-06 | The Broad Institute, Inc. | Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing |
CN107217075B (zh) | 2017-06-28 | 2021-07-02 | 西安交通大学医学院第一附属医院 | 一种构建epo基因敲除斑马鱼动物模型的方法及引物、质粒与制备方法 |
CN107356793A (zh) | 2017-07-01 | 2017-11-17 | 合肥东玖电气有限公司 | 一种防火电表箱 |
CN107312793A (zh) | 2017-07-05 | 2017-11-03 | 新疆农业科学院园艺作物研究所 | Cas9介导的番茄基因编辑载体及其应用 |
CN107190006A (zh) | 2017-07-07 | 2017-09-22 | 南通大学附属医院 | 一种靶向IGF‑IR基因的sgRNA及其应用 |
WO2019010384A1 (en) | 2017-07-07 | 2019-01-10 | The Broad Institute, Inc. | METHODS FOR DESIGNING GUIDE SEQUENCES FOR GUIDED NUCLEASES |
CN107354156B (zh) | 2017-07-19 | 2021-02-09 | 广州医科大学附属第五医院 | 一种敲除野生型T细胞TCR beta链的gRNA及方法 |
CN107236741A (zh) | 2017-07-19 | 2017-10-10 | 广州医科大学附属第五医院 | 一种敲除野生型T细胞TCR alpha链的gRNA及方法 |
CN107190008A (zh) | 2017-07-19 | 2017-09-22 | 苏州吉赛基因测序科技有限公司 | 一种基于Crispr/cas9的捕获基因组目标序列的方法及其在高通量测序中的应用 |
CN107400677B (zh) | 2017-07-19 | 2020-05-22 | 江南大学 | 一种基于CRISPR-Cas9系统的地衣芽孢杆菌基因组编辑载体及其制备方法 |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
CN107446954A (zh) | 2017-07-28 | 2017-12-08 | 新乡医学院 | 一种sd大鼠t细胞缺失遗传模型的制备方法 |
CN107418974A (zh) | 2017-07-28 | 2017-12-01 | 新乡医学院 | 一种利用单克隆细胞分选快速获得CRISPR/Cas9基因敲除稳定细胞株的方法 |
CN107267515B (zh) | 2017-07-28 | 2020-08-25 | 重庆医科大学附属儿童医院 | CRISPR/Cas9靶向敲除人CNE10基因及其特异性gRNA |
CN107435051B (zh) | 2017-07-28 | 2020-06-02 | 新乡医学院 | 一种通过CRISPR/Cas9系统快速获得大片段缺失的细胞系基因敲除方法 |
CN107435069A (zh) | 2017-07-28 | 2017-12-05 | 新乡医学院 | 一种细胞系CRISPR/Cas9基因敲除的快速检测方法 |
CN107384922A (zh) | 2017-07-28 | 2017-11-24 | 重庆医科大学附属儿童医院 | CRISPR/Cas9靶向敲除人CNE9基因及其特异性gRNA |
CN107217042B (zh) | 2017-07-31 | 2020-03-06 | 江苏东抗生物医药科技有限公司 | 一种生产无岩藻糖基化蛋白的基因工程细胞系及其建立方法 |
CN107446922A (zh) | 2017-08-03 | 2017-12-08 | 无锡市第二人民医院 | 一种敲除人成骨细胞株中hepcidin基因的gRNA序列及其使用方法 |
CN107502618B (zh) | 2017-08-08 | 2021-03-12 | 中国科学院微生物研究所 | 可控载体消除方法及易用型CRISPR-Cas9工具 |
CN107312785B (zh) | 2017-08-09 | 2019-12-06 | 四川农业大学 | OsKTN80b基因在降低水稻株高方面的应用 |
CN107365804B (zh) | 2017-08-13 | 2019-12-20 | 中国人民解放军疾病预防控制所 | 一种使用温和噬菌体载体包装CRISPR-Cas9系统的方法 |
CN107446923B (zh) | 2017-08-13 | 2019-12-31 | 中国人民解放军疾病预防控制所 | rAAV8-CRISPR-SaCas9系统及在制备乙肝治疗药物中的应用 |
CN107384926B (zh) | 2017-08-13 | 2020-06-26 | 中国人民解放军疾病预防控制所 | 一种靶向清除细菌耐药性质粒的CRISPR-Cas9系统及应用 |
CN107815463A (zh) | 2017-08-15 | 2018-03-20 | 西南大学 | CRISPR/Cas9技术介导miR167前体序列编辑体系的建立方法 |
CN107446924B (zh) | 2017-08-16 | 2020-01-14 | 中国科学院华南植物园 | 一种基于CRISPR-Cas9的猕猴桃基因AcPDS编辑载体及其构建方法和应用 |
CN108034656A (zh) | 2017-08-16 | 2018-05-15 | 四川省农业科学院生物技术核技术研究所 | 与水稻红褐色颖壳性状有关的sgRNA、CRISPR/Cas9载体、载体构建、应用 |
CN107384894B (zh) | 2017-08-21 | 2019-10-22 | 华南师范大学 | 功能化氧化石墨烯高效运载CRISPR/Cas9用于基因编辑的方法 |
CN107299114B (zh) | 2017-08-23 | 2021-08-27 | 中国科学院分子植物科学卓越创新中心 | 一种高效的酵母菌染色体融合方法 |
CN107557393B (zh) | 2017-08-23 | 2020-05-08 | 中国科学院上海应用物理研究所 | 一种磁性纳米材料介导的CRISPR/Cas9 T细胞内递送系统及其制备方法和应用 |
CN107312795A (zh) | 2017-08-24 | 2017-11-03 | 浙江省农业科学院 | 运用CRISPR/Cas9系统创制粉色果实番茄的基因编辑方法 |
CN107488649A (zh) | 2017-08-25 | 2017-12-19 | 南方医科大学 | 一种Cpf1和p300核心结构域的融合蛋白、相应的DNA靶向激活系统和应用 |
CN107460196A (zh) | 2017-08-25 | 2017-12-12 | 同济大学 | 一种免疫缺陷小鼠动物模型的构建方法及应用 |
CN107541525B (zh) | 2017-08-26 | 2021-12-10 | 内蒙古大学 | 一种基于CRISPR/Cas9技术介导山羊Tβ4基因定点敲入的方法 |
CN107446932B (zh) | 2017-08-29 | 2020-02-21 | 江西省农业科学院 | 一个控制水稻雄性生殖发育基因及其应用 |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
CN107519492B (zh) | 2017-09-06 | 2019-01-25 | 武汉迈特维尔生物科技有限公司 | 使用CRISPR技术敲除miR-3187-3p在冠状动脉粥样硬化性心脏病中的应用 |
CN107641631A (zh) | 2017-09-07 | 2018-01-30 | 浙江工业大学 | 一种由化学转化介导的基于CRISPR/Cas9系统敲除大肠杆菌基因的方法 |
CN107362372B (zh) | 2017-09-07 | 2019-01-11 | 佛山波若恩生物科技有限公司 | 使用crispr技术在冠状动脉粥样硬化性心脏病中的应用 |
WO2019051097A1 (en) | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
CN107502608B (zh) | 2017-09-08 | 2020-10-16 | 中山大学 | 用于敲除人ALDH2基因的sgRNA、ALDH2基因缺失细胞株的构建方法及应用 |
CN107557455A (zh) | 2017-09-15 | 2018-01-09 | 国家纳米科学中心 | 一种基于CRISPR‑Cas13a的特异性核酸片段的检测方法 |
WO2019056002A1 (en) | 2017-09-18 | 2019-03-21 | President And Fellows Of Harvard College | CONTINUOUS EVOLUTION FOR STABILIZED PROTEINS |
CN107475300B (zh) | 2017-09-18 | 2020-04-21 | 上海市同济医院 | Ifit3-eKO1基因敲除小鼠动物模型的构建方法和应用 |
CN107557390A (zh) | 2017-09-18 | 2018-01-09 | 江南大学 | 一种筛选cho细胞系高表达位点的方法 |
CN107557378A (zh) | 2017-09-19 | 2018-01-09 | 安徽大学 | 一种基于I型CRISPR‑Cas系统中基因cas7‑3的真核基因编辑方法 |
CN107523583A (zh) | 2017-09-19 | 2017-12-29 | 安徽大学 | 一种源于I型CRISPR‑Cas系统中基因cas5‑3的原核基因编辑方法 |
CN107630042A (zh) | 2017-09-19 | 2018-01-26 | 安徽大学 | 一种源于I型Cas系统4个cas基因的原核生物基因编辑方法 |
CN107630041A (zh) | 2017-09-19 | 2018-01-26 | 安徽大学 | 一种基于维吉尼亚链霉菌IBL14 I‑B型Cas系统的真核基因编辑方法 |
CN107557373A (zh) | 2017-09-19 | 2018-01-09 | 安徽大学 | 一种基于I‑B型CRISPR‑Cas系统基因cas3的基因编辑方法 |
CN107619837A (zh) | 2017-09-20 | 2018-01-23 | 西北农林科技大学 | 利用Cas9切割核酸酶介导Ipr1定点插入获取转基因牛胎儿成纤维细胞的方法 |
CN107513531B (zh) | 2017-09-21 | 2020-02-21 | 无锡市妇幼保健院 | 用于内源性过表达lncRNA-XIST的gRNA靶点序列及其应用 |
CN107686848A (zh) | 2017-09-26 | 2018-02-13 | 中山大学孙逸仙纪念医院 | 转座子协同CRISPR/Cas9系统的稳定敲除单质粒载体及其应用 |
CN107557394A (zh) | 2017-09-29 | 2018-01-09 | 南京鼓楼医院 | 降低CRISPR/Cas9介导的胚胎基因编辑脱靶率的方法 |
CN107760652A (zh) | 2017-09-29 | 2018-03-06 | 华南理工大学 | CRISPR/CAS9介导药物转运体靶向性敲除的caco‑2细胞模型及其方法 |
CN107630006B (zh) | 2017-09-30 | 2020-09-11 | 山东兴瑞生物科技有限公司 | 一种制备tcr与hla双基因敲除的t细胞的方法 |
CN107828794A (zh) | 2017-09-30 | 2018-03-23 | 上海市农业生物基因中心 | 一种水稻耐盐基因OsRR22突变体、其编码的氨基酸序列、植株及该突变体的创制方法 |
CN107760663A (zh) | 2017-09-30 | 2018-03-06 | 新疆大学 | 油莎草pepc基因的克隆及表达载体的构建和应用 |
CN107604003A (zh) | 2017-10-10 | 2018-01-19 | 南方医科大学 | 一种基于线性化crispr‑cas9慢病毒载体基因敲除试剂盒及其应用 |
CN108102940B (zh) | 2017-10-12 | 2021-07-13 | 中石化上海工程有限公司 | 一株利用CRISPR/Cas9系统敲除XKS1基因的工业酿酒酵母菌株及构建方法 |
CN107557381A (zh) | 2017-10-12 | 2018-01-09 | 南京农业大学 | 一种白菜CRISPR‑Cas9基因编辑体系的建立及其应用 |
CN107474129B (zh) | 2017-10-12 | 2018-10-19 | 江西汉氏联合干细胞科技有限公司 | 特异性增强crispr-cas系统基因编辑效率的方法 |
CN108103586A (zh) | 2017-10-13 | 2018-06-01 | 上海科技大学 | 一种CRISPR/Cas9随机文库及其构建和应用 |
CN107619829B (zh) | 2017-10-14 | 2018-08-24 | 南京平港生物技术有限公司 | 使用crispr-cas系统对间充质干细胞进行gins2基因敲除的方法 |
CN107586779B (zh) | 2017-10-14 | 2018-08-28 | 天津金匙生物科技有限公司 | 使用crispr-cas系统对间充质干细胞进行casp3基因敲除的方法 |
CN107523567A (zh) | 2017-10-16 | 2017-12-29 | 遵义医学院 | 一种敲除人ezrin基因增强子的食管癌细胞株的构建方法 |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
CN107760715B (zh) | 2017-10-17 | 2021-12-10 | 张业胜 | 一种转基因载体及其构建方法和应用 |
CN107937427A (zh) | 2017-10-20 | 2018-04-20 | 广东石油化工学院 | 一种基于CRISPR/Cas9体系的同源修复载体构建方法 |
EP3701025A4 (en) | 2017-10-23 | 2021-07-28 | The Broad Institute, Inc. | SYSTEMS, PROCEDURES AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITING |
CN107893086B (zh) | 2017-10-24 | 2021-09-03 | 中国科学院武汉植物园 | 快速构建配对sgRNA的Cas9双元表达载体文库的方法 |
CN107760684B (zh) | 2017-11-03 | 2018-09-25 | 上海拉德钫斯生物科技有限公司 | 使用crispr-cas系统对间充质干细胞进行rbm17基因敲除的方法 |
CN107858346B (zh) | 2017-11-06 | 2020-06-16 | 天津大学 | 一种敲除酿酒酵母染色体的方法 |
CN107794276A (zh) | 2017-11-08 | 2018-03-13 | 中国农业科学院作物科学研究所 | 一种crispr介导快速有效的农作物定点基因片段或等位基因替换方法和体系 |
CN107630043A (zh) | 2017-11-14 | 2018-01-26 | 吉林大学 | 采用敲除技术建立Gadd45a敲除兔模型的方法 |
CN108441519A (zh) | 2017-11-15 | 2018-08-24 | 中国农业大学 | 在crispr/cas9基因编辑中提高同源修复效率的方法 |
CN107858373B (zh) | 2017-11-16 | 2020-03-17 | 山东省千佛山医院 | 内皮细胞条件性敲除ccr5基因小鼠模型的构建方法 |
CN107893075A (zh) | 2017-11-17 | 2018-04-10 | 和元生物技术(上海)股份有限公司 | CRISPR‑Cas9靶向敲除人肠癌细胞RITA基因及其特异性的sgRNA |
CN108192956B (zh) | 2017-11-17 | 2021-06-01 | 东南大学 | 一种基于Cas9核酸酶的DNA检测分析方法及其应用 |
CN107828874B (zh) | 2017-11-20 | 2020-10-16 | 东南大学 | 一种基于crispr的dna检测和分型方法及其应用 |
CN107904261A (zh) | 2017-11-21 | 2018-04-13 | 福州大学 | CRISPR/Cas9纳米基因系统的制备及其在转染方面的应用 |
CN107653256A (zh) | 2017-11-21 | 2018-02-02 | 云南省烟草农业科学研究院 | 一种烟草多酚氧化酶基因NtPPO1及其定点突变方法与应用 |
CN107893076A (zh) | 2017-11-23 | 2018-04-10 | 和元生物技术(上海)股份有限公司 | CRISPR‑Cas9靶向敲除人乳腺癌细胞RASSF2基因及其特异性的sgRNA |
CN107937501A (zh) | 2017-11-24 | 2018-04-20 | 安徽师范大学 | 一种快速简便的筛选CRISPR/Cas基因编辑阳性对象的方法 |
CN107937432B (zh) | 2017-11-24 | 2020-05-01 | 华中农业大学 | 一种基于crispr系统的基因组编辑方法及其应用 |
CN107828738A (zh) | 2017-11-28 | 2018-03-23 | 新乡医学院 | 一种dna甲基转移酶缺陷型cho细胞系及其制备方法及应用 |
CN107988256B (zh) | 2017-12-01 | 2020-07-28 | 暨南大学 | 人亨廷顿基因敲入用重组载体及其构建方法和在模型猪构建中的应用 |
CN108570479B (zh) | 2017-12-06 | 2020-04-03 | 内蒙古大学 | 一种基于CRISPR/Cas9技术介导绒山羊VEGF基因定点敲入的方法 |
CN108148873A (zh) | 2017-12-06 | 2018-06-12 | 南方医科大学 | 一种cav-1基因缺失斑马鱼及其制备方法 |
CN108251423B (zh) | 2017-12-07 | 2020-11-06 | 嘉兴市第一医院 | CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及激活方法和应用 |
CN108315330B (zh) | 2017-12-07 | 2020-05-19 | 嘉兴市第一医院 | CRISPR-Cas9系统特异性靶向人RSPO2基因的sgRNA及敲除方法和应用 |
CN107974466B (zh) | 2017-12-07 | 2020-09-29 | 中国科学院水生生物研究所 | 一种鲟鱼CRISPR/Cas9基因编辑方法 |
CN108148835A (zh) | 2017-12-07 | 2018-06-12 | 和元生物技术(上海)股份有限公司 | CRISPR-Cas9靶向敲除SLC30A1基因及其特异性的sgRNA |
CN107828826A (zh) | 2017-12-12 | 2018-03-23 | 南开大学 | 一种体外高效获得神经干细胞的方法 |
CN108103098B (zh) | 2017-12-14 | 2020-07-28 | 华南理工大学 | 一种化合物皮肤致敏体外评估细胞模型及其构建方法 |
EP3724214A4 (en) | 2017-12-15 | 2021-09-01 | The Broad Institute Inc. | SYSTEMS AND PROCEDURES FOR PREDICTING REPAIR RESULTS IN GENE ENGINEERING |
CN107988268A (zh) | 2017-12-18 | 2018-05-04 | 湖南师范大学 | 一种基因敲除选育tcf25基因缺失型斑马鱼的方法 |
CN108018316A (zh) | 2017-12-20 | 2018-05-11 | 湖南师范大学 | 一种基因敲除选育rmnd5b基因缺失型斑马鱼的方法 |
CN108048466B (zh) | 2017-12-21 | 2020-02-07 | 嘉兴市第一医院 | CRISPR-Cas13a系统特异性靶向人RSPO2基因的crRNA及系统和应用 |
EP3728595A1 (en) | 2017-12-21 | 2020-10-28 | CRISPR Therapeutics AG | Materials and methods for treatment of usher syndrome type 2a and/or non-syndromic autosomal recessive retinitis pigmentosa (arrp) |
RU2652899C1 (ru) | 2017-12-28 | 2018-05-03 | Федеральное бюджетное учреждение науки "Центральный научно-исследовательский институт эпидемиологии" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека (ФБУН ЦНИИ Эпидемиологии Роспотребнадзора) | РНК-проводники для подавления репликации вируса гепатита B и для элиминации вируса гепатита B из клетки-хозяина |
CN107893080A (zh) | 2017-12-29 | 2018-04-10 | 江苏省农业科学院 | 一种靶向大鼠Inhba基因的sgRNA及其应用 |
CN107988229B (zh) | 2018-01-05 | 2020-01-07 | 中国农业科学院作物科学研究所 | 一种利用CRISPR-Cas修饰OsTAC1基因获得分蘖改变的水稻的方法 |
CN107988246A (zh) | 2018-01-05 | 2018-05-04 | 汕头大学医学院 | 一种基因敲除载体及其斑马鱼胶质瘤模型 |
CN108103092B (zh) | 2018-01-05 | 2021-02-12 | 中国农业科学院作物科学研究所 | 利用CRISPR-Cas系统修饰OsHPH基因获得矮化水稻的系统及其应用 |
CN108559760A (zh) | 2018-01-09 | 2018-09-21 | 陕西师范大学 | 基于CRISPR靶向基因组修饰技术建立荧光素酶knock-in细胞系的方法 |
WO2019139951A1 (en) | 2018-01-09 | 2019-07-18 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Detecting protein interaction sites in nucleic acids |
CN108559730B (zh) | 2018-01-12 | 2021-09-24 | 中国人民解放军第四军医大学 | 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法 |
CN108148837A (zh) | 2018-01-12 | 2018-06-12 | 南京医科大学 | ApoE-CRISPR/Cas9载体及其在敲除ApoE基因中的应用 |
CN108251451A (zh) | 2018-01-16 | 2018-07-06 | 西南大学 | HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及其应用 |
CN108251452A (zh) | 2018-01-17 | 2018-07-06 | 扬州大学 | 一种表达Cas9基因的转基因斑马鱼及其构建方法和应用 |
EP3744844A4 (en) | 2018-01-23 | 2021-10-20 | Institute for Basic Science | EXTENDED SINGLE GUIDE RNA AND ITS USES |
CN108359712B (zh) | 2018-02-09 | 2020-06-26 | 广东省农业科学院农业生物基因研究中心 | 一种快速高效筛选SgRNA靶向DNA序列的方法 |
CN108559745A (zh) | 2018-02-10 | 2018-09-21 | 和元生物技术(上海)股份有限公司 | 基于CRISPR-Cas9技术提高B16F10细胞转染效率的方法 |
CN108486145A (zh) | 2018-02-12 | 2018-09-04 | 中国科学院遗传与发育生物学研究所 | 基于CRISPR/Cas9的植物高效同源重组方法 |
CN108359691B (zh) | 2018-02-12 | 2021-09-28 | 中国科学院重庆绿色智能技术研究院 | 利用mito-CRISPR/Cas9系统敲除异常线粒体DNA的试剂盒及方法 |
CN109021111B (zh) | 2018-02-23 | 2021-12-07 | 上海科技大学 | 一种基因碱基编辑器 |
CN108396027A (zh) | 2018-02-27 | 2018-08-14 | 和元生物技术(上海)股份有限公司 | CRISPR-Cas9靶向敲除人肠癌细胞DEAF1基因及其特异性的sgRNA |
CN108486159B (zh) | 2018-03-01 | 2021-10-22 | 南通大学附属医院 | 一种敲除GRIN2D基因的CRISPR-Cas9系统及其应用 |
CN108410906A (zh) | 2018-03-05 | 2018-08-17 | 淮海工学院 | 一种适用于海洋甲壳类线粒体基因组的CRISPR/Cpf1基因编辑方法 |
CN108342480B (zh) | 2018-03-05 | 2022-03-01 | 北京医院 | 一种基因变异检测质控物及其制备方法 |
CN108410907B (zh) | 2018-03-08 | 2021-08-27 | 湖南农业大学 | 一种基于CRISPR/Cas9技术实现HMGCR基因敲除的方法 |
CN108410911B (zh) | 2018-03-09 | 2021-08-20 | 广西医科大学 | 基于CRISPR/Cas9技术构建的LMNA基因敲除的细胞系 |
CN108486108B (zh) | 2018-03-16 | 2020-10-09 | 华南农业大学 | 一种敲除人hmgb1基因的细胞株及其应用 |
CN108486146B (zh) | 2018-03-16 | 2021-02-19 | 中国农业科学院作物科学研究所 | LbCpf1-RR突变体用于CRISPR/Cpf1系统在植物基因编辑中的应用 |
CN108384784A (zh) | 2018-03-23 | 2018-08-10 | 广西医科大学 | 一种利用CRISPR/Cas9技术敲除Endoglin基因的方法 |
CN108504685A (zh) | 2018-03-27 | 2018-09-07 | 宜明细胞生物科技有限公司 | 一种利用CRISPR/Cas9系统同源重组修复IL-2RG缺陷基因的方法 |
CN108410877A (zh) | 2018-03-27 | 2018-08-17 | 和元生物技术(上海)股份有限公司 | CRISPR-Cas9靶向敲除人细胞SANIL1基因及其特异性的sgRNA |
CN108486234B (zh) | 2018-03-29 | 2022-02-11 | 东南大学 | 一种crispr分型pcr的方法及其应用 |
CN108424931A (zh) | 2018-03-29 | 2018-08-21 | 内蒙古大学 | CRISPR/Cas9技术介导山羊VEGF基因定点整合的方法 |
CN108441520B (zh) | 2018-04-04 | 2020-07-31 | 苏州大学 | 利用CRISPR/Cas9系统构建的基因条件性敲除方法 |
CN108753772B (zh) | 2018-04-04 | 2020-10-30 | 南华大学 | 基于CRISPR/Cas技术敲除CAPNS1基因的人神经母细胞瘤细胞系的构建方法 |
CN108486154A (zh) | 2018-04-04 | 2018-09-04 | 福州大学 | 一种唾液酸酶基因敲除小鼠模型的构建方法及其应用 |
CN108504693A (zh) | 2018-04-04 | 2018-09-07 | 首都医科大学附属北京朝阳医院 | 利用Crispr技术敲除T合酶基因构建的O-型糖基化异常的结肠癌细胞系 |
CN108486111A (zh) | 2018-04-04 | 2018-09-04 | 山西医科大学 | CRISPR-Cas9靶向敲除人SMYD3基因的方法及其特异性sgRNA |
CN108504657B (zh) | 2018-04-12 | 2019-06-14 | 中南民族大学 | 利用crispr-cas9技术敲除hek293t细胞kdm2a基因的方法 |
CN108588182A (zh) | 2018-04-13 | 2018-09-28 | 中国科学院深圳先进技术研究院 | 基于crispr-链取代的等温扩增及检测技术 |
CN108753817A (zh) | 2018-04-13 | 2018-11-06 | 北京华伟康信生物科技有限公司 | 增强细胞的抗癌能力的方法及采用该方法获得的增强型细胞 |
CN108823248A (zh) | 2018-04-20 | 2018-11-16 | 中山大学 | 一种利用CRISPR/Cas9编辑陆川猪CD163基因的方法 |
CN108753832A (zh) | 2018-04-20 | 2018-11-06 | 中山大学 | 一种利用CRISPR/Cas9编辑大白猪CD163基因的方法 |
CN108588071A (zh) | 2018-04-25 | 2018-09-28 | 和元生物技术(上海)股份有限公司 | CRISPR-Cas9靶向敲除人肠癌细胞CNR1基因及其特异性的sgRNA |
CN108588128A (zh) | 2018-04-26 | 2018-09-28 | 南昌大学 | 一种高效率大豆CRISPR/Cas9系统的构建方法及应用 |
CN108546712B (zh) | 2018-04-26 | 2020-08-07 | 中国农业科学院作物科学研究所 | 一种利用CRISPR/LbCpf1系统实现目的基因在植物中同源重组的方法 |
CN108707621B (zh) | 2018-04-26 | 2021-02-12 | 中国农业科学院作物科学研究所 | 一种CRISPR/Cpf1系统介导的以RNA转录本为修复模板的同源重组方法 |
CN108642053A (zh) | 2018-04-28 | 2018-10-12 | 和元生物技术(上海)股份有限公司 | CRISPR-Cas9靶向敲除人肠癌细胞PPP1R1C基因及其特异性的sgRNA |
CN108611364A (zh) | 2018-05-03 | 2018-10-02 | 南京农业大学 | 一种非转基因crispr突变体的制备方法 |
CN108588123A (zh) | 2018-05-07 | 2018-09-28 | 南京医科大学 | CRISPR/Cas9载体组合在制备基因敲除猪的血液制品中的应用 |
CN108610399B (zh) | 2018-05-14 | 2019-09-27 | 河北万玛生物医药有限公司 | 特异性增强crispr-cas系统在表皮干细胞中进行基因编辑效率的方法 |
CN108546717A (zh) | 2018-05-15 | 2018-09-18 | 吉林大学 | 反义lncRNA介导顺式调控抑制靶基因表达的方法 |
CN108624622A (zh) | 2018-05-16 | 2018-10-09 | 湖南艾佳生物科技股份有限公司 | 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株 |
CN108546718B (zh) | 2018-05-16 | 2021-07-09 | 康春生 | crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用 |
CN108642055B (zh) | 2018-05-17 | 2021-12-03 | 吉林大学 | 能有效编辑猪miR-17-92基因簇的sgRNA |
CN108642078A (zh) | 2018-05-18 | 2018-10-12 | 江苏省农业科学院 | 基于CRISPR/Cas9基因编辑技术选育绿豆开花传粉突变体的方法及专用gRNA |
CN108642090A (zh) | 2018-05-18 | 2018-10-12 | 中国人民解放军总医院 | 基于CRISPR/Cas9技术获得Nogo-B敲除模式小鼠的方法及应用 |
CN108642077A (zh) | 2018-05-18 | 2018-10-12 | 江苏省农业科学院 | 基于CRISPR/Cas9基因编辑技术选育绿豆不育突变体的方法及专用gRNA |
CN108559732A (zh) | 2018-05-21 | 2018-09-21 | 陕西师范大学 | 基于CRISPR/Cas9靶向基因组修饰技术建立KI-T2A-luciferase细胞系的方法 |
CN108707620A (zh) | 2018-05-22 | 2018-10-26 | 西北农林科技大学 | 一种Gene drive载体及构建方法 |
US20210198330A1 (en) | 2018-05-23 | 2021-07-01 | The Broad Institute, Inc. | Base editors and uses thereof |
CN108690844B (zh) | 2018-05-25 | 2021-10-15 | 西南大学 | HTT的CRISPR/Cas9-gRNA打靶序列对、质粒及HD细胞模型 |
CN108707629A (zh) | 2018-05-28 | 2018-10-26 | 上海海洋大学 | 斑马鱼notch1b基因突变体的制备方法 |
CN108823249A (zh) | 2018-05-28 | 2018-11-16 | 上海海洋大学 | CRISPR/Cas9构建notch1a突变体斑马鱼的方法 |
CN108707628B (zh) | 2018-05-28 | 2021-11-23 | 上海海洋大学 | 斑马鱼notch2基因突变体的制备方法 |
CN108707604B (zh) | 2018-05-30 | 2019-07-23 | 江西汉氏联合干细胞科技有限公司 | 表皮干细胞中采用CRISPR-Cas系统进行CNE10基因敲除 |
CN108753835A (zh) | 2018-05-30 | 2018-11-06 | 中山大学 | 一种利用CRISPR/Cas9编辑猪BMP15基因的方法 |
CN108753836B (zh) | 2018-06-04 | 2021-10-12 | 北京大学 | 一种利用rna干扰机制的基因调控或编辑系统 |
AU2019282149A1 (en) | 2018-06-05 | 2021-01-21 | LifeEDIT Therapeutics, Inc. | RNA-guided nucleases and active fragments and variants thereof and methods of use |
CN108715850B (zh) | 2018-06-05 | 2020-10-23 | 艾一生命科技(广东)有限公司 | 表皮干细胞中采用CRISPR-Cas系统进行GING2基因敲除 |
CN108753813B (zh) | 2018-06-08 | 2021-08-24 | 中国水稻研究所 | 获得无标记转基因植物的方法 |
CN108753783A (zh) | 2018-06-13 | 2018-11-06 | 上海市同济医院 | Sqstm1全基因敲除小鼠动物模型的构建方法和应用 |
CN108728486A (zh) | 2018-06-20 | 2018-11-02 | 江苏省农业科学院 | 一种茄子CRISPR/Cas9基因敲除载体的构建方法和应用 |
CN108841845A (zh) | 2018-06-21 | 2018-11-20 | 广东石油化工学院 | 一种带有筛选标记的CRISPR/Cas9载体及其构建方法 |
CN108893529A (zh) | 2018-06-25 | 2018-11-27 | 武汉博杰生物医学科技有限公司 | 一种基于CRISPR技术特异性检测人KRAS基因2号及3号外显子突变的crRNA |
CN108866093B (zh) | 2018-07-04 | 2021-07-09 | 广东三杰牧草生物科技有限公司 | 一种利用CRISPR/Cas9系统对紫花苜蓿基因定点突变的方法 |
CN108795902A (zh) | 2018-07-05 | 2018-11-13 | 深圳三智医学科技有限公司 | 一种安全高效的CRISPR/Cas9基因编辑技术 |
CN108913714A (zh) | 2018-07-05 | 2018-11-30 | 江西省超级水稻研究发展中心 | 一种利用CRISPR/Cas9系统敲除BADH2基因创制香稻的方法 |
US20220033785A1 (en) | 2018-07-09 | 2022-02-03 | The Broad Institute, Inc. | Rna programmable epigenetic rna modifiers and uses thereof |
CN108913691B (zh) | 2018-07-16 | 2020-09-01 | 山东华御生物科技有限公司 | 表皮干细胞中采用CRISPR-Cas系统进行Card3基因敲除 |
CN108913664B (zh) | 2018-07-20 | 2020-09-04 | 嘉兴学院 | 一种CRISPR/Cas9基因编辑方法敲除卵巢癌细胞中CFP1基因的方法 |
CN108823291B (zh) | 2018-07-25 | 2022-04-12 | 领航医学科技(深圳)有限公司 | 基于crispr技术的特异性核酸片段定量检测方法 |
CN108853133A (zh) | 2018-07-25 | 2018-11-23 | 福州大学 | 一种PAMAM与CRISPR/Cas9系统重组质粒递送纳米粒的制备方法 |
KR20210053898A (ko) | 2018-07-31 | 2021-05-12 | 더 브로드 인스티튜트, 인코퍼레이티드 | 신규 crispr 효소 및 시스템 |
CN108913717A (zh) | 2018-08-01 | 2018-11-30 | 河南农业大学 | 一种利用CRISPR/Cas9系统对水稻PHYB基因定点突变的方法 |
EP3841203A4 (en) | 2018-08-23 | 2022-11-02 | The Broad Institute Inc. | CAS9 VARIANTS WITH NON-CANONICAL PAM SPECIFICITIES AND USES OF THEM |
AU2019327449A1 (en) | 2018-08-28 | 2021-03-11 | Flagship Pioneering Innovations Vi, Llc | Methods and compositions for modulating a genome |
WO2020051360A1 (en) | 2018-09-05 | 2020-03-12 | The Broad Institute, Inc. | Base editing for treating hutchinson-gilford progeria syndrome |
US20220380740A1 (en) | 2018-10-24 | 2022-12-01 | The Broad Institute, Inc. | Constructs for improved hdr-dependent genomic editing |
WO2020092453A1 (en) | 2018-10-29 | 2020-05-07 | The Broad Institute, Inc. | Nucleobase editors comprising geocas9 and uses thereof |
WO2020102659A1 (en) | 2018-11-15 | 2020-05-22 | The Broad Institute, Inc. | G-to-t base editors and uses thereof |
CN109517841B (zh) | 2018-12-05 | 2020-10-30 | 华东师范大学 | 一种用于核苷酸序列修饰的组合物、方法与应用 |
WO2020154500A1 (en) | 2019-01-23 | 2020-07-30 | The Broad Institute, Inc. | Supernegatively charged proteins and uses thereof |
US20220170013A1 (en) | 2019-03-06 | 2022-06-02 | The Broad Institute, Inc. | T:a to a:t base editing through adenosine methylation |
WO2020181180A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | A:t to c:g base editors and uses thereof |
WO2020181195A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | T:a to a:t base editing through adenine excision |
WO2020181178A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | T:a to a:t base editing through thymine alkylation |
WO2020181202A1 (en) | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | A:t to t:a base editing through adenine deamination and oxidation |
SG11202109882VA (en) | 2019-03-19 | 2021-10-28 | Broad Inst Inc | Methods and compositions for editing nucleotide sequences |
US20220204975A1 (en) | 2019-04-12 | 2022-06-30 | President And Fellows Of Harvard College | System for genome editing |
US20220307003A1 (en) | 2019-04-17 | 2022-09-29 | The Broad Institute, Inc. | Adenine base editors with reduced off-target effects |
-
2018
- 2018-03-23 IL IL269458A patent/IL269458B2/en unknown
- 2018-03-23 US US15/934,945 patent/US11268082B2/en active Active
- 2018-03-23 KR KR1020197031141A patent/KR20190130613A/ko active IP Right Grant
- 2018-03-23 JP JP2019552463A patent/JP7191388B2/ja active Active
- 2018-03-23 CN CN201880033446.0A patent/CN110914426A/zh active Pending
- 2018-03-23 AU AU2018240571A patent/AU2018240571A1/en active Pending
- 2018-03-23 IL IL306092A patent/IL306092A/en unknown
- 2018-03-23 SG SG11201908658T patent/SG11201908658TA/en unknown
- 2018-03-23 WO PCT/US2018/024208 patent/WO2018176009A1/en active Application Filing
- 2018-03-23 BR BR112019019655A patent/BR112019019655A2/pt unknown
- 2018-03-23 CA CA3057192A patent/CA3057192A1/en active Pending
- 2018-03-23 EP EP18719341.2A patent/EP3601562A1/en active Pending
- 2018-03-23 GB GB1915338.6A patent/GB2575930A/en not_active Withdrawn
-
2019
- 2019-09-23 CL CL2019002679A patent/CL2019002679A1/es unknown
-
2020
- 2020-07-17 CL CL2020001894A patent/CL2020001894A1/es unknown
-
2022
- 2022-11-30 JP JP2022191651A patent/JP2023029926A/ja active Pending
- 2022-12-15 US US18/066,878 patent/US20230348883A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023008887A1 (ko) * | 2021-07-26 | 2023-02-02 | 서울대학교산학협력단 | 염기 편집기 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
EP3601562A1 (en) | 2020-02-05 |
US20230348883A1 (en) | 2023-11-02 |
IL269458B1 (en) | 2023-10-01 |
BR112019019655A2 (pt) | 2020-04-22 |
US11268082B2 (en) | 2022-03-08 |
GB201915338D0 (en) | 2019-12-04 |
IL306092A (en) | 2023-11-01 |
CL2019002679A1 (es) | 2020-03-20 |
AU2018240571A1 (en) | 2019-10-17 |
US20180312828A1 (en) | 2018-11-01 |
GB2575930A (en) | 2020-01-29 |
JP2023029926A (ja) | 2023-03-07 |
CN110914426A (zh) | 2020-03-24 |
JP7191388B2 (ja) | 2022-12-19 |
CL2020001894A1 (es) | 2020-10-23 |
IL269458A (en) | 2019-11-28 |
JP2020511970A (ja) | 2020-04-23 |
IL269458B2 (en) | 2024-02-01 |
CA3057192A1 (en) | 2018-09-27 |
WO2018176009A1 (en) | 2018-09-27 |
SG11201908658TA (en) | 2019-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7191388B2 (ja) | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 | |
US20220220462A1 (en) | Nucleobase editors and uses thereof | |
US11932884B2 (en) | High efficiency base editors comprising Gam | |
US11124782B2 (en) | Cas variants for gene editing | |
JP2023113627A (ja) | シトシンからグアニンへの塩基編集因子 | |
CA2956224A1 (en) | Cas9 proteins including ligand-dependent inteins | |
US20230002746A1 (en) | Base-editing systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
AMND | Amendment | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) |