KR20230156150A - 제vi형 crispr 오솔로그 및 시스템 - Google Patents
제vi형 crispr 오솔로그 및 시스템 Download PDFInfo
- Publication number
- KR20230156150A KR20230156150A KR1020237037115A KR20237037115A KR20230156150A KR 20230156150 A KR20230156150 A KR 20230156150A KR 1020237037115 A KR1020237037115 A KR 1020237037115A KR 20237037115 A KR20237037115 A KR 20237037115A KR 20230156150 A KR20230156150 A KR 20230156150A
- Authority
- KR
- South Korea
- Prior art keywords
- rna
- target
- protein
- cell
- sequence
- Prior art date
Links
- 108091033409 CRISPR Proteins 0.000 title abstract description 11
- 108090000623 proteins and genes Proteins 0.000 abstract description 492
- 102000004169 proteins and genes Human genes 0.000 abstract description 408
- 239000012636 effector Substances 0.000 abstract description 317
- 238000000034 method Methods 0.000 abstract description 226
- 239000000203 mixture Substances 0.000 abstract description 190
- 150000007523 nucleic acids Chemical class 0.000 abstract description 146
- 230000008685 targeting Effects 0.000 abstract description 146
- 102000039446 nucleic acids Human genes 0.000 abstract description 140
- 108020004707 nucleic acids Proteins 0.000 abstract description 140
- 108020005004 Guide RNA Proteins 0.000 abstract description 64
- 238000010354 CRISPR gene editing Methods 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 401
- 108091030071 RNAI Proteins 0.000 description 340
- 230000009368 gene silencing by RNA Effects 0.000 description 340
- 210000004027 cell Anatomy 0.000 description 260
- 239000013598 vector Substances 0.000 description 117
- 238000000338 in vitro Methods 0.000 description 106
- 238000003197 gene knockdown Methods 0.000 description 103
- 238000001727 in vivo Methods 0.000 description 96
- 230000000694 effects Effects 0.000 description 91
- 230000014509 gene expression Effects 0.000 description 87
- 108020004999 messenger RNA Proteins 0.000 description 78
- 239000000047 product Substances 0.000 description 74
- 108091079001 CRISPR RNA Proteins 0.000 description 65
- 238000003776 cleavage reaction Methods 0.000 description 63
- 230000007017 scission Effects 0.000 description 62
- 230000006698 induction Effects 0.000 description 54
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 52
- 230000035772 mutation Effects 0.000 description 52
- 102000040430 polynucleotide Human genes 0.000 description 49
- 108091033319 polynucleotide Proteins 0.000 description 49
- 239000002157 polynucleotide Substances 0.000 description 49
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 47
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 47
- 101000860104 Leptotrichia wadei (strain F0279) CRISPR-associated endoribonuclease Cas13a Proteins 0.000 description 47
- 230000014616 translation Effects 0.000 description 47
- 108010066154 Nuclear Export Signals Proteins 0.000 description 46
- 230000001939 inductive effect Effects 0.000 description 46
- 102000004190 Enzymes Human genes 0.000 description 44
- 108090000790 Enzymes Proteins 0.000 description 44
- 229940088598 enzyme Drugs 0.000 description 44
- 239000002773 nucleotide Substances 0.000 description 42
- 125000003729 nucleotide group Chemical group 0.000 description 42
- 125000006850 spacer group Chemical group 0.000 description 42
- 230000027455 binding Effects 0.000 description 41
- 238000013519 translation Methods 0.000 description 41
- 238000009739 binding Methods 0.000 description 40
- 230000001105 regulatory effect Effects 0.000 description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 description 35
- 230000004807 localization Effects 0.000 description 35
- 108060001084 Luciferase Proteins 0.000 description 34
- 239000005089 Luciferase Substances 0.000 description 34
- 230000004048 modification Effects 0.000 description 33
- 238000012986 modification Methods 0.000 description 33
- 239000004055 small Interfering RNA Substances 0.000 description 32
- 241001453171 Leptotrichia Species 0.000 description 31
- 238000001514 detection method Methods 0.000 description 30
- 108020004414 DNA Proteins 0.000 description 29
- 210000003527 eukaryotic cell Anatomy 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 28
- 108020004705 Codon Proteins 0.000 description 27
- 230000006870 function Effects 0.000 description 27
- 238000011282 treatment Methods 0.000 description 26
- 108091027967 Small hairpin RNA Proteins 0.000 description 25
- 125000000539 amino acid group Chemical group 0.000 description 25
- 241000196324 Embryophyta Species 0.000 description 24
- 235000001014 amino acid Nutrition 0.000 description 24
- 230000004927 fusion Effects 0.000 description 24
- 210000004962 mammalian cell Anatomy 0.000 description 24
- -1 use Substances 0.000 description 24
- 230000035897 transcription Effects 0.000 description 23
- 238000013518 transcription Methods 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 22
- 239000003446 ligand Substances 0.000 description 22
- 108091092562 ribozyme Proteins 0.000 description 21
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 20
- 101000611202 Homo sapiens Peptidyl-prolyl cis-trans isomerase B Proteins 0.000 description 20
- 102100040283 Peptidyl-prolyl cis-trans isomerase B Human genes 0.000 description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 20
- 238000012216 screening Methods 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 19
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 18
- 201000010099 disease Diseases 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 230000001413 cellular effect Effects 0.000 description 17
- 239000008187 granular material Substances 0.000 description 17
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 239000000523 sample Substances 0.000 description 17
- 230000035882 stress Effects 0.000 description 17
- 108700011259 MicroRNAs Proteins 0.000 description 16
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 15
- 230000033228 biological regulation Effects 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 229920001184 polypeptide Polymers 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 239000013603 viral vector Substances 0.000 description 15
- 108010085238 Actins Proteins 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 14
- 206010028980 Neoplasm Diseases 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 230000015556 catabolic process Effects 0.000 description 14
- 230000006378 damage Effects 0.000 description 14
- 238000006731 degradation reaction Methods 0.000 description 14
- 238000003384 imaging method Methods 0.000 description 14
- 238000004519 manufacturing process Methods 0.000 description 14
- 231100000350 mutagenesis Toxicity 0.000 description 14
- 238000002703 mutagenesis Methods 0.000 description 14
- 210000004940 nucleus Anatomy 0.000 description 14
- 241000186781 Listeria Species 0.000 description 13
- 230000007022 RNA scission Effects 0.000 description 13
- 238000003559 RNA-seq method Methods 0.000 description 13
- 230000003197 catalytic effect Effects 0.000 description 13
- 238000013461 design Methods 0.000 description 13
- 239000002679 microRNA Substances 0.000 description 13
- 230000009467 reduction Effects 0.000 description 13
- 230000000087 stabilizing effect Effects 0.000 description 13
- 101710159080 Aconitate hydratase A Proteins 0.000 description 12
- 101710159078 Aconitate hydratase B Proteins 0.000 description 12
- 108090000994 Catalytic RNA Proteins 0.000 description 12
- 102000053642 Catalytic RNA Human genes 0.000 description 12
- 241000124008 Mammalia Species 0.000 description 12
- 101710105008 RNA-binding protein Proteins 0.000 description 12
- 230000003466 anti-cipated effect Effects 0.000 description 12
- 230000010261 cell growth Effects 0.000 description 12
- 230000005059 dormancy Effects 0.000 description 12
- 102000042567 non-coding RNA Human genes 0.000 description 12
- 108091027963 non-coding RNA Proteins 0.000 description 12
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 11
- 108020004422 Riboswitch Proteins 0.000 description 11
- 201000011510 cancer Diseases 0.000 description 11
- 230000030833 cell death Effects 0.000 description 11
- 210000000805 cytoplasm Anatomy 0.000 description 11
- 239000005090 green fluorescent protein Substances 0.000 description 11
- 238000007901 in situ hybridization Methods 0.000 description 11
- 230000001404 mediated effect Effects 0.000 description 11
- 244000052769 pathogen Species 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 206010011968 Decreased immune responsiveness Diseases 0.000 description 10
- 206010028851 Necrosis Diseases 0.000 description 10
- 102000043141 Nuclear RNA Human genes 0.000 description 10
- 108020003217 Nuclear RNA Proteins 0.000 description 10
- 230000004913 activation Effects 0.000 description 10
- 230000006907 apoptotic process Effects 0.000 description 10
- 230000025084 cell cycle arrest Effects 0.000 description 10
- 230000004663 cell proliferation Effects 0.000 description 10
- 230000017074 necrotic cell death Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000011002 quantification Methods 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000010661 induction of programmed cell death Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 9
- 238000002560 therapeutic procedure Methods 0.000 description 9
- 230000009261 transgenic effect Effects 0.000 description 9
- 241000193403 Clostridium Species 0.000 description 8
- 108091035707 Consensus sequence Proteins 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- 206010039491 Sarcoma Diseases 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 210000004708 ribosome subunit Anatomy 0.000 description 8
- 241001430294 unidentified retrovirus Species 0.000 description 8
- 241000206602 Eukaryota Species 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- 241000282412 Homo Species 0.000 description 7
- 241000412895 Lachnospiraceae bacterium NK4A179 Species 0.000 description 7
- 241001112727 Listeriaceae Species 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 108020004459 Small interfering RNA Proteins 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000003115 biocidal effect Effects 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 7
- 125000005647 linker group Chemical group 0.000 description 7
- 230000007115 recruitment Effects 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 210000003705 ribosome Anatomy 0.000 description 7
- 241000701161 unidentified adenovirus Species 0.000 description 7
- 241001515965 unidentified phage Species 0.000 description 7
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 6
- YHOXIEXEPIIKMD-UHFFFAOYSA-N 9a-[(4-chlorophenyl)methyl]-7-hydroxy-4-[4-(2-piperidin-1-ylethoxy)phenyl]-2,9-dihydro-1h-fluoren-3-one Chemical compound C1C2=CC(O)=CC=C2C2=C(C=3C=CC(OCCN4CCCCC4)=CC=3)C(=O)CCC21CC1=CC=C(Cl)C=C1 YHOXIEXEPIIKMD-UHFFFAOYSA-N 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 6
- 101710132601 Capsid protein Proteins 0.000 description 6
- 102220614122 Casein kinase II subunit alpha 3_H1283A_mutation Human genes 0.000 description 6
- 102220614121 Casein kinase II subunit alpha 3_H602A_mutation Human genes 0.000 description 6
- 102220614117 Casein kinase II subunit alpha 3_R597A_mutation Human genes 0.000 description 6
- 101710094648 Coat protein Proteins 0.000 description 6
- 241000963438 Gaussia <copepod> Species 0.000 description 6
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 6
- 241000448224 Lachnospiraceae bacterium MA2020 Species 0.000 description 6
- 101000860102 Leptotrichia shahii (strain DSM 19757 / CCUG 47503 / CIP 107916 / JCM 16776 / LB37) CRISPR-associated endoribonuclease Cas13a Proteins 0.000 description 6
- 101710125418 Major capsid protein Proteins 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 101710141454 Nucleoprotein Proteins 0.000 description 6
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 101710083689 Probable capsid protein Proteins 0.000 description 6
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 238000007792 addition Methods 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 238000010171 animal model Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 210000001236 prokaryotic cell Anatomy 0.000 description 6
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 6
- 150000003384 small molecules Chemical class 0.000 description 6
- 230000009870 specific binding Effects 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 6
- 208000023275 Autoimmune disease Diseases 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 102100031562 Excitatory amino acid transporter 2 Human genes 0.000 description 5
- 101000866287 Homo sapiens Excitatory amino acid transporter 2 Proteins 0.000 description 5
- 201000004408 Hypobetalipoproteinemia Diseases 0.000 description 5
- 241000390917 Listeria newyorkensis Species 0.000 description 5
- 241000740708 Paludibacter Species 0.000 description 5
- 102000015097 RNA Splicing Factors Human genes 0.000 description 5
- 108010039259 RNA Splicing Factors Proteins 0.000 description 5
- 230000014632 RNA localization Effects 0.000 description 5
- 241000191023 Rhodobacter capsulatus Species 0.000 description 5
- 238000000692 Student's t-test Methods 0.000 description 5
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 5
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000009825 accumulation Methods 0.000 description 5
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 230000001687 destabilization Effects 0.000 description 5
- 230000001973 epigenetic effect Effects 0.000 description 5
- 210000001808 exosome Anatomy 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 230000003834 intracellular effect Effects 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 239000001755 magnesium gluconate Substances 0.000 description 5
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 5
- 238000002473 ribonucleic acid immunoprecipitation Methods 0.000 description 5
- 108020004418 ribosomal RNA Proteins 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 229960002930 sirolimus Drugs 0.000 description 5
- PTLRDCMBXHILCL-UHFFFAOYSA-M sodium arsenite Chemical compound [Na+].[O-][As]=O PTLRDCMBXHILCL-UHFFFAOYSA-M 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000007306 turnover Effects 0.000 description 5
- 241000605059 Bacteroidetes Species 0.000 description 4
- 241000206594 Carnobacterium Species 0.000 description 4
- 241000210552 Carnobacterium gallinarum DSM 4847 Species 0.000 description 4
- 102220614118 Casein kinase II subunit alpha 3_R1278A_mutation Human genes 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 108060002636 Eukaryotic Initiation Factor-4E Proteins 0.000 description 4
- 102000005233 Eukaryotic Initiation Factor-4E Human genes 0.000 description 4
- 101000893689 Homo sapiens Ras GTPase-activating protein-binding protein 1 Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 241001112693 Lachnospiraceae Species 0.000 description 4
- 241001490530 Leptotrichia sp. Species 0.000 description 4
- 241000029590 Leptotrichia wadei Species 0.000 description 4
- 102100024014 Nestin Human genes 0.000 description 4
- 230000026279 RNA modification Effects 0.000 description 4
- 102100040854 Ras GTPase-activating protein-binding protein 1 Human genes 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- 241000700584 Simplexvirus Species 0.000 description 4
- 241000191940 Staphylococcus Species 0.000 description 4
- NMFHJNAPXOMSRX-PUPDPRJKSA-N [(1r)-3-(3,4-dimethoxyphenyl)-1-[3-(2-morpholin-4-ylethoxy)phenyl]propyl] (2s)-1-[(2s)-2-(3,4,5-trimethoxyphenyl)butanoyl]piperidine-2-carboxylate Chemical compound C([C@@H](OC(=O)[C@@H]1CCCCN1C(=O)[C@@H](CC)C=1C=C(OC)C(OC)=C(OC)C=1)C=1C=C(OCCN2CCOCC2)C=CC=1)CC1=CC=C(OC)C(OC)=C1 NMFHJNAPXOMSRX-PUPDPRJKSA-N 0.000 description 4
- 208000004622 abetalipoproteinemia Diseases 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000009918 complex formation Effects 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000000368 destabilizing effect Effects 0.000 description 4
- 238000006471 dimerization reaction Methods 0.000 description 4
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 4
- 201000000544 familial hypobetalipoproteinemia 1 Diseases 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 230000017730 intein-mediated protein splicing Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 239000003607 modifier Substances 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 230000014621 translational initiation Effects 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- 108020005345 3' Untranslated Regions Proteins 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 3
- 108091023037 Aptamer Proteins 0.000 description 3
- 241000589941 Azospirillum Species 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 3
- 241000589876 Campylobacter Species 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 241000206592 Carnobacterium gallinarum Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 241000186394 Eubacterium Species 0.000 description 3
- 108700024394 Exon Proteins 0.000 description 3
- 241000032681 Gluconacetobacter Species 0.000 description 3
- 108010010234 HDL Lipoproteins Proteins 0.000 description 3
- 102000015779 HDL Lipoproteins Human genes 0.000 description 3
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 3
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 241000186660 Lactobacillus Species 0.000 description 3
- 241000589248 Legionella Species 0.000 description 3
- 208000007764 Legionnaires' Disease Diseases 0.000 description 3
- 241000123728 Leptotrichia buccalis Species 0.000 description 3
- 241000029603 Leptotrichia shahii Species 0.000 description 3
- 241000778057 Leptotrichia wadei F0279 Species 0.000 description 3
- 241001545398 Listeria weihenstephanensis Species 0.000 description 3
- 108091007767 MALAT1 Proteins 0.000 description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 241000588653 Neisseria Species 0.000 description 3
- 241001386753 Parvibaculum Species 0.000 description 3
- 101710111747 Peptidyl-prolyl cis-trans isomerase FKBP12 Proteins 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 230000004570 RNA-binding Effects 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 241000191025 Rhodobacter Species 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- 241000605947 Roseburia Species 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 238000003782 apoptosis assay Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 101150000705 cas1 gene Proteins 0.000 description 3
- 101150055766 cat gene Proteins 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 229940039696 lactobacillus Drugs 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 210000004379 membrane Anatomy 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 3
- 230000005522 programmed cell death Effects 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- WMHLZRDNWFNTCU-UHFFFAOYSA-N 2-nitroso-3,7-dihydropurin-6-one Chemical compound O=C1NC(N=O)=NC2=C1N=CN2 WMHLZRDNWFNTCU-UHFFFAOYSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- 108020005176 AU Rich Elements Proteins 0.000 description 2
- 241000604451 Acidaminococcus Species 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241001147780 Alicyclobacillus Species 0.000 description 2
- 101150102415 Apob gene Proteins 0.000 description 2
- 102000018616 Apolipoproteins B Human genes 0.000 description 2
- 108010027006 Apolipoproteins B Proteins 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000606125 Bacteroides Species 0.000 description 2
- 241000772275 Blautia sp. Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241001135245 Butyrivibrio sp. Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 239000004128 Copper(II) sulphate Substances 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 108010020076 Cytochrome P-450 CYP2B1 Proteins 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- 241000936939 Desulfonatronum Species 0.000 description 2
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 239000001856 Ethyl cellulose Substances 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 2
- 102000017013 Heterogeneous Nuclear Ribonucleoprotein A1 Human genes 0.000 description 2
- 101000800310 Homo sapiens Ubiquitin domain-containing protein TINCR Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 102000016252 Huntingtin Human genes 0.000 description 2
- 108050004784 Huntingtin Proteins 0.000 description 2
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 2
- 102220466360 Inactive tyrosine-protein kinase PRAG1_R1278A_mutation Human genes 0.000 description 2
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 2
- 241000412898 Lachnospiraceae bacterium NK4A144 Species 0.000 description 2
- 241000208822 Lactuca Species 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 241001496637 Listeria weihenstephanensis FSL R9-0317 Species 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 241000589323 Methylobacterium Species 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 108010052185 Myotonin-Protein Kinase Proteins 0.000 description 2
- 102100022437 Myotonin-protein kinase Human genes 0.000 description 2
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 description 2
- 241000135938 Nitratifractor Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 201000009110 Oculopharyngeal muscular dystrophy Diseases 0.000 description 2
- 208000005225 Opsoclonus-Myoclonus Syndrome Diseases 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 239000004100 Oxytetracycline Substances 0.000 description 2
- 241001099939 Paludibacter propionicigenes Species 0.000 description 2
- 208000017787 Paraneoplastic neurologic syndrome Diseases 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 2
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 101710124239 Poly(A) polymerase Proteins 0.000 description 2
- 241000605894 Porphyromonas Species 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000709748 Pseudomonas phage PRR1 Species 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108091008103 RNA aptamers Proteins 0.000 description 2
- 241000730262 Rhodobacter capsulatus DE442 Species 0.000 description 2
- 241000730265 Rhodobacter capsulatus R121 Species 0.000 description 2
- 241000433126 Rhodobacter capsulatus SB 1003 Species 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 108020005543 Satellite RNA Proteins 0.000 description 2
- 241001515849 Satellite Viruses Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 241000949716 Sphaerochaeta Species 0.000 description 2
- 235000009337 Spinacia oleracea Nutrition 0.000 description 2
- 244000300264 Spinacia oleracea Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 102100033084 Ubiquitin domain-containing protein TINCR Human genes 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 101000756604 Xenopus laevis Actin, cytoplasmic 1 Proteins 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000004178 amaranth Substances 0.000 description 2
- 235000012735 amaranth Nutrition 0.000 description 2
- 239000000605 aspartame Substances 0.000 description 2
- 229960004099 azithromycin Drugs 0.000 description 2
- MQTOSJVFKKJCRP-BICOPXKESA-N azithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)N(C)C[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 MQTOSJVFKKJCRP-BICOPXKESA-N 0.000 description 2
- 239000001654 beetroot red Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 230000030570 cellular localization Effects 0.000 description 2
- 230000008045 co-localization Effects 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 108010031180 cypridina luciferase Proteins 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000009274 differential gene expression Effects 0.000 description 2
- 108020001096 dihydrofolate reductase Proteins 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 229920001519 homopolymer Polymers 0.000 description 2
- 238000010166 immunofluorescence Methods 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 239000001788 mono and diglycerides of fatty acids Substances 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 244000045947 parasite Species 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 244000144977 poultry Species 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 230000016434 protein splicing Effects 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 208000017520 skin disease Diseases 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 210000001324 spliceosome Anatomy 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 210000000225 synapse Anatomy 0.000 description 2
- 238000010809 targeting technique Methods 0.000 description 2
- 108010026424 tau Proteins Proteins 0.000 description 2
- 102000013498 tau Proteins Human genes 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 230000037426 transcriptional repression Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- ADZBMFGQQWPHMJ-RHSMWYFYSA-N 4-[[2-[[(1r,2r)-2-hydroxycyclohexyl]amino]-1,3-benzothiazol-6-yl]oxy]-n-methylpyridine-2-carboxamide Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=C3SC(N[C@H]4[C@@H](CCCC4)O)=NC3=CC=2)=C1 ADZBMFGQQWPHMJ-RHSMWYFYSA-N 0.000 description 1
- 101150052384 50 gene Proteins 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 102000017919 ADRB2 Human genes 0.000 description 1
- 241001135756 Alphaproteobacteria Species 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 102000005666 Apolipoprotein A-I Human genes 0.000 description 1
- 108010059886 Apolipoprotein A-I Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101100177160 Arabidopsis thaliana HAC2 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 241000304886 Bacilli Species 0.000 description 1
- 241001038796 Bacteroides ihuae Species 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241000555281 Brevibacillus Species 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 102100025172 Calpain-1 catalytic subunit Human genes 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 101710103210 Capsid protein F Proteins 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102100032616 Caspase-2 Human genes 0.000 description 1
- 108090000552 Caspase-2 Proteins 0.000 description 1
- 102000011727 Caspases Human genes 0.000 description 1
- 108010076667 Caspases Proteins 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102000011045 Chloride Channels Human genes 0.000 description 1
- 241001643775 Chloroflexus aggregans Species 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 244000248349 Citrus limon Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000723377 Coffea Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000724252 Cucumber mosaic virus Species 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 108010026925 Cytochrome P-450 CYP2C19 Proteins 0.000 description 1
- 108010000543 Cytochrome P-450 CYP2C9 Proteins 0.000 description 1
- 102100029363 Cytochrome P450 2C19 Human genes 0.000 description 1
- 102100029358 Cytochrome P450 2C9 Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 102100026139 DNA damage-inducible transcript 4 protein Human genes 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 101100457345 Danio rerio mapk14a gene Proteins 0.000 description 1
- 101100457347 Danio rerio mapk14b gene Proteins 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 241000974757 Demequina aurantiaca Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 206010048768 Dermatosis Diseases 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- 101100273028 Drosophila melanogaster Caf1-55 gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 208000003556 Dry Eye Syndromes Diseases 0.000 description 1
- 206010013774 Dry eye Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010053101 ELAV Proteins Proteins 0.000 description 1
- 102000016662 ELAV Proteins Human genes 0.000 description 1
- 102000055765 ELAV-Like Protein 1 Human genes 0.000 description 1
- 108700015856 ELAV-Like Protein 1 Proteins 0.000 description 1
- 101150031726 ERS1 gene Proteins 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000714301 Eubacteriaceae bacterium CHKCI004 Species 0.000 description 1
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 description 1
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 description 1
- 241000178967 Filifactor Species 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241001453172 Fusobacteria Species 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 102100030651 Glutamate receptor 2 Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 102000019058 Glycogen Synthase Kinase 3 beta Human genes 0.000 description 1
- 108010051975 Glycogen Synthase Kinase 3 beta Proteins 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 241001430278 Helcococcus Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 102100038614 Hemoglobin subunit gamma-1 Human genes 0.000 description 1
- 241000613556 Herbinix hemicellulosilytica Species 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000959437 Homo sapiens Beta-2 adrenergic receptor Proteins 0.000 description 1
- 101000934069 Homo sapiens Calpain-1 catalytic subunit Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000912753 Homo sapiens DNA damage-inducible transcript 4 protein Proteins 0.000 description 1
- 101100446641 Homo sapiens FKBP1A gene Proteins 0.000 description 1
- 101001031977 Homo sapiens Hemoglobin subunit gamma-1 Proteins 0.000 description 1
- 101000956778 Homo sapiens LETM1 domain-containing protein 1 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000833167 Homo sapiens Poly(A) RNA polymerase GLD2 Proteins 0.000 description 1
- 101000780643 Homo sapiens Protein argonaute-2 Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000993172 Homo sapiens Putative cancer susceptibility gene HEPN1 protein Proteins 0.000 description 1
- 101000621945 Homo sapiens Vitamin K epoxide reductase complex subunit 1 Proteins 0.000 description 1
- 101000744745 Homo sapiens YTH domain-containing family protein 2 Proteins 0.000 description 1
- 101000795753 Homo sapiens mRNA decay activator protein ZFP36 Proteins 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241001600697 Insolitispirillum peregrinum Species 0.000 description 1
- 102100039060 Interleukin enhancer-binding factor 2 Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 102100038448 LETM1 domain-containing protein 1 Human genes 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 101000860100 Leptotrichia buccalis (strain ATCC 14201 / DSM 1135 / JCM 12969 / NCTC 10249 / C-1013-b) CRISPR-associated endoribonuclease Cas13a Proteins 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 241000371296 Listeria riparia Species 0.000 description 1
- 241000186807 Listeria seeligeri Species 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 108700012928 MAPK14 Proteins 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 101150003941 Mapk14 gene Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108091007780 MiR-122 Proteins 0.000 description 1
- 102000054819 Mitogen-activated protein kinase 14 Human genes 0.000 description 1
- 101100144701 Mus musculus Drosha gene Proteins 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101100046352 Mus musculus Tjap1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 108700021638 Neuro-Oncological Ventral Antigen Proteins 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108700031302 Nuclear Factor 45 Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000936936 Opitutaceae Species 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 241000007215 Paludibacter propionicigenes WB4 Species 0.000 description 1
- 238000010220 Pearson correlation analysis Methods 0.000 description 1
- 108010085186 Peroxisomal Targeting Signals Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 241000139306 Platt Species 0.000 description 1
- 102100024380 Poly(A) RNA polymerase GLD2 Human genes 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 241000711943 Porphyromonadaceae bacterium Species 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 102100034207 Protein argonaute-2 Human genes 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241001231807 Pseudobutyrivibrio sp. Species 0.000 description 1
- 102100031189 Putative cancer susceptibility gene HEPN1 protein Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101000866288 Rattus norvegicus Excitatory amino acid transporter 1 Proteins 0.000 description 1
- 101710146873 Receptor-binding protein Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 101710137011 Retinol-binding protein 4 Proteins 0.000 description 1
- 206010061494 Rhinovirus infection Diseases 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 102100024544 SURP and G-patch domain-containing protein 1 Human genes 0.000 description 1
- 235000008406 SarachaNachtschatten Nutrition 0.000 description 1
- 101100204733 Schizosaccharomyces pombe (strain 972 / ATCC 24843) gus1 gene Proteins 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100031463 Serine/threonine-protein kinase PLK1 Human genes 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000004790 Solanum aculeatissimum Nutrition 0.000 description 1
- 235000008424 Solanum demissum Nutrition 0.000 description 1
- 235000018253 Solanum ferox Nutrition 0.000 description 1
- 235000000208 Solanum incanum Nutrition 0.000 description 1
- 235000013131 Solanum macrocarpon Nutrition 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000009869 Solanum phureja Nutrition 0.000 description 1
- 235000000341 Solanum ptychanthum Nutrition 0.000 description 1
- 235000017622 Solanum xanthocarpum Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000123710 Sutterella Species 0.000 description 1
- 102000000551 Syk Kinase Human genes 0.000 description 1
- 108010016672 Syk Kinase Proteins 0.000 description 1
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 241000929593 Thalassospira sp. Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000670722 Tuberibacillus Species 0.000 description 1
- 108091026838 U1 spliceosomal RNA Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 102100023485 Vitamin K epoxide reductase complex subunit 1 Human genes 0.000 description 1
- 108091007416 X-inactive specific transcript Proteins 0.000 description 1
- 108091035715 XIST (gene) Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 102100039644 YTH domain-containing family protein 2 Human genes 0.000 description 1
- 241000907316 Zika virus Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 241000193458 [Clostridium] aminophilum Species 0.000 description 1
- 241000274840 [Clostridium] aminophilum DSM 10710 Species 0.000 description 1
- 241001531188 [Eubacterium] rectale Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000000879 anti-atherosclerotic effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 206010006451 bronchitis Diseases 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000005907 cancer growth Effects 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 108091092259 cell-free RNA Proteins 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000004640 cellular pathway Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 210000004718 centriole Anatomy 0.000 description 1
- 210000003793 centrosome Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 229930002875 chlorophyll Natural products 0.000 description 1
- 235000019804 chlorophyll Nutrition 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000008876 conformational transition Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000005956 cytoplasmic translocation Effects 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000002074 deregulated effect Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- BFMYDTVEBKDAKJ-UHFFFAOYSA-L disodium;(2',7'-dibromo-3',6'-dioxido-3-oxospiro[2-benzofuran-1,9'-xanthene]-4'-yl)mercury;hydrate Chemical compound O.[Na+].[Na+].O1C(=O)C2=CC=CC=C2C21C1=CC(Br)=C([O-])C([Hg])=C1OC1=C2C=C(Br)C([O-])=C1 BFMYDTVEBKDAKJ-UHFFFAOYSA-L 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003492 excitotoxic effect Effects 0.000 description 1
- 231100000063 excitotoxicity Toxicity 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 230000003176 fibrotic effect Effects 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 108010089305 glutamate receptor type B Proteins 0.000 description 1
- 108010033706 glycylserine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000055209 human FKBP1A Human genes 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 101150095658 ilf2 gene Proteins 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000011503 in vivo imaging Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000004410 intraocular pressure Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 241000238565 lobster Species 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091051828 miR-122 stem-loop Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 210000000337 motor cortex Anatomy 0.000 description 1
- 208000010125 myocardial infarction Diseases 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000007383 nerve stimulation Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 210000004492 nuclear pore Anatomy 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 201000005989 paraneoplastic polyneuropathy Diseases 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 230000002974 pharmacogenomic effect Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 108010056274 polo-like kinase 1 Proteins 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 235000021013 raspberries Nutrition 0.000 description 1
- 239000003642 reactive oxygen metabolite Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 208000020029 respiratory tract infectious disease Diseases 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 108091069025 single-strand RNA Proteins 0.000 description 1
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 230000002311 subsequent effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 1
- 229960001082 trimethoprim Drugs 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Veterinary Medicine (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Saccharide Compounds (AREA)
- Compounds Of Unknown Constitution (AREA)
Abstract
본 발명은 핵산을 표적화하기 위한 시스템, 방법, 및 조성물을 제공한다. 구체적으로, 본 발명은 신규 RNA-표적화 CRISPR 이펙터 단백질 및 가이드 RNA와 같은 적어도 하나의 표적화 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 RNA-표적화 시스템을 제공한다.
Description
관련 출원 및 참조에 의한 포함
본 출원은 2016년 6월 17일에 출원된 미국 임시 출원 62/351,662 및 62/351,803, 2016년 8월 17일에 출원된 미국 임시 출원 62/376,377, 2016년 10월 19일에 출원된 미국 임시 출원 62/410,366, 2016년 12월 9일에 출원된 미국 임시 출원 62/432,240, 2017년 3월 15일에 출원된 미국 임시 출원 62/471,792, 2017년 4월 12일에 출원된 미국 출원 62/484,786에 대한 우선권을 주장한다.
2017년 3월 15일에 출원된 미국 임시 출원 62/471,710가 참조된다(제목 "Novel Cas13B Orthologues CRISPR Enzymes and Systems," 대리인 참조번호: BI-10157 VP 47627.04.2149). 2016년 12월 9일에 출원된 미국 임시 출원 62/432,553, 2017년 2월 8일에 출원된 미국 임시 출원 62/456,645, 및 2017년 3월 15일에 출원된 미국 임시 출원 62/471,930(제목 "CRISPR Effector System Based Diagnostics," 대리인 참조번호 BI-10121 BROD 0842P) 및 2017 년 4월 12일에 출원된 미국 임시 출원 번호 미지정(제목 "CRISPR Effector System Based Diagnostics," 대리인 참조번호 BI-10121 BROD 0843P)가 추가로 참조된다.
본 명세서에 인용된 문헌들에서 인용되거나 언급된 모든 문헌은, 본 명세서에 언급된 임의의 제품에 대한 임의의 제조사의 지침서, 설명서, 제품 명세서 및 제품 시트(sheet) 또는 본 명세서에 참조로 포함된 임의의 문헌과 함께, 본 명세서에 참조로 포함되어 있으며, 본 발명의 실시에 이용될 수 있다. 더 구체적으로, 모든 참조된 문헌은, 마치 각각의 개별 문헌을 참조로 포함하는 것으로 특정적으로 그리고 개별적으로 나타내는 것과 동일한 정도로 참조로 포함된다.
연방 정부가 후원하는 연구에 대한 성명
본 발명은 미국 국립 보건원(National Institutes of Health)에 의해 지급된 승인 번호 MH100706 및 MH110049 하에 정부 지원으로 수행되었다. 정부는 본 발명에 대해 특정 권리를 갖는다.
발명의 분야
본 발명은 일반적으로 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats; CRISPR)와 관련된 벡터 시스템 및 이의 성분을 사용할 수 있는, 서열 표적화를 수반하는 유전자 발현의 제어, 예를 들어 유전자 전사물의 변동(perturbation) 또는 핵산 편집에 사용되는 시스템, 방법 및 조성물에 관한 것이다.
최근 게놈 시퀀싱 기법 및 분석 방법의 진보는 다양한 범위의 생물학적 기능 및 질환과 연관된 유전적 요인을 목록화하고 매핑하는 능력을 상당히 가속화시켰다. 개별적인 유전 요소의 선택적인 변동을 허용함으로써 원인이 되는 유전 변이의 체계적인 역조작(reverse engineering)을 가능하게 할 뿐만 아니라, 합성 생물학, 생명공학, 및 의학 응용 분야를 진전시키기 위하여, 정확한 게놈 표적화 기술이 필요하다. 게놈-편집 기법, 예를 들어 설계자 징크 핑거(designer zinc finger), 전사 활성자-유사 이펙터(transcription activator-like effector; TALE), 또는 귀소 메가뉴클레아제(homing meganuclease)가 표적화된 게놈 변동을 생성하는 데 이용 가능하지만, 신규 전략과 분자 메커니즘을 이용하고, 입수 가능하며, 설정하기 쉽고, 확장성이 있으며, 진핵세포 게놈 및 트랜스크립톰 내의 다수의 위치를 표적화할 수 있는 새로운 게놈 및 트랜스크립톰 조작 기술에 대한 필요성이 계속 남아 있다. 이는 게놈 조작 및 생명공학에서 새로운 응용 분야에 대한 주요 자원을 제공할 것이다.
박테리아 및 고박테리아의(archaeal) 적응 면역의 CRISPR-Cas 시스템은 단백질 조성 및 게놈 유전자좌 구조의 극단적인 다양성을 나타낸다. CRISPR-Cas 시스템 유전자좌는 50 개 초과의 유전자 패밀리를 가지며, 유전자좌 구조의 빠른 진화 및 극단적인 다양성을 나타내는 엄격한 보편적 유전자는 존재하지 않는다. 지금까지는, 다면적인 접근법을 채택하여, 93 개의 Cas 단백질에 대해 약 395 개의 프로파일의 포괄적인 cas 유전자 확인이 있다. 분류는 유전자 프로파일의 특징 및 유전자좌 구조의 특징을 포함한다. CRISPR-Cas 시스템의 새로운 분류가 제안되어 있으며, 여기서 이들 시스템은 광범위하게 2 개의 부류, 즉 다수 서브유닛 이펙터 복합체를 갖는 클래스 1 및 Cas9 단백질로 예시되는 단일-서브유닛 이펙터 모듈을 갖는 클래스 2로 나뉜다. 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질은 강력한 게놈 설계 제작 도구로서 개발될 수 있으며, 추정상의 신규 이펙터 단백질 및 이의 설계 제작 및 최적화의 예측이 중요하다.
CRISPR-Cas 적응 면역 시스템은 DNA 또는 RNA-DNA 간섭을 통해 외래 유전 요소에 대항하여 미생물을 방어한다. 최근, 클래스 2 제VI형 단일-성분 CRISPR-Cas 이펙터 C2c2(문헌[Shmakov et al.(2015) "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems"; Molecular Cell 60:1-13; doi: http://dx.doi.org/10.1016/j.molcel.2015.10.008])는 RNA-가이드된 알엔아제로 특징 확인되었다(문헌[Abudayyeh et al. (2016), Science, [인쇄 전 전자간행], June 2; "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector"; doi: 10.1126/science.aaf5573]). C2c2(예를 들어 렙토트리키아 샤히(Leptotrichia shahii) 유래)가 RNA 파지 감염에 대항하여 견고한 간섭을 제공함이 입증되었다. 시험관내 생화학 분석 및 생체내 분석을 통해, C2c2가 3'H(G가 아님) PAM 측면에 배치된 프로토스페이서를 갖는 ssRNA 표적을 절단하도록 프로그래밍될 수 있음이 나타났다. 절단은 촉매적으로 비활성인 RNA-결합 단백질을 생성하는 돌연변이인 C2c2의 2 개의 보존된 HEPN 도메인에서 촉매성 잔기에 의해 매개된다. C2c2는 단일 가이드에 의해 가이드되며 생체내 특정 mRNA를 손실시키도록 재프로그래밍될 수 있다. LshC2c2는 관심 있는 특정 부위에 표적화될 수 있고 일단 동족 표적 RNA로 프라이밍되면 비-특이적인 알엔아제 활성을 수행할 수 있음이 나타났다. 이들 결과는 CRISPR-Cas 시스템에 대한 이해를 넓히고 광범위한 RNA-표적화 도구 세트를 개발하기 위해 C2c2를 활용할 가능성을 입증한다.
C2c2는 현재 Cas13a로 알려져 있다. 본 명세서에서 용어 "C2c2"는 "Cas13a"와 상호 교환 가능하게 사용되는 것으로 이해될 것이다.
이 출원에서의 임의의 문헌의 인용 또는 확인은 이러한 문헌이 본 발명의 선행 기술로서 이용 가능함을 인정하는 것이 아니다.
핵산 또는 폴리뉴클레오티드(예를 들어, DNA 또는 RNA 또는 그의 임의의 하이브리드 또는 유도체)를 넓은 적용, 구체적으로 진핵 생물 시스템, 더욱 구체적으로 포유류 시스템에서 표적화하기 위한 대안적이고 견고한 시스템 및 기법에 대한 절실한 필요성이 존재한다. 본 발명은 이 필요성을 해결하고 관련 이점을 제공한다. 본 출원의 신규한 RNA-표적화 시스템을 게놈, 트랜스크립톰 및 후성유전체 표적화 기법의 목록에 추가하는 것은, 구체적으로 진핵 생물 시스템, 더욱 구체적으로 포유류 시스템(세포, 기관, 조직 또는 생물을 포함) 및 식물 시스템에서의, 직접 검출, 분석 및 조작을 통해 특정 표적 부위의 연구 및 변동 또는 편집을 변환시킬 수 있다. 유해 효과없이 RNA 표적화를 위해 본 출원의 RNA-표적화 시스템을 효과적으로 활용하기 위해서는, 이들 RNA 표적화 도구의 설계 제작 측면 및 최적화 측면을 이해하는 것이 중요하다.
CRISPR-Cas13 패밀리는 CRISPR 시스템의 특징에 대한 박테리아 게놈의 컴퓨터 마이닝(문헌[Shmakov, S. et al. Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems. Mol Cell 60, 385-397, doi:10.1016/j.molcel.2015.10.008 (2015)])에 의해 단일-이펙터 RNA-가이드된 알엔아제 Cas13a/C2c2(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]) 및 이후에 단일-이펙터 RNA-가이드된 알엔아제 Cas13b(문헌[Shmakov, S. et al. Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182, doi:10.1038/nrmicro.2016.184 (2017)]; 문헌[Smargon, A. A. et al. Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell 65, 618-630 e617, doi:10.1016/j.molcel.2016.12.023 (2017)])를 밝혀내며 발견되었다. Cas13a라고도 알려진, 클래스 2 제VI형의 이펙터 단백질 C2c2는 ssRNA를 분해하도록 효율적으로 프로그래밍될 수 있는 RNA-가이드된 알엔아제이다. C2c2(Cas13a)는 CRISPR-Cas 시스템에서 발견되는 다른 알려진 알엔아제의 촉매 메커니즘과 달리 2 개의 HEPN 도메인 내에 보존된 염기성 잔기를 통해 RNA 절단을 달성한다. 4 개의 예상되는 HEPN 도메인 촉매성 잔기 중 임의의 것에서의 (예를 들어, 알라닌) 치환과 같은, HEPN 도메인의 돌연변이는 C2c2를 비활성 프로그래밍 가능한 RNA-결합 단백질(dC2c2, dCas9와 유사)로 전환시킨다.
RNA-가이드된 알엔아제 Cas13의 프로그래밍 가능성 및 특이성은 그것을 트랜스크립톰 조작을 위한 이상적인 플랫폼으로 만들 것이다. 출원인은 포유류 전사물 녹다운 및 결합 도구로 사용하기 위해 Cas13a를 개발한다. 렙토트리키아 샤히 유래의 Cas13a(LshCas13a)는 프로그래밍 가능한 crRNA를 사용하여 촉매적으로 비활성 버전으로 견고한 RNA 절단 및 결합을 할 수 있고 그 절단은 동일성 H(구아닌이 아님)를 갖는 프로토스페이서 측면 부위(PFS)로 알려진 바로 3'-인접 모티프에 의존한다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). RNA 절단 시, 활성화된 LshCas13a는 구성적 알엔아제 활성이 비-표적화된 RNA를 절단하는 "부수적 활성"에 참여한다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 이 crRNA-프로그밍된 부수적 활성은 감염의 확산을 막기 위해 박테리아에 의해 생체내 프로그래밍된 세포 사멸을 가능하게 하고(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 시험관내 핵산의 특이적 검출에 적용되었다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]; 문헌[East-Seletsky, A. et al. Two distinct RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection. Nature 538, 270-273, doi:10.1038/nature19802 (2016)]). 부수적 활성은 최근 많은 임상 진단에 유용한 SHERLOCK이라고 지칭되는 매우 민감하고 특이적인 핵산 검출 플랫폼에 대해 영향을 받았다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 356, 438-442 (2017)]).
박테리아에서의 Cas13a 오솔로그(ortholog) 스크리닝 및 후속 생화학적 특징 확인을 통해, 출원인은 RNA 엔도뉴클레아제 활성에 대해 최적화된 오솔로그인 렙토트리키아 와데이 유래의 Cas13a(LwaCas13a)를 선택한다. LwaCas13a는 포유류 세포에서 안정적으로 발현되고, 세포 내에서 리포터 및 내인성 전사물 모두를 효과적으로 녹다운하기 위해 재표적화될 수 있고, 관찰 가능한 부수적 활성 없이 RNAi와 비교하여 높은 수준의 표적화 특이성 수준을 달성한다. 또한, 출원인은 촉매적으로 비활성인 LwaCas13a(dCas13a)가 생체내에서 프로그래밍 가능하게 RNA 전사물에 결합하고 세포에서 전사물을 이미징하는 데 사용될 수 있음을 보여준다. dCas13a에 기반한 음성-피드백 이미징 시스템을 설계 제작함으로써, 스트레스 과립의 형성을 살아있는 세포에서 추적할 수 있다.
특정된 서열에 결합하는 dC2c2(dCas13a)의 능력은 본 발명에 따른 몇몇 양태에서 (i) 대규모 스크리닝, 합성 조절 회로 구축 및 기타 목적에 사용될 수 있는, 기능 또는 번역 조절을 위해 특정 전사물로 이펙터 모듈을 가져오고; (ii) 그들의 운행 및/또는 국소화를 시각화하기 위해 특정 RNA를 형광으로 표지하고; (iii) 특정 세포 내 구획에 대한 친화성을 갖는 도메인을 통해 RNA 국소화를 변경하고; (iv) RNA 및 단백질을 포함하는 근접한 분자 파트너에 대해 강화하기 위해 (dC2c2의 직접 풀다운(pull down) 또는 바이오틴 리가제 활성을 특정 전사물로 국소화하기 위한 dC2c2의 사용을 통해) 특정 전사물을 포획하는 것에 사용될 수 있다.
활성 C2c2는 또한 많은 응용을 가져야 한다. 본 발명의 일 양태는 여기에서 RFP를 이용하는 것과 같이, 파괴를 위하여 특정 전사물을 표적화하는 것을 포함한다. 추가적으로, 일단 동족 표적에 의해 프라이밍되면, C2c2는 시험관내에서 다른 (비-상보성) RNA 분자를 절단할 수 있고 생체내에서 세포 성장을 저해할 수 있다. 생물학적으로, 이 잡다한 알엔아제 활성은 제VI형 CRISPR-Cas 시스템의 프로그래밍된 세포 사멸/휴면(PCD/D)-기반 보호 메카니즘을 반영할 수 있다. 따라서, 본 발명의 일 양태에서, 특정 세포-예를 들어 구체적인 전사물을 발현하는 암세포, 주어진 클래스의 뉴런, 특정 병원체에 의해 감염된 세포, 또는 다른 비정상 세포 또는 달리 그 존재를 원하지 않는 세포에서의 PCD 또는 휴면을 유발하기 위해 사용될 수 있다.
본 발명은 하기에 관한 것이다.
[1] 포유류의 관심 표적 유전자좌를 변형시키는 방법으로서, 방법은 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 방법.
[2] 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 포유류의 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[3] 하나 이상의 국소화 신호에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물의 용도로서, 여기서 적어도 하나 이상의 핵산 성분은 포유류의 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 용도.
[4] [1] 내지 [3] 또는 [58] 및 [59] 중 어느 하나에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 방법, 조성물, 또는 용도.
[5] [1] 내지 [4] 또는 [58] 및 [59] 중 어느 하나에 있어서, 상기 국소화 신호는 핵 국소화 신호(NLS) 또는 핵 방출 신호(NES), 바람직하게는 NES인, 방법, 조성물, 또는 용도.
[6] [1] 내지 [5] 중 어느 하나에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 방법.
[7] [1] 내지 [6] 또는 [58] 및 [59] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 포유류 세포에서의 발현을 위해 코돈 최적화된, 방법, 조성물, 또는 용도.
[8] [1] 내지 [7] 또는 [58] 및 [59] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 방법, 조성물, 또는 용도.
[9] [8]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 방법, 조성물, 또는 용도.
[10] [1] 내지 [9] 또는 [58] 및 [59] 중 어느 하나에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[11] [1] 내지 [10] 또는 [58] 및 [59] 중 어느 하나에 있어서, 상기 변형시키는 것은 생체내 또는 생체외에서인, 방법, 조성물, 또는 용도.
[12] [1] 내지 [11] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 방법, 조성물, 또는 용도.
[13] [1] 내지 [12] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 방법, 조성물, 또는 용도.
[14] [1] 내지 [13] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 방법, 조성물, 또는 용도.
[15] [14]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 방법, 조성물, 또는 용도.
[16] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[17] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[18] [16] 또는 [17]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[19] [18]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[20] [14] 또는 [15]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [16] 또는 [17]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [1] 내지 [13] 또는 [58] 내지 [59] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 방법, 조성물, 또는 용도.
[21] [1] 내지 [20] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 방법, 조성물, 또는 용도.
[22] [1] 내지 [21] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물.
[23] 하나 이상의 NLS 또는 NES에 융합된 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 포유류의 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[24] [23]에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 조성물.
[25] [23] 또는 [24]에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 조성물.
[26] [23] 또는 [24]에 있어서, C2c2 이펙터 단백질은 포유류 세포에서의 발현을 위해 코돈 최적화된, 조성물.
[27] [23] 또는 [24]에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 조성물.
[28] [27]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 조성물.
[29] [27] 또는 [28]에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 조성물.
[30] [27] 내지 [29] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 조성물.
[31] [27] 내지 [30] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 조성물.
[32] [27] 내지 [31] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 조성물.
[33] [32]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 조성물.
[34] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 조성물.
[35] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 조성물.
[36] [34] 또는 [35]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 조성물.
[37] [36]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 조성물.
[38] [32] 또는 [33]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [34] 또는 [35]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [23] 내지 [31] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 조성물.
[39] [1] 내지 [38] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 조성물.
[40] 하나 이상의 벡터를 포함하는 벡터 시스템으로서, 하나 이상의 벡터는 [1] 내지 [39] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레외드 분자를 포함하는, 벡터 시스템.
[41] [1] 내지 [40] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 전달하도록 구성된 전달 시스템.
[42] [41]에 있어서, 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하고, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 [1] 내지 [41] 중 어느 하나에 정의된 바와 같은 특징을 갖는 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함하는, 전달 시스템.
[43] 치료의 치료적 방법에서의 사용을 위한, [1] 내지 [42] 또는 [44] 내지 [161] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템.
[44] [1] 내지 [43] 또는 [45] 내지 [161] 중 어느 하나의 조성물 또는 이의 성분을, 선택적으로 유도성으로 또는 구성적으로, 포함하거나 발현하도록 설계 제작되거나, 방법에 따라 변형된 포유류 세포.
[45] [44]에 있어서, 변형은 다음을 초래하는, 포유류 세포:
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포;
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 증가되는 세포; 또는
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 감소되는 세포.
[46] 포유류 세포에서의 생체내 또는 생체외에서 다음 사용을 위한, [1] 내지 [45] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[47] [44] 내지 [45] 중 어느 하나에 따른 세포, 또는 이의 자손의 또는 이를 포함하는 세포주.
[48] [44] 또는 [45]에 따른 하나 이상의 세포를 포함하는 포유동물.
[49] [44] 또는 [45]에 따른 하나 이상의 세포를 포함하는 포유류 모델로서; 상기 세포(들)는 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [48] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 포유류 모델.
[50] [44] 또는 [45]의 세포, 또는 [47] 또는 [48]의 세포주 또는 생물 또는 [49]의 포유류 모델로부터의 생산물로서, 상기 세포 또는 세포주의 세포(들) 또는 포유류 모델의 포유동물은 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [49] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 생산물.
[51] [50]에 있어서, 생산물의 양은 [1] 내지 [50] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물의 양보다 더 많거나 더 적은, 생산물.
[52] [50]에 있어서, 생산물은 [1] 내지 [51] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물과 비교하여 변경된, 생산물.
[53] [1] 내지 [52] 또는 [54] 내지 [161] 중 어느 하나의 시스템 또는 방법 또는 세포를 포함하는 분석, 스크리닝 방법 또는 돌연변이 유발 방법.
[54] RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법으로서, 여기서 개선은 RNA를 사용하는 것 대신에, 방법은 [1] 내지 [53] 중 어느 하나에서와 같은 조성물을 사용하는 것을 포함하는, 방법.
[55] [53]에 있어서, RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법은 RNAi 또는 형광 인 시츄 혼성화 방법인, 방법.
[56] [1] 내지 [55] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 포유류 세포에서의, 바람직하게는 생체내 또는 생체외에서의 다음을 위한 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[57] [1] 내지 [21] 중 어느 하나에 있어서, 상기 방법은 다음을 초래하는, 방법 또는 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[58] 포유류 세포에서의 다음을 위한 방법으로서, [1] 내지 [57] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 표적 세포에서 시험관내, 생체외, 또는 생체내 도입하거나 유도하는 것을 포함하는 방법:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[59] 포유류의 관심 표적 유전자좌의 번역을 조절하는 방법으로서, 방법은 하나 이상의 국소화 신호뿐만 아니라 번역 활성화제 또는 번역 억제제와 같은 (이종) 번역 조절제에 융합된 C2c2 이펙터 단백질; 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌로 전달하는 것을 포함하고; 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하며, 바람직하게는 여기서 상기 이종 도메인은 EIF4, 예를 들어 EIF4E인, 방법.
[60] [59]에 있어서, 상기 C2c2 이펙터 단백질은 촉매적으로 비활성인, 방법.
[61] [1] 내지 [60] 중 어느 하나에 있어서, 상기 C2c2는 렙토트리키아 샤히(Leptotrichia shahii) C2c2, 렙토트리키아 와데이(Leptotrichia wadei) F0279(Lw2) C2c2, 리스테리아 세엘리게리(Listeria seeligeri) C2c2, 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(Clostridium aminophilum) DSM 10710 C2c2, 카르노박테리움 갈리나룸(Carnobacterium gallinarum) DSM 4847 C2c2, 카르노박테리움 갈리나룸 DSM 4847 C2c2, 팔루디박터 프로피오니시게네스(Paludibacter propionicigenes) WB4 C2c2, 리스테리아 웨이헨스테파넨시스(Listeria weihenstephanensis) FSL R9-0317, C2c2, 리스테리아세아에 박테리움(Listeriaceae bacterium) FSL M6-0635 C2c2, 렙토트리키아 와데이 F0279 C2c2, 로도박터 캅술라투스(Rhodobacter capsulatus) SB 1003 C2c2, 로도박터 캅술라투스R121 C2c2, 로도박터 캅술라투스 DE442 C2c2를 포함하는 군으로부터 선택되는, 방법, 조성물, 용도, 벡터 시스템, 전달 시스템, 세포, 포유동물, 포유류 모델, 생산물, 또는 분석.
[62] [1] 내지 [59] 중 어느 하나에 있어서, 상기 C2c2는 렙토트리키아 와데이 F0279 (Lw 또는 Lw2) C2c2 또는 리스테리아 뉴요켄시스(Listeria newyorkensis) FSL M6-0635 (LbFSL) C2c2인, 방법, 조성물, 용도, 벡터 시스템, 전달 시스템, 세포, 포유동물, 포유류 모델, 생산물, 또는 분석.
[63] (a) 샘플을
i) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질,
ii) 표적 RNA로 혼성화할 수 있는 가이드 RNA, 및
iii) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터와 함께 인큐베이션하는 것,
(b) 상기 RNA-기반 절단 유도성 리포터의 절단에 의해 생성되는 신호에 기반하여 상기 표적 RNA를 검출하는 것을 포함하는,
샘플에서 표적 RNA를 검출하는 방법.
[64] [63]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질인, 방법.
[65] [63]에 있어서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함하는, 방법.
[66] [63]에 있어서, 샘플은 무-세포 생물학적 샘플을 포함하는, 방법.
[67] [63]에 있어서, 샘플은 세포 샘플을 포함하는, 방법.
[68] [67]에 있어서, 세포 샘플은 식물 세포를 포함하는, 방법.
[69] [67]에 있어서, 세포 샘플은 동물 세포를 포함하는, 방법.
[70] [67]에 있어서, 세포 샘플은 암세포를 포함하는, 방법.
[71] [63]에 있어서, 표적 RNA는 병원체 RNA를 포함하는, 방법.
[72] [71]에 있어서, 병원체는 바이러스, 박테리아, 균류 또는 기생충을 포함하는, 방법.
[73] [63]에 있어서, 표적 RNA 내의 단일 뉴클레오티드 다형성 또는 RNA 전사물의 스플라이스 변이체를 검출하도록 설계된 가이드 RNA를 포함하는, 방법.
[74] [63]에 있어서, 가이드 RNA는 표적 RNA와의 하나 이상 미스 매치되는 뉴클레오티드를 포함하는, 방법.
[75] [63]에 있어서, 가이드 RNA는 질병 상태에 대해 진단적인 표적 분자에 결합하는, 방법.
[76] [75]에 있어서, 질병 상태는 암을 포함하는, 방법.
[77] [75]에 있어서, 질병 상태는 자가면역 질병을 포함하는, 방법.
[78] [63]에 있어서, C2c2 이펙터 단백질은 렙토트리키아(Leptotrichia), 리스테리아(Listeria), 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토르(Filifactor), 유박테리움(Eubacterium), 스트렙토코커스(Streptococcus), 락토바실러스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스(Bacteroides), 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루콘아세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코커스(Staphylococcus), 니트라티프락토르(Nitratifractor), 미코플라스마 및 캄필로박터(Campylobacter)로 구성되는 군으로부터 선택되는 생물 유래인, 방법.
[79] a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질,
b) 표적 RNA에 결합할 수 있는 가이드 RNA, 및
c) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 리보 핵산(RNA) 검출 시스템.
[80] [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질인, RNA 검출 시스템.
[81] [79]에 있어서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함하는, RNA 검출 시스템.
[82] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 렙토트리키아 샤히 C2c2, 라크노스피라세아에 박테리움 MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(DSM 10710) C2c2, 카르노박테리움 갈리나룸(DSM 4847) C2c2, 팔루디박터 프로피오니시게네스(WB4) C2c2, 리스테리아 웨이헨스테파넨시스(FSL R9-0317) C2c2, 리스테리아세아에 박테리움(FSL M6-0635) C2c2, 리스테리아 뉴요켄시스(FSL M6-0635) C2c2, 렙토트리키아 와데이(F0279) C2c2, 로도박터 캅술라투스(SB 1003) C2c2, 로도박터 캅술라투스(R121) C2c2, 로도박터 캅술라투스(DE442) C2c2, 렙토트리키아 와데이(Lw2) C2c2, 또는 리스테리아 세엘리게리 C2c2 중 임의의 것의 야생형 서열에 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함하는, 방법 또는 RNA 검출 시스템.
[83] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 적어도 하나의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[84] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 2 개의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[85] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 RxxxxH 모티프를 포함하는 적어도 하나의 촉매적으로 활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[86] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 각각 RxxxxH 모티프를 포함하는 2 개의 촉매적으로 활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[87] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 야생형 RxxxxH 모티프의 R 또는 H 중 적어도 하나를 돌연변이시키는 것으로부터 수득되는 적어도 하나의 촉매적으로 비활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[88] [63] 또는 [79]에 있어서, 제VI형 CRISPR-Cas 이펙터 단백질은 각각 야생형 RxxxxH 모티프의 R 또는 H 중 적어도 하나를 돌연변이시키는 것으로부터 수득되는 2 개의 촉매적으로 비활성의 HEPN 도메인을 포함하는, 방법 또는 RNA 검출 시스템.
[89] a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, 및
b) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 키트.
[90] 2 개의 상이한 촉매적으로 비활성의 C2c2 이펙터 단백질을 포함하는 조성물.
[91] [90]에 있어서, 상이한 C2c2 이펙터 단백질 각각은 상이한 리포터 분자에 연결된, 조성물.
[92] [90] 또는 [91]에 있어서, 리포터 분자는 상이한 에피토프 태그 및/또는 형광 분자로부터 개별적으로 선택되는, 조성물. 연구 및 진단 용도 및 바람직하게는 다-색 이미징을 위한 [90] 내지 [92] 중 어느 하나의 조성물의 용도.
[93] 하나 이상의 변형되거나 돌연변이된 아미노산 잔기를 갖는 C2c2 이펙터 단백질로서, 하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, L597, V602, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상이고, 바람직하게는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상으로부터 선택되며;
하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, 도 67에 표시된 컨센서스 서열에 따라, M35, K36, T38, K39, I57, E65, G66, L68, N84, T86, E88, I103, N105, E123, R128, R129, K139, L152, L194, N196, K198, N201, Y222, D253, I266, F267, S280, I303, N306, R331, Y338, K389, Y390, K391, I434, K435, L458, D459, E462, L463, I478, E479, K494, R495, N498, S501, E519, N524, Y529, V530, G534, K535, Y539, T549, D551, R577, E580, A581, F582, I587, A593, L597, I601, L602, E611, E613, D630, I631, G633, K641, N646, V669, F676, S678, N695, E703, A707, I709, I713, I716, R717, H722, F740, F742, K768, I774, K778, I783, L787, S789, V792, Y796, D799, F812, N818, P820, F821, V822, P823, S824, F825, Y829, K831, D837, L852, F858, E867, A871, L875, K877, Y880, Y881, F884, F888, F896, N901, V903, N915, K916, R918, Q920, E951, P956, Y959, Q964, I969, N994, F1000, I10001, Q1003, F10005, K1007, G1008, F1009, N1019, L1020, K1021, I1023, N1028, E1070, I1075, K1076, F1092, K1097, L1099, L1104, L1107, K1113, Y1114, E1149, E1151, I1153, L1155, L1158, D1166, L1203, D1222, G1224, I1228, R1236, K1243, Y1244, G1245, D1255, K1261, S1263, L1267, E1269, K1274, I1277, E1278, L1289, H1290, A1294, N1320, K1325, E1327, Y1328, I1334, Y1337, K1341, N1342, K1343, N1350, L1352, L1355, L1356, I1359, L1360, R1362, V1363, G1364, Y1365, I1369, R1371, D1372, F1385, E1391, D1459, K1463, K1466, R1509, N1510, I1512, A1513, H1514, N1516, Y1517, L1529, L1530, E1534, L1536, R1537, Y1543, D1544, R1545, K1546, L1547, K1548, N1549, A1550, K1553, S1554, D1557, I1558, L1559, G1563, F1568, I1612, L1651, E1652, K1655, H1658, L1659, K1663, T1673, S1677, E1678, E1679, C1681, V1684, K1685, E1689에 상응하는 C2c2에서의 것들 중 하나 이상이며,
하나 이상의 변형되거나 돌연변이된 아미노산 잔기는, 도 66에 표시된 컨센서스 서열에 따라, K28, K31, R44, E162, E184, K262, E288, K357, E360, K338, R441 (HEPN), H446 (HEPN), E471, K482, K525, K558, D707, R790, K811, R833, E839, R885, E894, R895, D896, K942, R960 (HEPN), H965 (HEPN), D990, K992, K994에 상응하는 C2c2에서의 것들 중 하나 이상인, C2c2 이펙터 단백질.
[94] 관심 표적 유전자좌를 변형시키는 방법으로서, 방법은 [93]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 방법.
[95] [1]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[96] [93]에 따른 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물의 용도로서, 여기서 적어도 하나 이상의 핵산 성분은 관심 표적 유전자좌를 변형시키는 데 사용하기 위해 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 용도.
[97] [93] 내지 [96] 중 어느 하나에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 방법, 조성물, 또는 용도.
[98] [93] 내지 [97] 중 어느 하나에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 방법.
[99] [93] 내지 [98] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 진핵 세포에서의 발현을 위해 코돈 최적화된, 방법, 조성물, 또는 용도.
[100] [93] 내지 [99] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 방법, 조성물, 또는 용도.
[101] [100]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 방법, 조성물, 또는 용도.
[102] [93] 내지 [101] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 적어도 하나 이상의 핵 국소화 신호 또는 핵 방출 신호를 포함하는, 방법, 조성물, 또는 용도.
[103] [93] 내지 [102] 중 어느 하나에 있어서, 관심 표적 유전자좌는 시험관내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[104] [93] 내지 [10] 중 어느 하나에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 방법, 조성물, 또는 용도.
[105] [104]에 있어서, 세포는 원핵 세포를 포함하는, 방법, 조성물, 또는 용도.
[106] [12]에 있어서, 세포는 진핵 세포를 포함하는, 방법.
[107] [93] 내지 [106] 중 어느 하나에 있어서, 상기 변형시키는 것은 시험관내, 생체내 또는 생체외에서인, 방법, 조성물, 또는 용도.
[108] [93] 내지 [107] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 방법, 조성물, 또는 용도.
[109] [93] 내지 [108] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 방법, 조성물, 또는 용도.
[110] [93] 내지 [109] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 방법, 조성물, 또는 용도.
[111] [110]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 방법, 조성물, 또는 용도.
[112] [110] 또는 [111]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[113] [110] 또는 [111]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 방법, 조성물, 또는 용도.
[114] [112] 또는 [113]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[115] [114]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 방법, 조성물, 또는 용도.
[116] [110] 내지 [111] 중 어느 하나에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [112] 또는 [113]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [93] 내지 [109] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 방법, 조성물, 또는 용도.
[117] [93] 내지 [116] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 방법, 조성물, 또는 용도.
[118] [93] 내지 [117] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물.
[119] C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물로서, 여기서 적어도 하나 이상의 핵산 성분은 설계 제작되고, 하나 이상의 핵산 성분은 복합체를 관심 표적으로 향하게 하며 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 복합체는 관심 표적 유전자좌에 결합하는, 조성물.
[120] [119]에 있어서, 관심 표적 유전자좌는 RNA를 포함하는, 조성물.
[121] [119] 또는 [120]에 있어서, 관심 표적 유전자좌의 변형은 가닥 손상을 포함하는, 조성물.
[122] [119] 또는 [120]에 있어서, C2c2 이펙터 단백질은 진핵 세포에서의 발현을 위해 코돈 최적화된, 조성물.
[123] [119] 또는 [120]에 있어서, C2c2 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고; 선택적으로 이펙터 단백질은 선택적으로 HEPN 도메인 내의 하나 이상의 돌연변이, 예를 들어 R597A, H602A, R1278A, 및/또는 H1283A를 함유하며, 이에 의해 복합체는 후성적 변형제 또는 전사 또는 번역 활성화 또는 억제 신호를 전달할 수 있는, 조성물.
[124] [123]에 있어서, 기능성 도메인은 표적 유전자좌의 전사 또는 번역을 변형시키는, 조성물.
[125] [119] 내지 [124] 중 어느 하나에 있어서, C2c2 이펙터 단백질은 적어도 하나 이상의 핵 국소화 신호를 포함하는, 조성물.
[126] [119]에 있어서, 관심 표적 유전자좌는 시험관내의 핵산 분자에 포함되어 있는, 조성물.
[127] [119]에 있어서, 관심 표적 유전자좌는 세포 내의 핵산 분자에 포함되어 있는, 조성물.
[128] [127]에 있어서, 세포는 원핵 세포를 포함하는, 조성물.
[129] [127]에 있어서, 세포는 진핵 세포를 포함하는, 조성물.
[130] [119] 내지 [129] 중 어느 하나에 있어서, 이펙터 단백질과 복합체화될 때 핵산 성분(들)은 관심 표적 유전자좌의 표적 서열에의 복합체의 서열 특이적 결합을 초래할 수 있는, 조성물.
[131] [119] 내지 [130] 중 어느 하나에 있어서, 핵산 성분(들)은 이중 직접 반복 서열을 포함하는, 조성물.
[132] [119] 내지 [127] 중 어느 하나에 있어서, 이펙터 단백질 및 핵산 성분(들)은 폴리펩티드 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공되며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 폴리펩티드 및/또는 핵산 성분(들)을 발현하는, 조성물.
[133] [128]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 폴리펩티드 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함하고, 선택적으로 여기서, 하나 이상의 조절 요소는 프로모터(들) 또는 유도성 프로모터(들)을 포함하는, 조성물.
[134] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함되는, 조성물.
[135] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 하나의 벡터 내에 포함되는, 조성물.
[136] [134] 또는 [135]에 있어서, 하나 이상의 벡터는 바이러스 벡터를 포함하는, 조성물.
[137] [136]에 있어서, 하나 이상의 바이러스 벡터는 하나 이상의 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 또는 단순 헤르페스바이러스 벡터를 포함하는, 조성물.
[138] [132] 또는 [133]에 있어서, 하나 이상의 폴리뉴클레오티드 분자는 전달 시스템에 포함되거나, [134] 또는 [135]에 있어서, 하나 이상의 벡터는 전달 시스템에 포함되거나, [119] 내지 [127] 중 어느 하나에 있어서, 조립된 복합체는 전달 시스템에 포함되는, 조성물.
[139] [1] 내지 [138] 중 어느 하나에 있어서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀(들), 입자(들), 엑소좀(들), 미세소포(들), 유전자총 또는 하나 이상의 바이러스 벡터(들)를 포함하는 전달 비히클을 통해 전달되는, 조성물.
[140] 하나 이상의 벡터를 포함하는 벡터 시스템으로서, 하나 이상의 벡터는 [1] 내지 [139] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레외드 분자를 포함하는, 벡터 시스템.
[141] [1] 내지 [140] 중 어느 하나에 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 전달하도록 구성된 전달 시스템.
[142] [141]에 있어서, 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하고, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 [1] 내지 [141] 중 어느 하나에 정의된 바와 같은 특징을 갖는 비-천연적으로 발생하거나 설계 제작된 조성물의 C2c2 이펙터 단백질 및 하나 이상의 핵산 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함하는, 전달 시스템.
[143] 치료의 치료적 방법에서의 사용을 위한, [1] 내지 [142] 또는 [144] 내지 [161] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템.
[144] [1] 내지 [143] 또는 [145] 내지 [161] 중 어느 하나의 조성물 또는 이의 성분을, 선택적으로 유도성으로 또는 구성적으로, 포함하거나 발현하도록 설계 제작되거나, 방법에 따라 변형된 세포.
[145] [144]에 있어서, 변형은 다음을 초래하는, 세포:
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포;
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 증가되는 세포; 또는
- 적어도 하나의 RNA 생산물의 변경된 전사 또는 번역을 포함하는 세포로서, 여기서 적어도 하나의 생산물의 발현이 감소되는 세포.
[146] [145]에 있어서, 세포는 진핵 세포를 포함하는, 세포.
[147] [144] 또는 [145]에 있어서, 포유류 세포를 포함하는, 세포.
[148] [144]에 있어서, 세포는 원핵 세포를 포함하는, 세포.
[149] 다음에서의 사용을 위한, [1] 내지 [148] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[150] [144] 내지 [148] 중 어느 하나에 따른 세포, 또는 이의 자손의 또는 이를 포함하는 세포주.
[151] [146] 또는 [147]에 따른 하나 이상의 세포를 포함하는 다세포 생물.
[152] [144] 내지 [147] 중 어느 하나에 따른 하나 이상의 세포를 포함하는 식물 또는 동물 모델로서; 상기 세포(들)는 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [151] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 식물 또는 동물 모델.
[153] 어느 하나의 세포, 또는 어느 하나의 세포주 또는 생물, 또는 [144] 내지 [148], [150] 내지 [152] 중 어느 하나의 식물 또는 동물 모델로부터의 생산물로서, 상기 세포 또는 세포주의 세포(들) 또는 생물 또는 식물 또는 동물 모델은 선택적으로 유도성으로 또는 구성적으로 [1] 내지 [152] 중 어느 하나의 조성물 또는 이의 성분을 발현하는, 생산물.
[154] [153]에 있어서, 생산물의 양은 [1] 내지 [153] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물의 양보다 더 많거나 더 적은, 생산물.
[155] [153]에 있어서, 생산물은 [1] 내지 [154] 중 어느 하나의 방법 또는 조성물에 의한 변경 또는 변형을 갖지 않는 세포로부터의 생산물과 비교하여 변경된, 생산물.
[156] [1] 내지 [155] 또는 [157] 내지 [161] 중 어느 하나의 시스템 또는 방법 또는 세포를 포함하는 분석, 스크리닝 방법 또는 돌연변이 유발 방법.
[157] RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법으로서, 여기서 개선은 RNA를 사용하는 것 대신에, 방법은 [1] 내지 [156] 중 어느 하나에서와 같은 조성물을 사용하는 것을 포함하는, 방법.
[158] [157]에 있어서, RNA-기반 분석, 스크리닝 방법 또는 돌연변이 유발 방법은 RNAi 또는 형광 인 시츄 혼성화 방법인, 방법.
[159] [1] 내지 [158] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 다음을 위한 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[160] [93] 내지 [117] 중 어느 하나에 있어서, 상기 방법은 다음을 초래하는, 방법 또는 용도:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
[161] 다음을 위한 방법으로서, [1] 내지 [160] 중 어느 하나의 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 표적 세포에서 시험관내, 생체외, 또는 생체내 도입하거나 유도하는 것을 포함하는 방법:
- RNA 서열 특이적 간섭,
- RNA 서열 특이적 유전자 조절,
- RNA 또는 RNA 생산물 또는 lincRNA 또는 비-코딩 RNA, 또는 핵 RNA, 또는 mRNA의 스크리닝,
- 돌연변이 유발,
- 형광 인 시츄 혼성화,
- 육종,
- 세포 휴면의 시험관내 또는 생체내 유도,
- 세포 주기 정지의 시험관내 또는 생체내 유도,
- 세포 성장 및/또는 세포 증식의 시험관내 또는 생체내 감소,
- 세포 아네르기의 시험관내 또는 생체내 유도,
- 세포 아폽토시스의 시험관내 또는 생체내 유도,
- 세포 괴사의 시험관내 또는 생체내 유도,
- 세포 사멸의 시험관내 또는 생체내 유도, 또는
- 프로그래밍된 세포 사멸의 시험관내 또는 생체내 유도.
본 발명은 구체적으로 진핵 세포, 조직, 기관, 또는 생물, 더욱 구체적으로 포유류 세포, 조직, 기관, 또는 생물에서 관심 표적 유전자좌의 또는 이와 연관된 핵산 서열을 변형시키는 방법을 제공하며, 방법은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 또는 이와 연관된 서열의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 바람직한 구현예에서, 관심 표적 유전자좌의 또는 이와 연관된 서열은 RNA를 포함하고 이펙터 단백질은 제VI형 CRISPR-Cas 유전자좌에 의해 인코딩된다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다.
용어 Cas 효소, CRISPR 효소, CRISPR 단백질 Cas 단백질 및 CRISPR Cas는 일반적으로 상호 교환 가능하게 사용되며 본 명세서에서 참고문헌의 모든 포인트에서, 구체적인 Cas9의 참조에 의하는 것과 같이 달리 명백하지 않은 한, 유추에 의해 본 명세서에 추가로 기재되는 신규한 CRISPR 이펙터 단백질을 지칭한다. 본 명세서에 기재된 CRISPR 이펙터 단백질은 바람직하게는 C2c2 이펙터 단백질이다.
본 발명은 관심 표적 유전자좌의 또는 이와 연관된 서열을 표적화(예를 들어 변형)하는 방법을 제공하며, 방법은 상기 유전자좌의 또는 이와 관련된 서열에 C2c2 유전자좌 이펙터 단백질(촉매적으로 활성이거나 대안적으로 촉매적으로 비활성인) 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 있는 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 또는 이와 연관된 서열의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 바람직한 구현예에서, C2c2 이펙터 단백질은 하나의 핵산 성분; 유리하게는 설계 제작되거나 비-천연적으로 발생 핵산 성분과 복합체를 형성한다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다. 관심 표적 유전자좌와 관련되거나 상기 표적 유전자좌에서의 서열의 변형의 도입은 C2c2 이펙터 단백질-핵산으로 가이드될 수 있다. 바람직한 구현예에서, 하나의 핵산 성분은 CRISPR RNA(crRNA)이다. 바람직한 구현예에서, 하나의 핵산 성분은 성숙 crRNA 또는 가이드 RNA이며, 상기 성숙 crRNA 또는 가이드 RNA는 스페이서 서열(또는 가이드 서열) 및 직접 반복 서열 또는 이들의 유도체를 포함한다. 바람직한 구현예에서, 스페이서 서열 또는 이의 유도체는 씨드(seed) 서열을 포함하며, 상기 씨드 서열은 표적 유전자좌에서 서열에 대한 인식 및/또는 혼성화에 중요하다.
본 발명의 일 양태는 하나 이상의 비-천연적으로 발생하거나 설계 제작되거나 변형되거나 최적화된 핵산 성분을 갖는 C2c2 이펙터 단백질 복합체에 관한 것이다. 바람직한 구현예에서, 상기 복합체의 핵산 성분은 직접 반복 서열에 연결된 가이드 서열을 포함할 수 있으며, 상기 직접 반복 서열은 하나 이상의 스템 루프(stem loop) 또는 최적화된 2차 구조를 포함한다. 특정 구현예에서, 직접 반복은 최소한의 길이가 16 nt, 예를 들어 적어도 28 nt이고 단일 스템 루프를 갖는다. 추가 구현예에서, 직접 반복은 길이가 16 nt보다 더 길며, 바람직하게는 17 nt 초과, 에를 들어 적어도 28 nt이고, 하나 초과의 스템 루프 또는 최적화된 2차 구조를 갖는다. 구체적인 구현예에서, 직접 반복은 25 이상 nts, 예를 들어 26 nt, 27 nt, 28 nt 이상, 및 하나 이상의 스템 루프 구조를 갖는다. 바람직한 구현예에서, 직접 반복은 변형되어 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 바람직한 구현예에서, 최적화된 2차 구조의 일부와 같은 하나 이상의 압타머가 포함될 수 있다. 이와 같은 압타머는 박테리오파지 코트 단백질에 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리오파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
본 발명은 제VI형 이펙터 단백질 및/또는 가이드 및 또는 표적 핵산과 이들의 복합체를 포함하는 세포를 제공한다. 특정 구현예에서, 세포는 효모 세포, 식물 세포, 포유류 세포, 동물 세포, 또는 인간 세포를 포함 하나 이에 한정되지 않는, 진핵 세포이다.
본 발명은 또한 구체적으로 진핵 세포, 조직, 기관, 또는 생물, 더욱 구체적으로 포유류 세포, 조직, 기관, 또는 생물에서 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 C2c2 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다. 복합체는 시험관내 또는 생체외에서 형성되어 세포 내로 도입되거나 RNA와 접촉될 수 있거나; 생체내에서 형성될 수 있다.
이러한 방법에서, 관심 표적 유전자좌는 RNA 분자 내에 포함될 수 있다. 또한, 관심 표적 유전자좌는 DNA 분자 내에 포함될 수 있고, 특정 구현예에서, 전사된 DNA 분자 내에 포함될 수 있다. 이러한 방법에서, 관심 표적 유전자좌는 시험관내 핵산 분자에 포함될 수 있다.
이러한 방법에서 관심 표적 유전자좌는 세포, 구체적으로 포유류 세포 또는 식물 세포와 같은 진핵 세포 내의 핵산 분자에 포함될 수 있다. 포유류 세포는 비인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 비포유류 진핵 세포, 예를 들어 가금류, 어류 또는 새우일 수 있다. 식물 세포는 농작물, 예를 들어 카사바, 옥수수, 수수, 밀, 또는 벼의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 채소의 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생물학적 생성물, 예를 들어 항체, 전분, 알콜 또는 다른 원하는 세포 산출물의 개선된 생성을 위하여 변경되도록 하는 것일 수 있다. 본 발명에 의해 세포에 도입된 변형은 세포 및 세포의 자손이 생성된 생물학적 생성물을 변화시키는 변경을 포함하도록 하는 것일 수 있다.
포유류 세포는 비인간 포유류, 예를 들어 영장류, 소, 양, 돼지, 개, 설치류, 토끼과, 예를 들어 원숭이, 소, 양, 돼지, 개, 토끼, 래트 또는 마우스 세포일수 있다. 세포는 비인간 진핵 세포, 예를 들어 가금류 조류(예를 들어, 닭), 척추동물 어류(예를 들어, 연어) 또는 패류(예를 들어, 굴, 조개, 바닷가재, 새우) 세포일 수 있다. 세포는 또한 식물 세포일 수 있다. 식물 세포는 단자엽식물 또는 쌍자엽식물의 것 또는 작물 또는 곡물 식물, 예를 들어 카사바, 옥수수, 수수, 대두, 밀, 귀리 또는 벼의 것일 수 있다. 식물 세포는 또한 조류, 수목 또는 생산성 식물, 과일 또는 채소(예를 들어, 수목, 예를 들어 감귤 나무, 예를 들어 오렌지, 자몽 또는 레몬 나무; 복숭아 또는 넥타린 나무; 사과 또는 배 나무; 견과류 나무, 예를 들어 아몬드 또는 호두 또는 피스타치오 나무; 가지속 식물; 유채속(Brassica)의 식물; 락투카(Lactuca) 속의 식물; 시금치(Spinacia) 속; 고추속(Capsicum)의 식물; 목화, 담배, 아스파라거스, 당근, 양배추, 브로콜리, 콜리플라워, 토마토, 가지, 후추, 상추, 시금치, 딸기, 블루베리, 라즈베리, 블랙베리, 포도, 커피, 코코아 등)의 것일 수 있다.
본 발명은 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다.
본 발명은 또한 관심 표적 유전자좌를 변형시키는 방법을 제공하며, 방법은 C2c2 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 상기 유전자좌에 전달하는 것을 포함하며, 여기서 C2c2 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 바람직한 구현예에서, 변형은 가닥 손상의 도입이다.
이러한 방법에서, 관심 표적 유전자좌는 시험관내 핵산 분자에 포함될 수 있다. 이러한 방법에서, 관심 표적 유전자좌는 세포내 핵산 분자에 포함될 수 있다. 바람직하게는, 이러한 방법에서, 관심 표적 유전자좌는 시험관내 RNA 분자 내에 포함될 수 있다. 또한 바람직하게는, 이러한 방법에서, 관심 표적 유전자좌는 세포내 RNA 분자 내에 포함될 수 있다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유류 세포일 수 있다. 세포는 설치류 세포일 수 있다. 세포는 마우스 세포일 수 있다.
기재된 방법 중 임의의 것에서, 관심 표적 유전자좌는 관심 있는 게놈 또는 후성유전체 유전자좌일 수 있다. 기재된 방법 중 임의의 것에서, 복합체는 다중화된 사용을 위한 다수의 가이드와 함께 전달될 수 있다. 기재된 방법 중 임의의 것에서 하나 초과의 단백질(들)이 사용될 수 있다.
본 발명의 추가의 양태에서, 핵산 성분은 CRISPR RNA(crRNA) 서열을 포함 할 수 있다. 제한없이, 출원인은 이러한 경우에 pre-crRNA가 성숙 crRNA뿐만 아니라 이펙터 단백질 상으로의 crRNA 로딩을 생산하기 위한 프로세싱에 충분한 2차 구조를 포함할 수 있다고 가정한다. 제한이 아닌 예로서, 이러한 2 차 구조는 pre-crRNA 내의, 더욱 구체적으로는 직접 반복 내의 스템 루프를 포함하거나, 스템 루프로 본질적으로 구성되거나, 스템 루프로 구성될 수 있다.
기재된 방법 중 임의의 것에서, 이펙터 단백질 및 핵산 성분은 단백질 및/또는 핵산 성분(들)을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 통해 제공될 수 있으며, 여기서 하나 이상의 폴리뉴클레오티드 분자는 작동 가능하게 구성되어 단백질 및/또는 핵산 성분(들)을 발현한다. 하나 이상의 폴리뉴클레오티드 분자는 단백질 및/또는 핵산 성분(들)을 발현하기 위해 작동 가능하게 구성된 하나 이상의 조절 요소를 포함할 수 있다. 하나 이상의 폴리뉴클레오티드 분자는 하나 이상의 벡터 내에 포함될 수 있다. 기재된 방법 중 임의의 것에서, 관심 표적 유전자좌는 관심 있는 게놈 또는 후성유전체 유전자좌일 수 있다. 기재된 방법 중 임의의 것에서, 복합체는 다중화된 사용을 위해 다수의 가이드와 함께 전달될 수 있다. 기재된 방법 중 임의의 것에서, 하나보다 많은 단백질(들)이 사용될 수 있다.
조절 요소는 유도성 프로모터를 포함할 수 있다. 폴리뉴클레오티드 및/또는 벡터 시스템은 유도성 시스템을 포함할 수 있다.
기재된 방법 중 임의의 것에서, 하나 이상의 폴리뉴클레오티드 분자가 전달 시스템에 포함될 수 있거나, 하나 이상의 벡터가 전달 시스템에 포함될 수 있다.
기재된 방법 중 임의의 것에서, 비-천연적으로 발생하거나 설계 제작된 조성물은 리포좀, 나노입자를 포함하는 입자, 엑소좀, 미세소포, 유전자총 또는 하나 이상의 바이러스 벡터를 통해 전달될 수 있다.
본 발명은 또한 본 명세서에서 논의되거나 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물을 제공한다.
특정 구현예에서, 본 발명은 따라서, 구체적으로 관심 표적 유전자좌를 변형할 수 있거나 또는 변형하도록 환경 설정된 조성물과 같은, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하고, 상기 조성물은 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 및 하나 이상의 핵산 성분을 포함하며, 여기서 이펙터 단백질은 하나 이상의 핵산 성분과 복합체를 형성하고 상기 복합체의 관심 유전자좌에의 결합 즉시 이펙터 단백질은 관심 표적 유전자좌의 변형을 유도한다. 특정 구현예에서, 이펙터 단백질은 C2c2 유전자좌 이펙터 단백질일 수 있다.
본 발명은 또한 추가의 양태에서, 구체적으로 관심 표적 유전자좌를 변형할 수 있거나 또는 변형하도록 환경 설정된 조성물과 같은, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하고, 상기 조성물은:(a) 가이드 RNA 분자(또는 다중화용 RNA와 같은, 예를 들어 제1 가이드 RNA 분자 및 제2 가이드 RNA 분자인, 가이드 RNA 분자의 조합) 또는 가이드 RNA 분자를 인코딩하는 핵산(또는 가이드 RNA 분자의 조합을 인코딩하는 하나 이상의 핵산);(b) 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질 또는 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질을 인코딩하는 핵산을 포함한다. 특정 구현예에서, 이펙터 단백질은 C2c2 유전자좌 이펙터 단백질일 수 있다.
본 발명은 또한 추가의 양태에서, (a) 가이드 RNA 분자(또는 예를 들어 제1 가이드 RNA 분자 및 제2 가이드 RNA 분자인, 가이드 RNA 분자의 조합) 또는 가이드 RNA 분자를 인코딩하는 핵산(또는 가이드 RNA 분자의 조합을 인코딩하는 하나 이상의 핵산); (b) C2c2 유전자좌 이펙터 단백질을 포함하는, 비-천연적으로 발생하거나 설계 제작된 조성물을 제공한다.
본 발명은 또한 하나 이상의 벡터를 포함하는 벡터 시스템을 제공하며, 하나 이상의 벡터는 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 하나 이상의 벡터 또는 하나 이상의 폴리뉴클레오티드 분자를 포함하는 전달 시스템을 제공하며, 하나 이상의 벡터 또는 폴리뉴클레오티드 분자는 본 명세서에서 논의되거나 본 명세서에 기재된 방법 중 임의의 것에서 정의된 바와 같은 특징을 갖는 조성물인 비-천연적으로 발생하거나 설계 제작된 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드 분자를 포함한다.
본 발명은 또한 비-천연적으로 발생하거나 설계 제작된 조성물, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 치료의 치료 방법에서 사용하기 위한 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템을 제공한다. 치료의 치료 방법은 유전자 또는 트랜스크립톰 편집, 또는 유전자 요법을 포함할 수 있다.
본 발명은 또한 이펙터 단백질의 하나 이상의 아미노산 잔기가 변형될 수 있는, 예를 들어 설계 제작되거나 비-천연적으로 발생하는 이펙터 단백질 또는 C2c2일 수 있는 방법 및 조성물을 제공한다. 일 구현예에서, 변형은 이펙터 단백질의 하나 이상의 아미노산 잔기의 돌연변이를 포함할 수 있다. 하나 이상의 돌연변이는 이펙터 단백질의 하나 이상의 촉매적으로 활성인 도메인에 존재할 수 있다. 이펙터 단백질은 하나 이상의 돌연변이가 없는 이펙터 단백질과 비교하여 감소되거나 제거된 뉴클레아제 활성을 가질 수 있다. 이펙터 단백질은 관심 표적 유전자좌에서 RNA 가닥의 절단을 지시하지 않을 수 있다. 바람직한 구현예에서, 하나 이상의 돌연변이는 2 개의 돌연변이를 포함할 수 있다. 바람직한 구현예에서, 하나 이상의 아미노산 잔기는 C2c2 이펙터 단백질, 예를 들어 설계 제작되거나 비-천연적으로 발생하는 이펙터 단백질 또는 C2c2에서 변형된다. 구체적인 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 돌연변이 R597A, H602A, R1278A 및 H1283A, 또는 Lsh C2c2 오솔로그에서의 상응하는 아미노산 잔기와 같이, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 C2c2에서의 것들 중 하나 이상이다.
구체적인 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, C2c2 컨센서스 넘버링에 따라, K2, K39, V40, E479, L514, V518, N524, G534, K535, E580, L597, V602, D630, F676, L709, I713, R717 (HEPN), N718, H722 (HEPN), E773, P823, V828, I879, Y880, F884, Y997, L1001, F1009, L1013, Y1093, L1099, L1111, Y1114, L1203, D1222, Y1244, L1250, L1253, K1261, I1334, L1355, L1359, R1362, Y1366, E1371, R1372, D1373, R1509 (HEPN), H1514 (HEPN), Y1543, D1544, K1546, K1548, V1551, I1558에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 R717 및 R1509에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 K2, K39, K535, K1261, R1362, R1372, K1546 및 K1548에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 상기 돌연변이는 변경된 또는 변형된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 증가된 특이성과 같은 증가된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 감소된 특이성과 같은 감소된 활성을 갖는 단백질을 초래한다. 특정 구현예에서, 상기 돌연변이는 촉매 활성이 없는 단백질(즉, "데드(dead)" C2c2)을 초래한다. 일 구현예에서, 상기 아미노산 잔기는 Lsh C2c2 아미노산 잔기, 또는 상이한 종 유래의 C2c2 단백질의 상응하는 아미노산 잔기에 상응한다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, 도 3에 표시된, 즉, 렙토트리키아 와데이(Leptotrichia wadei) F0279("Lew2" 또는 "Lw2") 및 리스테리아 뉴요켄시스(Listeria newyorkensis) FSL M6-0635(리스테리아세아에 박테리움(Listeriaceae bacterium) FSL M6-0635으로도 알려짐("Lib" 또는 "LbFSL"))의 정렬에 기반한, 컨센서스 서열을 참고하여, M35, K36, T38, K39, I57, E65, G66, L68, N84, T86, E88, I103, N105, E123, R128, R129, K139, L152, L194, N196, K198, N201, Y222, D253, I266, F267, S280, I303, N306, R331, Y338, K389, Y390, K391, I434, K435, L458, D459, E462, L463, I478, E479, K494, R495, N498, S501, E519, N524, Y529, V530, G534, K535, Y539, T549, D551, R577, E580, A581, F582, I587, A593, L597, I601, L602, E611, E613, D630, I631, G633, K641, N646, V669, F676, S678, N695, E703, A707, I709, I713, I716, R717, H722, F740, F742, K768, I774, K778, I783, L787, S789, V792, Y796, D799, F812, N818, P820, F821, V822, P823, S824, F825, Y829, K831, D837, L852, F858, E867, A871, L875, K877, Y880, Y881, F884, F888, F896, N901, V903, N915, K916, R918, Q920, E951, P956, Y959, Q964, I969, N994, F1000, I10001, Q1003, F10005, K1007, G1008, F1009, N1019, L1020, K1021, I1023, N1028, E1070, I1075, K1076, F1092, K1097, L1099, L1104, L1107, K1113, Y1114, E1149, E1151, I1153, L1155, L1158, D1166, L1203, D1222, G1224, I1228, R1236, K1243, Y1244, G1245, D1255, K1261, S1263, L1267, E1269, K1274, I1277, E1278, L1289, H1290, A1294, N1320, K1325, E1327, Y1328, I1334, Y1337, K1341, N1342, K1343, N1350, L1352, L1355, L1356, I1359, L1360, R1362, V1363, G1364, Y1365, I1369, R1371, D1372, F1385, E1391, D1459, K1463, K1466, R1509, N1510, I1512, A1513, H1514, N1516, Y1517, L1529, L1530, E1534, L1536, R1537, Y1543, D1544, R1545, K1546, L1547, K1548, N1549, A1550, K1553, S1554, D1557, I1558, L1559, G1563, F1568, I1612, L1651, E1652, K1655, H1658, L1659, K1663, T1673, S1677, E1678, E1679, C1681, V1684, K1685, E1689에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 앞서 표시된 바와 같이, 상기 아미노산 잔기 목록에서, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 잔기는 제외된다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는 하나 이상의 보존된 하전 아미노산 잔기이다. 특정 구현예에서, 상기 아미노산 잔기는 알라닌으로 돌연변이될 수 있다.
특정 구현예에서, 하나 이상의 변형 또는 돌연변이된 아미노산 잔기는, 도 2에 표시된, 즉, 도 1에 표시된 C2c2 오솔로그의 정렬에 기반한, 컨센서스 서열을 참고하여, K28, K31, R44, E162, E184, K262, E288, K357, E360, K338, R441 (HEPN), H446 (HEPN), E471, K482, K525, K558, D707, R790, K811, R833, E839, R885, E894, R895, D896, K942, R960 (HEPN), H965 (HEPN), D990, K992, K994에 상응하는 C2c2에서의 것들 중 하나 이상이다. 특정 구현예에서, 앞서 표시된 바와 같이, 상기 아미노산 잔기 목록에서, R597, H602, R1278 및 H1283(Lsh C2c2 아미노산 참조)에 상응하는 잔기는 제외된다.
본 발명은 또한 하나 이상의 돌연변이 또는 2 개 이상의 돌연변이가 이펙터 단백질의 촉매적 활성 도메인에 존재하는 것을 제공한다. 특정 구현예에서, 하나 이상의 돌연변이 또는 2 개 이상의 돌연변이는 HEPN 도메인, 또는 HEPN 도메인에 상동인 촉매 활성 도메인을 포함하는 이펙터 단백질의 촉매적 활성 도메인에 존재할 수 있다. 이펙터 단백질은 하나 이상의 이종 기능성 도메인을 포함 할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 핵 국소화 신호(NLS) 도메인을 포함할 수 있다. 하나 이상의 이종 기능성 도메인은 적어도 2 개 이상의 NLS 도메인을 포함할 수 있다. 하나 이상의 NLS 도메인(들)은 이펙터 단백질(예를 들어, C2c2)의 말단에 또는 근처에 또는 근접하게 위치할 수 있고 2 개 이상의 NLS의 경우, 2 개 각각은 이펙터 단백질(예를 들어, C2c2)의 말단에 또는 근처에 또는 근접하게 위치할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 번역 활성화 도메인을 포함할 수 있다. 다른 구현예에서, 기능성 도메인은 전사 활성화 도메인, 예를 들어 VP64를 포함할 수 있다. 하나 이상의 이종 기능성 도메인은 하나 이상의 전사 억제 도메인을 포함할 수 있다. 특정 구현예에서, 전사 억제 도메인은 KRAB 도메인 또는 SID 도메인(예를 들어, SID4X)을 포함한다. 하나 이상의 이종 기능성 도메인은 하나 이상의 뉴클레아제 도메인을 포함할 수 있다. 바람직한 구현예에서, 뉴클레아제 도메인은 Fok1을 포함한다.
본 발명은 또한 하나 이상의 이종 기능성 도메인이 다음의 활성 중 하나 이상을 갖는 것을 제공한다: 메틸라제 활성, 데메틸라제 활성, 번역 활성화 활성, 번역 억제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, 뉴클레아제 활성, 단일-가닥 RNA 절단 활성, 이중-가닥 RNA 절단 활성, 단일-가닥 DNA 절단 활성, 이중-가닥 DNA 절단 활성 및 핵산 결합 활성. 본 발명의 특정 구현예에서, 하나 이상의 이종 기능성 도메인은 에피토프 태그 또는 리포터를 포함할 수 있다. 에피토프 태그의 비-제한적인 예로는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그, 및 티오레독신(Trx) 태그가 포함된다. 리포터의 예로는 글루타티온-S-트랜스페라제(GST), 홀스래디쉬 페록시다제(HRP), 클로람페니콜 아세틸트랜스페라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시페라제, 녹색 형광 단백질(GFP), HcRed, DcRed, 시안 형광 단백질(CFP), 황색 형광 단백질(YFP), 및 청색 형광 단백질(BFP)을 포함하는 자가 형광 단백질이 포함된다.
적어도 하나 이상의 이종 기능성 도메인은 이펙터 단백질의 아미노-말단에 또는 상기 말단 근처에 존재할 수 있고/있거나 여기서 적어도 하나 이상의 이종 기능성 도메인은 이펙터 단백질의 카르복시-말단에 또는 상기 말단 근처에 존재한다. 하나 이상의 이종 기능성 도메인은 이펙터 단백질과 융합될 수 있다. 하나 이상의 이종 기능성 도메인은 이펙터 단백질에 묶일 수 있다. 하나 이상의 이종 기능성 도메인은 링커 모이어티에 의해 이펙터 단백질에 연결될 수 있다.
본 발명은 또한 스트렙토코커스(Streptococcus), 캄필로박터(Campylobacter), 니트라티프락토르(Nitratifractor), 스타필로코커스(Staphylococcus), 파르비바쿨룸(Parvibaculum), 로세부리아(Roseburia), 네이세리아(Neisseria), 글루콘아세토박터(Gluconacetobacter), 아조스피릴룸(Azospirillum), 스파에로카에타(Sphaerochaeta), 락토바실러스(Lactobacillus), 유박테리움(Eubacterium), 코리네박터(Corynebacter), 카르노박테리움(Carnobacterium), 로도박터(Rhodobacter), 리스테리아(Listeria), 팔루디박터(Paludibacter), 클로스트리디움(Clostridium), 라크노스피라세아에(Lachnospiraceae), 클로스트리디아리디움(Clostridiaridium), 렙토트리키아(Leptotrichia), 프란시셀라(Francisella), 레지오넬라(Legionella), 알리사이클로바실러스(Alicyclobacillus), 메타노메티오필러스(Methanomethyophilus), 포르피로모나스(Porphyromonas), 프레보텔라(Prevotella), 박테로이데테스(Bacteroidetes), 헬코코커스(Helcococcus), 레토스피라(Letospira), 데설포비브리오(Desulfovibrio), 데설포나트로눔(Desulfonatronum), 오피투타세아에(Opitutaceae), 투베리바실러스(Tuberibacillus), 바실러스(Bacillus), 브레비바실러스(Brevibacilus), 메틸로박테리움(Methylobacterium) 또는 아시다미노코커스(Acidaminococcus)를 포함하는 속으로부터의 생물 유래의 이펙터 단백질을 포함하는 이펙터 단백질을 제공한다. 이펙터 단백질은 제1 이펙터 단백질 오솔로그 유래의 제1 단편 및 제2 이펙터 단백질 오솔로그 유래의 제2 단편을 포함하는 키메라 이펙터 단백질을 포함할 수 있으며, 여기서 제1 및 제2 이펙터 단백질 오솔로그는 상이하다. 제1 및 제2 이펙터 단백질 오솔로그 중 적어도 하나는 스트렙토코커스, 캄필로박터, 니트라티프락토르, 스타필로코커스, 파르비바쿨룸, 로세부리아, 네이세리아, 글루콘아세토박터, 아조스피릴룸, 스파에로카에타, 락토바실러스, 유박테리움, 코리네박터, 카르노박테리움, 로도박터, 리스테리아, 팔루디박터, 클로스트리디움, 라크노스피라세아에, 클로스트리디아리디움, 렙토트리키아, 프란시셀라, 레지오넬라, 알리사이클로바실러스, 메타노메티오필러스, 포르피로모나스, 프레보텔라, 박테로이데테스, 헬코코커스, 레토스피라, 데설포비브리오, 데설포나트로눔, 오피투타세아에, 투베리바실러스, 바실러스, 브레비바실러스, 메틸로박테리움 또는 아시다미노코커스를 포함하는 생물 유래의 이펙터 단백질을 포함할 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 분류군 알파-프로테오박테리아, 바실리(Bacilli), 클로스트리디아(Clostridia), 푸소박테리아(Fusobacteria) 및 박테로이데테스(Bacteroidetes)에 속하는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 라크노스피라세아에, 클로스트리디움, 카르노박테리움, 팔루디박터, 리스테리아, 렙토트리키아, 및 로도박터로 구성된 군으로부터 선택되는 속에 속하는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 라크노스피라세아에 박테리움(Lachnospiraceae bacterium) MA2020, 라크노스피라세아에 박테리움 NK4A179, 클로스트리디움 아미노필룸(Clostridium aminophilum)(예를 들어, DSM 10710), 라크노스피라세아에 박테리움 NK4A144, 카르노박테리움 갈리나룸(Carnobacterium gallinarum)(예를 들어, DSM 4847 균주 MT44), 팔루디박터 프로피오니시게네스(Paludibacter propionicigenes)(예를 들어, WB4), 리스테리아 세엘리게리(Listeria seeligeri)(예를 들어, 혈청형 1/2b 균주 SLCC3954), 리스테리아 웨이헨스테파넨시스(Listeria weihenstephanensis)(예를 들어, FSL R9-0317 c4), 리스테리아 뉴요켄시스(예를 들어, 균주 FSL M6-0635: 또한 "LbFSL", 렙토트리키아 와데이(예를 들어, F0279: 또한 "Lw" 또는 "Lw2", 렙토트리키아 부칼리스(Leptotrichia buccalis)(예를 들어, DSM 1135), 렙토트리키아 종 오랄(Leptotrichia sp. Oral) 분류군 225(예를 들어, 균주 F0581), 렙토트리키아 종 오랄 분류군 879(예를 들어, 균주 F0557), 렙토트리키아 샤히(Leptotrichia shahii)(예를 들어, DSM 19757), 로도박터 캅술라투스(Rhodobacter capsulatus)(예를 들어, SB 1003, R121, 또는 DE442)로 구성된 군으로부터 선택되는 박테리아 종으로부터 기원될 수 있거나, 단리될 수 있거나, 유래될 수 있다. 특정 바람직한 구현예에서, C2c2 이펙터 단백질은 리스테리아세아에 박테리움 (예를 들어, FSL M6-0635: 또한 "LbFSL", 라크노스피라세아에 박테리움 MA2020, 라크노스피라세아에 박테리움 NK4A179, 클로스트리디움 아미노필룸(예를 들어, DSM 10710), 카르노박테리움 갈리나룸(예를 들어, DSM 4847), 팔루디박터 프로피오니시게네스(예를 들어, WB4), 리스테리아 세엘리게리(예를 들어, 혈청형 ?b 균주 SLCC3954), 리스테리아 웨이헨스테파넨시스(예를 들어, FSL R9-0317 c4), 렙토트리키아 와데이(예를 들어, F0279: 또한 "Lw" 또는 "Lw2", 렙토트리키아 샤히(예를 들어, DSM 19757), 로도박터 캅술라투스(예를 들어, SB 1003, R121, 또는 DE442); 바람직하게는 리스테리아세아에 박테리움 FSL M6-0635(즉, 리스테리아 뉴요켄시스 FSL M6-0635: 도 4 내지 7의 "LbFSL" 또는 렙토트리키아 와데이 F0279(또한 "Lw" 또는 "Lw2")로부터 기원한다.
특정 구현예에서, 본 명세서에서 의도된 제VI형 유전자좌는 Cas1, Cas2 및 C2c2p 이펙터 단백질을 인코딩할 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 천연 C2c2p와 같은 C2c2p는, 약 1100 내지 약 1400 아미노산 길이와 같은, 약 1000 내지 약 1500 아미노산 길이, 예를 들어 약 1000 내지 약 1100, 약 1100 내지 약 1200 아미노산 길이, 또는 약 1200 내지 약 1300 아미노산 길이, 또는 약 1300 내지 약 1400 아미노산 길이, 또는 약 1400 내지 약 1500 아미노산 길이, 예를 들어 약 1000, 약 1100, 약 1200, 약 1300, 약 1400 또는 약 1500 아미노산 길이일 수 있다.
특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 적어도 하나, 바람직하게는 적어도 2 개, 예를 들어 더욱 바람직하게는 정확히 2 개의 보존된 RxxxxH 모티프를 포함한다. 촉매성 RxxxxH 모티프는 HEPN(고등 진핵 생물 및 원핵 생물 뉴클레오티드-결합, Higher Eukaryotes and Prokaryotes Nucleotide-binding) 도메인의 특징이다. 따라서, 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 적어도 하나 및 바람직하게는 적어도 2 개, 예를 들어 더욱 바람직하게는 정확히 2 개의 HEPN 도메인을 포함한다. 특정 구현예에서, HEPN 도메인은 알엔아제 활성을 보유할 수 있다. 다른 구현예에서, HEPN 도메인은 디엔아제 활성을 보유할 수 있다.
특정 구현예에서, 본 명세서에서 의도된 제VI형 유전자좌는 30 및 40 bp 길이 사이, 더욱 전형적으로 35 및 39 bp 길이 사이, 예를 들어 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40 bp 길이의 CRISPR 반복을 포함할 수 있다. 구체적인 구현예에서, 직접 반복은 적어도 25 nt 길이이다.
특정 구현예에서, 프로토스페이서 인접 모티프(PAM) 또는 PAM-유사 모티프는 본 명세서에 개시된 이펙터 단백질 복합체의 관심 표적 유전자좌에의 결합을 지시한다. 일부 구현예에서, PAM은 5' PAM(즉, 프로토스페이서의 5' 말단의 업스트림에 위치)일 수 있다. 다른 구현예에서, PAM은 3' PAM(즉, 프로토스페이서의 5' 말단의 다운스트림에 위치)일 수 있다. 용어 "PAM"은 용어 "PFS" 또는 "프로토스페이서 측면 부위" 또는 "프로토스페이서 측면 서열"과 상호 교환 가능하게 사용할 수 있다.
바람직한 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 3' PAM을 인식할 수 있다. 특정 구현예에서, 이펙터 단백질, 구체적으로 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p는 5'H인 3' PAM을 인식할 수 있으며, 여기서 H는 A, C 또는 U 이다. 특정 구현예에서, 이펙터 단백질은 렙토트리키아 샤히 C2c2p, 더욱 바람직하게는 렙토트리키아 샤히DSM 19757 C2c2일 수 있고, 5' PAM은 5'H이다. 특정 구현예에서, 이펙터 단백질은 렙토트리키아 와데이 F0279(Lw2) C2c2일 수 있고, 5' PAM은 H이며, 여기서 H는 C, U 또는 A이다.
특정 구현예에서, CRISPR 효소는 설계 제작되어 뉴클레아제 활성을 감소시키거나 제거하는 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 이웃 잔기, 예를 들어 뉴클레아제 활성에 참여하는 상기 표시된 것들 근처의 아미노산에서 또한 일어날 수 있다. 일부 구현예에서, 오직 하나의 HEPN 도메인이 비활성화되고, 다른 구현예에서, 제2 HEPN 도메인이 비활성화된다.
본 발명의 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 직접 반복 서열 및 가이드 서열 또는 스페이서 서열을 포함하거나, 이로 본질적으로 구성되거나 또는 이로 구성된다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 가이드 서열 또는 스페이서 서열에 연결된 직접 반복 서열을 포함하거나, 이로 본질적으로 구성되거나 이로 구성된다. 특정 구현예에서, 가이드 RNA 또는 성숙 crRNA는 19 nt의 부분적 직접 반복 뒤에 따라오는 18, 19, 20, 21, 22, 23, 24, 25 이상 nt의 가이드 서열, 예를 들어 18 내지 25, 19 내지 25, 20 내지 25, 21 내지 25, 22 내지 25, 또는 23 내지 25 nt의 가이드 서열 또는 스페이서 서열을 포함한다. 특정 구현예에서, 이펙터 단백질은 C2c2 이펙터 단백질이며, 검출 가능한 DNA 절단을 달성하기 위하여 적어도 16 nt의 가이드 서열을 필요로 하고 시험관내에서 효율적인 DNA 절단을 달성하기 위해 최소 17 nt의 가이드 서열을 필요로 한다. 구체적인 구현예에서, 이펙터 단백질은 C2c2 단백질이고 검출 가능한 RNA 절단을 달성하기 위하여 적어도 19 nt의 가이드 서열을 필요로 한다. 특정 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 업스트림(즉, 5')에 위치된다. 바람직한 구현예에서, C2c2 가이드 RNA의 씨드 서열(즉, 표적 유전자좌의 서열에 대한 인식 및/또는 혼성화에 본질적으로 중요한 서열)은 가이드 서열 또는 스페이서 서열의 5' 말단에서 대략적으로 처음 5 개 nt 내에 존재한다.
본 발명의 바람직한 구현예에서, 성숙 crRNA는 스템 루프 또는 최적화된 스템 루프 구조 또는 최적화된 2차 구조를 포함한다. 바람직한 구현예에서, 성숙 crRNA는 직접 반복 서열에서 스템 루프 또는 최적화된 스템 루프 구조를 포함하며, 여기서 스템 루프 또는 최적화된 스템 루프 구조는 절단 활성에 중요하다. 특정 구현예에서, 성숙 crRNA는 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 직접 반복 서열은 바람직하게 단일 스템 루프를 포함한다. 특정 구현예에서, 이펙터 단백질 복합체의 절단 활성은 스템 루프 RNA 듀플렉스 구조에 영향을 미치는 돌연변이를 도입함으로써 변형된다. 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 유지하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 유지된다. 다른 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스 구조를 방해하는 돌연변이가 도입될 수 있으며, 이에 의해 이펙터 단백질 복합체의 절단 활성이 완전히 없어진다.
특정 구현예에서, C2c2 단백질은 Lsh C2c2 이펙터 단백질이고, 성숙 crRNA는 스템 루프 또는 최적화된 스템 루프 구조를 포함한다. 구체적인 구현예에서, crRNA의 직접 반복은 스템 루프를 포함하는 적어도 25 개의 뉴클레오티드를 포함한다. 구체적인 구현예에서, 스템은 개별적인 염기 교환의 여지가 있으나 활성은 대부분의 2 차 구조 변화 또는 crRNA의 절단에 의해 방해된다. 방해 돌연변이의 예로는 스템 뉴클레오티드 중 2 개 초과의 교환, 스템에 쌍을 이루지 않는 뉴클레오티드 부가, 스템 단축(쌍을 이루는 뉴클레오티드 중 하나의 제거에 의해) 또는 스템 연장(쌍을 이루는 뉴클레오티드 하나의 세트 부가에 의해)이 포함된다. 그러나, crRNA는 본 명세서에 기재된 구체적인 응용에 대해 예상되는 바와 같이, 비-기능성 RNA 서열을 포함하기 위해 5' 및/또는 3' 연장의 여지가 있을 수 있다.
본 발명은 또한 본 명세서에 기재된 임의의 방법 또는 조성물에서 진핵생물 또는 진핵 세포에서의 발현을 위해 코돈 최적화된 이펙터 단백질을 인코딩하는 뉴클레오티드 서열을 제공한다. 본 발명의 일 구현예에서, 코돈 최적화된 이펙터 단백질 인코딩 뉴클레오티드 서열은 본 명세서에서 논의된 임의의 C2c2를 인코딩하고 진핵 세포 또는 생물, 예를 들어 본 명세서의 다른 곳에 언급된 바와 같은 세포 또는 생물, 예를 들어, 제한 없이, 효모 세포, 또는 마우스 세포, 래트 세포, 및 인간 세포를 포함하는 포유류 세포 또는 생물, 또는 비-인간 진핵 생물, 예를 들어 식물에서 작동 가능성을 위해 코돈 최적화된다.
본 발명의 특정 구현예에서, 적어도 하나의 핵 국소화 신호(NLS)가 C2c2 이펙터 단백질을 인코딩하는 핵산 서열에 부착된다. 바람직한 구현예에서, 적어도 하나 이상의 C-말단 또는 N-말단 NLS가 부착된다(그리고 이에 따라 C2c2 이펙터 단백질을 코딩하는 핵산 분자(들)는 NLS(들)에 대한 코딩을 포함할 수 있어 발현된 생산물이 부착되거나 연결된 NLS(들)를 갖는다). 본 발명의 특정 구현예에서, 적어도 하나의 핵 방출 신호(NES)는 C2c2 이펙터 단백질을 인코딩하는 핵산 서열에 부착된다. 바람직한 구현예에서, 적어도 하나 이상의 C-말단 또는 N-말단 NES가 부착된다(그리고 이에 따라 C2c2 이펙터 단백질을 코딩하는 핵산 분자(들)는 NES(들)에 대한 코딩을 포함할 수 있어 발현된 생산물이 부착되거나 연결된 NES(들)를 갖는다). 바람직한 구현예에서, C-말단 및/또는 N-말단 NLS 또는 NES는 진핵 세포, 바람직하게는 인간 세포에서 최적 발현 및 핵 표적화를 위해 부착된다. 바람직한 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 특정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 16 개 뉴클레오티드, 예를 들어 적어도 17 개 뉴클레오티드, 바람직하게는 적어도 18 nt, 예를 들어 바람직하게는 적어도 19 nt, 적어도 20 nt, 적어도 21 nt, 또는 적어도 22 nt이다. 특정 구현예에서, 스페이서 길이는 15 nt 내지 17 nt, 17 nt 내지 20 nt, 20 nt 내지 24 nt, 예를 들어, 20 nt, 21 nt, 22 nt, 23 nt, 또는 24 nt, 23 내지 25 nt, 예를 들어 23 nt, 24 nt, 또는 25 nt, 24 nt 내지 27 nt, 27 nt 내지 30 nt, 30 nt 내지 35 nt, 또는 35 nt 이상이다. 본 발명의 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고, 가이드 RNA의 직접 반복 길이는 적어도 16 개의 뉴클레오티드이다. 특정 구현예에서, 코돈 최적화된 이펙터 단백질은 C2c2이고, 가이드 RNA의 직접 반복 길이는 16 nt 내지 20 nt, 예를 들어 16 개, 17 개, 18 개, 19 개, 또는 20 개 뉴클레오티드이다. 바람직한 특정 구현예에서, 가이드 RNA의 직접 반복 길이는 19 개 뉴클레오티드이다.
본 발명은 또한 다수의 핵산 성분을 전달하기 위한 방법을 포함하며, 여기서 각각의 핵산 성분은 상이한 관심 표적 유전자좌에 특이적이고, 이에 의해 다수의 관심 표적 유전자좌를 변형시킨다. 복합체의 핵산 성분은 하나 이상의 단백질-결합 RNA 압타머를 포함할 수 있다. 하나 이상의 압타머는 박테리오파지 코트 단백질을 결합할 수 있다. 박테리오파지 코트 단백질은 Qβ, F2, GA, fr, JP501, MS2, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s 및 PRR1을 포함하는 군으로부터 선택될 수 있다. 바람직한 구현예에서, 박테리오파지 코트 단백질은 MS2이다. 본 발명은 또한 길이가 30 개 이상, 40 개 이상 또는 50 개 이상의 뉴클레오티드인 복합체의 핵산 성분을 제공한다.
따라서, 출원인이 권리를 유보하도록 임의의 이전에 공지된 생산물, 그 생산물의 제조 공정, 또는 그 생산물의 사용 방법을 본 발명 내에 포함시키지 않으며, 이에 의하여 임의의 이전에 공지된 생산물, 공정, 또는 방법에 대한 권리 포기를 개시하는 것이 본 발명의 목적이다. 본 발명은 출원인이 권리를 유보하도록 USPTO(35 U.S.C. §112, 첫 단락) 또는 EPO(EPC의 83항)의 서면 기재 요건 및 실시 가능 요건을 충족하지 않는, 임의의 생산물, 공정, 또는 그 생산물의 제조 또는 그 생산물의 사용 방법을 본 발명의 범주 내에 포함시키는 것으로 의도되지 않으며, 이에 의하여 임의의 이전에 공지된 생산물, 그 생산물의 제조 공정, 또는 그 생산물의 사용 방법의 권리 포기를 개시함을 추가로 유의한다. 본 발명의 실시에 있어서 Art. 53(c) EPC 및 규칙 28(b) 및(c) EPC에 따르는 것이 유리할 수 있다. 본 명세서에서 어떤 것도 약속으로 해석되어서는 안 된다.
본 개시 내용 및 구체적으로 청구범위 및/또는 단락에서, "포함한다(comprises)", "포함된(comprised)", "포함하는(comprising)" 등과 같은 용어는 미국 특허법에서 이에 귀속된 의미를 가질 수 있음에 유의하며; 예를 들어 이들은 "포함한다(includes)", "포함된(included)", "포함하는(including)" 등을 의미할 수 있고; "본질적으로 구성되는(consisting essentially of)" 및 "본질적으로 구성된다(consists essentially of)"와 같은 용어는 미국 특허법에서 이들에게 할당된 의미를 갖고, 예를 들어 명시적으로 열거되지 않은 요소를 허용하지만, 선행 기술에서 발견되거나 본 발명의 기본적인 또는 신규한 특징에 영향을 미치는 요소는 제외한다.
추가의 양태에서, 본 발명은 변형된 관심 표적 유전자좌의 생성을 보장하는 본 명세서에 기재된 CRISPR 시스템을 인코딩하는 뉴클레오티드 서열을 포함하는 진핵 세포를 제공하며, 여기서 관심 표적 유전자좌는 본 명세서에 기재된 방법 중 임의의 것에 따라 변형된다. 추가의 양태는 상기 세포의 세포주를 제공한다. 또 다른 양태는 하나 이상의 상기 세포를 포함하는 다세포 생물을 제공한다.
특정 구현예에서, 관심 표적 유전자좌의 변형은 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포; 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포로서, 여기서 적어도 하나의 유전자 산물의 (단백질) 발현은 증가되는 것; 적어도 하나의 유전자 산물의 변경된 (단백질) 발현을 포함하는 진핵 세포로서, 여기서 적어도 하나의 유전자 산물의 (단백질) 발현은 감소되는 것, 또는 편집된 트랜스크립톰을 포함하는 진핵 세포를 초래할 수 있다.
특정 구현예에서, 진핵 세포는 포유류 세포 또는 인간 세포일 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 RNA 서열-특이적 간섭, 발현(이소형 특이적 발현 포함)의 RNA 서열 특이적 조절, 안정성, 국소화, 기능성(예를 들어, 리보솜 RNA 또는 miRNA) 등을 위해, 또는 이러한 프로세스의 다중화를 위해 사용될 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 생물학적 샘플과 같은 샘플에서의 RNA 검출 및/또는 정량화를 위해 사용될 수 있다. 특정 구현예에서, RNA 검출은 세포 내에서이다. 일 구현예에서, 본 발명은 (a) 샘플을 i) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, (ii) 표적 RNA로 혼성화할 수 있는 가이드 RNA, 및 iii) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터와 함께 인큐베이션하는 것, (b) 상기 RNA-기반 절단 유도성 리포터의 절단에 의해 생성되는 신호에 기반하여 상기 표적 RNA를 검출하는 것을 포함하는, 샘플에서 표적 RNA를 검출하는 방법을 제공한다.
일 구현예에서, 제VI형 CRISPR-Cas 이펙터 단백질은 C2c2 이펙터 단백질이다. 일 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함한다. 특정 구현예에서, 샘플은 무-세포 생물학적 샘플을 포함한다. 다른 구현예에서, 샘플은 예를 들어, 제한 없이, 식물 세포 또는 동물 세포인 세포 샘플을 포함한다. 본 발명의 일 구현예에서, 표적 RNA는 바이러스, 박테리아, 균류 또는 기생충 유래 표적 RNA를 포함하나 이에 한정되지 않는, 병원체 RNA를 포함한다. 일 구현예에서, 가이드 RNA는 단일 뉴클레오티드 다형성 또는 RNA 전사물의 스플라이스 변이체를 포함하는 표적 RNA를 검출하도록 설계된다. 일 구현예에서, 가이드 RNA는 표적 RNA와의 하나 이상의 미스 매치 뉴클레오티드를 포함한다. 특정 구현예에서, 가이드 RNA는 암 또는 면역 질병과 같지만 이에 한정되지 않는 질병 상태에 대해 진단적인 aa 표적 분자에 혼성화한다.
본 발명은 a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, b) 표적 RNA에 결합할 수 있는 가이드 RNA, 및 c) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, 리보 핵산(RNA) 검출 시스템을 제공한다. 추가로, 본 발명은 a) RNA를 절단할 수 있는 제VI형 CRISPR-Cas 이펙터 단백질, b) 이펙터 단백질에 의해 비-특이적이고 검출 가능하게 절단될 수 있는 RNA-기반 절단 유도성 리포터를 포함하는, RNA 검출용 키트를 제공한다. 특정 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광 색소 및 소광제를 포함한다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은 질병 모델 및/또는 스크리닝 시스템을 생성하기 위해 사용될 수 있다.
추가의 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템, 또는 전달 시스템은: 부위-특이적 트랜스크립톰 편집 또는 변동; 핵산 서열-특이적 간섭; 또는 다중화된 게놈 설계 제작을 위해 사용될 수 있다.
또한, 본 명세서에 기재된 세포, 세포주 또는 생물로부터의 유전자 산물이 제공된다. 특정 구현예에서, 발현된 유전자 산물의 양은 변경된 발현 또는 편집된 게놈을 갖지 않은 세포로부터의 유전자 산물의 양보다 더 많거나 더 적을 수 있다. 특정 구현예에서, 유전자 산물은 변경된 발현 또는 편집된 게놈을 갖지 않은 세포로부터의 유전자 산물과 비교하여 변경될 수 있다.
이들 및 다른 구현예는 하기 상세한 설명에 개시되어 있거나 이로부터 명백해지고 이에 의해 포함된다.
본 발명의 신규 특징은 구체적으로 첨부된 청구범위에 제시되어 있다. 본 발명의 원리가 이용된 예시적인 구현예를 제시하는 하기의 상세한 설명을 참조함으로써 본 발명의 특징 및 이점을 더욱 잘 이해할 것이며, 첨부된 도면은 다음과 같다:
도 1a 내지 1d. C2c2 오솔로그의 세포 국소화. (A) HEK293 세포는 핵 국소화 신호(NLS) 또는 핵 방출 신호(NES)와 함께 또는 없이 mCherry에 융합된 상이한 C2c2 오솔로그로 형질감염하였다. (B) 렙토트리키아 와데이 F0279 C2c2(B1) 및 라크노스피라세아에 박테리움 NK4A179 C2c2(B2)의 NES 융합은 세포질에 위치한다. (C) 렙토트리키아 와데이 F0279 C2c2(C1), 라크노스피라세아에 박테리움 NK4A179 C2c2 (C2), 및 렙토트리키아 샤히 C2c2(C3)의 NLS 융합은 핵에 위치하고 일정치 않게 인에 위치한다. (C) NLS 또는 NES에 융합하지 않은 렙토트리키아 와데이 F0279 C2c2(D1), 라크노스피라세아에 박테리움 NK4A179 C2c2(D2), 및 렙토트리키아 샤히 C2c2(D3)는 일정치 않게 핵 및 세포질에 위치한다. (D) 평가된 4 개의 포유류 LwaCas13a 작제물의 개략도(왼쪽) 및 각각의 설계의 국소화 및 발현을 보여주는 이미징(오른쪽).
도 2a 내지 2c. 포유류 세포에서의 C2c2 녹다운 효율의 평가를 위한 분석. A) C2c2의 녹다운 효율을 결정하기 위해 사용된 이중 루시페라제 리포터 설계의 개략도. 세포는 상이한 플라스미드로 형질감염하였다: 가우시아 루시페라제(Gluc) 및 사이프리디나 루시페라제(Cluc)를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 가우시아 루시페라제를 표적화하는 gRNA를 인코딩하는 플라스미드. Gluc의 녹다운 효율은 Gluc 및 Cluc의 비율에 기반하여 결정한다. (B)가우시아 루시페라제 mRNA를 표적화하는 상이한 gRNA의 위치. (C) 포유류 세포에서 C2c2 녹다운 효율을 평가하기위한 분석. 세포는 상이한 플라스미드로 형질감염하였다: EGFP를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 및 EGFP를 표적화하는 gRNA를 인코딩하는 플라스미드. EGFP의 녹다운 효율은 유세포분석법에 의해 결정한다.
도 3a 내지 3q. RNA 절단 활성에 대한 제VI형 CRISPR Cas13a 패밀리의 특징 확인. (A) Cas13a 오솔로그에 대한 PFS 특징 확인 스크린의 개략도. (B) Cas13a 단백질 및 crRNA의 발현을 위한 작제물의 개략도. 나타난 길이 및 잔기 번호는 LwaCas13a에 대한 것이다. (C) Cas13a 생체내 활성의 정량. (D) (C)로부터의 생체내 활성의 비율. (E, F) 생존 이.콜라이 집단에서 강화된 플라스미드의 차세대 시퀀싱에 의해 결정된, LshC2c2 및 LwaC2c2에 대한 PFS 모티프 결정. (G) 표적화 및 비-표적화 샘플에서의 LshC2c2 및 LwaC2c2에 대한 PFS 강화의 분포. (H) 생체내 PFS 스크리닝은 LwaCas13a가 최소한의 PFS 선호를 가짐을 나타낸다. (I) LshC2c2 및 LwC2c2에 대한 표적화 및 비-표적화 생물-반복실험(n=2)에서의 정규화된 PFS 수의 분포를 나타내는 박스 플롯. 박스는 거의 사분위수 범위의 1.5 배를 나타내는 제1 내지 제3사분위수까지 포괄한다. 평균값은 빨간색 가로 막대로 표시된다. (J) 정제 단백질을 사용한 LshC2c2 및 LwC2c2 RNA 절단 활성의 비교. LwaCas13a는 LshCas13a보다 더 활성있는 알엔아제 활성을 갖는다. 5' 표지된 RNA 표적을 C2c2 및 상응하는 crRVA와 함께 30 분 동안 인큐베이션시키고 생산물을 겔 전기영동으로 분석하였다. (K) LwaCas13a는 엘. 와데이 CRISPR 유전자좌 유래의 CRISPR 어레이 전사물을 처리할 수 있다. 2 개-스페이서 Lwa 어레이를 LwC2c2와 함께 30 분 동안 인큐베이션한 후 반응을 겔 전기영동으로 분석하였다. (L) 평가된 포유류 LwaCas13a 작제물의 개략도 및 각각의 설계의 국소화 및 발현을 나타내는 이미징. 축척 막대, 10μm. (M) 루시페라제 단백질 판독값으로 녹다운을 평가하기 위해 사용되는 포유류 리포터 시스템의 개략도. (N) LwaCas13a의 설계 제작 된 변이체를 사용한 가우시안 루시페라제(Gluc)의 녹다운. 가이드 및 shRNA에 대한 서열은 위에 나타난다. (O) LwaCas13a를 이용한 3 개의 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물과 비교. (P) 벼(Oryza sativa) 원형질체에서의 전사물의 LwaCas13a 녹다운의 개략도. (Q) 벼 원형질체에서 전사물당 3 개의 표적화 가이드 및 비-표적화 가이드를 사용하여 3 개 전사물의 LwaCas13a 녹다운. 달리 언급되지 않는 한 모든 값은 n=3 인 평균±SEM이다.
도 4a 내지 4b. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) ATCAGGGCAAACAGAACTTTGACTCCCA; (가이드 2) AGATCCGTGGTCGCGAAGTTGCTGGCCA; (가이드 3) TCGCCTTCGTAGGTGTGGCAGCGTCCTG; 및 (가이드 NP) TAGATTGCTGTTCTACCAAGTAATCCAT이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 1) TCGCCTTCGTAGGTGTGGCAGCGTCCTG 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 5a 내지 5b. EGPF에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 GPF의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) tgaacagctcctcgcccttgctcaccat; (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 6a 내지 6e. 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) A375s 세포에 형질감염된 다양한 가이드를 이용한 LwCas13a에 의한 Gluc 전사물의 녹다운: (B) LwCas13a의 설계제작된 변이체를 이용한 가우시아 루시페라제(Gluc)의 녹다운. (C) LwaCas13a 및 다양한 길이의 스페이서 Gluc crRNA 1에 의한 가우시아 루시페라제(Gluc)의 녹다운. (D) 다양한 가이드를 이용한 LwaCas13a에 의한 KRAS 전사물의 녹다운. (E) 다양한 가이드를 이용한 LwaCas13a에 의한 PPIB 전사물의 녹다운.
도 7. 각각의 표적 유전자에 대해 향하는 gRNA를 이용하고NES와 융합된 C2c2 렙토트리키아 와데이 F0279를 이용한 표적 유전자의 정규화된 단백질 발현. 각각의 표적 유전자에 대한 gRNA는 ctgctgccacagaccgagaggcttaaaa (CTNNB1); tccttgattacacgatggaatttgctgt (PPIB); tcaaggtggggtcacaggagaagccaaa (mAPK14); atgataatgcaatagcaggacaggatga (CXCR4); gcgtgagccaccgcgcctggccggctgt (TINCR); ccagctgcagatgctgcagtttttggcg (PCAT1); ctggaaatggaagatgccggcatagcca (CAPN1); gatgacacctcacacggaccacccctag (LETMD1); taatactgctccagatatgggtgggcca (MAPK14); catgaagaccgagttatagaatactata (RB1); ggtgaaatattctccatccagtggtttc (TP53); 및 aatttctcgaactaatgtatagaaggca (KRAS)이다.
도 8. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. C2c2 오솔로그는 렙토트리키아 샤히(Lsh), 렙토트리키아 와데이 F0279(Lw2), 클로스트리듐 아미노필룸(Ca), 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL), 라크노스피라세아에 박테리움 NK4A179(LbNk), 및 라크노스피라세아에 박테리움 MA2020(LbM)이다.
도 9. Lw2는 다수의 세포주에서 기능한다. 정규화된 루시페라제 활성은 293FT 세포에 대해 나타난다.
도 10a 내지 10b. Gluc에 대해 향하는 gRNA를 이용하고 촉매적으로 비활성화된 C2c2 오솔로그를 이용한 루시페라제의 상대 단백질 발현. (A) dC2c2 렙토트리키아 와데이(LwC2c2)를 EIF4E, EIF4E 및 NES에 융합했거나 태그가 없다. (B) dC2c2 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)를 NLS 및 EIF4E에 융합했거나 태그가 없다.
도 11a 내지 11c. 베타 액틴을 표적화하는 렙토트리키아 와데이 C2c2 의 세포 국소화는 NaAsO2로 세포를 처리 즉시 스트레스 과립으로 국소화한다;
도 12. 포유류 세포에서의 RNA 녹다운. C2c2는 2 개의 표적 부위에서 shRNA를 능가한다.
도 13. 증가하는 crRNA 형질감염 양은 녹다운을 증가시킨다.
도 14. NES를 갖는 Lw2C2c2(NES-Lw2C2c2)는 tRNA 및 U6 녹다운의 RNA를 효과적으로 절단한다.
도 15a 내지 15b. (A) 단백질 형질감염 양은 녹다운을 포화시킨다. (B) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운.
도 16. U6-구동되는 DR-스페이서-DR-스페이서 표적화 작제물.
도 17. 내인성 유전자 상의 상응하는 표적에 대해 C2c2가 최적화된 shRNA를 능가한다.
도 18. dLw2C2c2-EIF4E 융합은 3 개의 유전자의 번역을 상향 조절할 수 있다; 웨스턴 블롯 상에서 밴드 강도로 측정한 단백질 수준.
도 19. 개별 전사물의 녹다운. Lw2는 더 적은 변동성 및 더 높은 특이성을 나타낸다.
도 20. 포유류 세포에서의 RNA 녹다운.
도 21. 이미징은 GFP의 수퍼폴딩 유도체(sfGFP)에 의해 향상된다. C2c2-mCherry 및 sfGFP-C2c2 융합 단백질을 HEK293FT 세포 및 마우스 배아 줄기 세포(mESC)에서 비교한다.
도 22a. msfGFP-C2c2는 녹다운을 향상시킨다. NLS 또는 NES를 추가로 포함하는, C2c2의 mCherry 또는 msfGFP와의 다양한 융합 단백질에 의한 루시페라제 녹다운을 묘사한다.
도 22b 내지 22d는 C2c2를 이용한 전사 조절을 위한 단백질 태깅 시스템을 도시하고 변형된 C2c2(SunTag)가 포함하는 짧은 펩티드 서열에 결합하는 전사 개시 인자-연결된 scFv의 구성요소를 나타낸다. 도 22c 내지 22d는 시스템의 전사적 효과를 묘사한다.
도 23a 내지 23b. 리포터 단백질(GFP, Venus, Cre 등)의 분할. 각각의 부분은 C2c2에 융합되어 있다(예를 들어 카스파제를 이용한 개략도 슬라이드 참고). 서로에게 근접한 전사물을 표적화하는 2 개의 가이드를 설계함으로써, 분할된 단백질은 전사물의 존재 하에서 재구성된다.
도 24a 내지 24c. C2c2 부수적 알엔아제 활성에 의한 신속한 RNA 검출. (A) 왼쪽 패널: C2c2 crRNA의 가이드 서열에 상보적인 표적 RNA에 의한 C2c2 부수적 비-특이적 알엔아제 활성이 활성화되는 것은 리포터의 절단을 유도한다. 오른쪽 패널: 표적 RNA 부재 시, 부수적 비-특이적 알엔아제 활성이 유도되지 않으므로 리포터의 절단이 없다. (B) LwaCas13a에 의한 부수적 효과의 활성을 검출하기 위한 분석의 개략도. (C) 표적 RNA의 존재 또는 부재 하에 LwaCas13a-crRNA 복합체와 인큐베이션 후 부수적 RNA 표적의 겔 전기 영동.
도 25. 다양한 농도의 C2c2를 이용한 부수적 효과에 의한 렌티바이러스 검출.
도 26. 부수적 효과에 의한 렌티바이러스 검출의 시간 경과.
도 27. C2c2 부수적 알엔아제 활성에 의한 희귀한 RNA 종의 검출. 증가하는 표적 농도 및 표적 절단에는 증가된 비-특이적 표적외 알엔아제 활성이 동반한다.
도 28a 내지 28b. Lw2C2c2 및 LbuC2c2의 정렬.
도 29a 내지 29c. (A) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 βLwC2c2. (B) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 CXCR4 mRNA 녹다운에 대해 표적화된 LwC2c2. (C) 스페이서 서열에서의 단일 및 연속된 두 염기-쌍 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 LwC2c2.
도 29d-a 내지 29d-c. (A) 루시페라제 리포터 mRNA의 녹다운의 특이성. C2c2는 루시페라제 리포터 mRNA의 녹다운에 대한 RNAi보다 더 특이적이다. 왼쪽: shRNA를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 오른쪽: C2c2를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 녹다운에 대해 표적화된 표적 루시페라제 전사물은 빨간색 점으로 표시된다. n=3 생물학적 반복실험으로부터의 평균값이 나타난다. (B) 내인성 KRAS mRNA의 녹다운의 특이성. C2c2는 내인성 KRAS의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다. (C) 내인성 PPIB mRNA의 녹다운의 특이성. C2c2는 내인성 PPIB의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다.
도 29e 내지 29g. (E) 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (F) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. (G) 왼쪽: 세포 성장을 측정하기 전에 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질 감염시킨 세포에 대한 루시페라제 녹다운. 중간: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 세포 생존력. 오른쪽: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광. 모든 값은 n=3 인 평균±SEM이다.
도 30a 내지 30e. RNA 녹다운의 수준 및 특이성의 비교. C2c2는 RNAi와 유사한 수준의 녹다운을 유지하면서 증가된 특이성을 입증한다. (A): 분석된 각각의 RNA-seq 라이브러리에서 유의미하게 차등적으로 조절되는 유전자의 수. 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (B) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. 정규화된 발현은 표적화 조건에서의 표적화된 유전자의 TPM을 비-표적화 조건에서의 표적화된 유전자의 TPM으로 나눈 값으로서 계산한다. 플롯은 도 28의 RNA-seq 플롯의 누적 데이터에 해당한다. 표적외는 유의미하게 조절되지 않은(2 배 초과) 또는 하향 조절된(0.75 배 미만) 유전자로서 결정된다. (C) 비-선택성 및 블라스트시딘-선택성 버전의 C2c2를 이용하여 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 루시페라제 녹다운. (D) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 세포 생존력. (E) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광.
도 31. C2c2는 다중화된 녹다운이 가능하다. crRNA는 PPIB, CXCR4, KRAS, TINCR, 및 PCAT를 표적화 하도록 설계하였다. 상단 패널은 나타난 다중화된 crRNA 전사물과 왼쪽에서 오른쪽으로 동일한 순서이고 색상으로 구분된 mRNA의 정규화된 발현 수준을 나타낸다. 하단 패널은 단일로 주입된 가이드를 다중화되고 모아진 가이드와 비교한다.
도 32a 내지 32d. gLuc 또는 cLuc의 길이에 따른 가이드 타일링은 전사물 상의 재표적화 가능성 및 취약 영역을 입증한다. (A) LwaCas13a 어레이된 스크리닝의 개략도. (B) 전사물의 길이에 걸쳐 균등하게 타일링된 186 가이드를 이용하여 LwC2c2에 의한 가우시아 루시페라제 mRNA의 녹다운 효율. (C) 전사물의 길이에 걸쳐 균등하게 타일링된 가이드를 이용하여 LwC2c2에 의한 사이프리디나 루시페라제의 어레이된 녹다운 스크린. (D) shRNA 비교를 통한 어레이된 녹다운 스크린으로부터의 상위 3 개 crRNA의 검증.
도 33a 내지 33b. RNA 면역침강(RIP)은 표적 결합의 강화를 나타낸다. HA-태그를 포함하는 dC2c2-msfGFP는 단백질-RNA 복합체의 침강을 위해 제공된다. 결합된 RNA를 qPCR에 의해 정량화하고 입력 RNA(면역 침강이 없는 샘플) 및 음성 대조군 항체를 갖는 면역침강에 비교하여 강화를 결정하였다. 패널 A는 베타-액틴 RNA 표적의 강화를 나타낸다. 패널 B는 루시페라제 표적의 강화를 나타낸다.
도 34. 3T3L1 섬유아세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 35. HEK293FT 세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 36. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 하프-로그 단계로 연속 희석된 LwaCas13a-crRNA 복합체 복합체를 사용한 5' 말단-표지된 표적 1의 RNA-절단의 0.5 시간 후의 변성 겔.
도 37. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 5' 말단-표지된 표적 1을 사용한 LwaCas13a ssRNA 절단의 시계열의 변성 겔.
도 38. Lw2C2c2 및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. 1 시간 인큐베이션 후 Lw2 C2c2에 의한 crRNA-매개 ssRNA 절단을 입증하는 변성 겔. ssRNA 표적은 IRDye 800으로 5' 표지된다. 절단은 crRNA의 존재를 필요로하고 EDTA의 첨가에 의해 파괴된다.
도 39a 내지 39b. Lw2C2c2및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. (A) crRNA에 의해 표적화되는 ssRNA 기질의 개략도. 프로토스페이서 영역은 파란색으로 강조표시되고 PFS는 자홍색 막대로 표시된다. (B) 3 시간 인큐베이션 후 PFS에 대한 필요를 입증하는 변성 겔. PFS를 제외하고 동일한 4 개의 ssRNA 기질(개략도에서 자홍색 X로 표시)은 시험관내 절단 반응에 사용하였다. ssRNA 절단 활성은 표적 부위의 바로 3'에 있는 뉴클레오티드에 의존한다.
도 40. 직접 반복 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 직접 반복 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 41. 스페이서 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 스페이서 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 42a 내지 42c. Lw2C2c2 절단 부위는 표적 RNA의 2차 구조 및 서열에 의해 결정된다. (A) LwCas13a 및 crRNA1과의 인큐베이션 후 ssRNA 4 및 ssRNA 5를 나타내는 변성 겔. (B) ssRNA 4(파란색) 및 (C) ssRNA 5;(녹색)은 동일한 프로토스페이서를 갖지만 상이한 서열이 측면에 배치되어 있다. 동일한 프로토스페이서임에도 불구하고, 상이한 측면 배치 서열이 상이한 절단 패턴을 초래했다.
도 43a 내지 43c. (A) 4 개의 가능한 뉴클레오타이드 각각에 대해 강조 표시된 루프(빨간색)에서 호모폴리머 길이를 이용하여 변형된 ssRNA 4의 개략도. crRNA 스페이서 서열은 파란색으로 강조 표시된다. (B) 3 시간 인큐베이션 후 4 개의 가능한 호모폴리머 표적 각각에 대한 Lw2C2c2-crRNA-매개 절단을 나타내는 변성 겔. Lw2C2c2는 C 및 U를 절단한다. (C) LwaCas13a는 엘. 와데이 CRISPR-Cas 유전자좌로부터의 pre-crRNA를 처리할 수 있다.
도 44a 내지 44k. 촉매적으로 비활성인 LwaCas13a(dCas13a)는 포유류 세포에서 전사물에 결합할 수 있다. (A) dCas13a 결합의 이미징 및 평가에 사용된 dCas13a-GFP 작제물의 개략도. (B) dCas13a 결합의 정량화를 위한 RNA 면역 침강의 개략도. (C) dCas13a 표적화 gLuc 전사물은 비-표적화 대조군에 비해 유의미하게 강화된다. RIP에 의한 가우시안 루시페라제 mRNA에 대한 dC2c2-msfGFP 결합의 정량은 대조군 항체 또는 입력 용해물에 대하여 정규화하였다. 값을 비-표적화 가이드에 대하여 정규화하였다(n=3, t-검정에 의해, *, p<0.05; ****, p<0.0001). (D) 음성-피드백 이미징에 사용되는 dCas13a-GFP-KRAB 작제물의 개략도. 표적 및 가이드의 부재시, 리포터 단백질은 자체 전사를 저해한다. (E) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정된 표적 접근 가능성과 부분적으로 상관관계가 있다. (F) b-액틴 이미징를 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 간의 비교. (G) HEK293 세포에서 b-액틴을 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (H) ACTB를 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (I) 핵 대 전체-세포 신호의 비율로 측정된, dCas13a-GFP-KRAB의 세포질 전위의 정량. (J) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정 면역 형광 이미지. 스트레스 과립은 마커 G3BP1에 대한 염색으로 표시된다. 축척 막대, 5 μm. 축척 막대, 5 μm. (K) G3BP1 및 dCas13a-GFP-KRAB 공동-국소화는 피어슨의 상관관계에 의해 세포당 정량화하였다. 모든 값은 n=3인 평균±SEM이다. **** p<0.0001; *** p<0.001; ** p<0.01; * p<0.05. ns=유의미하지 않음. 한쪽-꼬리 스튜던트 t-검정은 (a)에서의 비교를 위해 사용되었고, 양쪽-꼬리 스튜던트 t-검정은 (I) 및 (K)에서의 비교를 위해 사용되었다.
도 45. 도 43에 나타낸 바와 같이 C2c2-GFP 이미징 단백질을 사용하는 사용하여 β-액틴의 검출. 비-표적화 가이드(오른쪽 패널) 중 표적화 가이드(왼쪽 패널)와 함께 dC2c2-eGFP-ZF-KRAB-NLS를 사용하여 β-액틴을 이미징 하였다.
도 46. GFP-태그된 G3BP1을 이용한 스트레스 과립의 검출.
도 47. 스트레스 과립 및 스트레스 과립 하위구조("코어")에서의 작용 검출. 표적화 작제물이 있거나 없이 및 코어 하위구조를 안정화하기 위한 NaAsO2 처리가 있거나 없이, 액틴 mRNA는 C2c2-eGFP-ZF-KRAB을 이용하여 이미징하였다. 스트레스 과립은 항-G3BP1을 사용하여 표지하였다.
도 48a 내지 48f: dCas13a는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 소듐 아르세나이트 처리 즉시 스트레스 과립으로의 β-액틴 mRNA의 국소화를 이미징하기 위해 음성-피드백 dCas13a-msfGFP-KRAB 작제물을 사용하는 것에 대한 개략도. (B) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정된 면역 형광 이미지. β-액틴 mRNA 표적화 가이드와 함께 형질감염된 dCas13a-msfGFP-KRAB는 스트레스 과립으로 국소화한다. 스트레스 과립에 대한 G3BP1 마커에 대한 항체로 면역염색된 고정된 HEK293 세포의 대표적인 이미지가 나타난다. (C) 조건당 약 20 개의 세포에 대한 피어슨 상관관계 분석에 의한 스트레스 과립 국소화의 정량 (D): 조건당 약 20 개의 세포에 대한 만데르의 공동국소화 분석에 스트레스 과립 국소화의 정량 (E) 400 uM 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성에 대한 살아있는 세포 분석으로부터의 대표적인 이미지 (F) 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성의 정량.
도 49a 내지 49o LwaCas13a는 내인성 포유류 코딩 및 비-코딩 RNA 표적을 표적화하도록 재프로그래밍할 수 있다. (A) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (B) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (C) LwaCas13a 어레이된 스크리닝의 개략도. (D) Gluc전사물에 걸쳐 균등하게 타일링된 186 개의 가이드의 어레이된 녹다운 스크린. (E) 사이프리디니아 루시페라제(Cluc) 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (F) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (G) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (H) shRNA 비교를 통한 내인성 어레이된 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. 모든 값은 n=3인 평균±SEM이다. ***p<0.001; **p<0.01. 양쪽-꼬리 스튜던트 T-검정을 비교를 위해 사용하였다. (I) MALAT1전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (J) shRNA 비교를 통한 내인성 어레이된 MALAT1 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. (K) 단일 프로모터의 발현 하에 5 개의 상이한 내인성 유전자에 대한 CRISPR 어레이의 5 개의 가이드를 다중화된 전달하는 것은 견고한 녹다운을 할 수 있다. (L) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 가이드를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다. 모든 값은 n=3인 평균±SEM이다. (M) LwaCas13a를 이용한 3 가지 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물에 대하여 비교. (N) LwaCas13a는 핵 lncRNA 전사물 MALAT1를 녹다운할 수 있다. (O) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 crRNA를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다.
도 50. 21 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 51. 33 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 52. 이펙터 도메인의 연결을 위한 예시적인 위치. 이종 기능성 도메인 (묘사된 mCherry 및 msfGFP)에 대해 C 또는 N 말단에 연결된 C2c2 단백질은 루시페라제 녹다운에 의해 표시되는 바와 같이 기능을 보유한다.
도 53a 내지 53l. (A 내지 K) C2c2 오솔로그의 서열 정렬. (L) HEPN 도메인의 서열 정렬.
도 54. C2c2 오솔로그의 트리 정렬.
도 55a 내지 55b. C2c2 및 Cas13b 오솔로그의 트리 정렬.
도 56a 내지 56f: 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운. (B) LwaCas13a 및 다양한 양의 형질감염된 Gluc crRNA 1 및 2 플라스미드에 의한 Gluc 전사물의 녹다운. (C) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 사용한 Gluc 전사물의 녹다운. (D) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 이용한 KRAS 전사물의 녹다운. (E) U6 또는 tRNAVal 프로모터로부터 발현된 가이드를 이용한 KRAS 전사물의 녹다운. (F) XIST 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린.
도 57a 내지 57e: LwaCas13a의 PFS 선호 평가 및 LshCas13a와의 비교. (A) 이 연구에서 평가된 15 개의 Cas13a 오솔로그의 서열 비교 트리. (B) 다양한 손실 임계값에 대하여 손실 임계값 초과하는 LshCas13a 및 LwaCas13a PFS 서열의 수. (C) 표적화 샘플에서, 비-표적화 샘플에 대하여 정규화된, LshCas13a 및 LwaCas13a에 대한 PFS 강화의 분포. (D) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수. (E) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수.
도 58a 내지 58d: LwaCas13a 표적화 효율은 전사물에 대한 접근 가능성의 영향을 받는다. (A) 첫 번째 행: 상위 녹다운 가이드는 표적 전사물을 따라 위치에 의해 플롯팅된다. 가이드의 상위 20%는 Gluc 용으로 선택되고 상위 30%의 가이드는Cluc, KRAS 및 PPIB용이다. 두 번째 행: 무작위 귀무-분포(빨간색)와 비교하여 각각의 전사물에 대해 인접한 상위 가이드 사이의 쌍-거리(파란색)에 대한 히스토그램이다. 삽입 그래프는 이들 히스토그램에 대한 누적 빈도 곡선을 나타낸다. 빨간색 곡선(거리의 귀무 부포)의 왼쪽으로의 파란색 곡선(실제 측정된 거리)의 이동은 가이드들이 우연에 의해 예상되는 것보다 서로 근접함을 나타낸다. (B) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정되는 표적 접근 가능성과 부분적으로 상관관계가 있다. (C) 표적 접근 가능성(염기쌍 형성 영역의 확률) 및 LwaCas13a에 의한 녹다운 후의 표적 발현 사이의 상관 관계를 묘사하는 커널 밀도 추정 플롯. (D) 첫 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계. 두 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계에 대한 P 값. 색상 기준은 p 값 > 0.05는 빨간색 음영이고 p 값 < 0.05는 파란색 음영이 되도록 설계하였다.
도 59a 내지 59k: 다양한 스페이서 길이에서 crRNA:표적 듀플렉스에서의 미스매치에 대한 LwaCas13a 민감성의 상세 평가. (A) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 KRAS의 녹다운. (B) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 PPIB의 녹다운 (C) 스페이서 서열에 걸쳐 다양한 위치에서 비-연속 2 개의 미스매치를 함유하는 가이드로 평가된 Gluc의 녹다운. 야생형 서열은 아래에 나타난 미스매치 동일성과 함께 상단에 나타난다. (D) 다양한 스페이서 길이에 대한 ssRNA 1 및 2 상의 부수적 절단 활성(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (E) (D)에서 시험한 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (F) 스페이서를 따라 타일링된 합성 미스매치를 갖는 28 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (G) (F)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (H) 스페이서를 따라 타일링된 합성 미스매치를 갖는 23 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (I) (H) 에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (J) 스페이서를 따라 타일링된 합성 미스매치를 갖는 20 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (K) (J)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다).
도 60a 내지 60f: LwaCas13a는 내인성 표적 상의 shRNA 녹다운보다 더 특이적이고 생물학적 잡음에 비교할 만한 변동이 거의 없다. (A) 왼쪽: KRAS-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: KRAS-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. (B) 왼쪽: PPIB-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: PPIB-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. (C) 비-표적화 shRNA 조건(첫 번째 행) 및 Gluc-표적화 shRNA 조건(두 번째 행)의 개별 반복실험의 비교. (D) 비-표적화 crRNA 조건(첫 번째 행) 및 Gluc-표적화 crRNA 조건(두 번째 행)의 개별 반복실험의 비교. (E) Gluc-표적화 shRNA 조건에 대한 비-표적화 shRNA 조건의 개별 반복실험의 쌍별 비교. (F) Gluc-표적화 crRNA 조건에 대한 비-표적화 crRNA 조건의 개별 반복실험의 쌍별 비교.
도 61a 내지 61c: 모든 샘플에 걸친 LwaCas13a 및 RNAi 녹다운 가변성(표준 편차)에 대한 상세 분석. (A) 루시페라제 리포터 또는 내인성 유전자를 표적화하는 shRNA 또는 crRNA에 대해 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (B) 모든 반복실험 및 변동 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (C) shRNA 또는 crRNA의 경우 표적화된 각각의 유전자에 대한 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 표준 편차 분포.
도 62a 내지 62j: LwaCas13a 녹다운은 측정된 표적외 전사물 상에 아무 활성을 갖지 않고 표적화된 전사물에 특이적이다. (A) Gluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Gluc 신호 히트 맵. (B) Cluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Cluc 신호 히트 맵. (C) 절대 Gluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (D) 절대 Cluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (E) 절대 Cluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (F) 절대 Gluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (G) PPIB 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (H) GAPDH 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (I) KRAS 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계. (J) GAPDH 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계.
도 63a 내지 63f: dCas13a는 리포터 유전자 발현을 억제하고 내인성 유전자와 결합한다. (A) Cluc및 Gluc를 분리하는 합성 HBG1 인트론을 통해 타일링된 dCas13a는 번역 개시 부위로부터 특정 거리에서 Gluc 번역을 억제할 수 있다. (B) dCas13a 및 2 개의 표적화 crRNA 및 1 개의 비-표적화 crRNA로 표적화된 β-액틴 mRNA의 RNA 면역 침강 강화. (C) ACTB를 이미징하기 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 사이의 비교. (D) 비-표적화 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (E) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (F) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야.
도 64a 내지 64b dCas13a-NF는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 상응하는 ACTB-표적화 및 비-표적화 가이드를 갖는 dCas13a-NF-발현 세포에서의 ACTB 전사물의 RNA FISH로부터의 대표적인 이미지. 세포 외곽선은 파선으로 나타난다. (B) 만데르의 중첩 계수(왼쪽) 및 피어슨 상관관계(오른쪽)에 의해 정량화된 ACTB RNA FISH 신호 및 dCas13a-NF 사이의 전체 신호 중첩. 상관 관계 및 신호 중첩은 세포당 기반으로 픽셀 단위로 계산된다. 모든 값은 n=3 인 평균±SEM이다. ****p < 0.0001; ***p < 0.001; **p < 0.01. 양쪽-꼬리 스튜던트 T-검정을 비교에 사용하였다.
도 65a 내지 65c. 발현에 대한 직접 및 부수적 전사물 녹다운. (A) 활성 대 데드 Cas13a에 의한 루시페라제의 녹다운. (B) 내인성 유전자 발현에 대한 활성 대 데드 Cas13a 녹다운. 데드 Cas13a에 의한 녹다운은 번역 차단으로 인하거나 결합으로 인한 전사물의 불안정화로 인할 수 있다. (C) 포유류 세포에서 데드 Cas13a에 의한 부수적 활성의 부재. (A)에서 루시페라제에 대해 데드 Cas13a 및 가이드 1 및 2를 사용하여, 비-표적화 대조군에 비해 전사물 분포 크기에서의 변화는 관찰되지 않는다.
도 66a 내지 66o. 도 53의 상이한 C2C2 오솔로그 서열들의 표시된 컨센서스 서열과의 정렬.
도 67a 내지 67c. 렙토트리키아 와데이 F0279 C2c2("Lew2C2c2") 및 리스테리아 뉴요켄시스 FSL M6-0635 C2c2("LibC2c2")의 정렬.
도 68. 알엔아제 활성을 나타내는 C2c2 HEPN 도메인의 정렬. 상단 정렬 블록은 이전에 기재된 선택된 HEPN 도메인을 포함하고 하단 블록은 C2c2 이펙터 단백질 유래의 촉매 모티프를 포함한다. 각각의 도메인 구조 밑에는 각 단백질 패밀리의 선택된 대표에서 보존된 모티프의 정렬. 촉매성 잔기는 검정색 배경 상의 흰색 글자로 나타나고; 보존된 소수성 잔기는 노란색으로 강조 표시되고; 보존된 작은 잔기는 녹색으로 강조 표시되고; 가교 나선 정렬에서, 양으로 하전된 잔기는 빨간색이다. 2 차 구조 예측은 정렬된 서열의 밑에 나타난다: H는 α-나선을 의미하며 E는 펼쳐진 형태(β-가닥)를 의미한다. 정렬 블록 사이의 불량하게 보존된 스페이서는 숫자로 나타난다.
본 명세서의 도면은 단지 예시적인 목적을 위한 것이며, 반드시 일정한 비율로 그려진 것은 아니다.
도 1a 내지 1d. C2c2 오솔로그의 세포 국소화. (A) HEK293 세포는 핵 국소화 신호(NLS) 또는 핵 방출 신호(NES)와 함께 또는 없이 mCherry에 융합된 상이한 C2c2 오솔로그로 형질감염하였다. (B) 렙토트리키아 와데이 F0279 C2c2(B1) 및 라크노스피라세아에 박테리움 NK4A179 C2c2(B2)의 NES 융합은 세포질에 위치한다. (C) 렙토트리키아 와데이 F0279 C2c2(C1), 라크노스피라세아에 박테리움 NK4A179 C2c2 (C2), 및 렙토트리키아 샤히 C2c2(C3)의 NLS 융합은 핵에 위치하고 일정치 않게 인에 위치한다. (C) NLS 또는 NES에 융합하지 않은 렙토트리키아 와데이 F0279 C2c2(D1), 라크노스피라세아에 박테리움 NK4A179 C2c2(D2), 및 렙토트리키아 샤히 C2c2(D3)는 일정치 않게 핵 및 세포질에 위치한다. (D) 평가된 4 개의 포유류 LwaCas13a 작제물의 개략도(왼쪽) 및 각각의 설계의 국소화 및 발현을 보여주는 이미징(오른쪽).
도 2a 내지 2c. 포유류 세포에서의 C2c2 녹다운 효율의 평가를 위한 분석. A) C2c2의 녹다운 효율을 결정하기 위해 사용된 이중 루시페라제 리포터 설계의 개략도. 세포는 상이한 플라스미드로 형질감염하였다: 가우시아 루시페라제(Gluc) 및 사이프리디나 루시페라제(Cluc)를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 가우시아 루시페라제를 표적화하는 gRNA를 인코딩하는 플라스미드. Gluc의 녹다운 효율은 Gluc 및 Cluc의 비율에 기반하여 결정한다. (B)가우시아 루시페라제 mRNA를 표적화하는 상이한 gRNA의 위치. (C) 포유류 세포에서 C2c2 녹다운 효율을 평가하기위한 분석. 세포는 상이한 플라스미드로 형질감염하였다: EGFP를 인코딩하는 플라스미드; C2c2를 인코딩하는 플라스미드(NLS 또는 NES가 있거나 없음); 및 EGFP를 표적화하는 gRNA를 인코딩하는 플라스미드. EGFP의 녹다운 효율은 유세포분석법에 의해 결정한다.
도 3a 내지 3q. RNA 절단 활성에 대한 제VI형 CRISPR Cas13a 패밀리의 특징 확인. (A) Cas13a 오솔로그에 대한 PFS 특징 확인 스크린의 개략도. (B) Cas13a 단백질 및 crRNA의 발현을 위한 작제물의 개략도. 나타난 길이 및 잔기 번호는 LwaCas13a에 대한 것이다. (C) Cas13a 생체내 활성의 정량. (D) (C)로부터의 생체내 활성의 비율. (E, F) 생존 이.콜라이 집단에서 강화된 플라스미드의 차세대 시퀀싱에 의해 결정된, LshC2c2 및 LwaC2c2에 대한 PFS 모티프 결정. (G) 표적화 및 비-표적화 샘플에서의 LshC2c2 및 LwaC2c2에 대한 PFS 강화의 분포. (H) 생체내 PFS 스크리닝은 LwaCas13a가 최소한의 PFS 선호를 가짐을 나타낸다. (I) LshC2c2 및 LwC2c2에 대한 표적화 및 비-표적화 생물-반복실험(n=2)에서의 정규화된 PFS 수의 분포를 나타내는 박스 플롯. 박스는 거의 사분위수 범위의 1.5 배를 나타내는 제1 내지 제3사분위수까지 포괄한다. 평균값은 빨간색 가로 막대로 표시된다. (J) 정제 단백질을 사용한 LshC2c2 및 LwC2c2 RNA 절단 활성의 비교. LwaCas13a는 LshCas13a보다 더 활성있는 알엔아제 활성을 갖는다. 5' 표지된 RNA 표적을 C2c2 및 상응하는 crRVA와 함께 30 분 동안 인큐베이션시키고 생산물을 겔 전기영동으로 분석하였다. (K) LwaCas13a는 엘. 와데이 CRISPR 유전자좌 유래의 CRISPR 어레이 전사물을 처리할 수 있다. 2 개-스페이서 Lwa 어레이를 LwC2c2와 함께 30 분 동안 인큐베이션한 후 반응을 겔 전기영동으로 분석하였다. (L) 평가된 포유류 LwaCas13a 작제물의 개략도 및 각각의 설계의 국소화 및 발현을 나타내는 이미징. 축척 막대, 10μm. (M) 루시페라제 단백질 판독값으로 녹다운을 평가하기 위해 사용되는 포유류 리포터 시스템의 개략도. (N) LwaCas13a의 설계 제작 된 변이체를 사용한 가우시안 루시페라제(Gluc)의 녹다운. 가이드 및 shRNA에 대한 서열은 위에 나타난다. (O) LwaCas13a를 이용한 3 개의 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물과 비교. (P) 벼(Oryza sativa) 원형질체에서의 전사물의 LwaCas13a 녹다운의 개략도. (Q) 벼 원형질체에서 전사물당 3 개의 표적화 가이드 및 비-표적화 가이드를 사용하여 3 개 전사물의 LwaCas13a 녹다운. 달리 언급되지 않는 한 모든 값은 n=3 인 평균±SEM이다.
도 4a 내지 4b. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) ATCAGGGCAAACAGAACTTTGACTCCCA; (가이드 2) AGATCCGTGGTCGCGAAGTTGCTGGCCA; (가이드 3) TCGCCTTCGTAGGTGTGGCAGCGTCCTG; 및 (가이드 NP) TAGATTGCTGTTCTACCAAGTAATCCAT이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 1) TCGCCTTCGTAGGTGTGGCAGCGTCCTG 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 5a 내지 5b. EGPF에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 GPF의 정규화된 단백질 발현. (A) C2c2 오솔로그는 렙토트리키아 와데이 F0279(Lw2)이다. 실험에 사용된 스페이서 서열은 (가이드 1) tgaacagctcctcgcccttgctcaccat; (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다. (B) C2c2 오솔로그는 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)이다. 실험에 사용된 스페이서 서열은 (가이드 2) tcagcttgccgtaggtggcatcgccctc; (가이드 3) gggtagcggctgaagcactgcacgccgt; (가이드 4) ggtcttgtagttgccgtcgtccttgaag; (가이드 5) tactccagcttgtgccccaggatgttgc; (가이드 6) cacgctgccgtcctcgatgttgtggcgg; (가이드 7) tctttgctcagggcggactgggtgctca; (가이드 8) gacttgtacagctcgtccatgccgagag; 및 (가이드 NT) tagattgctgttctaccaagtaatccat이다.
도 6a 내지 6e. 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) A375s 세포에 형질감염된 다양한 가이드를 이용한 LwCas13a에 의한 Gluc 전사물의 녹다운: (B) LwCas13a의 설계제작된 변이체를 이용한 가우시아 루시페라제(Gluc)의 녹다운. (C) LwaCas13a 및 다양한 길이의 스페이서 Gluc crRNA 1에 의한 가우시아 루시페라제(Gluc)의 녹다운. (D) 다양한 가이드를 이용한 LwaCas13a에 의한 KRAS 전사물의 녹다운. (E) 다양한 가이드를 이용한 LwaCas13a에 의한 PPIB 전사물의 녹다운.
도 7. 각각의 표적 유전자에 대해 향하는 gRNA를 이용하고NES와 융합된 C2c2 렙토트리키아 와데이 F0279를 이용한 표적 유전자의 정규화된 단백질 발현. 각각의 표적 유전자에 대한 gRNA는 ctgctgccacagaccgagaggcttaaaa (CTNNB1); tccttgattacacgatggaatttgctgt (PPIB); tcaaggtggggtcacaggagaagccaaa (mAPK14); atgataatgcaatagcaggacaggatga (CXCR4); gcgtgagccaccgcgcctggccggctgt (TINCR); ccagctgcagatgctgcagtttttggcg (PCAT1); ctggaaatggaagatgccggcatagcca (CAPN1); gatgacacctcacacggaccacccctag (LETMD1); taatactgctccagatatgggtgggcca (MAPK14); catgaagaccgagttatagaatactata (RB1); ggtgaaatattctccatccagtggtttc (TP53); 및 aatttctcgaactaatgtatagaaggca (KRAS)이다.
도 8. Gluc에 대해 향하는 상이한 gRNA를 이용하고 NLS, NES와 융합되거나 태그가 없는 C2c2 오솔로그를 이용한 루시페라제의 정규화된 단백질 발현. C2c2 오솔로그는 렙토트리키아 샤히(Lsh), 렙토트리키아 와데이 F0279(Lw2), 클로스트리듐 아미노필룸(Ca), 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL), 라크노스피라세아에 박테리움 NK4A179(LbNk), 및 라크노스피라세아에 박테리움 MA2020(LbM)이다.
도 9. Lw2는 다수의 세포주에서 기능한다. 정규화된 루시페라제 활성은 293FT 세포에 대해 나타난다.
도 10a 내지 10b. Gluc에 대해 향하는 gRNA를 이용하고 촉매적으로 비활성화된 C2c2 오솔로그를 이용한 루시페라제의 상대 단백질 발현. (A) dC2c2 렙토트리키아 와데이(LwC2c2)를 EIF4E, EIF4E 및 NES에 융합했거나 태그가 없다. (B) dC2c2 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)를 NLS 및 EIF4E에 융합했거나 태그가 없다.
도 11a 내지 11c. 베타 액틴을 표적화하는 렙토트리키아 와데이 C2c2 의 세포 국소화는 NaAsO2로 세포를 처리 즉시 스트레스 과립으로 국소화한다;
도 12. 포유류 세포에서의 RNA 녹다운. C2c2는 2 개의 표적 부위에서 shRNA를 능가한다.
도 13. 증가하는 crRNA 형질감염 양은 녹다운을 증가시킨다.
도 14. NES를 갖는 Lw2C2c2(NES-Lw2C2c2)는 tRNA 및 U6 녹다운의 RNA를 효과적으로 절단한다.
도 15a 내지 15b. (A) 단백질 형질감염 양은 녹다운을 포화시킨다. (B) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운.
도 16. U6-구동되는 DR-스페이서-DR-스페이서 표적화 작제물.
도 17. 내인성 유전자 상의 상응하는 표적에 대해 C2c2가 최적화된 shRNA를 능가한다.
도 18. dLw2C2c2-EIF4E 융합은 3 개의 유전자의 번역을 상향 조절할 수 있다; 웨스턴 블롯 상에서 밴드 강도로 측정한 단백질 수준.
도 19. 개별 전사물의 녹다운. Lw2는 더 적은 변동성 및 더 높은 특이성을 나타낸다.
도 20. 포유류 세포에서의 RNA 녹다운.
도 21. 이미징은 GFP의 수퍼폴딩 유도체(sfGFP)에 의해 향상된다. C2c2-mCherry 및 sfGFP-C2c2 융합 단백질을 HEK293FT 세포 및 마우스 배아 줄기 세포(mESC)에서 비교한다.
도 22a. msfGFP-C2c2는 녹다운을 향상시킨다. NLS 또는 NES를 추가로 포함하는, C2c2의 mCherry 또는 msfGFP와의 다양한 융합 단백질에 의한 루시페라제 녹다운을 묘사한다.
도 22b 내지 22d는 C2c2를 이용한 전사 조절을 위한 단백질 태깅 시스템을 도시하고 변형된 C2c2(SunTag)가 포함하는 짧은 펩티드 서열에 결합하는 전사 개시 인자-연결된 scFv의 구성요소를 나타낸다. 도 22c 내지 22d는 시스템의 전사적 효과를 묘사한다.
도 23a 내지 23b. 리포터 단백질(GFP, Venus, Cre 등)의 분할. 각각의 부분은 C2c2에 융합되어 있다(예를 들어 카스파제를 이용한 개략도 슬라이드 참고). 서로에게 근접한 전사물을 표적화하는 2 개의 가이드를 설계함으로써, 분할된 단백질은 전사물의 존재 하에서 재구성된다.
도 24a 내지 24c. C2c2 부수적 알엔아제 활성에 의한 신속한 RNA 검출. (A) 왼쪽 패널: C2c2 crRNA의 가이드 서열에 상보적인 표적 RNA에 의한 C2c2 부수적 비-특이적 알엔아제 활성이 활성화되는 것은 리포터의 절단을 유도한다. 오른쪽 패널: 표적 RNA 부재 시, 부수적 비-특이적 알엔아제 활성이 유도되지 않으므로 리포터의 절단이 없다. (B) LwaCas13a에 의한 부수적 효과의 활성을 검출하기 위한 분석의 개략도. (C) 표적 RNA의 존재 또는 부재 하에 LwaCas13a-crRNA 복합체와 인큐베이션 후 부수적 RNA 표적의 겔 전기 영동.
도 25. 다양한 농도의 C2c2를 이용한 부수적 효과에 의한 렌티바이러스 검출.
도 26. 부수적 효과에 의한 렌티바이러스 검출의 시간 경과.
도 27. C2c2 부수적 알엔아제 활성에 의한 희귀한 RNA 종의 검출. 증가하는 표적 농도 및 표적 절단에는 증가된 비-특이적 표적외 알엔아제 활성이 동반한다.
도 28a 내지 28b. Lw2C2c2 및 LbuC2c2의 정렬.
도 29a 내지 29c. (A) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 βLwC2c2. (B) 스페이서 서열에서의 단일 염기-쌍의 미스매치를 갖는 CXCR4 mRNA 녹다운에 대해 표적화된 LwC2c2. (C) 스페이서 서열에서의 단일 및 연속된 두 염기-쌍 미스매치를 갖는 루시페라제 mRNA 녹다운에 대해 표적화된 LwC2c2.
도 29d-a 내지 29d-c. (A) 루시페라제 리포터 mRNA의 녹다운의 특이성. C2c2는 루시페라제 리포터 mRNA의 녹다운에 대한 RNAi보다 더 특이적이다. 왼쪽: shRNA를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 오른쪽: C2c2를 위한 루시페라제 녹다운 조건에 비하여, 비-표적화 형질감염된 대조군의 RNA-seq 라이브러리에서의 모든 검출된 유전자(모든 그래프의 X 축)에 대한 log2(백만 당 전사물(TPM)) 값의 발현 수준. 녹다운에 대해 표적화된 표적 루시페라제 전사물은 빨간색 점으로 표시된다. n=3 생물학적 반복실험으로부터의 평균값이 나타난다. (B) 내인성 KRAS mRNA의 녹다운의 특이성. C2c2는 내인성 KRAS의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다. (C) 내인성 PPIB mRNA의 녹다운의 특이성. C2c2는 내인성 PPIB의 녹다운에 대한 RNAi보다 더 특이적이다. 표적 전사물은 빨간색 점으로 표시된다.
도 29e 내지 29g. (E) 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (F) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. (G) 왼쪽: 세포 성장을 측정하기 전에 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질 감염시킨 세포에 대한 루시페라제 녹다운. 중간: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 세포 생존력. 오른쪽: 항생제 선택 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광. 모든 값은 n=3 인 평균±SEM이다.
도 30a 내지 30e. RNA 녹다운의 수준 및 특이성의 비교. C2c2는 RNAi와 유사한 수준의 녹다운을 유지하면서 증가된 특이성을 입증한다. (A): 분석된 각각의 RNA-seq 라이브러리에서 유의미하게 차등적으로 조절되는 유전자의 수. 3 개의 상이한 유전자에서 LwaCas13a 녹다운을 shRNA 녹다운과 비교하는 6 개의 RNA-seq 라이브러리의 차등적 유전자 발현 분석(각각 3 회의 생물학적 반복실험으로). 유전자는 비-표적화 대조군과 비교하여 평균 배수 변화가 2 초과 또는 0.75 미만이고 거짓-발견률(FDR) 0.10 미만인 경우 유의미하게 차등적으로 발현된 것으로 고려한다. (B) RNA seq 라이브러리 유래 표적화된 유전자에 대한 평균 녹다운 수준 정량. 정규화된 발현은 표적화 조건에서의 표적화된 유전자의 TPM을 비-표적화 조건에서의 표적화된 유전자의 TPM으로 나눈 값으로서 계산한다. 플롯은 도 28의 RNA-seq 플롯의 누적 데이터에 해당한다. 표적외는 유의미하게 조절되지 않은(2 배 초과) 또는 하향 조절된(0.75 배 미만) 유전자로서 결정된다. (C) 비-선택성 및 블라스트시딘-선택성 버전의 C2c2를 이용하여 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 루시페라제 녹다운. (D) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포에 대한 세포 생존력. (E) 항생제 선택이 있거나 없이 72 시간 동안 LwaCas13a로 형질감염된 세포의 GFP 형광.
도 31. C2c2는 다중화된 녹다운이 가능하다. crRNA는 PPIB, CXCR4, KRAS, TINCR, 및 PCAT를 표적화 하도록 설계하였다. 상단 패널은 나타난 다중화된 crRNA 전사물과 왼쪽에서 오른쪽으로 동일한 순서이고 색상으로 구분된 mRNA의 정규화된 발현 수준을 나타낸다. 하단 패널은 단일로 주입된 가이드를 다중화되고 모아진 가이드와 비교한다.
도 32a 내지 32d. gLuc 또는 cLuc의 길이에 따른 가이드 타일링은 전사물 상의 재표적화 가능성 및 취약 영역을 입증한다. (A) LwaCas13a 어레이된 스크리닝의 개략도. (B) 전사물의 길이에 걸쳐 균등하게 타일링된 186 가이드를 이용하여 LwC2c2에 의한 가우시아 루시페라제 mRNA의 녹다운 효율. (C) 전사물의 길이에 걸쳐 균등하게 타일링된 가이드를 이용하여 LwC2c2에 의한 사이프리디나 루시페라제의 어레이된 녹다운 스크린. (D) shRNA 비교를 통한 어레이된 녹다운 스크린으로부터의 상위 3 개 crRNA의 검증.
도 33a 내지 33b. RNA 면역침강(RIP)은 표적 결합의 강화를 나타낸다. HA-태그를 포함하는 dC2c2-msfGFP는 단백질-RNA 복합체의 침강을 위해 제공된다. 결합된 RNA를 qPCR에 의해 정량화하고 입력 RNA(면역 침강이 없는 샘플) 및 음성 대조군 항체를 갖는 면역침강에 비교하여 강화를 결정하였다. 패널 A는 베타-액틴 RNA 표적의 강화를 나타낸다. 패널 B는 루시페라제 표적의 강화를 나타낸다.
도 34. 3T3L1 섬유아세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 35. HEK293FT 세포에서의 베타-액틴에 대한 C2c2 이미징. 표적화 조건(상단 프레임)에서 C2c2 복합체는 핵을 떠나는 액틴 mRNA와 결합하여, 세포질 베타-액틴 mRNA를 드러낸다. 비-표적화 조건에서, NLS-태그된 C2c2가 핵에서 관찰된다. 왼쪽 및 오른쪽 컬럼은 상이한 시각을 구성한다.
도 36. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 하프-로그 단계로 연속 희석된 LwaCas13a-crRNA 복합체 복합체를 사용한 5' 말단-표지된 표적 1의 RNA-절단의 0.5 시간 후의 변성 겔.
도 37. Lw2Cas13a의 RNA 절단 동역학에 대한 시험관내 특징 확인. 5' 말단-표지된 표적 1을 사용한 LwaCas13a ssRNA 절단의 시계열의 변성 겔.
도 38. Lw2C2c2 및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. 1 시간 인큐베이션 후 Lw2 C2c2에 의한 crRNA-매개 ssRNA 절단을 입증하는 변성 겔. ssRNA 표적은 IRDye 800으로 5' 표지된다. 절단은 crRNA의 존재를 필요로하고 EDTA의 첨가에 의해 파괴된다.
도 39a 내지 39b. Lw2C2c2및 crRNA는 RNA-가이드된 ssRNA 절단을 매개한다. (A) crRNA에 의해 표적화되는 ssRNA 기질의 개략도. 프로토스페이서 영역은 파란색으로 강조표시되고 PFS는 자홍색 막대로 표시된다. (B) 3 시간 인큐베이션 후 PFS에 대한 필요를 입증하는 변성 겔. PFS를 제외하고 동일한 4 개의 ssRNA 기질(개략도에서 자홍색 X로 표시)은 시험관내 절단 반응에 사용하였다. ssRNA 절단 활성은 표적 부위의 바로 3'에 있는 뉴클레오티드에 의존한다.
도 40. 직접 반복 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 직접 반복 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 41. 스페이서 길이는 Lw2C2c2의 RNA-가이드된 알엔아제 활성에 영향을 미친다. 3 시간의 인큐베이션 후 스페이서 길이의 함수로서 ssRNA 1의 crRNA-가이드된 절단을 보여주는 변성 겔.
도 42a 내지 42c. Lw2C2c2 절단 부위는 표적 RNA의 2차 구조 및 서열에 의해 결정된다. (A) LwCas13a 및 crRNA1과의 인큐베이션 후 ssRNA 4 및 ssRNA 5를 나타내는 변성 겔. (B) ssRNA 4(파란색) 및 (C) ssRNA 5;(녹색)은 동일한 프로토스페이서를 갖지만 상이한 서열이 측면에 배치되어 있다. 동일한 프로토스페이서임에도 불구하고, 상이한 측면 배치 서열이 상이한 절단 패턴을 초래했다.
도 43a 내지 43c. (A) 4 개의 가능한 뉴클레오타이드 각각에 대해 강조 표시된 루프(빨간색)에서 호모폴리머 길이를 이용하여 변형된 ssRNA 4의 개략도. crRNA 스페이서 서열은 파란색으로 강조 표시된다. (B) 3 시간 인큐베이션 후 4 개의 가능한 호모폴리머 표적 각각에 대한 Lw2C2c2-crRNA-매개 절단을 나타내는 변성 겔. Lw2C2c2는 C 및 U를 절단한다. (C) LwaCas13a는 엘. 와데이 CRISPR-Cas 유전자좌로부터의 pre-crRNA를 처리할 수 있다.
도 44a 내지 44k. 촉매적으로 비활성인 LwaCas13a(dCas13a)는 포유류 세포에서 전사물에 결합할 수 있다. (A) dCas13a 결합의 이미징 및 평가에 사용된 dCas13a-GFP 작제물의 개략도. (B) dCas13a 결합의 정량화를 위한 RNA 면역 침강의 개략도. (C) dCas13a 표적화 gLuc 전사물은 비-표적화 대조군에 비해 유의미하게 강화된다. RIP에 의한 가우시안 루시페라제 mRNA에 대한 dC2c2-msfGFP 결합의 정량은 대조군 항체 또는 입력 용해물에 대하여 정규화하였다. 값을 비-표적화 가이드에 대하여 정규화하였다(n=3, t-검정에 의해, *, p<0.05; ****, p<0.0001). (D) 음성-피드백 이미징에 사용되는 dCas13a-GFP-KRAB 작제물의 개략도. 표적 및 가이드의 부재시, 리포터 단백질은 자체 전사를 저해한다. (E) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정된 표적 접근 가능성과 부분적으로 상관관계가 있다. (F) b-액틴 이미징를 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 간의 비교. (G) HEK293 세포에서 b-액틴을 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (H) ACTB를 표적화하는 다수 가이드를 이용한 dCas13a-GFP-KRAB 이미징의 대표적인 이미지. (I) 핵 대 전체-세포 신호의 비율로 측정된, dCas13a-GFP-KRAB의 세포질 전위의 정량. (J) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정 면역 형광 이미지. 스트레스 과립은 마커 G3BP1에 대한 염색으로 표시된다. 축척 막대, 5 μm. 축척 막대, 5 μm. (K) G3BP1 및 dCas13a-GFP-KRAB 공동-국소화는 피어슨의 상관관계에 의해 세포당 정량화하였다. 모든 값은 n=3인 평균±SEM이다. **** p<0.0001; *** p<0.001; ** p<0.01; * p<0.05. ns=유의미하지 않음. 한쪽-꼬리 스튜던트 t-검정은 (a)에서의 비교를 위해 사용되었고, 양쪽-꼬리 스튜던트 t-검정은 (I) 및 (K)에서의 비교를 위해 사용되었다.
도 45. 도 43에 나타낸 바와 같이 C2c2-GFP 이미징 단백질을 사용하는 사용하여 β-액틴의 검출. 비-표적화 가이드(오른쪽 패널) 중 표적화 가이드(왼쪽 패널)와 함께 dC2c2-eGFP-ZF-KRAB-NLS를 사용하여 β-액틴을 이미징 하였다.
도 46. GFP-태그된 G3BP1을 이용한 스트레스 과립의 검출.
도 47. 스트레스 과립 및 스트레스 과립 하위구조("코어")에서의 작용 검출. 표적화 작제물이 있거나 없이 및 코어 하위구조를 안정화하기 위한 NaAsO2 처리가 있거나 없이, 액틴 mRNA는 C2c2-eGFP-ZF-KRAB을 이용하여 이미징하였다. 스트레스 과립은 항-G3BP1을 사용하여 표지하였다.
도 48a 내지 48f: dCas13a는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 소듐 아르세나이트 처리 즉시 스트레스 과립으로의 β-액틴 mRNA의 국소화를 이미징하기 위해 음성-피드백 dCas13a-msfGFP-KRAB 작제물을 사용하는 것에 대한 개략도. (B) 400 uM 소듐 아르세나이트로 처리된 293FT 세포의 대표적인 고정된 면역 형광 이미지. β-액틴 mRNA 표적화 가이드와 함께 형질감염된 dCas13a-msfGFP-KRAB는 스트레스 과립으로 국소화한다. 스트레스 과립에 대한 G3BP1 마커에 대한 항체로 면역염색된 고정된 HEK293 세포의 대표적인 이미지가 나타난다. (C) 조건당 약 20 개의 세포에 대한 피어슨 상관관계 분석에 의한 스트레스 과립 국소화의 정량 (D): 조건당 약 20 개의 세포에 대한 만데르의 공동국소화 분석에 스트레스 과립 국소화의 정량 (E) 400 uM 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성에 대한 살아있는 세포 분석으로부터의 대표적인 이미지 (F) 소듐 아르세나이트로 처리에 대응한 스트레스 과립 형성의 정량.
도 49a 내지 49o LwaCas13a는 내인성 포유류 코딩 및 비-코딩 RNA 표적을 표적화하도록 재프로그래밍할 수 있다. (A) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (B) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (C) LwaCas13a 어레이된 스크리닝의 개략도. (D) Gluc전사물에 걸쳐 균등하게 타일링된 186 개의 가이드의 어레이된 녹다운 스크린. (E) 사이프리디니아 루시페라제(Cluc) 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (F) KRAS 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (G) PPIB 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (H) shRNA 비교를 통한 내인성 어레이된 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. 모든 값은 n=3인 평균±SEM이다. ***p<0.001; **p<0.01. 양쪽-꼬리 스튜던트 T-검정을 비교를 위해 사용하였다. (I) MALAT1전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린. (J) shRNA 비교를 통한 내인성 어레이된 MALAT1 녹다운 스크린으로부터의 상위 3 개 가이드의 검증. (K) 단일 프로모터의 발현 하에 5 개의 상이한 내인성 유전자에 대한 CRISPR 어레이의 5 개의 가이드를 다중화된 전달하는 것은 견고한 녹다운을 할 수 있다. (L) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 가이드를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다. 모든 값은 n=3인 평균±SEM이다. (M) LwaCas13a를 이용한 3 가지 상이한 내인성 전사물의 녹다운을 상응하는 RNAi 작제물에 대하여 비교. (N) LwaCas13a는 핵 lncRNA 전사물 MALAT1를 녹다운할 수 있다. (O) 3 개의 상이한 내인성 유전자에 대한 3 개의 가이드의 다중화된 전달 또는 각각의 crRNA를 비-표적화 서열로 대체한 작제물을 갖는 것은 표적화된 유전자의 특이적인 녹다운을 나타낸다.
도 50. 21 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 51. 33 C2c2 오솔로그 유래의 HEPN서열 모티프.
도 52. 이펙터 도메인의 연결을 위한 예시적인 위치. 이종 기능성 도메인 (묘사된 mCherry 및 msfGFP)에 대해 C 또는 N 말단에 연결된 C2c2 단백질은 루시페라제 녹다운에 의해 표시되는 바와 같이 기능을 보유한다.
도 53a 내지 53l. (A 내지 K) C2c2 오솔로그의 서열 정렬. (L) HEPN 도메인의 서열 정렬.
도 54. C2c2 오솔로그의 트리 정렬.
도 55a 내지 55b. C2c2 및 Cas13b 오솔로그의 트리 정렬.
도 56a 내지 56f: 포유류 녹다운을 위한 LwaCas13a의 설계 제작 및 최적화. (A) Gluc crRNA 1 및 다양한 양의 형질감염된 LwaCas13a 플라스미드를 이용한 Gluc 전사물의 녹다운. (B) LwaCas13a 및 다양한 양의 형질감염된 Gluc crRNA 1 및 2 플라스미드에 의한 Gluc 전사물의 녹다운. (C) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 사용한 Gluc 전사물의 녹다운. (D) U6 또는 tRNAVal 프로모터로부터 발현된 crRNA를 이용한 KRAS 전사물의 녹다운. (E) U6 또는 tRNAVal 프로모터로부터 발현된 가이드를 이용한 KRAS 전사물의 녹다운. (F) XIST 전사물에 걸쳐 균등하게 타일링된 93 개의 가이드의 어레이된 녹다운 스크린.
도 57a 내지 57e: LwaCas13a의 PFS 선호 평가 및 LshCas13a와의 비교. (A) 이 연구에서 평가된 15 개의 Cas13a 오솔로그의 서열 비교 트리. (B) 다양한 손실 임계값에 대하여 손실 임계값 초과하는 LshCas13a 및 LwaCas13a PFS 서열의 수. (C) 표적화 샘플에서, 비-표적화 샘플에 대하여 정규화된, LshCas13a 및 LwaCas13a에 대한 PFS 강화의 분포. (D) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수. (E) 다양한 강화 컷오프 임계값에서 LshCas13a 절단 후 남은 PFS 서열에 대한 서열 로고 및 수.
도 58a 내지 58d: LwaCas13a 표적화 효율은 전사물에 대한 접근 가능성의 영향을 받는다. (A) 첫 번째 행: 상위 녹다운 가이드는 표적 전사물을 따라 위치에 의해 플롯팅된다. 가이드의 상위 20%는 Gluc 용으로 선택되고 상위 30%의 가이드는Cluc, KRAS 및 PPIB용이다. 두 번째 행: 무작위 귀무-분포(빨간색)와 비교하여 각각의 전사물에 대해 인접한 상위 가이드 사이의 쌍-거리(파란색)에 대한 히스토그램이다. 삽입 그래프는 이들 히스토그램에 대한 누적 빈도 곡선을 나타낸다. 빨간색 곡선(거리의 귀무 부포)의 왼쪽으로의 파란색 곡선(실제 측정된 거리)의 이동은 가이드들이 우연에 의해 예상되는 것보다 서로 근접함을 나타낸다. (B) Gluc, Cluc, PPIB, 및 KRAS 녹다운은 전사물의 예상되는 폴딩에 의해 측정되는 표적 접근 가능성과 부분적으로 상관관계가 있다. (C) 표적 접근 가능성(염기쌍 형성 영역의 확률) 및 LwaCas13a에 의한 녹다운 후의 표적 발현 사이의 상관 관계를 묘사하는 커널 밀도 추정 플롯. (D) 첫 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계. 두 번째 행: 상이한 윈도우 크기(W)에서 및 상이한 k-mer 길이에 대해 측정된 표적 발현과 표적 접근 가능성(염기쌍 형성 영역의 확률) 사이의 상관관계에 대한 P 값. 색상 기준은 p 값 > 0.05는 빨간색 음영이고 p 값 < 0.05는 파란색 음영이 되도록 설계하였다.
도 59a 내지 59k: 다양한 스페이서 길이에서 crRNA:표적 듀플렉스에서의 미스매치에 대한 LwaCas13a 민감성의 상세 평가. (A) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 KRAS의 녹다운. (B) 스페이서 서열에 걸쳐 다양한 위치에서 단일 미스매치를 함유하는 crRNA로 평가된 PPIB의 녹다운 (C) 스페이서 서열에 걸쳐 다양한 위치에서 비-연속 2 개의 미스매치를 함유하는 가이드로 평가된 Gluc의 녹다운. 야생형 서열은 아래에 나타난 미스매치 동일성과 함께 상단에 나타난다. (D) 다양한 스페이서 길이에 대한 ssRNA 1 및 2 상의 부수적 절단 활성(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (E) (D)에서 시험한 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (F) 스페이서를 따라 타일링된 합성 미스매치를 갖는 28 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (G) (F)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (H) 스페이서를 따라 타일링된 합성 미스매치를 갖는 23 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (I) (H) 에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (J) 스페이서를 따라 타일링된 합성 미스매치를 갖는 20 nt 스페이서 crRNA에 대한 ssRNA 1 및 2 상의 부수적 절단 활성 (n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다). (K) (J)에서 시험된 crRNA의 특이성 비율. 특이성 비율은 표적외 RNA(ssRNA 2)의 부수적 절단에 대한 표적내 RNA(ssRNA 1)의 부수적 절단의 비율로 계산된다(n=4 기술적 반복실험, 막대는 평균±s.e.m.에 해당한다).
도 60a 내지 60f: LwaCas13a는 내인성 표적 상의 shRNA 녹다운보다 더 특이적이고 생물학적 잡음에 비교할 만한 변동이 거의 없다. (A) 왼쪽: KRAS-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: KRAS-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. KRAS 전사물 데이터 포인트는 빨간색으로 채색된다. (B) 왼쪽: PPIB-표적화 shRNA(y-축)에 대비한 비-표적화 shRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. 오른쪽: PPIB-표적화 LwaCas13a-crRNA(y-축)에 대비한 비-표적화 LwaCas13a-crRNA-형질감염된 대조군의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM)) 값으로의 발현 수준(x-축). 3 회 생물학적 반복실험의 평균값이 나타난다. PPIB 전사물 데이터 포인트는 빨간색으로 채색된다. (C) 비-표적화 shRNA 조건(첫 번째 행) 및 Gluc-표적화 shRNA 조건(두 번째 행)의 개별 반복실험의 비교. (D) 비-표적화 crRNA 조건(첫 번째 행) 및 Gluc-표적화 crRNA 조건(두 번째 행)의 개별 반복실험의 비교. (E) Gluc-표적화 shRNA 조건에 대한 비-표적화 shRNA 조건의 개별 반복실험의 쌍별 비교. (F) Gluc-표적화 crRNA 조건에 대한 비-표적화 crRNA 조건의 개별 반복실험의 쌍별 비교.
도 61a 내지 61c: 모든 샘플에 걸친 LwaCas13a 및 RNAi 녹다운 가변성(표준 편차)에 대한 상세 분석. (A) 루시페라제 리포터 또는 내인성 유전자를 표적화하는 shRNA 또는 crRNA에 대해 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (B) 모든 반복실험 및 변동 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 상관 관계(켄달의 타우) 히트 맵. (C) shRNA 또는 crRNA의 경우 표적화된 각각의 유전자에 대한 표적화 및 비-표적화 반복실험 사이에서의 RNA-seq 라이브러리에서 검출된 모든 유전자의 log2(백만 당 전사물 (TPM+1)) 값에 대한 표준 편차 분포.
도 62a 내지 62j: LwaCas13a 녹다운은 측정된 표적외 전사물 상에 아무 활성을 갖지 않고 표적화된 전사물에 특이적이다. (A) Gluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Gluc 신호 히트 맵. (B) Cluc을 타일링한 처음 96 개의 스페이서에 대한 절대 Cluc 신호 히트 맵. (C) 절대 Gluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (D) 절대 Cluc 신호 및 Gluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (E) 절대 Cluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (F) 절대 Gluc 신호 및 Cluc 타일링 가이드에 대해 정규화된 루시페라제 사이의 관계. (G) PPIB 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (H) GAPDH 2-Ct 수준 및 PPIB 타일링 가이드에 대한 PPIB 녹다운 사이의 관계. (I) KRAS 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계. (J) GAPDH 2-Ct 수준 및 PPIB KRAS 가이드에 대한 KRAS 녹다운 사이의 관계.
도 63a 내지 63f: dCas13a는 리포터 유전자 발현을 억제하고 내인성 유전자와 결합한다. (A) Cluc및 Gluc를 분리하는 합성 HBG1 인트론을 통해 타일링된 dCas13a는 번역 개시 부위로부터 특정 거리에서 Gluc 번역을 억제할 수 있다. (B) dCas13a 및 2 개의 표적화 crRNA 및 1 개의 비-표적화 crRNA로 표적화된 β-액틴 mRNA의 RNA 면역 침강 강화. (C) ACTB를 이미징하기 위한 dCas13-GFP 및 dCas13a-GFP-KRAB 작제물의 국소화 사이의 비교. (D) 비-표적화 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (E) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야. (F) ACTB 가이드와 함께 전달되는 dCas13a-NLS-msfGFP 음성-피드백 작제물에 대한 추가적인 시야.
도 64a 내지 64b dCas13a-NF는 살아있는 세포에서 스트레스 과립 형성을 이미징할 수 있다. (A) 상응하는 ACTB-표적화 및 비-표적화 가이드를 갖는 dCas13a-NF-발현 세포에서의 ACTB 전사물의 RNA FISH로부터의 대표적인 이미지. 세포 외곽선은 파선으로 나타난다. (B) 만데르의 중첩 계수(왼쪽) 및 피어슨 상관관계(오른쪽)에 의해 정량화된 ACTB RNA FISH 신호 및 dCas13a-NF 사이의 전체 신호 중첩. 상관 관계 및 신호 중첩은 세포당 기반으로 픽셀 단위로 계산된다. 모든 값은 n=3 인 평균±SEM이다. ****p < 0.0001; ***p < 0.001; **p < 0.01. 양쪽-꼬리 스튜던트 T-검정을 비교에 사용하였다.
도 65a 내지 65c. 발현에 대한 직접 및 부수적 전사물 녹다운. (A) 활성 대 데드 Cas13a에 의한 루시페라제의 녹다운. (B) 내인성 유전자 발현에 대한 활성 대 데드 Cas13a 녹다운. 데드 Cas13a에 의한 녹다운은 번역 차단으로 인하거나 결합으로 인한 전사물의 불안정화로 인할 수 있다. (C) 포유류 세포에서 데드 Cas13a에 의한 부수적 활성의 부재. (A)에서 루시페라제에 대해 데드 Cas13a 및 가이드 1 및 2를 사용하여, 비-표적화 대조군에 비해 전사물 분포 크기에서의 변화는 관찰되지 않는다.
도 66a 내지 66o. 도 53의 상이한 C2C2 오솔로그 서열들의 표시된 컨센서스 서열과의 정렬.
도 67a 내지 67c. 렙토트리키아 와데이 F0279 C2c2("Lew2C2c2") 및 리스테리아 뉴요켄시스 FSL M6-0635 C2c2("LibC2c2")의 정렬.
도 68. 알엔아제 활성을 나타내는 C2c2 HEPN 도메인의 정렬. 상단 정렬 블록은 이전에 기재된 선택된 HEPN 도메인을 포함하고 하단 블록은 C2c2 이펙터 단백질 유래의 촉매 모티프를 포함한다. 각각의 도메인 구조 밑에는 각 단백질 패밀리의 선택된 대표에서 보존된 모티프의 정렬. 촉매성 잔기는 검정색 배경 상의 흰색 글자로 나타나고; 보존된 소수성 잔기는 노란색으로 강조 표시되고; 보존된 작은 잔기는 녹색으로 강조 표시되고; 가교 나선 정렬에서, 양으로 하전된 잔기는 빨간색이다. 2 차 구조 예측은 정렬된 서열의 밑에 나타난다: H는 α-나선을 의미하며 E는 펼쳐진 형태(β-가닥)를 의미한다. 정렬 블록 사이의 불량하게 보존된 스페이서는 숫자로 나타난다.
본 명세서의 도면은 단지 예시적인 목적을 위한 것이며, 반드시 일정한 비율로 그려진 것은 아니다.
일반적으로, WO 2014/093622(PCT/US2013/074667)와 같은 전술한 문헌에서 사용된 CRISPR-Cas 또는 CRISPR 시스템은 전사물 및, Cas유전자를 인코딩하는 서열, tracr(트랜스-활성화 CRISPR) 서열(예를 들어, tracrRNA 또는 활성 부분 tracrRNA), tracr-메이트 서열(내인성 CRISPR 시스템의 맥락에서 "직접 반복" 및 tracrRNA-처리된 부분 직접 반복을 포괄하는), 가이드 서열(내인성 CRISPR 시스템의 맥락에서 "스페이서"로도 지칭되는), 또는 본 명세서에서 사용되는 그 용어와 같은 "RNA"(예를 들어, Cas9와 같은 Cas를 가이드하기 위한 RNA(들), 예를 들어 CRISPR RNA 및 트랜스활성화(tracr) RNA 또는 단일 가이드 RNA(sgRNA)(키메라 RNA)) 또는 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함하는, CRISPR-관련("Cas") 유전자의 발현 또는 활성을 지시하는 것에 관여하는 다른 요소를 집합적으로 지칭한다. 일반적으로, CRISPR 시스템은 표적 서열의 부위에서 CRISPR 복합체의 형성을 촉진시키는 요소(내인성 CRISPR 시스템의 맥락에서 프로토스페이서라고도 지칭됨)를 특징으로 한다. CRISPR 단백질이 C2c2 단백질일 때, tracrRNA는 필요하지 않다.
CRISPR 복합체의 형성 맥락에서, "표적 서열"은 표적 서열과 가이드 서열 사이의 혼성화가 CRISPR 복합체의 형성을 촉진하는, 가이드 서열이 그에 대하여 상보성을 갖도록 설계된 서열을 지칭한다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 또는 세포질에 위치한다. 일부 구현예에서, 직접 반복은 다음 기준 중 임의의 것 또는 전부를 충족시키는 반복 모티프를 검색함으로써 인실리코로 동정될 수 있다: 1. 제II형 CRISPR 유전자좌 측면에 배치된 게놈 서열의 2 Kb 윈도우에서 발견됨; 2. 20 내지 50 bp에 걸침; 및 3. 20 내지 50 bp 만큼의 간격을 둠. 일부 구현예에서, 이들 기준 중 2 개, 예를 들어 1 및 2, 2 및 3, 또는 1 및 3이 사용될 수 있다. 일부 구현예에서, 3 개 기준 모두가 사용될 수 있다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고 표적 서열에 CRISPR 복합체의 서열-특이적 결합을 지시하기 위해 표적 폴리뉴클레오티드 서열과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 용어 "표적화 서열"은 표적 서열과 충분한 상보성을 갖는 가이드 서열의 부분을 의미한다. 일부 구현예에서, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬된 경우, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 그 이상이거나 그보다 크다. 서열을 정렬하기 위한 임의의 적합한 알고리즘으 사용으로 최적 정렬을 결정할 수 있으며, 이의 비-제한적인 예로는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러(Burrows-Wheeler) 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies, www.novocraft.com에서 이용 가능), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능), 및 Maq(maq.sourceforge.net에서 이용 가능)이 포함된다. 일부 구현예에서, 가이드 서열은 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75, 또는 그 이상의 뉴클레오티드 길이이거나 그보다 크다. 일부 구현예에서, 가이드 서열은 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12, 또는 그 이하의 뉴클레오티드 길이보다 작다. 바람직하게, 가이드 서열은 10 30 뉴클레오티드 길이이다. CRISPR 복합체의 표적 서열에 대한 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험될 가이드 서열을 포함하여, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, 예를 들어 CRISPR 서열의 성분을 인코딩하는 벡터로 형질감염시킴으로써, 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있고, 이어서, 예를 들어 본 명세서에 기재된 Surveyor 분석에 의해, 표적 서열 내에서의 선택적인 절단을 평가할 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 시험될 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는, CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 사이의 표적 서열에서의 결합 또는 절단 속도를 비교함으로써 시험과에서 평가될 수 있다. 다른 분석이 가능하며 당업자에게 떠오를 것이다.
대표적인 CRISPR-Cas 시스템에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99%, 또는 100%이거나 그보다 클 수 있고; 가이드 또는 RNA 또는 sgRNA는 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75, 또는 그 이상의 뉴클레오티드 길이이거나 그보다 클 수 있거나; 가이드 또는 RNA 또는 sgRNA는 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12, 또는 그 이하의 뉴클레오티드 길이보다 작을 수 있다. 그러나, 본 발명의 일 양태는 표적외 상호 작용을 감소시키는 것, 예를 들어, 낮은 상보성을 갖는 표적 서열과 상호 작용하는 가이드를 감소시키는 것이다. 실제로, 실시예에서, 본 발명은 CRISPR-Cas 시스템이 80% 초과 내지 약 95%의 상보성, 예를 들어, 83% 내지 84% 또는 88 내지 89% 또는 94 내지 95% 상보성을 갖는 표적과 표적외 서열 사이를 구별(예를 들어, 1, 2 또는 3 미스매치를 갖는 18 개 뉴클레오티드의 표적외로부터 18 개 뉴클레오티드를 갖는 표적 간의 구별)할 수 있도록 하는 돌연변이를 포함하는 것으로 나타난다. 따라서, 본 발명의 맥락에서, 가이드 서열과 그의 상응하는 표적 서열 사이의 상보성 정도는 94.5% 또는 95% 또는 95.5% 또는 96% 또는 96.5% 또는 97% 또는 97.5% 또는 98% 또는 98.5% 또는 99% 또는 99.5% 또는 99.9% 또는 100% 보다 크다. 표적외는 서열과 가이드 사이에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 또는 94% 또는 93% 또는 92% 또는 91% 또는 90% 또는 89% 또는 88% 또는 87% 또는 86% 또는 85% 또는 84% 또는 83% 또는 82% 또는 81% 또는 80% 상보성보다 적고, 표적외가 서열과 가이드 사이에 100% 또는 99.9% 또는 99.5% 또는 99% 또는 99% 또는 98.5% 또는 98% 또는 97.5% 또는 97% 또는 96.5% 또는 96% 또는 95.5% 또는 95% 또는 94.5% 상보성인 것이 유리하다.
특정 구현예에서, 절단 효율의 조절은 미스매치, 예를 들어 스페이서/표적을 따라 미스매치의 위치를 포함하여, 스페이서 서열과 표적 서열 사이의 1 또는 2 개의 미스매치와 같은, 1 개 이상의 미스매치의 도입에 의해 개발될 수 있다. 예를 들어 2 개의 미스매치가 더 중심에 있을수록(즉, 3' 또는 5'이 아님), 절단 효율이 더 많이 영향을 받는다. 따라서, 스페이서를 따라 미스매치 위치를 선택함으로써, 절단 효율이 조절될 수 있다. 예로서, 표적의 100% 미만의 절단을 원하는 경우(예를 들어, 세포 집단에서), 스페이스와 표적 서열 사이의 1 개 이상, 예를 들어 바람직하게는 2 개의 미스매치가 스페이서 서열에 도입될 수 있다. 미스매치 위치가 스페이서를 따라 더 중심에 있을수록 절단 백분율은 더 낮아진다.
본 명세서에 기재된 본 발명에 따른 방법은 본 명세서에서 논의된 벡터를 세포에 전달하는 것을 포함하여 본 명세서에서 논의된 진핵 세포(시험관내, 즉 단리된 진핵 세포)에서 하나 이상의 뉴클레오티드 변형을 유도하는 것을 이해한다. 돌연변이(들)는 가이드(들) RNA(들) 또는 sgRNA(들)를 통해 세포(들)의 각각의 표적 서열에의 하나 이상의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 1 내지 75 개 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 1, 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 75 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다. 돌연변이는 가이드(들) RNA(들)를 통해 상기 세포(들)의 각각의 표적 서열에의 40, 45, 50, 75, 100, 200, 300, 400 또는 500 개의 뉴클레오티드의 도입, 결실 또는 치환을 포함할 수 있다.
독성 및 표적외 효과의 최소화를 위해, Cas mRNA 또는 단백질 및 전달되는 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. Cas mRNA 또는 단백질 및 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵생물 동물 모델에서 상이한 농도를 시험하고 잠재적인 표적외 게놈 유전자좌에서 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정할 수 있다.
전형적으로, 내인성 CRISPR 시스템의 맥락에서, CRISPR 복합체(표적 서열에 혼성화되고 하나 이상의 Cas 단백질과 복합체를 이루는 가이드 서열을 포함)의 형성은 표적 서열에서 또는 근처(예를 들어. 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 또는 그 이상의 염기쌍 내에)에서 절단을 초래하나, 예를 들어, 구체적으로 RNA 표적의 경우에는 2 차 구조에 의존할 수 있다.
Cas를 인코딩하는 핵산 분자는 유리하게는 코돈 최적화된 Cas이다. 코돈 최적화 서열의 예는, 이 경우에는, 본 명세서에서 논의된 진핵 생물, 예를 들어 인간(즉, 인간에서의 발현을 위해 최적화된), 또는 또 다른 진핵 생물, 동물 또는 포유류에서의 발현을 위해 최적화된 서열이다; 예를 들어 WO2014/093622(PCT/US2013/074667)에서의 SaCas9 인간 코돈 최적화된 서열 참고. 이것이 선호되는 반면, 다른 예가 가능하고 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특정 기관에 대한 코돈 최적화가 알려져 있음을 이해할 것이다. 일부 구현예에서, Cas를 인코딩하는 효소 코딩 서열은 구체적인 세포, 예를 들어 진핵 세포에서의 발현을 위해 코돈 최적화된다. 진핵 세포는, 인간을 포함하나 이에 한정되지 않는 포유동물, 또는 본 명세서에서 논의된 비-인간 진핵 생물 또는 동물 또는 포유동물, 예를 들어, 마우스, 래트, 토끼, 개, 가축, 또는 비-인간 포유동물 또는 영장류와 같은 구체적인 생물의 것 또는 그로부터 유래한 것일 수 있다. 일부 구현예에서, 인간 또는 동물에게 임의의 실질적인 의학적 이익없이 고통을 초래할 가능성이 있는, 인간의 생식세포 유전적 동일성을 변형하기 위한 공정 및/또는 동물의 유전적 동일성을 변형하기 위한 공정, 및 이러한 공정으로부터 생기는 동물은 또한 제외될 수 있다. 일반적으로, 코돈 최적화는 천연 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개, 또는 그 이상의 코돈이거나 그보다 많은)을 천연 아미노산 서열을 유지하면서 그 숙주 세포의 유전자에서 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써 관심 있는 숙주 세포에서의 향상된 발현을 위해 핵산 서열을 변형시키는 공정을 지칭한다. 다양한 종은 구체적인 아미노산의 특정 코돈에 대해 구체적인 편향을 나타낸다. 코돈 편향(생물 간의 코돈 사용에 있어서의 차이)은 종종 메신저 RNA(mRNA)의 번역 효율과 상관관계가 있고, 이는 결국, 다른 것들 중에서, 번역될 코돈의 특성 및 구체적인 트랜스퍼 RNA(tRNA) 분자의 이용 가능성에 의존하는 것으로 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩티드 합성에서 가장 빈번하게 사용되는 코돈의 반영이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 생물에서 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스(Codon Usage Database)"에서 쉽게 이용할 수 있으며 이들 표는 많은 방식으로 각색될 수 있다. 문헌[Nakamura, Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292 (2000)] 참고. 구체적인 숙주 세포에서의 발현을 위해 구체적인 서열을 코돈 최적화하는 컴퓨터 알고리즘 또한 이용 가능하고, 예를 들어 Gene Forge(Aptagen, Jacobus, PA) 또한 이용 가능하다. 일부 구현예에서, Cas를 인코딩하는 서열 중 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50, 또는 그 이상의, 또는 모든 코돈)은 구체적인 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다.
특정 구현예에서, 본 명세서에 기재된 방법은, 하나 이상의 가이드 RNA를 인코딩하는 하나 이상의 핵산이 제공되거나 하나의 관심 유전자의 프로모터를 포함하는 조절 요소와 작동 가능하게 연결되어 세포 내에 도입된 Cas 유전자 도입 세포를 제공하는 것을 포함할 수 있다. 본 명세서에 사용된 용어 "Cas 유전자 도입 세포"는 Cas 유전자가 게놈으로 통합된, 진핵 세포와 같은, 세포를 지칭한다. 세포의 본성, 유형, 또는 기원은 본 발명에 따라 구체적으로 한정되지 않는다. 또한 Cas 전이 유전자가 세포 내에 도입되는 방식은 다양할 수 있으며 당 업계에 공지된 임의의 방법일 수 있다. 특정 구현예에서, Cas 유전자 도입 세포는 단리된 세포에 Cas 전이 유전자를 도입함으로써 수득된다. 특정 다른 구현예에서, Cas 유전자 도입 세포는 Cas 유전자 도입 생물로부터 세포를 단리함으로써 수득된다. 예로서, 제한 없이, 본 명세서에서 지칭된 Cas 유전자 도입 세포는 Cas 녹-인 진핵 생물과 같은 Cas 유전자 도입 진핵 생물로부터 유래될 수 있다. 본 명세서에 참조로서 포함된 WO2014/093622(PCT/US13/74667)를 참조한다. Rosa 유전자좌를 표적화하는 것에 대한, Sangamo BioSciences, Inc.에 양도된 미국 특허 공보 제20120017290호 및 제20110265198호의 방법은 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. Rosa 유전자좌를 표적화하는 것에 대한, Cellectis에 양도된 미국 특허 공보 제20130236946호의 방법도 본 발명의 CRISPR Cas 시스템을 이용하도록 변형될 수 있다. 추가의 예로서, 본 명세서에 참조로서 포함된, Cas9 녹-인 마우스를 기술하는, 문헌[Platt et. al. (Cell; 159(2):440-455 (2014))]을 참조한다. Cas 전이 유전자는 Lox-정지-폴리A-Lox(LSL) 카세트를 추가로 포함할 수 있어, Cre 재조합 효소에 의해 Cas 발현이 유도되도록 할 수 있다. 대안적으로, Cas 유전자 도입 세포는 단리된 세포에 Cas 전이 유전자를 도입함으로써 수득될 수 있다. 전이 유전자 전달 시스템은 당업계에 잘 알려져 있다. 예로서, Cas 전이 유전자는 본 명세서의 다른 곳에서도 기재된 바와 같이 벡터(예를 들어, AAV, 아데노바이러스, 렌티바이러스) 및/또는 입자 및/또는 나노입자 전달에 의해 예를 들어 진핵 세포에 전달될 수 있다.
당업자는 본 명세서에서 지칭된 Cas 유전자 도입 세포와 같은 세포가, 예를 들어, 제한 없이 문헌[Platt et al. (2014), Chen et al., (2014) or Kumar et al.. (2009)]에 기재된 바와 같이, 통합된 Cas 유전자 또는, 예를 들어 하나 이상의 발암성 돌연변이와 같은, Cas를 표적 유전자좌로 가이드할 수 있는 RNA와 복합체 형성시 Cas의 서열 특이적 작용으로부터 발생하는 돌연변이를 갖는 것 외에 추가적인 게놈 변경을 포함할 수 있음을 이해할 것이다.
일부 구현예에서, Cas 서열은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES와 같은, 하나 이상의 핵 국소화 서열(NLS) 또는 핵 방출 신호(NES)에 융합된다. 일부 구현예에서, Cas는 아미노 말단에서 또는 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES, 카르복시 말단에서 또는 근처에서 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 그 이상, 또는 그 보다 많은 NLS 또는 NES, 또는 이들의 조합(예를 들어, 아미노 말단에 0 또는 적어도 하나 이상의 NLS 또는 NES 및 카르복시 말단에 0 또는 하나 이상의 NLS 또는 NES)을 포함한다. 하나 보다 많은 NLS 또는 NES가 존재할 때, 각각은 다른 것과 독립적으로 선택될 수 있어, 단일 NLS 또는 NES가 하나보다 많은 카피로 존재할 수 있고/있거나 하나 이상의 다른 NLS 또는 NES와 조합하여 하나 이상의 카피로 존재할 수 있다. 본 발명의 바람직한 구현예에서, Cas는 최대 6 개의 NLS를 포함한다. 일부 구현예에서, NLS 또는 NES의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50, 또는 그 이상의 아미노산 내에 있는 경우 NLS 또는 NES는 N- 또는 C-말단 근처로 여겨진다. NLS의 비-제한적 예로는 아미노산 서열 PKKKRKV(SEQ ID NO: X)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민 유래 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 양분 NLS) (SEQ ID NO:X); 아미노산 서열 PAAKRVKLD(SEQ ID NO: X) 또는 RQRRNELKRSP(SEQ ID NO:X)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: X)를 갖는 hRNPA1 M9 NLS; 임포틴-알파 유래의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: X); 근종 T 단백질의 서열VSRKRPRP(SEQ ID NO: X) 및 PPKKARED(SEQ ID NO: X); 인간 p53의 서열 POPKKKPL(SEQ ID NO: X); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: X); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: X) 및 PKQKKRK(SEQ ID NO: X); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: X); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: X); 인간 폴리(ADP-리보스) 폴리메라제의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: X); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: X)로부터 유래된 NLS 서열이 포함된다. NES의 비-제한적인 예는 NES 서열 LYPERLRRILT (ctgtaccctgagcggctgcggcggatcctgacc)를 포함한다. 일반적으로, 하나 이상의 NLS 또는 NES는 진핵 세포의 핵 또는 세포질 각각에서 검출 가능한 양으로 Cas의 축적을 추진하기에 충분한 강도이다. 일반적으로 핵 국소화/방출 활성의 강도는 Cas의 NLS/NES 수, 사용된 구체적인 NLS(들) 또는 NES(들), 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵/세포질에서의 축적의 검출은 임의의 적합한 기법에 의해 수행될 수 있다. 예를 들어, 검출 가능한 마커가 Cas에 융합되어, 예를 들어 핵(예를 들어, DAPI와 같은 핵에 특이적인 염색) 또는 세포질의 위치를 검출하기 위한 수단과 조합하여, 세포 내의 위치가 시각화될 수 있다. 세포 핵은 또한 세포로부터 단리될 수 있으며, 그 다음 그 내용물을 면역조직화학법, 웨스턴 블롯, 또는 효소 활성 분석과 같은 단백질 검출을 위한 임의의 적합한 공정에 의해 분석할 수 있다. 핵 내 축적은 또한 예를 들어, Cas 또는 복합체에 노출되지 않은 대조군, 또는 하나 이상의 NLS 또는 NES가 없는 Cas에 노출된 대조군과 비교하여 CRISPR 복합체 형성 효과에 대한 분석(예를 들어, 표적 서열에서의 DNA 절단 또는 돌연변이에 대한 분석, 또는 CRISPR 복합체 형성 및/또는 Cas 효소 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 분석)에 의해 간접적으로 결정될 수 있다. 특정 구현예에서, 예를 들어, 제한 없이, 미토콘드리아, 플라스티드, 엽록체, 소포, 골지, (핵 또는 세포)막, 리보솜, 인, ER, 세포골격, 공포, 중심체, 뉴클레오솜, 과립, 중심립 등과 같은 세포 기관과 같은 세포의 구체적인 부위에 Cas를 국소화시키기 위하여 다른 국소화 태그를 Cas 단백질에 융합시킬 수 있다.
특정 양태에서, 본 발명은 벡터, 예를 들어 Cas 및/또는 Cas를 표적 유전자좌로 가이드할 수 있는 RNA(즉, 가이드 RNA)를 세포에 전달하거나 도입시키는 것뿐만 아니라, (예를 들어, 원핵 세포에서) 이들 성분을 증식시키는 것을 위한 벡터를 포함한다. 본 명세서에서 사용되는 "벡터"는 한 환경에서 또 다른 환경으로의 실재물의 이동을 가능하게 하거나 용이하게 하는 도구이다. 그것은 플라스미드, 파지, 또는 코즈미드와 같은 레플리콘(replicon)으로, 이 안으로 또 다른 DNA 절편이 삽입되어 삽입된 절편의 복제를 초래할 수 있다. 일반적으로 벡터는 적절한 제어 요소와 연관될 때 복제가 가능한다. 일반적으로, 용어 "벡터"는 그것이 연결된 또 다른 핵산을 운반할 수 있는 핵산 분자를 지칭한다. 벡터는 단일-가닥, 이중-가닥, 또는 부분적으로 이중-가닥인 핵산 분자, 하나 이상의 자유 말단을 포함하는, 자유 말단을 포함하지 않는(예를 들어 원형) 핵산 분자; DNA, RNA 또는 둘 모두를 포함하는 핵산 분자; 및 당업계에 공지된 다른 다양한 폴리뉴클레오티드를 포함하지만 이에 한정되지 않는다. 벡터의 한 유형은 "플라스미드"이며, 이는, 예를 들어 표준 분자 클로닝 기법에 의해, 추가적인 DNA 절편이 삽입될 수 있는 원형 이중 가닥 DNA 루프를 지칭한다. 벡터의 또 다른 유형은 바이러스 벡터이며, 여기서, 바이러스-유래 DNA 또는 RNA 서열이 바이러스로의 패키징을 위해 벡터에 존재한다(예를 들어, 레트로바이러스, 복제 결함 있는 레트로바이러스, 아데노바이러스, 복제 결함 있는 아데노바이러스, 및 아데노-관련 바이러스(AAV)). 바이러스 벡터는 또한 숙주 세포 내로의 형질감염을 위해 바이러스가 가지는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그들이 도입된 숙주 세포에서 자체 복제할 수 있다(예를 들어, 박테리아 복제 기원을 갖는 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입 즉시 숙주 세포의 게놈 안에 통합되어, 숙주 게놈과 함께 복제된다. 또한, 특정 벡터는 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 재조합 DNA 기법에서 효용있는 통상의 발현 벡터는 종종 플라스미드 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있으며, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 이는 발현될 핵산 서열에 작동 가능하게 연결되는, 발현에 사용되는 숙주 세포에 기반하여 선택될 수 있다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이 (예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입되는 경우 숙주 세포에서) 뉴클레오티드 서열의 발현이 가능하게 하는 방식으로 조절 요소(들)에 연결됨을 의미하는 것으로 의도된다. 재조합 및 클로닝 방법과 관련하여, 2004년 9월 2일 US 2004-0171156 A1으로서 공개된 미국 특허 출원 제10/815,730 호에 대하여 언급되며, 그 내용은 전체가 본 명세서에 참조로서 포함된다.
벡터(들)는 조절 요소(들), 예를 들어, 프로모터(들)를 포함할 수 있다. 벡터(들)는 Cas 인코딩 서열, 및/또는 단일, 그러나 또한 가능하게는 적어도 3 또는 8 또는 16 또는 32 또는 48 또는 50 개의 가이드 RNA(들)(예를 들어, sgRNA) 인코딩 서열, 예를 들어1 내지 2, 1 내지 3, 1 내지 4, 1 내지 5, 3 내지 6, 3 내지 7, 3 내지 8, 3 내지 9, 3 내지 10, 3 내지 8, 3 내지 16, 3 내지 30, 3 내지 32, 3 내지 48, 3 내지 50 RNA(들)(예를 들어, sgRNA) 를 포함할 수 있다. 단일 벡터에서, 유리하게는, 약 16 개까지의 RNA(들)가 있는 경우, 각각의 RNA(예를 들어, sgRNA)에 대한 프로모터가 있을 수 있고; 단일 벡터가 16 개 보다 많은 RNA(들)를 제공할 경우, 하나 이상의 프로모터(들)가 하나보다 많은 RNA(들)의 발현을 구동할 수 있으며, 예를 들어, 32 개의 RNA(들)이 있을 경우, 각각의 프로모터는 2 개의 RNA(들)의 발현을 구동할 수 있으며, 48 개의 RNA(들)가 있을 경우 각각의 프로모터는 3 개의 RNA(들)의 발현을 구동할 수 있다. 간단한 산술 및 잘 확립된 클로닝 프로토콜 및 이 개시에서의 교시에 의해, 당업자는 AAV와 같은 적합한 예시적 벡터, 및 U6 프로모터와 같은 적합한 프로모터에 대하여 RNA(들)에 대한 본 발명을 용이하게 실시할 수 있다. 예를 들어, AAV의 패키징 한계는 약 4.7 kb이다. 단일 U6-gRNA(클로닝을 위한 제한 부위 포함)의 길이는 361 bp이다. 따라서, 당업자는 약 12 내지 16 개, 예를 들어, 13 개의 U6-gRNA 카세트를 단일 벡터에 용이하게 맞출 수 있다. 이것은 TALE 조립에 사용되는 골든 게이트 전략(http://www.genome-engineering.org/taleffectors/)과 같은 임의의 적합한 수단에 의해 조립될 수 있다. 당업자는 U6-gRNA의 수를 약 1.5 배만큼 증가시키기 위해, 예를 들어 12 내지 16 개, 예를 들어 13 개로부터 약 18 내지 24 개, 예를 들어 약 19개 U6-gRNA로 증가시키기 위해 직렬 배열 가이드 전략을 사용할 수도 있다. 따라서, 당업자는 단일 벡터, 예를 들어 AAV 벡터 내에서 약 18 개 내지 24 개, 예를 들어 약 19 개의 프로모터-RNA, 예를 들어 U6-gRNA에 용이하게 도달할 수 있다. 벡터 내 프로모터 및 RNA의 수를 증가시키기 위한 추가의 수단은 절단 가능한 서열에 의해 분리된 RNA의 어레이를 발현하는 단일 프로모터(예를 들어, U6)를 사용하는 것이다. 또한 벡터 내 프로모터-RNA의 수를 증가시키는 또 다른 추가의 수단은 코딩 서열 또는 유전자의 인트론에서 절단 가능한 서열에 의해 분리된 프로모터-RNA의 어레이를 발현하는 것이며; 이 경우, 증가된 발현을 가질 수 있고 조직 특이적 방식으로 긴 RNA의 전사를 가능하게 할 수 있는 폴리메라제 II 프로모터를 사용하는 것이 유리하다 (예를 들어, http://nar.oxfordjournals.org/content/34/7/e53.short, http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html 참조). 유리한 구현예에서, AAV는 약 50 개까지의 유전자를 표적화하는 U6 직렬 배열 gRNA를 패키징할 수 있다. 따라서, 당업계의 지식 및 이 개시에서의 교시로부터, 당업자는 벡터(들), 예를 들어, 제어 하에 또는 작동 가능하게 또는 기능적으로 하나 이상의 프로모터에 연결된 다중 RNA 또는 가이드를 발현하는 단일 벡터를, 특히 어떤 과도한 실험 없이 본 명세서에서 논의된 RNA 또는 가이드의 수와 관련하여, 용이하게 제조 및 사용할 수 있다.
가이드 RNA(들) 인코딩 서열 및/또는 Cas 인코딩 서열은 기능적으로 또는 작동 가능하게 조절 요소(들)에 연결될 수 있으며, 따라서 조절 요소(들)는 발현을 추진할 수 있다. 프로모터(들)는 구성적 프로모터(들) 및/또는 조건적 프로모터(들) 및/또는 유도성 프로모터(들) 및/또는 조직 특이적 프로모터일 수 있다. 프로모터는 RNA 폴리메라제, pol I, pol II, pol III, T7, U6, H1, 레트로바이러스 Rous 육종 바이러스(RSV) LTR 프로모터, 사이토메갈로바이러스(CMV) 프로모터, SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나제(PGK) 프로모터, 및 EF1α 프로모터로 구성된 군으로부터 선택될 수 있다. 유리한 프로모터는 프로모터가 U6인 것이다.
본 발명의 일 양태는 클래스 2 CRISPR-Cas 시스템과 연관된 신규 이펙터 단백질의 동정 및 설계 제작에 관한 것이다. 바람직한 구현예에서, 이펙터 단백질은 단일-서브유닛 이펙터 모듈을 포함한다. 추가 구현예에서, 이펙터 단백질은 시험관내, 생체내 또는 생체외 적용을 위한 원핵 세포 또는 진핵 세포에서 기능적이다. 본 발명의 일 양태는 새로운 클래스 2 CRISPR-Cas 시스템을 예측하고 그 안에 있는 성분을 동정하기 위한 컴퓨터 방법 및 알고리즘을 포함한다.
일 양태에서, 신규한 클래스 2 CRISPR-Cas 유전자좌를 동정하는 컴퓨터 방법은 다음 단계를 포함한다: Cas1 단백질을 인코딩하는 모든 콘티그(contig)를 검출하는 단계; cas1 유전자의 20 kB 내, 더욱 구체적으로 cas1 유전자의 시작으로부터 20 kb 및 cas1 유전자의 말단으로부터 20 kb 영역 내의 모든 예측된 단백질 코딩 유전자를 동정하는 단계; 동정된 유전자를 Cas 단백질-특이적 프로파일과 비교하고 CRISPR 어레이를 예측하는 단계; 500 아미노산(>500 aa)보다 큰 단백질을 함유하는 부분적 및/또는 분류되지 않은 후보 CRISPR-Cas 유전자좌를 선택하는 단계; PSI-BLAST 및 HHPred를 사용하여 선택된 후보를 분석함으로써 신규한 클래스 2 CRISPR-Cas 유전자좌를 단리하고 동정하는 단계. 상기 언급된 단계에 추가적으로, 추가적인 상동체에 대한 메타게노믹스(metagenomics) 데이터베이스를 검색함으로써 후보의 추가적인 분석을 수행할 수 있다.
일 양태에서, Cas1 단백질을 인코딩하는 모든 콘티그를 검출하는 것은 본 명세서에 참조로서 포함되어 있는 문헌["GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions". John Besemer, Alexandre Lomsadze and Mark Borodovsky, 핵산s Research (2001) 29, pp 2607-2618]에 추가로 기재된 바와 같은 유전자 예측 프로그램인 GenemarkS에 의해 실행된다.
일 양태에서 모든 예측된 단백질 코딩 유전자를 동정하는 것은 동정된 유전자를 Cas 단백질-특이적 프로파일과 비교하고, 오래된 도메인 및 전장 단백질에 대한 주석이 잘 달린 다중 서열 정렬 모델의 집합으로 이루어진 단백질 주석 자료인 NCBI 보존된 도메인 데이터베이스(Conserved Domain Database; CDD)에 따라서 이들에 주석을 붙임으로써 수행된다. 이들은 RPS-BLAST를 통해 단백질 서열 중 보존된 도메인의 빠른 동정을 위한 위치-특이적 스코어 매트릭스(position-specific score matrix; PSSM)로서 이용 가능하다. CDD 내용은 NCBI-큐레이팅된 도메인을 포함하며, 이는 3D-구조 정보를 사용하여 도메인 경계를 한정하고 서열/구조/기능 관계뿐만 아니라 다수의 외부 공급원 데이터베이스(Pfam, SMART, COG, PRK, TIGRFAM)로부터 가져온 도메인 모델에 대한 이해를 제공한다. 추가의 양태에서, 문헌["PILER-CR: fast and accurate identification of CRISPR repeats", Edgar, R.C., BMC Bioinformatics, Jan 20;8:18(2007)](본 명세서에 참조로서 포함되어 있음)에 기재된 바와 같은 CRISPR 반복부를 발견하기 위한 공개 도메인 소프트웨어인 PILER-CR 프로그램을 사용하여 CRISPR 어레이를 예측하였다.
추가의 양태에서, 사례별 분석은 PSI-BLAST(Position-Specific Iterative Basic Local Alignment Search Tool; 위치-특이적 반복 기본 국소 정렬 검색 도구)를 사용하여 실행한다. PSI-BLAST는 단백질-단백질 BLAST를 사용하여 주어진 스코어 임계값 초과로 검출된 서열의 다중 서열 정렬로부터 위치-특이적 스코어 매트릭스(position-specific scoring matrix; PSSM) 또는 프로파일을 유도한다. PSSM은 새로운 매치에 대한 데이터베이스를 추가로 검색하는 데 사용되며, 이들 새로 검출된 서열을 이용하여 후속 반복을 위해 업데이트된다. 따라서, PSI-BLAST는 단백질 간 거리가 있는 관계를 검출하는 수단을 제공한다.
또 다른 양태에서, 사례별 분석은 BLAST 또는 PSI-BLAST와 같이 사용하기 쉽고 동시에 원격 상동체를 찾는 데 훨씬 더 민감한 서열 데이터베이스 검색 및 구조 예측을 위한 방법인 HHpred를 사용하여 실행된다. 사실, HHpred의 민감도는 현재 이용 가능한 구조 예측을 위한 가장 강력한 서버와 경쟁적이다. HHpred는 프로파일 은닉 마르코프 모델(hidden Markov model; HMM)의 쌍별 비교를 기반으로 하는 첫 번째 서버이다. 대부분의 종래 서열 검색 방법이 UniProt 또는 NR과 같은 서열 데이터베이스, HHpred 검색 정렬 데이터베이스, 예를 들어 Pfam 또는 SMART를 검색한다. 이는 단일 서열의 클러터(clutter) 대신에 다수의 서열 패밀리에 대한 히트 목록이 크게 단순화된다. 모든 공개적으로 이용 가능한 주요 프로파일 및 정렬 데이터베이스는 HHpred를 통해 이용 가능하다. HHpred는 입력값으로서 단일 질의 서열 또는 다중 정렬을 허용한다. 단지 몇 분 이내에, PSI-BLAST와 유사한 읽기 쉬운 포맷으로 검색 결과를 가져온다. 검색 옵션은 국소 또는 전체 정렬 및 2차 구조 유사성의 스코어를 포함한다. HHpred는 쌍별 질의-주형 서열 정렬, 병합된 질의-주형 다중 정렬(예를 들어, 이행성 검색을 위함)뿐만 아니라, HHpred 정렬로부터 MODELLER 소프트웨어에 의해 계산된 3D 구조 모델을 생성할 수 있다.
용어 "핵산-표적화 시스템", 여기서, 핵산은 DNA 또는 RNA이고, 일부 양태에서는 또한 DNA-RNA 하이브리드 또는 이의 유도체를 지칭할 수 있음은 DNA 또는 RNA-표적화 CRISPR-관련된("Cas") 유전자의 발현 또는 이의 활성의 유도에 포함되는 전사물 및 다른 요소를 집합적으로 지칭하며, 이는 DNA 또는 RNA-표적화 Cas 단백질을 인코딩하는 서열 및 CRISPR RNA(crRNA) 서열을 포함하는 DNA 또는 RNA-표적화 가이드 RNA 및 (모든 시스템 아닌 일부 시스템에서) 트랜스-활성화 CRISPR/Cas 시스템 RNA(tracrRNA) 서열, 또는 DNA 또는 RNA-표적화 CRISPR 유전자좌로부터의 다른 서열 및 전사물을 포함할 수 있다. 일반적으로, RNA-표적화 시스템은 표적 DNA 또는 RNA 서열의 부위에서 DNA 또는 RNA-표적화 복합체의 형성을 촉진하는 요소들에 의해 특징지어진다. DNA 또는 RNA-표적화 복합체의 형성의 맥락에서, "표적 서열"은 DNA 또는 RNA-표적화 가이드 RNA가 그에 대한 상보성을 갖도록 설계된 DNA 또는 RNA 서열을 지칭하며, 여기서 표적 서열과 RNA-표적화 가이드 RNA 사이에서의 혼성화는 RNA-표적화 복합체의 형성을 촉진한다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다.
본 발명의 일 양태에서, 본 출원의 RNA- 또는 RNA-표적화 CRISPR/Cas 또는 CRISPR-Cas 시스템 RNA-표적화 시스템으로도 지칭되는 신규한 RNA 표적화 시스템은 동정된 제VI형 Cas 단백질에 기반하며, 이는 특정 RNA 서열을 표적화하기 위해 맞춤화된 단백질을 생성할 필요가 없고 오히려 단일 효소는 특정 RNA 표적을 인식하기 위해 RNA 분자에 의해 프로그래밍될 수 있고, 즉, 효소가 상기 RNA 분자를 사용하여 특정 RNA 표적에 모집될 수 있다.
본 발명의 일 양태에서, 본 출원의 DNA- 또는 DNA-표적화 CRISPR/Cas 또는 CRISPR-Cas 시스템 RNA-표적화 시스템으로도 지칭되는 신규한 DNA 표적화 시스템은 동정된 제VI형 Cas 단백질에 기반하며, 이는 특정 RNA 서열을 표적화하기 위해 맞춤화된 단백질을 생성할 필요가 없고 오히려 단일 효소는 특정 DNA 표적을 인식하기 위해 RNA 분자에 의해 프로그래밍될 수 있고, 즉, 효소가 상기 RNA 분자를 사용하여 특정 DNA 표적에 모집될 수 있다.
본 명세서에 기재된 핵산-표적화 시스템, 벡터 시스템, 벡터 및 조성물은 다양한 핵산-표적화 응용, 유전자 생성물, 예를 들어 단백질의 합성 변경 또는 변형, 핵산 절단, 핵산 편집, 핵산 스플라이싱; 표적 핵산의 수송, 표적 핵산의 추적, 표적 핵산의 단리, 표적 핵산의 시각화 등에 사용될 수 있다.
본 명세서에서 사용된 Cas 단백질 또는 CRISPR 효소는 CRISPR-Cas 시스템의 새로운 분류에 제시되는 단백질 중 임의의 것을 지칭한다.
C2c2 뉴클레아제
클래스 2 제VI형 이펙터 단백질 C2c2는 ssRNA를 분해하도록 효율적으로 프로그래밍될 수 있는 RNA-가이드된 알엔아제이다. 본 발명의 C2c2 이펙터 단백질은 다음의 21 개 오솔로그 종을 제한 없이 포함한다(다중 CRISPR 유전자좌 포함하여: 렙토트리키아 샤히; 렙토트리키아 와데이(Lw2); 리스테리아 세엘리게리; 라크노스피라세아에 박테리움 MA2020; 라크노스피라세아에 박테리움 NK4A179; [클로스트리디움] 아미노필룸 DSM 10710; 카르노박테리움 갈리나룸 DSM 4847; 카르노박테리움 갈리나룸 DSM 4847 (제2 CRISPR 유전자좌); 팔루디박터 프로피오니시게네스 WB4; 리스테리아 웨이헨스테파넨시스 FSL R9-0317; 리스테리아세아에 박테리움 FSL M6-0635; 렙토트리키아 와데이 F0279; 로도박터 캅술라투스 SB 1003; 로도박터 캅술라투스 R121; 로도박터 캅술라투스 DE442; 렙토트리키아 부칼리스 C-1013-b; 헤르비닉스 헤미셀룰로실리티카(Herbinix hemicellulosilytica); [유박테리움] 렉탈레([Eubacterium] rectale); 유박테리아세아에 박테리움(Eubacteriaceae bacterium) CHKCI004; 블라우티아 종 마르세일레(Blautia sp. Marseille)-P2398; 및 렙토트리키아 종 오랄 분류군 879 균주 F0557. 12 개의 추가 비-제한적 예는: 라크노스피라세아에 박테리움 NK4A144; 클로로플렉서스 아그레간스(Chloroflexus aggregans); 데메퀴나 아우란티아카(Demequina aurantiaca); 탈라쏘스피라 종(Thalassospira sp.) TSL5-1; 슈도부티리비브리오 종(Pseudobutyrivibrio sp.) OR37; 부티리비브리오 종(Butyrivibrio sp.) YAB3001; 블라우티아 종 마르세일레-P2398; 렙토트리키아 종 마르세일레(Leptotrichia sp. Marseille)-P3007; 박테로이데스 이후아에(Bacteroides ihuae); 포르피로모나다세아에 박테리움(Porphyromonadaceae bacterium) KH3CP3RA; 리스테리아 리파리아(Listeria riparia); 및 인솔리티스피릴룸 페레그리눔(Insolitispirillum peregrinum)이다.
C2c2는 그의 2 개의 HEPN 도메인 내의 보존된 염기성 잔기를 통해 RNA 절단을 달성한다. 예측된 HEPN 도메인 촉매성 잔기의(예를 들어, 알라닌) 치환과 같은 HEPN 도메인의 돌연변이는 C2c2를 비활성 프로그래밍 가능한 RNA-결합 단백질(dC2c2, dCas9에 유사)로 전환시키는 데 사용될 수 있다.
본 발명에 따르면, 다수의 C2c2 오솔로그로부터 컨센서스 서열이 생성될 수 있으며, 이는 C2c2 기능을 매개하는 C2c2 오솔로그 내에 촉매성 잔기 및 HEPN 모티프를 포함하지만 이에 한정되지 않는, 보존된 아미노산 잔기 및 모티프를 위치시키는 데 도움이 될 수 있다. Geneious 정렬을 사용하여 상기 언급된 33 개의 오솔로그로부터 생성된 하나의 이러한 컨센서스 서열은: MKISKVXXXVXKKXXXGKLXKXVNERNRXAKRLSNXLBKYIXXIDKIXKKEXXKKFXAXEEITLKLNQXXXBXLXKAXXDLRKDNXYSXJKKILHNEDINXEEXELLINDXLEKLXKIESXKYSYQKXXXNYXMSVQEHSKKSIXRIXESAKRNKEALDKFLKEYAXLDPRMEXLAKLRKLLELYFYFKNDXIXXEEEXNVXXHKXLKENHPDFVEXXXNKENAELNXYAIEXKKJLKYYFPXKXAKNSNDKIFEKQELKKXWIHQJENAVERILLXXGKVXYKLQXGYLAELWKIRINEIFIKYIXVGKAVAXFALRNXXKBENDILGGKIXKKLNGITSFXYEKIKAEEILQREXAVEVAFAANXLYAXDLXXIRXSILQFFGGASNWDXFLFFHFATSXISDKKWNAELIXXKKJGLVIREKLYSNNVAMFYSKDDLEKLLNXLXXFXLRASQVPSFKKVYVRXBFPQNLLKKFNDEKDDEAYSAXYYLLKEIYYNXFLPYFSANNXFFFXVKNLVLKANKDKFXXAFXDIREMNXGSPIEYLXXTQXNXXNEGRKKEEKEXDFIKFLLQIFXKGFDDYLKNNXXFILKFIPEPTEXIEIXXELQAWYIVGKFLNARKXNLLGXFXSYLKLLDDIELRALRNENIKYQSSNXEKEVLEXCLELIGLLSLDLNDYFBDEXDFAXYJGKXLDFEKKXMKDLAELXPYDQNDGENPIVNRNIXLAKKYGTLNLLEKJXDKVSEKEIKEYYELKKEIEEYXXKGEELHEEWXQXKNRVEXRDILEYXEELXGQIINYNXLXNKVLLYFQLGLHYLLLDILGRLVGYTGIWERDAXLYQIAAMYXNGLPEYIXXKKNDKYKDGQIVGXKINXFKXDKKXLYNAGLELFENXNEHKNIXIRNYIAHFNYLSKAESSLLXYSENLRXLFSYDRKLKNAVXKSLINILLRHGMVLKFKFGTDKKSVXIRSXKKIXHLKSIAKKLYYPEVXVSKEYCKLVKXLLKYK이다.
상기 오솔로그로부터 동정된 HEPN 서열 모티프가 처음 21 개의 오솔로그 및 모든 33 개의 오솔로그 각각을 기초로 하여 도 49 및 도 50에 제공된다. 촉매적으로 데드 C2c2 돌연변이체를 생성하기 위해 돌연변이될 수 있는 아미노산 잔기의 비-제한적인 예는, 상기 컨센서스를 기반으로, HEPN1에 또는 근처에 D372, R377, Q/H382, 및 F383 또는 오솔로그의 상응하는 아미노산, 및 HEPN2에 또는 근처에 K893, N894, R898, N899, H903, F904, Y906, Y927, D928, K930, K932 또는 오솔로그의 상응하는 아미노산을 포함한다.
또 다른 비-제한적인 예에서, 컨센서스 서열의 생성 및 보존된 잔기의 확인을 돕기 위한 서열 정렬 도구는 MUSCLE 정렬 도구(www.ebi.ac.uk/Tools/msa/muscle/)이다. 예를 들어, MUSCLE을 사용하여, C2c2 오솔로그들 사이에서 보존된 다음의 아미노산 위치를 렙토트리키아 와데이 C2c2에서 확인할 수 있다: K2; K5; V6; E301; L331; I335; N341; G351; K352; E375; L392; L396; D403; F446; I466; I470; R474 (HEPN); H475; H479 (HEPN), E508; P556; L561; I595; Y596; F600; Y669; I673; F681; L685; Y761; L676; L779; Y782; L836; D847; Y863; L869; I872; K879; I933; L954; I958; R961; Y965; E970; R971; D972; R1046 (HEPN), H1051 (HEPN), Y1075; D1076; K1078; K1080; I1083; I1090.
도 52a 내지 52k는 C2c2 오솔로그의 정렬을 나타낸다. 도 52l은 HEPN 도메인의 예시적인 서열 정렬 및 고도로 보존된 잔기를 나타낸다.
C2c2 HEPN은 또한 DNA, 또는 잠재적으로 DNA 및/또는 RNA를 표적화할 수 있다. C2c2의 HEPN 도메인이 적어도 결합할 수 있고 야생형 형태에서 RNA를 절단할 수 있다는 점을 근거로 하여, C2c2 이펙터 단백질은 알엔아제 기능을 갖는 것이 선호된다. 또한, 또는 대안적으로, 디엔아제 기능을 가질 수 있다.
따라서, 일부 구현예에서, 이펙터 단백질은 예를 들어 전사 활성화제 또는 억제제 도메인, NLS 또는 기타 기능성 도메인으로 본 명세서에 기재된 바와 같이 선택적으로 기능화될 수 있는, 데드-Cas 타입 이펙터 단백질과 같은 RNA-결합 단백질일 수 있다. 일부 구현예에서, 이펙터 단백질은 RNA의 단일 가닥을 절단하는 RNA-결합 단백질일 수 있다. 결합된 RNA가 ssRNA인 경우, ssRNA는 완전히 절단된다. 일부 구현예에서, 이펙터 단백질은, 예를 들어 2 개의 알엔아제 도메인을 포함하는 경우, RNA의 이중 가닥을 절단하는 RNA-결합 단백질일 수 있다. 결합된 RNA가 dsRNA인 경우, dsRNA는 완전히 절단된다.
CRISPR 시스템에서의 알엔아제 기능은 알려져 있으며, 예를 들어 mRNA 표적화는 특정 제III형 CRISPR-Cas 시스템(문헌[Hale et al., 2014, Genes Dev, vol. 28, 2432-2443; Hale et al., 2009, Cell, vol. 139, 945-956; Peng et al., 2015, Nucleic acids research, vol. 43, 406-417])에 대하여 보고되었고 상당한 이점을 제공한다. 스태필로코커스 에피더미스(Staphylococcus epidermis) 제III-A형 시스템에서, 표적에 걸친 전사는 Cas10-Csm 리보핵산단백질 이펙터 복합체 내의 독립적인 활성 부위에 의해 매개되는, 표적 DNA 및 그 전사물의 절단을 초래한다(Samai et al., 2015, Cell, vol. 151, 1164-1174 참고). 따라서, 본 이펙터 단백질을 통해 RNA를 표적화하는 CRISPR-Cas 시스템, 조성물 또는 방법이 제공된다.
표적 RNA, 즉 관심 RNA는 표적 RNA상의 관심 표적 부위로의 모집, 및 이펙터 단백질의 결합을 유도하는, 본 발명에 의해 표적화될 RNA이다. 표적 RNA는 임의의 적합한 형태의 RNA 일 수 있다. 이는 일부 구현예에서 mRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 tRNA 또는 rRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 miRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 siRNA를 포함할 수 있다.
간섭 RNA(RNAi) 및 마이크로RNA(miRNA)
다른 구현예에서, 표적 RNA는 간섭 RNA, 즉 진핵 생물 및 원핵 생물 모두에서 shRNA, siRNA 등과 같은 RNA 간섭 경로에 관여하는 RNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 마이크로RNA(miRNA)를 포함할 수 있다. 간섭 RNA 또는 miRNA에 대한 제어는 생체내 또는 시험관내에서 간섭 RNA 또는 miRNA의 수명을 감소시킴으로써 그러한 접근에서 보이는 표적외 효과(OTE)를 감소시키는 데 도움이 될 수 있다.
특정 구현예에서, 표적은 miRNA 자체가 아니고 miRNA 표적의 miRNA 결합 부위이다.
특정 구현예에서, miRNA는 (예를 들어, 세포 내 재위치되는 것을 포함하여) 격리될 수 있다. 특정 구현예에서, 예를 들어 제한 없이, 헤어핀에서 miRNA는 절단될 수 있다.
특정 구현예에서, miRNA 가공(예를 들어 턴오버 포함)은 증가되거나 감소된다.
이펙터 단백질 및 적합한 가이드가 선택적으로(예를 들어, 적합한 프로모터, 예를 들어 조직- 또는 세포주기-특이적 프로모터 및/또는 인핸서의 제어 하에 공간적으로 또는 시간적으로) 발현되는 경우, 이것은 그들 세포에서 RNAi로부터 (생체내 또는 시험관내) 세포 또는 시스템을 '보호'하는 데 사용될 수 있다. 이것은 RNAi가 필요하지 않은 이웃 조직 또는 세포에서 또는 이펙터 단백질 및 적합한 가이드가 발현되고 발현되지 않는(즉, 각각 RNAi가 제어되지 않는 곳 및 제어되는 곳) 세포 또는 조직의 비교 목적으로 유용할 수 있다. 이펙터 단백질은 리보자임, 리보솜 또는 리보스위치와 같은 RNA를 포함하거나 이로 구성된 분자를 제어하거나 분자에 결합하는 데 사용될 수 있다. 본 발명의 일 구현예에서, RNA 가이드는 이펙터 단백질을 이들 분자에 모집하여 이펙터 단백질이 그들에 결합할 수 있도록 할 수 있다.
본 출원은 정보가 제공된 시스템의 설계 제작을 위한 기초를 제공하므로, 본 발명의 단백질 시스템은, 본 개시 내용으로부터, 과도한 실험없이 치료, 분석 및 다른 응용을 포함하는 RNAi 기술 분야에 적용될 수 있다(예를 들어, 문헌[Guidi et al., PLoS Negl Trop Dis 9(5): e0003801. doi:10.1371/journal.pntd; Crotty et al., In vivo RNAi screens: concepts and applications. Shane Crotty ... 2015 Elsevier Ltd. Published by Elsevier Inc., Pesticide Biochemistry and Physiology (Impact Factor: 2.01). 01/2015; 120. DOI: 10.1016/j.pestbp.2015.01.002] 및 문헌[Makkonen et al., Viruses 2015, 7(4), 2099-2125; doi:10.3390/v7042099] 참고).
리보솜 RNA(rRNA)
예를 들어, 아지트로마이신과 같은 아잘리드 항생제가 잘 알려져 있다. 그들은 50S 리보솜 서브유닛을 표적화하고 파괴한다. 본 이펙터 단백질은 50S 리보솜 서브유닛을 표적화하는 적합한 가이드 RNA와 함께, 일부 구현예에서, 50S 리보솜 서브유닛에 모집 및 결합될 수 있다. 따라서, 리보솜(특히 50s 리보솜 서브유닛) 표적을 향하는 적합한 가이드와 함께 본 이펙터 단백질이 제공된다. 리보솜(특히 50s 리보솜 서브유닛) 표적을 향하는 적합한 가이드와 함께 이 사용 이펙터 단백질의 용도는 항생제 용도를 포함할 수 있다. 구체적으로, 항생제 용도는 아지트로마이신과 같은 아잘리드 항생제의 작용과 유사하다. 일부 구현예에서, 원핵 생물에서의 70S 서브유닛, 상기 언급된 50S 서브유닛, 30S 서브유닛뿐만 아니라 16S 및 5S 서브유닛과 같은 원핵 리보솜 서브유닛이 표적화될 수 있다. 다른 구현예에서, 진핵 세포에서의 80S 서브유닛, 60S 서브유닛, 40S 서브유닛뿐만 아니라 28S, 18S. 5.8S 및 5S서브유닛과 같은 진핵 리보솜 서브유닛이 표적화될 수 있다.
일부 구현예에서, 이펙터 단백질은 본 명세서에 기재된 바와 같이 선택적으로 기능화된, RNA-결합 단백질일 수 있다. 일부 구현예에서, 이펙터 단백질은 RNA의 단일 가닥을 절단하는 RNA-결합 단백질일 수 있다. 두 경우 모두, 구체적으로 RNA-결합 단백질이 RNA의 단일 가닥을 절단하는 경우, 리보솜 기능이 조절되고, 구체적으로 감소되거나 파괴될 수 있다. 이것은 임의의 리보솜 RNA 및 임의의 리보솜 서브유닛에 적용될 수 있으며, rRNA의 서열은 잘 알려져 있다.
따라서, 리보솜 활성의 제어가 리보솜 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 예상된다. 이것은 리보솜의 절단 또는 리보솜에의 결합을 통한 것일 수 있다. 구체적으로, 리보솜 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보솜 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보솜 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다. 또한, 생체내 또는 시험관내 시스템에서의 단백질 합성의 제어(즉, 감소)가 예상되며, 이러한 제어는 항생제 및 연구 및 진단 용도를 포함한다.
리보스위치
리보스위치(압토자임으로도 알려져 있음)는 소분자를 결합하는 메신저 RNA 분자의 조절 부분이다. 이것은 전형적으로 mRNA에 의해 인코딩된 단백질의 생산을 변화시킨다. 따라서, 리보스위치 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 리보스위치 활성의 제어가 예상된다. 이것은 리보스위치의 절단 또는 리보스위치에의 결합을 통한 것일 수 있다. 구체적으로, 리보스위치 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보스위치 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보스위치 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다. 또한, 생체내 또는 시험관내 시스템에서의 단백질 합성의 제어(즉, 감소)가 예상된다. 이 제어는, rRNA에서와 같이, 항생제 및 연구 및 진단 용도를 포함할 수 있다.
리보자임
리보자임은 효소(물론 단백질임)와 유사한 촉매 특성을 갖는 RNA 분자이다. 리보자임은, 천연적으로 발생한 것 및 설계 제작된 것 모두, RNA를 포함하거나 RNA로 구성되기 때문에, 본 RNA-결합 이펙터 단백질에 의해 또한 표적화될 수 있다. 일부 구현예에서, 이펙터 단백질은 리보자임을 절단함으로써 이를 불능으로 만드는 RNA-결합 단백질일 수 있다. 따라서, 리보자임 표적에 대한 적합한 가이드와 함께 본 이펙터 단백질의 사용을 통해 리보자임 활성의 제어가 예상된다. 이것은 리보자임의 절단 또는 리보자임에의 결합을 통한 것일 수 있다. 구체적으로, 리보자임 활성의 감소가 예상된다. 이것은 생체내 또는 시험관내에서 리보자임 기능을 분석하는 데 유용할 수 있고, 생체내 또는 시험관내에서 리보자임 활성에 기반한 치료법을 제어하는 수단으로서 또한 유용할 수 있다.
RNA 가공을 포함하는, 유전자 발현
이펙터 단백질은 RNA 가공의 제어를 통하는 것을 포함하여, 적합한 가이드와 함께, 유전자 발현을 표적화하는 데 또한 사용될 수 있다. RNA 가공의 제어는 RNApol; 식물에서의 바이로이드를 포함하는 (구체적으로, 위성 바이러스, 박테리오파지 및 레트로바이러스, 예를 들어, HBV, HBC 및 HIV 및 본 명세서에 나열된 다른 것들의) 바이러스 복제; 및 tRNA 생합성의 표적화를 통해, 대안적 스플라이싱을 포함하는 RNA 스플라이싱과 같은 RNA 가공 반응을 포함할 수 있다. 이펙터 단백질 및 적합한 가이드는 또한 RNA 활성화(RNAa)를 제어하는 데 사용될 수 있다. RNAa는 유전자 발현을 촉진하므로 RNAa의 파괴 또는 감소 그에 따른 유전자 발현의 더 적은 촉진을 통해 그와 같이 유전자 발현의 제어가 달성될 수 있다. 이것은 아래에서 상세히 더 논의된다.
RNAi 스크린
녹다운이 표현형 변화와 관련되는 유전자 산물을 동정하여, RNAi 스크린을 통해 생물학적 경로를 조사하고, 구성 부분을 동정할 수 있다. 스크린에서 RNAi의 활성을 제거 또는 감소시키고 그에 따라 (간섭/억제를 제거 또는 감소시킴으로써) 유전자 산물의 (이전에 간섭된) 활성을 회복시키기 위해 이펙터 단백질 및 적합한 가이드를 사용함으로써 이들 스크린을 통해 또는 그 동안 제어가 또한 작용할 수 있다.
위성 RNA(satRNA) 및 위성 바이러스가 또한 처리될 수 있다.
알엔아제 활성과 관련하여 본 명세서에서의 제어는 일반적으로 감소, 음성적 방해 또는 녹-다운 또는 녹-아웃을 의미한다.
생체내 RNA 응용
유전자 발현의 저해
본 명세서에서 제공된 표적-특이적 알엔아제는 표적 RNA의 매우 특이적인 절단을 가능하게 한다. RNA 수준에서의 간섭은 게놈이 변형되지 않으므로 공간적 및 시간적 둘 모두에서 비-침습적 방식으로 조절을 가능하게 한다.
다수의 질병이 mRNA 표적화에 의해 치료 가능한 것으로 입증되었다. 이들 연구의 대부분은 siRNA의 투여에 관한 것이지만, 본 명세서에서 제공되는 RNA 표적화 이펙터 단백질이 유사한 방식으로 적용될 수 있음은 분명하다.
mRNA 표적(및 상응하는 질병 치료)의 예는 VEGF, VEGF-R1 및 RTP801(AMD 및/또는 DME 치료에서), 카스파제 2(Naion 치료에서) ADRB2(안내압 치료에서), TRPVI(건성 안구 증후군 치료에서, Syk 키나제(천식 치료에서), Apo B(고콜레스테롤혈증 또는 저베타지질단백혈증 치료에서), PLK1, KSP 및 VEGF(고형 종양 치료에서), Ber-Abl(CML 치료에서)(문헌[Burnett and Rossi Chem Biol. 2012, 19(1): 60-71)])이다. 유사하게, RNA 표적화는 HIV(HIV Tet 및 Rev의 표적화), RSV(RSV 뉴클레오캡시드의 표적화) 및 HCV(miR-122의 표적화)와 같은 RNA-바이러스 매개 질병의 치료에 효과적임이 입증되었다(문헌[Burnett and Rossi Chem Biol. 2012, 19(1): 60-71]).
본 발명의 RNA 표적화 이펙터 단백질은 돌연변이 특이적 또는 대립유전자 특이적 녹다운에 사용될 수 있다고 추가로 예상된다. 가이드 RNA는 돌연변이 또는 대립유전자-특이적 서열을 포함하는 전사된 mRNA내의 서열을 특이적으로 표적화하도록 설계될 수 있다. 이러한 특이적인 녹다운은 돌연변이된 또는 대립유전자-특이적 유전자 산물과 관련된 장애에 관한 치료적 적용에 특히 적합하다. 예를 들어, 가족성 저베타지질단백혈증(FHBL)의 대부분 사례는 ApoB 유전자의 돌연변이에 의해 야기된다. 이 유전자는 아포지질단백질 B 단백질의 2 가지 버전인 짧은 버전(ApoB-48) 및 긴 버전(ApoB-100)을 인코딩한다. FHBL를 초래하는 몇몇 ApoB 유전자 돌연변이로 인해 ApoB의 2 가지 버전이 비정상적으로 짧아진다. 본 발명의 RNA 표적화 이펙터 단백질을 이용한 돌연변이된 ApoB mRNA 전사물의 특이적 표적화 및 녹다운은 FHBL의 치료에 유익할 수 있다. 또 다른 예로서, 헌팅턴 질병 (HD)은 헌팅틴 단백질을 코딩하는 유전자에서, 비정상적 단백질을 초래하는, CAG 3 개 반복의 확장에 의해 야기된다. 본 발명의 RNA 표적화 이펙터 단백질을 이용한 돌연변이된 또는 대립유전자-특이적인 헌팅틴 단백질 인코딩 mRNA 전사물의 특이적 표적화 및 녹다운은 HD의 치료에 유익할 수 있다.
이 맥락에서, 그리고 더욱 일반적으로는 본 명세서에 기재된 바와 같은 다양한 응용을 위해서, RNA 표적화 이펙터 단백질의 분할된 버전의 사용이 예상될 수 있음이 언급된다. 실제로, 이것은 특이성을 증가시킬뿐만 아니라 전달에 유리할 수도 있다. C2c2는 C2c2 효소의 두 부분이 기능하는 C2c2를 실질적으로 포함한다는 의미에서 분할된다. 이상적으로, 분할은 항상 촉매성 도메인(들)이 영향을 받지 않도록 되어야 한다. 그 C2c2는 뉴클레아제로서 기능할 수 있거나, 촉매성 도메인에서의 전형적인 돌연변이로 인해 촉매 활성이 거의 없거나 전혀 없는 본질적으로 RNA-결합 단백질인 데드-C2c2일 수 있다.
분할된 C2c2의 각각의 절반은 이량체화 파트너에 융합될 수 있다. 제한없이, 예로서, 라파마이신 민감성 이량체화 도메인을 사용함으로써 C2c2 활성의 시간적 제어를 위한 화학적으로 유도성인 분할된 C2c2 생성이 가능하다. 따라서 C2c2는 2 개의 단편으로 분할됨으로써 화학적으로 유도성이 될 수 있고 그 라파마이신-민감성 이량체화 도메인은 C2c2의 제어된 재조립에 사용될 수 있다. 분할된 C2c2의 두 부분은 분할된 C2c2의 N' 말단 부분 및 C' 말단 부분으로 생각될 수 있다. 융합은 전형적으로 C2c2의 분할 지점에서 있다. 다시 말해서, 분할된 C2c2의 N' 말단 부분의 C' 말단은 이량체 절반 중 하나에 융합되는 반면, C' 말단 부분의 N' 말단은 다른 이량체 절반에 융합된다.
손상이 새롭게 생성된다는 의미에서 C2c2가 분할될 필요는 없다. 분할 지점은 전형적으로 인실리코로 설계되고 작제물로 클로닝된다. 함께, 분할된 C2c2의 두 부분, N' 말단 및 C' 말단 부분은 바람직하게는 야생형 아미노산(또는 이들을 인코딩하는 뉴클레오티드)의 적어도 70% 이상, 바람직하게는 적어도 80% 이상, 바람직하게는 적어도 90% 이상, 바람직하게는 적어도 95% 이상, 및 가장 바람직하게는 적어도 99% 이상의 야생형 아미노산(또는 이들을 인코딩하는 뉴클레오티드)을 포함하는 완전한 C2c2를 형성한다. 일부 트리밍이 가능할 수 있고, 돌연변이체가 예상된다. 비-기능성 도메인은 완전하게 제거될 수 있다. 중요한 것은 두 부분이 병합되어 원하는 C2c2 기능이 회복되거나 재구성될 수 있다는 것이다. 이량체는 동종이량체 또는 이종이량체일 수 있다.
특정 구현예에서, 본 명세서에 기재된 C2c2 이펙터는, 돌연변이-특이적, 또는 대립유전자-특이적 녹다운과 같은, 돌연변이-특이적, 또는 대립유전자-특이적 표적화를 위해 사용될 수 있다.
RNA 표적화 이펙터 단백질은 또한 알엔아제 활성을 증가시키거나 또는 메시지의 추가 분해를 보장하기 위해 상승 작용하는, 비-특이적 알엔아제 또는 아르고노트(Argonaute) 2와 같은 또 다른 기능성 알엔아제 도메인에 융합될 수 있다.
RNA 기능의 조절을 통한 유전자 발현의 조절
mRNA의 절단을 통한 유전자 발현에의 직접적인 영향 외에도, RNA 표적화는 또한 세포 내의 RNA 가공의 특정 측면에 영향을 미치기 위해 사용될 수 있으며, 이는 유전자 발현의 더욱 미세한 조절을 가능하게 할 수 있다. 일반적으로, 조절은 예를 들어 단백질의 결합을 차단하거나 RNA 결합 단백질을 모집하는 것과 같이, RNA에 대한 단백질의 결합을 간섭함으로써 예를 들어 매개될 수 있다. 실제로, mRNA의 스플라이싱, 수송, 국소화, 번역 및 턴오버와 같은 상이한 수준에서 조절이 보장될 수 있다. 유사하게, 치료의 맥락에서, RNA-특이적 표적화 분자를 사용함으로써 이들 각각의 수준에서 기능 부전(병원성)을 처리하는 것이 예상될 수 있다. 이들 구현예에서, RNA 표적화 단백질은, 본 명세서 기재된 c2c2의 돌연변이 형태와 같이, RNA 표적을 절단하는 능력을 잃었지만, 그것에 결합하는 능력을 유지하는 "데드" C2c2 인 것이 많은 사례에서 바람직하다.
A) 대안적인 스플라이싱
다수의 인간 유전자는 대안적인 스플라이싱의 결과로서 다수의 mRNA를 발현한다. 상이한 질병이, 발현된 유전자의 기능 상실 또는 기능 획득을 초래하는 비정상적 스플라이싱에 연결된 것으로 나타났다. 이들 질병 중 일부는 스플라이싱 결함을 야기하는 돌연변이에 의해 유발되지만, 이들 중 다수는 그렇지 않다. 하나의 치료 선택지는 스플라이싱 메커니즘을 직접 표적화하는 것이다. 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 예를 들어 슬라이싱을 차단 또는 촉진하고, 엑손을 포함 또는 제외하고, 특정 이소형의 발현에 영향을 미치고/미치거나 대안적 단백질 생산물의 발현을 자극하는 데 사용될 수 있다. 이러한 적용은 아래에서 상세히 더 기재된다.
표적 RNA에 결합하는 RNA 표적화 이펙터 단백질은 스플라이싱 인자의 RNA 서열에 대한 접근을 입체적으로 차단할 수 있다. 스플라이스 부위로 표적화되는 RNA 표적화 이펙터 단백질은, 선택적으로 인접한 부위로 스플라이싱 방향을 바꾸며, 부위에서의 스플라이싱을 차단할 수 있다. 예를 들어, 5' 스플라이스 부위 결합에 결합하는 RNA 표적화 이펙터 단백질은 스플라이소솜의 U1 성분의 모집을 차단하여, 그 엑손을 건너뛰도록 촉진할 수 있다. 대안적으로, 스플라이싱 인핸서 또는 사일렌서로 표적화되는 RNA 표적화 이펙터 단백질은 표적 부위에서의 트랜스작용 조절 스플라이싱 인자의 결합을 방지하고 스플라이싱을 효과적으로 차단 또는 촉진시킬 수 있다. 엑손 제외는 본 명세서에 기재된 RNA 표적화 이펙터 단백질에 의해 엑손 근처에서 전구체 mRNA로 ILF2/3 모집함으로써 추가로 달성될 수 있다. 또 다른 예로서, 글리신이 풍부한 도메인이 hnRNP A1의 모집 및 엑손 제외를 위해 부착될 수 있다(Del Gatto-Konczak et al. Mol Cell Biol. 1999 Jan;19(1):251-60).
특정 구현예에서, gRNA의 적절한 선택을 통해 다른 스플라이스 변이체는 표적화되지 않으면서, 특정 스플라이스 변이체가 표적화될 수 있다.
일부 경우, RNA 표적화 이펙터 단백질은(예를 들어, 스플라이싱이 결함있는 경우) 슬라이싱을 촉진시키는 데 사용될 수 있다. 예를 들어, RNA 표적화 이펙터 단백질은 추가의 스플라이싱을 위해 스플라이싱 조절 스템-루프를 안정화시킬 수 있는 이펙터와 관련될 수 있다. RNA 표적화 이펙터 단백질은 표적 DNA로 단백질을 모집하기 위해 특정 스플라이싱 인자에 대한 컨센서스 결합 부위 서열에 연결될 수 있다.
비정상적 스플라이싱과 관련된 질병의 예로는, 시냅스에서 기능하는 단백질의 스플라이싱을 조절하는 Nova 단백질의 손실로부터 유래된 부종양성 안진전 간대성근경련 실조(Paraneoplastic Opsoclonus Myoclonus Ataxia, 또는 POMA), 및 낭성 섬유증 막 전도도 조절제의 스플라이싱 결함에 의해 유발되어 비기능성 염화물 채널 생산이 초래되는 낭성 섬유증이 포함된다. 다른 질병에서 비정상적인 RNA 스플라이싱은 기능-획득을 초래한다. 예를 들어, 스플라이싱 결함을 일으키는, mRNA의 3'UTR에서의 CUG 3 개-반복 확장(50 내지 1500 초과 반복)으로 인해 유발되는 근긴장성이영양증에서 그러하다.
RNA 표적화 이펙터 단백질은 원하는 엑손 주위의 인트론 절제를 촉진하기 위해 5' 스플라이싱 부위에 스플라이싱 인자(예를 들어, U1)를 모집함으로써 엑손을 포함시키는 데 사용될 수 있다. 이러한 모집은 스플라이싱 활성화제로서 기능하는 아르기닌/세린 풍부 도메인과의 융합을 통해 매개될 수 있다(문헌[Gravely BR and Maniatis T, Mol Cell. 1998 (5):765-71]).
RNA 표적화 이펙터 단백질이 원하는 유전자좌에서 스플라이싱 시스템을 차단하여 엑손 인식 및 상이한 단백질 산물의 발현 방지를 초래하는 데 사용될 수 있다고 예상된다. 치료될 수 있는 장애의 예는 디스트로핀 단백질을 인코딩하는 유전자의 돌연변이에 의해 유발되는 듀시엔형 근이영양증(Duchenne muscular dystrophy, DMD)이다. 거의 모든 DMD 돌연변이는 프레임쉬프트를 일으켜 디스트로핀 번역의 손상을 초래한다. RNA 표적화 이펙터 단백질은 스플라이스 연결점 또는 엑손 스플라이싱 인핸서(ESE)와 쌍을 이룰 수 있으며, 이로써 엑손 인식을 방지하고 부분적으로 기능하는 단백질의 번역을 초래한다. 이것은 치명적인 듀시엔 표현형을 덜 심한 베커(Becker) 표현형으로 변환시킨다.
B)
RNA 변형
RNA 편집은 주어진 서열의 유전자 산물의 다양성이 RNA에서의 사소한 변형에 의해 증가되는 자연적인 과정이다. 전형적으로, 변형은 아데노신(A)의 이노신(I)으로의 변환을 포함하여, 게놈에 의해 인코딩된 것과 상이한 RNA 서열을 초래한다. RNA 변형은 일반적으로 ADAR 효소에 의해 보장되며, 이로써 pre-RNA 표적은 편집될 아데노신을 함유하는 엑손 및 인트론 비-코딩 요소 사이의 염기쌍에 의해 불완전한 듀플렉스 RNA를 형성한다. A-I 편집의 대표적 예는 글루타메이트 수용체 GluR-B mRNA이고, 이로써 변화는 채널의 변형된 전도도 특성을 초래한다(문헌[Higuchi M, et al. Cell. 1993;75:1361-70]).
본 발명에 따르면, 주어진 전사물의 RNA 염기에서 전이(transition)(A<->G 또는 C<-> 변화) 또는 전환(transversion)(임의의 퓨링에서 임의의 피리미딘으로, 역도 또한 같음)를 유도하기 위해 효소적 접근이 사용된다. 전이는 A를 I로 또는 C를 U로 각각 전환시키는 아데닝(ADAR1/2), APOBEC) 또는 시토신 디아미나제(AID)를 이용함으로써 직접적으로 유도될 수 있다. 전환은 관심있는 염기에 반응성 산소 종 손상을 국소화시켜, 구아닌의 옥소-구아닌으로의 전환과 같이, 영향을 받는 염기에 화학적 변형이 부가되도록 함으로써 간접적으로 유도될 수 있다. 옥소-구아닌은 T로 인식되므로 아데닌과 염기쌍을 형성하여 번역이 영향받도록 한다. ROS-매개된 염기 손상에 대해 모집될 수 있는 단백질은 APEX 및 mini-SOG를 포함한다. 두 접근 모두의 경우 이들 이펙터는 촉매적으로 비활성인 C2c2에 융합되어 이들 돌연변이 유형이 필요한 전사물 상의 부위에 모집될 수 있다.
인간에서, ADAR1 유전자의 이형접합의 기능-삭제 돌연변이는 피부 질병, 인간 색소성 유전피부병(문헌[Miyamura Y, et al. Am J Hum Genet. 2003;73:693-9])을 유도한다. 본 발명의 RNA 표적화 이펙터 단백질은 기능 부전의 RNA 변형을 교정하는 데 사용될 수 있다고 예상된다.
RNA 아데노신 메틸라제(N(6)-메틸아데노신)는 본 발명의 RNA 표적화 이펙터 단백질에 융합되고 관심 전사물로 표적화될 수 있다고 예상된다. 이 메틸라제는 가역적인 메틸화를 야기하고 조절 역할을 하며 다수 RNA-관련 세포 경로를 조절함으로써 유전자 발현 및 세포 운명 결정에 영향을 줄 수 있다(문헌[Fu et al Nat Rev Genet. 2014;15(5):293-306]).
C) 폴리아데닐화
mRNA의 폴리아데닐화는 핵 수송, 번역 효율 및 mRNA의 안정성에 중요하며, 이들 모두뿐만 아니라 폴리아데닐화의 과정은 특정 RBP에 의존한다. 대부분의 진핵 mRNA는 전사 후 약 200 개 뉴클레오티드의 3' 폴리(A) 꼬리를 받는다. 폴리아데닐화는 폴리(A)폴리머라제의 활성을 자극하는 상이한 RNA-결합 단백질 복합체를 포함한다(문헌[Minvielle-Sebastia L et al. Curr Opin Cell Biol. 1999;11:352-7]). 본 명세서에서 제공된 RNA-표적화 이펙터 단백질은 RNA-결합 단백질과 RNA 사이의 상호 작용을 간섭하거나 촉진시키는 데 사용될 수 있다고 예상된다.
폴리아데닐화에 관여되는 결함 단백질과 연관된 질병의 예는 안구인두 근이영양증(OPMD)이다(문헌[Brais B, et al. Nat Genet. 1998;18:164-7]).
D) RNA 방출
pre-mRNA 가공 후, mRNA는 핵으로부터 세포질로 방출된다. 이것은 캐리어 복합체의 생성을 포함하는 세포 메카니즘에 의해 보장되며, 그 후 핵 공극을 통해 전위되어 mRNA를 세포질에 방출하고 이어서 캐리어를 재순환시킨다.
RNA의 방출에 역할을 하는 단백질(예를 들어, TAP)의 과도 발현은 그렇지 않으면 Xenopus에서 비효율적으로 방출되는 전사물의 방출을 증가시키는 것으로 밝혀졌다(문헌[Katahira J, et al. EMBO J. 1999;18:2593-609]).
E) mRNA 국소화
mRNA 국소화는 공간적으로 조절된 단백질 생산을 보장한다. 세포의 특정 영역으로의 전사물의 국소화는 국소화 요소에 의해 보장될 수 있다. 구체적인 구현예에서, 본 명세서에 기재된 이펙터 단백질은 관심 있는 RNA로 국소화 요소를 표적화하는 데 사용될 수 있다고 예상된다. 이펙터 단백질은 표적 전사물을 결합하고 그들을 펩티드 신호 태그에 의해 결정된 세포 내 위치로 왕복시키도록 설계될 수 있다. 더욱 구체적으로, 예를 들어, 하나 이상의 핵 국소화 신호(NLS) 및/또는 하나 이상의 핵 방출 신호(NES)에 융합된 RNA 표적화 이펙터 단백질은 RNA 국소화를 변경시키는 데 사용될 수 있다.
국소화 신호의 추가 예로는 몇몇 비대칭 세포 유형에서 세포질로의 β-액틴의 국소화를 보장하는 우편번호 결합 단백질(ZBP1), KDEL 보유 서열(소포체로의 국소화), 핵 방출 신호(세포질로의 국소화), 미토콘드리아 표적화 신호(미토콘드리아로의 국소화), 페록시솜 표적화 신호(페록시솜으로의 국소화) 및 m6A 표지/YTHDF2(p-바디로의 국소화)가 포함된다. 예상되는 다른 접근은 RNA 표적화 이펙터 단백질을 알려진 국소화의 단백질(예를 들어, 막, 시냅스)과 융합하는 것이다.
대안적으로, 본 발명에 따른 이펙터 단백질은 예를 들어 국소화-의존적 녹다운에서 사용될 수 있다. 이펙터 단백질을 적절한 국소화 신호에 융합시킴으로써 이펙터는 구체적인 세포 구획으로 표적화된다. 이 구획에 상주하는 표적 RNA만 효과적으로 표적화되고, 반면, 다른 세포 구획에 상주하지만 그렇지 않으면 동일한 표적은 표적화되지 않을 것이므로, 국소화 의존적 녹다운이 확립될 수 있다.
F) 번역
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 번역을 향상 또는 억제하는 데 사용될 수 있다. 번역을 상향 조절하는 것은 세포 회로를 제어하는 매우 견고한 방식이라고 예상된다. 또한, 기능성 연구를 위해 단백질 번역 스크린은 전사 상향 조절 스크린보다 유리할 수 있는데, 이는 전사물의 상향 조절이 증가된 단백질 생산으로 번역되지 않는다는 단점을 갖는다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 번역을 구동하는 관심 메신저 RNA의 5' 비번역 반복(5'UTR) 부근에 EIF4G와 같은 번역 개시 인자를 가져오는 데 사용될 수 있는 것으로 예상된다(비-재프로그래밍 가능 RNA 결합 단백질에 대하여 문헌[De Gregorio et al. EMBO J. 1999;18(17):4865-74]에 기재된 바와 같이). 또 다른 예로서, 세포질 폴리(A) 폴리메라제인 GLD2는 RNA 표적화 이펙터 단백질에 의해 표적 mRNA에 모집될 수 있다. 이것은 표적 mRNA의 지시된 폴리아데닐화를 가능하게 하여 번역을 자극할 것이다.
유사하게, 본 명세서에서 예상된 RNA 표적화 이펙터 단백질은 ZBP1 (문헌[Huttelmaier S, et al. Nature. 2005;438:512-5])과 같은 mRNA의 번역 억제제를 차단하는 데 사용될 수 있다. 표적 RNA의 번역 개시 부위에 결합함으로써 번역이 직접적으로 영향을 받을 수 있다.
추가적으로, 예를 들어 알엔아제 저해제와 같은 그의 분해를 방지함으로써, mRNA를 안정화시키는 단백질에 RNA 표적화 이펙터 단백질을 융합시켜, 관심있는 전사물로부터 단백질 생산을 증가시키는 것이 가능하다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질은 RNA 전사물의 5'UTR 영역에서 결합하고 리보솜 형성 및 번역 시작을 방지함으로써 번역을 억제하는 데 사용될 수 있다고 예상된다.
또한, RNA 표적화 이펙터 단백질은 CCR4-NOT 데아데닐라제 복합체의 성분인 Caf1을 표적 mRNA에 모집하여 표적 전사물의 데아데닐화 및 단백질 번역의 저해를 초래하는 데 사용될 수 있다.
예를 들어, 본 발명의 RNA 표적화 이펙터 단백질은 치료적으로 관련 있는 단백질의 번역을 증가 또는 감소시키는 데 사용될 수 있다. RNA 표적화 이펙터 단백질이 번역을 하향 조절 또는 상향 조절하는 데 사용될 수 있는 치료적 적용의 예는 근위축성 측삭 경화증(ALS) 및 심혈관 장애에 있다. 감소된 수준의 교세포 글루타메이트 트랜스포터 EAAT2가 ALS 운동 피질 및 척수에서 보고되었을 뿐만 아니라 ALS 뇌 조직에서 다수의 비정상적인 EAAT2 mRNA 전사물이 보고되었다. EAAT2 단백질 및 기능의 손실은 ALS에서 흥분 독성의 주요 원인으로 생각되었다. EAAT2 단백질 수준 및 기능의 회복은 치료적 유익을 제공할 수 있다. 따라서, RNA 표적화 이펙터 단백질은, 예를 들어, 상기 기재된 바와 같이 번역 억제제를 차단하거나 mRNA를 안정화시킴으로써, EAAT2 단백질의 발현을 상향 조절하는 데 유익하게 사용될 수 있다. 아포지질단백질 A1은 고밀도 지질단백질(HDL)의 주요 단백질 성분이며 ApoA1 및 HDL은 일반적으로 아테롬성 동맥경화 방지제로서 고려된다. RNA 표적화 이펙터 단백질이, 예를 들어, 상기 기재된 바와 같이 번역 억제제를 차단하거나 mRNA를 안정화시킴으로써, ApoA1의 발현을 상향 조절하는 데 유익하게 사용될 수 있다고 예상된다.
G) mRNA 턴오버
번역은 mRNA 턴오버 및 조절된 mRNA 안정성에 밀접하게 연결된다. 특정 단백질이 전사물의 안정성(예를 들어, 뉴런의 ELAV/Hu 단백질, 문헌[Keene JD, 1999, Proc Natl Acad Sci U S A. 96:5-7]) 및 트리스테트라프롤린(TTP)에 관여한다고 기재되었다. 이들 단백질은 메시지가 세포질에서 분해되는 것을 방지함으로써 표적 mRNA를 안정화시킨다(문헌[Peng SS et al., 1988, EMBO J. 17:3461-70]).
본 발명의 RNA-표적화 이펙터 단백질은 mRNA 전사물을 안정화시키기 위해 작용하는 단백질의 활성을 간섭하거나 촉진하여, mRNA 턴오버가 영향을 받도록 하기 위해 사용될 수 있다고 예상될 수 있다. 예를 들어, RNA 표적화 이펙터 단백질을 사용하여 표적 RNA에 인간 TTP를 모집하는 것은 아데닐레이트-우리딜레이트-풍부한 요소(AU-풍부 요소) 매개되는 번역 억제 및 표적 분해를 가능하게 할 것이다. AU-풍부 요소는 전-암유전자, 핵 전사 인자, 및 사이토카인을 코딩하는 많은 mRNA의 3'UTR에서 발견되고 RNA 안정성을 촉진한다. 또 다른 예로서, RNA 표적화 이펙터 단백질은 또 다른 mRNA 안정화 단백질인 HuR(문헌[Hinman MN 및 Lou H, Cell Mol Life Sci 2008; 65: 3168-81])에 융합되어 표적 전사물에 그것을 모집하고 그의 수명을 연장시키거나 수명이 짧은 mRNA를 안정화시킬 수 있다.
본 명세서에 기재된 RNA-표적화 이펙터 단백질이 표적 전사물의 분해를 촉진시키는 데 사용될 수 있음이 추가로 예상된다. 예를 들어, m6A 메틸트랜스페라제는 표적 전사물에 모집되어 전사물을 P-바디에 국소화시켜 표적의 분해를 유도할 수 있다.
또 다른 예로서, 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 비-특이적 엔도뉴클레아제 도메인 PilT N-말단(PIN)에 융합되어 이를 표적 전사물로 모집하고 그의 분해를 가능하게 할 수 있다.
부종양성 신경 장애(PND)-관련 뇌척수염 및 신경병증을 갖는 환자는 중추 신경계 외부의 종양에서 Hu-단백질에 대한 자가항체를 발생시킨 후(문헌[Szabo A et al. 1991, Cell.;67:325-33] 혈액-뇌 장벽을 건너는 환자이다. 본 발명의 RNA-표적화 이펙터 단백질은 mRNA 전사물에 대한 자가항체의 결합을 간섭하는 데 사용될 수 있다고 예상될 수 있다.
근긴장성 이영양증-단백질 키나제(DMPK) 유전자의 3 'UTR에서 (CUG)n의 확장에 의해 야기되는 이영양증 제1 형(DM1) 환자는 이러한 전사물의 핵 내 축적을 특징으로 한다. (CUG)n 반복으로 표적화되는 엔도뉴클레아제와 융합된 본 발명의 RNA 표적화 이펙터 단백질은 비정상적인 전사물의 이러한 축적을 저해할 수 있다고 예상된다.
H) 다-기능성 단백질과의 상호작용
일부 RNA-결합 단백질은 다양한 과정에서 기능하는 다수의 RNA상의 다수의 부위에 결합한다. 예를 들어, hnRNP A1 단백질은 엑손 스플라이싱 사일렌서 서열과 결합하여 스플라이싱 인자를 길항시키고, 텔로미어 말단과 관련되고(그에 의해 텔로미어 활성을 자극하고) miRNA와 결합하여 Drosha-매개된 가공을 촉진하고 성숙에 영향을 주는 것으로 밝혀졌다. 본 발명의 RNA-결합 이펙터 단백질은 하나 이상의 위치에서 RNA-결합 단백질의 결합을 간섭할 수 있다고 예상된다.
I) RNA 폴딩
RNA는 그의 생물학적 활성을 수행하기 위해 규정된 구조를 취한다. 대안적인 3 차 구조들 사이에서의 형태 전이는 대부분의 RNA-매개 과정에 결정적이다. 그러나, RNA 폴딩은 몇몇의 문제와 관련될 수 있다. 예를 들어, RNA는 부적절한 대안적인 형태로 폴딩되고 유지되는 경향이 있을 수 있고/있거나 올바른 3 차 구조는 대안적 구조보다 열역학적으로 충분히 유리하지 못할 수 있다. 본 발명의 RNA 표적화 이펙터 단백질, 구체적으로 절단-결함 또는 데드 RNA 표적화 단백질은 (m)RNA의 폴딩을 지시하고/하거나 그의 올바른 3 차 구조를 포획하는 데 사용될 수 있다.
세포 상태 조절에서의 RNA-표적화 이펙터 단백질의 사용
특정 구현예에서, crRNA와의 복합체 중의 C2c2는 표적 RNA에 결합 즉시 활성화되고 이어서 임의의 가까운 ssRNA 표적을 절단한다(즉, "부수적" 또는 "구경꾼" 효과). C2c2는 동족 표적에 의해 일단 프라이밍되면, 다른 (비-상보적인) RNA 분자를 절단할 수 있다. 이러한 잡다한 RNA 절단은 잠재적으로 세포 독성을 유발하거나 그렇지 않으면 세포 생리 또는 세포 상태에 영향을 줄 수 있다.
따라서, 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 휴면 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포주기 정지의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 성장 및/또는 세포 증식의 감소를 위해 사용되거나 감소에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 아네르기의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 아폽토시스의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 괴사의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 세포 사멸 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다. 특정 구현예에서, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템은 프로그래밍된 세포 사멸의 유도를 위해 사용되거나 유도에서의 사용을 위한 것이다.
특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 휴면 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 주기 정지 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 성장 및/또는 세포 증식을 감소시키는 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 아네르기 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 아폽토시스의 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 괴사 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 세포 사멸 유도 방법에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는 프로그래밍된 세포 사멸 유도 방법에 관한 것이다.
본 명세서에 기재된 방법 및 용도는 치료적 또는 예방적일 수 있으며, 구체적인 세포, 세포 (하위)집단, 또는 세포/조직 유형을 표적화할 수 있다. 구체적으로, 본 명세서에 기재된 방법 및 용도는 치료적 또는 예방적일 수 있으며, 하나 이상의 구체적인 표적 RNA(예를 들어, ssRNA)와 같은 하나 이상의 표적 서열을 발현하는 구체적인 세포, 세포 (하위)집단, 또는 세포/조직 유형을 표적화할 수 있다. 제한없이, 표적 세포는 예를 들어 구체적인 전사물을 발현하는 암세포, 예를 들어 주어진 클래스의 뉴런, 예를 들어 자가면역을 야기하는 (면역) 세포, 또는 특정(예를 들어, 바이러스성) 병원체에 감염된 세포 등일 수 있다.
따라서, 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 방법에 관한 것이다. 특정 구현예에서, 본 발명은 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 것을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 원하지 않는 세포(숙주 세포)의 존재를 특징으로 하는 병리학적 상태를 치료하는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 원하지 않는 세포에 특이적인 표적을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 암을 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 암을 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 암을 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 암세포에 특이적인 표적을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 병원체에 의한 세포의 감염을 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 병원체에 의해 감염된 세포에 특이적인 표적(예를 들어, 병원체 유래 표적)을 표적화함이 이해되어야 한다. 특정 구현예에서, 본 발명은 자가면역 장애를 치료, 예방 또는 경감시키기 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템의 용도에 관한 것이다. 특정 구현예에서, 본 발명은 자가면역 장애를 치료, 예방 또는 경감시키는 것에서의 사용을 위한, 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템에 관한 것이다. 특정 구현예에서, 본 발명은 본 명세서에 기재된 비-천연적으로 발생하거나 설계 제작된 조성물, 벡터 시스템 또는 전달 시스템을 도입 또는 유도하는 것을 포함하는, 자가면역 장애를 치료, 예방 또는 경감시키는 방법에 관한 것이다. 바람직하게는 CRISPR-Cas 시스템은 자가면역 장애의 원인이 되는 세포(예를 들어, 특정 면역 세포)에 특이적인 표적을 표적화함이 이해되어야 한다.
RNA 검출 또는 단백질 검출에 있어서의 RNA-표적화 이펙터 단백질의 사용
RNA 표적화 이펙터 단백질이 생물학적 샘플에서 핵산 또는 단백질의 검출에 사용될 수 있음이 더 예상된다. 샘플은 세포 또는 무-세포일 수 있다.
노던 블롯 분석에서. 노던 블롯팅은 크기별로 RNA 샘플을 분리하기 위해 전기 영동의 사용을 포함한다. RNA 표적화 이펙터 단백질은 표적 RNA 서열을 특이적으로 결합 및 검출하는 데 사용될 수 있다.
RNA 표적화 이펙터 단백질은 또한 형광 단백질(예를 들어, GFP)에 융합되어 살아있는 세포에서 RNA 국소화를 추적하는 데 사용될 수 있다. 더욱 구체적으로, RNA 표적화 이펙터 단백질은 더 이상 RNA를 절단하지 않는다는 점에서 비활성화될 수 있다. 구체적인 구현예에서, 더욱 정확한 시각화를 보장하기 위해, 신호가 두 서브단백질 모두의 결합에 의존하는, 분할된 RNA 표적화 이펙터 단백질이 사용될 수 있다고 예상된다. 대안적으로, 다수의 RNA 표적화 이펙터 단백질 복합체가 표적 전사물에 결합할 때 재구성되는 분할된 형광 단백질이 사용될 수 있다. 전사물은 mRNA를 따라 다수의 결합 부위에 표적화되므로 형광 신호가 실제 신호를 증폭시키고 초점 식별이 가능하게 할 수 있다고 추가로 예상된다. 또 다른 대안으로서, 형광 단백질은 분할된 인테인(intein)으로부터 재구성될 수 있다.
RNA 표적화 이펙터 단백질은 예를 들어 RNA 또는 특정 스플라이스 변이체의 국소화, mRNA 전사물의 수준, 전사물의 상향- 또는 하향 조절 및 질병-특이적 진단을 결정하는 데 적합하게 사용된다. RNA 표적화 이펙터 단백질은, 예를 들어 형광 현미경 검사 또는 세포의 고-처리량 스크리닝 및 세포 분류 후 살아있는 세포의 회수를 가능하게 하는 형광-활성화된 세포 분류(FACS)와 같은, 유세포 계측법을 사용하여 (살아있는) 세포 내에서 RNA를 시각화하는 데 사용될 수 있다. 추가적으로, 스트레스, 예를 들어, 세포 상에 분자 저해제 또는 저산소 상태를 이용한 암 성장 저해, 하에서 상이한 전사물의 발현 수준을 동시에 평가할 수 있다. 또 다른 적용은 2 개의 광자 현미경을 사용하여 신경 자극 동안 시냅스 연결으로의 전사물의 국소화를 추적하는 것일 것이다.
특정 구현예에서, 본 명세서에 기재된 본 발명에 따른 성분 또는 복합체는 예를 들어, (형광으로) 표지된 C2c2 이펙터를 사용하여, 다중화된 에러-로버스트 형광 인 시츄(in situ) 혼성화(MERFISH; 문헌[Chen et al. Science; 2015; 348(6233)])에서 사용될 수 있다.
시험관내 apex 표지
세포 과정은 단백질, RNA 및 DNA 간의 분자 상호 작용의 네트워크에 의존한다. 단백질-DNA 및 단백질-RNA 상호 작용의 정확한 검출은 이러한 과정을 이해하기 위한 핵심이다. 시험관내 근접 표지 기술은 시험관내에서 관심 단백질 또는 RNA의 부근의 폴리펩티드 및 RNA를 표지하기 위해, 예를 들어, 광활성화 가능한 프로브와 조합된 친화성 태그를 이용한다. UV 조사 후, 광활성화 가능한 그룹은 태그가 부착된 분자에 매우 근접한 단백질 및 기타 분자와 반응하여 그들을 표지한다. 표지된 상호 작용 분자는 이어서 회수되고 식별될 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 예를 들어 프로브를 선택된 RNA 서열에 표적화하는 데 사용될 수 있다.
이들 응용은 또한 질병 관련 응용 또는 배양하기 어려운 세포 유형의 생체내 이미징을 위한 동물 모델에 적용될 수 있다.
본 발명은 위험요소 테스트 및 RNA-표적화된 치료법 가이드를 포함하는, 무 세포 RNA의 비-침습성 샘플링을 통한 건강 상태의 진단 및 모니터링을 위한 제제 및 방법을 제공하며, 치료의 신속한 투여가 치료 결과에 중요한 환경에서 유용하다. 일 구현예에서, 본 발명은 통상적인 약물 내성 돌연변이의 재발 및/또는 발생을 모니터링하는 것을 포함하여, 종양 RNA를 순환시키는 암 검출 방법 및 제제를 제공한다. 또 다른 구현예에서, 본 발명은 예를 들어 질병 진행 및 패혈증을 모니터링하기 위해 혈액 또는 혈청으로부터 직접 박테리아 종을 검출 및/또는 동정하기 위한 검출 방법 및 제제를 제공한다. 본 발명의 일 구현예에서, C2c2 단백질 및 유도체는 라이노바이러스 또는 상부 호흡기 감염과 같은 통상적인 질병을 기관지염과 같은 더욱 심각한 감염과 구별하고 진단하기 데 사용될 수 있다.
본 발명은 예를 들어, VKORC1, CYP2C9 및 CYP2C19 유전형 분석에 기반한 심근 경색 또는 뇌졸중 치료 중 항응고제의 투여에 대한 지침을 포함하여, 응급 약물유전체학을 위한 신속한 유전형분석을 위한 방법 및 제제를 제공한다.
본 발명은 식품 생산 및 전달 체인을 따라 모든 지점에서 박테리아에 의한 식품 오염을 모니터링하기 위한 제제 및 방법을 제공한다. 또 다른 구현예에서, 본 발명은, 예를 들어, 식품 출처 확인 및 순도 결정에 의해, 품질 제어 및 모니터링을 제공한다. 하나의 비-제한적인 예에서, 본 발명은 동물 고기 및 해산물 종과 같은, 식품 출처를 식별하거나 확인하는 데 사용될 수 있다.
또 다른 구현예에서, 본 발명은 법의학적 결정에서 사용된다. 예를 들어, 혈액 또는 다른 체액을 함유하는 범죄 현장 샘플. 본 발명의 일 구현예에서, 본 발명은 지문으로부터 핵산 샘플을 동정하는 데 사용된다.
RNA 오리가미(origami)/시험관내 조립 라인-조합론에서의 RNA-표적화 이펙터 단백질의 사용
RNA 오리가미는 RNA를 통합된 주형으로 사용하여 2-차원 또는 3-차원 구조를 생성하기 위한 나노 크기 폴딩된 구조를 지칭한다. 폴딩된 구조는 RNA에서 인코딩되며 결과로 발생한 RNA의 모양은 따라서 합성된 RNA 서열(문헌[Geary, et al. 2014. Science, 345 (6198). pp. 799-804])에 의해 결정된다. RNA 오리가미는 단백질과 같은 다른 성분을 복합체로 배열하기 위한 스캐폴드로서 작용할 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 예를 들어 적합한 가이드 RNA를 사용하여 관심 단백질을 RNA 오리가미로 표적화하는 데 사용될 수 있다.
RNA 단리 또는 정제, 강화 또는 격감에서의 RNA-표적화 이펙터 단백질의 사용
RNA 표적화 이펙터 단백질이 RNA에 복합체화될 때 RNA를 단리 및/또는 정제하는 데 사용될 수 있다는 것이 또한 예상된다. RNA 표적화 이펙터 단백질은 예를 들어, RNA-RNA 표적화 이펙터 단백질 복합체를 단리 및/또는 정제하는 데 사용될 수 있는 친화성 태그에 융합될 수 있다. 이러한 응용은 예를 들어 세포에서의 유전자 발현 프로파일의 분석에 유용하다. 구체적인 구현예에서, RNA 표적화 이펙터 단백질이 특정 비-코딩 RNA(ncRNA)를 표적화하여 그의 활성을 차단하는 데 사용될 수 있고 유용한 기능적 프로브를 제공할 수 있다고 예상될 수 있다. 특정 구현예에서, 본 명세서에 기재된 이펙터 단백질은 구체적인 RNA에 대해 특이적으로 강화하는 데(안정성 증가 등을 포함하지만 이에 한정되지는 않음), 또는 대안적으로 구체적인 RNA(예를 들어 제한 없이 구체적인 스플라이스 변이체, 이소형 등과 같은)를 특이적으로 격감시키는 데 사용될 수 있다.
lincRNA 기능 및 다른 핵 RNA의 조사
siRNA와 같은 현재의 RNA 녹다운 전략은 단백질 시스템이 기작이 세포액성이기 때문에 주로 세포액의 전사물을 표적화하는 것으로 제한된다는 단점이 있다. 세포 기능에 필수적이지 않은 외인성 시스템인, 본 발명의 RNA 표적화 이펙터 단백질의 이점은 세포 내 임의의 구획에서 사용될 수 있다는 것이다. NLS 신호를 RNA 표적화 이펙터 단백질에 융합함으로써, 핵으로 유도될 수 있고 핵 RNA가 표적화되도록 할 수 있다. 예를 들어 lincRNA의 기능을 조사하는 것이 예상된다. 긴 유전자간 비-코딩 RNA(lincRNA)는 탐구가 덜 된 연구 영역이 대단히 크다. 대부분의 lincRNA는 본 발명의 RNA 표적화 이펙터 단백질을 사용하여 연구될 수 있는 아직 알려지지 않은 기능을 갖는다.
RNA 결합 단백질의 동정
특정 RNA에 결합된 단백질을 동정하는 것은 많은 RNA의 역할을 이해하는 데 유용할 수 있다. 예를 들어, 많은 lincRNA는 전사를 제어하기 위한 전사적 및 후성적 조절제와 관련된다. 어떤 단백질이 주어진 lincRNA에 결합하는지 이해하는 것은 주어진 조절 경로의 성분을 밝히는 데 도움이 될 수 있다. 본 발명의 RNA 표적화 이펙터 단백질은 결합된 단백질을 국소적으로 바이오틴으로 표지하기 위해 특정 전사물에 바이오틴 리가제를 모집하도록 설계될 수 있다. 그 다음 단백질을 풀다운(pull down)하고 질량 분광법으로 분석하여 그들을 동정할 수 있다.
RNA 상의 복합체 조립 및 기질 왕복
본 발명의 RNA 표적화 이펙터 단백질은 RNA상에 복합체를 조립하는 데 추가로 사용될 수 있다. 이것은 다수의 관련 단백질(예를 들어, 구체적인 합성 경로의 성분)로 RNA 표적화 이펙터 단백질을 기능화함으로써 달성될 수 있다. 대안적으로, 다수의 RNA 표적화 이펙터 단백질은 이러한 상이한 관련 단백질로 기능화될 수 있고 동일하거나 인접한 표적 RNA로 표적화될 수 있다. RNA 상에 복합체를 조립하는 것에 대한 유용한 응용은 예를 들어 단백질 간의 기질 왕복을 촉진하는 것이다.
합성 생물학
생물학적 시스템의 개발은 임상적 적용을 포함하여 넓은 유용성을 갖는다. 본 발명의 프로그래밍 가능한 RNA 표적화 이펙터 단백질은 예를 들어 암-연결된 RNA를 표적 전사물로 사용하여 표적화된 세포 사멸을 위해 독성 도메인의 분할된 단백질에 융합되어 사용될 수 있음이 예상된다. 추가로, 예를 들어, 키나제 또는 다른 효소와 같은 적절한 이펙터와의 융합 복합체로, 단백질-단백질 상호 작용을 수반하는 경로가 합성 생물학 시스템에서 영향을 받는다.
단백질 스플라이싱: 인테인
단백질 스플라이싱은 인테인으로 지칭되는, 개입 폴리펩티드가 엑스테인으로 지칭되는, 그 측면에 배치되는 폴리펩티드로부터 자체 절제뿐만 아니라 뒤이은 엑스테인의 연결을 촉매하는 번역-후 과정이다. 2 개 이상의 본 명세서에 기재된 RNA 표적화 이펙터 단백질의 표적 전사물 상의 조립은 분할된 인테인의 방출을 지시함으로써(Topilina and Mills Mob DNA. 2014 Feb 4;5(1):5), mRNA 전사물의 존재에 대한 직접적 계산 및, 대사 효소 또는 (전사 경로의 다운스트림 작동을 위한) 전사 인자와 같은, 단백질 산물의 후속적인 방출이 가능하도록 하는 데 사용될 수 있다. 이 응용은 합성 생물학(상기 참고) 또는 대규모 생물생산(특정 조건에서만 생산물 생산하는)에서 상당한 관련성이 있을 수 있다.
유도성이고, 투여되고 자가-비활성화인 시스템
일 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질 및 이펙터 성분을 포함하는 융합 복합체는 유도성, 예를 들어 광 유도성 또는 화학적 유도성이도록 설계된다. 이러한 유도성은 시간 상 원하는 순간에 이펙터 성분의 활성화를 가능하게 한다.
광 유도성은 예를 들어 융합을 위해 CRY2PHR/CIBN 쌍이 사용되는 융합 복합체를 설계함으로써 달성된다. 이 시스템은 살아있는 세포에서 단백질 상호 작용에 대한 광 유도에 특히 유용하다(문헌[Konermann S, et al. Nature. 2013;500:472-476]).
화학적 유도성은 예를 들어 융합을 위해 FKBP/FRB(FK506 결합 단백질/FKBP 라파마이신 결합) 쌍이 사용되는 융합 복합체를 설계함으로써 제공된다. 이 시스템을 사용하면 라파마이신이 단백질 결합에 필요하다(문헌[Zetsche et al. Nat Biotechnol. 2015;33(2):139-42 describes the use of this system for Cas9]).
추가적으로, DNA로서 세포 내에 도입될 때, 본 발명의 RNA 표적화 이펙터 단백질은 테트라사이클린 또는 독시사이클린 제어되는 전사 활성화(Tet-온 및 Tet-오프 발현 시스템), 예를 들어 엑디손 유도성 유전자 발현 시스템 및 아라비노스-유도성 유전자 발현 시스템과 같은 호르몬 유도성 유전자 발현 시스템과 같은, 유도성 프로모터에 의해 조절될 수 있다. RNA로서 전달될 때, RNA 표적화 이펙터 단백질의 발현은 테트라사이클린과 같은 소분자를 감지할 수 있는 리보스위치를 통해 조절될 수 있다(문헌[Goldfless et al. Nucleic Acids Res. 2012;40(9):e64]에 기재된 바와 같음).
일 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질의 전달은 세포 내의 단백질 또는 crRNA의 양을 변화시키도록 조절될 수 있고, 이에 의해 원하는 효과 또는 임의의 원하지 않는 표적외 효과의 규모를 변화시킬 수 있다.
일 구현예에서, 본 명세서에 기재된 RNA 표적화 이펙터 단백질은 자가-비활성화되도록 설계될 수 있다. mRNA 또는 복제 RNA 치료제(문헌[Wrobleska et al Nat Biotechnol. 2015 Aug; 33(8): 839-841])로서의 RNA로서 세포에 전달될 때, 그들은 자체 RNA를 파괴함으로써 발현 및 후속 효과를 자가-비활성화하고, 이에 의해 상주 및 잠재적인 원하지 않는 효과를 감소시킬 수 있다.
본 명세서에 기재된 RNA 표적화 이펙터 단백질의 추가의 생체내 적용에 대해서는 참조로서 본 명세서에 포함된, 문헌[Mackay JP et al (Nat Struct Mol Biol. 2011 Mar;18(3):256-61), 문헌[Nelles et al (Bioessays. 2015 Jul;37(7):732-9)] 및 문헌[Abil Z and Zhao H (Mol Biosyst. 2015 Oct;11(10):2658-65)])을 참조한다. 구체적으로, 본 발명의 특정 구현예에서, 바람직하게는 촉매적으로 비활성인 C2c2를 사용함으로써 특정 구현예에서 다음의 응용이 예상된다: 번역 향상(예를 들어, C2c2-번역 촉진 인자 융합(예를 들어, eIF4 융합)); 번역 억제(예를 들어, 리보솜 결합 부위를 표적화하는 gRNA); 엑손 건너뛰기(예를 들어, 스플라이스 공여체 및/또는 수용체 부위를 표적화하는 gRNA); 엑손 포함(예를 들어, 구체적인 엑손 스플라이스 공여체 및/또는 수용체 부위를 표적화하는 gRNA가 포함되거나 스플라이소솜 성분(예를 들어, U1 snRNA)에 융합되거나 이를 모집하는 C2c2); RNA 국소화 접근(예를 들어, C2c2-마커 융합(예를 들어, EGFP 융합)); RNA 국소화 변경(예를 들어, C2c2-국소화 신호 융합(예를 들어, NLS 또는 NES 융합)); RNA 분해(이 경우 C2c2의 활성에 의존하는 경우 촉매적으로 비활성인 C2c2는 사용되지 않고, 대안적으로 증가된 특이성을 위해, 분할된 C2c2가 사용될 수 있음); 예를 들어 gRNA의 분해 또는 gRNA의 기능성 부위에의 결합에 의해(아마도 C2c2-신호 서열 융합에 의한 재국소화에 의해 특정 부위에서 적정하는), 비-코딩 RNA 기능의 저해(예를 들어, miRNA)에 의한 억제.
본 명세서에서 이전에 기재되고 실시예에서 입증된 바와 같이, C2c2 기능은 crRNA의 5' 또는 3' 연장 및 crRNA 루프의 연장에 대해 견고하다. 따라서 MS2 루프 및 다른 모집 도메인은, 복합체 형성에 영향을 미치지 않고 표적 전사물에 결합하지 않으면서 crRNA에 부가될 수 있는 것으로 예상된다. 다양한 이펙터 도메인의 모집을 위한 crRNA에 대한 이러한 변형은 상기 기재된 RNA 표적화된 이펙터 단백질의 사용에서 적용 가능하다.
실시예에서 입증된 바와 같이, C2c2, 구체적으로 LshC2c2는 RNA 파지에 대한 저항성을 매개할 수 있다. 따라서, C2c2는, 레트로바이러스(예를 들어, HIV와 같은 렌티바이러스), HCV, 에볼라 바이러스 및 지카(Zika) 바이러스를 포함하나 이에 한정되지 않는 RNA만 갖는 병원체에 대해 예를 들어 동물, 인간 및 식물을 면역화하는 데 사용될 수 있다고 예상된다.
본 발명자는 C2c2가 자체 어레이를 처리(절단)할 수 있음을 보여주었다. 이것은 R597A, H602A, R1278A 및 H1283A로부터 선택되는 하나 이상의 변형과 같은, 하나 이상의 돌연변이된 아미노산 잔기 R597, H602, R1278 및 H1283을 함유하는 야생형 C2c2 단백질 및 돌연변이된 C2c2 단백질 모두에 적용된다. 따라서, 상이한 표적 전사물 및/또는 응용을 위해 설계된 다수의 crRNA가 단일 pre-crRNA로서 또는 하나의 프로모터에 의해 구동되는 단일 전사물로서 전달될 수 있는 것으로 예상된다. 이러한 전달 방법은 실질적으로 더 소형이고, 합성이 더 쉽고, 바이러스 시스템으로 전달하기가 더 쉽다는 이점을 갖는다. 바람직하게, 본 명세서에 기재된 아미노산 넘버링은 Lsh C2c2 단백질을 참조한다. 정확한 아미노산 위치는 Lsh C2c2의 오솔로그들에 대해 달라질 수 있으며, 이는 당업계에 공지되고, 본 명세서의 다른 곳에서 기재된 바와 같이, 단백질 정렬에 의해 적절하게 결정될 수 있음이 이해될 것이다.
본 발명의 일 양태는 또한, 예를 들어 시험관내, 생체내 또는 생체외에서, 원핵 세포 또는 진핵 세포에서 하나 이상의 유전자 또는 하나 이상의 유전자 산물의 (단백질) 발현을 변경하거나 조작하기 위한, 게놈 또는 트랜스크립톰 설계 제작에 있어서 본 명세서에 기재된 조성물 및 시스템의 방법 및 용도를 포함한다.
일 양태에서, 본 발명은 세포에서 표적 RNA의 (단백질) 발현을 조절, 예를 들어 감소시키기 위한 방법 및 조성물을 제공한다. 대상 방법에서, RNA의 전사, 안정성 및/또는 번역을 간섭하는 본 발명의 C2c2 시스템이 제공된다.
특정 구현예에서, 유효량의 C2c2 시스템은 RNA를 절단하거나 그렇지 않으면 RNA 발현을 저해하는 데 사용된다. 이와 관련하여, 시스템은 siRNA 및 shRNA와 유사한 용도를 가지므로 이러한 방법으로 대체될 수도 있다. 방법은, 제한없이, 예를 들어 간섭 리보핵산(예를 들어, siRNA 또는 shRNA) 또는 그의 전사 주형, 예를 들어 shRNA를 인코딩하는 DNA,에 대한 대체물로서의 C2c2 시스템의 사용을 포함한다. C2c2 시스템은 예를 들어 표적 세포를 포함하는 포유류에 투여됨으로써 표적 세포로 도입된다.
유리하게는, 본 발명의 C2c2 시스템은 특이적이다. 예를 들어, 간섭 리보핵산(siRNA 또는 shRNA와 같은) 폴리뉴클레오티드 시스템이 설계 및 안정성 문제 및 표적외 결합에 의해 성가신 반면, 본 발명의 C2c2 시스템은 높은 특이성으로 설계될 수 있다.
불안정화된 C2c2
특정 구현예에서, 본 명세서에 기재된 본 발명에 따른 이펙터 단백질(CRISPR 효소; C2c2)은 불안정화 도메인(DD)과 관련되거나 이에 융합된다. 일부 구현예에서, DD는 ER50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서, 4HT이다. 이와 같이, 일부 구현예에서, 적어도 하나의 DD 중 하나는 ER50이고 이에 대한 안정화 리간드는 4HT 또는 CMP8이다. 일부 구현예에서, DD는 DHFR50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서 TMP이다. 이와 같이, 일부 구현예에서, 적어도 하나의 DD 중 하나는 DHFR50이고 이에 대한 안정화 리간드는 TMP이다. 일부 구현예에서, DD는 ER50이다. 이 DD에 대한 상응하는 안정화 리간드는, 일부 구현예에서 CMP8이다. 따라서 CMP8은 ER50 시스템에서 4HT에 대한 대안적인 안정화 리간드일 수 있다. CMP8 및 4HT가 경쟁 물질에서 사용될 수 있거나/사용되어야 하는 것이 가능할 수 있는 동안, 일부 세포 유형은 이들 두 리간드 중 하나 또는 다른 것에 더 민감할 수 있으며, 본 개시내용 및 당업계의 지식으로부터 당업자는 CMP8 및/또는 4HT를 사용할 수 있다.
일부 구현예에서, 하나 또는 2 개의 DD는 CRISPR 효소의 C-말단에 융합되면서 하나 또는 2 개의 DD는 CRISPR 효소의 N-말단에 융합될 수 있다. 일부 구현예에서, 적어도 2 개의 DD가 CRISPR 효소와 관련되고 DD는 동일한 DD, 즉 DD는 상동이다. 따라서, 2 개(또는 둘 이상)의 DD는 ER50 DD일 수 있다. 이는 일부 구현예에서 바람직하다. 대안적으로, 2 개(또는 둘 이상)의 DD는 DHFR50 DD일 수 있다. 이는 또한 일부 구현예에서 바람직하다. 일부 구현예에서, 적어도 2 개의 DD가 CRISPR 효소와 관련되고 DD는 상이한 DD, 즉 DD는 이종성이다. 따라서 DDS 중 하나는 ER50 일 수 있고 하나 이상의 DD 또는 임의의 다른 DD는 DHFR50일 수 있다. 이종성인 2 개 이상의 DD를 갖는 것은 더 큰 수준의 분해 제어를 제공할 것이기 때문에 유리할 수 있다. N 또는 C-말단에 하나 초과의 DD를 직렬 융합한 것은 분해를 향상시킬 수 있고; 이러한 직렬 융합은 예를 들어 ER50-ER50-C2c2 또는 DHFR-DHFR-C2c2일 수 있다. 모든 안정화 리간드의 부재 하에 높은 수준의 분해가 발생하고, 하나의 안정화 리간드의 부재 및 다른(또는 또 다른) 안정화 리간드의 존재 하에 중간 수준의 분해가 발생하고, 2 개(또는 그 이상 중 2 개)의 안정화 리간드 존재 하에 낮은 수준의 분해가 발생할 것임이 예상된다. N-말단 ER50 DD 및 C-말단 DHFR50 DD를 가짐으로써 또한 제어가 제공될 수 있다.
일부 구현예에서, CRISPR 효소의 DD와의 융합은 DD와 CRISPR 효소 사이의 링커를 포함한다. 일부 구현예에서, 링커는 GlySer 링커이다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵 방출 신호(NES)를 추가로 포함한다. 일부 구현예에서, DD-CRISPR 효소는 2 개 이상의 NES를 포함한다. 일부 구현예에서, DD-CRISPR 효소는 적어도 하나의 핵 국소화 신호(NLS)를 포함한다. 이것은 NES에 추가될 수 있다. 일부 구현예에서, CRISPR 효소는 CRISPR 효소와 DD 사이의 링커로서 또는 그 일부로서, 국소화(핵 도입 또는 방출) 신호를 포함하거나 이로 본질적으로 구성되거나 이로 구성된다. HA 또는 Flag 태그는 링커로서 본 발명의 범위 내에 또한 있다. 출원인은 NLS 및/또는 NES를 링커로 사용하고 또한 글리신 세린 링커를 GS만큼 짧게부터 (GGGGS)3까지 사용한다.
불안정화 도메인은 광범위한 단백질에 불안정성을 부여하는 일반적인 유용성을 갖는다; 예를 들어, 참조로서 본 명세서에 포함된 문헌[Miyazaki, J Am Chem Soc. Mar 7, 2012; 134(9): 3942-3945] 참고. CMP8 또는 4-하이드록시타목시펜은 불안정화 도메인일 수 있다. 더욱 일반적으로, N-말단 규칙에 의해 불안정화 잔기인, 포유류 DHFR의 온도-민감 돌연변이체(DHFRts)는 허용 온도에서는 안정하지만 37℃에서는 불안정한 것으로 밝혀졌다. DHFRts를 발현하는 세포에 포유류 DHFR에 대한 고-친화성 리간드인 메토트렉세이트를 첨가하면 부분적으로 단백질 분해가 억제되었다. 이것은 소분자 리간드가 그렇지 않으면 세포에서의 분해를 위해 표적화되는 단백질을 안정화시킬 수 있다는 중요한 입증이었다. mTOR(FRB*)의 FRB 도메인의 불안정한 돌연변이체를 안정화시키고 융합된 키나제인 GSK-3β.6,7의 기능을 회복시키는 데 라파마이신 유도체가 사용되었다. 이 시스템은 리간드-의존적 안정성이 복잡한 생물학적 환경에서 특정 단백질의 기능을 조절하는 매력적인 전략에 해당한다는 것을 입증하였다. 단백질 활성을 제어하는 시스템은 라파마이신에 의해 유도되는 FK506-결합 단백질 및 FKBP12의 이량체화에 의해 유비퀴틴 상보성이 발생하는 경우 DD가 기능적으로 되는 것을 포함할 수 있다. 인간 FKBP12 또는 ecDHFR 단백질의 돌연변이체는 각각 그들의 고-친화성 리간드인 Shield-1 또는 트리메토프림(TTP)이 부재하는 경우 대사적으로 불안정해지도록 설계 제작될 수 있다. 이들 돌연변이체는 본 발명의 실시에 유용한 가능한 불안정화 도메인(DD) 중 일부이고, CRISPR 효소와의 융합으로서 DD의 불안정성은 프로테아솜에 의한 전체 융합 단백질의 CRISPR 단백질 분해를 부여한다. Shield-1 및 TMP는 용량-의존적 방식으로 DD에 결합하고 DD를 안정화시킨다. 에스트로겐 수용체 리간드 결합 도메인(ERLBD, ERS1의 305 내지 549 잔기)은 또한 불안정화 도메인으로서 설계 제작될 수 있다. 에스트로겐 수용체 신호 전달 경로는 유방암과 같은 다양한 질병에 관여하기 때문에, 경로는 널리 연구되어 왔으며 수많은 에스트로겐 수용체의 작용제 및 길항제가 개발되었다. 따라서, ERLBD 및 약물의 양립 가능한 쌍이 알려져 있다. ERLBD의 돌연변이체에는 결합하지만 야생형에는 하지 않는 리간드가 있다. 3 개의 돌연변이(L384M, M421G, G521R)12를 인코딩하는 이들 돌연변이체 도메인 중 하나를 사용함으로써 내인성 에스트로겐-민감성 네트워크를 변동시키지 않는 리간드를 사용하여 ERLBD-유래 DD의 안정성을 조절하는 것이 가능하다. ERLBD를 더 불안정화하고 그것을 잠재적인 DD 후보로서 구성하기 위해 추가적인 돌연변이(Y537S)가 도입될 수 있다. 이 4-돌연변이체는 유리한 DD 개발이다. 돌연변이체 ERLBD는 CRISPR 효소에 융합될 수 있으며 그 안정성은 리간드를 사용하여 조절되거나 변동될 수 있고, 이에 의해 CRISPR 효소는 DD를 갖는다. 또 다른 DD는 Shield1 리간드에 의해 안정화된 돌연변이된 FKBP 단백질에 기반한 12-kDa(107-아미노산) 태그일 수 있다; 예를 들어, 문헌[Nature Methods 5,(2008)] 참고. 예를 들어 DD는 합성, 생물학적으로 비활성인 소분자인 Shield-1에 결합하여 이에 의해 가역적으로 안정화되는 변형된 FK506 결합 단백질 12(FKBP12)일 수 있다; 예를 들어, 문헌[Banaszynski LA, Chen LC, Maynard-Smith LA, Ooi AG, Wandless TJ. A rapid, reversible, and tunable method to regulate protein function in living cells using synthetic small molecules. Cell. 2006;126:995-1004]; 문헌[Banaszynski LA, Sellmyer MA, Contag CH, Wandless TJ, Thorne SH. Chemical control of protein stability and function in living mice. Nat Med. 2008;14:1123-1127]; 문헌[Maynard-Smith LA, Chen LC, Banaszynski LA, Ooi AG, Wandless TJ. A directed approach for engineering conditional protein stability using biologically silent small molecules. The Journal of biological chemistry. 2007;282:24866-24872]; 및 문헌[Rodriguez, Chem Biol. Mar 23, 2012; 19(3): 391-398]을 참고-이들 모두는 본 명세서에 참조로서 포함되며 본 발명의 실시에 있어서 CRISPR 효소와 관련시키는 선택된 DD에서 본 발명의 실시에 활용될 수 있다. 알게 될 수 있는 바와 같이, 당업계의 지식은 다수의 DD를 포함하고, DD는 CRISPR 효소와 관련될 수 있고, 예를 들어 유리하게는 링커를 이용하여 이에 융합될 수 있고, 이에 의해 DD는 리간드의 존재 하에 안정화될 수 있고 이것이 부재하는 경우 DD가 불안정화되며, 이에 의해 CRISPR 효소는 완전히 불안정화되거나, DD는 리간드의 부재 하에 안정화될 수 있고 리간드가 존재하는 경우 DD가 불안정화되며; DD는 CRISPR 효소 및 그에 따른 CRISPR-Cas 복합체 또는 시스템이 조절 또는 제어되도록-말하자면 켜지거나 꺼지도록 하여, 이에 의해 예를 들어, 생체내 또는 시험관내 환경에서, 시스템의 조절 또는 제어의 수단을 제공한다. 예를 들어, 관심 단백질이 DD 태그와의 융합으로서 발현되는 경우, 이것은 예를 들어 프로테아솜에 의해 불안정화되고 세포 내에서 급속히 분해된다. 따라서, 안정화 리간드의 부재는 D 관련된 Cas가 분해되도록 한다. 새로운 DD가 관심 단백질에 융합된 경우, 그의 불안정성이 관심 단백질에 부여되어 전체 융합 단백질의 급속한 분해를 초래한다. Cas에 대한 최고조 활성은 표적외 효과를 감소시키기 위해 때때로 유익하다. 따라서, 높은 활성의 짧은 폭발이 선호된다. 본 발명은 이러한 최고조를 제공할 수 있다. 일부 의미에서 시스템은 유도성이다. 일부 다른 의미에서, 시스템은 안정화 리간드의 부재 하에 억제되고 안정화 리간드의 존재 하에 탈-억제된다.
RNA-표적화RNA-표적화-CRISPR 시스템의 식물 및 효모에의 응용
정의:
일반적으로, 용어 "식물"은 특징적으로 세포 분열에 의해 성장하고, 엽록체를 함유하고, 셀룰로스가 포함된 세포벽을 갖는, 식물계의 임의의 다양한 광합성하는, 진핵성, 단세포 또는 다세포 생물에 관한 것이다. 용어, 식물은 단자엽 및 쌍자엽 식물을 포함한다. 구체적으로, 식물은 제한 없이 속씨 식물 및 겉씨 식물, 예를 들어 아카시아, 알팔파, 아마란스, 사과, 살구, 아티초크, 물푸레나무, 아스파라거스, 아보카도, 바나나, 보리, 콩, 비트, 자작나무, 너도밤나무, 블랙베리, 블루베리, 브로콜리, 방울 양배추(Brussel's sprout), 양배추, 카놀라, 칸탈루프, 당근, 카사바, 콜리플라워, 삼나무, 곡물, 셀러리, 밤, 체리, 중국 배추, 감귤류, 클레멘타인, 클로버, 커피, 옥수수, 목화, 동부, 오이, 사이프러스, 가지, 느릅나무, 꽃상추, 유칼립투스, 회향, 무화과, 전나무, 제라늄, 포도, 자몽, 땅콩, 꽈리, 검 헴록(gum hemlock), 히코리(hickory), 케일, 키위, 콜라비, 낙엽송, 상추, 대파, 레몬, 라임, 로커스트(locust), 소나무, 공작고사리(maidenhair), 메이즈, 망고, 단풍나무, 멜론, 기장, 버섯, 겨자, 견과류, 참나무, 귀리, 기름야자, 오크라, 양파, 오렌지, 장식용 식물 또는 꽃 또는 나무, 파파야, 야자, 파슬리, 파스닙(parsnip), 콩, 복숭아, 땅콩, 배, 피트(peat), 후추, 감, 나무콩, 소나무, 파인애플, 플랜테인(plantain), 자두, 석류, 감자, 호박, 라디키오(radicchio), 무, 유채, 라스베리, 벼, 호밀, 수수, 홍화, 갯버들, 대두, 시금치, 가문비 나무, 호박, 딸기, 사탕무, 사탕수수, 해바라기, 고구마, 스위트콘, 귤, 녹차, 담배, 토마토, 나무, 라이밀(triticale), 잔디풀(turf grass), 순무, 포도나무, 호두, 물냉이, 수박, 밀, 참마(yam), 주목나무, 및 주키니를 포함하는 것으로 의도된다. 용어, 식물은 뿌리, 잎 및 고등 식물을 특징짓는 다른 기관의 결여에 의해서 주로 일차적으로 연합된 광독립영양생물인, 조류를 또한 포함한다.
본 명세서에 기재된 RNA-표적화RNA-표적화 시스템을 이용하는 유전자 발현 조절 방법은 원하는 특성을 본질적으로 임의의 식물에 부여하는 데 사용될 수 있다. 광범위한 종류의 식물 및 식물 세포 시스템은, 본 개시 내용의 핵산 작제물 및 상기 언급된 다양한 형질전환 방법을 이용하여 본 명세서에 기재된 원하는 생리학적 및 작물학적 특징들을 위해, 설계 제작될 수 있다. 바람직한 구현예에서, 설계 제작을 위한 표적 식물 및 식물 세포로는, 이에 한정되지 않지만, 단자엽성 및 쌍자엽성 식물이 포함되며, 예를 들어 곡물 작물(예를 들어, 밀, 메이즈, 벼, 기장, 보리), 과실 작물(예를 들어, 토마토, 사과, 배, 딸기, 오렌지), 사료 작물(예를 들어, 알팔파), 뿌리 채소 작물(예를 들어, 당근, 감자, 사탕무, 참마), 옆채류 작물(예를 들어, 상추, 시금치)을 포함하는 작물; 화훼 식물(예를 들어, 페튜니아, 장미, 국화), 침엽수 및 소나무(예를 들어, 소나무, 전나무, 가문비나무); 식물환경복원에 사용되는 식물(예를 들어, 중금속 축적 식물); 기름 작물(예를 들어, 해바라기, 유채씨) 및 실험용 목적으로 사용되는 식물(예를 들어, 아라비돕시스)이 포함된다. 따라서, 방법 및 CRISPR-Cas 시스템은 광범위한 식물, 예를 들어 다음 목에 속하는 쌍자엽 식물과 같은 식물: 마그니오랄레스(Magniolales), 일리시알레스(Illiciales), 녹나무목(Laurales), 후추목(Piperales), 아리스토키알레스(Aristochiales), 수련목(Nymphaeales), 미나리아재비목(Ranunculales), 파프베랄레스(Papeverales), 사라세니아세(Sarraceniaceae), 트로코덴드랄레스(Trochodendrales), 하마멜리달레스(Hamamelidales), 유코미알레스(Eucomiales), 레이트네리알레스(Leitneriales), 마이리칼레스(Myricales), 참나무목(Fagales), 카수아리날레스(Casuarinales), 석죽목(Caryophyllales), 바탈레스(Batales), 마디풀목(Polygonales), 갯질경이목(Plumbaginales), 오이과목(Dilleniales), 테알레스(Theales), 아욱목(Malvales), 쐐기풀목(Urticales), 오예목(Lecythidales), 제비꽃목(Violales), 버드나무목(Salicales), 십자화목(Capparales), 진달래목(Ericales), 디아펜살레스(Diapensales), 에베날레스(Ebenales), 앵초목(Primulales), 장미목(Rosales), 콩목(Fabales), 포도스테말레스(Podostemales), 할로라갈레스(Haloragales), 도금양목(Myrtales), 층층나무목(Cornales), 프로테아목(Proteales), 산 탈레스(San tales), 라플레시알레스(Rafflesiales), 노박덩굴목(Celastrales), 대극목(Euphorbiales), 갈매나무목(Rhamnales), 무환자나무목(Sapindales), 저그란달레스(Juglandales), 쥐손이풀목(Geraniales), 원지목(Polygalales), 움벨랄레스(Umbellales), 용담목(Gentianales), 꽃고비목(Polemoniales), 꿀풀목(Lamiales), 질경이목(Plantaginales), 현삼목(Scrophulariales), 초롱꽃목(Campanulales), 꼭두서니목(Rubiales), 산토끼꽃목(Dipsacales), 및 국화목(Asterales) 에 걸쳐 사용될 수 있으며; 방법 및 CRISPR-Cas 시스템은 다음 목에 속하는 것과 같은 단자엽 식물: 택사목(Alismatales), 자러폰목(Hydrocharitales), 나자달레스(Najadales), 트리우리달레스(Triuridales), 닭의장풀목(Commelinales), 에리오카우랄레스(Eriocaulales), 레스티오날레스(Restionales), 벼목(Poales), 준칼레스(Juncales), 사초목(Cyperales), 타이팔레스(Typhales), 브로멜리알레스(Bromeliales), 생강목(Zingiberales), 아레칼레스(Arecales), 사이클란탈레스(Cyclanthales), 판다너스목(Pandanales), 천남성목(Arales), 릴리알레스(Lilliales), 및 난목(Orchid ales), 또는 겉씨식물문(Gymnospermae)에 속하는 식물, 예를 들어 구과목(Pinales), 은행목(Ginkgoales), 소철목(Cycadales), 아라우카리알레스(Araucariales), 쿠페르살레스(Cupressales) 및 네탈레스(Gnetales) 목에 속하는 것들을 이용하여 사용될 수 있다.
본 명세서에 기재된 RNA-표적화RNA-표적화 CRISPR 시스템 및 사용 방법은 다음의 쌍자엽, 단자엽 또는 겉씨식물속의 비-제한적인 리스트에 포함되는 광범위한 식물 종에 걸쳐 사용될 수 있다: 아트로파(Atropa), 알세오다프네(Alseodaphne), 아나카디움(Anacardium), 땅콩속(Arachis), 베일스미에디아(Beilschmiedia), 배추속(Brassica), 카르타무스(Carthamus), 댕댕이덩굴속(Cocculus), 파두속(Croton), 오이속(Cucumis), 감귤속(Citrus), 수박속(Citrullus), 고추속(Capsicum), 카사란터스(Catharanthus), 코코스(Cocos), 커피나무속(Coffea), 호박속(Cucurbita), 당근속(Daucus), 두그에티아(Duguetia), 에쉬솔지아(Eschscholzia), 피쿠스속(Ficus), 딸기속(Fragaria), 글라우시움(Glaucium), 글리신(Glycine), 고시피움(Gossypium), 해바라기속(Helianthus), 히비어(Hevea), 사리풀속(Hyoscyamus), 상추속(Lactuca), 란돌피아(Landolphia), 아마속(Linum), 릿시(Litsea), 토마토속(Lycopersicon), 루피너스(Lupinus), 마니호트(Manihot), 마요라나(Majorana), 말루스(Malus), 개자리속(Medicago), 담배속(Nicotiana), 올리아(Olea), 파르테늄(Parthenium), 양귀비속(Papaver), 페르세아(Persea), 파세올루스(Phaseolus), 피스타시아(Pistacia), 피섬(Pisum), 파이루스(Pyrus), 살구속(Prunus), 라파누스(Raphanus), 피마자속(Ricinus), 세네시오(Senecio), 방기속(Sinomenium), 스테파니아(Stephania), 시나피스(Sinapis), 가지속(Solanum), 테오브로마(Theobroma), 트리폴리움(Trifolium), 트리고넬라(Trigonella), 나비나물속(Vicia), 빙카속(Vinca), 빌리스(Vilis), 및 비냐(Vigna); 및 파속(Allium), 쇠풀속(Andropogon), 아라그로스티스(Aragrostis), 아스파라거스(Asparagus), 아베나속(Avena), 시노돈(Cynodon), 엘라에이스(Elaeis), 페스투카(Festuca), 페스툴로리움(Festulolium), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 렘나(Lemna), 롤리움(Lolium), 무사(Musa), 벼속(Oryza), 수수속(Panicum), 파네세툼(Pannesetum), 플레움(Phleum), 포아(Poa), 세칼레(Secale), 소검(Sorghum), 트리티쿰(Triticum), 옥수수속(Zea), 침엽수속(Abies), 컨닝하미아(Cunninghamia), 마황속(Ephedra), 가문비나무속(Picea), 피누스(Pinus), 및 미송속(Pseudotsuga)의 속.
RNA 표적화 CRISPR 시스템 및 사용 방법은 광범위한 범위의 "조류" 또는 "조류 세포"에 걸쳐 사용될 수도 있으며; 예를 들어, 홍조 식물(홍조류), 녹조 식물(녹조류), 갈조 식물(갈조류), 규조 식물(규조류), 유스티그마토파이타(Eustigmatophyta) 및 와편모조류를 포함하는 몇몇 진핵성 문 뿐만 아니라 원핵성 남조문(남조류)으로부터 선택된 조류를 포함한다. 용어 "조류"는 예를 들어 다음으로부터 선택된 조류를 포함한다: 암포라(Amphora), 아나베나(Anabaena), 아닉스트로데스미스(Anikstrodesmis), 보트리오코커스(Botryococcus), 센털돌말속(Chaetoceros), 클라미도모나스(Chlamydomonas), 클로렐라(Chlorella), 클로로코쿰(Chlorococcum), 시클로텔라(Cyclotella), 실린드로테카(Cylindrotheca), 두날리엘라(Dunaliella), 에밀리아나(Emiliana), 유글레나(Euglena), 헤마토코쿠스(Hematococcus), 이소크리시스(Isochrysis), 모노크리시스(Monochrysis), 모노라피디움(Monoraphidium), 나노클로리스(Nannochloris), 나노클로롭시스(Nannnochloropsis), 나비쿨라(Navicula), 네프로클로리스(Nephrochloris), 네프로셀미스(Nephroselmis), 니트치아(Nitzschia), 노듈리아(Nodularia), 노스톡(Nostoc), 오오크로모나스(Oochromonas), 오오시스티스(Oocystis), 오실라토리아(Oscillartoria), 파블로바(Pavlova), 페오닥틸럼(Phaeodactylum), 플레이토모나스(Playtmonas), 플웨로크리시스(Pleurochrysis), 포르히라(Porhyra), 슈도아나바에나(Pseudoanabaena), 피라미모나스(Pyramimonas), 스티코코커스(Stichococcus), 시네코코커스(Synechococcus), 시네코시스티스(Synechocystis), 테트라셀미스(Tetraselmis), 탈라시오시라(Thalassiosira), 및 트리코데스뮴(Trichodesmium).
식물의 부분, 즉 "식물 조직"은 본 발명의 방법에 따라 처리되어 개선된 식물을 생산할 수 있다. 식물 조직은 또한 식물 세포를 포함한다. 본 명세서에서 사용된 용어 "식물 세포"는, 온전한 전체 식물 상태로의, 또는 성장 배지 또는 완충액 내 현탁 상태의, 배지 또는 한천 상에서의 시험관내 조직 배양에서 성장한 단리된 형태 상태로의, 또는 예를 들어 식물 조직, 식물 기관 또는 전체 식물과 같은 고도의 조직화된 단위의 일부로서 중 어느 하나의 살아있는 식물의 개별 단위를 지칭한다.
"원형질체"는 예를 들어 기계적 또는 효소적 수단을 이용하여 그의 보호성 세포벽이 완전히 또는 부분적으로 제거된 식물 세포를 지칭하며, 적절한 성장 조건 하에서 그의 세포벽을 재형성하고, 증식 및 재생하여 전체 식물로 성장할 수 있는, 살아있는 식물의 온전한 생화학적 컴피턴트 단위를 초래한다.
용어 "형질전환"은 식물 숙주가 아그로박테리아 또는 다양한 화학적 또는 물리적 방법 중 하나를 이용하여 DNA의 도입에 의해 유전적으로 변형되도록 하는 공정을 대체로 지칭한다. 본 명세서에 사용된 용어 "식물 숙주"는 식물의 임의의 세포, 조직, 기관 또는 자손을 포함하는 식물을 지칭한다. 많은 적합한 식물 조직 또는 식물 세포가 형질전환될 수 있으며, 이에 한정되지 않지만, 원형질체, 체세포배(somatic embryo), 화분, 잎, 묘목, 줄기, 가피(calli), 기는 줄기(stolon), 미소괴경, 및 싹을 포함할 수 있다. 식물 조직은 또한 유성으로 생성되든 또는 무성으로 생성되든, 이러한 식물, 종자, 자손, 번식체의 임의의 클론, 및 절단물 또는 종자와 같은 이들 중 임의의 후손을 지칭한다.
본 명세서에 사용된 용어 "형질전환된"은, 외래 DNA 분자, 예를 들어 작제물이 그 안으로 도입된 세포, 조직, 기관 또는 생물을 지칭한다. 도입된 DNA 분자는 수령 세포, 조직, 기관 또는 생물의 게놈 DNA 내로 통합될 수 있어서, 도입된 DNA 분자가 이후의 자손에게 전달되도록 한다. 이들 구현예에서, "형질전환된" 또는 "유전자 도입된" 세포 또는 식물은, 세포 또는 식물의 자손, 및 교배에서 부모로서 이러한 형질전환된 식물을 이용하고 도입된 DNA분자의 존재로부터 초래되는 변경된 표현형을 나타내는 육종 프로그램으로부터 생산된 자손을 또한 포함할 수 있다. 바람직하게는, 유전자 도입 식물은 생식력이 있으며, 유성 생식을 통하여 도입된 DNA를 자손에게 전달할 수 있다.
용어 "자손", 예를 들어 유전자 도입 식물의 자손은, 식물 또는 유전자 도입된 식물로부터 태어난, 얻은, 또는 유래된 것이다. 도입된 DNA 분자는 수령 세포 내로 일시적으로 도입되어 도입된 DNA 분자가 이후의 자손에 의해 유전되지 않을 수 있고 따라서 "유전자 도입된"이라고 여겨지지 않는다. 이에 따라, 본 명세서에서 사용된, "비-유전자 도입" 식물 또는 식물 세포는 그의 게놈 내로 안정하게 통합된 외래 DNA를 함유하지 않는 식물이다.
본 명세서에 사용된 용어 "식물 프로모터"는 그의 기원이 식물 세포이든 아니든, 식물 세포에서 전사를 개시할 수 있는 프로모터이다. 예시적인 적합한 식물 프로모터로는, 이에 한정되지 않지만, 식물, 식물 바이러스, 및 박테리아, 예를 들어 식물 세포에서 발현되는 유전자를 포함하는 아그로박테리움 또는 리조비움으로부터 수득되는 것들이 포함된다.
본 명세서에 사용된 "균류 세포"는 균류 계 내에서 임의의 유형의 진핵 세포를 지칭한다. 균류 계 내의 문(phyla)은 자낭균류(Ascomycota), 담자균류(Basidiomycota), 블라스토클라디아균류(Blastocladiomycota), 호상균류(Chytridiomycota), 글로메로균류(Glomeromycota), 미포자충(Microsporidia) 및 네오칼리마스트릭스균류(Neocallimastigomycota)를 포함한다. 균류 세포는 효모, 곰팡이, 및 사상 균류를 포함할 수 있다. 일부 구현예에서, 균류 세포는 효모 세포이다.
본 명세서에 사용된 용어 "효모 세포"는 자낭균류 및 담자균류 문 내의 임의의 균류 세포를 지칭한다. 효모 세포는 출아 효모 세포, 분열 효모 세포, 및 곰팡이 세포를 포함할 수 있다. 이들 생물에 제한되지 않으면서, 실험실 및 산업적 환경에서 사용되는 많은 유형의 효모는 자낭균문의 일부이다. 일부 구현예에서, 효모 세포는 에스. 세레비시에(S. cerervisiae), 클루이베로마이세스 마르시아누스(Kluyveromyces marxianus), 또는 이삿첸키아 오리엔탈리스(Issatchenkia orientalis) 세포이다. 다른 효모 세포는 제한 없이, 칸디다 종(예를 들어, 칸디다 알비칸스(Candida albicans)), 야로이아 종(예를 들어, 야로이아 리폴리티카(Yarrowia lipolytica)), 피키아 종(예를 들어, 피키아 파스토리스(Pichia pastoris)), 클루이베로마이세스 종(예를 들어, 클루이베로마이세스 락티스(Kluyveromyces lactis) 및 클루이베로마이세스 마르시아누스), 뉴로스포라 종(예를 들어, 뉴로스포라 크라사(Neurospora crassa)), 푸사리움 종(예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum)), 및 이삿첸키아 종(예를 들어, 이삿첸키아 오리엔탈리스, a.k.a. 피키아 쿠드리아바제빌(Pichia kudriavzevii) 및 칸디다 아시도테르모필룸(Candida acidothermophilum))을 포함할 수 있다. 일부 구현예에서, 균류 세포는 사상 균류 세포이다. 본 명세서에 사용된 용어 "사상 균류 세포"는 실 모양으로 자라는 임의의 유형의 균류 세포, 즉, 균사 또는 균사체를 지칭한다. 사상 균류 세포의 예로는 제한 없이 누룩곰팡이 종(Aspergillus spp.)(예를 들어, 아스페르길루스 나이거(Aspergillus niger)), 트리코더마 종(Trichoderma spp.)(예를 들어, 트리코더마 리세이(Trichoderma reesei)), 리조푸스 종(Rhizopus spp.)(예를 들어, 리조푸스 오리재(Rhizopus oryzae)), 및 모르티에렐라 종(Mortierella spp.)(예를 들어, 모르티에렐라 이사벨리나)가 포함될 수 있다.
일부 구현예에서, 균류 세포는 산업용 균주이다. 본 명세서에서 사용된 "산업용 균주"는 산업적 공정, 예를 들어 상업적 또는 산업적 규모에서의 생산물의 생산에 사용되거나 그로부터 단리된 균주 세포의 임의의 균주를 지칭한다. 산업용 균주는 산업적 공정에서 전형적으로 사용되는 균류 종을 지칭할 수 있거나, 비-산업적 목적에도 사용될 수 있는(예를 들어, 실험실 연구) 균류 종의 단리물을 지칭할 수 있다. 산업적 공정의 예로는 (예를 들어, 식품 또는 음료 제품의 생산에서의) 발효, 증류, 바이오연료 생산, 화합물의 생산 및 폴리펩티드의 생산이 포함될 수 있다. 산업용 균주의 예는 제한 없이, JAY270 및 ATCC4124를 포함할 수 있다.
일부 구현예에서, 균류 세포는 배수체 세포이다. 본 명세서에서 사용된 "배수체" 세포는 그의 게놈이 하나 초과의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 배수체 세포는 천연적으로 배수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 배수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다(예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 배수체 세포는 그의 전체 게놈이 배수체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 배수체인 세포를 지칭할 수 있다. 이론에 얽매이기 원하지 않지만, 가이드RNA의 풍부는 반수체 세포에서보다 배수체 세포의 게놈 설계 제작에서 더욱 종종 속도-제한 성분일 수 있으며, 이에 따라 본 명세서에 기재된 C2c2 CRISPR 시스템을 사용하는 방법은 특정 균류 세포 유형 사용을 활용할 수 있는 것으로 생각된다.
일부 구현예에서, 균류 세포는 이배체 세포이다. 본 명세서에서 사용된 "이배체" 세포는 그의 게놈이 2 개의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 이배체 세포는 천연적으로 이배체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 이배체 상태로 존재하도록 유도된 세포를 지칭할 수 있다(예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 예를 들어, 에스. 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 이배체 세포는 그의 전체 게놈이 이배체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 이배체인 세포를 지칭할 수 있다. 일부 구현예에서, 균류 세포는 반수체 세포이다. 본 명세서에서 사용된 "반수체" 세포는 그의 게놈이 하나의 카피로 존재하는 임의의 세포를 지칭할 수 있다. 반수체 세포는 천연적으로 반수체 상태로 발견되는 세포의 유형을 지칭할 수 있거나, 반수체 상태로 존재하도록 유도된 세포를 지칭할 수 있다 (예를 들어, 특이적 조절, 변경, 비활성화, 활성화, 또는 감수분열, 세포질 분열, 또는 DNA 복제의 변형을 통해). 예를 들어, 에스. 세레비시에 균주 S228C는 반수체 또는 이배체 상태로 유지될 수 있다. 반수체 세포는 그의 전체 게놈이 반수체인 세포를 지칭할 수 있거나, 구체적인 관심 게놈 유전자좌에서 반수체인 세포를 지칭할 수 있다.
본 명세서에서 사용된 "효모 발현 벡터"는 RNA 및/또는 폴리펩타이드를 인코딩하는 하나 이상의 서열을 함유하는 핵산을 지칭하며, 핵산(들)의 발현을 제어하는 임의의 원하는 요소뿐만 아니라, 효모 세포 내부에서의 발현 벡터의 복제 및 유지를 가능하게 하는 임의의 요소를 추가로 함유할 수 있다. 많은 적합한 효모 발현 벡터 및 그의 특징은 당업계에 알려져 있다; 예를 들어, 다양한 벡터 및 기법이 문헌[Yeast Protocols, 2nd edition, Xiao, W., ed. (Humana Press, New York, 2007)] 및 문헌[Buckholz, R.G. and Gleeson, M.A. (1991) Biotechnology (NY) 9(11): 1067-72]에 예시되어 있다. 효모 벡터는 제한 없이, 동원체(CEN) 서열, 자율 복제 서열(ARS), 프로모터, 예를 들어, 관심 서열 또는 유전자에 작동 가능하게 연결된, RNA 폴리메라제 III 프로모터, RNA 폴라머라제 III 터미네이터와 같은 터미네이터, 복제 기원, 및 마커 유전자(예를 들어, 영양요구성, 항생제, 또는 다른 선택가능한 마커)를 함유할 수 있다. 효모에서의 이용을 위한 발현 벡터의 예로는, 플라스미드, 효모 인공 염색체, 2μ 플라스미드, 효모 통합성 플라스미드, 효모 복제성 플라스미드, 셔틀 벡터, 및 에피솜 플라스미드가 포함될 수 있다.
식물 및 식물 세포의 게놈 내에서의 RNA 표적화 CRISPR 시스템 성분의 안정한 통합
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 인코딩하는 폴리뉴클레오티드가 식물 세포의 게놈 내로 안정한 통합을 위해 도입되는 것이 예상된다. 이들 구현예에서, 형질전환 벡터 또는 발현 시스템의 설계는, 가이드 RNA 및/또는 RNA 표적화 유전자(들)가 언제, 어디에서 어떤 조건 하에서 발현되는지에 따라 조정될 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 식물 세포의 게놈 DNA 내로 안정적으로 도입하는 것이 예상된다. 추가적으로 또는 대안적으로, RNA 표적화 CRISPR 시스템의 성분을 식물 세포소기관, 예를 들어 이에 한정되지 않지만, 색소체, 미토콘드리아 또는 엽록체의 DNA 내로 안정한 통합을 위하여 도입하는 것이 예상된다.
식물 세포의 게놈 내로의 안정한 통합을 위한 발현 시스템은 하나 이상의 다음 요소를 함유할 수 있다: 가이드 RNA 및/또는 RNA 표적화 효소를 식물 세포에서 발현하는 데 사용될 수 있는 프로모터 요소; 발현을 향상시키는 5' 비번역 영역; 특정 세포, 예를 들어 단자엽 세포 내 발현을 추가로 향상시키는 인트론 요소; 가이드 RNA 및/또는 RNA 표적화 유전자 서열 및 다른 원하는 요소를 하나 이상 삽입하기 위하여 편리한 제한 부위를 제공하는 다중-클로닝 부위; 및 발현된 전사물의 효율적인 종결을 제공하는 3' 비번역 영역.
발현 시스템의 요소는 플라스미드 또는 형질전환 벡터와 같은 원형, 또는 선형 이중 가닥 DNA와 같은 비-원형 중 어느 하나인 하나 이상의 발현 작제물 상에 있을 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 발현 시스템은 적어도 다음을 포함하며:
(a) 식물에서 표적 서열과 혼성화하는 가이드 RNA(gRNA)를 인코딩하는 뉴클레오티드 서열로, 여기서 가이드 RNA는 가이드 서열 및 직접 반복 서열을 포함하는 것, 및
(b) RNA 표적화 단백질을 인코딩하는 뉴클레오티드 서열,
여기서 성분 (a) 또는 (b)는 동일하거나 상이한 작제물 상에 위치되며, 이로 인해 상이한 뉴클레오티드 서열은 식물 세포 내에서 작동 가능한 동일하거나 상이한 조절 요소의 제어 하에 있을 수 있다.
RNA 표적화 CRISPR 시스템의 성분을 함유하는 DNA 작제물(들), 및 적용가능한 경우, 주형 서열은 각종 통상의 기법에 의해 식물, 식물 일부, 또는 식물 세포의 게놈 내로 도입될 수 있다. 공정은 일반적으로 적합한 숙주 세포 또는 숙주 조직을 선택하는 단계, 작제물(들)을 숙주 세포 또는 숙주 조직 내로 도입하는 단계, 및 식물 세포 또는 그로부터의 식물을 재생하는 단계를 포함한다.
구체적인 구현예에서, DNA 작제물은, 이에 한정되지 않지만, 식물 세포 원형질체의 전기천공, 미세주입, 에어로졸 빔 주사와 같은 기법을 이용하여 식물 세포 내로 도입될 수 있거나, DNA 작제물은 DNA 유전자 총(particle bombardment)과 같은 바이오리스틱 방법을 이용하여 식물 조직에 직접 도입될 수 있다(문헌[Fu et al., Transgenic Res. 2000 Feb;9(1):11-9] 또한 참고). 유전자 총의 기초는 관심 유전자/들로 코팅된 입자를 세포를 향해 가속화하는 것으로, 이는 입자에 의한 원형질의 침투 및 전형적으로 게놈 내로의 안정한 통합을 초래한다(예를 들어, 문헌[Klein et al, Nature (1987), Klein et al, Bio/Technology (1992), Casas et al, Proc. Natl. Acad. Sci. USA (1993)] 참고).
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 성분을 함유하는 DNA 작제물은 아그로박테리움-매개된 형질전환에 의해 식물 내로 도입될 수 있다. DNA 작제물은 적합한 T-DNA 측면 배치 영역과 조합될 수 있으며, 통상의 아그로박테리움 투메파시엔스 숙주 벡터 내로 도입될 수 있다. 외래 DNA는 식물을 감염시킴으로써 또는 하나 이상의 Ti(종양-유도) 플라스미드를 함유하는, 아그로박테리움 박테리아와 함께 식물 원형질체를 인큐베이션함으로써 식물의 게놈 내로 포함될 수 있다(예를 들어, 문헌[Fraley et al., (1985), Rogers et al., (1987) and U.S. Pat. No. 5,563,055] 참고).
식물 프로모터
식물 세포 내 적절한 발현을 보장하기 위하여, 본 명세서에 기재된 C2c2 CRISPR 시스템의 성분은 전형적으로 식물 프로모터, 즉 식물 세포 내에서 작동 가능한 프로모터의 제어 하에 위치된다. 상이한 유형의 프로모터의 이용이 예상된다.
구조적 식물 프로모터는, 오픈 리딩 프레임(open reading frame)(ORF)을 발현할 수 있는 프로모터로, 이는 식물의 모든 또는 거의 모든 발생 단계 동안, 모든 또는 거의 모든 식물 조직에서 제어한다("구조적 발현"으로 지칭됨). 구조적 프로모터의 비-제한적인 일 예는 콜리플라워 모자이크 바이러스 35S 프로모터이다. 본 발명은 RNA 서열을 변형하는 방법을 예상하고 또한 이와 같이 식물 생분자의 발현을 조절하는 것을 예상한다. 따라서 본 발명의 구체적인 구현예에서 조절될 수 있는 프로모터의 제어 하에 하나 이상의 RNA 표적화 CRISPR 시스템 요소를 위치시키는 것이 유리하다. "조절되는 프로모터"는 구조적으로가 아닌, 시간적으로- 및/또는 공간적으로-조절되는 방식으로 유전자 발현을 지시하는 프로모터를 지칭하며, 조직-특이적, 조직-선호된 및 유도성 프로모터를 포함한다. 상이한 프로모터는 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있다. 구체적인 구현예에서, 하나 이상의 RNA 표적화 CRISPR 성분은 구조적 프로모터, 예를 들어 콜리플라워 모자이크 바이러스 35S 프로모터의 제어 하에 발현된다. 조직-선호된 프로모터는 구체적인 식물 조직 내의 특정 세포 유형 내, 예를 들어, 잎 또는 뿌리 내의 맥관 세포 또는 종자의 특정 세포 내에서의 향상된 발현을 표적화하는 데 활용될 수 있다. RNA 표적화 CRISPR 시스템에서의 이용을 위한 구체적인 프로모터의 예는 문헌[Kawamata et al., (1997) Plant Cell Physiol 38:792-803]; 문헌[Yamamoto et al., (1997) Plant J 12:255-65]; 문헌[Hire et al, (1992) Plant Mol Biol 20:207-18], 문헌[Kuster et al, (1995) Plant Mol Biol 29:759-72], 및 문헌[Capana et al., (1994) Plant Mol Biol 25:681-91]에서 발견된다.
유도성이며 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 하는 프로모터의 예는 에너지의 형태를 이용할 수 있다. 에너지의 형태는 이에 한정되지 않지만, 소리 에너지, 전자기 방사, 화학 에너지 및/또는 열 에너지를 포함할 수 있다. 유도성 시스템의 예로는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA, 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬), 예를 들어 서열-특이적 방식으로 전사 활성에서의 변화를 지시하는 광 유도성 전사 이펙터(LITE)가 포함된다. 광 유도성 시스템의 성분은 RNA 표적화 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 애기장대 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 그의 사용 방법의 추가적인 예는 US 61/736465 및 US 61/721,283에 제공되며, 이들은 그 전체로 본 명세서에 참조로서 포함된다.
구체적인 구현예에서, 일시적 또는 유도성 발현은 예를 들어, 화학물질-조절되는 프로모터를 이용함으로써 달성될 수 있으며, 즉 이에 의해 외인성 화학물질의 적용이 유전자 발현을 유도한다. 유전자 발현의 조절은 화학물질-억제성 프로모터에 의해 수득될 수도 있으며, 여기서 화학물질의 적용은 유전자 발현을 억제한다. 화학물질-유도성 프로모터는, 이에 한정되지 않지만, 벤젠 술폰아미드 제초제 약해경감제에 의해 활성화되는, 메이즈 ln2-2 프로모터(문헌[De Veylder et al., (1997) Plant Cell Physiol 38:568-77]), 발아 전 제초제로서 사용된 소수성 친전자성 화합물에 의해 활성화되는, 메이즈 GST 프로모터(GST-ll-27, WO93/01294), 및 살리실산에 의해 활성화되는 담배 PR-1 프로모터(문헌[Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7])를 포함한다. 항생제에 의해 조절되는 프로모터, 예를 들어 테트라사이클린-유도성 및 테트라사이클린-억제성 프로모터(문헌[Gatz et al., (1991) Mol Gen Genet 227:229-37]; 미국 특허 5,814,618 및 5,789,156) 또한 본 명세서에서 사용될 수 있다.
특정 식물 세포소기관으로의 전위 및/또는 그에서의 발현
발현 시스템은 특정 식물 세포소기관으로의 전위 및/또는 식물 세포소기관에서의 발현을 위한 요소를 포함할 수 있다.
엽록체 표적화
구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 엽록체 유전자의 발현 및/또는 번역을 특이적으로 변형시키거나, 엽록체에서의 발현을 보장하는 데 사용되는 것으로 예상된다. 이 목적을 위해, 엽록체 형질전환 방법 또는 RNA 표적화 CRISPR 성분의 엽록체로의 구획화를 이용한다. 예를 들어, 색소체 게놈 내 유전적 변형의 도입은 화분을 통한 유전자 흐름과 같은 생물안전성 문제를 감소시킬 수 있다.
엽록체 형질전환 방법은 당업계에 알려져 있으며 유전자 총, PEG 처리, 및 미세주입을 포함한다. 추가적으로, 형질전환 카세트의 핵 게놈으로부터 색소체로의 전위를 수반하는 방법이 WO2010061186에 기재된 바와 같이 사용될 수 있다.
대안적으로, 하나 이상의 RNA 표적화 CRISPR 성분을 식물 엽록체로 표적화하는 것이 예상된다. 이는 발현 작제물 내로, RNA 표적화 단백질을 인코딩하는 서열의 5' 영역에 작동 가능하게 연결된, 엽록체 수송 펩티드(CTP) 또는 색소체 수송 펩티드를 인코딩하는 서열을 포함시킴으로써 달성된다. CTP는 엽록체 내로의 전위 동안 가공 단계에서 제거된다. 발현된 단백질의 엽록체 표적화는 당업자에게 잘 알려져 있(예를 들어, 문헌[Protein Transport into Chloroplasts, 2010, Annual Review of Plant Biology,Vol. 61: 157-180] 참고). 이러한 구현예에서, 하나 이상의 가이드 RNA를 식물 엽록체로 표적화하는 것이 또한 바람직하다. 엽록체 국소화 서열을 이용하여 가이드 RNA를 엽록체 내로 전위하는 데 사용될 수 있는 방법 및 작제물이 예를 들어 US20040142476에 기재되어 있으며, 이는 본 명세서에 참조로서 포함된다. 작제물의 이러한 변형은 본 발명의 발현 시스템 내로 포함되어 RNA 표적화-가이드 RNA를 효율적으로 전위시킬 수 있다.
CRISPR-RNA 표적화 시스템을 인코딩하는 폴리뉴클레오티드의 조류 세포 내 도입.
유전자 도입 조류(또는 유채와 같은 다른 식물)는 식물성 기름 또는 바이오연료, 예를 들어 알콜(특히 메탄올 및 에탄올), 또는 다른 생산물의 생산에서 특히 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
US8945839는 Cas9를 이용하여 미세-조류(클라미도모나스 레인하티(Chlamydomonas reinhardtii) 세포) 종)을 설계 제작하는 방법을 기재한다. 유사한 도구를 사용하여, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템의 방법은 클라미도모나스 종 및 다른 조류 상에 적용될 수 있다. 구체적인 구현예에서, RNA 표적화 단백질 및 가이드 RNA(들)는 Hsp70A-Rbc S2 또는 Beta2-튜불린과 같은 구조적 프로모터의 제어 하에서 RNA 표적화 단백질을 발현하는 벡터를 사용하여 발현되는 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 선택적으로 전달된다. 대안적으로, RNA 표적화 mRNA 및 시험관내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 GeneArt 클라미도모나스 설계 제작 키트로부터 권장된 표준 프로토콜과 같이, 당업자에게 이용 가능하다.
RNA 표적화 성분을 인코딩하는 폴리뉴클레오티드의 효소 세포 내 도입
구체적인 구현예에서, 본 발명은 효모 세포에서의 RNA 편집을 위한 RNA 표적화 CRISPR 시스템의 이용에 관한 것이다. RNA 표적화 CRISPR 시스템 성분을 인코딩하는 폴리뉴클레오티드를 도입하는 데 사용될 수 있는 효모 세포를 형질전환하는 방법은 당업자에게 잘 알려져 있으며, 문헌[Kawai et al., 2010, Bioeng Bugs. 2010 Nov-Dec; 1(6): 395-403)]에 의해 검토되어 있다. 비-제한적인 예로는 리튬 아세테이트 처리(이는 캐리어 DNA 및 PEG 처리를 추가로 포함할 수 있음), 유전자 총 또는 전기천공에 의한 효모 세포의 형질전환이 포함된다.
식물 및 식물 세포 내에서의 RNA 표적화 CRISP 시스템 성분의 일시적 발현
구체적인 구현예에서, 가이드 RNA 및/또는 RNA 표적화 유전자는 식물 세포 내에서 일시적으로 발현되는 것이 예상된다. 이들 구현예에서, RNA 표적화 CRISPR 시스템은, 가이드 RNA 및 RNA 표적화 단백질 모두가 세포 내에 존재하는 때에만 RNA 표적 분자의 변형을 보장할 수 있어서, 게놈 발현이 추가로 제어될 수 있다. RNA 표적화 효소의 발현이 일시적이므로, 이러한 식물 세포로부터 생성된 식물은 전형적으로 외래 DNA를 함유하지 않는다. 구체적인 구현예에서 RNA 표적화 효소는 식물 세포에 의해 안정하게 발현되고 가이드 서열이 일시적으로 발현된다.
구체적으로 선호되는 구현예에서, RNA 표적화 CRISPR 시스템 성분은 식물 바이러스 벡터를 사용하여 식물 세포 내로 도입될 수 있다(문헌[Scholthof et al. 1996, Annu Rev Phytopathol. 1996;34:299-323]). 추가의 구체적인 구현예에서, 상기 바이러스 벡터는 DNA 바이러스 유래의 벡터이다. 예를 들어, 제미니바이러스(예를 들어, 양배추 잎말림 바이러스, 콩 황색 왜소 바이러스, 밀 왜소 바이러스, 토마토 잎말림 바이러스, 메이즈 줄무늬병 바이러스, 담배 잎말림 바이러스, 또는 토마토 골든 모자이크 바이러스) 또는 나노바이러스(예를 들어, 누에콩 괴사성 황색 바이러스). 다른 구체적인 구현예에서, 상기 바이러스 벡터는 RNA 바이러스 유래의 벡터이다. 예를 들어, 토브라바이러스(tobravirus)(예를 들어, 담배 얼룩 바이러스, 담배 모자이크 바이러스), 포텍스바이러스(potexvirus)(예를 들어, 감자 바이러스 X), 또는 호르데이바이러스(hordeivirus)(예를 들어, 보리 반엽 모자이크 바이러스). 식물 바이러스의 복제 게놈은 비-통합성 벡터이고, 이는 GMO 식물의 생산을 피한다는 맥락에서 관심 대상이다.
구체적인 구현예에서, RNA 표적화 CRISPR 작제물의 일시적 발현에 사용되는 벡터는 예를 들어 pEAQ 벡터이고, 이는 원형질체 내에서 아그로박테리움-매개 일시적 발현을 위해 조정된다(문헌[Sainsbury F. et al., Plant Biotechnol J. 2009 Sep;7(7):682-93]). 게놈 위치의 정확한 표적화는, CRISPR 효소를 발현하는 안정한 유전자 도입 식물에서 gRNA를 발현하는 변형된 양배추 잎말림 바이러스(CaLCuV) 벡터를 이용하여 입증되었다(Scientific Reports 5, Article number: 14926 (2015), doi:10.1038/srep14926).
구체적인 구현예에서, 가이드 RNA 및/또는 RNA 표적화 유전자를 인코딩하는 이중-가닥 DNA 단편은 식물 세포 내로 일시적으로 도입될 수 있다. 이러한 구현예에서, 도입된 이중-가닥 DNA 단편은 세포 내 RNA 분자(들)를 변형하기에는 충분한 양으로 제공되지만, 고려된 기간이 지나거나 1 회 이상의 세포 분열 후에는 지속되지 않는다. 식물에서의 직접 DNA 전달 방법은 당업자에 의해 알려져 있다(예를 들어, 문헌[Davey et al. Plant Mol Biol. 1989 Sep;13(3):273-85] 참고).
다른 구현예에서, RNA 표적화 단백질을 인코딩하는 RNA 폴리뉴클레오티드는 식물 세포 내로 도입되고, 이는 이후 숙주 세포에 의해 번역되고 가공되어(적어도 하나의 가이드 RNA 존재 하에서) RNA 분자(들) 세포를 변형시키기에 충분한 양의 단백질을 생성하지만 고려된 기간이 지나거나 1 회 이상의 세포 분열 후에는 지속되지 않는다. 일시적 발현을 위하여 mRNA를 식물 원형질체로 도입하는 방법은 당업자에게 알려져 있다(예를 들어, 문헌[Gallie, Plant Cell Reports (1993), 13;119-122] 참고). 상기 기재된 상이한 방법들의 조합이 또한 예상된다.
RNA 표적화 CRISPR 성분의 식물 세포로의 전달
구체적인 구현예에서, RNA 표적화 CRISPR 시스템의 하나 이상의 성분을 식물 세포로 직접적으로 전달하는 것이 관심 대상이다. 이것은, 그중에서도, 비-유전자 도입 식물의 생성을 위해 관심 대상이다(아래 참고). 구체적인 구현예에서, 하나 이상의 RNA 표적화 성분이 식물 또는 식물 세포 외부에서 제조되고 세포로 전달된다. 예를 들어 구체적인 구현예에서, RNA 표적화 단백질은 식물 세포로의 도입 전에 시험관내에서 제조된다. RNA 표적화 단백질은 당업자에게 알려진 다양한 방법에 의해 제조될 수 있으며, 재조합 생산을 포함한다. 발현 후, RNA 표적화 단백질이 단리되고, 필요한 경우 재폴딩되고, 정제되고 선택적으로 임의의 정제 태그, 예를 들어 His-태그를 제거하기 위해 처리된다. 미정제의, 부분적으로 정제된, 또는 더욱 완전하게 정제된 RNA 표적화 단백질이 일단 수득되면, 단백질은 식물 세포로 도입될 수 있다.
구체적인 구현예에서, RNA 표적화 단백질은 관심 RNA를 표적화하는 가이드 RNA와 혼합되어 사전-조립된 리보뉴클레오단백질을 형성한다.
개별적인 성분 또는 사전-조립된 리보뉴클레오단백질은 전기 천공을 통해, RNA 표적화-관련된 유전자 산물 코팅된 입자를 이용한 유전자총에 의해, 화학적 형질감염에 의해, 또는 세포막을 통과하여 수송하는 일부 다른 수단에 의해 식물 세포 내로 도입될 수 있다. 예를 들어, 사전-조립된 CRISPR 리보뉴클레오단백질을 이용한 식물 원형질체의 형질감염은 식물 게놈이 표적화된 변형을 보장하는 것으로 입증되었다(문헌[Woo et al. Nature Biotechnology, 2015; DOI: 10.1038/nbt.3389]에 기재된 바와 같음). 이들 방법은 식물에서 RNA 분자의 표적화된 변형을 달성하기 위해 변형될 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템 성분은 나노입자를 사용하여 식물 세포 내로 도입된다. 단백질 또는 핵산으로서, 또는 이의 조합으로 중 어느 하나로, 성분은 나노입자 위에 업로드되거나, 나노입자 내에 패키징되고, 식물에 적용될 수 있다(예를 들어, WO 2008042156 및 US 20130185823에 기재된 것과 같음). 구체적으로, 본 발명의 일 구현예는, WO2015089419에 기재된 바와 같이, RNA 표적화 단백질을 인코딩하는 DNA 분자(들), 가이드 RNA를 인코딩하는 DNA 분자 및/또는 단리된 가이드 RNA로 업로드된 또는 그로 패킹된 나노입자를 포함한다.
RNA 표적화 CRISPR 시스템의 하나 이상의 성분을 식물 세포로 도입하는 추가의 수단은 세포 침투 펩티드(CPP)를 이용하는 것에 의한다. 따라서, 구체적으로 본 발명에서 구현예는 RNA 표적화 단백질에 연결된 세포 침투 펩티드를 포함하는 조성물을 포함한다. 본 발명의 구체적인 구현예에서, RNA 표적화 단백질 및/또는 가이드 RNA(들)는 하나 이상의 CPP에 커플링되어 이들을 식물 원형질체 내부로 효과적으로 수송한다(인간 세포에서의 Cas9에 대한 문헌[Ramakrishna (2014, Genome Res. 2014 Jun;24(6):1020-7)]. 다른 구현예에서, RNA 표적화 유전자 및/또는 가이드 RNA(들)는 식물 원형질체 전달을 위한 하나 이상의 CPP에 커플링되는 하나 이상의 원형 또는 비-원형 DNA 분자(들)에 의해 인코딩된다. 식물 원형질체는 그 후 식물 세포로 그리고 추가로 식물로 재생된다. CPP는 단백질로부터 유래된 또는 수용체 독립적인 방식으로 세포막을 통과하여 생분자를 수송할 수 있는 키메라 서열로부터 유래된, 일반적으로 35 개 미만 아미노산의 짧은 펩티드로서 기재된다. CPP는 양이온 펩티드, 소수성 서열을 갖는 펩티드, 양친매성 펩티드, 프롤린-풍부 및 항균성 서열을 갖는 펩티드, 및 키메라 또는 2부로 구성된 펩티드(Pooga and Langel 2005)일 수 있다. CPP는 생물학적 막을 침투할 수 있고, 그와 같이 다양한 생분자의 세포막을 통과하는 세포질 내로의 이동을 야기하고, 그의 세포내 경로에 따른 수송을 개선시키고, 이에 따라 생분자의 표적과의 상호작용을 촉진한다. CPP의 예로는, 특히: Tat, HIV 제1형에 의해 바이러스 복제에 요구되는 핵 전사 활성화제 단백질, 페네트라틴, 카포시(Kaposi) 섬유아세포 성장 인자(FGF) 신호 펩티드 서열, 인테그린 β3 신호 펩티드 서열; 폴리아르기닌 펩티드 Arg 서열, 구아닌 풍부-분자 수송체, 스위트 애로우(sweet arrow) 펩티드, 등이 포함된다.
식물, 조류 또는 균류 적용을 위해 예상되는 표적 RNA
표적 RNA, 즉 관심 RNA는 본 발명에 의해 표적화될 RNA로서, 표적 RNA상의 관심 표적 부위로의 모집, 및 관심 표적 부위에서의 RNA 표적화 단백질의 결합을 유도한다. 표적 RNA는 임의의 적합한 형태의 RNA 일 수 있다. 이는 일부 구현예에서 mRNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 전달 RNA(tRNA) 또는 리보솜 RNA(rRNA)를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 간섭 RNA(RNAi), 마이크로RNA(miRNA), 마이크로스위치, 마이크로자임, 위성 RNA 및 RNA 바이러스를 포함할 수 있다. 표적 RNA는 식물 세포의 세포질 또는 세포핵 또는 미토콘드리아, 엽록체 또는 색소체와 같은 식물 세포 소기관 내에 위치할 수 있다.
구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 RNA를 절단하거나 그렇지 않으면 RNA 발현을 저해하는 데 사용된다.
RNA 조절을 통한 식물 유전자 발현 조절을 위한 RNA 표적화 CRISPR 시스템의 사용
RNA 표적화 단백질은 또한 RNA 가공의 제어를 통하여 유전자 발현을 표적화하기 위해, 적합한 가이드 RNA와 함께 사용될 수 있다. RNA 가공의 제어는 대안적인 스플라이싱 또는 특정 스플라이스 변이체 또는 이소형을 특이적으로 표적화하는 것을 포함하는, RNA 스플라이싱; 바이러스 복제(구체적으로, 식물 내 바이로이드를 포함하는 식물 바이러스의) 및 tRNA 생합성과 같은 RNA 가공 반응을 포함할 수 있다. 적합한 가이드 RNA와 조합된 RNA 표적화 단백질은 또한 RNA 활성화(RNAa)를 제어하는 데 사용될 수 있다. RNAa는 유전자 발현의 촉진을 유도하므로, 유전자 발현의 제어는 RNAa의 파괴 또는 감소, 이에 따른 유전자 발현의 덜한 촉진을 통하는 방식으로 달성될 수 있다.
본 발명의 RNA 표적화 이펙터 단백질은 식물에서의, 구체적으로 RNA 바이러스에 대한, 항 바이러스 활성을 위해 추가로 사용될 수 있다. 이펙터 단백질은 선택된 바이러스 RNA 서열에 대해 선택적인 적합한 가이드 RNA를 사용하여 바이러스 RNA에 표적화될 수 있다. 구체적으로, 이펙터 단백질은 단일 가닥 RNA와 같은 RNA를 절단하는 활성 뉴클레아제일 수 있다. 따라서, 본 발명의 RNA 표적화 이펙터 단백질의 항 바이러스제로서의 용도가 제공된다. 이 방식으로 중화될 수 있는 바이러스의 예로는 담배 모자이크 바이러스(TMV), 토마토 반점 시듦 바이러스(TSWV), 오이 모자이크 바이러스(CMV), 감자 바이러스 Y(PVY), 콜리플라워 모자이크 바이러스(CaMV)(RT 바이러스), 자두 폭스 바이러스(PPV), 브롬 모자이크 바이러스(BMV) 및 감자 바이러스 X(PVX)가 포함된다.
표적화된 유전자 변형의 대안으로서, 식물, 조류 또는 균류에서 RNA 발현을 조절하는 예가 본 명세서에 추가로 기재되어 있다.
mRNA의 조절되는 절단을 통한 유전자 발현의 조절되는 제어가 구체적인 관심 대상이다. 이것은 본 명세서에 기재된 조절되는 프로모터의 제어 하에 RNA 표적화 요소를 위치시킴으로써 달성될 수 있다.
tRNA 분자의 기능성 획복을 위한 RNA 표적화 CRISPR 시스템의 사용.
Pring 외는 DNA보다 mRNA 서열을 상이한 단백질을 코딩하도록 변경시키는 식물 미토콘드리아 및 엽록체에서의 RNA 편집을 기재하고 있다(문헌[Plant Mol. Biol. (1993) 21 (6): 1163-1170. doi:10.1007/BF00023611]). 본 발명의 구체적인 구현예에서, 미토콘드리아 및 엽록체 mRNA를 특이적으로 표적화하는 RNA 표적화 CRISPR 시스템의 요소는 생체내에서 일어나는 과정을 모방하여 이러한 식물 세포 소기관에서 상이한 단백질을 발현하도록 식물 또는 식물 세포에 도입될 수 있다.
RNA 발현을 저해하는 RNA 간섭에 대한 대안으로서의 RNA 표적화 CRISPR 시스템의 사용.
RNA 표적화 CRISPR 시스템은 RNA 저해 또는 RNA 간섭과 유사한 용도를 가지며, 따라서 이러한 방법으로 대체될 수도 있다. 구체적인 구현예에서, 본 발명의 방법은 예를 들어, 간섭 리보핵산(예를 들어, siRNA 또는 shRNA 또는 dsRNA)에 대한 대체물로서의 RNA 표적화 CRISPR의 사용을 포함한다. 표적화된 유전자 변형의 대안으로서의 식물, 조류 또는 균류에서의 RNA 발현의 저해의 예가 본 명세서에 추가로 기재되어 있다.
RNA 간섭을 제어하기 위한 RNA 표적화 CRISPR 시스템의 사용.
간섭 RNA 또는 miRNA에 대한 제어는 생체내 또는 시험관내에서 간섭 RNA 또는 miRNA의 수명을 감소시킴으로써 그 접근에서 나타나는 표적외 효과(OTE)를 감소시키는 데 도움을 줄 수 있다. 구체적인 구현예에서, 표적 RNA는 간섭 RNA, 즉 shRNA, siRNA 등과 같은 RNA 간섭 경로에 관여하는 RNA를 포함할 수 있다. 다른 구현예에서, 표적 RNA는 마이크로RNA(miRNA) 또는 이중 가닥 RNA(dsRNA)를 포함할 수 있다.
다른 구체적인 구현예에서, RNA 표적화 단백질 및 적합한 가이드 RNA(들)가 선택적으로(예를 들어 조절되는 프로모터, 예를 들어, 조직- 또는 세포주기-특이적 프로모터 및/또는 인핸서의 제어 하에서 공간적 또는 시간적으로) 발현되는 경우 이것은 그 세포에서 RNAi로부터 세포 또는 시스템(생체내 또는 시험관내)을 '보호'하는 데 사용될 수 있다. 이것은 RNAi가 필요하지 않은 이웃 조직이나 세포에서, 또는 이펙터 단백질 및 적절한 가이드가 발현되는 세포 또는 조직과 발현되지 않는 것(즉, 각각 RNAi가 제어되지 않은 것 및 제어되는 것)의 비교의 목적을 위해 유용할 수 있다. RNA 표적화 단백질은 리보자임, 리보솜 또는 리보스위치와 같은 RNA를 포함하거나 RNA로 구성된 분자를 제어하거나 분자에 결합하는 데 사용될 수 있다. 본 발명의 일 구현예에서, 가이드 RNA는 RNA 표적화 단백질을 이들 분자에 모집하여 RNA 표적화 단백질이 이들에 결합할 수 있다.
본 출원은 정보 제공된 시스템의 설계 제작을 위한 기초를 제공하므로, 본 발명의 RNA 표적화 CRISPR 시스템은 본 기재 내용으로부터 과도한 실험없이, 곤충 해충 관리, 식물 질병 관리 및 제초제 내성의 관리뿐만 아니라 식물 분석에서 및 다른 적용을 위한 것을 포함하는, 식물 내 RNAi 기술 영역에 적용될 수 있다(예를 들어 문헌[Kim et al., in Pesticide Biochemistry and Physiology (Impact Factor: 2.01). 01/2015; 120. DOI: 10.1016/j.pestbp.2015.01.002]; 문헌[Sharma et al. in Academic Journals (2015), Vol.12(18) pp2303-2312)]; 문헌[Green J.M, inPest Management Science, Vol 70(9), pp 1351-1357] 참고).
식물, 조류 및 균류에서 리보스위치를 변형하고 대사 조절을 제어하기 위한 RNA 표적화 CRISPR 시스템의 사용
리보스위치(압토자임으로도 알려짐)는 소분자에 결합하고 교대로 유전자 발현을 조절하는 메신저 RNA의 조절 절편이다. 이 메커니즘은 세포가 이들 소분자의 세포 내 농도를 감지 가능하게 한다. 구체적인 리보스위치는 전형적으로 이 유전자의 전사, 번역 또는 스플라이싱을 변경함으로써 인접한 유전자를 조절한다. 따라서, 본 발명의 구체적인 구현예에서, 리보스위치를 표적화하는 적합한 가이드 RNA와 조합하여 RNA 표적화 단백질의 사용을 통하여 리보스위치 활성의 제어가 예상된다. 이것은 리보스위치의 절단 또는 리보스위치에의 결합을 통한 것일 수 있다. 구체적인 구현예에서, 리보스위치 활성의 감소가 예상된다. 최근, 티아민 피로포스페이트(TPP)에 결합하는 리보스위치가 동정되어 식물 및 조류에서 티아민 생합성을 조절하는 것으로 밝혀졌다. 또한, 이 요소는 식물에서 주요 대사의 필수 조절제인 것으로 보인다(문헌[Bocobza and Aharoni, Plant J. 2014 Aug; 79(4):693-703. doi: 10.1111/tpj.12540. Epub 2014 Jun 17]). TPP 리보스위치는 뉴로스포라 크라싸(Neurospora crassa)와 같은 특정 균류에서도 발견되고, 이는 업스트림 오픈 리딩 프레임(uORF)을 조건부로 생산하기 위한 대안적 스플라이싱을 제어하고, 이에 의해 다운스트림 유전자의 발현에 영향을 미친다(문헌[Cheah MT et al., (2007)Nature 447 (7143): 497-500. doi:10.1038/nature05769]). 본 명세서에 기재된 RNA 표적화 CRISPR 시스템은 식물, 조류 또는 균류에서 내인성 리보스위치 활성을 조작하고, 그와 같이 이에 의해 제어되는 다운스트림 유전자의 발현을 변경시키는 데 사용될 수 있다. 구체적인 구현예에서, RNA 표적화 CRISP 시스템은 생체내 또는 시험관내에서 리보스위치 기능을 분석하고 대사 네트워크에 대한 관련성을 연구하는 데 사용될 수 있다. 구체적인 구현예에서, RNA 표적화 CRISPR 시스템은 잠재적으로 유전자 제어를 위한 식물 및 플랫폼에서의 대사산물 센서로서 리보스위치의 설계 제작을 위해 사용될 수 있다.
식물, 조류 또는 균류를 위한 RNAi 스크린에서의 RNA 표적화 CRISPR 시스템의 사용
녹다운이 표현형 변화와 관련된 유전자 산물을 동정하여, RNAi 스크린을 통해, 생물학적 경로가 조사되고 구성 부분이 동정될 수 있다. 본 발명의 구체적인 구현예에서, 스크린에서의 RNAi의 활성을 제거 또는 감소시키고 이에 따라 (이전에 간섭된) 유전자 산물의 활성을(간섭/억제를 제거하거나 감소시킴으로써) 회복시키기 위해 본 명세서에 기재된 가이드 29 또는 가이드 30 단백질 및 적합한 가이드 RNA를 사용함으로써 이들 스크린을 통해 또는 이들 스크린 동안 제어가 또한 행사될 수 있다.
생체내 및 시험관내 RNA 분자의 시각화를 위한 RNA 표적화 단백질의 사용
구체적인 구현예에서, 본 발명은 핵산 결합 시스템을 제공한다. RNA의 상보적인 프로브와의 인 시츄 혼성화는 강력한 기법이다. 전형적으로 형광 DNA 올리고뉴클레오티드가 혼성화에 의해 핵산을 검출하는 데 사용된다. 고정된 핵산(LNA)과 같은 특정 변형에 의해 증가된 효율이 달성되었지만, 효율적이고 융통성있는 대안에 대한 요구가 여전히 남아있다. 이와 같이, RNA 표적화 시스템의 표지된 요소는 인 시츄 혼성화를 위한 효율적이고 적응 가능한 시스템에 대한 대안으로서 사용될 수 있다.
식물 및 효모에서 RNA 표적화 CRISPR 시스템의 추가의 응용
바이오연료 생산에서 RNA 표적화 CRISPR 시스템의 사용
본 명세서에 기재된 용어 "바이오연료"는 식물 및 식물-유래된 자원으로부터 제조된 대안적인 연료이다. 재생 가능한 바이오연료는, 에너지가 탄소 고정 과정을 통해 수득되거나 바이오매스의 이용 또는 전환을 통하여 만들어진 유기 물질로부터 추출될 수 있다. 이 바이오매스는 바이오연료를 위해 직접 사용될 수 있거나, 열 전환, 화학 전환 및 생화학 전환에 의한 물질을 함유하는 편리한 에너지로 전환될 수 있다. 이 바이오매스 전환은 고체, 액체, 또는 가스 형태의 연료를 초래할 수 있다. 바이오연료에는 두 가지 유형이 있다: 바이오에탄올 및 바이오디젤. 바이오에탄올은 셀룰로스(전분)의 당 발효 공정에 의해 주로 생산되며, 이는 대부분 메이즈 및 사탕수수로부터 유래된다. 한편, 바이오디젤은 유채씨, 야자 및 대두와 같은 기름 작물로부터 주로 생산된다. 바이오연료는 주로 교통에 사용된다.
바이오연료 생산을 위한 식물 특성의 향상
구체적인 구현예에서, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템을 이용하는 방법은, 발효를 위한 당의 더욱 효율적인 방출을 위해 핵심 가수분해제에 의한 접근을 촉진하기 위하여, 세포벽의 특성을 변경하는 데 사용된다. 구체적인 구현예에서, 셀룰로스 및/또는 리그닌의 생합성이 변형된다. 셀룰로스는 세포벽의 주 성분이다. 셀룰로스 및 리그닌의 생합성은 공동-조절된다. 식물에서 리그닌의 비율을 감소시킴으로써 셀룰로스의 비율이 증가될 수 있다. 구체적인 구현예에서, 본 명세서에 기재된 방법은, 발효 가능한 탄수화물을 증가시키기 위하여 식물에서 리그닌 생합성을 하향조절하는 데 사용된다. 더욱 구체적으로, 본 명세서에 기재된 방법은, WO 2008064289 A2에 개시된 바와 같이, 4-쿠마레이트 3-하이드록실라제(C3H), 페닐알라닌 암모니아-리아제(PAL), 신나메이트 4-하이드록실라제(C4H), 하이드록시신나모일 트랜스페라제(HCT), 카페산 O-메틸트랜스페라제(COMT), 카페오일 CoA 3-O-메틸트랜스페라제(CCoAOMT), 페룰레이트 5-하이드록실라제(F5H), 신나밀 알콜 데하이드로게나제(CAD), 신나모일 CoA-리덕타제(CCR), 4-쿠마레이트-CoA 리가제(4CL), 모노리그놀-리그닌-특이적 글리코실트랜스페라제, 및 알데히드 데하이드로게나제(ALDH)로 구성된 군으로부터 선택되는 적어도 제1 리그닌 생합성 유전자를 하향조절하는 데 사용된다.
구체적인 구현예에서, 본 명세서에 기재된 방법은 발효 동안 더욱 낮은 수준의 아세트산을 생산하는 식물 매스를 생산하는 데 사용된다(WO 200096488 또한 참고).
바이오연료 생산을 위한 효모의 변형
구체적인 구현예에서, 본 명세서에서 제공된 RNA 표적화 효소는 재조합 미생물에 의한 바이오에탄올 생산을 위해 사용된다. 예를 들어, RNA 표적화 효소는 미생물, 예를 들어 효모를 설계 제작하여 발효 가능한 당으로부터 바이오연료 또는 생체고분자를 생성하고, 선택적으로 발효 가능한 당 공급원으로서 농업 폐기물로부터 유래된 식물-유래 리그노셀룰로스를 분해시킬 수 있는 데 사용될 수 있다. 더욱 구체적으로, 본 발명은 바이오연료 생산에 요구되는 내인성 유전자의 발현을 변형시키고/시키거나 바이오연료 합성을 간섭할 수 있는 내인성 유전자를 변형시키는 데 RNA 표적화 CRISPR 복합체가 사용되는 방법을 제공한다. 더욱 구체적으로, 방법은 피루베이트의 에탄올 또는 또 다른 관심 생산물로의 전환에 관여하는 효소를 인코딩하는 하나 이상의 뉴클레오티드 서열의, 효모와 같은 미생물 내에서의 발현을 자극하는 것을 포함한다. 구체적인 구현예에서 방법은 미생물이 셀룰로스를 분해 가능하도록 하는 하나 이상의 효소, 예를 들어 셀룰라제의 발현의 자극을 보장하도록 한다. 추가의 구현예에서, RNA 표적화 CRISPR 복합체는 바이오연료 생산 경로와 경쟁하는 내인성 대사 경로를 억제하는 데 사용된다.
식물성-기름 또는 바이오연료의 생산을 위한 조류 및 식물의 변형
유전자 도입 조류 또는 유채와 같은 기타 식물은 구체적으로 예를 들어 식물성 기름 또는 알콜(특히 메탄올 및 에탄올)과 같은 바이오연료의 생산에 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
US8945839는 Cas9를 이용하여 미세-조류(클라미도모나스 레인하티 세포)종)을 설계 제작하는 방법을 기재한다. 유사한 도구를 사용하여, 본 명세서에 기재된 RNA 표적화 CRISPR 시스템의 방법은 클라미도모나스 종 및 다른 조류 상에 적용될 수 있다. 구체적인 구현예에서, RNA 표적화 이펙터 단백질 및 가이드 RNA는 Hsp70A-Rbc S2 또는 Beta2-튜불린과 같은 구조적 프로모터의 제어 하에서 RNA 표적화 이펙터 단백질을 발현하는 벡터를 사용하여 발현되는 조류 내에 도입된다. 가이드 RNA는 T7 프로모터를 함유하는 벡터를 사용하여 전달될 것이다. 대안적으로, 시험관내 전사된 가이드 RNA는 조류 세포로 전달될 수 있다. 전기천공 프로토콜은 GeneArt 클라미도모나스 설계 제작 키트로부터 권장된 표준 프로토콜을 따른다.
식물에서의 RNA 표적화 효소의 구체적인 적용
구체적인 구현예에서, 본 발명은 바이러스 RNA를 절단할 수 있기 때문에 식물 시스템에서 바이러스 제거를 위한 치료법으로서 사용될 수 있다. 인간 시스템에서의 이전의 연구는 단일 가닥 RNA 바이러스인 C형 간염을 표적화하는 것에 CRISPR를 활용하는 것의 성공을 입증하였다(문헌[A. Price, et al., Proc. Natl. Acad. Sci, 2015]). 이들 방법은 또한 식물에서의 RNA 표적화 CRISPR 시스템의 사용을 위하여 조정될 수 있다.
개량된 식물
본 발명은 또한 본 명세서에서 제공된 방법에 의해 수득 가능하고 수득된 식물 및 효모 세포를 제공한다. 본 명세서에 기재된 방법에 의해 수득된 개량된 식물은 예를 들어 식물 해충, 제초제, 가뭄, 저온 또는 고온, 과습 등에 대한 내성을 보장하는 유전자의 변형된 발현을 통해 식품 또는 사료 생산에 유용할 수 있다.
본 명세서에 기재된 방법에 의해 수득된 개량된 식물, 특히 작물 및 조류는 예를 들어, 야생형에서 보통 나타나는 것보다 더 높은 단백질, 탄수화물, 영양소 또는 비타민 수준의 발현을 통해 식품 또는 사료 생산에 유용할 수 있다. 이와 관련하여 개량된 식물, 특히 콩류 및 괴경이 선호된다.
개량된 조류 또는 유채와 같은 기타 식물은 예를 들어 식물성 기름 또는 알콜(특히 메탄올 및 에탄올)과 같은 바이오연료의 생산에 특히 유용할 수 있다. 이들은 기름 또는 바이오연료 산업에서의 이용을 위해 높은 수준의 기름 또는 알콜을 발현 또는 과발현하도록 설계 제작될 수 있다.
본 발명은 또한 식물의 개량된 부분을 제공한다. 식물 부분은 잎, 줄기, 뿌리, 괴경, 종자, 배젖, 배주 및 화분을 포함하지만 이에 한정되지 않는다. 본 명세서에서 예상된 식물 부분은 생존 가능, 비 생존 가능, 재생 가능 및/또는 비-재생 가능일 수 있다.
본 발명의 방법에 따라 생성된 식물 세포 및 식물을 제공하는 것 또한 본 명세서에 포함된다. 전통적인 육종 방법에 의해 생산되는, 유전적 변형을 포함하는 식물의 생식세포, 종자, 접합자 또는 체세포성, 배아, 자손 또는 잡종 또한 본 발명의 범위 내에 포함된다. 이러한 식물은 표적 서열에 또는 표적 서열 대신에 삽입된 이종 또는 외래 DNA 서열을 함유할 수 있다. 대안적으로, 이러한 식물은 하나 이상의 뉴클레오티드에서의 변경(돌연변이, 결실, 삽입, 치환)만을 함유할 수 있다. 이와 같이, 이러한 식물은 오직 구체적인 변형의 존재에 의해 그들의 시조 식물과 상이할 것이다.
본 발명의 일 구현예에서, C2c2 시스템은 예를 들어 박테리아, 균류 또는 바이러스에 의해 유발된 질병에 대한 저항성을 생성시킴으로써 병원체 저항성 식물을 설계 제작하는 데 사용된다. 특정 구현예에서, 병충해 저항성은 곤충 해충에 의해 섭취되어 사망에 이를 C2c2 시스템을 생산하도록 작물을 설계 제작함으로써 달성될 수 있다. 본 발명의 일 구현예에서, C2c2 시스템은 비생물적 스트레스 내성을 설계 제작하는 데 사용된다. 또 다른 구현예에서, C2c2 시스템은 가뭄 스트레스 내성 또는 염 스트레스 내성, 또는 추위 또는 열 스트레스 내성을 설계 제작하는 데 사용된다. 문헌[Younis et al. 2014, Int. J. Biol. Sci. 10;1150]은 식물 육종 방법의 잠재적 표적을 검토하였으며, 이들 모두는 본 명세서에 기재된 C2c2 시스템의 사용을 통해 교정 또는 개선을 할 수 있다. 일부 비-제한적인 표적 작물은, 애기장대(Arabidopsis thaliana), 옥수수(Zea mays), 벼(Oryza sativa L), 자두(Prunus domestica L.), 목화(Gossypium hirsutum), 야생 담배(Nicotiana rustica), 옥수수(Zea mays), 알팔파(Medicago sativa), 담배(Nicotiana benthamiana) 및 애기장대(Arabidopsis thaliana)를 포함한다.
본 발명의 일 구현예에서, C2c2 시스템은 작물 해충의 관리에 사용된다. 예를 들어, 작물 해충에서 작동 가능한 C2c2 시스템은 식물 숙주로부터 발현되거나, 예를 들어 바이러스 벡터를 사용하여, 표적에 직접적으로 전달될 수 있다.
일 구현예에서, 본 발명은 이형접합 비-인간 출발 생물로부터 동형접합 생물을 효율적으로 생산하는 방법을 제공한다. 일 구현예에서, 본 발명은 식물 육종에 사용된다. 또 다른 구현예에서, 본 발명은 동물 육종에 사용된다. 이러한 구현예에서, 식물 또는 동물과 같은 동형접합 생물은 이중 가닥 손상, 염색체 쌍 형성 및/또는 가닥 교환에 관여하는 적어도 하나의 표적 유전자를 간섭하는 것에 의해 재조합을 방지 또는 억제함으로써 제조된다.
최적화된 기능성 RNA 표적화 시스템에서의 C2C2단백질의 적용
일 양태에서, 본 발명은 기능적 성분을 RNA 환경으로 특이적으로 전달하기 위한 시스템을 제공한다. 이것은 상이한 성분의 RNA로의 특이적 표적화를 가능하게 하는 본 발명의 RNA 표적화 이펙터 단백질을 포함하는 CRISPR 시스템을 사용하여 보장될 수 있다. 더욱 구체적으로, 이러한 성분은 RNA 번역, 분해 등의 활성화제 또는 억제제와 같은, 활성화제 또는 억제제를 포함한다. 이 시스템의 적용은 본 명세서의 다른 곳에 기재되어 있다.
일 양태에 따라, 본 발명은 세포의 관심 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA를 포함하는 비-천연적으로 발생하거나 설계 제작된 조성물을 제공하며, 여기서 가이드 RNA는 어댑터 단백질에 결합하는 하나 이상의 별개 RNA 서열(들)의 삽입에 의해 변형된다. 구체적인 구현예에서, RNA 서열은 둘 이상의 어댑터 단백질(예를 들어, 압타머)에 결합할 수 있으며, 여기서 각각의 어댑터 단백질은 하나 이상의 기능성 도메인과 회합된다. 본 명세서에 기재된 c2c2 효소의 가이드 RNA는 가이드 서열의 변형이 가능한 것으로 나타난다. 구체적인 구현예에서, 가이드 RNA는 직접 반복 내 직접 반복의 5' 또는 가이드 서열의 3'에 별개의 RNA 서열(들)의 삽입에 의해 변형된다. 하나 초과의 기능성 도메인이 존재하는 경우, 기능성 도메인은 동일하거나 상이할 수 있으며, 예를 들어 동일하거나 상이한 2 개의 활성화제 또는 억제제 중 2 개일 수 있다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인이 RNA 표적화 효소에 부착되어 표적 RNA에 결합 즉시 기능성 도메인이 그것의 간주되는 성질의 기능으로 기능할 수 있도록 하는 공간적 방향으로 기능성 도메인이 있게 된다; 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 조성물은 적어도 3 개의 기능성 도메인을 갖는 CRISPR-Cas 복합체를 포함하고, 그 중 적어도 하나는 RNA 표적화 효소와 관련되고 그 중 적어도 2 개는 gRNA와 관련된다.
따라서, 일 양태에서, 본 발명은 본 명세서에서-논의된 가이드 RNA 및 RNA 표적화 효소인 CRISPR 효소를 포함하는, 비-천연적으로 발생하거나 설계 제작된 CRISPR-Cas 복합체 조성물을 제공하며, 여기서 선택적으로 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 효소의 뉴클레아제 활성의 5% 이하를 가지게 되고, 선택적으로 적어도 하나 이상의 핵 국소화 서열을 포함하는 하나 이상을 포함한다. 구체적인 구현예에서, RNA 표적화 효소의 결합을 여전히 보장하지만 RNA 표적화 효소에 의한 절단을 방지하기 위해(본 명세서의 다른 곳에서 상세히 설명된 바와 같이), 가이드 RNA가 추가적으로 또는 대안적으로 변형된다.
구체적인 구현예에서, RNA 표적화 효소는 적어도 하나의 돌연변이를 갖지 않는 c2c2 효소와 비교하여 적어도 97% 또는 100%의 감소된 뉴클레아제 활성을 갖는 c2c2 효소이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 C2c2 효소는 2 개 이상의 돌연변이를 포함한다. 돌연변이는, 렙토트리키아 샤히 c2c2 단백질 또는 오솔로그의 상응하는 위치에 따라, 예를 들어, 다음의 돌연변이 중 하나 이상과 같은: R597A, H602A, R1278A 및 H1283A, 다음 아미노산 잔기 중 하나 이상에 대한 돌연변이로부터 선택될 수있다: R597, H602, R1278 및 H1283.
구체적인 구현예에서, RNA 표적화 시스템은 2 개 이상의 기능성 도메인을 포함하는 본 명세서에서 상기 기재된 바와 같이 제공된다. 구체적인 구현예에서, 2 개 이상의 기능성 도메인은 이종의 기능성 도메인이다. 구체적인 구현예에서, 시스템은 기능성 도메인을 포함하는 융합 단백질인 어댑터 단백질을 포함하고, 융합 단백질은 선택적으로 어댑터 단백질과 기능성 도메인 사이에 링커를 포함한다. 구체적인 구현예에서, 링커는 GlySer 링커를 포함한다. 추가적으로 또는 대안적으로, 하나 이상의 기능성 도메인이 링커, 선택적으로 GlySer 링커를 통해 RNA 이펙터 단백질에 부착된다. 구체적인 구현예에서, 하나 이상의 기능성 도메인은 HEPN 도메인 중 하나 또는 둘 모두를 통해 RNA 표적화 효소에 부착된다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질 또는 RNA 표적화 효소와 회합된 하나 이상의 기능성 도메인은 RNA 번역을 활성화 또는 억제할 수 있는 도메인이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질과 회합된 하나 이상의 기능성 도메인 중 적어도 하나는 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, DNA 통합 활성 RNA 절단 활성, DNA 절단 활성 또는 핵산 결합 활성, 또는 분자 스위치 활성 또는 화학적 유도성 또는 광 유도성을 포함하는 하나 이상의 활성을 갖는다.
일 양태에서, 본 발명은 압타머 서열을 포함하는 본 명세서에서-논의된 조성물을 제공한다. 구체적인 구현예에서, 압타머 서열은 동일한 어댑터 단백질에 특이적인 2 개 이상의 압타머 서열이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 압타머 서열은 상이한 어댑터 단백질에 특이적인 2 개 이상의 압타머 서열이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 어댑터 단백질은 MS2, PP7, Qβ F2, GA, fr, JP501, M12, R17, BZ13, JP34, JP500, KU1, M11, MX1, TW18, VK, SP, FI, ID2, NL95, TW19, AP205, φCb5, φCb8r, φCb12r, φCb23r, 7s, PRR1를 포함한다. 따라서, 구체적인 구현예에서, 압타머는 상기 나열된 어댑터 단백질 중 임의의 하나에 특이적으로 결합하는 결합 단백질로부터 선택된다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 세포는 진핵 세포이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 진핵 세포는 포유류 세포, 식물 세포 또는 효모 세포이고, 포유류 세포는 선택적으로 마우스 세포이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 포유류 세포는 인간 세포이다.
일 양태에서, 본 발명은 상기 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 초과의 gRNA가 존재하고 gRNA는 상이한 서열을 표적화하여, 조성물이 사용될 때 다중화가 존재한다. 일 양태에서, 본 발명은 조성물을 제공하며, 여기서 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형된 하나 초과의 gRNA가 존재한다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인과 회합된 하나 이상의 어댑터 단백질이 존재하고 이는 가이드 RNA(들)에 삽입된 별개의 RNA 서열(들)에 결합된다.
일 양태에서, 본 발명은 본 명세서에서-논의된 조성물을 제공하며, 여기서 가이드 RNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형되고; 예를 들어, 여기서 적어도 하나의 비-코딩 기능성 루프는 억압성이며; 예를 들어, 여기서 적어도 하나의 비-코딩 기능성 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 하나 이상의 조성물을 숙주에 투여하거나 생체내 숙주에서 발현시키는 것을 포함하는 유전자 발현 변형 방법을 제공한다.
일 양태에서, 본 발명은 조성물 또는 그를 코딩하는 핵산 분자의 전달을 포함하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내 발현되는, 본 명세서에서-논의된 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서-논의된 방법을 제공하며, 여기서 생체내 발현은 렌티바이러스, 아데노바이러스 또는 AAV를 통한 것이다.
일 양태에서, 본 발명은 본 명세서에-논의된 세포의 포유류 세포주를 제공하며, 여기서 세포주는 선택적으로 인간 세포주 또는 마우스 세포주이다. 일 양태에서, 본 발명은 유전자 도입 포유류 모델, 선택적으로 마우스를 제공하며, 여기서 모델은 본 명세서에서-논의된 조성물로 형질전환되었거나 상기 형질전환체의 자손이다.
일 양태에서, 본 발명은 가이드 RNA 또는 RNA 표적화 CRISPR-Cas 복합체 또는 본 명세서에서-논의된 조성물을 인코딩하는 핵산 분자(들)를 제공한다. 일 양태에서, 본 발명은: 세포의 관심 게놈 유전자좌 내 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(gRNA)를 인코딩하는 핵산 분자를 포함하는 벡터를 제공하며, 여기서 gRNA의 직접 반복은 2 개 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 각각의 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되거나; 여기서 gRNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형된다. 일 양태에서, 본 발명은: 본 명세서에서-논의된 gRNA 및 RNA 표적화 효소를 포함하는 비-천연적으로 발생하거나 설계 제작된 CRISPR-Cas 복합체 조성물을 인코딩하는 핵산 분자(들)을 포함하는 벡터(들)를 제공하며, 여기서 선택적으로 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소의 5% 이하의 뉴클레아제 활성을 갖게 되고, 선택적으로 적어도 하나 이상의 핵 국소화 서열을 포함하는 하나 이상을 포함한다. 일 양태에서, 벡터는 가이드 RNA(gRNA)를 인코딩하는 핵산 분자 및/또는 RNA 표적화 효소를 인코딩하는 핵산 분자 및/또는 선택적인 핵 국소화 서열(들)에 작동 가능하게 연결된 진핵 세포에서 작동 가능한 조절 요소(들)를 추가로 포함할 수 있다.
일 양태에서, 본 발명은 상기 본 명세서에서 기재된 하나 이상의 성분을 포함하는 키트를 제공한다. 일부 구현예에서, 키트는 상기 기재된 벡터 시스템 및 키트를 사용하기 위한 지침서를 포함한다.
일 양태에서, 본 발명은 기능 획득(GOF) 또는 기능 손실(LOF)에 대한 스크리닝 방법 또는 비-코딩 RNA 또는 잠재적 조절 영역(예를 들어, 인핸서, 억제제)을 스크리닝하는 방법을 제공하며, RNA 표적화 효소를 함유하거나 발현하는 본 명세서에서-논의된 세포주 또는 본 명세서에서-논의된 모델의 세포, 및 세포주 또는 모델의 세포 내로 본 명세서에서-논의된 조성물을 도입하여 gRNA가 활성화제 또는 억제제를 포함하게 되는 것, 및 도입된 gRNA가 활성화제를 포함하는 세포에 대하여 또는 도입된 gRNA가 억제제를 포함하는 세포에 대하여 각각 GOF 또는 LOF를 모니터링하는 것을 포함한다.
일 양태에서, 본 발명은 비-천연적으로 발생하거나 설계 제작되는 조성물의 라이브러리를 제공하며, 각각, 세포의 관심 표적 RNA 서열에 혼성화할 수 있는 가이드 서열을 포함하는 RNA 표적화 CRISPR 가이드 RNA(gRNA), RNA 표적화 효소를 포함하며, 여기서 RNA 표적화 효소는 적어도 하나의 돌연변이를 포함하여, RNA 표적화 효소가 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소의 5% 이하의 뉴클레아제 활성을 갖게 되며, 여기서 gRNA는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되며, 여기서 조성물은 하나 이상의 또는 2 개 이상의 어댑터 단백질을 포함하며, 여기서 각각의 단백질은 하나 이상의 기능성 도메인과 회합되며, 여기서 gRNA는 복수의 RNA 표적화 가이드 RNA(gRNA)를 포함하는 전체 게놈에 걸친 라이브러리를 포함한다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 RNA 표적화 RNA 표적화 효소는 적어도 하나의 돌연변이를 갖지 않는 RNA 표적화 효소와 비교하여 적어도 97% 또는 100%의 감소된 뉴클레아제 활성을 갖는다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 어댑터 단백질은 기능성 도메인을 포함하는 융합 단백질이다. 일 양태에서, 본 발명은 본 명세서에서-논의된 라이브러리를 제공하며, 여기서 gRNA는 하나 또는 2 개 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되지 않는다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 하나 또는 2 개 이상의 기능성 도메인은 RNA 표적화 효소와 회합된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 세포의 세포 집단은 진핵 세포의 집단이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 진핵 세포는 포유류 세포, 식물 세포 또는 효모 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 포유류 세포는 인간 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 세포 집단은 배아 줄기(ES) 세포의 집단이다.
일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 100 개 이상의 RNA 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 1000 개 이상의 RNA 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 약 20,000 개 이상의 서열에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 전체 트랜스크립톰에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 표적화는 관련된 또는 원하는 경로 상에서 초점을 맞춘 표적 서열의 패널에 대한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 경로는 면역 경로이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 라이브러리를 제공하며, 여기서 경로는 세포 분열 경로이다.
일 양태에서, 본 발명은 변형된 발현을 갖는 유전자를 포함하는 모델 진핵 세포를 생성하는 방법을 제공한다. 일부 구현예에서, 질병 유전자는 질병을 갖거나 발병할 위험이 증가하는 것과 관련된 임의의 유전자이다. 일부 구현예에서, 방법은 (a) 상기 본 명세서에서 기재된 시스템의 성분을 인코딩하는 하나 이상의 벡터를 진핵 세포 내로 도입시키는 것, 및 (b) CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하여 유전자 발현을 변형시킬 수 있도록 하고, 그에 의해 변형된 유전자 발현을 포함하는 모델 진핵 세포를 생성하는 것을 포함한다.
본 명세서에서 제공된 구조 정보는 표적 RNA 및 RNA 표적화 효소와의 가이드 RNA의 상호 작용의 조사가 가능하게 하여 전체 RNA 표적화 CRISPR-Cas 시스템의 기능성을 최적화하기 위하여 가이드 RNA 구조의 설계 제작 또는 변경을 가능하게 한다. 예를 들어, 가이드 RNA는 RNA에 결합할 수 있는 어댑터 단백질의 삽입에 의해 RNA 표적화 단백질과 충돌하지 않고 연장될 수 있다. 이들 어댑터 단백질은 하나 이상의 기능성 도메인을 포함하는 이펙터 단백질 또는 융합체를 추가로 모집할 수 있다.
본 발명의 일 양태는 상기 요소가 단일 조성물 내에 포함되거나 개별 조성물 내에 포함된다는 것이다. 이들 조성물은 게놈 수준에 기능적 효과를 이끌어 내기 위해 숙주에게 유리하게 적용될 수 있다.
당업자는 어댑터 + 기능성 도메인의 결합은 가능하게 하지만(예를 들어, CRISPR 복합체의 3 차원 구조 내의 입체적 방해로 인해) 어댑터 + 기능성 도메인의 적절한 위치 결정은 가능하지 않게 하는 가이드 RNA로의 변형은 의도되지 않은 변형임을 이해할 것이다. 하나 이상의 변형된 가이드 RNA는 직접 반복 내의 직접 반복의 5', 또는 가이드 서열의 3'에 개별 RNA 서열(들)을 도입함으로써 변형될 수 있다.
변형된 가이드 RNA, 비활성화된 RNA 표적화 효소(기능성 도메인을 갖거나 갖지 않음) 및 하나 이상의 기능성 도메인을 갖는 결합 단백질은 각각 개별적으로 조성물 내에 포함될 수 있고, 개별적으로 또는 일괄적으로 숙주에 투여될 수 있다. 대안적으로, 이들 성분은 숙주에 투여하기 위해 단일 조성물로 제공될 수 있다. 숙주에의 투여는 숙주로의 전달을 위한 당업자에게 알려지거나 본 명세서에 기재된 바이러스 벡터를 통하여 수행될 수 있다(예를 들어, 렌티바이러스 벡터, 아데노바이러스 벡터, AAV 벡터). 본 명세서에 설명된 바와 같이, 상이한 선택 마커(예를 들어, 렌티바이러스 gRNA 선택을 위해) 및 gRNA 농도(예를 들어, 다수의 gRNA가 사용되는지 여부에 의존함)의 사용은 개선된 효과를 유도하는 데 유리할 수 있다.
제공된 조성물을 사용하여, 당업자는 하나 이상의 게놈 이벤트를 유도하기 위해 동일하거나 상이한 기능성 도메인으로 단일 또는 다수 유전자좌를 유리하게 및 특이적으로 표적화할 수 있다. 조성물은 세포의 라이브러리에서의 스크리닝을 위하여 및 생체내 기능 모델링을 위하여 매우 다양한 방법에 적용될 수 있다(예를 들어, lincRNA의 유전자 활성화 및 기능 확인; 기능-획득 모델링; 기능-손실 모델링; 최적화 및 스크리닝 목적의 세포주 및 유전자 도입 동물을 확립하기 위한 본 발명의 조성물의 사용).
현재 발명은 조건적 또는 유도성 CRISPR RNA 표적화 이벤트를 확립하고 활용하기 위한 현재 발명의 조성물의 사용을 용도를 포함한다(예를 들어, 문헌[Platt et al., Cell (2014), http://dx.doi.org/10.1016/j.cell.2014.09.014], 또는 WO 2014/093622(PCT/US2013/074667)과 같은 본 명세서에 인용된 PCT 특허 공보를 참고하며, 이는 본 발명 또는 출원에 대해 선행으로 여겨지지 않음). 예를 들어, 표적 세포는 RNA 표적화 CRISRP 효소를 조건적 또는 유도성으로(예를 들어, Cre 의존적 작제물의 형태로) 및/또는 어댑터 단백질을 조건적 또는 유도성으로 포함하고, 표적 세포로 도입된 벡터의 발현 시 벡터는 표적 세포에서 s RNA 표적화 효소 발현 및/또는 어댑터 발현의 조건을 유도하거나 발생시키는 그것을 발현한다. 현재 발명의 교시 및 조성물을 CRISPR 복합체를 생성시키는 공지된 방법과 함께 적용함으로써, 기능성 도메인에 의해 영향을 받는 유도성 유전자 발현 또한 현재 발명의 양태이다. 대안적으로, 어댑터 단백질은 스크리닝 목적의 효과적인 모델을 제공하기 위하여 조건적 또는 유도성 s RNA 표적화 효소를 갖는 조건적 또는 유도성 요소로서 제공될 수 있으며, 이는 유리하게 매우 많은 적용을 위하여 최소 설계 및 특정 gRNA의 투여만을 필요로 한다.
데드 가이드 서열을 포함하는 본 발명에 따른 가이드 RNA
일 양태에서, 본 발명은 CRISPR 복합체의 형성 및 표적에의 성공적인 결합을 가능하게 하는 반면 동시에 성공적인 뉴클레아제 활성을 가능하지 않게 하는(즉, 뉴클레아제 활성이 없는/인델 활성이 없는) 방식으로 변형된 가이드 서열을 제공한다. 설명 상, 이러한 변형된 가이드 서열은 "데드 가이드" 또는 "데드 가이드 서열"로 지칭된다. 이들 데드 가이드 또는 가이드 서열은 촉매적으로 비활성이거나 뉴클레아제 활성과 관련하여 형태적으로 비활성인 것으로 생각될 수 있다. 실제로, 데드 가이드 서열은 촉매 활성을 촉진시키거나 표적내 및 표적외 결합 활성을 구별하는 능력과 관련하여 생산적인 염기쌍 형성에 충분히 관여하지 않을 수 있다. 간략하게, 분석은 CRISPR 표적 RNA 및 표적 RNA와의 미스매치를 포함하는 가이드 RNA를 합성하는 것, 이들을 RNA 표적화 효소와 조합하는 것 및 절단 산물에 의해 생성된 밴드의 존재에 기반하여 겔 기반 절단을 분석하는 것, 및 상대적 밴드 강도에 기반하여 절단을 정량하는 것을 포함한다.
따라서, 관련된 양태에서, 본 발명은 본 명세서에 기재된 기능성 RNA 표적화 및 가이드 RNA(gRNA)를 포함하는, 비-천연적으로 발생하거나 설계 제작된 RNA 표적화 CRISPR-Cas 시스템 조성물을 제공하고, 여기서 gRNA는 데드 가이드 서열을 포함하여 gRNA는 표적 서열에 혼성화할 수 있고 RNA 표적화 CRISPR-Cas 시스템은 시스템의 비-돌연변이체 RNA 표적화 효소의 검출 가능한 RNA 절단 활성 없이 세포에서 관심 게놈 유전자좌로 향하게 된다. 본 명세서의 다른 곳에 기재된 본 발명에 따른 gRNA 중 임의의 것은 본 명세서의 아래에 기재된 데드 가이드 서열을 포함하는 데드 gRNA/gRNA로서 사용될 수 있음이 이해되어야 한다. 본 명세서의 다른 곳에 기재된 방법, 생산물, 조성물 및 용도 중 임의의 것은 하기에 추가로 상세히 설명되는 데드 가이드 서열을 포함하는 데드 gRNA/gRNA를 이용하여 동등하게 적용 가능하다. 추가의 안내에 의해, 다음의 구체적인 양태 및 구현예가 제공된다.
CRISPR 복합체의 RNA 표적 서열에의 서열-특이적 결합을 지시하는 데드 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험될 데드 가이드 서열을 포함하는, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, 예를 들어 CRISPR 서열의 성분을 인코딩하는 벡터로 형질감염시키고 그 후 표적 서열 내의 선택적인 절단의 평가함으로써 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있다. 예를 들어, 표적 서열, 시험될 데드 가이드 서열 및 시험 데드 가이드 서열과 상이한 대조군 가이드 서열을 포함하는, CRISPR 복합체의 성분을 제공하고, 시험 및 대조군 가이드 서열 반응 사이의 표적 서열에서의 결합 및 절단 비율을 비교함으로써, 표적 RNA 폴리뉴클레오티드 서열의 절단이 시험관에서 평가될 수 있다. 다른 분석이 가능하며 당업자에게 떠오를 것이다. 데드 가이드 서열은 임의의 표적 서열을 표적화하기 위해 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내의 서열이다.
본 명세서에서 추가로 설명되는 바와 같이, 몇몇 구조 파라미터는 적절한 프레임워크가 이러한 데드 가이드에 도달 가능하도록 한다. 데드 가이드 서열은 전형적으로 활성 RNA 절단을 초래하는 각각의 가이드 서열보다 짧다. 구체적인 구현예에서, 데드 가이드는 동일한 것으로 향하는 각각의 가이드보다 5%, 10%, 20%, 30%, 40%, 50% 더 짧다.
아래에서 설명되고 당업계에 알려진 바와 같이, gRNA의 일 측면-특이성을 표적화하는 RNA는 직접 반복 서열이며, 이는 이러한 가이드에 적절히 연결되어야 한다. 구체적으로, 이것은 직접 반복 서열이 RNA 표적화 효소의 기원에 의존하여 설계됨을 암시한다. 따라서, 인증된 데드 가이드 서열에 대해 사용 가능한 구조 데이터는 C2c2 특이적 동등물을 설계하는 데 사용될 수 있다. 예를 들어, 2 개 이상의 C2c2 이펙터 단백질의 오솔로그 뉴클레아제 도메인 HEPN 사이의 구조적 유사성이 설계 동등한 데드 가이드를 전달하는 데 사용될 수 있다. 따라서, 본 명세서의 데드 가이드는 길이 및 서열에서 적절하게 변형되어 이러한 C2c2 특이적 동등물을 나타내고, CRISPR 복합체의 형성 및 표적 RNA에의 성공적 결합을 가능하게 하는 반면 동시에 성공적인 뉴클레아제 활성은 가능하지 않게 할 수 있다.
본 명세서뿐만 아니라 당업계 기술 맥락에서 데드 가이드의 사용은 시험관내, 생체외 및 생체내 적용 둘 모두에서 네트워크 생물학 및/또는 시스템 생물학을 위한 놀랍고 예상하지 못한 플랫폼을 제공하며, 다중화된 유전자 표적화, 및 구체적으로 양방향성 다중화된 유전자 표적화가 가능하게 한다. 데드 가이드 사용 전에는, 다수의 표적을 다루는 것이 어려웠고 일부 사례에서는 불가능하였다. 데드 가이드 사용으로, 다수의 표적, 및 이에 따른 다수의 활성이 예를 들어, 동일한 세포에서, 동일한 동물에서, 또는 동일한 환자에서 다뤄질 수 있다. 이러한 다중화는 동시에 발생하거나 원하는 시간에 대해 시차를 둘 수 있다.
예를 들어, 데드 가이드는 뉴클레아제 활성의 결과없이 유전자 표적화를 위한 수단으로서 gRNA를 사용하는 것이 가능하게 하는 동시에 활성화 또는 억제를 위한 지시된 수단을 제공한다. 데드 가이드를 포함하는 가이드 RNA는 유전자 활성의 활성화 또는 억제가 가능하게 하는 방식으로 요소, 구체적으로, 유전자 이펙터(예를 들어, 유전자 활성의 활성화제 또는 억제제)의 기능적인 배치를 가능하게 하는 본 명세서의 다른 곳에 기재된 단백질 어댑터(예를 들어, 압타머)를 더 포함하도록 변형될 수 있다. 일 예는 본 명세서 및 당업계의 기술에서 설명된 바와 같은, 압타머의 포함이다. 단백질-상호작용하는 압타머를 포함하도록 데드 가이드를 포함하는 gRNA를 설계 제작함으로써(문헌[Konermann et al., "Genome-scale transcription activation by an engineered CRISPR-Cas9 complex," doi:10.1038/nature14136], 참조로서 본 명세서에 포함됨), 다수의 별개의 이펙터 도메인을 조립할 수 있다. 이러한 것은 자연적 과정을 따라 모델화될 수 있다.
따라서, 일 양태는 데드 가이드를 포함하는 본 발명의 gRNA이며, 여기서 gRNA는 본 명세서에 기재된 유전자 활성화 또는 억제를 제공하는 변형을 추가로 포함한다. 데드 gRNA는 하나 이상의 압타머를 포함할 수 있다. 압타머는 유전자 이펙터, 유전자 활성화제 또는 유전자 억제제에 특이적일 수 있다. 대안적으로, 압타머는 차례로 특정 유전자 이펙터, 유전자 활성화제 또는 유전자 억제제에 특이적이고 이를 모집/결합하는 단백질에 특이적일 수 있다. 활성화제 또는 억제제 모집을 위한 다수의 부위가 있는 경우, 부위가 활성화제 또는 억제제에 특이적인 것이 선호된다. 활성화제 또는 억제제 결합을 위한 다수의 부위가 있는 경우, 부위는 동일한 활성화제 또는 동일한 억제제에 특이적일 수 있다. 부위는 또한 상이한 활성화제 또는 상이한 억제제에 특이적일 수 있다. 이펙터, 활성화제, 억제제는 융합 단백질의 형태로 존재할 수 있다.
일 양태에서, 본 발명은 기능화된 CRISPR 시스템을 생물 내의 유전자 좌위로 향하도록 하기 위한 데드 가이드 RNA 표적화 서열을 선택하는 방법을 제공하며, 이는 a) 유전자 좌위에 하나 이상의 CRISPR 모티프를 위치시키는 것; b) 각각의 CRISPR 모티프의 다운스트림에 있는 20 nt서열을 i) 서열의 GC 함량을 결정함으로써; 및 ii) 생물의 게놈에서 서열의 처음 15 nt의 표적외 매치가 있는 여부를 결정함으로써 분석하는 것; c) 서열의 GC 함량이 70% 이하이고 표적외 매치가 확인되지 않으면 가이드 RNA에서의 사용을 위해 서열을 선택하는 것을 포함한다. 일 구현예에서, GC 함량이 50% 이하이면 서열이 선택된다. 일 구현예에서, GC 함량이 40% 이하이면 서열이 선택된다. 일 구현예에서, GC 함량이 30% 이하이면 서열이 선택된다. 일 구현예에서, 2 개 이상의 서열이 분석되고 가장 낮은 GC 함량을 갖는 서열이 선택된다. 일 구현예에서, 표적외 매치는 생물의 조절 서열에서 결정된다. 일 구현예에서, 유전자 좌위는 조절 영역이다. 일 양태는 전술된 방법에 따라 선택된 표적화 서열을 포함하는 데드 가이드 RNA를 제공한다.
일 양태에서, 본 발명은 기능화된 CRISPR 시스템을 생물 내의 유전자 좌위로 표적화하는 데드 가이드 RNA를 제공한다. 본 발명의 일 구현예에서, 데드 가이드 RNA는 표적화 서열을 포함하고 여기서 표적 서열의 CG 함량이 70% 이하이고, 표적화 서열의 처음 15 nt가 생물 내 또 다른 유전자 좌위의 조절 서열 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 특정 구현예에서, 표적화 서열의 GC 함량은 60% 이하, 55% 이하, 50% 이하, 45% 이하, 40% 이하, 35% 이하 또는 30% 이하. 특정 구현예에서, 표적화 서열의 GC 함량은 70% 내지 60% 또는 60% 내지 50% 또는 50% 내지 40% 또는 40% 내지 30%이다. 일 구현예에서, 표적화 서열은 유전자좌의 잠재적 표적화 서열 중에서 가장 낮은 CG 함량을 갖는다.
본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 14 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 13 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 12 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 11 nt는 표적 서열과 매치된다. 또 다른 구현예에서, 데드 가이드의 처음 10 nt는 표적 서열과 매치된다. 본 발명의 일 구현예에서, 데드 가이드의 처음 15 nt는 또 다른 유전자 좌위의 조절 영역 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 14 nt, 또는 데드 가이드의 처음 13 nt, 또는 가이드의 처음 12 nt, 또는 데드 가이드의 처음 11 nt, 또는 데드 가이드의 처음 10 nt는 또 다른 유전자 좌위의 조절 영역 내 CRISPR모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다. 다른 구현예에서, 데드 가이드의 처음 15 nt, 또는 14 nt, 또는 13 nt, 또는 12 nt, 또는 11 nt는 게놈의 CRISPR 모티프로부터 다운스트림에 있는 표적외 서열과 매치되지 않는다.
특정 구현예에서, 데드 가이드 RNA는 표적 서열과 매치되지 않는 3' 말단에 부가적인 뉴클레오티드를 포함한다. 따라서, CRISPR 모티프의 다운스트림에 있는 처음 20 내지 28 nt를 포함하는 데드 가이드 RNA는 3' 말단에서 길이가 연장될 수 있다.
일반적인 준비
일 양태에서, 본 발명은 핵산 결합 시스템을 제공한다. 상보적인 프로브와 RNA의 인 시츄 혼성화는 강력한 기법이다. 전형적으로 형광 DNA 올리고뉴클레오티드가 혼성화에 의해 핵산을 검출하는 데 사용된다. 고정된 핵산(LNA)과 같은 특정 변형에 의해 증가된 효율이 달성되었지만, 효율적이고 융통성 있는 대안에 대한 요구가 여전히 남아있다. 본 발명은 인 시츄 혼성화를 위한 효율적이고 조정 가능한 시스템을 제공한다.
본 발명의 일 구현예에서, 용어 가이드 서열 및 가이드 RNA는 상기 인용된 문헌, 예를 들어 WO 2014/093622(PCT/US2013/074667)에서 상호교환 가능하게 사용된다. 일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 지시하기에, 표적 폴리뉴클레오티드 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 이의 해당하는 표적 서열 간의 상보성의 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적의 정렬은 서열을 정렬하기에 적합한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies; www.novocraft.com에서 이용 가능함), ELAND(Illumina, San Diego, CA), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 미만이다. 바람직하게 가이드 서열은 길이가 10 개 내지 30 개 뉴클레오티드이다. 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분은, CRISPR 서열의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 서열 내의 우선적인 절단의 평가로 이어질 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은 표적 서열, 즉 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 CRISPR 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다. 가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 세포의 게놈 내 서열이다. 예시적인 표적 서열은 표적 게놈에서 특유한 것을 포함한다.
일반적으로, 그리고 본 명세서에 걸쳐서, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터는, 이에 한정되지 않지만, 단일-가닥, 이중-가닥, 또는 부분적 이중-가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 이들 둘 다를 포함하는 핵산 분자; 및 당업계에서 알려진 다른 다양한 폴리뉴클레오티드를 포함한다. 벡터의 일 유형으로 "플라스미드"가 있으며, 이는 원형 이중 가닥 DNA 루프를 지칭하며, 그 안으로 예를 들어 표준 분자 클로닝 기법에 의해서 추가적인 DNA 절편이 삽입될 수 있다. 벡터의 또 다른 유형으로 바이러스 벡터가 있으며, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-관련 바이러스) 내로의 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로의 형질감염을 위한, 바이러스가 보유하는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 원점을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이에 의해 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 지시할 수 있다. 이와 같은 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 진핵 세포에서의 발현을 위한 벡터 및 이를 초래하는 벡터는 본 명세서에서 "진핵 발현 벡터"로 지칭될 수 있다. 재조합 DNA 기법에서 유용성이 있는 통상적인 발현 벡터는 종종 플라스미드 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이는 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기반하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터 내에서, "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입된 경우에는 숙주 세포에서) 상기 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결됨을 의미하는 것으로 의도된다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 엔트리 부위(internal ribosomal entry site; IRES), 및 다른 발현 제어 요소(예를 들어, 전사 종결 신호, 예를 들어 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 이와 같은 조절 요소는, 예를 들어 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 기재되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 원하는 관심 조직, 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 지시할 수 있다. 조절 요소는 시간-의존적 방식으로, 예를 들어 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 지시할 수 있으며, 이것은 조직 특이적이거나 세포-유형 특이적일 수 있거나, 또한 그렇지 않을 수 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 이에 한정되지 않지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 이에 한정되지 않지만, 레트로바이러스 라우스 육종 바이러스(Rous sarcoma virus; RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, 문헌[Boshart et al, Cell, 41:521-530(1985)] 참조], SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(phosphoglycerol kinase; PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예를 들어 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 절편(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])이 포함된다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 원하는 발현 수준 등과 같은 요인에 따라 달라질 수 있다는 것이 당업자에 의해서 이해될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이에 의해 본 명세서에 기재된 바와 같이 핵산에 의해서 인코딩된, 융합 단백질 또는 펩티드를 포함하는, 전사물, 단백질 또는 펩티드(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 이들의 돌연변이체 형태, 이들의 융합 단백질 등)가 생성될 수 있다.
유리한 벡터로는 렌티바이러스 및 아데노-관련 바이러스를 포함하며, 이와 같은 벡터의 유형은 또한 특정 유형의 세포들의 표적화를 위해 선택될 수 있다.
본 명세서에서 사용된 바와 같이, 제V형 또는 제VI형 CRISPR-Cas 유전자좌 이펙터 단백질의 용어 "crRNA" 또는 "가이드 RNA" 또는 "단일 가이드 RNA" 또는 "sgRNA" 또는 "하나 이상의 핵산 성분"은 표적 핵산 서열과 혼성화하고, 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하기에, 표적 핵산 서열과의 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열을 포함한다.
특정 구현예에서, 본 명세서에서 제공된 CRISPR 시스템은 crRNA 또는 가이드 서열을 포함하는 유사 폴리뉴클레오티드를 이용할 수 있으며, 여기서 폴리뉴클레오티드는 RNA, DNA 또는 RNA와 DNA의 혼합물이고/이거나 여기서 폴리뉴클레오티드는 하나 이상의 뉴클레오티드 유사체를 포함한다. 서열은 이에 한정되지 않지만 벌지(bulge), 헤어핀 또는 스템 루프 구조와 같은 천연 crRNA의 구조를 포함하는, 임의의 구조를 포함할 수 있다. 특정 구현예에서, 가이드 서열을 포함하는 폴리뉴클레오티드는 RNA 또는 DNA 서열일 수 있는 제2 폴리뉴클레오티드 서열과 듀플렉스를 형성한다.
특정 구현예에서, 본 발명의 가이드는 비-천연적으로 발생하는 핵산 및/또는 비-천연적으로 발생하는 뉴클레오티드 및/또는 뉴클레오티드 유사체, 및/또는 화학적 변형물을 포함한다. 비-천연적으로 발생하는 핵산은 예를 들어, 천연적으로 및 비-천연적으로 발생하는 뉴클레오티드의 혼합물을 포함할 수 있다. 비-천연적으로 발생하는 뉴클레오티드 및/또는 뉴클레오티드 유사체는 리보스, 포스페이트 및/또는 염기 모이어티에서 변형될 수 있다. 본 발명의 일 구현예에서, 가이드 핵산은 리보뉴클레오티드 및 비-리보뉴클레오티드를 포함한다. 이러한 일 구현예에서, 가이드는 하나 이상의 리보뉴클레오티드 및 하나 이상의 데옥시리보뉴클레오티드를 포함한다. 본 발명의 일 구현예에서, 가이드는 포스포로티오에이트 결합, 보라노포스페이트 결합을 갖는 뉴클레오티드, 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 고정된 핵산(LNA) 뉴클레오티드, 또는 가교 핵산(BNA)과 같은 하나 이상의 비-천연적으로 발생하는 뉴클레오티드 또는 뉴클레오티드 유사체를 포함한다. 변형된 뉴클레오티드의 다른 예로는 2'-O-메틸 유사체, 2'-데옥시 유사체, 2-티오우리딘 유사체, N6-메틸아데노신 유사체, 또는 2'-플루오로 유사체가 포함된다. 변형된 염기의 추가의 예로는 2-아미노퓨린, 5-브로모-우리딘, 슈도우리딘(Ψ), N1-메틸슈도우리딘(me1Ψ), 5-메톡시우리딘(5moU), 이노신, 7-메틸구아노신이 포함되나 이에 한정되지 않는다.
특정 구현예에서, 화학적으로 변형된 가이드 RNA가 사용된다. 가이드 RNA 화학적 변형의 예로는 제한 없이, 하나 이상의 말단 뉴클레오티드에의 2'-O-메틸(M), 2'-O-메틸 3'포스포로티오에이트(MS), S-구속된 에틸(cEt), 또는 2'-O-메틸 3'티오PACE(MSP)의 포함이 포함된다. 이러한 화학적으로 변형된 가이드 RNA는 변형되지 않은 가이드 RNA와 비교하여 증가된 안정성 및 증가된 활성을 포함할 수 있으나, 그럼에도 표적내 대 표적외 특이성은 예측 가능하지 않다(문헌[Hendel, 2015, Nat Biotechnol. 33(9):985-9, doi: 10.1038/nbt.3290, 2015년 6월 29일 온라인 간행]; 문헌[Allerson et al., J. Med. Chem. 2005, 48:901-904; Bramsen et al., Front. Genet., 2012, 3:154; Deng et al., PNAS, 2015, 112:11870-11875]; 문헌[Sharma et al., MedChemComm., 2014, 5:1454-1471]; 문헌[Li et al., Nature Biomedical Engineering, 2017, 1, 0066 DOI:10.1038/s41551-017-0066] 참고). 화학적으로 변형된 가이드 RNA는 제한없이, 포스포로티오에이트 결합을 갖는 RNA 및 리보스 고리의 2' 및 4' 탄소 사이에 메틸렌 가교를 포함하는 고정된 핵산(LNA) 뉴클레오티드를 추가로 포함한다.
일부 구현예에서, 상보성의 정도는 적합한 정렬 알고리즘을 사용하여 최적으로 정렬되는 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적의 정렬은 서열을 정렬하기에 적절한 임의의 알고리즘의 사용으로 결정될 수 있으며, 그의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies; www.novocraft.com에서 이용 가능함), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 표적 핵산 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하는(핵산-표적화 가이드 RNA 내) 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 CRISPR 시스템의 성분은, 핵산-표적화 복합체의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 핵산 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 핵산 서열 내의 우선적인 표적화(예를 들어, 절단)의 평가로 이어질 수 있다. 유사하게, 표적 핵산 서열의 절단은 표적 핵산 서열, 즉 시험 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 핵산-표적화 복합체의 성분을 제공하고, 표적 서열에서 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다. 가이드 서열, 따라서 핵산-표적화 가이드 RNA는 임의의 표적 핵산 서열을 표적화하도록 선택될 수 있다. 표적 서열은 DNA일 수 있다. 표적 서열은 임의의 RNA 서열일 수 있다. 일부 구현예에서, 표적 서열은 메신저 RNA(mRNA), pre-mRNA, 리보솜 RNA(rRNA), 운반 RNA(tRNA), 마이크로-RNA(miRNA), 작은 간섭 RNA(siRNA), 소형 핵 RNA(snRNA), 소형 핵소체 RNA(snoRNA), 이중 가닥화 RNA(dsRNA), 비-코딩 RNA(ncRNA), 긴 비-코딩 RNA(lncRNA), 및 소형 세포질 RNA(scRNA)로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 mRNA, pre-mRNA, 및 rRNA로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 바람직한 구현예에서, 표적 서열은 ncRNA, 및 lncRNA로 구성된 군으로부터 선택되는 RNA 분자 내의 서열일 수 있다. 일부 더 바람직한 구현예에서, 표적 서열은 mRNA 분자 또는 pre-mRNA 분자 내의 서열일 수 있다.
일부 구현예에서, 핵산-표적화 가이드 RNA는 RNA-표적화 가이드 RNA 내의 2차 구조 정도를 감소시키도록 선택된다. 일부 구현예에서, 핵산-표적화 가이드 RNA의 뉴클레오티드의 약 75%, 50%, 40%, 30%, 25%, 20%, 15%, 10%, 5%, 1% 이하 또는 이의 미만이 최적으로 폴딩된 경우 자기-상보성 염기 쌍형성에 참여한다. 최적 폴딩은 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스(Gibbs) 자유 에너지 계산을 기반으로 한다. 이와 같은 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9(1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소(Institute for Theoretical Chemistry)에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조).
특정 구현예에서, 가이드 RNA 또는 crRNA는 직접 반복(DR) 서열 및 가이드 서열 또는 스페이서 서열을 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다. 특정 구현예에서, 가이드 RNA 또는 crRNA는 가이드 서열 또는 스페이서 서열에 융합되거나 연결된 직접 반복 서열을 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다. 특정 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 업스트림(즉, 5')에 위치할 수 있다. 다른 구현예에서, 직접 반복 서열은 가이드 서열 또는 스페이서 서열로부터 다운스트림(즉, 3')에 위치할 수 있다.
특정 구현예에서, crRNA는 스템 루프, 바람직하게는 단일 스템 루프를 포함한다. 특정 구현예에서, 직접 반복 서열은 스템 루프, 바람직하게는 단일 스템 루프를 형성한다.
특정 구현예에서, 가이드 RNA의 스페이서 길이는 15 내지 35 nt이다. 특정 구현예에서, 가이드 RNA의 스페이서 길이는 적어도 15 개 뉴클레오티드, 바람직하게는 적어도 18 nt, 예를 들어 적어도 19, 20, 21, 22 이상 nt이다. 특정 구현예에서, 스페이서 길이는 15 내지 17 nt, 예를 들어 15, 16 또는 17 nt, 17 내지 20 nt, 예를 들어 17, 18, 19 또는 20 nt, 20 내지 24 nt, 예를 들어 20, 21, 22, 23, 또는 24 nt, 23 내지 25 nt, 예를 들어 23, 24 또는 25 nt, 24 내지 27 nt, 예를 들어 24, 25, 26 또는 27 nt, 27 내지 30 nt, 예를 들어 27, 28, 29, 또는 30 nt, 30 내지 35 nt, 예를 들어 30, 31, 32, 33, 34, 또는 35 nt, 또는 35 nt 이상이다.
출원인은 또한 RNA 표적화 및 절단 능력을 검증하기 위한 도전 실험을 실행한다. 이 실험은 StCas9의 이종성 발현을 위한 에스케리키아 콜라이에서의 유사한 연구와 거의 유사하다(문헌[Sapranauskas, R. et al. Nucleic acids Res 39, 9275-9282(2011)]). 출원인은 이종성 에스케리키아 콜라이 내로 PAM 및 내성 유전자 둘 다를 함유하는 플라스미드를 도입한 다음, 해당하는 항생제 상에 플레이팅한다. 플라스미드 전사된 내성 유전자의 RNA 절단이 있는 경우, 출원인은 생존 콜로니를 관찰하지 않는다.
보다 상세하게, DNA 표적에 대하여 분석은 다음과 같으나, RNA 표적에 대하여 그에 따라 조정될 수 있다. 2 가지 에스케리키아 콜라이 균주가 이 분석에서 사용된다. 하나는 박테리아 균주 유래의 내인성 이펙터 단백질 유전자좌를 인코딩하는 플라스미드를 보유한다. 나머지 균주는 빈 플라스미드(예를 들어, pACYC184, 대조 균주)를 보유한다. 가능한 모든 7 bp 또는 8 bp PAM 서열을 항생제 내성 플라스미드(암피실린 내성 유전자를 갖는 pUC19) 상에 제시한다. PAM은 프로토-스페이서 1의 서열(내인성 이펙터 단백질 유전자좌에서 제1 스페이서에 대한 DNA 표적) 옆에 위치한다. 2 개의 PAM 라이브러리를 클로닝하였다. 하나는 프로토-스페이서의 8 랜덤 bp 5'를 갖는다(예를 들어, 총 65536 개의 상이한 PAM 서열 = 복잡성). 나머지 라이브러리는 프로토-스페이서의 7 랜덤 bp 3'를 갖는다(예를 들어, 총 복잡성은 16384 개의 상이한 PAM임). 둘 모두의 라이브러리가 가능한 PAM 당 평균 500 개의 플라스미드를 갖도록 클로닝되었다. 시험 균주 및 대조 균주를 별도의 형질전환에서 5'PAM 및 3'PAM 라이브러리로 형질전환하고, 형질전환된 세포를 암피실린 플레이트 상에 별도로 플레이팅하였다. 플라스미드를 이용한 인식 및 후속 절단/간섭은 세포를 암피실린에 취약하게 만들고 성장을 방지한다. 대략 형질전환 12 시간 후, 시험 및 대조 균주에 의해 형성된 모든 콜로니를 수확하고 플라스미드 DNA를 분리하였다. 플라스미드 DNA를 PCR 증폭 및 후속 딥 시퀀싱을 위한 주형으로서 사용하였다. 비형질전환 라이브러리에서 모든 PAM의 표시는 형질전환된 세포에서의 예상된 PAM의 표시를 나타내었다. 대조 균주에서 발견된 모든 PAM의 표시는 실제 표시를 나타내었다. 시험 균주에서 모든 PAM의 표시는 어떤 PAM이 효소에 의해 인식되지 않는지를 나타내었고 대조 균주와의 비교는 손실된 PAM의 서열을 추출할 수 있게 한다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 핵산-표적화 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. 핵산-표적화 가이드 RNA의 최적 농도는 세포 또는 비-인간 진핵 생물 동물 모델에서 상이한 농도를 시험함으로써, 그리고 잠재적인 표적외 게놈 유전자좌에서의 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 표적외 변형 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도는 생체내 전달을 위해 선택되어야 한다. 핵산-표적화 시스템은 유리하게 제VI형 CRISPR 시스템으로부터 유래된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 RNA-표적화 시스템을 포함하는 특정 생물로부터 유래한다. 구체적인 구현예에서, 제VI형 RNA-표적화 Cas 효소는 C2c2이다. Cas 단백질의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(또한 Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 상동체, 또는 이의 변형된 형태를 포함한다. 일 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질은 또한 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그를 포함한다. 용어 "오솔로그(orthologue)"(또한 본 명세서에서 "오솔로그(ortholog)"로 지칭됨) 및 "상동체(homologue)"(또한 본 명세서에서 "상동체(homolog)"로 지칭됨)는 당업계에 잘 공지되어 있다. 추가 지침에 의해, 본 명세서에서 사용된 단백질의 "상동체"는 이의 상동체인 단백질과 동일 또는 유사한 기능을 실행하는 동일 종의 단백질이다. 상동성 단백질은 구조적으로 관련될 수 있지만 관련될 필요는 없거나, 부분적으로만 구조적으로 관련된다. 구체적인 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그는 C2c2와 같은 제VI형 단백질과 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 예를 들어 적어도 95%와 같은 서열 상동성 또는 동일성을 갖는다. 추가의 구현예에서, 본 명세서에서 지칭된 C2c2와 같은 제VI형 단백질의 상동체 또는 오솔로그는 C2c2와 같은 야생형 제VI형 단백질과 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 예를 들어 적어도 95%와 같은 서열 상동성 또는 동일성을 갖는다.
일 구현예에서, 제VI형 RNA-표적화 Cas 단백질은 렙토트리키아, 리스테리아, 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팍토(Filifactor), 유박테리움, 스트렙토코커스, 락토바실러스(Lactobacillus), 미코플라스마(Mycoplasma), 박테로이데스, 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코커스(Staphylococcus), 니트라티프락토(Nitratifractor), 미코플라스마 및 캄필로박터를 포함하지만 이에 한정되지 않는 속의 생물의 C2c2 오솔로그일 수 있다. 이러한 속의 생물의 종은 본 명세서에서 다르게 논의될 수 있다.
CRISPR-Cas 시스템 효소의 오솔로그를 확인하는 일부 방법은 관심 게놈에서 tracr 서열을 확인하는 것을 수반할 수 있다. tracr 서열의 확인은 다음 단계와 관련될 수 있다: 데이터베이스에서 직접 반복 또는 tracr 메이트 서열을 검색하여 CRISPR 효소를 포함하는 CRISPR 영역을 확인하는 단계. 센스 및 안티센스 방향 둘 다에서 CRISPR 효소의 측면에 배치하는 CRISPR 영역에서 상동성 서열을 검색하는 단계. 전사 종결자 및 2차 구조를 조사하는 단계. 직접 반복 또는 tracr 메이트 서열은 아니지만, 잠재적인 tracr 서열로서 직접 반복 또는 tracr 메이트 서열에 대해 50% 초과의 동일성을 갖는 임의의 서열을 확인하는 단계. 잠재적인 tracr 서열을 취하고, 이와 연관된 전사 종결자 서열에 대해 분석하는 단계.
본 명세서에서 기재된 임의의 기능성은 다수의 오솔로그 유래의 단편을 포함하는 키메라 효소를 포함하는, 다른 오솔로그 유래의 CRISPR 효소로 조작될 수 있음이 이해될 것이다. 이와 같은 오솔로그의 예는 본 명세서의 다른 곳에 기재되어 있다. 따라서, 키메라 효소는 렙토트리키아, 리스테리아, 코리네박터, 수테렐라, 레지오넬라, 트레포네마, 필리팍토르, 유박테리움, 스트렙토코커스, 락토바실러스, 미코플라스마, 박테로이데스, 플라비볼라, 플라보박테리움, 스파에로카에타, 아조스피릴룸, 글루콘아세토박터, 네이세리아, 로세부리아, 파르비바쿨룸, 스타필로코커스, 니트라티프락토르, 미코플라스마 및 캄필로박터를 포함하지만, 이에 한정되지 않은 생물의 CRISPR 효소 오솔로그의 단편을 포함할 수 있다. 키메라 효소는 본 명세서에서 언급된 속 또는 본 명세서에서 언급된 종의 생물의 CRISPR 효소 오솔로그일 수 있으며; 유리하게 단편은 상이한 종의 CRISPR 효소 오솔로그 유래의 것이다.
구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 본 명세서에서 언급된 바와 같은 C2c2 단백질은 또한 C2c2의 기능적 변이체 또는 이의 상동체 또는 오솔로그를 포함한다. 본 명세서에서 사용된 바와 같은 단백질의 "기능적 변이체"는 그 단백질의 활성을 적어도 부분적으로 보유하는 단백질의 변이체를 지칭한다. 기능적 변이체는 돌연변이체(이는 삽입, 결실, 또는 치환 돌연변이체일 수 있음)를 포함할 수 있으며, 이는 다형체 등을 포함한다. 또한, 기능적 변이체 내에는 또 다른, 보통 관련되지 않은, 핵산, 단백질, 폴리펩티드 또는 펩티드와 이와 같은 단백질의 융합 생성물이 포함된다. 기능적 변이체는 천연적으로 발생할 수 있거나 인공적일 수 있다. 유리한 구현예는 설계 제작된 또는 비-천연 발생 제VI형 RNA-표적화 이펙터 단백질을 수반할 수 있다.
본 발명의 일 구현예에서, 렙토트리키아 샤히C2c2, 라크노스피라세아에 박테리움 MA2020 C2c2, 라크노스피라세아에 박테리움 NK4A179 C2c2, 클로스트리디움 아미노필룸(DSM 10710) C2c2, 카르노박테리움 갈리나룸(DSM 4847) C2c2, 팔루디박터 프로피오니시게네스(WB4) C2c2, 리스테리아 웨이헨스테파넨시스(FSL R9-0317) C2c2, 리스테리아세아에 박테리움(FSL M6-0635) C2c2, 리스테리아 뉴요켄시스(FSL M6-0635) C2c2, 렙토트리키아 와데이(F0279) C2c2, 로도박터 캅술라투스(SB 1003) C2c2, 로도박터 캅술라투스(R121) C2c2, 로도박터 캅술라투스(DE442) C2c2, 렙토트리키아 와데이(Lw2) C2c2, 리스테리아 세엘리게리 C2c2 중 임의의 것의 야생형 서열에 대해 적어도 80% 서열 상동성을 갖는 아미노산 서열을 포함하는 이펙터 단백질이 제공된다.
본 발명의 일 구현예에서, 이펙터 단백질은 본 명세서에 기재된 컨센서스 서열을 포함하지만 이에 한정되지 않는 제VI형 이펙터 단백질 컨센서스 서열에 대해 적어도 80%의 서열 상동성을 갖는 아미노산 서열을 포함한다.
본 발명의 일 구현예에서, 이펙터 단백질은 본 명세서에 기재된 HEPN 도메인, 당업계에 공지된 HEPN 도메인 및 컨센서스 서열 및 모티프와 비교하여 HEPN 도메인으로 인식되는 도메인을 포함하지만 이에 한정되지 않는 적어도 하나의 HEPN 도메인을 포함한다. 몇몇의 이러한 도메인이 본 명세서에 제공된다. 하나의 비-제한적인 예에서, 컨센서스 서열은 본 명세서에서 제공된 C2c2 오솔로그의 서열로부터 유래될 수 있다.
본 발명의 일 구현예에서, 이펙터 단백질은 RxxxxH 모티프 서열을 포함하는 하나 이상의 HEPN 도메인을 포함한다. RxxxxH 모티프 서열은, 제한없이, 본 명세서에 기재된 HEPN 도메인 또는 당업계에 공지된 HEPN 도메인 유래일 수 있다. RxxxxH 모티프 서열은 2 개 이상의 HEPN 도메인의 부분을 조합함으로써 생성된 모티프 서열을 추가로 포함한다. 언급된 바와 같이, 컨센서스 서열은 US 62/432,240(BI-10035)에 개시된 15 개의 오솔로그의 서열로부터 유래될 수 있다. 예를 들어, 상기 서열 정렬로부터, 제1 HEPN 도메인은 R{N/H}xxxH 모티프를 포함하는 반면 제2 HEPN 도메인은 R{N/K}xxxH 모티프를 포함한다.
본 발명의 일 구현예에서, HEPN 도메인은 R{N/H/K}X1X2X3H의 서열을 포함하는 적어도 하나의 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/H}X1X2X3H의 서열을 포함하는 RxxxxH 모티프를 포함한다. 본 발명의 일 구현예에서, HEPN 도메인은 R{N/K}X1X2X3H의 서열을 포함한다. 특정 구현예에서, X1는 R, S, D, E, Q, N, G, Y, 또는 H이다. 특정 구현예에서, X2는 I, S, T, V 또는 L이다. 특정 구현예에서, X3은 L, F, N, Y, V, I, S, D, E 또는 A이다.
본 발명에 따른 사용을 위한 추가적인 이펙터는 이에 한정되지 않음에도 예를 들어 cas1 유전자의 시작으로부터 20 kb 및 cas1유전자의 말단으로부터 20 kb 영역 내에서 cas1 유전자와의 근접성에 의해 식별될 수 있다. 특정 구현예에서, 이펙터 단백질은 적어도 1 개의 HEPN 도메인 및 적어도 500 개의 아미노산을 포함하고, 여기서 C2c2 이펙터 단백질은 Cas1 유전자 또는 CRISPR 어레이의 업스트림 또는 다운스트림 20 kb 내의 원핵 게놈에 천연적으로 존재한다.
일 구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 C2c2 또는 이의 오솔로그 또는 상동체를 인코딩하는 핵산 분자(들)는 진핵 세포에서 발현을 위해 코돈 최적화될 수 있다. 진핵 생물은 본 명세서에 논의된 바와 같을 수 있다. 핵산 분자(들)는 설계 제작되거나 비-천연적으로 발생할 수 있다.
일 구현예에서, 제VI형 RNA-표적화 이펙터 단백질, 특히 C2c2 또는 이의 오솔로그 또는 상동체는 하나 이상의 돌연변이를 포함할 수 있다(그리고 따라서 이들을 코딩하는 핵산 분자(들)은 돌연변이(들)를 포함할 수 있다). 돌연변이는 인위적으로 도입된 돌연변이일 수 있으며, 촉매 도메인에 하나 이상의 돌연변이를 포함할 수 있지만, 이에 한정되지 않는다. Cas9 효소에 관한 촉매 도메인의 예는 RuvC I, RuvC II, RuvC III 및 HNH 도메인을 포함할 수 있지만, 이에 한정되지 않는다.
일 구현예에서, C2c2 또는 그의 오솔로그 또는 상동체와 같은 제VI형 단백질은 하나 이상의 돌연변이를 포함할 수 있다. 돌연변이는 인위적으로 도입된 돌연변이일 수 있으며, 촉매 도메인에서의 하나 이상의 돌연변이를 포함할 수 있으나, 이에 한정되지 않는다. Cas 효소에 관한 촉매 도메인의 예는 HEPN 도메인을 포함할 수 있지만 이에 한정되지 않는다.
일 구현예에서, 제VI형 단백질, 예를 들어 C2c2 또는 이의 오솔로그 또는 상동체는 기능성 도메인에 융합되거나 작동 가능하게 연결된 총칭적인 핵산 결합 단백질로서 사용될 수 있다. 예시적인 기능성 도메인은 번역 개시제, 번역 활성화제, 번역 억제제, 뉴클레아제, 특히 리보뉴클레아제, 스플라이세오좀(spliceosome), 비드, 광 유도성/제어성 도메인 또는 화학적 유도성/제어성 도메인을 포함할 수 있지만, 이에 한정되지 않는다.
일부 구현예에서, 비-변형된 핵산-표적화 이펙터 단백질은 절단 활성을 가질 수 있다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 표적 서열의 위치에서 또는 그 가까이에서, 예를 들어 표적 서열 내 및/또는 표적 서열의 상보체 내 또는 표적 서열과 연관된 서열에서, 1 개 또는 2 개의 핵산(DNA 또는 RNA) 가닥의 절단을 지시할 수 있다. 일부 구현예에서, 핵산-표적화 Cas 단백질은, 표적 서열의 제1 또는 최종 뉴클레오티드로부터의 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 50, 100, 200, 500 개 이상의 염기쌍 내에서 1 개 또는 2 개의 DNA 또는 RNA 가닥의 절단을 지시할 수 있다. 일부 구현예에서, 벡터는, 돌연변이된 핵산-표적화 Cas 단백질이 표적 서열을 함유하는 표적 폴리뉴클레오티드의 RNA 가닥을 절단하는 능력이 결여되도록 해당하는 야생형 효소와 관련하여 돌연변이될 수 있는 핵산-표적화 Cas 단백질을 인코딩한다. 추가 예로서, Cas의 2 개 이상의 촉매 도메인(예를 들어, HEPN 도메인)은 돌연변이되어 모든 RNA 절단 활성이 실질적으로 결여된 돌연변이된 Cas를 생성할 수 있다. 일부 실시형태에서, 돌연변이된 효소의 RNA 절단 활성이 효소의 비-돌연변이 형태의 핵산 절단 활성의 약 25%, 10%, 5%, 1%, 0.1%, 0.01% 이하, 또는 그 미만인 경우, 핵산-표적화 이펙터 단백질은 모든 RNA 절단 활성이 실질적으로 결여된 것으로 간주될 수 있으며; 예는, 돌연변이된 형태의 핵산 절단 활성이 0이거나 비-돌연변이된 형태에 비하여 무시해도 될 정도인 경우일 수 있다. 이펙터 단백질은 제VI형 CRISPR 시스템 유래의 다수 뉴클레아제 도메인을 갖는 가장 큰 뉴클레아제에 대하여 상동성을 공유하는 일반적인 부류의 효소를 참조하여 확인될 수 있다. 가장 바람직하게, 이펙터 단백질은 제VI형 단백질, 예를 들어 C2c2이다. 유래됨은, 유래된 효소가 야생형 효소와 높은 정도의 서열 상동성을 갖는 의미에서 크게 기반으로 하지만, 당업계에 공지되거나 본 명세서에 기재된 바와 같은 일부 방법으로 돌연변이된(변형된) 것을 출원인은 의미한다.
다시, 용어 Cas 및 CRISPR 효소 및 CRISPR 단백질 및 Cas 단백질은 일반적으로 상호교환 가능하게 사용되며, Cas9에 대한 특정 언급에 의한 것과 같이 본 명세서에서 달리 명백하지 않다면, 본 명세서에서의 언급한 모든 점은 본 출원에서 추가로 기재된 신규 CRISPR 이펙터 단백질에 대한 유사성을 언급하는 것으로 이해될 것이다. 상기 언급된 바와 같이, 본 명세서에서 사용된 많은 잔기의 넘버링은 제VI형 CRISPR 유전자좌로부터의 이펙터 단백질을 지칭한다. 그러나, 본 발명은 미생물의 다른 종로부터의 다수의 더 많은 이펙터 단백질을 포함한다는 것이 이해될 것이다. 특정 구현예에서, Cas는 구성적으로 존재하거나 유도성으로 존재하거나, 조건부로 존재하거나 투여되거나 전달될 수 있다. Cas 최적화를 사용하여 기능을 향상시키거나 새로운 기능을 발생시킬 수 있으며, 키메라 Cas 단백질을 생성할 수 있다. 그리고 Cas는 총칭적인 핵산 결합 단백질로 사용될 수 있다.
통상적으로, 내인성 핵산-표적화 시스템의 맥락에서(표적 서열에 혼성화되고 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함하는), 핵산-표적화 복합체의 형성은, 표적 서열 내 또는 가까이에서(예를 들어, 그로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500 개 이상의 염기쌍 내) 1 개 또는 2 개의 DNA 또는 RNA 가닥의 절단을 초래한다. 본 명세서에서 사용된 바와 같이, 용어 "관심 표적 유전자와 관련된 서열(들)"은 표적 서열의 부근 가까이의(예를 들어, 표적 서열로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 500 개 이상의 염기쌍 내, 여기서 표적 서열은 관심 표적 유전자좌 내에 포함됨) 서열을 지칭한다.
코돈 최적화된 서열의 예는, 이러한 예에서, 진핵생물, 예를 들어 인간(즉, 인간에서의 발현을 위해 최적화됨), 또는 본 명세서에서 논의된 바와 같은 또 다른 진핵생물, 동물 또는 포유류에서의 발현을 위해 최적화된 서열이며; 예를 들어, 코돈 최적화된 서열의 예로서 WO 2014/093622(PCT/US2013/074667)에서의 SaCas9 인간 코돈 최적화 서열을 참조한다(당업계 및 본 개시 내용의 지식으로부터, 특히 이펙터 단백질(예를 들어, C2c2)에 대해, 핵산 분자(들)를 코딩하는 코돈 최적화는 당업자의 범위 내에 있다). 이것이 바람직하지만, 다른 예들도 가능하며, 인간 이외의 숙주 종에 대한 코돈 최적화, 또는 특정 기관에 대한 코돈 최적화가 공지되어 있다는 것이 이해될 것이다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 효소 코딩 서열은 진핵 세포와 같은 특정 세포에서의 발현에 대해 코돈 최적화된다. 진핵 세포는, 구체적인 생물, 예를 들어 인간 또는 본 명세서에서 논의된 바와 같은 비-인간 진핵생물 또는 동물 또는 포유동물, 예를 들어 마우스, 래트, 토끼, 개, 가축 또는 비-인간 포유동물 또는 영장류(이에 한정되지 않음)를 포함하는 포유동물의 것이거나 또는 그로부터 유래될 수 있다. 일부 구현예에서, 인간이나 동물에 임의의 실질적인 의학적 이익 없이 그들을 고통스럽게 할 수 있는 인간의 생식계열 유전자 동일성을 변형하기 위한 과정 및/또는 동물의 유전자 동일성을 변형하기 위한 과정과, 또한 이와 같은 과정으로부터 생긴 동물이 배제될 수 있다. 일반적으로, 코돈 최적화는 고유 아미노산 서열을 유지하면서, 고유 서열의 적어도 하나의 코돈(예를 들어, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상, 또는 그를 초과하는 코돈)을 숙주 세포의 유전자에 더 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체함으로써, 관심 숙주 세포에서의 발현의 향상을 위해 핵산 서열을 변형시키는 과정을 지칭한다. 다양한 종은 특정 아미노산의 특정 코돈에 대하여 특정 편향을 나타낸다. 코돈 편향(생물 간의 코돈 사용의 차이)은 종종 메신저 RNA(mRNA)의 번역의 효율과 상관관계가 있으며, 이는 결국, 특히, 번역되는 코돈의 특성 및 특정 운반 RNA(tRNA) 분자의 이용 가능성에 좌우되는 것으로 여겨진다. 세포에서의 선택된 tRNA의 우세는 일반적으로 펩티드 합성에 가장 빈번하게 사용되는 코돈을 반영하는 것이다. 따라서, 유전자는 코돈 최적화를 기반으로 하여 주어진 생물에서의 최적의 유전자 발현을 위해 맞춤화될 수 있다. 코돈 사용 표는, 예를 들어 www.kazusa.orjp/codon/에서 이용 가능한 "코돈 사용 데이터베이스"에서 용이하게 이용 가능하며, 이 표는 다수의 방식으로 적합하게 될 수 있다. 문헌[Nakamura, Y., et al. “Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28:292(2000)]을 참조한다. 특정 숙주 세포에서의 발현을 위해 특정 서열을 코돈 최적화시키는 컴퓨터 알고리즘이 또한 이용 가능하며, 예를 들어 Gene Forge(Aptagen; 미국 펜실베이니아주 야코부스)도 또한 이용 가능하다. 일부 구현예에서, DNA/RNA-표적화 Cas 단백질을 인코딩하는 서열 내의 하나 이상의 코돈(예를 들어, 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 개 이상의, 또는 모든 코돈)은 특정 아미노산에 대하여 가장 빈번하게 사용되는 코돈에 해당한다.
일부 구현예에서, 벡터는 하나 이상의 핵 국소화 서열(NLS) 또는 핵 방출 서열(NES), 예를 들어 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES를 포함하는 C2c2와 같은 핵산-표적화 이펙터 단백질, 또는 이의 오솔로그 또는 상동체를 인코딩한다. 일부 구현예에서, RNA-표적화 이펙터 단백질은 아미노-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES, 카르복시-말단 또는 그 근처에 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 NLS 또는 NES, 또는 이들의 조합(예를 들어 아미노-말단에서 0 개 또는 적어도 1 개 이상의 NLS 또는 NES, 그리고 카르복시 말단에서 0 개 또는 적어도 1 개 이상의 NLS 또는 NES)을 포함한다. 1 개 초과의 NLS 또는 NES가 존재하는 경우, 각각은 단일의 NLS 또는 NES가 1 개 초과의 복제물로 존재하고/존재하거나 1 개 이상의 복제물로 존재하는 1 개 이상의 다른 NLS 또는 NES와 조합될 수 있도록, 다른 것들로부터 독립적으로 선택될 수 있다. 일부 구현예에서, NLS 또는 NES는 NLS 또는 NES의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩티드 사슬을 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 개 이상의 아미노산 내에 존재하는 경우, N- 또는 C-말단 근처에 있는 것으로 간주된다. NLS의 비제한적인 예는 하기로부터 유래된 NLS 서열을 포함한다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK. 일반적으로, 하나 이상의 NLS 또는 NES는 진핵 세포의 핵 또는 세포질 각각에서 검출 가능한 양의 DNA/RNA-표적화 Cas 단백질의 축적을 유도하기에 충분한 세기의 것이다. 일반적으로, 핵/세포질 국소화 활성의 세기는 핵산-표적화 이펙터 단백질 내 NLS 또는 NES의 수, 사용되는 특정 NLS(들) 또는 NES(들), 또는 이들 인자의 조합으로부터 유래할 수 있다. 핵/세포질에서의 축적의 검출은 임의의 적합한 기법에 의해 실행될 수 있다. 예를 들어, 검출 가능한 마커는, 예를 들어 핵(예를 들어, 핵에 특이적인 염색제, 예를 들어 DAPI) 또는 세포질의 위치를 검출하기 위한 수단과 함께, 세포 내의 위치가 가시화될 수 있도록, 핵산-표적화 단백질에 융합될 수 있다. 세포 핵을 또한 세포로부터 분리할 수 있으며, 그 다음 이의 내용물을 단백질을 검출하기 위한 임의의 적합한 과정, 예를 들어 면역조직화학, 웨스턴 블롯, 또는 효소 활성 분석에 의해 분석할 수 있다. 또한 핵/세포질에서의 축적은, 핵산-표적화 Cas 단백질 또는 핵산-표적화 복합체에 노출되지 않거나, 하나 이상의 NLS 또는 NES가 결여된 핵산-표적화 Cas 단백질에 노출된 대조군에 비하여, 간접적으로, 예를 들어 핵산-표적화 복합체 형성의 영향에 대한 분석(예를 들어, 표적 서열에서의 RNA 절단 또는 돌연변이에 대한 분석, 또는 RNA-표적화 복합체 형성 및/또는 RNA-표적화 Cas 단백질 활성에 의해 영향을 받는 변경된 유전자 발현 활성에 대한 분석)에 의해 결정될 수 있다. 본 명세서에 기재된 C2c2 이펙터 단백질 복합체 및 시스템의 바람직한 구현예에서, 코돈 최적화된 C2c2 이펙터 단백질은 단백질의 C-말단에 부착된 NLS 또는 NES를 포함한다.
일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 구동하는 하나 이상의 벡터는, 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 지시하도록 숙주 세포 내로 도입된다. 예를 들어, 핵산-표적화 이펙터 효소 및 핵산-표적화 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 핵산-표적화 시스템의 RNA(들)는 유전자 도입 핵산-표적화 이펙터 단백질 동물 또는 포유동물, 예를 들어 핵산-표적화 이펙터 단백질을 구조적으로 또는 유도적으로 또는 조건적으로 발현하는 동물 또는 포유동물; 또는 그렇지 않으면 핵산-표적화 이펙터 단백질을 발현하거나 핵산-표적화 이펙터 단백질을 함유하는 세포를 갖는 동물 또는 포유동물에게, 예를 들어 생체내 핵산-표적화 이펙터 단백질을 코딩하고 발현하는 벡터 또는 벡터들을 이에 사전 투여함으로써 전달될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소는, 제1 벡터 내에 포함되지 않은 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터들과 단일 벡터로 조합될 수 있다. 단일 벡터로 조합된 핵산-표적화 시스템 요소는 임의의 적합한 배향으로, 예를 들어 제2의 요소에 대하여 5'(제2의 요소의 "업스트림") 또는 3'(제2의 요소의 "다운스트림")에 위치되어 배열될 수 있다. 하나의 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일한 가닥 또는 반대의 가닥에 위치될 수 있고, 동일하거나 반대의 방향으로 배향될 수 있다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된(예를 들어, 상이한 인트론 내 각각, 적어도 하나의 인트론 내 둘 이상, 또는 단일 인트론 내 모두), 핵산-표적화 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 구동한다. 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 핵산-표적화 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현될 수 있다. 핵산-표적화 시스템의 하나 이상의 요소의 발현을 위한 전달 비히클, 벡터, 입자, 나노입자, 제형 및 그의 성분은 이전의 문헌, 예를 들어 WO 2014/093622(PCT/US2013/074667)에서 사용된 바와 같다. 일부 구현예에서, 벡터는 하나 이상의 삽입 부위, 예를 들어 제한 엔도뉴클레아제 인식 서열(또한 "클로닝 부위"로서 지칭됨)을 포함한다. 일부 구현예에서, 하나 이상의 삽입 부위(예를 들어, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 삽입 부위)가 하나 이상의 벡터의 하나 이상의 서열 요소의 업스트림 및/또는 다운스트림에 위치된다. 일부 구현예에서, 벡터는 2 개 이상의 삽입 부위를 포함하여, 각각의 부위에서 가이드 서열의 삽입이 가능하게 한다. 이러한 배열에서, 2 개 이상의 가이드 서열은 단일 가이드 서열의 2 개 이상의 카피, 2 개 이상의 상이한 가이드 서열 또는 이들의 조합을 포함할 수 있다. 다수의 상이한 가이드 서열이 사용된 경우, 핵산-표적화 활성을 세포 내에서 다수의 상이한 해당하는 표적 서열로 표적화하는 데 단일 발현 작제물이 사용될 수 있다. 예를 들어, 단일 벡터는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 개 이상, 또는 이를 초과하는 가이드 서열을 포함할 수 있다. 일부 구현예에서, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상, 또는 이를 초과하는 이와 같은 가이드-서열 함유 벡터가 제공될 수 있으며, 선택적으로 세포로 전달될 수 있다. 일부 구현예에서, 벡터는 핵산-표적화 이펙터 단백질을 인코딩하는 효소-코딩 서열에 작동 가능하게 연결된 조절 요소를 포함한다. 핵산-표적화 이펙터 단백질 또는 핵산-표적화 가이드 RNA 또는 RNA(들)는 개별적으로 전달될 수 있으며; 유리하게는 이들 중 적어도 하나가 입자 또는 나노입자 복합체를 통해 전달된다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 이펙터 단백질이 발현될 시간을 제공하기 위하여 핵산-표적화 가이드 RNA 이전에 전달될 수 있다. 핵산-표적화 이펙터 단백질 mRNA는 핵산-표적화 가이드 RNA의 투여 전 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있을 것이다. 대안적으로, 핵산-표적화 이펙터 단백질 mRNA 및 핵산-표적화 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 핵산-표적화 이펙터 단백질 mRNA + 가이드 RNA의 초기 투여 후 1 시간 내지 12 시간(바람직하게는 약 2 시간 내지 6 시간)에 투여될 수 있다. 핵산-표적화 이펙터 단백질 mRNA 및/또는 가이드 RNA의 추가적인 투여는 게놈 및/또는 트랜스크립톰 변형의 가장 효율적인 수준을 달성하는 데 유용할 수 있다.
일 양태에서, 본 발명은 핵산-표적화 시스템의 하나 이상의 요소의 사용 방법을 제공한다. 본 발명의 핵산-표적화 복합체는 표적 RNA를 변형시키기 위한 효율적인 수단을 제공한다. 본 발명의 핵산-표적화 복합체는 다수의 세포 유형에서 표적 RNA를 변형시키는(예를 들어, 결실시키는, 삽입하는, 전위시키는, 비활성화시키는, 활성화시키는) 것을 포함하는 매우 다양한 유용성을 갖는다. 이와 같이, 본 발명의 핵산-표적화 복합체는, 예를 들어 유전자 치료법, 약물 스크리닝, 질병 진단 및 예후에서 광범위한 적용을 갖는다. 예시적인 핵산-표적화 복합체는 관심 표적 유전자좌 내의 표적 서열에 혼성화되는 가이드 RNA와 복합체화되는 RNA-표적화 이펙터 단백질을 포함한다.
일 구현예에서, 본 발명은 표적 RNA를 절단하는 방법을 제공한다. 상기 방법은 표적 RNA와 결합하여 상기 표적 RNA의 절단을 행하는 핵산-표적화 복합체를 사용하여 표적 RNA를 변형하는 것을 포함한다. 일 구현예에서, 본 발명의 핵산-표적화 복합체는, 세포 내에 도입되는 경우, RNA 서열 중에 손상(예를 들어, 단일 또는 이중 가닥 손상)을 생성할 수 있다. 예를 들어, 상기 방법은 세포에서 질병 RNA를 절단하기 위하여 사용될 수 있다. 예를 들어, 업스트림 서열과 다운스트림 서열이 측면에 배치된 통합될 서열을 포함하는 외인성 RNA 주형이 세포 내에 도입될 수 있다. 업스트림 서열과 다운스트림 서열은 RNA 내의 통합 부위의 어느 측과 서열 유사성을 공유한다. 원하는 경우, 공여자 RNA는 mRNA일 수 있다. 외인성 RNA 주형은 통합될 서열(예를 들어, 돌연변이된 RNA)을 포함한다. 통합을 위한 서열은 세포에 대해 내인성 또는 외인성인 서열일 수 있다. 통합될 서열의 예는 단백질을 인코딩하는 RNA 또는 비-코딩 RNA(예를 들어, 마이크로RNA)를 포함한다. 따라서, 통합을 위한 서열은 적절한 제어 서열 또는 서열들에 작동 가능하게 연결될 수 있다. 대안적으로, 통합될 서열은 조절 기능을 제공할 수 있다. 외인성 RNA 주형에서 업스트림 및 다운스트림 서열은 관심 RNA 서열과 공여자 RNA 사이의 재조합을 촉진하도록 선택된다. 업스트림 서열은 통합을 위해 표적화된 부위의 업스트림 RNA 서열과 서열 유사성을 공유하는 RNA 서열이다. 유사하게, 다운스트림 서열은 통합의 표적화된 부위의 다운스트림 RNA 서열과 서열 유사성을 공유하는 RNA 서열이다. 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 75%, 80%, 85%, 90%, 95%, 또는 100% 서열 동일성을 가질 수 있다. 바람직하게, 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 약 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 갖는다. 일부 방법에서, 외인성 RNA 주형의 업스트림 및 다운스트림 서열은 표적화된 RNA 서열과 약 99% 또는 100% 서열 동일성을 갖는다. 업스트림 또는 다운스트림 서열은 약 20 bp 내지 약 2500 bp, 예를 들어 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 또는 2500 bp를 포함할 수 있다. 일부 방법에서, 예시적인 업스트림 또는 다운스트림 서열은 약 200 bp 내지 약 2000 bp, 약 600 bp 내지 약 1000 bp, 또는 더 구체적으로 약 700 bp 내지 약 1000 bp를 갖는다. 일부 방법에서, 외인성 RNA 주형은 마커를 추가로 포함할 수 있다. 이와 같은 마커는 표적화된 통합의 스크리닝을 용이하게 할 수 있다. 적합한 마커의 예는 제한 부위, 형광 단백질, 또는 선택성 마커를 포함한다. 본 발명의 외인성 RNA 주형은 재조합 기법을 사용하여 작제될 수 있다(예를 들어, 문헌[Sambrook et al., 2001] 및 문헌[Ausubel et al., 1996] 참조). 외인성 RNA 주형을 통합함으로써 표적 RNA를 변형하는 방법에서, 손상(예를 들어 이중 또는 단일 가닥 DNA 또는 RNA에서 이중 또는 단일 가닥 손상)이 핵산-표적화 복합체에 의해서 DNA 또는 RNA 서열에 도입되며, 이 손상은 주형이 RNA 표적에 통합되도록 외인성 RNA 주형의 상동성 재조합을 통해서 수복된다. 이중-가닥 손상의 존재는 주형의 통합을 촉진한다. 다른 구현예에서, 본 발명은 진핵 세포에서 RNA의 발현을 변형하는 방법을 제공한다. 상기 방법은 RNA(예를 들어, mRNA 또는 pre-mRNA)에 결합하는 핵산-표적화 복합체를 사용하여 표적 폴리뉴클레오티드의 발현을 증가시키거나 감소시키는 단계를 포함한다. 일부 방법에서, 표적 RNA는 세포에서 발현의 변형을 행하기 위해 비활성화될 수 있다. 예를 들어, 세포에서 RNA-표적화 복합체와 표적 서열의 결합시, 표적 RNA가 비활성화되며, 이로써 서열이 번역되지 않거나, 코딩된 단백질이 생성되지 않거나, 또는 서열이 야생형 서열처럼 기능하지 않는다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은 단백질 또는 마이크로RNA 또는 예비-마이크로RNA 전사물이 생성되지 않도록 비활성화될 수 있다. RNA-표적화 복합체의 표적 RNA는 진핵 세포에 내인성이거나 외인성인 임의의 RNA일 수 있다. 예를 들어, 표적 RNA는 진핵 세포의 핵에 존재하는 RNA일 수 있다. 표적 RNA는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열(예를 들어, mRNA 또는 pre-mRNA) 또는 비-코딩 서열(예를 들어, ncRNA, lncRNA, tRNA, 또는 rRNA)일 수 있다. 표적 RNA의 예는 신호화 생화학 경로와 연관된 서열, 예를 들어 신호화 생화학적 경로-연관 RNA를 포함한다. 표적 RNA의 예는 질병 관련 RNA를 포함한다. "질병-관련" RNA는 질병이 없는 대조군의 조직 또는 세포에 비하여, 질병-발생 조직으로부터 유래된 세포에서 비정상적인 수준 또는 비정상적인 형태로 번역 산물을 생성하는 임의의 RNA를 지칭한다. 그것은 비정상적으로 높은 수준으로 발현되는 유전자로부터 전사된 RNA일 수 있으며; 그것은 비정상적으로 낮은 수준으로 발현되는 유전자로부터 전사된 RNA일 수 있고, 여기서 변경된 발현은 질병의 발생 및/또는 진행과 상관관계가 있다. 또한, 질병-관련 RNA는 질병의 병인에 직접적인 원인이 있거나, 그에 원인이 있는 유전자(들)와 연관 불균형이 있는 돌연변이(들) 또는 유전적 변이를 갖는 유전자로부터 전사된 RNA를 지칭한다. 번역된 산물은 공지된 것이거나 미공지된 것일 수 있으며, 정상 또는 비정상 수준으로 존재할 수 있다. RNA-표적화 복합체의 표적 RNA는 진핵 세포에 대해 내인성이거나 외인성인 임의의 RNA일 수 있다. 예를 들어, 표적 RNA는 진핵 세포의 핵에 존재하는 RNA일 수 있다. 표적 RNA는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열(예를 들어, mRNA 또는 pre-mRNA) 또는 비-코딩 서열(예를 들어, ncRNA, lncRNA, tRNA, 또는 rRNA)일 수 있다.
일부 구현예에서, 상기 방법은 핵산-표적화 복합체가 표적 RNA에 결합할 수 있게 하여, 상기 표적 RNA의 절단을 초래하여, 그에 의해 표적 RNA를 변형시키는 단계를 포함하며, 핵산-표적화 복합체는 상기 표적 RNA 내의 표적 서열과 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다. 일 양태에서, 본 발명은 진핵 세포에서의 RNA의 발현의 변형 방법을 제공한다. 일부 구현예에서, 상기 방법은 핵산-표적화 복합체가 RNA에 결합할 수 있게 하여, 상기 결합이 상기 RNA의 증가된 또는 감소된 발현을 초래하게 하는 단계를 포함하며; 여기서 핵산-표적화 복합체는 가이드 RNA와 복합체화되는 핵산-표적화 이펙터 단백질을 포함한다. 유사한 고려사항 및 조건이 표적 RNA를 변형하는 방법을 위해 상기한 바와 같이 적용된다. 사실상, 이들 샘플링, 배양 및 재도입 선택사항은 본 발명의 전 양태에 적용된다. 일 양태에서, 본 발명은 진핵 세포에서 표적 RNA를 변형하는 방법을 제공하며, 이것은 생체내, 생체외 또는 시험관내에서 이루어질 수 있다. 일부 구현예에서, 상기 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 샘플링하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다. 재도입된 세포의 경우, 세포가 줄기 세포인 것이 특히 바람직하다.
실제로, 본 발명의 임의의 양태에서, 핵산-표적화 복합체는 표적 서열과 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함할 수 있다.
본 발명은 핵산-표적화 시스템 및 그의 성분에 관한 RNA 서열 표적화를 수반하는 유전자 발현의 제어에 사용되는 시스템, 방법 및 조성물의 조작 및 최적화에 관한 것이다. 유리한 구현예에서, 이펙터 단백질 효소는 제VI형 단백질, 예를 들어 C2c2이다. 본 방법의 이점은 CRISPR 시스템이 표적외 결합 및 그 결과의 부작용을 최소화시키거나 회피한다는 점이다. 이는 표적 RNA에 대하여 고도의 서열 특이성을 갖도록 배열된 시스템을 사용하여 달성된다.
바람직하게는 핵산-표적화 복합체 또는 시스템과 관련하여, tracr 서열은 하나 이상의 헤어핀을 가지며, 이는 길이가 30 개 이상의 뉴클레오티드, 길이가 40 개 이상의 뉴클레오티드, 또는 길이가 50 개 이상의 뉴클레오티드이고; crRNA 거열은 길이가 10 개 내지 30 개 뉴클레오티드이며, 핵산-표적화 이펙터 단백질은 제VI형 이펙터 단백질이다.
특정 구현예에서, 이펙터 단백질은 리스테리아 종 C2c2p, 바람직하게는 리스테리아 세엘리게리아 C2c2p, 더욱 바람직하게는 리스테리아 세엘리게리아 혈청형 1/2b 균주 SLCC3954 C2c2p일 수 있고 crRNA 서열은, 5' 29-nt 직접 반복(DR) 및 15-nt 내지 18-nt 스페이서를 갖는, 길이가 44 내지 47 뉴클레오티드일 수 있다.
특정 구현예에서, 이펙터 단백질은 렙토트리키아 종 C2c2p, 바람직하게는 렙토트리키아 샤히 C2c2p, 더욱 바람직하게는 렙토트리키아 샤히 DSM 19757 C2c2p일 수 있고, crRNA 서열은, 5' 24 내지 28 nt 직접 반복(DR)과 같은, 적어도 24-nt의 5'직접 반복, 및 14-nt 내지 28-nt 스페이서와 같은, 적어도 14 nt의 스페이서, 또는 19, 20, 21, 22, 이상 nt, 예를 들어 18 내지 28, 19 내지 28, 20 내지 28, 21 내지 28, 또는 22 내지 28 nt와 같은, 적어도 18 nt의 스페이서를 갖는, 길이가 42 내지 58 뉴클레오티드일 수 있다.
더욱 바람직하게, 이펙터 단백질은 렙토트리키아 종, 바람직하게는 렙토트리키아 와데이 F0279, 또는 리스테리아 종. 바람직하게는 리스테리아 뉴요켄시스 FSL M6-0635일 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로 C2c2p일 수 있고, crRNA 서열은 길이가 36 내지 63 뉴클레오티드, 바람직하게는 길이가 37-nt 내지 62-nt, 또는 길이가 38-nt 내지 61-nt, 또는 길이가 39-nt 내지 60-nt, 더욱 바람직하게는 길이가 40-nt 내지 59-nt, 또는 길이가 41-nt 내지 58-nt, 가장 바람직하게는 길이가 42-nt 내지 57-nt일 수 있다. 예를 들어, crRNA는 길이가 26-nt 내지 31-nt, 바람직하게는 길이가 27-nt 내지 30-nt, 더욱 더 바람직하게는 길이가 28-nt 또는 29-nt 또는 길이가 적어도 28 또는 29 nt인 직접 반복(DR), 바람직하게는5'DR, 및 길이가 10-nt 내지 32-nt, 바람직하게는 길이가 11-nt 내지 31-nt, 더욱 바람직하게는 길이가 12-nt 내지 30-nt, 더욱 더 바람직하게는 길이가 13-nt 내지 29-nt, 및 가장 바람직하게는 길이가 14-nt 내지 28-nt, 예를 들어 18 내지 28 nt, 19 내지 28 nt, 20 내지 28 nt, 21 내지 28 nt, 또는 22 내지 28 nt의 스페이서를 포함할 수 있거나, 이로 본질적으로 구성될 수 있거나 이로 구성될 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로는 C2c2p일 수 있고, tracrRNA 서열(존재하는 경우)은 적어도 60-nt 길이, 예를 들어 길이가 적어도 65-nt, 또는 길이가 적어도 70-nt, 예를 들어 길이가 60-nt 내지 70-nt, 또는 길이가 60-nt 내지 70-nt, 또는 길이가 70-nt 내지 80-nt, 또는 길이가 80-nt 내지 90-nt, 또는 길이가 90-nt 내지 100-nt, 또는 길이가 100-nt 내지 110-nt, 또는 길이가 110-nt 내지 120-nt, 또는 길이가 120-nt 내지 130-nt, 또는 길이가 130-nt 내지 140-nt, 또는 길이가 140-nt 내지 150-nt 또는 길이가 150-nt보다 길 수 있다.
특정 구현예에서, 이펙터 단백질은 제VI형 유전자좌 이펙터 단백질, 더욱 구체적으로는 C2c2p일 수 있으며, 절단을 위해 tracrRNA가 요구되지 않을 수 있다.
2 개의 상이한 압타머(각각 별개의 핵산-표적화 가이드 RNA)의 사용은 상이한 핵산-표적화 가이드 RNA를 이용하여, 사용될 활성화제-어댑터 단백질 융합 및 억제제-어댑터 단백질 융합이, 다른 하나는 억제하는 한편 하나의 DNA 또는 RNA의 발현은 활성화시키는 것을 가능하게 한다. 이들은 그들의 상이한 가이드 RNA와 함께, 다중화된 접근법에서 함께, 또는 실질적으로 함께 투여될 수 있다. 이와 같은 변형된 핵산-표적화 가이드 RNA의 다수, 예를 들어 10 개 또는 20 개 또는 30 개 등이 모두 동시에 사용될 수 있고, 한편 비교적 적은 수의 이펙터 단백질 분자로서, 전달되는 이펙터 단백질 분자 중 단지 하나(또는 적어도 최소 수)가 다수의 변형된 가이드와 함께 사용될 수 있다. 어댑터 단백질은 하나 이상의 활성화제 또는 하나 이상의 억제제에 연관(바람직하게는 연결 또는 융합)될 수 있다. 예를 들어, 어댑터 단백질은 제1 활성화제 및 제2 활성화제와 연관될 수 있다. 제1 및 제2 활성화제는 동일할 수 있지만, 이들은 바람직하게 상이한 활성화제이다. 3 개 이상 또는 심지어 4 개 이상의 활성화제(또는 억제제)가 사용될 수 있지만, 패키지 크기는 5 개를 초과하는 개수의 상이한 기능성 도메인은 제한할 수 있다. 어댑터 단백질에 대한 직접 융합에 대하여, 링커가 바람직하게 사용되며, 여기서 2 개 이상의 기능성 도메인은 어댑터 단백질에 연결된다. 적합한 링커는 GlySer 링커를 포함할 수 있다.
또한 핵산-표적화 이펙터 단백질-가이드 RNA 복합체는 전체로서 둘 이상의 기능성 도메인과 회합될 수 있음이 고려된다. 예를 들어, 핵산-표적화 이펙터 단백질과 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 가이드 RNA와 회합된 둘 이상의 기능성 도메인이 존재할 수 있거나, (하나 이상의 어댑터 단백질을 통해) 핵산-표적화 이펙터 단백질과 회합된 하나 이상의 기능성 도메인 및 가이드 RNA와 회합된 하나 이상의 기능성 도메인이 존재할 수 있다.
어댑터 단백질과 활성화제 또는 억제제 사이의 융합은 링커를 포함할 수 있다. 예를 들어, GlySer 링커 GGGS가 사용될 수 있다. 이들은 3((GGGGS)3) 또는 6, 9 또는 심지어는 12 이상의 반복부로 사용되어, 필요에 따라 적합한 길이를 제공할 수 있다. 링커는 가이드 RNA와 기능성 도메인(활성화제 또는 억제제) 사이, 또는 핵산-표적화 이펙터 단백질과 기능성 도메인(활성화제 또는 억제제) 사이에서 사용될 수 있다. 사용자는 링커를 "기계적 유연성"의 적절한 양으로 조작한다.
본 발명은 핵산-표적화 이펙터 단백질 및 가이드 RNA를 포함하는 핵산-표적화 복합체를 포괄하며, 여기서 핵산-표적화 이펙터 단백질은 적어도 하나의 돌연변이를 포함하여, 핵산-표적화 Cas 단백질이 적어도 하나의 돌연변이를 갖지 않는 핵산-표적화 Cas 단백질의 활성의 5% 이하, 및 선택적으로 적어도 하나 이상의 핵 국소화 서열을 갖도록 하며; 가이드 RNA는 세포 내 관심 RNA에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하고; 여기서 핵산-표적화 이펙터 단백질은 둘 이상의 기능성 도메인과 회합되거나; 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고; 여기서 어댑터 단백질은 둘 이상의 기능성 도메인과 회합되거나; 핵산-표적화 이펙터 단백질은 하나 이상의 기능성 도메인과 회합되고, 가이드 RNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인에 회합된다.
전달 일반
C2c2 이펙터 단백질 복합체는 작용 이펙터를 전달할 수 있다
DNA수준에서 유전자를 돌연변이시킴으로써 발현을 영구히 제거하는, CRISPR-Cas-매개된 유전자 녹아웃과 달리, CRISPR-Cas 녹다운은 인공 전사 또는 번역 인자의 사용을 통해 유전자 발현의 일시적 감소를 가능하게 한다. C2c2 단백질의 DNA 또는 RNA 절단 도메인 모두에서 중요 잔기를 돌연변이시키는 것은 촉매적으로 비활성인 C2c2의 생성을 초래한다. 촉매적으로 비활성인 C2c2는 가이드 RNA와 복합체화하고, 도메인을 표적화하는 가이드 RNA에 의해 특정된 RNA 서열에 국소화되지만, 이는 표적 RNA를 절단하지 않는다. 비활성 C2c2 단백질의 이펙터 도메인, 예를 들어 전사 또는 번역 억제 도메인으로의 융합은 이펙터의 가이드 RNA에 의해 특정된 임의의 RNA 부위로의 채용을 가능하게 한다. 특정 구현예에서, C2c2는 전사 억제 도메인에 융합될 수 있고, 유전자의 프로모터 영역에 채용될 수 있다. 특히 유전자 억제의 경우, 내인성 전사 인자의 결합 부위를 차단하는 것은 유전자 발현을 하향조절하는 것을 보조할 것으로 본 명세서에서 고려된다. 또 다른 구현예에서, 비활성 C2c2는 크로마틴 변형 단백질에 융합될 수 있다. 크로마틴 상태의 변경은 표적 유전자의 발현 감소를 초래할 수 있다. 추가의 구현예에서, C2c2는 번역 억제 도메인에 융합될 수 있다.
일 구현예에서, 가이드 RNA 분자는 공지된 전사 반응 요소(예를 들어, 프로모터, 인핸서 등), 공지된 업스트림 활성화 서열, 및/또는 표적 RNA의(단백질) 발현을 제어할 수 있는 것으로 의심되는 미지의 또는 공지된 작용의 서열로 표적화될 수 있다.
일부 방법에서, 표적 폴리뉴클레오티드는 비활성화되어 세포 내에서 발현의 변형을 일으킬 수 있다. 예를 들어, CRISPR 복합체의 세포 내의 표적 서열로의 결합시, 표적 폴리뉴클레오티드는 비활성화되어, 서열이 전사되지 않거나, 코딩된 단백질이 생산되지 않거나, 서열이 야생형 서열이 작용하는 것처럼 작용하지 않게 된다. 예를 들어, 단백질 또는 마이크로RNA 코딩 서열은 비활성화되어 단백질이 생산되지 않게 된다. 일부 방법에서, 표적 폴리뉴클레오티드는 세포에서 발현의 변형을 가져오기 위해 비활성화될 수 있다. 예를 들어, CRISPR 복합체가 세포의 RNA 표적 서열에 결합 즉시, 표적 폴리뉴클레오티드는 비활성화되어 서열이 번역되지 않고 세포에서 단백질의 발현 수준에 영향을 미친다.
특정 구현예에서, CRISPR 효소는 R597A, H602A, R1278A 및 H1283A로 구성된 군으로부터 선택되는 하나 이상의 돌연변이를 포함하고/포함하거나, 하나 이상의 돌연변이는 CRISPR 효소의 HEPN 도메인 내에 있거나, 다르게는 본 명세서에서 논의된 돌연변이다. 일부 구현예에서, CRISPR 효소는 촉매 도메인 내에서 하나 이상의 돌연변이를 갖고, 전사된 경우, 직접 반복 서열은 단일 스템 루프를 형성하고, 가이드 서열은 표적 서열로의 CRISPR 복합체의 서열-특이적 결합을 유도하며, 여기서 효소는 기능성 도메인을 추가로 포함한다. 일부 구현예에서, 기능성 도메인은. 일부 구현예에서, 기능성 도메인은 전사 억제 도메인, 바람직하게는 KRAB이다. 일부 구현예에서, 전사 억제 도메인은 SID, 또는 SID의 연쇄체(예를 들어, SID4X)이다. 일부 구현예에서, 기능성 도메인은 후성적 변형 도메인으로, 후성적 변형 효소가 제공되도록 한다. 일부 구현예에서, 기능성 도메인은 활성화 도메인으로, 이는 P65 활성화 도메인일 수 있다.
C2c2 이펙터 단백질 복합체 또는 이의 성분의 전달
본 개시 내용 및 당업계의 지식을 통하여, TALE, CRISPR-Cas 시스템, 또는 이의 성분 또는 이의 핵산 분자 또는 이의 성분을 인코딩하거나 제공하는 핵산 분자는 본 명세서에서 일반적으로 그리고 상세하게 기재된 전달 시스템에 의해 전달될 수 있다.
벡터 전달, 예를 들어 플라스미드, 바이러스 전달: CRISPR 효소, 예를 들어 C2c2와 같은 제V형 단백질, 및/또는 본 발명의 임의의 RNA, 예를 들어 가이드 RNA는 임의의 적합한 벡터, 예를 들어 플라스미드 또는 바이러스 벡터, 예를 들어 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 다른 바이러스 벡터 유형, 또는 이의 조합을 사용하여 전달될 수 있다. 이펙터 단백질 및 하나 이상의 가이드 RNA는 하나 이상의 벡터, 예를 들어 플라스미드 또는 바이러스 벡터 내로 패키지될 수 있다. 일부 구현예에서, 벡터, 예를 들어 플라스미드 또는 바이러스 벡터는, 예를 들어 근육내 주사에 의해 관심 조직으로 전달되는 한편, 다른 경우에 전달은 정맥내, 경피, 비강내, 구강, 점막 또는 다른 전달 방법을 통하여 이루어진다. 이와 같은 전달은 단일 용량 또는 다중 용량 중 어느 하나를 통하여 이루어질 수 있다. 당업자는, 본 명세서에서 전달되는 실제 용량은 다양한 인자, 예를 들어 벡터 선택, 표적 세포, 생물, 또는 조직, 치료될 대상체의 일반 상태, 구하는 형질전환/변형의 정도, 투여 경로, 투여 방법, 구하는 형질전환/변형의 형태 등에 따라 크게 달라질 수 있다.
이와 같은 용량은, 예를 들어 담체(물, 식염수, 에탄올, 글리세롤, 락토오스, 수크로오스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 등), 희석제, 약학적으로 허용 가능한 담체(예를 들어, 인산염 완충 식염수), 약학적으로 허용 가능한 부형제, 및/또는 당업계에 알려진 다른 화합물을 추가로 함유할 수 있다. 용량은 하나 이상의 약학적으로 허용 가능한 염, 예를 들어 무기산 염, 예를 들어 염산염, 브롬화수소산염, 인산염, 황산염 등; 및 유기산 염, 예를 들어 아세테이트, 프로피오네이트, 말로네이트, 벤조에이트 등을 추가로 함유할 수 있다. 추가적으로, 보조 성분, 예를 들어 습윤 또는 유화제, pH 완충 성분, 겔 또는 겔화 물질, 풍미제, 착색제, 마이크로스피어, 중합체, 현탁제 등이 또한 본 명세서에서 제시될 수 있다. 추가적으로, 하나 이상의 다른 통상의 약학 성분들, 예를 들어 보존제, 보수제, 현탁화제, 계면활성제, 산화방지제, 케이킹방지제(anticaking agent), 충전제, 킬레이트화제, 코팅제, 화학 안정화제 등이 또한 존재할 수 있으며, 특히 투약 형태는 재구성 가능한 형태이다. 적합한 예시적인 성분으로는, 미세결정성 셀룰로스, 카르복시메틸셀룰로스 나트륨, 폴리소르베이트 80, 페닐에틸 알콜, 클로로부탄올, 칼륨 소르베이트, 소르빈산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 파라클로로페놀, 젤라틴, 알부민 및 이의 조합을 포함한다. 약학적으로 허용 가능한 부형제의 철저한 논의는 문헌[REMINGTON'S PHARMACEUTICAL SCIENCES(Mack Pub. Co., N.J. 1991)]에서 이용 가능하며, 이는 본 명세서에 참조로서 포함된다.
본 명세서의 일 구현예에서, 전달은 아데노바이러스를 통한 것으로, 이는 적어도 1 x 105 개의 입자(입자 단위, pu로서도 지칭됨)의 아데노바이러스 벡터를 함유하는 단일 부스터(booster) 용량일 수 있다. 본 명세서의 일 구현예에서, 용량은 바람직하게 적어도 약 1 x 106 개의 입자(예를 들어, 약 1 x 106 개 내지 1 x 1012 개 입자), 더욱 바람직하게는 적어도 약 1 x 107 개의 입자, 더욱 바람직하게는 적어도 약 1 x 108 개 이상의 입자(예를 들어, 약, 1 x 108 개 내지 1 x 1011 개 입자 또는 약 1 x 108 개 내지 1 x 1012 개 입자), 가장 바람직하게는 적어도 약 1 x 100 개의 입자(예를 들어, 약 1 x 109 개 내지 1 x 1010 개 입자 또는 약 1 x 109 개 내지 1 x 1012 입자), 또는 심지어 적어도 약 1 x 1010 개의 입자(예를 들어, 약 1 x 1010 개 내지 1 x 1012 개 입자)의 아데노바이러스 벡터이다. 대안적으로, 용량은 약 1 x 1014 개 이하의 입자, 바람직하게는 약 1 x 1013 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 1012 개 이하의 입자, 훨씬 더 바람직하게는 약 1 x 1011 개 이하의 입자, 가장 바람직하게는 약 1 x 1010 개 이하의 입자(예를 들어, 약 1 x 109 개 입자)를 포함한다. 따라서, 용량은 단일 용량의 아데노바이러스 벡터를 함유할 수 있으며, 이는 예를 들어 약 1 x 106 입자 단위(pu), 약 2 x 106 pu, 약 4 x 106 pu, 약 1 x 107 pu, 약 2 x 107 pu, 약 4 x 107 pu, 약 1 x 108 pu, 약 2 x 108 pu, 약 4×108 pu, 약 1 x 109 pu, 약 2 x 109 pu, 약 4 x 109 pu, 약 1 x 1010 pu, 약 2 x 1010 pu, 약 4 x 1010 pu, 약 1 x 1011 pu, 약 2 x 1011 pu, 약 4 x 1011 pu, 약 1 x 1012 pu, 약 2 x 1012 pu, 또는 약 4 x 1012 pu의 아데노바이러스 벡터이다. 예를 들어, 아데노바이러스 벡터에 대해, Nabel외에게, 2013년 6월 4일 수여된, 미국 특허 8,454,972 B2를 참조하며, 이는 본 명세서에 참고로 포함되고, 이의 컬럼 29, 36 내지 58 행의 용량을 참조한다. 본 명세서의 일 구현예에서, 아데노바이러스는 다중 용량을 통해 전달된다.
본 명세서의 일 구현예에서, 전달은 AAV를 통해 이루어진다. 인간에 대한 AAV의 생체내 전달을 위한 치료적으로 유효한 용량은, 용액 ml 당 약 1 x 1010 내지 약 1 x 1010의 작용적 AAV를 함유하는 약 20 ml 내지 약 50 ml 범위의 식염수 용액인 것으로 여겨진다. 용량은 임의의 부작용에 대하여 치료 이익의 균형을 맞추도록 조정될 수 있다. 본 명세서의 일 구현예에서, AAV 용량은 일반적으로 약 1 x 105 내지 1 x 1050 개의 게놈 AAV, 약 1 x 108 내지 1 x 1020 개의 게놈 AAV, 약 1 x 1010 내지 약 1 x 1016 개의 게놈, 또는 약 1 x 1011 내지 약 1 x 1016 개의 게놈 AAV의 농도 범위 내에 있다. 인간 용량은 약 1 x 1013 개의 게놈 AAV이다. 이와 같은 농도는 약 0.001 ml 내지 약 100 ml, 약 0.05 ml 내지 약 50 ml, 또는 약 10 ml 내지 약 25 ml의 담체 용액 중에서 전달될 수 있다. 다른 효과적인 용량은 당업자에 의해, 용량 반응 곡선을 수립하는 일상적 시험을 통해 쉽게 수립될 수 있다. 예를 들어, 2013년 3월 26일 등록된 Hajjar 외의 미국 특허 8,404,658 B2, 27 칼럼 45 내지 60 행을 참조한다.
본 명세서의 일 구현예에서, 전달은 플라스미드를 통해 이루어진다. 이와 같은 플라스미드 조성물에서, 용량은 반응을 유발하는 데 충분한 양의 플라스미드여야 한다. 예를 들어, 플라스미드 조성물 중의 플라스미드 DNA의 적합한 양은 70 kg의 개체 당 약 0.1 mg 내지 약 2 mg, 또는 약 1 μg 내지 약 10 μg일 수 있다. 본 발명의 플라스미드는 일반적으로 (i) 프로모터; (ii) 상기 프로모터에 작동 가능하게 연결된 핵산-표적화 CRISPR 효소를 인코딩하는 서열; (iii) 선택 가능 마커; (iv) 복제 원점; 및 (v) (ii)에 작동 가능하게 연결되는 (ii)의 다운스트림 전사 종결자를 포함할 것이다. 플라스미드는 또한 CRISPR 복합체의 RNA 성분을 인코딩할 수 있지만, 대신에 이들 중 하나 이상은 상이한 벡터 상에서 인코딩될 수 있다.
본 명세서의 용량은 평균 70 kg 개체를 기준으로 한다. 투여 빈도는 해당 분야의 숙련된 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사) 또는 과학자의 영역 내이다. 또한, 실험에 사용된 마우스는 통상적으로 약 20 g이며, 마우스 실험으로부터 70 kg 개체까지 증대될 수 있음이 주목된다.
일부 구현예에서, 본 발명의 RNA 분자는 리포좀 또는 리포펙틴 제형 등으로 전달되며, 당업자에게 잘 공지된 방법에 의해 제조될 수 있다. 이와 같은 방법은, 예를 들어 미국 특허 5,593,972, 5,589,466, 및 5,580,859에 기재되어 있으며, 이들 특허는 본 명세서에 참조로서 포함된다. 포유류 세포 내로의 siRNA의 향상 및 개선된 전달을 구체적으로 목표로 하는 전달 시스템이 개발되었고(예를 들어, 문헌[Shen et al FEBS Let. 2003, 539:111-114]; [Xia et al., Nat. Biotech. 2002, 20:1006-1010]; [Reich et al., Mol. Vision. 2003, 9: 210-216]; [Sorensen et al., J. Mol. Biol. 2003, 327: 761-766]; [Lewis et al., Nat. Gen. 2002, 32: 107-108] 및 [Simeoni et al., NAR 2003, 31, 11: 2717-2724] 참조), 본 발명에 적용될 수 있다. siRNA는 최근에 영장류에서 유전자 발현의 억제를 위해 성공적으로 사용되었다(예를 들어, 또한 본 발명에 적용될 수 있는 문헌[Tolentino et al., Retina 24(4):660] 참조).
실제로, RNA 전달은 생체내 전달의 유용한 방법이다. 리포좀 또는 입자를 사용하여 핵산-표적화 Cas 단백질 Cas9 및 가이드 RNA gRNA(예를 들어, HR 수복 주형)를 세포 내로 전달할 수 있다. 따라서, CasCas9과 같은 핵산-표적화 Cas 단백질/CRISPR 효소의 전달 및/또는 본 발명의 가이드 RNA의 전달은 RNA 형태로, 그리고 미세소포, 리포좀 또는 입자를 통해 이루어질 수 있다. 예를 들어, Cas mRNA 및 가이드 RNA는 생체내 전달을 위해 리포좀 입자 내로 패키징될 수 있다. Life Technologies로부터의 리포펙타민(Lipofectamine)과 같은 리포좀 형질감염 시약 및 시판 중인 다른 시약은 RNA 분자를 간에 효과적으로 전달할 수 있다.
RNA의 전달 수단은 또한 바람직하게는 나노입자(문헌[Cho, S., Goldberg, M., Son, S., Xu, Q., Yang, F., Mei, Y., Bogatyrev, S., Langer, R. and Anderson, D., Lipid-like nanoparticles for small interfering RNA delivery to endothelial cells, Advanced Functional Materials, 19: 3112-3118, 2010]) 또는 엑소좀(문헌[Schroeder, A., Levins, C., Cortez, C., Langer, R., and Anderson, D., Lipid-based nanotherapeutics for siRNA delivery, Journal of Internal Medicine, 267: 9-21, 2010, PMID: 20059641])을 통한 RNA의 전달을 포함한다. 실제로, 엑소좀은 RNA-표적화 시스템과 조금 유사한 시스템인 전달 siRNA에서 특히 유용한 것으로 나타났다. 예를 들어, El-Andaloussi S 외(문헌["Exosomes-mediated delivery of siRNA in vitro and in vivo." Nat Protoc. 2012 Dec;7(12):2112-26. doi: 10.1038/nprot.2012.131. Epub 2012 Nov 15.])은 엑소좀이 상이한 생물학적 장벽을 가로질러 약물을 전달하기 위한 촉망받는 도구가 되고 시험관내 및 생체내에서 siRNA의 전달을 위해 이용될 수 있는 방법을 기재한다. 이들의 접근법은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하여, 발현 벡터의 형질감염을 통해 표적화된 엑소좀을 생성하는 것이다. 이어서, 엑소좀은 형질감염된 세포 상청액으로부터 정제 및 특성화된 다음, RNA는 엑소좀에 로딩된다. 본 발명에 따른 전달 또는 투여는 엑소좀을 이용하여, 특히 비제한적으로 뇌로 실행될 수 있다. 비타민 E(α-토코페롤)는 핵산-표적화 Cas 단백질과 컨쥬게이트될 수 있고, 예를 들어 뇌에 짧은 간섭 RNA(siRNA)를 전달하기 위해 Uno 외(HUMAN GENE THERAPY 22:711-719(June 2011))에 의해 행해지는 것과 유사한 방식으로 고밀도 지단백질(HDL)과 함께 뇌에 전달될 수 있다. 마우스에 인산염 완충 식염수(PBS) 또는 유리 TocsiBACE 또는 Toc-siBACE/HDL이 충전되고, 뇌 주입 키트 3(Brain Infusion Kit 3)(Alzet)과 연결된 삼투 미니펌프(Osmotic minipump)(모델 1007D; Alzet, 미국 캘리포니아주 쿠퍼티노 소재)를 통해 주입하였다. 뇌 주입 캐뉼라를 등쪽의 제3 뇌실 내로의 주입을 위해 중앙에서 브레그마(bregma)보다 약 0.5 mm 뒤에 위치시켰다. Uno 외는 HDL과 함께 3 nmol만큼 적은 Toc-siRNA가 동일한 ICV 주입 방법에 의해 유사한 정도로 표적 감소를 유도할 수 있었다는 것을 발견하였다. α-토코페롤에 컨쥬게이트되고 뇌에 표적화된 HDL과 동시-투여되는 유사한 용량의 핵산-표적화 이펙터 단백질이 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 뇌에 표적화된 약 3 nmol 내지 약 3 μmol의 핵산-표적화 이펙터 단백질이 고려될 수 있다. Zou 외(HUMAN GENE THERAPY 22:465-475(April 2011))는 래트의 척수에서 생체내 유전자 침묵화를 위한 PKCγ를 표적화하는 짧은 헤어핀 RNA의 렌티바이러스-매개의 전달 방법을 기재한다. Zou 외는 척추강내 카테터에 의해 1 x 109 형질도입 단위(TU)/ml의 역가를 갖는 재조합 렌티바이러스 약 10 μl를 투여하였다. 뇌에 표적화된 렌티바이러스 벡터에서 발현된 유사한 용량의 핵산-표적화 이펙터 단백질이 본 발명에서 인간에 대해 고려될 수 있으며, 예를 들어 1 x 109 형질도입 단위(TU)/ ml의 역가를 갖는 렌티바이러스에서 뇌에 표적화된 약 10 ml 내지 50 ml의 핵산-표적화 이펙터 단백질이 고려될 수 있다.
뇌로의 국소 전달에 관하여, 이는 다양한 방법으로 달성될 수 있다. 예를 들어, 물질은, 예를 들어, 주사에 의해 선상체 내로 전달될 수 있다. 주사는 개두술을 통해 정위적으로 실행될 수 있다.
패키징 및 프로모터 일반
생체내에서 게놈 변형을 매개하기 위해 핵산-표적화 이펙터를 코딩하는 핵산 분자, 예를 들어 DNA를 벡터, 예를 들어 바이러스 벡터로 패키징하는 방법은 다음을 포함한다:
NHEJ-매개 유전자 녹아웃을 달성하는 것:
단일 바이러스 벡터:
두 개 이상의 발현 카세트를 함유하는 벡터:
프로모터-핵산 표적화 이펙터 단백질 코딩 핵산 분자-터미네이터
프로모터-가이드 RNA1-터미네이터
프로모터-가이드 RNA(N)-터미네이터(벡터의 크기 제한까지)
이중 바이러스 벡터:
핵산-표적화 이펙터 단백질의 발현을 구동하기 위한 하나의 발현 카세트를 함유하는 벡터 1
프로모터-핵산-표적화 이펙터 단백질 코딩 핵산 분자-터미네이터
하나 이상의 가이드RNA의 발현을 구동하기 위한 하나 이상의 발현 카세트를 함유하는 벡터 2
프로모터-가이드 RNA1-터미네이터
프로모터-가이드 RNA1(N)-터미네이터(벡터의 크기 제한까지)
상동성-지시되는 수선을 매개하는 것.
상기 기재된 단일 및 이중 바이러스 벡터 접근에 추가하여, 상동성-지시되는 수선 주형을 전달하기 위해 추가적인 벡터가 사용된다.
핵산-표적화 이펙터 단백질 코딩 핵산 분자 발현을 구동하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
AAV ITR은 프로모터로서 역할을 할 수 있다: 이것은(벡터에서 공간을 차지할 수 있는) 추가적인 프로모터 요소에 대한 필요성을 제거하는 데 유리하다. 해방된 추가 공간은 추가적인 요소(gRNA 등)의 발현을 구동하는 데 사용될 수 있다. 또한, ITR 활성은 상대적으로 더 약하므로 핵산-표적화 이펙터 단백질의 과발현으로 인한 잠재적인 독성을 감소시키는 데 사용될 수 있다.
편재하는 발현을 위해, 프로모터: CMV, CAG, CBh, PGK, SV40, 페리틴 중쇄 또는 경쇄 등을 사용할 수 있다.
뇌 또는 다른 CNS 발현에서, 프로모터: 모든 뉴런에 대해 시냅신I, 흥분성 뉴런에 대해 CaMKII알파, GABAergic 뉴런에 대해 GAD67 또는 GAD65 또는 VGAT 등을 사용할 수 있다.
간 발현에서, 알부민 프로모터를 사용할 수 있다.
폐 발현에서, SP-B를 사용할 수 있다.
내피 세포에서, ICAM을 사용할 수 있다.
조혈 세포에서 IFN베타 또는 CD45를 사용할 수 있다.
조골세포에서 OG-2를 사용할 수 있다.
가이드 RNA를 유도하기 위해 사용되는 프로모터는 다음을 포함할 수 있다:
U6 또는 H1과 같은 Pol III 프로모터.
가이드 RNA를 발현시키기 위한 Pol II 프로모터 및 인트론 카세트의 사용.
아데노 관련 바이러스(AAV)
핵산-표적화 이펙터 단백질 및 하나 이상의 가이드 RNA는 아데노 관련 바이러스(AAV), 렌티바이러스, 아데노바이러스 또는 다른 플라스미드 또는 바이러스 벡터 유형을 사용하여, 특히, 예를 들어, 미국 특허 8,454,972(아데노바이러스에 대한 제형, 용량), 8,404,658(AAV에 대한 제형, 용량) 및 5,846,946(DNA 플라스미드에 대한 제형, 용량)으로부터의 제형 및 용량, 및 렌티바이러스, AAV 및 아데노바이러스를 수반하는 임상 시험 및 임상 시험에 관한 간행물로부터의 제형 및 용량을 사용하여 전달될 수 있다. 예를 들어, AAV에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,454,972에서와 같고, AAV를 수반하는 임상 시험에서와 같을 수 있다. 아데노바이러스에 대해, 투여 경로, 제형 및 용량은 미국 특허 8,404,658에서와 같을 수 있고 아데노바이러스를 수반하는 임상 시험에서와 같을 수 있다. 플라스미드 전달에 대해, 투여 경로, 제형 및 용량은 미국 특허 5,846,946에서와 같고, 플라스미드를 수반하는 임상 연구에서와 같을 수 있다. 용량은 평균 70 kg 개체(예를 들어, 성인 남성)를 기준으로 하거나 또는 이로 추정될 수 있고, 상이한 체중 및 종의 환자, 대상체, 포유류에 대해 조정될 수 있다. 투여 빈도는 환자 또는 대상체의 연령, 성별, 일반적 건강상태, 다른 질환 및 다루어질 특정 질환 또는 증상을 포함하는 보통의 인자에 따라서 의학적 또는 수의학적 실행자(예를 들어, 의사, 수의사)의 영역 내에 있다. 바이러스 벡터는 관심 조직 내에 주사될 수 있다. 세포 유형 특이적 게놈/트랜스크립톰 변형을 위해, 핵산-표적화 이펙터 단백질의 발현은 세포 유형 특이적 프로모터에 의해 유도될 수 있다. 예를 들어, 간 특이적 발현은 알부민 프로모터를 사용할 수 있고, 뉴런 특이적 발현(예를 들어, CNS 장애를 표적화하기 위함)은 시냅신 I 프로모터를 사용할 수 있다.
생체내 전달에 관하여, AAV는 몇 가지 이유로 다른 바이러스 벡터에 비하여 유리하다:
AAV는 4.5 또는 4.75 Kb의 패키징 한계를 갖는다. 이것은 핵산-표적화 이펙터 단백질(예를 들어 C2c2 같은 제V형 단백질)뿐만 아니라 프로모터 및 전사 터미네이터가 모두 동일한 바이러스 벡터 내에 맞춰져야 함을 의미한다. 따라서, 본 발명의 일 구현예는 더 짧은 핵산-표적화 이펙터 단백질의 상동체를 이용하는 것을 포함한다.
AAV에 관해서, AAV는 AAV1, AAV2, AAV5 또는 이들의 임의의 조합일 수 있다. 표적화될 세포에 관한 AAV의 AAV를 선택할 수 있고; 예를 들어, 뇌 또는 뉴런 세포를 표적화하기 위하여 AAV 혈청형 1, 2, 5 또는 하이브리드 캡시드 AAV1, AAV2, AAV5 또는 이들의 임의의 조합을 선택할 수 있으며; 심장 조직을 표적화하기 위하여 AAV4를 선택할 수 있다. AAV8은 간으로의 전달에 유용하다. 본 명세서의 프로모터 및 벡터는 개별적으로 바람직하다. 이들 세포에 관한 특정 AAV 혈청형의 표 작성(문헌[Grimm, D. et al, J. Virol. 82: 5887-5911(2008)] 참조)은 다음과 같다:
렌티바이러스
렌티바이러스는 유사분열과 유사분열 후 세포 둘 다에서 그들의 유전자를 감염 및 발현시키는 능력을 갖는 복합 레트로바이러스이다. 가장 흔히 알려진 렌티바이러스는 광범위한 세포 유형을 표적화하기 위해 다른 바이러스의 외피 당단백질을 사용하는 인간 면역결핍 바이러스(HIV)이다.
렌티바이러스는 다음과 같이 제조될 수 있다. (렌티바이러스 전달 플라스미드 백본을 함유하는) pCasES10의 클로닝 후에, 낮은 계대(p=5)에서 HEK293FT를 10% 우태아혈청이 있고 항생제가 없는 DMEM 중의 형질감염 전날에 50% 컨플루언스(confluence)까지 T-75 플라스크에 씨딩하였다. 20시간 후에, 배지를 OptiMEM(무혈청) 배지로 바꾸고, 4 시간 후에 형질감염을 행하였다. 세포를 10 μg의 렌티바이러스 전달 플라스미드(pCasES10), 및 5 μg의 pMD2.G(VSV-g 위형), 및 7.5 μg의 psPAX2(gag/pol/rev/tat)의 패키징 플라스미드를 이용하여 형질감염시켰다. 양이온성 지질 전달제(50 μl 리포펙타민 2000 및 100 μl 플러스(Plus) 시약)를 이용하여 4 ml OptiMEM 중에서 형질감염을 행하였다. 6 시간 후, 배지를 10% 우태아혈청이 있는 무항생제 DMEM으로 바꾸었다. 이들 방법은 세포 배양 동안 혈청을 사용하지만, 무혈청 방법이 바람직하다.
렌티바이러스는 다음과 같이 정제될 수 있다. 바이러스 상청액을 48 시간 후에 수집하였다. 상청액을 먼저 데브리스(debris)를 없애고, 0.45 um 저 단백질 결합(PVDF) 필터를 통해 여과시켰다. 이어서, 이들을 24,000 rpm에서 2 시간 동안 초원심분리기에서 회전시켰다. 바이러스 펠렛을 4C에서 밤새 50 ul의 DMEM 중에서 재현탁화시켰다. 이어서 이들을 분주하고 즉시 -80℃에서 즉시 동결시켰다.
또 다른 구현예에서, 말 감염성 빈혈 바이러스(equine infectious anemia virus; EIAV)에 기반한 최소 비-영장류 렌티바이러스 벡터는 또한, 특히 눈 유전자 치료법을 위해 고려된다(예를 들어, 문헌[Balagaan, J Gene Med 2006; 8: 275 - 285] 참조). 또 다른 구현예에서, RetinoStat®, 망(web) 형태의 노인성 황반변성의 치료를 위한 망막하 주사를 통해 전달되는 혈관신생억제 단백질 엔도스타틴 및 앤지오스타틴을 발현시키는 말 감염성 빈혈 바이러스-기반의 렌티바이러스 유전자 치료법 벡터가 또한 고려되며(예를 들어, 문헌[Binley et al., HUMAN GENE THERAPY 23:980-991(September 2012)]), 이러한 벡터는 본 발명의 핵산-표적화 시스템을 위해 변형될 수 있다.
또 다른 구현예에서, HIV tat/rev에 의해 공유되는 공통 엑손을 표적화하는 siRNA, 핵소체-국소화 TAR 데코이(decoy), 및 항-CCR5-특이적 해머헤드(hammerhead) 리보자임을 이용하는 자가-비활성화 렌티바이러스 벡터(예를 들어, 문헌[DiGiusto et al.(2010) Sci Transl Med 2:36ra43] 참조)가 본 발명의 핵산-표적화 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 최소 2.5 x 106 개 CD34+ 세포/킬로그램(환자의 체중)을 수집하고, 2 x 106 개 세포/ml의 밀도에서 2 μmol/L-글루타민, 줄기 세포 인자(100 ng/ml), Flt-3 리간드(Flt-3L)(100 ng/ml), 및 트롬보포이에틴(10 ng/ml)(CellGenix)을 함유하는 X-VIVO 15 배지(Lonza))에서 16 시간 내지 20 시간 동안 사전자극할 수 있다. 사전자극된 세포는 피브로넥틴(25 mg/cm2)으로 코팅된 75-cm2 조직 배양 플라스크에서 16 시간 내지 24 시간 동안 감염다중도 5로 렌티바이러스에 의해 형질도입될 수 있다(RetroNectin, Takara Bio Inc.).
렌티바이러스 벡터는 파킨슨병의 치료에서와 같이 개시되었으며, 예를 들어 미국 특허 공개 20120295960 및 미국 특허 7303910 및 7351585를 참조한다. 렌티바이러스 벡터는 또한 안질환의 치료용으로 개시되었으며, 예를 들어 미국 특허 공개 20060281180, 20090007284, US20110117189; US20090017543; US20070054961, US20100317109를 참조한다. 렌티바이러스 벡터는 또한 뇌에 대한 전달용으로 개시되었으며, 예를 들어 미국 특허 공개 US20110293571; US20110293571, US20040013648, US20070025970, US20090111106 및 미국 특허 US7259015를 참조한다.
RNA 전달
RNA 전달: 핵산-표적화 Cas 단백질, 예를 들어 C2c2와 같은 제V형 단백질, 및/또는 가이드 RNA는 RNA의 형태로 또한 전달될 수 있다. 핵산-표적화 Cas 단백질(예를 들어 C2c2와 같은 제VI형 단백질) mRNA는 시험관내 전사를 이용하여 생성될 수 있다. 예를 들어, 핵산-표적화 이펙터 단백질(예를 들어 C2c2와 같은 제V형 단백질) mRNA는 다음 요소를 함유하는 PCR 카세트를 사용하여 합성될 수 있다: 베타 글로빈-폴리A 테일(120 개 이상의 아데닌의 스트링(string))로부터의 T7_프로모터-코작 서열(GCCACC)-이펙터 단백질-3' UTR. 카세트는 T7 중합효소에 의한 전사를 위해 사용될 수 있다. 가이드 RNA는 또한 T7_프로모터-GG-가이드 RNA 서열을 함유하는 카세트로부터의 시험관내 전사를 사용하여 전사될 수 있다.
발현을 향상시키고 가능한 독성을 감소시키기 위해, 핵산-표적화 이펙터 단백질-코딩 서열 및/또는 가이드 RNA는, 예를 들어, 슈도-U 또는 5-메틸-C를 사용하여 하나 이상의 변형된 뉴클레오시드를 포함하도록 변형될 수 있다.
mRNA 전달 방법은 현재 간 전달용으로 특히 촉망된다.
RNA 전달에 대한 많은 임상적 연구는 RNAi 또는 안티센스에 집중되어 있으나, 이들 시스템은 본 발명을 이행하기 위하여 RNA의 전달에 적합하게 될 수 있다. 따라서, RNAi 등에 대한 하기의 참고문헌을 확인해야 한다.
입자 전달 시스템 및/또는 제형:
여러 유형의 입자 전달 시스템 및/또는 제형은 다양한 범위의 생체의학 적용에서 유용하다고 알려져 있다. 일반적으로, 입자는 이의 운반 및 특성에 대해서 전체 유닛으로서 거동하는 작은 물체로서 규정된다. 입자는 직경에 따라서 추가로 분류된다. 조립 입자는 2,500 나노미터 내지 10,000 나노미터 사이의 범위를 망라한다. 미세 입자는 100 나노미터 내지 2,500 나노미터 사이의 크기이다. 초미세 입자, 또는 나노입자는 일반적으로 1 나노미터 내지 100 나노미터 크기 사이이다. 100-nm 한계의 근거는 벌크 물질로부터 입자를 구별하는 신규한 특성이 통상적으로 100 nm 미만의 역치 길이 규모에서 발생한다는 사실이다.
본 명세서에서 사용된 바와 같이, 입자 전달 시스템/제형은 본 발명에 따른 입자를 포함하는 임의의 생물학적 전달 시스템/제형으로서 규정된다. 본 발명에 따른 입자는 100 미크론(μm) 미만의 가장 큰 크기(예를 들어, 직경)를 갖는 임의의 개체(entity)이다. 일부 구현예에서, 본 발명의 입자는 10 μm 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 2000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 1000 나노미터(nm) 미만의 가장 큰 치수를 갖는다. 일부 구현예에서, 본 발명의 입자는 900 nm, 800 nm, 700 nm, 600 nm, 500 nm, 400 nm, 300 nm, 200 nm, 또는 100 nm 미만의 가장 큰 치수를 갖는다. 통상적으로, 본 발명의 입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 250 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 200 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 150 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 일부 구현예에서, 본 발명의 입자는 100 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 더 작은 입자, 예를 들어 50 nm 이하의 가장 큰 치수를 갖는 더 작은 입자가 본 발명의 일부 구현예에서 사용된다. 일부 구현예에서, 본 발명의 입자는 25 nm 및 200 nm 사이 범위의 가장 큰 치수를 갖는다.
입자 특성화(예를 들어, 형태, 치수 등의 특성화를 포함함)는 상이한 기법을 사용하여 수행된다. 일반적인 기법은 전자 현미경검사법(TEM, SEM), 원자력 현미경검사법(AFM), 동적 광 산란(DLS), X-선 광전자 분광법(XPS), 분말 X-선 회절(XRD), 푸리에 형질전환 적외선 분광광도법(FTIR), 매트릭스-보조 레이저 탈착/이온화 비행시간형 질량 분석기(MALDI-TOF), 자외선-가시 분광법, 이중 분극 간섭계 및 핵 자기 공명(NMR)이다. 특성화(치수 측정)는 본 발명의 임의의 시험관내, 생체외 및/또는 생체내 적용을 위한 전달에 있어서 최적인 크기의 입자를 제공하기 위해 고유 입자(즉, 로딩 이전)에 대해 또는 카고(cargo)의 로딩 후(본 명세서에서 카고는, 예를 들어, 하나 이상의 성분의 CRISPR-Cas 시스템, 예를 들어, CRISPR 효소 또는 mRNA 또는 가이드 RNA, 또는 이들의 임의의 조합을 지칭하며, 추가적인 담체 및/또는 부형제를 포함할 수 있음)에 이루어질 수 있다. 바람직한 특정 구현예에서, 입자 치수(예를 들어, 직경) 특성화는 동적 레이저 산란(DLS)을 사용한 측정을 기반으로 한다. 입자, 이들을 제조하고 사용하는 방법 및 이들의 측정과 관련하여 미국 특허 8,709,843; 미국 특허 6,007,845; 미국 특허 5,855,913; 미국 특허 5,985,309; 미국 특허 5,543,158; 및 2014년 5월 11일에 온라인 공개된 간행물(문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), doi:10.1038/nnano.2014.84])이 언급된다.
본 발명의 범주 내의 입자 전달 시스템은 고체, 반고체, 에멀젼 또는 콜로이드 입자를 포함하지만 이에 제한되지 않는 임의의 형태로 제공될 수 있다. 예를 들어, 지질-기반 시스템, 리포좀, 미셀, 미세소포, 엑소좀, 또는 유전자총을 포함하지만 이에 제한되지는 않는 본 명세서에 기재된 전달 시스템 중 임의의 전달 시스템이 본 발명의 범주 내의 입자 전달 시스템으로서 제공될 수 있다.
입자
CRISPR 효소 mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있으며; 예를 들어, 복합체로서, 예를 들어 CRISPR 효소 및 본 발명의 RNA는 문헌[Dahlman et al., WO2015089419 A2] 및 거기서 인용된 문헌들에서와 같이 입자, 예를 들어 7C1(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84])을 통해, 예를 들어 지질 또는 리피도이드(lipidoid) 및 친수성 중합체, 예를 들어 양이온성 지질 및 친수성 중합체를 포함하는 전달 입자를 통해 전달될 수 있으며, 예를 들어 양이온 지질은 1,2-디올레일-3-트리메틸암모늄-프로판(DOTAP) 또는 1,2-디테트라데카노일-sn-글리세로-3-포스포콜린(DMPC)을 포함하고/포함하거나, 여기서 친수성 중합체는 에틸렌 글리콜 또는 폴리에틸렌 글리콜(PEG)을 포함하고/포함하거나; 여기서 입자는 콜레스테롤을 추가로 포함하고(예를 들어, 제형 1 = DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0; 제형 번호 2 = DOTAP 90, DMPC 0, PEG 10, 콜레스테롤 0; 제형 번호 3 = DOTAP 90, DMPC 0, PEG 5, 콜레스테롤 5로부터의 입자), 여기서 입자는 효율적인 다단계 공정을 사용하여 형성되며, 여기서 먼저 이펙터 단백질 및 RNA는 함께, 예를 들어 1:1의 몰 비로, 예를 들어 실온에서, 예를 들어 30 분 동안, 예를 들어 멸균 무-뉴클레아제 1X PBS 중에서 혼합되고; 별도로 제형에 대해 적용가능함에 따라 DOTAP, DMPC, PEG, 및 콜레스테롤을 알콜, 예를 들어 100% 에탄올에 용해시키고; 2 개의 용액을 함께 혼합하여 복합체를 함유하는 입자를 형성한다.
핵산 및 표적화 단백질(예를 들어, C2c2과 같은 제VI형 단백질) mRNA 및 가이드 RNA는 입자 또는 지질 외피를 사용하여 동시에 전달될 수 있다.
예를 들어, 문헌[Su X, Fricke J, Kavanagh DG, Irvine DJ ("In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsive polymer nanoparticles" Mol Pharm. 2011 Jun 6;8(3):774-87. doi: 10.1021/mp100390w. Epub 2011 Apr 1)]은 인지질 이중층 쉘에 의해 둘러싸인 폴리(β-아미노 에스테르)(PBAE) 코어를 지니는 생분해성 코어-쉘 구조의 입자를 기재한다. 이들은 생체내 mRNA 전달을 위해 개발되었다. pH-반응성 PBAE 성분은 엔도솜 파괴를 촉진하도록 선택되는 한편, 지질 표면층은 다가양이온 코어의 독성을 최소화하도록 선택되었다. 따라서 이와 같은 것은 본 발명의 RNA를 전달하는 데 바람직하다.
일 구현예에서, 모두 뇌로의 펩티드의 구강 전달, 펩티드의 정맥내 전달 및 펩티드의 비강 전달에 적용될 수 있는 생접착성 중합체의 자가 조립에 기반한 입자가 고려된다. 다른 구현예, 예를 들어 소수성 약물의 구강 흡수 및 눈 전달이 또한 고려된다. 분자 외피 기술은 보호되고, 질병의 부위에 전달되는 조작된 중합체 외피를 수반한다(예를 들어, 문헌[Mazza, M. et al. ACSNano, 2013. 7(2): 1016-1026]; [Siew, A., et al. Mol Pharm, 2012. 9(1):14-28]; [Lalatsa, A., et al. J Contr Rel, 2012. 161(2):523-36]; [Lalatsa, A., et al., Mol Pharm, 2012. 9(6):1665-80]; [Lalatsa, A., et al. Mol Pharm, 2012. 9(6):1764-74]; [Garrett, N.L., et al. J Biophotonics, 2012. 5(5-6):458-68]; [Garrett, N.L., et al. J Raman Spect, 2012. 43(5):681-688]; [Ahmad, S., et al. J Royal Soc Interface 2010. 7:S423-33]; [Uchegbu, I.F. Expert Opin Drug Deliv, 2006. 3(5):629-40]; [Qu, X.,et al. Biomacromolecules, 2006. 7(12):3452-9] 및 [Uchegbu, I.F., et al. Int J Pharm, 2001. 224:185-199] 참조). 표적 조직에 따라, 약 5 ㎎/kg 용량의 단일 또는 다중 용량이 고려된다.
일 구현예에서, MIT의 Dan Anderson 연구소에 의해 개발된 종양 성장을 중단시키기 위해 암 세포에 RNA를 전달할 수 있는 입자가 본 발명의 핵산-표적화 시스템에 대해 사용되고/사용되거나 적합하게 될 수 있다. 특히, Anderson 연구소는 새로운 생체재료 및 나노제형의 합성, 정제, 특성화 및 제형화를 위한 완전히 자동화된 조합 시스템을 개발하였다. 예를 들어, 문헌[Alabi et al., Proc Natl Acad Sci U S A. 2013 Aug 6;110(32):12881-6]; [Zhang et al., Adv Mater. 2013 Sep 6;25(33):4641-5]; [Jiang et al., Nano Lett. 2013 Mar 13;13(3):1059-64]; [Karagiannis et al., ACS Nano. 2012 Oct 23;6(10):8484-7]; [Whitehead et al., ACS Nano. 2012 Aug 28;6(8):6922-9] 및 [Lee et al., Nat Nanotechnol. 2012 Jun 3;7(6):389-93]을 참조한다.
미국 특허 출원 20110293703은 또한 본 발명의 핵산-표적화 시스템을 전달하기 위해 적용될 수 있는 폴리뉴클레오티드의 투여에서 특히 유용한 리피도이드 화합물에 관한 것이다. 일 양태에서, 아미노알콜 리피도이드 화합물은 작용제와 병용되어 세포 또는 대상체에게 전달되어 마이크로입자, 나노입자, 리포좀, 또는 미셀을 형성한다. 입자, 리포좀 또는 미셀에 의해 전달될 작용제는 기체, 액체 또는 고체의 형태일 수 있고, 작용제는 폴리뉴클레오티드, 단백질, 펩티드 또는 소분자일 수 있다. 미노알콜 리피도이드 화합물은 다른 아미노알콜 리피도이드 화합물, 중합체(합성 또는 천연), 계면활성제, 콜레스테롤, 탄수화물, 단백질, 지질 등과 조합되어 입자를 형성할 수 있다. 이어서 이들 입자는 선택적으로 약학적 부형제와 조합되어 약학적 조성물을 형성할 수 있다.
미국 특허 공개 20110293703은 또한 아미노알콜 리피도이드 화합물의 제조 방법을 제공한다. 1 이상의 당량의 아민을 본 발명의 아미노알콜 리피도이드 화합물을 형성하기에 적합한 조건 하에서 에폭시드-말단 화합물의 1 당량 이상과 반응되게 한다. 특정 구현예에서, 아민의 모든 아미노기는 에폭시드-말단 화합물과 완전히 반응되어 3 차 아민을 형성한다. 다른 구현예에서, 아민의 모든 아미노기는 3 차 아민을 형성하기 위하여 에폭시드-말단 화합물과 완전히 반응되지 않으며, 이에 의해 아미노알콜 리피도이드 화합물에서 1 차 또는 2 차 아민이 초래된다. 이들 1 차 또는 2 차 아민은 그대로 남아 있거나, 또 다른 친핵체, 예를 들어 상이한 에폭시드-말단 화합물과 반응할 수 있다. 당업자에 의해 인식될 바와 같이, 아민을 과량 미만의 에폭시드-말단 화합물과 반응시키는 것은 다양한 수의 테일을 지니는 복수의 상이한 아미노알콜 리피도이드 화합물을 초래할 것이다. 특정 아민은 2 개의 에폭시드 유래 화합물 테일로 완전히 작용화될 수 있는 반면, 다른 분자는 에폭시드 유래 화합물 테일에 의해 완전히 작용화되지 않을 것이다. 예를 들어, 디아민 또는 폴리아민은 분자의 다양한 아미노 모이어티를 제거하는 1 개, 2 개, 3 개 또는 4 개의 에폭시드 유래 화합물 테일을 포함하여 1 차, 2 차 및 3 차 아민을 초래할 수 있다. 특정 구현예에서, 모든 아미노기는 완전히 작용화되지 않는다. 특정 구현예에서, 2 가지 동일 유형의 에폭시드 말단 화합물이 사용된다. 다른 구현예에서, 2 개 이상의 상이한 에폭시드 말단 화합물이 사용된다. 아미노알콜 리피도이드 화합물의 합성은 용매와 함께 또는 용매 없이 수행되고, 합성은 30℃ 내지 100℃, 바람직하게는 대략 50℃ 내지 90℃ 범위의 고온에서 실행될 수 있다. 제조된 아미노알콜 리피도이드 화합물은 선택적으로 정제될 수 있다. 예를 들어, 아미노알콜 리피도이드 화합물의 혼합물을 정제하여, 특정 수의 에폭시드 유래 화합물 테일을 지니는 아미노알콜 리피도이드 화합물을 수득할 수 있다. 또는 혼합물을 정제하여 특정 입체 이성질체 또는 구조 이성질체를 수득할 수 있다. 아미노알콜 리피도이드 화합물은 또한 알킬 할로겐화물(예를 들어, 요오드화메틸) 또는 다른 알킬화제를 사용하여 알킬화될 수 있고/있거나 이들은 아실화될 수 있다.
미국 특허 공개 20110293703은 또한 본 발명의 방법에 의해 제조된 아미노알콜 리피도이드 화합물의 라이브러리를 제공한다. 이들 아미노알콜 리피도이드 화합물은 액체 핸들러(handler), 로봇, 마이크로타이터 플레이트, 컴퓨터 등을 수반하는 고처리량 기법을 사용하여 제조 및/또는 스크리닝될 수 있다. 특정 구현예에서, 아미노알콜 리피도이드 화합물을 폴리뉴클레오티드 또는 다른 작용제(예를 들어, 단백질, 펩티드, 소분자)를 세포에 형질감염시키는 이들의 능력에 대해 스크리닝한다.
미국 특허 공개 20130302401은 조합 중합을 사용하여 제조된 폴리(베타-아미노 알콜)(PBAA)의 부류에 관한 것이다. 본 발명의 PBAA는 코팅(예를 들어, 의료장치 또는 이식물에 대한 필름 또는 다중층 필름의 코팅), 첨가제, 재료, 부형제, 비생물오손제(non-biofouling agent), 미세패터닝제 및 세포 캡슐화제로서 생명공학 및 생체의학 적용분야에서 사용될 수 있다. 표면 코팅제로서 사용될 때, 이들 PBAA는 이들의 화학적 구조에 따라서 시험관내와 생체내 둘 다에서 상이한 염증 수준을 유발하였다. 이러한 부류의 물질의 큰 화학적 다양성은 출원인이 시험관내 대식세포 활성화를 억제하는 중합체 코팅제를 확인하게 하였다. 더욱이, 이들 코팅제는 카르복실화된 폴리스티렌 마이크로입자의 피하 이식 후에 염증 세포의 동원을 감소시키고, 섬유증을 감소시킨다. 이들 중합체를 사용하여 세포 캡슐화를 위한 고분자전해질 복합체 캡슐을 형성할 수 있다. 본 발명은 또한 미생물방지 코팅, DNA 또는 siRNA 전달, 및 줄기 세포 조직 조작과 같은 다수의 다른 생물학적 적용분야를 가질 수 있다. 미국 특허 공개 20130302401의 교시는 본 발명의 핵산-표적화 시스템에 적용될 수 있다.
또 다른 구현예에서, 지질 나노입자(LNP)가 고려된다. 항트렌스티레틴(anti트렌스티레틴) 짧은 간섭 RNA는 지질 나노입자에서 캡슐화되고, 인간으로 전달되며(예를 들어, 문헌[Coelho et al., N Engl J Med 2013;369:819-29] 참조), 이와 같은 시스템은 본 발명의 핵산-표적화 시스템에 적합하게 되고, 적용될 수 있다. 정맥내로 투여된 체중 kg 당 약 0.01 ㎎ 내지 약 1 ㎎의 용량이 고려된다. 주입 관련 반응의 위험을 감소시키기 위한 의약이 고려되며, 예를 들어 덱사메타손, 아세탐피노펜, 디펜하이드라민 또는 세티리진 및 라니티딘이 고려된다. 5 회 용량에 있어서 4 주마다 킬로그램 당 약 0.3 ㎎의 다회 용량이 또한 고려된다.
LNP는 siRNA를 간에 전달함에 있어 고도로 효과적인 것으로 나타났으며(예를 들어, 문헌[Tabernero et al., Cancer Discovery, April 2013, Vol. 3, No. 4, pages 363-470] 참조), 따라서 핵산-표적화 이펙터 단백질을 인코딩하는 RNA를 간으로 전달하기 위해 고려된다. 2 주마다 6 ㎎/kg의 LNP의 약 4 회 용량의 용량이 고려될 수 있다. Tabernero 외는 0.7 ㎎/kg으로 투약한 LNP의 처음 2 사이클 후에 종양 퇴행을 관찰하였고, 6 사이클의 종료까지 환자는 림프절 전이의 완전한 퇴행 및 간 종양의 실질적 수축으로 부분적 반응을 달성하였음을 입증하였다. 관해가 남아 있는 이러한 환자에서 40 회 용량 후에 완전한 반응을 수득하였고, 26 개월에 걸쳐 용량을 제공한 후에 치료를 완료하였다. VEGF 경로 억제제를 이용한 사전 치료법 후에 진행한 신장, 폐 및 림프절을 포함하는 RCC 및 간외영역 질병을 지니는 2 명의 환자는 대략 8 개월 내지 12 개월 동안 모든 부위에서 안정적인 질병을 가졌고, PNET 및 간 전이를 지니는 환자는 안정적인 질병과 함께 18 개월(36 회 용량) 동안 연장 연구를 계속하였다.
그러나, LNP의 전하를 고려하여야 한다. 양이온성 지질은 세포내 전달을 용이하게 하는 비이중층 구조를 유도하기 위해 음으로 하전된 지질과 조합되기 때문이다. 하전된 LNP는 정맥내 주사 후 순환으로부터 빠르게 제거되기 때문에, 7 미만의 pKa 값을 지니는 이온화 가능한 양이온성 지질을 개발하였다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 음으로 하전된 중합체, 예를 들어 RNA는 이온화 가능한 지질이 양전하를 나타내는 경우 낮은 pH 값(예를 들어, pH 4)에서 LNP에 로딩될 수 있다. 그러나, 생리적 pH 값에서, LNP는 더 긴 순환 시간과 양립 가능한 낮은 표면 전하를 나타낸다. 이온화 가능한 양이온성 지질의 4 개 종, 즉, 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시-케토-N,N-디메틸-3-아미노프로판(DLinKDMA), 및 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA)에 중점을 두었다. 이들 지질을 함유하는 LNP siRNA 시스템은 생체내 간세포에서 현저하게 상이한 유전자 침묵화 특성을 나타내는 것으로 나타났고, 효능은 인자 VII 유전자 침묵화 모델을 이용하는 시리즈 DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP에 따라 다르다(예를 들어, 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011] 참조). 특히 DLinKC2-DMA를 함유하는 제형에 대하여, 1 μg/ml의 용량의 LNP 또는 LNP 중의 또는 이와 회합된 CRISPR Cas RNA가 고려될 수 있다.
LNP의 제조 및 CRISPR-Cas 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 적합하게 될 수 있다. 양이온성 지질 1,2-디리네오일-3-디메틸암모늄-프로판(DLinDAP), 1,2-디리놀레일옥시-3-N,N-디메틸아미노프로판(DLinDMA), 1,2-디리놀레일옥시케토-N,N-디메틸-3-아미노프로판(DLinK-DMA), 1,2-디리놀레일-4-(2-디메틸아미노에틸)-[1,3]-디옥솔란(DLinKC2-DMA),(3-o-[2"-(메톡시폴리에틸렌글리콜 2000) 숙시노일]-1,2-디미리스토일-sn-글리콜(PEG-S-DMG), 및 R-3-[(ω-메톡시-폴리(에틸렌 글리콜)2000) 카르바모일]-1,2-디미리스틸옥시프로필-3-아민(PEG-C-DOMG)은 Tekmira Pharmaceuticals(캐나다 밴쿠버에 소재)에 의해 제공될 수 있거나 합성될 수 있다. 콜레스테롤은 Sigma(미국 미주리주 세인트루이스 소재)로부터 구입할 수 있다. 특정 핵산-표적화 복합체(CRISPR-Cas) RNA는 DLinDAP, DLinDMA, DLinK-DMA 및 DLinKC2-DMA(40:10:40:10 몰비의 양이온성 지질:DSPC:CHOL: PEGS-DMG 또는 PEG-C-DOMG)를 함유하는 LNP 내에 캡슐화될 수 있다. 필요하다면, 0.2% SP-DiOC18(Invitrogen, 캐나다 벌링턴 소재)을 혼입시켜 세포 흡수, 세포내 전달, 및 생체분포를 평가할 수 있다. 캡슐화는 10 mmol/l의 최종 지질 농도로 양이온성 지질:DSPC:콜레스테롤:PEG-c-DOMG(40:10:40:10 몰비)로 구성된 지질 혼합물을 에탄올 중에 용해함으로써 실행될 수 있다. 이러한 지질의 에탄올 용액을 50 mmol/l 시트르산염, pH 4.0에 적가하여 다중 라멜라 소낭를 형성하여 30% 에탄올 vol/vol의 최종 농도를 생성할 수 있다. 압출기(Northern Lipids, 캐나다 벤쿠버 소재)를 사용하여 2 개의 적층 80 nm Nuclepore 폴리카르보네이트 필터를 통해 다중 라멜라 소낭을 압출한 후 거대 단일 라멜라 소낭이 형성될 수 있다. 30% 에탄올 vol/vol을 함유하는 50 mmol/l 시트르산염, pH 4.0 중에 2 mg/ml로 용해시킨 RNA를 압출된 사전형성된 거대 단일 라멜라 소낭에 적가하고, 0.06/1 wt/wt의 최종 RNA/지질 중량비로 일정하게 혼합하면서 30 분 동안 31℃에서 인큐베이션함으로써 캡슐화를 달성할 수 있다. Spectra/Por 2 재생 셀룰로스 투석막을 사용하여 16 시간 동안 인산염 완충 식염수(PBS), pH 7.4에 대해 투석함으로써 에탄올의 제거 및 제형 완충제의 중화를 실행하였다. NICOMP 370 입도 분석기, 소낭/강도 모드, 및 가우시안(Gaussian) 핏팅(Nicomp Particle Sizing, 미국 캘리포니아주 산타 바바라 소재)을 사용하여 동적 광 산란에 의해 입자 크기 분포를 결정할 수 있다. 3 개 모두의 LNP 시스템에 대한 입자 크기는 직경이 약 70 nm일 수 있다. VivaPureD MiniH 컬럼(Sartorius Stedim Biotech)을 사용하여 투석 전 및 후에 수집한 샘플로부터 유리 RNA를 제거함으로써 RNA 캡슐화 효율을 결정할 수 있다. 캡슐화된 RNA는 용리된 입자로부터 추출되고, 260 nm에서 정량화될 수 있다. RNA 대 지질 비는 Wako Chemicals USA(미국 버지니아주 리치몬드 소재)로부터의 콜레스테롤 E 효소 검정을 사용하여 소낭 내 콜레스테롤 함량의 측정에 의해 결정되었다. LNP 및 PEG 지질의 본 명세서에서의 논의와 함께, PEG화 리포좀 또는 LNP는 마찬가지로 핵산-표적화 시스템 또는 이의 성분의 전달에 적합하다.
거대 LNP의 제조는 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, Dec. 2011]으로부터 사용될 수 있고/있거나 이에 적합하게 될 수 있다. 지질 예비혼합 용액(20.4 ㎎/㎖ 총 지질 농도)은 50:10:38.5 몰비로 DLinKC2-DMA, DSPC 및 콜레스테롤을 함유하는 에탄올 중에서 제조될 수 있다. 아세트산나트륨은 0.75:1의 몰비(아세트산나트륨:DLinKC2-DMA)로 지질 예비혼합물에 첨가될 수 있다. 지질은 격렬한 교반과 함께 1.85 부피의 시트르산염 완충제(10 mmol/l, pH 3.0)와 혼합물을 합함으로써 이후에 수화되어, 35% 에탄올을 함유하는 수성 완충제 중의 자발적 리포좀 형성을 초래할 수 있다. 리포좀 용액을 37℃에서 인큐베이션시켜 시간-의존적 입자 크기의 증가를 가능하게 할 수 있다. 분취물을 인큐베이션 동안 다양한 시간에 제거하여, 동적 광 산란에 의해 리포좀 크기의 변화를 조사할 수 있다(Zetasizer Nano ZS, Malvern Instruments, 영국 우스터셔 소재). 일단 원하는 입자 크기가 달성되면, 수성 PEG 지질 용액(원액 = 35%(vol/vol) 에탄올 중의 10 mg/ml PEG-DMG)을 리포좀 혼합물에 첨가하여 3.5%의 총 지질의 최종 PEG 몰 농도를 제공할 수 있다. PEG-지질의 첨가 시, 리포좀을 추가 성장을 효과적으로 켄칭시켜 이들의 크기를 해야 한다. 이어서, RNA를 대략 1:10(wt:wt)의 RNA 대 총 지질 비로 빈 리포좀에 첨가한 후에 37℃에서 30 분 동안 인큐베이션시켜 로딩된 LNP를 형성할 수 있다. 혼합물을 후속적으로 PBS 중에 밤새 투석시키고, 0.45-㎛ 주사기 필터로 여과할 수 있다.
구체 핵산(Spherical Nucleic Acid; SNA™) 작제물 및 다른 입자(특히, 금 입자)는 또한 의도된 표적에 핵산-표적화 시스템을 전달하기 위한 수단으로서 고려된다. 유의한 데이터는 핵산 작용화된 금 입자에 기반한 AuraSense Therapeutics의 구체 핵산(SNA™) 작제물이 유용한 것을 나타낸다.
본 명세서의 교시와 함께 이용될 수 있는 문헌은 문헌[Cutler et al., J. Am. Chem. Soc. 2011 133:9254-9257], [Hao et al., Small. 2011 7:3158-3162], [Zhang et al., ACS Nano. 2011 5:6962-6970], [Cutler et al., J. Am. Chem. Soc. 2012 134:1376-1391], [Young et al., Nano Lett. 2012 12:3867-71], [Zheng et al., Proc. Natl. Acad. Sci. USA. 2012 109:11975-80], [Mirkin, Nanomedicine 2012 7:635-638], [Zhang et al., J. Am. Chem. Soc. 2012 134:16488-1691], [Weintraub, Nature 2013 495:S14-S16], [Choi et al., Proc. Natl. Acad. Sci. USA. 2013 110(19):7625-7630], [Jensen et al., Sci. Transl. Med. 5, 209ra152(2013)] 및 [Mirkin, et al., Small, 10:186-192]을 포함한다.
RNA를 지니는 자가 조립 입자는, 폴리에틸렌 글리콜(PEG)의 원위 말단에 부착된 Arg-Gly-Asp(RGD) 펩티드 리간드로 PEG화된 폴리에틸렌이민(PEI)을 이용하여 작제될 수 있다. 이러한 시스템은, 예를 들어 인테그린을 발현하는 종양 신생혈관을 표적화하고, 혈관 내피 성장 인자 수용체-2(VEGF R2) 발현을 억제하는 siRNA를 전달하여, 이에 의해, 종양 혈관형성을 달성하기 위한 수단으로 사용된다(예를 들어, 문헌[Schiffelers et al., Nucleic Acids Research, 2004, Vol. 32, No. 19] 참조). 나노플렉스(nanoplex)를 동일한 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조하여 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공할 수 있다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 갖는 폴리플렉스(polyplex)의 형성을 초래하며, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Schiffelers외의 자가 조립 입자에서의 전달을 위해 약 100 mg 내지 200 mg의 핵산-표적화 복합체 RNA의 용량이 예상된다.
Bartlett 외(문헌[PNAS, September 25, 2007,vol. 104, no. 39])의 나노플렉스가 또한 본 발명에 적용될 수 있다. Bartlett 외의 나노플렉스는 동일 부피의 양이온성 중합체 및 핵산의 수용액을 혼합함으로써 제조되어 2 내지 6의 범위에 걸쳐 인산염(핵산)에 대한 순 몰 과량의 이온화 가능한 질소(중합체)를 제공한다. 양이온성 중합체와 핵산 간의 정전기적 상호작용은 약 100 nm의 평균 입자 크기 분포를 지니는 폴리플렉스의 형성을 초래하였고, 따라서 본 명세서에서 나노플렉스로서 지칭된다. Bartlett 외의 DOTA-siRNA를 다음과 같이 합성하였다: 1,4,7,10-테트라아자사이클로도데칸-1,4,7,10-테트라아세트산 모노(N-하이드록시숙신이미드 에스테르)(DOTA-NHS에스테르)를 Macrocyclics(미국 텍사스주 달라스 소재)에서 주문하였다. 탄산염 완충제(pH 9) 중의 100 배 몰 과량의 DOTA-NHS-에스테르에 의한 아민 변형 RNA 센스 가닥을 마이크로원심분리 튜브에 첨가하였다. 내용물을 실온에서 4 시간 동안 교반시킴으로써 반응시켰다. DOTA-RNA센스 컨쥬게이트를 에탄올 침전시키고, 수 중에 재현탁화한 다음, 미변형 안티센스 가닥에 어닐링시켜 DOTA-siRNA를 수득하였다. 모든 액체를 Chelex-100(Bio-Rad, 미국 캘리포니아주 허큘러스 소재)으로 전처리하여 미량의 금속 오염물질을 제거하였다. Tf-표적화 및 비표적화 siRNA 입자를 사이클로덱스트린-함유 다가양이온을 사용함으로써 형성할 수 있다. 전형적으로, 입자를 전하비 3(+/-) 및 siRNA 농도 0.5 g/리터로 수 중에서 형성하였다. 표적화된 입자의 표면 상의 아다만탄-PEG 분자의 1%를 Tf로 변형시켰다(아다만탄-PEG-Tf). 입자를 주사용 5%(wt/vol) 글루코스 담체 용액 중에서 현탁화시켰다.
Davis 외(문헌[Nature, Vol 464, 15 April 2010])는 표적화된 입자-전달 시스템(임상 시험 등록 번호 NCT00689065)을 사용하는 RNA 임상 시험을 수행한다. 표준 치료 치료법에 난치성인 고형암을 지니는 환자에게 30 분 정맥내 주입에 의해 21 일 사이클 중 제1 일, 제3 일, 제8 일 및 제10 일에 표적화된 입자의 용량을 투여한다. 입자는 하기를 함유하는 합성 전달 시스템을 포함하거나, 으로 essentially 이루어지거나, 으로 이루어진다:(1) 선형, 사이클로덱스트린-기반 중합체(CDP), (2) 암 세포의 표면 상의 TF 수용체(TFR)에 맞물리는 나노입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드, (3) 친수성 중합체(생물학적 유체 중에서 나노입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG)), 및 (4) RRM2의 발현을 감소시키도록 설계된 siRNA(임상에서 사용한 서열은 앞서 정의한 siR2B+5였음). TFR는 악성 세포에서 상향조절되는 것으로 오랫동안 알려져 있고, RRM2는 확립된 항암 표적이다. 이들 입자(CALAA-01로서 정의된 임상 형태)는 비-인간 영장류에서의 다회 투약 연구에서 잘 용인되는 것으로 나타났다. 만성 골수성 백혈병을 지니는 단일 환자에게 리포좀 전달에 의해 siRNA가 투여되었지만, Davis 외의 임상 시험은 표적화된 전달 시스템을 이용하여 siRNA를 전신으로 전달하기 위한 그리고 고형암을 지니는 환자를 치료하기 위한 초기 인간 시험이다. 표적화된 전달 시스템이 인간 종양으로의 기능성 siRNA의 효과적인 전달을 제공할 수 있는지 여부를 확인하기 위해, Davis 외는 3 개의 상이한 투약 코호트로부터의 3 명 환자로부터의 생검을 조사하였으며; 환자 A, B 및 C는 모두 전이성 흑색종을 가졌고, 각각 18 mg m-2, 24 mg m-2 및 30 ㎎ m-2 siRNA의 CALAA-01 용량을 받았다. 유사한 용량이 또한 본 발명의 핵산-표적화 시스템을 위해 고려될 수 있다. 본 발명의 전달은 선형, 사이클로덱스트린-기반 중합체(CDP), 암세포의 표면 상의 TF 수용체(TFR)에 맞물리는 입자 외부에 나타나는 인간 트랜스페린 단백질(TF) 표적화 리간드 및/또는 친수성 중합체(예를 들어, 생물학적 유체 중에서 입자 안정성을 촉진하기 위해 사용되는 폴리에틸렌 글리콜(PEG))를 함유하는 입자에 의해 달성될 수 있다.
본 발명과 관련하여, 입자 또는 지질 외피를 사용하여 핵산-표적화 복합체의 하나 이상의 성분, 예를 들어 핵산-표적화 이펙터 단백질 또는 mRNA, 또는 가이드 RNA가 전달될 수 있는 것이 바람직하다. 다른 전달 시스템 또는 벡터가 본 발명의 입자 양태와 함께 사용될 수 있다.
일반적으로, "나노입자"는 1000 nm 미만의 직경을 갖는 임의의 입자를 나타낸다. 바람직한 특정 구현예에서, 본 발명의 나노입자는 500 nm 이하의 가장 큰 치수(예를 들어, 직경)를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 25 nm 내지 200 nm 범위의 가장 큰 치수를 갖는다. 다른 바람직한 구현에에서, 본 발명의 입자는 100 nm 이하의 가장 큰 치수를 갖는다. 다른 바람직한 구현예에서, 본 발명의 나노입자는 35 nm 내지 60 nm 범위의 가장 큰 치수를 갖는다.
본 발명에 포함된 입자는 상이한 형태, 예를 들어 고체 입자(예를 들어, 금속, 예를 들어 은, 금, 철, 티타늄), 비-금속, 지질-기반 고체, 중합체), 입자의 현탁액, 또는 이들의 조합물로 제공될 수 있다. 금속, 유전체, 및 반도체 입자뿐만 아니라 하이브리드 구조(예를 들어, 코어-쉘 입자)가 제조될 수 있다. 반도체 물질로 제조된 입자는 또한 이들이 전자 에너지 수준의 양자화가 발생하기에 충분히 작은(통상적으로, 10 nm 이하) 경우 양자점으로 표지화될 수 있다. 이와 같은 나노규모 입자는 약물 담체 또는 이미징 작용제로서 생물의학 응용에서 사용되며, 본 발명에서 유사한 목적을 위해 적합하게 될 수 있다.
반고체 및 연성 입자가 제조되었고, 이들은 본 발명의 범주 내에 속한다. 반고체 성질의 프로토타입 입자는 리포좀이다. 다양한 유형의 리포좀 입자가 항암 약물 및 백신을 위한 전달 시스템으로서 현재 임상적으로 사용된다. 절반이 친수성이고, 나머지 절반이 소수성인 입자는 야누스(Janus) 입자로 명명되며, 에멀젼을 안정화시키는 데 특히 효과적이다. 이들은 물/오일 계면에서 자가-조립되며, 고체 계면활성제로 작용할 수 있다.
참고로 본 명세서에 포함되는 미국 특허 제8,709,843 호는 조직, 세포, 및 세포내 구획으로의 치료제-함유 입자의 표적화된 전달을 위한 약물 전달 시스템을 제공한다. 상기 발명은 계면활성제, 친수성 중합체 또는 지질에 컨쥬게이트된 중합체를 포함하는 표적화된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제6,007,845 호는 다작용성 화합물과 하나 이상의 소수성 중합체 및 하나 이상의 친수성 중합체를 공유적으로 연결시킴으로써 형성된 멀티블록 공중합체의 코어를 갖고, 생물학적으로 활성인 물질을 함유하는 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,855,913 호는 폐기관계로의 약물 전달을 위해 표면 상에 계면활성제가 혼입된, 0.4 g/㎤ 미만의 탭 밀도(tap density)와 함께 5 ㎛ 내지 30 ㎛의 평균 직경을 갖는 공기역학적으로 가벼운 입자를 갖는 미립자 조성물을 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,985,309 호는 폐기관계로의 전달을 위한 계면활성제 및/또는 양으로 또는 음으로 하전된 치료제 또는 진단제 및 반대 전하로 하전된 분자의 친수성 또는 소수성 복합체가 혼입된 입자를 제공한다.
참고로 본 명세서에 포함되는 미국 특허 제5,543,158 호는 표면 상에 폴리(알킬렌 글리콜) 모이어티 및 생물학적 활성 물질을 함유하는 생분해성 고체 코어를 갖는 생분해성 주사가능한 입자를 제공한다.
참고로 본 명세서에 포함되는 WO2012135025(또한 US20120251560으로 공개됨)는 컨쥬게이트된 폴리에틸렌이민(PEI) 중합체 및 컨쥬게이트된 아자-마크로사이클(집합적으로, "컨쥬게이트된 리포머" 또는 "리포머"로 지칭됨)이 기재한다. 특정 구현예에서, 이와 같은 본 명세서에 인용된 문서의 방법 및 물질, 예를 들어, 컨쥬게이트된 리포머가 단백질 발현의 조절을 포함하여 유전자 발현을 변형시키기 위한 시험관내, 생체외 및 생체내 게놈 변동을 달성하기 위해 핵산-표적화 시스템의 상황에서 사용될 수 있음이 계획될 수 있다.
일 구현예에서, 입자는 에폭시드-변형된 지질-중합체, 유리하게는 7C1일 수 있다(예를 들어, 문헌[James E. Dahlman and Carmen Barnes et al. Nature Nanotechnology(2014), 2014년 5월 11일 온라인 발행, doi:10.1038/nnano.2014.84] 참조). C71을 14:1의 몰비로 C15 에폭시드-말단 지질과 PEI600을 반응시킴으로써 합성하였고, 적어도 40 일 동안 PBS 용액에서 안정적인 입자(35 nm 내지 60 nm의 직경)를 생성시키기 위해 C14PEG2000과 함께 제형화하였다.
폐, 심혈관 또는 신장 세포로 본 발명의 핵산-표적화 시스템을 전달하기 위해 에폭시드-변형된 지질-중합체가 이용될 수 있으나, 당업자는 다른 표적 기관으로 전달하기 위해 시스템을 적합하게 할 수 있다. 약 0.05 mg/kg내지 약 0.6 mg/kg 범위의 용량이 계획된다. 약 2 mg/kg의 전체 용량의 수 일 또는 수 주에 걸친 용량이 또한 계획된다.
엑소좀
엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 전달하는 내인성 나노-소낭이다. 면역원성을 감소시키기 위해, Alvarez-Erviti외(문헌[2011, Nat Biotechnol 29: 341])는 엑소좀 생성을 위해 자가-유래 수상돌기 세포를 사용하였다. 뉴런-특이적 RVG 펩티드에 융합된 엑소좀 막 단백질인 Lamp2b를 발현하도록 수상돌기 세포를 조작함으로써 뇌로의 표적화를 달성하였다. 정제된 엑소좀에 전기천공법에 의해 외인성 RNA를 로딩하였다. 정맥내로 주사한 RVG-표적화 엑소좀은 뇌 내의 뉴런, 미세아교세포, 희소돌기신경교에 특이적으로 GAPDH siRNA를 전달하여, 특이적 유전자 녹다운을 초래하였다. RVG 엑소좀에 대한 사전 노출은 녹다운을 약화시키지 않았고, 다른 조직에서의 비-특이적 흡수는 관찰되지 않았다. 엑소좀-매개 siRNA 전달의 치료 잠재력은 알츠하이머병에서의 치료 표적인 BACE1의 강력한 mRNA(60%) 및 단백질(62%) 녹다운에 의해 입증되었다.
면역학적으로 비활성인 엑소좀의 풀을 얻기 위해, Alvarez-Erviti외는 상동성 주조직적합성 복합체(MHC) 단상형을 지니는 근친교배 C57BL/6 마우스로부터 골수를 수집하였다. 미성숙 수상돌기 세포가 MHC-II 및 CD86과 같은 T-세포 활성화제가 없는 다량의 엑소좀을 생성하기 때문에, Alvarez-Erviti외는 7 일 동안 과립구/대식세포-콜로니 자극 인자(GM-CSF)를 지니는 수상돌기 세포에 대해 선택하였다. 잘 확립된 초원심분리 프로토콜을 사용하여 다음날 배양 상청액으로부터 엑소좀을 정제하였다. 생성된 엑소좀은 물리적으로 균질하였고, 크기 분포는 입자 트래킹 분석(NTA) 및 전자 현미경에 의해 결정하였을 때, 직경 80 nm에서 최고였다. Alvarez-Erviti외는 106 개 세포당 6 μg 내지 12 μg의 엑소좀(단백질 농도를 기준으로 측정)을 얻었다.
다음에, Alvarez-Erviti외는 나노규모 적용에 적합한 전기천공법 프로토콜을 사용하여 외인성 카고로의 변형된 엑소좀의 로딩 가능성을 조사하였다. 나노미터 규모에서 막 입자에 대한 전기천공법은 제대로 특성화되지 않기 때문에, 비특이적 Cy5-표지화 RNA를 전기천공법 프로토콜의 경험적 최적화를 위해 사용하였다. 캡슐화된 RNA의 양을 엑소좀의 초원심분리 및 용해 후에 분석하였다. 400 V 및 125 μF에서의 전기천공법은 RNA의 가장 큰 보유를 초래하였고, 모든 후속 실험에 대해 사용하였다.
Alvarez-Erviti외는 150 μg의 RVG 엑소좀 중에 캡슐화된 150 μg의 각각의 BACE1 siRNA를 정상 C57BL/6 마우스에게 투여하고, 녹다운 효율을 4 개의 대조군, 즉 미처리 마우스, RVG 엑소좀만을 주사한 마우스, 생체내 양이온성 리포좀 시약에 복합체화된 BACE1 siRNA를 주사한 마우스, 및 siRNA에 정전기적으로 결합된 9 개의 D-아르기닌에 컨쥬게이트된 RVG 펩티드인 RVG-9R에 복합체화된 BACE1 siRNA를 주사한 마우스에 대하여 비교하였다. 투여 3 일 후 피질 조직 샘플을 분석하였고, siRNA-RVG-9R-처리 마우스와 siRNARVG 엑소좀-처리 마우스 둘 다에서 BACE1 mRNA 수준의 상당한 감소(각각 66% [+ 또는 -] 15%, P < 0.001 및 61% [+ 또는 -] 13%, P < 0.01)로부터 초래되는 상당한 단백질 녹다운(45%, P < 0.05, 대 62%, P < 0.01)을 관찰하였다. 게다가, 출원인은 RVG-엑소좀-처리 동물에서 알츠하이머 병증에서의 아밀로이드 플라크의 주요 성분인 총 [베타]-아밀로이드 1 내지 42 수준에서 상당한 감소(55%, P < 0.05)를 입증하였다. 관찰한 감소는 BACE1 억제제의 정맥내 주사 후 정상 마우스에서 입증된 β-아밀로이드 1 내지 40 감소보다 더 컸다. Alvarez-Erviti외는 BACE1 절단 생성물에 대해 cDNA 말단의 5'-신속한 증폭(RACE)을 수행하였는데, 이는 siRNA에 의한 RNAi-매개 녹다운의 증거를 제공하였다.
최종적으로, Alvarez-Erviti 외는 IL-6, IP-10, TNFα 및 IFN-α 혈청 농도를 평가함으로써 RNA-RVG 엑소좀이 생체내 면역 반응을 유도하였는지 여부를 조사하였다. 엑소좀 처리 후에, 모든 사이토카인에서의 중요하지 않은 변화가 IL-6 분비를 강력하게 자극한 siRNA-RVG-9R과 대조적으로 siRNA-형질감염 시약 처리와 유사하게 등록되었는데, 이는 엑소좀 처리의 면역학적 비활성 프로파일을 확인시켜준다. 엑소좀이 단지 20%의 siRNA를 캡슐화하는 것을 고려해 볼 때, RVG-엑소좀에 의한 전달은 비슷한 mRNA 녹다운으로서 RVG-9R 전달보다 더 효율적인 것으로 나타나며, 대응하는 면역 자극 수준 없이, 더 큰 단백질 녹다운이 5 배 더 적은 siRNA에 의해 달성되었다. 이 실험은 신경변성 질병과 관련된 유전자의 장기간 침묵화에 잠재적으로 적합한 RVG-엑소좀 기술의 치료 잠재력을 입증하였다. Alvarez-Erviti 외의 엑소좀 전달 시스템은 치료 표적, 특히 신경변성 질병에 본 발명의 핵산-표적화 시스템을 전달하기 위해 적용될 수 있다. 약 100 mg 내지 1000 mg의 RVG 엑소좀에서 캡슐화된 약 100 mg 내지 1000 mg의 핵산-표적화 시스템의 용량은 본 발명을 위해 고려될 수 있다.
El-Andaloussi 외(Nature Protocols 7,2112-2126(2012))는 배양 세포로부터 유래된 엑소좀이 시험관내 및 생체내 RNA의 전달을 위해 이용될 수 있는 방법을 개시한다. 이 프로토콜은 펩티드 리간드와 융합된 엑소좀 단백질을 포함하는 발현 벡터의 형질감염을 통한 표적화된 엑소좀의 생성을 처음으로 기재한다. 다음에, El-Andaloussi외는 형질감염된 세포 상청액으로부터 엑소좀을 정제하고 특성화하는 방법을 설명한다. 다음에, El-Andaloussi 외는 RNA를 엑소좀에 로딩하기 위한 결정적인 단계를 상술한다. 최종적으로, El-Andaloussi 외는 마우스 뇌에서 시험관내 및 생체내 RNA를 효율적으로 전달하기 위해 엑소좀을 사용하는 방법을 약술한다. 엑소좀-매개 RNA 전달이 기능성 분석 및 영상에 의해 평가되는 예상된 결과의 예가 또한 제공된다. 전체 프로토콜은 약 3 주가 걸린다. 본 발명에 따른 전달 또는 투여는 자가-유래 수상돌기 세포로부터 생성된 엑소좀을 사용하여 실행될 수 있다. 본 명세서의 교시로부터, 이는 본 발명의 실시에 이용될 수 있다.
또 다른 구현예에서, Wahlgren 외(문헌[Nucleic Acids Research, 2012, Vol. 40, No. 17 e130])의 혈장 엑소좀이 고려된다. 엑소좀은 수상돌기 세포(DC), B 세포, T 세포, 비만 세포, 상피 세포 및 종양 세포를 포함하는 다수의 세포 유형에 의해 생성된 나노 크기 소낭(30 nm 내지 90 nm 크기)이다. 이들 소낭은 후기 엔도솜의 안쪽으로 향하는 출아에 의해 형성되며, 이어서 혈장막과 융합시 세포외 환경으로 방출된다. 엑소좀은 천연적으로 세포 간에 RNA를 운반하기 때문에, 이 특성은 유전자 치료법에 유용할 수 있으며, 이러한 개시 내용으로부터, 본 발명의 실시에 이용될 수 있다.
혈장으로부터의 엑소좀은 20 분 동안 900 g에서 버피 코트의 원심분리로 혈장을 분리시킨 다음에 세포 상청액을 수집하고 10 분 동안 300 g에서 그리고 30 분 동안 16 500 g에서 원심분리하여 세포를 제거한 후 0.22 mm 필터를 통해 여과시킴으로써 제조될 수 있다. 엑소좀을 120 000 g에서 70 분 동안 초원심분리에 의해 펠렛화시킨다. siRNA의 엑소좀 내로의 화학적 형질감염을 RNAi 인간/마우스 스타터 키트(Human/Mouse Starter Kit)(Quiagen, 독일 힐덴 소재)에서 제조업자의 지침서에 따라 수행한다. siRNA를 2 mmol/ml의 최종 농도로 100 ml PBS에 첨가한다. HiPerFect 형질감염 시약을 첨가한 후에, 혼합물을 실온에서 10 분 동안 인큐베이션시킨다. 과량의 미셀을 제거하기 위해, 알데하이드/설페이트 라텍스 비드를 사용하여 엑소좀을 재분리시킨다. 엑소좀 내로의 핵산-표적화 시스템의 화학적 형질감염은 siRNA와 유사하게 수행될 수 있다. 엑소좀은 건강한 공여자의 말초혈액으로부터 분리된 림프구 및 단핵구와 동시배양될 수 있다. 따라서, 핵산-표적화 시스템을 함유하는 엑소좀은 인간의 단핵구 및 림프구에 도입될 수 있고 인간에게 자가 조직으로 재도입될 수도 있는 것이 고려될 수 있다. 따라서, 본 발명에 따른 전달 또는 투여는 혈장 엑소좀을 사용하여 실행될 수 있다.
리포좀
본 발명에 따른 전달 또는 투여는 리포좀을 이용하여 실행될 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 이들이 생체적합성, 비독성이기 때문에 약물 전달 담체로서 상당한 관심을 얻었고, 친수성과 친지성 약물 분자를 둘 다 전달할 수 있으며, 혈장 효소에 의한 분해로부터 그들의 카고를 보호하고, 생물학적 막 및 혈액 뇌 장벽(BBB)을 가로질러 그들의 로드를 전달할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 통상적으로 사용된다. 지질 필름이 수용액과 혼합될 때 리포좀 형성은 자발적이지만, 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용하는 것에 의한 진탕 형태로 힘을 적용함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀의 구조 및 특성을 변형시키기 위해 몇몇 다른 첨가제가 리포좀에 첨가될 수 있다. 예를 들어, 콜레스테롤 또는 스핑고미엘린을 리포좀 혼합물에 첨가하여 리포좀 구조를 안정화시키는 데 도움을 주고 리포좀 내부 카고의 누출을 방지할 수 있다. 추가로, 리포좀을 수소화된 난(egg) 포스파티딜콜린 또는 난 포스파티딜콜린, 콜레스테롤, 및 디세틸 포스페이트로부터 제조하고, 리포좀의 평균 소낭 크기를 약 50 nm 및 100 nm로 조정하였다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
리포좀 제형은 주로 천연 인지질 및 지질, 예를 들어 1,2-디스테아로릴-sn-글리세로-3-포스파티딜 콜린(DSPC), 스핑고미엘린, 난 포스파티딜콜린 및 모노시알로강글리오사이드로 구성될 수 있다. 이 제형은 인지질만으로 구성되기 때문에, 리포좀 제형은 다수의 난제와 마주치는데, 그 중 하나는 혈장 내 불안정성이다. 구체적으로 지질막의 조작에서 이들 난제를 극복하기 위한 몇몇 시도가 이루어졌다. 이들 시도 중 하나는 콜레스테롤의 조작에 집중되어 있다. 통상의 제형으로의 콜레스테롤의 첨가는 캡슐화된 생활성 화합물의 혈장 내로의 신속한 방출을 감소시키거나 또는 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE)은 안정성을 증가시킨다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
특히 유리한 구현예에서, 트로이 목마 리포좀(또한 분자 트로이 목마로 알려져 있음)이 바람직하며, 프로토콜은 http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long에서 찾을 수 있다. 이들 입자는 혈관내 주사 후 전체 뇌로의 전이유전자의 전달을 가능하게 한다. 제한에 의해 구속되지 않고, 표면에 컨쥬게이트된 특이적 항체를 지니는 중성 지질 입자는 엔도시토시스를 통해 혈액 뇌 장벽을 가로지르는 것으로 여겨진다. 출원인은 혈관내 주사를 통해 뇌에 뉴클레아제의 CRISPR 패밀리를 전달하기 위해 트로이 목마 리포좀을 이용하는 것을 가정하는데, 이는 배아 조작에 대한 필요 없이 전체 뇌 유전자 도입 동물을 가능하게 할 것이다. 약 1 g 내지 5 g의 DNA 또는 RNA가 리포좀 내 생체내 투여를 위해 고려될 수 있다.
또 다른 구현예에서, 핵산-표적화 시스템 또는 이의 성분은 안정적인 핵산-지질 입자(SNALP)와 같은 리포좀으로 투여될 수 있다(예를 들어, 문헌[Morrissey et al., Nature Biotechnology, Vol. 23, No. 8, August 2005] 참조). SNALP에서 표적화된 특이적 핵산-표적화 시스템의 약 1 mg/kg/일, 3 mg/kg/일 또는 5 mg/kg/일의 매일의 정맥내 주사가 고려된다. 매일의 치료는 약 3 일에 걸쳐 이루어질 수 있고, 이어서 약 5 주 동안 주마다 이루어질 수 있다. 또 다른 구현예에서, 약 1 mg/kg 또는 2.5 mg/kg 의 용량에서 정맥내 주사에 의해 투여되는 특정 핵산-표적화 시스템 캡슐화된 SNALP가 또한 고려된다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조). SNALP 제형은 지질 3-N-[(w메톡시폴리(에틸렌 글리콜) 2000) 카바모일]-1,2-디미리스틸옥시-프로필아민(PEG-C-DMA), 1,2-디리놀레일옥시-N,N-디메틸-3-아미노프로판(DLinDMA), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC) 및 콜레스테롤을 2:40:10:48 몰 백분율 비로 함유할 수 있다(예를 들어, 문헌[Zimmerman et al., Nature Letters, Vol. 441, 4 May 2006] 참조).
또 다른 구현예에서, 안정적인 핵산-지질 입자(SNALP)는 고도로 혈관화된 HepG2-유래 간 종양에 대해 효과적인 전달 분자인 것으로 입증되었지만, 불량하게 혈관화된 HCT-116 유래 간 종양에 대해서는 그렇지 않다(예를 들어, 문헌[Li, Gene Therapy(2012) 19, 775-780] 참조). SNALP 리포좀은 25:1의 지질/siRNA 비 및 48/40/10/2 몰비의 콜레스테롤/D-Lin-DMA/DSPC/PEG-C-DMA를 사용하여 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및 siRNA로 D-Lin-DMA 및 PEG-C-DMA를 제형화함으로써 제조될 수 있다. 생성된 SNALP 리포좀은 크기가 약 80 nm 내지 100 nm이다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich, 미국 미주리주 세인트루이스 소재), 디팔미토일포스파티딜콜린(Avanti Polar Lipids, 미국 앨라배마주 앨러배스터 소재), 3-N-[(w-메톡시 폴리(에틸렌 글리콜)2000)카바모일]-1,2-디미레스틸옥시프로필아민, 및 양이온성 1,2-디리놀레일옥시-3-N,N 디메틸아미노프로판(예를 들어, 문헌[Geisbert et al., Lancet 2010; 375: 1896-905] 참조)을 포함할 수 있다. 예를 들어, 볼루스 정맥내 주입으로서 투여되는 용량당 약 2 mg/kg의 총 핵산-표적화 시스템의 용량이 고려될 수 있다.
또 다른 구현예에서, SNALP는 합성 콜레스테롤(Sigma-Aldrich), 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC; Avanti Polar Lipids Inc.), PEG-cDMA, 및 1,2-디리놀레일옥시-3-(N;N-디메틸)아미노프로판(DLinDMA)(예를 들어, 문헌[Judge, J. Clin. Invest. 119:661-673(2009)] 참조)을 포함할 수 있다. 생체내 연구를 위해 사용되는 제형은 약 9:1의 최종 지질/RNA 질량비를 포함할 수 있다.
RNAi 나노의학의 안전성 프로파일은 Alnylam Pharmaceuticals의 Barros 및 Gollob에 의해 검토되었다(예를 들어, 문헌[Advanced Drug Delivery Reviews 64(2012) 1730-1737] 참조). 안정적인 핵산 지질 입자(SNALP)는 4 가지 상이한 지질, 즉 낮은 pH에서 양이온성인 이온화 가능한 지질(DLinDMA), 중성 헬퍼 지질, 콜레스테롤, 및 확산성 폴리에틸렌 글리콜(PEG)-지질로 구성된다. 입자는 직경이 대략 80 nm이고, 생리학적 pH에서 중성 전하이다. 제형화 동안, 이온화 가능한 지질은 입자 형성 동안 음이온성 RNA와 지질을 축합하는 작용을 한다. 점점 더 산성인 엔도좀 조건 하에 양으로 하전될 때, 이온화 가능한 지질은 또한 RNA의 세포질 내로의 방출을 가능하게 하는 엔도좀 막과 SNALP의 융합을 매개한다. PEG-지질은 입자를 안정화시키고, 제형화 동안 응집을 감소시키며, 후속적으로 약동학적 특성을 개선시키는 외부의 중성 친수성을 제공한다.
지금까지, RNA가 있는 SNALP 제형을 사용하여 2 가지 임상 프로그램을 개시하였다. Tekmira Pharmaceuticals는 최근에 상승된 LDL 콜레스테롤을 지니는 성인 출원인에서 SNALP-ApoB의 I상 단일 용량 연구를 완료하였다. ApoB는 간 및 공장에서 대부분 발현되며, VLDL 및 LDL의 어셈블리 및 분비에 필수적이다. 17 명의 대상체에 단일 용량의 SNALP-ApoB를 제공하였다(7 가지 용량 수준에 걸친 용량 상승). 간 독성의 증거는 없었다(전임상 연구에 기반한 잠재적 용량 제한 독성으로서 예상). 가장 높은 용량에서(둘 중) 한 명의 대상체는 면역계 자극과 일치되는 감기-유사 증상을 경험하였고, 시험을 끝내는 결정을 하였다.
Alnylam Pharmaceuticals는 상기 기재한 SNALP 기술을 이용하고, TTR 아밀로이드증(ATTR)을 치료하기 위해 돌연변이체와 야생형 TTR 둘 다의 간세포 생성을 표적화하는 유사하게 진보된 ALN-TTR01을 갖는다. 3 가지 ATTR 증후군이 기재되었다: 가족성 아밀로이드성 다발신경병증(FAP) 및 가족성 아밀로이드성 심근증(FAC)(둘 다 TTR에서의 상염색체 우성 돌연변이에 의해 야기됨); 및 야생형 TTR에 의해 야기되는 노인 전신성 아밀로이드증(SSA). ALN-TTR01의 위약 조절, 단일 용량 상승 I상 시험을 ATTR을 지니는 환자에서 최근에 완료하였다. ALN-TTR01을 0.01 mg/kg 내지 1.0 mg/kg(siRNA 기준)의 용량 범위 내에서 31 명의 환자(연구 약물에 의한 23 명 및 위약에 의한 8 명)에 대한 15 분 IV 주입으로서 투여하였다. 간 기능 시험에서 유의한 증가 없이 치료는 잘 용인되었다. 주입 관련 반응은 0.4 mg/kg 이상에서 23 명의 환자 중 3 명에서 언급되었고; 모두 주입 속도의 늦춤에 반응하였으며, 모두 연구를 계속하였다. 1 mg/kg의 가장 높은 용량에서 2 명의 환자에서 혈청 사이토카인 IL-6, IP-10 및 IL-1ra의 최소 및 일시적 상승이 언급되었다(전임상 및 NHP 연구로부터 예상되는 바와 같음). 혈청 TTR의 저하, ALN-TTR01의 예상된 약동학적 효과가 1 mg/kg에서 관찰되었다.
또 다른 구현예에서, SNALP는 양이온성 지질, DSPC, 콜레스테롤 및 PEG-지질을, 예를 들어 각각 40:10:40:10의 몰비로, 예를 들어 에탄올 중에 용해시킴으로써 제조될 수 있다(문헌[Semple et al., Nature Niotechnology, Volume 28 Number 2 February 2010, pp. 172-177] 참조). 지질 혼합물을 혼합하면서, 각각 30%(vol/vol) 및 6.1 mg/ml의 최종 에탄올 및 지질 농도로 수성 완충제(50 mM 시트르산염, pH 4)에 첨가하고, 2 분 동안 22℃에서 평형화되게 한 후 압출시켰다. 수화된 지질을 동적 광 산란 분석에 의해 결정될 때 70 nm 내지 90 nm의 소낭 직경이 수득될 때까지 Lipex Extruder(Northern Lipids)를 사용하여 22℃에서 2층 80 nm 기공 크기 필터(Nuclepore)를 통해 압출하였다. 이는 일반적으로 1 회 내지 3 회의 통과를 필요로 하였다. siRNA(30% 에탄올을 함유하는 50 mM 시트르산염, pH 4 수용액 중에 용해)를 혼합하면서 약 5 ml/분의 속도로 사전 평형화된(35℃) 소낭에 첨가하였다. 0.06(wt/wt)의 최종 표적 siRNA/지질 비에 도달한 후, 혼합물을 35℃에서 추가 30 분 동안 인큐베이션시켜 소낭 재조직화 및 siRNA의 캡슐화를 가능하게 하였다. 이어서, 에탄올을 제거하고, 투석 또는 접선 유동 정용여과에 의해 외부 완충제를 PBS로 대체하였다(155 mM NaCl, 3 mM Na2HPO4, 1 mM KH2PO4, pH 7.5). siRNA를 제어된 계단식 희석 방법 과정을 사용하여 SNALP에서 캡슐화하였다. KC2-SNALP의 지질 성분은 57.1:7.1:34.3:1.4의 몰비로 사용한 DLin-KC2-DMA(양이온성 지질), 디팔미토일포스파티딜콜린(DPPC; Avanti Polar Lipids), 합성 콜레스테롤(Sigma) 및 PEG-C-DMA였다. 로딩된 입자의 형성시에, SNALP를 PBS에 대해 투석하였고, 사용 전 0.2 μm 필터를 통해 멸균 여과시켰다. 평균 입자 크기는 75 nm 내지 85 nm였고, siRNA의 90% 내지 95%는 지질 입자 내에서 캡슐화되었다. 생체내 시험을 위해 사용한 제형 내 최종 siRNA/지질 비는 약 0.15(wt/wt)였다. 인자 VII siRNA를 함유하는 LNP-siRNA 시스템을 사용 직전에 멸균 PBS 중에서 적절한 농도로 희석시켰고, 제형을 총 10 ml/kg의 부피로 옆 꼬리 정맥을 통해 정맥내로 투여하였다. 이러한 방법 및 이들 전달 시스템은 본 발명의 핵산-표적화 시스템에 대해 추론될 수 있다.
다른 지질
다른 양이온성 지질, 예를 들어 아미노 지질 2,2-디리놀레일-4-디메틸아미노에틸-[1,3]-디옥솔란(DLin-KC2-DMA)은 예를 들어, siRNA와 유사한 핵산-표적화 시스템 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)를 캡슐화하기 위해 이용될 수 있으며(예를 들어, 문헌[Jayaraman, Angew. Chem. Int. Ed. 2012, 51, 8529 - 8533] 참조), 이런 이유로, 본 발명의 실시에 이용될 수 있다. 다음의 지질 조성물이 있는 사전 형성된 소낭이 고려될 수 있다: 대략 0.05(w/w)의 FVII siRNA/총 지질 비 및 각각 40/10/40/10의 몰비의 아미노 지질, 디스테아로일포스파티딜콜린(DSPC), 콜레스테롤 및(R)-2,3-비스(옥타데실옥시) 프로필-1-(메톡시 폴리(에틸렌 글리콜)2000)프로필카바메이트(PEG-지질). 70 nm 내지 90 nm 범위의 좁은 입자 크기 분포 및 0.11±0.04(n=56)의 낮은 다분산지수를 보장하기 위해, 입자를 가이드 RNA를 첨가하기 전에 80 nm 막을 통해 최대 3 회까지 압출시킬 수 있다. 매우 강력한 아미노 지질 16을 함유하는 입자가 사용될 수 있으며, 여기서 4 가지 지질 성분, 16, DSPC, 콜레스테롤 및 PEG-지질의 몰비(50/10/38.5/1.5)는 생체내 활성을 향상시키도록 추가로 최적화될 수 있다.
Michael S D Kormann 외(문헌["Expression of therapeutic proteins after delivery of chemically modified mRNA in mice: Nature Biotechnology, Volume:29, Pages: 154-157(2011)])는 RNA를 전달하기 위한 지질 외피의 사용을 기재한다. 지질 외피의 사용은 또한 본 발명에서 바람직하다.
또 다른 구현예에서, 지질은 본 발명의 핵산-표적화 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)와 함께 제형화되어 지질 나노입자(LNP)를 형성할 수 있다. 지질은 DLin-KC2-DMA4, C12-200 및 공지질 디스테로일포스파티딜 콜린을 포함하지만 이들로 제한되지 않으며, 콜레스테롤, 및 PEG-DMG는 자발적 소낭 형성 절차를 사용하여 siRNA 대신 RNA-표적화 시스템을 이용하여 제형화될 수 있다(예를 들어, 문헌[Novobrantseva, Molecular Therapy-핵산s(2012) 1, e4; doi:10.1038/mtna.2011.3] 참조). 성분 몰비는 약 50/10/38.5/1.5(DLin-KC2-DMA 또는 C12-200/디스테로일포스파티딜 콜린/콜레스테롤/PEG-DMG)일 수 있다. 최종 지질:siRNA 중량비는 DLin-KC2-DMA 및 C12-200 지질 입자(LNP)의 경우에 각각 약 12:1 및 9:1일 수 있다. 제형은 90% 초과의 포획 효율을 지니는 약 80 nm의 평균 입자 직경을 가질 수 있다. 3 mg/kg 용량이 고려될 수 있다.
Tekmira는 LNP 및 LNP 제형의 다양한 양태와 관련된 미국 및 해외에서의 대략 95 개의 특허 패밀리의 포트폴리오를 가지며(예를 들어, 미국 특허 7,982,027; 7,799,565; 8,058,069; 8,283,333; 7,901,708; 7,745,651; 7,803,397; 8,101,741; 8,188,263; 7,915,399; 8,236,943 및 7,838,658 및 유럽 특허 1766035; 1519714; 1781593 및 1664316 참조), 이들 모두는 본 발명에 대해 사용되고/사용되거나 적합하게 될 수 있다.
핵산-표적화 시스템 또는 이의 성분 또는 이를 코딩하는 핵산 분자(들)는 단백질, 단백질 전구체, 또는 단백질 또는 단백질 전구체의 부분적으로 또는 완전히 가공된 형태를 인코딩할 수 있는 변형된 핵산 분자를 포함하는 조성물의 제형의 양태에 관한 미국 출원 공개 20130252281 및 20130245107 및 20130244279(Moderna Therapeutics 출원)에서 추가로 기재된 것과 같은 PLGA 미소구체에서 캡슐화되어 전달될 수 있다. 제형은 몰비 50:10:38.5:1.5 내지 3.0(양이온성 지질:융합생성 지질:콜레스테롤:PEG 지질)을 가질 수 있다. PEG 지질은 PEG-c-DOMG, PEG-DMG로부터 선택될 수 있지만, 이들로 제한되지 않는다. 융합생성 지질은 DSPC일 수 있다. 또한, Schrum외의 미국 출원 공개 20120251618(Delivery and Formulation of Engineered Nucleic Acids)을 참조한다.
나노머 기술은 저분자량 소수성 약물, 펩티드 및 핵산 기반 치료제(플라스미드, siRNA, miRNA)를 포함하는 광범위한 치료제에 대한 생체이용성 난제를 다룬다. 기술이 명확한 이점을 입증한 특정 투여 경로는 경구 경로, 혈액 뇌 장벽을 가로지르는 전달, 고형 종양으로의 전달뿐만 아니라, 눈으로의 전달을 포함한다. 예를 들어, 문헌[Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; 문헌[Mazza et al., 2013, ACS Nano. 2013 Feb 26;7(2):1016-26]; [Uchegbu and Siew, 2013, J Pharm Sci. 102(2):305-10] 및 [Lalatsa et al., 2012, J Control Release. 2012 Jul 20; 161(2):523-36]을 참조한다.
미국 특허 공개 20050019923은 생활성 분자, 예를 들어 폴리뉴클레오티드 분자, 펩티드 및 폴리펩티드 및/또는 약제학적 작용제를 포유류 신체에 전달하기 위한 양이온성 덴드리머를 기재한다. 덴드리머는, 예를 들어 간, 비장, 폐, 신장 또는 심장(또는 심지어 뇌)으로의 생활성 분자의 전달을 표적화하는 데 적합하다. 덴드리머는 단순한 분지형 단량체 단위로부터 단계적 방식으로 제조된 합성 3-차원 거대분자이며, 이의 특성 및 기능성은 용이하게 제어되고 달라질 수 있다. 덴드리머는 다작용성 코어에 대한(합성에 대한 확산적 접근), 또는 다작용성 코어를 향한(합성에 대한 수렴적 접근) 빌딩 블록의 반복된 첨가로부터 합성되고, 빌딩 블록의 3차원 쉘의 각각의 첨가는 덴드리머의 더 고차 세대의 형성을 야기한다. 폴리프로필렌이민 덴드리머는 디아미노부탄 코어로부터 출발하며, 이것에 일차 아민으로의 아크릴로니트릴의 이중 마이클 첨가(Michael addition)에 의해 아미노기 수의 2 배가 첨가된 후, 니트릴이 수소화된다. 이는 아미노기의 배가를 초래한다. 폴리프로필렌이민 덴드리머는 100% 양성자화 가능한 질소 및 최대 64 개의 말단 아미노기를 함유한다(5세대, DAB 64). 양성자화 가능한 기는 보통 중성 pH에서 양성자를 수용할 수 있는 아민기이다. 유전자 전달제로서 덴드리머의 용도는 콘주게이팅 단위로서 각각 아민/아미드 또는 N--P(O2)S의 혼합물과 함께 폴리아미도아민 및 인 함유 화합물의 용도에 크게 집중되어 있는데 유전자 전달을 위한 더 낮은 세대 폴리프로필렌이민 덴드리머의 용도에 대해 보고한 연구는 없었다. 폴리프로필렌이민 덴드리머는 또한 주변 아미노기에 의해 화학적으로 변형될 때 약물 전달을 위해 그리고 게스트 분자의 캡슐화를 위해 pH 감수성 제어 방출 시스템으로서 연구되었다. 세포독성 및 DNA와 폴리프로필렌이민 덴드리머의 상호작용뿐만 아니라 DAB 64의 형질감염 효능이 또한 연구되었다.
미국 특허 공개 20050019923은 이전의 보고와 상반되게 양이온성 덴드리머, 예를 들어 폴리프로필렌이민 덴드리머가 유전 물질과 같은 생활성 분자의 표적화된 전달에서 사용하기 위한 적합한 특성, 예를 들어 특이적 표적화 및 낮은 독성을 나타낸다는 관찰에 기반한다. 추가적으로, 양이온성 덴드리머의 유도체는 또한 생활성 분자의 표적화된 전달을 위한 적합한 특성을 나타낸다. 또한, 미국 출원 공개 20080267903의 생활성 중합체를 참조하며, 이는 "양이온성 폴리아민 중합체 및 덴드리머 중합체를 포함하는 다양한 중합체가 항증식 활성을 갖는 것으로 나타나며, 따라서 신생물 및 종양과 같은 바람직하지 않은 세포 증식을 특징으로 하는 장애, 염증 장애(자가면역 장애를 포함함), 건선 및 아테롬성 동맥경화증의 치료에 유용할 수 있다. 중합체는 단독으로 활성제로서 또는 다른 치료제, 예를 들어 유전자 치료법을 위한 약물 분자 또는 핵산을 위한 전달 비히클로서 사용될 수 있다. 이와 같은 경우에, 중합체 자체의 고유 항종양 활성은 전달될 작용제의 활성을 보완할 수 있다"고 개시한다. 이들 특허 간행물의 개시 내용은 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위한 본 발명의 교시와 함께 이용될 수 있다.
초하전(supercharged) 단백질
초하전 단백질은 대단히 높은 양 또는 음의 이론적 순전하를 지니는 조작된 또는 천연적으로 발생하는 단백질의 부류이며, 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다. 초음성으로 하전된 단백질과 초양성으로 하전된 단백질은 둘 모두 열적으로 또는 화학적으로 유도된 응집을 견뎌내는 현저한 능력을 나타낸다. 초양성으로 하전된 단백질은 또한 포유류 세포를 침투할 수 있다. 카고와 이들 단백질, 예를 들어 플라스미드 DNA, RNA 또는 다른 단백질의 회합은 시험관내와 생체내 둘 다에서 포유류 세포 내로 이들 거대분자의 기능적 전달을 가능하게 할 수 있다. David Liu 연구소는 2007년에 초하전 단백질의 생성 및 특성화를 보고하였다(문헌[Lawrence et al., 2007, Journal of the American Chemical Society 129, 10110-10112]).
포유류 세포 내로의 RNA 및 플라스미드 DNA의 비바이러스 전달은 연구와 치료 응용 둘 다에 대해 가치가 있다(문헌[Akinc et al., 2010, Nat. Biotech. 26, 561-569]). 정제된 +36 GFP 단백질(또는 다른 초양성으로 하전된 단백질)은 적절한 무혈청 배지에서 RNA와 혼합되고, 세포에 첨가 전 복합체화되게 한다. 이 단계에서 혈청의 포함은 초하전 단백질-RNA 복합체의 형성을 억제하고, 치료 효능을 감소시킨다. 다음의 프로토콜은 다양한 세포주에 대해 효과적이 되는 것으로 관찰되었다(문헌[McNaughton et al., 2009, Proc. Natl. Acad. Sci. USA 106, 6111-6116]) 그러나, 단백질 및 RNA의 용량을 변화시키는 파일럿 실험은 특정 세포주에 대하여 절차를 최적화하도록 수행되어야 한다.
(1) 처리 하루 전, 48-웰 플레이트에서 웰당 1 x 105 개 세포를 플레이팅함.
(2) 처리일에, 최종 농도 200 nM로 무혈청 배지에서 정제된 +36 GFP 단백질을 희석시킴. RNA를 50 nM의 최종 농도로 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) +36 GFP 및 RNA의 인큐베이션 후에, 단백질-RNA 복합체를 세포에 첨가함.
(5) 37℃에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, 20 U/ml 헤파린 PBS로 3 회 세척함. 활성에 대한 검정에 따라 추가 48 시간 또는 그 이상 동안 혈청-함유 배지와 세포를 인큐베이션시킴.
(7) 세포를 면역블롯, qPCR, 표현형 분석 또는 다른 적절한 방법에 의해 분석함.
David Liu 연구소는 다양한 세포에서 +36 GFP가 효과적인 플라스미드 전달 시약인 것으로 추가로 발견하였다. 플라스미드 DNA는 siRNA보다 더 큰 카고이기 때문에, 비례하여 더 많은 +36 GFP 단백질이 효과적으로 플라스미드와 복합체화하는 데 필요로 한다. 효과적인 플라스미드 전달을 위해, 출원인들은 인플루엔자 바이러스 혈구응집소 단백질로부터 유래된 공지된 엔도좀-파괴 펩티드인 C-말단의 HA2 펩티드 태그를 보유하는 +36 GFP의 변이체를 개발하였다. 다음의 프로토콜은 다양한 세포에서 효과적이었지만, 상기와 같이 플라스미드 DNA 및 초하전 단백질 용량이 특정 세포주 및 전달 응용분야를 위해 최적화되는 것이 권장된다.
(1) 처리 하루 전, 48-웰 플레이트에서 웰당 1 x 105 개를 플레이팅함.
(2) 처리일에, 최종 농도 2 mM로 무혈청 배지에서 정제된 þ36 GFP 단백질을 희석시킴. 1 ㎎의 플라스미드 DNA를 첨가함. 와류시켜 혼합하고 실온에서 10 분 동안 인큐베이션시킴.
(3) 인큐베이션 동안, 세포로부터 배지를 흡입하고, PBS로 1 회 세척함.
(4) þ36 GFP 및 플라스미드 DNA의 인큐베이션 후에, 단백질-DNA 복합체를 세포에 온건하게 첨가함.
(5) 37C에서 4 시간 동안 복합체와 세포를 인큐베이션시킴.
(6) 인큐베이션 후에, 배지를 흡입하고, PBS로 세척함. 혈청-함유 배지에서 세포를 인큐베이션시키고 추가 24 시간 내지 48 시간 동안 인큐베이션시킴.
(7) 적절하다면(예를 들어, 플라스미드-유도 유전자 발현에 의해) 플라스미드 전달을 분석함.
또한, 예를 들어, 문헌[McNaughton et al., Proc. Natl. Acad. Sci. USA 106, 6111-6116(2009)]; [Cronican et al., ACS Chemical Biology 5, 747-752(2010)]; [Cronican et al., Chemistry & Biology 18, 833-838(2011)]; [Thompson et al., Methods in Enzymology 503, 293-319(2012)]; [Thompson, D.B., et al., Chemistry & Biology 19(7), 831-843(2012)]을 참조한다. 초하전된 단백질의 방법은 본 발명의 핵산-표적화 시스템의 전달을 위해 사용되고/사용되거나 이를 위해 적합하게 될 수 있다. Lui 박사 및 본 명세서의 교시와 함께 본 명세서의 문헌의 이들 시스템은 핵산-표적화 시스템(들) 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달에 이용될 수 있다.
세포 투과성 펩티드(CPP)
또 다른 구현예에서, 세포 투과성 펩티드(CPP)가 CRISPR Cas 시스템의 전달을 위해 고려된다. CPP는 다양한 분자 카고(나노크기 입자로부터 작은 화학 분자 및 DNA의 큰 단편까지)의 세포 흡수를 용이하게 하는 짧은 펩티드이다. 본 명세서에서 사용된 바와 같은 용어 "카고"는 치료제, 진단 프로브, 펩티드, 핵산, 안티센스 올리고뉴클레오티드, 플라스미드, 단백질, 나노입자를 포함하는 입자, 리포좀, 발색단, 소분자 및 방사성 물질로 구성된 군을 포함하지만 이에 제한되지 않는다. 본 발명의 일 양태에서, 카고는 또한 CRISPR Cas 시스템의 임의의 성분 또는 전체 기능성 CRISPR Cas 시스템을 포함할 수 있다. 본 발명의 일 양태는 하기를 포함하는, 원하는 카고를 대상체로 전달하는 방법을 제공한다: (a) 본 발명의 세포 투과성 펩티드 및 원하는 카고를 포함하는 복합체를 제조하는 단계, 및 (b) 대상체에게 복합체를 경구, 관절내, 복강내, 척추강내, 동맥내, 비강내, 뇌실내, 피하내, 근육내, 정맥내, 피부, 직장내, 또는 국소투여하는 단계. 카고는 공유 결합을 통한 화학적 결합 또는 비-공유 상호작용을 통해 펩티드와 회합된다.
CPP의 기능은 카고를 세포로 전달하는 것이며, 살아있는 포유류 세포의 엔도솜으로 전달된 카고의 엔도시토시스를 통해 일반적으로 발생하는 공정이다. 세포-침투성 펩티드는 상이한 크기, 아미노산 서열, 및 전하를 가지지만, 모든 CPP가, 혈장 막을 전위시키고 세포질 또는 세포소기관으로 다양한 분자 카고의 전달을 용이하게 하는 능력인 하나의 별개 특징을 갖는다. CPP 전위는 3 개의 주요 엔트리 메커니즘으로 분류될 수 있다: 막에서의 직접 투과, 엔도시토시스-매개 엔트리, 및 일시적 구조의 형성을 통한 전위. CPP는 암을 포함하는 상이한 질병의 치료에서 약물 전달제, 바이러스 억제제뿐만 아니라, 세포 표지화를 위한 조영제로서 의약에서의 많은 적용이 발견되었다. 후자의 예는 GFP에 대한 담체, MRI 조영제, 또는 양자점으로서 작용하는 것을 포함한다. CPP는 연구 및 의약에서의 용도에서 시험관내 및 생체내 전달 벡터로서 훌륭한 잠재성을 보유한다. CPP는 통상적으로 리신 또는 아르기닌과 같은 상대적으로 풍부한 양전하 아미노산을 함유하거나 극성/전하 아미노산 및 비-극성 소수성 아미노산의 교대 패턴을 함유하는 서열을 갖는 아미노산 조성물을 갖는다. 이들 2 가지 유형의 구조는 각각 다가이온성 또는 양친매성으로서 지칭된다. CPP의 세번째 부류는 낮은 순 전하를 갖는 극성 잔기만을 함유하는 소수성 펩티드이거나, 세포 흡수에 결정적인 소수성 아미노산 그룹을 갖는다. 발견된 초기 CPP 중 하나는 배양에서 많은 세포 유형에 의해 배지 주위로부터 효율적으로 취득되어 발견되는 인간 면역결핍 바이러스 1(HIV-1)로부터의 트랜스-활성화 전사 활성화제(Tat)였다. 그 이후부터, 많은 공지된 CPP는 상당히 확장되었으며 더 효과적인 단백질 형질도입 특성을 갖는 소분자 합성 유사체가 생성되었다. CPP는 페너트라틴, Tat(48-60), 트란스포르탄, 및(R-AhX-R4)(Ahx=아미노헥사노일)을 포함하지만 이에 제한되지 않는다.
미국 특허 8,372,951은 높은 세포-투과 효율 및 낮은 독성을 나타내는 호산구 양이온성 단백질(ECP)으로부터 유래된 CPP를 제공한다. 척추동물 대상체로 CPP를 이의 카고와 함께 전달하는 양태가 또한 제공된다. CPP 및 이의 전달의 추가 양태는 미국 특허 8,575,305; 8;614,194 및 8,044,019에 기재되어 있다. CPP는 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 사용될 수 있다. CPP가 CRISPR-Cas 시스템 또는 이의 성분을 전달하기 위해 이용될 수 있는 것은 또한 본 명세서에 전체가 참조로서 포함된, Suresh Ramakrishna, Abu-Bonsrah Kwaku Dad, Jagadish Beloor외의 문헌["Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA", Gees.nome R 2014 Apr 2. [인쇄 전 전자논문상태]]에서 제공되며, 여기에서 CPP-컨쥬게이트된 재조합 Cas9 단백질 및 CPP-복합체화 가이드 RNA를 이용한 치료가 인간 세포주에서의 내인성 유전자 파괴를 이끌어냄이 입증되었다. 이 논문에서 Cas9 단백질은 티오에스테르 결합을 통해 CPP에 컨쥬게이트되는 반면, 가이드 RNA는 CPP와 복합체화되어, 축합된 양으로 하전된 입자를 형성한다. 변형된 Cas9 및 가이드 RNA와 함께, 배아 줄기 세포, 피부 섬유아세포, HEK293T 세포, HeLa 세포, 및 배아 암종 세포를 포함하는 인간 세포의 동시 및 순차적 치료가 플라스미드 형질감염에 비하여 감소된 표적외 돌연변이로 효율적인 유전자 파괴를 이끌어냄을 나타내었다.
이식 가능한 장치
또 다른 구현예에서, 핵산-표적화 시스템 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)의 전달을 위해 이식 가능한 장치가 또한 고려된다. 예를 들어, 미국 특허 공개 20110195123은 국소적으로 그리고 연장된 기간 동안 약물을 용리하는 이식 가능한 의료 장치(이와 같은 장치의 몇 가지 유형, 실행의 처리 방식 및 이식 방법을 포함함)가 제공됨을 개시한다. 장치는 중합체 기질, 예를 들어 매트릭스, 예를 들어 장치 몸체로서 사용되는 매트릭스, 및 약물, 및 일부 경우에 추가적인 스캐폴딩 재료, 예를 들어 금속 또는 추가적인 중합체, 및 가시성 및 이미징을 향상시키는 재료를 포함한다. 이식 가능한 전달 장치는 국소적인, 그리고 연장된 기간에 걸친 방출을 제공하는 데 유리할 수 있으며, 여기서 약물은, 예를 들어 종양, 염증, 변성과 같은 병에 걸린 영역의 세포외 매트릭스(ECM)로 직접 방출되거나, 증상 목표를 위해, 또는 손상된 평활근 세포에 또는 예방을 위해 방출된다. 한 종류의 약물은 상기 개시된 바와 같은 RNA이며, 이러한 시스템은 본 발명의 핵산-표적화 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다. 일부 구현예에서 이식 방식은 근접 치료법 및 바늘 생검을 포함하는 다른 치료를 위해 오늘날 개발되고 사용되는 기존의 이식 절차이다. 이와 같은 경우에, 본 발명에 기재된 새로운 이식물의 치수는 본래의 이식물과 유사하다. 전형적으로 소수의 장치는 동일한 치료 절차 동안 이식된다.
미국 특허 공개 20110195123은, 복강과 같은 강에 적용 가능한 시스템을 포함하는 약물 전달 이식 가능한 또는 삽입 가능한 시스템 및/또는 임의의 다른 유형의 투여를 제공하며, 여기서, 예를 들어 선택적으로 매트릭스일 수 있는 생체안정성 및/또는 분해가능 및/또는 생체흡수성 중합체성 기질을 포함하는 약물 전달 시스템은 고정 또는 부착되지 않는다. 용어 "삽입"은 또한 이식을 포함하는 것을 주목하여야 한다. 약물 전달 시스템은 바람직하게 미국 특허 공개 20110195123에 기재된 바와 같은 "로더(Loder)"로서 실행된다.
중합체 또는 복수의 중합체는 생체적합성이며, 제어된 속도로 작용제를 방출시킬 수 있는 작용제 및/또는 복수의 작용제를 혼입하며, 중합체성 기질, 예를 들어 일부 구현예에서 매트릭스의 총 부피는, 선택적으로 그리고 바람직하게는 작용제의 치료 수준이 도달되게 하는 최대 부피 이하이다. 비제한적 예로서, 이와 같은 부피는 작용제 로드를 위한 부피에 의해 필요한 바와 같은 바람직하게는 0.1 ㎥ 내지 1000 ㎣ 범위 내에 있다. 로더는, 예를 들어 크기가 기능성에 의해 결정되는 장치, 예를 들어 제한 없이, 무릎 관절, 자궁내 또는 자궁경부 링 등과 함께 혼입될 때, 선택적으로 더 클 수 있다.
(조성물을 전달하기 위한) 약물 전달 시스템은 바람직하게 일부 구현예에서 분해성 중합체를 이용하도록 설계되거나(주요 방출 메카니즘은 벌크 침식(bulk erosion)임); 또는 일부 구현예에서, 비분해성 또는 서서히 분해되는 중합체가 사용되며(주요 방출 메카니즘은 벌크 침식보다는 확산임), 따라서 외부는 막으로서 기능하고, 내부는 약물 저장소로서 기능하는데, 이는 연장된 기간(예를 들어, 약 1 주 내지 약 수 개월) 동안 주변에 의해 실제로 영향받지 않는다. 상이한 방출 메카니즘을 지니는 상이한 중합체의 조합이 또한 선택적으로 사용될 수 있다. 표면에서 농도 기울기는 바람직하게 총 약물 방출 기간의 상당한 기간 동안 효과적으로 일정하게 유지되고, 따라서 확산 속도는 효과적으로 일정하다("제로 방식" 확신으로 지칭됨). 용어 "일정한"은 더 낮은 치료적 유효성의 역치 초과로 바람직하게 유지되지만, 여전히 선택적으로 초기 버스트를 특징으로 하고/하거나 변동할 수 있는, 예를 들어 특정 정도로 증가 및 감소할 수 있는 확산 속도를 의미한다. 확산 속도는 바람직하게 연장된 기간 동안 이렇게 유지되며, 치료적으로 효과적인 기간, 예를 들어 효과적인 침묵화 기간을 최적화하기 위해 특정 수준으로 일정한 것으로 고려될 수 있다.
약물 전달 시스템은 선택적으로 그리고 바람직하게는 성질이 화학물질이든 대상체의 체내의 효소 및 다른 인자로부터의 공격에 기인하든, 분해로부터 뉴클레오티드 기반 치료제를 보호하도록 설계된다.
미국 특허 공개 20110195123의 약물 전달 시스템은 장치의 이식 시 및/또는 이식 후에, 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 방법에 의해 작동되는 감지 및/또는 활성화 기기와 선택적으로 연동되며, 예를 들어 선택적으로 제한되는 것은 아니지만, 열적인 가열 및 냉각, 레이저 빔 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치를 포함한다.
미국 특허 공개 20110195123의 일부 구현예에 따르면, 국소 전달을 위한 부위는 선택적으로 종양을 포함하는 세포의 고도 비정상 증식, 및 억제된 아폽토시스, 자가면역질병 상태를 포함하는 활성 및 또는 만성 염증 및 감염, 근육 및 신경 조직을 포함하는 변성 조직, 만성 통증, 변성 부위, 및 뼈 골절 위치 및 조직 재생의 향상을 위한 다른 상처 위치, 및 손상된 심근, 평활근 및 횡문근을 특징으로 하는 표적 부위를 포함할 수 있다.
조성물의 이식을 위한 부위, 또는 표적 부위는 바람직하게 표적화된 국소 전달에 충분히 작은 반경, 면적 및/또는 부피를 특징으로 한다. 예를 들어, 표적 부위는 선택적으로 약 0.1 mm 내지 약 5 cm 범위의 직경을 갖는다.
표적 부위의 위치는 바람직하게 최대 치료 효능에 대해 선택된다. 예를 들어, 약물 전달 시스템의 조성물(선택적으로 상기 기재한 바와 같은 이식을 위한 장치와 함께)은 선택적으로 그리고 바람직하게는 종양 환경, 또는 이들의 연관된 혈액 공급 내에서 또는 이에 근접하여 이식된다.
예를 들어 조성물은(선택적으로 장치와 함께) 선택적으로 췌장, 전립선, 유방, 간 내에 또는 그에 근접하여, 니플을 통해, 혈관계 내 등에 이식된다.
표적 위치는(선택적으로 체내의 임의의 부위가 로더를 이식하는 데 적합할 수 있기 때문에 단지 비제한적 예로서): 1. 기저핵, 백질 및 회백질에서 파킨슨병 또는 알츠하이머병에서와 같은 변성 부위의 뇌; 2. 근위축성 측삭경화증(ALS)의 경우에서와 같은 척추; 3. HPV 감염을 예방하기 위한 자궁경부; 4. 활성 및 만성 염증 관절; 5. 건선의 경우에서와 같은 진피; 6. 진통 효과를 위한 교감 및 감각 신경 부위; 7. 골내이식; 8. 급성 및 만성 감염 부위; 9. 질내; 10. 내이--청각기관, 내이의 미로, 전정계; 11. 기관내; 12. 심장내; 관상동맥, 심외막; 13. 방광; 14. 담도계; 15. 신장, 간, 비장을 포함하지만, 이들로 제한되지 않는 실질세포; 16. 림프절; 17. 침샘; 18. 치과용 수지; 19. 관절내(관절 내로); 20. 안내; 21. 뇌조직; 22. 뇌실; 23. 복강을 포함하는 강(예를 들어, 제한되는 것은 아니지만, 난소암); 24. 식도내 및 25. 직장내를 포함하거나, 이로 필수적으로 이루어지거나, 이로 구성된 군으로부터 선택적으로 선택된다.
선택적으로 시스템의 삽입(예를 들어, 조성물을 함유하는 장치)은 표적 부위의 및 이러한 부위 부근의, 국소 pH 및/또는 온도 및/또는 ECM 내 약물의 확산 및/또는 약물 역학에 영향을 미치는 다른 생물학적 인자에 영향을 미치도록 하는 표적 부위 및 해당 부위 부근에서 ECM에 대한 물질의 주사와 연관된다.
선택적으로, 일부 구현예에 따르면, 상기 작용제의 방출은 삽입 전 및/또는 삽입 시 및/또는 삽입 후, 레이저빔, 조사, 열적 가열 및 냉각, 및 집속 초음파 및/또는 RF(무선주파수)를 포함하는 초음파 방법 또는 장치 및 화학적 활성화제를 포함하는 활성화 및/또는 가속화/감속화의 비침습적 및/또는 최소 침습적 및/또는 그 밖의 방법에 의해 작동되는 감지 및/또는 활성화 기기와 연관될 수 있었다.
미국 특허 공개 20110195123의 다른 구현예에 따르면, 약물은 바람직하게, 예를 들어 이하에 기재되는 바와 같이 유방, 췌장, 뇌, 신장, 방광, 폐 및 전립선에서 국소화된 암 경우를 위한 RNA를 포함한다. RNAi로 예시되지만, 약물이 로더 기질, 예를 들어 매트릭스와 함께 캡슐화될 수 있는 한, 다수 약물이 로더에서 캡슐화되어 적용 가능하고, 본 발명과 함께 사용될 수 있으며, 이러한 시스템이 본 발명의 핵산-표적화 시스템을 전달하는 데 사용되고/사용되거나 그에 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 신경 및 근육 변성 질병은 비정상 유전자 발현에 기인하여 발생한다. RNA의 국소 전달은 이와 같은 비정상 유전자 발현을 방해하는 치료적 특성을 가질 수 있다. 작은 약물 및 거대분자를 포함하는 아폽토시스방지, 염증방지 및 변성방지 약물의 국소 전달은 또한 선택적으로 치료적일 수 있다. 이와 같은 경우에, 로더는 일정한 속도로 및/또는 별도로 이식되는 전용 장치를 통해 연장된 방출을 위해 적용된다. 이것 모두는 본 발명의 핵산-표적화 시스템 에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 정신과적 및 인지 장애가 유전자 변형자를 이용하여 치료된다. 유전자 녹다운은 치료적 선택사항이다. 중추 신경계 부위에 작용제를 국소적으로 전달하는 로더는 정신병, 양극성 질병, 신경성 장애 및 행동 병폐를 포함하지만, 이들로 제한되지 않는 정신과적 및 인지 장애에 대한 치료적 선택사항이다. 로더는 또한 특정 뇌 부위에 이식시 작은 약물 및 거대분자를 포함하는 약물을 국소적으로 전달할 수 있었다. 이것 모두는 본 발명의 핵산-표적화 시스템 에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, 국소 부위에서 선천성 및/또는 적응성 면역 매개체의 침묵화는 기관 이식 거부를 예방할 수 있다. 이식된 기관 및/또는 이식된 부위에 이식된 로더를 이용한 RNA 및 면역조절 시약의 국소 전달은 이식 기관에 대해 활성화된 CD8과 같은 면역 세포를 퇴치함으로써 국소 면역 억제를 제공한다. 이것 모두는 본 발명의 핵산-표적화 시스템에 사용될 수 있고/있거나 적합하게 될 수 있다.
구체적 적용의 또 다른 예로서, VEGF 및 안지오제닌 등을 포함하는 혈관 성장 인자는 신혈관형성에 필수적이다. 인자, 펩티드, 펩티드모방체의 국소 전달 또는 이들의 억제제의 억제는 중요한 치료적 양식이며; 억제제의 침묵화 및 로더를 이용한 혈관형성을 자극하는 인자, 펩티드, 거대분자 및 작은 약물의 국소 전달은 말초, 전신 및 심혈관 질병에 대하여 치료적이다.
이식과 같은 삽입 방법은 선택적으로 다른 유형의 조직 이식을 위해 및/또는 삽입을 위해 및/또는 조직 샘플링을 위해 선택적으로 변형 없이, 또는 대안적으로 선택적으로 이와 같은 방법에서 주요하지 않은 변형만을 이용하여 이전에 사용될 수 있다. 이와 같은 방법은 선택적으로 근접치료 방법, 생검, 초음파와 함께 및/또는 초음파 없이 내시경, 예를 들어 ERCP, 뇌 조직 내로의 정위적 방법, 관절, 복부 기관, 방광벽 및 체강 내로의 복강경의 이식을 포함하는 복강경검사를 포함하지만, 이들로 제한되지 않는다.
본 명세서에서 논의된 이식 가능한 장치 기술이 본 명세서의 교시와 함께 이용될 수 있으며, 이에 따라 본 개시 내용 및 당업계의 지식에 의해, CRISPR-Cas 시스템 또는 이의 성분 또는 이의 핵산 분자 또는 성분의 인코딩 또는 제공이 이식 가능한 장치를 통해 전달될 수 있다.
환자-특이적 스크리닝 방법
RNA, 예를 들어 트리뉴클레오티드 반복부를 표적화하는 핵산-표적화 시스템을 사용하여 이와 같은 반복부의 존재에 대하여 환자 또는 환자 샘플을 스크리닝할 수 있다. 반복부는 핵산-표적화 시스템의 RNA의 표적일 수 있으며, 핵산-표적화 시스템에 의한 이로의 결합이 존재한다면, 결합을 검출하여, 이와 같은 반복부가 존재하는 것을 나타낼 수 있다. 따라서, 핵산-표적화 시스템을 사용하여 환자 또는 환자 샘플을 반복부의 존재에 대하여 스크리닝할 수 있다. 그 다음, 환자에게 질환을 다루기 위한 적합한 화합물(들)을 투여할 수 있거나; 또는 이에 결합하고 삽입, 결실 또는 돌연변이를 야기하며, 질환을 완화시키는 핵산-표적화 시스템을 투여할 수 있다.
본 발명은 핵산을 사용하여 표적 RNA 서열에 결합한다.
CRISPR 이펙터 단백질 mRNA 및 가이드 RNA
CRISPR 이펙터 단백질 mRNA 및 가이드 RNA는 또한 별도로 전달될 수 있다. CRISPR 이펙터 단백질 mRNA는 가이드 RNA 전에 전달되어 CRISPR 이펙터 단백질이 발현될 시간을 제공할 수 있다. CRISPR 이펙터 단백질 mRNA는 가이드 RNA 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 전에 투여될 수 있다.
대안적으로, CRISPR 이펙터 단백질 mRNA 및 가이드 RNA는 함께 투여될 수 있다. 유리하게, 가이드 RNA의 제2 부스터 용량은 CRISPR 이펙터 단백질 mRNA + 가이드 RNA의 초기 투여 1 시간 내지 12 시간(바람직하게는, 약 2 시간 내지 6 시간) 이후에 투여될 수 있다.
본 발명의 CRISPR 이펙터 단백질, 즉 C2c2 이펙터 단백질은 때때로 본 명세서에서 CRISPR 효소로 지칭된다. 이펙터 단백질은 효소를 기반으로 하거나 효소로부터 유래되어, 따라서 용어 '이펙터 단백질'은 일부 구현예에서 확실히 '효소'를 포함하는 것으로 이해될 것이다. 그러나, 또한 이펙터 단백질은, 일부 구현예에서 요구되는 바와 같이, DNA 또는 RNA 결합을 가질 수 있지만, 반드시 데드-Cas 이펙터 단백질 기능을 포함하여 절단 또는 닉킹, 활성을 필요로 하는 것은 아님을 이해할 것이다.
CRISPR 이펙터 단백질 mRNA 및/또는 가이드 RNA의 추가적인 투여는 가장 효율적인 수준의 게놈 변형을 달성하기 위해 유용할 수 있다. 일부 구현예에서, 표현형 변경은 특히 치료 방법에서, 바람직하게는 표현형의 교정 또는 변경을 위해 수복 주형이 제공된 경우에서, 바람직하게는 유전적 질병이 표적화된 경우 게놈 변형의 결과이다.
일부 구현예에서, 표적화될 수 있는 질병은 질병-유발 스플라이스 결함과 연관이 있는 것들을 포함한다.
일부 구현예에서, 세포 표적은, 조혈 줄기/선조 세포(CD34+); 인간 T 세포; 및 눈(망막 세포)(예를 들어, 광수용체 전구 세포)를 포함한다.
일부 구현예에서, 유전자 표적은, 인간 베타 글로빈 - HBB((내인성 주형으로서 밀접하게 관련된 HBD 유전자를 사용하여 )유전자-전환을 자극시키는 것을 포함하는, 겸상 적혈구 빈혈증의 치료를 위함); CD3(T-세포); 및 CEP920 - 망막(눈)을 포함한다.
일부 구현예에서, 질병 표적은 또한, 암; 겸상 적혈구 빈혈증(점 돌연변이를 기반으로 함); HIV; 베타-지중해빈혈(Beta-Thalassemia); 및 안과질환 또는 안 질환(예를 들어, 레베르 선천성 흑암시(Leber Congenital Amaurosis; LCA)-유발 스플라이스 결함을 포함한다.
일부 구현예에서, 전달 방법은, 효소-가이드 복합체(리보뉴클레오단백질)의 양이온 지질 매개 "직접" 전달 및 플라스미드 DNA의 전기천공을 포함한다.
본 발명의 방법은, dsODN 또는 ssODN일 수 있는 수복 주형과 같은 주형의 전달을 추가로 포함할 수 있으며, 하기를 참조한다. 주형의 전달은 임의의 또는 모든 CRISPR 이펙터 단백질 또는 가이드의 전달과 함께 또는 이와 분리된 전달을 통해 그리고 동일하거나 상이한 전달 메커니즘을 통한 것일 수 있다. 일부 구현예에서, 주형은 가이드와 함께, 바람직하게는 또한 CRISPR 이펙터 단백질과 함께 전달되는 것이 바람직하다. 예는, AAV 벡터일 수 있다.
본 발명의 방법은 (a) 상기 이중 가닥 손상에 의해 형성된 오버행에 대해 상보적인 오버행을 포함하는 이중-가닥 올리고데옥시뉴클레오티드(dsODN)를 세포로 전달하는 것으로서, 상기 dsODN은 관심 유전자 내로 통합되는 것; 또는 (b) 단일-가닥 올리고데옥시뉴클레오티드(ssODN)를 세포로 전달하는 것으로서, 상기 ssODN은 상기 이중 가닥 손상의 상동 직접 수복을 위한 주형으로서 작용하는 것을 추가로 포함할 수 있다. 본 발병의 방법은 개인에서 질병의 예방 또는 치료를 위한 것일 수 있으며, 선택적으로 상기 질병은 상기 관심 유전자좌에서의 결함에 의해 유발된다. 본 발명의 방법은 개인에서 생체내에서 또는 개인으로부터 취한 세포 상에서 생체외에서 수행될 수 있으며, 여기서 선택적으로 상기 세포는 개인에게 되돌려진다.
독성 및 표적외 효과의 최소화를 위해, 전달되는 CRISPR 이펙터 단백질 mRNA 및 가이드 RNA의 농도를 제어하는 것이 중요할 것이다. CRISPR 이펙터 단백질 mRNA 및 가이드 RNA의 최적 농도는 세포 또는 동물 모델에서 상이한 농도를 시험하고, 잠재적인 표적외 게놈 유전자좌에서 변형 정도를 분석하는 딥 시퀀싱을 사용함으로써 결정될 수 있다. 예를 들어, 인간 게놈의 EMX1 유전자에서 5'-GAGTCCGAGCAGAAGAAGAA-3'를 표적화하는 가이드 서열에 있어서, 딥 시퀀싱을 사용하여 2 가지 표적외 유전자좌, 즉 1: 5'-GAGTCCTAGCAGGAGAAGAA-3' 및 2: 5'-GAGTCTAAGCAGAAGAAGAA-3'에서의 변형 수준을 평가할 수 있다. 표적외 변형의 수준을 최소화하면서 표적상 변형의 가장 높은 수준을 제공하는 농도가 생체내 전달을 위하여 선택되어야 한다.
유도성 시스템
일부 구현예에서, CRISPR 이펙터 단백질은 유도성 시스템의 성분을 형성할 수 있다. 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집 또는 유전자 발현의 시공간적 제어를 가능하게 할 것이다. 에너지의 형태는 이에 한정되지 않지만, 전자기 방사, 음향 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 이펙터 단백질은 서열-특이적 방식으로 전사 활성에서의 변화를 유도하기 위한 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 성분은 CRISPR 이펙터 단백질, 광-반응성 시토크롬 이형이량체(예를 들어, 아라비돕시스 탈리아나(Arabidopsis thaliana) 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 이의 사용을 위한 방법의 추가의 예는 미국 특허 제61/736465 호, 미국 특허 제61/721,283호 및 WO 2014018423에서 제공되며, 이는 전체가 참고로 본 명세서에 포함된다.
CRISPR Cas 시스템의 예시적인 방법
본 발명은 비-천연 발생 또는 조작된 조성물, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드, 또는 상기 조성물의 성분을 인코딩하는 하나 이상의 폴리뉴클레오티드를 포함하는 벡터 또는 전달 시스템의, 생체내, 생체외 또는 시험관내에서 표적 세포를 변형시키는 데 있어서의 이용을 제공하며, 세포를 변경시키는 방식으로 수행되어, 일단 변형되면, CRISPR 변형된 세포의 자손 또는 세포주가 변경된 표현형을 보유하도록 한다. 변형된 세포 및 자손은, 원하는 세포 유형으로의 CRISPR 시스템의 생체외 또는 생체내 적용을 갖는, 식물 또는 동물과 같은 다세포 생물의 일부일 수 있다. CRISPR 발명은 치료 처리 방법일 수 있다. 치료 처리 방법은 유전자 또는 게놈 편집 또는 유전자 치료법을 포함할 수 있다.
CRISPR Cas 시스템 또는 복합체(예를 들어, C2c2-RNA 복합체)를 이용한 표적 변형
일 양태에서, 본 발명은, 생체내, 생체외 또는 시험관내일 수 있는 진핵 세포 내에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공한다. 일부 구현예에서, 본 방법은 인간 또는 비-인간 동물로부터 세포 또는 세포 집단을 샘플링하는 단계 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 비-인간 동물 또는 식물 내로 재도입될 수 있다. 재도입된 세포들의 경우, 세포는 줄기 세포인 것이 특히 바람직하다.
일부 구현예에서, CRISPR 복합체가 표적 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 표적 폴리뉴클레오티드를 절단시켜, 이에 의해 표적 폴리뉴클레오티드를 변형시키고, 여기서 CRISPR 복합체는 상기 표적 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함한다.
일 양태에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 일부 구현예에서, 본 방법은 CRISPR 복합체가 폴리뉴클레오티드에 결합하도록 허용하는 것을 포함하여, 상기 결합이 상기 폴리뉴클레오티드의 증가된 또는 감소된 발현을 결과로서 초래하도록 하며; 여기서 CRISPR 복합체는 상기 폴리뉴클레오티드 내에서 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함한다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형시키는 방법에 대해 상기와 같이 적용된다. 실제로, 이들 샘플링, 배양 및 재도입 옵션은 본 발명의 일 양태에 걸쳐 적용된다.
실제로, 본 발명이 임의의 양태에서, CRISPR 복합체는 표적 서열에 혼성화된 또는 혼성화될 수 있는 가이드 서열과 복합체화된 CRISPR 이펙터 단백질을 포함할 수 있다. 유사한 고려사항 및 조건이 표적 폴리뉴클레오티드를 변형시키는 방법에 대해 상기와 같이 적용된다.
따라서, 본 명세서에서 설명된 임의의 비-천연 발생 CRISPR 이펙터 단백질은 하나 이상의 변형을 포함하고, 이로 인해 이펙터 단백질은 소정의 개선된 능력을 갖는다. 특히, 임의의 이펙터 단백질은 가이드 RNA와의 CRISPR 복합체를 형성할 수 있다. 그러한 복합체가 형성된 경우, 가이드 RNA는 표적 폴리뉴클레오티드 서열에 결합할 수 있고, 이펙터 단백질은 표적 유전자좌를 변형시킬 수 있다. 추가적으로, CRISPR 복합체 내 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여, 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력을 갖는다.
추가적으로, 본 명세서에서 설명된 변형된 CRISPR 효소는 효소를 포괄하고, 이로 인해 CRISPR 복합체 내에서 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여, 하나 이상의 표적 유전자좌를 변형시킬 수 있는 증가된 능력을 갖는다. 그러한 작용은 개별적으로 제공될 수 있거나 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력인 상기 설명된 작용과 함께 제공될 수 있다. 임의의 그러한 이펙터 단백질에는 본 명세서에서 설명된 바와 같이 CRISPR 이펙터 단백질에 대한 추가의 임의의 변형, 예를 들어 하나 이상의 연관된 상동성 기능성 도메인에 의해 제공된 임의의 활성과 조합된, 뉴클레아제 활성 등을 감소시키는 임의의 추가의 돌연변이가 제공될 수 있다.
본 발명의 유리한 구현예에서, 변형된 CRISPR 이펙터 단백질은 비변형된 효소/이펙터 단백질에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 감소된 능력 및 비변형된 효소/이펙터 단백질에 비하여 하나 이상의 표적외 유전자좌를 변형시키는 증가된 능력이 있다. 이펙터 단백질에 대한 추가의 변형과 조합하여, 현저히 증진된 특이성이 달성될 수 있다. 예를 들어, 그러한 유리한 구현예의 하나 이상의 추가의 돌연변이와의 조합이 제공되며, 여기서 하나 이상의 추가적인 돌연변이는 하나 이상의 촉매적으로 활성인 도메인이다. 그러한 이펙터 단백질에서, 증진된 특이성은 이펙터 단백질 활성 면에서 개선된 특이성으로 인해 달성될 수 있다.
본 명세서에 기재된 변형된 CRISPR 이펙터 단백질로 설계 제작될 수 있는 추가적인 기능은 다음을 포함한다. 1. 단백질 3 차 또는 2 차 구조에 영향을 주지 않으면서 RNA:단백질 상호 작용을 방해하는 변형된 CRISPR 이펙터 단백질. 이것에는 RNA:RNA 듀플렉스의 임의의 부분과 접촉하는 잔기가 포함된다. 2. RNA 결합(표적내 또는 표적외)에 대한 반응으로의 뉴클레아제 절단에 필수적인 형태로 C2c2를 유지하는 단백질 내 상호 작용을 약화시키는 변형된 CRISPR 이펙터 단백질. 예를 들어: HNH 도메인의 뉴클레아제 형태를 약간 저해하지만 여전히 가능하게 하는 변형(분리되기 쉬운 포스페이트에 위치된). 3. RNA 결합(표적내 또는 표적외)에 대한 반응으로의 뉴클레아제 활성을 저해하는 형태로 C2c2를 유지하는 단백질 내 상호 작용을 강화시키는 변형된 CRISPR 이펙터 단백질. 예를 들어, 분리되기 쉬운 포스페이트로부터 멀리 떨어져 있는 형태로 HNH 도메인을 안정화시키는 변형. 임의의 이러한 추가적인 기능 향상은 본 명세서의 다른 부분에서 상세히 기재된 CRISPR 이펙터 단백질에 대한 임의의 다른 변형과 조합하여 제공될 수 있다.
본 명세서에 기재된 개선된 기능성 중 임의의 것은 임의의 CRISPR 이펙터 단백질, 예를 들어 C2c2 이펙터 단백질에게 만들어질 수 있다. 그러나, 본 명세서에 기재된 기능성 중 임의의 것은 다수의 오솔로그 유래의 단편을 포함하는 키메라 이펙터 단백질을 포함하는, 다른 오솔로그로부터의 C2c2 이펙터 단백질로 설계 제작될 수 있음이 이해될 것이다.
본 발명은 표적 DNA 서열에 결합하는 핵산을 사용한다. 이는, 핵산이 단백질보다 생산이 훨씬 더 쉽고 더 저렴하기 때문에 유리하며, 특이성은 상동성이 구해지는 스트레치의 길이에 따라 변화될 수 있다. 다수의 핑거의 복합체 3-D 위치선정은, 예를 들어 요구되지 않는다. 용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환 가능하게 사용된다. 그것들은 임의의 길이의 뉴클레오티드, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나, 또는 그의 유사체의 중합체 형태를 지칭한다. 폴리뉴클레오티드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 다음은 폴리뉴클레오티드의 비제한적인 예이다: 유전자 또는 유전자 단편의 코딩 또는 비-코딩 영역, 연결 분석으로부터 정의된 유전자좌들(유전자좌), 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA, 리보솜 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지형 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 분리된 DNA, 임의의 서열의 분리된 RNA, 핵산 프로브 및 프라이머. 또한, 상기 용어는 합성 백본이 있는 핵산-유사 구조를 포괄하며, 예를 들어, 문헌 [Eckstein, 1991; Baserga et al., 1992; Milligan, 1993; WO 97/03211; WO 96/39154; Mata, 1997; Strauss-Soukup, 1997; 및 Samstag, 1996]을 참조한다. 폴리뉴클레오티드는 하나 이상의 변형된 뉴클레오티드, 예를 들어, 메틸화 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비뉴클레오티드 성분에 의해 단속될 수 있다. 폴리뉴클레오티드는 중합 후에, 예를 들어, 표지화 성분과의 콘주게이션에 의해 추가로 변형될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "야생형"은 해당 분야의 숙련자에 의해 이해되는 해당 분야의 용어이며, 그것이 돌연변이체 또는 변이체로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 생물, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해해야 한다. 용어 "비-천연 발생" 또는 "설계 제작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 언급되는 경우, 핵산 분자 또는 폴리펩티드에 그들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다. "상보성"은 통상의 왓슨-크릭 염기쌍 형성 또는 기타 비-통상적 유형에 의해 다른 핵산 서열과 수소 결합(들)을 형성하는 핵산의 능력을 지칭한다. 상보성 백분율은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기쌍 형성)을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 나타낸다(예를 들어, 10 개 중 5, 6, 7, 8, 9, 10 개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성임). "완전한 상보성"은 핵산 서열의 모든 연속 잔기가 동일한 수의 제2 핵산 서열 내의 연속 잔기와 수소 결합할 것임을 의미한다. 본 명세서에 사용되는 바와 같이, "실질적인 상보성"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 개 이상의 뉴클레오티드의 영역에 걸쳐 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%인 상보성 정도를 지칭하거나, 엄격한 조건 하에서 혼성화하는 2 개의 핵산을 지칭한다. 본 명세서에 사용되는 바와 같이, 혼성화를 위한 "엄격한 조건"은 표적 서열에 대하여 상보성을 갖는 핵산 서열이 대개 표적 서열과 혼성화하며, 비-표적 서열에는 실질적으로 혼성화하지 않는 조건을 지칭한다. 엄격한 조건은 일반적으로 서열-의존적이며, 다수의 요인에 따라 달라진다. 일반적으로, 서열이 길수록, 서열이 그의 표적 서열에 특이적으로 혼성화하는 온도가 더 높아진다. 엄격한 조건의 비제한적인 예는 문헌[Tijssen(1993), Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of principles of hybridization and the strategy of nucleic acid probe assay", Elsevier, N.Y]에 상세히 기재되어 있다. 폴리뉴클레오티드 서열이 언급될 때, 상보성 또는 부분 상보성 서열도 생각된다. 이들은 바람직하게 높은 엄격성 조건하에 기준 서열에 혼성화할 수 있다. 일반적으로, 혼성화 속도를 최대화하기 위해서, 상대적으로 낮은 엄격성 혼성화 조건이 선택된다: 열 융점(Tm)보다 약 20 내지 25℃ 낮은 온도. Tm은 특정 표적 서열의 50%가 규정된 이온 세기와 pH에서 용액 중에서 완전히 상보성인 프로브와 혼성화하는 온도이다. 일반적으로, 혼성화된 서열의 적어도 약 85%의 뉴클레오티드 상보성을 요구하기 위해서, 높은 엄격성 세척 조건은 Tm보다 약 5 내지 15℃ 낮도록 선택된다. 혼성화된 서열의 적어도 약 70%의 뉴클레오티드 상보성을 요구하기 위해서, 중등의 엄격성 세척 조건은 Tm보다 약 15 내지 30℃ 낮도록 선택된다. 아주 관대한(매우 낮은 엄격성) 세척 조건은 Tm보다 50℃ 정도 낮을 수 있으며, 이것은 혼성화된 서열들 간에 높은 수준의 미스매칭을 허용한다. 당업자는 표적 서열과 프로브 서열 간 상동성의 특정 수준으로부터 검출 가능한 혼성화 신호의 결과에 영향을 미치기 위해서 혼성화 및 세척 단계에서 다른 물리화학적 변수들도 변경될 수 있다는 것을 인정할 것이다. 바람직한 높은 엄격성 조건은 42℃에서 50% 포름아미드, 5xSSC, 및 1% SDS 인큐베이션, 또는 65℃에서 5xSSC 및 1% SDS 인큐베이션과 65℃에서 0.2xSSC 및 0.1% SDS 세척을 포함한다. "혼성화"는 하나 이상의 폴리뉴클레오티드가 반응하여, 복합체를 형성하고, 이 복합체는 뉴클레오티드 잔기의 염기 사이의 수소 결합을 통해 안정화되는 반응을 지칭한다. 수소 결합은 왓슨 크릭 염기쌍 형성, 훅스타인 결합 또는 임의의 다른 서열 특이적 방식으로 발생할 수 있다. 복합체는 듀플렉스 구조를 형성하는 2 개의 가닥, 다중 가닥 복합체를 형성하는 3 개 이상의 가닥, 단일의 자가 혼성화 가닥 또는 이들의 임의의 조합을 포함할 수 있다. 혼성화 반응은 PCR의 개시 또는 효소에 의한 폴리뉴클레오티드의 절단과 같은 보다 광범위한 과정에서 하나의 단계를 이룰 수 있다. 주어진 서열과 혼성화할 수 있는 서열은 주어진 서열의 "상보물"로 지칭된다. 본 명세서에서 사용된 용어 "게놈 유전자좌" 또는 "유전자좌"(복수의 유전자좌)는 염색체에서 유전자 또는 DNA 서열의 특정 위치이다. "유전자"는 생물에서 활동하는 기능적 역할을 가진 RNA 사슬 또는 폴리펩티드를 인코딩하는 DNA 또는 RNA의 스트레치로서, 이에 따라, 살아있는 생물에서 유전의 분자 단위를 말한다. 본 발명의 목적을 위해서, 유전자는 이러한 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하든 아니든 유전자 산물의 생성을 조절하는 영역을 포함하는 것으로 간주될 수 있다. 따라서, 반드시 제한되는 것은 아니지만, 유전자는 프로모터 서열, 종결자, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 번역 조절 서열, 인핸서, 사일렌서, 인슐레이터, 경계 요소, 복제 원점, 매트릭스 부착 부위 및 유전자좌 조절 영역을 포함한다. 본 명세서에서 사용된 "게놈 유전자좌의 발현" 또는 "유전자 발현"은 유전자로부터의 정보가 기능적 유전자 산물의 합성에서 사용되는 과정이다. 유전자 발현의 산물은 주로 단백질이지만, rRNA 유전자 또는 tRNA 유전자와 같은 비-단백질 코딩 유전자에서는 이 산물은 기능적 RNA이다. 유전자 발현 과정은 생존을 위한 기능적 산물들을 생성하기 위해서 모든 알려진 생명체, 즉 진핵생물(다세포 생물 포함), 원핵생물(박테리아 및 고박테리아) 및 바이러스에 의해서 사용된다. 본 명세서에서 사용된 유전자 또는 핵산의 "발현"은 세포 유전자 발현뿐만 아니라 클로닝 시스템 및 임의의 다른 맥락에서 핵산(들)의 전사 및 번역을 포괄한다. 본 명세서에서 사용된 "발현"은 또한 폴리뉴클레오티드가 DNA 주형으로부터(예를 들어, mRNA 또는 다른 RNA 전사물로) 전사되는 과정 및/또는 전사된 mRNA가 이어서 펩티드, 폴리펩티드, 또는 단백질로 번역되는 과정을 말한다. 전사물 및 인코딩된 폴리펩티드는 집합적으로 "유전자 산물"이라고 언급될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래된다면, 발현은 진핵 세포에서 mRNA의 스플라이싱을 포함할 수 있다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 본 명세서에서 임의의 길이의 아미노산의 중합체를 지칭하기 위해 상호교환 가능하게 사용된다. 중합체는 선형 또는 분지형일 수 있으며, 그것은 변형된 아미노산을 포함할 수 있고, 그것은 비-아미노산에 의해 단속될 수 있다. 또한, 상기 용어는 변형된 아미노산 중합체; 예를 들어, 이황화 결합 형성, 글리코실화, 지질화(lipidation), 아세틸화, 인산화 또는 임의의 기타 조작, 예를 들어, 표지화 성분과의 콘주게이션을 포함한다. 본 명세서에서 사용되는 바와 같이, 용어 "아미노산"은 글리신 및 D 또는 L 광학 이성질체 및 아미노산 유사체 및 펩티드모방체를 포함하는 천연 및/또는 비천연 또는 합성 아미노산을 포함한다. 본 명세서에서 사용된 용어 "도메인" 또는 "단백질 도메인"은 단백질 사슬의 나머지 부분과 독립적으로 존재하며 기능할 수 있는 단백질 서열의 일부를 말한다. 본 발명의 양태에서 설명된 대로, 서열 동일성은 서열 상동성과 연관된다. 상동성 비교는 눈으로, 또는 더 일반적으로는 쉽게 이용 가능한 서열 비교 프로그램의 도움으로 수행될 수 있다. 이들 상업적으로 이용 가능한 컴퓨터 프로그램은 둘 이상의 서열 사이의 상동성 백분율(%)을 계산할 수 있고, 또한 둘 이상의 아미노산 또는 핵산 서열에 의해서 공유된 서열 동일성을 계산할 수 있다.
본 발명의 일 양태에서, 용어 "가이드 RNA"는 하나 이상의 추정되거나 확인된 tracr 서열 및 추정되거나 확인된 crRNA 서열 또는 가이드 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 구체적인 구현예에서, "가이드 RNA"는 추정되거나 확인된 crRNA 서열 또는 가이드 서열을 포함한다. 추가의 구현예에서, 가이드 RNA는 추정되거나 확인된 tracr 서열을 포함하지 않는다.
본 명세서에 사용되는 바와 같이, 용어 "야생형"은 당업자에 의해 이해되는 당업계의 용어이며, 이것이 돌연변이체 또는 변이체 형태로부터 구별되는 정도로 천연에서 발생하는 것과 같은 통상적인 형태의 생물, 균주, 유전자 또는 특징을 의미한다. "야생형"은 기준선일 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "변이체"는 천연에서 발생하는 것에서 벗어난 패턴을 갖는 특질의 표현을 의미하는 것으로 이해되어야 한다.
용어 "비-천연 발생" 또는 "설계 제작된"은 상호교환 가능하게 사용되며, 인간의 손의 개입을 나타낸다. 상기 용어는 핵산 분자 또는 폴리펩티드에 대하여 말하는 경우, 핵산 분자 또는 폴리펩티드에 이들이 천연에서 천연적으로 회합되어 있고, 천연에서 관찰되는 적어도 하나의 다른 성분이 적어도 실질적으로 없음을 의미한다. 모든 양태 및 구현예에서, 이들 용어가 포함되는지 아닌지의 여부에 관계없이, 바람직하게는 이는 선택적일 수 있으며, 이에 따라 바람직하게는 포함되거나 또는 바람직하게는 포함되지 않을 수 있는 것으로 이해될 것이다. 추가로, 용어 "비-천연 발생" 및 "설계 제작된"은 상호교환 가능하게 사용될 수 있으며, 따라서 단독으로 또는 조합되어 사용될 수 있고 하나 또는 다른 것들이 함께 언급된 것들을 대체할 수 있다. 특히, "비-천연 발생" 또는 "비-천연 발생 및/또는 설계 제작된" 대신에 "설계 제작된"이 바람직하다.
서열 상동성은 본 분야에 알려진 다수의 컴퓨터 프로그램, 예를 들어 BLAST 또는 FASTA 등의 임의의 것에 의해서 생성될 수 있다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏(Wisconsin Bestfit) 패키지이다(University of Wisconsin, U.S.A; 문헌[Devereux et al., 1984, Nucleic Acids Research 12:387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이에 한정되지 않지만 BLAST 패키지(상기 문헌[Ausubel et al., 1999] - 18장 참조), FASTA(문헌[Atschul et al., 1990, J. Mol. Biol., 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색을 위해 이용할 수 있다(상기 문헌[Ausubel et al., 1999], 페이지 7-58 내지 7-60 참조). 그러나, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. 서열 상동성 백분율(%)은 연속 서열에 걸쳐서 계산될 수 있는데, 즉 하나의 서열이 다른 서열과 정렬되고, 하나의 서열에서 각 아미노산 또는 뉴클레오티드가 다른 서열에서 상응하는 아미노산 또는 뉴클레오티드와 한번에 하나의 잔기씩 직접 비교된다. 이것은 "비갭"(ungapped) 정렬이라고 불린다. 전형적으로, 이러한 비갭 정렬은 상대적으로 짧은 수의 잔기에 걸쳐서만 수행된다. 이것은 매우 간단하고 일관된 방법이지만, 예를 들어 다른 동일한 쌍의 서열에서, 하나의 삽입 또는 결실이 이후의 아미노산 잔기를 정렬되지 않도록 할 수 있다는 것을 고려하지 않으므로, 전반적 정렬이 수행될 때는 잠재적으로 상동성%에 상당한 감소가 있게 된다. 결론적으로, 대부분의 서열 비교 방법은 전체 상동성 또는 동일성 점수에 과도한 패널티 부과 없이 가능한 삽입과 결실을 고려하는 최적 정렬을 생성하도록 설계된다. 이것은 국소 상동성 또는 동일성을 최대화하도록 시도하도록 서열 정렬에 "갭"을 삽입함으로써 달성된다. 그러나, 이런 더 복잡한 방법은 정렬에서 발생한 각 갭에 "갭 패널티"를 배정하며, 이로써 동일한 수의 동일한 아미노산에 대해, 가능한 적은 갭을 가진 서열 정렬 - 비교된 두 서열 간의 더 높은 연관성 반영 - 이 많은 갭을 가진 것보다 더 높은 점수를 달성할 수 있다. "친화성 갭 점수"가 통상적으로 사용되는데, 이것은 갭의 존재에는 상대적으로 높은 점수를 매기고, 갭의 각 연속 잔기에는 더 적은 패널티를 매긴다. 이것은 가장 흔히 사용되는 갭 점수배정 시스템이다. 높은 갭 패널티는 당연히 갭이 적을수록 최적화된 정렬을 생성할 수 있다. 대부분의 정렬 프로그램은 갭 패널티의 변형을 허용한다. 그러나, 서열 비교에 이러한 소프트웨어를 사용할 때 디폴트 값을 사용하는 것이 바람직하다. 예를 들어, GCG 위스콘신 베스트핏 패키지를 사용할 때, 아미노산 서열에 대한 디폴트 갭 패널티는 갭에 대해 -12 및 각 연장에 대해 -4이다. 따라서, 최대 상동성%의 계산은 먼저 갭 패널티를 고려한 최적 정렬의 생성을 요구한다. 이러한 정렬을 수행하기 위한 적합한 컴퓨터 프로그램은 GCG 위스콘신 베스트핏 패키지이다(문헌[Devereux et al., 1984 Nuc. Acids Research 12 p387]). 서열 비교를 수행할 수 있는 다른 소프트웨어의 예들은, 이에 한정되지 않지만, BLAST 패키지(문헌[Ausubel et al., 1999 Short Protocols in Molecular Biology, 4th Ed. Chapter 18] 참조), FASTA(문헌[Altschul et al., 1990 J. Mol. Biol. 403-410]) 및 GENEWORKS 비교 도구 묶음을 포함한다. BLAST와 FASTA는 모두 오프라인과 온라인 검색으로 이용할 수 있다(문헌[Ausubel et al., 1999, Short Protocols in Molecular Biology, pages 7-58 to 7-60] 참조). 그러나, 일부 응용에는, GCG 베스트핏 프로그램을 사용하는 것이 바람직하다. BLAST 2 서열이라고 불리는 새로운 도구도 단백질 및 뉴클레오티드 서열을 비교하는 데 이용할 수 있다(문헌[FEMS Microbiol Lett. 1999 174(2): 247-50]; 문헌[FEMS Microbiol Lett. 1999 177(1): 187-8] 및 National Institutes for Health 웹사이트에서 National Center for Biotechnology 웹사이트 참조). 최종 상동성%는 동일성에 관하여 측정될 수 있지만, 전형적으로 정렬 과정 자체는 양단간의 쌍 비교에 기초하지 않는다. 대신, 축척된 유사성 점수 행렬이 일반적으로 사용되는데, 이것은 화학적 유사성 또는 진화적 거리에 기초하여 각 쌍-방식 비교에 점수를 배정한다. 흔히 사용되는 이러한 행렬의 예는 BLOSUM62 행렬로서, 이것은 BLAST 프로그램 묶음의 디폴트 행렬이다. GCG 위스콘신 프로그램은 일반적으로 공개된 디폴트 값이나 제공되는 경우에는 사용자 지정 기호 비교표(추가의 상세한 설명을 위해 사용자 매뉴얼 참조)를 사용한다. 일부 응용에는, GCG 패키지에 대한 공개된 디폴트 값을 사용하거나, 또는 다른 소프트웨어의 경우에는 BLOSUM62와 같은 디폴트 행렬을 사용하는 것이 바람직하다. 대안적으로, 상동성 백분율은 CLUSTAL과 유사한 알고리즘에 기초한, DNASIS™(Hitachi Software)의 다중 정렬 특징을 사용하여 계산될 수 있다(문헌[Higgins DG & Sharp PM(1988), Gene 73(1), 237-244]). 일단 소프트웨어가 최적 정렬을 생성하면, 상동성%, 바람직하게는 서열 동일성%를 계산하는 것이 가능하다. 소프트웨어는 통상적으로 서열 비교의 일부로서 이것을 행하고, 수치 결과를 생성한다. 서열은 또한 침묵성 변화를 생성하여 기능적으로 동등한 물질을 야기하는 아미노산 잔기의 결실, 삽입 또는 치환을 가질 수 있다. 아미노산 특성(예를 들어, 잔기의 극성, 전하, 용해성, 소수성, 친수성 및/또는 양친매성)의 유사성을 기초로 의도적인 아미노산 치환이 만들어질 수 있으며, 따라서 작용기에 있어서 아미노산을 함께 그룹화하는 데 유용하다. 아미노산은 그것의 측쇄만의 특성에 기초하여 그룹화될 수 있다. 그러나, 돌연변이 데이터를 포함하는 것도 역시 더 유용하다. 이렇게 유도된 아미노산 세트는 구조적 이유로 보존될 수 있다. 이들 세트는 벤다이어그램의 형태로 설명될 수 있다(문헌[Livingstone C.D. and Barton G.J.(1993) "Protein sequence alignments: a strategy for the hierarchical analysis of residue conservation" Comput. Appl. Biosci. 9: 745-756])(문헌[Taylor W.R.(1986) "The classification of amino acid conservation" J. Theor. Biol. 119; 205-218]). 보존적 치환은, 예를 들어 일반적으로 용인된 벤다이어그램 아미노산 그룹화를 설명한 아래 표에 따라서 이루어질 수 있다.
용어 "대상체", "개인", 및 "환자"는 본 명세서에서 상호교환 가능하게 사용되어 척추동물, 바람직하게는 포유류, 더 바람직하게는 인간을 지칭한다. 포유류는 이에 한정되지 않지만 뮤린, 유인원, 인간, 농장 동물, 경기용 동물, 및 반려동물을 포함한다. 생체내에서 수득된 또는 시험관내에서 배양된 생물학적 개체의 조직, 세포 및 이들의 자손 또한 포함된다.
용어 "치료제", "치료 가능제" 또는 "처리제"는 상호교환 가능하게 사용되며, 대상체로의 투여에 몇 가지 유익한 효과를 부여하는 분자 또는 화합물을 지칭한다. 유익한 효과는 진단 결정의 가능화; 질병, 증상, 장애, 또는 병리학적 질환의 개선; 질병, 증상, 장애 또는 질환의 개시의 감소 또는 예방; 및 일반적으로 질병, 증상, 장애 또는 병리학적 질환의 대응을 포함한다.
본 명세서에서 사용된 바와 같이, "치료" 또는 "치료하는" 또는 "완화" 또는 "개선하는"은 상호교환 가능하게 사용된다. 이들 용어는 이에 한정되지 않지만 치료 이익 및/또는 예방 이익을 포함하는, 유익하거나 원하는 결과를 수득하기 위한 접근을 지칭한다. 치료적 이익이라 함은, 치료 하에 있는 하나 이상의 질병, 질환, 또는 증상에서의 임의의 치료 관련 개선 또는 이에 대한 효과를 의미한다. 예방적 이익을 위해, 조성물은 특정 질병, 질환, 또는 증상 발전의 위험에 있는 대상체에, 또는 질병, 질환, 또는 증상이 아직 표명되지 않을 수 있다 하더라도 질병의 하나 이상의 생리학적 증상이 보고되는 대상체에게 투여될 수 있다.
용어 "유효량" 또는 "치료적 유효량"은 유익하거나 원하는 결과를 발생시키기에 충분한 제제의 양을 지칭한다. 치료적 유효량은, 치료될 대상체 및 질병 상태, 대상체의 체중 및 연령, 질병 상태의 심각도, 투여 방법 등 중 하나 이상에 따라 달라질 수 있으며, 이는 당업자에 의해 쉽게 결정될 수 있다. 용어는 또한 본 명세서에서 기재된 임의의 하나의 이미지화 방법에 의한 검출을 위한 이미지를 제공할 용량에 적용된다. 특정 용량은, 선택된 특정 제제, 이후 따르는 투약 섭생, 다른 화합물과 조합되어 투여되는지의 여부, 투여 타이밍, 이미징될 조직, 및 용량이 운반되는 물리적 전달 시스템 중 하나 이상에 따라 달라질 수 있다.
본 발명의 실시는, 달리 표시되지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상적인 기법을 사용한다. 문헌[Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989)]; 문헌[CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel, et al. eds., (1987))]; 시리즈 문헌[METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995))], 문헌[Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987))] 참고.
본 발명의 일부 양태는 하나 이상의 벡터를 포함하는 벡터 시스템, 또는 이와 같은 벡터에 관한 것이다. 벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질, 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어 에스케리키아 콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포, 또는 포유류 세포에서 발현될 수 있다. 적합한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는, 예를 들어 T7 프로모터 조절 서열 및 T7 중합효소를 사용하여 시험관내에서 전사되고 번역될 수 있다.
본 발명의 일 구현예는, 아미노산의 경우 유사한 것으로의 치환, 예를 들어 염기성을 염기성으로, 산성을 산성으로, 극성을 극성으로 등등의 치환을 일으킬 수 있는 상동성 치환(치환 및 대체는 모두 본 명세서에서 기존 아미노산 잔기 또는 뉴클레오티드의 대안적인 잔기 또는 뉴클레오티드로의 교환을 의미하도록 사용됨)을 포함할 수 있는 서열(폴리뉴클레오티드 또는 폴리펩티드 모두)을 포함한다. 비-상동성 치환, 즉 한 부류의 잔기로부터 다른 부류의 잔기로의 치환, 또는 대안적으로 오르니틴(이후 Z로 언급), 디아미노부티르산 오르니틴(이후 B로 언급), 노르류신 오르니틴(이후 O로 언급), 피리일알라닌, 티에닐알라닌, 나프틸알라닌 및 페닐글리신과 같은 비천연 아미노산의 포함을 수반하는 치환이 일어날 수 있다. 변이체 아미노산 서열은 글리신 또는 β-알라닌 잔기와 같은 아미노산 스페이서에 더하여 메틸, 에틸 또는 프로필기와 같은 알킬기를 포함하는 서열의 임의의 두 아미노산 잔기 사이에 삽입될 수 있는 적합한 스페이서 기를 포함할 수 있다. 펩토이드 형태로 하나 이상의 아미노산 잔기의 존재를 포함하는 추가의 형태의 변형도 해당 분야의 숙련자에게 잘 이해될 수 있다. 의심을 피하기 위해서, "펩토이드 형태"는 α-탄소 치환기가 α-탄소가 아니라 잔기의 질소 원자에 존재하는 변이체 아미노산 잔기를 말하기 위해서 사용된다. 펩토이드 형태로 펩티드를 제조하는 과정은 해당 분야에, 예를 들어 문헌[Simon RJ et al., PNAS(1992) 89(20), 9367-9371] 및 문헌[Horwell DC, Trends Biotechnol.(1995) 13(4), 132-134]에 공지되어 있다.
상동성 모델링: 다른 C2c2 오솔로그에서의 해당 잔기는 문헌 [Zhang et al., 2012(Nature; 490(7421): 556-60) and Chen et al., 2015(PLoS Comput Biol; 11(5): e1004248)]의 방법 - 도메인-모티프 계면에 의해 매개된 상호작용을 예측하는 계산상 단백질-단백질 상호작용(PPI) 방법에 의해 확인될 수 있다. PrePPI(예측 PPI)는 구조 기준 PPI 예측 방법으로, 베이지안(Bayesian) 통계 프레임워크를 이용하여 비-구조적 증거와 구조적 증거를 조합한다. 이 방법은 문의되는 단백질의 쌍을 취하고, 구조적 정렬을 이용하여 그의 실험적으로 결정된 구조 또는 상동성 모델 중 어느 하나에 상응하는 구조적 대표물을 확인하는 것을 포함한다. 구조적 정렬은 전반적인 및 국소의 기하 관계를 고려함으로써 가까운 구조적 이웃 및 먼 구조적 이웃 모두를 확인하는 데 추가로 사용된다. 구조적 대표물의 두 이웃이 단백질 데이터 뱅크에 보고된 복합체를 형성할 때마다, 이는 두 개의 문의되는 단백질 사이의 상호작용을 모델링하기 위한 주형을 정의한다. 복합체의 모델은 대표 작제물을 주형 내에서 그의 상응하는 구조적 이웃에 겹쳐놓음으로써 창출된다. 이러한 접근은 문헌[Dey et al., 2013(Prot Sci; 22: 359-66)]에 추가로 기재되어 있다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 이.콜라이(에스케리키아 콜라이) DNA 폴리머라제의 클레나우(Klenow) 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다.
특정 양태에서, 본 발명은 벡터를 포함한다. 본 명세서에서 사용된 "벡터"는 개체를 하나의 환경에서 다른 환경으로 전달하는 것을 허용 또는 촉진하는 도구이다. 이는 레플리콘, 예를 들어 플라스미드, 파지, 또는 코스미드로, 다른 DNA 절편이 그 안에 삽입될 수 있어서, 삽입된 절편의 복제를 유발한다. 일반적으로, 벡터는 적절한 제어 요소와 연결된 경우 복제할 수 있다. 일반적으로, 용어 "벡터"는 그것이 연결되어 있는 다른 핵산을 전달할 수 있는 핵산 분자를 지칭한다. 벡터는, 이에 한정되지 않지만, 단일 가닥, 이중 가닥, 또는 부분적으로 이중 가닥인 핵산 분자; 하나 이상의 자유 말단을 포함하는 핵산 분자, 자유 말단이 없는 핵산 분자(예를 들어, 원형); DNA, RNA 또는 이들 둘 모두를 포함하는 핵산 분자; 및 해당 분야에서 알려진 다른 각종 폴리뉴클레오티드를 포함한다. 벡터의 일 종류로 "플라스미드"가 있으며, 이는 원형 이중 가닥 DNA 루프를 지칭하며, 그 안으로 예를 들어 표준 분자 클로닝 기술에 의해서 추가의 DNA 절편이 삽입될 수 있다. 벡터의 또 다른 종류로 바이러스 벡터가 있으며, 바이러스-유래된 DNA 또는 RNA 서열이 바이러스(예를 들어, 레트로바이러스, 복제 결함 레트로바이러스, 아데노바이러스, 복제 결함 아데노바이러스, 및 아데노-관련 바이러스(AAV)) 내로의 패키징을 위해 벡터에 존재한다. 바이러스 벡터는 또한 숙주 세포 내로의 트랜스펙션을 위한, 바이러스가 지니는 폴리뉴클레오티드를 포함한다. 특정 벡터는 그것이 도입된 숙주 세포에서 자율적 복제가 가능하다(예를 들어, 박테리아 복제 원점을 가진 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터(예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포 내로 도입시 숙주 세포의 게놈에 통합되며, 이로써 숙주 게놈과 함께 복제된다. 더욱이, 특정 벡터는 그것이 작동 가능하게 연결된 유전자의 발현을 유도할 수 있다. 이러한 벡터는 본 명세서에서 "발현 벡터"로 지칭된다. 재조합 DNA 기술에서 활용되는 통상적인 발현 벡터는 주로 플라스미드의 형태이다.
재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로 본 발명의 핵산을 포함할 수 있는데, 이것은 재조합 발현 벡터가 하나 이상의 조절 요소를 포함하는 것을 의미하며, 하나 이상의 조절 요소는 발현에 사용될 숙주 세포에 기초하여 선택될 수 있고, 발현될 핵산 서열에 작동 가능하게 연결된다. 재조합 발현 벡터 내에서 "작동 가능하게 연결된"은 관심 뉴클레오티드 서열이(예를 들어, 시험관내 전사/번역 시스템에서 또는 벡터가 숙주 세포에 도입된 경우에는 숙주 세포에서) 그 뉴클레오티드 서열의 발현을 허용하는 방식으로 조절 요소(들)에 연결됨을 의미하고자 한다. 재조합 및 클로닝 방법에 관련하여, 2004년 9월 2일 간행된 미국 특허 출원 10/815,730이 언급될 수 있으며, 이의 모든 내용은 그 전체로서 본 명세서에 포함된다.
본 발명의 일 양태는 가이드 RNA 및 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)에 대한 비시스트로닉(bicistronic) 벡터에 관한 것이다. 비시스트로닉 발현 벡터 가이드 RNA 및 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)가 바람직하다. 일반적으로 그리고 특히 이 구현예에서, 야생형, 변형된 또는 돌연변이된 CRISPR 이펙터 단백질/효소(예를 들어, C2c2)는 바람직하게 CBh 프로모터에 의해서 유도된다. RNA는 바람직하게 Pol III 프로모터, 예를 들어, U6 프로모터에 의해 유도된다. 이상적으로 2 개가 조합된다.
일부 구현예에서, 가이드 RNA에서 루프가 제공된다. 이는 스템 루프 도는 테트라 루프일 수 있다. 이 루프는 바람직하게 GAAA이지만, 이 서열에만 제한되는 것은 아니며, 또는 실제로 단지 4 bp 길이에만 제한되는 것도 아니다. 실제로, 헤어핀 구조에서 사용하기 위한 바람직한 루프 형성 서열은 4 개 뉴클레오티드 길이이고, 가장 바람직하게 서열 GAAA를 갖는다. 그러나, 더 길거나 짧은 루프 서열도 사용될 수 있으며, 대안적인 서열도 사용될 수 있다. 서열은 바람직하게 뉴클레오티드 트리플렛(예를 들어, AAA), 및 추가의 뉴클레오티드(예를 들어, C 또는 G)를 포함한다. 루프 형성 서열의 예들은 CAAA 및 AAAG를 포함한다.
본 명세서에 개시된 임의의 방법을 실시하는 데 있어서, 적합한 벡터가, 이에 한정되지 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해서 배아에 도입될 수 있다. 벡터 또는 벡터들은 배아의 핵 또는 세포질에 미세주입될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션에 의해서 세포 내로 도입될 수 있다.
용어 "조절 요소"는 프로모터, 인핸서, 내부 리보솜 진입 부위(IRES), 및 다른 발현 조절 요소(예를 들어, 전사 종결 신호, 예를 들어 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 이러한 조절 요소는, 예를 들어 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 기재되어 있다. 조절 요소는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 유도하는 것들과 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다. 조직-특이적 프로모터는 근육, 뉴런, 뼈, 피부, 혈액, 특정 장기(예를 들어, 간, 췌장)와 같은 요망되는 관심 조직, 또는 특정 세포 유형(예를 들어, 림프구)에서 주로 발현을 유도할 수 있다. 조절 요소는 시간-의존적 방식으로, 예를 들어 세포-주기 의존적 또는 발생 단계 의존적 방식으로 발현을 유도할 수 있으며, 이것은 조직 특이적이거나 세포-유형 특이적일 수 있거나, 그렇지 않을 수도 있다. 일부 구현예에서, 벡터는 하나 이상의 pol III 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol III 프로모터), 하나 이상의 pol II 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol II 프로모터), 하나 이상의 pol I 프로모터(예를 들어, 1, 2, 3, 4, 5 개 또는 그 이상의 pol I 프로모터), 또는 이들의 조합을 포함한다. pol III 프로모터의 예들은, 이에 한정되지 않지만, U6 및 H1 프로모터를 포함한다. pol II 프로모터의 예들은, 이에 한정되지 않지만, 레트로바이러스 라우스 육종 바이러스(RSV) LTR 프로모터(선택적으로 RSV 인핸서와 함께), 사이토메갈로바이러스(CMV) 프로모터(선택적으로 CMV 인핸서와 함께)[예를 들어, 문헌[Boshart et al, Cell, 41:521-530(1985)] 참조], SV40 프로모터, 디하이드로폴레이트 리덕타제 프로모터, β-액틴 프로모터, 포스포글리세롤 키나아제(PGK) 프로모터, 및 EF1α 프로모터를 포함한다. 또한, 용어 "조절 요소"에는 인핸서 요소, 예를 들어 WPRE; CMV 인핸서; HTLV-I의 LTR에서 R-U5' 절편(문헌[Mol. Cell. Biol., Vol. 8(1), p. 466-472, 1988]); SV40 인핸서; 및 토끼 β-글로빈의 엑손 2와 3 사이의 인트론 서열(문헌[Proc. Natl. Acad. Sci. USA., Vol. 78(3), p. 1527-31, 1981])도 포함된다. 발현 벡터의 설계는 형질전환될 숙주 세포의 선택, 요망되는 발현 수준 등과 같은 요인에 따라 달라질 수 있다는 것이 해당 분야의 숙련자에 의해서 인정될 것이다. 벡터는 숙주 세포에 도입될 수 있고, 이로써 본 명세서에 설명된 바와 같이 핵산에 의해서 인코딩된, 융합 단백질 또는 펩티드를 포함하는, 전사물, 단백질 또는 펩티드가 생성될 수 있다(예를 들어, 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR) 전사물, 단백질, 효소, 이들의 돌연변이체 형태, 이들의 융합 단백질 등). 조절 서열과 관련하여, US 특허 출원 10/491,026이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 프로모터와 관련하여, PCT 공보 WO 2011/028929 및 미국 특허 출원 12/511,940이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다.
벡터는 원핵 또는 진핵 세포에서 CRISPR 전사물(예를 들어, 핵산 전사물, 단백질 또는 효소)의 발현을 위해 설계될 수 있다. 예를 들어, CRISPR 전사물은 박테리아 세포, 예를 들어 이.콜라이, 곤충 세포(배큘로바이러스 발현 벡터 사용), 효모 세포 또는 포유류 세포에서 발현될 수 있다. 적절한 숙주 세포는 문헌[Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990)]에 추가로 논의되어 있다. 대안적으로, 재조합 발현 벡터는 예를 들어, T7 프로모터 조절 서열 및 T7 폴리머라제를 사용하여 시험관내에서 전사되고 번역될 수 있다.
벡터는 원핵생물, 또는 원핵 세포에 도입되고, 그에서 증식될 수 있다. 일부 구현예에서, 원핵생물은 진핵 세포로 도입될 벡터 또는 진핵 세포로 도입되는 벡터의 생성에서 중간체 벡터(예를 들어, 바이러스 벡터 패키징 시스템의 일부로서 플라스미드 증폭)로서 벡터의 복사(copy)를 증폭시키기 위해서 사용된다. 일부 구현예에서, 원핵생물은 벡터의 복사를 증폭시키고, 하나 이상의 핵산을 발현하기 위해, 예를 들어, 숙주 세포 또는 숙주 생물로의 전달을 위한 하나 이상의 단백질의 공급원을 제공하기 위해 사용된다. 원핵생물에서의 단백질의 발현은 종종 융합 또는 비-융합 단백질 중 어느 하나의 발현을 유도하는 구성성 또는 유도성 프로모터를 함유하는 벡터를 사용하여 이.콜라이에서 실시된다. 융합 벡터는 거기에서 인코딩된 단백질에, 예를 들어 재조합 단백질의 아미노 말단에 수많은 아미노산을 부가한다. 이러한 융합 벡터는 다음과 같은 하나 이상의 목적을 제공할 수 있다: (i) 재조합 단백질의 발현의 증가; (ii) 재조합 단백질의 용해도의 증가; 및 (iii) 친화성 정제에서 리간드로 작용함으로써 재조합 단백질의 정제의 보조. 종종, 융합 발현 벡터에서, 단백질분해 절단 부위는 융합 모이어티와 재조합 단백질의 연접부에 도입되어, 융합 단백질의 정제 이후에 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 한다. 이러한 효소 및 그들의 동족 인식 서열은 인자 Xa, 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX(파마시아 바이오테크 인코포레이티드(Pharmacia Biotech Inc); 문헌[Smith and Johnson, 1988. Gene 67: 31-40]), pMAL(미국 매사추세츠주 비벌리 소재의 뉴 잉글랜드 바이오랩스(New England Biolabs)) 및 pRIT5(미국 뉴저지주 피스카타웨이 소재의 파마시아(Pharmacia))를 포함하며, 이는 각각 글루타티온 S-트랜스퍼라제(GST), 말토스 E 결합 단백질 또는 단백질 A를 표적 재조합 단백질에 융합시킨다.
적절한 유도성 비-융합 이.콜라이 발현 벡터의 예는 pTrc(문헌[Amrann et al.,(1988) Gene 69:301-315]) 및 pET 11d(문헌[Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif.(1990) 60-89])를 포함한다.
일부 구현예에서, 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비시에(Saccharomyces cerevisiae)에서의 발현을 위한 벡터의 예에는 pYepSec1(문헌[Baldari, et al., 1987. EMBO J. 6: 229-234]), pMFa(문헌[Kuijan and Herskowitz, 1982. Cell 30: 933-943]), pJRY88(문헌[Schultz et al., 1987. Gene 54: 113-123]), pYES2(미국 캘리포니아주 샌디에고 소재의 인비트로겐 코포레이션) 및 picZ(미국 캘리포니아주 샌 디에고 소재의 인비트로겐 코포레이션)가 포함된다.
일부 구현예에서, 벡터는 배큘로바이러스 발현 벡터를 사용하여 곤충 세포에서 단백질 발현을 유도한다. 배양된 곤충 세포(예를 들어, SF9 세포)에서 단백질의 발현에 이용 가능한 배큘로바이러스 벡터는 pAc 시리즈(문헌[Smith, et al., 1983. Mol. Cell. Biol. 3: 2156-2165]) 및 pVL 시리즈(문헌[Lucklow and Summers, 1989. Virology 170: 31-39])를 포함한다.
일부 구현예에서, 벡터는 포유류 발현 벡터를 사용하여 포유류 세포에서 하나 이상의 서열의 발현을 유도할 수 있다. 포유류 발현 벡터의 예는 pCDM8(문헌[Seed, 1987. Nature 329: 840]) 및 pMT2PC(문헌[Kaufman, et al., 1987. EMBO J. 6: 187-195])를 포함한다. 포유류 세포에서 사용되는 경우, 발현 벡터의 제어 작용은 통상적으로 하나 이상의 조절 요소에 의해 제공된다. 예를 들어, 통상적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스, 유인원 바이러스 40 및 본 명세서에 개시되고 당업계에 공지되어 있는 기타의 것으로부터 유래된다. 원핵 및 진핵 세포 둘 모두를 위한 다른 적절한 발현 시스템에 대하여, 예를 들어, 문헌[Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]의 16 및 17장을 참조한다.
일부 구현예에서, 재조합 포유류 발현 벡터는 특정 세포 유형에서 우선적으로 핵산의 발현을 유도할 수 있다(예를 들어, 핵산을 발현하기 위하여 조직-특이적 조절 요소가 사용됨). 조직-특이적 조절 요소는 해당 분야에 공지되어 있다. 적절한 조직-특이적 프로모터의 비제한적인 예에는 알부민 프로모터(간-특이적; 문헌[Pinkert, et al., 1987. Genes Dev. 1: 268-277]), 림프-특이적 프로모터(문헌[Calame and Eaton, 1988. Adv. Immunol. 43: 235-275]), 특히, T 세포 수용체(문헌[Winoto and Baltimore, 1989. EMBO J. 8: 729-733]) 및 면역글로불린의 프로모터(문헌[Baneiji, et al., 1983. Cell 33: 729-740]; 문헌[Queen and Baltimore, 1983. Cell 33: 741-748]), 뉴런-특이적 프로모터(예를 들어, 신경섬유 프로모터; 문헌[Byrne and Ruddle, 1989. Proc. Natl. Acad. Sci. USA 86: 5473-5477]), 췌장-특이적 프로모터(문헌[Edlund, et al., 1985. Science 230: 912-916]) 및 유선-특이적 프로모터(예를 들어, 유장(milk whey) 프로모터; 미국 특허 4,873,316 및 유럽 출원 공보 264,166)가 포함된다. 발생-조절 프로모터, 예를 들어, 뮤린 hox 프로모터(문헌[Kessel and Gruss, 1990. Science 249: 374-379]) 및 α-태아단백질 프로모터(문헌[Campes and Tilghman, 1989. Genes Dev. 3: 537-546])도 또한 포함된다. 이들 원핵 및 진핵 벡터와 관련하여, 미국 특허 제6,750,059 호가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 본 발명의 다른 구현예들은 바이러스 벡터의 사용에 관한 것일 수 있으며, 이에 관해서는 미국 특허 출원 제13/092,085 호가 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다. 조직-특이적 조절 요소는 해당 분야에 공지이며, 이에 관해서는 미국 특허 제7,776,321 호이 언급되며, 그의 내용은 본 명세서에 그 전체로서 참고문헌으로 통합된다.
일부 구현예에서, 조절 요소는 CRISPR 시스템의 하나 이상의 요소에 작동 가능하게 연결되어 CRISPR 시스템의 하나 이상의 요소의 발현을 유도한다. 일반적으로, SPIDR(스페이서 산재된 직접 반복)로도 알려져 는 CRISPR(클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부)은 통상 특정 박테리아 종에 특이적인 DNA 유전자좌의 패밀리를 구성한다. CRISPR 유전자좌는 이.콜라이에서 인식되는 별개의 부류의 산재된 짧은 서열 반복부(SSR) 및 관련 유전자를 포함한다(문헌[Ishino et al., J. Bacteriol., 169:5429-5433 [1987]]; 및 문헌[Nakata et al., J. Bacteriol., 171:3553-3556 [1989]]). 유사한 산재된 SSR이 할로페락스 메디테라네이(Haloferax mediterranei), 스트렙토코커스 피오게네스, 아나바에나(Anabaena) 및 미코박테리움 튜베르큘로시스(Mycobacterium tuberculosis)에서 확인되었다(문헌[Groenen et al., Mol. Microbiol., 10:1057-1065 [1993]]; 문헌[Hoe et al., Emerg. Infect. Dis., 5:254-263 [1999]]; 문헌[Masepohl et al., Biochim. Biophys. Acta 1307:26-30 [1996]]; 및 문헌[Mojica et al., Mol. Microbiol., 17:85-93 [1995]] 참조). CRISPR 유전자좌는 통상적으로 SRSR(규칙적으로 산재된 짧은 반복부(short regularly spaced repeat))로 명명된 반복부의 구조가 다른 SSR과 상이하다(문헌[Janssen et al., OMICS J. Integ. Biol., 6:23-33 [2002]]; 및 문헌[Mojica et al., Mol. Microbiol., 36:244-246 [2000]]). 일반적으로, 반복부는 실질적으로 고정된 길이를 갖는 독특한 개재 서열에 의해 규칙적으로 산재된 클러스터에 존재하는 짧은 요소이다(상기 문헌[Mojica et al., [2000]]). 반복 서열이 균주들 간에 고도로 보존되어 있지만, 산재된 반복부의 수와 스페이서 영역의 서열은 통상적으로 균주마다 상이하다(문헌[van Embden et al., J. Bacteriol., 182:2393-2401 [2000]]). CRISPR 유전자좌는 40 개가 넘는 원핵생물에서 확인되며(예를 들어, Jansen 등의 Mol. Microbiol., 43:1565-1575 [2002]; 및 Mojica 등의 [2005] 참조), 에로피룸(Aeropyrum), 피로박쿨룸(Pyrobaculum), 설포로부스(Sulfolobus), 아캐오글로부스(Archaeoglobus), 할로카르쿨라(Halocarcula), 메타노박테리움, 메타노코커스, 메타노사르시나(Methanosarcina), 메타노피루스(Methanopyrus), 피로코커스, 피크로필루스(Picrophilus), 테르모플라스마, 코리네박테리움, 미코박테리움, 스트렙토마이세스, 아퀴펙스, 포르피로모나스, 클로로비움, 테르무스(Thermus), 바실러스, 리스테리아, 스태필로코커스, 클로스트리디움, 테르모언에어로박터, 미코플라스마, 푸소박테리움, 아자르쿠스(Azarcus), 크로모박테리움, 네이세리아, 니트로소모나스, 데술포비브리오(Desulfovibrio), 게오박터(Geobacter), 마익소코커스(Myxococcus), 캄필로박터, 올리넬라(Wolinella), 아시네토박터, 어위니아, 에스케리키아, 레지오넬라, 메틸로코커스, 파스퉤렐라(Pasteurella), 포토박테리움, 살모넬라, 크산토모나스, 여시니아, 트레포모나, 및 테르모토가(Thermotoga)를 포함하지만, 이로 제한되지는 않는다.
일반적으로, 본 출원에서 사용되는 바와 같은 "핵산-표적화 시스템"은 핵산-표적화 CRISPR-회합된("Cas") 유전자(또한, 본 명세서에서 이펙터 단백질로 지칭됨)의 발현 또는 활성을 유도하는 데 수반된 다른 요소 및 전사물을 종합적으로 지칭하며, 이는 핵산-표적화 Cas(이펙터) 단백질 및 가이드 RNA(crRNA 서열 및 트랜스-활성화 CRISPR/Cas 시스템 RNA(tracrRNA) 서열을 포함)를 인코딩하는 서열 또는 핵산-표적화 CRISPR 유전자좌로부터의 전사물 및 다른 서열을 포함한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 제V형/제VI형 핵산-표적화 CRISPR 시스템으로부터 유도된다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소는 내인성 핵산-표적화 CRISPR 시스템을 포함하는 특정 생물로부터 유도된다. 일반적으로, 핵산-표적화 시스템은 표적 서열의 부위에서 핵산-표적화 복합체의 형성을 촉진하는 요소에 의해 특징지어진다. 핵산-표적화 복합체의 형성의 맥락에서, "표적 서열"은 가이드 서열이 이에 대해 상보성을 갖도록 설계되는 서열을 지칭하며, 여기서 표적 서열과 가이드 RNA 사이의 혼성화는 DNA 또는 RNA-표적화 복합체의 형성을 촉진한다. 혼성화를 유발하고 핵산-표적화 복합체의 형성을 촉진하기에 충분한 상보성이 있다면, 완전한 상보성이 반드시 요구되지는 않는다. 표적 서열은 RNA 폴리뉴클레오티드를 포함할 수 있다. 일부 구현예에서, 표적 서열은 세포의 핵 내 또는 세포질 내에 위치된다. 일부 구현예에서, 표적 서열은 진핵 세포의 세포소기관 내, 예를 들어 미토콘드리아 또는 엽록체에 있을 수 있다. 표적 서열을 포함하는 표적화된 유전자좌 내로의 재조합을 위해 사용될 수 있는 서열 또는 주형은 "편집 주형" 또는 "편집 RNA" 또는 "편집 서열"로 지칭된다. 본 발명의 일 양태에서, 외인성 주형 RNA는 편집 주형으로서 지칭될 수 있다. 본 발명의 일 양태에서 재조합은 상동성 재조합이다.
전형적으로, 내인성 핵산-표적화 시스템의 맥락에서, 핵산-표적화 복합체(표적 서열에 혼성화되고, 하나 이상의 핵산-표적화 이펙터 단백질과 복합체화된 가이드 RNA를 포함함)의 형성은 표적 서열 내 또는 가까이에서(예를 들어, 이로부터 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50 개 이상의 염기쌍) 하나 또는 2 개의 RNA 가닥의 절단을 초래한다. 일부 구현예에서, 핵산-표적화 시스템의 하나 이상의 요소의 발현을 유도하는 하나 이상의 벡터가 숙주 세포 내로 도입되어 핵산-표적화 시스템의 요소의 발현이 하나 이상의 표적 부위에서 핵산-표적화 복합체의 형성을 유도하도록 한다. 예를 들어, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 각각 별개의 벡터 상에서 별개의 조절 요소에 작동 가능하게 연결될 수 있다. 대안적으로, 동일하거나 상이한 조절 요소로부터 발현된 둘 이상의 요소가 단일 벡터 내에 조합될 수 있으며, 핵산-표적화 시스템의 임의의 성분을 제공하는 하나 이상의 추가적인 벡터는 첫번째 벡터에 포함되지 않는다. 단일 벡터 내에서 조합되는 핵산-표적화 시스템 요소는, 예를 들어 제2 요소에 대해 3'(이의 "다운스트림") 또는 제2 요소에 대해 5'(이의 "업스트림")에 위치되는 하나의 요소와 같이, 임의의 적합한 배향으로 배열될 수 있다. 일 요소의 코딩 서열은 제2 요소의 코딩 서열의 동일하거나 반대의 가닥 상에 위치될 수 있거나, 동일하거나 상이한 방향으로 배향된다. 일부 구현예에서, 단일 프로모터는 하나 이상의 인트론 서열 내에 임베딩된 가이드 RNA 및 핵산-표적화 이펙터 단백질을 인코딩하는 전사물의 발현을 유도할 수 있다(예를 들어, 상이한 인트론 내에서 각각, 적어도 하나의 인트론 내에서 둘 이상, 또는 단일 인트론 내에서 모두). 일부 구현예에서, 핵산-표적화 이펙터 단백질 및 가이드 RNA는 동일한 프로모터에 작동 가능하게 연결되고 발현된다.
일반적으로, 가이드 서열은 표적 서열과 혼성화하고, 핵산-표적화 복합체의 표적 서열로의 서열-특이적 결합을 유도하기에 충분한 표적 폴리뉴클레오티드와의 상보성을 갖는 임의의 폴리뉴클레오티드 서열이다. 일부 구현예에서, 가이드 서열과 이의 상응하는 표적 서열 간의 상보성 정도는, 적합한 정렬 알고리즘을 사용하여 최적으로 정렬된 경우, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5%, 99% 이상 또는 이를 초과한다. 최적 정렬은 정렬 서열에 대한 임의의 적합한 알고리즘을 사용하여 결정될 수 있으며, 이의 비제한적인 예는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환 기반 알고리즘(예를 들어, Burrows Wheeler Aligner), ClustalW, Clustal X, BLAT, Novoalign(Novocraft Technologies), ELAND(Illumina, 미국 캘리포니아주 샌디에고 소재), SOAP(soap.genomics.org.cn에서 이용 가능함), 및 Maq(maq.sourceforge.net에서 이용 가능함)를 포함한다. 일부 구현예에서, 가이드 서열은 길이가 약 5, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 75 개 이상의 뉴클레오티드이거나 이를 초과한다. 일부 구현예에서, 가이드 서열은 길이가 약 75, 50, 45, 40, 35, 30, 25, 20, 15, 12 개 이하의 뉴클레오티드 미만이다. 표적 서열로의 핵산-표적화 복합체의 서열-특이적 결합을 지시하는 가이드 서열의 능력은 임의의 적절한 분석에 의해 평가될 수 있다. 예를 들어, 시험되는 가이드 서열을 포함하는 핵산-표적화 복합체를 형성하기에 충분한 핵산-표적화 시스템의 성분은, 핵산-표적화 서열의 성분을 인코딩하는 벡터를 이용한 형질감염에 의해서와 같이 해당하는 표적 서열을 갖는 숙주 세포로 제공될 수 있으며, 본 명세서에 기재된 바와 같은 Surveyor 분석에 의해서와 같이, 표적 서열 내 또는 그 부근에서의 우선적인 절단의 평가로 이어질 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열(또는 이의 부근의 서열)의 절단은 표적 서열, 즉 시험되는 가이드 서열 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 포함하는 핵산-표적화 복합체의 성분을 제공하고, 표적 서열에서 또는 이 부근에서의 시험 및 대조군 가이드 서열 반응 간의 결합 또는 절단 속도를 비교함으로써 시험관에서 평가될 수 있다. 다른 분석이 가능하며, 이는 당업자에게 일어날 것이다.
가이드 서열은 임의의 표적 서열을 표적화하도록 선택될 수 있다. 일부 구현예에서, 표적 서열은 유전자 전사물 또는 mRNA 내 서열이다.
일부 구현예에서, 표적 서열은 세포의 게놈 내 서열이다.
일부 구현예에서, 가이드 서열은 가이드 서열 내 2차 구조의 정도를 감소시키도록 선택된다. 2차 구조는 임의의 적합한 폴리뉴클레오티드 폴딩 알고리즘에 의해 결정될 수 있다. 일부 프로그램은 최소 깁스 자유 에너지 계산을 기반으로 한다. 이와 같은 한 알고리즘의 예는 mFold이며, 이는 문헌[Zuker and Stiegler, Nucleic Acids Res. 9(1981), 133-148]에 기재된 바와 같다. 또 다른 예의 폴딩 알고리즘은, 비엔나 대학의 이론 화학 연구소에서 개발된, 중심 구조 예측 알고리즘을 사용하는, 온라인 웹서버 RNAfold이다(예를 들어, 문헌[A.R. Gruber et al., 2008, Cell 106(1): 23-24]; 및 [PA Carr and GM Church, 2009, Nature Biotechnology 27(12): 1151-62] 참조). 추가의 알고리즘은 미국 출원 일련 번호 TBA(대리인 도켓 44790.11.2022; 브로드 레퍼런스 BI-2013/004A)에서 찾을 수 있으며; 이는 본 명세서에 참조로서 포함된다.
일부 구현예에서, 핵산-표적화 이펙터 단백질은 하나 이상의 이종성 단백질 도메인(예를 들어, 핵산-표적화 이펙터 단백질에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. 일부 구현예에서, CRISPR 이펙터 단백질/효소는 하나 이상의 이종성 단백질 도메인(예를 들어, CRISPR 효소에 추가적으로, 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개 이상 또는 이를 초과하는 도메인)을 포함하는 융합 단백질의 일부이다. CRISPR 이펙터 단백질/효소 융합 단백질은 임의의 추가의 단백질 서열 및 선택적으로 임의의 2 개 도메인 사이의 링커 서열을 포함할 수 있다. 이펙터 단백질에 융합될 수 있는 단백질 도메인의 예는 제한 없이, 에피토프 태그, 리포터 유전자 서열 및 하기의 활성 중 하나 이상을 갖는 단백질 도메인을 포함한다: 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, 및 핵산 결합 활성. 에피토프 태그의 비제한적인 예는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그를 포함한다. 리포터 유전자의 예는, 이로 한정되지 않지만, 글루타티온-S-트랜스퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함한다. 핵산-표적화 이펙터 단백질은 DNA 분자에 결합하거나, 이에 한정되지 않지만, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD) 융합물, GAL4 DNA 결합 도메인 융합물 및 단순 포진 바이러스(HSV) BP16 단백질 융합체물을 포함하는 다른 세포 분자에 결합하는 단백질 또는 단백질의 단편을 인코딩하는 유전자 서열에 융합될 수 있다. 핵산-표적화 이펙터 단백질을 포함하는 융합 단백질의 부분을 형성할 수 있는 추가의 도메인은 본 명세서에 참고 문헌으로 포함되는 US20110059502에 기재되어 있다. 일부 구현예에서, 태그가 부착된 핵산-표적화 이펙터 단백질을 사용하여 표적 서열의 위치를 확인한다.
일부 구현예에서, CRISPR 효소는 유도성 시스템의 성분을 형성할 수 있다. 이 시스템의 유도성 성질은 에너지 형태를 사용하여 유전자 편집이나 유전자 발현의 시공간적 제어를 가능하게 할 것이다. 에너지의 형태는 이에 한정되지 않이지만, 전자기 방사, 음향 에너지, 화학 에너지 및 열 에너지를 포함할 수 있다. 유도성 시스템의 예는 테트라사이클린 유도성 프로모터(Tet-온 또는 Tet-오프), 소분자 2-하이브리드 전사 활성화 시스템(FKBP, ABA 등), 또는 광 유도성 시스템(피토크롬, LOV 도메인, 또는 크립토크롬)을 포함한다. 일 구현예에서, CRISPR 효소는 서열-특이적 방식으로 전사 활성에서의 변화를 유도하기 위한 광 유도성 전사 이펙터(LITE)의 일부일 수 있다. 광의 성분은 CRISPR 효소, 광-반응성 시토크롬 이형이량체(예를 들어, 아라비돕시스 탈리아나 유래), 및 전사 활성화/억제 도메인을 포함할 수 있다. 유도성 DNA 결합 단백질 및 이의 사용을 위한 방법의 추가의 예는 US 61/736465 및 US 61/721,283 및 WO 2014/018423 및 US8889418, US8895308, US20140186919, US20140242700, US20140273234, US20140335620, WO2014093635에서 제공되며, 이는 전체가 참조로서 본 명세서에 포함된다.
일부 양태에서, 본 발명은 본 명세서에 기재된 바와 같은 하나 이상의 폴리뉴클레오티드, 하나 이상의 벡터, 하나 이상의 이의 전사물, 및/또는 이로부터의 하나 이상의 단백질을 숙주 세포에 전달하는 것을 포함하는 방법을 제공한다. 일부 양태에서, 본 발명은 이와 같은 방법에 의해 생산된 이와 같은 세포, 및 상기 세포를 포함하거나 상기 세포로부터 생산된 생물(예를 들어, 동물, 식물, 또는 균류)를 제공한다. 일부 구현예에서, 가이드 RNA와 조합된(및 선택적으로 이와 복합체화된) 핵산-표적화 이펙터 단백질은 세포로 전달된다. 통상의 바이러스 및 비-바이러스 기반 유전자 수송 방법이 포유류 세포 또는 표적 조직 내로 핵산을 도입시키는 데 사용될 수 있다. 이와 같은 방법은 핵산-표적화 시스템의 성분을 인코딩하는 핵산을 배양물, 또는 숙주 생물 내 세포로 투여하는 데 사용될 수 있다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, RNA(예를 들어, 본 명세서에 기재된 벡터의 전사물), 네이키드 핵산, 및 리포좀과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하며, 이는 세포로의 전달 후 에피솜 또는 통합된 게놈 중 하나를 갖는다. 유전자 치료법 절차의 검토에 대해서는, 문헌[Anderson, Science 256:808-813(1992)]; [Nabel & Felgner, TIBTECH 11:211-217(1993)]; [Mitani & Caskey, TIBTECH 11:162-166(1993)]; [Dillon, TIBTECH 11:167-175(1993)]; [Miller, Nature 357:455-460(1992)]; [Van Brunt, Biotechnology 6(10):1149-1154(1988)]; [Vigne, Restorative Neurology and Neuroscience 8:35-36(1995)]; [Kremer & Perricaudet, British Medical Bulletin 51(1):31-44(1995)]; [Haddada et al., in Current Topics in Microbiology and Immunology, Doerfler and Bohm(eds)(1995)]; 및 [Yu et al., Gene Therapy 1:13-26(1994)]을 참조한다.
핵산의 비-바이러스 전달 방법은 리포펙션, 뉴클레오펙션, 미세주입, 바이오리스틱스, 비로좀, 리포좀, 면역리포좀, 다가양이온 또는 지질:핵산 컨쥬게이트, 네이키드 DNA, 인공 비리온, 및 DNA의 제제-향상 흡수를 포함한다. 리포펙션은, 예를 들어 미국 특허 5,049,386, 4,946,787; 및 4,897,355에 기재되어 있으며, 리포펙션 시약은 상업적으로 판매된다(예를 들어, 형질감염am™ 및 Lipofectin™). 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 대해 적합한 양이온성 및 중성 지질은 Felgner의 WO 91/17424; WO 91/16024의 것을 포함한다. 전달은 세포(예를 들어, 시험관내 또는 생체외 투여) 또는 표적 조직(예를 들어, 생체내 투여)으로 이루어질 수 있다.
면역지질 복합체와 같은 표적화된 리포좀을 포함하는, 지질:핵산 복합체의 제조는 당업자에게 잘 알려져 있다(예를 들어, 문헌[Crystal, Science 270:404-410(1995)]; [Blaese et al., Cancer Gene Ther. 2:291-297(1995)]; [Behr et al., Bioconjugate Chem. 5:382-389(1994)]; [Remy et al., Bioconjugate Chem. 5:647-654(1994)]; [Gao et al., Gene Therapy 2:710-722(1995)]; [Ahmad et al., Cancer Res. 52:4817-4820(1992)]; 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787 참조).
핵산 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템의 사용은 바이러스를 체내 특정 세포로 표적화하고, 핵으로의 바이러스 페이로드(payload)를 수송하기 위한 매우 진화된 공정을 이용한다. 바이러스 벡터는 환자에게 직접(생체내) 투여될 수 있거나, 또는 이들은 시험관내에서 세포를 처리하는 데 사용될 수 있고, 변형된 세포는 환자에게 선택적으로 투여될 수 있다(생체외). 통상의 바이러스 기반 시스템은 유전자 운반을 위해 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 단순포진 바이러스 벡터를 포함할 수 있다. 숙주 게놈 내 통합은 레트로바이러스, 렌티바이러스, 및 아데노-관련 바이러스 유전자 운반 방법에서 가능하며, 이는 종종 삽입된 전이유전자의 장기간 발현을 초래한다. 추가적으로, 높은 형질도입 효능은 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 친화성은 외부 외피 단백질을 통합하여 변경될 수 있으며, 이는 표적 세포의 잠재적 표적 집단을 확장한다. 렌티바이러스 벡터는 비-분열 세포를 형질도입하거나 감염하고 통상적으로 높은 바이러스 역가를 생산할 수 있는 레트로바이러스 벡터이다. 그러므로, 레트로바이러스 유전자 이동 시스템의 선택은 표적 조직에 의존할 것이다. 레트로바이러스 벡터는 최대 6 kb 내지 10 kb까지의 외부 서열에 대한 패키징 능력을 갖는 cis-작용의 긴 말단 반복부로 구성된다. 최소한의 cis-작용 LTR은 벡터의 복제 및 패키징에 대하여 충분하며, 이들은 그 후 표적 세포 내로 치료적 유전자를 통합하는 데 사용되어 영구적인 전이유전자 발현을 제공한다. 널리 사용된 레트로바이러스 벡터는 뮤린 백혈병 바이러스(MuLV), 기본 유인원(gibbon ape) 백혈병 바이러스(GaLV), 원숭이 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 이들의 조합을 기반으로 한 벡터를 포함한다(예를 들어, 문헌[Buchscher et al., J. Virol. 66:2731-2739(1992)]; [Johann et al., J. Virol. 66:1635-1640(1992)]; [Sommnerfelt et al., Virol. 176:58-59(1990)]; [Wilson et al., J. Virol. 63:2374-2378(1989)]; [Miller et al., J. Virol. 65:2220-2224(1991)]; PCT/US94/05700 참조). 일시적인 발현이 바람직한 적용에서, 아데노바이러스 기반 시스템이 사용될 수 있다. 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가능하게 하며 세포 분열을 필요로 하지 않는다. 이와 같은 벡터로, 높은 역가 및 발현 수준이 수득되었다. 이 벡터는 상대적으로 간단한 시스템에서 다량으로 생산될 수 있다. 아데노-관련 바이러스("AAV") 벡터는 또한, 예를 들어 핵산 및 펩티드의 시험관내 생산에서, 그리고 생체내 및 생체외 유전자 치료법 과정을 위해 세포를 표적 핵산으로 세포 형질도입시키는 데 사용될 수 있다(예를 들어, 문헌[West et al., Virology 160:38-47(1987)]; 미국 특허 4,797,368; WO 93/24641; 문헌[Kotin, Human Gene Therapy 5:793-801(1994)]; [Muzyczka, J. Clin. Invest. 94:1351(1994)] 참조). 재조합 AAV 벡터의 구성은 미국 특허 5,173,414; 문헌[Tratschin et al., Mol. Cell. Biol. 5:3251-3260(1985)]; [Tratschin, et al., Mol. Cell. Biol. 4:2072-2081(1984)]; [Hermonat & Muzyczka, PNAS 81:6466-6470(1984)]; 및 [Samulski et al., J. Virol. 63:03822-3828(1989)]을 포함하여, 다수의 간행물에 기재되어 있다.
유전적 및 후성적 조건의 모델
본 발명의 방법은, 예를 들어 관심 돌연변이의 모델 또는 질병 모델을 통하여, 질병 모델로서 사용될 수 있는 식물, 동물 또는 세포를 형성하고/형성하거나 관심 유전적 또는 후성적 질환을 연구하는 데 사용될 수 있다. 본 명세서에서 사용된 바와 같이 "질병"은 대상체에서 질병, 장애 또는 징후를 지칭한다. 예를 들어, 본 발명의 방법은 질병과 연관된 하나 이상의 핵산 서열에서의 변형을 포함하는 동물 또는 세포, 또는 질병과 연관된 하나 이상의 핵산 서열의 발현이 변경된 식물, 동물 또는 세포를 만드는 데 사용될 수 있다. 그러한 핵산 서열은 질병 관련 단백질 서열을 인코딩할 수 있거나, 질병 관련 제어 서열일 수 있다. 이에 따라, 본 발명의 일 구현예에서, 식물, 대상체, 환자, 생물 또는 세포는 비-인간 대상, 환자, 생물 또는 세포일 수 있는 것으로 이해된다. 따라서, 본 발명은 본 발명에 의해 생산된, 식물, 동물 또는 세포, 또는 그의 자손을 제공한다. 그 자손은 생산된 식물 또는 동물의 클론일 수 있거나, 추가의 바람직한 특성을 그의 자손에게 유전자 이입(introgress)하기 위해 동일 종의 다른 개체와의 교잡에 의한 유성 생식으로부터의 것일 수 있다. 세포는 다세포 생물, 특히 동물 또는 식물의 경우 생체내 또는 생체외일 수 있다. 세포가 배양된 경우, 적절한 배양 조건이 맞추어지고 바람직하게는 세포가 이러한 목적을 위해 적합하게 조정되는 경우 세포주가 수립될 수 있다(예를 들어, 줄기 세포). 본 발명에 의해 생산된 박테리아 세포주가 또한 고려된다. 이에 따라, 세포주 또한 고려된다.
일부 방법에서, 질병 모델은 동물 또는 세포에서 돌연변이의 효과 및 질병 연구에서 흔히 사용되는 기준을 이용하여 질병의 발생 및/또는 진전을 연구하는 데 사용될 수 있다. 대안적으로, 그러한 질병 모델은 약학 활성 화합물의 질병에 대한 효과를 연구하는 데 유용하다.
일부 방법에서, 질병 모델은 잠재적인 유전자 치료 전략의 효능을 평가하는데 사용될 수 있다. 즉, 질병-관련 유전자 또는 폴리뉴클레오티드는 질병 발생 및/또는 진전이 저해 또는 감소되도록 변형될 수 있다. 특히, 방법은 변경된 단백질이 생산되고, 그 결과 동물 또는 세포가 변경된 반응을 갖도록 질병 관련 유전자 또는 폴리뉴클레오티드를 변형시키는 것을 포함한다. 따라서, 일부 방법에서, 유전학적으로 변형된 동물은, 유전자 치료법 이벤트의 효과가 평가될 수 있도록, 질병이 발생되기 쉬운 동물에 비교될 수 있다.
또 다른 구현예에서, 본 발명은, 질병 유전자와 연관된 세포 신호화 이벤트를 조절하는 생물학적 활성제의 개발 방법을 제공한다. 본 방법은 하나 이상의 CRISPR 효소, 및 가이드 서열에 연결된 직접 반복 서열의 발현을 유도하는 하나 이상의 벡터를 포함하는 세포와 시험 화합물을 접촉시키는 단계; 및 예를 들어 세포 내에 포함된 질병 유전자 내 돌연변이와 연관된 세포 신호화 이벤트의 감소 또는 증강을 나타내는 판독값에서의 변화를 검출하는 단계를 포함한다.
세포 모델 또는 동물 모델은 세포 작용 변화를 스크리닝하기 위한 본 발명의 방법과 조합되어 구축될 수 있다. 그러한 모델은 본 발명의 CRISPR 복합체에 의해 변형된 게놈 서열의 관심 세포 작용에 대한 효과를 연구하는 데 사용될 수 있다. 예를 들어, 세포 작용 모델은 변형된 게놈 서열의 세포내 신호화 또는 세포외 신호화에 대한 효과를 연구하는 데 사용될 수 있다. 대안적으로, 세포 작용 모델은 변형된 게놈 서열의 감각 인지에 대한 효과를 연구하는 데 사용될 수 있다. 그러한 일부 모델에서, 모델 내 신호화 생화학 경로와 연관된 하나 이상의 게놈 서열은 변형된다.
몇몇 질병 모델은 특히 연구되어 왔다. 이들은 새로운 자폐증 위험 유전자 CHD8, KATNAL2, 및 SCN2A; 및 증후군성 자폐증(엔젤만(Angelman) 증후군) 유전자 UBE3A를 포함한다. 이들 유전자 및 결과의 자폐증 모델은 물론 바람직하지만, 유전자 및 상응하는 모델에 걸친 본 발명의 광범위한 적용성을 나타내는 역할을 한다.
신호화 생화학 경로와 연관된 하나 이상의 게놈 서열의 변경된 발현은, 시험 모델 세포와 대조구 세포들이 후보물질과 접촉되는 경우, 시험 모델 세포와 대조구 세포들 간의 상응 유전자의 mRNA 수준에서의 차이에 대한 분석에 의해 결정될 수 있다. 대안적으로, 신호화 생화학 경로와 연관된 서열의 차등 발현은 인코딩된 폴리뉴클레오티드 또는 유전자 생성물의 수준에서의 차이를 검출함으로써 결정된다.
mRNA 전사물 또는 상응하는 폴리뉴클레오티드의 수준에서 약제-유도된 변경을 분석하기 위하여, 샘플 내 포함된 핵산을 먼저 해당 분야의 표준 방법에 따라 추출한다. 예를 들어, mRNA는 문헌 [Sambrook et al.(1989)]에 설명된 절차에 따라 각종 용균 효소 또는 화학 용액을 이용하여 분리될 수 있거나, 제조자에 의해 제공된 첨부 안내서에 따라 핵산-결합 수지에 의해 추출될 수 있다. 추출된 핵산 샘플 내에 포함된 mRNA는 이후 당 분야에서 공지된 방법 또는 본 명세서에서 예시된 방법에 기초한, 증폭 절차 또는 통상의 혼성화 분석(예를 들어, 노던 블롯 분석)에 의해 검출된다.
본 발명의 목적을 위하여, 증폭은 타당한 충실도로 표적 서열을 복제할 수 있는 폴리머라제 및 프라이머를 사용하는 임의의 방법을 의미한다. 증폭은 천연 또는 재조합 DNA 폴리머라제, 예를 들어, TaqGold™, T7 DNA 폴리머라제, 이.콜라이 DNA 폴리머라제의 클레나우 단편 및 역전사효소에 의해 수행될 수 있다. 바람직한 증폭 방법은 PCR이다. 특히, 분리된 RNA는 신호화 생화학 경로와 연관된 서열의 발현 수준을 정량화하기 위하여 정량적 폴리머라제 연쇄반응과 연결된 역전사 분석(RT-PCR) 처리될 수 있다.
유전자 발현의 검출은 증폭 분석에서 실시간으로 수행될 수 있다. 일 양태에서, 증폭된 생성물은 이에 한정되지 않지만 DNA 삽입제 및 DNA 홈 결합제를 포함하는 형광 DNA-결합제로 직접 시각화될 수 있다. 이중-가닥 DNA 분자 내로 혼입된 삽입제의 양은 통상적으로 증폭된 DNA 생성물의 양에 비례하기 때문에, 증폭된 생성물의 양은 해당 분야의 통상적인 광학 시스템을 이용하여 삽입된 염료의 형광을 정량화함으로써 편리하게 결정될 수 있다. 본 적용에 적합한 DNA-결합 염료는 SYBR 녹색, SYBR 청색, DAPI, 프리디늄 요오드, 회스트(Hoeste), SYBR 금색, 에티디윰 브로마이드, 아크리딘, 프로플라빈, 아크리딘 오렌지, 아크리플라빈, 플루오르쿠마린, 엘립티신, 다우노마이신, 클로로퀸, 디스타마이신 D, 크로모마이신, 호미디윰, 미트라마이신, 루테늄 폴리피리딜스, 안트라마이신 등을 포함한다.
또 다른 양태에서, 서열 특이적 프로브와 같은 기타 형광 표지는, 증폭된 생성물의 검출 및 정량화를 촉진하기 위하여 증폭 반응에서 사용될 수 있다. 프로브-기준 정량적 증폭은 원하는 증폭 생성물의 서열-특이적 검출에 의존한다. 이는 형광, 표적-특이적 프로브(예를 들어, TaqMan® 프로브)를 이용하여, 그 결과 특이성 및 감도를 증가시킨다. 프로브-기준 정량적 증폭의 수행 방법은 당 기술 분야에서 잘 확립되어 있으며, 미국 특허 제5,210,015 호에 교시되어 있다.
그러나 또 다른 양태에서, 신호화 생화학 경로와 연관된 서열과 상동성을 공유하는 혼성화 프로브를 이용하는 통상의 혼성화 분석이 수행될 수 있다. 전형적으로, 프로브는, 혼성화 반응에서 시험 대상체로부터 유래된 생물학적 샘플 내에 포함된 신호화 생화학 경로와 연관된 서열과 안정한 복합체를 형성하는 것을 가능하게 한다. 안티센스가 프로브 핵산으로서 사용된 경우, 샘플 내에 제공된 표적 폴리뉴클레오티드는 그 안티센스 핵산의 서열에 상보적이도록 선택됨을 해당 분야의 숙련자는 이해할 것이다. 역으로, 뉴클레오티드 프로브가 센스 핵산인 경우, 표적 폴리뉴클레오티드는 센스 핵산의 서열에 상보적이도록 선택된다.
혼성화는 각종 엄격성 조건 하에서 수행될 수 있다. 본 발명의 실시에 적합한 혼성화 조건은 프로브와 신호화 생화학 경로와 연관된 서열 간의 인식 상호작용이 충분히 특이적이고 충분히 안정적이도록 하는 것이다. 혼성화 반응의 엄격성을 증가시키는 조건은 해당 기술 분야에서 공지 및 공개되어 있다. 예를 들어, 문헌[(Sambrook, et al.,(1989); Nonradioactive In Situ Hybridization Application Manual, Boehringer Mannheim, second edition)] 참조. 혼성화 분석은, 이에 한정되지 않지만 니트로셀룰로스, 유리, 규소, 및 각종 유전자 어레이를 포함하는 임의의 고체 기재 상에 고정화된 프로브를 이용하여 형성될 수 있다. 바람직한 혼성화 분석은 미국 특허 5,445,934에 기재된 바와 같은 고밀도 유전자 칩 상에서 수행된다.
혼성화 분석 동안 형성된 프로브-표적 복합체의 편리한 검출을 위하여, 뉴클레오티드 프로브는 검출 가능한 표지에 컨쥬게이트된다. 본 발명에서의 이용에 적합한 검출 가능한 표지는 광화학, 생화학, 분광학 면역 화학, 전기, 광학 또는 화학적 수단에 의해 검출 가능한 임의의 조성물을 포함한다. 광범위한 종류의 적절한 검출 가능한 표지는 해당 분야에서 알려져 있으며, 이는 형광 또는 화학발광 표지, 방사성 동위원소 표지, 효소 또는 기타 리간드를 포함한다. 바람직한 구현예에서, 형광 표지 또는 효소 태그, 예를 들어 디곡시제닌, β-갈락토시다제, 우레아제, 알칼리성 포스파타제 또는 퍼옥시다제, 아비딘/바이오틴 복합체가 바람직하게 사용될 것이다.
혼성화 또는 강도를 검출 또는 정량화하는 데 사용되는 검출 방법은 통상적으로 상기 선택된 표지에 따라 달라질 것이다. 예를 들어, 방사성표지는 사진 필름 또는 포스포이미저(phosphoimager)를 이용하여 검출될 수 있다. 형광 마커는 방출된 광을 검출하기 위한 광검출기를 이용하여 검출 및 정량화될 수 있다. 효소 표지는 통상적으로 효소에 기재를 제공하고, 효소의 작용에 의해 기재 상에 생성된 반응 생산물을 측정하여 검출되고; 최종적으로 비색성 표지는 착색된 표지를 단순히 시각화함으로써 검출된다.
신호화 생화학 경로와 연관된 서열의 발현에서의 약제-유도된 변화는 상응하는 유전자 생성물을 검사함으로써 결정될 수도 있다. 단백질 수준의 결정은 통상적으로, a) 생물학적 샘플 내에 포함된 단백질을, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제와 접촉시키는 단계; 및 b) 그렇게 형성된 어떤 약제:단백질 복합체를 확인하는 확인하는 단계를 포함한다. 이러한 구현예의 일 양태에서, 신호화 생화학 경로와 연관된 단백질에 특이적으로 결합하는 약제는 항체, 바람직하게는 단일클론성 항체이다.
반응은 그 약제를, 시험 샘플로부터 유래된 신호화 생화학 경로와 연관된 단백질의 샘플과, 그 약제와 신호화 생화학 경로와 연관된 단백질간에 복합체가 형성되는 것을 가능하게 하는 조건 하에서 접촉시킴으로써 수행된다. 복합체의 형성은 해당 기술 분야의 표준 절차에 따라 직접적으로 또는 간접적으로 검출될 수 있다. 직접 검출 방법에서, 약제에는 검출 가능한 표지가 공급되고, 미반응된 약제는 복합체로부터 제거될 수 있으며; 따라서 남아있는 표지의 양은 형성된 복합체의 양을 나타낸다. 그러한 방법의 경우, 엄격한 세척 조건 동안에도 약제에 부착된 채로 잔류하는 표지를 선택하는 것이 바람직하다. 표지는 결합 반응을 간섭하지 않는 것이 바람직하다. 대안에서, 간접적 검출 절차는, 화학적으로 또는 효소적으로 도입된 표지를 함유하는 약제를 사용할 수 있다. 바람직한 표지는 일반적으로 결합 또는 그 결과의 약제:폴리펩티드 복합체의 안정성을 간섭하지 않는다. 그러나, 표지는 전형적으로 효과적인 결합 및 그에 따라 검출 가능한 신호를 생성하기 위하여 항체에 접근 가능하도록 설계된다.
단백질 수준을 검출하는 데 적합한 광범위한 각종 표지는 당 기술 분야에서 알려져 있다. 비제한적인 예로는 방사성동위원소, 효소, 콜로이드성 금속, 형광 화합물, 생물발광 화합물, 및 화학발광 화합물이 포함된다.
결합 반응 동안 형성된 약제:폴리펩티드 복합체의 양은 표준 정량 분석에 의해 정량화될 수 있다. 상기 예시된 바와 같이, 약제:폴리펩티드 복합체의 형성은 결합 부위에서 유지된 표지의 양에 의해 직접적으로 측정될 수 있다. 대안에서, 신호화 생화학 경로와 연관된 단백질은, 특정 약제 상의 결합 부위에 대해 표지된 유사체와 경쟁하는 그의 능력에 대해 시험된다. 이러한 경쟁적 분석에서, 포착된 표지의 양은 시험 샘플에 존재하는 신호화 생화학 경로와 연관된 단백질 서열의 양에 역비례한다.
상기 개괄된 일반 원칙을 기준으로 한 다수의 단백질 분석 기술은 해당 기술분야에서 이용 가능하다. 그들은 이에 한정되지 않지만, 방사성면역분석, ELISA(효소 결합 면역흡착 분석), "샌드위치" 면역분석, 면역방사계 분석, 제위치 면역분석(예를 들어, 콜로이드성 금, 효소 또는 방사성동위원소 표지를 이용), 웨스턴 블롯 분석, 면역침강 분석, 면역형광 분석, 및 SDS-PAGE를 포함한다.
신호화 생화학 경로와 연관된 단백질을 특이적으로 인식 또는 결합하는 항체는 상기 언급된 단백질 분석을 수행하는 것이 바람직하다. 바람직한 경우, 번역후 변형의 특이적 유형(예를 들어, 신호화 생물학 경로 유도성 변형)을 인식하는 항체가 사용될 수 있다. 번역후 변형은 이에 한정되지 않지만, 글리코실화, 지질화, 아세틸화 및 인산화를 포함한다. 이들 항체는 판매업체로부터 구매할 수 있다. 예를 들어, 티로신-포스포릴화 단백질을 특이적으로 인식하는 항-포스포티로신 항체가 Invitrogen 및 Perkin Elmer를 포함하는 다수의 판매사로부터 입수 가능하다. 항 포스포티로신 항체는, 특히 ER 스트레스에 반응하여 그의 티로신 잔기 상에서 별도로 포스포릴화된 단백질을 검출하는 데 있어서 특히 이용 가능하다. 그러한 단백질은 이에 한정되지 않지만, 진핵성 번역 개시 인자 2 알파(eIF-2α)가 포함된다. 대안적으로, 이들 항체는 통상의 다클론성 또는 단일클론성 항체 기술을 이용하여, 숙주 동물 또는 항체-생산 세포를 바람직한 번역후 변형을 나타내는 표적 단백질로 면역화함으로써 생성될 수 있다.
본 방법을 실시하는 데 있어서, 상이한 신체 조직에서, 상이한 세포 유형에서, 및/또는 상이한 하위세포 작제물에서 신호화 생화학 경로와 연관된 단백질의 발현 패턴을 식별하는 것이 바람직할 수 있다. 이들 연구는, 특정 조직, 세포 유형 또는 하위 구조 내에서 우선적으로 발현되는 단백질 마커에 결합할 수 있는 조직-특이적, 세포-특이적 또는 하위세포 구조 특이적 항체를 이용하여 수행될 수 있다.
신호화 생화학 경로와 연관된 유전자의 변경된 발현은 또한 제어 세포에 대하여 유전자 생성물의 활성에서의 변화를 시험함으로써 결정될 수 있다. 신호화 생화학 경로와 연관된 단백질의 활성에서의 약제-유도된 변화에 대한 분석은, 연구 중에 있는 생물학적 활성 및/또는 신호 형질도입 경로에 의존할 것이다. 예를 들어, 단백질이 키나아제인 경우, 다운스트림 기재(들)를 포스포릴화하는 그의 능력에서의 변화는 해당 기술에서 알려진 각종 분석에 의해 결정될 수 있다. 대표적인 분석으로는 이에 한정되지 않이지만, 포스포릴화 단백질을 인식하는 포스포릴화 항-포스포티로신 항체와 같은 항체를 이용하는 면역블롯팅 및 면역침강이 포함된다. 추가적으로, 키나아제 활성은, AlphaScreen™(Perkin Elmer로부터 입수 가능) 및 eTag™ 분석(문헌[Chan-Hui, et al.(2003) Clinical Immunology 111: 162-174])와 같은 고처리량(high throughput) 화학발광 분석에 의해 검출될 수 있다.
신호화 생화학 경로와 연관된 단백질이 세포 내 pH 조건의 동요를 일으키는 신호화 캐스케이드(cascade) 반응의 일부인 경우, 형광 pH 염료와 같은 pH 민감성 분자가 리포터 분자로서 사용될 수 있다. 또 다른 예에서, 신호화 생화학 경로와 연관된 단백질이 이온 채널인 경우, 막 전위 및/또는 세포내 이온 농도에서의 동요는 모니터링될 수 있다. 다수의 상용 키트 및 고속 처리 장치는 이온 채널의 조절제에 대한 신속하고 강건한 스크리닝에 특히 적합하다. 대표적인 기기로는 FLIPRTM(Molecular Devices, Inc.) 및 VIPR(Aurora Biosciences)가 포함된다. 이들 기기는 마이크로플레이트의 1000 개가 넘는 샘플 웰 내 반응들을 검출할 수 있고, 1 초 또는 심지어 밀리 초(minisecond) 내의 실시간 측정 및 작용 데이터를 제공할 수 있다.
본 명세서에 개시된 임의의 방법의 실시에 있어서, 적합한 벡터가, 이에 한정되지 않지만, 미세주입, 전기천공, 소노포레이션(sonoporation), 바이오리스틱스, 칼슘 포스페이트-매개 트랜스펙션, 양이온 트랜스펙션, 리포좀 트랜스펙션, 덴드리머 트랜스펙션, 열 충격 트랜스펙션, 뉴클레오펙션 트랜스펙션, 마그네토펙션, 리포펙션, 임페일펙션, 광학 트랜스펙션, 핵산의 전용 제제-증진 흡수, 및 리포좀, 면역리포좀, 비로좀 또는 인공 비리온을 통한 전달을 포함하는 해당 분야에 알려진 하나 이상의 방법을 통해서 세포 또는 배아에 도입될 수 있다. 일부 방법에서, 벡터는 미세주입에 의해 배아 내로 도입된다. 벡터 또는 벡터들은 핵 내로 또는 배아의 세포질 내로 미세주입될 수 있다. 일부 방법에서, 벡터 또는 벡터들은 뉴클레오펙션(nucleofection)에 의해 세포 내로 도입될 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내생 또는 외인성 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물을 코딩하는 서열(예를 들어, 단백질) 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다.
표적 폴리뉴클레오티드의 예는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로와 연관된 서열, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드를 포함한다. 표적 폴리뉴클레오티드의 예는 질병 관련 유전자 또는 폴리뉴클레오티드를 포함한다. "질병-관련된" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조군의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전과 상관관계가 있다. 질병-관련 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)와의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전 변이를 지칭한다. 전사된 또는 번역된 생성물은 공지되거나 공지되지 않은 것일 수 있으며, 정상 또는 비정상 수준일 수 있다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 진핵 세포에 대해 내인성 또는 외인성인 임의의 폴리뉴클레오티드일 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 진핵 세포의 핵 내에 존재하는 폴리뉴클레오티드일 수 있다. 표적 폴리뉴클레오티드는 유전자 생성물(예를 들어, 단백질)을 코딩하는 서열 또는 비-코딩 서열(예를 들어, 조절 폴리뉴클레오티드 또는 정크 DNA)일 수 있다. 이론에 의해 구애되고자 하지 않지만, 표적 서열은 PAM(프로토스페이서 인접 모티프)와 연관되어야 하는 것으로 여겨지며; 이는 CRISPR 복합체에 의해 인식된 짧은 서열이다. PAM에 대한 정확한 서열 및 길이 요구사항은 사용된 CRISPR 효소에 따라 다르지만, PAM은 프로토스페이서(즉, 표적 서열)에 인접한 통상적으로 2 내지 5 개의 염기쌍 서열이다. PAM 서열의 예는 하기 예의 섹션에서 제공되며, 숙련자는 주어진 CRISPR 효소와의 이용을 위한 추가의 PAM 서열을 확인할 수 있을 것이다.
CRISPR 복합체의 표적 폴리뉴클레오티드는 다수의 질병-관련 유전자 및 폴리뉴클레오티드뿐만 아니라, 신호화 생화학 경로-관련 유전자 및 폴리뉴클레오티드를 포함할 수 있으며, 이는 각각 "SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION"라는 명칭으로 2012년 12월 12일 및 2013년 1월 2일에 출원된 미국 임시 출원 61/736,527 및 61/748,427, 및 "DELIVERY, ENGINEERING AND OPTIMIZATION OF SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS"라는 명칭으로 2013년 12월 12일에 출원된 PCT 출원 PCT/US2013/074667에 열거된 바와 같으며, 이들의 모든 내용은 본 명세서에 전체가 참조로서 포함된이다.
표적 폴리뉴클레오티드의 예로는 신호화 생화학 경로, 예를 들어 신호화 생화학 경로-연관 유전자 또는 폴리뉴클레오티드와 연관된 서열을 포함한다. 표적 폴리뉴클레오티드의 예로는 질병 관련 유전자 또는 폴리뉴클레오티드가 포함된다. "질병-관련" 유전자 또는 폴리뉴클레오티드는, 비-질병 대조구의 조직 또는 세포에 비하여 질병-발생된 조직으로부터 유도된 세포에서의 비정상 수준 또는 비정상 형태의 전사 또는 번역 생성물을 산출하는 임의의 유전자 또는 폴리뉴클레오티드를 지칭한다. 이는 비정상적으로 높은 수준으로 발현된 유전자일 수 있고; 비정상적으로 낮은 수준으로 발현되는 유전자일 수 있으며, 여기서 변경된 발현은 질병의 발생 및/또는 진전에 상관한다. 질병-관련 유전자는 또한, 질병의 병인론에 책임이 있는 유전자(들)과의 연결 불균형 상태 또는 직접적으로 책임이 있는 유전자 가공 돌연변이(들) 또는 유전적 변이를 또한 지칭한다. 전사된 또는 번역된 생성물은 기지 또는 미지일 수 있으며, 정상 또는 비정상 수준일 수 있다.
트랜스크립톰 전체에 걸친 녹-다운 스크리닝
본 명세서에 설명된 CRISPR 이펙터 단백질 복합체는 효율적이며 비용효과적인 기능성 트랜스크립톰 스크리닝을 수행하는 데 사용될 수 있다. 그러한 스크리닝은 CRISPR 이펙터 단백질 기반 트랜스크립톰 전체에 걸친 라이브러리를 이용할 수 있다. 그러한 스크리닝 및 라이브러리는 유전자의 작용을 결정하는 데 제공될 수 있고, 세포 경로 유전자가 관련되고, 유전자 발현에서 임의의 변경은 어떠하게 특정 생물학적 공정을 결과로서 초래할 수 있다. 본 발명의 장점은 CRISPR 시스템이 표적외 결합 및 그 결과로 인한 부작용을 회피한다는 것이다. 이는 표적 DNA에 대한 고도의 서열 특이성을 갖도록 배열된 시스템을 이용하여 달성된다. 본 발명의 바람직한 구현예에서, CRISPR 이펙터 단백질 복합체는 C2c2 이펙터 단백질 복합체이다.
본 발명의 구현예에서, 트랜스크립톰 전체에 걸친 라이브러리는 본 명세서에서 설명된 바와 같이, 복수의 C2c2 가이드 RNA를 포함할 수 있으며, 이는 진핵 세포의 집단 내 복수의 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함한다. 세포의 집단은 배아 줄기(ES) 세포의 집단일 수 있다. 유전자좌 내 표적 서열은 비코딩 서열일 수 있다. 비코딩 서열은 인트론, 조절 서열, 스플라이스 부위, 3' UTR, 5' UTR, 또는 폴리아데닐화 신호일 수 있다. 하나 이상의 유전자 생성물의 유전자 기능은 상기 표적화에 의해 변경될 수 있다. 표적화는 유전자 기능의 녹아웃을 결과로서 초래할 수 있다. 유전자 생성물의 표적화는 하나 초과의 가이드 RNA를 포함할 수 있다. 유전자 생성물은 유전자 당, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 가이드 RNA, 바람직하게는 3 내지 4 개의 가이드 RNA에 의해 표적될 수 있다. 표적외 변형은 C2c2 이펙터 단백질 복합체에 의해 생성된 엇갈린 이중 가닥 손상을 이용함으로써 또는 CRISPR-Cas9 시스템에서 사용된 것과 유사한 방법을 이용함으로써 최소화될 수 있다(예를 들어, 본 명세서에 참조로 포함된 문헌[DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647(2013)] 참조). 표적화는 약 100 개 이상의 서열일 수 있다. 표적화는 약 1000 개 이상의 서열일 수 있다. 표적화는 약 20,000 개 이상의 서열일 수 있다. 표적화는 전체 게놈일 수 있다. 표적화는 관련 또는 바람직한 경로에 집중된 일단의 표적 서열들일 수 있다. 경로는 면역 경로일 수 있다. 경로는 세포 분열 경로일 수 있다.
본 발명이 일 양태는 복수의 유전자좌에서 복수의 표적 서열을 표적화할 수 있는 가이드 서열을 포함할 수 있는 복수의 C2c2 가이드 RNA를 포함할 수 있는 트랜스크립톰 전체에 걸친 라이브러리를 포함하며, 여기서 상기 표적화는 유전자 기능의 녹다운을 결과로서 초래한다. 이러한 라이브러리는 생물의 게놈 내 각각 및 모든 유전자를 표적화하는 가이드 RNA를 잠재적으로 포함할 수 있다.
본 발명의 일부 구현예예서, 생물 또는 대상체는 진핵 생물(인간을 포함하는 포유류 포함) 또는 비-인간 진핵 생물 또는 비-인간 동물 또는 비-인간 포유류다. 일부 구현예에서, 생물 또는 대상체는 비-인간 동물이며, 예를 들어 곤충과 같은 절지 동물일 수 있거나, 선충일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 식물이다. 본 발명의 일부 방법에서, 생물 또는 대상체는 포유류 또는 비-인간 포유류다. 비-인간 포유류는, 예를 들어 설치류(바람직하게는 마우스), 유제류, 또는 영장류일 수 있다. 본 발명의 일부 방법에서, 생물 또는 대상체는 미세조류를 포함하는 조류, 또는 균류이다.
유전자 기능의 녹다운은: I. C2c2 이펙터 단백질, 및 II. 하나 이상의 가이드 RNA를 포함하는 조작된, 비-천연 발생 C2c2 이펙터 단백질 시스템을 포함하는 하나 이상의 벡터의 벡터 시스템을, 세포 집단 내 각각의 세포로 도입시키는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터일 수 있는 단계, 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 성분 I 및 성분 II는 시스템의 동일하거나 상이한 벡터인 단계; 성분 I 및 II를 각각의 세포로 통합하는 단계로서, 여기서 가이드 서열은 각각의 세포 내 독특한 유전자를 표적화하고, 여기서 C2c2 이펙터 단백질은 조절 요소에 작동 가능하게 연결되고, 전사된 경우, 가이드 서열을 포함하는 가이드 RNA가 C2c2 이펙터 단백질 시스템의 독특한 유전자의 게놈 유전자좌 내의 표적 서열로의 서열-특이적 결합을 유도하는 단계; C2c2 이펙터 단백질에 의해 게놈 유전자좌의 절단을 유도하는 단계; 및 세포 집단의 각각의 세포에서 다수의 독특한 유전자에서 상이한 녹다운 이벤트를 확인하여, 이에 의해 유전자 녹다운 세포 라이브러리를 생성하는 단계를 포함할 수 있다. 본 발명은 세포 집단이 진핵 세포의 집단인 것을 포함하며, 바람직한 구현예에서, 세포들의 집단은 배아 줄기(ES) 세포의 집단이다.
하나 이상의 벡터는 플라스미드 벡터이다. 벡터는 C2c2 이펙터 단백질, sgRNA, 및 선택적으로 표적 서열 내로의 선택 마커를 포함하는 단일 벡터일 수 있다. 이론에 구애되지는 않지만, 단일 벡터를 통하여 C2c2 이펙터 단백질 및 sgRNA를 동시에 전달하는 능력은, C2c2 이펙터 단백질을 발현하는 세포주를 먼저 생성할 필요 없이, 임의의 관심 세포 유형에의 적용을 가능하게 한다. 조절 요소는 유도성 프로모터일 수 있다. 유도성 프로모터는 독시사이클린 유도성 프로모터일 수 있다. 본 발명의 일부 방법에서, 가이드 서열의 발현은 T7 프로모터의 제어 하에 있으며, T7 폴리머라제의 발현에 의해 유도된다. 상이한 녹다운 이벤트의 확인은 전체 트랜스크립톰 시퀀싱에 의할 수 있다. 녹다운 이벤트는 100 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 1000 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 20,000 개 이상의 독특한 유전자에서 달성될 수 있다. 녹다운 이벤트는 전체 트랜스크립톰에서 달성될 수 있다. 유전자 기능의 녹다운은 특정 생리학적 경로 또는 조건에서 작용하는 복수의 독특한 유전자에서 달성될 수 있다. 경로 또는 조건은 면역 경로 또는 조건일 수 있다. 경로 또는 조건은 세포 분열 경로 또는 조건일 수 있다.
본 발명은 본 명세서에서 언급된 트랜스크립톰 전체에 걸친 라이브러리를 포함하는 키트를 또한 제공한다. 키트는 본 발명의 라이브러리를 포함하는 벡터 또는 플라스미드를 포함하는 단일 용기를 포함할 수 있다. 키트는 또한 본 발명의 라이브러리로부터의 가이드 서열을 포함하는 독특한 C2c2 이펙터 단백질 시스템 가이드 RNA의 선택을 포함하는 패널을 포함할 수 있으며, 여기서 선택은 특정 생리학적 조건을 나타낸다. 본 발명은, 표적화가 약 100 개 이상의 서열, 약 1000 개 이상의 서열 또는 약 20,000 개 이상의 서열 또는 전체 트랜스크립톰인 것을 포함한다. 추가로, 일단의 표적 서열은, 면역 경로 또는 세포 분열과 같은 관련 또는 바람직한 경로에 집중될 수 있다.
본 발명의 추가의 양태에서, C2c2 이펙터 단백질은 하나 이상의 돌연변이를 포함할 수 있고, 기능성 도메인에 대한 융합 또는 융합 없이 일반적인 RNA 결합 단백질로서 사용될 수 있다. 돌연변이는 인공적으로 도입된 돌연변이 또는 기능 획득 돌연변이 또는 기능 손실 돌연변이일 수 있다. 돌연변이가 본 명세서에 기재된 바와 같이 특징화된다. 본 발명의 일 양태에서, 기능성 도메인은 VP64일 수 있는 전사 활성화 도메인일 수 있다. 본 발명의 일 양태에서, 기능성 도메인은 KRAB 또는 SID4X일 수 있는 전사 억제제 도메인일 수 있다. 다른 양태에서, 본 발명은 이에 한정되지 않지만, 전사 활성화제, 억제제, 재조합효소, 트랜스포사제, 히스톤 림델러, 데메틸라제, DNA 메틸트랜스퍼라제, 크립토크롬, 광 유도성/제어성 도메인 또는 화학적으로 유도성/제어성 도메인을 포함하는 도메인에 융합되는 돌연변이된 C2c2 이펙터 단백질 효소에 관한 것이다. 본 발명의 일부 방법은 표적된 유전자의 발현의 유도를 포함할 수 있다. 일 구현예에서, 진핵 세포의 집단에서 복수의 게놈 유전자좌의 복수의 표적 서열을 표적화함에 의한 발현 유도는 기능성 도메인의 이용에 의한다.
C2c2 3이펙터 단백질 복합체를 이용하는 본 발명의 실시에서 CRISPR-Cas9 시스템에 사용되는 방법이 유용하며, 하기가 참고된다:
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12.(2013). [Epub ahead of print]; Published in final edited form as: Science. 2014 Jan 3; 343(6166): 84-87.
Shalem 외는 게놈-전체에 걸친 규모에서 유전자 기능을 질의하기 위한 새로운 방식을 이용한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 녹아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서 세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나아제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
미국 특허 공개 번호 US20140357530; 및 PCT 특허 공보 WO2014093701을 참조하며, 이들은 본 명세서에 참고문헌으로 통합된다.
기능성 변경 및 스크리닝
또 다른 양태에서, 본 발명은 유전자의 기능성 평가 및 스크리닝 방법을 제공한다. 기능성 도메인을 정확하게 전달하거나, 유전자를 활성화 또는 억제하거나 관심 특정 유전자좌 상에서 메틸화 부위를 정확하게 변경시킴으로써 후성적 상태를 변경시키기 위한 본 발명의 CRISPR 시스템의 사용은, 생체외 또는 생체내에서 복수의 가이드 RNA(sgRNA)를 포함하는 라이브러리의 투여 또는 발현을 포함하는 세포의 풀(pool) 중 게놈에 적용되는 라이브러리와 함께이거나 단일 세포 또는 세포 집단에 적용되는 하나 이상의 가이드 RNA와 함께일 수 있으며, 여기서 스크리닝은 C2c2 이펙터 단백질의 사용을 추가로 포함하고, C2c2 이펙터 단백질을 포함하는 CRISPR 복합체는 변형되어 이종 기능성 도메인을 포함한다. 일 양태에서, 본 발명은 숙주로의 투여 또는 라이브러리의 숙주에서의 생체내 발현을 포함하는 게놈/트랜스크립톰의 스크리닝 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같이, 숙주로 투여되거나 숙주 내에서 발현되는 활성화제를 추가로 포함하는 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 C2c2 이펙터 단백질에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 C2c2 이펙터 단백질의 N 말단 또는 C 말단에 부착된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 활성화제는 sgRNA 루프에 부착된다. 일 양태에서, 본 발명은 숙주에 투여되거나 숙주에서 발현되는 억제제를 추가로 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공한다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 스크리닝은 유전자좌에서의 유전자 활성화, 유전자 억제, 또는 절단에 영향을 미치거나 검출하는 것을 포함한다.
일 양태에서, 본 발명은 효율적인 표적상 활성을 제공하고, 표적외 활성은 최소화한다. 일 양태에서, 본 발명은 C2c2 이펙터 단백질에 의한 효율적인 표적상 절단을 제공하고, C2c2 이펙터 단백질에 의한 표적외 절단은 최소화한다. 일 양태에서, 본 발명은 DNA 절단 없이, 유전자좌에서의 C2c2 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 표적-특이적 유전자 조절을 제공한다. 일 양태에서, 본 발명은 DNA 절단 없이 유전자좌에서 C2c2 이펙터 단백질의 가이드 특이적 결합을 제공한다. 따라서, 일 양태에서, 본 발명은 단일 C2c2 이펙터 단백질을 사용하여 하나의 유전자좌에서의 절단 및 상이한 유전자좌에서의 유전자 조절을 제공한다. 일 양태에서, 본 발명은 하나 이상의 C2c2 이펙터 단백질 및/또는 효소를 사용하여 다수의 표적의 직교(orthogonal) 활성화 및/또는 억제 및/또는 절단을 제공한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 진핵 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 포유류 세포이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 숙주는 비-인간 진핵 생물이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 비-인간 진핵 생물은 비-인간 포유동물이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 비-인간 포유동물은 마우스이다. 일 양태에서, 본 발명은 C2c2 이펙터 단백질 복합체 또는 이의 성분(들) 또는 이에 대해 코딩하는 핵산 분자(들)의 전달을 포함하는, 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내에서 발현된다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 생체내 발현은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다. 일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 방법을 제공하며, 여기서 전달은 입자, 나노입자, 지질 또는 세포 투과 펩티드(CPP)를 통한 것이다.
일 양태에서, 본 발명은 C2c2 이펙터 단백질을 포함하는 CRISPR 복합체의 쌍을 제공하며, 이들 각각은 세포에서 관심 게놈 유전자좌에서 표적 서열에 혼성화할 수 있는 가이드 서열을 포함하는 가이드 RNA(sgRNA)를 포함하며, 여기서 각 sgRNA의 적어도 하나의 루프는 하나 이상의 어댑터 단백질에 결합하는 별개의 RNA 서열(들)의 삽입에 의해 변형되고, 여기서 어댑터 단백질은 하나 이상의 기능성 도메인과 회합되고, 여기서 각각의 C2c2 이펙터 단백질 복합체의 각각의 sgRNA는 DNA 절단 활성을 갖는 기능성 도메인을 포함한다.
일 양태에서, 본 발명은 C2c2 이펙터 단백질 복합체의 세포 또는 이의 성분(들) 또는 이를 코딩하는 핵산 분자(들)로의 전달을 포함하는, 관심 유전자좌에서 표적 서열을 절단하는 방법을 제공하며, 여기서 상기 핵산 분자(들)는 조절 서열(들)에 작동 가능하게 연결되고 생체내 발현된다. 일 양태에서, 본 발명은 상기 논의된 바와 같은 방법을 제공하고, 여기서 전달은 렌티바이러스, 아데노바이러스, 또는 AAV를 통한 것이다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 라이브러리, 방법 또는 복합체를 제공하며, 여기서 sgRNA는 적어도 하나의 비-코딩 기능성 루프를 갖도록 변형되고, 예를 들어 여기서 적어도 하나의 비-코딩 기능성 루프는 반복적이고; 예를 들어 여기서 적어도 하나의 비-코딩 기능성 루프는 Alu를 포함한다.
일 양태에서, 본 발명은 유전자 생성물의 발현을 변경 또는 변형하는 방법을 제공한다. 상기 방법은 유전자 생성물을 인코딩하는 DNA 분자를 함유 및 발현하는 세포 내로 C2c2 이펙터 단백질 및 그 RNA 분자를 표적화하는 가이드 RNA를 포함하는 조작된 비-천연 발생 CRISPR 시스템을 도입시키는 것을 포함할 수 있으며, 이로 인해 가이드 RNA는 유전자 생성물을 인코딩하는 RNA 표적 분자를 표적화하고, C2c2 이펙터 단백질은 유전자 생성물을 인코딩하는 RNA 분자를 절단하고, 이로 인해 유전자 생성물의 발현이 변경되고; 여기서 C2c2 이펙터 단백질 및 가이드 RNA는 함께 자연적으로 발생하지 않는다. 본 발명은 직접 반복 서열에 연결된 가이드 서열을 포함하는 가이드 RNA를 포괄한다. 본 발명은 진핵 세포에서 발현에 대해 최적화된 코돈인 C2c2 이펙터 단백질을 추가로 포괄한다. 바람직한 구현예에서, 진핵 세포는 포유류 세포이고, 더 바람직한 구현예에서 포유류 세포는 인간 세포이다. 본 발명의 추가 구현예에서, 유전자 생성물의 발현은 감소된다.
일부 구현예에서, 하나 이상의 기능성 도메인은 C2c2 이펙터 단백질과 연관된다. 일부 구현예에서, 예를 들어, 문헌 [Konnerman et al.(Nature 517, 583-588, 29 January 2015)]의 변형된 가이드와 함께 사용된 바와 같이, 하나 이상의 기능성 도메인은 어댑터 단백질과 연관된다. 일부 구현예에서, 하나 이상의 기능성 도메인은 데드 sgRNA(dRNA)와 연관된다. 일부 구현예에서, 활성 C2c2 이펙터 단백질과의 dRNA 복합체는 유전자좌 상에서 기능성 도메인에 의한 유전자 조절을 유도하는 한편, sgRNA는 또 다른 유전자좌에서 활성 C2c2 이펙터 단백질에 의한 DNA 절단을 유도하며, 예를 들어, 이는 문헌[Dahlman et al., 'Orthogonal gene control with a catalytically active Cas9 nuclease' Nature Biotechnology 33, p. 1159-61(November, 2015)]에 의한 CRISPR-Cas9 시스템에서 유사하게 기재된 바와 같다. 일부 구현예에서, dRNA는 표적외 조절에 비하여 관심 유전자좌에 대한 조절의 선택성을 최대화하도록 선택된다. 일부 구현예에서, dRNA는 표적 유전자 조절을 최대화하고 표적 절단은 최소화하도록 선택된다.
하기 논의의 목적을 위하여, 기능성 도메인에 대한 기준은 C2c2 이펙터 단백질과 연관된 기능성 도메인 또는 어댑터 단백질과 연관된 기능성 도메인일 수 있다.
일부 구현예에서, 하나 이상의 기능성 도메인은 NLS(핵 국소화 서열) 또는 NES(핵외 수송 신호)이다. 일부 구현예에서, 하나 이상의 기능성 도메인은 전사 활성화 도메인으로, VP64, p65, MyoD1, HSF1, RTA, SET7/9 및 히스톤 아세틸트랜스퍼라제를 포함한다. CRISPR 효소와 연관된 것들에 대하여 활성화(또는 활성화제) 도메인에 대한 기타 참조는 임의의 기지의 전사 활성화 도메인을 포함하며, 특히 VP64, p65, MyoD1, HSF1, RTA, SET7/9 또는 히스톤 아세틸트랜스퍼라제.
일부 구현예에서, 하나 이상의 기능성 도메인은 전사 억제제 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 KRAB 도메인이다. 일부 구현예에서, 전사 억제제 도메인은 NuE 도메인, NcoR 도메인, SID 도메인 또는 SID4X 도메인이다.
일부 구현예에서, 하나 이상의 기능성 도메인은 번역 활성화 활성, 번역 억제 활성, 메틸라제 활성, 데메틸라제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성, DNA 절단 활성, DNA 통합 활성 또는 핵산 결합 활성을 포함하는 하나 이상의 활성을 갖는다.
히스톤 변형 도메인 또한 일부 구현예에서 바람직하다. 예시적인 히스톤 변형 도메인이 하기에서 논의된다. 트랜스포사제 도메인, HR(상동성 재조합) 기구 도메인, 재조합효소 도메인, 및/또는 인테그라제 도메인이 본 발명의 기능성 도메인으로서 또한 바람직하다. 일부 구현예에서, DNA 통합 활성은 HR 기구 도메인, 인테그라제 도메인, 재조합효소 도메인 및/또는 트랜스포사제 도메인을 포함한다. 히스톤 아세틸트랜스퍼라제가 일부 구현예에서 바람직하다.
일부 구현예에서, DNA 절단 활성은 뉴클레아제로 인한 것이다. 일부 구현예에서, 뉴클레아제는 Fok1 뉴클레아제를 포함한다. 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77(2014) 참조]은 연장된 서열을 인식하고, 인간 세포에서 고효율로 내인성 유전자를 편집할 수 있는, 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
일부 구현예에서, 하나 이상의 기능성 도메인은 C2c2 이펙터 단백질에 부착되어, sgRNA 및 표적에 대한 결합 시, 기능성 도메인은 그 기능성 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일부 구현예에서, 하나 이상의 기능성 도메인은 어댑터 단백질에 부착되며, C2c2 이펙터 단백질의 sgRNA 및 표적에 대한 결합 시, 기능성 도메인은 그 기능성 도메인이 그에 귀속된 작용으로 작용하는 것을 가능하게 하는 공간 배향으로 존재하도록 한다.
일 양태에서, 본 발명은 본 명세서에서 논의된 바와 같은 조성물을 제공하며, 여기서 하나 이상의 기능성 도메인은, 본 명세서에서 논의된 바와 같은, 링커, 선택적으로 GlySer 링커를 통해 C2c2 이펙터 단백질 또는 어댑터 단백질에 부착된다.
또한 예를 들어 번역, 안정성 등과 관련된 내인성(조절) 제어 요소를 표적화하는 것이 선호된다. 공지된 제어 요소의 표적화는 관심 유전자를 활성화 또는 억제하는 데 사용될 수 있다. 한편 추정적인 제어 요소의 표적화는 그러한 요소를 확인하는(관심 유전자의 번역을 측정함으로써) 또는 신규 제어 요소를 검출하는 수단으로서 사용될 수 있다. 추가적으로, 추정적인 제어 요소의 표적화는 질병의 유전적 원인을 이해하는 맥락에서 유용할 수 있다. 질병 표현형과 연관된 많은 돌연변이 및 일반 SNP 변이체는 코딩 영역 외부에 위치된다. 본 명세서에서 설명된 활성화 또는 저해 시스템 중 어느 하나를 이용한 그러한 영역의 표적화에 이어, a) 추정적인 표적의 세트(예를 들어, 제어 요소의 최근접부에 위치된 유전자의 세트) 또는 b) 예를 들어, RNAseq 또는 마이크로어레이에 의한, 전체-트랜스크립톰 판독 중 어느 하나의 전사 판독에 뒤따를 수 있다. 이는 질병 표현형과 관련된 가능성 있는 후보 유전자의 확인을 가능하게 할 것이다. 그러한 후보 유전자는 신규 약물 표적으로서 유용할 수 있다.
히스톤 아세틸트랜스퍼라제(HAT) 억제제가 본 명세서에 언급된다. 그러나, 대안적인 일부 구현예에서 하나 이상의 기능성 도메인이 아세틸트랜스퍼라제, 바람직하게는 히스톤 아세틸트랜스퍼라제를 포함하는 것이다. 이들은 후성유전학(epigenomics) 분야, 예를 들어 후성유전자에서 정보를 얻는 방법에서 유용하다. 표적화 후성유전자 서열은 후성유전자 표적 서열로 유도되는 가이드를 포함할 수 있다. 후성유전자 표적화는 일부 구현예에서, 프로모터, 사일렌서 또는 인핸서 서열을 포함할 수 있다.
본 명세서에서 설명된 바와 같이 후성유전자 서열을 표적하기 위한 C2c2 이펙터 단백질, 바람직하게는 데드-C2c2 이펙터 단백질, 더욱 바람직하게는 데드-FnC2c2 이펙터 단백질에 연결된 기능성 도메인의 이용은 프로모터, 사일렌서 또는 인핸서를 활성화 또는 억제하는 데 사용될 수 있다.
아세틸트랜스퍼라제의 예는 알려져 있지만, 일부 구현예에서, 히스톤 아세틸트랜스퍼라제를 포함할 수 있다. 일부 구현예에서, 히스톤 아세틸트랜스퍼라제는 인간 아세틸트랜스퍼라제 p300의 촉매 중심을 포함할 수 있다(Gjerbasch & Reddy, Nature Biotech, 2015년 4월 6일).
일부 바람직한 구현예에서, 기능성 도메인은 데드-C2c2 이펙터 단백질에 연결되어 프로모터 또는 인핸서와 같은 후성유전자 서열을 표적 및 활성화한다. 그러한 프로모터 또는 인핸서로 유도된 하나 이상의 가이드는 또한 CRISPR 효소의 그러한 프로모터 또는 인핸서로의 결합을 유도하기 위해 제공될 수 있다.
특정 구현예에서, 본 발명의 RNA 표적화 이펙터 단백질은 DNA/염색질 구조의 공동-전사 변형, RNA-지시되는 DNA 메틸화, 또는 RNA-지시되는 DNA/염색질의 침묵화/활성화를 간섭하는 데 사용될 수 있다. RNA-지시되는 DNA 메틸화(RdDM)는 식물에서 최초로 발견된 후성적 과정이다. RdDM 동안 이중-가닥 RNA(dsRNA)는 21 내지 24 개의 뉴클레오티드 소형 간섭 RNA(siRNA)로 처리되고 상동성 DNA 유전자좌의 메틸화를 가이드한다. RNA 분자 외에도 아르고노트, DNA 메틸트랜스페라제, 염색질 리모델링 복합체 및 식물-특이적 PolIV 및 PolV와 같이, RdDM의 확립에 많은 단백질이 관여한다. 이들 모두는 시토신의 5' 위치에 메틸기를 부가하기 위해 협력하여 작용한다. 소형 RNA는 아르고노트-함유 복합체를 상보적인 신생 (비-코딩) RNA 전사물로 가이드함으로써 염색질 구조를 변형시키고 전사를 침묵화할 수 있다. 그 후 히스톤 및 DNA 메틸트랜스페라제를 포함하는, 염색질-변형 복합체의 모집이 매개된다. 본 발명의 RNA 표적화 이펙터 단백질은 이러한 소형 RNA를 표적화하고 이들 소형 RNA와 신생의 비-코딩 전사물 사이의 상호 작용을 간섭하는 데 사용될 수 있다.
용어 "회합된"이 기능성 도메인의 C2c2 이펙터 단백질 또는 어댑터 단백질로의 연결에 관하여 본 명세서에서 사용된다. 이는 어떻게 하나의 분자가 다른 하나에 대해서, 예를 들어 어댑터 단백질과 기능성 도메인 사이에서 또는 C2c2 이펙터 단백질과 기능성 도메인 사이에서 '회합되는'지에 관하여 사용된다. 이와 같은 단백질-단백질 상호 작용의 경우, 이러한 회합은 항체가 에피토프를 인식하는 방식에서의 인식이라는 면에서 생각될 수 있다. 대안적으로, 하나의 단백질은, 둘 예를 들어 다른 서브유닛에 융합되는 하나의 서브유닛의 융합을 통해 또 다른 단백질과 회합될 수 있다. 융합은 예를 들어 각각의 단백질 또는 서브유닛을 인코딩하는 뉴클레오티드 서열을 함께 스플라이싱을 통해, 통상적으로 하나의 아미노산 서열의 다른 아미노산 서열로의 부가에 의해 일어난다. 대안적으로, 이는 본질적으로 두 개의 분자간의 결합 또는 직접 연결, 예를 들어 융합 단백질로서 생각될 수 있다. 어쨌든, 융합 단백질은 관심의 두 서브유닛 사이(즉, 효소와 기능성 도메인 또는 어댑터 단백질와 기능성 도메인 사이)의 링커를 포함할 수 있다. 따라서, 일부 구현예에서, C2c2 이펙터 단백질 또는 어댑터 단백질은 거기 결합함으로써 기능성 도메인과 회합된다. 다른 구현예에서, C2c2 이펙터 단백질 또는 어댑터 단백질은 기능성 도메인과 함께 회합되는데, 이는 이들 둘이 함께, 선택적으로 중간체 링커를 통해 융합되기 때문이다.
포화(saturating) 돌연변이 유발
본 명세서에 기재된 C2c2 이펙터 단백질 시스템(들)은, 예를 들어 유전자 발현, 약물 내성 및 질병의 전환에 요구되는 작용 요소의 개별 취약성 및 임계 최소 특징의 결정을 위해 세포 표현형과 함께 게놈 유전자좌의 포화 또는 딥 스캐닝 돌연변이 유발을 수행하는 데 사용될 수 있다. 포화 또는 딥 스캐닝 돌연변이 유발이라 함은 모든 또는 본질적으로 모든 RNA 염기가 게놈 유전자좌 내에서 절단됨을 의미한다. C2c2 이펙터 단백질 가이드 RNA의 라이브러리는 세포의 집단 내로 도입될 수 있다. 라이브러리가 도입될 수 있어서, 각각의 세포는 단일 가이드 RNA(sgRNA)를 수령하게 된다. 라이브러리가 본 명세서에서 설명된 바와 같은 바이러스 벡터의 형질도입에 의해 도입되는 경우, 낮은 감염 다중도(MOI)가 사용된다. 라이브러리는 게놈 유전자좌에서(프로토스페서 인접 모티프)(PAM) 서열의 업스트림에 있는 모든 서열을 표적화하는 sgRNA를 포함할 수 있다. 라이브러리는 게놈 유전자좌 내의 모든 1000 개의 베이스 염기쌍에 대해 PAM의 업스트림에서 100 개 이상의 비-중복 게놈 서열을 포함할 수 있다. 라이브러리는 하나 이상의 상이한 PAM 서열의 업스트림에서 서열을 표적화하는 sgRNA를 포함할 수 있다. C2c2 이펙터 단백질 시스템은 하나 초과의 C2c2 단백질을 포함할 수 있다. 본 명세서에서 기재된 바와 같은, 상이한 PAM 서열을 인식하는 오솔로그 또는 설계 제작된 C2c2 이펙터 단백질을 포함하는, 임의의 C2c2 이펙터 단백질이 사용될 수 있다. sgRNA에 대한 표적외 부위의 빈도는 500 개 미만일 수 있다. 표적외 점수는 최저 표적외 부위를 갖는 sgRNA를 선택하기 위해 생성될 수 있다. sgRNA 표적 부위에서의 절단과 연관되는 것으로 결정된 임의의 표현형은 sgRNA의 표적화를 단일 시험에서 동일한 부위를 이용함으로써 확인될 수 있다. 표적 부위의 확인은 본 명세서에서 설명된 바와 같은, 변형된 C2c2 이펙터 단백질, 및 관심 게놈 부위를 표적화하는 두 개의 sgRNA를 이용함으로써 수행될 수도 있다. 이론에 구애되고자 하지는 않지만, 표현형에서의 변화가 확인 실험에서 관찰된다면, 표적 부위가 제대로 확인된 것이다.
포화 또는 딥 스캐닝 돌연변이 유발을 위한 C2c2 이펙터 단백질 시스템(들)은 세포의 집단에서 사용될 수 있다. C2c2 이펙터 단백질 시스템(들)은, 이에 한정되지 않지만, 포유류 및 식물 세포를 포함하는 진핵 세포에서 사용될 수 있다. 세포의 집단은 원핵 세포일 수 있다. 진핵 세포의 집단은 배아 줄기(ES) 세포, 뉴런 세포, 상피 세포, 면역 세포, 내분비 세포, 근육 세포, 적혈구, 림프구, 식물 세포 또는 효모 세포의 집단일 수 있다.
일 양태에서, 본 발명은 표현형에서의 변화와 연관된 작용 요소에 대한 스크리닝 방법을 제공한다. 라이브러리는 C2c2 이펙터 단백질을 함유하도록 조정된 세포 집단 내로 도입될 수 있다. 세포는 표현형을 기준으로 둘 이상의 군으로 분류될 수 있다. 표현형은 유전자, 세포 성장, 또는 세포 생육력의 발현일 수 있다. 각 군에 존재하는 가이드 RNA의 상대적 표시가 결정되며, 이로 인해 표현형에서의 변화와 연관된 게놈 부위는 각 군에 존재하는 가이드 RNA의 표시에 의해 결정될 수 있다. 표현형에서의 변화는 관심 유전자의 발현에서의 변화일 수 있다. 관심 유전자는 상향조절, 하향조절, 또는 녹아웃될 수 있다. 세포는 고발현 군과 저발현 군으로 분류될 수 있다. 세포 집단은 표현형을 결정하는 데 사용되는 리포터 작제물을 포함할 수 있다. 리포터 작제물은 검출 가능한 마커를 포함할 수 있다. 세포는 검출 가능한 마커의 이용에 의해 분류될 수 있다.
또 다른 양태에서, 본 발명은 화학 화합물에 대한 내성과 관련된 유전자좌의 스크리닝 방법을 제공한다. 화학 화합물은 약물 또는 살충제일 수 있다. 라이브러리는 C2c2 이펙터 단백질을 함유하도록 조절된 세포 집단 내로 도입될 수 있으며, 여기서 집단의 세포 각각은 단지 하나의 가이드 RNA를 함유하며, 세포 집단은 화학 화합물로 처리되며; 가이드 RNA의 표시는 초기 시점에 비하여, 이후의 시점에서 화학 화합물로 처리 후에 결정되며, 이로 인해 화학 화합물에 대한 내성과 연관된 부위는 가이드 RNA의 풍부화에 의해 결정된다. sgRNA의 표시는 딥 시퀀싱 방법에 의해 결정될 수 있다.
C2c2 이펙터 단백질 복합체를 이용하는 본 발명의 실시에 있어서 CRISPR-Cas9 시스템에서 사용되는 방법이 유용하고, Cas9-매개된 동일계내 포화 돌연변이유발에의한 BCL11A 인핸서 절제(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis)라는 명칭의 논문이 언급된다. 논문[Canver, M.C., Smith, E.C., Sher, F., Pinello, L., Sanjana, N.E., Shalem, O., Chen, D.D., Schupp, P.G., Vinjamur, D.S., Garcia, S.P., Luc, S., Kurita, R., Nakamura, Y., Fujiwara, Y., Maeda, T., Yuan, G., Zhang, F., Orkin, S.H., & Bauer, D.E. DOI:10.1038/nature15521, 2015년 9월 16일 간행]은 참고문헌으로 본 명세서에 통합되고, 아래 간략히 논의된다:
Canver 외의 문헌은, 이전에 태아 헤모글로빈(HbF) 수준과 연관된 인핸서로서, 그의 마우스 오솔로그가 적혈구 BCL11A 발현에 필요한 것으로 확인된, 인간 및 마우스 BCL11A 적혈구 인핸서의 현장 포화 돌연변이 유발을 수행하기 위하여 신규 풀화된(pooled) CRISPR-Cas9 가이드 RNA 라이브러리를 수반한다. 이 시도는 이들 인핸서의 임계 최소 특징 및 개별 취약성을 밝혔다. 1 차 인간 조상 및 마우스 유전자 도입의 편집을 통해, 저자는 BCL11A 적혈구 인핸서를 HbF 재도입을 위한 표적으로서 확인하였다. 저자는 치료적 게놈 편집을 알려주는 상세한 인핸서 맵을 생성하였다.
세포 또는 생물을 변형시키기 위하여 C2c2 시스템을 이용하는 방법
일부 구현예에서 본 발명은 세포 또는 생물을 변형시키는 방법을 포함한다. 세포는 원핵 세포 또는 진핵 세포일 수 있다. 세포는 포유류 세포일 수 있다. 포유류 세포는 많은 경우 비-인간 영장류, 소, 돼지, 설치류 또는 마우스 세포일 수 있다. 세포는 가금류, 어류 또는 새우와 같은 비-포유류 진핵 세포일 수 있다. 세포는 식물일 수도 있다. 식물 세포는 카사바, 옥수수, 수수, 밀 또는 벼와 같은 작물 식물의 것일 수 있다. 식물 세포는 또한 조류, 나무 또는 채소일 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 항체, 전분, 알콜 또는 기타 바람직한 세포 산출물과 같은 생물학적 생성물의 개선된 생산에 대해 변경되도록 할 수 있다. 본 발명에 의해 세포에 도입된 변형은, 세포 및 세포의 자손이 생산된 생물학적 생성물을 변화시키는 변경을 포함하도록 할 수 있다.
시스템은 하나 이상의 상이한 벡터를 포함할 수 있다. 본 발명의 일 양태에서, 이펙터 단백질은 바람직한 세포 유형, 우선적으로는 진핵 세포, 바람직하게는 포유류 세포 또는 인간 세포의 발현에 대해 코돈 최적화된다.
세포를 패키징하는 것은 통상적으로 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는 데 사용된다. 이와 같은 세포는, 아데노바이러스를 패키징하는 293 개의 세포를 포함하고, 레트로바이러스를 패키징하는 ψ2 세포 또는 PA317 세포를 포함한다. 유전자 치료법에서 사용되는 바이러스 벡터는 보통 핵산 벡터를 바이러스 입자로 패키징하는 세포주를 생성함으로써 생성된다. 벡터는 통상적으로 숙주로의 패키징 및 후속 통합에 요구되는 최소 바이러스 서열을 함유하고, 다른 바이러스 서열은 발현될 폴리뉴클레오티드(들)에 있어서 발현 카세트에 의해 대체된다. 누락된 바이러스 작용은 통상적으로 패키징 세포주에 의해 트랜스로 공급된다. 예를 들어, 유전자 치료법에서 사용되는 AAV 벡터는 통상적으로 숙주 게놈으로의 패키징 및 통합에 요구되는, AAV 게놈 유래의 ITR 서열만을 갖는다. 바이러스 DNA는 세포주에서 패키징되고, 이는 다른 AAV 유전자를 인코딩하는 헬퍼 플라스미드, 즉 rep 및 cap를 함유하지만, ITR 서열은 결여되어 있다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염될 수 있다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진시킨다. 헬퍼 플라스미드는 ITR 서열의 결여로 인하여 상당한 양으로 패키징되지 않는다. 아데노바이러스로 인한 오염은, 예를 들어 아데노바이러스가 AAV보다 더 민감한 열 처리에 의해 감소될 수 있다. 핵산의 세포로의 전달을 위한 추가적인 방법은 당업자들에게 알려져 있다. 예를 들어, 본 명세서에 참조로서 포함된 US20030087817을 참조한다.
일부 구현예에서, 숙주 세포는 본 명세서에 기재된 하나 이상의 벡터로 일시적으로 또는 비-일시적으로 형질감염된다. 일부 구현예에서, 세포는 대상체에서 자연적으로 발생하기 때문에 형질감염된다. 일부 구현예에서, 형질감염된 세포는 대상체로부터 취한다. 일부 구현예에서, 세포는 대상체로부터 취한 세포로부터 유래되며, 예를 들어 세포주이다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 알려져 있다. 세포주의 예로는 이에 한정되지 않이지만, C8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLa-S3, Huh1, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panc1, PC-3, TF1, CTLL-2, C1R, Rat6, CV1, RPTE, A10, T24, J82, A375, ARH-77, Calu1, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI-231, HB56, TIB55, Jurkat, J45.01, LRMB, Bcl-1, BC-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4, COS, COS-1, COS-6, COS-M6A, BS-C-1 원숭이 신장 상피세포, BALB/ 3T3 마우스 배아 섬유아세포, 3T3 Swiss, 3T3-L1, 132-d5 인간 태아 섬유아세포; 10.1 마우스 섬유아세포, 293-T, 3T3, 721, 9L, A2780, A2780ADR, A2780cis, A172, A20, A253, A431, A-549, ALC, B16, B35, BCP-1 세포, BEAS-2B, bEnd.3, BHK-21, BR 293, BxPC3, C3H-10T1/2, C6/36, Cal-27, CHO, CHO-7, CHO-IR, CHO-K1, CHO-K2, CHO-T, CHO Dhfr -/-, COR-L23, COR-L23/CPR, COR-L23/5010, COR-L23/R23, COS-7, COV-434, CML T1, CMT, CT26, D17, DH82, DU145, DuCaP, EL4, EM2, EM3, EMT6/AR1, EMT6/AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepa1c1c7, HL-60, HMEC, HT-29, Jurkat, JY 세포, K562 세포, Ku812, KCL22, KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCK II, MDCK II, MOR/0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69/CPR, NCI-H69/LX10, NCI-H69/LX20, NCI-H69/LX4, NIH-3T3, NALM-1, NW-145, OPCN / OPCT 세포주, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA/RMAS, Saos-2 세포, Sf-9, SkBr3, T2, T-47D, T84, THP1 세포주, U373, U87, U937, VCaP, Vero 세포, WM39, WT-49, X63, YAC-1, YAR, 및 이들의 유전자 도입 변형들을 포함한다. 세포주는 당업자에게 알려진 다양한 공급원으로부터 입수 가능하다(예를 들어, 미국 균주 은행(American Type Culture Collection; ATCC)(미국 버지니아주 매나서스 소재) 참조). 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터로 형질감염된 세포는 하나 이상의 벡터-유래된 서열을 포함하는 신규 세포주를 구축하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 핵산-표적화 시스템의 성분으로 일시적으로 형질감염되고(예를 들어, 하나 이상의 벡터의 일시 형질감염, 또는 RNA를 이용한 형질감염에 의해), 핵산-표적화 복합체의 활성을 통하여 변형된 세포는 변형을 포함하지만 임의의 다른 외인성 서열은 결여한 세포를 포함하는 새로운 세포주를 수립하는 데 사용된다. 일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터를 이용하여 일시적으로 또는 비-일시적으로 형질감염된 세포, 또는 이와 같은 세포로부터 유래된 세포주는 하나 이상의 시험 화합물을 평가하는 데 사용된다.
일부 구현예에서, 본 명세서에 기재된 하나 이상의 벡터가 비-인간 유전자 도입 동물 또는 유전자 도입 식물을 생산하는 데 사용된다. 일부 구현예에서, 유전자 도입 동물은 포유류, 예를 들어 마우스, 래트 또는 토끼다. 특정 구현예에서, 생물 또는 대상체는 식물이다. 특정 구현예에서, 생물 또는 대상체 또는 식물은 조류이다. 유전자 도입 식물 및 동물을 생산하는 방법은 당업계에 공지되어 있으며, 일반적으로 본 명세서에 기재된 바와 같은 세포 형질 감염 방법으로 시작한다.
일 양태에서, 본 발명은 진핵 세포에서 표적 폴리뉴클레오티드를 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 핵산-표적화 복합체가 표적 폴리뉴클레오티드에 결합 가능하게 하여 상기 표적 폴리뉴클레오티드의 절단을 가져옴으로써 표적 폴리뉴클레오티드를 변형시키는 것을 포함하며, 여기서 핵산-표적화 복합체는 상기 표적 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다.
일 양태에서, 본 발명은 진핵 세포에서 폴리뉴클레오티드의 발현을 변형시키는 방법을 제공한다. 일부 구현예에서, 방법은 핵산-표적화 복합체가 폴리뉴클레오티드에 결합 가능하게 하여 상기 결합이 상기 폴리뉴클레오티드의 증가되거나 감소된 발현을 초래하는 것을 포함하며; 여기서 핵산-표적화 복합체는 상기 폴리뉴클레오티드 내의 표적 서열에 혼성화된 가이드 RNA와 복합체화된 핵산-표적화 이펙터 단백질을 포함한다.
C2c2 이펙터 단백질 복합체는 식물에서 사용될 수 있다
C2c2 이펙터 단백질 시스템(들)(예를 들어, 단일 또는 다중화된)은 작물 유전체학에서의 최근의 진전과 함께 사용될 수 있다. 본 명세서에 기재된 시스템은 효율적 및 비용 효과적으로 식물 유전자 또는 게놈 측정 또는 편집 또는 조작(예를 들어, 식물 유전자 또는 게놈의 신속한 조사 및/또는 선택 및/또는 측정 및/또는 비교 및/또는 조작 및/또는 형질전환)을 실행하는 데 사용될 수 있으며; 예를 들어 특성(들) 또는 특징(들)을 형성, 확인, 발생, 최적화 또는 식물(들)에게 부여 또는 식물 게놈을 형질전환한다. 따라서 식물, 특성 또는 특징의 새로운 조합을 갖는 새로운 식물 또는 향상된 특성을 갖는 새로운 식물의 개선된 생산이 있을 수 있다. 그러한 C2c2 이펙터 단백질 시스템(들)은 식물에 대하여 부위-유도된 통합(SDI) 또는 유전자 편집(GE) 또는 임의의 근접 역전 브리딩(NRB) 또는 역전 브리딩(RB) 기법에서 사용될 수 있다. 본 명세서에 기재된 C2c2 이펙터 단백질 시스템의 이용 양태는 식물에서 CRISPR-Cas(예를 들어, CRISPR-Cas9) 시스템의 사용과 유사할 수 있으며, 아리조나 대학 웹사이트 "CRISPR-PLANT"(http://www.genome.arizona.edu/crispr/)(Penn State 및 AGI 후원)가 언급된다. 본 발명의 일 구현예는 식물에서 또는 RNAi 또는 유사한 게놈 편집 기술이 이미 사용된 곳에서 게놈 편집에 사용될 수 있다; 예를 들어, 문헌 [Nekrasov, "Plant genome editing made easy: targeted mutagenesis in model and crop plants using the CRISPR-Cas system," Plant Methods 2013, 9:39(doi:10.1186/1746-4811-9-39)]; 문헌 [Brooks, "Efficient gene editing in tomato in the first generation using the CRISPR-Cas9 system," Plant Physiology September 2014 pp 114.247577]; 문헌 [Shan, "Targeted genome modification of crop plants using a CRISPR-Cas system," Nature Biotechnology 31, 686-688(2013)]; 문헌 [Feng, "Efficient genome editing in plants using a CRISPR/Cas system," Cell Research(2013) 23:1229-1232. doi:10.1038/cr.2013.114; 2013년 8월 20일 온라인 간행됨]; 문헌 [Xie, "RNA-guided genome editing in plants using a CRISPR-Cas system," Mol Plant. 2013 Nov;6(6):1975-83. doi: 10.1093/mp/sst119. 2013년 8월 17일 전자출판]; 문헌 [Xu, "Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice," Rice 2014, 7:5(2014)]; 문헌 [Zhou et al., "Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate: CoA ligase specificity and Redundancy," New Phytologist(2015)(Forum) 1-4(www.newphytologist.com에서만 온라인으로만 이용 가능)]; 문헌 [Caliando et al, "Targeted DNA degradation using a CRISPR device stably carried in the host genome, NATURE COMMUNICATIONS 6:6989, DOI: 10.1038/ncomms7989, www.nature.com/naturecommunications DOI: 10.1038/ncomms7989]; 미국 특허 제6,603,061 호 - Agrobacterium-Mediated Plant Transformation Method; 미국 특허 제7,868,149 호 - Plant Genome Sequences and Uses Thereof, 및 미국 2009/0100536 - Transgenic Plants with Enhanced Agronomic Traits 참조, 이들 각각의 내용 및 개시 내용 모두는 그 전체로 본 명세서에 참고문헌으로 포함된다. 본 발명의 실시에서, 문헌 [Morrell et al "Crop genomics: advances and applications," Nat Rev Genet. 2011 Dec 29;13(2):85-96]의 내용 및 개시 내용; 이들 각각은, 본 명세서의 구현예가 식물에 대하여 어떻게 사용되는지를 포함하여, 본 명세서에서 참고문헌으로 통합된다. 따라서, 동물 세포에 대한 본 명세서의 참고문헌 또한 달리 명백하지 않은 경우, 식물 세포에 또한 적절한 변형을 가하여 적용될 수 있고; 본 명세서에서 감소된 표적외 효과를 갖는 효소 및 그러한 효소를 사용하는 시스템은, 본 명세서에서 언급된 것들을 포함하여, 식물 응용분야에서 사용될 수 있다.
Sugano 외(Plant Cell Physiol. 2014 Mar;55(3):475-81. doi: 10.1093/pcp/pcu014. Epub 2014 Jan 18)는, 육상 식물 진화를 연구하기 위한 모델 종으로서 떠오른, 우산이끼 마르찬티아 폴리모파 L(Marchantia polymorpha L.)에서의 표적화된 돌연변이유발에 CRISPR-Cas9의 적용을 보고한다. 마르찬티아 폴리모파의 U6 프로모터가 확인되고, 클로닝되어 gRNA를 발현하였다. gRNA의 표적 서열은 마르찬티아 폴리모파에서 옥신 반응 인자 1(ARF1)을 인코딩하는 유전자를 파괴하도록 설계되었다. 아그로박테리움-매개 형질전환을 사용하여, Sugano외는 마르찬티아 폴리모파의 배우체 생성에서 안정적인 돌연변이체를 분리하였다. 생체내에서 CRISPR-Cas9-기반 부위-특이적 돌연변이유발은, 콜리플라워 모자이크 바이러스 35S 또는 마르찬티아 폴리모파 EF1α 프로모터 중 어느 하나를 사용하여 Cas9를 발현하도록 달성되었다. 옥신-내성 표현형을 나타내는 분리된 돌연변이체 개체는 키메라가 아니었다. 나아가, 안정적인 돌연변이체는 T1 식물의 무성 생식에 의해 생산되었다. arf1 겹대립형질(multiple allele)은 CRIPSR/Cas9-기반의 표적화된 돌연변이유발을 사용하여 용이하게 수립되었다. 본 발명의 C2c2 시스템은 동일뿐만 아니라 다른 유전자를 조절하는 데 사용될 수 있으며, RNAi 및 siRNA와 같은 발현 제어 시스템과 같이 본 발명의 방법은 유도성 및 가역성일 수 있다.
Kabadi 외(Nucleic Acids Res. 2014 Oct 29;42(19):e147. doi: 10.1093/nar/gku749. Epub 2014 Aug 13)는, 편리한 골든 게이트 클로닝 방법에 의하여 벡터 내로 혼입된 독립된 RNA 중합효소 III 프로모터로부터, Cas9 변이체, 리포터 유전자 및 최대 4 개의 sgRNA를 발현시키기 위하여 단일 렌티바이러스 시스템을 개발하였다. 각각의 sgRNA는 효율적으로 발현되었고, 불사화된 일차 인간 세포에서 다중화 유전자 편집 및 지속된 전사 활성화를 매개할 수 있다. 본 발명은 Kabadi의 식물 유전자를 조절하는 데 사용될 수 있다.
Xing 외(BMC Plant Biology 2014, 14:327)는, pGreen 또는 pCAMBIA 백본뿐만 아니라, gRNA를 기반으로 한 CRISPR-Cas9 바이너리 벡터 세트를 개발하였다. 이러한 도구 키트(toolkit)는 최소한 하나의 클로닝 단계에서 메이즈(maize)-코돈 최적화된 Cas9 및 하나 이상의 gRNA를 품고 있는 최종 작제물을 고효율로 생성하기 위해, BsaI 외의 제한 효소를 필요로 하지 않는다. 도구 키트는 메이즈 원형질, 유전자 도입 메이즈 계통, 및 유전자 도입 아라비돕시스 계통을 사용하여 확인되었으며, 높은 효율 및 특이성을 보이는 것으로 나타났다. 더욱 중요하게는, 이러한 도구 키트를 사용하여, 3 개의 아라비돕시스 유전자의 표적화된 돌연변이가 T1 세대의 유전자 도입 묘목에서 검출되었다. 또한, 다중-유전자 돌연변이가 그 다음 세대로 유전될 수 있었다. 식물에서 다중화 게놈 편집을 위한 도구 키트로서, (가이드 RNA) 모듈 벡터 세트. 본 발명의 C2c2 시스템 및 단백질은 Xing에 의해 표적화된 유전자를 표적화하는 데 사용될 수 있다.
본 발명의 C2c2 CRISPR 시스템은 식물 바이러스의 검출에 사용될 수 있다. Gambino 외(Phytopathology. 2006 Nov;96(11):1223-9. doi: 10.1094/PHYTO-96-1223)는 9 개의 포도덩굴 바이러스의 동시 검출을 위해 증폭 및 다중 PCR에 의존하였다. 본 발명의 C2c2 시스템 및 단백질은 유사하게 숙주에서 다수의 표적을 검출하는 데 사용될 수 있다. 더욱이, 본 발명의 시스템은 가치가 큰 품종에서의 바이러스 유전자 발현을 동시에 녹다운시키고 발현된 바이러스 RNA를 표적화함으로써 활성화 또는 추가 감염을 방지하는 데 사용될 수 있다.
Murray 외(Proc Biol Sci. 2013 Jun 26;280(1765):20130965. doi: 10.1098/rspb.2013.0965; 2013월 8월 22일 간행)는 12 종의 식물 RNA 바이러스를 분석하여 진화 속도를 조사하였으며 아마도 상이한 숙주 유전자형 또는 종 사이에서의 이동으로 인한 우발적 선택의 증거를 밝혀냈다. 본 발명의 C2c2 시스템 및 단백질은 숙주에서 이러한 바이러스에 대해 표적화 또는 면역화하는 데 사용될 수 있다. 예를 들어, 본 발명의 시스템은 바이러스 RNA 발현 이에 따른 복제를 차단하는 데 사용될 수 있다. 또한, 본 발명은 절단을 위해 핵산을 표적화하는 것뿐만 아니라 발현 또는 활성화를 표적화하는 데 사용될 수 있다. 더욱이, 본 발명의 시스템은 다수의 표적 또는 동일한 바이러스의 다수의 단리물을 공격하도록 다중화될 수 있다.
Ma 외(Mol Plant. 2015 Aug 3;8(8):1274-84. doi: 10.1016/j.molp.2015.04.007)는 단자엽 및 쌍자엽 식물에서 편리하고 고효율의 다중화된 게놈 편집을 위해, 식물 코돈 최적화된 Cas9 유전자를 활용하는, 견고한 CRISPR-Cas9 벡터 시스템을 보고한다. Ma 외는 다수의 sgRNA 발현 카세트를 신속하게 생성하기 위해 PCR-기반 절차를 설계하였으며, 이는 골든 게이트 연결 또는 Gibson 조립에 의한 한 차례의 클로닝에서 2 부분으로 이루어진 CRISPR-Cas9 벡터 내로 조립될 수 있다. 이 시스템을 이용하여, Ma 외는, 평균 85.4%의 돌연변이율로, 대부분 2-대립형질 및 동형 접합 상태로, 벼의 46 개 표적 부위를 편집하였다. Ma 외는 유전자 패밀리의 다수의(8 개까지) 구성원, 생합성 경로에서의 다수의 유전자, 또는 단일 유전자에서 다수의 부위의 동시 표적화에 의해 T0 벼 및 T1 애기장대 식물에서 기능-손실 유전자 돌연변이의 예를 제공한다. 유사하게, 본 발명의 C2c2 시스템은 다수의 유전자의 발현을 동시에 효율적으로 표적화할 수 있다.
Lowder 외(Plant Physiol. 2015 Aug 21. pii: pp.00636.2015) 또한 CRISPR-Cas9 툴박스(toolbox)를 개발하여 식물에서 발현된, 침묵화된 또는 비-코딩 유전자의 다중화된 게놈 편집 및 전사 조절을 가능하게 한다. 이 툴박스는 골든 게이트 및 게이트웨이 클로닝 방법을 사용하여 단자엽 및 쌍자엽에 대한 기능성 CRISPR-Cas9 T-DNA 작제물을 빠르고 효율적으로 조립하기 위한 프로토콜 및 시약을 연구원에게 제공한다. 그것은 다중화된 유전자 편집 및 식물 내인성 유전자의 전사 활성화 또는 억제를 포함하는 전체 세트의 성능을 제공한다. T-DNA 기반의 형질 전환 기술은 현대 식물 생명 공학, 유전학, 분자 생물학 및 생리학의 기본이다. 이와 같이 Cas9(WT, 니카제 또는 dCas9) 및 gRNA(들)를 관심 T-DNA 목적-벡터에 조립하는 방법을 개발하였다. 조립 방법은 골든 게이트 조립 및 MultiSite 게이트웨이 재조합 모두를 기반으로 한다. 조립을 위해서 3 개의 모듈이 요구된다. 제1 모듈은 Cas9 엔트리 벡터이며, 이는 attL1 및 attR5 부위의 측면에 배치되는 프로모터 없는 Cas9 또는 이의 유도체 유전자를 함유한다. 제2 모듈은 attL5 및 attL2 부위의 측면에 배치되는 엔트리 gRNA 발현 카세트를 함유하는 gRNA 엔트리 벡터이다. 제3 모듈은 Cas9 발현을 위한 선택의 프로모터를 제공하는, attR1-attR2-함유 목적 T-DNA 벡터를 포함한다. Lowder 외의 툴박스는 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
효모 및 미세 조류와 같은 생물은 합성 생물학에 널리 사용된다. Stovicek 외(Metab. Eng. Comm., 2015; 2:13는 산업적 생산용 견고한 균주를 효율적으로 생산하기 위한 산업 효모, 예를 들어, 사카로마이세스 세레비사에의 게놈 편집을 기재하고 있다. Stovicek은 동시에 내인성 유전자의 두 대립유전자 모두를 파괴하고 이종 유전자를 녹인하기 위해 효모에 대해 코돈-최적화된 CRISPR-Cas9 시스템을 사용하였다. Cas9 및 gRNA는 게놈 또는 에피솜 2 μ-기반 벡터 위치로부터 발현되었다. 저자는 또한 Cas9 및 gRNA 발현 수준을 최적화함으로써 유전자 파괴 효율이 향상될 수 있음을 보여주었다. Hlavovα 외(Biotechnol. Adv. 2015)는 삽입 돌연변이유발 및 스크리닝을 위해 핵 및 엽록체 유전자를 표적화하는 CRISPR과 같은 기법을 사용하는 미세 조류의 종 또는 균주의 개발에 대해 논의한다. 동일한 플라스미드 및 벡터가 본 발명의 C2c2 시스템에 적용될 수 있다.
Petersen("Towards precisely glycol engineered plants," Plant Biotech Denmark Annual meeting 2015, Copenhagen, Denmark)은 아라비돕시스에서 게놈 변화를 조작하기 위하여, 예를 들어 원하는 번역후 변형을 갖는 생성물 및 단백질의 생산을 위해 아라비돕시스를 글리코 조작하기 위하여, CRISPR/Cas9를 사용하는 방법을 개발하였다. Hebelstrup 외(Front Plant Sci. 2015 Apr 23; 6:247)은 식물체 내 전분 생물공학을 개괄하며, 전분 변형 효소를 발현하고, 전분의 산업적 화학적 및/또는 물리적 처리에 의해 보통 제조되는 생성물을 직접 생산하는 작물을 제공한다. Petersen 및 Hebelstrup의 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
Kurth 외, J Virol. 2012 Jun;86(11):6002-9. doi: 10.1128/JVI.00436-12. Epub 2012 Mar 21)는 게놈에 대한 유전적 변형없이 포도덩굴에 원하는 형질을 도입하기 위해 RNA 바이러스-기반 벡터를 개발하였다. 벡터는 바이러스-유도된 유전자 침묵에 의해 내인성 유전자의 발현을 조절하는 능력을 제공하였다. 본 발명의 C2c2 시스템 및 단백질은 게놈에 대한 유전적 변형없이 유전자 및 단백질을 침묵시키는 데 사용될 수 있다.
일 구현예에서, 식물은 콩과 식물일 수 있다. 본 발명은 예를 들어 제한 없이 대두, 완두콩 및 땅콩을 탐구 및 변형하기 위하여 본 명세서에 개시된 CRISP-Cas 시스템을 이용할 수 있다. Curtin 외는 콩과 식물 기능 유전체학을 위한 툴박스를 제공한다(Curtin et al., "A genome engineering toolbox for legume Functional genomics," International Plant and Animal Genome Conference XXII 2014 참고). Curtin은 털이 많은 뿌리 및 전체 식물 시스템 모두에서 단일 카피 및 복제된 콩과 식물 유전자를 녹-아웃/다운하기 위해 CRISPR의 유전 형질 변환을 이용하였다. 표적 유전자 중 일부는 녹-아웃/다운 시스템의 특징을 탐구 및 최적화하기 위해 선택된 것인 반면(예를 들어, 피토엔 불포화화 효소), 다른 것들은 애기장대 다이서-유사 유전자에 대한 대두 상동성에 의해 또는 개자리속(Medicago)의 마디 생성에 대한 게놈-전체에 걸친 관련성 연구에 의해 확인되었다. 본 발명의 C2c2 시스템 및 단백질은 시스템을 녹아웃/녹다운시키는 데 사용될 수 있다.
땅콩 알레르기 및 콩과 식물에 대한 알레르기는 일반적으로 실제적이고 심각한 건강 상의 문제이다. 본 발명의 C2c2 이펙터 단백질 시스템은 이러한 콩과 식물의 알레르기 유발 단백질을 인코딩하는 유전자를 동정하고 그 후 편집하거나 침묵시키는 데 사용될 수 있다. 이러한 유전자 및 단백질에 대한 제한 없이, Nicolaou 외는 땅콩, 대두, 렌틸, 완두콩, 루핀, 껍질콩 및 녹두에서 알레르기 유발 단백질을 확인한다. 문헌[Nicolaou et al., Current Opinion in Allergy and Clinical Immunology 2011;11(3):222)] 참고.
유리한 구현예에서, 식물은 나무일 수 있다. 본 발명은 또한 본 명세서에서 개시된 CRISPR Cas 시스템을 초본경에 이용할 수 있다(예를 들어, 문헌[Belhaj et al., Plant Methods 9: 39] 및 문헌[Harrison et al., Genes & Development 28: 1859-1872] 참조). 특히 유리한 구현예에서, 본 발명의 CRISPR Cas 시스템은 나무에서 단일 뉴클레오티드 다형성(SNP)을 표적화할 수 있다(예를 들어, 문헌[Zhou et al., New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015] 참조). Zhou 외의 연구에서, 저자는, 케이스 연구로서 4-쿠마레이트:CoA 리가제(4CL) 유전자 패밀리를 사용하여 다년생 목본 사시나무속(Populus)에서 CRISPR Cas 시스템을 적용하고, 표적화된 2 개의 4CL 유전자에 대해 100% 돌연변이 효율을 달성하였으며, 검사한 모든 형질전환체는 이중대립형질 변형을 가졌다. Zhou 외의 연구에서, CRISPR-Cas9 시스템은 단일 뉴클레오티드 다형성(SNP)에 대해 고도로 민감하였으며, 제3의 4CL 유전자에 대한 절단은 표적 서열 내 SNP로 인해 삭제되었다. 이러한 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
Zhou 외의 방법(New Phytologist, Volume 208, Issue 2, pages 298-301, October 2015)은 본 발명에 다음과 같이 적용될 수 있다. 리그닌 및 플라보노이드 생합성에 연관된, 2 개의 4CL 유전자, 즉 4CL1 및 4CL2는 각각 CRISPR-Cas9 편집에 대해 표적화된다. 형질전환에 일상적으로 사용되는 포퓰러스 트레뮬라(Populus tremula) x alba 클론 717-1B4는 게놈-시퀀싱된 포퓰러스 트리코카르파(Populus trichocarpa)로부터 분기된다. 따라서, 기준 게놈으로부터 설계된 4CL1 및 4CL2 gRNA는 인-하우스 717 RNA-Seq 데이터로 질의되어 Cas 효율을 제한할 수 있는 SNP의 부재를 보장한다. 4CL1의 게놈 복제물인, 4CL5에 대해 설계된 제3 gRNA 또한 포함된다. 상응하는 717 서열은 PAM 가까이/내의 각각의 대립형질에서 하나의 SNP를 포함하며, 이들 모두는 4CL5-gRNA에 의한 표적화를 제거하는 것으로 예상된다. 3 개의 gRNA 표적 부위 모두는 제1 엑손 내에 위치된다. 717 형질전환의 경우, gRNA는 바이너리 벡터 내 CaMV 35S 프로모터의 제어 하에, 인간 코돈-최적화된 Cas와 함께 개자리(Medicago) U6.6 프로모터로부터 발현된다. Cas-만의 벡터를 이용한 형질전환은 대조군으로서 제공될 수 있다. 무작위로 선택된 4CL1 및 4CL2 계통은 앰플리콘-시퀀싱 처리된다. 그 데이터는 이후 가공되고, 이중대립형질 돌연변이는 모든 경우에서 확인된다. 이들 방법은 본 발명의 C2c2 이펙터 단백질 시스템에 적용될 수 있다.
식물에서, 병원균은 종종 숙주-특이적이다. 예를 들어, 푸사리움 옥시스포룸(Fusarium oxysporum) f. sp. 리코페르시시(lycopersici)는 토마토의 시듬을 유발하지만 토마토만을 공격하고, F. 옥시스포룸 f. 다이안티 푸치니아 그라미니스(dianthii Puccinia graminis) f. sp. 트리티시(tritici)는 밀만 공격한다. 식물은 대부분의 병원균에 견디는 기존 및 유도된 방어를 갖는다. 식물 세대에 걸친 돌연변이 및 재조합 사건은, 특히 병원균이 식물보다 더욱 높은 빈도로 번식함에 따라, 감수성이 증가되는 유전적 변동성을 일으킨다. 식물에서는, 비-숙주 내성이 존재할 수 있으며, 예를 들어 숙주 및 병원균은 비양립성이다. 통상적으로 많은 유전자에 의해 제어되는, 수평 내성, 예를 들어 병원균의 모든 종족에 대하여 부분 내성, 및 통상적으로 몇몇 유전자에 의해 제어되는, 수직 내성, 예를 들어 다른 종족은 아니지만 일부 종족의 병원균에 대해 완전한 내성이 또한 존재할 수 있다. 유전자 대 유전자 수준에서, 식물 및 병원균은 함께 진화하며, 하나의 균형에서의 유전적 변화는 다른 하나에서 변화를 일으킨다. 따라서, 자연적 변동성을 사용하여, 품종 개량자는, 산출량, 품질, 균일성, 강인성(hardiness), 내성에 대해 가장 유용한 유전자를 조합한다. 내성 유전자 공급원은 천연 또는 외래의 변종들, 토종(Heirloom Varieties), 야생 근연 식물, 및 유도된 돌연변이, 예를 들어 돌연변이원성 제제를 이용한 식물 재료 처리를 포함한다. 본 발명을 사용하여, 식물 품종 개량자는 돌연변이를 유도하는 새로운 도구를 제공받는다. 따라서, 당업자는 내성 유전자의 게놈을 분석할 수 있고, 원하는 특징 또는 특성을 갖는 변종들에서, 이전의 돌연변이원성 제제보다 더욱 정확하고, 이에 따라 식물 품종 개량 프로그램을 가속화하고 개선하는 내성 유전자의 증가를 유도하기 위하여 본 발명을 이용할 수 있다.
본 명세서에서 및 상기에서 달리 논의된 식물 외에도, 이펙터 단백질 및 적합한 가이드에 의해 변형된 설계 제작된 식물 및 그의 자손이 제공된다. 이들에는 밀, 보리, 벼, 대두 또는 옥수수와 같은 질병 또는 가뭄 저항성 작물; 자가 수분 능력을 제거 또는 감소시키기 위해 변형된 식물(그러나 대신 할 수 있고, 선택적으로 대신 혼성화할 수 있음); 및 면역원성 단백질이 이펙터 단백질 및 적합한 가이드를 통해 표적화됨으로써 장애, 파괴 또는 방해된, 땅콩 및 견과류와 같은 알레르기 유발 식품이 포함될 수 있다.
치료적 처리
본 출원이 시스템의 정보 제공된 설계 제작을 위한 기초를 제공하므로, 본 발명의 시스템은 본 개시 내용으로부터 과도한 실험없이, 치료, 분석 및 다른 응용을 포함하여, 이전의 RNA 절단 기술 분야에 적용될 수 있다. 본 발명은 RNA 과발현, 독성 RNA 및/또는 돌연변이된 RNA(예를 들어, 스플라이싱 결함 또는 절단과 같은)에 의해 야기되는 질병의 치료적 처리를 제공한다. 독성 RNA의 발현은 뇌, 심장 또는 골격근에서 핵 봉입 형성 및 후기-개시되는 퇴행성 변화와 관련될 수 있다. 가장 잘 연구된 예인 근긴장성 이영양증에서, 독성 RNA의 주요 병원성 효과는 결합 단백질을 격리시키고 대안적 스플라이싱의 조절을 손상시키는 것으로 보인다(문헌[Hum. Mol. Genet. (2006) 15 (suppl 2): R162-R169]). 근긴장성 이영양증 [dystrophia myotonica(DM)]은 극히 광범위한 임상 특징을 생산하기 때문에 유전학자들에게 특히 관심 대상이다. 부분적인 목록에는 근육 소모, 백내장, 인슐린 내성, 고환 위축, 심장 전도 감속, 피부 종양 및 인지에 대한 영향이 포함될 것이다. 현재 DM 제1형(DM1)으로 불리는 DM의 전형적인 형태는 시토졸 단백질 키나제를 인코딩하는 유전자인 DMPK의 3'-비번역 영역(UTR)에서 CTG 반복의 확장에 의해 야기된다.
하기 표는 DM1 골격근, 심장 또는 뇌에서 잘못 조절된 대안적 스플라이싱을 갖는 것으로 나타난 엑손의 목록을 나타낸다.
본 발명의 효소는 과발현된 RNA 또는 독성 RNA, 예를 들어 DMPK 유전자 또는, 예를 들어 상기 표에서, DM1 골격근, 심장 또는 뇌에서의 잘못 조절된 대안적 스플라이싱 중 임의의 것과 같은 것을 표적화할 수 있다.
본 발명의 효소는 또한 하기 표에 나타난 바와 같은 질병을 유발하는 RNA-의존적 기능(문헌[Cell. 2009 Feb 20; 136(4): 777-793]에 요약됨)에 영향을 미치는 트랜스-작용 돌연변이를 표적화할 수 있다.
본 발명의 효소는 또한 AD와 유사한 NFT를 갖지만 플라크는 없는, 일차 연령-관련 타우병증(PART)/신경섬유 매듭-우세한 노인성 치매, 권투선수치매(만성 외상 뇌병증), 진행핵상마비, 피질기저 변성, 염색체 17에 연관된 전측두엽 치매 및 파킨슨병, 리티코-보디그 병(lytico-Bodig disease)(괌의 파킨슨-치매 복합), 신경절교종 및 신경절세포종, 수막혈관종증, 뇌염후 파킨슨병, 아급성경화범뇌염, 뿐만 아니라 납중독뇌병증, 결절경화증, 할러포르덴-스파츠병(Hallervorden-Spatz disease), 및 리포푸신증, 알츠하이머 병과 같은 일차 및 이차 타우병증을 비롯한 다양한 타우병증(tauopathy)의 치료에 사용될 수 있다. 본 발명의 효소는 또한 스플라이싱 결함 및 질병을 야기하는 시스-작용 스플라이싱 코드 방해 돌연변이를 표적화할 수있다(문헌[Cell. 2009 Feb 20; 136(4): 777-793]에 요약됨). 운동 뉴런 퇴행성 질병 SMA는 SMN1 유전자의 결실로부터 기인한다. 나머지 SMN2 유전자는 엑손 스플라이싱 인핸서(ESE)를 비활성화하고 엑손 스플라이싱 사일렌서(ESS)를 생성하는 엑손 7에서의 C->T 치환을 갖고 있으며, 이는 엑손 7 건너뛰기 및 절단된 단백질(SMNΔ7)을 유도한다. 디스트로핀 유전자의 엑손 31에서의 T->A 치환은 미성숙 종료 코돈(STOP) 및 ESS를 동시에 생성하여 엑손 31 건너뛰기를 유도한다. 엑손 31이 결여된 mRNA는 부분적으로 기능적인 단백질을 생산하기 때문에 이 돌연변이는 DMD의 경미한 형태를 유발한다. 타우 단백질을 인코딩하는 MAPT 유전자의 엑손 10내의 및 이의 다운스트림의 돌연변이는 스플라이싱 조절 요소에 영향을 미치고 엑손 10을 포함하거나 제외하는 mRNA의 정상 1:1 비율을 방해한다. 이것은 4 개 또는 3 개의 미세소관-결합 도메인(4R-타우 및 3R-타우, 각각)을 함유하는 타우 단백질들 사이에서 변동된 균형을 초래하여, 신경병리학적 장애 FTDP-17을 유발한다. 나타난 예는 엑손 10 포함을 촉진하고 증가된 4R-타우 쪽으로 균형을 이동시키는 ESE 기능을 향상시키는 N279K 돌연변이이다. CFTR 유전자 엑손 9의 3' 스플라이스 부위 내의 다형성 (UG)m(U)n 영역은 엑손 9 포함 정도 및 전장 기능성 단백질의 수준에 영향을 주어, CFTR 유전자의 다른 곳에 있는 돌연변이에 의해 유발되는 낭포성 섬유증(CF)의 중증도를 변형시킨다.
선천 면역 시스템은 감염된 세포 내에서 바이러스 핵산을 인식함으로써 바이러스 감염을 일차적으로 검출하는데, 이는 DNA 또는 RNA 감지로 지칭된다. 시험관내 RNA 감지 분석은 특정 RNA 기질을 검출하는 데 사용될 수 있다. RNA 표적화 이펙터 단백질은 예를 들어 살아있는 세포에서의 RNA-기반 감지에 사용될 수 있다. 응용의 예는 예를 들어 질병-특이적 RNA의 감지에 의한 진단이다.
본 발명의 RNA 표적화 이펙터 단백질은, 구체적으로 RNA 바이러스에 대한, 항 바이러스 활성에 추가로 사용될 수 있다. 이펙터 단백질은 선택된 바이러스 RNA 서열에 대해 선택적인 적합한 가이드 RNA를 사용하여 바이러스 RNA에 표적화될 수 있다. 구체적으로, 이펙터 단백질은 단일 가닥 RNA와 같은 RNA를 절단하는 활성 뉴클레아제일 수 있다. 따라서, 항 바이러스제로서의 본 발명의 RNA 표적화 이펙터 단백질의 용도가 제공된다.
RNA 상기 언급된 RNA를 표적화하는 본 발명의 효소 시스템의 치료적 투여량은 약 0.1 내지 약 2 mg/kg 인 것으로 고려되며, 투여량은 모니터링된 반응과 함께 순차적으로 투여될 수 있고, 필요한 경우, 환자 당 약 7 내지 10 투여량까지 투여량 반복될 수 있다. 유리하게는, 치료의 효과를 확인하기 위해 치료 요법 동안 각각의 환자로부터 샘플을 수집한다. 예를 들어, RNA 샘플을 단리하고 정량하여 발현이 감소되거나 개선되는지 여부를 결정할 수 있다. 이러한 진단은 당업자의 이해 범위 내에 있다.
전사물 검출 방법
본 발명의 이펙터 단백질 및 시스템은 세포 또는 다른 샘플에서 RNA의 특이적 검출에 유용하다. 관심 RNA 표적의 존재 하에서, 가이드-의존적 C2c2 뉴클레아제 활성은 부수적 표적에 대한 비-특이적 알엔아제 활성에 의해 수반될 수 있다. 알엔아제 활성을 이용하기 위해서, 필요한 모든 것은 검출 가능하게 절단될 수 있는 리포터 기질이다. 예를 들어, 리포터 분자는 한쪽 끝에 형광 리포터 분자(플루오르)로 다른 쪽에는 소광제로 태깅된 RNA를 포함할 수 있다. C2c2 알엔아제 활성이 부재하는 경우, 소광제의 물리적 근접성은 형광을 플루오르로부터 낮은 수준으로 약화시킨다. C2c2 표적 특이적 절단이 관심 있는 RNA 표적 및 적합한 가이드 RNA의 존재에 의해 활성화될 때, RNA-함유 리포터 분자는 비-특이적으로 절단되고 플루오르 및 소광제는 공간적으로 분리된다. 이것은 적절한 파장의 빛에 의해 여기될 때 플루오르가 검출 가능한 신호를 방출하도록 한다.
일 양태에서, 본 발명은 RNA 표적화 이펙터, 상응하는 RNA 표적에 결합하도록 설계된 하나 이상의 가이드 RNA; 및 RNA-기반 절단 유도성 리포터 작제물을 포함하는 (표적) RNA 검출 시스템에 관한 것이다. 또 다른 양태에서, 본 발명은 RNA 표적화 이펙터, 상기 (표적) RNA에 결합하도록 설계된 하나 이상의 가이드 RNA, 및 RNA-기반 절단 유도성 리포터 작제물을 상기 샘플에 첨가하는 것을 포함하는, 샘플에서 (표적) RNA 검출하는 방법에 관한 것이다. 추가의 양태에서, 본 발명은 본 명세서에서 정의된 (표적) RNA 검출 시스템을 포함하는 키트 또는 장치, 또는 적어도 RNA 표적화 이펙터 및 RNA-기반 절단 유도성 리포터 작제물을 포함하는 키트 또는 장치에 관한 것이다. 추가의 양태에서, 본 발명은 (표적) RNA 검출을 위한 본 명세서에서 정의된 RNA 표적화 시스템 또는 키트 또는 장치의 용도에 관한 것이다. 특정 구현예에서 RNA 표적화 이펙터는 RNA 가이드된 알엔아제이다. 특정 구현예에서, RNA 표적화 이펙터는 CRISPR 이펙터이다. 특정 구현예에서, RNA 표적화 이펙터는 클래스 2 CRISPR 이펙터이다. 특정 구현예에서, RNA 표적화 이펙터는 클래스 2, 제VI형 CRISPR 이펙터이다. 선호되는 구현예에서, RNA 표적화 이펙터는 C2c2이다. 특정 구현예에서, RNA 표적화 이펙터, 바람직하게 C2c2는 본 명세서의 다른 곳에 기재된 종으로부터 유래된다. 본 명세서에 기재된 바와 같이 상기 (표적) RNA에 결합하도록 설계된 가이드 RNA는 RNA 표적화 이펙터와 복합체를 형성할 수 있고 여기서 상기 복합체 내의 가이드 RNA는 표적 RNA 분자에 결합할 수 있어, 역시 본 명세서의 다른 곳에 기재된 바와 같이, 표적 RNA가 절단된다는 것이 이해될 것이다. 가이드 RNA는 전형적으로 본 명세서의 다른 곳에 기재된, 가이드 서열 및 직접 반복을 포함하는 것으로 이해될 것이다. 특정 구현예에서, 하나 이상의 가이드 RNA는 질병 상태에 대해 진단적인 하나 이상의 표적 분자에 결합하도록 설계된다. 특정 구현예에서, 질병 상태는 바이러스, 박테리아, 균류 또는 기생충 감염과 같은 감염이다. 특정 구현예에서, 질병 상태는 비정상적 (표적) RNA 발현을 특징으로 한다. 특정 구현예에서, 질병 상태는 암이다. 특정 구현예에서, 질병 상태는 자가면역 질병이다. RNA-기반 절단 유도성 리포터 작제물은 RNA를 포함하고, RNA의 절단은 검출 가능한 판독 결과를 초래하고, 즉 검출 가능한 신호가 RNA의 절단 즉시 생성된다. 특정 구현예에서, RNA-기반 절단 유도성 리포터 작제물은 형광색소 및 소광제를 포함한다. 당업자는 상이한 유형의 형광색소 및 상응하는 소광제가 사용될 수 있음을 이해할 것이다. 당업자는 본 RNA 절단 리포터 작제물에서의 사용을 위해 조정될 수 있는 다른 유형의 유도성 리포터 시스템을 용이하게 예상할 것이다.
하나의 예시적인 분석 방법에서, C2c2 이펙터, 관심 표적-특이적 가이드 RNA, 및 리포터 분자가 세포 샘플에 첨가된다. 형광의 증가는 관심 RNA 표적의 존재를 암시한다. 또 다른 예시적인 방법에서, 검출 어레이가 제공된다. 어레이의 각각의 위치는 C2c2 이펙터, 리포터 분자, 및 관심 표적-특이적 가이드 RNA로 제공된다. 수행되는 분석에 따라, 어레이의 각각의 위치에서의 관심 표적-특이적 가이드 RNA는 동일하거나 상이할 수 있거나 이들의 조합일 수 있다. 예를 들어, 단일 출처 샘플에서 하나 이상의 표적을 시험하고자 할 때, 상이한 관심 표적-특이적 가이드 RNA가 제공될 수 있다. 예를 들어, 동일한 표적에 대해 다수의 샘플을 시험하고자 할 때, 각각의 위치에서 동일한 관심 표적-특이적 가이드 RNA가 제공될 수 있다.
본 명세서에 사용된 "마스킹 작제물"은 본 명세서에 기재된 활성화된 CRISPR 시스템 이펙터 단백질에 의해 절단되거나 그렇지 않으면 탈활성화될 수 있는 분자를 지칭한다. 특정 예시적 구현예에서, 마스킹 작제물은 RNA-기반 마스킹 작제물이다. 마스킹 작제물은 양성의 검출 가능한 신호의 생성 또는 검출을 방지한다. 양성의 검출 가능한 신호는 당업계에 공지된 광학, 형광, 화학발광, 전기화학적 또는 다른 검출 방법을 사용하여 검출될 수 있는 임의의 신호일 수 있다. 마스킹 작제물은 마스킹 작제물인 제거되거나 그렇지 않으면 침묵될 때까지 검출 가능한 양성 신호의 생성을 방지하거나 검출 가능한 양성 신호의 존재를 마스킹할 수 있다. 용어 "양성의 검출 가능 신호"는 마스킹 작제물의 존재 하에서 검출될 수 있는 다른 검출 가능한 신호와 구별하기 위해 사용된다. 예를 들어, 특정 구현예에서, 마스킹 제제가 존재할 때 제1 신호가 검출될 수 있으며(즉, 음성의 검출 가능한 신호), 그 후 이는 활성화된 CRISPR 이펙터 단백질에 의한 표적 분자의 검출 및 마스킹 제제의 절단 또는 탈활성화 즉시 제2 신호(예를 들어, 양성의 검출 가능한 신호)로 전환된다.
특정 예시적 구현예에서, 마스킹 작제물은 유전자 산물의 생성을 억제할 수 있다. 유전자 산물은 샘플에 첨가되는 리포터 작제물에 의해 인코딩될 수 있다. 마스킹 작제물은 shRHN 또는 siRNA와 같은 RNA 간섭 경로에 관여되는 간섭 RNA일 수 있다. 마스킹 작제물은 또한 마이크로RNA(miRNA)를 포함할 수 있다. 존재하는 동안, 마스킹 작제물은 유전자 산물의 발현을 억제한다. 유전자 산물은 형광 단백질일 수 있거나 마스킹 작제물의 존재가 없었다면 표지된 프로브 또는 항체에 의해 검출 가능할 다른 RNA 전사물 또는 단백질일 수 있다. 이펙터 단백질의 활성화 즉시 마스킹 작제물은 절단되거나 그렇지 않으면 침묵되어 양성의 검출 가능한 신호로서 유전자 산물의 발현 및 검출을 가능하게 한다.
특정 예시적 구현예에서, 마스킹 작제물은 검출 가능한 양성 신호를 생성하는 데 필요한 하나 이상의 시약을 격리하여, 마스킹 작제물로부터의 하나 이상의 시약의 방출이 검출 가능한 양성 신호의 생성을 초래하도록 할 수 있다. 하나 이상의 시약은 결합하여 비색 신호, 화학발광 신호, 형광 신호 또는 임의의 다른 검출 가능한 신호를 생산할 수 있으며, 이러한 목적에 적합한 것으로 알려진 임의의 시약을 포함할 수 있다. 특정 예시적 구현예에서, 하나 이상의 시약은 하나 이상의 시약에 결합하는 RNA 압타머에 의해 격리된다. 하나 이상의 시약은 표적 분자의 검출 즉시 이펙터 단백질이 활성화될 때 방출된다. 특정 예시적 구현예에서, 하나 이상의 시약은, 하나 이상의 RNA 압타머가 단백질에 결합함으로써 단백질이 검출 가능한 신호를 생성할 수 없도록 저해되거나 격리된, 비색, 화학발광 또는 형광 신호와 같은 검출 가능한 신호의 생성을 촉진시킬 수 있는, 효소와 같은 단백질이다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, RNA 압타머는 검출 가능 신호를 생성하는 단백질의 능력을 더 이상 저해하지 않는 정도까지 절단되거나 분해된다.
일 구현예에서, 트롬빈은 예를 들어 다음의 서열을 갖는 저해성 압타머와 함께 신호 증폭 효소로서 사용된다:GGGAACAAAGCUGAAGUACUUACCC. 이 압타머가 절단되면 트롬빈은 활성화되어 펩티드 비색 기질(예를 들어, www.sigmaaldrich.com/catalog/product/sigma/t3068?lang=en®ion=US 참고) 또는 형광 기질(예를 들어, www.sigmaaldrich.com/catalog/product/sigma/b9385?lang=en®ion=US 참고)을 절단할 것이다. 비색 기질, 파라-니트로아닐리드(pNA),는 트롬빈을 위한 펩티드 기질에 공유 결합된다. 트롬빈에 의한 절단 시, pNA는 방출되어 황색으로 되고 쉽게 눈으로 볼 수 있다. 형광 기질은 유사한 원리에 의해 작동하며 트롬빈에 의한 절단 즉시 형광 검출기를 사용하여 검출될 수 있는 청색 형광단인 7-아미노-4-메틸쿠마린을 방출한다. 트롬빈의 대안으로는 유사하게 비색 또는 형광 신호를 생성하는 데 사용될 수 있고 저해성 압타머에 의해 저해될 수 있는 홀스라디시 페록시다제(HRP), β-갈락토시다제 및 송아지 알칼라인 포스파타제(CAP)가 포함된다.
특정 예시적 구현예에서, 마스킹 작제물은 개별 분리된 부피로(아래에서 추가로 정의됨) 고체 기질 상에 고정화될 수 있고 단일 시약을 격리할 수 있다. 예를 들어, 시약은 염료를 포함하는 비드일 수 있다. 고정된 시약에 의해 격리될 때, 개별 비드는 검출 가능한 신호를 생성하기에 너무 분산되어 있지만, 마스킹 작제물로부터의 방출 시, 예를 들어 응집 또는 용액 농도의 단순한 증가에 의해 검출 가능한 신호를 생성할 수 있다. 특정 예시적 구현예에서, 고정화된 마스킹 제제는 표적 분자의 검출 시 활성화된 이펙터 단백질에 의해 절단될 수 있는 RNA-기반의 압타머이다.
특정 다른 예시적 구현예에서, 마스킹 작제물은 용액 중 고정화된 시약에 결합함으로써 시약이 용액 중 유리된 별도의 표지된 결합 파트너에 결합하는 능력을 차단한다. 따라서, 샘플에 세척 단계 적용 시, 표지된 결합 파트너는 표적 분자의 부재 하에 샘플로부터 세척될 수 있다. 그러나, 이펙터 단백질이 활성화되면, 마스킹 작제물은 마스킹 작제물이 시약에 결합하는 능력을 간섭하기에 충분한 정도로 절단되어, 표지된 결합 파트너가 고정화된 시약에 결합할 수 있게 한다. 따라서, 표지된 결합 파트너는 세척 단계 후에 남아있고, 이는 샘플 내 표적 분자의 존재를 나타낸다. 특정 양태에서, 고정화된 시약에 결합하는 마스킹 작제물은 RNA 압타머이다. 고정화된 시약은 단백질일 수 있고, 표지된 결합 파트너는 표지된 항체일 수 있다. 대안적으로, 고정화된 시약은 스트렙타비딘일 수 있고, 표지된 결합 파트너는 바이오틴 표지될 수 있다. 상기 구현예에서 사용된 결합 파트너 상의 표지는 당업계에 공지된 임의의 검출 가능한 표지일 수 있다. 추가적으로 본 명세서에 기재된 전체적인 설계에 따라 다른 공지된 결합 파트너가 사용될 수 있다.
특정 예시적 구현예에서, 마스킹 작제물은 리보자임을 포함할 수 있다. 리보자임은 촉매 특성을 갖는 RNA 분자이다. 리보자임은 천연적인 것 및 설계 제작된 것 모두, RNA를 포함하거나 RNA로 구성되므로, 본 명세서에 개시된 이펙터 단백질에 의해 표적화될 수 있다. 리보자임은 음성의 검출 가능한 신호를 생성하거나 양성의 제어 신호의 생성을 방지하는 반응을 촉매하도록 선택되거나 설계 제작될 수 있다. 활성화된 이펙터 단백질 분자에 의한 리보자임의 탈활성화 시, 음성의 제어 신호를 생성하거나 양성의 검출 가능한 신호의 생성을 방지하는 반응이 제거되어, 양성의 검출 가능한 신호가 검출 가능하게 한다. 일 예시적 구현예에서, 리보자임은 용액이 제1 색으로 보이도록 하는 비색 반응을 촉매할 수 있다. 리보자임이 탈활성화되면, 그 후 용액은 제2 색으로 변하고, 제2 색은 검출 가능한 양성 신호이다. 리보자임이 비색 반응을 촉매하는 데 어떻게 사용될 수 있는지에 대한 예가 문헌[Zhao et al. "Signal amplification of glucosamine-6-phosphate based on ribozyme glmS," Biosens Bioelectron. 2014; 16:337-42]에 기재되어 있고, 이러한 시스템이 어떻게 본 명세서에 개시된 구현예들의 맥락에서 작동하도록 변형될 수 있는지에 대한 예를 제공한다. 대안적으로, 리보자임은, 존재하는 경우, 예를 들어 RNA 전 사물의 절단 산물을 생성할 수 있다. 따라서, 양성의 검출 가능한 신호의 검출은 리보자임의 부재 하에만 생성되는 비-절단 RNA 전사물의 검출을 포함할 수 있다
일 예시적 구현예에서, 마스킹 작제물은 검출 제제가 용액 중 응집되거나 분산되는지 여부에 따라 색을 변화시키는 검출 제제를 포함한다. 예를 들어, 콜로이드 금과 같은 특정 나노입자는 응집체에서 분산된 입자로 이동할 때 가시적인 보라색에서 빨간색으로의 변화를 겪는다. 따라서, 특정 예시적 구현예에서, 이러한 검출 제제는 하나 이상의 가교 분자에 의해 응집체로 유지될 수 있다. 가교 분자의 적어도 일부는 RNA를 포함한다. 본 명세서에 개시된 이펙터 단백질의 활성화 시, 가교 분자의 RNA 부분이 절단되어 검출 제제가 분산되고 대응하는 색 변화를 초래하도록 한다. 특정 예시적 구현예에서, 가교 분자는 RNA 분자이다. 특정 예시적 구현예에서, 검출 제제는 콜로이드성 금속이다. 콜로이드성 금속 물질은 수-불용성 금속 입자 또는 액체 중 분산된 금속 화합물, 하이드로졸 또는 금속 졸을 포함할 수 있다. 콜로이드성 금속은 주기율표의 IA, IB, IIB 및 IIIB 족의 금속뿐만 아니라 전이 금속, 특히 VIII 족의 것들로부터 선택될 수 있다. 선호되는 금속은 금, 은, 알루미늄, 루테늄, 아연, 철, 니켈 및 칼슘을 포함한다. 다른 적합한 금속은 또한 모든 다양한 산화 상태에서의 다음을 포함한다: 리튬, 소듐, 마그네슘, 포타슘, 스칸듐, 티타늄, 바나듐, 크롬, 망간, 코발트, 구리, 갈륨, 스트론튬, 니오븀, 몰리브덴, 팔라듐, 인듐, 주석, 텅스텐, 레늄, 백금 및 가돌리늄. 금속은 바람직하게는 적절한 금속 화합물 유래의 이온 형태, 예를 들어 A13+, Ru3+, Zn2+, Fe3+, Ni2+ 및 Ca2+ 이온으로 제공된다.
특정 다른 예시적 구현예에서, 마스킹 작제물은 검출 가능한 표지에 부착된 RNA 올리고뉴클레오티드 및 그 검출 가능한 표지의 마스킹 제제를 포함할 수 있다. 이러한 검출 가능한 표지/마스킹 제제 쌍의 예는 형광단 및 형광단의 소광제이다. 형광단의 소광은 형광단과 또 다른 형광단 사이의 비-형광 복합체 또는 비-형광 분자의 형성의 결과로서 발생할 수 있다. 이 메커니즘은 기저-상태 복합체 형성, 정적 소광 또는 접촉 소광으로 알려져 있다. 따라서, RNA 올리고뉴클레오티드는 형광단 및 소광제가 접촉 소광이 일어나기에 충분히 근접하도록 설계될 수 있다. 형광단 및 이의 동족 소광제는 당업계에 공지되어 있고 당업자에 의해 이 목적으로 선택될 수 있다. 구체적인 형광단/소광제 쌍은, 형광단/소광제 쌍의 선택이 형광단의 마스킹을 보장하는 것을 제외하고는, 본 발명의 맥락에서 중요하지 않다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, RNA 올리고뉴클레오티드는 절단됨으로써 접촉 소광 효과를 유지하는 데 필요한 형광단과 소광제 사이의 근접성을 단절한다. 따라서, 형광단의 검출은 샘플 내의 표적 분자의 존재를 결정하는 데 사용될 수 있다.
일 예시적 구현예에서, 마스킹 작제물은 양자점을 포함할 수 있다. 양자점은 표면에 부착된 다수의 링커 분자를 가질 수 있다. 링커 분자의 적어도 일부는 RNA를 포함한다. 링커 분자는 한 쪽 말단은 양자점에 부착되고 링커의 길이를 따라 또는 끝 말단들은 하나 이상의 소광제에 부착되어 양자점의 소광이 발생하기에 충분히 근접하게 소광제를 유지시킨다. 링커는 분지될 수 있다. 위와 같이 양자점/소광제 쌍의 선택이 형광단의 마스킹을 보장하는 것을 제외하고는, 양자점/소광제 쌍은 중요하지 않다. 양자점 및 이의 동족 소광제는 당업계에 공지되어 있고 당업자에 의해 이 목적으로 선택될 수 있다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, 링커 분자의 RNA 부분은 절단됨으로써 소광 효과를 유지하는 데 필요한 양자점과 하나 이상의 소광제 사이의 근접성을 제거한다. 일 구현예에서, 양자점은 Qdot® 625 스트렙타비딘 컨쥬게이트(www.thermofisher.com/order/catalog/product/A10196)와 같이 스트렙타비딘 컨쥬게이트된다. RNA는 바이오틴 링커를 통해 부착되고 /5Biosg/UCUCGUACGUUC/3IAbRQSp/ 또는 /5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/ 서열로 소광 분자를 모집하며, 여기서 /5Biosg/는 바이오틴 태그이고 /3IAbRQSp/는 아이오와 검정 소광제이다. 절단 시, 소광제가 방출되고 양자점이 가시적으로 형광을 낼 것이다.
유사한 방식으로, 형광 에너지 전달(FRET)이 검출 가능한 양성 신호를 생성하는 데 사용될 수 있다. FRET은 에너지적으로 여기된 형광단(즉, "공여자 형광단")으로부터의 광자가 또 다른 분자(즉, "수용자")의 전자의 에너지 상태를 더욱 높은 진동 수준의 여기된 단일항 상태로 상승시키는 비-방사성 과정이다. 공여자 형광단은 그 형광단의 형광 특징을 방출하지 않고 기저 상태로 돌아간다. 수용자는 또 다른 형광단 또는 비-형광 분자일 수 있다. 수용자가 형광단인 경우, 전달된 에너지는 그 형광단의 형광 특징으로 방출된다. 수용자가 비-형광 분자인 경우 흡수된 에너지는 열로 손실된다. 따라서, 본 명세서에 개시된 구현예의 맥락에서, 형광단/소광제 쌍은 올리고뉴클레오티드 분자에 부착된 공여자 형광단/수용자 쌍으로 대체된다. 원래의 경우, 마스킹 작제물은 수용자로부터 방출된 형광 또는 열에 의해 검출되는 제1 신호(음성의 검출 가능한 신호)를 생성한다. 본 명세서에 개시된 이펙터 단백질의 활성화 즉시, RNA 올리고뉴클레오티드는 절단되고 FRET는 파괴되어 공여자 형광단의 형광이 이제 검출되게 된다(양성의 검출 가능한 신호).
알엔아제의 검출을 위한 비색 판독결과의 일 방식은 인터칼레이팅 염료에 기반한 것이고, 이는 긴 RNA의 짧은 뉴클레오티드로의 절단에 반응하여 그들의 흡광도를 변화시킨다. 이들 특성을 갖는 몇몇의 기존 염료가 존재한다. Wagner(1983)로부터, 피로닌-Y는 RNA와 복합체화하고 572 nm에서 흡광도를 갖는 복합체를 형성할 것이고; RNA의 절단은 흡광도 손실 및 색 변화를 초래한다. Greiner-Stoeffele(1996)는 유사한 방식으로 메틸렌 블루를 사용하였으며, 알엔아제 활성에 따라 688 nm에서 흡광도가 변하였다.
비색 판독결과의 또 다른 방식은 절단 즉시 색이 변화하는 핵산 기질을 포함한다. Witmer(1991)는, 절단 후 리포터 기를 방출하는, 합성 리보뉴클레오티드 기질인 U-3'-BCIP를 이용하여 650 nm에서의 흡광도 생성을 초래하였다.
CRISPR-Cas 시스템, 그의 성분 및 이러한 성분의 전달에 대한, 양 및 제형에 관한, 본 발명의 실시에 유용한 모든 것 포함하여, 방법, 재료, 전달 비히클, 벡터, 입자, AAV 및 이들의 제조 및 사용을 포함하는, 일반적인 정보 관련하여, 다음을 참조한다: 미국 특허 번호 8,999,641, 8,993,233, 8,945,839, 8,932,814, 8,906,616, 8,895,308, 8,889,418, 8,889,356, 8,871,445, 8,865,406, 8,795,965, 8,771,945 및 8,697,359; 미국 특허 공보 US 2014-0310830(미국 출원 번호 14/105,031), US 2014-0287938 A1(미국 출원 번호 14/213,991), US 2014-0273234 A1(미국 출원 번호 14/293,674), US2014-0273232 A1(미국 출원 번호 14/290,575), US 2014-0273231(미국 출원 번호 14/259,420), US 2014-0256046 A1(미국 출원 번호 14/226,274), US 2014-0248702 A1(미국 출원 번호 14/258,458), US 2014-0242700 A1(미국 출원 번호 14/222,930), US 2014-0242699 A1(미국 출원 번호 14/183,512), US 2014-0242664 A1(미국 출원 번호 14/104,990), US 2014-0234972 A1(미국 출원 번호 14/183,471), US 2014-0227787 A1(미국 출원 번호 14/256,912), US 2014-0189896 A1(미국 출원 번호 14/105,035), US 2014-0186958(미국 출원 번호 14/105,017), US 2014-0186919 A1(미국 출원 번호 14/104,977), US 2014-0186843 A1(미국 출원 번호 14/104,900), US 2014-0179770 A1(미국 출원 번호 14/104,837) 및 US 2014-0179006 A1(미국 출원 번호 14/183,486), US 2014-0170753(미국 출원 번호 14/183,429); 유럽 특허 EP 2 784 162 B1 및 EP 2 771 468 B1; 유럽 특허 출원 EP 2 771 468(EP13818570.7), EP 2 764 103(EP13824232.6), 및 EP 2 784 162(EP14170383.5); 및 PCT 특허 공보 PCT 특허 공보 WO 2014/093661(PCT/US2013/074743), WO 2014/093694(PCT/US2013/074790), WO 2014/093595(PCT/US2013/074611), WO 2014/093718(PCT/US2013/074825), WO 2014/093709(PCT/US2013/074812), WO 2014/093622(PCT/US2013/074667), WO 2014/093635(PCT/US2013/074691), WO 2014/093655(PCT/US2013/074736), WO 2014/093712(PCT/US2013/074819), WO 2014/093701(PCT/US2013/074800), WO 2014/018423(PCT/US2013/051418), WO 2014/204723(PCT/US2014/041790), WO 2014/204724(PCT/US2014/041800), WO 2014/204725(PCT/US2014/041803), WO 2014/204726(PCT/US2014/041804), WO 2014/204727(PCT/US2014/041806), WO 2014/204728(PCT/US2014/041808), WO 2014/204729(PCT/US2014/041809). 또한 다음을 참조한다: 미국 임시 특허 출원 61/758,468; 61/802,174; 61/806,375; 61/814,263; 61/819,803 및 61/828,130, 각각 2013년 1월 30일; 2013년 3월 15일; 2013년 3월 28일; 2013년 4월 20일; 2013년 5월 6일 및 2013년 5월 28일에 출원. 또한 2013년 6월 17일에 출원된 미국 임시 특허 출원 61/836,123을 참조한다. 추가적으로 다음을 참조한다: 미국 임시 특허 출원 61/835,931, 61/835,936, 61/836,127, 61/836,101, 61/836,080 및 61/835,973, 각각 2013년 6월 17일에 출원. 추가로 다음을 참조한다: 2013년 8월 5일 출원된 미국 임시 특허 출원 61/862,468 및 61/862,355; 2013년 8월 28일에 출원된 61/871,301; 2013년 9월 25일에 출원된 61/960,777, 및2013년 10월 28일에 출원된 61/961,980. 더욱 추가적으로 다음을 참조한다: PCT 특허 출원 번호: PCT/US2014/041803, PCT/US2014/041800, PCT/US2014/041809, PCT/US2014/041804 및 PCT/US2014/041806, 각각 2014년 6월 10일에 출원 6/10/14; 2014년 6월 11일에 출원된 PCT/US2014/041808; 및 2014년 10월 28일에 출원된 PCT/US2014/62558, 및 미국 임시 특허 출원 번호: 61/915,150, 61/915,301, 61/915,267 및 61/915,260, 각각 2013년 12월 12일에 출원; 2013년 1월 29일 및 2013년 2월 25일에 출원된 61/757,972 및 61/768,959; 2013년 6월 17일에 출원된 61/835,936, 61/836,127, 61/836,101, 61/836,080, 61/835,973, 및 61/835,931; 62/010,888 및 62/010,879, 둘 다 2014년 6월 11일에 출원; 62/010,329 및 62/010,441, 각각 2014년 6월 10일에 출원; 61/939,228 및 61/939,242, 각각 2014년 2월 12일에 출원; 2014년 4월 15일에 출원된 61/980,012; 2014년 8월 17일에 출원된 62/038,358; 62/054,490, 62/055,484, 62/055,460 및 62/055,487, 각각 2014년 9월 25일에 출원; 및 2014년 10월 27일에 출원된 62/069,243. 또한 다음을 참조한다: 2014년 9월 25일에 출원된 미국 임시 특허 출원 번호 62/055,484, 62/055,460, 및 62/055,487; 2014년 4월 15일에 출원된 미국 임시 특허 출원 61/980,012; 및 2014년 2월 12일에 출원된 미국 임시 특허 출원 61/939,242. 그 중에서도, 미국을 지정한 PCT 출원, 2014년 6월 10일에 출원된 출원 번호 PCT/US14/41806을 참조한다. 2014년 1월 22일에 출원된 미국 임시 특허 출원 61/930,214를 참조한다. 각각 2013년 12월 12일에 출원된 미국 임시 특허 출원 61/915,251; 61/915,260 및 61/915,267를 참조한다. 2014년 4월 15일에 출원된 미국 임시 특허 출원 USSN 61/980,012를 참조한다. 그 중에서도, 미국을 지정한 PCT 출원, 2014년 6월 10일에 출원된 출원 번호 PCT/US14/41806를 참조한다. 2014년 1월 22일에 출원된 미국 임시 특허 출원 61/930,214를 참조한다. 각각 2013년 12월 12일에 출원된 미국 임시 특허 출원 61/915,251; 61/915,260 및 61/915,267를 참조한다.
또한 다음에 대하여 언급된다: 미국 출원 62/091,455, 12-Dec-14 출원, PROTECTED GUIDE RNAS(PGRNAS); 미국 출원 62/096,708, 24-Dec-14, PROTECTED GUIDE RNAS(PGRNAS); 미국 출원 62/091,462, 12-Dec-14, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; 미국 출원 62/096,324, 23-Dec-14, DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS; 미국 출원 62/091,456, 12-Dec-14, ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS; 미국 출원 62/091,461, 12-Dec-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs); 미국 출원 62/094,903, 19-Dec-14, UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING; 미국 출원 62/096,761, 24-Dec-14, ENGINEERING OF SYSTEMS, METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION; 미국 출원 62/098,059, 30-Dec-14, RNA-TARGETING SYSTEM; 미국 출원 62/096,656, 24-Dec-14, CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS; 미국 출원 62/096,697, 24-Dec-14, CRISPR HAVING OR ASSOCIATED WITH AAV; 미국 출원 62/098,158, 30-Dec-14, ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS; 미국 출원 62/151,052, 22-Apr-15, CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING; 미국 출원 62/054,490, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS; 미국 출원 62/055,484, 25-Sep-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/087,537, 4-Dec-14, SYSTEMS, METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/054,651, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 62/067,886, 23-Oct-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO; 미국 출원 62/054,675, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES; 미국 출원 62/054,528, 24-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS; 미국 출원 62/055,454, 25-Sep-14, DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES(CPP); 미국 출원 62/055,460, 25-Sep-14, MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 미국 출원 62/087,475, 4-Dec-14, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/055,487, 25-Sep-14, FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS; 미국 출원 62/087,546, 4-Dec-14, MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES; 및 미국 출원 62/098,285, 30-Dec-14, CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS.
이들 특허, 특허 공보 및 출원 각각, 및 그 안에 또는 그들 절차 중에 인용된 모든 문헌("출원 인용 문헌") 및 상기 출원 인용 문헌에 인용되거나 참조된 모든 문헌은 상기 그 안에 또는 그 안의 및 본 명세서에 참조로서 포함된 임의의 문헌에서 언급된 임의의 제품에 대한 임의의 지침서, 설명서, 제품 명세서, 및 제품 시트와 함께, 참조로서 본 명세서에 포함되며, 본 발명의 실시에 이용될 수 있다. 모든 문헌(예를 들어, 이들 특허, 특허 공보 및 출원 및 출원 인용 문헌)은 각각의 개별적 문헌이 참조로서 포함되는 것으로 구체적이고 개별적으로 표시된 것과 같이 동일한 정도로 참조로서 본 명세서에 포함된다.
또한 CRISPR-Cas 시스템에 관한 일반적인 정보와 관련하여,(또한 본 명세서에서 참조로서 포함되는) 다음이 언급된다:
Multiplex genome engineering using CRISPR/Cas systems. Cong, L., Ran, F.A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P.D., Wu, X., Jiang, W., Marraffini, L.A., & Zhang, F. Science Feb 15;339(6121):819-23 (2013);
RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Jiang W., Bikard D., Cox D., Zhang F, Marraffini LA. Nat Biotechnol Mar;31(3):233-9 (2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering. Wang H., Yang H., Shivalila CS., Dawlaty MM., Cheng AW., Zhang F., Jaenisch R. Cell May 9;153(4):910-8 (2013);
Optical control of mammalian endogenous transcription and epigenetic states. Konermann S, Brigham MD, Trevino AE, Hsu PD, Heidenreich M, Cong L, Platt RJ, Scott DA, Church GM, Zhang F. Nature. Aug 22;500(7463):472-6. doi: 10.1038/Nature12466. Epub 2013 Aug 23 (2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced Genome Editing Specificity. Ran, FA., Hsu, PD., Lin, CY., Gootenberg, JS., Konermann, S., Trevino, AE., Scott, DA., Inoue, A., Matoba, S., Zhang, Y., & Zhang, F. Cell Aug 28. pii: S0092-8674(13)01015-5 (2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases. Hsu, P., Scott, D., Weinstein, J., Ran, FA., Konermann, S., Agarwala, V., Li, Y., Fine, E., Wu, X., Shalem, O., Cradick, TJ., Marraffini, LA., Bao, G., & Zhang, F. Nat Biotechnol doi:10.1038/nbt.2647 (2013);
Genome engineering using the CRISPR-Cas9 system. Ran, FA., Hsu, PD., Wright, J., Agarwala, V., Scott, DA., Zhang, F. Nature Protocols Nov;8(11):2281-308 (2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells. Shalem, O., Sanjana, NE., Hartenian, E., Shi, X., Scott, DA., Mikkelson, T., Heckl, D., Ebert, BL., Root, DE., Doench, JG., Zhang, F. Science Dec 12. (2013). [Epub ahead of print];
Crystal structure of cas9 in complex with guide RNA and target DNA. Nishimasu, H., Ran, FA., Hsu, PD., Konermann, S., Shehata, SI., Dohmae, N., Ishitani, R., Zhang, F., Nureki, O. Cell Feb 27, 156(5):935-49 (2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammalian cells. Wu X., Scott DA., Kriz AJ., Chiu AC., Hsu PD., Dadon DB., Cheng AW., Trevino AE., Konermann S., Chen S., Jaenisch R., Zhang F., Sharp PA. Nat Biotechnol. Apr 20. doi: 10.1038/nbt.2889 (2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and Cancer Modeling. Platt RJ, Chen S, Zhou Y, Yim MJ, Swiech L, Kempton HR, Dahlman JE, Parnas O, Eisenhaure TM, Jovanovic M, Graham DB, Jhunjhunwala S, Heidenreich M, Xavier RJ, Langer R, Anderson DG, Hacohen N, Regev A, Feng G, Sharp PA, Zhang F. Cell 159(2): 440-455 DOI: 10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering, Hsu PD, Lander ES, Zhang F., Cell. Jun 5;157(6):1262-78 (2014).
Genetic screens in human cells using the CRISPR/Cas9 system, Wang T, Wei JJ, Sabatini DM, Lander ES., Science. January 3; 343(6166): 80-84. doi:10.1126/science.1246981 (2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation, Doench JG, Hartenian E, Graham DB, Tothova Z, Hegde M, Smith I, Sullender M, Ebert BL, Xavier RJ, Root DE., (published online 3 September 2014) Nat Biotechnol. Dec;32(12):1262-7 (2014);
In vivo interrogation of gene function in the mammalian brain using CRISPR-Cas9, Swiech L, Heidenreich M, Banerjee A, Habib N, Li Y, Trombetta J, Sur M, Zhang F., (published online 19 October 2014) Nat Biotechnol. Jan;33(1):102-6 (2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex, Konermann S, Brigham MD, Trevino AE, Joung J, Abudayyeh OO, Barcena C, Hsu PD, Habib N, Gootenberg JS, Nishimasu H, Nureki O, Zhang F., Nature. Jan 29;517(7536):583-8 (2015).
A split-Cas9 architecture for inducible genome editing and transcription modulation, Zetsche B, Volz SE, Zhang F., (published online 02 February 2015) Nat Biotechnol. Feb;33(2):139-42 (2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth and Metastasis, Chen S, Sanjana NE, Zheng K, Shalem O, Lee K, Shi X, Scott DA, Song J, Pan JQ, Weissleder R, Lee H, Zhang F, Sharp PA. Cell 160, 1246-1260, March 12, 2015 (multiplex screen in mouse), and
In vivo genome editing using Staphylococcus aureus Cas9, Ran FA, Cong L, Yan WX, Scott DA, Gootenberg JS, Kriz AJ, Zetsche B, Shalem O, Wu X, Makarova KS, Koonin EV, Sharp PA, Zhang F., (published online 01 April 2015), Nature. Apr 9;520(7546):186-91 (2015).
Shalem et al., "High-throughput functional genomics using CRISPR-Cas9," Nature Reviews Genetics 16, 299-311 (May 2015).
Xu et al., "Sequence determinants of improved CRISPR sgRNA design," Genome Research 25, 1147-1157 (August 2015).
Parnas et al., "A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks," Cell 162, 675-686 (July 30, 2015).
Ramanan et al., CRISPR/Cas9 cleavage of viral DNA efficiently suppresses hepatitis B virus," Scientific Reports 5:10833. doi: 10.1038/srep10833 (June 2, 2015)
Nishimasu et al., "Crystal Structure of Staphylococcus aureus Cas9," Cell 162, 1113-1126 (Aug. 27, 2015)
Zetsche et al. (2015), "Cpf1 is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system," Cell 163, 759-771 (Oct. 22, 2015) doi: 10.1016/j.cell.2015.09.038. Epub Sep. 25, 2015
Shmakov et al. (2015), "Discovery and Functional Characterization of Diverse Class 2 CRISPR-Cas Systems," Molecular Cell 60, 385-397 (Nov. 5, 2015) doi: 10.1016/j.molcel.2015.10.008. Epub Oct 22, 2015
Dahlman et al., "Orthogonal gene control with a catalytically active Cas9 nuclease," Nature Biotechnology 33, 1159-1161 (November, 2015)
Gao et al, "Engineered Cpf1 Enzymes with Altered PAM Specificities," bioRxiv 091611; doi: http://dx.doi.org/10.1101/091611 Epub Dec. 4, 2016
Smargon et al. (2017), "Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28," Molecular Cell 65, 618-630 (Feb. 16, 2017) doi: 10.1016/j.molcel.2016.12.023. Epub Jan 5, 2017
이들 각각은 본 명세서에 참조로서 포함되고, 본 발명의 실시에서 고려될 수 있으며, 아래에서 간략히 논의된다:
Cong 외는 스트렙토코커스 테르모필루스 Cas9 및 또한 스트렙토코커스 피오게네스 Cas9 둘 모두를 기초로 하여 진핵 세포에서 사용하기 위해 II형 CRISPR/Cas 시스템을 조작하였고, Cas9 뉴클레아제가 짧은 RNA에 의해 유도되어 인간 및 마우스 세포에서 DNA의 정밀한 절단을 유도할 수 있는 것을 입증하였다. 이들의 연구는 닉킹 효소로 전환됨에 따라 Cas9가 최소의 돌연변이유발 활성을 갖는 진핵 세포에서 상동성-유도된 수복을 촉진하는 데 이용될 수 있음을 추가로 보여준다. 또한, 그들의 연구는 다수의 가이드 서열이 단일의 CRISPR 어레이로 인코딩되어 포유류 게놈 내의 내인성 게놈 유전자좌 위치에서 몇몇의 동시 편집을 가능하게 할 수 있음을 입증하였으며, 이는 RNA-안내된 뉴클레아제 기술의 용이한 프로그램화가능성 및 폭넓은 응용 가능성을 입증한다. 세포에서 서열 특이적 DNA 절단을 프로그램화하기 위해 RNA를 이용하는 이러한 능력은 게놈 조작 도구의 새로운 부류를 규정하였다. 이들 연구는 다른 CRISPR 유전자좌가 포유류 세포로 이식될 수 있고, 또한 포유류 게놈 절단을 매개할 수 있음을 추가로 보여준다. 중요하게는, CRISPR/Cas 시스템의 여러 양태가 그의 효능 및 다능성을 증가시키기 위해 추가로 개선될 수 있음이 예견될 수 있다.
Jiang 외는 스트렙토코커스 뉴모니애 및 에스케리키아 콜라이의 게놈에서 정밀한 돌연변이를 도입시키기 위해 이중-RNA와 복합체화된 클러스터링되고 규칙적으로 산재된 짧은 팔린드로믹 반복부(CRISPR)-회합된 Cas9 엔도뉴클레아제를 이용하였다. 상기 접근법은 돌연변이되지 않은 세포를 사멸시키기 위해 표적화된 게놈 부위에서의 이중-RNA:Cas9-유도된 절단에 의존하며, 선택 마커 또는 반대-선택 시스템의 필요를 회피한다. 상기 연구는 편집 주형에서 수행되는 단일- 및 다중 뉴클레오티드 변화를 만들기 위해 짧은 CRISPR RNA(crRNA)의 서열을 변화시킴에 의한 이중-RNA:Cas9 특이성의 재프로그램화를 보고하였다. 상기 연구는 2 개의 crRNA의 동시 사용이 다중화 돌연변이유발을 가능하게 하는 것을 보여준다. 또한, 상기 접근법이 리컴비니어링(recombineering)과 병용하여 이용된 경우, 스트렙토코커스 뉴모니애에서 기재된 접근법을 이용하여 회수된 세포의 거의 100%가 요망되는 돌연변이를 함유하였고, 에스케리키아 콜라이에서, 회수된 65%가 돌연변이를 함유하였다.
Wang 외는(2013) 배아 줄기 세포에서의 순차적인 재조합 및/또는 많은 시간이 걸리는, 단일 돌연변이를 갖는 마우스의 이종교배에 의한 전통적으로 다수의 단계로 생성된 다수의 유전자에서의 돌연변이를 함유한 마우스들의 일-단계 생성을 위해 CRISPR/Cas 시스템을 사용하였다. CRISPR/Cas 시스템은 작용적으로 중복인 유전자 및 상위 유전자 상호작용의 생체내 연구를 크게 촉진할 것이다.
Konermann 외는(2013) DNA-결합 도메인 기반 CRISPR Cas9 효소 및 또한 전사 활성화제 유사 이펙터의 광학적 및 화학적 조절을 가능하게 하는 다능성이고 강력한 기술에 대한 해당 분야의 요구를 다루었다.
Ran 외는(2013-A) 표적화된 이중-가닥 손상을 도입시키기 위해 쌍을 형성하는 가이드 RNA와 Cas9 닉카아제 돌연변이체를 병용한 접근법을 기재하였다. 이는 가이드 서열에 의해 특정 게놈 유전자좌로 표적되는 미생물 CRISPR-Cas 시스템으로부터의 Cas9 뉴클레아제의 문제를 다루며, 이는 DNA 표적으로의 특정 미스매치를 용인할 수 있고, 이에 의해 바람직하지 않은 표적외 돌연변이유발을 촉진할 수 있다. 게놈 내의 개별의 닉은 높은 정확도로 수복되므로, 적절한 오프셋 가이드 RNA를 통한 동시 닉킹이 이중-가닥 손상에 필요하고, 표적 절단을 위한 특이적으로 인식된 염기의 수를 연장시킨다. 상기 저자는 쌍을 형성한 닉킹을 이용하는 것이 세포주에서 50 내지 1,500 배까지 표적외 활성을 감소시킬 수 있고, 표적에 대한 절단 효율을 희생시키지 않고 마우스 스플라이싱체에서 유전자 녹아웃을 촉진하는 것을 입증하였다. 이러한 다능성 전략은 높은 특이성을 필요로 하는 매우 다양한 게놈 편집 응용을 가능하게 한다.
Hsu 외는(2013) 표적 부위의 선택을 알아내고, 표적외 효과를 피하기 위해 인간 세포에서 SpCas9 표적화 특이성을 특성화하였다. 상기 연구는 293T 및 293FT 세포에서 100 개 초과의 예측 게놈 표적외 유전자좌에서 SpCas9-유도된 삽입-결실 돌연변이 수준 및 700 개 초과의 가이드 RNA 변이체를 평가하였다. 상기 저자는 SpCas9가 미스매치의 수, 위치 및 분포에 민감한 서열-의존성 방식으로 상이한 위치에서 가이드 RNA와 표적 DNA 사이의 미스매치를 용인하는 것을 보고하였다. 상기 저자는 SpCas9-매개 절단이 DNA 메틸화에 의해 영향을 받지 않고, SpCas9 및 sgRNA의 용량을 적정하여 표적외 변형을 최소화시킬 수 있음을 추가로 나타내었다. 또한, 포유류 게놈 조작 응용을 용이하게 하기 위해, 상기 저자는 표적 서열의 선택 및 확인뿐만 아니라 표적외 분석을 안내하기 위해 웹-기반 소프트웨어 도구를 제공한 것을 보고하였다.
Ran 외는(2013-B) 포유류 세포에서 비-상동성 말단 연결(NHEJ) 또는 상동성-유도 수복(HDR)뿐만 아니라 다운스트림 기능성 연구를 위한 변형된 세포주의 생성을 통한 Cas9-매개 게놈 편집을 위한 일련의 도구를 기재하였다. 표적외 절단을 최소화시키기 위해, 상기 저자는 쌍을 형성한 가이드 RNA와 함께 Cas9 닉카아제 돌연변이체를 이용한 이중-닉킹 전략을 추가로 기재하였다. 상기 저자에 의해 제공된 프로토콜은 표적 부위의 선택, 절단 효율의 평가 및 표적외 활성의 분석을 위한 가이드를 실험적으로 유래하였다. 상기 연구는 표적 설계로 시작하여, 유전자 변형은 1 내지 2 주만큼 적은 기간 내에 달성될 수 있고, 변형된 클론성 세포주가 2 내지 3 주 내에 유래될 수 있음을 나타내었다.
Shalem 외는 게놈-전체에 걸친 규모에서 유전자 기능을 질의하기 위한 새로운 방식을 기재한다. 그들의 연구는 64,751 개의 독특한 가이드 서열을 이용하여 18,080 개 유전자를 표적화시킨 게놈-규모의 CRISPR-Cas9 녹아웃(GeCKO) 라이브러리의 전달이 인간 세포에서 음성 및 양성 선택 스크리닝 둘 모두를 가능하게 하는 것을 보여주었다. 먼저, 상기 저자는 암 및 만능성 줄기 세포에서세포 생존력에 필수적인 유전자를 확인하기 위한 GeCKO 라이브러리의 사용을 보여주었다. 다음으로, 흑색종 모델에서, 상기 저자는 유전자의 소실이 돌연변이 단백질 키나제 BRAF를 억제하는 치료제인 베무라페닙(vemurafenib)에 대한 내성과 관련된 유전자를 스크리닝하였다. 그들의 연구는 가장 높은 순위의 후보물질이 이전에 확인된 유전자 NF1 및 MED12뿐만 아니라 새로운 히트(hit) NF2, CUL3, TADA2B, 및 TADA1을 포함한 것을 나타내었다. 상기 저자는 동일한 유전자를 표적으로 하는 독립적 가이드 RNA와 높은 비율의 히트 확인 사이에 높은 수준의 일치를 관찰하였고, 따라서 Cas9를 이용한 게놈-규모 스크리닝의 가망성을 입증하였다.
Nishimasu 외는 2.5 A°해상도로 sgRNA 및 그의 표적 DNA와의 복합체에서 스트렙토코커스 피오게네스 Cas9의 결정 구조를 보고하였다. 상기 구조는 그들의 계면에서 양으로 하전된 홈에서 sgRNA:DNA 이형이중가닥을 수용하는 표적 인식 및 뉴클레아제 엽으로 구성된 2 엽 구조를 나타내었다. 인식 엽이 sgRNA 및 DNA 결합에 필수적인 반면, 뉴클레아제 엽은 각각 표적 DNA의 상보적 및 비-상보적 가닥의 절단을 위해 적절하게 위치된 HNH 및 RuvC 뉴클레아제 도메인을 함유한다. 뉴클레아제 엽은 또한 프로토스페이서 인접 모티프(PAM)와의 상호작용을 담당하는 카르복실-말단 도메인을 함유한다. 이러한 고-해상도 구조 및 수반하는 기능 분석은 Cas9에 의한 RNA-안내된 DNA 표적화의 분자 메카니즘을 나타내었고, 이에 따라 새로운 다능성 게놈-편집 기술의 합리적 설계를 용이하게 한다.
Wu 외는 마우스 배아 줄기 세포(mESC)에서 단일 가이드 RNA(sgRNA)가 로딩된 스트렙토코커스 피오게네스 유래의 촉매적 비활성 Cas9(dCas9)의 게놈-와이드 결합 부위를 맵핑하였다. 저자는 4 개의 sgRNA 각각이 NGG 프로토스페이서 인접 모티프(PAM) 및 sgRNA 내의 5-뉴클레오티드 씨드 영역을 종종 특징으로 하는 수십 내지 수천 개의 게놈 부위에 대하여 표적 dCas9를 시험한 것을 보여주었다. 염색질 비접근성은 씨드 서열과 일치하는 다른 부위로의 dCas9 결합을 감소시키고; 따라서 표적외 부위의 70%가 유전자와 회합된다. 상기 저자는 촉매적 활성 Cas9로 트랜스펙션된 mESC 내의 295 개의 dCas9 결합 부위의 표적화된 시퀀싱에 의해, 백그라운드 수준 초과로 돌연변이된 단지 하나의 부위가 확인된 것을 나타내었다. 상기 저자는 씨드 매치가 결합을 촉발하나, 표적 DNA와의 광범위한 쌍형성이 절단에 필요한 Cas9 결합 및 절단을 위한 2-상태 모델을 제안하였다.
Platt 외는 Cre-의존성 Cas9 낙인 마우스를 수립하였다. 저자는 뉴런, 면역 세포, 및 상피 세포에서 가이드 RNA의 아데노-관련 바이러스(AAV)-, 렌티바이러스-, 또는 입자-매개된 전달을 이용하여 생체내 및 생체외 게놈 편집을 증명하였다.
Hsu 외는(2014) 요거트부터 세포의 유전적 스크리닝을 포함하는 게놈 편집까지 CRISPR-Cas9 전력를 일반적으로 논의하는 리뷰 기사이다.
Wang 외는(2014) 게놈-규모 렌티바이러스 단일 가이드 RNA(sgRNA) 라이브러리를 이용하는 양성 및 음성 선택 모두에 적합한 풀화된(pooled) 기능 손실 유전학적 스크리닝 시도에 관한 것이다.
Doench 외는 6 개의 내인성 마우스 및 3 개의 내인성 인간 유전자의 패널의 모든 가능한 표적 부위에 걸쳐 타일링하는(tiling) sgRNA의 풀을 만들고, 항체 염색 및 유세포분석기에 의해 표적 유전자의 널 대립형질을 생산하는 그의 능력을 정량적으로 평가하였다. 저자들은 PAM 개선된 활성의 최적화를 보였으며, sgRNA의 설계를 위한 온라인 도구를 또한 제공하였다.
Swiech 외는 AAV-매개된 SpCas9 게놈 편집이 뇌 내 유전자 기능의 역전 유전적 구조를 가능하게 할 수 있음을 증명하였다.
Konermann 외는(2015) 다수의 이펙터 도메인, 예를 들어 전사 활성화제, 예를 들어 작용적 및 후성유전자적 조절제를 링커 없이 또는 링커와 함께 줄기 또는 테트라루프와 같은 가이드 상에서 적절한 위치에 부착시키는 능력을 논의한다.
Zetsche 외는 Cas9 효소가 둘로 분열될 수 있고, 이에 따라 활성화를 위한 Cas9 조립이 제어될 수 있음을 증명한다.
Chen 외는 마우스들에서 게놈-와이드 생체내 CRISPR-Cas9 스크린은 폐 전이를 조절하는 유전자를 드러냄을 증명함에 의한 다중화 스크리닝에 관한 것이다.
Ran 외는(2015) SaCas9 및 게놈을 편집하는 그의 능력에 관한 것으로, 생화학 분석으로부터 추론할 수 없음을 증명한다. Shalem 외(2015)는 촉매적으로 비활성인 Cas9(dCas9) 융합체가 합성적으로 발현을 억제(CRISPRi) 또는 활성화(CRISPRa)하는 데 사용되는 방법을 기재하였고, 이는, 어레이된 및 모아진 스크린을 포함하는, 게놈-규모 스크린, 게놈 유전자좌를 비활성화시키는 녹아웃 접근 및 전사 활성을 조절하는 전략에 Cas9를 사용하는 진보를 보여준다.
Shalem 외는(2015), 촉매적으로 비활성인 Cas9(dCas9) 융합물이 발현을 합성적으로 저해(CRISPRi) 또는 활성(CRISPRa)하는 데 사용되는 방법을 설명하며, 이는 배열되고 풀화된 스크린을 포함하는, 게놈-규모 스크린을 위해 Cas9를 이용하는 진전, 비활성 게놈 유전자좌를 비활성화하는 녹아웃 시도 및 전사 활성을 조절하는 전략을 보여준다.
Xu 외는(2015) CRISPR-기반 스크린에서 단일 가이드 RNA(sgRNA) 효율에 기여하는 DNA 서열 특징을 평가하였다. 저자들은 CRISPR/Cas9 녹아웃 및 절단 부위에서 뉴클레오티드 선호성을 탐구하였다. 저자들은 또한 CRISPRi/a에 대한 서열 선호성이 CRISPR/Cas9 녹아웃에 대한 선호와 실질적으로 상이함을 발견하였다.
Parnas 외는(2015) 박테리아성 지질다당류(LPS)에 의해 종양 괴사 인자(Tnf)의 유도를 제어하는 유전자를 확인하기 위하여 게놈-와이드 풀화된 CRISPR-Cas9 라이브러리를 수지상 세포(DC) 내로 도입하였다. Tlr4 신호화의 알려진 조절자 및 이전에 알려지지 않은 후보물질들이 확인되었으며, LPS에 대한 정규 반응에 대한 구별된 효과를 갖는 3 개의 작용 모듈로 확인되었다.
Ramanan 외는(2015) 감염된 세포에서 바이러스 에피좀성 DNA(cccDNA)의 절단을 증명하였다. HBV 게놈은 공유결합 폐환형 DNA(cccDNA)로도 명명되는 3.2 kb의 이중-가닥 에피좀 DNA 종으로서 감염된 간세포의 핵에 존재하고, 그의 복제가 현재 치료법에 의해 억제되지 않는 HBV 생애 주기에서 주요 성분이다. HBV의 고도로 보존된 영역을 특이적으로 표적화하는 sgRNA가 바이러스 복제 및 손실 된 cccDNA를 저해함을 보여주었다.
Nishimasu 외는(2015) 5'-TTGAAT-3' PAM 및 5'-TTGGGT-3' PAM을 함유하는 단일 가이드 RNA(sgRNA) 및 그의 이중-가닥 DNA 표적과 함께 복합체화되는 SaCas9의 결정 구조를 보고하였다. SpCas9 와 SaCas9의 구조 비교는 구조적 보존 및 다양성 모두에서 강조표시하였으며, 이는 그들의 구별되는 PAM 특이성 및 오솔로그성 sgRNA 인식을 설명한다.
Zetsche 외(2015)는 추정되는 클래스 2 CRISPR 이펙터인 Cpf1의 특징 확인을 보고하였다. Cpf1이 Cas9와 구별되는 특징을 갖는 견고한 DNA 간섭을 매개함이 입증되었다. 이 간섭 메커니즘의 확인은 CRISPR-Cas 시스템에 대한 이해를 넓히고 게놈 편집 응용을 발전시킨다.
Shmakov 외(2015)는 3 가지 별개의 클래스 2 CRISPR-Cas 시스템의 특징 확인을 보고하였다. 확인된 시스템 중 2 개의 이펙터인 C2c1 및 C2c3은 Cpf1과 멀리 관련된 RuvC 유사 엔도뉴클레아제 도메인을 함유한다. 세 번째 시스템 인 C2c2는 2 개의 예측된 HEPN 알엔아제 도메인을 갖는 이펙터를 함유한다.
Gao 외(2016)는 Cpf1의 표적화 범위를 증가시키기 위해 구조-가이드되는 포화 돌연변이 유발 스크린을 사용하여 보고하였다. Cpf1 변이체는 돌연변이 S542R/K607R 및 S542R/K548V/N552R로 설계 제작 되어, 시험관내 및 인간 세포에서 향상된 활성으로 각각 TYCV/CCCC 및 TATV PAM을 갖는 표적 부위를 절단할 수 있다.
또한, 문헌 ["Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Shengdar Q. Tsai, Nicolas Wyvekens, Cyd Khayter, Jennifer A. Foden, Vishal Thapar, Deepak Reyon, Mathew J. Goodwin, Martin J. Aryee, J. Keith Joung Nature Biotechnology 32(6): 569-77(2014)]은, 연장된 서열을 인식하고 인간 세포에서 높은 효율을 갖는 내인성 유전자를 편집할 수 있는 이량체성 RNA-가이드된 FokI 뉴클레아제에 관한 것이다.
추가적으로, 제목이 "DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS인 PCT 출원 PCT/US14/70057, 대리인 참조 47627.99.2060 및 BI-2013/107(2014년 9월 24일에 출원된 미국 임시 특허 출원 62/054,490, 2014년 6월 10일에 출원된 62/010,441 및 각각 2013년 12월 12일에 출원된 61/915,118, 61/915,215 및 61/915,148 중 하나 이상 또는 모두로부터 우선권 주장)("입자 전달 PCT")이 언급되며, 이는 본 명세서에 참조로서 포함되고, 이는 sgRNA 및 Cas9 단백질 (및 선택적으로 HDR 주형)을 포함하는 혼합물을, 계면활성제, 인지질, 생분해성 중합체, 지질단백질 및 알콜를 포함하거나 이로 본질적으로 구성되거나 이로 구성되는 혼합물과 혼합하는 것을 포함하는, sgRNA-및-Cas9 단백질 함유 입자를 제조하는 방법 및 이러한 공정으로부터의 입자에 관한 것이다. 예를 들어, 여기서 Cas9 단백질 및 sgRNA는 적합한, 예를 들어 3:1 내지 1:3 또는 2:1 내지 1:2 또는 1:1의 몰비로, 적합한 온도에서, 예를 들어 15 내지 30 C, 예를 들어 20 내지 25 C, 예를 들어 실온에서, 적합한 시간동안 예를 들어 15 내지 45, 예를 들어 30 분, 유리하게는 멸균된 뉴클레아제 없는 완충액, 예를 들어, 1X PBS에서 함께 혼합되었다. 별도로, 계면 활성제, 예를 들어 양이온성 지질, 예를 들어 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP); 인지질, 예를 들어 디미리스토일포스파티딜콜린(DMPC); 생분해성 중합체, 예를 들어 에틸렌-글리콜 중합체 또는 PEG, 및 지질단백질, 예를 들어 저-밀도 지질단백질, 예를 들어 콜레스테롤과 같은 또는 이를 포함하는 입자 성분이 알코올, 유리하게는 C1-6 알킬 알콜, 예를 들어 메탄올, 에탄올, 이소프로판올, 예를 들어 100% 에탄올에 용해되었다. 두 용액을 함께 혼합하여 Cas9-sgRNA 복합체를 함유하는 입자를 형성시켰다. 따라서, sgRNA는 입자 내 전체 복합체를 만들기 전에 Cas9 단백질과 미리 복합체화될 수 있다. 제형은 세포 내로의 핵산 전달을 촉진시키는 것으로 알려진 상이한 성분의 상이한 몰 비로 제조될 수 있다(예를 들어, 1,2-디올레오일-3-트리메틸암모늄-프로판(DOTAP), 1,2-디테트라데카노일-sn-글리세로-3-포스포콜린(DMPC), 폴리에틸렌 글리콜(PEG) 및 콜레스테롤). 예를 들어 DOTAP:DMPC:PEG:콜레스테롤 몰 비는 DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0; 또는 DOTAP 90, DMPC 0, PEG 10, 콜레스테롤 0; 또는 DOTAP 90, DMPC 0, PEG 5, 콜레스테롤 5일 수 있다. DOTAP 100, DMPC 0, PEG 0, 콜레스테롤 0. 따라서 그 적용은 sgRNA, Cas9 단백질 및 입자를 형성하는 성분을 혼합하는 것;뿐만 아니라 이러한 혼합으로부터의 입자를 포함한다. 본 발명의 일 양태는 입자를 포함할 수 있고; 예를 들어 입자는 예를 들어, 본 발명에서와 같은 sgRNA 및/또는 Cas9를 포함하는 혼합물 및 예를 들어, 입자 전달 PCT에서와 같은, 입자를 형성하는 성분을 혼합함으로써, 입자 전달 PCT의 그것과 유사한 공정을 사용하여, 이러한 혼합으로부터 입자 및 입자들을 형성한다(또는 물론, 본 발명에서와 같은 sgRNA 및/또는 Cas9를 포함하는 다른 입자).
실시예
실시예 1: Cas13a 패밀리의 특징 확인
출원인은 암피실린 내성 박테리아 분석(도 3a)을 사용하여 PFS 선호도 및 활성(도 57a)에 대해 15 개의 Cas13a 오솔로그를 포괄적으로 평가하였다. 간략하게, Cas13a는 무작위 PFS 뉴클레오티드가 측면에 배치된 β-락타마제 전사물 상의 5' 범위의 서열을 표적화하도록 프로그램한다. Cas13a 절단 활성은 암피실린 선택 하에서 박테리아의 사멸을 초래하고, 그 다음에 PFS 손실은 차세대 시퀀싱에 의해 분석한다. 오솔로그 간의 양적 비교를 가능하게 하기 위해, 출원인은 pJ23119 작은 RNA 프로모터의 발현 하에 있는 근처의 단일-스페이서 CRISPR 어레이와 함께 pLac 프로모터 하에 각각의 Cas13a 오솔로그를 클로닝하였다. 이.콜라이에서 Cas13a 오솔로그 플라스미드 각각과 PFS 플라스미드 라이브러리의 동시 형질전환 후, 출원인은 형질 전환체 계수를 통해 박테리아 생존을 측정하였고 렙토트리키아 와데이(LwaCas13a) 유래 Cas13a 오솔로그가 가장 활성있고 렙토트리키아 샤히 Cas13a(LshCas13a)가 그 뒤를 따른다는 것을 발견하였다(도 3c, 3d). LwaCas13a 및 LshCas13a 스크린으로부터의 PFS 분포에 대한 차세대 시퀀싱 분석으로 대부분의 LwCas13a PFS 서열이 손실되었음을 밝혔으며(도 3g 및 57b, 57c), 이는 강력한 LwCas13a RNA 절단 활성을 시사한다. 실제로, 다양한 임계값에서 손실된 PFS 서열에 대한 모티프 분석은 LshCas13a의 예상 3 'H 모티프를 밝혔지만 LwCas13a에 대해서는 유의미한 PFS 모티프가 없었다(도 3h, 56d, 56e). 핵산 검출을 위한 LwCas13a에 대한 최근 발전에서, 출원인은 LwCas13a가 LshCas13a보다 더 활성있음을 발견했으며, 생화학적 특징 확인에 의해 약한 3'H PFS를 발견하였다. LwCas13a는 시험된 15 개의 Cas13a 오솔로그 중 가장 활성있고 박테리아에서 PFS를 갖지 않는 것으로 밝혀졌다.
실시예 2: 진핵 세포에서의 C2c2 발현
다음의 C2c2 오솔로그는 포유류 세포에서의 발현을 위해 코돈 최적화하였다.
상기 종의 단백질 서열을 하기 표에 나열한다.
mCherry 및 선택적으로 NLS 또는 NES와의 C2c2 오솔로그 각각의 융합 작제물을 제조하고 포유류 발현 벡터(도 1a)에 클로닝하였다. 다양한 C2c2 오솔로그를 HEK293T 세포에 형질감염하였고 세포 국소화는 mCherry 발현에 기반하여 평가하였다. C-말단 및 N-말단 NES에 융합될 때, C-말단 및 N-말단 NLS에 융합될 때, 또는 NES 또는 NLS 융합이 없을 때 상이한 C2c2 오솔로그의 대표적인 국소화를 도 1b,c, 및 d에 각각 나타내었다. NES 융합은 효율적으로 C2c2 단백질의 세포질 국소화를 초래하였다. NLS 융합은 효율적으로 C2c2 단백질의 핵 국소화를 초래하였다. 가변적으로, 인 국소화 또한 NLS 융합으로 관찰될 수 있다. C2c2가 NLS 또는 NES에 융합되지 않았을 때, 가변적인 세포질/핵 국소화가 관찰되었다.
실시예 3: 진핵세포에서의 C2c2(Cas13a)의 활성
루시페라제 표적화 분석은 Gluc에 대해 안내되는 상이한 gRNA를 사용하여 도 2에 나타난 바와 같이 수행하였다. C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw2) 및 리스테리아 뉴요켄시스(리스테리아 뉴요켄시스) FSL M6-0635(LbFSL)는 NLS 또는 NES에 융합하였거나 대안적으로 국소화 신호에 융합하지 않았다. 루시페라제의 정규화된 단백질 발현을 결정하고 비 표적화(NT) gRNA와 비교하였다. 결과는 도 4에 나타내었다. 효율적인 녹다운이 명백하였다. 도 4a 및 도 4b에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 4a
가이드 1
ATCAGGGCAAACAGAACTTTGACTCCca
가이드 2
AGATCCGTGGTCGCGAAGTTGCTGGCCA
가이드 3
TCGCCTTCGTAGGTGTGGCAGCGTCCTG
가이드 NT
tagattgctgttctaccaagtaatccat
도 4b
가이드 1
TCGCCTTCGTAGGTGTGGCAGCGTCCTG
가이드 NT
tagattgctgttctaccaagtaatccat
GFP 발현에 기반한 표적화 분석은 EGFP에 대해 안내되는 상이한 gRNA를 사용하여 도 2c에 나타난 바와 같이 수행하였다. C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw2) 및 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)는NLS 또는 NES에 융합하였거나 대안적으로 국소화 신호에 융합하지 않았다. GFP의 정규화된 발현을 결정하고 비 표적화(NT) gRNA와 비교하였다. 결과는 도 5에 나타내었다. 효율적인 녹다운이 명백하였다. 도 5a 및 도 5b에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 5a
가이드 1
tgaacagctcctcgcccttgctcaccat
가이드 2
tcagcttgccgtaggtggcatcgccctc
가이드 3
gggtagcggctgaagcactgcacgccgt
가이드 4
ggtcttgtagttgccgtcgtccttgaag
가이드 5
tactccagcttgtgccccaggatgttgc
가이드 6
cacgctgccgtcctcgatgttgtggcgg
가이드 7
tctttgctcagggcggactgggtgctca
가이드 8
gacttgtacagctcgtccatgccgagag
가이드 NT
tagattgctgttctaccaagtaatccat
도 5b
가이드 2
tcagcttgccgtaggtggcatcgccctc
가이드 3
gggtagcggctgaagcactgcacgccgt
가이드 4
ggtcttgtagttgccgtcgtccttgaag
가이드 5
tactccagcttgtgccccaggatgttgc
가이드 6
cacgctgccgtcctcgatgttgtggcgg
가이드 7
tctttgctcagggcggactgggtgctca
가이드 8
gacttgtacagctcgtccatgccgagag
가이드 NT
tagattgctgttctaccaagtaatccat
표적화 분석은 내인성 표적 유전자에 대해 안내되는 gRNA를 사용하여 HEK293 세포에서 상이한 내인성 표적 유전자에 대해 수행하였다. C2c2 렙토트리키아 와데이F0279(Lw2)를 NES에 융합하였다. 각각의 표적 유전자의 정규화된 단백질 발현을 결정하였다(비 표적화(NT) gRNA와 비교). 결과는 도 7에 나타내었다. 효율적인 녹다운이 명백하였다. 도 7에 기술된 실험에서 사용된 스페이서 서열은 다음과 같다:
도 7
CTNNB1
ctgctgccacagaccgagaggcttaaaa
PPIB
tccttgattacacgatggaatttgctgt
mAPK14
tcaaggtggggtcacaggagaagccaaa
CXCR4
atgataatgcaatagcaggacaggatga
TINCR
gcgtgagccaccgcgcctggccggctgt
PCAT1
ccagctgcagatgctgcagtttttggcg
CAPN1
ctggaaatggaagatgccggcatagcca
LETMD1
gatgacacctcacacggaccacccctag
MAPK14
taatactgctccagatatgggtgggcca
RB1
catgaagaccgagttatagaatactata
TP53
ggtgaaatattctccatccagtggtttc
KRAS
aatttctcgaactaatgtatagaaggca
실시예 4: 번역 활성화제/프로모터에 융합된 촉매적으로 비활성인 C2c2를 이용한 진핵 세포에서의 번역 상향조절
촉매적으로 비활성인 C2c2 오솔로그 렙토트리키아 와데이 F0279(Lw) 및 리스테리아 뉴요켄시스 FSL M6-0635(LbFSL)를 생성하였다.
Lw C2c2를 NES에 또는 국소화 신호없이 및 선택적으로 EIF4E에 융합하였다.
LbFSL을 NLS 및 선택적으로 EIF4E에 융합하였다.
Gluc를 표적화하였다(도 2 참조).
상대 단백질 발현은 EIF4E를 갖거나 갖지 않는 C2c2로 표적화하는 것 간의 비교에 기반하여 평가하였다.
결과를 도 10에 나타내었다.
효율적인 번역 상향조절이 명백하였다. 도 10에 기술된 실험에서 사용된 스페이서 서열은 tagattgctgttctaccaagtaatccat이고, 표적은 이 스페이서에 대한 3x 결합 부위를 갖는다.
실시예 5: NaASO
2
처리시 C2c2 및 이의 표적 베타-액틴의 동시-국소화
소듐 아르세나이트(NaAsO2)의 영향 하에 베타-액틴을 표적화하는 C2c2의 국소화를 조사하였다. 렙토트리키아 와데이 C2c2의 mCherry 및 NES와의 융합 작제물을 제조하고 베타-액틴 표적화 가이드 또는 비-표적화 가이드와 함께 포유류 발현 벡터에 클로닝하였다. C2c2의 세포 국소화는 mCherry 발현에 기반하여 평가하였고, 스트레스 과립은 G3BP1-GFP로 표지하였다. 베타 액틴을 표적화하는 Lw C2c2는 NaAsO2 처리시 스트레스 과립으로 국소화하는 것으로 밝혀졌다(도 11a). 이 국소화는 베타-액팅 표적화 가이드에서만 보였고 비-표적화 가이드에서는 아니었으므로 가이드-의존적이었다(도 11b,c).
실시예 6: 녹다운 활성을 촉진하기 위해 대안적 crRNA 프로모터를 사용함
간섭 효과를 추가로 증가시키기 위해, crRNA를 U6 프로모터 제어 하에 두었다.
C2c2에 의한 간섭 효율을 향상시킬 목적으로, tRNA-crRNA 및 U6로 구동되는 crRNA 및 shRNA를 사용하여 표적화된 유전자의 발현을 비교하였다. 신뢰성있는 표적 유전자의 녹다운이 shRNA와 비슷한 효율로 관찰되었다(도 12, 도 14). 추가의 실험은 crRNA 형질감염 양의 증가(도 13), 단백질 형질전환 양의 증가(도 15)의 효과 및 DR-스페이서-DR-스페이서 작제물의 효과를 결정하기 위해 수행하였다(도 16). C2c2는 내인성 유전자 상의 상응하는 표적에 대해 최적화된 shRNA를 능가하는 것으로 밝혀졌다.
실시예 7: C2c2와의 융합 작제물
도 18에서 입증된 바와 같이, dLw2C2c2-EIF4E 융합은 3 가지 유전자의 번역을 상향 조절할 수 있다; 웨스턴 블롯에서 밴드 강도로 측정되는 단백질 수준.
실시예 8: 표적 유도된 비-특이적 알엔아제 활성
C2c2 표적 유도된 비-특이적 알엔아제 활성은 표본에서 RNA 종을 검출하는 데 유용하다. 관심 RNA 표적이 존재하면, 부수적 표적에 대한 비-특이적 알엔아제 활성은 가이드-의존적 C2c2 뉴클레아제 활성을 동반한다. 예를 들어, 형광 모이어티 및 형광 소광제를 포함하는 리포터 RNA는 활성화된 C2c2에 의해 비-특이적으로 절단된다. RNA 기질은 한쪽 끝에 형광 리포터 분자(플루오르)로 다른 쪽에 소광제로 표시한다. C2c2 알엔아제 활성이 부재하면, 소광제의 물리적 근접성은 플루오르로부터의 형광을 낮은 수준으로 약화시킨다. C2c2 표적 특이적 절단이 활성화될 때, RNA 기질은 비-특이적으로 절단되고 플루오르 및 소광제는 공간적으로 분리된다. 이것은 적절한 파장 길이의 빛에 의해 여기될 때 플루오르로 하여금 신호를 방출하게 한다. 이러한 분석의 개략도가 도 24a에 나타난다.
실시예 9: Lw2C2c2(LwaCas13a)의 생화학적 특징 확인
방법론은 본질적으로 문헌[Abudayyeh et al. (2016) "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector"; Science 353(6299), DOI: 10.1126/science.aaf5573]에 기재된 바와 같고; 본 명세서에 참고로서 포함된다.
박테리아 세포에서의 LwaCas13a의 원하는 절단 활성 때문에, 출원인은 포유류 세포에서의 시험 전에 이의 절단을 더 잘 이해하기 위해 추가의 생화학적 특징 확인을 탐구하였다. LshCas13a 및 LwaCas13a 둘 모두를 사용한 시험관내 절단 반응은 LshCas13a보다 LwaCas13a 효율의 생체내 증가를 확인하는 것뿐만 아니라 28 nt 스페이서를 인코딩하는 가이드를 사용하는 프로그래밍 가능한 표적 절단 및 Mg2+에 대한 필요(도 3i)를 입증하였다. 단일 가닥 RNA 표적(ssRNA 1)의 LwaCas13a 및 가이드와의 인큐베이션은 30 분의 인큐베이션 후 거의 완전한 절단으로 2 분 내에 검출 가능한 절단을 나타낸 반면, 가이드 없는 LwaCas13a에는 관찰 가능한 절단이 없었고(도 37), 절단은 LwaC2c2-가이드 복합체 수준으로 용량 의존적이었다(도 36). 스테레오타입의 절단 생산물의 외관을 고려하여 출원인은 LshCas13a 절단 패턴이 LshCas13a와 유사하게, 표적-의존적이라는 가설을 세웠다(Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)). 다양한 인실리코-예측된 2차 구조(도 42)를 갖는 다수의 RNA 표적과의 인큐베이션은 실질적으로 상이한 절단 패턴을 나타내었다(도 42). LwaCas13a 절단이 표적 상의 노출된 단일 가닥 부위에서의 염기 동일성에 의존하는지 여부를 결정하기 위해, 출원인은 표적 상 LwaCas13a(변형된 ssRNA 표적 4)를 루프 상의 호모폴리머 치환과 인큐베이션하였다(도 43). 출원인은 C 또는 U 치환에서 표적에 대해 더 강한 절단을 발견하였으며(도 43), 이는 LwaCas13a가 U 잔기에서 우선적으로 절단하는 LshCas13a보다 기질 유연성이 더 많음을 나타낸다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 표적 알엔아제 활성에 더하여, Cas13 패밀리는 엘.와디에 유래의 자체 상응하는 pre-crRNA 전사물을 처리하는 것으로 보고되었다(도 43c)(문헌[East-Seletsky, A. et al. Two district RNase activities of CRISPR-C2c2 enable guide-RNA processing and RNA detection, Nature 538, 270-273 (2016)]). 출원인은 또한 스페이서 또는 직접 반복(DR) 서열을 절단함으로써 LwaCas13a 절단에 대한 가이드 제한을 탐구하였다. 출원인은 LwaCas13a가 20 nt만큼 짧은 스페이서 길이로 시험관내 절단 활성을 유지하고(도 41), 27 nt만큼 짧은 DR 절단으로 절단할 수 있으며(도 40), 하나의 DR 길이 절단(32 nt)이 활성을 제거하는 것으로 보일지라도 아마도 2차 구조 변동에 기인함을 발견하였다. 20 nt 미만의 가이드 길이는 더 이상 촉매 활성을 나타내지 않지만, LwaCas13-가이드 복합체는 여전히 결합 활성을 유지할 수 있어 단일 촉매 효소와의 직교 적용이 가능하게 한다(문헌[Dahlman, J. E. et al. Orthogonal gene knockout and activation with a catalytically active Cas9 nuclease. Nat Biotechnol 33, 1159-1161, doi:10.1038/nbt.3390 (2015)]).
Cas13 패밀리는 Cpf1과 유사한 방식으로(문헌[Fonfara, I., Richter, H., Bratovic, M., Le Rhun, A. & Charpentier, E. The CRISPR-associated DNA-cleaving enzyme Cpf1 also processes precursor CRISPR RNA. Nature 532, 517-521, doi:10.1038/nature17945 (2016)]; 문헌[Zetsche, B. et al. Multiplex gene editing by CRISPR-Cpf1 using a single guide array. Nat Biotechnol 35, 31-34, doi:10.1038/nbt.3737 (2017)]), 전장 CRISPR 전사물의 처리를 위한 이중 알엔아제 활성을 갖는 것으로 밝혀졌다(문헌[East-Seletsky, A. et al. Two distinct RNase activities of CRISPR-C2c2 enable guide processing and RNA detection. Nature 538, 270-273, doi:10.1038/nature19802 (2016)]). 출원인은 LwaCas13a가 엘.와데이 유래의 상응하는 CRISPR 스페이서 전사물을 절단할 수 있고(도 3j),이 절단은 농도 의존적임(도 15b)을 밝혀냈다. 또한, LwaCas13a는 겔 전기영동에 의해 분리된 RNA 생산물(도 24c)에 부수적 활성을 나타내어(도 24b), 소광된 형광단 절단에 의해 부수적 활성에 대한 이전의 특징을 확인하였다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]).
렙토트리키아 와데이 F0279(Lwa2) C2c2는 절단 동역학(도 36 내지 37), 양이온의 존재에 대한 절단 활성의 의존성(도 38), PFS 선호(도 39), 직접 반복 길이의 효과(도 40), 스페이서 길이의 효과(도 41), 표적 RNA 서열 및 2차 구조의 효과(도 42) 및 뉴클레오티드 컷 선호(도 43)를 평가하기 위한 시험관내 분석에서 사용하였다.
실시예 10: LwaCas13a는 리포터 mRNA를 녹다운하기 위해 재프로그래밍될 수 있다.
LwaCas13a의 강력한 RNA 절단 활성 및 유연한 서열 선호를 고려할 때, 출원인은 포유류 세포에서 전사물을 절단하는 능력을 평가하기로 결정하였다. 출원인은 먼저 포유류 코돈 최적화된 LwaCas13a를 C- 또는 N-말단 상의 msfGFP 융합 및 이중 인접 핵 방출 서열(NES) 또는 핵 국소화 서열(NLS) 중 하나와 함께 포유류 발현 벡터로 클로닝하고 발현 및 국소화를 평가하였다(도 1d). 출원인은 msfGFP-융합된 LwaCas13a 작제물이 잘 발현되고 국소화 서열에 따라 세포질 또는 핵으로 효과적으로 국소화됨을 밝혔다. LwaCas13a의 생체내 절단 활성을 평가하기 위해 출원인은 가우시아(Gaussia) 루시페라제(Gluc) 및 사이프리디니아(Cypridinia) 루시페라제(Cluc) 모두를 동일 벡터 상의 상이한 프로모터 하에서 발현하는, 이중 루시페라제 리포터 시스템을 개발하여, 하나의 전사물이 Cas13a 표적으로 역할하고 다른 것은 용량 대조군으로 역할하도록 하였다(도 2a). 그 후 출원인은 Gluc에 대한 가이드를 설계하고 tRNAVal-프로모터-발현 가이드 벡터로 이들을 클로닝하였다. 출원인은 LwaCas13a 발현 벡터, 가이드 벡터, 및 이중-루시페라제 작제물을 HEK293FT로 형질감염시키고 형질감염 48 시간 후에 루시페라제 활성을 측정하였다. 출원인은 핵-국소화된 LwaCas13a-msfGFP가 위치 매치된 shRNA 대조군에 유사하게(가이드 1의 경우 78.3%, 가이드 2의 경우 51.1%), 가장 높은 수준의 녹다운을 초래했으며(가이드 1의 경우 75.7%, 가이드 2의 경우 72.9%)(도 6b), 이는 표적 영역에서의 접근 가능성 및 서열을 제어한다. LwaCas13a-msfGFP-NLS 작제물의 우수한 절단 때문에, 출원인은 모든 추가의 녹다운 실험에 이 설계를 사용하였다. 핵 국소화된 LwaCas13a-msfGFP는 또한, 아마도 msfGFP에 의해 제공되는 향상된 안정성으로 인해, mCherry 융합 버전보다 더 좋은 성능을 나타냈다. 설계 제작된 융합에 의해 LwaCas13a 활성을 조작하는 능력은 Cas13a 도구의 유연성을 강조한다. LwaCas13a는 또한 A375 흑색종 세포주에서 녹다운할 수 있어(도 6a, 도 9), Cas13의 다목적성을 입증한다. 출원인은 또한 LwaCas13a가 28 nt의 스페이서 길이로 최상의 Gluc 녹다운을 생산함(73.8%)(도 6c) 및 녹다운은 단백질 및 가이드 또는 crRNA 형질감염된 벡터 양 모두에 용량-반응적임(도 56a,b)을 밝혔다. 가이드 발현은 프로모터 선택에 민감하지 않으며, tRNAVal 또는 U6 프로모터로부터 발현된 가이드 또는 crRNA는 유사한 수준의 Gluc 녹다운을 초래한다(tRNAval의 경우 66.3%, U6의 경우 74.5%)을 초래한다(도 56c).
출원인은 다음으로 3 가지 내인성 유전자인 KRAS, CXCR4 및 PPIB에 대한 녹다운을 시험하였고, 다양한 수준의 녹다운을 밝혔고, 3 가지 유전자 중 2 가지에 대해, LwaCas13a 녹다운(PPIB의 경우 40.4%, CXCR4의 경우 83.9%, KRAS의 경우 57.5%)은 위치 매치된 shRNA를 사용한 RNAi(PPIB의 경우 63.0%, CXCR4의 경우 73.9%, KRAS의 경우 44.3%)와 유사하였다(도 3o). 출원인은 또한 내인성 유전자 녹다운이 tRNAVal 또는 U6 프로모터로부터 발현된 가이드에 대해 유사한 수준의 녹다운으로(tRNAVal에 대해서 86.7%, U6에 대해서 77.6%), 가이드 프로모터 선택에 유연하다는 것을 밝혔다(도 56d). 출원인은 또한 LwaCas13a가 A375 흑색종 세포주에서 녹다운할 수 있음을 밝혔다(도 56e). LwaCas13a 녹다운의 다목적성을 확장하기 위해, 출원인은 벼(Oryza sativa) 유전자 EPSPS, HCT 및 PDS에 대한 전사물에 대한 가이드를 설계하고 LwaCas13a 및 가이드 벡터를 오.사티바 원형질체로 동시 형질감염시켰다(도 3p). 형질감염 후, 출원인은 시험된 3 가지 유전자 모두 및 9 개의 가이드 중 7 개에 대해 50% 초과의 녹다운을 관찰하였고 최고 녹다운은 78.0%였다(도 3q). 함께, 이들 결과는 LwaCas13a가 RNAi와 유사한 수준의 RNA 녹다운을 매개할 수 있음을 시사한다. Cas13 패밀리의 추가적인 구성원에 대한 추가 탐구는 더욱 강력한 녹다운 효과를 달성할 수 있는 단백질을 밝힐 수 있다.
실시예 11: 리포터 및 내인성 전사물에 대한 LwaCas13a 녹다운 스크리닝
LwaCas13a 녹다운의 효율에 대한 RNA 맥락 의존성을 포괄적으로 특징 확인하기 위해, 출원인은 Gluc, KRAS, PPIB 또는 Cluc 전사물의 길이를 따라 가이드를 타일링하기 위한 LwaCas13a의 프로그래밍 가능성을 이용하였다(도 32a). Gluc 및 Cluc 스크린은 60%보다 높은 녹다운을 갖는 가이드를 나타냈고(도 32), Gluc 표적화 가이드 중 대부분은 최대 83%까지의 녹다운으로 50%보다 많은 녹다운을 가졌다. LwaCas13a 녹다운을 RNAi와 비교하기 위해, 출원인은 Gluc 및 Cluc에 대한 상위 3 개 성능 가이드를 선택하고 그들을 위치 매치된 shRNA와 비교하였다. 출원인은 상위 6 개 성능 가이드 중 5 개가 그들의 매치된 shRNA보다 유의미하게 더 높은 수준의 녹다운(p < 0.05)을 달성함을 밝혔다(도 32d).
리포터 유전자에 대한 강력한 녹다운을 입증하여, 출원인은 다음으로 Cas13a가 KRAS 및 PPIB 2 가지 유전자의 타일링을 통해 내인성 전사물을 표적화하도록 설계 제작될 수 있는지 여부를 탐구하였다. 출원인은 녹다운 효율이 전사물 의존적인 반면, 출원인이 KRAS 및 PPIB에 대해 각각 85% 및 75%의 최대 녹다운으로 각 표적에 대해 50% 녹다운을 달성할 수 있는 가이드를 여전히 찾을 수 있음을 밝혔다(도 49a,b). 출원인은 또한 내인성 유전자 녹다운이 tRNAVal 또는 U6 프로모터로부터 발현된 crRNA에 대해 유사한 수준의 녹다운으로, 가이드 발현 설계에 유연함을 밝혔다(도 56d).
LwaCas13 녹다운 대 RNAi 효율을 더 이해하기 위해, 출원인은 동일한 표적 영역에 위치 매치된 shRNA 작제물에 다양한 가이드를 비교하였다. 출원인은 내인성 타일링 스크린(KRAS 및 PPIB) 각각으로부터 상위 3 개의 가이드를 선택하고 shRNA 녹다운(61.8% 내지 95.2%)에 의해 달성된 수준에 동등한 Cas13a를 이용한 강력한 녹다운(53.7% 내지 88.8%)을 관찰하였고, 6 개 가이드 중 2 개에 대해서는 shRNA이 더 좋았고(p<0.01) 6 개 가이드 중 2 개에 대해서는 Cas13a가 더 좋았다(p<0.01)(도 49h).
실시예 12: LwaCas13a 녹다운은 표적 전사물 내의 접근 가능한 부위에서 최적임
출원인은 LshCas13a 활성이 이.콜라이에서 표적 접근 가능성에 의해 좌우됨을 발견했기 때문에(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 출원인은 가이드 타일링 스크린에서 표적화된 4 개의 전사물을 따라 접근 가능성의 영역에 위치하는 가이드에 대해 LwaCas13a 활성이 증가했는지 여부를 조사하기로 결정하였다. 출원인은 먼저 가장 효과적인 가이드가 정의된 영역으로 클러스터를 이루는 것처럼 보임을 발견했고(도 58a) 효과적인 가이드 사이의 쌍 거리를 귀무 분포와 비교함으로써 출원인은 4 개 전사물 모두에 대해 관찰된 가이드가 우연에 의해 예상되는 것보다 유의미하게 더 서로 가깝다는 것을 밝혔다(도 58a). 이들 초기 클러스터링 결과는 접근 가능성의 영역이 더 나은 LwaCas13a 절단 활성을 위해 강화될 수 있음을 시사한다.
전사물 접근 가능성이 LwaCas13a 활성에 영향을 주는지 확인하기 위해, 출원인은 전사물 각각에 걸친 모든 표적 영역의 접근 가능성을 컴퓨터로 예측하고, 이들 컴퓨터 예측이 부분적으로는 녹다운 효율과 상관관계가 있음을 밝혔다(도 58b 내지 58d). 4 개의 표적화된 전사물에 걸쳐, 예측된 표적 접근 가능성은 표적화 효능에서의 변동(녹다운에 있어서 4.4% 내지 16%의 변동)의 일부를 설명할 수 있으며, 이는 접근 가능성이 녹다운 효율의 결정 요인인 반면 염기 동일성, 서열 특성 및 RNA에의 단백질 결합과 같은 다른 인자 또한 표적화 효능에 중요한 역할을 할 수 있음을 나타낸다. 미래에 더욱 광범위한 스크리닝으로 이들 메커니즘을 보다 명확하게 설명할 수 있을 가능성이 있을 것이다.
실시예 13: 내인성 전사물에 대한 LwaCas13a 녹다운 및 RNAi의 비교
LwaCas13 녹다운 대 RNAi 효율을 더 이해하기 위해, 출원인은 동일한 표적 영역에 매치된 shRNA 작제물에 다양한 가이드를 비교하였다. 출원인은 먼저 내인성 타일링 스크린(KRAS 및 PPIB) 각각으로부터 상위 3 개의 가이드를 선택하고, 거의 모든 가이드에 대해 shRNA에 동등한 녹다운으로 Cas13a를 이용한 강력한 녹다운을 관찰하였다(도 49c). shRNA와 추가로 비교하기 위해 출원인은 또한 KRAS, PPIB 및 CXCR4에 대해 RNAx 알고리즘에 의해 예측된 접근 가능성 영역에서의 Cas13a crRNA를 설계했으며 shRNA에 유사한 수준의 녹다운을 발견하였다(도 48d).
실시예 14: MALAT1 IncRNA에 대한LwaCas13a 녹다운 스크리닝
LwaCas13a는 세포 국소화를 위해 설계 제작될 수 있기 때문에, RNA 녹다운을 위해 표적화될 수 있는 세포의 구획에 대하여 다목적성을 갖는다. 출원인은 핵 국소화된 전체 lncRNA MALAT1 전사물에 걸쳐 고르게 타일링된 93 개의 가이드를 설계하고 이들 가이드를 핵 국소화된 LwaCas13a로 형질 감염시켰다. 출원인은 하나의 실험에서 약 40% 내지 50%의 녹다운 만큼까지로, 다양한 수준의 녹다운을 발견하였다(도 49e). 검출 가능한 녹다운을 나타내지 않았던(p > 0.05) 위치 매치된 shRNA와 비교하여, Cas13a는 유의미하게 더 높은 수준의 녹다운(39.0 내지 66.5%, p < 0.05)을 달성하였다(도 49j). 출원인은 또한 lncRNA XIST 전사물을 타일링하여 모든 가이드에 걸쳐 평균 22.0% 및 최대 83.9%의 녹다운을 발견하였다(도 56f).
실시예 15: 내인성 전사물에 대한 다중화된 녹다운
Cpf1과 같은, CRISPR 어레이 처리 활성을 갖는 다른 CRISPR 이펙터는 하나의 프로모터 하에서 다수의 가이드를 발현함으로써 다중화된 유전자 편집을 위해 영향받았다(Zetsche, B. et al. Multiplex gene editing by CRISPR-Cpf1 using a single guide array. Nat Biotechnol 35, 31-34, doi:10.1038/nbt.3737 (2017)). LwaCas13a는 자체 어레이를 처리할 수 있기 때문에 출원인은 단일 프로모터 하에서 발현되는 CRISPR 어레이로서 LwaCas13a 가이드의 다중화된 전달을 시험하기로 결정하였다. 출원인은 내인성 PPIB, CXCR4, KRAS, TINCR, 및 PCAT 전사물에 대해 5 개의 상이한 가이드를 설계하였고, U6 프로모터의 발현 하의, 처리되지 않은 DR 및 절단된 스페이서에 해당하는, 36 nt 직접 반복(DR)이 측면에 배치된 28 nt 가이드를 갖는 CRISPR 어레이로서 표적화 시스템을 전달하였다. 이 접근으로, 출원인은 단일 또는 집단의 가이드 대조군에 유사한, 각각의 유전자에 대한 녹다운 수준을 발견 하였다(도 49f).
표적외 LwaCas13a 활성이 CRISPR 어레이에 의해 표적화된 5 개 전사물의 비-특이적 녹다운을 일으킬 수 있다는 우려 때문에, 출원인은 PPIB, CXCR4 및 KRAS에 대한 3 개 가이드 및 3 개의 가이드 중 각각의 하나가 비-표적화 가이드로 대체된 3 가지 변이체의 다중화된 전달로 실험을 설계하였다. 출원인은 가이드가 어레이에 부재한 각각의 경우에, 누락된 가이드에 의해 표적화된 전사물의 유의미한 녹다운이 없었으며 오직 표적화된 전사물만 LwaCas13a에 의해 녹다운되었음을 밝혔고, 이는 녹다운이 전사물의 비특이적 분해에 기인한 것이 아니고 사실은 LwaCas13a에 의한 특이적, 다중화된 녹다운에 기인한 것임을 입증한다(도 49g).
실시예 16: LwaCas13a 녹다운은 미스매치에 민감함
특이성은 핵산 표적화 도구에 대한 중요 우려이고, RNAi 및 Cas9 DNA-표적화 시스템 모두의 특이성(문헌[Mali, P. et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol 31, 833-838, doi:10.1038/nbt.2675 (2013)]; 문헌[Fu, Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826, doi:10.1038/nbt.2623 (2013)]; 문헌[Pattanayak, V. et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity. Nat Biotechnol 31, 839-843, doi:10.1038/nbt.2673 (2013)]; 문헌[Hsu, P. D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol 31, 827-832, doi:10.1038/nbt.2647 (2013)]; 문헌[Doench, J. G. et al. Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9. Nat Biotechnol 34, 184-191, doi:10.1038/nbt.3437 (2016)])은 광범위하게 특징 확인되었다. LshCas13a의 초기 특징 확인은 시험관내에서 겨우 2 개의 미스 매치에도 민감할 수 있음을 보여주었고(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]), 부수적 효과를 통한 LwaCas13a의 특이성 프로파일링(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)])은 식별이, 가이드:표적 듀플렉스의 씨드 영역에서는 단일-뉴클레오티드 해상도이면서, 2 개 뉴클레오티드 해상도에서 달성될 수 있음을 밝혔다. 생체내에서 Cas13a의 특이성을 조사하기 위해, 출원인은 Gluc(도 29a) 또는 내인성 유전자 CXCR4, KRAS 및 PPIB(도 29b, 도 59a 내지 59b)를 표적화하는 가이드에 미스 매치를 도입하였다. 출원인은 Cas13a 특이성에 대한 이전의 시험관내 특징 확인과 일치하여, 모든 전사물에 대해, 가이드:표적 듀플렉스의 중심 영역이 단일 미스매치에 가장 민감함을 밝혔다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 씨드 영역에서는 녹다운이 감소된 반면, 출원인은 단일 미스매치가 Gluc와 같은 일부 표적 상의 실질적인 수준의 특이성에 충분하지 않음을 밝혔다. Gluc에 대한 스페이서에 대한 연속적인 2 개 미스매치의 타일링은(도 29a) 2 개 미스매치가 8 배까지의 활성 감소를 초래하였음을 밝혔고, 이는 특이적 생체내 표적화 도구로서의 Cas13a의 장래성을 나타낸다. 출원인은 또한 비-연속적인 2 개 미스매치의 효과를 조사하여 대부분의 2 개 미스매치가, 가이드 서열의 5' 또는 3' 말단에 위치하는 2 개 미스매치를 제외하고는, 80.4%에서 60% 미만으로 녹다운을 감소시킴을 밝혔다(도 59c).
시험관내 다중 특이성 파라미터에 걸쳐 Cas13a의 추가 특징 확인을 위해, 출원인은 직접적 Cas13a 활성에 대한 대용물로서 부수적 활성의 검출(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)])을 사용하였다. 더 짧은 스페이서 길이에 의해 특이성이 증가할 수 있음을 나타낸 Cas9 실험 결과를 고려할 때(문헌[Fu, Y., Sander, J. D., Reyon, D., Cascio, V. M. & Joung, J. K. Improving CRISPR-Cas nuclease specificity using truncated guide RNAs. Nat Biotechnol 32, 279-284, doi:10.1038/nbt.2808 (2014)]), 출원인은 스페이서 길이가 단일 미스매치에 의해 상이한 2 개의 표적에 대한 Cas13a 특이성에 영향을 미쳤는지 여부가 궁금하였다. 출원인은 더 짧은 스페이서는 감소된 활성을 갖는 반면(도 59d), 생체내 LwaCas13a 결과로부터 기대되는 바와 같이, 더 짧은 스페이서는 또한 단일 염기-미스매치 구별을 개선함을 밝혔다(도 59d, 59e). 출원인은 이 접근이 LwaCas13a를 이용한 시험관내 단일-미스매치 구별에 성공적으로 사용되었기 때문에(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]), 다음으로 스페이서 서열에서의 추가적인 합성 미스매치를 설계함으로써 특이성이 개선될 수 있는지 여부를 탐구하였다. 출원인은, 전장 스페이서(도 59f, 59g)와 비교하여, 23 nt(59h, 59i) 또는 20 nt(도 59j, 59k)로 절단된 스페이서는 전체 활성은 더 적지만 실질적으로 증가된 특이성을 가짐을 밝혔다. 종합하면, LwaCas13a의 시험관내 및 생체내 설계 제작은 특이적 녹다운 도구로서 이의 사용에 대한 장래성을 나타낸다. 단일-염기 특이성을 부여하기 위해 가이드를 설계 제작하는 능력은 LwaCas13a에 의한 대립 유전자-특이적 전사물 녹다운을 용이하게 할 것이다.
실시예 17: LwaCas13a를 이용한 전사물 녹다운은 매우 특이적임
LwaCas13a 녹다운의 표적외 효과가 있는지 여부를 포괄적으로 이해하기 위해, 출원인은 트랜스크립톰-전체에 걸친 mRNA 시퀀싱을 수행하였다. 출원인은 LwaCas13a 또는 위치 매치된 shRNA 작제물로 Gluc 전사물을 표적화하고, 표적 전사물의 유의미한 녹다운을 발견하였다(도 29b-a). KRAS 및 PPIB의 2 가지 내인성 유전자 상에서의 동일한 비교에 대해서도 유사한 결과가 발견되었다(도 29b-b, 29b-c). shRNA 조건은 LwaCas13a 조건보다 표적화 및 비-표적화 대조군 간에 더 많은 트랜스크립톰-전체에 걸친 변이 및 약한 상관관계를 가졌으며, 이는 shRNA 표적화 실험에서의 더 많은 표적외를 시사한다. 출원인은 차등 발현 분석에 의해 유의미한 표적외 수를 추가로 특징 확인하고 shRNA 조건 각각에서 수백 개의 표적외를 발견하였으나, 표적 전사물의 유사한 수준의 녹다운에도 불구하고(Gluc, KRAS, 및 PPIB 각각에 대하여, shRNA에서는 30.5%, 43.5%, 및 64.7%, Cas13a에서는 62.6%, 27.1%, 및 29.2%)(도 30b), LwaCas13a 조건에서는 표적외를 0 개 발견하였다(도 30a). 출원인은 Gluc 표적화 RNA-seq 비교에 대한 추가적인 분석을 수행하였고, shRNA 조건에서의 가변성의 주된 출처가 개별 반복실험에서의 표적화 및 비-표적화 조건 간의 차이에 기인함을 밝혔다(평균 켄달 타우=0.917)(도 60c 내지 60e). 동일한 조건의 개별 반복실험을 비교할 때 훨씬 높은 상관 관계 및 더 적은 가변성이 있었으며(평균 켄달 타우=0.941), 이는 관찰된 변이가 주어진 shRNA 작제물의 일관된 표적외 효과로부터 나온 것임을 나타낸다. 이 분석을 3 가지 유전자에 대해 분석된 모든 RNA-seq 라이브러리에 걸쳐 적용하면, 모든 LwaCas13a 조건은 전사물 분포의 좁은 다양성으로 인해 상이한 가이드 서열에도 불구하고 서로 높은 상관 관계를 갖는다. 대조적으로, shRNA 조건 각각에 대한 3 가지 반복실험 세트는 각각의 상이한 shRNA 서열에 대한 표적외 변이 양으로 인해 shRNA 조건들 사이보다 세트 내 상관 관계가 더 높다(도 61a, 61b). 또한, 각각의 가이드 조건에 대한 표준 편차의 분포를 3 개의 전사물에 걸쳐 각각의 shRNA 조건에 비교할 때, shRNA 조건에서 유의미하게 더 많은 변이가 관찰된다(p<10-192, 양측 K-S 테스트)(도 61c).
실시예 18: LwaCas13a는 포유류 세포에서 관찰할 수 있는 부수적 활성을 나타내지 않음
Cas13a의 부수적 활성은 시험관내에서 생화학적으로 직접적으로 관찰되고 박테리아에서의 성장 억제를 통해 간접적으로 관찰되었다. 다중화된 단일 제거법(leave-one-out) 및 RNA-seq 분석은 비-특이적 RNA 분해의 결여 및 따라서 포유류 세포에서의 부수적 활성의 결여를 시사하기 때문에 출원인은 부수적 활성으로 인한 전체 표적외 발현의 감소가 녹다운 실험에서 발생했는지 여부를 알아보고 싶었다. 출원인은 표적 전사물 녹다운의 결과로서 대조군에서의 변이가 있었는지 여부를 알아보기 위하여 루시페라제 및 내인성 녹다운 실험에서 유전자 대조군을 분석하였다. 초기 Gluc 타일링 실험으로부터, 많은 가이드가 Gluc의 유의미한 녹다운을 나타낸 반면 Cluc 수준에서는 변이가 거의 없었음이 분명하였다(도 62a, 62b). 그 다음 출원인은 표적내 발현에 대한 표적내 녹다운 또는 표적외 발현에 대한 표적내 녹다운(내인성 표적화의 경우에는 루시페라제 대조군 또는 GAPDH) 간의 상관 관계를 분석하기로 결정하였다. 출원인은 4 가지 표적 각각에 대해, 표적내 녹다운 및 대조군 유전자 발현 사이에 상관 관계는 훨씬 약하거나 없는 반면(Gluc: R=-0.078, p>0.05; PPIB: R=-0.058, p>0.05; KRAS: R=-0.51, p<0.0001)(도 61c 내지 61j), 표적내 녹다운 및 표적내 발현 사이에는 유의미한 양의 상관관계가 있음(Gluc: R=0.89, p<0.0001; PPIB: R=0.81, p<0.0001; KRAS: R=0.52, p<0.0001)을 밝혔으며, 이는 검출 가능한 표적외 녹다운이 없음을 나타낸다.
대조군 발현 및 녹다운 사이의 유의미한 상관 관계의 결여는 포유류 세포에서 LwaCas13a의 부수적 활성이 거의 없거나 전혀 없음을 시사한다. 출원인은 전사물 녹다운 동안의 세포의 성장 제한이 이전에 박테리아에서 관찰된 바와 같이 나타나는지를 알아봄으로써 이것을 더 조사하고자 하였다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 출원인은 Gluc에 대한 다수의 가이드로 선택하거나 선택하지 않고 LwaCas13a를 72 시간 동안 형질감염한 다음 녹다운을 측정한 직후 GFP 형광을 통해 세포 생존력 및 LwaCas13a 발현을 측정하였다. 출원인은 5 개의 모든 Gluc 표적화 가이드에 대해 유의미한 수준의 녹다운을 관찰하였으나(도 30c), 표적화 가이드 및 비-표적화 가이드 대조군 사이에 세포 성장 또는 GFP 형광에서의 유의미한 차이는 없었다(도 30d, 30e).
Cas13a의 부수적 활성은 시험관내에서 생화학적으로 직접적으로 및 박테리아에서 성장 억제를 통해 간접적으로 관찰되었으나, 포유류 세포에서의 이러한 활성의 정도는 불명확하다. 출원인은 RNA 시퀀싱 실험에서 서열-특이적 표적외 LwaCas13a 활성을 발견하지 못했고, 표적화된 전사물의 LwaCas13a-매개된 녹다운은 유사한 수준의 LwaCas13a를 발현하는 포유류 세포의 성장에 영향을 미치지 않았다(도 29g). 추가적으로, 검출 가능한 유전자 발현 변화가 없었으며, 이는 LwaCas13a 표적화의 존재가 트랜스크립톰 수준에서 관찰 가능한 세포 스트레스 반응을 유도하지 않음을 나타낸다(도 29a, 도 60a, 60b)(문헌[Subramanian, A. et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles, Proc. Natl. Acad. Sci USA 102, 15545-15550 (2005)]). 요약하면, 출원인은 낮은 수준의 균일한 부수적 활성 절단이 발생할 수 있는 가능성을 배제할 수 없지만, 출원인은 4 개의 다음 관찰에 걸쳐 검출 가능한 부수적 활성을 발견하지 못했다: 1) 모든 타일링 실험에서, 출원인은 표적 전사물 녹다운 및 인-라인(in-line) 대조군 유전자 녹다운 사이에 유의미한 상관 관계를 관찰하지 못했고(도 62), 2) 출원인은 RNA 시퀀싱 분석에서 트랜스크립톰에 대한 최소한의 변동을 관찰하였으며 유의미한 표적외를 관찰하지 못했고(도 29a), 3) 단일 제거 다중화 실험에서 출원인은 제외된 유전자의 녹다운을 관찰하지 못했고(도 49l), 4) 출원인은 LwaCas13a 표적화로 인한 세포 성장 또는 스트레스에 대한 표현형 효과를 관찰하지 못했다(도 29g).
실시예 19: 포유류 세포에서 dCas13a는 프로그래밍 가능하게 전사물에 결합함
프로그래밍 가능한 RNA-결합 단백질이 광범위한 적용을 위한 기초로서 역할할 수 있기 때문에, 출원인은 LwaCas13a가 촉매적으로 비활성인 변이체(dCas13a)로서 설계 제작될 수 있는지 여부를 탐구하였다. 이전의 연구들은 촉매성 잔기의 돌연변이를 통한 LshCas13a의 비활성화가 알엔아제 활성을 제거하면서도 RNA-결합을 유지함을 입증하였다(문헌[Abudayyeh, O. O. et al. C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector. Science 353, aaf5573, doi:10.1126/science.aaf5573 (2016)]). 출원인은 LwaCas13a에서 촉매적 아르기닌 잔기를 돌연변이시켜 dCas13a를 생성하였으며(도 44a), 리포터 코딩 서열의 5' UTR 업스트림으로의 dCas13a의 표적화가 번역 및 리포터 유전자 발현의 감소를 초래함을 밝혔다(도 63a). dCas13a에 의한 RNA 결합을 정량하기 위해, 출원인은 36 nt DR 및 28 nt 스페이서를 함유하는 가이드를 사용하여 RNA 면역침강(RIP)을 수행하였고(도 58b) 루시페라제 전사물(도 44a) 또는 ACTB mRNA(도 63b) 중 하나에 표적화되는 dCas13a의 풀다운이 비-표적화 대조군 대비 상응하는 표적의 유의미한 강화를 초래하였음을 밝혔고(루시페라제에 대해 7.8 내지 11.2x 강화 및 ACTB에 대해 2.1 내지 3x 강화; p<0.05), 이는 재프로그래밍 가능한 RNA 결합 단백질로서의 dCas13a를 인증하는 것이다.
실시예 20: dCas13a를 이용한 전사물의 음성 패드백 이미징
생체내 이미징을 위해 dCas13a를 설계 제작하고 미결합 단백질로 인한 배경 잡음을 감소시키기 위해, 출원인은 징크 핑거 자가-표적화 및 KRAB 도메인 억제에 기반한 음성-피드백 시스템을 포함시켰다(문헌[Gross, G. G. et al. Recombinant probes for visualizing endogenous synaptic proteins in living neurons. Neuron 78, 971-985, doi:10.1016/j.neuron.2013.04.017 (2013)])(도 44b). 징크 핑거, KRAB 도메인 및 NLS의 dCas13a에의 융합은 음성 피드백 작제물(dCas13a-NF)을 초래하였다. dCas13a-NF가 표적 전사물에 결합하지 않을 경우, 그것은 핵으로 국소화되며 자체 발현을 억제한다. 전사물 결합 시, 새롭게 번역된 dCas13a-NF가 세포질 내에 계속 머무르는 것 또한 가능하나, dCas13a-NF는 세포질 내로 방출되어 발현을 증가시킨다. 전사물 결합의 결과로 보통 수준의 세포질 전위(또는 유지)를 나타내는 dCas13a와 비교하여, dCas13a-NF는 ACTB mRNA에 표적화될 때 효과적으로 전위 또는 재-국소화되었다(도 63e). dCas13a-NF의 전위 정도를 추가로 특징 확인하기 위해, 출원인은 2 개의 가이드로 ACTB 전사물을 표적화하고 두 가이드가 비-표적화 가이드에 비해 전위를 증가시켰음을 밝혔다(3.1 내지 3.7x 세포/핵 신호 비율, p<0.0001)(도 44c, 도 11c 내지 11e). 전위의 정량화는 표적화 가이드가 비-표적화 가이드보다 세포질에서 유의미하게 더 많은 형광 분획을 초래하였음을 나타냈고, 이는 전사물 이미징 도구로서의 dCas13a-NF의 유용성을 보여주었다. dCas13a-NF 이미징을 추가로 검증하기 위해, 출원인은 ACTB mRNA 형광 인 시츄 혼성화(FISH) 신호에 대한 dCas13a-NF 신호의 상관 관계를 분석하였고(도 64a), 표적화 가이드 대 비-표적화 가이드 조건에 대하여 유의미한 상관 관계 및 신호 중첩이 있음을 밝혔다(가이드 1 및 2에 대해 각각 R=0.27 및 0.30, 및 비-표적화 가이드 조건에 대해 R=0.00; p<0.0001(도 64b).
실시예 21: 살아있는 세포에서의 스트레스 과립에 대한 dCas13a 이미징
산화 스트레스는 폴리아데닐화된 전사물 및 단백질을 세포질 내의 스트레스 과립으로 응집되게 하고(문헌[Nelles, D. A. et al. Programmable RNA Tracking in Live Cells with CRISPR/Cas9. Cell 165, 488-496, doi:10.1016/j.cell.2016.02.054 (2016)]; 문헌[Unsworth, H., Raguz, S., Edwards, H. J., Higgins, C. F. & Yague, E. mRNA escape from stress granule sequestration is dictated by localization to the endoplasmic reticulum. FASEB J 24, 3370-3380, doi:10.1096/fj.09-151142 (2010)]), 스트레스 과립의 발달은 암, 신경 퇴행성 질병, 및 근병증을 포함한 많은 병리학과 관련되어 있다(문헌[Wyss-Coray, T. Ageing, neurodegeneration and brain rejuvenation. Nature 539, 180-186, doi:10.1038/nature20411 (2016)]; 문헌[Protter, D. S. & Parker, R. Principles and Properties of Stress Granules. Trends Cell Biol 26, 668-679, doi:10.1016/j.tcb.2016.05.004 (2016)]). 출원인은 스트레스 과립, G3BP1의 잘 알려진 마커(문헌[Tourriere, H. et al. The RasGAP-associated endoribonuclease G3BP assembles stress granules. J Cell Biol 160, 823-831, doi:10.1083/jcb.200212128 (2003)])의 시각화와 전사물의 dCas13a-NF 이미징을 조합함으로써 mRNA의 스트레스 과립으로의 축적을 조사하였다(도 48a). 고정된 샘플에서 mRNA 추적을 확인하기 위해, 출원인은 2 개의 ACTB를 표적화하는 crRNA 또는 가이드 중 하나를 dCas13a-NF와 함께 동시 형질감염하고, 소듐 아르세나이트로 스트레스 과립 형성을 유도하고, 면역 형광으로 G3BP1을 시각화하였다(도 48b). dCas13a-NF는 예상되는 바와 같이 표적화 조건에 대해 세포질 내로 전위되거나 재-국소화되었고, 출원인은 비-표적화 대조군과 비교하여 dCas13a-NF 신호 및 G3BP1 형광 사이에 유의미한 상관 관계를 밝혔으며(가이드 1 및 가이드 2의 경우 각각 R=0.49 및 0.50, 및 비-표적화 가이드의 경우 0.08; p<0.001)(도 48c, 48d), 이는 스트레스 과립 형성을 추적하는 dCas13a-NF의 능력을 시사한다. 고정된 샘플에서의 공동-국소화를 고려할 때, 출원인은 다음으로 살아있는 세포에서 스트레스 과립 추적을 수행하였다. 출원인은 ACTB 표적화 가이드 및 비-표적화 가이드를 dCas13a-NF와 함께 형질 감염시켰으며, 형질 감염 24 시간 후 소듐 아르세나이트로 스트레스 과립 형성을 유도하고, 시간 경과에 따라 살아있는 세포를 이미징하였다(도 48e). 스트레스 과립 마커로서 G3BP1-RFP 융합을 사용하여, 출원인은 ACTB에 표적화되는 dCas13a-NF가 상응하는 비-표적화 대조군보다 시간에 따라 세포 당 유의미하게 더 많은 스트레스 과립으로 국소화함을 밝혔다(p<0.05)(도 48f).
실시예 22: 논의
클래스 2 제VI형 CRISPR-Cas 이펙터 Cas13a는 포유류 세포에서 녹다운하거나 전사물에 결합하는 crRNA 또는 가이드로 효과적으로 재프로그래밍될 수 있다. 출원인은 박테리아에서 RNA 절단을 위한 15 가지 Cas13a 오솔로그 중 가장 활성인 것으로 LwaCas13a를 동정하고 RNAi에 유사한 수준으로의 포유류 RNA 녹다운을 위해 이를 이용하였다. 출원인은 박테리아 스크리닝을 통해 검출 가능한 PFS가 없으며 가이드 활성이 PFS에 의해 영향을 받지 않음을 밝혔다. LwaCas13a는 생체내 스페이서:표적 듀플렉스에서의 미스매치에 민감하며, 이 민감성은 RNAi에 비해 높은 특이성의 녹다운으로 번역된다. 출원인은 또한 RNA 녹다운 도구로서의 LwaCas13a의, 단백질을 추가로 설계 제작하고 최적화할 수 있는 능력, 가이드의 다중화된 전달, 및 핵 lncRNA의 녹다운을 포함하는, 특유의 특성을 자세히 보여주었다. 중요하게는, 출원인은 LwaCas13a의 부수적 활성을 관찰하지 못하였으며, 이 특징은 시험관내에서 매우 활성있고 진단과 같은 많은 응용에 유용하다(문헌[Gootenberg, J. S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2. Science 인쇄중 (2017)]). 또한, 출원인은 LwaCas13a가 촉매적으로 비활성으로 되어, 프로그램 가능한 RNA 결합 플랫폼으로서 사용될 수 있음을 보여주고, 출원인은 살아있는 세포에서 스트레스 과립에의 전사물 축적을 추적하기 위한 이의 유용성을 입증하였다.
중요하게도, 출원인은 포유류 세포에서 LwaCas13a의 부수적 활성을 관찰하지 못했고, 이는 출원인이 시험관내에서 관찰하여 진단 응용을 위해 이용한 특징이다(문헌[Gootenberg, J.S. et al. Nucleic acid detection with CRISPR-Cas13a/C2c2, Science, 인쇄중 (2017)]). 부수적 활성은 집단으로부터 감염된 세포를 제거하거나 감염된 세포에게 감염에 적응하고 극복할 시간을 제공하는, 본래 박테리아 세포에서의 프로그램된 세포 사멸/휴지 경로의 일부로 추정되었고, 이는 Cas13a 의 표적내 바이러스 전사물 절단 활성을 보충한다. 포유류 세포에서의 부수적 활성의 결여는 본래의 세포 맥락에서 이의 존재 가능성을 배제하지 않는다.
Cas13 패밀리 구성원에 기반한 RNA-표적화 도구의 개선 및 다양화를 위한 많은 기회가 있다. Cas13b(문헌[Smargon, A. A. et al. Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28. Mol Cell 65, 618-630 e617, doi:10.1016/j.molcel.2016.12.023 (2017)]) 또는 Cas13c(문헌[Shmakov, S. et al. Diversity and evolution of class 2 CRISPR-Cas systems. Nat Rev Microbiol 15, 169-182, doi:10.1038/nrmicro.2016.184 (2017)])와 같은 추가적인 Cas13 단백질의 생체내 특징 확인은 절단 또는 결합 능력의 추가 개선을 산출할 수 있으며, 다중 색상 이미징을 포함하는, 직교 RNA 결합 단백질을 필요로 하는 응용을 가능하게 할 수 있다. 추가적으로, 더 작은 오솔로그는 아데노-관련 바이러스 벡터와 같은 크기-제한적 전달 선택지를 가능하게 할 것이다(문헌[Ran, F. A. et al. In vivo genome editing using Staphylococcus aureus Cas9. Nature 520, 186-191, doi:10.1038/nature14299, nature14299 [pii] (2015)]). 마지막으로, 증가된 구조 데이터(문헌[Liu, L. et al. Two Distant Catalytic Sites Are Responsible for C2c2 RNase Activities. Cell 168, 121-134 e112, doi:10.1016/j.cell.2016.12.031 (2017)])와 결합된 Cas13 구성원의 다양성에 대한 탐구는 생물 정보학-(문헌[Zinn, E. et al. In Silico Reconstruction of the Viral Evolutionary Lineage Yields a Potent Gene Therapy Vector. Cell Rep 12, 1056-1068, doi:10.1016/j.celrep.2015.07.019 (2015)]) 또는 구조-(문헌[Kleinstiver, B. P. et al. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature 529, 490-495, doi:10.1038/nature16526 (2016)]; 문헌[Slaymaker, I. M. et al. Rationally engineered Cas9 nucleases with improved specificity. Science 351, 84-88, doi:10.1126/science.aad5227 (2016)]) 안내되는 합리적 설계를 가능하게 할 수 있다. 개선된 RNA 결합 도구는 분할된 형광단의 재구성을 통한 이미징(문헌[Ozawa, T., Natori, Y., Sato, M. & Umezawa, Y. Imaging dynamics of endogenous mitochondrial RNA in single living cells. Nat Methods 4, 413-419, doi:10.1038/nmeth1030 (2007)]), 번역 조절(문헌[De Gregorio, E., Preiss, T. & Hentze, M. W. Translation driven by an eIF4G core domain in vivo. EMBO J 18, 4865-4874, doi:10.1093/emboj/18.17.4865 (1999)]; 문헌[Adamala, K. P., Martin-Alarcon, D. A. & Boyden, E. S. Programmable RNA-binding protein composed of repeats of a single modular unit. Proc Natl Acad Sci U S A 113, E2579-2588, doi:10.1073/pnas.1519368113 (2016)]; 문헌[Campbell, Z. T., Valley, C. T. & Wickens, M. A protein-RNA specificity code enables targeted activation of an endogenous human transcript. Nat Struct Mol Biol 21, 732-738, doi:10.1038/nsmb.2847 (2014)]; 문헌[Cao, J. et al. Light-inducible activation of target mRNA translation in mammalian cells. Chem Commun (Camb) 49, 8338-8340, doi:10.1039/c3cc44866e (2013)]; 문헌[Cooke, A., Prigge, A., Opperman, L. & Wickens, M. Targeted translational regulation using the PUF protein family scaffold. Proc Natl Acad Sci U S A 108, 15870-15875, doi:10.1073/pnas.1105151108 (2011)]), RNA 염기 편집(문헌[Nishikura, K. A-to-I editing of coding and non-coding RNAs by ADARs. Nat Rev Mol Cell Biol 17, 83-96, doi:10.1038/nrm.2015.4 (2016)]; 문헌[Wedekind, J. E., Dance, G. S., Sowden, M. P. & Smith, H. C. Messenger RNA editing in mammals: new members of the APOBEC family seeking roles in the family business. Trends Genet 19, 207-216, doi:10.1016/S0168-9525(03)00054-4 (2003)]), 후성트랜스크립톰 변동(문헌[Harcourt, E. M., Kietrys, A. M. & Kool, E. T. Chemical and structural effects of base modifications in messenger RNA. Nature 541, 339-346, doi:10.1038/nature21351 (2017)]), RNA 발현 수준에 기반한 아폽토시스의 표적화된 유도(문헌[Rider, T. H. et al. Broad-spectrum antiviral therapeutics. PLoS One 6, e22572, doi:10.1371/journal.pone.0022572 (2011)]), 또는 스플라이싱 조절(문헌[Wang, Y., Cheong, C. G., Hall, T. M. & Wang, Z. Engineering splicing factors with designed specificities. Nat Methods 6, 825-830, doi:10.1038/nmeth.1379 (2009)])을 포함하는, 추가적인 기능화를 가능하게 할 것이다.
Cas13a를 이용한 RNA 녹다운은 게놈-전체에 걸쳐 모아진(pooled) 녹다운 스크리닝, lncRNA 및 발생기 전사물 기능에 대한 조사, 대립 유전자-특이적 녹다운, 및 RNA 바이러스 치료제를 포함하는, 다수의 생물학적 맥락에서 RNA를 변동시키는 데 적용될 수 있다. 추가적으로, dCas13a 및 유도체는 RNA-단백질 상호 작용 연구, 살아있는 세포에서 전사물 추적, 및 RNA 수준에 기반한 세포의 표적화된 파괴를 위해 RNA 풀다운을 가능하게 하며, 이는 특정 세포 집단을 연구하거나 암세포를 죽이는 데 유용할 것이다. 출원인은 Cas13이 포유류 및 식물 세포에서 프로그래밍 가능한 녹다운 및 RNA 결합 모두를 위한 견고한 플랫폼임을 보여주었으며, 이 플랫폼은 다른 진핵 생물으로도 확장될 수 있다. 창조적인 설계 제작 접근과 결합된 CRISPR-Cas13은 핵산 기반 진단 및 치료제를 위한 강력한 플랫폼이 될 것이며 트랜스크립톰 연구에 혁명을 불러올 수 있다.
실시예 23: 아폽토시스를 위한 분할 설계
특정 세포 유형의 역할을 연구하기 위한 기초 생물학 적용 또는 암 또는 노화 세포 청소와 같은 치료적 적용을 위해, 전사적 특징 또는 특정 유전자 발현에 기반하여 세포를 손실시키거나 사멸시키는 것이 종종 바람직하다(문헌[Baker, D.J., Childs, B.G., Durik, M., Wijers, M.E., Sieben, C.J., Zhong, J., Saltness, R.A., Jeganathan, K.B., Verzosa, G.C., Pezeshki, A., et al. (2016). Naturally occurring p16(Ink4a)-positive cells shorten healthy lifespan. Nature 530, 184-189]). 이 표적화된 세포 사멸은 분할된 아폽토시스 도메인을 Cas13 단백질에 융합시킴으로써 달성될 수 있는데, 이는 전사물에 결합 즉시 재구성되어, 표적화된 유전자 또는 유전자 세트를 특이적으로 발현하는 세포의 사멸을 유도한다. 특정 구현예에서, 아폽토시스 도메인은 분할된 카스파제 3일 수 있다(문헌[Chelur, D.S., and Chalfie, M. (2007). Targeted cell killing by reconstituted caspases. Proc. Natl. Acad. Sci. U. S. A. 104, 2283-2288]). 다른 가능성으로는 Cas13 결합을 통해 2 개의 카스파제 8(문헌[Pajvani, U.B., Trujillo, M.E., Combs, T.P., Iyengar, P., Jelicks, L., Roth, K.A., Kitsis, R.N., and Scherer, P.E. (2005). Fat apoptosis through targeted activation of caspase 8: a new mouse model of inducible and reversible lipoatrophy. Nat. Med. 11, 797-803]) 또는 카스파제 9(문헌[Straathof, K.C., Pule, M.A., Yotnda, P., Dotti, G., Vanin, E.F., Brenner, M.K., Heslop, H.E., Spencer, D.M., and Rooney, C.M. (2005). An inducible caspase 9 safety switch for T-cell therapy. Blood 105, 4247-4254]) 이펙터를 근접하게 가져오는 것과 같은, 카스파제의 결집이다. 전사물 상의 Cas13 결합을 통해 분할된 TEV를 재구성하는 것도 또한 가능하다(문헌[Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease. Cell 142, 637-646]). 이 분할된 TEV는 발광 및 형광 판독을 포함하는, 다양한 판독에서 사용될 수 있다(문헌[Wehr, M.C., Laage, R., Bolz, U., Fischer, T.M., Grunewald, S., Scheek, S., Bach, A., Nave, K.-A., and Rossner, M.J. (2006). Monitoring regulated protein-protein interactions using split TEV. Nat. Methods 3, 985-993]). 일 구현예는, 세포 사멸을 초래하는, 변형된 프로-카스파제 3 또는 프로-카스파제 7을 절단하기 위한 이 분할된 TEV의 재구성을 수반한다(문헌[Gray, D.C., Mahrus, S., and Wells, J.A. (2010). Activation of specific apoptotic caspases with an engineered small-molecule-activated protease. Cell 142, 637-646]).
실시예 24: 이미징을 위한 분할 설계
현재의 출원에서 언급되었지만, 2 개의 Cas13 단백질이 전사물에 결합한 즉시 분할된 형광단의 재구성을 통한 감소된 배경을 갖는 이미징을 위해 추가적인 분할된-형광단 작제물을 설계하였다. 이들 분할된 단백질로는 iSplit(문헌[Filonov, G.S., and Verkhusha, V.V. (2013). A near-infrared BiFC reporter for in vivo imaging of protein-protein interactions. Chem. Biol. 20, 1078-1086.)], Split Venus(문헌[Wu, B., Chen, J., and Singer, R.H. (2014). Background free imaging of single mRNAs in live cells using split fluorescent proteins. Sci. Rep. 4, 3615.]), 및 Split 초양성 GFP(문헌[Blakeley, B.D., Chapman, A.M., and McNaughton, B.R. (2012). Split-superpositive GFP reassembly is a fast, efficient, and robust method for detecting protein-protein interactions in vivo. Mol. Biosyst. 8, 2036-2040.])가 포함된다.
실시예 25: 추가적인 전사 활성, 루시페라제를 위한 분할 설계
Cas13 단백질에 의해 구성될 수 있는 추가적인 가능한 분할 융합은 발광 이미징을 위한 루시페라제(문헌[Kim, S.B., Ozawa, T., Watanabe, S., and Umezawa, Y. (2004). High-throughput sensing and noninvasive imaging of protein nuclear transport by using reconstitution of split Renilla luciferase. Proc. Natl. Acad. Sci. U. S. A. 101, 11542-11547]) 또는 RNA-감지 기반 방식의 유전자 회로의 유전자 발현을 구동하기 위한 분할된 전사 인자를 포함할 수 있다. 가능한 분할된 전사 인자로는, 분할된-유비퀴틴-LexA 시스템과 같은 분할된-유비퀴틴 기반 시스템(문헌[Petschnigg, J., Groisman, B., Kotlyar, M., Taipale, M., Zheng, Y., Kurat, C.F., Sayad, A., Sierra, J.R., Mattiazzi Usaj, M., Snider, J., et al. (2014). The mammalian-membrane two-hybrid assay (MaMTH) for probing membrane-protein interactions in human cells. Nat. Methods 11, 585-592])이 포함된다.
실시예 26: C2c2 오솔로그의 동정
하기 C2c2 오솔로그는 포유류 세포에서 발현을 위해 코돈 최적화될 수 있다.
상기 종의 단백질 서열을 하기 표에 나열한다.
실시예 27: C2c2 오솔로그의 동정
특정 Cas13b 오솔로그는 놀랍게도 C2c2와 유사하다. 도 54는 C2c2 및 Cas13b 단백질의 트리 정렬을 제공한다. 다음의 Cas13b 단백질은 포유류 세포에서 발현을 위해 코돈 최적화될 수 있다.
실시예 28: C2c2 오솔로그의 식별
C2c2 효소의 특성을 개선하거나 달리 변경하기 위해, 아미노산의 변형을 수행한다. 변화 가능한 잔기는 보존된 하전 잔기의 서브세트로 확인된다. 이들 잔기는 도 53의 정렬에서 80% 초과의 보존을 갖는다. 이들은 비하전 잔기(전형적으로 알라닌)로 변화될 수 있다. 표시된 잔기 중 하나 이상이 돌연변이되었다. 아미노산 잔기 넘버링은 도 66(맨윗 줄)에 표시된 컨센서스 넘버링에 상응하며, 아래에 재현되었다:
MWISIKTLIHHLGVLFFCDMGNLFGHMKIXKVXHEKRXAKXKXPXKKVXVKRKYSGGGLLLNYNENPNKNKSXENILIKKKISFXXLKSSSKLBKTINKPDXKKXXXXLQWFLSEIVKKINRRNGLVLSDMLSVDKRXXEKIXEKXXXLKYFXXXXXXLXKLHQEKPSKKLFNLKDLKEXEEXVLFLKXKFKNEJXYXXENDXXKDIEKILXEXLRXGFXPADKKLKXKFLIEXXWGIFSXXXKLEPYXIQEDFXEXYIEDFKKLNKXKXJXKSIENNKIVSQKSSDSQIYEXGKNIIMSXXGXIESIIEXXSKRKXXLDKYATXXLXEKLLLDEXLXIEQXXXNXXEXXDKLASNLKXYXLXKLYFYVKXDKKKSXXEVAKAAVSAAKDXNKDKYQNEVWXXHEXRKEDKRDFIXXXLEIXXIXKXIXKVKXXIXKXAXXEAXEXIKXXNIGKYRXXJDLFELEEDNXLNQFXXFVNIEXXKFFXHYXPNXIKRIXXXKNDAXAXXLKXGELXKKVEKQLKNGALSIYXIXXGKAVYYXXFAMKXLADSDYWTXKDLEXIKISEAFLRKFIGACSFAYXSLXAXNILQPECXXDILGKGDLLXKATVNIXQXXSEHIMYLGKLRHNDIDXLLXFKEDIAKSTXKXGXGXLXKNLIQFFGGESTWDNKIFXAAYXXXLXGXXENEDFLGWALRGAIXSIRNEXFHSFKIKKHXXXXFLNIXNFIXXKLXEFEKXXXXKXKEXXHXXXTSYXXXLIKKLFXNEXXKXXLPXXIKELKLKSSGVXMYYSXDDLKKLLENIYFKFSLLKIXEENXEXAXFVPSFKKVYXRADGVKGFDYQXXXTRXHAYXLKLXPFFDXEEXEXEAFNARYYLLKXIYYNXILEXXXEENEXXXXFLPKFXXXNNXAFREXXNFXADXIEXYYKRLQINKKKGAXKXXKKKXQXKVXNXYNRKXFAYAFENIRXMXFXETPREYMQYIQSEYXIENNGKEXKKSXXENKRNKDXFXHXEKFLLQVFIKGFDXYJDXRXENFXFILXPEPQNGTKEYLYEEXXAILDEXXXXNXLRXXXITXNKXLKLXEFJPEXKSDIKVXPXLVEEIYDYIKKIKINKIKKDXEJAFWQDAALYLFCEKLLDARHLSXXLRXELIKYKQFXKDIKXRAXXNGNXINHSXXXNXXXVXECTDELEIIELXLLLNDRXSNDFKDYFDDEEAXIXXXXLCRIIFYAEYLXKYXKEEDDXXXXAEXXXFXALEPFCQSDTAREAKNDIYXDGGXNPELRVPILNRGIXQXKKIYGTEXXLEKLFDKNXLFBIDGXBIPXFKVSEEXAIIXEXXEKKXEIXEXSQYKXRGELHTEWXQKAREIEEYXXXXXKXKFXKKPQNXXFEKRFIEKHGQEYKKAXXXIXEYXWLKNKVEXNXLNELHELLIXLLGRLIGYSALFERDLQYFXNGFHYXCLNNDXEKLAXYXNJSXVXXKNRXIXKAXLYQIFAMYXXGLPFYSKDXDXXXAXXSGXKXSXXXXSXXTAGXGKKJKKFKKYSXYXLIXXXLXXDXSKKLDXYLAGLELFENXEEHDNXTEXIRNYIAHFNYLXXAGXXADXSLLELYNXLRDRLXSYDRKLKNAVSKSLIDILDRHGMILKFKFKXXXKLIGXNDXXXXAIKHKDXARITIXEPNGVTSEXFTYKLLXXVAALEIXSLEPKKIRHLXXXARLLYYPKXATAQSQPDQKXXXKXKKKNIXKGYIERXTNQVSSNQEEYCELVKKLLETXXLXXLAVXGVAXBIGLHISRLRRIREDAIIVGRRYRFRVEIYVPPKSNTSKLNAADLVRID
MUSCLE 정렬(www.ebi.ac.uk/Tools/msa/muscle/)을 사용하여 컨센서스 서열에 기반한 돌연변이된 잔기. Lsh의 상응하는 위치가 표시된다.
상기 아미노산 잔기 중 임의의 하나 이상을 단독으로 또는 조합하여 갖는, 돌연변이된 C2c2 단백질은 변형된 특이성 및/또는 활성 및/또는 대안적인 PAM 인식을 나타낸다.
실시예 29:
Lw2 및 FSL의 정렬(도 67)에 기반하여, 다음의 보존된 잔기가 확인되었다:
표시된 잔기 중 하나 이상이 돌연변이되었다. 아미노산 잔기 넘버링은 도 67(동일한 잔기를 나타내는 2 개의 오솔로그 정렬된 서열 사이의 중앙선)에 표시된 넘버링에 상응한다.
Lew2 C2c2 및 Lib C2c2간에 동일한, 도 67에 표시된 잔기 중 임의의 하나 이상을 C2c2 단백질 활성, 특이성 또는 기능성을 변형하기 위해 돌연변이한다. 돌연변이된 상기 아미노산 잔기 중 임의의 하나 이상을 단독으로 또는 조합하여 갖는 C2c2 단백질은 변경된 특이성 및/또는 활성 및/또는 대안적 PAM 인식을 나타낸다.
실시예 30: 방법
활성 스크리닝 및 재조합 발현을 위한 오솔로그 클로닝
15 개의 Cas13a 오솔로그(Genscript, Jiangsu, China)(보충 표 9)의 인간 코돈-최적화된 버전을 합성하고 pLac 프로모터에 의한 발현 하에 이들을 pACYC184로 클로닝하였다. Cas13a 발현 카세트에 인접하여, 베타-락타마제 표적화 또는 비-표적화 스페이서 측면에 배치되는 오솔로그의 상응하는 직접 반복을 클로닝하였다. 스페이서 어레이 발현은 J23119 프로모터에 의해 구동하였다.
LwaCas13a의 정제를 위해, 포유류 코돈-최적화된 LwaCas13a 서열을 단백질 정제용 박테리아 발현 벡터에 클로닝하였다(6x His/Twin Strep SUMO, Ilya Finkelstein(텍사스 대학교 오스틴 캠퍼스)로부터 선물로 받은 pET-기반 발현 벡터).
이 연구에서 사용된 모든 플라스미드는 보충 표 1에 나열되어 있다.
Cas13a 활성 및 PFS 동일성을 위한 박테리아 생체내 시험
스크린은 다음과 같이 기능한다. 간략하게, Cas13a는 무작위 PFS 뉴클레오티드가 측면에 배치된 β-락타마제 전사물 상의 5' 범위의 서열을 표적화하도록 프로그래밍한다. Cas13a 절단 활성은 암피실린 선택 하에 박테리아의 사멸을 초래하고, 그 다음에 PFS 손실은 차세대 시퀀싱으로 분석한다. 오솔로그 사이의 양적 비교를 가능하게 하기 위해, pJ23119 작은 RNA 프로모터의 발현 하에 있는 근처의 단일-스페이서 CRISPR 어레이와 함께 pLac 프로모터 하에 각각의 Cas13a 오솔로그를 클로닝하였다.
Cas13a 오솔로그의 활성을 시험하기 위해, 표적화 또는 비-표적화 가이드를 갖는 90 ng의 오솔로그 발현 플라스미드를 이전에 기재된 베타-락타마제 표적 플라스미드 25 ng과 함께 NovaBlue Singles 수용성 세포(Millipore) 내로 동시-형질전환하였다. 형질전환 후, 세포를 희석하고, 100 μg/uL 암피실린 및 25 μg/uL 클로람페니콜로 보충된 LB-한천에 플레이팅하고, 하룻밤 동안 37℃에서 인큐베이션하였다. 다음날 형질전환체를 계수하였다.
LshCas13a 및 LwaCas13a PFS 동일성의 결정을 위해, 표적화 또는 비-표적화 스페이서를 갖는 40 ng의 오솔로그 발현 플라스미드를 생물학적 복제 당 2 분취물의 NovaBlue GigaSingles(Millipore) 내로 25 ng의 베타-락타마제 표적 플라스미드와 함께 동시-형질전환하였다. 2 개의 생물학적 복제를 수행하였다. 형질전환 후, 세포를 1 시간 동안 생물학적 복제 당 500 uL의 SOC(ThermoFisher Scientific)에서 37℃에서 회수하고, 100 μg/uL 암피실린 및 25 μg/uL의 클로람페니콜로 보충된 LB-한천(Affymetrix)을 갖는 바이오-분석 플레이트(코닝)에 플레이팅하고, 37℃에서 16 시간 동안 인큐베이션하였다. 그 다음 콜로니를 스크래핑으로 수확하고 다음의 시퀀싱을 위해 플라스미드 DNA를 NuceloBond Xtra EF(Macherey-Nagel)로 정제하였다.
수확된 플라스미드 샘플을 NEBNext High Fidelity 2X 마스터 믹스(New England Biosciences)를 사용하여 바코딩 프라이머 및 Illumina 유동 세포 핸들을 갖는 PCR에 의한 차세대 시퀀싱을 위해 제조하였다. PCR 생산물을 모으고 Zymoclean 겔 추출 키트(Zymo Research)를 사용하여 겔 추출하고 MiSeq 차세대 시퀀싱 기기(Illumina)를 사용하여 시퀀싱하였다.
PFS의 컴퓨터 분석
LshCas13a 및 LwaCas13a PFS 스크리닝 라이브러리의 차세대 시퀀싱으로부터, 무작위 PFS 영역 측면에 배치된 서열을 정렬하고 PFS 동일성을 추출하였다. 서열 적용 범위를 향상시키기 위해 PFS 동일성을 4 뉴클레오티드로 접고, 각각의 고유 PFS의 빈도를 계수하고, 가짜수(pseudocount)를 1로 하여 각각의 라이브러리에 대한 총 판독 수로 정규화하였다. 도 1e에 표시된 각각의 분포의 강화는 -log2(f조건/fpACYC184)로서 pACYC184 대조군(단백질 없음/가이드 유전자좌)에 대해 계산하였으며, 여기서 f조건은 실험 조건에서의 PFS 동일성의 빈도이며 fpACYC184는 pACYC184 대조군에서의 PFS 동일성의 빈도이다. 보존된 PFS 모티프의 분석을 위해, 다음과 같이 각각의 조건에서의 비-표적화 대조군을 사용하여 최고 손실된 PFS 동일성을 계산하였다: -log2(fi,표적화/fi,비-표적화) 여기서 fi,표적화는 표적화 스페이스를 갖는 조건 i에서의 PFS 동일성의 빈도이고 fi,비-표적화는 비-표적화 스페이서를 갖는 조건 i에서의 PFS 동일성의 빈도이다. 확장된 데이터 도 1d, 1e에 나타난 바와 같이 PFS 모티프를 임계값의 범위에 대해 분석하였다.
LwaCas13a의 정제
LwaCas13a의 정제는 이전에 기재된 바와 같이 수행하였다. 간랸하게, LwaCas13a 박테리아 발현 벡터를 Rosetta 2(DE3)pLysS singles 수용성 세포(Millipore) 내로 형질전환시키고 Terrific Broth 4 성장 배지(TB) 4 L를 출발 배양으로 씨딩하였다. 세포 단백질 발현을 IPTG로 유도하고 하룻밤 동안 성장시킨 후, 세포 펠렛을 수확하여 -80℃에서 보관하였다. 세포 용해 후, 단백질은 StrepTactin Sepharose 수지(GE)를 사용하여 결합시키고 단백질은 SUMO 프로테아제 분해(ThermoFisher)로 용출시켰다. 단백질은 HiTrap SP HP 양이온 교환 컬럼(GE Healthcare Life Sciences)을 사용하여 양이온 교환하고 이어서 Superdex 200 Increase 10/300 GL 컬럼(GE Healthcare Life Sciences)을 사용하여 겔 여과하며, 두 단계 모두 FPLC(AKTA PURE, GE Healthcare Life Sciences)를 통하여 추가 정제하였다. LwaCas13a 단백질을 함유하는 최종 분획을 모으고 저장 완충액(600 mM NaCl, 50 mM Tris-HCl pH 7.5, 5% 글리세롤, 2 mM DTT)에 농축시키고, 분취물을 장기 저장을 위해 -80℃에서 동결시켰다.
포유류 발현 작제물 클로닝
인간 코돈 최적화된 Cas13a 유전자를 합성하고(Genscript) EF1-α 프로모터에 의한 발현 하에 핵 방출 서열(NES) 또는 핵 국소화 서열(NLS)을 갖는 포유류 발현 벡터 내로 클로닝 하였다. 단량체-수퍼-폴드 GFP(msfGFP)에 의해 부여된 안정성 때문에, msfGFP를 LwaCas13a의 C 말단에 융합시켰다. LwaCas13a의 전장 직접-반복은 U6 프로모터 하에서의 발현으로 가이드 백본 플라스미드를 클로닝하는 데 사용하였다. 촉매적으로 비활성인 LwaCas13a-msfGFP 작제물(데드 Cas13a 또는 dCas13a)은 2 개의 HEPN 도메인에 R474A 및 R1046A 돌연변이를 도입함으로써 생성하였다. LwaCas13a-msfGFP의 약물-선택성 버전은 2 A 펩티드 서열을 통해 C-말단에 연결된 블라스티시딘 선택 마커를 갖는 백본에 단백질을 클로닝함으로써 생성하였다. dCas13a-msfGFP 작제물의 음성 피드백 버전은 dCas13a-msfGFP의 프로모터 업스트림에 징크-핑거 결합 부위를 클로닝하고 징크 핑거 및 KRAB 도메인을 C-말단에 융합시킴으로써 생성하였다.
리포터 루시페라제 작제물은 CMV에 의한 발현 하에 사이프리디니아 루시페라제(Cluc) 및 EF1-α에 의한 발현 하에 가우시아 루시페라제(Gluc)를 둘 모두 단일 벡터 상에 클로닝함으로써 생성하였다. 단일 벡터 상의 두 루시페라제 모두의 발현은 하나의 루시페라제가 다른 루시페라제의 녹다운의 정규화를 위한 용량 대조군으로서 작용할 수 있도록 하여, 형질감염 조건으로 인한 변동을 제어한다.
도 1g의 내인성 녹다운 실험에 있어서, RNAxs siRNA 설계 알고리즘을 사용하여 가이드 및 shRNA를 설계하였다. shRNA를 설계하기 위해 예측 툴을 사용하였고 shRNA 및 Cas13a 녹다운 사이의 비교를 가능하게 하기 위하여 가이드는 동일한 위치에서 설계하였다.
벼 액틴 프로모터(pOsActin)를 pANIC6A로부터 PCR 증폭시키고 각각의 Cas13a를 기존 Cas13a 작제물로부터 PCR 증폭시켰다. 이들 단편을 기존의 식물 발현 플라스미드 내에 결찰하여 각각의 Cas13a가 벼 액틴 프로모터에 의해 구동되고 전사가 HSP 터미네이터에 의해 종결되도록 하였다. Cas13a gRNA는 벼 U6 프로모터(pOsU6)로부터 발현하였다. gRNA 표적 서열은 각각의 유전자에 대해 동일했으나 스캐폴드 서열은 Cas13a-특이적이었다. 이들 실험에서 글리포세이트-기반 제초제의 표적인 5-에놀피루빌쉬키메이트-3-포스페이트 신타제(OsEPSPS) 유전자 및, 적절한 식물 성장을 위해 필요한 벼 히드록시신나모일-CoA 쉬키메이트/퀴네이트 히드록시신나모일 트랜스페라제(OsHCT) 유전자를 표적화했다.
이 연구에서 사용된 모든 가이드 및 shRNA는 보충 표 2 및 3에 나열되어 있다.
원형질체 제조
녹색 벼 원형질체(Oryza sativa L. ssp. japonica var. Nipponbare)를 약간 변형하여 이전에 기재된 바와 같이 제조하였다. 모종을 14 일 동안 성장시키고, 원형질체를 0.1 M CaCl2를 함유하는 MMG 완충액에 재현탁시켰다. WI 완충액 대용으로뿐만 아니라 새로운 40% PEG 완충액을 제조하기 위해 이 변형된 MMG 완충액을 사용하였다. 마지막으로, 원형질체는 형질전환 후 48 시간 동안 전체 암흑 상태에서 유지하였다. 다른 모든 조건은 이전에 기재된 바와 같았다.
시험관내 반응 및 부수적 활성을 위한 핵산 표적 및 crRNA 제조
핵산 표적의 생성을 위해, 올리고뉴클레오티드를 KAPA Hifi Hot Start(Kapa Biosystems)로 PCR 증폭시켰다. dsDNA 앰플리콘을 겔 추출하고 MinElute 겔 추출 키트(Qiagen)를 사용하여 정제하였다. 초래된 정제 dsDNA는 HiScribe T7 Quick High Yield RNA 합성 키트(New England Biolabs)를 사용하여 30℃에서 하룻밤 동안 인큐베이션을 통해 전사시켰다. 전사된 RNA는 MEGAclear Transciption Clean-up 키트(Thermo Fisher)를 사용하여 정제하였다. 이 연구에서 사용 된 모든 RNA 표적은 보충 표 4 및 6에 나열되어 있다.
crRNA를 생성하기 위해, 올리고뉴클레오티드를 추가적인 5' T7 프로모터 서열을 갖는 DNA(Integrated DNA Technologies)로서 주문하였다. crRNA 주형 DNA를 T7 프라이머(최종 농도 10 μM)로 어닐링시킨 후 HiScribe T7 Quick High Yield RNA 합성 키트(New England Biolabs)로 37℃에서 하룻밤 동안 인큐베이션하여 전사시켰다. 초래된 전사 crRNA를, 추가적인 1.8x 비율의 이소프로판올(Sigma)로 보충되고, 2x 비율의 비드 대 반응물 부피를 사용하여, RNAXP 클린 비드(Beckman Coulter)로 정제하였다. 시험관내 실험 연구에 사용된 crRNA 작제물은 보충 표 5에 나열되어 있으며 부수적 검출에 사용된 crRNA 작제물은 보충 표 6에 나열되어 있다.
LwaCas13a 절단 및 부수적 활성 검출
LwaCas13a의 생화학적 특징 확인을 위해, 이전에 기재된 바와 같이 분석을 수행하였다. 간략하게, 달리 표시되지 않는 한, 160 nM의 말단-표지된 ssRNA 표적, 200 nM의 정제된 LwaCas13a, 및 100 nM crRNA로 뉴클레아제 분석을 수행하였다. 모든 분석은 뉴클레아제 분석 완충액(40 mM Tris-HCl, 60 mM NaCl, 6 mM MgCl2, pH 7.3)에서 수행하였다. 어레이 프로세싱을 위해, 100 ng의 시험관내 전사된 어레이를 뉴클레아제 분석마다 사용하였다. 반응은 37℃에서 1 시간 동안 진행하도록 두었고(달리 표시하지 않는 한), 프로테이나제 완충액(프로테이나제 K, 60 mM EDTA, 및 4 M 우레아)으로 37℃에서 15 분 동안 소멸시켰다. 그 다음 95℃에서 5 분 동안 4.5 M 우레아 변성 완충액으로 반응물을 변성시켰다. 샘플을 45℃에서 10% PAGE TBE-우레아(Invitrogen) 상의 변성 겔 전기영동 실행에 의해 분석하였다. 겔은 Odyssey 스캐너(LI-COR Biosciences)를 사용하여 이미징하였다.
부수적 활성 검출 분석은 이전에 기재된 바와 같이 수행하였다. 간략하게, 반응은, 달리 표시되지 않는 한, 뉴클레아제 분석 완충액(40 mM Tris-HCl, 60 mM NaCl, 6 mM MgCl2, pH 7.3)내에 45 nM 정제된 LwCas13a, 22.5 nM crRNA, 125 nM 소광된 형광 RNA 리포터(알엔아제 Alert v2, Thermo Scientific), 2 μL 쥐 알엔아제 저해제(New England Biolabs), 100 ng의 배경 총 인간 RNA(HEK293FT 배양으로부터 정제), 및 가변하는 양의 입력 핵산 표적으로 구성되었다. 반응은 매 5 분마다 형광 동력학이 측정되는 형광 플레이트 리더(BioTek) 상에서 37℃에서 1 내지 3 시간 동안(달리 표시되지 않는 한) 진행되도록 두었다.
RNA 추출 및 qRT-PCR
트리졸 및 첨부 프로토콜을 사용하여 48 시간의 인큐베이션 후 전체 RNA를 단리하였다. SuperScript III Plantinum SYBR Green One-Step qRT-PCR 키트(Invitrogen)에서 첨부된 프로토콜을 사용하여 총 RNA 중 1 나노그램을 사용하였다. 모든 샘플은 LightCycler 480 Instrument(Roche) 상에서 384-웰 포맷으로 3 개의 생물학적 반복실험에 대한 기술적 3 회로 실행하였다. 모든 PCR 프라이머는 용융 곡선 분석에 기반하여 특이적인 것으로 인증되었고 다음과 같다: OsEPSPS (Os06g04280), 5' - TTG CCA TGA CCC TTG CCG TTG TTG - 3' 및 5' - TGA TGA TGC AGT AGT CAG GAC CTT - 3'; OsHCT (Os11g07960), 5' - CAA GTT TGT GTA CCC GAG GAT TTG - 3' 및 5' - AGC TAG TCC CAA TAA ATA TGC GCT - 3'; OsEF1a (Os03g08020), 5' - CTG TAG TCG TTG GCT GTG GT - 3' 및 5' - CAG CGT TCC CCA AGA AGA GT - 3'. OsEF1a에 대한 프라이머는 이전에 기재되었다. 모든 데이터는 EF1a의 발현에 비례하여 각각의 샘플을 이용한 평균±표준 오차로 나타난다.
타일링 가이드 스크린의 클로닝
타일링 가이드 스크린을 위하여, 스페이서는 전사물의 전체 길이를 완전히 커버하기 위하여 균일한 간격으로 mRNA 전사물을 표적화하도록 설계하였다. 스페이서는 IDT로부터 주문하여, 어닐링하고, Gluc 및 Cluc 스크린용 tRNAval 프로모터 또는 모든 내인성 스크린용 U6 프로모터를 갖는 LwaCas13a 가이드 발현 작제물 내로 골든-게이트 클로닝하였다.
LwaCas13a를 이용한 녹다운을 위한 포유류 세포 배양 및 형질감염
달리 언급되지 않는 한, 모든 포유류 세포 실험을 HEK293FT 라인(ATCC)에서 수행하였다. HEK293FT 세포를 10% 태아 소 혈청(VWR Seradigm) 및 1X 페니실린-스트렙토마이신(Thermo Fisher Scientific)으로 보충된, 고 글루코스, 소듐 피루베이트, 및 GlutaMAX(Thermo Fisher Scientific)를 갖는 Dulbecco's Modified Eagle 배지에서 배양하였다. 세포를 70% 미만의 컨플루언시(confluency)를 유지하기 위해 계대시켰다. A375(ATCC)를 포함하는 실험을 위해, 세포를 9% 태아 소 혈청(VWR Seradigm) 및 1X 페니실린-스트렙토마이신(Thermo Fisher Scientific)으로 보충된 RPMI 배지 1640(Thermo Fisher Scientific)에서 배양하였다.
내인성 유전자의 녹다운을 시험하기 위해, 달리 언급되지 않는 한, 웰당 150 ng의 LwaCas13a 플라스미드 및 250 ng의 가이드 플라스미드를 사용하여 리포펙타민 2000(Thermo Fisher Scientific) 형질감염을 수행하였다. 리포터 플라스미드의 녹다운 시험 실험은 웰당 12.5 ng 리포터 작제물로 보충하였다. 형질감염 16 시간 전에, 세포를 96-웰 플레이트에 약 20,000 세포/웰로 플레이팅하고, 하룻밤 동안 90% 컨플루언시로 성장하도록 두었다. 각각의 웰에 대해 플라스미드를 Opti-MEM® I 환원 혈청 배지(Thermo Fisher)와 조합하여 총 25 uL로 하고, 개별적으로 0.5 uL의 리포펙타민 2000을 24.5 uL의 Opti-MEM과 조합하였다. 그 다음 플라스미드 및 리포펙타민 용액을 조합하고, 5 분 동안 인큐베이션하고, 파쇄를 막기 위해 천천히 세포 상에 피펫팅하였다.
녹색 벼 원형질체의 형질전환
녹색 벼 실험을 위해, 각각의 Cas13a를 발현하는 플라스미드 및 상응하는 gRNA를 등몰비로 혼합하여 총 30 mg의 DNA를 사용하여 형질전환당 총 200,000 개의 원형질체를 형질전환시켰다.
루시페라제 활성의 측정
달리 언급되지 않는 한, 형질감염 후 48 시간에 분비된 루시페라제를 함유하는 배지를 수확하였다. 배지를 PBS로 1:5로 희석한 다음 주입 프로토콜로 Biotek Synergy 4 플레이트 판독기 상에서 NEB 사이프리디니아 및 가우시아 루시페라제 측정 키트를 사용하여 루시페라제 활성을 측정하였다. 모든 반복실험은 생물학적 반복실험으로 수행하였다.
총 RNA의 수확 및 정량적 PCR
형질감염 48 시간 후, 세포 수확 및 cDNA 생성을 위한 역전사는 시판되는 Cells-to-Ct 키트(Thermo Fisher Scientific)의 이전에 기재된 변형92을 사용하여 수행하였다. 그 다음 전사물 발현은 Fast Advanced Master Mix(Thermo Fisher Scientific) 및 GAPDH 대조군 프로브(Thermo Fisher Scientific)를 갖는 TaqMan qPCR 프로브(Thermo Fisher Scientific, 보충 표 7 및 8)를 사용하여 qPCR로 정량화하였다. 모든 qPCR 반응은 384-웰 포맷에서 4 기술적 반복실험으로 5 uL 반응에서 수행하였고, LightCycler 480 Instrument II(Roche)를 사용하여 판독하였다. 다중화된 표적화 반응의 경우, 상이한 표적의 판독은 별도의 웰에서 수행하였다.
발현 수준은 표적 Ct 값으로부터 하우스키핑 대조군(GAPDH) Ct 값을 빼는 것으로 계산하여 총 입력에 대해 정규화하고, ΔCt 수준을 얻었다. 상대적 전사물 존재량은 2^(-ΔCt)로 계산하였다. 모든 반복실험은 생물학적 반복실험으로 수행하였다.
표적 접근 가능성에 대한 컴퓨터 분석
먼저 표적 접근 가능성을 분석하기 위해, 타일링 스크린으로부터 상위 가이드를 분석하였고, 접근 가능성의 영역이 있다면 그 영역에서 다수의 가이드가 매우 활성있을 것임을 기대할 수 있다는 가정 하에, 그들이 예상보다 서로 가깝게 그룹화하였는지 여부를 결정하였다. Gluc 타일링 스크린에 대해서는 상위 20% 성능 가이드 및 Cluc, KRAS 및 PPIB 타일링 스크린에 대해서는 상위 30% 성능 가이드로 상위 가이드를 정의하였다. 무작위로 시뮬레이션된 10,000 개의 가이드 위치에 의하여 가이드 간 쌍 거리에 대한 귀무 확률 분포를 생성한 다음 실험적으로 결정된 상위 가이드 쌍 거리를 비교하였다.
접근 가능성은 Vienna RNA 소프트웨어 세트93에서 RNApl 폴드 알고리즘을 사용하여 예측하였다. 70 nt의 기본 윈도우 크기를 사용하였고 쌍이 되지 않은 표적 영역의 확률은 표적 영역에 걸친 28 개의 단일-뉴클레오티드 쌍 없는 확률의 평균으로 계산하였다. 이들 접근 가능성 곡선을 스무딩하고 4 개 전사물 각각에 걸쳐 스무딩된 녹다운 곡선과 비교하였고, 두 인자 간의 상관 관계를 피어슨 상관 계수를 사용하여 계산하였다. 이들 두 인자의 확률 공간은 또한 두 변수에 걸쳐 2D 커널 밀도 추정을 수행하여 시각화하였다.
RNA 시퀀싱 및 분석
LwaCas13a 녹다운의 특이성을 결정하기 위해, LwaCas13a 및 shRNA 작제물 모두를 포함하는 녹다운 실험 유래의 mRNA상에서 RNA 시퀀싱을 수행하였다. 총 RNA는 Qiagen RNeasy Plus Mini mit를 사용하여 48 시간 후 형질감염 실험으로부터 제조하였다. 그 다음 NEBNext® Poly(A) mRNA 자기 단리 모듈을 사용하여 mRNA를 추출하고 Illumina®를 위한 NEBNext® Ultra™ 방향성 RNA 라이브러리 프렙 키트를 사용하여 RNA-seq 라이브러리를 제조하였다. RNA-시퀀싱 라이브러리는 Illumina NextSeq 장비 상에서 라이브러리당 적어도 10 M 리드(read)로 시퀀싱하였다.
RefSeq GRCh38 어셈블리를 사용하여 인덱스를 생성하고 디폴트 파라미터94를 사용하여 Bowtie 및 RSEM v1.2.31을 사용하여 리드를 정렬하고 정량하였다. 발현 수를 위해 백만 당 전사물(TPM) 값을 사용하였고 log2(TPM+1)를 취하여 로그-공간으로 변환하였다.
차등적으로 발현된 유전자를 찾기 위해, 3 개의 표적화 반복실험 대 3 개의 비-표적화 반복실험에 대하여 스튜던트 t-검정을 수행하였다. 통계 분석은 6 개의 반복실험 중 적어도 2 개에서 log2(TPM+1) 값이 2.5 초과인 유전자에 대해서만 수행하였다. 차등적 발현이 2보다 크거나 0.75보다 작고, 0.10 미만의 거짓 발견율인 유전자만이 유의미하게 차등적으로 발현되는 것으로 보고되었다.
반복실험과 반복실험의 평균 사이의 교차 상관은 켄달의 타우 계수를 사용하여 수행하였다. shRNA 대 Cas13a 라이브러리의 변동은 6 개의 반복실험(3 개의 표적화 및 3 개의 비-표적화 반복실험)에 걸친 유전자 발현에 대한 표준 편차의 분포를 고려하여 분석하고 바이올린 플롯으로 플로팅하였다.
포유류 세포에서의 부수적 활성에 대한 LwaCas13a 평가
LwaCas13a는 임의의 잠재적인 성장 제한 효과에 대해 시험함으로써 부수적 활성에 대해 추가적으로 평가하였다. 포유류 세포를 루시퍼라제 리포터 표적, 가이드 플라스미드, 및 LwaCas13a 또는 약물-선택성 LwaCas13a중 하나로 형질감염시켰다. 형질감염 24 시간 후, 세포를 새 배지로 1:5 분할하고 약물-선택성 LwaCas13a 샘플을 10 ug/mL 블라스티시딘 에스(Thermo Fisher Scientific)로 보충하였다. 추가 성장 48 시간 후, 루시페라제 녹다운, 다중모드 플레이트 판독기(Biotek Neo2) 상의 GFP 형광 측정을 통한 LwaCas13a 발현 유지, 및 CellTiter-Glo® 발광 세포 생존력 분석(Promega)에 의한 세포 성장에 대하여 세포를 분석하였다.
RIP를 이용한 dCas13a 결합 정량화
RNA 면역침강 실험을 위해, HEK293FT 세포를 6-웰 플레이트에 플레이팅하고, 리포터 표적화를 수반하는 조건의 경우 추가적인 150 ng의 리포터 플라스미드와 함께, 1.3 ug의 dCas13a 발현 플라스미드 및 1.7 ug의 가이드 플라스미드로 형질감염시켰다. 형질감염 48 시간 후, 세포를 얼음-냉각시킨 PBS(Sigma)로 2 회 세척하고 실온에서 15 분 동안 PBS 중의 0.2% 파라포름알데히드(Electron Microscopy Sciences)로 고정시켰다. 고정 후, 파라포름알데히드를 제거하고, PBS 중의 125 mM 글리신을 첨가하여 가교 결합을 소멸시키고, 세포를 10 분 동안 인큐베이션하였다. 세포를 얼음-냉각시킨 PBS로 다시 2 회 세척하고, 스크래핑하여 수확하고, 세포 현탁액을 800g에서 4 분 동안 원심분리하여 세포를 펠렛화하였다. 상청액을 제거하고 펠렛을 용해 전에 PBS로 세척하였다. 세포를 cOmplete™ ULTRA Tablets, EDTA-없음(Sigma) 및 리보뉴클레아제 저해제(Sigma R1158)로 보충된 1X RIPA 완충액(Cell Signaling) 200 uL로 용해시켰다. 세포를 얼음 위에서 10 분 동안 용해되도록 둔 다음 Bioruptor 초음파 분쇄기(Diagenode)상에서 저 강도에서 30 초 켜기/30 초 끄기 주기로 2 분 동안 초음파처리 하였다. 불용성 물질을 4C에서 16,000 g에서 10 분 동안 원심분리하여 펠렛화하고, 맑아진 용해물을 함유하는 상청액을 자성 비드를 이용하여 풀다운하기 위해 사용하였다.
항체를 자기 비드에 스플라이싱시키기 위해, 면역침강을 위한 Dynabeads® 단백질 A(Thermo Fisher Scientific) 샘플당 100 μL 를 자석을 적용하여 펠렛화하고, 상청액을 제거하였다. 비드를 200 μL의 세척 완충액(0.02% Tween-20(Sigma)으로 보충된 PBS)에 재현탁시키고 5 μg의 토끼 항-마우스 IgG(Sigma M7023)를 첨가하였다. 샘플을 회전기 상에서 실온에서 10 분 동안 인큐베이션하여 항체가 비드에 스플라이싱되도록 하였다. 인큐베이션 후, 비드를 자석을 통해 펠렛화하고, 상청액을 제거하고, 비드를 세척 완충액으로 2 회 세척하였다. 펠렛을 100 μL 세척 완충액에 재현탁하고 항-HA 항체(Thermo Fisher Scientific 26183) 또는 IgG 항체 대조군(Sigma I5381)의 스플라이싱을 위해 2 개의 50 μL 부피로 분할하였다. 각각의 항체에 대해 2.5 μg의 항체를 200 μL 세척 완충액과 함께 첨가하고 회전기 상에서 실온에서 10 분 동안 인큐베이션하였다. 인큐베이션 후, 비드를 자석을 통해 펠렛화하고 세척 완충액으로 2 회 세척하고 리보뉴클레아제 저해제(Sigma R1158) 및 프로테아제 저해제 칵테일(Sigma P8340)을 포함하는 200 μL 1X RIPA에 재현탁하였다. 샘플 용해물 100 μL를 비드에 첨가하고 4℃에서 하룻밤 동안 회전시켰다.
샘플 용해물과 함께 인큐베이션 후, 비드를 펠렛화하고, 1X RIPA, 0.02% Tween-20으로 3 회 세척한 다음, 디엔아제 완충액(350 mM Tris-HCl [pH 6.5]; 50 mM MgCl2; 5 mM DTT)으로 세척하였다. 비드를 디엔아제 완충액에 재현탁시키고, TURBO 디엔아제(Life Technologies)를 0.08 유닛/μl의 최종 농도로 첨가하였다. 디엔아제를 회전기상에서 37℃에서 30 분 동안 인큐베이션하였다. 그 다음 0.1 유닛/μl의 최종 농도로 프로테이나제 K(New England Biosciences)를 첨가하여 단백질을 분해하고 37℃에서 추가 30 분 동안 회전하며 인큐베이션하였다. 변성 및 정제를 위해 우레아(Sigma)를 최종 농도 2.5 M로 첨가하고 샘플을 30 분 동안 인큐베이션하고, Direct-Zol RNA 미니프렙(Zymo Research)을 사용하여 RNA를 정제하였다. 정제된 RNA는 qScript Flex cDNA(Quantabio)를 사용하여 cDNA로 역전사하였고, 풀다운은 Fast Advanced Master Mix 및 TaqMan qPCR 프로브(보충 표 7 및 8)를 사용하여 qPCR로 정량되었다. 모든 qPCR 반응은 384-웰 포맷에서 4 회 기술적 반복실험으로 5 μL 반응으로 수행하였고, LightCycler 480 Instrument II를 사용하여 판독하였다. 강화는 매치되는 IgG 항체 대조군과 비교하여 샘플에 대하여 정량하였다.
LwaCas13a 및 LwaCas13a-NF의 전위 측정
HEK293FT 세포를 폴리-D-리신 커버슬립(Corning) 상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB 이미징을 위한 dCas13a-NF 벡터 150 ng 및 300 ng의 가이드로 형질감염시켰다. 전위 실험을 위해서, 세포를 4% PFA로 고정시키고 48 시간 후에 0.2% Triton X-100으로 투과성을 높이고 DAPI(Vectashield)를 갖는 안티페이드 마운팅(antiface mounting) 매질을 사용하여 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
ACTB mRNA를 표적화하는 가이드를 갖는 dCas13a-NF-msfGFP의 핵 방출을 평균 세포질 및 핵 msfGFP 형광을 측정하고 표적화 및 비-표적화 조건 간의 많은 세포에 걸친 비율을 비교함으로써 분석하였다.
ACTB 전사물의 형광 인 시츄 혼성화(FISH)
HEK293FT 세포를 폴리-D-리신 커버슬립(코닝)상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB를 이미징하기 위한 dCas13a-NF 벡터 75 ng 및 가이드 250 ng으로 형질감염시켰다. 48 시간 후, 세포를 4% PFA로 45 분 동안 고정시켰다. QuantiGene viewRNA ISH 세포 분석 키트(Affymetrix)는 세포 샘플 상에서 FISH를 수행하기 위해 사용하였으며 프로토콜은 제조업자에 의해 기재된 바대로 따랐다. FISH 절차를 완료한 후, 안티페이드 마운팅 매질(Vectashield)을 사용하여 커버슬립을 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
스트레스 과립에 대한 LwaCas13a 추적
HEK293FT 세포를 폴리-D-리신 커버슬립(코닝) 상의 24-웰 조직 배양 플레이트에 플레이팅하고 ACTB를 이미징하기 위한 dCas13a-NF 벡터 75 ng 및 250 ng 가이드로 형질감염시켰다. 스트레스 과립 실험을 위해, 세포를 고정시키고 투과성 높이기 전에 200 μM 소듐 아르세나이트를 1 시간 동안 적용하였다. G3BP1의 면역형광을 위해, 세포를 20% 염소 혈청으로 차단하고, 항-G3BP1 일차 항체(Abnova H00010146-B01P)로 실온에서 하룻밤 동안 인큐베이션하였다. 그 다음 세포를 Alexa 플루오르 594로 표지된 이차 항체와 함께 인큐베이션하고 DAPI(Vectashield)가 있는 안티페이드 마운팅 매질을 사용하여 마운팅하였다. 공초점 현미경 관찰은 Andor Yokagawa Spinning disk Revolution WD 시스템을 갖는 Nikon Eclipse Ti1을 사용하여 수행하였다.
스트레스 과립의 dCas13a-NF-msfGFP와의 공동-국소화는 피어슨 상관 계수를 사용한 세포당 평균 msfGFP 및 G3BP1 신호를 사용하여 계산하였다. 공동국소화 분석은 Coloc 2 플러그인을 사용하여 이미지 분석 소프트웨어 FIJI95에서 수행하였다.
라이브 이미징 실험을 위해, HEK293FT 세포를 96-웰 조직 배양 플레이트에 플레이팅하고 ACTB 이미징을 위한 150 ng dCas13a-NF 벡터, 300 ng의 가이드, 및 5 ng의 G3BP1-RFP 리포터로 형질감염하였다. 48 시간 후, 세포를 0 μM 또는 400 μM 소듐 아르세나이트를 겪게 하고 20x 물 대물렌즈를 갖는 회전 디스크 공초점 세팅을 사용하여 Opera Phenix™ 고 함량 스크리닝 시스템(PerkinElmer) 상에서 매 2 시간마다 매 15 분마다 이미징하였다. 세포를 50% CO2를 갖는 가습 챔버에서 37℃로 유지시켰다. 스트레스 과립에서살아있는 세포 dCas13a-NF-msfGFP의 G3BP1-RFP와의 공동국소화는 Opera Phenix Harmony 소프트웨어(PerkinElmer)를 사용하여 측정하였다.
표적 접근 가능성 및 녹다운의 상관관계
출원인은 LshCas13a가 우연에 의해 예상되는 것보다 더 근접하게 함께 그룹화된 매우 효과적인 가이드로 한정된 위치에서 MS2 ssRNA 게놈을 표적화함을 보여주었다1. 출원인은 효과적인 가이드의 클러스터가 표적 결합의 입체 배치 및 이용 가능성으로 인해 LshCas13a에 의해 더 잘 표적화되는 접근 가능성 영역으로부터 발생할 수 있다고 추정하였다. 이들 결과가 LwCas13a를 이용한 포유류 mRNA의 표적화에까지 확장될 지 여부를 분석하고자 하였고 그래서 가이드로 타일링한 4 개 유전자: Gluc, Cluc, KRAS 및 PPIB에 대해 유사한 분석을 수행하였다. 먼저 효과적인 가이드를 녹다운 효율에 의해 측정된 바와 같이 Gluc에 대해서는 상위 20%의 가이드 및 다른 3 개 유전자에 대해서는 상위 30%의 가이드로 정의하였다(Gluc보다 50% 더 적은 가이드로 타일링하였으므로 Cluc, KRAS 및 PPIB에 대한 임계값에 대해 더 관대하다는 것을 주의). 이들 임계값을 사용하여 정의된 가장 효과적인 가이드만 분석함에 있어서, 그들은 우연에 의해 예상되는 것보다 더 근접하게 함께 모여있는 것으로 나타났다.
다음으로, Vienna RNA 소프트웨어 모음으로부터 RNAplfold 알고리즘을 사용하여 표적 전사물의 접근 가능성을 모델링하고자 하였다. 윈도우 크기 70(기본값)에 걸쳐 접근 가능성 및 전사물 상의 주어진 뉴클레오티드 위치가 쌍이 없을 확률을 계산하였다. 그 다음, 주어진 가이드에 대해, 주어진 가이드 표적이 쌍이 없고 따라서 접근 가능할 평균 확률을 얻기 위해 28 nt에 걸친 확률을 평균화할 수 있다. 이 계산을 표적 접근 가능성에 대한 측정으로서 취하고 각각의 가이드에 대한 표적 발현에 대하여 비교한다. 가이드별로 발생하는 변동 때문에, 특히 유전자를 조밀하게 타일링하지 않았기 때문에, 표적 접근 가능성 및 표적 발현 곡선 모두를 스무딩하기로 결정하였다. 이들 곡선을 플롯팅하고 상관관계를 분석함으로써 표적 접근 가능성이 표적 발현과 유의미한 상관관계가 있고 표적 발현에서의 변동의 4.4% 내지 16%를 설명할 수 있음을 밝혔다. 스무딩의 거짓 효과를 상쇄하기 위해 커널 밀도 추정을 사용하여 확률 공간에서의 확률 대 녹다운 데이터를 또한 분석하였다. 이 분석은 염기쌍 형성된 표적 영역의 확률 및 표적 발현 사이에 유사한 양의 관계를 밝혔다. 마지막으로, 염기쌍 형성 확률에 대한 거짓 상관관계를 만드는 RNAplfold의 임의의 파라미터-특이적 측면을 상쇄하기 위해, 윈도우 크기 및 k-mer 크기의 파라미터 그리드에 대해 쌍이 없을 확률을 계산했다. 처음에 1의 k-mer에 대한 확률 즉, 주어진 위치가 쌍이 없고 28 nt 표적 영역에 걸쳐 평균화된 확률만을 계산하였다. k=2에서, 뉴클레오티드 쌍이 쌍이 없을 확률을 계산하고 28 nt 영역에 걸쳐 그들을 평균화하고 28까지의 k에 대하여 계속한다. 이 분석은 각각의 전사물에 대해 양의 상관 관계를 만드는 파라미터 영역을 밝혔고 이는 상관관계를 제공하는 것은 특정 파라미터 세트만이 아니라는 확신을 더 제공한다. 예상할 수 있듯이, KRAS와 같은 더 큰 전사물은 더 큰 윈도우 크기에 대해 양의 상관관계를 갖고 PPIB와 같은 더 작은 전사물은 훨씬 더 작은 윈도우 크기에 대해 양의 상관관계를 갖는다.
shRNA 및 Cas13a 사이의 표적 녹다운 특이성 비교
shRNA 및 Cas13a 전사물 녹다운 특이성 사이의 엄밀한 비교를 위해, 표적화 및 비-표적화 대조군 사이에 비교된 트랜스크립톰 전체에 걸친 변동의 효과를 평가하고자 하였다. 표적외는 동일성 라인에서부터 편차로서 나타날 것이며, 리포터 작제물을 표적화할 때 Cas13a보다 shRNA에 대해 더 많은 표적외가 발생함은 명백하다. 유사한 증가된 편차가 내인성 유전자에 대해 발생한다. 내인성 전사물의 녹다운이 생물학적 기능의 변화로 인한 추가적인 유전자 발현 변화를 초래할 것으로 예상될 수 있는 반면, Cas13a를 이용한 PPIB 및 KRAS 녹다운은 발현 변화를 초래하지 않았음을 발견하였고, 이는 아마도 녹다운의 수준이 실질적인 다운스트림 효과에 충분하지 않기 때문이다.
다음으로, 차등적 유전자 발현을 통해 표적외의 수를 정량화하였다: 표적외 전사물은 적어도 100% 상향 조절 또는 25% 하향 조절을 갖는 유전자로 정의한다. 그 다음, 유의미한 표적외를 표적화 및 비-표적화 조건 사이에서 스튜던트 t-검정에 의해0.1의 FDR로 Benjamini-Hochberg 절차를 통해 보정된 다중 비교로 비교하였다. 시험된 3 개 전사물 모두에서 shRNA 표적화의 결과로 수백 개의 유의미한 표적외 전사물이 있었으나, Cas13a 표적화의 결과로는 유의미한 표적외가 없었음을 밝혔다.
표적화 및 비-표적화 조건 사이의 shRNA 변동에서의 큰 변동은, 생물학적 반복실험 사이에 유사한 편차를 초래할, 증가된 전체 유전자 발현 변이로 인한 것이거나, 동일 조건에 대한 반복실험 사이에서 증가된 상관관계로 나타날, 재현가능하고 일관된 표적외로 인한 것일 수 있다. Gluc 변동에 대해 비-표적화 및 표적화 반복실험을 서로와 비교하면서, 반복실험 사이에는 거의 변동이 없음을 발견하였다. 그러나, shRNA 또는 Cas13a에 대해 표적화 조건 대 모든 비-표적화 조건의 개별 반복실험을 비교하였을 때, 반복실험 간의 비교는 평균 측정에서 보여진 표적외를 재정리했음을 발견하였다. 반복실험 간의 상관 관계를 정량화하기 위해, 리포터 및 내인성 유전자 전반에 걸쳐 표적화 및 비-표적화 조건에 대한 모든 반복실험을 비교하였다. shRNA 샘플은 비-표적화 및 표적화 조건 사이보다 반복실험 내에서 더 높은 상관 관계를 보였으나, Cas13a 샘플 간의 상관 관계는 표적화 및 비-표적화 변동 사이에서 더 적은 변동을 가졌다. 그 다음, 모든 샘플을 서로 비교하여 shRNA 샘플이 샘플 간에 더 낮은 상관관계를 갖고 Cas13a내에서 보다 Cas13a와 더 낮은 상관관계를 가짐을 밝혔고, 이는 Cas13a가 더 일관성이 있음을 나타낸다. 마지막으로, 표적화 및 비-표적화 반복실험 모두에 걸쳐 유전자 당 표준 편차를 계산하였고, 표준 편차의 분포는 트랜스크립톰에 걸쳐 shRNA 변동에서보다 Cas13a 변동에서 더 낮음을 밝혔다. 전체적으로, 이 증거는 Cas13a 표적화가 트랜스크립톰 전체에 걸친 변동을 더 적게 초래함을 나타낸다.
포유류 세포에서 부수적 활성 결여에 대한 증거
LshCas13a 및 LwCas13a는 시험관내에서 견고한 부수적 활성을 나타내는 것으로 보인다. 부수적 효과로 인한 세포 건강 및 LwCas13a 녹다운의 특이성에 대한 우려때문에, 부수적 효과가 포유류 세포에서 실제로 존재하는지 여부를 연구하려고 시도하였다. 원고 전체에 걸쳐 LwCas13a에 대한 부수적 활성의 결여를 시사하는 데이터를 수집하고, 여기서 모든 증거 조각을 모아 상세하게 논의한다.
1. RNA 시퀀싱: RNA 시퀀싱을 수행하여 LwCas13a 녹다운의 특이성을 결정하였고, LwCas13a가 RNAi보다 훨씬 더 높은 특이성을 나타냄을 발견하였다. 차등적 발현 분석에서, 표적 전사물의 유의미한 녹다운에도 불구하고, 분석된 임의의 LwCas13a 조건에 대해 유의미한 차등적 발현된 표적외가 없었다. 인간 트랜스크립톰에서 모든 전사물의 균일한 녹다운이 없었다고 가정할 때, 이는 LwCas13a에 의한 녹다운이 특이적이고 포유류 세포에서 부수적 효과가 없다는 실질적 증거를 제공하는 것으로 여겨진다.
2. 타일링 스크린: 수행한 4 가지 유전자 타일링 스크린에서, 정규화에 사용된 대조군 유전자의 녹다운을 보지 못하였다. 이것은 트랜스크립톰이 아닌 하나의 다른 유전자에만 초점을 맞춤에도 불구하고 RNA 시퀀싱 유사한 분석이다. 그러나 시험된 수백 개의 가이드에 걸쳐 부수적 활성을 보지 못했기 때문에, LwCas13a가 생체내에서 부수적 활성을 강력하게 나타내지 않는다는 확신을 제공하면서, 이 결과는 중요하다.
3. 단일 제거 다중화: 다중화 실험에서 유전자 녹다운의 특이성을 확인하기 위해, 3 개의 상이한 유전자에 대한 가이드를 함유하는 가이드 발현 어레이에서 각각의 유전자-표적화 가이드가 비-표적화 가이드로 대체되는 실험을 설계했다. 부재한 가이드에 의해 표적화된 유전자에 대한 유전자 발현에 유의미한 변화가 없음을 발견하였다. 가이드의 존재 유무에도 불구하고 3 가지 유전자 모두 항상 녹다운을 나타낼 것으로 기대되기 때문에, 이는 또한 포유류 세포에서의 부수적 활성의 결여에 대한 좋은 입증으로 여겨진다.
4. 성장 실험: 이전에, 출원인은 LshCas13a가 유전자 녹다운 동안 박테리아에서 성장 제한을 야기함을 보였다1. 포유류 세포에서의 녹다운의 성장 효과가 있는지 여부를 측정하기 위한 간단한 실험을 설계하였다. Gluc를 표적화하는 LwCas13a를 갖는 세포를 72 시간 동안 성장하도록 둔 다음 세포 생존력을 측정하였고 표적화 및 비-표적화 가이드 조건 사이에 성장에서의 차이가 없음을 발견하였다. C-말단 msfGFP 융합의 형광을 관찰함으로써 LwCas13a 발현에 대해 추가로 제어하였고 발현은 모든 조건에 걸쳐 동일했고 잠재적으로 해로운 표현형으로 인해 선택되지 않음을 밝혔다. RNA 세포질 밀도, 사이토졸 조성, 및 절단된 전사물의 가공 메커니즘에서의 차이를 포함하여, 박테리아 성장 억제에 대한 이전 관찰에도 불구하고 포유류 세포에서 성장 저해의 결여에 대한 많은 가능한 원인이 있다.
포인트 1 내지 3은 표적화된 유전자 녹다운이 표적화된 유전자 이외의 다른 유전자에 영향을 미치지 않음을 총괄하여 나타내고 포인트 4는 유전자 녹다운에 대한 관찰 가능한 부작용이 없음을 나타낸다. 이 데이터는 모두 포유류 세포에서의 LwCas13a 부수적 활성의 결여에 대한 실질적인 증거이며 Cas13 녹다운은 매우 특이적인 것으로 여겨진다.
dCas13a 이미징을 위한 음성-피드백 작제물의 중요성
살아있는 세포 이미징을 위해, 높은 신호 대 잡음 비를 유지하고 배경을 감소시키는 것이 중요하다. dCas13a와 같은 형광단-표지된 작제물의 경우, 결합되지 않은 dCas13a는 세포에서 제거될 수 없거나 결합된 단백질과 구별될 수 없기 때문에, 배경에 대한 우려가 특히 중요하다. 배경을 감소시키는 한 가지 접근법은 핵 국소화 신호(NLS) 태그를 통해 핵에 단백질을 격리하는 것이고; 발생기 전사물 결합 즉시 단백질은 일시적으로 세포질로 방출된다. 이 기술은 MS2 시스템에서 활용되었지만, 표적외 핵 유출 및 표적내 핵 탈출로 인하여 이것은 불완전함을 발견하였다. 출원인은 NLS-태깅만 있는 경우의 신호 대 잡음을 향상시키기 위해, 핵 상주 단백질이 dCas13a의 추가 발현을 저해할 음성 피드백 시스템을 포함시켰다. 음성 피드백 조절은 세포질로의 가짜 전위를 감소시키고 표적화 조건과 비교하여 비-표적화 조건에서의 dCas13a-NF 수준의 전체적인 수준의 감소를 유도함으로써 이미징 도구로서의 dCas13a의 활용성을 증가시킴을 밝혔다.
보충 표
[보충 표 1]
[보충 표 2]
[보충 표 3]
[보충 표 4]
[보충 표 5]
[보충 표 6]
[보충 표 7]
[보충 표 8]
[보충 표 9]
* * *
본 발명의 선호되는 구현예가 본 명세서에 나타나고 기재되었지만, 이러한 구현예가 단지 예로서 제공된 것임이 당업자에게 자명할 것이다. 이제 본 발명을 벗어나지 않으면서 많은 변이, 변화, 및 치환이 당업자에게 떠오를 것이다. 본 명세서에 기재된 본 발명의 일 구현예에 대한 다양한 대안이 본 발명을 실시함에 있어서 이용될 수 있음이 이해되어야 한다. 다음의 청구항이 본 발명의 범위를 규정하고 이들 청구항의 범위 내의 방법 및 구조 및 이들의 균등물이 이에 의해 포함되는 것으로 의도된다.
SEQUENCE LISTING
<110> THE BROAD INSTITUTE INC.
MASSACHUSETTS INSTITUTE OF TECHNOLOGY
PRESIDENT AND FELLOWS OF HARVARD COLLEGE
<120> NOVEL TYPE VI CRISPR ORTHOLOGS AND SYSTEMS
<130> 47627.99.2133
<140> PCT/US2017/038154
<141> 2017-06-19
<150> 62/484,786
<151> 2017-04-12
<150> 62/471,792
<151> 2017-03-15
<150> 62/432,240
<151> 2016-12-09
<150> 62/410,366
<151> 2016-10-19
<150> 62/376,377
<151> 2016-08-17
<150> 62/351,803
<151> 2016-06-17
<150> 62/351,662
<151> 2016-06-17
<160> 577
<170> PatentIn version 3.5
<210> 1
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 1
atcagggcaa acagaacttt gactccca 28
<210> 2
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 2
agatccgtgg tcgcgaagtt gctggcca 28
<210> 3
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 3
tcgccttcgt aggtgtggca gcgtcctg 28
<210> 4
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 4
tagattgctg ttctaccaag taatccat 28
<210> 5
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 5
tcgccttcgt aggtgtggca gcgtcctg 28
<210> 6
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 6
tagattgctg ttctaccaag taatccat 28
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 7
tgaacagctc ctcgcccttg ctcaccat 28
<210> 8
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 8
tcagcttgcc gtaggtggca tcgccctc 28
<210> 9
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 9
gggtagcggc tgaagcactg cacgccgt 28
<210> 10
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 10
ggtcttgtag ttgccgtcgt ccttgaag 28
<210> 11
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 11
tactccagct tgtgccccag gatgttgc 28
<210> 12
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 12
cacgctgccg tcctcgatgt tgtggcgg 28
<210> 13
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 13
tctttgctca gggcggactg ggtgctca 28
<210> 14
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 14
gacttgtaca gctcgtccat gccgagag 28
<210> 15
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 15
ctgctgccac agaccgagag gcttaaaa 28
<210> 16
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 16
tccttgatta cacgatggaa tttgctgt 28
<210> 17
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 17
tcaaggtggg gtcacaggag aagccaaa 28
<210> 18
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 18
atgataatgc aatagcagga caggatga 28
<210> 19
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 19
gcgtgagcca ccgcgcctgg ccggctgt 28
<210> 20
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 20
ccagctgcag atgctgcagt ttttggcg 28
<210> 21
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 21
ctggaaatgg aagatgccgg catagcca 28
<210> 22
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 22
gatgacacct cacacggacc acccctag 28
<210> 23
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 23
taatactgct ccagatatgg gtgggcca 28
<210> 24
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 24
catgaagacc gagttataga atactata 28
<210> 25
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 25
ggtgaaatat tctccatcca gtggtttc 28
<210> 26
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 26
aatttctcga actaatgtat agaaggca 28
<210> 27
<211> 7
<212> PRT
<213> Simian virus 40
<400> 27
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 28
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Nucleoplasmin bipartite NLS sequence"
<400> 28
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 29
<211> 9
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-myc NLS sequence"
<400> 29
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 30
<211> 11
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C-myc NLS sequence"
<400> 30
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 31
<211> 38
<212> PRT
<213> Homo sapiens
<400> 31
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 32
<211> 42
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
IBB domain from importin-alpha sequence"
<400> 32
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 33
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 33
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 34
<211> 8
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Myoma T protein sequence"
<400> 34
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 35
<211> 8
<212> PRT
<213> Homo sapiens
<400> 35
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 36
<211> 12
<212> PRT
<213> Mus musculus
<400> 36
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 37
<211> 5
<212> PRT
<213> Influenza virus
<400> 37
Asp Arg Leu Arg Arg
1 5
<210> 38
<211> 7
<212> PRT
<213> Influenza virus
<400> 38
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 39
<211> 10
<212> PRT
<213> Hepatitis delta virus
<400> 39
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 40
<211> 10
<212> PRT
<213> Mus musculus
<400> 40
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 41
<211> 20
<212> PRT
<213> Homo sapiens
<400> 41
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 42
<211> 17
<212> PRT
<213> Homo sapiens
<400> 42
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 43
<211> 11
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
NES sequence"
<400> 43
Leu Tyr Pro Glu Arg Leu Arg Arg Ile Leu Thr
1 5 10
<210> 44
<211> 33
<212> DNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
NES sequence"
<400> 44
ctgtaccctg agcggctgcg gcggatcctg acc 33
<210> 45
<211> 1001
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
consensus sequence"
<220>
<221> MOD_RES
<222> (7)..(9)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (14)..(16)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (22)..(22)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (29)..(29)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (36)..(36)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (42)..(43)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (48)..(48)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (52)..(53)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (57)..(57)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (59)..(59)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (69)..(71)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (73)..(73)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (75)..(75)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (78)..(79)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (86)..(86)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (89)..(89)
<223> Any amino acid
<220>
<221> VARIANT
<222> (90)..(90)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (101)..(101)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (104)..(104)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (111)..(111)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (116)..(116)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (121)..(121)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (128)..(130)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (133)..(133)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (145)..(145)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (148)..(148)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (167)..(167)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (174)..(174)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (192)..(192)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (194)..(195)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (199)..(199)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (202)..(203)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (206)..(206)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (217)..(219)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (228)..(228)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (233)..(233)
<223> Any amino acid
<220>
<221> VARIANT
<222> (236)..(236)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (243)..(243)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (245)..(245)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (262)..(262)
<223> Any amino acid
<220>
<221> VARIANT
<222> (267)..(267)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (277)..(278)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (282)..(282)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (287)..(287)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (307)..(307)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (314)..(314)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (320)..(321)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (333)..(333)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (343)..(343)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (357)..(357)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (367)..(367)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (371)..(371)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (374)..(375)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (378)..(378)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (392)..(392)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (402)..(402)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (414)..(415)
<223> Any amino acid
<220>
<221> VARIANT
<222> (418)..(418)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (446)..(446)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (448)..(449)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (451)..(451)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (467)..(467)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (489)..(489)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (500)..(500)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (510)..(510)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (514)..(514)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (528)..(529)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (532)..(532)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (539)..(539)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (547)..(548)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (551)..(551)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (553)..(554)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (565)..(565)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (576)..(576)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (587)..(588)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (600)..(600)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (604)..(605)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (622)..(622)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (627)..(627)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (629)..(629)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (655)..(655)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (662)..(662)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (682)..(682)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (686)..(686)
<223> Any amino acid
<220>
<221> VARIANT
<222> (688)..(688)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (691)..(691)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (698)..(698)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (706)..(706)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (723)..(723)
<223> Any amino acid
<220>
<221> VARIANT
<222> (737)..(737)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (738)..(738)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (760)..(761)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (771)..(771)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (773)..(773)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (779)..(779)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (786)..(786)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (790)..(790)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (798)..(798)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (800)..(800)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (834)..(834)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (843)..(843)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (851)..(852)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (866)..(866)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (870)..(870)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (873)..(873)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (877)..(877)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (889)..(889)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (896)..(896)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (916)..(916)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (923)..(923)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (936)..(936)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (962)..(962)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (966)..(966)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (970)..(970)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (985)..(985)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (996)..(996)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (1)..(1001)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 45
Met Lys Ile Ser Lys Val Xaa Xaa Xaa Val Xaa Lys Lys Xaa Xaa Xaa
1 5 10 15
Gly Lys Leu Xaa Lys Xaa Val Asn Glu Arg Asn Arg Xaa Ala Lys Arg
20 25 30
Leu Ser Asn Xaa Leu Asx Lys Tyr Ile Xaa Xaa Ile Asp Lys Ile Xaa
35 40 45
Lys Lys Glu Xaa Xaa Lys Lys Phe Xaa Ala Xaa Glu Glu Ile Thr Leu
50 55 60
Lys Leu Asn Gln Xaa Xaa Xaa Asx Xaa Leu Xaa Lys Ala Xaa Xaa Asp
65 70 75 80
Leu Arg Lys Asp Asn Xaa Tyr Ser Xaa Leu Lys Lys Ile Leu His Asn
85 90 95
Glu Asp Ile Asn Xaa Glu Glu Xaa Glu Leu Leu Ile Asn Asp Xaa Leu
100 105 110
Glu Lys Leu Xaa Lys Ile Glu Ser Xaa Lys Tyr Ser Tyr Gln Lys Xaa
115 120 125
Xaa Xaa Asn Tyr Xaa Met Ser Val Gln Glu His Ser Lys Lys Ser Ile
130 135 140
Xaa Arg Ile Xaa Glu Ser Ala Lys Arg Asn Lys Glu Ala Leu Asp Lys
145 150 155 160
Phe Leu Lys Glu Tyr Ala Xaa Leu Asp Pro Arg Met Glu Xaa Leu Ala
165 170 175
Lys Leu Arg Lys Leu Leu Glu Leu Tyr Phe Tyr Phe Lys Asn Asp Xaa
180 185 190
Ile Xaa Xaa Glu Glu Glu Xaa Asn Val Xaa Xaa His Lys Xaa Leu Lys
195 200 205
Glu Asn His Pro Asp Phe Val Glu Xaa Xaa Xaa Asn Lys Glu Asn Ala
210 215 220
Glu Leu Asn Xaa Tyr Ala Ile Glu Xaa Lys Lys Leu Leu Lys Tyr Tyr
225 230 235 240
Phe Pro Xaa Lys Xaa Ala Lys Asn Ser Asn Asp Lys Ile Phe Glu Lys
245 250 255
Gln Glu Leu Lys Lys Xaa Trp Ile His Gln Leu Glu Asn Ala Val Glu
260 265 270
Arg Ile Leu Leu Xaa Xaa Gly Lys Val Xaa Tyr Lys Leu Gln Xaa Gly
275 280 285
Tyr Leu Ala Glu Leu Trp Lys Ile Arg Ile Asn Glu Ile Phe Ile Lys
290 295 300
Tyr Ile Xaa Val Gly Lys Ala Val Ala Xaa Phe Ala Leu Arg Asn Xaa
305 310 315 320
Xaa Lys Asx Glu Asn Asp Ile Leu Gly Gly Lys Ile Xaa Lys Lys Leu
325 330 335
Asn Gly Ile Thr Ser Phe Xaa Tyr Glu Lys Ile Lys Ala Glu Glu Ile
340 345 350
Leu Gln Arg Glu Xaa Ala Val Glu Val Ala Phe Ala Ala Asn Xaa Leu
355 360 365
Tyr Ala Xaa Asp Leu Xaa Xaa Ile Arg Xaa Ser Ile Leu Gln Phe Phe
370 375 380
Gly Gly Ala Ser Asn Trp Asp Xaa Phe Leu Phe Phe His Phe Ala Thr
385 390 395 400
Ser Xaa Ile Ser Asp Lys Lys Trp Asn Ala Glu Leu Ile Xaa Xaa Lys
405 410 415
Lys Leu Gly Leu Val Ile Arg Glu Lys Leu Tyr Ser Asn Asn Val Ala
420 425 430
Met Phe Tyr Ser Lys Asp Asp Leu Glu Lys Leu Leu Asn Xaa Leu Xaa
435 440 445
Xaa Phe Xaa Leu Arg Ala Ser Gln Val Pro Ser Phe Lys Lys Val Tyr
450 455 460
Val Arg Xaa Asx Phe Pro Gln Asn Leu Leu Lys Lys Phe Asn Asp Glu
465 470 475 480
Lys Asp Asp Glu Ala Tyr Ser Ala Xaa Tyr Tyr Leu Leu Lys Glu Ile
485 490 495
Tyr Tyr Asn Xaa Phe Leu Pro Tyr Phe Ser Ala Asn Asn Xaa Phe Phe
500 505 510
Phe Xaa Val Lys Asn Leu Val Leu Lys Ala Asn Lys Asp Lys Phe Xaa
515 520 525
Xaa Ala Phe Xaa Asp Ile Arg Glu Met Asn Xaa Gly Ser Pro Ile Glu
530 535 540
Tyr Leu Xaa Xaa Thr Gln Xaa Asn Xaa Xaa Asn Glu Gly Arg Lys Lys
545 550 555 560
Glu Glu Lys Glu Xaa Asp Phe Ile Lys Phe Leu Leu Gln Ile Phe Xaa
565 570 575
Lys Gly Phe Asp Asp Tyr Leu Lys Asn Asn Xaa Xaa Phe Ile Leu Lys
580 585 590
Phe Ile Pro Glu Pro Thr Glu Xaa Ile Glu Ile Xaa Xaa Glu Leu Gln
595 600 605
Ala Trp Tyr Ile Val Gly Lys Phe Leu Asn Ala Arg Lys Xaa Asn Leu
610 615 620
Leu Gly Xaa Phe Xaa Ser Tyr Leu Lys Leu Leu Asp Asp Ile Glu Leu
625 630 635 640
Arg Ala Leu Arg Asn Glu Asn Ile Lys Tyr Gln Ser Ser Asn Xaa Glu
645 650 655
Lys Glu Val Leu Glu Xaa Cys Leu Glu Leu Ile Gly Leu Leu Ser Leu
660 665 670
Asp Leu Asn Asp Tyr Phe Asx Asp Glu Xaa Asp Phe Ala Xaa Tyr Leu
675 680 685
Gly Lys Xaa Leu Asp Phe Glu Lys Lys Xaa Met Lys Asp Leu Ala Glu
690 695 700
Leu Xaa Pro Tyr Asp Gln Asn Asp Gly Glu Asn Pro Ile Val Asn Arg
705 710 715 720
Asn Ile Xaa Leu Ala Lys Lys Tyr Gly Thr Leu Asn Leu Leu Glu Lys
725 730 735
Leu Xaa Asp Lys Val Ser Glu Lys Glu Ile Lys Glu Tyr Tyr Glu Leu
740 745 750
Lys Lys Glu Ile Glu Glu Tyr Xaa Xaa Lys Gly Glu Glu Leu His Glu
755 760 765
Glu Trp Xaa Gln Xaa Lys Asn Arg Val Glu Xaa Arg Asp Ile Leu Glu
770 775 780
Tyr Xaa Glu Glu Leu Xaa Gly Gln Ile Ile Asn Tyr Asn Xaa Leu Xaa
785 790 795 800
Asn Lys Val Leu Leu Tyr Phe Gln Leu Gly Leu His Tyr Leu Leu Leu
805 810 815
Asp Ile Leu Gly Arg Leu Val Gly Tyr Thr Gly Ile Trp Glu Arg Asp
820 825 830
Ala Xaa Leu Tyr Gln Ile Ala Ala Met Tyr Xaa Asn Gly Leu Pro Glu
835 840 845
Tyr Ile Xaa Xaa Lys Lys Asn Asp Lys Tyr Lys Asp Gly Gln Ile Val
850 855 860
Gly Xaa Lys Ile Asn Xaa Phe Lys Xaa Asp Lys Lys Xaa Leu Tyr Asn
865 870 875 880
Ala Gly Leu Glu Leu Phe Glu Asn Xaa Asn Glu His Lys Asn Ile Xaa
885 890 895
Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Leu Ser Lys Ala Glu Ser
900 905 910
Ser Leu Leu Xaa Tyr Ser Glu Asn Leu Arg Xaa Leu Phe Ser Tyr Asp
915 920 925
Arg Lys Leu Lys Asn Ala Val Xaa Lys Ser Leu Ile Asn Ile Leu Leu
930 935 940
Arg His Gly Met Val Leu Lys Phe Lys Phe Gly Thr Asp Lys Lys Ser
945 950 955 960
Val Xaa Ile Arg Ser Xaa Lys Lys Ile Xaa His Leu Lys Ser Ile Ala
965 970 975
Lys Lys Leu Tyr Tyr Pro Glu Val Xaa Val Ser Lys Glu Tyr Cys Lys
980 985 990
Leu Val Lys Xaa Leu Leu Lys Tyr Lys
995 1000
<210> 46
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 46
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 47
<211> 4
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
'KDEL' motif sequence"
<400> 47
Lys Asp Glu Leu
1
<210> 48
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 48
Gly Gly Gly Ser
1
<210> 49
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 49
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
20 25 30
<210> 50
<211> 45
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 50
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
35 40 45
<210> 51
<211> 60
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 51
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
35 40 45
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
50 55 60
<210> 52
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Aminohexanoyl
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Aminohexanoyl
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Aminohexanoyl
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Aminohexanoyl
<400> 52
Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg
1 5 10
<210> 53
<211> 20
<212> DNA
<213> Homo sapiens
<400> 53
gagtccgagc agaagaagaa 20
<210> 54
<211> 20
<212> DNA
<213> Homo sapiens
<400> 54
gagtcctagc aggagaagaa 20
<210> 55
<211> 20
<212> DNA
<213> Homo sapiens
<400> 55
gagtctaagc agaagaagaa 20
<210> 56
<211> 25
<212> RNA
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Thrombin sequence"
<400> 56
gggaacaaag cugaaguacu uaccc 25
<210> 57
<211> 12
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 57
ucucguacgu uc 12
<210> 58
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 58
ucucguacgu ucucucguac guuc 24
<210> 59
<211> 1340
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 59
Met Gln Ile Ser Lys Val Asn His Lys His Val Ala Val Gly Gln Lys
1 5 10 15
Asp Arg Glu Arg Ile Thr Gly Phe Ile Tyr Asn Asp Pro Val Gly Asp
20 25 30
Glu Lys Ser Leu Glu Asp Val Val Ala Lys Arg Ala Asn Asp Thr Lys
35 40 45
Val Leu Phe Asn Val Phe Asn Thr Lys Asp Leu Tyr Asp Ser Gln Glu
50 55 60
Ser Asp Lys Ser Glu Lys Asp Lys Glu Ile Ile Ser Lys Gly Ala Lys
65 70 75 80
Phe Val Ala Lys Ser Phe Asn Ser Ala Ile Thr Ile Leu Lys Lys Gln
85 90 95
Asn Lys Ile Tyr Ser Thr Leu Thr Ser Gln Gln Val Ile Lys Glu Leu
100 105 110
Lys Asp Lys Phe Gly Gly Ala Arg Ile Tyr Asp Asp Asp Ile Glu Glu
115 120 125
Ala Leu Thr Glu Thr Leu Lys Lys Ser Phe Arg Lys Glu Asn Val Arg
130 135 140
Asn Ser Ile Lys Val Leu Ile Glu Asn Ala Ala Gly Ile Arg Ser Ser
145 150 155 160
Leu Ser Lys Asp Glu Glu Glu Leu Ile Gln Glu Tyr Phe Val Lys Gln
165 170 175
Leu Val Glu Glu Tyr Thr Lys Thr Lys Leu Gln Lys Asn Val Val Lys
180 185 190
Ser Ile Lys Asn Gln Asn Met Val Ile Gln Pro Asp Ser Asp Ser Gln
195 200 205
Val Leu Ser Leu Ser Glu Ser Arg Arg Glu Lys Gln Ser Ser Ala Val
210 215 220
Ser Ser Asp Thr Leu Val Asn Cys Lys Glu Lys Asp Val Leu Lys Ala
225 230 235 240
Phe Leu Thr Asp Tyr Ala Val Leu Asp Glu Asp Glu Arg Asn Ser Leu
245 250 255
Leu Trp Lys Leu Arg Asn Leu Val Asn Leu Tyr Phe Tyr Gly Ser Glu
260 265 270
Ser Ile Arg Asp Tyr Ser Tyr Thr Lys Glu Lys Ser Val Trp Lys Glu
275 280 285
His Asp Glu Gln Lys Ala Asn Lys Thr Leu Phe Ile Asp Glu Ile Cys
290 295 300
His Ile Thr Lys Ile Gly Lys Asn Gly Lys Glu Gln Lys Val Leu Asp
305 310 315 320
Tyr Glu Glu Asn Arg Ser Arg Cys Arg Lys Gln Asn Ile Asn Tyr Tyr
325 330 335
Arg Ser Ala Leu Asn Tyr Ala Lys Asn Asn Thr Ser Gly Ile Phe Glu
340 345 350
Asn Glu Asp Ser Asn His Phe Trp Ile His Leu Ile Glu Asn Glu Val
355 360 365
Glu Arg Leu Tyr Asn Gly Ile Glu Asn Gly Glu Glu Phe Lys Phe Glu
370 375 380
Thr Gly Tyr Ile Ser Glu Lys Val Trp Lys Ala Val Ile Asn His Leu
385 390 395 400
Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr Asn Tyr Ala Met
405 410 415
Lys Glu Leu Ser Ser Pro Gly Asp Ile Glu Pro Gly Lys Ile Asp Asp
420 425 430
Ser Tyr Ile Asn Gly Ile Thr Ser Phe Asp Tyr Glu Ile Ile Lys Ala
435 440 445
Glu Glu Ser Leu Gln Arg Asp Ile Ser Met Asn Val Val Phe Ala Thr
450 455 460
Asn Tyr Leu Ala Cys Ala Thr Val Asp Thr Asp Lys Asp Phe Leu Leu
465 470 475 480
Phe Ser Lys Glu Asp Ile Arg Ser Cys Thr Lys Lys Asp Gly Asn Leu
485 490 495
Cys Lys Asn Ile Met Gln Phe Trp Gly Gly Tyr Ser Thr Trp Lys Asn
500 505 510
Phe Cys Glu Glu Tyr Leu Lys Asp Asp Lys Asp Ala Leu Glu Leu Leu
515 520 525
Tyr Ser Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe His
530 535 540
Phe Ser Thr Glu Asn Val Asp Asn Gly Ser Trp Asp Thr Glu Leu Ile
545 550 555 560
Gly Lys Leu Phe Glu Glu Asp Cys Asn Arg Ala Ala Arg Ile Glu Lys
565 570 575
Glu Lys Phe Tyr Asn Asn Asn Leu His Met Phe Tyr Ser Ser Ser Leu
580 585 590
Leu Glu Lys Val Leu Glu Arg Leu Tyr Ser Ser His His Glu Arg Ala
595 600 605
Ser Gln Val Pro Ser Phe Asn Arg Val Phe Val Arg Lys Asn Phe Pro
610 615 620
Ser Ser Leu Ser Glu Gln Arg Ile Thr Pro Lys Phe Thr Asp Ser Lys
625 630 635 640
Asp Glu Gln Ile Trp Gln Ser Ala Val Tyr Tyr Leu Cys Lys Glu Ile
645 650 655
Tyr Tyr Asn Asp Phe Leu Gln Ser Lys Glu Ala Tyr Lys Leu Phe Arg
660 665 670
Glu Gly Val Lys Asn Leu Asp Lys Asn Asp Ile Asn Asn Gln Lys Ala
675 680 685
Ala Asp Ser Phe Lys Gln Ala Val Val Tyr Tyr Gly Lys Ala Ile Gly
690 695 700
Asn Ala Thr Leu Ser Gln Val Cys Gln Ala Ile Met Thr Glu Tyr Asn
705 710 715 720
Arg Gln Asn Asn Asp Gly Leu Lys Lys Lys Ser Ala Tyr Ala Glu Lys
725 730 735
Gln Asn Ser Asn Lys Tyr Lys His Tyr Pro Leu Phe Leu Lys Gln Val
740 745 750
Leu Gln Ser Ala Phe Trp Glu Tyr Leu Asp Glu Asn Lys Glu Ile Tyr
755 760 765
Gly Phe Ile Ser Ala Gln Ile His Lys Ser Asn Val Glu Ile Lys Ala
770 775 780
Glu Asp Phe Ile Ala Asn Tyr Ser Ser Gln Gln Tyr Lys Lys Leu Val
785 790 795 800
Asp Lys Val Lys Lys Thr Pro Glu Leu Gln Lys Trp Tyr Thr Leu Gly
805 810 815
Arg Leu Ile Asn Pro Arg Gln Ala Asn Gln Phe Leu Gly Ser Ile Arg
820 825 830
Asn Tyr Val Gln Phe Val Lys Asp Ile Gln Arg Arg Ala Lys Glu Asn
835 840 845
Gly Asn Pro Ile Arg Asn Tyr Tyr Glu Val Leu Glu Ser Asp Ser Ile
850 855 860
Ile Lys Ile Leu Glu Met Cys Thr Lys Leu Asn Gly Thr Thr Ser Asn
865 870 875 880
Asp Ile His Asp Tyr Phe Arg Asp Glu Asp Glu Tyr Ala Glu Tyr Ile
885 890 895
Ser Gln Phe Val Asn Phe Gly Asp Val His Ser Gly Ala Ala Leu Asn
900 905 910
Ala Phe Cys Asn Ser Glu Ser Glu Gly Lys Lys Asn Gly Ile Tyr Tyr
915 920 925
Asp Gly Ile Asn Pro Ile Val Asn Arg Asn Trp Val Leu Cys Lys Leu
930 935 940
Tyr Gly Ser Pro Asp Leu Ile Ser Lys Ile Ile Ser Arg Val Asn Glu
945 950 955 960
Asn Met Ile His Asp Phe His Lys Gln Glu Asp Leu Ile Arg Glu Tyr
965 970 975
Gln Ile Lys Gly Ile Cys Ser Asn Lys Lys Glu Gln Gln Asp Leu Arg
980 985 990
Thr Phe Gln Val Leu Lys Asn Arg Val Glu Leu Arg Asp Ile Val Glu
995 1000 1005
Tyr Ser Glu Ile Ile Asn Glu Leu Tyr Gly Gln Leu Ile Lys Trp
1010 1015 1020
Cys Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln Leu Gly Phe
1025 1030 1035
His Tyr Leu Cys Leu Asn Asn Ala Ser Ser Lys Glu Ala Asp Tyr
1040 1045 1050
Ile Lys Ile Asn Val Asp Asp Arg Asn Ile Ser Gly Ala Ile Leu
1055 1060 1065
Tyr Gln Ile Ala Ala Met Tyr Ile Asn Gly Leu Pro Val Tyr Tyr
1070 1075 1080
Lys Lys Asp Asp Met Tyr Val Ala Leu Lys Ser Gly Lys Lys Ala
1085 1090 1095
Ser Asp Glu Leu Asn Ser Asn Glu Gln Thr Ser Lys Lys Ile Asn
1100 1105 1110
Tyr Phe Leu Lys Tyr Gly Asn Asn Ile Leu Gly Asp Lys Lys Asp
1115 1120 1125
Gln Leu Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Val Ala Glu
1130 1135 1140
His Glu Asn Ile Ile Ile Phe Arg Asn Glu Ile Asp His Phe His
1145 1150 1155
Tyr Phe Tyr Asp Arg Asp Arg Ser Met Leu Asp Leu Tyr Ser Glu
1160 1165 1170
Val Phe Asp Arg Phe Phe Thr Tyr Asp Met Lys Leu Arg Lys Asn
1175 1180 1185
Val Val Asn Met Leu Tyr Asn Ile Leu Leu Asp His Asn Ile Val
1190 1195 1200
Ser Ser Phe Val Phe Glu Thr Gly Glu Lys Lys Val Gly Arg Gly
1205 1210 1215
Asp Ser Glu Val Ile Lys Pro Ser Ala Lys Ile Arg Leu Arg Ala
1220 1225 1230
Asn Asn Gly Val Ser Ser Asp Val Phe Thr Tyr Lys Val Gly Ser
1235 1240 1245
Lys Asp Glu Leu Lys Ile Ala Thr Leu Pro Ala Lys Asn Glu Glu
1250 1255 1260
Phe Leu Leu Asn Val Ala Arg Leu Ile Tyr Tyr Pro Asp Met Glu
1265 1270 1275
Ala Val Ser Glu Asn Met Val Arg Glu Gly Val Val Lys Val Glu
1280 1285 1290
Lys Ser Asn Asp Lys Lys Gly Lys Ile Ser Arg Gly Ser Asn Thr
1295 1300 1305
Arg Ser Ser Asn Gln Ser Lys Tyr Asn Asn Lys Ser Lys Asn Arg
1310 1315 1320
Met Asn Tyr Ser Met Gly Ser Ile Phe Glu Lys Met Asp Leu Lys
1325 1330 1335
Phe Asp
1340
<210> 60
<211> 1437
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 60
Met Lys Ile Ser Lys Val Arg Glu Glu Asn Arg Gly Ala Lys Leu Thr
1 5 10 15
Val Asn Ala Lys Thr Ala Val Val Ser Glu Asn Arg Ser Gln Glu Gly
20 25 30
Ile Leu Tyr Asn Asp Pro Ser Arg Tyr Gly Lys Ser Arg Lys Asn Asp
35 40 45
Glu Asp Arg Asp Arg Tyr Ile Glu Ser Arg Leu Lys Ser Ser Gly Lys
50 55 60
Leu Tyr Arg Ile Phe Asn Glu Asp Lys Asn Lys Arg Glu Thr Asp Glu
65 70 75 80
Leu Gln Trp Phe Leu Ser Glu Ile Val Lys Lys Ile Asn Arg Arg Asn
85 90 95
Gly Leu Val Leu Ser Asp Met Leu Ser Val Asp Asp Arg Ala Phe Glu
100 105 110
Lys Ala Phe Glu Lys Tyr Ala Glu Leu Ser Tyr Thr Asn Arg Arg Asn
115 120 125
Lys Val Ser Gly Ser Pro Ala Phe Glu Thr Cys Gly Val Asp Ala Ala
130 135 140
Thr Ala Glu Arg Leu Lys Gly Ile Ile Ser Glu Thr Asn Phe Ile Asn
145 150 155 160
Arg Ile Lys Asn Asn Ile Asp Asn Lys Val Ser Glu Asp Ile Ile Asp
165 170 175
Arg Ile Ile Ala Lys Tyr Leu Lys Lys Ser Leu Cys Arg Glu Arg Val
180 185 190
Lys Arg Gly Leu Lys Lys Leu Leu Met Asn Ala Phe Asp Leu Pro Tyr
195 200 205
Ser Asp Pro Asp Ile Asp Val Gln Arg Asp Phe Ile Asp Tyr Val Leu
210 215 220
Glu Asp Phe Tyr His Val Arg Ala Lys Ser Gln Val Ser Arg Ser Ile
225 230 235 240
Lys Asn Met Asn Met Pro Val Gln Pro Glu Gly Asp Gly Lys Phe Ala
245 250 255
Ile Thr Val Ser Lys Gly Gly Thr Glu Ser Gly Asn Lys Arg Ser Ala
260 265 270
Glu Lys Glu Ala Phe Lys Lys Phe Leu Ser Asp Tyr Ala Ser Leu Asp
275 280 285
Glu Arg Val Arg Asp Asp Met Leu Arg Arg Met Arg Arg Leu Val Val
290 295 300
Leu Tyr Phe Tyr Gly Ser Asp Asp Ser Lys Leu Ser Asp Val Asn Glu
305 310 315 320
Lys Phe Asp Val Trp Glu Asp His Ala Ala Arg Arg Val Asp Asn Arg
325 330 335
Glu Phe Ile Lys Leu Pro Leu Glu Asn Lys Leu Ala Asn Gly Lys Thr
340 345 350
Asp Lys Asp Ala Glu Arg Ile Arg Lys Asn Thr Val Lys Glu Leu Tyr
355 360 365
Arg Asn Gln Asn Ile Gly Cys Tyr Arg Gln Ala Val Lys Ala Val Glu
370 375 380
Glu Asp Asn Asn Gly Arg Tyr Phe Asp Asp Lys Met Leu Asn Met Phe
385 390 395 400
Phe Ile His Arg Ile Glu Tyr Gly Val Glu Lys Ile Tyr Ala Asn Leu
405 410 415
Lys Gln Val Thr Glu Phe Lys Ala Arg Thr Gly Tyr Leu Ser Glu Lys
420 425 430
Ile Trp Lys Asp Leu Ile Asn Tyr Ile Ser Ile Lys Tyr Ile Ala Met
435 440 445
Gly Lys Ala Val Tyr Asn Tyr Ala Met Asp Glu Leu Asn Ala Ser Asp
450 455 460
Lys Lys Glu Ile Glu Leu Gly Lys Ile Ser Glu Glu Tyr Leu Ser Gly
465 470 475 480
Ile Ser Ser Phe Asp Tyr Glu Leu Ile Lys Ala Glu Glu Met Leu Gln
485 490 495
Arg Glu Thr Ala Val Tyr Val Ala Phe Ala Ala Arg His Leu Ser Ser
500 505 510
Gln Thr Val Glu Leu Asp Ser Glu Asn Ser Asp Phe Leu Leu Leu Lys
515 520 525
Pro Lys Gly Thr Met Asp Lys Asn Asp Lys Asn Lys Leu Ala Ser Asn
530 535 540
Asn Ile Leu Asn Phe Leu Lys Asp Lys Glu Thr Leu Arg Asp Thr Ile
545 550 555 560
Leu Gln Tyr Phe Gly Gly His Ser Leu Trp Thr Asp Phe Pro Phe Asp
565 570 575
Lys Tyr Leu Ala Gly Gly Lys Asp Asp Val Asp Phe Leu Thr Asp Leu
580 585 590
Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe His Tyr Ala Thr
595 600 605
Glu Asn His Asn Asn Gly Lys Trp Asn Lys Glu Leu Ile Ser Ala Met
610 615 620
Phe Glu His Glu Thr Glu Arg Met Thr Val Val Met Lys Asp Lys Phe
625 630 635 640
Tyr Ser Asn Asn Leu Pro Met Phe Tyr Lys Asn Asp Asp Leu Lys Lys
645 650 655
Leu Leu Ile Asp Leu Tyr Lys Asp Asn Val Glu Arg Ala Ser Gln Val
660 665 670
Pro Ser Phe Asn Lys Val Phe Val Arg Lys Asn Phe Pro Ala Leu Val
675 680 685
Arg Asp Lys Asp Asn Leu Gly Ile Glu Leu Asp Leu Lys Ala Asp Ala
690 695 700
Asp Lys Gly Glu Asn Glu Leu Lys Phe Tyr Asn Ala Leu Tyr Tyr Met
705 710 715 720
Phe Lys Glu Ile Tyr Tyr Asn Ala Phe Leu Asn Asp Lys Asn Val Arg
725 730 735
Glu Arg Phe Ile Thr Lys Ala Thr Lys Val Ala Asp Asn Tyr Asp Arg
740 745 750
Asn Lys Glu Arg Asn Leu Lys Asp Arg Ile Lys Ser Ala Gly Ser Asp
755 760 765
Glu Lys Lys Lys Leu Arg Glu Gln Leu Gln Asn Tyr Ile Ala Glu Asn
770 775 780
Asp Phe Gly Gln Arg Ile Lys Asn Ile Val Gln Val Asn Pro Asp Tyr
785 790 795 800
Thr Leu Ala Gln Ile Cys Gln Leu Ile Met Thr Glu Tyr Asn Gln Gln
805 810 815
Asn Asn Gly Cys Met Gln Lys Lys Ser Ala Ala Arg Lys Asp Ile Asn
820 825 830
Lys Asp Ser Tyr Gln His Tyr Lys Met Leu Leu Leu Val Asn Leu Arg
835 840 845
Lys Ala Phe Leu Glu Phe Ile Lys Glu Asn Tyr Ala Phe Val Leu Lys
850 855 860
Pro Tyr Lys His Asp Leu Cys Asp Lys Ala Asp Phe Val Pro Asp Phe
865 870 875 880
Ala Lys Tyr Val Lys Pro Tyr Ala Gly Leu Ile Ser Arg Val Ala Gly
885 890 895
Ser Ser Glu Leu Gln Lys Trp Tyr Ile Val Ser Arg Phe Leu Ser Pro
900 905 910
Ala Gln Ala Asn His Met Leu Gly Phe Leu His Ser Tyr Lys Gln Tyr
915 920 925
Val Trp Asp Ile Tyr Arg Arg Ala Ser Glu Thr Gly Thr Glu Ile Asn
930 935 940
His Ser Ile Ala Glu Asp Lys Ile Ala Gly Val Asp Ile Thr Asp Val
945 950 955 960
Asp Ala Val Ile Asp Leu Ser Val Lys Leu Cys Gly Thr Ile Ser Ser
965 970 975
Glu Ile Ser Asp Tyr Phe Lys Asp Asp Glu Val Tyr Ala Glu Tyr Ile
980 985 990
Ser Ser Tyr Leu Asp Phe Glu Tyr Asp Gly Gly Asn Tyr Lys Asp Ser
995 1000 1005
Leu Asn Arg Phe Cys Asn Ser Asp Ala Val Asn Asp Gln Lys Val
1010 1015 1020
Ala Leu Tyr Tyr Asp Gly Glu His Pro Lys Leu Asn Arg Asn Ile
1025 1030 1035
Ile Leu Ser Lys Leu Tyr Gly Glu Arg Arg Phe Leu Glu Lys Ile
1040 1045 1050
Thr Asp Arg Val Ser Arg Ser Asp Ile Val Glu Tyr Tyr Lys Leu
1055 1060 1065
Lys Lys Glu Thr Ser Gln Tyr Gln Thr Lys Gly Ile Phe Asp Ser
1070 1075 1080
Glu Asp Glu Gln Lys Asn Ile Lys Lys Phe Gln Glu Met Lys Asn
1085 1090 1095
Ile Val Glu Phe Arg Asp Leu Met Asp Tyr Ser Glu Ile Ala Asp
1100 1105 1110
Glu Leu Gln Gly Gln Leu Ile Asn Trp Ile Tyr Leu Arg Glu Arg
1115 1120 1125
Asp Leu Met Asn Phe Gln Leu Gly Tyr His Tyr Ala Cys Leu Asn
1130 1135 1140
Asn Asp Ser Asn Lys Gln Ala Thr Tyr Val Thr Leu Asp Tyr Gln
1145 1150 1155
Gly Lys Lys Asn Arg Lys Ile Asn Gly Ala Ile Leu Tyr Gln Ile
1160 1165 1170
Cys Ala Met Tyr Ile Asn Gly Leu Pro Leu Tyr Tyr Val Asp Lys
1175 1180 1185
Asp Ser Ser Glu Trp Thr Val Ser Asp Gly Lys Glu Ser Thr Gly
1190 1195 1200
Ala Lys Ile Gly Glu Phe Tyr Arg Tyr Ala Lys Ser Phe Glu Asn
1205 1210 1215
Thr Ser Asp Cys Tyr Ala Ser Gly Leu Glu Ile Phe Glu Asn Ile
1220 1225 1230
Ser Glu His Asp Asn Ile Thr Glu Leu Arg Asn Tyr Ile Glu His
1235 1240 1245
Phe Arg Tyr Tyr Ser Ser Phe Asp Arg Ser Phe Leu Gly Ile Tyr
1250 1255 1260
Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr Asp Leu Lys Tyr Arg
1265 1270 1275
Lys Asn Val Pro Thr Ile Leu Tyr Asn Ile Leu Leu Gln His Phe
1280 1285 1290
Val Asn Val Arg Phe Glu Phe Val Ser Gly Lys Lys Met Ile Gly
1295 1300 1305
Ile Asp Lys Lys Asp Arg Lys Ile Ala Lys Glu Lys Glu Cys Ala
1310 1315 1320
Arg Ile Thr Ile Arg Glu Lys Asn Gly Val Tyr Ser Glu Gln Phe
1325 1330 1335
Thr Tyr Lys Leu Lys Asn Gly Thr Val Tyr Val Asp Ala Arg Asp
1340 1345 1350
Lys Arg Tyr Leu Gln Ser Ile Ile Arg Leu Leu Phe Tyr Pro Glu
1355 1360 1365
Lys Val Asn Met Asp Glu Met Ile Glu Val Lys Glu Lys Lys Lys
1370 1375 1380
Pro Ser Asp Asn Asn Thr Gly Lys Gly Tyr Ser Lys Arg Asp Arg
1385 1390 1395
Gln Gln Asp Arg Lys Glu Tyr Asp Lys Tyr Lys Glu Lys Lys Lys
1400 1405 1410
Lys Glu Gly Asn Phe Leu Ser Gly Met Gly Gly Asn Ile Asn Trp
1415 1420 1425
Asp Glu Ile Asn Ala Gln Leu Lys Asn
1430 1435
<210> 61
<211> 1385
<212> PRT
<213> Clostridium aminophilum
<400> 61
Met Lys Phe Ser Lys Val Asp His Thr Arg Ser Ala Val Gly Ile Gln
1 5 10 15
Lys Ala Thr Asp Ser Val His Gly Met Leu Tyr Thr Asp Pro Lys Lys
20 25 30
Gln Glu Val Asn Asp Leu Asp Lys Arg Phe Asp Gln Leu Asn Val Lys
35 40 45
Ala Lys Arg Leu Tyr Asn Val Phe Asn Gln Ser Lys Ala Glu Glu Asp
50 55 60
Asp Asp Glu Lys Arg Phe Gly Lys Val Val Lys Lys Leu Asn Arg Glu
65 70 75 80
Leu Lys Asp Leu Leu Phe His Arg Glu Val Ser Arg Tyr Asn Ser Ile
85 90 95
Gly Asn Ala Lys Tyr Asn Tyr Tyr Gly Ile Lys Ser Asn Pro Glu Glu
100 105 110
Ile Val Ser Asn Leu Gly Met Val Glu Ser Leu Lys Gly Glu Arg Asp
115 120 125
Pro Gln Lys Val Ile Ser Lys Leu Leu Leu Tyr Tyr Leu Arg Lys Gly
130 135 140
Leu Lys Pro Gly Thr Asp Gly Leu Arg Met Ile Leu Glu Ala Ser Cys
145 150 155 160
Gly Leu Arg Lys Leu Ser Gly Asp Glu Lys Glu Leu Lys Val Phe Leu
165 170 175
Gln Thr Leu Asp Glu Asp Phe Glu Lys Lys Thr Phe Lys Lys Asn Leu
180 185 190
Ile Arg Ser Ile Glu Asn Gln Asn Met Ala Val Gln Pro Ser Asn Glu
195 200 205
Gly Asp Pro Ile Ile Gly Ile Thr Gln Gly Arg Phe Asn Ser Gln Lys
210 215 220
Asn Glu Glu Lys Ser Ala Ile Glu Arg Met Met Ser Met Tyr Ala Asp
225 230 235 240
Leu Asn Glu Asp His Arg Glu Asp Val Leu Arg Lys Leu Arg Arg Leu
245 250 255
Asn Val Leu Tyr Phe Asn Val Asp Thr Glu Lys Thr Glu Glu Pro Thr
260 265 270
Leu Pro Gly Glu Val Asp Thr Asn Pro Val Phe Glu Val Trp His Asp
275 280 285
His Glu Lys Gly Lys Glu Asn Asp Arg Gln Phe Ala Thr Phe Ala Lys
290 295 300
Ile Leu Thr Glu Asp Arg Glu Thr Arg Lys Lys Glu Lys Leu Ala Val
305 310 315 320
Lys Glu Ala Leu Asn Asp Leu Lys Ser Ala Ile Arg Asp His Asn Ile
325 330 335
Met Ala Tyr Arg Cys Ser Ile Lys Val Thr Glu Gln Asp Lys Asp Gly
340 345 350
Leu Phe Phe Glu Asp Gln Arg Ile Asn Arg Phe Trp Ile His His Ile
355 360 365
Glu Ser Ala Val Glu Arg Ile Leu Ala Ser Ile Asn Pro Glu Lys Leu
370 375 380
Tyr Lys Leu Arg Ile Gly Tyr Leu Gly Glu Lys Val Trp Lys Asp Leu
385 390 395 400
Leu Asn Tyr Leu Ser Ile Lys Tyr Ile Ala Val Gly Lys Ala Val Phe
405 410 415
His Phe Ala Met Glu Asp Leu Gly Lys Thr Gly Gln Asp Ile Glu Leu
420 425 430
Gly Lys Leu Ser Asn Ser Val Ser Gly Gly Leu Thr Ser Phe Asp Tyr
435 440 445
Glu Gln Ile Arg Ala Asp Glu Thr Leu Gln Arg Gln Leu Ser Val Glu
450 455 460
Val Ala Phe Ala Ala Asn Asn Leu Phe Arg Ala Val Val Gly Gln Thr
465 470 475 480
Gly Lys Lys Ile Glu Gln Ser Lys Ser Glu Glu Asn Glu Glu Asp Phe
485 490 495
Leu Leu Trp Lys Ala Glu Lys Ile Ala Glu Ser Ile Lys Lys Glu Gly
500 505 510
Glu Gly Asn Thr Leu Lys Ser Ile Leu Gln Phe Phe Gly Gly Ala Ser
515 520 525
Ser Trp Asp Leu Asn His Phe Cys Ala Ala Tyr Gly Asn Glu Ser Ser
530 535 540
Ala Leu Gly Tyr Glu Thr Lys Phe Ala Asp Asp Leu Arg Lys Ala Ile
545 550 555 560
Tyr Ser Leu Arg Asn Glu Thr Phe His Phe Thr Thr Leu Asn Lys Gly
565 570 575
Ser Phe Asp Trp Asn Ala Lys Leu Ile Gly Asp Met Phe Ser His Glu
580 585 590
Ala Ala Thr Gly Ile Ala Val Glu Arg Thr Arg Phe Tyr Ser Asn Asn
595 600 605
Leu Pro Met Phe Tyr Arg Glu Ser Asp Leu Lys Arg Ile Met Asp His
610 615 620
Leu Tyr Asn Thr Tyr His Pro Arg Ala Ser Gln Val Pro Ser Phe Asn
625 630 635 640
Ser Val Phe Val Arg Lys Asn Phe Arg Leu Phe Leu Ser Asn Thr Leu
645 650 655
Asn Thr Asn Thr Ser Phe Asp Thr Glu Val Tyr Gln Lys Trp Glu Ser
660 665 670
Gly Val Tyr Tyr Leu Phe Lys Glu Ile Tyr Tyr Asn Ser Phe Leu Pro
675 680 685
Ser Gly Asp Ala His His Leu Phe Phe Glu Gly Leu Arg Arg Ile Arg
690 695 700
Lys Glu Ala Asp Asn Leu Pro Ile Val Gly Lys Glu Ala Lys Lys Arg
705 710 715 720
Asn Ala Val Gln Asp Phe Gly Arg Arg Cys Asp Glu Leu Lys Asn Leu
725 730 735
Ser Leu Ser Ala Ile Cys Gln Met Ile Met Thr Glu Tyr Asn Glu Gln
740 745 750
Asn Asn Gly Asn Arg Lys Val Lys Ser Thr Arg Glu Asp Lys Arg Lys
755 760 765
Pro Asp Ile Phe Gln His Tyr Lys Met Leu Leu Leu Arg Thr Leu Gln
770 775 780
Glu Ala Phe Ala Ile Tyr Ile Arg Arg Glu Glu Phe Lys Phe Ile Phe
785 790 795 800
Asp Leu Pro Lys Thr Leu Tyr Val Met Lys Pro Val Glu Glu Phe Leu
805 810 815
Pro Asn Trp Lys Ser Gly Met Phe Asp Ser Leu Val Glu Arg Val Lys
820 825 830
Gln Ser Pro Asp Leu Gln Arg Trp Tyr Val Leu Cys Lys Phe Leu Asn
835 840 845
Gly Arg Leu Leu Asn Gln Leu Ser Gly Val Ile Arg Ser Tyr Ile Gln
850 855 860
Phe Ala Gly Asp Ile Gln Arg Arg Ala Lys Ala Asn His Asn Arg Leu
865 870 875 880
Tyr Met Asp Asn Thr Gln Arg Val Glu Tyr Tyr Ser Asn Val Leu Glu
885 890 895
Val Val Asp Phe Cys Ile Lys Gly Thr Ser Arg Phe Ser Asn Val Phe
900 905 910
Ser Asp Tyr Phe Arg Asp Glu Asp Ala Tyr Ala Asp Tyr Leu Asp Asn
915 920 925
Tyr Leu Gln Phe Lys Asp Glu Lys Ile Ala Glu Val Ser Ser Phe Ala
930 935 940
Ala Leu Lys Thr Phe Cys Asn Glu Glu Glu Val Lys Ala Gly Ile Tyr
945 950 955 960
Met Asp Gly Glu Asn Pro Val Met Gln Arg Asn Ile Val Met Ala Lys
965 970 975
Leu Phe Gly Pro Asp Glu Val Leu Lys Asn Val Val Pro Lys Val Thr
980 985 990
Arg Glu Glu Ile Glu Glu Tyr Tyr Gln Leu Glu Lys Gln Ile Ala Pro
995 1000 1005
Tyr Arg Gln Asn Gly Tyr Cys Lys Ser Glu Glu Asp Gln Lys Lys
1010 1015 1020
Leu Leu Arg Phe Gln Arg Ile Lys Asn Arg Val Glu Phe Gln Thr
1025 1030 1035
Ile Thr Glu Phe Ser Glu Ile Ile Asn Glu Leu Leu Gly Gln Leu
1040 1045 1050
Ile Ser Trp Ser Phe Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln
1055 1060 1065
Leu Gly Phe His Tyr Leu Cys Leu His Asn Asp Thr Glu Lys Pro
1070 1075 1080
Ala Glu Tyr Lys Glu Ile Ser Arg Glu Asp Gly Thr Val Ile Arg
1085 1090 1095
Asn Ala Ile Leu His Gln Val Ala Ala Met Tyr Val Gly Gly Leu
1100 1105 1110
Pro Val Tyr Thr Leu Ala Asp Lys Lys Leu Ala Ala Phe Glu Lys
1115 1120 1125
Gly Glu Ala Asp Cys Lys Leu Ser Ile Ser Lys Asp Thr Ala Gly
1130 1135 1140
Ala Gly Lys Lys Ile Lys Asp Phe Phe Arg Tyr Ser Lys Tyr Val
1145 1150 1155
Leu Ile Lys Asp Arg Met Leu Thr Asp Gln Asn Gln Lys Tyr Thr
1160 1165 1170
Ile Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Thr Asp Glu His
1175 1180 1185
Asp Asn Ile Thr Asp Val Arg Lys Tyr Val Asp His Phe Lys Tyr
1190 1195 1200
Tyr Ala Thr Ser Asp Glu Asn Ala Met Ser Ile Leu Asp Leu Tyr
1205 1210 1215
Ser Glu Ile His Asp Arg Phe Phe Thr Tyr Asp Met Lys Tyr Gln
1220 1225 1230
Lys Asn Val Ala Asn Met Leu Glu Asn Ile Leu Leu Arg His Phe
1235 1240 1245
Val Leu Ile Arg Pro Glu Phe Phe Thr Gly Ser Lys Lys Val Gly
1250 1255 1260
Glu Gly Lys Lys Ile Thr Cys Lys Ala Arg Ala Gln Ile Glu Ile
1265 1270 1275
Ala Glu Asn Gly Met Arg Ser Glu Asp Phe Thr Tyr Lys Leu Ser
1280 1285 1290
Asp Gly Lys Lys Asn Ile Ser Thr Cys Met Ile Ala Ala Arg Asp
1295 1300 1305
Gln Lys Tyr Leu Asn Thr Val Ala Arg Leu Leu Tyr Tyr Pro His
1310 1315 1320
Glu Ala Lys Lys Ser Ile Val Asp Thr Arg Glu Lys Lys Asn Asn
1325 1330 1335
Lys Lys Thr Asn Arg Gly Asp Gly Thr Phe Asn Lys Gln Lys Gly
1340 1345 1350
Thr Ala Arg Lys Glu Lys Asp Asn Gly Pro Arg Glu Phe Asn Asp
1355 1360 1365
Thr Gly Phe Ser Asn Thr Pro Phe Ala Gly Phe Asp Pro Phe Arg
1370 1375 1380
Asn Ser
1385
<210> 62
<211> 1175
<212> PRT
<213> Carnobacterium gallinarum
<400> 62
Met Arg Ile Thr Lys Val Lys Ile Lys Leu Asp Asn Lys Leu Tyr Gln
1 5 10 15
Val Thr Met Gln Lys Glu Glu Lys Tyr Gly Thr Leu Lys Leu Asn Glu
20 25 30
Glu Ser Arg Lys Ser Thr Ala Glu Ile Leu Arg Leu Lys Lys Ala Ser
35 40 45
Phe Asn Lys Ser Phe His Ser Lys Thr Ile Asn Ser Gln Lys Glu Asn
50 55 60
Lys Asn Ala Thr Ile Lys Lys Asn Gly Asp Tyr Ile Ser Gln Ile Phe
65 70 75 80
Glu Lys Leu Val Gly Val Asp Thr Asn Lys Asn Ile Arg Lys Pro Lys
85 90 95
Met Ser Leu Thr Asp Leu Lys Asp Leu Pro Lys Lys Asp Leu Ala Leu
100 105 110
Phe Ile Lys Arg Lys Phe Lys Asn Asp Asp Ile Val Glu Ile Lys Asn
115 120 125
Leu Asp Leu Ile Ser Leu Phe Tyr Asn Ala Leu Gln Lys Val Pro Gly
130 135 140
Glu His Phe Thr Asp Glu Ser Trp Ala Asp Phe Cys Gln Glu Met Met
145 150 155 160
Pro Tyr Arg Glu Tyr Lys Asn Lys Phe Ile Glu Arg Lys Ile Ile Leu
165 170 175
Leu Ala Asn Ser Ile Glu Gln Asn Lys Gly Phe Ser Ile Asn Pro Glu
180 185 190
Thr Phe Ser Lys Arg Lys Arg Val Leu His Gln Trp Ala Ile Glu Val
195 200 205
Gln Glu Arg Gly Asp Phe Ser Ile Leu Asp Glu Lys Leu Ser Lys Leu
210 215 220
Ala Glu Ile Tyr Asn Phe Lys Lys Met Cys Lys Arg Val Gln Asp Glu
225 230 235 240
Leu Asn Asp Leu Glu Lys Ser Met Lys Lys Gly Lys Asn Pro Glu Lys
245 250 255
Glu Lys Glu Ala Tyr Lys Lys Gln Lys Asn Phe Lys Ile Lys Thr Ile
260 265 270
Trp Lys Asp Tyr Pro Tyr Lys Thr His Ile Gly Leu Ile Glu Lys Ile
275 280 285
Lys Glu Asn Glu Glu Leu Asn Gln Phe Asn Ile Glu Ile Gly Lys Tyr
290 295 300
Phe Glu His Tyr Phe Pro Ile Lys Lys Glu Arg Cys Thr Glu Asp Glu
305 310 315 320
Pro Tyr Tyr Leu Asn Ser Glu Thr Ile Ala Thr Thr Val Asn Tyr Gln
325 330 335
Leu Lys Asn Ala Leu Ile Ser Tyr Leu Met Gln Ile Gly Lys Tyr Lys
340 345 350
Gln Phe Gly Leu Glu Asn Gln Val Leu Asp Ser Lys Lys Leu Gln Glu
355 360 365
Ile Gly Ile Tyr Glu Gly Phe Gln Thr Lys Phe Met Asp Ala Cys Val
370 375 380
Phe Ala Thr Ser Ser Leu Lys Asn Ile Ile Glu Pro Met Arg Ser Gly
385 390 395 400
Asp Ile Leu Gly Lys Arg Glu Phe Lys Glu Ala Ile Ala Thr Ser Ser
405 410 415
Phe Val Asn Tyr His His Phe Phe Pro Tyr Phe Pro Phe Glu Leu Lys
420 425 430
Gly Met Lys Asp Arg Glu Ser Glu Leu Ile Pro Phe Gly Glu Gln Thr
435 440 445
Glu Ala Lys Gln Met Gln Asn Ile Trp Ala Leu Arg Gly Ser Val Gln
450 455 460
Gln Ile Arg Asn Glu Ile Phe His Ser Phe Asp Lys Asn Gln Lys Phe
465 470 475 480
Asn Leu Pro Gln Leu Asp Lys Ser Asn Phe Glu Phe Asp Ala Ser Glu
485 490 495
Asn Ser Thr Gly Lys Ser Gln Ser Tyr Ile Glu Thr Asp Tyr Lys Phe
500 505 510
Leu Phe Glu Ala Glu Lys Asn Gln Leu Glu Gln Phe Phe Ile Glu Arg
515 520 525
Ile Lys Ser Ser Gly Ala Leu Glu Tyr Tyr Pro Leu Lys Ser Leu Glu
530 535 540
Lys Leu Phe Ala Lys Lys Glu Met Lys Phe Ser Leu Gly Ser Gln Val
545 550 555 560
Val Ala Phe Ala Pro Ser Tyr Lys Lys Leu Val Lys Lys Gly His Ser
565 570 575
Tyr Gln Thr Ala Thr Glu Gly Thr Ala Asn Tyr Leu Gly Leu Ser Tyr
580 585 590
Tyr Asn Arg Tyr Glu Leu Lys Glu Glu Ser Phe Gln Ala Gln Tyr Tyr
595 600 605
Leu Leu Lys Leu Ile Tyr Gln Tyr Val Phe Leu Pro Asn Phe Ser Gln
610 615 620
Gly Asn Ser Pro Ala Phe Arg Glu Thr Val Lys Ala Ile Leu Arg Ile
625 630 635 640
Asn Lys Asp Glu Ala Arg Lys Lys Met Lys Lys Asn Lys Lys Phe Leu
645 650 655
Arg Lys Tyr Ala Phe Glu Gln Val Arg Glu Met Glu Phe Lys Glu Thr
660 665 670
Pro Asp Gln Tyr Met Ser Tyr Leu Gln Ser Glu Met Arg Glu Glu Lys
675 680 685
Val Arg Lys Ala Glu Lys Asn Asp Lys Gly Phe Glu Lys Asn Ile Thr
690 695 700
Met Asn Phe Glu Lys Leu Leu Met Gln Ile Phe Val Lys Gly Phe Asp
705 710 715 720
Val Phe Leu Thr Thr Phe Ala Gly Lys Glu Leu Leu Leu Ser Ser Glu
725 730 735
Glu Lys Val Ile Lys Glu Thr Glu Ile Ser Leu Ser Lys Lys Ile Asn
740 745 750
Glu Arg Glu Lys Thr Leu Lys Ala Ser Ile Gln Val Glu His Gln Leu
755 760 765
Val Ala Thr Asn Ser Ala Ile Ser Tyr Trp Leu Phe Cys Lys Leu Leu
770 775 780
Asp Ser Arg His Leu Asn Glu Leu Arg Asn Glu Met Ile Lys Phe Lys
785 790 795 800
Gln Ser Arg Ile Lys Phe Asn His Thr Gln His Ala Glu Leu Ile Gln
805 810 815
Asn Leu Leu Pro Ile Val Glu Leu Thr Ile Leu Ser Asn Asp Tyr Asp
820 825 830
Glu Lys Asn Asp Ser Gln Asn Val Asp Val Ser Ala Tyr Phe Glu Asp
835 840 845
Lys Ser Leu Tyr Glu Thr Ala Pro Tyr Val Gln Thr Asp Asp Arg Thr
850 855 860
Arg Val Ser Phe Arg Pro Ile Leu Lys Leu Glu Lys Tyr His Thr Lys
865 870 875 880
Ser Leu Ile Glu Ala Leu Leu Lys Asp Asn Pro Gln Phe Arg Val Ala
885 890 895
Ala Thr Asp Ile Gln Glu Trp Met His Lys Arg Glu Glu Ile Gly Glu
900 905 910
Leu Val Glu Lys Arg Lys Asn Leu His Thr Glu Trp Ala Glu Gly Gln
915 920 925
Gln Thr Leu Gly Ala Glu Lys Arg Glu Glu Tyr Arg Asp Tyr Cys Lys
930 935 940
Lys Ile Asp Arg Phe Asn Trp Lys Ala Asn Lys Val Thr Leu Thr Tyr
945 950 955 960
Leu Ser Gln Leu His Tyr Leu Ile Thr Asp Leu Leu Gly Arg Met Val
965 970 975
Gly Phe Ser Ala Leu Phe Glu Arg Asp Leu Val Tyr Phe Ser Arg Ser
980 985 990
Phe Ser Glu Leu Gly Gly Glu Thr Tyr His Ile Ser Asp Tyr Lys Asn
995 1000 1005
Leu Ser Gly Val Leu Arg Leu Asn Ala Glu Val Lys Pro Ile Lys
1010 1015 1020
Ile Lys Asn Ile Lys Val Ile Asp Asn Glu Glu Asn Pro Tyr Lys
1025 1030 1035
Gly Asn Glu Pro Glu Val Lys Pro Phe Leu Asp Arg Leu His Ala
1040 1045 1050
Tyr Leu Glu Asn Val Ile Gly Ile Lys Ala Val His Gly Lys Ile
1055 1060 1065
Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu Leu Ser
1070 1075 1080
Met Ile Glu Ser Met Asn Asn Leu Arg Asp Leu Met Ala Tyr Asp
1085 1090 1095
Arg Lys Leu Lys Asn Ala Val Thr Lys Ser Met Ile Lys Ile Leu
1100 1105 1110
Asp Lys His Gly Met Ile Leu Lys Leu Lys Ile Asp Glu Asn His
1115 1120 1125
Lys Asn Phe Glu Ile Glu Ser Leu Ile Pro Lys Glu Ile Ile His
1130 1135 1140
Leu Lys Asp Lys Ala Ile Lys Thr Asn Gln Val Ser Glu Glu Tyr
1145 1150 1155
Cys Gln Leu Val Leu Ala Leu Leu Thr Thr Asn Pro Gly Asn Gln
1160 1165 1170
Leu Asn
1175
<210> 63
<211> 1164
<212> PRT
<213> Carnobacterium gallinarum
<400> 63
Met Arg Met Thr Lys Val Lys Ile Asn Gly Ser Pro Val Ser Met Asn
1 5 10 15
Arg Ser Lys Leu Asn Gly His Leu Val Trp Asn Gly Thr Thr Asn Thr
20 25 30
Val Asn Ile Leu Thr Lys Lys Glu Gln Ser Phe Ala Ala Ser Phe Leu
35 40 45
Asn Lys Thr Leu Val Lys Ala Asp Gln Val Lys Gly Tyr Lys Val Leu
50 55 60
Ala Glu Asn Ile Phe Ile Ile Phe Glu Gln Leu Glu Lys Ser Asn Ser
65 70 75 80
Glu Lys Pro Ser Val Tyr Leu Asn Asn Ile Arg Arg Leu Lys Glu Ala
85 90 95
Gly Leu Lys Arg Phe Phe Lys Ser Lys Tyr His Glu Glu Ile Lys Tyr
100 105 110
Thr Ser Glu Lys Asn Gln Ser Val Pro Thr Lys Leu Asn Leu Ile Pro
115 120 125
Leu Phe Phe Asn Ala Val Asp Arg Ile Gln Glu Asp Lys Phe Asp Glu
130 135 140
Lys Asn Trp Ser Tyr Phe Cys Lys Glu Met Ser Pro Tyr Leu Asp Tyr
145 150 155 160
Lys Lys Ser Tyr Leu Asn Arg Lys Lys Glu Ile Leu Ala Asn Ser Ile
165 170 175
Gln Gln Asn Arg Gly Phe Ser Met Pro Thr Ala Glu Glu Pro Asn Leu
180 185 190
Leu Ser Lys Arg Lys Gln Leu Phe Gln Gln Trp Ala Met Lys Phe Gln
195 200 205
Glu Ser Pro Leu Ile Gln Gln Asn Asn Phe Ala Val Glu Gln Phe Asn
210 215 220
Lys Glu Phe Ala Asn Lys Ile Asn Glu Leu Ala Ala Val Tyr Asn Val
225 230 235 240
Asp Glu Leu Cys Thr Ala Ile Thr Glu Lys Leu Met Asn Phe Asp Lys
245 250 255
Asp Lys Ser Asn Lys Thr Arg Asn Phe Glu Ile Lys Lys Leu Trp Lys
260 265 270
Gln His Pro His Asn Lys Asp Lys Ala Leu Ile Lys Leu Phe Asn Gln
275 280 285
Glu Gly Asn Glu Ala Leu Asn Gln Phe Asn Ile Glu Leu Gly Lys Tyr
290 295 300
Phe Glu His Tyr Phe Pro Lys Thr Gly Lys Lys Glu Ser Ala Glu Ser
305 310 315 320
Tyr Tyr Leu Asn Pro Gln Thr Ile Ile Lys Thr Val Gly Tyr Gln Leu
325 330 335
Arg Asn Ala Phe Val Gln Tyr Leu Leu Gln Val Gly Lys Leu His Gln
340 345 350
Tyr Asn Lys Gly Val Leu Asp Ser Gln Thr Leu Gln Glu Ile Gly Met
355 360 365
Tyr Glu Gly Phe Gln Thr Lys Phe Met Asp Ala Cys Val Phe Ala Ser
370 375 380
Ser Ser Leu Arg Asn Ile Ile Gln Ala Thr Thr Asn Glu Asp Ile Leu
385 390 395 400
Thr Arg Glu Lys Phe Lys Lys Glu Leu Glu Lys Asn Val Glu Leu Lys
405 410 415
His Asp Leu Phe Phe Lys Thr Glu Ile Val Glu Glu Arg Asp Glu Asn
420 425 430
Pro Ala Lys Lys Ile Ala Met Thr Pro Asn Glu Leu Asp Leu Trp Ala
435 440 445
Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe His Gln Gln
450 455 460
Ile Asn Lys Arg His Glu Pro Asn Gln Leu Lys Val Gly Ser Phe Glu
465 470 475 480
Asn Gly Asp Leu Gly Asn Val Ser Tyr Gln Lys Thr Ile Tyr Gln Lys
485 490 495
Leu Phe Asp Ala Glu Ile Lys Asp Ile Glu Ile Tyr Phe Ala Glu Lys
500 505 510
Ile Lys Ser Ser Gly Ala Leu Glu Gln Tyr Ser Met Lys Asp Leu Glu
515 520 525
Lys Leu Phe Ser Asn Lys Glu Leu Thr Leu Ser Leu Gly Gly Gln Val
530 535 540
Val Ala Phe Ala Pro Ser Tyr Lys Lys Leu Tyr Lys Gln Gly Tyr Phe
545 550 555 560
Tyr Gln Asn Glu Lys Thr Ile Glu Leu Glu Gln Phe Thr Asp Tyr Asp
565 570 575
Phe Ser Asn Asp Val Phe Lys Ala Asn Tyr Tyr Leu Ile Lys Leu Ile
580 585 590
Tyr His Tyr Val Phe Leu Pro Gln Phe Ser Gln Ala Asn Asn Lys Leu
595 600 605
Phe Lys Asp Thr Val His Tyr Val Ile Gln Gln Asn Lys Glu Leu Asn
610 615 620
Thr Thr Glu Lys Asp Lys Lys Asn Asn Lys Lys Ile Arg Lys Tyr Ala
625 630 635 640
Phe Glu Gln Val Lys Leu Met Lys Asn Glu Ser Pro Glu Lys Tyr Met
645 650 655
Gln Tyr Leu Gln Arg Glu Met Gln Glu Glu Arg Thr Ile Lys Glu Ala
660 665 670
Lys Lys Thr Asn Glu Glu Lys Pro Asn Tyr Asn Phe Glu Lys Leu Leu
675 680 685
Ile Gln Ile Phe Ile Lys Gly Phe Asp Thr Phe Leu Arg Asn Phe Asp
690 695 700
Leu Asn Leu Asn Pro Ala Glu Glu Leu Val Gly Thr Val Lys Glu Lys
705 710 715 720
Ala Glu Gly Leu Arg Lys Arg Lys Glu Arg Ile Ala Lys Ile Leu Asn
725 730 735
Val Asp Glu Gln Ile Lys Thr Gly Asp Glu Glu Ile Ala Phe Trp Ile
740 745 750
Phe Ala Lys Leu Leu Asp Ala Arg His Leu Ser Glu Leu Arg Asn Glu
755 760 765
Met Ile Lys Phe Lys Gln Ser Ser Val Lys Lys Gly Leu Ile Lys Asn
770 775 780
Gly Asp Leu Ile Glu Gln Met Gln Pro Ile Leu Glu Leu Cys Ile Leu
785 790 795 800
Ser Asn Asp Ser Glu Ser Met Glu Lys Glu Ser Phe Asp Lys Ile Glu
805 810 815
Val Phe Leu Glu Lys Val Glu Leu Ala Lys Asn Glu Pro Tyr Met Gln
820 825 830
Glu Asp Lys Leu Thr Pro Val Lys Phe Arg Phe Met Lys Gln Leu Glu
835 840 845
Lys Tyr Gln Thr Arg Asn Phe Ile Glu Asn Leu Val Ile Glu Asn Pro
850 855 860
Glu Phe Lys Val Ser Glu Lys Ile Val Leu Asn Trp His Glu Glu Lys
865 870 875 880
Glu Lys Ile Ala Asp Leu Val Asp Lys Arg Thr Lys Leu His Glu Glu
885 890 895
Trp Ala Ser Lys Ala Arg Glu Ile Glu Glu Tyr Asn Glu Lys Ile Lys
900 905 910
Lys Asn Lys Ser Lys Lys Leu Asp Lys Pro Ala Glu Phe Ala Lys Phe
915 920 925
Ala Glu Tyr Lys Ile Ile Cys Glu Ala Ile Glu Asn Phe Asn Arg Leu
930 935 940
Asp His Lys Val Arg Leu Thr Tyr Leu Lys Asn Leu His Tyr Leu Met
945 950 955 960
Ile Asp Leu Met Gly Arg Met Val Gly Phe Ser Val Leu Phe Glu Arg
965 970 975
Asp Phe Val Tyr Met Gly Arg Ser Tyr Ser Ala Leu Lys Lys Gln Ser
980 985 990
Ile Tyr Leu Asn Asp Tyr Asp Thr Phe Ala Asn Ile Arg Asp Trp Glu
995 1000 1005
Val Asn Glu Asn Lys His Leu Phe Gly Thr Ser Ser Ser Asp Leu
1010 1015 1020
Thr Phe Gln Glu Thr Ala Glu Phe Lys Asn Leu Lys Lys Pro Met
1025 1030 1035
Glu Asn Gln Leu Lys Ala Leu Leu Gly Val Thr Asn His Ser Phe
1040 1045 1050
Glu Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp
1055 1060 1065
Gly Lys Gly Glu Gly Val Ser Leu Leu Ser Cys Met Asn Asp Leu
1070 1075 1080
Arg Lys Leu Met Ser Tyr Asp Arg Lys Leu Lys Asn Ala Val Thr
1085 1090 1095
Lys Ala Ile Ile Lys Ile Leu Asp Lys His Gly Met Ile Leu Lys
1100 1105 1110
Leu Thr Asn Asn Asp His Thr Lys Pro Phe Glu Ile Glu Ser Leu
1115 1120 1125
Lys Pro Lys Lys Ile Ile His Leu Glu Lys Ser Asn His Ser Phe
1130 1135 1140
Pro Met Asp Gln Val Ser Gln Glu Tyr Cys Asp Leu Val Lys Lys
1145 1150 1155
Met Leu Val Phe Thr Asn
1160
<210> 64
<211> 1154
<212> PRT
<213> Paludibacter propionicigenes
<400> 64
Met Arg Val Ser Lys Val Lys Val Lys Asp Gly Gly Lys Asp Lys Met
1 5 10 15
Val Leu Val His Arg Lys Thr Thr Gly Ala Gln Leu Val Tyr Ser Gly
20 25 30
Gln Pro Val Ser Asn Glu Thr Ser Asn Ile Leu Pro Glu Lys Lys Arg
35 40 45
Gln Ser Phe Asp Leu Ser Thr Leu Asn Lys Thr Ile Ile Lys Phe Asp
50 55 60
Thr Ala Lys Lys Gln Lys Leu Asn Val Asp Gln Tyr Lys Ile Val Glu
65 70 75 80
Lys Ile Phe Lys Tyr Pro Lys Gln Glu Leu Pro Lys Gln Ile Lys Ala
85 90 95
Glu Glu Ile Leu Pro Phe Leu Asn His Lys Phe Gln Glu Pro Val Lys
100 105 110
Tyr Trp Lys Asn Gly Lys Glu Glu Ser Phe Asn Leu Thr Leu Leu Ile
115 120 125
Val Glu Ala Val Gln Ala Gln Asp Lys Arg Lys Leu Gln Pro Tyr Tyr
130 135 140
Asp Trp Lys Thr Trp Tyr Ile Gln Thr Lys Ser Asp Leu Leu Lys Lys
145 150 155 160
Ser Ile Glu Asn Asn Arg Ile Asp Leu Thr Glu Asn Leu Ser Lys Arg
165 170 175
Lys Lys Ala Leu Leu Ala Trp Glu Thr Glu Phe Thr Ala Ser Gly Ser
180 185 190
Ile Asp Leu Thr His Tyr His Lys Val Tyr Met Thr Asp Val Leu Cys
195 200 205
Lys Met Leu Gln Asp Val Lys Pro Leu Thr Asp Asp Lys Gly Lys Ile
210 215 220
Asn Thr Asn Ala Tyr His Arg Gly Leu Lys Lys Ala Leu Gln Asn His
225 230 235 240
Gln Pro Ala Ile Phe Gly Thr Arg Glu Val Pro Asn Glu Ala Asn Arg
245 250 255
Ala Asp Asn Gln Leu Ser Ile Tyr His Leu Glu Val Val Lys Tyr Leu
260 265 270
Glu His Tyr Phe Pro Ile Lys Thr Ser Lys Arg Arg Asn Thr Ala Asp
275 280 285
Asp Ile Ala His Tyr Leu Lys Ala Gln Thr Leu Lys Thr Thr Ile Glu
290 295 300
Lys Gln Leu Val Asn Ala Ile Arg Ala Asn Ile Ile Gln Gln Gly Lys
305 310 315 320
Thr Asn His His Glu Leu Lys Ala Asp Thr Thr Ser Asn Asp Leu Ile
325 330 335
Arg Ile Lys Thr Asn Glu Ala Phe Val Leu Asn Leu Thr Gly Thr Cys
340 345 350
Ala Phe Ala Ala Asn Asn Ile Arg Asn Met Val Asp Asn Glu Gln Thr
355 360 365
Asn Asp Ile Leu Gly Lys Gly Asp Phe Ile Lys Ser Leu Leu Lys Asp
370 375 380
Asn Thr Asn Ser Gln Leu Tyr Ser Phe Phe Phe Gly Glu Gly Leu Ser
385 390 395 400
Thr Asn Lys Ala Glu Lys Glu Thr Gln Leu Trp Gly Ile Arg Gly Ala
405 410 415
Val Gln Gln Ile Arg Asn Asn Val Asn His Tyr Lys Lys Asp Ala Leu
420 425 430
Lys Thr Val Phe Asn Ile Ser Asn Phe Glu Asn Pro Thr Ile Thr Asp
435 440 445
Pro Lys Gln Gln Thr Asn Tyr Ala Asp Thr Ile Tyr Lys Ala Arg Phe
450 455 460
Ile Asn Glu Leu Glu Lys Ile Pro Glu Ala Phe Ala Gln Gln Leu Lys
465 470 475 480
Thr Gly Gly Ala Val Ser Tyr Tyr Thr Ile Glu Asn Leu Lys Ser Leu
485 490 495
Leu Thr Thr Phe Gln Phe Ser Leu Cys Arg Ser Thr Ile Pro Phe Ala
500 505 510
Pro Gly Phe Lys Lys Val Phe Asn Gly Gly Ile Asn Tyr Gln Asn Ala
515 520 525
Lys Gln Asp Glu Ser Phe Tyr Glu Leu Met Leu Glu Gln Tyr Leu Arg
530 535 540
Lys Glu Asn Phe Ala Glu Glu Ser Tyr Asn Ala Arg Tyr Phe Met Leu
545 550 555 560
Lys Leu Ile Tyr Asn Asn Leu Phe Leu Pro Gly Phe Thr Thr Asp Arg
565 570 575
Lys Ala Phe Ala Asp Ser Val Gly Phe Val Gln Met Gln Asn Lys Lys
580 585 590
Gln Ala Glu Lys Val Asn Pro Arg Lys Lys Glu Ala Tyr Ala Phe Glu
595 600 605
Ala Val Arg Pro Met Thr Ala Ala Asp Ser Ile Ala Asp Tyr Met Ala
610 615 620
Tyr Val Gln Ser Glu Leu Met Gln Glu Gln Asn Lys Lys Glu Glu Lys
625 630 635 640
Val Ala Glu Glu Thr Arg Ile Asn Phe Glu Lys Phe Val Leu Gln Val
645 650 655
Phe Ile Lys Gly Phe Asp Ser Phe Leu Arg Ala Lys Glu Phe Asp Phe
660 665 670
Val Gln Met Pro Gln Pro Gln Leu Thr Ala Thr Ala Ser Asn Gln Gln
675 680 685
Lys Ala Asp Lys Leu Asn Gln Leu Glu Ala Ser Ile Thr Ala Asp Cys
690 695 700
Lys Leu Thr Pro Gln Tyr Ala Lys Ala Asp Asp Ala Thr His Ile Ala
705 710 715 720
Phe Tyr Val Phe Cys Lys Leu Leu Asp Ala Ala His Leu Ser Asn Leu
725 730 735
Arg Asn Glu Leu Ile Lys Phe Arg Glu Ser Val Asn Glu Phe Lys Phe
740 745 750
His His Leu Leu Glu Ile Ile Glu Ile Cys Leu Leu Ser Ala Asp Val
755 760 765
Val Pro Thr Asp Tyr Arg Asp Leu Tyr Ser Ser Glu Ala Asp Cys Leu
770 775 780
Ala Arg Leu Arg Pro Phe Ile Glu Gln Gly Ala Asp Ile Thr Asn Trp
785 790 795 800
Ser Asp Leu Phe Val Gln Ser Asp Lys His Ser Pro Val Ile His Ala
805 810 815
Asn Ile Glu Leu Ser Val Lys Tyr Gly Thr Thr Lys Leu Leu Glu Gln
820 825 830
Ile Ile Asn Lys Asp Thr Gln Phe Lys Thr Thr Glu Ala Asn Phe Thr
835 840 845
Ala Trp Asn Thr Ala Gln Lys Ser Ile Glu Gln Leu Ile Lys Gln Arg
850 855 860
Glu Asp His His Glu Gln Trp Val Lys Ala Lys Asn Ala Asp Asp Lys
865 870 875 880
Glu Lys Gln Glu Arg Lys Arg Glu Lys Ser Asn Phe Ala Gln Lys Phe
885 890 895
Ile Glu Lys His Gly Asp Asp Tyr Leu Asp Ile Cys Asp Tyr Ile Asn
900 905 910
Thr Tyr Asn Trp Leu Asp Asn Lys Met His Phe Val His Leu Asn Arg
915 920 925
Leu His Gly Leu Thr Ile Glu Leu Leu Gly Arg Met Ala Gly Phe Val
930 935 940
Ala Leu Phe Asp Arg Asp Phe Gln Phe Phe Asp Glu Gln Gln Ile Ala
945 950 955 960
Asp Glu Phe Lys Leu His Gly Phe Val Asn Leu His Ser Ile Asp Lys
965 970 975
Lys Leu Asn Glu Val Pro Thr Lys Lys Ile Lys Glu Ile Tyr Asp Ile
980 985 990
Arg Asn Lys Ile Ile Gln Ile Asn Gly Asn Lys Ile Asn Glu Ser Val
995 1000 1005
Arg Ala Asn Leu Ile Gln Phe Ile Ser Ser Lys Arg Asn Tyr Tyr
1010 1015 1020
Asn Asn Ala Phe Leu His Val Ser Asn Asp Glu Ile Lys Glu Lys
1025 1030 1035
Gln Met Tyr Asp Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu
1040 1045 1050
Thr Lys Asp Ala Ala Asp Phe Ser Leu Ile Asp Leu Ile Asn Glu
1055 1060 1065
Leu Arg Glu Leu Leu His Tyr Asp Arg Lys Leu Lys Asn Ala Val
1070 1075 1080
Ser Lys Ala Phe Ile Asp Leu Phe Asp Lys His Gly Met Ile Leu
1085 1090 1095
Lys Leu Lys Leu Asn Ala Asp His Lys Leu Lys Val Glu Ser Leu
1100 1105 1110
Glu Pro Lys Lys Ile Tyr His Leu Gly Ser Ser Ala Lys Asp Lys
1115 1120 1125
Pro Glu Tyr Gln Tyr Cys Thr Asn Gln Val Met Met Ala Tyr Cys
1130 1135 1140
Asn Met Cys Arg Ser Leu Leu Glu Met Lys Lys
1145 1150
<210> 65
<211> 970
<212> PRT
<213> Listeria weihenstephanensis
<400> 65
Met Leu Ala Leu Leu His Gln Glu Val Pro Ser Gln Lys Leu His Asn
1 5 10 15
Leu Lys Ser Leu Asn Thr Glu Ser Leu Thr Lys Leu Phe Lys Pro Lys
20 25 30
Phe Gln Asn Met Ile Ser Tyr Pro Pro Ser Lys Gly Ala Glu His Val
35 40 45
Gln Phe Cys Leu Thr Asp Ile Ala Val Pro Ala Ile Arg Asp Leu Asp
50 55 60
Glu Ile Lys Pro Asp Trp Gly Ile Phe Phe Glu Lys Leu Lys Pro Tyr
65 70 75 80
Thr Asp Trp Ala Glu Ser Tyr Ile His Tyr Lys Gln Thr Thr Ile Gln
85 90 95
Lys Ser Ile Glu Gln Asn Lys Ile Gln Ser Pro Asp Ser Pro Arg Lys
100 105 110
Leu Val Leu Gln Lys Tyr Val Thr Ala Phe Leu Asn Gly Glu Pro Leu
115 120 125
Gly Leu Asp Leu Val Ala Lys Lys Tyr Lys Leu Ala Asp Leu Ala Glu
130 135 140
Ser Phe Lys Val Val Asp Leu Asn Glu Asp Lys Ser Ala Asn Tyr Lys
145 150 155 160
Ile Lys Ala Cys Leu Gln Gln His Gln Arg Asn Ile Leu Asp Glu Leu
165 170 175
Lys Glu Asp Pro Glu Leu Asn Gln Tyr Gly Ile Glu Val Lys Lys Tyr
180 185 190
Ile Gln Arg Tyr Phe Pro Ile Lys Arg Ala Pro Asn Arg Ser Lys His
195 200 205
Ala Arg Ala Asp Phe Leu Lys Lys Glu Leu Ile Glu Ser Thr Val Glu
210 215 220
Gln Gln Phe Lys Asn Ala Val Tyr His Tyr Val Leu Glu Gln Gly Lys
225 230 235 240
Met Glu Ala Tyr Glu Leu Thr Asp Pro Lys Thr Lys Asp Leu Gln Asp
245 250 255
Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile Asn Ala Cys Ala
260 265 270
Phe Ala Ser Asn Asn Leu Lys Met Ile Leu Asn Pro Glu Cys Glu Lys
275 280 285
Asp Ile Leu Gly Lys Gly Asp Phe Lys Lys Asn Leu Pro Asn Ser Thr
290 295 300
Thr Gln Ser Asp Val Val Lys Lys Met Ile Pro Phe Phe Ser Asp Glu
305 310 315 320
Ile Gln Asn Val Asn Phe Asp Glu Ala Ile Trp Ala Ile Arg Gly Ser
325 330 335
Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys Lys Lys His Ser Trp
340 345 350
Lys Ser Ile Leu Lys Ile Lys Gly Phe Glu Phe Glu Pro Asn Asn Met
355 360 365
Lys Tyr Thr Asp Ser Asp Met Gln Lys Leu Met Asp Lys Asp Ile Ala
370 375 380
Lys Ile Pro Asp Phe Ile Glu Glu Lys Leu Lys Ser Ser Gly Ile Ile
385 390 395 400
Arg Phe Tyr Ser His Asp Lys Leu Gln Ser Ile Trp Glu Met Lys Gln
405 410 415
Gly Phe Ser Leu Leu Thr Thr Asn Ala Pro Phe Val Pro Ser Phe Lys
420 425 430
Arg Val Tyr Ala Lys Gly His Asp Tyr Gln Thr Ser Lys Asn Arg Tyr
435 440 445
Tyr Asp Leu Gly Leu Thr Thr Phe Asp Ile Leu Glu Tyr Gly Glu Glu
450 455 460
Asp Phe Arg Ala Arg Tyr Phe Leu Thr Lys Leu Val Tyr Tyr Gln Gln
465 470 475 480
Phe Met Pro Trp Phe Thr Ala Asp Asn Asn Ala Phe Arg Asp Ala Ala
485 490 495
Asn Phe Val Leu Arg Leu Asn Lys Asn Arg Gln Gln Asp Ala Lys Ala
500 505 510
Phe Ile Asn Ile Arg Glu Val Glu Glu Gly Glu Met Pro Arg Asp Tyr
515 520 525
Met Gly Tyr Val Gln Gly Gln Ile Ala Ile His Glu Asp Ser Thr Glu
530 535 540
Asp Thr Pro Asn His Phe Glu Lys Phe Ile Ser Gln Val Phe Ile Lys
545 550 555 560
Gly Phe Asp Ser His Met Arg Ser Ala Asp Leu Lys Phe Ile Lys Asn
565 570 575
Pro Arg Asn Gln Gly Leu Glu Gln Ser Glu Ile Glu Glu Met Ser Phe
580 585 590
Asp Ile Lys Val Glu Pro Ser Phe Leu Lys Asn Lys Asp Asp Tyr Ile
595 600 605
Ala Phe Trp Thr Phe Cys Lys Met Leu Asp Ala Arg His Leu Ser Glu
610 615 620
Leu Arg Asn Glu Met Ile Lys Tyr Asp Gly His Leu Thr Gly Glu Gln
625 630 635 640
Glu Ile Ile Gly Leu Ala Leu Leu Gly Val Asp Ser Arg Glu Asn Asp
645 650 655
Trp Lys Gln Phe Phe Ser Ser Glu Arg Glu Tyr Glu Lys Ile Met Lys
660 665 670
Gly Tyr Val Gly Glu Glu Leu Tyr Gln Arg Glu Pro Tyr Arg Gln Ser
675 680 685
Asp Gly Lys Thr Pro Ile Leu Phe Arg Gly Val Glu Gln Ala Arg Lys
690 695 700
Tyr Gly Thr Glu Thr Val Ile Gln Arg Leu Phe Asp Ala Ser Pro Glu
705 710 715 720
Phe Lys Val Ser Lys Cys Asn Ile Thr Glu Trp Glu Arg Gln Lys Glu
725 730 735
Thr Ile Glu Glu Thr Ile Glu Arg Arg Lys Glu Leu His Asn Glu Trp
740 745 750
Glu Lys Asn Pro Lys Lys Pro Gln Asn Asn Ala Phe Phe Lys Glu Tyr
755 760 765
Lys Glu Cys Cys Asp Ala Ile Asp Ala Tyr Asn Trp His Lys Asn Lys
770 775 780
Thr Thr Leu Val Tyr Val Asn Glu Leu His His Leu Leu Ile Glu Ile
785 790 795 800
Leu Gly Arg Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln
805 810 815
Cys Met Ala Asn Gln Tyr Phe Lys His Ser Gly Ile Thr Glu Arg Val
820 825 830
Glu Tyr Trp Gly Asp Asn Arg Leu Lys Ser Ile Lys Lys Leu Asp Thr
835 840 845
Phe Leu Lys Lys Glu Gly Leu Phe Val Ser Glu Lys Asn Ala Arg Asn
850 855 860
His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys Ser Glu Cys Thr Leu
865 870 875 880
Leu Tyr Leu Ser Glu Arg Leu Arg Glu Ile Phe Lys Tyr Asp Arg Lys
885 890 895
Leu Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg His
900 905 910
Gly Met Ser Val Val Phe Ala Asn Leu Lys Glu Asn Lys His Arg Leu
915 920 925
Val Ile Lys Ser Leu Glu Pro Lys Lys Leu Arg His Leu Gly Glu Lys
930 935 940
Lys Ile Asp Asn Gly Tyr Ile Glu Thr Asn Gln Val Ser Glu Glu Tyr
945 950 955 960
Cys Gly Ile Val Lys Arg Leu Leu Glu Ile
965 970
<210> 66
<211> 1051
<212> PRT
<213> Listeriaceae bacterium
<400> 66
Met Lys Ile Thr Lys Met Arg Val Asp Gly Arg Thr Ile Val Met Glu
1 5 10 15
Arg Thr Ser Lys Glu Gly Gln Leu Gly Tyr Glu Gly Ile Asp Gly Asn
20 25 30
Lys Thr Thr Glu Ile Ile Phe Asp Lys Lys Lys Glu Ser Phe Tyr Lys
35 40 45
Ser Ile Leu Asn Lys Thr Val Arg Lys Pro Asp Glu Lys Glu Lys Asn
50 55 60
Arg Arg Lys Gln Ala Ile Asn Lys Ala Ile Asn Lys Glu Ile Thr Glu
65 70 75 80
Leu Met Leu Ala Val Leu His Gln Glu Val Pro Ser Gln Lys Leu His
85 90 95
Asn Leu Lys Ser Leu Asn Thr Glu Ser Leu Thr Lys Leu Phe Lys Pro
100 105 110
Lys Phe Gln Asn Met Ile Ser Tyr Pro Pro Ser Lys Gly Ala Glu His
115 120 125
Val Gln Phe Cys Leu Thr Asp Ile Ala Val Pro Ala Ile Arg Asp Leu
130 135 140
Asp Glu Ile Lys Pro Asp Trp Gly Ile Phe Phe Glu Lys Leu Lys Pro
145 150 155 160
Tyr Thr Asp Trp Ala Glu Ser Tyr Ile His Tyr Lys Gln Thr Thr Ile
165 170 175
Gln Lys Ser Ile Glu Gln Asn Lys Ile Gln Ser Pro Asp Ser Pro Arg
180 185 190
Lys Leu Val Leu Gln Lys Tyr Val Thr Ala Phe Leu Asn Gly Glu Pro
195 200 205
Leu Gly Leu Asp Leu Val Ala Lys Lys Tyr Lys Leu Ala Asp Leu Ala
210 215 220
Glu Ser Phe Lys Leu Val Asp Leu Asn Glu Asp Lys Ser Ala Asn Tyr
225 230 235 240
Lys Ile Lys Ala Cys Leu Gln Gln His Gln Arg Asn Ile Leu Asp Glu
245 250 255
Leu Lys Glu Asp Pro Glu Leu Asn Gln Tyr Gly Ile Glu Val Lys Lys
260 265 270
Tyr Ile Gln Arg Tyr Phe Pro Ile Lys Arg Ala Pro Asn Arg Ser Lys
275 280 285
His Ala Arg Ala Asp Phe Leu Lys Lys Glu Leu Ile Glu Ser Thr Val
290 295 300
Glu Gln Gln Phe Lys Asn Ala Val Tyr His Tyr Val Leu Glu Gln Gly
305 310 315 320
Lys Met Glu Ala Tyr Glu Leu Thr Asp Pro Lys Thr Lys Asp Leu Gln
325 330 335
Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile Asn Ala Cys
340 345 350
Ala Phe Ala Ser Asn Asn Leu Lys Met Ile Leu Asn Pro Glu Cys Glu
355 360 365
Lys Asp Ile Leu Gly Lys Gly Asn Phe Lys Lys Asn Leu Pro Asn Ser
370 375 380
Thr Thr Arg Ser Asp Val Val Lys Lys Met Ile Pro Phe Phe Ser Asp
385 390 395 400
Glu Leu Gln Asn Val Asn Phe Asp Glu Ala Ile Trp Ala Ile Arg Gly
405 410 415
Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys Lys Lys His Ser
420 425 430
Trp Lys Ser Ile Leu Lys Ile Lys Gly Phe Glu Phe Glu Pro Asn Asn
435 440 445
Met Lys Tyr Ala Asp Ser Asp Met Gln Lys Leu Met Asp Lys Asp Ile
450 455 460
Ala Lys Ile Pro Glu Phe Ile Glu Glu Lys Leu Lys Ser Ser Gly Val
465 470 475 480
Val Arg Phe Tyr Arg His Asp Glu Leu Gln Ser Ile Trp Glu Met Lys
485 490 495
Gln Gly Phe Ser Leu Leu Thr Thr Asn Ala Pro Phe Val Pro Ser Phe
500 505 510
Lys Arg Val Tyr Ala Lys Gly His Asp Tyr Gln Thr Ser Lys Asn Arg
515 520 525
Tyr Tyr Asn Leu Asp Leu Thr Thr Phe Asp Ile Leu Glu Tyr Gly Glu
530 535 540
Glu Asp Phe Arg Ala Arg Tyr Phe Leu Thr Lys Leu Val Tyr Tyr Gln
545 550 555 560
Gln Phe Met Pro Trp Phe Thr Ala Asp Asn Asn Ala Phe Arg Asp Ala
565 570 575
Ala Asn Phe Val Leu Arg Leu Asn Lys Asn Arg Gln Gln Asp Ala Lys
580 585 590
Ala Phe Ile Asn Ile Arg Glu Val Glu Glu Gly Glu Met Pro Arg Asp
595 600 605
Tyr Met Gly Tyr Val Gln Gly Gln Ile Ala Ile His Glu Asp Ser Ile
610 615 620
Glu Asp Thr Pro Asn His Phe Glu Lys Phe Ile Ser Gln Val Phe Ile
625 630 635 640
Lys Gly Phe Asp Arg His Met Arg Ser Ala Asn Leu Lys Phe Ile Lys
645 650 655
Asn Pro Arg Asn Gln Gly Leu Glu Gln Ser Glu Ile Glu Glu Met Ser
660 665 670
Phe Asp Ile Lys Val Glu Pro Ser Phe Leu Lys Asn Lys Asp Asp Tyr
675 680 685
Ile Ala Phe Trp Ile Phe Cys Lys Met Leu Asp Ala Arg His Leu Ser
690 695 700
Glu Leu Arg Asn Glu Met Ile Lys Tyr Asp Gly His Leu Thr Gly Glu
705 710 715 720
Gln Glu Ile Ile Gly Leu Ala Leu Leu Gly Val Asp Ser Arg Glu Asn
725 730 735
Asp Trp Lys Gln Phe Phe Ser Ser Glu Arg Glu Tyr Glu Lys Ile Met
740 745 750
Lys Gly Tyr Val Val Glu Glu Leu Tyr Gln Arg Glu Pro Tyr Arg Gln
755 760 765
Ser Asp Gly Lys Thr Pro Ile Leu Phe Arg Gly Val Glu Gln Ala Arg
770 775 780
Lys Tyr Gly Thr Glu Thr Val Ile Gln Arg Leu Phe Asp Ala Asn Pro
785 790 795 800
Glu Phe Lys Val Ser Lys Cys Asn Leu Ala Glu Trp Glu Arg Gln Lys
805 810 815
Glu Thr Ile Glu Glu Thr Ile Lys Arg Arg Lys Glu Leu His Asn Glu
820 825 830
Trp Ala Lys Asn Pro Lys Lys Pro Gln Asn Asn Ala Phe Phe Lys Glu
835 840 845
Tyr Lys Glu Cys Cys Asp Ala Ile Asp Ala Tyr Asn Trp His Lys Asn
850 855 860
Lys Thr Thr Leu Ala Tyr Val Asn Glu Leu His His Leu Leu Ile Glu
865 870 875 880
Ile Leu Gly Arg Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe
885 890 895
Gln Cys Met Ala Asn Gln Tyr Phe Lys His Ser Gly Ile Thr Glu Arg
900 905 910
Val Glu Tyr Trp Gly Asp Asn Arg Leu Lys Ser Ile Lys Lys Leu Asp
915 920 925
Thr Phe Leu Lys Lys Glu Gly Leu Phe Val Ser Glu Lys Asn Ala Arg
930 935 940
Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys Ser Glu Cys Thr
945 950 955 960
Leu Leu Tyr Leu Ser Glu Arg Leu Arg Glu Ile Phe Lys Tyr Asp Arg
965 970 975
Lys Leu Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg
980 985 990
His Gly Met Ser Val Val Phe Ala Asn Leu Lys Glu Asn Lys His Arg
995 1000 1005
Leu Val Ile Lys Ser Leu Glu Pro Lys Lys Leu Arg His Leu Gly
1010 1015 1020
Gly Lys Lys Ile Asp Gly Gly Tyr Ile Glu Thr Asn Gln Val Ser
1025 1030 1035
Glu Glu Tyr Cys Gly Ile Val Lys Arg Leu Leu Glu Met
1040 1045 1050
<210> 67
<211> 1152
<212> PRT
<213> Leptotrichia wadei
<400> 67
Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu
1 5 10 15
Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu
20 25 30
Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn
35 40 45
Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu
50 55 60
Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu
65 70 75 80
Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr
85 90 95
Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe
100 105 110
Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu
115 120 125
Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn
130 135 140
Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile
145 150 155 160
Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile
165 170 175
Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn
180 185 190
Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu
195 200 205
Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys
210 215 220
Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu
225 230 235 240
Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile
245 250 255
Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser
260 265 270
Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys
275 280 285
Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln
290 295 300
Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp
305 310 315 320
Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu
325 330 335
Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys
340 345 350
Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile
355 360 365
Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val
370 375 380
Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn
385 390 395 400
Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn
405 410 415
Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn
420 425 430
Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser
435 440 445
Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala
450 455 460
Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
465 470 475 480
Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala
485 490 495
Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys
500 505 510
Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe
515 520 525
Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys
530 535 540
Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys
545 550 555 560
Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp
565 570 575
Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu
580 585 590
Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser
595 600 605
Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln
610 615 620
Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile
625 630 635 640
Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu
645 650 655
Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe
660 665 670
Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn
675 680 685
Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile
690 695 700
Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys
705 710 715 720
Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His
725 730 735
Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys
740 745 750
Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn
755 760 765
His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser
770 775 780
Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu
785 790 795 800
Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala
805 810 815
Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp
820 825 830
Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly
835 840 845
Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly
850 855 860
Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile
865 870 875 880
Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu
885 890 895
Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro
900 905 910
Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys
915 920 925
Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu
930 935 940
Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His
945 950 955 960
Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg
965 970 975
Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn
980 985 990
Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu
995 1000 1005
Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu
1010 1015 1020
Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln
1025 1030 1035
Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn
1040 1045 1050
Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn
1055 1060 1065
Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile
1070 1075 1080
Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala
1085 1090 1095
Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu
1100 1105 1110
Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys
1115 1120 1125
Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys
1130 1135 1140
Val Met Phe Glu Tyr Lys Ala Leu Glu
1145 1150
<210> 68
<211> 1285
<212> PRT
<213> Rhodobacter capsulatus
<400> 68
Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp
1 5 10 15
Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg
20 25 30
Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly
35 40 45
Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg
50 55 60
Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln
65 70 75 80
Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser
85 90 95
Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg
100 105 110
Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys
115 120 125
Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg
130 135 140
Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala
145 150 155 160
Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly
165 170 175
Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val
180 185 190
Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met
195 200 205
Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe
210 215 220
Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val
225 230 235 240
Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser
245 250 255
Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val
260 265 270
Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val
275 280 285
Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala
290 295 300
Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu
305 310 315 320
Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met
325 330 335
Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp
340 345 350
Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys
355 360 365
Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala
370 375 380
Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn
385 390 395 400
Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln
405 410 415
Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly
420 425 430
Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly
435 440 445
Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg
450 455 460
Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile
465 470 475 480
Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu
485 490 495
His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile
500 505 510
Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser
515 520 525
Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu
530 535 540
Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser
545 550 555 560
Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg
565 570 575
Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr
580 585 590
Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr
595 600 605
Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg
610 615 620
Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala
625 630 635 640
Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr
645 650 655
Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Thr Ser Arg Leu Arg Pro
660 665 670
Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly
675 680 685
Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser
690 695 700
Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp
705 710 715 720
Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp
725 730 735
Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro
740 745 750
Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln
755 760 765
Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser
770 775 780
Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr
785 790 795 800
Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg
805 810 815
Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe
820 825 830
Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp
835 840 845
Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg
850 855 860
Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro
865 870 875 880
Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu
885 890 895
Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser
900 905 910
Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu
915 920 925
Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala
930 935 940
Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro
945 950 955 960
Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys
965 970 975
Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp
980 985 990
His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile
995 1000 1005
Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile
1010 1015 1020
Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr
1025 1030 1035
Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys
1040 1045 1050
Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro
1055 1060 1065
Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr
1070 1075 1080
Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met
1085 1090 1095
Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His
1100 1105 1110
Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu
1115 1120 1125
Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu
1130 1135 1140
Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe
1145 1150 1155
Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly
1160 1165 1170
Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln
1175 1180 1185
Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg
1190 1195 1200
Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val
1205 1210 1215
Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly
1220 1225 1230
Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile
1235 1240 1245
Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val
1250 1255 1260
Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala
1265 1270 1275
Ala Asp Leu Val Arg Ile Asp
1280 1285
<210> 69
<211> 1285
<212> PRT
<213> Rhodobacter capsulatus
<400> 69
Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp
1 5 10 15
Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg
20 25 30
Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly
35 40 45
Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg
50 55 60
Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln
65 70 75 80
Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser
85 90 95
Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg
100 105 110
Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys
115 120 125
Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg
130 135 140
Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala
145 150 155 160
Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly
165 170 175
Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val
180 185 190
Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met
195 200 205
Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe
210 215 220
Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val
225 230 235 240
Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser
245 250 255
Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val
260 265 270
Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val
275 280 285
Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala
290 295 300
Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu
305 310 315 320
Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met
325 330 335
Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp
340 345 350
Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys
355 360 365
Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala
370 375 380
Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn
385 390 395 400
Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln
405 410 415
Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly
420 425 430
Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly
435 440 445
Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg
450 455 460
Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile
465 470 475 480
Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu
485 490 495
His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile
500 505 510
Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser
515 520 525
Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu
530 535 540
Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser
545 550 555 560
Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg
565 570 575
Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr
580 585 590
Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr
595 600 605
Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg
610 615 620
Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala
625 630 635 640
Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr
645 650 655
Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Ser Ser Arg Leu Arg Pro
660 665 670
Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly
675 680 685
Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser
690 695 700
Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp
705 710 715 720
Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp
725 730 735
Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro
740 745 750
Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln
755 760 765
Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser
770 775 780
Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr
785 790 795 800
Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg
805 810 815
Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe
820 825 830
Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp
835 840 845
Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg
850 855 860
Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro
865 870 875 880
Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu
885 890 895
Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser
900 905 910
Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu
915 920 925
Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala
930 935 940
Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro
945 950 955 960
Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys
965 970 975
Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp
980 985 990
His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile
995 1000 1005
Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile
1010 1015 1020
Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr
1025 1030 1035
Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys
1040 1045 1050
Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro
1055 1060 1065
Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr
1070 1075 1080
Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met
1085 1090 1095
Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His
1100 1105 1110
Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu
1115 1120 1125
Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu
1130 1135 1140
Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe
1145 1150 1155
Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly
1160 1165 1170
Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln
1175 1180 1185
Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg
1190 1195 1200
Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val
1205 1210 1215
Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly
1220 1225 1230
Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile
1235 1240 1245
Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val
1250 1255 1260
Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala
1265 1270 1275
Ala Asp Leu Val Arg Ile Asp
1280 1285
<210> 70
<211> 1285
<212> PRT
<213> Rhodobacter capsulatus
<400> 70
Met Gln Ile Gly Lys Val Gln Gly Arg Thr Ile Ser Glu Phe Gly Asp
1 5 10 15
Pro Ala Gly Gly Leu Lys Arg Lys Ile Ser Thr Asp Gly Lys Asn Arg
20 25 30
Lys Glu Leu Pro Ala His Leu Ser Ser Asp Pro Lys Ala Leu Ile Gly
35 40 45
Gln Trp Ile Ser Gly Ile Asp Lys Ile Tyr Arg Lys Pro Asp Ser Arg
50 55 60
Lys Ser Asp Gly Lys Ala Ile His Ser Pro Thr Pro Ser Lys Met Gln
65 70 75 80
Phe Asp Ala Arg Asp Asp Leu Gly Glu Ala Phe Trp Lys Leu Val Ser
85 90 95
Glu Ala Gly Leu Ala Gln Asp Ser Asp Tyr Asp Gln Phe Lys Arg Arg
100 105 110
Leu His Pro Tyr Gly Asp Lys Phe Gln Pro Ala Asp Ser Gly Ala Lys
115 120 125
Leu Lys Phe Glu Ala Asp Pro Pro Glu Pro Gln Ala Phe His Gly Arg
130 135 140
Trp Tyr Gly Ala Met Ser Lys Arg Gly Asn Asp Ala Lys Glu Leu Ala
145 150 155 160
Ala Ala Leu Tyr Glu His Leu His Val Asp Glu Lys Arg Ile Asp Gly
165 170 175
Gln Pro Lys Arg Asn Pro Lys Thr Asp Lys Phe Ala Pro Gly Leu Val
180 185 190
Val Ala Arg Ala Leu Gly Ile Glu Ser Ser Val Leu Pro Arg Gly Met
195 200 205
Ala Arg Leu Ala Arg Asn Trp Gly Glu Glu Glu Ile Gln Thr Tyr Phe
210 215 220
Val Val Asp Val Ala Ala Ser Val Lys Glu Val Ala Lys Ala Ala Val
225 230 235 240
Ser Ala Ala Gln Ala Phe Asp Pro Pro Arg Gln Val Ser Gly Arg Ser
245 250 255
Leu Ser Pro Lys Val Gly Phe Ala Leu Ala Glu His Leu Glu Arg Val
260 265 270
Thr Gly Ser Lys Arg Cys Ser Phe Asp Pro Ala Ala Gly Pro Ser Val
275 280 285
Leu Ala Leu His Asp Glu Val Lys Lys Thr Tyr Lys Arg Leu Cys Ala
290 295 300
Arg Gly Lys Asn Ala Ala Arg Ala Phe Pro Ala Asp Lys Thr Glu Leu
305 310 315 320
Leu Ala Leu Met Arg His Thr His Glu Asn Arg Val Arg Asn Gln Met
325 330 335
Val Arg Met Gly Arg Val Ser Glu Tyr Arg Gly Gln Gln Ala Gly Asp
340 345 350
Leu Ala Gln Ser His Tyr Trp Thr Ser Ala Gly Gln Thr Glu Ile Lys
355 360 365
Glu Ser Glu Ile Phe Val Arg Leu Trp Val Gly Ala Phe Ala Leu Ala
370 375 380
Gly Arg Ser Met Lys Ala Trp Ile Asp Pro Met Gly Lys Ile Val Asn
385 390 395 400
Thr Glu Lys Asn Asp Arg Asp Leu Thr Ala Ala Val Asn Ile Arg Gln
405 410 415
Val Ile Ser Asn Lys Glu Met Val Ala Glu Ala Met Ala Arg Arg Gly
420 425 430
Ile Tyr Phe Gly Glu Thr Pro Glu Leu Asp Arg Leu Gly Ala Glu Gly
435 440 445
Asn Glu Gly Phe Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg
450 455 460
Asn Gln Thr Phe His Leu Gly Ala Arg Ala Gly Phe Leu Lys Glu Ile
465 470 475 480
Arg Lys Glu Leu Glu Lys Thr Arg Trp Gly Lys Ala Lys Glu Ala Glu
485 490 495
His Val Val Leu Thr Asp Lys Thr Val Ala Ala Ile Arg Ala Ile Ile
500 505 510
Asp Asn Asp Ala Lys Ala Leu Gly Ala Arg Leu Leu Ala Asp Leu Ser
515 520 525
Gly Ala Phe Val Ala His Tyr Ala Ser Lys Glu His Phe Ser Thr Leu
530 535 540
Tyr Ser Glu Ile Val Lys Ala Val Lys Asp Ala Pro Glu Val Ser Ser
545 550 555 560
Gly Leu Pro Arg Leu Lys Leu Leu Leu Lys Arg Ala Asp Gly Val Arg
565 570 575
Gly Tyr Val His Gly Leu Arg Asp Thr Arg Lys His Ala Phe Ala Thr
580 585 590
Lys Leu Pro Pro Pro Pro Ala Pro Arg Glu Leu Asp Asp Pro Ala Thr
595 600 605
Lys Ala Arg Tyr Ile Ala Leu Leu Arg Leu Tyr Asp Gly Pro Phe Arg
610 615 620
Ala Tyr Ala Ser Gly Ile Thr Gly Thr Ala Leu Ala Gly Pro Ala Ala
625 630 635 640
Arg Ala Lys Glu Ala Ala Thr Ala Leu Ala Gln Ser Val Asn Val Thr
645 650 655
Lys Ala Tyr Ser Asp Val Met Glu Gly Arg Ser Ser Arg Leu Arg Pro
660 665 670
Pro Asn Asp Gly Glu Thr Leu Arg Glu Tyr Leu Ser Ala Leu Thr Gly
675 680 685
Glu Thr Ala Thr Glu Phe Arg Val Gln Ile Gly Tyr Glu Ser Asp Ser
690 695 700
Glu Asn Ala Arg Lys Gln Ala Glu Phe Ile Glu Asn Tyr Arg Arg Asp
705 710 715 720
Met Leu Ala Phe Met Phe Glu Asp Tyr Ile Arg Ala Lys Gly Phe Asp
725 730 735
Trp Ile Leu Lys Ile Glu Pro Gly Ala Thr Ala Met Thr Arg Ala Pro
740 745 750
Val Leu Pro Glu Pro Ile Asp Thr Arg Gly Gln Tyr Glu His Trp Gln
755 760 765
Ala Ala Leu Tyr Leu Val Met His Phe Val Pro Ala Ser Asp Val Ser
770 775 780
Asn Leu Leu His Gln Leu Arg Lys Trp Glu Ala Leu Gln Gly Lys Tyr
785 790 795 800
Glu Leu Val Gln Asp Gly Asp Ala Thr Asp Gln Ala Asp Ala Arg Arg
805 810 815
Glu Ala Leu Asp Leu Val Lys Arg Phe Arg Asp Val Leu Val Leu Phe
820 825 830
Leu Lys Thr Gly Glu Ala Arg Phe Glu Gly Arg Ala Ala Pro Phe Asp
835 840 845
Leu Lys Pro Phe Arg Ala Leu Phe Ala Asn Pro Ala Thr Phe Asp Arg
850 855 860
Leu Phe Met Ala Thr Pro Thr Thr Ala Arg Pro Ala Glu Asp Asp Pro
865 870 875 880
Glu Gly Asp Gly Ala Ser Glu Pro Glu Leu Arg Val Ala Arg Thr Leu
885 890 895
Arg Gly Leu Arg Gln Ile Ala Arg Tyr Asn His Met Ala Val Leu Ser
900 905 910
Asp Leu Phe Ala Lys His Lys Val Arg Asp Glu Glu Val Ala Arg Leu
915 920 925
Ala Glu Ile Glu Asp Glu Thr Gln Glu Lys Ser Gln Ile Val Ala Ala
930 935 940
Gln Glu Leu Arg Thr Asp Leu His Asp Lys Val Met Lys Cys His Pro
945 950 955 960
Lys Thr Ile Ser Pro Glu Glu Arg Gln Ser Tyr Ala Ala Ala Ile Lys
965 970 975
Thr Ile Glu Glu His Arg Phe Leu Val Gly Arg Val Tyr Leu Gly Asp
980 985 990
His Leu Arg Leu His Arg Leu Met Met Asp Val Ile Gly Arg Leu Ile
995 1000 1005
Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu Ile
1010 1015 1020
Asn Ala Ser Lys Gln Leu Gly Ala Gly Ala Asp Trp Ala Val Thr
1025 1030 1035
Ile Ala Gly Ala Ala Asn Thr Asp Ala Arg Thr Gln Thr Arg Lys
1040 1045 1050
Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala Asp Gly Thr Pro
1055 1060 1065
Asp Leu Thr Ala Leu Val Asn Arg Ala Arg Glu Met Met Ala Tyr
1070 1075 1080
Asp Arg Lys Arg Lys Asn Ala Val Pro Arg Ser Ile Leu Asp Met
1085 1090 1095
Leu Ala Arg Leu Gly Leu Thr Leu Lys Trp Gln Met Lys Asp His
1100 1105 1110
Leu Leu Gln Asp Ala Thr Ile Thr Gln Ala Ala Ile Lys His Leu
1115 1120 1125
Asp Lys Val Arg Leu Thr Val Gly Gly Pro Ala Ala Val Thr Glu
1130 1135 1140
Ala Arg Phe Ser Gln Asp Tyr Leu Gln Met Val Ala Ala Val Phe
1145 1150 1155
Asn Gly Ser Val Gln Asn Pro Lys Pro Arg Arg Arg Asp Asp Gly
1160 1165 1170
Asp Ala Trp His Lys Pro Pro Lys Pro Ala Thr Ala Gln Ser Gln
1175 1180 1185
Pro Asp Gln Lys Pro Pro Asn Lys Ala Pro Ser Ala Gly Ser Arg
1190 1195 1200
Leu Pro Pro Pro Gln Val Gly Glu Val Tyr Glu Gly Val Val Val
1205 1210 1215
Lys Val Ile Asp Thr Gly Ser Leu Gly Phe Leu Ala Val Glu Gly
1220 1225 1230
Val Ala Gly Asn Ile Gly Leu His Ile Ser Arg Leu Arg Arg Ile
1235 1240 1245
Arg Glu Asp Ala Ile Ile Val Gly Arg Arg Tyr Arg Phe Arg Val
1250 1255 1260
Glu Ile Tyr Val Pro Pro Lys Ser Asn Thr Ser Lys Leu Asn Ala
1265 1270 1275
Ala Asp Leu Val Arg Ile Asp
1280 1285
<210> 71
<211> 1389
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
C2c2 orthologue sequence"
<400> 71
Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys
1 5 10 15
Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp
20 25 30
Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys
35 40 45
Ile Asp Asn Asn Lys Phe Ile Arg Lys Tyr Ile Asn Tyr Lys Lys Asn
50 55 60
Asp Asn Ile Leu Lys Glu Phe Thr Arg Lys Phe His Ala Gly Asn Ile
65 70 75 80
Leu Phe Lys Leu Lys Gly Lys Glu Gly Ile Ile Arg Ile Glu Asn Asn
85 90 95
Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Ala Tyr
100 105 110
Gly Lys Ser Glu Lys Leu Lys Ala Leu Gly Ile Thr Lys Lys Lys Ile
115 120 125
Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile
130 135 140
Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg
145 150 155 160
Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg
165 170 175
Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile
180 185 190
Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile
195 200 205
Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His
210 215 220
Leu Arg Glu Lys Leu Leu Lys Asp Asp Lys Ile Asp Val Ile Leu Thr
225 230 235 240
Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Leu
245 250 255
Gly Phe Val Lys Phe Tyr Leu Asn Val Gly Gly Asp Lys Lys Lys Ser
260 265 270
Lys Asn Lys Lys Met Leu Val Glu Lys Ile Leu Asn Ile Asn Val Asp
275 280 285
Leu Thr Val Glu Asp Ile Ala Asp Phe Val Ile Lys Glu Leu Glu Phe
290 295 300
Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Val Asn Asn Glu
305 310 315 320
Phe Leu Glu Lys Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu
325 330 335
Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp
340 345 350
Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys
355 360 365
Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asp Glu Leu Ile
370 375 380
Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile
385 390 395 400
Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys
405 410 415
Phe Ser Lys Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr
420 425 430
Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys
435 440 445
Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn
450 455 460
Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr
465 470 475 480
Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Asp
485 490 495
Met Thr Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu
500 505 510
Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu
515 520 525
Leu Asn Lys Ile Phe Ser Arg Glu Asn Ile Asn Asn Asp Glu Asn Ile
530 535 540
Asp Phe Phe Gly Gly Asp Arg Glu Lys Asn Tyr Val Leu Asp Lys Lys
545 550 555 560
Ile Leu Asn Ser Lys Ile Lys Ile Ile Arg Asp Leu Asp Phe Ile Asp
565 570 575
Asn Lys Asn Asn Ile Thr Asn Asn Phe Ile Arg Lys Phe Thr Lys Ile
580 585 590
Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala Ile Ser Lys Glu Arg
595 600 605
Asp Leu Gln Gly Thr Gln Asp Asp Tyr Asn Lys Val Ile Asn Ile Ile
610 615 620
Gln Asn Leu Lys Ile Ser Asp Glu Glu Val Ser Lys Ala Leu Asn Leu
625 630 635 640
Asp Val Val Phe Lys Asp Lys Lys Asn Ile Ile Thr Lys Ile Asn Asp
645 650 655
Ile Lys Ile Ser Glu Glu Asn Asn Asn Asp Ile Lys Tyr Leu Pro Ser
660 665 670
Phe Ser Lys Val Leu Pro Glu Ile Leu Asn Leu Tyr Arg Asn Asn Pro
675 680 685
Lys Asn Glu Pro Phe Asp Thr Ile Glu Thr Glu Lys Ile Val Leu Asn
690 695 700
Ala Leu Ile Tyr Val Asn Lys Glu Leu Tyr Lys Lys Leu Ile Leu Glu
705 710 715 720
Asp Asp Leu Glu Glu Asn Glu Ser Lys Asn Ile Phe Leu Gln Glu Leu
725 730 735
Lys Lys Thr Leu Gly Asn Ile Asp Glu Ile Asp Glu Asn Ile Ile Glu
740 745 750
Asn Tyr Tyr Lys Asn Ala Gln Ile Ser Ala Ser Lys Gly Asn Asn Lys
755 760 765
Ala Ile Lys Lys Tyr Gln Lys Lys Val Ile Glu Cys Tyr Ile Gly Tyr
770 775 780
Leu Arg Lys Asn Tyr Glu Glu Leu Phe Asp Phe Ser Asp Phe Lys Met
785 790 795 800
Asn Ile Gln Glu Ile Lys Lys Gln Ile Lys Asp Ile Asn Asp Asn Lys
805 810 815
Thr Tyr Glu Arg Ile Thr Val Lys Thr Ser Asp Lys Thr Ile Val Ile
820 825 830
Asn Asp Asp Phe Glu Tyr Ile Ile Ser Ile Phe Ala Leu Leu Asn Ser
835 840 845
Asn Ala Val Ile Asn Lys Ile Arg Asn Arg Phe Phe Ala Thr Ser Val
850 855 860
Trp Leu Asn Thr Ser Glu Tyr Gln Asn Ile Ile Asp Ile Leu Asp Glu
865 870 875 880
Ile Met Gln Leu Asn Thr Leu Arg Asn Glu Cys Ile Thr Glu Asn Trp
885 890 895
Asn Leu Asn Leu Glu Glu Phe Ile Gln Lys Met Lys Glu Ile Glu Lys
900 905 910
Asp Phe Asp Asp Phe Lys Ile Gln Thr Lys Lys Glu Ile Phe Asn Asn
915 920 925
Tyr Tyr Glu Asp Ile Lys Asn Asn Ile Leu Thr Glu Phe Lys Asp Asp
930 935 940
Ile Asn Gly Cys Asp Val Leu Glu Lys Lys Leu Glu Lys Ile Val Ile
945 950 955 960
Phe Asp Asp Glu Thr Lys Phe Glu Ile Asp Lys Lys Ser Asn Ile Leu
965 970 975
Gln Asp Glu Gln Arg Lys Leu Ser Asn Ile Asn Lys Lys Asp Leu Lys
980 985 990
Lys Lys Val Asp Gln Tyr Ile Lys Asp Lys Asp Gln Glu Ile Lys Ser
995 1000 1005
Lys Ile Leu Cys Arg Ile Ile Phe Asn Ser Asp Phe Leu Lys Lys
1010 1015 1020
Tyr Lys Lys Glu Ile Asp Asn Leu Ile Glu Asp Met Glu Ser Glu
1025 1030 1035
Asn Glu Asn Lys Phe Gln Glu Ile Tyr Tyr Pro Lys Glu Arg Lys
1040 1045 1050
Asn Glu Leu Tyr Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly
1055 1060 1065
Asn Pro Asn Phe Asp Lys Ile Tyr Gly Leu Ile Ser Asn Asp Ile
1070 1075 1080
Lys Met Ala Asp Ala Lys Phe Leu Phe Asn Ile Asp Gly Lys Asn
1085 1090 1095
Ile Arg Lys Asn Lys Ile Ser Glu Ile Asp Ala Ile Leu Lys Asn
1100 1105 1110
Leu Asn Asp Lys Leu Asn Gly Tyr Ser Lys Glu Tyr Lys Glu Lys
1115 1120 1125
Tyr Ile Lys Lys Leu Lys Glu Asn Asp Asp Phe Phe Ala Lys Asn
1130 1135 1140
Ile Gln Asn Lys Asn Tyr Lys Ser Phe Glu Lys Asp Tyr Asn Arg
1145 1150 1155
Val Ser Glu Tyr Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr
1160 1165 1170
Leu Asn Lys Ile Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu
1175 1180 1185
Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1190 1195 1200
Asn Gly Leu Arg Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn
1205 1210 1215
Thr Gly Ile Ser Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly
1220 1225 1230
Phe Tyr Thr Thr Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser
1235 1240 1245
Tyr Lys Lys Phe Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu
1250 1255 1260
Ser Glu Asn Ser Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg
1265 1270 1275
Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp
1280 1285 1290
Tyr Ser Ile Ala Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser
1295 1300 1305
Tyr Ser Thr Arg Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu
1310 1315 1320
Val Phe Lys Lys Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys
1325 1330 1335
Lys Phe Lys Leu Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met
1340 1345 1350
Lys Pro Lys Lys Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser
1355 1360 1365
Asp Tyr Ile Lys Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu
1370 1375 1380
Asn Thr Asn Asp Thr Leu
1385
<210> 72
<211> 1197
<212> PRT
<213> Leptotrichia wadei
<400> 72
Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu
1 5 10 15
Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu
20 25 30
Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn
35 40 45
Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu
50 55 60
Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu
65 70 75 80
Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr
85 90 95
Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe
100 105 110
Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu
115 120 125
Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn
130 135 140
Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile
145 150 155 160
Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile
165 170 175
Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn
180 185 190
Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu
195 200 205
Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys
210 215 220
Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu
225 230 235 240
Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile
245 250 255
Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser
260 265 270
Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys
275 280 285
Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln
290 295 300
Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp
305 310 315 320
Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu
325 330 335
Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys
340 345 350
Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile
355 360 365
Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val
370 375 380
Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn
385 390 395 400
Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn
405 410 415
Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn
420 425 430
Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser
435 440 445
Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala
450 455 460
Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
465 470 475 480
Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala
485 490 495
Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys
500 505 510
Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe
515 520 525
Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys
530 535 540
Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys
545 550 555 560
Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp
565 570 575
Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu
580 585 590
Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser
595 600 605
Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln
610 615 620
Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile
625 630 635 640
Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu
645 650 655
Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe
660 665 670
Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn
675 680 685
Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile
690 695 700
Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys
705 710 715 720
Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His
725 730 735
Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys
740 745 750
Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn
755 760 765
His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser
770 775 780
Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu
785 790 795 800
Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala
805 810 815
Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp
820 825 830
Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly
835 840 845
Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly
850 855 860
Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile
865 870 875 880
Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu
885 890 895
Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro
900 905 910
Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys
915 920 925
Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu
930 935 940
Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His
945 950 955 960
Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg
965 970 975
Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn
980 985 990
Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu
995 1000 1005
Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu
1010 1015 1020
Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln
1025 1030 1035
Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn
1040 1045 1050
Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn
1055 1060 1065
Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile
1070 1075 1080
Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala
1085 1090 1095
Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu
1100 1105 1110
Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys
1115 1120 1125
Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys
1130 1135 1140
Val Met Phe Glu Tyr Lys Ala Leu Glu Lys Arg Pro Ala Ala Thr
1145 1150 1155
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr
1160 1165 1170
Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1175 1180 1185
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1190 1195
<210> 73
<211> 1120
<212> PRT
<213> Listeria seeligeri
<400> 73
Met Trp Ile Ser Ile Lys Thr Leu Ile His His Leu Gly Val Leu Phe
1 5 10 15
Phe Cys Asp Tyr Met Tyr Asn Arg Arg Glu Lys Lys Ile Ile Glu Val
20 25 30
Lys Thr Met Arg Ile Thr Lys Val Glu Val Asp Arg Lys Lys Val Leu
35 40 45
Ile Ser Arg Asp Lys Asn Gly Gly Lys Leu Val Tyr Glu Asn Glu Met
50 55 60
Gln Asp Asn Thr Glu Gln Ile Met His His Lys Lys Ser Ser Phe Tyr
65 70 75 80
Lys Ser Val Val Asn Lys Thr Ile Cys Arg Pro Glu Gln Lys Gln Met
85 90 95
Lys Lys Leu Val His Gly Leu Leu Gln Glu Asn Ser Gln Glu Lys Ile
100 105 110
Lys Val Ser Asp Val Thr Lys Leu Asn Ile Ser Asn Phe Leu Asn His
115 120 125
Arg Phe Lys Lys Ser Leu Tyr Tyr Phe Pro Glu Asn Ser Pro Asp Lys
130 135 140
Ser Glu Glu Tyr Arg Ile Glu Ile Asn Leu Ser Gln Leu Leu Glu Asp
145 150 155 160
Ser Leu Lys Lys Gln Gln Gly Thr Phe Ile Cys Trp Glu Ser Phe Ser
165 170 175
Lys Asp Met Glu Leu Tyr Ile Asn Trp Ala Glu Asn Tyr Ile Ser Ser
180 185 190
Lys Thr Lys Leu Ile Lys Lys Ser Ile Arg Asn Asn Arg Ile Gln Ser
195 200 205
Thr Glu Ser Arg Ser Gly Gln Leu Met Asp Arg Tyr Met Lys Asp Ile
210 215 220
Leu Asn Lys Asn Lys Pro Phe Asp Ile Gln Ser Val Ser Glu Lys Tyr
225 230 235 240
Gln Leu Glu Lys Leu Thr Ser Ala Leu Lys Ala Thr Phe Lys Glu Ala
245 250 255
Lys Lys Asn Asp Lys Glu Ile Asn Tyr Lys Leu Lys Ser Thr Leu Gln
260 265 270
Asn His Glu Arg Gln Ile Ile Glu Glu Leu Lys Glu Asn Ser Glu Leu
275 280 285
Asn Gln Phe Asn Ile Glu Ile Arg Lys His Leu Glu Thr Tyr Phe Pro
290 295 300
Ile Lys Lys Thr Asn Arg Lys Val Gly Asp Ile Arg Asn Leu Glu Ile
305 310 315 320
Gly Glu Ile Gln Lys Ile Val Asn His Arg Leu Lys Asn Lys Ile Val
325 330 335
Gln Arg Ile Leu Gln Glu Gly Lys Leu Ala Ser Tyr Glu Ile Glu Ser
340 345 350
Thr Val Asn Ser Asn Ser Leu Gln Lys Ile Lys Ile Glu Glu Ala Phe
355 360 365
Ala Leu Lys Phe Ile Asn Ala Cys Leu Phe Ala Ser Asn Asn Leu Arg
370 375 380
Asn Met Val Tyr Pro Val Cys Lys Lys Asp Ile Leu Met Ile Gly Glu
385 390 395 400
Phe Lys Asn Ser Phe Lys Glu Ile Lys His Lys Lys Phe Ile Arg Gln
405 410 415
Trp Ser Gln Phe Phe Ser Gln Glu Ile Thr Val Asp Asp Ile Glu Leu
420 425 430
Ala Ser Trp Gly Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile
435 440 445
Ile His Leu Lys Lys His Ser Trp Lys Lys Phe Phe Asn Asn Pro Thr
450 455 460
Phe Lys Val Lys Lys Ser Lys Ile Ile Asn Gly Lys Thr Lys Asp Val
465 470 475 480
Thr Ser Glu Phe Leu Tyr Lys Glu Thr Leu Phe Lys Asp Tyr Phe Tyr
485 490 495
Ser Glu Leu Asp Ser Val Pro Glu Leu Ile Ile Asn Lys Met Glu Ser
500 505 510
Ser Lys Ile Leu Asp Tyr Tyr Ser Ser Asp Gln Leu Asn Gln Val Phe
515 520 525
Thr Ile Pro Asn Phe Glu Leu Ser Leu Leu Thr Ser Ala Val Pro Phe
530 535 540
Ala Pro Ser Phe Lys Arg Val Tyr Leu Lys Gly Phe Asp Tyr Gln Asn
545 550 555 560
Gln Asp Glu Ala Gln Pro Asp Tyr Asn Leu Lys Leu Asn Ile Tyr Asn
565 570 575
Glu Lys Ala Phe Asn Ser Glu Ala Phe Gln Ala Gln Tyr Ser Leu Phe
580 585 590
Lys Met Val Tyr Tyr Gln Val Phe Leu Pro Gln Phe Thr Thr Asn Asn
595 600 605
Asp Leu Phe Lys Ser Ser Val Asp Phe Ile Leu Thr Leu Asn Lys Glu
610 615 620
Arg Lys Gly Tyr Ala Lys Ala Phe Gln Asp Ile Arg Lys Met Asn Lys
625 630 635 640
Asp Glu Lys Pro Ser Glu Tyr Met Ser Tyr Ile Gln Ser Gln Leu Met
645 650 655
Leu Tyr Gln Lys Lys Gln Glu Glu Lys Glu Lys Ile Asn His Phe Glu
660 665 670
Lys Phe Ile Asn Gln Val Phe Ile Lys Gly Phe Asn Ser Phe Ile Glu
675 680 685
Lys Asn Arg Leu Thr Tyr Ile Cys His Pro Thr Lys Asn Thr Val Pro
690 695 700
Glu Asn Asp Asn Ile Glu Ile Pro Phe His Thr Asp Met Asp Asp Ser
705 710 715 720
Asn Ile Ala Phe Trp Leu Met Cys Lys Leu Leu Asp Ala Lys Gln Leu
725 730 735
Ser Glu Leu Arg Asn Glu Met Ile Lys Phe Ser Cys Ser Leu Gln Ser
740 745 750
Thr Glu Glu Ile Ser Thr Phe Thr Lys Ala Arg Glu Val Ile Gly Leu
755 760 765
Ala Leu Leu Asn Gly Glu Lys Gly Cys Asn Asp Trp Lys Glu Leu Phe
770 775 780
Asp Asp Lys Glu Ala Trp Lys Lys Asn Met Ser Leu Tyr Val Ser Glu
785 790 795 800
Glu Leu Leu Gln Ser Leu Pro Tyr Thr Gln Glu Asp Gly Gln Thr Pro
805 810 815
Val Ile Asn Arg Ser Ile Asp Leu Val Lys Lys Tyr Gly Thr Glu Thr
820 825 830
Ile Leu Glu Lys Leu Phe Ser Ser Ser Asp Asp Tyr Lys Val Ser Ala
835 840 845
Lys Asp Ile Ala Lys Leu His Glu Tyr Asp Val Thr Glu Lys Ile Ala
850 855 860
Gln Gln Glu Ser Leu His Lys Gln Trp Ile Glu Lys Pro Gly Leu Ala
865 870 875 880
Arg Asp Ser Ala Trp Thr Lys Lys Tyr Gln Asn Val Ile Asn Asp Ile
885 890 895
Ser Asn Tyr Gln Trp Ala Lys Thr Lys Val Glu Leu Thr Gln Val Arg
900 905 910
His Leu His Gln Leu Thr Ile Asp Leu Leu Ser Arg Leu Ala Gly Tyr
915 920 925
Met Ser Ile Ala Asp Arg Asp Phe Gln Phe Ser Ser Asn Tyr Ile Leu
930 935 940
Glu Arg Glu Asn Ser Glu Tyr Arg Val Thr Ser Trp Ile Leu Leu Ser
945 950 955 960
Glu Asn Lys Asn Lys Asn Lys Tyr Asn Asp Tyr Glu Leu Tyr Asn Leu
965 970 975
Lys Asn Ala Ser Ile Lys Val Ser Ser Lys Asn Asp Pro Gln Leu Lys
980 985 990
Val Asp Leu Lys Gln Leu Arg Leu Thr Leu Glu Tyr Leu Glu Leu Phe
995 1000 1005
Asp Asn Arg Leu Lys Glu Lys Arg Asn Asn Ile Ser His Phe Asn
1010 1015 1020
Tyr Leu Asn Gly Gln Leu Gly Asn Ser Ile Leu Glu Leu Phe Asp
1025 1030 1035
Asp Ala Arg Asp Val Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala
1040 1045 1050
Val Ser Lys Ser Leu Lys Glu Ile Leu Ser Ser His Gly Met Glu
1055 1060 1065
Val Thr Phe Lys Pro Leu Tyr Gln Thr Asn His His Leu Lys Ile
1070 1075 1080
Asp Lys Leu Gln Pro Lys Lys Ile His His Leu Gly Glu Lys Ser
1085 1090 1095
Thr Val Ser Ser Asn Gln Val Ser Asn Glu Tyr Cys Gln Leu Val
1100 1105 1110
Arg Thr Leu Leu Thr Met Lys
1115 1120
<210> 74
<211> 1159
<212> PRT
<213> Leptotrichia buccalis
<400> 74
Met Lys Val Thr Lys Val Gly Gly Ile Ser His Lys Lys Tyr Thr Ser
1 5 10 15
Glu Gly Arg Leu Val Lys Ser Glu Ser Glu Glu Asn Arg Thr Asp Glu
20 25 30
Arg Leu Ser Ala Leu Leu Asn Met Arg Leu Asp Met Tyr Ile Lys Asn
35 40 45
Pro Ser Ser Thr Glu Thr Lys Glu Asn Gln Lys Arg Ile Gly Lys Leu
50 55 60
Lys Lys Phe Phe Ser Asn Lys Met Val Tyr Leu Lys Asp Asn Thr Leu
65 70 75 80
Ser Leu Lys Asn Gly Lys Lys Glu Asn Ile Asp Arg Glu Tyr Ser Glu
85 90 95
Thr Asp Ile Leu Glu Ser Asp Val Arg Asp Lys Lys Asn Phe Ala Val
100 105 110
Leu Lys Lys Ile Tyr Leu Asn Glu Asn Val Asn Ser Glu Glu Leu Glu
115 120 125
Val Phe Arg Asn Asp Ile Lys Lys Lys Leu Asn Lys Ile Asn Ser Leu
130 135 140
Lys Tyr Ser Phe Glu Lys Asn Lys Ala Asn Tyr Gln Lys Ile Asn Glu
145 150 155 160
Asn Asn Ile Glu Lys Val Glu Gly Lys Ser Lys Arg Asn Ile Ile Tyr
165 170 175
Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asp Ala Tyr Val Ser Asn Val
180 185 190
Lys Glu Ala Phe Asp Lys Leu Tyr Lys Glu Glu Asp Ile Ala Lys Leu
195 200 205
Val Leu Glu Ile Glu Asn Leu Thr Lys Leu Glu Lys Tyr Lys Ile Arg
210 215 220
Glu Phe Tyr His Glu Ile Ile Gly Arg Lys Asn Asp Lys Glu Asn Phe
225 230 235 240
Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Met Lys Glu
245 250 255
Leu Ile Glu Lys Val Pro Asp Met Ser Glu Leu Lys Lys Ser Gln Val
260 265 270
Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys Asn Ile
275 280 285
Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln Leu Leu
290 295 300
Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp Lys Ile
305 310 315 320
Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu Asn Lys
325 330 335
Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys Tyr Asn
340 345 350
Tyr Tyr Leu Gln Asp Gly Glu Ile Ala Thr Ser Asp Phe Ile Ala Arg
355 360 365
Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val Ser Ser
370 375 380
Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn Glu Asn
385 390 395 400
Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn Lys Gly
405 410 415
Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn Glu Asn
420 425 430
Lys Lys Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser Tyr Asp
435 440 445
Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala Asn Ile
450 455 460
Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe Asn Leu
465 470 475 480
Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala Pro Ser
485 490 495
Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys Lys Leu
500 505 510
Lys Leu Lys Ile Phe Arg Gln Leu Asn Ser Ala Asn Val Phe Arg Tyr
515 520 525
Leu Glu Lys Tyr Lys Ile Leu Asn Tyr Leu Lys Arg Thr Arg Phe Glu
530 535 540
Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys Leu Tyr
545 550 555 560
Ser Arg Ile Asp Asp Leu Lys Asn Ser Leu Gly Ile Tyr Trp Lys Thr
565 570 575
Pro Lys Thr Asn Asp Asp Asn Lys Thr Lys Glu Ile Ile Asp Ala Gln
580 585 590
Ile Tyr Leu Leu Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Tyr Phe
595 600 605
Met Ser Asn Asn Gly Asn Phe Phe Glu Ile Ser Lys Glu Ile Ile Glu
610 615 620
Leu Asn Lys Asn Asp Lys Arg Asn Leu Lys Thr Gly Phe Tyr Lys Leu
625 630 635 640
Gln Lys Phe Glu Asp Ile Gln Glu Lys Ile Pro Lys Glu Tyr Leu Ala
645 650 655
Asn Ile Gln Ser Leu Tyr Met Ile Asn Ala Gly Asn Gln Asp Glu Glu
660 665 670
Glu Lys Asp Thr Tyr Ile Asp Phe Ile Gln Lys Ile Phe Leu Lys Gly
675 680 685
Phe Met Thr Tyr Leu Ala Asn Asn Gly Arg Leu Ser Leu Ile Tyr Ile
690 695 700
Gly Ser Asp Glu Glu Thr Asn Thr Ser Leu Ala Glu Lys Lys Gln Glu
705 710 715 720
Phe Asp Lys Phe Leu Lys Lys Tyr Glu Gln Asn Asn Asn Ile Lys Ile
725 730 735
Pro Tyr Glu Ile Asn Glu Phe Leu Arg Glu Ile Lys Leu Gly Asn Ile
740 745 750
Leu Lys Tyr Thr Glu Arg Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu
755 760 765
Leu Asn His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr
770 775 780
Gln Ser Ala Asn Lys Glu Glu Ala Phe Ser Asp Gln Leu Glu Leu Ile
785 790 795 800
Asn Leu Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu
805 810 815
Glu Ala Asp Glu Ile Gly Lys Phe Leu Asp Phe Asn Gly Asn Lys Val
820 825 830
Lys Asp Asn Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe
835 840 845
Asp Gly Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys
850 855 860
Tyr Gly Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Gly Tyr
865 870 875 880
Lys Ile Ser Ile Glu Glu Leu Lys Lys Tyr Ser Asn Lys Lys Asn Glu
885 890 895
Ile Glu Lys Asn His Lys Met Gln Glu Asn Leu His Arg Lys Tyr Ala
900 905 910
Arg Pro Arg Lys Asp Glu Lys Phe Thr Asp Glu Asp Tyr Glu Ser Tyr
915 920 925
Lys Gln Ala Ile Glu Asn Ile Glu Glu Tyr Thr His Leu Lys Asn Lys
930 935 940
Val Glu Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Arg Ile
945 950 955 960
Leu His Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg
965 970 975
Phe Arg Leu Lys Gly Glu Phe Pro Glu Asn Gln Tyr Ile Glu Glu Ile
980 985 990
Phe Asn Phe Glu Asn Lys Lys Asn Val Lys Tyr Lys Gly Gly Gln Ile
995 1000 1005
Val Glu Lys Tyr Ile Lys Phe Tyr Lys Glu Leu His Gln Asn Asp
1010 1015 1020
Glu Val Lys Ile Asn Lys Tyr Ser Ser Ala Asn Ile Lys Val Leu
1025 1030 1035
Lys Gln Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His
1040 1045 1050
Phe Asn Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu
1055 1060 1065
Glu Asn Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn
1070 1075 1080
Ala Val Met Lys Ser Val Val Asp Ile Leu Lys Glu Tyr Gly Phe
1085 1090 1095
Val Ala Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Gly Ile Gln
1100 1105 1110
Thr Leu Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys
1115 1120 1125
Lys Lys Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Lys Leu
1130 1135 1140
Val Lys Ile Met Phe Glu Tyr Lys Met Glu Glu Lys Lys Ser Glu
1145 1150 1155
Asn
<210> 75
<211> 1285
<212> PRT
<213> Herbinix hemicellulosilytica
<400> 75
Met Lys Leu Thr Arg Arg Arg Ile Ser Gly Asn Ser Val Asp Gln Lys
1 5 10 15
Ile Thr Ala Ala Phe Tyr Arg Asp Met Ser Gln Gly Leu Leu Tyr Tyr
20 25 30
Asp Ser Glu Asp Asn Asp Cys Thr Asp Lys Val Ile Glu Ser Met Asp
35 40 45
Phe Glu Arg Ser Trp Arg Gly Arg Ile Leu Lys Asn Gly Glu Asp Asp
50 55 60
Lys Asn Pro Phe Tyr Met Phe Val Lys Gly Leu Val Gly Ser Asn Asp
65 70 75 80
Lys Ile Val Cys Glu Pro Ile Asp Val Asp Ser Asp Pro Asp Asn Leu
85 90 95
Asp Ile Leu Ile Asn Lys Asn Leu Thr Gly Phe Gly Arg Asn Leu Lys
100 105 110
Ala Pro Asp Ser Asn Asp Thr Leu Glu Asn Leu Ile Arg Lys Ile Gln
115 120 125
Ala Gly Ile Pro Glu Glu Glu Val Leu Pro Glu Leu Lys Lys Ile Lys
130 135 140
Glu Met Ile Gln Lys Asp Ile Val Asn Arg Lys Glu Gln Leu Leu Lys
145 150 155 160
Ser Ile Lys Asn Asn Arg Ile Pro Phe Ser Leu Glu Gly Ser Lys Leu
165 170 175
Val Pro Ser Thr Lys Lys Met Lys Trp Leu Phe Lys Leu Ile Asp Val
180 185 190
Pro Asn Lys Thr Phe Asn Glu Lys Met Leu Glu Lys Tyr Trp Glu Ile
195 200 205
Tyr Asp Tyr Asp Lys Leu Lys Ala Asn Ile Thr Asn Arg Leu Asp Lys
210 215 220
Thr Asp Lys Lys Ala Arg Ser Ile Ser Arg Ala Val Ser Glu Glu Leu
225 230 235 240
Arg Glu Tyr His Lys Asn Leu Arg Thr Asn Tyr Asn Arg Phe Val Ser
245 250 255
Gly Asp Arg Pro Ala Ala Gly Leu Asp Asn Gly Gly Ser Ala Lys Tyr
260 265 270
Asn Pro Asp Lys Glu Glu Phe Leu Leu Phe Leu Lys Glu Val Glu Gln
275 280 285
Tyr Phe Lys Lys Tyr Phe Pro Val Lys Ser Lys His Ser Asn Lys Ser
290 295 300
Lys Asp Lys Ser Leu Val Asp Lys Tyr Lys Asn Tyr Cys Ser Tyr Lys
305 310 315 320
Val Val Lys Lys Glu Val Asn Arg Ser Ile Ile Asn Gln Leu Val Ala
325 330 335
Gly Leu Ile Gln Gln Gly Lys Leu Leu Tyr Tyr Phe Tyr Tyr Asn Asp
340 345 350
Thr Trp Gln Glu Asp Phe Leu Asn Ser Tyr Gly Leu Ser Tyr Ile Gln
355 360 365
Val Glu Glu Ala Phe Lys Lys Ser Val Met Thr Ser Leu Ser Trp Gly
370 375 380
Ile Asn Arg Leu Thr Ser Phe Phe Ile Asp Asp Ser Asn Thr Val Lys
385 390 395 400
Phe Asp Asp Ile Thr Thr Lys Lys Ala Lys Glu Ala Ile Glu Ser Asn
405 410 415
Tyr Phe Asn Lys Leu Arg Thr Cys Ser Arg Met Gln Asp His Phe Lys
420 425 430
Glu Lys Leu Ala Phe Phe Tyr Pro Val Tyr Val Lys Asp Lys Lys Asp
435 440 445
Arg Pro Asp Asp Asp Ile Glu Asn Leu Ile Val Leu Val Lys Asn Ala
450 455 460
Ile Glu Ser Val Ser Tyr Leu Arg Asn Arg Thr Phe His Phe Lys Glu
465 470 475 480
Ser Ser Leu Leu Glu Leu Leu Lys Glu Leu Asp Asp Lys Asn Ser Gly
485 490 495
Gln Asn Lys Ile Asp Tyr Ser Val Ala Ala Glu Phe Ile Lys Arg Asp
500 505 510
Ile Glu Asn Leu Tyr Asp Val Phe Arg Glu Gln Ile Arg Ser Leu Gly
515 520 525
Ile Ala Glu Tyr Tyr Lys Ala Asp Met Ile Ser Asp Cys Phe Lys Thr
530 535 540
Cys Gly Leu Glu Phe Ala Leu Tyr Ser Pro Lys Asn Ser Leu Met Pro
545 550 555 560
Ala Phe Lys Asn Val Tyr Lys Arg Gly Ala Asn Leu Asn Lys Ala Tyr
565 570 575
Ile Arg Asp Lys Gly Pro Lys Glu Thr Gly Asp Gln Gly Gln Asn Ser
580 585 590
Tyr Lys Ala Leu Glu Glu Tyr Arg Glu Leu Thr Trp Tyr Ile Glu Val
595 600 605
Lys Asn Asn Asp Gln Ser Tyr Asn Ala Tyr Lys Asn Leu Leu Gln Leu
610 615 620
Ile Tyr Tyr His Ala Phe Leu Pro Glu Val Arg Glu Asn Glu Ala Leu
625 630 635 640
Ile Thr Asp Phe Ile Asn Arg Thr Lys Glu Trp Asn Arg Lys Glu Thr
645 650 655
Glu Glu Arg Leu Asn Thr Lys Asn Asn Lys Lys His Lys Asn Phe Asp
660 665 670
Glu Asn Asp Asp Ile Thr Val Asn Thr Tyr Arg Tyr Glu Ser Ile Pro
675 680 685
Asp Tyr Gln Gly Glu Ser Leu Asp Asp Tyr Leu Lys Val Leu Gln Arg
690 695 700
Lys Gln Met Ala Arg Ala Lys Glu Val Asn Glu Lys Glu Glu Gly Asn
705 710 715 720
Asn Asn Tyr Ile Gln Phe Ile Arg Asp Val Val Val Trp Ala Phe Gly
725 730 735
Ala Tyr Leu Glu Asn Lys Leu Lys Asn Tyr Lys Asn Glu Leu Gln Pro
740 745 750
Pro Leu Ser Lys Glu Asn Ile Gly Leu Asn Asp Thr Leu Lys Glu Leu
755 760 765
Phe Pro Glu Glu Lys Val Lys Ser Pro Phe Asn Ile Lys Cys Arg Phe
770 775 780
Ser Ile Ser Thr Phe Ile Asp Asn Lys Gly Lys Ser Thr Asp Asn Thr
785 790 795 800
Ser Ala Glu Ala Val Lys Thr Asp Gly Lys Glu Asp Glu Lys Asp Lys
805 810 815
Lys Asn Ile Lys Arg Lys Asp Leu Leu Cys Phe Tyr Leu Phe Leu Arg
820 825 830
Leu Leu Asp Glu Asn Glu Ile Cys Lys Leu Gln His Gln Phe Ile Lys
835 840 845
Tyr Arg Cys Ser Leu Lys Glu Arg Arg Phe Pro Gly Asn Arg Thr Lys
850 855 860
Leu Glu Lys Glu Thr Glu Leu Leu Ala Glu Leu Glu Glu Leu Met Glu
865 870 875 880
Leu Val Arg Phe Thr Met Pro Ser Ile Pro Glu Ile Ser Ala Lys Ala
885 890 895
Glu Ser Gly Tyr Asp Thr Met Ile Lys Lys Tyr Phe Lys Asp Phe Ile
900 905 910
Glu Lys Lys Val Phe Lys Asn Pro Lys Thr Ser Asn Leu Tyr Tyr His
915 920 925
Ser Asp Ser Lys Thr Pro Val Thr Arg Lys Tyr Met Ala Leu Leu Met
930 935 940
Arg Ser Ala Pro Leu His Leu Tyr Lys Asp Ile Phe Lys Gly Tyr Tyr
945 950 955 960
Leu Ile Thr Lys Lys Glu Cys Leu Glu Tyr Ile Lys Leu Ser Asn Ile
965 970 975
Ile Lys Asp Tyr Gln Asn Ser Leu Asn Glu Leu His Glu Gln Leu Glu
980 985 990
Arg Ile Lys Leu Lys Ser Glu Lys Gln Asn Gly Lys Asp Ser Leu Tyr
995 1000 1005
Leu Asp Lys Lys Asp Phe Tyr Lys Val Lys Glu Tyr Val Glu Asn
1010 1015 1020
Leu Glu Gln Val Ala Arg Tyr Lys His Leu Gln His Lys Ile Asn
1025 1030 1035
Phe Glu Ser Leu Tyr Arg Ile Phe Arg Ile His Val Asp Ile Ala
1040 1045 1050
Ala Arg Met Val Gly Tyr Thr Gln Asp Trp Glu Arg Asp Met His
1055 1060 1065
Phe Leu Phe Lys Ala Leu Val Tyr Asn Gly Val Leu Glu Glu Arg
1070 1075 1080
Arg Phe Glu Ala Ile Phe Asn Asn Asn Asp Asp Asn Asn Asp Gly
1085 1090 1095
Arg Ile Val Lys Lys Ile Gln Asn Asn Leu Asn Asn Lys Asn Arg
1100 1105 1110
Glu Leu Val Ser Met Leu Cys Trp Asn Lys Lys Leu Asn Lys Asn
1115 1120 1125
Glu Phe Gly Ala Ile Ile Trp Lys Arg Asn Pro Ile Ala His Leu
1130 1135 1140
Asn His Phe Thr Gln Thr Glu Gln Asn Ser Lys Ser Ser Leu Glu
1145 1150 1155
Ser Leu Ile Asn Ser Leu Arg Ile Leu Leu Ala Tyr Asp Arg Lys
1160 1165 1170
Arg Gln Asn Ala Val Thr Lys Thr Ile Asn Asp Leu Leu Leu Asn
1175 1180 1185
Asp Tyr His Ile Arg Ile Lys Trp Glu Gly Arg Val Asp Glu Gly
1190 1195 1200
Gln Ile Tyr Phe Asn Ile Lys Glu Lys Glu Asp Ile Glu Asn Glu
1205 1210 1215
Pro Ile Ile His Leu Lys His Leu His Lys Lys Asp Cys Tyr Ile
1220 1225 1230
Tyr Lys Asn Ser Tyr Met Phe Asp Lys Gln Lys Glu Trp Ile Cys
1235 1240 1245
Asn Gly Ile Lys Glu Glu Val Tyr Asp Lys Ser Ile Leu Lys Cys
1250 1255 1260
Ile Gly Asn Leu Phe Lys Phe Asp Tyr Glu Asp Lys Asn Lys Ser
1265 1270 1275
Ser Ala Asn Pro Lys His Thr
1280 1285
<210> 76
<211> 1344
<212> PRT
<213> Eubacterium rectale
<400> 76
Met Leu Arg Arg Asp Lys Glu Val Lys Lys Leu Tyr Asn Val Phe Asn
1 5 10 15
Gln Ile Gln Val Gly Thr Lys Pro Lys Lys Trp Asn Asn Asp Glu Lys
20 25 30
Leu Ser Pro Glu Glu Asn Glu Arg Arg Ala Gln Gln Lys Asn Ile Lys
35 40 45
Met Lys Asn Tyr Lys Trp Arg Glu Ala Cys Ser Lys Tyr Val Glu Ser
50 55 60
Ser Gln Arg Ile Ile Asn Asp Val Ile Phe Tyr Ser Tyr Arg Lys Ala
65 70 75 80
Lys Asn Lys Leu Arg Tyr Met Arg Lys Asn Glu Asp Ile Leu Lys Lys
85 90 95
Met Gln Glu Ala Glu Lys Leu Ser Lys Phe Ser Gly Gly Lys Leu Glu
100 105 110
Asp Phe Val Ala Tyr Thr Leu Arg Lys Ser Leu Val Val Ser Lys Tyr
115 120 125
Asp Thr Gln Glu Phe Asp Ser Leu Ala Ala Met Val Val Phe Leu Glu
130 135 140
Cys Ile Gly Lys Asn Asn Ile Ser Asp His Glu Arg Glu Ile Val Cys
145 150 155 160
Lys Leu Leu Glu Leu Ile Arg Lys Asp Phe Ser Lys Leu Asp Pro Asn
165 170 175
Val Lys Gly Ser Gln Gly Ala Asn Ile Val Arg Ser Val Arg Asn Gln
180 185 190
Asn Met Ile Val Gln Pro Gln Gly Asp Arg Phe Leu Phe Pro Gln Val
195 200 205
Tyr Ala Lys Glu Asn Glu Thr Val Thr Asn Lys Asn Val Glu Lys Glu
210 215 220
Gly Leu Asn Glu Phe Leu Leu Asn Tyr Ala Asn Leu Asp Asp Glu Lys
225 230 235 240
Arg Ala Glu Ser Leu Arg Lys Leu Arg Arg Ile Leu Asp Val Tyr Phe
245 250 255
Ser Ala Pro Asn His Tyr Glu Lys Asp Met Asp Ile Thr Leu Ser Asp
260 265 270
Asn Ile Glu Lys Glu Lys Phe Asn Val Trp Glu Lys His Glu Cys Gly
275 280 285
Lys Lys Glu Thr Gly Leu Phe Val Asp Ile Pro Asp Val Leu Met Glu
290 295 300
Ala Glu Ala Glu Asn Ile Lys Leu Asp Ala Val Val Glu Lys Arg Glu
305 310 315 320
Arg Lys Val Leu Asn Asp Arg Val Arg Lys Gln Asn Ile Ile Cys Tyr
325 330 335
Arg Tyr Thr Arg Ala Val Val Glu Lys Tyr Asn Ser Asn Glu Pro Leu
340 345 350
Phe Phe Glu Asn Asn Ala Ile Asn Gln Tyr Trp Ile His His Ile Glu
355 360 365
Asn Ala Val Glu Arg Ile Leu Lys Asn Cys Lys Ala Gly Lys Leu Phe
370 375 380
Lys Leu Arg Lys Gly Tyr Leu Ala Glu Lys Val Trp Lys Asp Ala Ile
385 390 395 400
Asn Leu Ile Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr Asn
405 410 415
Phe Ala Leu Asp Asp Ile Trp Lys Asp Lys Lys Asn Lys Glu Leu Gly
420 425 430
Ile Val Asp Glu Arg Ile Arg Asn Gly Ile Thr Ser Phe Asp Tyr Glu
435 440 445
Met Ile Lys Ala His Glu Asn Leu Gln Arg Glu Leu Ala Val Asp Ile
450 455 460
Ala Phe Ser Val Asn Asn Leu Ala Arg Ala Val Cys Asp Met Ser Asn
465 470 475 480
Leu Gly Asn Lys Glu Ser Asp Phe Leu Leu Trp Lys Arg Asn Asp Ile
485 490 495
Ala Asp Lys Leu Lys Asn Lys Asp Asp Met Ala Ser Val Ser Ala Val
500 505 510
Leu Gln Phe Phe Gly Gly Lys Ser Ser Trp Asp Ile Asn Ile Phe Lys
515 520 525
Asp Ala Tyr Lys Gly Lys Lys Lys Tyr Asn Tyr Glu Val Arg Phe Ile
530 535 540
Asp Asp Leu Arg Lys Ala Ile Tyr Cys Ala Arg Asn Glu Asn Phe His
545 550 555 560
Phe Lys Thr Ala Leu Val Asn Asp Glu Lys Trp Asn Thr Glu Leu Phe
565 570 575
Gly Lys Ile Phe Glu Arg Glu Thr Glu Phe Cys Leu Asn Val Glu Lys
580 585 590
Asp Arg Phe Tyr Ser Asn Asn Leu Tyr Met Phe Tyr Gln Val Ser Glu
595 600 605
Leu Arg Asn Met Leu Asp His Leu Tyr Ser Arg Ser Val Ser Arg Ala
610 615 620
Ala Gln Val Pro Ser Tyr Asn Ser Val Ile Val Arg Thr Ala Phe Pro
625 630 635 640
Glu Tyr Ile Thr Asn Val Leu Gly Tyr Gln Lys Pro Ser Tyr Asp Ala
645 650 655
Asp Thr Leu Gly Lys Trp Tyr Ser Ala Cys Tyr Tyr Leu Leu Lys Glu
660 665 670
Ile Tyr Tyr Asn Ser Phe Leu Gln Ser Asp Arg Ala Leu Gln Leu Phe
675 680 685
Glu Lys Ser Val Lys Thr Leu Ser Trp Asp Asp Lys Lys Gln Gln Arg
690 695 700
Ala Val Asp Asn Phe Lys Asp His Phe Ser Asp Ile Lys Ser Ala Cys
705 710 715 720
Thr Ser Leu Ala Gln Val Cys Gln Ile Tyr Met Thr Glu Tyr Asn Gln
725 730 735
Gln Asn Asn Gln Ile Lys Lys Val Arg Ser Ser Asn Asp Ser Ile Phe
740 745 750
Asp Gln Pro Val Tyr Gln His Tyr Lys Val Leu Leu Lys Lys Ala Ile
755 760 765
Ala Asn Ala Phe Ala Asp Tyr Leu Lys Asn Asn Lys Asp Leu Phe Gly
770 775 780
Phe Ile Gly Lys Pro Phe Lys Ala Asn Glu Ile Arg Glu Ile Asp Lys
785 790 795 800
Glu Gln Phe Leu Pro Asp Trp Thr Ser Arg Lys Tyr Glu Ala Leu Cys
805 810 815
Ile Glu Val Ser Gly Ser Gln Glu Leu Gln Lys Trp Tyr Ile Val Gly
820 825 830
Lys Phe Leu Asn Ala Arg Ser Leu Asn Leu Met Val Gly Ser Met Arg
835 840 845
Ser Tyr Ile Gln Tyr Val Thr Asp Ile Lys Arg Arg Ala Ala Ser Ile
850 855 860
Gly Asn Glu Leu His Val Ser Val His Asp Val Glu Lys Val Glu Lys
865 870 875 880
Trp Val Gln Val Ile Glu Val Cys Ser Leu Leu Ala Ser Arg Thr Ser
885 890 895
Asn Gln Phe Glu Asp Tyr Phe Asn Asp Lys Asp Asp Tyr Ala Arg Tyr
900 905 910
Leu Lys Ser Tyr Val Asp Phe Ser Asn Val Asp Met Pro Ser Glu Tyr
915 920 925
Ser Ala Leu Val Asp Phe Ser Asn Glu Glu Gln Ser Asp Leu Tyr Val
930 935 940
Asp Pro Lys Asn Pro Lys Val Asn Arg Asn Ile Val His Ser Lys Leu
945 950 955 960
Phe Ala Ala Asp His Ile Leu Arg Asp Ile Val Glu Pro Val Ser Lys
965 970 975
Asp Asn Ile Glu Glu Phe Tyr Ser Gln Lys Ala Glu Ile Ala Tyr Cys
980 985 990
Lys Ile Lys Gly Lys Glu Ile Thr Ala Glu Glu Gln Lys Ala Val Leu
995 1000 1005
Lys Tyr Gln Lys Leu Lys Asn Arg Val Glu Leu Arg Asp Ile Val
1010 1015 1020
Glu Tyr Gly Glu Ile Ile Asn Glu Leu Leu Gly Gln Leu Ile Asn
1025 1030 1035
Trp Ser Phe Met Arg Glu Arg Asp Leu Leu Tyr Phe Gln Leu Gly
1040 1045 1050
Phe His Tyr Asp Cys Leu Arg Asn Asp Ser Lys Lys Pro Glu Gly
1055 1060 1065
Tyr Lys Asn Ile Lys Val Asp Glu Asn Ser Ile Lys Asp Ala Ile
1070 1075 1080
Leu Tyr Gln Ile Ile Gly Met Tyr Val Asn Gly Val Thr Val Tyr
1085 1090 1095
Ala Pro Glu Lys Asp Gly Asp Lys Leu Lys Glu Gln Cys Val Lys
1100 1105 1110
Gly Gly Val Gly Val Lys Val Ser Ala Phe His Arg Tyr Ser Lys
1115 1120 1125
Tyr Leu Gly Leu Asn Glu Lys Thr Leu Tyr Asn Ala Gly Leu Glu
1130 1135 1140
Ile Phe Glu Val Val Ala Glu His Glu Asp Ile Ile Asn Leu Arg
1145 1150 1155
Asn Gly Ile Asp His Phe Lys Tyr Tyr Leu Gly Asp Tyr Arg Ser
1160 1165 1170
Met Leu Ser Ile Tyr Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr
1175 1180 1185
Asp Ile Lys Tyr Gln Lys Asn Val Leu Asn Leu Leu Gln Asn Ile
1190 1195 1200
Leu Leu Arg His Asn Val Ile Val Glu Pro Ile Leu Glu Ser Gly
1205 1210 1215
Phe Lys Thr Ile Gly Glu Gln Thr Lys Pro Gly Ala Lys Leu Ser
1220 1225 1230
Ile Arg Ser Ile Lys Ser Asp Thr Phe Gln Tyr Lys Val Lys Gly
1235 1240 1245
Gly Thr Leu Ile Thr Asp Ala Lys Asp Glu Arg Tyr Leu Glu Thr
1250 1255 1260
Ile Arg Lys Ile Leu Tyr Tyr Ala Glu Asn Glu Glu Asp Asn Leu
1265 1270 1275
Lys Lys Ser Val Val Val Thr Asn Ala Asp Lys Tyr Glu Lys Asn
1280 1285 1290
Lys Glu Ser Asp Asp Gln Asn Lys Gln Lys Glu Lys Lys Asn Lys
1295 1300 1305
Asp Asn Lys Gly Lys Lys Asn Glu Glu Thr Lys Ser Asp Ala Glu
1310 1315 1320
Lys Asn Asn Asn Glu Arg Leu Ser Tyr Asn Pro Phe Ala Asn Leu
1325 1330 1335
Asn Phe Lys Leu Ser Asn
1340
<210> 77
<211> 1373
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Eubacteriaceae bacterium sequence"
<400> 77
Met Lys Ile Ser Lys Glu Ser His Lys Arg Thr Ala Val Ala Val Met
1 5 10 15
Glu Asp Arg Val Gly Gly Val Val Tyr Val Pro Gly Gly Ser Gly Ile
20 25 30
Asp Leu Ser Asn Asn Leu Lys Lys Arg Ser Met Asp Thr Lys Ser Leu
35 40 45
Tyr Asn Val Phe Asn Gln Ile Gln Ala Gly Thr Ala Pro Ser Glu Tyr
50 55 60
Glu Trp Lys Asp Tyr Leu Ser Glu Ala Glu Asn Lys Lys Arg Glu Ala
65 70 75 80
Gln Lys Met Ile Gln Lys Ala Asn Tyr Glu Leu Arg Arg Glu Cys Glu
85 90 95
Asp Tyr Ala Lys Lys Ala Asn Leu Ala Val Ser Arg Ile Ile Phe Ser
100 105 110
Lys Lys Pro Lys Lys Ile Phe Ser Asp Asp Asp Ile Ile Ser His Met
115 120 125
Lys Lys Gln Arg Leu Ser Lys Phe Lys Gly Arg Met Glu Asp Phe Val
130 135 140
Leu Ile Ala Leu Arg Lys Ser Leu Val Val Ser Thr Tyr Asn Gln Glu
145 150 155 160
Val Phe Asp Ser Arg Lys Ala Ala Thr Val Phe Leu Lys Asn Ile Gly
165 170 175
Lys Lys Asn Ile Ser Ala Asp Asp Glu Arg Gln Ile Lys Gln Leu Met
180 185 190
Ala Leu Ile Arg Glu Asp Tyr Asp Lys Trp Asn Pro Asp Lys Asp Ser
195 200 205
Ser Asp Lys Lys Glu Ser Ser Gly Thr Lys Val Ile Arg Ser Ile Glu
210 215 220
His Gln Asn Met Val Ile Gln Pro Glu Lys Asn Lys Leu Ser Leu Ser
225 230 235 240
Lys Ile Ser Asn Val Gly Lys Lys Thr Lys Thr Lys Gln Lys Glu Lys
245 250 255
Ala Gly Leu Asp Ala Phe Leu Lys Glu Tyr Ala Gln Ile Asp Glu Asn
260 265 270
Ser Arg Met Glu Tyr Leu Lys Lys Leu Arg Arg Leu Leu Asp Thr Tyr
275 280 285
Phe Ala Ala Pro Ser Ser Tyr Ile Lys Gly Ala Ala Val Ser Leu Pro
290 295 300
Glu Asn Ile Asn Phe Ser Ser Glu Leu Asn Val Trp Glu Arg His Glu
305 310 315 320
Ala Ala Lys Lys Val Asn Ile Asn Phe Val Glu Ile Pro Glu Ser Leu
325 330 335
Leu Asn Ala Glu Gln Asn Asn Asn Lys Ile Asn Lys Val Glu Gln Glu
340 345 350
His Ser Leu Glu Gln Leu Arg Thr Asp Ile Arg Arg Arg Asn Ile Thr
355 360 365
Cys Tyr His Phe Ala Asn Ala Leu Ala Ala Asp Glu Arg Tyr His Thr
370 375 380
Leu Phe Phe Glu Asn Met Ala Met Asn Gln Phe Trp Ile His His Met
385 390 395 400
Glu Asn Ala Val Glu Arg Ile Leu Lys Lys Cys Asn Val Gly Thr Leu
405 410 415
Phe Lys Leu Arg Ile Gly Tyr Leu Ser Glu Lys Val Trp Lys Asp Met
420 425 430
Leu Asn Leu Leu Ser Ile Lys Tyr Ile Ala Leu Gly Lys Ala Val Tyr
435 440 445
His Phe Ala Leu Asp Asp Ile Trp Lys Ala Asp Ile Trp Lys Asp Ala
450 455 460
Ser Asp Lys Asn Ser Gly Lys Ile Asn Asp Leu Thr Leu Lys Gly Ile
465 470 475 480
Ser Ser Phe Asp Tyr Glu Met Val Lys Ala Gln Glu Asp Leu Gln Arg
485 490 495
Glu Met Ala Val Gly Val Ala Phe Ser Thr Asn Asn Leu Ala Arg Val
500 505 510
Thr Cys Lys Met Asp Asp Leu Ser Asp Ala Glu Ser Asp Phe Leu Leu
515 520 525
Trp Asn Lys Glu Ala Ile Arg Arg His Val Lys Tyr Thr Glu Lys Gly
530 535 540
Glu Ile Leu Ser Ala Ile Leu Gln Phe Phe Gly Gly Arg Ser Leu Trp
545 550 555 560
Asp Glu Ser Leu Phe Glu Lys Ala Tyr Ser Asp Ser Asn Tyr Glu Leu
565 570 575
Lys Phe Leu Asp Asp Leu Lys Arg Ala Ile Tyr Ala Ala Arg Asn Glu
580 585 590
Thr Phe His Phe Lys Thr Ala Ala Ile Asp Gly Gly Ser Trp Asn Thr
595 600 605
Arg Leu Phe Gly Ser Leu Phe Glu Lys Glu Ala Gly Leu Cys Leu Asn
610 615 620
Val Glu Lys Asn Lys Phe Tyr Ser Asn Asn Leu Val Leu Phe Tyr Lys
625 630 635 640
Gln Glu Asp Leu Arg Val Phe Leu Asp Lys Leu Tyr Gly Lys Glu Cys
645 650 655
Ser Arg Ala Ala Gln Ile Pro Ser Tyr Asn Thr Ile Leu Pro Arg Lys
660 665 670
Ser Phe Ser Asp Phe Met Lys Gln Leu Leu Gly Leu Lys Glu Pro Val
675 680 685
Tyr Gly Ser Ala Ile Leu Asp Gln Trp Tyr Ser Ala Cys Tyr Tyr Leu
690 695 700
Phe Lys Glu Val Tyr Tyr Asn Leu Phe Leu Gln Asp Ser Ser Ala Lys
705 710 715 720
Ala Leu Phe Glu Lys Ala Val Lys Ala Leu Lys Gly Ala Asp Lys Lys
725 730 735
Gln Glu Lys Ala Val Glu Ser Phe Arg Lys Arg Tyr Trp Glu Ile Ser
740 745 750
Lys Asn Ala Ser Leu Ala Glu Ile Cys Gln Ser Tyr Ile Thr Glu Tyr
755 760 765
Asn Gln Gln Asn Asn Lys Glu Arg Lys Val Arg Ser Ala Asn Asp Gly
770 775 780
Met Phe Asn Glu Pro Ile Tyr Gln His Tyr Lys Met Leu Leu Lys Glu
785 790 795 800
Ala Leu Lys Met Ala Phe Ala Ser Tyr Ile Lys Asn Asp Lys Glu Leu
805 810 815
Lys Phe Val Tyr Lys Pro Thr Glu Lys Leu Phe Glu Val Ser Gln Asp
820 825 830
Asn Phe Leu Pro Asn Trp Asn Ser Glu Lys Tyr Asn Thr Leu Ile Ser
835 840 845
Glu Val Lys Asn Ser Pro Asp Leu Gln Lys Trp Tyr Ile Val Gly Lys
850 855 860
Phe Met Asn Ala Arg Met Leu Asn Leu Leu Leu Gly Ser Met Arg Ser
865 870 875 880
Tyr Leu Gln Tyr Val Ser Asp Ile Gln Lys Arg Ala Ala Gly Leu Gly
885 890 895
Glu Asn Gln Leu His Leu Ser Ala Glu Asn Val Gly Gln Val Lys Lys
900 905 910
Trp Ile Gln Val Leu Glu Val Cys Leu Leu Leu Ser Val Arg Ile Ser
915 920 925
Asp Lys Phe Thr Asp Tyr Phe Lys Asp Glu Glu Glu Tyr Ala Ser Tyr
930 935 940
Leu Lys Glu Tyr Val Asp Phe Glu Asp Ser Ala Met Pro Ser Asp Tyr
945 950 955 960
Ser Ala Leu Leu Ala Phe Ser Asn Glu Gly Lys Ile Asp Leu Tyr Val
965 970 975
Asp Ala Ser Asn Pro Lys Val Asn Arg Asn Ile Ile Gln Ala Lys Leu
980 985 990
Tyr Ala Pro Asp Met Val Leu Lys Lys Val Val Lys Lys Ile Ser Gln
995 1000 1005
Asp Glu Cys Lys Glu Phe Asn Glu Lys Lys Glu Gln Ile Met Gln
1010 1015 1020
Phe Lys Asn Lys Gly Asp Glu Val Ser Trp Glu Glu Gln Gln Lys
1025 1030 1035
Ile Leu Glu Tyr Gln Lys Leu Lys Asn Arg Val Glu Leu Arg Asp
1040 1045 1050
Leu Ser Glu Tyr Gly Glu Leu Ile Asn Glu Leu Leu Gly Gln Leu
1055 1060 1065
Ile Asn Trp Ser Tyr Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln
1070 1075 1080
Leu Gly Phe His Tyr Ser Cys Leu Met Asn Glu Ser Lys Lys Pro
1085 1090 1095
Asp Ala Tyr Lys Thr Ile Arg Arg Gly Thr Val Ser Ile Glu Asn
1100 1105 1110
Ala Val Leu Tyr Gln Ile Ile Ala Met Tyr Ile Asn Gly Phe Pro
1115 1120 1125
Val Tyr Ala Pro Glu Lys Gly Glu Leu Lys Pro Gln Cys Lys Thr
1130 1135 1140
Gly Ser Ala Gly Gln Lys Ile Arg Ala Phe Cys Gln Trp Ala Ser
1145 1150 1155
Met Val Glu Lys Lys Lys Tyr Glu Leu Tyr Asn Ala Gly Leu Glu
1160 1165 1170
Leu Phe Glu Val Val Lys Glu His Asp Asn Ile Ile Asp Leu Arg
1175 1180 1185
Asn Lys Ile Asp His Phe Lys Tyr Tyr Gln Gly Asn Asp Ser Ile
1190 1195 1200
Leu Ala Leu Tyr Gly Glu Ile Phe Asp Arg Phe Phe Thr Tyr Asp
1205 1210 1215
Met Lys Tyr Arg Asn Asn Val Leu Asn His Leu Gln Asn Ile Leu
1220 1225 1230
Leu Arg His Asn Val Ile Ile Lys Pro Ile Ile Ser Lys Asp Lys
1235 1240 1245
Lys Glu Val Gly Arg Gly Lys Met Lys Asp Arg Ala Ala Phe Leu
1250 1255 1260
Leu Glu Glu Val Ser Ser Asp Arg Phe Thr Tyr Lys Val Lys Glu
1265 1270 1275
Gly Glu Arg Lys Ile Asp Ala Lys Asn Arg Leu Tyr Leu Glu Thr
1280 1285 1290
Val Arg Asp Ile Leu Tyr Phe Pro Asn Arg Ala Val Asn Asp Lys
1295 1300 1305
Gly Glu Asp Val Ile Ile Cys Ser Lys Lys Ala Gln Asp Leu Asn
1310 1315 1320
Glu Lys Lys Ala Asp Arg Asp Lys Asn His Asp Lys Ser Lys Asp
1325 1330 1335
Thr Asn Gln Lys Lys Glu Gly Lys Asn Gln Glu Glu Lys Ser Glu
1340 1345 1350
Asn Lys Glu Pro Tyr Ser Asp Arg Met Thr Trp Lys Pro Phe Ala
1355 1360 1365
Gly Ile Lys Leu Glu
1370
<210> 78
<211> 1276
<212> PRT
<213> Blautia sp.
<400> 78
Met Lys Ile Ser Lys Val Asp His Val Lys Ser Gly Ile Asp Gln Lys
1 5 10 15
Leu Ser Ser Gln Arg Gly Met Leu Tyr Lys Gln Pro Gln Lys Lys Tyr
20 25 30
Glu Gly Lys Gln Leu Glu Glu His Val Arg Asn Leu Ser Arg Lys Ala
35 40 45
Lys Ala Leu Tyr Gln Val Phe Pro Val Ser Gly Asn Ser Lys Met Glu
50 55 60
Lys Glu Leu Gln Ile Ile Asn Ser Phe Ile Lys Asn Ile Leu Leu Arg
65 70 75 80
Leu Asp Ser Gly Lys Thr Ser Glu Glu Ile Val Gly Tyr Ile Asn Thr
85 90 95
Tyr Ser Val Ala Ser Gln Ile Ser Gly Asp His Ile Gln Glu Leu Val
100 105 110
Asp Gln His Leu Lys Glu Ser Leu Arg Lys Tyr Thr Cys Val Gly Asp
115 120 125
Lys Arg Ile Tyr Val Pro Asp Ile Ile Val Ala Leu Leu Lys Ser Lys
130 135 140
Phe Asn Ser Glu Thr Leu Gln Tyr Asp Asn Ser Glu Leu Lys Ile Leu
145 150 155 160
Ile Asp Phe Ile Arg Glu Asp Tyr Leu Lys Glu Lys Gln Ile Lys Gln
165 170 175
Ile Val His Ser Ile Glu Asn Asn Ser Thr Pro Leu Arg Ile Ala Glu
180 185 190
Ile Asn Gly Gln Lys Arg Leu Ile Pro Ala Asn Val Asp Asn Pro Lys
195 200 205
Lys Ser Tyr Ile Phe Glu Phe Leu Lys Glu Tyr Ala Gln Ser Asp Pro
210 215 220
Lys Gly Gln Glu Ser Leu Leu Gln His Met Arg Tyr Leu Ile Leu Leu
225 230 235 240
Tyr Leu Tyr Gly Pro Asp Lys Ile Thr Asp Asp Tyr Cys Glu Glu Ile
245 250 255
Glu Ala Trp Asn Phe Gly Ser Ile Val Met Asp Asn Glu Gln Leu Phe
260 265 270
Ser Glu Glu Ala Ser Met Leu Ile Gln Asp Arg Ile Tyr Val Asn Gln
275 280 285
Gln Ile Glu Glu Gly Arg Gln Ser Lys Asp Thr Ala Lys Val Lys Lys
290 295 300
Asn Lys Ser Lys Tyr Arg Met Leu Gly Asp Lys Ile Glu His Ser Ile
305 310 315 320
Asn Glu Ser Val Val Lys His Tyr Gln Glu Ala Cys Lys Ala Val Glu
325 330 335
Glu Lys Asp Ile Pro Trp Ile Lys Tyr Ile Ser Asp His Val Met Ser
340 345 350
Val Tyr Ser Ser Lys Asn Arg Val Asp Leu Asp Lys Leu Ser Leu Pro
355 360 365
Tyr Leu Ala Lys Asn Thr Trp Asn Thr Trp Ile Ser Phe Ile Ala Met
370 375 380
Lys Tyr Val Asp Met Gly Lys Gly Val Tyr His Phe Ala Met Ser Asp
385 390 395 400
Val Asp Lys Val Gly Lys Gln Asp Asn Leu Ile Ile Gly Gln Ile Asp
405 410 415
Pro Lys Phe Ser Asp Gly Ile Ser Ser Phe Asp Tyr Glu Arg Ile Lys
420 425 430
Ala Glu Asp Asp Leu His Arg Ser Met Ser Gly Tyr Ile Ala Phe Ala
435 440 445
Val Asn Asn Phe Ala Arg Ala Ile Cys Ser Asp Glu Phe Arg Lys Lys
450 455 460
Asn Arg Lys Glu Asp Val Leu Thr Val Gly Leu Asp Glu Ile Pro Leu
465 470 475 480
Tyr Asp Asn Val Lys Arg Lys Leu Leu Gln Tyr Phe Gly Gly Ala Ser
485 490 495
Asn Trp Asp Asp Ser Ile Ile Asp Ile Ile Asp Asp Lys Asp Leu Val
500 505 510
Ala Cys Ile Lys Glu Asn Leu Tyr Val Ala Arg Asn Val Asn Phe His
515 520 525
Phe Ala Gly Ser Glu Lys Val Gln Lys Lys Gln Asp Asp Ile Leu Glu
530 535 540
Glu Ile Val Arg Lys Glu Thr Arg Asp Ile Gly Lys His Tyr Arg Lys
545 550 555 560
Val Phe Tyr Ser Asn Asn Val Ala Val Phe Tyr Cys Asp Glu Asp Ile
565 570 575
Ile Lys Leu Met Asn His Leu Tyr Gln Arg Glu Lys Pro Tyr Gln Ala
580 585 590
Gln Ile Pro Ser Tyr Asn Lys Val Ile Ser Lys Thr Tyr Leu Pro Asp
595 600 605
Leu Ile Phe Met Leu Leu Lys Gly Lys Asn Arg Thr Lys Ile Ser Asp
610 615 620
Pro Ser Ile Met Asn Met Phe Arg Gly Thr Phe Tyr Phe Leu Leu Lys
625 630 635 640
Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Ala Ser Asn Leu Lys Glu Met
645 650 655
Phe Cys Glu Gly Leu Lys Asn Asn Val Lys Asn Lys Lys Ser Glu Lys
660 665 670
Pro Tyr Gln Asn Phe Met Arg Arg Phe Glu Glu Leu Glu Asn Met Gly
675 680 685
Met Asp Phe Gly Glu Ile Cys Gln Gln Ile Met Thr Asp Tyr Glu Gln
690 695 700
Gln Asn Lys Gln Lys Lys Lys Thr Ala Thr Ala Val Met Ser Glu Lys
705 710 715 720
Asp Lys Lys Ile Arg Thr Leu Asp Asn Asp Thr Gln Lys Tyr Lys His
725 730 735
Phe Arg Thr Leu Leu Tyr Ile Gly Leu Arg Glu Ala Phe Ile Ile Tyr
740 745 750
Leu Lys Asp Glu Lys Asn Lys Glu Trp Tyr Glu Phe Leu Arg Glu Pro
755 760 765
Val Lys Arg Glu Gln Pro Glu Glu Lys Glu Phe Val Asn Lys Trp Lys
770 775 780
Leu Asn Gln Tyr Ser Asp Cys Ser Glu Leu Ile Leu Lys Asp Ser Leu
785 790 795 800
Ala Ala Ala Trp Tyr Val Val Ala His Phe Ile Asn Gln Ala Gln Leu
805 810 815
Asn His Leu Ile Gly Asp Ile Lys Asn Tyr Ile Gln Phe Ile Ser Asp
820 825 830
Ile Asp Arg Arg Ala Lys Ser Thr Gly Asn Pro Val Ser Glu Ser Thr
835 840 845
Glu Ile Gln Ile Glu Arg Tyr Arg Lys Ile Leu Arg Val Leu Glu Phe
850 855 860
Ala Lys Phe Phe Cys Gly Gln Ile Thr Asn Val Leu Thr Asp Tyr Tyr
865 870 875 880
Gln Asp Glu Asn Asp Phe Ser Thr His Val Gly His Tyr Val Lys Phe
885 890 895
Glu Lys Lys Asn Met Glu Pro Ala His Ala Leu Gln Ala Phe Ser Asn
900 905 910
Ser Leu Tyr Ala Cys Gly Lys Glu Lys Lys Lys Ala Gly Phe Tyr Tyr
915 920 925
Asp Gly Met Asn Pro Ile Val Asn Arg Asn Ile Thr Leu Ala Ser Met
930 935 940
Tyr Gly Asn Lys Lys Leu Leu Glu Asn Ala Met Asn Pro Val Thr Glu
945 950 955 960
Gln Asp Ile Arg Lys Tyr Tyr Ser Leu Met Ala Glu Leu Asp Ser Val
965 970 975
Leu Lys Asn Gly Ala Val Cys Lys Ser Glu Asp Glu Gln Lys Asn Leu
980 985 990
Arg His Phe Gln Asn Leu Lys Asn Arg Ile Glu Leu Val Asp Val Leu
995 1000 1005
Thr Leu Ser Glu Leu Val Asn Asp Leu Val Ala Gln Leu Ile Gly
1010 1015 1020
Trp Val Tyr Ile Arg Glu Arg Asp Met Met Tyr Leu Gln Leu Gly
1025 1030 1035
Leu His Tyr Ile Lys Leu Tyr Phe Thr Asp Ser Val Ala Glu Asp
1040 1045 1050
Ser Tyr Leu Arg Thr Leu Asp Leu Glu Glu Gly Ser Ile Ala Asp
1055 1060 1065
Gly Ala Val Leu Tyr Gln Ile Ala Ser Leu Tyr Ser Phe Asn Leu
1070 1075 1080
Pro Met Tyr Val Lys Pro Asn Lys Ser Ser Val Tyr Cys Lys Lys
1085 1090 1095
His Val Asn Ser Val Ala Thr Lys Phe Asp Ile Phe Glu Lys Glu
1100 1105 1110
Tyr Cys Asn Gly Asp Glu Thr Val Ile Glu Asn Gly Leu Arg Leu
1115 1120 1125
Phe Glu Asn Ile Asn Leu His Lys Asp Met Val Lys Phe Arg Asp
1130 1135 1140
Tyr Leu Ala His Phe Lys Tyr Phe Ala Lys Leu Asp Glu Ser Ile
1145 1150 1155
Leu Glu Leu Tyr Ser Lys Ala Tyr Asp Phe Phe Phe Ser Tyr Asn
1160 1165 1170
Ile Lys Leu Lys Lys Ser Val Ser Tyr Val Leu Thr Asn Val Leu
1175 1180 1185
Leu Ser Tyr Phe Ile Asn Ala Lys Leu Ser Phe Ser Thr Tyr Lys
1190 1195 1200
Ser Ser Gly Asn Lys Thr Val Gln His Arg Thr Thr Lys Ile Ser
1205 1210 1215
Val Val Ala Gln Thr Asp Tyr Phe Thr Tyr Lys Leu Arg Ser Ile
1220 1225 1230
Val Lys Asn Lys Asn Gly Val Glu Ser Ile Glu Asn Asp Asp Arg
1235 1240 1245
Arg Cys Glu Val Val Asn Ile Ala Ala Arg Asp Lys Glu Phe Val
1250 1255 1260
Asp Glu Val Cys Asn Val Ile Asn Tyr Asn Ser Asp Lys
1265 1270 1275
<210> 79
<211> 1385
<212> PRT
<213> Leptotrichia sp.
<400> 79
Met Gly Asn Leu Phe Gly His Lys Arg Trp Tyr Glu Val Arg Asp Lys
1 5 10 15
Lys Asp Phe Lys Ile Lys Arg Lys Val Lys Val Lys Arg Asn Tyr Asp
20 25 30
Gly Asn Lys Tyr Ile Leu Asn Ile Asn Glu Asn Asn Asn Lys Glu Lys
35 40 45
Ile Asp Asn Asn Lys Phe Ile Gly Glu Phe Val Asn Tyr Lys Lys Asn
50 55 60
Asn Asn Val Leu Lys Glu Phe Lys Arg Lys Phe His Ala Gly Asn Ile
65 70 75 80
Leu Phe Lys Leu Lys Gly Lys Glu Glu Ile Ile Arg Ile Glu Asn Asn
85 90 95
Asp Asp Phe Leu Glu Thr Glu Glu Val Val Leu Tyr Ile Glu Val Tyr
100 105 110
Gly Lys Ser Glu Lys Leu Lys Ala Leu Glu Ile Thr Lys Lys Lys Ile
115 120 125
Ile Asp Glu Ala Ile Arg Gln Gly Ile Thr Lys Asp Asp Lys Lys Ile
130 135 140
Glu Ile Lys Arg Gln Glu Asn Glu Glu Glu Ile Glu Ile Asp Ile Arg
145 150 155 160
Asp Glu Tyr Thr Asn Lys Thr Leu Asn Asp Cys Ser Ile Ile Leu Arg
165 170 175
Ile Ile Glu Asn Asp Glu Leu Glu Thr Lys Lys Ser Ile Tyr Glu Ile
180 185 190
Phe Lys Asn Ile Asn Met Ser Leu Tyr Lys Ile Ile Glu Lys Ile Ile
195 200 205
Glu Asn Glu Thr Glu Lys Val Phe Glu Asn Arg Tyr Tyr Glu Glu His
210 215 220
Leu Arg Glu Lys Leu Leu Lys Asp Asn Lys Ile Asp Val Ile Leu Thr
225 230 235 240
Asn Phe Met Glu Ile Arg Glu Lys Ile Lys Ser Asn Leu Glu Ile Met
245 250 255
Gly Phe Val Lys Phe Tyr Leu Asn Val Ser Gly Asp Lys Lys Lys Ser
260 265 270
Glu Asn Lys Lys Met Phe Val Glu Lys Ile Leu Asn Thr Asn Val Asp
275 280 285
Leu Thr Val Glu Asp Ile Val Asp Phe Ile Val Lys Glu Leu Lys Phe
290 295 300
Trp Asn Ile Thr Lys Arg Ile Glu Lys Val Lys Lys Phe Asn Asn Glu
305 310 315 320
Phe Leu Glu Asn Arg Arg Asn Arg Thr Tyr Ile Lys Ser Tyr Val Leu
325 330 335
Leu Asp Lys His Glu Lys Phe Lys Ile Glu Arg Glu Asn Lys Lys Asp
340 345 350
Lys Ile Val Lys Phe Phe Val Glu Asn Ile Lys Asn Asn Ser Ile Lys
355 360 365
Glu Lys Ile Glu Lys Ile Leu Ala Glu Phe Lys Ile Asn Glu Leu Ile
370 375 380
Lys Lys Leu Glu Lys Glu Leu Lys Lys Gly Asn Cys Asp Thr Glu Ile
385 390 395 400
Phe Gly Ile Phe Lys Lys His Tyr Lys Val Asn Phe Asp Ser Lys Lys
405 410 415
Phe Ser Asn Lys Ser Asp Glu Glu Lys Glu Leu Tyr Lys Ile Ile Tyr
420 425 430
Arg Tyr Leu Lys Gly Arg Ile Glu Lys Ile Leu Val Asn Glu Gln Lys
435 440 445
Val Arg Leu Lys Lys Met Glu Lys Ile Glu Ile Glu Lys Ile Leu Asn
450 455 460
Glu Ser Ile Leu Ser Glu Lys Ile Leu Lys Arg Val Lys Gln Tyr Thr
465 470 475 480
Leu Glu His Ile Met Tyr Leu Gly Lys Leu Arg His Asn Asp Ile Val
485 490 495
Lys Met Thr Val Asn Thr Asp Asp Phe Ser Arg Leu His Ala Lys Glu
500 505 510
Glu Leu Asp Leu Glu Leu Ile Thr Phe Phe Ala Ser Thr Asn Met Glu
515 520 525
Leu Asn Lys Ile Phe Asn Gly Lys Glu Lys Val Thr Asp Phe Phe Gly
530 535 540
Phe Asn Leu Asn Gly Gln Lys Ile Thr Leu Lys Glu Lys Val Pro Ser
545 550 555 560
Phe Lys Leu Asn Ile Leu Lys Lys Leu Asn Phe Ile Asn Asn Glu Asn
565 570 575
Asn Ile Asp Glu Lys Leu Ser His Phe Tyr Ser Phe Gln Lys Glu Gly
580 585 590
Tyr Leu Leu Arg Asn Lys Ile Leu His Asn Ser Tyr Gly Asn Ile Gln
595 600 605
Glu Thr Lys Asn Leu Lys Gly Glu Tyr Glu Asn Val Glu Lys Leu Ile
610 615 620
Lys Glu Leu Lys Val Ser Asp Glu Glu Ile Ser Lys Ser Leu Ser Leu
625 630 635 640
Asp Val Ile Phe Glu Gly Lys Val Asp Ile Ile Asn Lys Ile Asn Ser
645 650 655
Leu Lys Ile Gly Glu Tyr Lys Asp Lys Lys Tyr Leu Pro Ser Phe Ser
660 665 670
Lys Ile Val Leu Glu Ile Thr Arg Lys Phe Arg Glu Ile Asn Lys Asp
675 680 685
Lys Leu Phe Asp Ile Glu Ser Glu Lys Ile Ile Leu Asn Ala Val Lys
690 695 700
Tyr Val Asn Lys Ile Leu Tyr Glu Lys Ile Thr Ser Asn Glu Glu Asn
705 710 715 720
Glu Phe Leu Lys Thr Leu Pro Asp Lys Leu Val Lys Lys Ser Asn Asn
725 730 735
Lys Lys Glu Asn Lys Asn Leu Leu Ser Ile Glu Glu Tyr Tyr Lys Asn
740 745 750
Ala Gln Val Ser Ser Ser Lys Gly Asp Lys Lys Ala Ile Lys Lys Tyr
755 760 765
Gln Asn Lys Val Thr Asn Ala Tyr Leu Glu Tyr Leu Glu Asn Thr Phe
770 775 780
Thr Glu Ile Ile Asp Phe Ser Lys Phe Asn Leu Asn Tyr Asp Glu Ile
785 790 795 800
Lys Thr Lys Ile Glu Glu Arg Lys Asp Asn Lys Ser Lys Ile Ile Ile
805 810 815
Asp Ser Ile Ser Thr Asn Ile Asn Ile Thr Asn Asp Ile Glu Tyr Ile
820 825 830
Ile Ser Ile Phe Ala Leu Leu Asn Ser Asn Thr Tyr Ile Asn Lys Ile
835 840 845
Arg Asn Arg Phe Phe Ala Thr Ser Val Trp Leu Glu Lys Gln Asn Gly
850 855 860
Thr Lys Glu Tyr Asp Tyr Glu Asn Ile Ile Ser Ile Leu Asp Glu Val
865 870 875 880
Leu Leu Ile Asn Leu Leu Arg Glu Asn Asn Ile Thr Asp Ile Leu Asp
885 890 895
Leu Lys Asn Ala Ile Ile Asp Ala Lys Ile Val Glu Asn Asp Glu Thr
900 905 910
Tyr Ile Lys Asn Tyr Ile Phe Glu Ser Asn Glu Glu Lys Leu Lys Lys
915 920 925
Arg Leu Phe Cys Glu Glu Leu Val Asp Lys Glu Asp Ile Arg Lys Ile
930 935 940
Phe Glu Asp Glu Asn Phe Lys Phe Lys Ser Phe Ile Lys Lys Asn Glu
945 950 955 960
Ile Gly Asn Phe Lys Ile Asn Phe Gly Ile Leu Ser Asn Leu Glu Cys
965 970 975
Asn Ser Glu Val Glu Ala Lys Lys Ile Ile Gly Lys Asn Ser Lys Lys
980 985 990
Leu Glu Ser Phe Ile Gln Asn Ile Ile Asp Glu Tyr Lys Ser Asn Ile
995 1000 1005
Arg Thr Leu Phe Ser Ser Glu Phe Leu Glu Lys Tyr Lys Glu Glu
1010 1015 1020
Ile Asp Asn Leu Val Glu Asp Thr Glu Ser Glu Asn Lys Asn Lys
1025 1030 1035
Phe Glu Lys Ile Tyr Tyr Pro Lys Glu His Lys Asn Glu Leu Tyr
1040 1045 1050
Ile Tyr Lys Lys Asn Leu Phe Leu Asn Ile Gly Asn Pro Asn Phe
1055 1060 1065
Asp Lys Ile Tyr Gly Leu Ile Ser Lys Asp Ile Lys Asn Val Asp
1070 1075 1080
Thr Lys Ile Leu Phe Asp Asp Asp Ile Lys Lys Asn Lys Ile Ser
1085 1090 1095
Glu Ile Asp Ala Ile Leu Lys Asn Leu Asn Asp Lys Leu Asn Gly
1100 1105 1110
Tyr Ser Asn Asp Tyr Lys Ala Lys Tyr Val Asn Lys Leu Lys Glu
1115 1120 1125
Asn Asp Asp Phe Phe Ala Lys Asn Ile Gln Asn Glu Asn Tyr Ser
1130 1135 1140
Ser Phe Gly Glu Phe Glu Lys Asp Tyr Asn Lys Val Ser Glu Tyr
1145 1150 1155
Lys Lys Ile Arg Asp Leu Val Glu Phe Asn Tyr Leu Asn Lys Ile
1160 1165 1170
Glu Ser Tyr Leu Ile Asp Ile Asn Trp Lys Leu Ala Ile Gln Met
1175 1180 1185
Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val Asn Gly Leu Arg
1190 1195 1200
Glu Leu Gly Ile Ile Lys Leu Ser Gly Tyr Asn Thr Gly Ile Ser
1205 1210 1215
Arg Ala Tyr Pro Lys Arg Asn Gly Ser Asp Gly Phe Tyr Thr Thr
1220 1225 1230
Thr Ala Tyr Tyr Lys Phe Phe Asp Glu Glu Ser Tyr Lys Lys Phe
1235 1240 1245
Glu Lys Ile Cys Tyr Gly Phe Gly Ile Asp Leu Ser Glu Asn Ser
1250 1255 1260
Glu Ile Asn Lys Pro Glu Asn Glu Ser Ile Arg Asn Tyr Ile Ser
1265 1270 1275
His Phe Tyr Ile Val Arg Asn Pro Phe Ala Asp Tyr Ser Ile Ala
1280 1285 1290
Glu Gln Ile Asp Arg Val Ser Asn Leu Leu Ser Tyr Ser Thr Arg
1295 1300 1305
Tyr Asn Asn Ser Thr Tyr Ala Ser Val Phe Glu Val Phe Lys Lys
1310 1315 1320
Asp Val Asn Leu Asp Tyr Asp Glu Leu Lys Lys Lys Phe Arg Leu
1325 1330 1335
Ile Gly Asn Asn Asp Ile Leu Glu Arg Leu Met Lys Pro Lys Lys
1340 1345 1350
Val Ser Val Leu Glu Leu Glu Ser Tyr Asn Ser Asp Tyr Ile Lys
1355 1360 1365
Asn Leu Ile Ile Glu Leu Leu Thr Lys Ile Glu Asn Thr Asn Asp
1370 1375 1380
Thr Leu
1385
<210> 80
<211> 1334
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 80
Met Lys Ile Ser Lys Val Asp His Thr Arg Met Ala Val Ala Lys Gly
1 5 10 15
Asn Gln His Arg Arg Asp Glu Ile Ser Gly Ile Leu Tyr Lys Asp Pro
20 25 30
Thr Lys Thr Gly Ser Ile Asp Phe Asp Glu Arg Phe Lys Lys Leu Asn
35 40 45
Cys Ser Ala Lys Ile Leu Tyr His Val Phe Asn Gly Ile Ala Glu Gly
50 55 60
Ser Asn Lys Tyr Lys Asn Ile Val Asp Lys Val Asn Asn Asn Leu Asp
65 70 75 80
Arg Val Leu Phe Thr Gly Lys Ser Tyr Asp Arg Lys Ser Ile Ile Asp
85 90 95
Ile Asp Thr Val Leu Arg Asn Val Glu Lys Ile Asn Ala Phe Asp Arg
100 105 110
Ile Ser Thr Glu Glu Arg Glu Gln Ile Ile Asp Asp Leu Leu Glu Ile
115 120 125
Gln Leu Arg Lys Gly Leu Arg Lys Gly Lys Ala Gly Leu Arg Glu Val
130 135 140
Leu Leu Ile Gly Ala Gly Val Ile Val Arg Thr Asp Lys Lys Gln Glu
145 150 155 160
Ile Ala Asp Phe Leu Glu Ile Leu Asp Glu Asp Phe Asn Lys Thr Asn
165 170 175
Gln Ala Lys Asn Ile Lys Leu Ser Ile Glu Asn Gln Gly Leu Val Val
180 185 190
Ser Pro Val Ser Arg Gly Glu Glu Arg Ile Phe Asp Val Ser Gly Ala
195 200 205
Gln Lys Gly Lys Ser Ser Lys Lys Ala Gln Glu Lys Glu Ala Leu Ser
210 215 220
Ala Phe Leu Leu Asp Tyr Ala Asp Leu Asp Lys Asn Val Arg Phe Glu
225 230 235 240
Tyr Leu Arg Lys Ile Arg Arg Leu Ile Asn Leu Tyr Phe Tyr Val Lys
245 250 255
Asn Asp Asp Val Met Ser Leu Thr Glu Ile Pro Ala Glu Val Asn Leu
260 265 270
Glu Lys Asp Phe Asp Ile Trp Arg Asp His Glu Gln Arg Lys Glu Glu
275 280 285
Asn Gly Asp Phe Val Gly Cys Pro Asp Ile Leu Leu Ala Asp Arg Asp
290 295 300
Val Lys Lys Ser Asn Ser Lys Gln Val Lys Ile Ala Glu Arg Gln Leu
305 310 315 320
Arg Glu Ser Ile Arg Glu Lys Asn Ile Lys Arg Tyr Arg Phe Ser Ile
325 330 335
Lys Thr Ile Glu Lys Asp Asp Gly Thr Tyr Phe Phe Ala Asn Lys Gln
340 345 350
Ile Ser Val Phe Trp Ile His Arg Ile Glu Asn Ala Val Glu Arg Ile
355 360 365
Leu Gly Ser Ile Asn Asp Lys Lys Leu Tyr Arg Leu Arg Leu Gly Tyr
370 375 380
Leu Gly Glu Lys Val Trp Lys Asp Ile Leu Asn Phe Leu Ser Ile Lys
385 390 395 400
Tyr Ile Ala Val Gly Lys Ala Val Phe Asn Phe Ala Met Asp Asp Leu
405 410 415
Gln Glu Lys Asp Arg Asp Ile Glu Pro Gly Lys Ile Ser Glu Asn Ala
420 425 430
Val Asn Gly Leu Thr Ser Phe Asp Tyr Glu Gln Ile Lys Ala Asp Glu
435 440 445
Met Leu Gln Arg Glu Val Ala Val Asn Val Ala Phe Ala Ala Asn Asn
450 455 460
Leu Ala Arg Val Thr Val Asp Ile Pro Gln Asn Gly Glu Lys Glu Asp
465 470 475 480
Ile Leu Leu Trp Asn Lys Ser Asp Ile Lys Lys Tyr Lys Lys Asn Ser
485 490 495
Lys Lys Gly Ile Leu Lys Ser Ile Leu Gln Phe Phe Gly Gly Ala Ser
500 505 510
Thr Trp Asn Met Lys Met Phe Glu Ile Ala Tyr His Asp Gln Pro Gly
515 520 525
Asp Tyr Glu Glu Asn Tyr Leu Tyr Asp Ile Ile Gln Ile Ile Tyr Ser
530 535 540
Leu Arg Asn Lys Ser Phe His Phe Lys Thr Tyr Asp His Gly Asp Lys
545 550 555 560
Asn Trp Asn Arg Glu Leu Ile Gly Lys Met Ile Glu His Asp Ala Glu
565 570 575
Arg Val Ile Ser Val Glu Arg Glu Lys Phe His Ser Asn Asn Leu Pro
580 585 590
Met Phe Tyr Lys Asp Ala Asp Leu Lys Lys Ile Leu Asp Leu Leu Tyr
595 600 605
Ser Asp Tyr Ala Gly Arg Ala Ser Gln Val Pro Ala Phe Asn Thr Val
610 615 620
Leu Val Arg Lys Asn Phe Pro Glu Phe Leu Arg Lys Asp Met Gly Tyr
625 630 635 640
Lys Val His Phe Asn Asn Pro Glu Val Glu Asn Gln Trp His Ser Ala
645 650 655
Val Tyr Tyr Leu Tyr Lys Glu Ile Tyr Tyr Asn Leu Phe Leu Arg Asp
660 665 670
Lys Glu Val Lys Asn Leu Phe Tyr Thr Ser Leu Lys Asn Ile Arg Ser
675 680 685
Glu Val Ser Asp Lys Lys Gln Lys Leu Ala Ser Asp Asp Phe Ala Ser
690 695 700
Arg Cys Glu Glu Ile Glu Asp Arg Ser Leu Pro Glu Ile Cys Gln Ile
705 710 715 720
Ile Met Thr Glu Tyr Asn Ala Gln Asn Phe Gly Asn Arg Lys Val Lys
725 730 735
Ser Gln Arg Val Ile Glu Lys Asn Lys Asp Ile Phe Arg His Tyr Lys
740 745 750
Met Leu Leu Ile Lys Thr Leu Ala Gly Ala Phe Ser Leu Tyr Leu Lys
755 760 765
Gln Glu Arg Phe Ala Phe Ile Gly Lys Ala Thr Pro Ile Pro Tyr Glu
770 775 780
Thr Thr Asp Val Lys Asn Phe Leu Pro Glu Trp Lys Ser Gly Met Tyr
785 790 795 800
Ala Ser Phe Val Glu Glu Ile Lys Asn Asn Leu Asp Leu Gln Glu Trp
805 810 815
Tyr Ile Val Gly Arg Phe Leu Asn Gly Arg Met Leu Asn Gln Leu Ala
820 825 830
Gly Ser Leu Arg Ser Tyr Ile Gln Tyr Ala Glu Asp Ile Glu Arg Arg
835 840 845
Ala Ala Glu Asn Arg Asn Lys Leu Phe Ser Lys Pro Asp Glu Lys Ile
850 855 860
Glu Ala Cys Lys Lys Ala Val Arg Val Leu Asp Leu Cys Ile Lys Ile
865 870 875 880
Ser Thr Arg Ile Ser Ala Glu Phe Thr Asp Tyr Phe Asp Ser Glu Asp
885 890 895
Asp Tyr Ala Asp Tyr Leu Glu Lys Tyr Leu Lys Tyr Gln Asp Asp Ala
900 905 910
Ile Lys Glu Leu Ser Gly Ser Ser Tyr Ala Ala Leu Asp His Phe Cys
915 920 925
Asn Lys Asp Asp Leu Lys Phe Asp Ile Tyr Val Asn Ala Gly Gln Lys
930 935 940
Pro Ile Leu Gln Arg Asn Ile Val Met Ala Lys Leu Phe Gly Pro Asp
945 950 955 960
Asn Ile Leu Ser Glu Val Met Glu Lys Val Thr Glu Ser Ala Ile Arg
965 970 975
Glu Tyr Tyr Asp Tyr Leu Lys Lys Val Ser Gly Tyr Arg Val Arg Gly
980 985 990
Lys Cys Ser Thr Glu Lys Glu Gln Glu Asp Leu Leu Lys Phe Gln Arg
995 1000 1005
Leu Lys Asn Ala Val Glu Phe Arg Asp Val Thr Glu Tyr Ala Glu
1010 1015 1020
Val Ile Asn Glu Leu Leu Gly Gln Leu Ile Ser Trp Ser Tyr Leu
1025 1030 1035
Arg Glu Arg Asp Leu Leu Tyr Phe Gln Leu Gly Phe His Tyr Met
1040 1045 1050
Cys Leu Lys Asn Lys Ser Phe Lys Pro Ala Glu Tyr Val Asp Ile
1055 1060 1065
Arg Arg Asn Asn Gly Thr Ile Ile His Asn Ala Ile Leu Tyr Gln
1070 1075 1080
Ile Val Ser Met Tyr Ile Asn Gly Leu Asp Phe Tyr Ser Cys Asp
1085 1090 1095
Lys Glu Gly Lys Thr Leu Lys Pro Ile Glu Thr Gly Lys Gly Val
1100 1105 1110
Gly Ser Lys Ile Gly Gln Phe Ile Lys Tyr Ser Gln Tyr Leu Tyr
1115 1120 1125
Asn Asp Pro Ser Tyr Lys Leu Glu Ile Tyr Asn Ala Gly Leu Glu
1130 1135 1140
Val Phe Glu Asn Ile Asp Glu His Asp Asn Ile Thr Asp Leu Arg
1145 1150 1155
Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Tyr Gly Asn Lys Met
1160 1165 1170
Ser Leu Leu Asp Leu Tyr Ser Glu Phe Phe Asp Arg Phe Phe Thr
1175 1180 1185
Tyr Asp Met Lys Tyr Gln Lys Asn Val Val Asn Val Leu Glu Asn
1190 1195 1200
Ile Leu Leu Arg His Phe Val Ile Phe Tyr Pro Lys Phe Gly Ser
1205 1210 1215
Gly Lys Lys Asp Val Gly Ile Arg Asp Cys Lys Lys Glu Arg Ala
1220 1225 1230
Gln Ile Glu Ile Ser Glu Gln Ser Leu Thr Ser Glu Asp Phe Met
1235 1240 1245
Phe Lys Leu Asp Asp Lys Ala Gly Glu Glu Ala Lys Lys Phe Pro
1250 1255 1260
Ala Arg Asp Glu Arg Tyr Leu Gln Thr Ile Ala Lys Leu Leu Tyr
1265 1270 1275
Tyr Pro Asn Glu Ile Glu Asp Met Asn Arg Phe Met Lys Lys Gly
1280 1285 1290
Glu Thr Ile Asn Lys Lys Val Gln Phe Asn Arg Lys Lys Lys Ile
1295 1300 1305
Thr Arg Lys Gln Lys Asn Asn Ser Ser Asn Glu Val Leu Ser Ser
1310 1315 1320
Thr Met Gly Tyr Leu Phe Lys Asn Ile Lys Leu
1325 1330
<210> 81
<211> 500
<212> PRT
<213> Chloroflexus aggregans
<400> 81
Met Thr Asp Gln Val Arg Arg Glu Glu Val Ala Ala Gly Glu Leu Ala
1 5 10 15
Asp Thr Pro Leu Ala Ala Ala Gln Thr Pro Ala Ala Asp Ala Ala Val
20 25 30
Ala Ala Thr Pro Ala Pro Ala Glu Ala Val Ala Pro Thr Pro Glu Gln
35 40 45
Ala Val Asp Gln Pro Ala Thr Thr Gly Glu Ser Glu Ala Pro Val Thr
50 55 60
Thr Ala Gln Ala Ala Ala His Glu Ala Glu Pro Ala Glu Ala Thr Gly
65 70 75 80
Ala Ser Phe Thr Pro Val Ser Glu Gln Gln Pro Gln Lys Pro Arg Arg
85 90 95
Leu Lys Asp Leu Gln Pro Gly Met Glu Leu Glu Gly Lys Val Thr Ser
100 105 110
Ile Ala Leu Tyr Gly Ile Phe Val Asp Val Gly Val Gly Arg Asp Gly
115 120 125
Leu Val His Ile Ser Glu Met Ser Asp Arg Arg Ile Asp Thr Pro Ser
130 135 140
Glu Leu Val Gln Ile Gly Asp Thr Val Lys Val Trp Val Lys Ser Val
145 150 155 160
Asp Leu Asp Ala Arg Arg Ile Ser Leu Thr Met Leu Asn Pro Ser Arg
165 170 175
Gly Glu Lys Pro Arg Arg Ser Arg Gln Ser Gln Pro Ala Gln Pro Gln
180 185 190
Pro Arg Arg Gln Glu Val Asp Arg Glu Lys Leu Ala Ser Leu Lys Val
195 200 205
Gly Glu Ile Val Glu Gly Val Ile Thr Gly Phe Ala Pro Phe Gly Ala
210 215 220
Phe Ala Asp Ile Gly Val Gly Lys Asp Gly Leu Ile His Ile Ser Glu
225 230 235 240
Leu Ser Glu Gly Arg Val Glu Lys Pro Glu Asp Ala Val Lys Val Gly
245 250 255
Glu Arg Tyr Gln Phe Lys Val Leu Glu Ile Asp Gly Glu Gly Thr Arg
260 265 270
Ile Ser Leu Ser Leu Arg Arg Ala Gln Arg Thr Gln Arg Met Gln Gln
275 280 285
Leu Glu Pro Gly Gln Ile Ile Glu Gly Thr Val Ser Gly Ile Ala Thr
290 295 300
Phe Gly Ala Phe Val Asp Ile Gly Val Gly Arg Asp Gly Leu Val His
305 310 315 320
Ile Ser Ala Leu Ala Pro His Arg Val Ala Lys Val Glu Asp Val Val
325 330 335
Lys Val Gly Asp Lys Val Lys Val Lys Val Leu Gly Val Asp Pro Gln
340 345 350
Ser Lys Arg Ile Ser Leu Thr Met Arg Leu Glu Glu Glu Gln Pro Ala
355 360 365
Thr Thr Ala Gly Asp Glu Ala Ala Glu Pro Ala Glu Glu Val Thr Pro
370 375 380
Thr Arg Arg Gly Asn Leu Glu Arg Phe Ala Ala Ala Ala Gln Thr Ala
385 390 395 400
Arg Glu Arg Ser Glu Arg Gly Glu Arg Ser Glu Arg Gly Glu Arg Arg
405 410 415
Glu Arg Arg Glu Arg Arg Pro Ala Gln Ser Ser Pro Asp Thr Tyr Ile
420 425 430
Val Gly Glu Asp Asp Asp Glu Ser Phe Glu Gly Asn Ala Thr Ile Glu
435 440 445
Asp Leu Leu Thr Lys Phe Gly Gly Ser Ser Ser Arg Arg Asp Arg Asp
450 455 460
Arg Arg Arg Arg His Glu Asp Asp Asp Asp Glu Glu Met Glu Arg Pro
465 470 475 480
Ser Asn Arg Arg Gln Arg Glu Ala Ile Arg Arg Thr Leu Gln Gln Ile
485 490 495
Gly Tyr Asp Glu
500
<210> 82
<211> 249
<212> PRT
<213> Demequina aurantiaca
<400> 82
Met Asp Leu Thr Trp His Ala Leu Leu Ile Leu Phe Ile Val Ala Leu
1 5 10 15
Leu Ala Gly Phe Leu Asp Thr Leu Ala Gly Gly Gly Gly Leu Leu Thr
20 25 30
Val Pro Ala Leu Leu Leu Thr Gly Ile Pro Pro Leu Gln Ala Leu Gly
35 40 45
Thr Asn Lys Leu Gln Ser Ser Phe Gly Thr Gly Met Ala Thr Tyr Gln
50 55 60
Val Ile Arg Lys Lys Arg Val His Trp Arg Asp Val Arg Trp Pro Met
65 70 75 80
Val Trp Ala Phe Leu Gly Ser Ala Ala Gly Ala Val Ala Val Gln Phe
85 90 95
Ile Asp Thr Asp Ala Leu Leu Ile Ile Ile Pro Val Val Leu Ala Leu
100 105 110
Val Ala Ala Tyr Phe Leu Phe Val Pro Lys Ser His Leu Pro Pro Pro
115 120 125
Glu Pro Arg Met Ser Asp Pro Ala Tyr Glu Ala Thr Leu Val Pro Ile
130 135 140
Ile Gly Ala Tyr Asp Gly Ala Phe Gly Pro Gly Thr Gly Ser Leu Tyr
145 150 155 160
Ala Leu Ser Gly Val Ala Leu Arg Ala Lys Thr Leu Val Gln Ser Thr
165 170 175
Ala Ile Ala Lys Thr Leu Asn Phe Ala Thr Asn Phe Ala Ala Leu Leu
180 185 190
Val Phe Ala Phe Ala Gly His Met Leu Trp Thr Val Gly Ala Val Met
195 200 205
Ile Ala Gly Gln Leu Ile Gly Ala Tyr Ala Gly Ser His Met Leu Phe
210 215 220
Arg Val Asn Pro Leu Val Leu Arg Val Leu Ile Val Val Met Ser Leu
225 230 235 240
Gly Met Leu Ile Arg Val Leu Leu Asp
245
<210> 83
<211> 1235
<212> PRT
<213> Thalassospira sp.
<400> 83
Met Arg Ile Ile Lys Pro Tyr Gly Arg Ser His Val Glu Gly Val Ala
1 5 10 15
Thr Gln Glu Pro Arg Arg Lys Leu Arg Leu Asn Ser Ser Pro Asp Ile
20 25 30
Ser Arg Asp Ile Pro Gly Phe Ala Gln Ser His Asp Ala Leu Ile Ile
35 40 45
Ala Gln Trp Ile Ser Ala Ile Asp Lys Ile Ala Thr Lys Pro Lys Pro
50 55 60
Asp Lys Lys Pro Thr Gln Ala Gln Ile Asn Leu Arg Thr Thr Leu Gly
65 70 75 80
Asp Ala Ala Trp Gln His Val Met Ala Glu Asn Leu Leu Pro Ala Ala
85 90 95
Thr Asp Pro Ala Ile Arg Glu Lys Leu His Leu Ile Trp Gln Ser Lys
100 105 110
Ile Ala Pro Trp Gly Thr Ala Arg Pro Gln Ala Glu Lys Asp Gly Lys
115 120 125
Pro Thr Pro Lys Gly Gly Trp Tyr Glu Arg Phe Cys Gly Val Leu Ser
130 135 140
Pro Glu Ala Ile Thr Gln Asn Val Ala Arg Gln Ile Ala Lys Asp Ile
145 150 155 160
Tyr Asp His Leu His Val Ala Ala Lys Arg Lys Gly Arg Glu Pro Ala
165 170 175
Lys Gln Gly Glu Ser Ser Asn Lys Pro Gly Lys Phe Lys Pro Asp Arg
180 185 190
Lys Arg Gly Leu Ile Glu Glu Arg Ala Glu Ser Ile Ala Lys Asn Ala
195 200 205
Leu Arg Pro Gly Ser His Ala Pro Cys Pro Trp Gly Pro Asp Asp Gln
210 215 220
Ala Thr Tyr Glu Gln Ala Gly Asp Val Ala Gly Gln Ile Tyr Ala Ala
225 230 235 240
Ala Arg Asp Cys Leu Glu Glu Lys Lys Arg Arg Ser Gly Asn Arg Asn
245 250 255
Thr Ser Ser Val Gln Tyr Leu Pro Arg Asp Leu Ala Ala Lys Ile Leu
260 265 270
Tyr Ala Gln Tyr Gly Arg Val Phe Gly Pro Asp Thr Thr Ile Lys Ala
275 280 285
Ala Leu Asp Glu Gln Pro Ser Leu Phe Ala Leu His Lys Ala Ile Lys
290 295 300
Asp Cys Tyr His Arg Leu Ile Asn Asp Ala Arg Lys Arg Asp Ile Leu
305 310 315 320
Arg Ile Leu Pro Arg Asn Met Ala Ala Leu Phe Arg Leu Val Arg Ala
325 330 335
Gln Tyr Asp Asn Arg Asp Ile Asn Ala Leu Ile Arg Leu Gly Lys Val
340 345 350
Ile His Tyr His Ala Ser Glu Gln Gly Lys Ser Glu His His Gly Ile
355 360 365
Arg Asp Tyr Trp Pro Ser Gln Gln Asp Ile Gln Asn Ser Arg Phe Trp
370 375 380
Gly Ser Asp Gly Gln Ala Asp Ile Lys Arg His Glu Ala Phe Ser Arg
385 390 395 400
Ile Trp Arg His Ile Ile Ala Leu Ala Ser Arg Thr Leu His Asp Trp
405 410 415
Ala Asp Pro His Ser Gln Lys Phe Ser Gly Glu Asn Asp Asp Ile Leu
420 425 430
Leu Leu Ala Lys Asp Ala Ile Glu Asp Asp Val Phe Lys Ala Gly His
435 440 445
Tyr Glu Arg Lys Cys Asp Val Leu Phe Gly Ala Gln Ala Ser Leu Phe
450 455 460
Cys Gly Ala Glu Asp Phe Glu Lys Ala Ile Leu Lys Gln Ala Ile Thr
465 470 475 480
Gly Thr Gly Asn Leu Arg Asn Ala Thr Phe His Phe Lys Gly Lys Val
485 490 495
Arg Phe Glu Lys Glu Leu Gln Glu Leu Thr Lys Asp Val Pro Val Glu
500 505 510
Val Gln Ser Ala Ile Ala Ala Leu Trp Gln Lys Asp Ala Glu Gly Arg
515 520 525
Thr Arg Gln Ile Ala Glu Thr Leu Gln Ala Val Leu Ala Gly His Phe
530 535 540
Leu Thr Glu Glu Gln Asn Arg His Ile Phe Ala Ala Leu Thr Ala Ala
545 550 555 560
Met Ala Gln Pro Gly Asp Val Pro Leu Pro Arg Leu Arg Arg Val Leu
565 570 575
Ala Arg His Asp Ser Ile Cys Gln Arg Gly Arg Ile Leu Pro Leu Ser
580 585 590
Pro Cys Pro Asp Arg Ala Lys Leu Glu Glu Ser Pro Ala Leu Thr Cys
595 600 605
Gln Tyr Thr Val Leu Lys Met Leu Tyr Asp Gly Pro Phe Arg Ala Trp
610 615 620
Leu Ala Gln Gln Asn Ser Thr Ile Leu Asn His Tyr Ile Asp Ser Thr
625 630 635 640
Ile Ala Arg Thr Asp Lys Ala Ala Arg Asp Met Asn Gly Arg Lys Leu
645 650 655
Ala Gln Ala Glu Lys Asp Leu Ile Thr Ser Arg Ala Ala Asp Leu Pro
660 665 670
Arg Leu Ser Val Asp Glu Lys Met Gly Asp Phe Leu Ala Arg Leu Thr
675 680 685
Ala Ala Thr Ala Thr Glu Met Arg Val Gln Arg Gly Tyr Gln Ser Asp
690 695 700
Gly Glu Asn Ala Gln Lys Gln Ala Ala Phe Ile Gly Gln Phe Glu Cys
705 710 715 720
Asp Val Ile Gly Arg Ala Phe Ala Asp Phe Leu Asn Gln Ser Gly Phe
725 730 735
Asp Phe Val Leu Lys Leu Lys Ala Asp Thr Pro Gln Pro Asp Ala Ala
740 745 750
Gln Cys Asp Val Thr Ala Leu Ile Ala Pro Asp Asp Ile Ser Val Ser
755 760 765
Pro Pro Gln Ala Trp Gln Gln Val Leu Tyr Phe Ile Leu His Leu Val
770 775 780
Pro Val Asp Asp Ala Ser His Leu Leu His Gln Ile Arg Lys Trp Gln
785 790 795 800
Val Leu Glu Gly Lys Glu Lys Pro Ala Gln Ile Ala His Asp Val Gln
805 810 815
Ser Val Leu Met Leu Tyr Leu Asp Met His Asp Ala Lys Phe Thr Gly
820 825 830
Gly Ala Ala Leu His Gly Ile Glu Lys Phe Ala Glu Phe Phe Ala His
835 840 845
Ala Ala Asp Phe Arg Ala Val Phe Pro Pro Gln Ser Leu Gln Asp Gln
850 855 860
Asp Arg Ser Ile Pro Arg Arg Gly Leu Arg Glu Ile Val Arg Phe Gly
865 870 875 880
His Leu Pro Leu Leu Gln His Met Ser Gly Thr Val Gln Ile Thr His
885 890 895
Asp Asn Val Val Ala Trp Gln Ala Ala Arg Thr Ala Gly Ala Thr Gly
900 905 910
Met Ser Pro Ile Ala Arg Arg Gln Lys Gln Arg Glu Glu Leu His Ala
915 920 925
Leu Ala Val Glu Arg Thr Ala Arg Phe Arg Asn Ala Asp Leu Gln Asn
930 935 940
Tyr Met His Ala Leu Val Asp Val Ile Lys His Arg Gln Leu Ser Ala
945 950 955 960
Gln Val Thr Leu Ser Asp Gln Val Arg Leu His Arg Leu Met Met Gly
965 970 975
Val Leu Gly Arg Leu Val Asp Tyr Ala Gly Leu Trp Glu Arg Asp Leu
980 985 990
Tyr Phe Val Val Leu Ala Leu Leu Tyr His His Gly Ala Thr Pro Asp
995 1000 1005
Asp Val Phe Lys Gly Gln Gly Lys Lys Asn Leu Ala Asp Gly Gln
1010 1015 1020
Val Val Ala Ala Leu Lys Pro Lys Asn Arg Lys Ala Ala Ala Pro
1025 1030 1035
Val Gly Val Phe Asp Asp Leu Asp His Tyr Gly Ile Tyr Gln Asp
1040 1045 1050
Asp Arg Gln Ser Ile Arg Asn Gly Leu Ser His Phe Asn Met Leu
1055 1060 1065
Arg Gly Gly Lys Ala Pro Asp Leu Ser His Trp Val Asn Gln Thr
1070 1075 1080
Arg Ser Leu Val Ala His Asp Arg Lys Leu Lys Asn Ala Val Ala
1085 1090 1095
Lys Ser Val Ile Glu Met Leu Ala Arg Glu Gly Phe Asp Leu Asp
1100 1105 1110
Trp Gly Ile Gln Thr Asp Arg Gly Gln His Ile Leu Ser His Gly
1115 1120 1125
Lys Ile Arg Thr Arg Gln Ala Gln His Phe Gln Lys Ser Arg Leu
1130 1135 1140
His Ile Val Lys Lys Ser Ala Lys Pro Asp Lys Asn Asp Thr Val
1145 1150 1155
Lys Ile Arg Glu Asn Leu His Gly Asp Ala Met Val Glu Arg Val
1160 1165 1170
Val Gln Leu Phe Ala Ala Gln Val Gln Lys Arg Tyr Asp Ile Thr
1175 1180 1185
Val Glu Lys Arg Leu Asp His Leu Phe Leu Lys Pro Gln Asp Gln
1190 1195 1200
Lys Gly Lys Asn Gly Ile His Thr His Asn Gly Trp Ser Lys Thr
1205 1210 1215
Glu Lys Lys Arg Arg Pro Ser Arg Glu Asn Arg Lys Gly Asn His
1220 1225 1230
Glu Asn
1235
<210> 84
<211> 1312
<212> PRT
<213> Pseudobutyrivibrio sp.
<400> 84
Met Lys Phe Ser Lys Glu Ser His Arg Lys Thr Ala Val Gly Val Thr
1 5 10 15
Glu Ser Asn Gly Ile Ile Gly Leu Leu Tyr Lys Asp Pro Leu Asn Glu
20 25 30
Lys Glu Lys Ile Glu Asp Val Val Asn Gln Arg Ala Asn Ser Thr Lys
35 40 45
Arg Leu Phe Asn Leu Phe Gly Thr Glu Ala Thr Ser Lys Asp Ile Ser
50 55 60
Arg Ala Ser Lys Asp Leu Ala Lys Val Val Asn Lys Ala Ile Gly Asn
65 70 75 80
Leu Lys Gly Asn Lys Lys Phe Asn Lys Lys Glu Gln Ile Thr Lys Gly
85 90 95
Leu Asn Thr Lys Ile Ile Val Glu Glu Leu Lys Asn Val Leu Lys Asp
100 105 110
Glu Lys Lys Leu Ile Val Asn Lys Asp Ile Ile Asp Glu Ala Cys Ser
115 120 125
Arg Leu Leu Lys Thr Ser Phe Arg Thr Ala Lys Thr Lys Gln Ala Val
130 135 140
Lys Met Ile Leu Thr Ala Val Leu Ile Glu Asn Thr Asn Leu Ser Lys
145 150 155 160
Glu Asp Glu Ala Phe Val His Glu Tyr Phe Val Lys Lys Leu Val Asn
165 170 175
Glu Tyr Asn Lys Thr Ser Val Lys Lys Gln Ile Pro Val Ala Leu Ser
180 185 190
Asn Gln Asn Met Val Ile Gln Pro Asn Ser Val Asn Gly Thr Leu Glu
195 200 205
Ile Ser Glu Thr Lys Lys Ser Lys Glu Thr Lys Thr Thr Glu Lys Asp
210 215 220
Ala Phe Arg Ala Phe Leu Arg Asp Tyr Ala Thr Leu Asp Glu Asn Arg
225 230 235 240
Arg His Lys Met Arg Leu Cys Leu Arg Asn Leu Val Asn Leu Tyr Phe
245 250 255
Tyr Gly Glu Thr Ser Val Ser Lys Asp Asp Phe Asp Glu Trp Arg Asp
260 265 270
His Glu Asp Lys Lys Gln Asn Asp Glu Leu Phe Val Lys Lys Ile Val
275 280 285
Ser Ile Lys Thr Asp Arg Lys Gly Asn Val Lys Glu Val Leu Asp Val
290 295 300
Asp Ala Thr Ile Asp Ala Ile Arg Thr Asn Asn Ile Ala Cys Tyr Arg
305 310 315 320
Arg Ala Leu Ala Tyr Ala Asn Glu Asn Pro Asp Val Phe Phe Ser Asp
325 330 335
Thr Met Leu Asn Lys Phe Trp Ile His His Val Glu Asn Glu Val Glu
340 345 350
Arg Ile Tyr Gly His Ile Asn Asn Asn Thr Gly Asp Tyr Lys Tyr Gln
355 360 365
Leu Gly Tyr Leu Ser Glu Lys Val Trp Lys Gly Ile Ile Asn Tyr Leu
370 375 380
Ser Ile Lys Tyr Ile Ala Glu Gly Lys Ala Val Tyr Asn Tyr Ala Met
385 390 395 400
Asn Ala Leu Ala Lys Asp Asn Asn Ser Asn Ala Phe Gly Lys Leu Asp
405 410 415
Glu Lys Phe Val Asn Gly Ile Thr Ser Phe Glu Tyr Glu Arg Ile Lys
420 425 430
Ala Glu Glu Thr Leu Gln Arg Glu Cys Ala Val Asn Ile Ala Phe Ala
435 440 445
Ala Asn His Leu Ala Asn Ala Thr Val Asp Leu Asn Glu Lys Asp Ser
450 455 460
Asp Phe Leu Leu Leu Lys His Glu Asp Asn Lys Asp Thr Leu Gly Ala
465 470 475 480
Val Ala Arg Pro Asn Ile Leu Arg Asn Ile Leu Gln Phe Phe Gly Gly
485 490 495
Lys Ser Arg Trp Asn Asp Phe Asp Phe Ser Gly Ile Asp Glu Ile Gln
500 505 510
Leu Leu Asp Asp Leu Arg Lys Met Ile Tyr Ser Leu Arg Asn Ser Ser
515 520 525
Phe His Phe Lys Thr Glu Asn Ile Asp Asn Asp Ser Trp Asn Thr Lys
530 535 540
Leu Ile Gly Asp Met Phe Ala Tyr Asp Phe Asn Met Ala Gly Asn Val
545 550 555 560
Gln Lys Asp Lys Met Tyr Ser Asn Asn Val Pro Met Phe Tyr Ser Thr
565 570 575
Ser Asp Ile Glu Lys Met Leu Asp Arg Leu Tyr Ala Glu Val His Glu
580 585 590
Arg Ala Ser Gln Val Pro Ser Phe Asn Ser Val Phe Val Arg Lys Asn
595 600 605
Phe Pro Asp Tyr Leu Lys Asn Asp Leu Lys Ile Thr Ser Ala Phe Gly
610 615 620
Val Asp Asp Ala Leu Lys Trp Gln Ser Ala Val Tyr Tyr Val Cys Lys
625 630 635 640
Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Asn Pro Glu Thr Phe Thr Met
645 650 655
Leu Lys Asp Tyr Val Gln Cys Leu Pro Ile Asp Ile Asp Lys Ser Met
660 665 670
Asp Gln Lys Leu Lys Ser Glu Arg Asn Ala His Lys Asn Phe Lys Glu
675 680 685
Ala Phe Ala Thr Tyr Cys Lys Glu Cys Asp Ser Leu Ser Ala Ile Cys
690 695 700
Gln Met Ile Met Thr Glu Tyr Asn Asn Gln Asn Lys Gly Asn Arg Lys
705 710 715 720
Val Ile Ser Ala Arg Thr Lys Asp Gly Asp Lys Leu Ile Tyr Lys His
725 730 735
Tyr Lys Met Ile Leu Phe Glu Ala Leu Lys Asn Val Phe Thr Ile Tyr
740 745 750
Leu Glu Lys Asn Ile Asn Thr Tyr Gly Phe Leu Lys Lys Pro Lys Leu
755 760 765
Ile Asn Asn Val Pro Ala Ile Glu Glu Phe Leu Pro Asn Tyr Asn Gly
770 775 780
Arg Gln Tyr Glu Thr Leu Val Asn Arg Ile Thr Glu Glu Thr Glu Leu
785 790 795 800
Gln Lys Trp Tyr Ile Val Gly Arg Leu Leu Asn Pro Lys Gln Val Asn
805 810 815
Gln Leu Ile Gly Asn Phe Arg Ser Tyr Val Gln Tyr Val Asn Asp Val
820 825 830
Ala Arg Arg Ala Lys Gln Thr Gly Asn Asn Leu Ser Asn Asp Asn Ile
835 840 845
Ala Trp Asp Val Lys Asn Ile Ile Gln Ile Phe Asp Val Cys Thr Lys
850 855 860
Leu Asn Gly Val Thr Ser Asn Ile Leu Glu Asp Tyr Phe Asp Asp Gly
865 870 875 880
Asp Asp Tyr Ala Arg Tyr Leu Lys Asn Phe Val Asp Tyr Thr Asn Lys
885 890 895
Asn Asn Asp His Ser Ala Thr Leu Leu Gly Asp Phe Cys Ala Lys Glu
900 905 910
Ile Asp Gly Ile Lys Ile Gly Ile Tyr His Asp Gly Thr Asn Pro Ile
915 920 925
Val Asn Arg Asn Ile Ile Gln Cys Lys Leu Tyr Gly Ala Thr Gly Ile
930 935 940
Ile Ser Asp Leu Thr Lys Asp Gly Ser Ile Leu Ser Val Asp Tyr Glu
945 950 955 960
Ile Ile Lys Lys Tyr Met Gln Met Gln Lys Glu Ile Lys Val Tyr Gln
965 970 975
Gln Lys Gly Ile Cys Lys Thr Lys Glu Glu Gln Gln Asn Leu Lys Lys
980 985 990
Tyr Gln Glu Leu Lys Asn Ile Val Glu Leu Arg Asn Ile Ile Asp Tyr
995 1000 1005
Ser Glu Ile Leu Asp Glu Leu Gln Gly Gln Leu Ile Asn Trp Gly
1010 1015 1020
Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln Leu Gly Phe His
1025 1030 1035
Tyr Leu Cys Leu His Asn Glu Ser Lys Lys Pro Val Gly Tyr Asn
1040 1045 1050
Asn Ala Gly Asp Ile Ser Gly Ala Val Leu Tyr Gln Ile Val Ala
1055 1060 1065
Met Tyr Thr Asn Gly Leu Ser Leu Ile Asp Ala Asn Gly Lys Ser
1070 1075 1080
Lys Lys Asn Ala Lys Ala Ser Ala Gly Ala Lys Val Gly Ser Phe
1085 1090 1095
Cys Ser Tyr Ser Lys Glu Ile Arg Gly Val Asp Lys Asp Thr Lys
1100 1105 1110
Glu Asp Asp Asp Pro Ile Tyr Leu Ala Gly Val Glu Leu Phe Glu
1115 1120 1125
Asn Ile Asn Glu His Gln Gln Cys Ile Asn Leu Arg Asn Tyr Ile
1130 1135 1140
Glu His Phe His Tyr Tyr Ala Lys His Asp Arg Ser Met Leu Asp
1145 1150 1155
Leu Tyr Ser Glu Val Phe Asp Arg Phe Phe Thr Tyr Asp Met Lys
1160 1165 1170
Tyr Thr Lys Asn Val Pro Asn Met Met Tyr Asn Ile Leu Leu Gln
1175 1180 1185
His Leu Val Val Pro Ala Phe Glu Phe Gly Ser Ser Glu Lys Arg
1190 1195 1200
Leu Asp Asp Asn Asp Glu Gln Thr Lys Pro Arg Ala Met Phe Thr
1205 1210 1215
Leu Arg Glu Lys Asn Gly Leu Ser Ser Glu Gln Phe Thr Tyr Arg
1220 1225 1230
Leu Gly Asp Gly Asn Ser Thr Val Lys Leu Ser Ala Arg Gly Asp
1235 1240 1245
Asp Tyr Leu Arg Ala Val Ala Ser Leu Leu Tyr Tyr Pro Asp Arg
1250 1255 1260
Ala Pro Glu Gly Leu Ile Arg Asp Ala Glu Ala Glu Asp Lys Phe
1265 1270 1275
Ala Lys Ile Asn His Ser Asn Pro Lys Ser Asp Asn Arg Asn Asn
1280 1285 1290
Arg Gly Asn Phe Lys Asn Pro Lys Val Gln Trp Tyr Asn Asn Lys
1295 1300 1305
Thr Lys Arg Lys
1310
<210> 85
<211> 1343
<212> PRT
<213> Butyrivibrio sp.
<400> 85
Met Lys Ile Ser Lys Val Asp His Arg Lys Thr Ala Val Lys Ile Thr
1 5 10 15
Asp Asn Lys Gly Ala Glu Gly Phe Ile Tyr Gln Asp Pro Thr Arg Asp
20 25 30
Ser Ser Thr Met Glu Gln Ile Ile Ser Asn Arg Ala Arg Ser Ser Lys
35 40 45
Val Leu Phe Asn Ile Phe Gly Asp Thr Lys Lys Ser Lys Asp Leu Asn
50 55 60
Lys Tyr Thr Glu Ser Leu Ile Ile Tyr Val Asn Lys Ala Ile Lys Ser
65 70 75 80
Leu Lys Gly Asp Lys Arg Asn Asn Lys Tyr Glu Glu Ile Thr Glu Ser
85 90 95
Leu Lys Thr Glu Arg Val Leu Asn Ala Leu Ile Gln Ala Gly Asn Glu
100 105 110
Phe Thr Cys Ser Glu Asn Asn Ile Glu Asp Ala Leu Asn Lys Tyr Leu
115 120 125
Lys Lys Ser Phe Arg Val Gly Asn Thr Lys Ser Ala Leu Lys Lys Leu
130 135 140
Leu Met Ala Ala Tyr Cys Gly Tyr Lys Leu Ser Ile Glu Glu Lys Glu
145 150 155 160
Glu Ile Gln Asn Tyr Phe Val Asp Lys Leu Val Lys Glu Tyr Asn Lys
165 170 175
Asp Thr Val Leu Lys Tyr Thr Ala Lys Ser Leu Lys His Gln Asn Met
180 185 190
Val Val Gln Pro Asp Thr Asp Asn His Val Phe Leu Pro Ser Arg Ile
195 200 205
Ala Gly Ala Thr Gln Asn Lys Met Ser Glu Lys Glu Ala Leu Thr Glu
210 215 220
Phe Leu Lys Ala Tyr Ala Val Leu Asp Glu Glu Lys Arg His Asn Leu
225 230 235 240
Arg Ile Ile Leu Arg Lys Leu Val Asn Leu Tyr Phe Tyr Glu Ser Pro
245 250 255
Asp Phe Ile Tyr Pro Glu Asn Asn Glu Trp Lys Glu His Asp Asp Arg
260 265 270
Lys Asn Lys Thr Glu Thr Phe Val Ser Pro Val Lys Val Asn Glu Glu
275 280 285
Lys Asn Gly Lys Thr Phe Val Lys Ile Asp Val Pro Ala Thr Lys Asp
290 295 300
Leu Ile Arg Leu Lys Asn Ile Glu Cys Tyr Arg Arg Ser Val Ala Glu
305 310 315 320
Thr Ala Gly Asn Pro Ile Thr Tyr Phe Thr Asp His Asn Ile Ser Lys
325 330 335
Phe Trp Ile His His Ile Glu Asn Glu Val Glu Lys Ile Phe Ala Leu
340 345 350
Leu Lys Ser Asn Trp Lys Asp Tyr Gln Phe Ser Val Gly Tyr Ile Ser
355 360 365
Glu Lys Val Trp Lys Glu Ile Ile Asn Tyr Leu Ser Ile Lys Tyr Ile
370 375 380
Ala Ile Gly Lys Ala Val Tyr Asn Tyr Ala Leu Glu Asp Ile Lys Lys
385 390 395 400
Asn Asp Gly Thr Leu Asn Phe Gly Val Ile Asp Pro Ser Phe Tyr Asp
405 410 415
Gly Ile Asn Ser Phe Glu Tyr Glu Lys Ile Lys Ala Glu Glu Thr Phe
420 425 430
Gln Arg Glu Val Ala Val Tyr Val Ser Phe Ala Val Asn His Leu Ser
435 440 445
Ser Ala Thr Val Lys Leu Ser Glu Ala Gln Ser Asp Met Leu Val Leu
450 455 460
Asn Lys Asn Asp Ile Glu Lys Ile Ala Tyr Gly Asn Thr Lys Arg Asn
465 470 475 480
Ile Leu Gln Phe Phe Gly Gly Gln Ser Lys Trp Lys Glu Phe Asp Phe
485 490 495
Asp Arg Tyr Ile Asn Pro Val Asn Tyr Thr Asp Ile Asp Phe Leu Phe
500 505 510
Asp Ile Lys Lys Met Val Tyr Ser Leu Arg Asn Glu Ser Phe His Phe
515 520 525
Thr Thr Thr Asp Thr Glu Ser Asp Trp Asn Lys Asn Leu Ile Ser Ala
530 535 540
Met Phe Glu Tyr Glu Cys Arg Arg Ile Ser Thr Val Gln Lys Asn Lys
545 550 555 560
Phe Phe Ser Asn Asn Leu Pro Leu Phe Tyr Gly Glu Asn Ser Leu Glu
565 570 575
Arg Val Leu His Lys Leu Tyr Asp Asp Tyr Val Asp Arg Met Ser Gln
580 585 590
Val Pro Ser Phe Gly Asn Val Phe Val Arg Lys Lys Phe Pro Asp Tyr
595 600 605
Met Lys Glu Ile Gly Ile Lys His Asn Leu Ser Ser Glu Asp Asn Leu
610 615 620
Lys Leu Gln Gly Ala Leu Tyr Phe Leu Tyr Lys Glu Ile Tyr Tyr Asn
625 630 635 640
Ala Phe Ile Ser Ser Glu Lys Ala Met Lys Ile Phe Val Asp Leu Val
645 650 655
Asn Lys Leu Asp Thr Asn Ala Arg Asp Asp Lys Gly Arg Ile Thr His
660 665 670
Glu Ala Met Ala His Lys Asn Phe Lys Asp Ala Ile Ser His Tyr Met
675 680 685
Thr His Asp Cys Ser Leu Ala Asp Ile Cys Gln Lys Ile Met Thr Glu
690 695 700
Tyr Asn Gln Gln Asn Thr Gly His Arg Lys Lys Gln Thr Thr Tyr Ser
705 710 715 720
Ser Glu Lys Asn Pro Glu Ile Phe Arg His Tyr Lys Met Ile Leu Phe
725 730 735
Met Leu Leu Gln Lys Ala Met Thr Glu Tyr Ile Ser Ser Glu Glu Ile
740 745 750
Phe Asp Phe Ile Met Lys Pro Asn Ser Pro Lys Thr Asp Ile Lys Glu
755 760 765
Glu Glu Phe Leu Pro Gln Tyr Lys Ser Cys Ala Tyr Asp Asn Leu Ile
770 775 780
Lys Leu Ile Ala Asp Asn Val Glu Leu Gln Lys Trp Tyr Ile Thr Ala
785 790 795 800
Arg Leu Leu Ser Pro Arg Glu Val Asn Gln Leu Ile Gly Ser Phe Arg
805 810 815
Ser Tyr Lys Gln Phe Val Ser Asp Ile Glu Arg Arg Ala Lys Glu Thr
820 825 830
Asn Asn Ser Leu Ser Lys Ser Gly Met Thr Val Asp Val Glu Asn Ile
835 840 845
Thr Lys Val Leu Asp Leu Cys Thr Lys Leu Asn Gly Arg Phe Ser Asn
850 855 860
Glu Leu Thr Asp Tyr Phe Asp Ser Lys Asp Asp Tyr Ala Val Tyr Val
865 870 875 880
Ser Lys Phe Leu Asp Phe Gly Phe Lys Ile Asp Glu Lys Phe Pro Ala
885 890 895
Ala Leu Leu Gly Glu Phe Cys Asn Lys Glu Glu Asn Gly Lys Lys Ile
900 905 910
Gly Ile Tyr His Asn Gly Thr Glu Pro Ile Leu Asn Ser Asn Ile Ile
915 920 925
Lys Ser Lys Leu Tyr Gly Ile Thr Asp Val Val Ser Arg Ala Val Lys
930 935 940
Pro Val Ser Glu Lys Leu Ile Arg Glu Tyr Leu Gln Gln Glu Val Lys
945 950 955 960
Ile Lys Pro Tyr Leu Glu Asn Gly Val Cys Lys Asn Lys Glu Glu Gln
965 970 975
Ala Ala Leu Arg Lys Tyr Gln Glu Leu Lys Asn Arg Ile Glu Phe Arg
980 985 990
Asp Ile Val Glu Tyr Ser Glu Ile Ile Asn Glu Leu Met Gly Gln Leu
995 1000 1005
Ile Asn Phe Ser Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln
1010 1015 1020
Leu Gly Phe His Tyr Leu Cys Leu Asn Asn Tyr Gly Ala Lys Pro
1025 1030 1035
Glu Gly Tyr Tyr Ser Ile Val Asn Asp Lys Arg Thr Ile Lys Gly
1040 1045 1050
Ala Ile Leu Tyr Gln Ile Val Ala Met Tyr Thr Tyr Gly Leu Pro
1055 1060 1065
Ile Tyr His Tyr Val Asp Gly Thr Ile Ser Asp Arg Arg Lys Asn
1070 1075 1080
Lys Lys Thr Val Leu Asp Thr Leu Asn Ser Ser Glu Thr Val Gly
1085 1090 1095
Ala Lys Ile Lys Tyr Phe Ile Tyr Tyr Ser Asp Glu Leu Phe Asn
1100 1105 1110
Asp Ser Leu Ile Leu Tyr Asn Ala Gly Leu Glu Leu Phe Glu Asn
1115 1120 1125
Ile Asn Glu His Glu Asn Ile Val Asn Leu Arg Lys Tyr Ile Asp
1130 1135 1140
His Phe Lys Tyr Tyr Val Ser Gln Asp Arg Ser Leu Leu Asp Ile
1145 1150 1155
Tyr Ser Glu Val Phe Asp Arg Tyr Phe Thr Tyr Asp Arg Lys Tyr
1160 1165 1170
Lys Lys Asn Val Met Asn Leu Phe Ser Asn Ile Met Leu Lys His
1175 1180 1185
Phe Ile Ile Thr Asp Phe Glu Phe Ser Thr Gly Glu Lys Thr Ile
1190 1195 1200
Gly Glu Lys Asn Thr Ala Lys Lys Glu Cys Ala Lys Val Arg Ile
1205 1210 1215
Lys Arg Gly Gly Leu Ser Ser Asp Lys Phe Thr Tyr Lys Phe Lys
1220 1225 1230
Asp Ala Lys Pro Ile Glu Leu Ser Ala Lys Asn Thr Glu Phe Leu
1235 1240 1245
Asp Gly Val Ala Arg Ile Leu Tyr Tyr Pro Glu Asn Val Val Leu
1250 1255 1260
Thr Asp Leu Val Arg Asn Ser Glu Val Glu Asp Glu Lys Arg Ile
1265 1270 1275
Glu Lys Tyr Asp Arg Asn His Asn Ser Ser Pro Thr Arg Lys Asp
1280 1285 1290
Lys Thr Tyr Lys Gln Asp Val Lys Lys Asn Tyr Asn Lys Lys Thr
1295 1300 1305
Ser Lys Ala Phe Asp Ser Ser Lys Leu Asp Thr Lys Ser Val Gly
1310 1315 1320
Asn Asn Leu Ser Asp Asn Pro Val Leu Lys Gln Phe Leu Ser Glu
1325 1330 1335
Ser Lys Lys Lys Arg
1340
<210> 86
<211> 1276
<212> PRT
<213> Blautia sp.
<400> 86
Met Lys Ile Ser Lys Val Asp His Val Lys Ser Gly Ile Asp Gln Lys
1 5 10 15
Leu Ser Ser Gln Arg Gly Met Leu Tyr Lys Gln Pro Gln Lys Lys Tyr
20 25 30
Glu Gly Lys Gln Leu Glu Glu His Val Arg Asn Leu Ser Arg Lys Ala
35 40 45
Lys Ala Leu Tyr Gln Val Phe Pro Val Ser Gly Asn Ser Lys Met Glu
50 55 60
Lys Glu Leu Gln Ile Ile Asn Ser Phe Ile Lys Asn Ile Leu Leu Arg
65 70 75 80
Leu Asp Ser Gly Lys Thr Ser Glu Glu Ile Val Gly Tyr Ile Asn Thr
85 90 95
Tyr Ser Val Ala Ser Gln Ile Ser Gly Asp His Ile Gln Glu Leu Val
100 105 110
Asp Gln His Leu Lys Glu Ser Leu Arg Lys Tyr Thr Cys Val Gly Asp
115 120 125
Lys Arg Ile Tyr Val Pro Asp Ile Ile Val Ala Leu Leu Lys Ser Lys
130 135 140
Phe Asn Ser Glu Thr Leu Gln Tyr Asp Asn Ser Glu Leu Lys Ile Leu
145 150 155 160
Ile Asp Phe Ile Arg Glu Asp Tyr Leu Lys Glu Lys Gln Ile Lys Gln
165 170 175
Ile Val His Ser Ile Glu Asn Asn Ser Thr Pro Leu Arg Ile Ala Glu
180 185 190
Ile Asn Gly Gln Lys Arg Leu Ile Pro Ala Asn Val Asp Asn Pro Lys
195 200 205
Lys Ser Tyr Ile Phe Glu Phe Leu Lys Glu Tyr Ala Gln Ser Asp Pro
210 215 220
Lys Gly Gln Glu Ser Leu Leu Gln His Met Arg Tyr Leu Ile Leu Leu
225 230 235 240
Tyr Leu Tyr Gly Pro Asp Lys Ile Thr Asp Asp Tyr Cys Glu Glu Ile
245 250 255
Glu Ala Trp Asn Phe Gly Ser Ile Val Met Asp Asn Glu Gln Leu Phe
260 265 270
Ser Glu Glu Ala Ser Met Leu Ile Gln Asp Arg Ile Tyr Val Asn Gln
275 280 285
Gln Ile Glu Glu Gly Arg Gln Ser Lys Asp Thr Ala Lys Val Lys Lys
290 295 300
Asn Lys Ser Lys Tyr Arg Met Leu Gly Asp Lys Ile Glu His Ser Ile
305 310 315 320
Asn Glu Ser Val Val Lys His Tyr Gln Glu Ala Cys Lys Ala Val Glu
325 330 335
Glu Lys Asp Ile Pro Trp Ile Lys Tyr Ile Ser Asp His Val Met Ser
340 345 350
Val Tyr Ser Ser Lys Asn Arg Val Asp Leu Asp Lys Leu Ser Leu Pro
355 360 365
Tyr Leu Ala Lys Asn Thr Trp Asn Thr Trp Ile Ser Phe Ile Ala Met
370 375 380
Lys Tyr Val Asp Met Gly Lys Gly Val Tyr His Phe Ala Met Ser Asp
385 390 395 400
Val Asp Lys Val Gly Lys Gln Asp Asn Leu Ile Ile Gly Gln Ile Asp
405 410 415
Pro Lys Phe Ser Asp Gly Ile Ser Ser Phe Asp Tyr Glu Arg Ile Lys
420 425 430
Ala Glu Asp Asp Leu His Arg Ser Met Ser Gly Tyr Ile Ala Phe Ala
435 440 445
Val Asn Asn Phe Ala Arg Ala Ile Cys Ser Asp Glu Phe Arg Lys Lys
450 455 460
Asn Arg Lys Glu Asp Val Leu Thr Val Gly Leu Asp Glu Ile Pro Leu
465 470 475 480
Tyr Asp Asn Val Lys Arg Lys Leu Leu Gln Tyr Phe Gly Gly Ala Ser
485 490 495
Asn Trp Asp Asp Ser Ile Ile Asp Ile Ile Asp Asp Lys Asp Leu Val
500 505 510
Ala Cys Ile Lys Glu Asn Leu Tyr Val Ala Arg Asn Val Asn Phe His
515 520 525
Phe Ala Gly Ser Glu Lys Val Gln Lys Lys Gln Asp Asp Ile Leu Glu
530 535 540
Glu Ile Val Arg Lys Glu Thr Arg Asp Ile Gly Lys His Tyr Arg Lys
545 550 555 560
Val Phe Tyr Ser Asn Asn Val Ala Val Phe Tyr Cys Asp Glu Asp Ile
565 570 575
Ile Lys Leu Met Asn His Leu Tyr Gln Arg Glu Lys Pro Tyr Gln Ala
580 585 590
Gln Ile Pro Ser Tyr Asn Lys Val Ile Ser Lys Thr Tyr Leu Pro Asp
595 600 605
Leu Ile Phe Met Leu Leu Lys Gly Lys Asn Arg Thr Lys Ile Ser Asp
610 615 620
Pro Ser Ile Met Asn Met Phe Arg Gly Thr Phe Tyr Phe Leu Leu Lys
625 630 635 640
Glu Ile Tyr Tyr Asn Asp Phe Leu Gln Ala Ser Asn Leu Lys Glu Met
645 650 655
Phe Cys Glu Gly Leu Lys Asn Asn Val Lys Asn Lys Lys Ser Glu Lys
660 665 670
Pro Tyr Gln Asn Phe Met Arg Arg Phe Glu Glu Leu Glu Asn Met Gly
675 680 685
Met Asp Phe Gly Glu Ile Cys Gln Gln Ile Met Thr Asp Tyr Glu Gln
690 695 700
Gln Asn Lys Gln Lys Lys Lys Thr Ala Thr Ala Val Met Ser Glu Lys
705 710 715 720
Asp Lys Lys Ile Arg Thr Leu Asp Asn Asp Thr Gln Lys Tyr Lys His
725 730 735
Phe Arg Thr Leu Leu Tyr Ile Gly Leu Arg Glu Ala Phe Ile Ile Tyr
740 745 750
Leu Lys Asp Glu Lys Asn Lys Glu Trp Tyr Glu Phe Leu Arg Glu Pro
755 760 765
Val Lys Arg Glu Gln Pro Glu Glu Lys Glu Phe Val Asn Lys Trp Lys
770 775 780
Leu Asn Gln Tyr Ser Asp Cys Ser Glu Leu Ile Leu Lys Asp Ser Leu
785 790 795 800
Ala Ala Ala Trp Tyr Val Val Ala His Phe Ile Asn Gln Ala Gln Leu
805 810 815
Asn His Leu Ile Gly Asp Ile Lys Asn Tyr Ile Gln Phe Ile Ser Asp
820 825 830
Ile Asp Arg Arg Ala Lys Ser Thr Gly Asn Pro Val Ser Glu Ser Thr
835 840 845
Glu Ile Gln Ile Glu Arg Tyr Arg Lys Ile Leu Arg Val Leu Glu Phe
850 855 860
Ala Lys Phe Phe Cys Gly Gln Ile Thr Asn Val Leu Thr Asp Tyr Tyr
865 870 875 880
Gln Asp Glu Asn Asp Phe Ser Thr His Val Gly His Tyr Val Lys Phe
885 890 895
Glu Lys Lys Asn Met Glu Pro Ala His Ala Leu Gln Ala Phe Ser Asn
900 905 910
Ser Leu Tyr Ala Cys Gly Lys Glu Lys Lys Lys Ala Gly Phe Tyr Tyr
915 920 925
Asp Gly Met Asn Pro Ile Val Asn Arg Asn Ile Thr Leu Ala Ser Met
930 935 940
Tyr Gly Asn Lys Lys Leu Leu Glu Asn Ala Met Asn Pro Val Thr Glu
945 950 955 960
Gln Asp Ile Arg Lys Tyr Tyr Ser Leu Met Ala Glu Leu Asp Ser Val
965 970 975
Leu Lys Asn Gly Ala Val Cys Lys Ser Glu Asp Glu Gln Lys Asn Leu
980 985 990
Arg His Phe Gln Asn Leu Lys Asn Arg Ile Glu Leu Val Asp Val Leu
995 1000 1005
Thr Leu Ser Glu Leu Val Asn Asp Leu Val Ala Gln Leu Ile Gly
1010 1015 1020
Trp Val Tyr Ile Arg Glu Arg Asp Met Met Tyr Leu Gln Leu Gly
1025 1030 1035
Leu His Tyr Ile Lys Leu Tyr Phe Thr Asp Ser Val Ala Glu Asp
1040 1045 1050
Ser Tyr Leu Arg Thr Leu Asp Leu Glu Glu Gly Ser Ile Ala Asp
1055 1060 1065
Gly Ala Val Leu Tyr Gln Ile Ala Ser Leu Tyr Ser Phe Asn Leu
1070 1075 1080
Pro Met Tyr Val Lys Pro Asn Lys Ser Ser Val Tyr Cys Lys Lys
1085 1090 1095
His Val Asn Ser Val Ala Thr Lys Phe Asp Ile Phe Glu Lys Glu
1100 1105 1110
Tyr Cys Asn Gly Asp Glu Thr Val Ile Glu Asn Gly Leu Arg Leu
1115 1120 1125
Phe Glu Asn Ile Asn Leu His Lys Asp Met Val Lys Phe Arg Asp
1130 1135 1140
Tyr Leu Ala His Phe Lys Tyr Phe Ala Lys Leu Asp Glu Ser Ile
1145 1150 1155
Leu Glu Leu Tyr Ser Lys Ala Tyr Asp Phe Phe Phe Ser Tyr Asn
1160 1165 1170
Ile Lys Leu Lys Lys Ser Val Ser Tyr Val Leu Thr Asn Val Leu
1175 1180 1185
Leu Ser Tyr Phe Ile Asn Ala Lys Leu Ser Phe Ser Thr Tyr Lys
1190 1195 1200
Ser Ser Gly Asn Lys Thr Val Gln His Arg Thr Thr Lys Ile Ser
1205 1210 1215
Val Val Ala Gln Thr Asp Tyr Phe Thr Tyr Lys Leu Arg Ser Ile
1220 1225 1230
Val Lys Asn Lys Asn Gly Val Glu Ser Ile Glu Asn Asp Asp Arg
1235 1240 1245
Arg Cys Glu Val Val Asn Ile Ala Ala Arg Asp Lys Glu Phe Val
1250 1255 1260
Asp Glu Val Cys Asn Val Ile Asn Tyr Asn Ser Asp Lys
1265 1270 1275
<210> 87
<211> 1168
<212> PRT
<213> Leptotrichia sp.
<400> 87
Met Lys Ile Thr Lys Ile Asp Gly Ile Ser His Lys Lys Tyr Ile Lys
1 5 10 15
Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Lys Thr Asp Glu
20 25 30
Arg Leu Ser Glu Leu Leu Thr Ile Arg Leu Asp Thr Tyr Ile Lys Asn
35 40 45
Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu
50 55 60
Lys Glu Phe Phe Ser Asn Lys Val Leu Tyr Leu Lys Asp Gly Ile Leu
65 70 75 80
Tyr Leu Lys Asp Arg Arg Glu Lys Asn Gln Leu Gln Asn Lys Asn Tyr
85 90 95
Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Asn Phe
100 105 110
Leu Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Ile Asn Ser Glu Glu
115 120 125
Leu Glu Ile Phe Arg Asn Asp Phe Glu Lys Lys Leu Asp Lys Ile Asn
130 135 140
Ser Leu Lys Tyr Ser Leu Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile
145 150 155 160
Asn Glu Asn Asn Ile Lys Lys Val Glu Gly Lys Ser Lys Arg Asn Ile
165 170 175
Phe Tyr Asn Tyr Tyr Lys Asp Ser Ala Lys Arg Asn Asp Tyr Ile Asn
180 185 190
Asn Ile Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu
195 200 205
Asn Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys
210 215 220
Ile Arg Glu Cys Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu
225 230 235 240
Asn Phe Ala Thr Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Met
245 250 255
Lys Glu Leu Ile Glu Lys Val Pro Asn Val Ser Glu Leu Lys Lys Ser
260 265 270
Gln Val Phe Tyr Lys Tyr Tyr Leu Asn Lys Glu Lys Leu Asn Asp Glu
275 280 285
Asn Ile Lys Tyr Val Phe Cys His Phe Val Glu Ile Glu Met Ser Lys
290 295 300
Leu Leu Lys Asn Tyr Val Tyr Lys Lys Pro Ser Asn Ile Ser Asn Asp
305 310 315 320
Lys Val Lys Arg Ile Phe Glu Tyr Gln Ser Leu Lys Lys Leu Ile Glu
325 330 335
Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys
340 345 350
Tyr Ser Phe Tyr Leu Gln Asp Gly Glu Ile Ala Thr Ser Asp Phe Ile
355 360 365
Val Gly Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val
370 375 380
Ser Ser Thr Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn
385 390 395 400
Glu Asn Asp Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn
405 410 415
Lys Gly Glu Glu Lys Tyr Ile Ser Gly Glu Ile Asp Lys Leu Tyr Asp
420 425 430
Asn Asn Lys Gln Asn Glu Val Lys Lys Asn Leu Lys Met Phe Tyr Ser
435 440 445
Tyr Asp Phe Asn Met Asn Ser Lys Lys Glu Ile Glu Asp Phe Phe Ser
450 455 460
Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
465 470 475 480
Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Thr Phe Lys Asn Ile Val
485 490 495
Pro Ser Gln Ile Ser Lys Lys Met Phe His Asp Glu Ile Asn Glu Lys
500 505 510
Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe
515 520 525
Arg Tyr Leu Glu Lys Tyr Lys Ile Leu Asn Tyr Leu Asn Arg Thr Arg
530 535 540
Phe Glu Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys
545 550 555 560
Leu Tyr Ser Arg Ile Asp Asp Leu Lys Asn Ser Leu Gly Ile Tyr Trp
565 570 575
Lys Thr Pro Lys Thr Asn Asp Asp Asn Lys Thr Lys Glu Ile Thr Asp
580 585 590
Ala Gln Ile Tyr Leu Leu Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn
595 600 605
Tyr Phe Met Ser Asn Asn Gly Asn Phe Phe Glu Ile Thr Lys Glu Ile
610 615 620
Ile Glu Leu Asn Lys Asn Asp Lys Arg Asn Leu Lys Thr Gly Phe Tyr
625 630 635 640
Lys Leu Gln Lys Phe Glu Asn Leu Gln Glu Lys Thr Pro Lys Glu Tyr
645 650 655
Leu Ala Asn Ile Gln Ser Leu Tyr Met Ile Asn Ala Gly Asn Gln Asp
660 665 670
Glu Glu Glu Lys Asp Thr Tyr Ile Asp Phe Ile Gln Lys Ile Phe Leu
675 680 685
Lys Gly Phe Met Thr Tyr Leu Ala Asn Asn Gly Arg Leu Ser Leu Ile
690 695 700
Tyr Ile Gly Ser Asp Glu Glu Thr Asn Thr Ser Leu Ala Glu Lys Lys
705 710 715 720
Gln Glu Phe Asp Lys Phe Leu Lys Lys Tyr Glu Gln Asn Asn Asn Ile
725 730 735
Glu Ile Pro Tyr Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly
740 745 750
Lys Ile Leu Lys Tyr Thr Glu Arg Leu Asn Met Phe Tyr Leu Ile Leu
755 760 765
Lys Leu Leu Asn His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu
770 775 780
Lys Tyr Gln Ser Ala Asn Lys Glu Glu Ala Phe Ser Asp Gln Leu Glu
785 790 795 800
Leu Ile Asn Leu Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe
805 810 815
Glu Leu Glu Ala Asp Glu Ile Gly Lys Phe Leu Asp Phe Asn Gly Asn
820 825 830
Lys Val Lys Asp Asn Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile
835 840 845
Tyr Phe Asp Gly Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile
850 855 860
Lys Lys Tyr Gly Met Leu Asn Leu Leu Glu Lys Ile Ser Asp Glu Ala
865 870 875 880
Lys Tyr Lys Ile Ser Ile Glu Glu Leu Lys Asn Tyr Ser Lys Lys Lys
885 890 895
Asn Glu Ile Glu Glu Asn His Thr Thr Gln Glu Asn Leu His Arg Lys
900 905 910
Tyr Ala Arg Pro Arg Lys Asp Glu Lys Phe Thr Asp Glu Asp Tyr Lys
915 920 925
Lys Tyr Glu Lys Ala Ile Arg Asn Ile Gln Gln Tyr Thr His Leu Lys
930 935 940
Asn Lys Val Glu Phe Asn Glu Leu Asn Leu Leu Gln Ser Leu Leu Leu
945 950 955 960
Arg Ile Leu His Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp
965 970 975
Leu Arg Phe Arg Leu Lys Gly Glu Phe Pro Glu Asn Gln Tyr Ile Glu
980 985 990
Glu Ile Phe Asn Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Asn Gly
995 1000 1005
Gln Ile Val Glu Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys
1010 1015 1020
Asp Asp Thr Glu Lys Ile Ser Ile Tyr Ser Asp Lys Lys Val Lys
1025 1030 1035
Glu Leu Lys Lys Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile
1040 1045 1050
Ala His Phe Asn Tyr Ile Pro Asn Ala Glu Ile Ser Leu Leu Glu
1055 1060 1065
Met Leu Glu Asn Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu
1070 1075 1080
Lys Asn Ala Ile Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr
1085 1090 1095
Gly Phe Val Val Thr Phe Lys Ile Glu Lys Asp Lys Lys Ile Arg
1100 1105 1110
Ile Glu Ser Leu Lys Ser Glu Glu Val Val His Leu Lys Lys Leu
1115 1120 1125
Lys Leu Lys Asp Asn Asp Lys Lys Lys Glu Pro Ile Lys Thr Tyr
1130 1135 1140
Arg Asn Ser Lys Glu Leu Cys Lys Leu Val Lys Val Met Phe Glu
1145 1150 1155
Tyr Lys Met Lys Glu Lys Lys Ser Glu Asn
1160 1165
<210> 88
<211> 1138
<212> PRT
<213> Bacteroides ihuae
<400> 88
Met Arg Ile Thr Lys Val Lys Val Lys Glu Ser Ser Asp Gln Lys Asp
1 5 10 15
Lys Met Val Leu Ile His Arg Lys Val Gly Glu Gly Thr Leu Val Leu
20 25 30
Asp Glu Asn Leu Ala Asp Leu Thr Ala Pro Ile Ile Asp Lys Tyr Lys
35 40 45
Asp Lys Ser Phe Glu Leu Ser Leu Leu Lys Gln Thr Leu Val Ser Glu
50 55 60
Lys Glu Met Asn Ile Pro Lys Cys Asp Lys Cys Thr Ala Lys Glu Arg
65 70 75 80
Cys Leu Ser Cys Lys Gln Arg Glu Lys Arg Leu Lys Glu Val Arg Gly
85 90 95
Ala Ile Glu Lys Thr Ile Gly Ala Val Ile Ala Gly Arg Asp Ile Ile
100 105 110
Pro Arg Leu Asn Ile Phe Asn Glu Asp Glu Ile Cys Trp Leu Ile Lys
115 120 125
Pro Lys Leu Arg Asn Glu Phe Thr Phe Lys Asp Val Asn Lys Gln Val
130 135 140
Val Lys Leu Asn Leu Pro Lys Val Leu Val Glu Tyr Ser Lys Lys Asn
145 150 155 160
Asp Pro Thr Leu Phe Leu Ala Tyr Gln Gln Trp Ile Ala Ala Tyr Leu
165 170 175
Lys Asn Lys Lys Gly His Ile Lys Lys Ser Ile Leu Asn Asn Arg Val
180 185 190
Val Ile Asp Tyr Ser Asp Glu Ser Lys Leu Ser Lys Arg Lys Gln Ala
195 200 205
Leu Glu Leu Trp Gly Glu Glu Tyr Glu Thr Asn Gln Arg Ile Ala Leu
210 215 220
Glu Ser Tyr His Thr Ser Tyr Asn Ile Gly Glu Leu Val Thr Leu Leu
225 230 235 240
Pro Asn Pro Glu Glu Tyr Val Ser Asp Lys Gly Glu Ile Arg Pro Ala
245 250 255
Phe His Tyr Lys Leu Lys Asn Val Leu Gln Met His Gln Ser Thr Val
260 265 270
Phe Gly Thr Asn Glu Ile Leu Cys Ile Asn Pro Ile Phe Asn Glu Asn
275 280 285
Arg Ala Asn Ile Gln Leu Ser Ala Tyr Asn Leu Glu Val Val Lys Tyr
290 295 300
Phe Glu His Tyr Phe Pro Ile Lys Lys Lys Lys Lys Asn Leu Ser Leu
305 310 315 320
Asn Gln Ala Ile Tyr Tyr Leu Lys Val Glu Thr Leu Lys Glu Arg Leu
325 330 335
Ser Leu Gln Leu Glu Asn Ala Leu Arg Met Asn Leu Leu Gln Lys Gly
340 345 350
Lys Ile Lys Lys His Glu Phe Asp Lys Asn Thr Cys Ser Asn Thr Leu
355 360 365
Ser Gln Ile Lys Arg Asp Glu Phe Phe Val Leu Asn Leu Val Glu Met
370 375 380
Cys Ala Phe Ala Ala Asn Asn Ile Arg Asn Ile Val Asp Lys Glu Gln
385 390 395 400
Val Asn Glu Ile Leu Ser Lys Lys Asp Leu Cys Asn Ser Leu Ser Lys
405 410 415
Asn Thr Ile Asp Lys Glu Leu Cys Thr Lys Phe Tyr Gly Ala Asp Phe
420 425 430
Ser Gln Ile Pro Val Ala Ile Trp Ala Met Arg Gly Ser Val Gln Gln
435 440 445
Ile Arg Asn Glu Ile Val His Tyr Lys Ala Glu Ala Ile Asp Lys Ile
450 455 460
Phe Ala Leu Lys Thr Phe Glu Tyr Asp Asp Met Glu Lys Asp Tyr Ser
465 470 475 480
Asp Thr Pro Phe Lys Gln Tyr Leu Glu Leu Ser Ile Glu Lys Ile Asp
485 490 495
Ser Phe Phe Ile Glu Gln Leu Ser Ser Asn Asp Val Leu Asn Tyr Tyr
500 505 510
Cys Thr Glu Asp Val Asn Lys Leu Leu Asn Lys Cys Lys Leu Ser Leu
515 520 525
Arg Arg Thr Ser Ile Pro Phe Ala Pro Gly Phe Lys Thr Ile Tyr Glu
530 535 540
Leu Gly Cys His Leu Gln Asp Ser Ser Asn Thr Tyr Arg Ile Gly His
545 550 555 560
Tyr Leu Met Leu Ile Gly Gly Arg Val Ala Asn Ser Thr Val Thr Lys
565 570 575
Ala Ser Lys Ala Tyr Pro Ala Tyr Arg Phe Met Leu Lys Leu Ile Tyr
580 585 590
Asn His Leu Phe Leu Asn Lys Phe Leu Asp Asn His Asn Lys Arg Phe
595 600 605
Phe Met Lys Ala Val Ala Phe Val Leu Lys Asp Asn Arg Glu Asn Ala
610 615 620
Arg Asn Lys Phe Gln Tyr Ala Phe Lys Glu Ile Arg Met Met Asn Asn
625 630 635 640
Asp Glu Ser Ile Ala Ser Tyr Met Ser Tyr Ile His Ser Leu Ser Val
645 650 655
Gln Glu Gln Glu Lys Lys Gly Asp Lys Asn Asp Lys Val Arg Tyr Asn
660 665 670
Thr Glu Lys Phe Ile Glu Lys Val Phe Val Lys Gly Phe Asp Asp Phe
675 680 685
Leu Ser Trp Leu Gly Val Glu Phe Ile Leu Ser Pro Asn Gln Glu Glu
690 695 700
Arg Asp Lys Thr Val Thr Arg Glu Glu Tyr Glu Asn Leu Met Ile Lys
705 710 715 720
Asp Arg Val Glu His Ser Ile Asn Ser Asn Gln Glu Ser His Ile Ala
725 730 735
Phe Phe Thr Phe Cys Lys Leu Leu Asp Ala Asn His Leu Ser Asp Leu
740 745 750
Arg Asn Glu Trp Ile Lys Phe Arg Ser Ser Gly Asp Lys Glu Gly Phe
755 760 765
Ser Tyr Asn Phe Ala Ile Asp Ile Ile Glu Leu Cys Leu Leu Thr Val
770 775 780
Asp Arg Val Glu Gln Arg Arg Asp Gly Tyr Lys Glu Gln Thr Glu Leu
785 790 795 800
Lys Glu Tyr Leu Ser Phe Phe Ile Lys Gly Asn Glu Ser Glu Asn Thr
805 810 815
Val Trp Lys Gly Phe Tyr Phe Gln Gln Asp Asn Tyr Thr Pro Val Leu
820 825 830
Tyr Ser Pro Ile Glu Leu Ile Arg Lys Tyr Gly Thr Leu Glu Leu Leu
835 840 845
Lys Leu Ile Ile Val Asp Glu Asp Lys Ile Thr Gln Gly Glu Phe Glu
850 855 860
Glu Trp Gln Thr Leu Lys Lys Val Val Glu Asp Lys Val Thr Arg Arg
865 870 875 880
Asn Glu Leu His Gln Glu Trp Glu Asp Met Lys Asn Lys Ser Ser Phe
885 890 895
Ser Gln Glu Lys Cys Ser Ile Tyr Gln Lys Leu Cys Arg Asp Ile Asp
900 905 910
Arg Tyr Asn Trp Leu Asp Asn Lys Leu His Leu Val His Leu Arg Lys
915 920 925
Leu His Asn Leu Val Ile Gln Ile Leu Ser Arg Met Ala Arg Phe Ile
930 935 940
Ala Leu Trp Asp Arg Asp Phe Val Leu Leu Asp Ala Ser Arg Ala Asn
945 950 955 960
Asp Asp Tyr Lys Leu Leu Ser Phe Phe Asn Phe Arg Asp Phe Ile Asn
965 970 975
Ala Lys Lys Thr Lys Thr Asp Asp Glu Leu Leu Ala Glu Phe Gly Ser
980 985 990
Lys Ile Glu Lys Lys Asn Ala Pro Phe Ile Lys Ala Glu Asp Val Pro
995 1000 1005
Leu Met Val Glu Cys Ile Glu Ala Lys Arg Ser Phe Tyr Gln Lys
1010 1015 1020
Val Phe Phe Arg Asn Asn Leu Gln Val Leu Ala Asp Arg Asn Phe
1025 1030 1035
Ile Ala His Tyr Asn Tyr Ile Ser Lys Thr Ala Lys Cys Ser Leu
1040 1045 1050
Phe Glu Met Ile Ile Lys Leu Arg Thr Leu Met Tyr Tyr Asp Arg
1055 1060 1065
Lys Leu Arg Asn Ala Val Val Lys Ser Ile Ala Asn Val Phe Asp
1070 1075 1080
Gln Asn Gly Met Val Leu Gln Leu Ser Leu Asp Asp Ser His Glu
1085 1090 1095
Leu Lys Val Asp Lys Val Ile Ser Lys Arg Ile Val His Leu Lys
1100 1105 1110
Asn Asn Asn Ile Met Thr Asp Gln Val Pro Glu Glu Tyr Tyr Lys
1115 1120 1125
Ile Cys Arg Arg Leu Leu Glu Met Lys Lys
1130 1135
<210> 89
<211> 697
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Porphyromonadaceae bacterium sequence"
<400> 89
Met Glu Phe Arg Asp Ser Ile Phe Lys Ser Leu Leu Gln Lys Glu Ile
1 5 10 15
Glu Lys Ala Pro Leu Cys Phe Ala Glu Lys Leu Ile Ser Gly Gly Val
20 25 30
Phe Ser Tyr Tyr Pro Ser Glu Arg Leu Lys Glu Phe Val Gly Asn His
35 40 45
Pro Phe Ser Leu Phe Arg Lys Thr Met Pro Phe Ser Pro Gly Phe Lys
50 55 60
Arg Val Met Lys Ser Gly Gly Asn Tyr Gln Asn Ala Asn Arg Asp Gly
65 70 75 80
Arg Phe Tyr Asp Leu Asp Ile Gly Val Tyr Leu Pro Lys Asp Gly Phe
85 90 95
Gly Asp Glu Glu Trp Asn Ala Arg Tyr Phe Leu Met Lys Leu Ile Tyr
100 105 110
Asn Gln Leu Phe Leu Pro Tyr Phe Ala Asp Ala Glu Asn His Leu Phe
115 120 125
Arg Glu Cys Val Asp Phe Val Lys Arg Val Asn Arg Asp Tyr Asn Cys
130 135 140
Lys Asn Asn Asn Ser Glu Glu Gln Ala Phe Ile Asp Ile Arg Ser Met
145 150 155 160
Arg Glu Asp Glu Ser Ile Ala Asp Tyr Leu Ala Phe Ile Gln Ser Asn
165 170 175
Ile Ile Ile Glu Glu Asn Lys Lys Lys Glu Thr Asn Lys Glu Gly Gln
180 185 190
Ile Asn Phe Asn Lys Phe Leu Leu Gln Val Phe Val Lys Gly Phe Asp
195 200 205
Ser Phe Leu Lys Asp Arg Thr Glu Leu Asn Phe Leu Gln Leu Pro Glu
210 215 220
Leu Gln Gly Asp Gly Thr Arg Gly Asp Asp Leu Glu Ser Leu Asp Lys
225 230 235 240
Leu Gly Ala Val Val Ala Val Asp Leu Lys Leu Asp Ala Thr Gly Ile
245 250 255
Asp Ala Asp Leu Asn Glu Asn Ile Ser Phe Tyr Thr Phe Cys Lys Leu
260 265 270
Leu Asp Ser Asn His Leu Ser Arg Leu Arg Asn Glu Ile Ile Lys Tyr
275 280 285
Gln Ser Ala Asn Ser Asp Phe Ser His Asn Glu Asp Phe Asp Tyr Asp
290 295 300
Arg Ile Ile Ser Ile Ile Glu Leu Cys Met Leu Ser Ala Asp His Val
305 310 315 320
Ser Thr Asn Asp Asn Glu Ser Ile Phe Pro Asn Asn Asp Lys Asp Phe
325 330 335
Ser Gly Ile Arg Pro Tyr Leu Ser Thr Asp Ala Lys Val Glu Thr Phe
340 345 350
Glu Asp Leu Tyr Val His Ser Asp Ala Lys Thr Pro Ile Thr Asn Ala
355 360 365
Thr Met Val Leu Asn Trp Lys Tyr Gly Thr Asp Lys Leu Phe Glu Arg
370 375 380
Leu Met Ile Ser Asp Gln Asp Phe Leu Val Thr Glu Lys Asp Tyr Phe
385 390 395 400
Val Trp Lys Glu Leu Lys Lys Asp Ile Glu Glu Lys Ile Lys Leu Arg
405 410 415
Glu Glu Leu His Ser Leu Trp Val Asn Thr Pro Lys Gly Lys Lys Gly
420 425 430
Ala Lys Lys Lys Asn Gly Arg Glu Thr Thr Gly Glu Phe Ser Glu Glu
435 440 445
Asn Lys Lys Glu Tyr Leu Glu Val Cys Arg Glu Ile Asp Arg Tyr Val
450 455 460
Asn Leu Asp Asn Lys Leu His Phe Val His Leu Lys Arg Met His Ser
465 470 475 480
Leu Leu Ile Glu Leu Leu Gly Arg Phe Val Gly Phe Thr Tyr Leu Phe
485 490 495
Glu Arg Asp Tyr Gln Tyr Tyr His Leu Glu Ile Arg Ser Arg Arg Asn
500 505 510
Lys Asp Ala Gly Val Val Asp Lys Leu Glu Tyr Asn Lys Ile Lys Asp
515 520 525
Gln Asn Lys Tyr Asp Lys Asp Asp Phe Phe Ala Cys Thr Phe Leu Tyr
530 535 540
Glu Lys Ala Asn Lys Val Arg Asn Phe Ile Ala His Phe Asn Tyr Leu
545 550 555 560
Thr Met Trp Asn Ser Pro Gln Glu Glu Glu His Asn Ser Asn Leu Ser
565 570 575
Gly Ala Lys Asn Ser Ser Gly Arg Gln Asn Leu Lys Cys Ser Leu Thr
580 585 590
Glu Leu Ile Asn Glu Leu Arg Glu Val Met Ser Tyr Asp Arg Lys Leu
595 600 605
Lys Asn Ala Val Thr Lys Ala Val Ile Asp Leu Phe Asp Lys His Gly
610 615 620
Met Val Ile Lys Phe Arg Ile Val Asn Asn Asn Asn Asn Asp Asn Lys
625 630 635 640
Asn Lys His His Leu Glu Leu Asp Asp Ile Val Pro Lys Lys Ile Met
645 650 655
His Leu Arg Gly Ile Lys Leu Lys Arg Gln Asp Gly Lys Pro Ile Pro
660 665 670
Ile Gln Thr Asp Ser Val Asp Pro Leu Tyr Cys Arg Met Trp Lys Lys
675 680 685
Leu Leu Asp Leu Lys Pro Thr Pro Phe
690 695
<210> 90
<211> 204
<212> PRT
<213> Listeria riparia
<400> 90
Met His Asp Ala Trp Ala Glu Asn Pro Lys Lys Pro Gln Ser Asp Ala
1 5 10 15
Phe Leu Lys Glu Tyr Lys Ala Cys Cys Glu Ala Ile Asp Thr Tyr Asn
20 25 30
Trp His Lys Asn Lys Ala Thr Leu Val Tyr Val Asn Glu Leu His His
35 40 45
Leu Leu Ile Asp Ile Leu Gly Arg Leu Val Gly Tyr Val Ala Ile Ala
50 55 60
Asp Arg Asp Phe Gln Cys Met Ala Asn Gln Tyr Leu Lys Ser Ser Gly
65 70 75 80
His Thr Glu Arg Val Asp Ser Trp Ile Asn Thr Ile Arg Lys Asn Arg
85 90 95
Pro Asp Tyr Ile Glu Lys Leu Asp Ile Phe Met Asn Lys Ala Gly Leu
100 105 110
Phe Val Ser Glu Lys Asn Gly Arg Asn Tyr Ile Ala His Leu Asn Tyr
115 120 125
Leu Ser Pro Lys His Lys Tyr Ser Leu Leu Tyr Leu Phe Glu Lys Leu
130 135 140
Arg Glu Met Leu Lys Tyr Asp Arg Lys Leu Lys Asn Ala Val Thr Lys
145 150 155 160
Ser Leu Ile Asp Leu Leu Asp Lys His Gly Met Cys Val Val Phe Ala
165 170 175
Asn Leu Lys Asn Asn Lys His Arg Leu Val Ile Ala Ser Leu Lys Pro
180 185 190
Lys Lys Ile Glu Thr Phe Lys Trp Lys Lys Ile Lys
195 200
<210> 91
<211> 1082
<212> PRT
<213> Insolitispirillum peregrinum
<400> 91
Met Arg Ile Ile Arg Pro Tyr Gly Ser Ser Thr Val Ala Ser Pro Ser
1 5 10 15
Pro Gln Asp Ala Gln Pro Leu Arg Ser Leu Gln Arg Gln Asn Gly Thr
20 25 30
Phe Asp Val Ala Glu Phe Ser Arg Arg His Pro Glu Leu Val Leu Ala
35 40 45
Gln Trp Val Ala Met Leu Asp Lys Ile Ile Arg Lys Pro Ala Pro Gly
50 55 60
Lys Asn Ser Thr Ala Leu Pro Arg Pro Thr Ala Glu Gln Arg Arg Leu
65 70 75 80
Arg Gln Gln Val Gly Ala Ala Leu Trp Ala Glu Met Gln Arg His Thr
85 90 95
Pro Val Pro Pro Glu Leu Lys Ala Val Trp Asp Ser Lys Val His Pro
100 105 110
Tyr Ser Lys Asp Asn Ala Pro Ala Thr Ala Lys Thr Pro Ser His Arg
115 120 125
Gly Arg Trp Tyr Asp Arg Phe Gly Asp Pro Glu Thr Ser Ala Ala Thr
130 135 140
Val Ala Glu Gly Val Arg Arg His Leu Leu Asp Ser Ala Gln Pro Phe
145 150 155 160
Arg Ala Asn Gly Gly Gln Pro Lys Gly Lys Gly Val Ile Glu His Arg
165 170 175
Ala Leu Thr Ile Gln Asn Gly Thr Leu Leu His His His Gln Ser Glu
180 185 190
Lys Ala Gly Pro Leu Pro Glu Asp Trp Ser Thr Tyr Arg Ala Asp Glu
195 200 205
Leu Val Ser Thr Ile Gly Lys Asp Ala Arg Trp Ile Lys Val Ala Ala
210 215 220
Ser Leu Tyr Gln His Tyr Gly Arg Ile Phe Gly Pro Thr Thr Pro Ile
225 230 235 240
Ser Glu Ala Gln Thr Arg Pro Glu Phe Val Leu His Thr Ala Val Lys
245 250 255
Ala Tyr Tyr Arg Arg Leu Phe Lys Glu Arg Lys Leu Pro Ala Glu Arg
260 265 270
Leu Glu Arg Leu Leu Pro Arg Thr Gly Glu Ala Leu Arg His Ala Val
275 280 285
Thr Val Gln His Gly Asn Arg Ser Leu Ala Asp Ala Val Arg Ile Gly
290 295 300
Lys Ile Leu His Tyr Gly Trp Leu Gln Asn Gly Glu Pro Asp Pro Trp
305 310 315 320
Pro Asp Asp Ala Ala Leu Tyr Ser Ser Arg Tyr Trp Gly Ser Asp Gly
325 330 335
Gln Thr Asp Ile Lys His Ser Glu Ala Val Ser Arg Val Trp Arg Arg
340 345 350
Ala Leu Thr Ala Ala Gln Arg Thr Leu Thr Ser Trp Leu Tyr Pro Ala
355 360 365
Gly Thr Asp Ala Gly Asp Ile Leu Leu Ile Gly Gln Lys Pro Asp Ser
370 375 380
Ile Asp Arg Asn Arg Leu Pro Leu Leu Tyr Gly Asp Ser Thr Arg His
385 390 395 400
Trp Thr Arg Ser Pro Gly Asp Val Trp Leu Phe Leu Lys Gln Thr Leu
405 410 415
Glu Asn Leu Arg Asn Ser Ser Phe His Phe Lys Thr Leu Ser Ala Phe
420 425 430
Thr Ser His Leu Asp Gly Thr Cys Glu Ser Glu Pro Ala Glu Gln Gln
435 440 445
Ala Ala Gln Ala Leu Trp Gln Asp Asp Arg Gln Gln Asp His Gln Gln
450 455 460
Val Phe Leu Ser Leu Arg Ala Leu Asp Ala Thr Thr Tyr Leu Pro Thr
465 470 475 480
Gly Pro Leu His Arg Ile Val Asn Ala Val Gln Ser Thr Asp Ala Thr
485 490 495
Leu Pro Leu Pro Arg Phe Arg Arg Val Val Thr Arg Ala Ala Asn Thr
500 505 510
Arg Leu Lys Gly Phe Pro Val Glu Pro Val Asn Arg Arg Thr Met Glu
515 520 525
Asp Asp Pro Leu Leu Arg Cys Arg Tyr Gly Val Leu Lys Leu Leu Tyr
530 535 540
Glu Arg Gly Phe Arg Ala Trp Leu Glu Thr Arg Pro Ser Ile Ala Ser
545 550 555 560
Cys Leu Asp Gln Ser Leu Lys Arg Ser Thr Lys Ala Ala Gln Thr Ile
565 570 575
Asn Gly Lys Asn Ser Pro Gln Gly Val Glu Ile Leu Ser Arg Ala Thr
580 585 590
Lys Leu Leu Gln Ala Glu Gly Gly Gly Gly His Gly Ile His Asp Leu
595 600 605
Phe Asp Arg Leu Tyr Ala Ala Thr Ala Arg Glu Met Arg Val Gln Val
610 615 620
Gly Tyr His His Asp Ala Glu Ala Ala Arg Gln Gln Ala Glu Phe Ile
625 630 635 640
Glu Asp Leu Lys Cys Glu Val Val Ala Arg Ala Phe Cys Ala Tyr Leu
645 650 655
Lys Thr Leu Gly Ile Gln Gly Asp Thr Phe Arg Arg Gln Pro Glu Pro
660 665 670
Leu Pro Thr Trp Pro Asp Leu Pro Asp Leu Pro Ser Ser Thr Ile Gly
675 680 685
Thr Ala Gln Ala Ala Leu Tyr Ser Val Leu His Leu Met Pro Val Glu
690 695 700
Asp Val Gly Ser Leu Leu His Gln Leu Arg Arg Trp Leu Val Ala Leu
705 710 715 720
Gln Ala Arg Gly Gly Glu Asp Gly Thr Ala Ile Thr Ala Thr Ile Pro
725 730 735
Leu Leu Glu Leu Tyr Leu Asn Arg His Asp Ala Lys Phe Ser Gly Gly
740 745 750
Gly Ala Gly Thr Gly Leu Arg Trp Asp Asp Trp Gln Val Phe Phe Asp
755 760 765
Cys Gln Ala Thr Phe Asp Arg Val Phe Pro Pro Gly Pro Ala Leu Asp
770 775 780
Ser His Arg Leu Pro Leu Arg Gly Leu Arg Glu Val Leu Arg Phe Gly
785 790 795 800
Arg Val Asn Asp Leu Ala Ala Leu Ile Gly Gln Asp Lys Ile Thr Ala
805 810 815
Ala Glu Val Asp Arg Trp His Thr Ala Glu Gln Thr Ile Ala Ala Gln
820 825 830
Gln Gln Arg Arg Glu Ala Leu His Glu Gln Leu Ser Arg Lys Lys Gly
835 840 845
Thr Asp Ala Glu Val Asp Glu Tyr Arg Ala Leu Val Thr Ala Ile Ala
850 855 860
Asp His Arg His Leu Thr Ala His Val Thr Leu Ser Asn Val Val Arg
865 870 875 880
Leu His Arg Leu Met Thr Thr Val Leu Gly Arg Leu Val Asp Tyr Gly
885 890 895
Gly Leu Trp Glu Arg Asp Leu Thr Phe Val Thr Leu Tyr Glu Ala His
900 905 910
Arg Leu Gly Gly Leu Arg Asn Leu Leu Ser Glu Ser Arg Val Asn Lys
915 920 925
Phe Leu Asp Gly Gln Thr Pro Ala Ala Leu Ser Lys Lys Asn Asn Ala
930 935 940
Glu Glu Asn Gly Met Ile Ser Lys Val Leu Gly Asp Lys Ala Arg Arg
945 950 955 960
Gln Ile Arg Asn Asp Phe Ala His Phe Asn Met Leu Gln Gln Gly Lys
965 970 975
Lys Thr Ile Asn Leu Thr Asp Glu Ile Asn Asn Ala Arg Lys Leu Met
980 985 990
Ala His Asp Arg Lys Leu Lys Asn Ala Ile Thr Arg Ser Val Thr Thr
995 1000 1005
Leu Leu Gln Gln Asp Gly Leu Asp Ile Val Trp Thr Met Asp Ala
1010 1015 1020
Ser His Arg Leu Thr Asp Ala Lys Ile Asp Ser Arg Asn Ala Ile
1025 1030 1035
His Leu His Lys Thr His Asn Arg Ala Asn Ile Arg Glu Pro Leu
1040 1045 1050
His Gly Lys Ser Tyr Cys Arg Trp Val Ala Ala Leu Phe Gly Ala
1055 1060 1065
Thr Ser Thr Pro Ser Ala Thr Lys Lys Ser Asp Lys Ile Arg
1070 1075 1080
<210> 92
<211> 1224
<212> PRT
<213> Bergeyella zoohelcum
<400> 92
Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe
1 5 10 15
Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Phe Asn Ala Ala Met
20 25 30
Glu Asn Thr Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly
35 40 45
Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn
50 55 60
Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr
65 70 75 80
Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu
85 90 95
Arg Lys Glu Asn Phe Lys Lys Asn Phe Lys Gly Ile Ile Lys Ala Val
100 105 110
Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu
115 120 125
Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr
130 135 140
Val Leu Thr Val Lys Lys Lys Lys Val Lys Thr Asp Lys Thr Lys Glu
145 150 155 160
Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys
165 170 175
Lys Leu Glu Tyr Leu Arg Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg
180 185 190
Arg Asn Gln Arg Glu Arg Gly Glu Lys Glu Leu Val Ala Pro Phe Lys
195 200 205
Tyr Ser Asp Lys Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala
210 215 220
Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser
225 230 235 240
Lys Ala Lys Tyr Asn Thr Lys Ser Asp Pro Gln Gln Glu Glu Gly Asp
245 250 255
Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu
260 265 270
Phe Leu Thr Lys Gln Glu Ile His Ala Phe Lys Ser Lys Ile Ala Gly
275 280 285
Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser Glu Ala Thr Val
290 295 300
Ser His Gly Lys Asn Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe
305 310 315 320
Ser His Leu Ala Tyr Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu
325 330 335
Ile Asn Tyr Gly Glu Ala Glu Asn Ala Glu Gln Leu Ser Val Tyr Ala
340 345 350
Lys Glu Thr Leu Met Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro
355 360 365
Asp Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile
370 375 380
Glu Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr
385 390 395 400
Met Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu
405 410 415
Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln
420 425 430
Phe Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu His Asp
435 440 445
Ser Arg Pro Lys Glu Asn Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys
450 455 460
Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu
465 470 475 480
Phe Ile Lys Asn Thr Glu Thr Asn Glu Asp Arg Glu His Tyr Trp Glu
485 490 495
Ile Phe Pro Asn Pro Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val
500 505 510
Asn Asp Lys Asp Phe Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys
515 520 525
Gln Pro Val Ala Gly Lys Ile Gly Ile Lys Val Lys Leu Leu Asn Gln
530 535 540
Gln Tyr Val Ser Glu Val Asp Lys Ala Val Lys Ala His Gln Leu Lys
545 550 555 560
Gln Arg Lys Ala Ser Lys Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile
565 570 575
Val Pro Ile Asn Glu Ser Asn Pro Lys Glu Ala Ile Val Phe Gly Gly
580 585 590
Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Ile Leu Tyr
595 600 605
Glu Phe Phe Asp Lys Trp Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys
610 615 620
Gly Glu Lys Glu Leu Arg Lys Glu Ile Gly Lys Glu Leu Glu Lys Lys
625 630 635 640
Ile Val Gly Lys Ile Gln Ala Gln Ile Gln Gln Ile Ile Asp Lys Asp
645 650 655
Thr Asn Ala Lys Ile Leu Lys Pro Tyr Gln Asp Gly Asn Ser Thr Ala
660 665 670
Ile Asp Lys Glu Lys Leu Ile Lys Asp Leu Lys Gln Glu Gln Asn Ile
675 680 685
Leu Gln Lys Leu Lys Asp Glu Gln Thr Val Arg Glu Lys Glu Tyr Asn
690 695 700
Asp Phe Ile Ala Tyr Gln Asp Lys Asn Arg Glu Ile Asn Lys Val Arg
705 710 715 720
Asp Arg Asn His Lys Gln Tyr Leu Lys Asp Asn Leu Lys Arg Lys Tyr
725 730 735
Pro Glu Ala Pro Ala Arg Lys Glu Val Leu Tyr Tyr Arg Glu Lys Gly
740 745 750
Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Thr
755 760 765
Asp Phe Lys Asn Glu Trp Lys Gly Glu Gln His Ser Leu Leu Gln Lys
770 775 780
Ser Leu Ala Tyr Tyr Glu Gln Cys Lys Glu Glu Leu Lys Asn Leu Leu
785 790 795 800
Pro Glu Lys Val Phe Gln His Leu Pro Phe Lys Leu Gly Gly Tyr Phe
805 810 815
Gln Gln Lys Tyr Leu Tyr Gln Phe Tyr Thr Cys Tyr Leu Asp Lys Arg
820 825 830
Leu Glu Tyr Ile Ser Gly Leu Val Gln Gln Ala Glu Asn Phe Lys Ser
835 840 845
Glu Asn Lys Val Phe Lys Lys Val Glu Asn Glu Cys Phe Lys Phe Leu
850 855 860
Lys Lys Gln Asn Tyr Thr His Lys Glu Leu Asp Ala Arg Val Gln Ser
865 870 875 880
Ile Leu Gly Tyr Pro Ile Phe Leu Glu Arg Gly Phe Met Asp Glu Lys
885 890 895
Pro Thr Ile Ile Lys Gly Lys Thr Phe Lys Gly Asn Glu Ala Leu Phe
900 905 910
Ala Asp Trp Phe Arg Tyr Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe
915 920 925
Tyr Asp Thr Glu Asn Tyr Pro Leu Val Glu Leu Glu Lys Lys Gln Ala
930 935 940
Asp Arg Lys Arg Lys Thr Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val
945 950 955 960
Phe Thr Leu Leu Met Ala Lys His Ile Phe Lys Ser Val Phe Lys Gln
965 970 975
Asp Ser Ile Asp Gln Phe Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu
980 985 990
Glu Arg Leu Gly Asn Gln Glu Arg Ala Arg Gln Thr Gly Glu Arg Asn
995 1000 1005
Thr Asn Tyr Ile Trp Asn Lys Thr Val Asp Leu Lys Leu Cys Asp
1010 1015 1020
Gly Lys Ile Thr Val Glu Asn Val Lys Leu Lys Asn Val Gly Asp
1025 1030 1035
Phe Ile Lys Tyr Glu Tyr Asp Gln Arg Val Gln Ala Phe Leu Lys
1040 1045 1050
Tyr Glu Glu Asn Ile Glu Trp Gln Ala Phe Leu Ile Lys Glu Ser
1055 1060 1065
Lys Glu Glu Glu Asn Tyr Pro Tyr Val Val Glu Arg Glu Ile Glu
1070 1075 1080
Gln Tyr Glu Lys Val Arg Arg Glu Glu Leu Leu Lys Glu Val His
1085 1090 1095
Leu Ile Glu Glu Tyr Ile Leu Glu Lys Val Lys Asp Lys Glu Ile
1100 1105 1110
Leu Lys Lys Gly Asp Asn Gln Asn Phe Lys Tyr Tyr Ile Leu Asn
1115 1120 1125
Gly Leu Leu Lys Gln Leu Lys Asn Glu Asp Val Glu Ser Tyr Lys
1130 1135 1140
Val Phe Asn Leu Asn Thr Glu Pro Glu Asp Val Asn Ile Asn Gln
1145 1150 1155
Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln Lys Ala Phe Val Leu
1160 1165 1170
Thr Tyr Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Lys Lys
1175 1180 1185
Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr Gly Lys Ile Glu Lys
1190 1195 1200
Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu Val Phe Lys Lys Glu
1205 1210 1215
Lys Glu Ala Leu Ile Lys
1220
<210> 93
<211> 1126
<212> PRT
<213> Prevotella intermedia
<400> 93
Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Arg Tyr Glu Leu Lys
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Glu Glu Gly Glu Ile
35 40 45
Asn Arg Asp Gly Tyr Glu Thr Thr Leu Lys Asn Thr Trp Asn Glu Ile
50 55 60
Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile Lys His
65 70 75 80
Phe Pro Phe Leu Glu Ala Ala Thr Tyr Arg Leu Asn Pro Thr Asp Thr
85 90 95
Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu Ser
100 105 110
Leu Arg Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp Leu Arg
115 120 125
Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg Pro Lys
130 135 140
Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Ile Phe Asn Ala Ser
145 150 155 160
Ile Arg Leu Val Lys Glu Asp Tyr Gln Tyr Asn Lys Asp Ile Asn Pro
165 170 175
Asp Glu Asp Phe Lys His Leu Asp Arg Thr Glu Glu Glu Phe Asn Tyr
180 185 190
Tyr Phe Thr Lys Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu
195 200 205
Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met Gln
210 215 220
Gln Lys Leu Arg Gly Phe Lys Asp Asn Arg Glu Asn Lys Lys Lys Met
225 230 235 240
Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg
245 250 255
Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn
260 265 270
Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu
275 280 285
Asp Arg Glu Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr
290 295 300
Asp Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp
305 310 315 320
Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe
325 330 335
Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile
340 345 350
Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His
355 360 365
Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg
370 375 380
Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr
385 390 395 400
Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu
405 410 415
Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp
420 425 430
Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys
435 440 445
Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu
450 455 460
Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp
465 470 475 480
Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys
485 490 495
Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu
500 505 510
Ile Tyr Ala Leu Tyr Asp Thr Phe Ala Asn Gly Glu Ile Lys Ser Ile
515 520 525
Asp Glu Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His
530 535 540
Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Asp Glu His Lys Val Met
545 550 555 560
Ala Thr Glu Ala Glu Arg Lys Gln Glu Glu Met Leu Val Asp Val Gln
565 570 575
Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn
580 585 590
Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Lys Ile Ala Ser Trp
595 600 605
Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu
610 615 620
Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu
625 630 635 640
Leu Gln Arg Thr Leu Ala Phe Phe Gly Ser Glu His Glu Arg Leu Ala
645 650 655
Pro Tyr Phe Lys Gln Thr Lys Leu Ile Glu Ser Ser Asn Pro His Pro
660 665 670
Phe Leu Lys Asp Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe
675 680 685
Tyr Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys
690 695 700
Pro Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro
705 710 715 720
Lys Thr Lys Pro Lys Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn
725 730 735
Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Lys
740 745 750
His Arg Glu Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val
755 760 765
Ala Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val
770 775 780
Gln Pro Phe Tyr Asn Tyr His Phe Asn Val Gly Asn Ile Asn Lys Pro
785 790 795 800
Asp Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg
805 810 815
Lys Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu
820 825 830
Asn Pro Ser Tyr Leu Glu Phe Lys Ser Trp Asn Lys Phe Glu Arg Glu
835 840 845
Leu Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met
850 855 860
Glu Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile
865 870 875 880
Tyr Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr
885 890 895
Glu Glu Lys Asn Gly Glu Glu Lys Asn Ile Lys Glu Lys Asn Asn Ile
900 905 910
Leu Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg
915 920 925
Glu Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe
930 935 940
Phe Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly
945 950 955 960
Asn Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser
965 970 975
Phe Val Lys Thr Pro Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser
980 985 990
Lys Leu Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile
995 1000 1005
Glu Ile Ile Lys Asp Met Leu Ala Leu Glu Lys Thr Leu Ile Asp
1010 1015 1020
Lys Tyr Asn Ser Leu Asp Thr Asp Asn Phe Asn Lys Met Leu Thr
1025 1030 1035
Asp Trp Leu Glu Leu Lys Gly Glu Pro Asp Lys Ala Ser Phe Gln
1040 1045 1050
Asn Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His
1055 1060 1065
Asn Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn
1070 1075 1080
Pro Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu
1085 1090 1095
Gly Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu
1100 1105 1110
Lys Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu
1115 1120 1125
<210> 94
<211> 1127
<212> PRT
<213> Prevotella buccae
<400> 94
Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile
1 5 10 15
Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Lys Glu Lys Pro
20 25 30
Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe
35 40 45
Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn
50 55 60
Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly
65 70 75 80
Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val
85 90 95
Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala
100 105 110
Ala Tyr Glu Met Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg
115 120 125
Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val
130 135 140
Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser
145 150 155 160
His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser
165 170 175
Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val
180 185 190
Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe
195 200 205
Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile
210 215 220
Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met
225 230 235 240
Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys
245 250 255
Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg
260 265 270
Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile
275 280 285
Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met
290 295 300
Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr
305 310 315 320
Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp
325 330 335
Ile Phe Ser Asp Asp Tyr Asn Ala Glu Glu Glu Pro Phe Lys Asn Thr
340 345 350
Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe
355 360 365
Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly
370 375 380
Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu
385 390 395 400
Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp
405 410 415
Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp
420 425 430
Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala
435 440 445
Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser
450 455 460
Ala His Asn Asn Leu Phe Pro Ser Leu Gln Thr Asp Lys Thr Cys Asn
465 470 475 480
Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe
485 490 495
Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu
500 505 510
Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile
515 520 525
Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala
530 535 540
Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Arg Arg Leu Gln Asn
545 550 555 560
Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu
565 570 575
Lys Gly Arg Gln Lys Asp Met Gly Lys Glu Ala Glu Arg Lys Ile Gly
580 585 590
Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln
595 600 605
Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys
610 615 620
Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln
625 630 635 640
Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala
645 650 655
Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly
660 665 670
Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val
675 680 685
Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His
690 695 700
Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys
705 710 715 720
Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His
725 730 735
Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr
740 745 750
Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro
755 760 765
Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp
770 775 780
Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro
785 790 795 800
Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp
805 810 815
Tyr Pro Phe Asn Ile Gly Asn Arg Leu Lys Pro Lys Lys Arg Gln Phe
820 825 830
Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu
835 840 845
Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu
850 855 860
Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys
865 870 875 880
Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met
885 890 895
Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile
900 905 910
Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile
915 920 925
Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly
930 935 940
Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr
945 950 955 960
Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp
965 970 975
Arg Arg Leu Asn Gly Leu Phe Ser Phe Ala Glu Thr Thr Asp Leu Asn
980 985 990
Leu Glu Glu His Pro Ile Ser Lys Leu Ser Val Asp Leu Glu Leu Ile
995 1000 1005
Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly
1010 1015 1020
Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp
1025 1030 1035
Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn
1040 1045 1050
Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg
1055 1060 1065
Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu
1070 1075 1080
Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr
1085 1090 1095
Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val
1100 1105 1110
Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn
1115 1120 1125
<210> 95
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 95
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Val Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Phe Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asp Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Gly Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Ile Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 96
<211> 1115
<212> PRT
<213> Bacteroides pyogenes
<400> 96
Met Glu Ser Ile Lys Asn Ser Gln Lys Ser Thr Gly Lys Thr Leu Gln
1 5 10 15
Lys Asp Pro Pro Tyr Phe Gly Leu Tyr Leu Asn Met Ala Leu Leu Asn
20 25 30
Val Arg Lys Val Glu Asn His Ile Arg Lys Trp Leu Gly Asp Val Ala
35 40 45
Leu Leu Pro Glu Lys Ser Gly Phe His Ser Leu Leu Thr Thr Asp Asn
50 55 60
Leu Ser Ser Ala Lys Trp Thr Arg Phe Tyr Tyr Lys Ser Arg Lys Phe
65 70 75 80
Leu Pro Phe Leu Glu Met Phe Asp Ser Asp Lys Lys Ser Tyr Glu Asn
85 90 95
Arg Arg Glu Thr Ala Glu Cys Leu Asp Thr Ile Asp Arg Gln Lys Ile
100 105 110
Ser Ser Leu Leu Lys Glu Val Tyr Gly Lys Leu Gln Asp Ile Arg Asn
115 120 125
Ala Phe Ser His Tyr His Ile Asp Asp Gln Ser Val Lys His Thr Ala
130 135 140
Leu Ile Ile Ser Ser Glu Met His Arg Phe Ile Glu Asn Ala Tyr Ser
145 150 155 160
Phe Ala Leu Gln Lys Thr Arg Ala Arg Phe Thr Gly Val Phe Val Glu
165 170 175
Thr Asp Phe Leu Gln Ala Glu Glu Lys Gly Asp Asn Lys Lys Phe Phe
180 185 190
Ala Ile Gly Gly Asn Glu Gly Ile Lys Leu Lys Asp Asn Ala Leu Ile
195 200 205
Phe Leu Ile Cys Leu Phe Leu Asp Arg Glu Glu Ala Phe Lys Phe Leu
210 215 220
Ser Arg Ala Thr Gly Phe Lys Ser Thr Lys Glu Lys Gly Phe Leu Ala
225 230 235 240
Val Arg Glu Thr Phe Cys Ala Leu Cys Cys Arg Gln Pro His Glu Arg
245 250 255
Leu Leu Ser Val Asn Pro Arg Glu Ala Leu Leu Met Asp Met Leu Asn
260 265 270
Glu Leu Asn Arg Cys Pro Asp Ile Leu Phe Glu Met Leu Asp Glu Lys
275 280 285
Asp Gln Lys Ser Phe Leu Pro Leu Leu Gly Glu Glu Glu Gln Ala His
290 295 300
Ile Leu Glu Asn Ser Leu Asn Asp Glu Leu Cys Glu Ala Ile Asp Asp
305 310 315 320
Pro Phe Glu Met Ile Ala Ser Leu Ser Lys Arg Val Arg Tyr Lys Asn
325 330 335
Arg Phe Pro Tyr Leu Met Leu Arg Tyr Ile Glu Glu Lys Asn Leu Leu
340 345 350
Pro Phe Ile Arg Phe Arg Ile Asp Leu Gly Cys Leu Glu Leu Ala Ser
355 360 365
Tyr Pro Lys Lys Met Gly Glu Glu Asn Asn Tyr Glu Arg Ser Val Thr
370 375 380
Asp His Ala Met Ala Phe Gly Arg Leu Thr Asp Phe His Asn Glu Asp
385 390 395 400
Ala Val Leu Gln Gln Ile Thr Lys Gly Ile Thr Asp Glu Val Arg Phe
405 410 415
Ser Leu Tyr Ala Pro Arg Tyr Ala Ile Tyr Asn Asn Lys Ile Gly Phe
420 425 430
Val Arg Thr Ser Gly Ser Asp Lys Ile Ser Phe Pro Thr Leu Lys Lys
435 440 445
Lys Gly Gly Glu Gly His Cys Val Ala Tyr Thr Leu Gln Asn Thr Lys
450 455 460
Ser Phe Gly Phe Ile Ser Ile Tyr Asp Leu Arg Lys Ile Leu Leu Leu
465 470 475 480
Ser Phe Leu Asp Lys Asp Lys Ala Lys Asn Ile Val Ser Gly Leu Leu
485 490 495
Glu Gln Cys Glu Lys His Trp Lys Asp Leu Ser Glu Asn Leu Phe Asp
500 505 510
Ala Ile Arg Thr Glu Leu Gln Lys Glu Phe Pro Val Pro Leu Ile Arg
515 520 525
Tyr Thr Leu Pro Arg Ser Lys Gly Gly Lys Leu Val Ser Ser Lys Leu
530 535 540
Ala Asp Lys Gln Glu Lys Tyr Glu Ser Glu Phe Glu Arg Arg Lys Glu
545 550 555 560
Lys Leu Thr Glu Ile Leu Ser Glu Lys Asp Phe Asp Leu Ser Gln Ile
565 570 575
Pro Arg Arg Met Ile Asp Glu Trp Leu Asn Val Leu Pro Thr Ser Arg
580 585 590
Glu Lys Lys Leu Lys Gly Tyr Val Glu Thr Leu Lys Leu Asp Cys Arg
595 600 605
Glu Arg Leu Arg Val Phe Glu Lys Arg Glu Lys Gly Glu His Pro Leu
610 615 620
Pro Pro Arg Ile Gly Glu Met Ala Thr Asp Leu Ala Lys Asp Ile Ile
625 630 635 640
Arg Met Val Ile Asp Gln Gly Val Lys Gln Arg Ile Thr Ser Ala Tyr
645 650 655
Tyr Ser Glu Ile Gln Arg Cys Leu Ala Gln Tyr Ala Gly Asp Asp Asn
660 665 670
Arg Arg His Leu Asp Ser Ile Ile Arg Glu Leu Arg Leu Lys Asp Thr
675 680 685
Lys Asn Gly His Pro Phe Leu Gly Lys Val Leu Arg Pro Gly Leu Gly
690 695 700
His Thr Glu Lys Leu Tyr Gln Arg Tyr Phe Glu Glu Lys Lys Glu Trp
705 710 715 720
Leu Glu Ala Thr Phe Tyr Pro Ala Ala Ser Pro Lys Arg Val Pro Arg
725 730 735
Phe Val Asn Pro Pro Thr Gly Lys Gln Lys Glu Leu Pro Leu Ile Ile
740 745 750
Arg Asn Leu Met Lys Glu Arg Pro Glu Trp Arg Asp Trp Lys Gln Arg
755 760 765
Lys Asn Ser His Pro Ile Asp Leu Pro Ser Gln Leu Phe Glu Asn Glu
770 775 780
Ile Cys Arg Leu Leu Lys Asp Lys Ile Gly Lys Glu Pro Ser Gly Lys
785 790 795 800
Leu Lys Trp Asn Glu Met Phe Lys Leu Tyr Trp Asp Lys Glu Phe Pro
805 810 815
Asn Gly Met Gln Arg Phe Tyr Arg Cys Lys Arg Arg Val Glu Val Phe
820 825 830
Asp Lys Val Val Glu Tyr Glu Tyr Ser Glu Glu Gly Gly Asn Tyr Lys
835 840 845
Lys Tyr Tyr Glu Ala Leu Ile Asp Glu Val Val Arg Gln Lys Ile Ser
850 855 860
Ser Ser Lys Glu Lys Ser Lys Leu Gln Val Glu Asp Leu Thr Leu Ser
865 870 875 880
Val Arg Arg Val Phe Lys Arg Ala Ile Asn Glu Lys Glu Tyr Gln Leu
885 890 895
Arg Leu Leu Cys Glu Asp Asp Arg Leu Leu Phe Met Ala Val Arg Asp
900 905 910
Leu Tyr Asp Trp Lys Glu Ala Gln Leu Asp Leu Asp Lys Ile Asp Asn
915 920 925
Met Leu Gly Glu Pro Val Ser Val Ser Gln Val Ile Gln Leu Glu Gly
930 935 940
Gly Gln Pro Asp Ala Val Ile Lys Ala Glu Cys Lys Leu Lys Asp Val
945 950 955 960
Ser Lys Leu Met Arg Tyr Cys Tyr Asp Gly Arg Val Lys Gly Leu Met
965 970 975
Pro Tyr Phe Ala Asn His Glu Ala Thr Gln Glu Gln Val Glu Met Glu
980 985 990
Leu Arg His Tyr Glu Asp His Arg Arg Arg Val Phe Asn Trp Val Phe
995 1000 1005
Ala Leu Glu Lys Ser Val Leu Lys Asn Glu Lys Leu Arg Arg Phe
1010 1015 1020
Tyr Glu Glu Ser Gln Gly Gly Cys Glu His Arg Arg Cys Ile Asp
1025 1030 1035
Ala Leu Arg Lys Ala Ser Leu Val Ser Glu Glu Glu Tyr Glu Phe
1040 1045 1050
Leu Val His Ile Arg Asn Lys Ser Ala His Asn Gln Phe Pro Asp
1055 1060 1065
Leu Glu Ile Gly Lys Leu Pro Pro Asn Val Thr Ser Gly Phe Cys
1070 1075 1080
Glu Cys Ile Trp Ser Lys Tyr Lys Ala Ile Ile Cys Arg Ile Ile
1085 1090 1095
Pro Phe Ile Asp Pro Glu Arg Arg Phe Phe Gly Lys Leu Leu Glu
1100 1105 1110
Gln Lys
1115
<210> 97
<211> 953
<212> PRT
<213> Alistipes sp.
<400> 97
Met Ser Asn Glu Ile Gly Ala Phe Arg Glu His Gln Phe Ala Tyr Ala
1 5 10 15
Pro Gly Asn Glu Lys Gln Glu Glu Ala Thr Phe Ala Thr Tyr Phe Asn
20 25 30
Leu Ala Leu Ser Asn Val Glu Gly Met Met Phe Gly Glu Val Glu Ser
35 40 45
Asn Pro Asp Lys Ile Glu Lys Ser Leu Asp Thr Leu Pro Pro Ala Ile
50 55 60
Leu Arg Gln Ile Ala Ser Phe Ile Trp Leu Ser Lys Glu Asp His Pro
65 70 75 80
Asp Lys Ala Tyr Ser Thr Glu Glu Val Lys Val Ile Val Thr Asp Leu
85 90 95
Val Arg Arg Leu Cys Phe Tyr Arg Asn Tyr Phe Ser His Cys Phe Tyr
100 105 110
Leu Asp Thr Gln Tyr Phe Tyr Ser Asp Glu Leu Val Asp Thr Thr Ala
115 120 125
Ile Gly Glu Lys Leu Pro Tyr Asn Phe His His Phe Ile Thr Asn Arg
130 135 140
Leu Phe Arg Tyr Ser Leu Pro Glu Ile Thr Leu Phe Arg Trp Asn Glu
145 150 155 160
Gly Glu Arg Lys Tyr Glu Ile Leu Arg Asp Gly Leu Ile Phe Phe Cys
165 170 175
Cys Leu Phe Leu Lys Arg Gly Gln Ala Glu Arg Phe Leu Asn Glu Leu
180 185 190
Arg Phe Phe Lys Arg Thr Asp Glu Glu Gly Arg Ile Lys Arg Thr Ile
195 200 205
Phe Thr Lys Tyr Cys Thr Arg Glu Ser His Lys His Ile Gly Ile Glu
210 215 220
Glu Gln Asp Phe Leu Ile Phe Gln Asp Ile Ile Gly Asp Leu Asn Arg
225 230 235 240
Val Pro Lys Val Cys Asp Gly Val Val Asp Leu Ser Lys Glu Asn Glu
245 250 255
Arg Tyr Ile Lys Asn Arg Glu Thr Ser Asn Glu Ser Asp Glu Asn Lys
260 265 270
Ala Arg Tyr Arg Leu Leu Ile Arg Glu Lys Asp Lys Phe Pro Tyr Tyr
275 280 285
Leu Met Arg Tyr Ile Val Asp Phe Gly Val Leu Pro Cys Ile Thr Phe
290 295 300
Lys Gln Asn Asp Tyr Ser Thr Lys Glu Gly Arg Gly Gln Phe His Tyr
305 310 315 320
Gln Asp Ala Ala Val Ala Gln Glu Glu Arg Cys Tyr Asn Phe Val Val
325 330 335
Arg Asn Gly Asn Val Tyr Tyr Ser Tyr Met Pro Gln Ala Gln Asn Val
340 345 350
Val Arg Ile Ser Glu Leu Gln Gly Thr Ile Ser Val Glu Glu Leu Arg
355 360 365
Asn Met Val Tyr Ala Ser Ile Asn Gly Lys Asp Val Asn Lys Ser Val
370 375 380
Glu Gln Tyr Leu Tyr His Leu His Leu Leu Tyr Glu Lys Ile Leu Thr
385 390 395 400
Ile Ser Gly Gln Thr Ile Lys Glu Gly Arg Val Asp Val Glu Asp Tyr
405 410 415
Arg Pro Leu Leu Asp Lys Leu Leu Leu Arg Pro Ala Ser Asn Gly Glu
420 425 430
Glu Leu Arg Arg Glu Leu Arg Lys Leu Leu Pro Lys Arg Val Cys Asp
435 440 445
Leu Leu Ser Asn Arg Phe Asp Cys Ser Glu Gly Val Ser Ala Val Glu
450 455 460
Lys Arg Leu Lys Ala Ile Leu Leu Arg His Glu Gln Leu Leu Leu Ser
465 470 475 480
Gln Asn Pro Ala Leu His Ile Asp Lys Ile Lys Ser Val Ile Asp Tyr
485 490 495
Leu Tyr Leu Phe Phe Ser Asp Asp Glu Lys Phe Arg Gln Gln Pro Thr
500 505 510
Glu Lys Ala His Arg Gly Leu Lys Asp Glu Glu Phe Gln Met Tyr His
515 520 525
Tyr Leu Val Gly Asp Tyr Asp Ser His Pro Leu Ala Leu Trp Lys Glu
530 535 540
Leu Glu Ala Ser Gly Arg Leu Lys Pro Glu Met Arg Lys Leu Thr Ser
545 550 555 560
Ala Thr Ser Leu His Gly Leu Tyr Met Leu Cys Leu Lys Gly Thr Val
565 570 575
Glu Trp Cys Arg Lys Gln Leu Met Ser Ile Gly Lys Gly Thr Ala Lys
580 585 590
Val Glu Ala Ile Ala Asp Arg Val Gly Leu Lys Leu Tyr Asp Lys Leu
595 600 605
Lys Glu Tyr Thr Pro Glu Gln Leu Glu Arg Glu Val Lys Leu Val Val
610 615 620
Met His Gly Tyr Ala Ala Ala Ala Thr Pro Lys Pro Lys Ala Gln Ala
625 630 635 640
Ala Ile Pro Ser Lys Leu Thr Glu Leu Arg Phe Tyr Ser Phe Leu Gly
645 650 655
Lys Arg Glu Met Ser Phe Ala Ala Phe Ile Arg Gln Asp Lys Lys Ala
660 665 670
Gln Lys Leu Trp Leu Arg Asn Phe Tyr Thr Val Glu Asn Ile Lys Thr
675 680 685
Leu Gln Lys Arg Gln Ala Ala Ala Asp Ala Ala Cys Lys Lys Leu Tyr
690 695 700
Asn Leu Val Gly Glu Val Glu Arg Val His Thr Asn Asp Lys Val Leu
705 710 715 720
Val Leu Val Ala Gln Arg Tyr Arg Glu Arg Leu Leu Asn Val Gly Ser
725 730 735
Lys Cys Ala Val Thr Leu Asp Asn Pro Glu Arg Gln Gln Lys Leu Ala
740 745 750
Asp Val Tyr Glu Val Gln Asn Ala Trp Leu Ser Ile Arg Phe Asp Asp
755 760 765
Leu Asp Phe Thr Leu Thr His Val Asn Leu Ser Asn Leu Arg Lys Ala
770 775 780
Tyr Asn Leu Ile Pro Arg Lys His Ile Leu Ala Phe Lys Glu Tyr Leu
785 790 795 800
Asp Asn Arg Val Lys Gln Lys Leu Cys Glu Glu Cys Arg Asn Val Arg
805 810 815
Arg Lys Glu Asp Leu Cys Thr Cys Cys Ser Pro Arg Tyr Ser Asn Leu
820 825 830
Thr Ser Trp Leu Lys Glu Asn His Ser Glu Ser Ser Ile Glu Arg Glu
835 840 845
Ala Ala Thr Met Met Leu Leu Asp Val Glu Arg Lys Leu Leu Ser Phe
850 855 860
Leu Leu Asp Glu Arg Arg Lys Ala Ile Ile Glu Tyr Gly Lys Phe Ile
865 870 875 880
Pro Phe Ser Ala Leu Val Lys Glu Cys Arg Leu Ala Asp Ala Gly Leu
885 890 895
Cys Gly Ile Arg Asn Asp Val Leu His Asp Asn Val Ile Ser Tyr Ala
900 905 910
Asp Ala Ile Gly Lys Leu Ser Ala Tyr Phe Pro Lys Glu Ala Ser Glu
915 920 925
Ala Val Glu Tyr Ile Arg Arg Thr Lys Glu Val Arg Glu Gln Arg Arg
930 935 940
Glu Glu Leu Met Ala Asn Ser Ser Gln
945 950
<210> 98
<211> 1322
<212> PRT
<213> Prevotella sp.
<400> 98
Met Ser Lys Glu Cys Lys Lys Gln Arg Gln Glu Lys Lys Arg Arg Leu
1 5 10 15
Gln Lys Ala Asn Phe Ser Ile Ser Leu Thr Gly Lys His Val Phe Gly
20 25 30
Ala Tyr Phe Asn Met Ala Arg Thr Asn Phe Val Lys Thr Ile Asn Tyr
35 40 45
Ile Leu Pro Ile Ala Gly Val Arg Gly Asn Tyr Ser Glu Asn Gln Ile
50 55 60
Asn Lys Met Leu His Ala Leu Phe Leu Ile Gln Ala Gly Arg Asn Glu
65 70 75 80
Glu Leu Thr Thr Glu Gln Lys Gln Trp Glu Lys Lys Leu Arg Leu Asn
85 90 95
Pro Glu Gln Gln Thr Lys Phe Gln Lys Leu Leu Phe Lys His Phe Pro
100 105 110
Val Leu Gly Pro Met Met Ala Asp Val Ala Asp His Lys Ala Tyr Leu
115 120 125
Asn Lys Lys Lys Ser Thr Val Gln Thr Glu Asp Glu Thr Phe Ala Met
130 135 140
Leu Lys Gly Val Ser Leu Ala Asp Cys Leu Asp Ile Ile Cys Leu Met
145 150 155 160
Ala Asp Thr Leu Thr Glu Cys Arg Asn Phe Tyr Thr His Lys Asp Pro
165 170 175
Tyr Asn Lys Pro Ser Gln Leu Ala Asp Gln Tyr Leu His Gln Glu Met
180 185 190
Ile Ala Lys Lys Leu Asp Lys Val Val Val Ala Ser Arg Arg Ile Leu
195 200 205
Lys Asp Arg Glu Gly Leu Ser Val Asn Glu Val Glu Phe Leu Thr Gly
210 215 220
Ile Asp His Leu His Gln Glu Val Leu Lys Asp Glu Phe Gly Asn Ala
225 230 235 240
Lys Val Lys Asp Gly Lys Val Met Lys Thr Phe Val Glu Tyr Asp Asp
245 250 255
Phe Tyr Phe Lys Ile Ser Gly Lys Arg Leu Val Asn Gly Tyr Thr Val
260 265 270
Thr Thr Lys Asp Asp Lys Pro Val Asn Val Asn Thr Met Leu Pro Ala
275 280 285
Leu Ser Asp Phe Gly Leu Leu Tyr Phe Cys Val Leu Phe Leu Ser Lys
290 295 300
Pro Tyr Ala Lys Leu Phe Ile Asp Glu Val Arg Leu Phe Glu Tyr Ser
305 310 315 320
Pro Phe Asp Asp Lys Glu Asn Met Ile Met Ser Glu Met Leu Ser Ile
325 330 335
Tyr Arg Ile Arg Thr Pro Arg Leu His Lys Ile Asp Ser His Asp Ser
340 345 350
Lys Ala Thr Leu Ala Met Asp Ile Phe Gly Glu Leu Arg Arg Cys Pro
355 360 365
Met Glu Leu Tyr Asn Leu Leu Asp Lys Asn Ala Gly Gln Pro Phe Phe
370 375 380
His Asp Glu Val Lys His Pro Asn Ser His Thr Pro Asp Val Ser Lys
385 390 395 400
Arg Leu Arg Tyr Asp Asp Arg Phe Pro Thr Leu Ala Leu Arg Tyr Ile
405 410 415
Asp Glu Thr Glu Leu Phe Lys Arg Ile Arg Phe Gln Leu Gln Leu Gly
420 425 430
Ser Phe Arg Tyr Lys Phe Tyr Asp Lys Glu Asn Cys Ile Asp Gly Arg
435 440 445
Val Arg Val Arg Arg Ile Gln Lys Glu Ile Asn Gly Tyr Gly Arg Met
450 455 460
Gln Glu Val Ala Asp Lys Arg Met Asp Lys Trp Gly Asp Leu Ile Gln
465 470 475 480
Lys Arg Glu Glu Arg Ser Val Lys Leu Glu His Glu Glu Leu Tyr Ile
485 490 495
Asn Leu Asp Gln Phe Leu Glu Asp Thr Ala Asp Ser Thr Pro Tyr Val
500 505 510
Thr Asp Arg Arg Pro Ala Tyr Asn Ile His Ala Asn Arg Ile Gly Leu
515 520 525
Tyr Trp Glu Asp Ser Gln Asn Pro Lys Gln Tyr Lys Val Phe Asp Glu
530 535 540
Asn Gly Met Tyr Ile Pro Glu Leu Val Val Thr Glu Asp Lys Lys Ala
545 550 555 560
Pro Ile Lys Met Pro Ala Pro Arg Cys Ala Leu Ser Val Tyr Asp Leu
565 570 575
Pro Ala Met Leu Phe Tyr Glu Tyr Leu Arg Glu Gln Gln Asp Asn Glu
580 585 590
Phe Pro Ser Ala Glu Gln Val Ile Ile Glu Tyr Glu Asp Asp Tyr Arg
595 600 605
Lys Phe Phe Lys Ala Val Ala Glu Gly Lys Leu Lys Pro Phe Lys Arg
610 615 620
Pro Lys Glu Phe Arg Asp Phe Leu Lys Lys Glu Tyr Pro Lys Leu Arg
625 630 635 640
Met Ala Asp Ile Pro Lys Lys Leu Gln Leu Phe Leu Cys Ser His Gly
645 650 655
Leu Cys Tyr Asn Asn Lys Pro Glu Thr Val Tyr Glu Arg Leu Asp Arg
660 665 670
Leu Thr Leu Gln His Leu Glu Glu Arg Glu Leu His Ile Gln Asn Arg
675 680 685
Leu Glu His Tyr Gln Lys Asp Arg Asp Met Ile Gly Asn Lys Asp Asn
690 695 700
Gln Tyr Gly Lys Lys Ser Phe Ser Asp Val Arg His Gly Ala Leu Ala
705 710 715 720
Arg Tyr Leu Ala Gln Ser Met Met Glu Trp Gln Pro Thr Lys Leu Lys
725 730 735
Asp Lys Glu Lys Gly His Asp Lys Leu Thr Gly Leu Asn Tyr Asn Val
740 745 750
Leu Thr Ala Tyr Leu Ala Thr Tyr Gly His Pro Gln Val Pro Glu Glu
755 760 765
Gly Phe Thr Pro Arg Thr Leu Glu Gln Val Leu Ile Asn Ala His Leu
770 775 780
Ile Gly Gly Ser Asn Pro His Pro Phe Ile Asn Lys Val Leu Ala Leu
785 790 795 800
Gly Asn Arg Asn Ile Glu Glu Leu Tyr Leu His Tyr Leu Glu Glu Glu
805 810 815
Leu Lys His Ile Arg Ser Arg Ile Gln Ser Leu Ser Ser Asn Pro Ser
820 825 830
Asp Lys Ala Leu Ser Ala Leu Pro Phe Ile His His Asp Arg Met Arg
835 840 845
Tyr His Glu Arg Thr Ser Glu Glu Met Met Ala Leu Ala Ala Arg Tyr
850 855 860
Thr Thr Ile Gln Leu Pro Asp Gly Leu Phe Thr Pro Tyr Ile Leu Glu
865 870 875 880
Ile Leu Gln Lys His Tyr Thr Glu Asn Ser Asp Leu Gln Asn Ala Leu
885 890 895
Ser Gln Asp Val Pro Val Lys Leu Asn Pro Thr Cys Asn Ala Ala Tyr
900 905 910
Leu Ile Thr Leu Phe Tyr Gln Thr Val Leu Lys Asp Asn Ala Gln Pro
915 920 925
Phe Tyr Leu Ser Asp Lys Thr Tyr Thr Arg Asn Lys Asp Gly Glu Lys
930 935 940
Ala Glu Ser Phe Ser Phe Lys Arg Ala Tyr Glu Leu Phe Ser Val Leu
945 950 955 960
Asn Asn Asn Lys Lys Asp Thr Phe Pro Phe Glu Met Ile Pro Leu Phe
965 970 975
Leu Thr Ser Asp Glu Ile Gln Glu Arg Leu Ser Ala Lys Leu Leu Asp
980 985 990
Gly Asp Gly Asn Pro Val Pro Glu Val Gly Glu Lys Gly Lys Pro Ala
995 1000 1005
Thr Asp Ser Gln Gly Asn Thr Ile Trp Lys Arg Arg Ile Tyr Ser
1010 1015 1020
Glu Val Asp Asp Tyr Ala Glu Lys Leu Thr Asp Arg Asp Met Lys
1025 1030 1035
Ile Ser Phe Lys Gly Glu Trp Glu Lys Leu Pro Arg Trp Lys Gln
1040 1045 1050
Asp Lys Ile Ile Lys Arg Arg Asp Glu Thr Arg Arg Gln Met Arg
1055 1060 1065
Asp Glu Leu Leu Gln Arg Met Pro Arg Tyr Ile Arg Asp Ile Lys
1070 1075 1080
Asp Asn Glu Arg Thr Leu Arg Arg Tyr Lys Thr Gln Asp Met Val
1085 1090 1095
Leu Phe Leu Leu Ala Glu Lys Met Phe Thr Asn Ile Ile Ser Glu
1100 1105 1110
Gln Ser Ser Glu Phe Asn Trp Lys Gln Met Arg Leu Ser Lys Val
1115 1120 1125
Cys Asn Glu Ala Phe Leu Arg Gln Thr Leu Thr Phe Arg Val Pro
1130 1135 1140
Val Thr Val Gly Glu Thr Thr Ile Tyr Val Glu Gln Glu Asn Met
1145 1150 1155
Ser Leu Lys Asn Tyr Gly Glu Phe Tyr Arg Phe Leu Thr Asp Asp
1160 1165 1170
Arg Leu Met Ser Leu Leu Asn Asn Ile Val Glu Thr Leu Lys Pro
1175 1180 1185
Asn Glu Asn Gly Asp Leu Val Ile Arg His Thr Asp Leu Met Ser
1190 1195 1200
Glu Leu Ala Ala Tyr Asp Gln Tyr Arg Ser Thr Ile Phe Met Leu
1205 1210 1215
Ile Gln Ser Ile Glu Asn Leu Ile Ile Thr Asn Asn Ala Val Leu
1220 1225 1230
Asp Asp Pro Asp Ala Asp Gly Phe Trp Val Arg Glu Asp Leu Pro
1235 1240 1245
Lys Arg Asn Asn Phe Ala Ser Leu Leu Glu Leu Ile Asn Gln Leu
1250 1255 1260
Asn Asn Val Glu Leu Thr Asp Asp Glu Arg Lys Leu Leu Val Ala
1265 1270 1275
Ile Arg Asn Ala Phe Ser His Asn Ser Tyr Asn Ile Asp Phe Ser
1280 1285 1290
Leu Ile Lys Asp Val Lys His Leu Pro Glu Val Ala Lys Gly Ile
1295 1300 1305
Leu Gln His Leu Gln Ser Met Leu Gly Val Glu Ile Thr Lys
1310 1315 1320
<210> 99
<211> 1322
<212> PRT
<213> Prevotella sp.
<400> 99
Met Ser Lys Glu Cys Lys Lys Gln Arg Gln Glu Lys Lys Arg Arg Leu
1 5 10 15
Gln Lys Ala Asn Phe Ser Ile Ser Leu Thr Gly Lys His Val Phe Gly
20 25 30
Ala Tyr Phe Asn Met Ala Arg Thr Asn Phe Val Lys Thr Ile Asn Tyr
35 40 45
Ile Leu Pro Ile Ala Gly Val Arg Gly Asn Tyr Ser Glu Asn Gln Ile
50 55 60
Asn Lys Met Leu His Ala Leu Phe Leu Ile Gln Ala Gly Arg Asn Glu
65 70 75 80
Glu Leu Thr Thr Glu Gln Lys Gln Trp Glu Lys Lys Leu Arg Leu Asn
85 90 95
Pro Glu Gln Gln Thr Lys Phe Gln Lys Leu Leu Phe Lys His Phe Pro
100 105 110
Val Leu Gly Pro Met Met Ala Asp Val Ala Asp His Lys Ala Tyr Leu
115 120 125
Asn Lys Lys Lys Ser Thr Val Gln Thr Glu Asp Glu Thr Phe Ala Met
130 135 140
Leu Lys Gly Val Ser Leu Ala Asp Cys Leu Asp Ile Ile Cys Leu Met
145 150 155 160
Ala Asp Thr Leu Thr Glu Cys Arg Asn Phe Tyr Thr His Lys Asp Pro
165 170 175
Tyr Asn Lys Pro Ser Gln Leu Ala Asp Gln Tyr Leu His Gln Glu Met
180 185 190
Ile Ala Lys Lys Leu Asp Lys Val Val Val Ala Ser Arg Arg Ile Leu
195 200 205
Lys Asp Arg Glu Gly Leu Ser Val Asn Glu Val Glu Phe Leu Thr Gly
210 215 220
Ile Asp His Leu His Gln Glu Val Leu Lys Asp Glu Phe Gly Asn Ala
225 230 235 240
Lys Val Lys Asp Gly Lys Val Met Lys Thr Phe Val Glu Tyr Asp Asp
245 250 255
Phe Tyr Phe Lys Ile Ser Gly Lys Arg Leu Val Asn Gly Tyr Thr Val
260 265 270
Thr Thr Lys Asp Asp Lys Pro Val Asn Val Asn Thr Met Leu Pro Ala
275 280 285
Leu Ser Asp Phe Gly Leu Leu Tyr Phe Cys Val Leu Phe Leu Ser Lys
290 295 300
Pro Tyr Ala Lys Leu Phe Ile Asp Glu Val Arg Leu Phe Glu Tyr Ser
305 310 315 320
Pro Phe Asp Asp Lys Glu Asn Met Ile Met Ser Glu Met Leu Ser Ile
325 330 335
Tyr Arg Ile Arg Thr Pro Arg Leu His Lys Ile Asp Ser His Asp Ser
340 345 350
Lys Ala Thr Leu Ala Met Asp Ile Phe Gly Glu Leu Arg Arg Cys Pro
355 360 365
Met Glu Leu Tyr Asn Leu Leu Asp Lys Asn Ala Gly Gln Pro Phe Phe
370 375 380
His Asp Glu Val Lys His Pro Asn Ser His Thr Pro Asp Val Ser Lys
385 390 395 400
Arg Leu Arg Tyr Asp Asp Arg Phe Pro Thr Leu Ala Leu Arg Tyr Ile
405 410 415
Asp Glu Thr Glu Leu Phe Lys Arg Ile Arg Phe Gln Leu Gln Leu Gly
420 425 430
Ser Phe Arg Tyr Lys Phe Tyr Asp Lys Glu Asn Cys Ile Asp Gly Arg
435 440 445
Val Arg Val Arg Arg Ile Gln Lys Glu Ile Asn Gly Tyr Gly Arg Met
450 455 460
Gln Glu Val Ala Asp Lys Arg Met Asp Lys Trp Gly Asp Leu Ile Gln
465 470 475 480
Lys Arg Glu Glu Arg Ser Val Lys Leu Glu His Glu Glu Leu Tyr Ile
485 490 495
Asn Leu Asp Gln Phe Leu Glu Asp Thr Ala Asp Ser Thr Pro Tyr Val
500 505 510
Thr Asp Arg Arg Pro Ala Tyr Asn Ile His Ala Asn Arg Ile Gly Leu
515 520 525
Tyr Trp Glu Asp Ser Gln Asn Pro Lys Gln Tyr Lys Val Phe Asp Glu
530 535 540
Asn Gly Met Tyr Ile Pro Glu Leu Val Val Thr Glu Asp Lys Lys Ala
545 550 555 560
Pro Ile Lys Met Pro Ala Pro Arg Cys Ala Leu Ser Val Tyr Asp Leu
565 570 575
Pro Ala Met Leu Phe Tyr Glu Tyr Leu Arg Glu Gln Gln Asp Asn Glu
580 585 590
Phe Pro Ser Ala Glu Gln Val Ile Ile Glu Tyr Glu Asp Asp Tyr Arg
595 600 605
Lys Phe Phe Lys Ala Val Ala Glu Gly Lys Leu Lys Pro Phe Lys Arg
610 615 620
Pro Lys Glu Phe Arg Asp Phe Leu Lys Lys Glu Tyr Pro Lys Leu Arg
625 630 635 640
Met Ala Asp Ile Pro Lys Lys Leu Gln Leu Phe Leu Cys Ser His Gly
645 650 655
Leu Cys Tyr Asn Asn Lys Pro Glu Thr Val Tyr Glu Arg Leu Asp Arg
660 665 670
Leu Thr Leu Gln His Leu Glu Glu Arg Glu Leu His Ile Gln Asn Arg
675 680 685
Leu Glu His Tyr Gln Lys Asp Arg Asp Met Ile Gly Asn Lys Asp Asn
690 695 700
Gln Tyr Gly Lys Lys Ser Phe Ser Asp Val Arg His Gly Ala Leu Ala
705 710 715 720
Arg Tyr Leu Ala Gln Ser Met Met Glu Trp Gln Pro Thr Lys Leu Lys
725 730 735
Asp Lys Glu Lys Gly His Asp Lys Leu Thr Gly Leu Asn Tyr Asn Val
740 745 750
Leu Thr Ala Tyr Leu Ala Thr Tyr Gly His Pro Gln Val Pro Glu Glu
755 760 765
Gly Phe Thr Pro Arg Thr Leu Glu Gln Val Leu Ile Asn Ala His Leu
770 775 780
Ile Gly Gly Ser Asn Pro His Pro Phe Ile Asn Lys Val Leu Ala Leu
785 790 795 800
Gly Asn Arg Asn Ile Glu Glu Leu Tyr Leu His Tyr Leu Glu Glu Glu
805 810 815
Leu Lys His Ile Arg Ser Arg Ile Gln Ser Leu Ser Ser Asn Pro Ser
820 825 830
Asp Lys Ala Leu Ser Ala Leu Pro Phe Ile His His Asp Arg Met Arg
835 840 845
Tyr His Glu Arg Thr Ser Glu Glu Met Met Ala Leu Ala Ala Arg Tyr
850 855 860
Thr Thr Ile Gln Leu Pro Asp Gly Leu Phe Thr Pro Tyr Ile Leu Glu
865 870 875 880
Ile Leu Gln Lys His Tyr Thr Glu Asn Ser Asp Leu Gln Asn Ala Leu
885 890 895
Ser Gln Asp Val Pro Val Lys Leu Asn Pro Thr Cys Asn Ala Ala Tyr
900 905 910
Leu Ile Thr Leu Phe Tyr Gln Thr Val Leu Lys Asp Asn Ala Gln Pro
915 920 925
Phe Tyr Leu Ser Asp Lys Thr Tyr Thr Arg Asn Lys Asp Gly Glu Lys
930 935 940
Ala Glu Ser Phe Ser Phe Lys Arg Ala Tyr Glu Leu Phe Ser Val Leu
945 950 955 960
Asn Asn Asn Lys Lys Asp Thr Phe Pro Phe Glu Met Ile Pro Leu Phe
965 970 975
Leu Thr Ser Asp Glu Ile Gln Glu Arg Leu Ser Ala Lys Leu Leu Asp
980 985 990
Gly Asp Gly Asn Pro Val Pro Glu Val Gly Glu Lys Gly Lys Pro Ala
995 1000 1005
Thr Asp Ser Gln Gly Asn Thr Ile Trp Lys Arg Arg Ile Tyr Ser
1010 1015 1020
Glu Val Asp Asp Tyr Ala Glu Lys Leu Thr Asp Arg Asp Met Lys
1025 1030 1035
Ile Ser Phe Lys Gly Glu Trp Glu Lys Leu Pro Arg Trp Lys Gln
1040 1045 1050
Asp Lys Ile Ile Lys Arg Arg Asp Glu Thr Arg Arg Gln Met Arg
1055 1060 1065
Asp Glu Leu Leu Gln Arg Met Pro Arg Tyr Ile Arg Asp Ile Lys
1070 1075 1080
Asp Asn Glu Arg Thr Leu Arg Arg Tyr Lys Thr Gln Asp Met Val
1085 1090 1095
Leu Phe Leu Leu Ala Glu Lys Met Phe Thr Asn Ile Ile Ser Glu
1100 1105 1110
Gln Ser Ser Glu Phe Asn Trp Lys Gln Met Arg Leu Ser Lys Val
1115 1120 1125
Cys Asn Glu Ala Phe Leu Arg Gln Thr Leu Thr Phe Arg Val Pro
1130 1135 1140
Val Thr Val Gly Glu Thr Thr Ile Tyr Val Glu Gln Glu Asn Met
1145 1150 1155
Ser Leu Lys Asn Tyr Gly Glu Phe Tyr Arg Phe Leu Thr Asp Asp
1160 1165 1170
Arg Leu Met Ser Leu Leu Asn Asn Ile Val Glu Thr Leu Lys Pro
1175 1180 1185
Asn Glu Asn Gly Asp Leu Val Ile Arg His Thr Asp Leu Met Ser
1190 1195 1200
Glu Leu Ala Ala Tyr Asp Gln Tyr Arg Ser Thr Ile Phe Met Leu
1205 1210 1215
Ile Gln Ser Ile Glu Asn Leu Ile Ile Thr Asn Asn Ala Val Leu
1220 1225 1230
Asp Asp Pro Asp Ala Asp Gly Phe Trp Val Arg Glu Asp Leu Pro
1235 1240 1245
Lys Arg Asn Asn Phe Ala Ser Leu Leu Glu Leu Ile Asn Gln Leu
1250 1255 1260
Asn Asn Val Glu Leu Thr Asp Asp Glu Arg Lys Leu Leu Val Ala
1265 1270 1275
Ile Arg Asn Ala Phe Ser His Asn Ser Tyr Asn Ile Asp Phe Ser
1280 1285 1290
Leu Ile Lys Asp Val Lys His Leu Pro Glu Val Ala Lys Gly Ile
1295 1300 1305
Leu Gln His Leu Gln Ser Met Leu Gly Val Glu Ile Thr Lys
1310 1315 1320
<210> 100
<211> 1095
<212> PRT
<213> Riemerella anatipestifer
<400> 100
Met Glu Lys Pro Leu Leu Pro Asn Val Tyr Thr Leu Lys His Lys Phe
1 5 10 15
Phe Trp Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Ile Thr
20 25 30
Ile Cys His Ile Asn Glu Gln Leu Gly Leu Lys Thr Pro Ser Asn Asp
35 40 45
Asp Lys Ile Val Asp Val Val Cys Glu Thr Trp Asn Asn Ile Leu Asn
50 55 60
Asn Asp His Asp Leu Leu Lys Lys Ser Gln Leu Thr Glu Leu Ile Leu
65 70 75 80
Lys His Phe Pro Phe Leu Thr Ala Met Cys Tyr His Pro Pro Lys Lys
85 90 95
Glu Gly Lys Lys Lys Gly His Gln Lys Glu Gln Gln Lys Glu Lys Glu
100 105 110
Ser Glu Ala Gln Ser Gln Ala Glu Ala Leu Asn Pro Ser Lys Leu Ile
115 120 125
Glu Ala Leu Glu Ile Leu Val Asn Gln Leu His Ser Leu Arg Asn Tyr
130 135 140
Tyr Ser His Tyr Lys His Lys Lys Pro Asp Ala Glu Lys Asp Ile Phe
145 150 155 160
Lys His Leu Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu
165 170 175
Asp Tyr Lys Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His
180 185 190
Leu Asn Arg Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg
195 200 205
Tyr Arg Phe Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe
210 215 220
Phe Thr Asn Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys
225 230 235 240
Lys Val Ser Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr
245 250 255
Thr Glu Val Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu
260 265 270
Glu Ser Arg Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu
275 280 285
Leu Ser Arg Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn
290 295 300
Lys Lys His Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu
305 310 315 320
Glu Glu Gln Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg
325 330 335
Phe Pro Tyr Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys
340 345 350
Ser Ile Arg Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr
355 360 365
Asp Lys Lys Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr
370 375 380
Leu Leu Ser Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro
385 390 395 400
Gln Glu Trp Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser
405 410 415
Asn Gln Pro Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp
420 425 430
Asn Lys Ile Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser
435 440 445
Leu Glu Ile Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn
450 455 460
Ser Gly Phe Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro
465 470 475 480
Leu Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys
485 490 495
Glu Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu
500 505 510
Arg Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu
515 520 525
Pro Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys
530 535 540
Gln Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile
545 550 555 560
Ala Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser
565 570 575
Ser Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val
580 585 590
Leu Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala
595 600 605
Tyr Asp Ala Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr
610 615 620
Glu Phe Trp Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys
625 630 635 640
Asn Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr
645 650 655
Asn Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn
660 665 670
Leu Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu
675 680 685
Glu Ala Ile Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu
690 695 700
Leu Lys Ile Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu
705 710 715 720
Gln Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg
725 730 735
Glu Thr Leu Ser Glu Asp Leu Met Leu Ser Lys Pro Ile Arg Lys Glu
740 745 750
Ile Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu
755 760 765
Tyr Phe Lys Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu
770 775 780
Ser Tyr Lys Leu Glu Ala Lys Ala Pro Leu Leu Lys Arg Glu Glu His
785 790 795 800
Tyr Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln
805 810 815
Arg Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr
820 825 830
Lys Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln
835 840 845
Asp Val Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe
850 855 860
Lys Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala
865 870 875 880
Val Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr
885 890 895
Leu Pro Met Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly
900 905 910
Glu Val Gln Tyr His Lys Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu
915 920 925
Glu His Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys
930 935 940
Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp
945 950 955 960
Thr Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu
965 970 975
Ile Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu
980 985 990
Glu Glu Lys Leu Leu Asn Lys His Thr Ser Leu Ser Ser Leu Glu Asn
995 1000 1005
Glu Phe Arg Ala Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala
1010 1015 1020
Ser Ser Met Val Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val
1025 1030 1035
Arg Asn Ala Phe Cys His Asn Gln Tyr Pro Phe Tyr Lys Glu Ala
1040 1045 1050
Leu His Ala Pro Ile Pro Leu Phe Thr Val Ala Gln Pro Thr Thr
1055 1060 1065
Glu Glu Lys Asp Gly Leu Gly Ile Ala Glu Ala Leu Leu Lys Val
1070 1075 1080
Leu Arg Glu Tyr Cys Glu Ile Val Lys Ser Gln Ile
1085 1090 1095
<210> 101
<211> 1124
<212> PRT
<213> Prevotella aurantiaca
<400> 101
Met Glu Asp Asp Lys Lys Thr Thr Gly Ser Ile Ser Tyr Glu Leu Lys
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Ile Asn His Ile Asn Lys Leu Leu Glu Ile Arg Glu Ile
35 40 45
Asp Asn Asp Glu Lys Val Leu Asp Ile Lys Thr Leu Trp Gln Lys Gly
50 55 60
Asn Lys Asp Leu Asn Gln Lys Ala Arg Leu Arg Glu Leu Met Thr Lys
65 70 75 80
His Phe Pro Phe Leu Glu Thr Ala Ile Tyr Thr Lys Asn Lys Glu Asp
85 90 95
Lys Lys Glu Val Lys Gln Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu
100 105 110
Ser Leu Lys Asp Cys Leu Phe Leu Phe Leu Asp Lys Leu Gln Glu Ala
115 120 125
Arg Asn Tyr Tyr Ser His Tyr Lys Tyr Ser Glu Phe Ser Lys Glu Pro
130 135 140
Glu Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Ile Phe Gly Asn
145 150 155 160
Asn Ile Gln Leu Val Ile Asn Asp Tyr Gln His Asn Lys Asp Ile Asn
165 170 175
Pro Asp Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys Tyr
180 185 190
Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu Phe
195 200 205
Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met Gln Gln
210 215 220
Lys Leu Asn Gly Phe Lys Asp Asn Leu Glu Asn Lys Lys Lys Met Thr
225 230 235 240
His Glu Val Phe Cys Arg Ser Arg Ile Leu Met Pro Lys Leu Arg Leu
245 250 255
Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn Glu
260 265 270
Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly Asp Asp
275 280 285
Arg Glu Lys Phe Lys Val Pro Phe Asp Pro Ala Asp Glu Asp Tyr Asn
290 295 300
Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Ile Arg His Gln Asp Arg
305 310 315 320
Phe Pro Tyr Phe Val Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe Lys
325 330 335
Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile Tyr
340 345 350
Lys Lys Leu Ile Gly Gly Gln Lys Glu Asp Arg His Leu Thr His Lys
355 360 365
Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Ala Lys Gln Asn Arg Pro
370 375 380
Asp Glu Trp Lys Ala Ile Val Lys Asp Leu Asp Thr Tyr Glu Thr Ser
385 390 395 400
Asn Lys Arg Tyr Ile Ser Glu Thr Thr Pro His Tyr His Leu Glu Asn
405 410 415
Gln Lys Ile Gly Ile Arg Phe Arg Asn Gly Asn Lys Glu Ile Trp Pro
420 425 430
Ser Leu Lys Thr Asn Asp Glu Asn Asn Glu Lys Ser Lys Tyr Lys Leu
435 440 445
Asp Lys Gln Tyr Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu Leu
450 455 460
Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Lys Glu Lys Pro Asn Asn
465 470 475 480
Asp Glu Ile Asn Ala Ser Ile Val Glu Gly Phe Ile Lys Arg Glu Ile
485 490 495
Arg Asn Ile Phe Lys Leu Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn
500 505 510
Asn Ile Asp Asp Leu Glu Lys Tyr Cys Ala Asp Lys Gly Ile Pro Lys
515 520 525
Arg His Leu Pro Lys Gln Met Val Ala Ile Leu Tyr Asp Glu His Lys
530 535 540
Asp Met Val Lys Glu Ala Lys Arg Lys Gln Lys Glu Met Val Lys Asp
545 550 555 560
Thr Lys Lys Leu Leu Ala Thr Leu Glu Lys Gln Thr Gln Lys Glu Lys
565 570 575
Glu Asp Asp Gly Arg Asn Val Lys Leu Leu Lys Ser Gly Glu Ile Ala
580 585 590
Arg Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp
595 600 605
Asn Glu Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr
610 615 620
Gln Met Leu Gln Arg Ser Leu Ala Leu Tyr Asn Asn Glu Glu Lys Pro
625 630 635 640
Thr Arg Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Asn Asn Pro His
645 650 655
Pro Phe Leu Lys Trp Thr Lys Trp Glu Glu Cys Asn Asn Ile Leu Thr
660 665 670
Phe Tyr Tyr Ser Tyr Leu Thr Lys Lys Ile Glu Phe Leu Asn Lys Leu
675 680 685
Lys Pro Glu Asp Trp Lys Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu
690 695 700
Pro Lys Thr Asn Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe
705 710 715 720
Asn Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Glu Trp Phe Lys
725 730 735
Arg His Gln Asn Asn Ser Lys Glu Tyr Glu Lys Val Glu Ala Leu Asp
740 745 750
Arg Val Gly Leu Val Thr Lys Val Ile Pro Leu Phe Phe Lys Glu Glu
755 760 765
Tyr Phe Lys Asp Lys Glu Glu Asn Phe Lys Glu Asp Thr Gln Lys Glu
770 775 780
Ile Asn Asp Cys Val Gln Pro Phe Tyr Asn Phe Pro Tyr Asn Val Gly
785 790 795 800
Asn Ile His Lys Pro Lys Glu Lys Asp Phe Leu His Arg Glu Glu Arg
805 810 815
Ile Glu Leu Trp Asp Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Glu
820 825 830
Lys Ile Lys Ser Lys Lys Leu Thr Glu Lys Asp Lys Glu Glu Phe Arg
835 840 845
Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg
850 855 860
Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Lys Glu Leu
865 870 875 880
Ile Asp Lys Leu Lys Ile Asp Glu Leu Asn Ile Glu Glu Leu Lys Lys
885 890 895
Leu Arg Leu Asn Asn Ile Asp Thr Asp Thr Ala Lys Lys Glu Lys Asn
900 905 910
Asn Ile Leu Asn Arg Val Met Pro Met Glu Leu Pro Val Thr Val Tyr
915 920 925
Glu Ile Asp Asp Ser His Lys Ile Val Lys Asp Lys Pro Leu His Thr
930 935 940
Ile Tyr Ile Lys Glu Ala Glu Thr Lys Leu Leu Lys Gln Gly Asn Phe
945 950 955 960
Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val
965 970 975
Lys Thr Asn Ser Glu Ala Glu Ser Lys Arg Asn Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Glu Ala Arg Ile Glu Ile
995 1000 1005
Ile Gln Asp Met Leu Ala Leu Glu Glu Lys Leu Ile Asn Lys Tyr
1010 1015 1020
Lys Asp Leu Pro Thr Asn Lys Phe Ser Glu Met Leu Asn Ser Trp
1025 1030 1035
Leu Glu Gly Lys Asp Glu Ala Asp Lys Ala Arg Phe Gln Asn Asp
1040 1045 1050
Val Asp Phe Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln
1055 1060 1065
Tyr Pro Met His Asn Lys Ile Glu Phe Ala Asn Ile Lys Pro Phe
1070 1075 1080
Ser Leu Tyr Thr Ala Asn Asn Ser Glu Glu Lys Gly Leu Gly Ile
1085 1090 1095
Ala Asn Gln Leu Lys Asp Lys Thr Lys Glu Thr Thr Asp Lys Ile
1100 1105 1110
Lys Lys Ile Glu Lys Pro Ile Glu Thr Lys Glu
1115 1120
<210> 102
<211> 1151
<212> PRT
<213> Prevotella saccharolytica
<400> 102
Met Glu Asp Lys Pro Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His
1 5 10 15
Asn Val Tyr Leu Thr Val Asn His Ile Asn Lys Leu Leu Asp Leu Glu
20 25 30
Lys Leu Tyr Asp Glu Gly Lys His Lys Glu Ile Phe Glu Arg Glu Asp
35 40 45
Ile Phe Asn Ile Ser Asp Asp Val Met Asn Asp Ala Asn Ser Asn Gly
50 55 60
Lys Lys Arg Lys Leu Asp Ile Lys Lys Ile Trp Asp Asp Leu Asp Thr
65 70 75 80
Asp Leu Thr Arg Lys Tyr Gln Leu Arg Glu Leu Ile Leu Lys His Phe
85 90 95
Pro Phe Ile Gln Pro Ala Ile Ile Gly Ala Gln Thr Lys Glu Arg Thr
100 105 110
Thr Ile Asp Lys Asp Lys Arg Ser Thr Ser Thr Ser Asn Asp Ser Leu
115 120 125
Lys Gln Thr Gly Glu Gly Asp Ile Asn Asp Leu Leu Ser Leu Ser Asn
130 135 140
Val Lys Ser Met Phe Phe Arg Leu Leu Gln Ile Leu Glu Gln Leu Arg
145 150 155 160
Asn Tyr Tyr Ser His Val Lys His Ser Lys Ser Ala Thr Met Pro Asn
165 170 175
Phe Asp Glu Asp Leu Leu Asn Trp Met Arg Tyr Ile Phe Ile Asp Ser
180 185 190
Val Asn Lys Val Lys Glu Asp Tyr Ser Ser Asn Ser Val Ile Asp Pro
195 200 205
Asn Thr Ser Phe Ser His Leu Ile Tyr Lys Asp Glu Gln Gly Lys Ile
210 215 220
Lys Pro Cys Arg Tyr Pro Phe Thr Ser Lys Asp Gly Ser Ile Asn Ala
225 230 235 240
Phe Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys Gln Asp Ser
245 250 255
Ile Trp Met Gln Lys Lys Ile Pro Gly Phe Lys Lys Ala Ser Glu Asn
260 265 270
Tyr Met Lys Met Thr Asn Glu Val Phe Cys Arg Asn His Ile Leu Leu
275 280 285
Pro Lys Ile Arg Leu Glu Thr Val Tyr Asp Lys Asp Trp Met Leu Leu
290 295 300
Asp Met Leu Asn Glu Val Val Arg Cys Pro Leu Ser Leu Tyr Lys Arg
305 310 315 320
Leu Thr Pro Ala Ala Gln Asn Lys Phe Lys Val Pro Glu Lys Ser Ser
325 330 335
Asp Asn Ala Asn Arg Gln Glu Asp Asp Asn Pro Phe Ser Arg Ile Leu
340 345 350
Val Arg His Gln Asn Arg Phe Pro Tyr Phe Val Leu Arg Phe Phe Asp
355 360 365
Leu Asn Glu Val Phe Thr Thr Leu Arg Phe Gln Ile Asn Leu Gly Cys
370 375 380
Tyr His Phe Ala Ile Cys Lys Lys Gln Ile Gly Asp Lys Lys Glu Val
385 390 395 400
His His Leu Ile Arg Thr Leu Tyr Gly Phe Ser Arg Leu Gln Asn Phe
405 410 415
Thr Gln Asn Thr Arg Pro Glu Glu Trp Asn Thr Leu Val Lys Thr Thr
420 425 430
Glu Pro Ser Ser Gly Asn Asp Gly Lys Thr Val Gln Gly Val Pro Leu
435 440 445
Pro Tyr Ile Ser Tyr Thr Ile Pro His Tyr Gln Ile Glu Asn Glu Lys
450 455 460
Ile Gly Ile Lys Ile Phe Asp Gly Asp Thr Ala Val Asp Thr Asp Ile
465 470 475 480
Trp Pro Ser Val Ser Thr Glu Lys Gln Leu Asn Lys Pro Asp Lys Tyr
485 490 495
Thr Leu Thr Pro Gly Phe Lys Ala Asp Val Phe Leu Ser Val His Glu
500 505 510
Leu Leu Pro Met Met Phe Tyr Tyr Gln Leu Leu Leu Cys Glu Gly Met
515 520 525
Leu Lys Thr Asp Ala Gly Asn Ala Val Glu Lys Val Leu Ile Asp Thr
530 535 540
Arg Asn Ala Ile Phe Asn Leu Tyr Asp Ala Phe Val Gln Glu Lys Ile
545 550 555 560
Asn Thr Ile Thr Asp Leu Glu Asn Tyr Leu Gln Asp Lys Pro Ile Leu
565 570 575
Ile Gly His Leu Pro Lys Gln Met Ile Asp Leu Leu Lys Gly His Gln
580 585 590
Arg Asp Met Leu Lys Ala Val Glu Gln Lys Lys Ala Met Leu Ile Lys
595 600 605
Asp Thr Glu Arg Arg Leu Lys Leu Leu Asp Lys Gln Leu Lys Gln Glu
610 615 620
Thr Asp Val Ala Ala Lys Asn Thr Gly Thr Leu Leu Lys Asn Gly Gln
625 630 635 640
Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Lys
645 650 655
Arg Asp Lys Glu Gly Asn Pro Ile Asn Cys Ser Lys Ala Asn Ser Thr
660 665 670
Glu Tyr Gln Met Leu Gln Arg Ala Phe Ala Phe Tyr Ala Thr Asp Ser
675 680 685
Cys Arg Leu Ser Arg Tyr Phe Thr Gln Leu His Leu Ile His Ser Asp
690 695 700
Asn Ser His Leu Phe Leu Ser Arg Phe Glu Tyr Asp Lys Gln Pro Asn
705 710 715 720
Leu Ile Ala Phe Tyr Ala Ala Tyr Leu Lys Ala Lys Leu Glu Phe Leu
725 730 735
Asn Glu Leu Gln Pro Gln Asn Trp Ala Ser Asp Asn Tyr Phe Leu Leu
740 745 750
Leu Arg Ala Pro Lys Asn Asp Arg Gln Lys Leu Ala Glu Gly Trp Lys
755 760 765
Asn Gly Phe Asn Leu Pro Arg Gly Leu Phe Thr Glu Lys Ile Lys Thr
770 775 780
Trp Phe Asn Glu His Lys Thr Ile Val Asp Ile Ser Asp Cys Asp Ile
785 790 795 800
Phe Lys Asn Arg Val Gly Gln Val Ala Arg Leu Ile Pro Val Phe Phe
805 810 815
Asp Lys Lys Phe Lys Asp His Ser Gln Pro Phe Tyr Arg Tyr Asp Phe
820 825 830
Asn Val Gly Asn Val Ser Lys Pro Thr Glu Ala Asn Tyr Leu Ser Lys
835 840 845
Gly Lys Arg Glu Glu Leu Phe Lys Ser Tyr Gln Asn Lys Phe Lys Asn
850 855 860
Asn Ile Pro Ala Glu Lys Thr Lys Glu Tyr Arg Glu Tyr Lys Asn Phe
865 870 875 880
Ser Leu Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys Asn Gln
885 890 895
Asp Ile Leu Ile Trp Leu Met Cys Lys Asn Leu Phe Asp Glu Lys Ile
900 905 910
Lys Pro Lys Lys Asp Ile Leu Glu Pro Arg Ile Ala Val Ser Tyr Ile
915 920 925
Lys Leu Asp Ser Leu Gln Thr Asn Thr Ser Thr Ala Gly Ser Leu Asn
930 935 940
Ala Leu Ala Lys Val Val Pro Met Thr Leu Ala Ile His Ile Asp Ser
945 950 955 960
Pro Lys Pro Lys Gly Lys Ala Gly Asn Asn Glu Lys Glu Asn Lys Glu
965 970 975
Phe Thr Val Tyr Ile Lys Glu Glu Gly Thr Lys Leu Leu Lys Trp Gly
980 985 990
Asn Phe Lys Thr Leu Leu Ala Asp Arg Arg Ile Lys Gly Leu Phe Ser
995 1000 1005
Tyr Ile Glu His Asp Asp Ile Asp Leu Lys Gln His Pro Leu Thr
1010 1015 1020
Lys Arg Arg Val Asp Leu Glu Leu Asp Leu Tyr Gln Thr Cys Arg
1025 1030 1035
Ile Asp Ile Phe Gln Gln Thr Leu Gly Leu Glu Ala Gln Leu Leu
1040 1045 1050
Asp Lys Tyr Ser Asp Leu Asn Thr Asp Asn Phe Tyr Gln Met Leu
1055 1060 1065
Ile Gly Trp Arg Lys Lys Glu Gly Ile Pro Arg Asn Ile Lys Glu
1070 1075 1080
Asp Thr Asp Phe Leu Lys Asp Val Arg Asn Ala Phe Ser His Asn
1085 1090 1095
Gln Tyr Pro Asp Ser Lys Lys Ile Ala Phe Arg Arg Ile Arg Lys
1100 1105 1110
Phe Asn Pro Lys Glu Leu Ile Leu Glu Glu Glu Glu Gly Leu Gly
1115 1120 1125
Ile Ala Thr Gln Met Tyr Lys Glu Val Glu Lys Val Val Asn Arg
1130 1135 1140
Ile Lys Arg Ile Glu Leu Phe Asp
1145 1150
<210> 103
<211> 1159
<212> PRT
<213> Myroides odoratimimus
<400> 103
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Asp
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Phe Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Asp Lys Glu Thr Val
225 230 235 240
Val Ala Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser
245 250 255
Asn Asp Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr
260 265 270
Leu Leu Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala
275 280 285
Asn Leu Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser
290 295 300
Ile Lys Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg
305 310 315 320
Gly Leu Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr
325 330 335
Leu Leu Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val
340 345 350
Tyr Gln His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp
355 360 365
Asn Glu Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu
370 375 380
Ser Arg Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe
385 390 395 400
Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr
405 410 415
Leu Arg Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr
420 425 430
Lys Gln Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val
435 440 445
Thr Val Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr
450 455 460
Phe His Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp
465 470 475 480
Thr Leu Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu
485 490 495
Gln His Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val
500 505 510
Lys Leu Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala
515 520 525
Arg Lys Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys
530 535 540
Tyr Asp Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser
545 550 555 560
Glu Lys Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met
565 570 575
Asn Asp Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu
580 585 590
Leu Lys Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile
595 600 605
Gly Lys Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile
610 615 620
Leu Lys Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys
625 630 635 640
Ile Thr Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile
645 650 655
Leu Glu Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr
660 665 670
Lys Phe Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn
675 680 685
Ala Glu Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg
690 695 700
Phe Met Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr
705 710 715 720
Glu Leu Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu
725 730 735
Glu Leu Ile Leu Ser Asn Met Val Met Val Lys Asp Tyr Pro Ile Glu
740 745 750
Leu Ile Asp Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn
755 760 765
Lys Tyr Leu Glu Ala Arg Leu Glu Tyr Ile Glu Asn Val Ile Thr Arg
770 775 780
Val Lys Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu
785 790 795 800
Cys Phe Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp
805 810 815
Lys Gln Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly
820 825 830
Phe Met Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Lys Gln
835 840 845
His Lys Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser
850 855 860
Asn Tyr Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu
865 870 875 880
Asp Lys Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln
885 890 895
Lys Asn Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu
900 905 910
Val Leu Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr
915 920 925
Gln Thr Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr
930 935 940
Gln Glu Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln
945 950 955 960
Leu Cys Asp Gly Leu Val His Ile Asp Asn Val Lys Leu Lys Asp Ile
965 970 975
Gly Asn Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu
980 985 990
Thr Tyr Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val
995 1000 1005
Asp Ser Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr
1010 1015 1020
Glu Ser Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile
1025 1030 1035
Glu Cys Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys
1040 1045 1050
Gln Ser Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu
1055 1060 1065
Leu Pro Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr
1070 1075 1080
Asp Val Lys Phe Lys Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala
1085 1090 1095
Gly Glu Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn
1100 1105 1110
Lys Phe Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe
1115 1120 1125
Cys Glu Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala
1130 1135 1140
Glu Tyr Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala
1145 1150 1155
Asn
<210> 104
<211> 1120
<212> PRT
<213> Prevotella intermedia
<400> 104
Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Arg Tyr Glu Leu Lys
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Glu Glu Asp Glu Ile
35 40 45
Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Asn Ser Trp Asn Glu Ile
50 55 60
Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile Lys His
65 70 75 80
Phe Pro Phe Leu Glu Ala Thr Thr Tyr Arg Gln Asn Pro Thr Asp Thr
85 90 95
Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu Glu Ser
100 105 110
Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp Leu Arg
115 120 125
Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg Pro Lys
130 135 140
Phe Glu Glu Asp Leu Gln Asn Lys Met Tyr Asn Ile Phe Asp Val Ser
145 150 155 160
Ile Gln Phe Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile Asn Pro
165 170 175
Lys Lys Asp Phe Lys His Leu Asp Arg Lys Arg Lys Gly Lys Phe His
180 185 190
Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu
195 200 205
Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln
210 215 220
Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Lys Ser Tyr Gln Lys Met
225 230 235 240
Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg
245 250 255
Leu Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn
260 265 270
Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly Val
275 280 285
Asn Arg Lys Lys Phe Tyr Val Ser Phe Asp Pro Ala Asp Glu Asp Tyr
290 295 300
Asp Ala Glu Gln Glu Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp
305 310 315 320
Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Val Phe
325 330 335
Ala Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile
340 345 350
Tyr Lys Lys Leu Ile Gly Gly Gln Lys Glu Asp Arg His Leu Thr His
355 360 365
Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Asp Lys Gln Asn Arg
370 375 380
Pro Asp Glu Trp Lys Ala Ile Val Lys Asp Ser Asp Thr Phe Lys Lys
385 390 395 400
Lys Glu Glu Lys Glu Glu Glu Lys Pro Tyr Ile Ser Glu Thr Thr Pro
405 410 415
His Tyr His Leu Glu Asn Lys Lys Ile Gly Ile Ala Phe Lys Asn His
420 425 430
Asn Ile Trp Pro Ser Thr Gln Thr Glu Leu Thr Asn Asn Lys Arg Lys
435 440 445
Lys Tyr Asn Leu Gly Thr Ser Ile Lys Ala Glu Ala Phe Leu Ser Val
450 455 460
His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu
465 470 475 480
Asn Thr Lys Asn Asp Asn Lys Val Gly Gly Lys Lys Glu Thr Lys Lys
485 490 495
Gln Gly Lys His Lys Ile Glu Ala Ile Ile Glu Ser Lys Ile Lys Asp
500 505 510
Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn Ser Glu
515 520 525
Asp Glu Leu Lys Glu Tyr Leu Lys Gly Lys Asp Ile Lys Ile Val His
530 535 540
Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Asn Glu His Lys Asp Met
545 550 555 560
Ala Glu Lys Ala Glu Ala Lys Gln Glu Lys Met Lys Leu Ala Thr Glu
565 570 575
Asn Arg Leu Lys Thr Leu Asp Lys Gln Leu Lys Gly Lys Ile Gln Asn
580 585 590
Gly Lys Arg Tyr Asn Ser Ala Pro Lys Ser Gly Glu Ile Ala Ser Trp
595 600 605
Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Glu Asn
610 615 620
Gly Glu Ser Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu
625 630 635 640
Leu Gln Arg Thr Leu Ala Phe Phe Gly Ser Glu His Glu Arg Leu Ala
645 650 655
Pro Tyr Phe Lys Gln Thr Lys Leu Ile Glu Ser Ser Asn Pro His Pro
660 665 670
Phe Leu Asn Asp Thr Glu Trp Glu Lys Cys Ser Asn Ile Leu Ser Phe
675 680 685
Tyr Arg Ser Tyr Leu Lys Ala Arg Lys Asn Phe Leu Glu Ser Leu Lys
690 695 700
Pro Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro
705 710 715 720
Lys Thr Asn Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn
725 730 735
Leu Pro Arg Gly Phe Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu
740 745 750
His Trp Lys Ser Ile Lys Val Asp Asp Leu Lys Arg Val Gly Leu Val
755 760 765
Ala Lys Val Thr Pro Leu Phe Phe Ser Glu Lys Tyr Lys Asp Ser Val
770 775 780
Gln Pro Phe Tyr Asn Tyr Pro Phe Asn Val Gly Asp Val Asn Lys Pro
785 790 795 800
Lys Glu Glu Asp Phe Leu His Arg Glu Glu Arg Ile Glu Leu Trp Asp
805 810 815
Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Lys Lys Phe Lys
820 825 830
Glu Met Thr Asp Lys Glu Lys Glu Glu His Arg Ser Tyr Leu Glu Phe
835 840 845
Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln
850 855 860
Asp Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys
865 870 875 880
Ile Asp Glu Leu Asn Ile Lys Glu Leu Lys Lys Leu Arg Leu Lys Asp
885 890 895
Ile Asn Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg
900 905 910
Val Met Pro Met Glu Leu Pro Val Thr Val Tyr Lys Val Asn Lys Gly
915 920 925
Gly Tyr Ile Ile Lys Asn Lys Pro Leu His Thr Ile Tyr Ile Lys Glu
930 935 940
Ala Glu Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys
945 950 955 960
Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Lys Thr Pro Ser Glu
965 970 975
Ala Glu Ser Glu Ser Asn Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
980 985 990
Leu Gly Lys Tyr Gln Asn Ala Arg Leu Asp Ile Ile Glu Asp Met Leu
995 1000 1005
Ala Leu Glu Lys Lys Leu Ile Asp Lys Tyr Asn Ser Leu Asp Thr
1010 1015 1020
Asp Asn Phe His Asn Met Leu Thr Gly Trp Leu Glu Leu Lys Gly
1025 1030 1035
Glu Ala Lys Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Thr
1040 1045 1050
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1055 1060 1065
Glu Asn Leu Phe Gly Asn Ile Glu Arg Phe Ser Leu Ser Ser Ser
1070 1075 1080
Asn Ile Ile Glu Ser Lys Gly Leu Asp Ile Ala Ala Lys Leu Lys
1085 1090 1095
Glu Glu Val Ser Lys Ala Ala Lys Lys Ile Gln Asn Glu Glu Asp
1100 1105 1110
Asn Lys Lys Glu Lys Glu Thr
1115 1120
<210> 105
<211> 1199
<212> PRT
<213> Capnocytophaga canimorsus
<400> 105
Met Lys Asn Ile Gln Arg Leu Gly Lys Gly Asn Glu Phe Ser Pro Phe
1 5 10 15
Lys Lys Glu Asp Lys Phe Tyr Phe Gly Gly Phe Leu Asn Leu Ala Asn
20 25 30
Asn Asn Ile Glu Asp Phe Phe Lys Glu Ile Ile Thr Arg Phe Gly Ile
35 40 45
Val Ile Thr Asp Glu Asn Lys Lys Pro Lys Glu Thr Phe Gly Glu Lys
50 55 60
Ile Leu Asn Glu Ile Phe Lys Lys Asp Ile Ser Ile Val Asp Tyr Glu
65 70 75 80
Lys Trp Val Asn Ile Phe Ala Asp Tyr Phe Pro Phe Thr Lys Tyr Leu
85 90 95
Ser Leu Tyr Leu Glu Glu Met Gln Phe Lys Asn Arg Val Ile Cys Phe
100 105 110
Arg Asp Val Met Lys Glu Leu Leu Lys Thr Val Glu Ala Leu Arg Asn
115 120 125
Phe Tyr Thr His Tyr Asp His Glu Pro Ile Lys Ile Glu Asp Arg Val
130 135 140
Phe Tyr Phe Leu Asp Lys Val Leu Leu Asp Val Ser Leu Thr Val Lys
145 150 155 160
Asn Lys Tyr Leu Lys Thr Asp Lys Thr Lys Glu Phe Leu Asn Gln His
165 170 175
Ile Gly Glu Glu Leu Lys Glu Leu Cys Lys Gln Arg Lys Asp Tyr Leu
180 185 190
Val Gly Lys Gly Lys Arg Ile Asp Lys Glu Ser Glu Ile Ile Asn Gly
195 200 205
Ile Tyr Asn Asn Ala Phe Lys Asp Phe Ile Cys Lys Arg Glu Lys Gln
210 215 220
Asp Asp Lys Glu Asn His Asn Ser Val Glu Lys Ile Leu Cys Asn Lys
225 230 235 240
Glu Pro Gln Asn Lys Lys Gln Lys Ser Ser Ala Thr Val Trp Glu Leu
245 250 255
Cys Ser Lys Ser Ser Ser Lys Tyr Thr Glu Lys Ser Phe Pro Asn Arg
260 265 270
Glu Asn Asp Lys His Cys Leu Glu Val Pro Ile Ser Gln Lys Gly Ile
275 280 285
Val Phe Leu Leu Ser Phe Phe Leu Asn Lys Gly Glu Ile Tyr Ala Leu
290 295 300
Thr Ser Asn Ile Lys Gly Phe Lys Ala Lys Ile Thr Lys Glu Glu Pro
305 310 315 320
Val Thr Tyr Asp Lys Asn Ser Ile Arg Tyr Met Ala Thr His Arg Met
325 330 335
Phe Ser Phe Leu Ala Tyr Lys Gly Leu Lys Arg Lys Ile Arg Thr Ser
340 345 350
Glu Ile Asn Tyr Asn Glu Asp Gly Gln Ala Ser Ser Thr Tyr Glu Lys
355 360 365
Glu Thr Leu Met Leu Gln Met Leu Asp Glu Leu Asn Lys Val Pro Asp
370 375 380
Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile Glu
385 390 395 400
Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr Met
405 410 415
Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp
420 425 430
Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln Phe
435 440 445
Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu Cys Asp Lys
450 455 460
Arg Thr Lys Gln Ile Cys Asp Thr Thr Thr Glu Arg Glu Val Lys Lys
465 470 475 480
Lys Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu Asn Lys Lys Ala
485 490 495
Ile Phe Leu Asn Glu Arg Glu Glu Ile Lys Gly Trp Glu Val Phe Pro
500 505 510
Asn Pro Ser Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val Asn Tyr Lys
515 520 525
Asp Phe Pro Ile Val Gly Ser Ile Leu Asp Arg Glu Lys Gln Pro Val
530 535 540
Ser Asn Lys Ile Gly Ile Arg Val Lys Ile Ala Asp Glu Leu Gln Arg
545 550 555 560
Glu Ile Asp Lys Ala Ile Lys Glu Lys Lys Leu Arg Asn Pro Lys Asn
565 570 575
Arg Lys Ala Asn Gln Asp Glu Lys Gln Lys Glu Arg Leu Val Asn Glu
580 585 590
Ile Val Ser Thr Asn Ser Asn Glu Gln Gly Glu Pro Val Val Phe Ile
595 600 605
Gly Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Val Leu
610 615 620
Tyr Glu Phe Leu Ile Asn Lys Ile Ser Gly Glu Ala Leu Glu Thr Lys
625 630 635 640
Ile Val Glu Lys Ile Glu Thr Gln Ile Lys Gln Ile Ile Gly Lys Asp
645 650 655
Ala Thr Thr Lys Ile Leu Lys Pro Tyr Thr Asn Ala Asn Ser Asn Ser
660 665 670
Ile Asn Arg Glu Lys Leu Leu Arg Asp Leu Glu Gln Glu Gln Gln Ile
675 680 685
Leu Lys Thr Leu Leu Glu Glu Gln Gln Gln Arg Glu Lys Asp Lys Lys
690 695 700
Asp Lys Lys Ser Lys Arg Lys His Glu Leu Tyr Pro Ser Glu Lys Gly
705 710 715 720
Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Lys
725 730 735
Ala Phe Lys Glu Gln Trp Arg Gly Tyr His His Ser Leu Leu Gln Lys
740 745 750
Tyr Leu Ala Tyr Tyr Glu Gln Ser Lys Glu Glu Leu Lys Asn Leu Leu
755 760 765
Pro Lys Glu Val Phe Lys His Phe Pro Phe Lys Leu Lys Gly Tyr Phe
770 775 780
Gln Gln Gln Tyr Leu Asn Gln Phe Tyr Thr Asp Tyr Leu Lys Arg Arg
785 790 795 800
Leu Ser Tyr Val Asn Glu Leu Leu Leu Asn Ile Gln Asn Phe Lys Asn
805 810 815
Asp Lys Asp Ala Leu Lys Ala Thr Glu Lys Glu Cys Phe Lys Phe Phe
820 825 830
Arg Lys Gln Asn Tyr Ile Ile Asn Pro Ile Asn Ile Gln Ile Gln Ser
835 840 845
Ile Leu Val Tyr Pro Ile Phe Leu Lys Arg Gly Phe Leu Asp Glu Lys
850 855 860
Pro Thr Met Ile Asp Arg Glu Lys Phe Lys Glu Asn Lys Asp Thr Glu
865 870 875 880
Leu Ala Asp Trp Phe Met His Tyr Lys Asn Tyr Lys Glu Asp Asn Tyr
885 890 895
Gln Lys Phe Tyr Ala Tyr Pro Leu Glu Lys Val Glu Glu Lys Glu Lys
900 905 910
Phe Lys Arg Asn Lys Gln Ile Asn Lys Gln Lys Lys Asn Asp Val Tyr
915 920 925
Thr Leu Met Met Val Glu Tyr Ile Ile Gln Lys Ile Phe Gly Asp Lys
930 935 940
Phe Val Glu Glu Asn Pro Leu Val Leu Lys Gly Ile Phe Gln Ser Lys
945 950 955 960
Ala Glu Arg Gln Gln Asn Asn Thr His Ala Ala Thr Thr Gln Glu Arg
965 970 975
Asn Leu Asn Gly Ile Leu Asn Gln Pro Lys Asp Ile Lys Ile Gln Gly
980 985 990
Lys Ile Thr Val Lys Gly Val Lys Leu Lys Asp Ile Gly Asn Phe Arg
995 1000 1005
Lys Tyr Glu Ile Asp Gln Arg Val Asn Thr Phe Leu Asp Tyr Glu
1010 1015 1020
Pro Arg Lys Glu Trp Met Ala Tyr Leu Pro Asn Asp Trp Lys Glu
1025 1030 1035
Lys Glu Lys Gln Gly Gln Leu Pro Pro Asn Asn Val Ile Asp Arg
1040 1045 1050
Gln Ile Ser Lys Tyr Glu Thr Val Arg Ser Lys Ile Leu Leu Lys
1055 1060 1065
Asp Val Gln Glu Leu Glu Lys Ile Ile Ser Asp Glu Ile Lys Glu
1070 1075 1080
Glu His Arg His Asp Leu Lys Gln Gly Lys Tyr Tyr Asn Phe Lys
1085 1090 1095
Tyr Tyr Ile Leu Asn Gly Leu Leu Arg Gln Leu Lys Asn Glu Asn
1100 1105 1110
Val Glu Asn Tyr Lys Val Phe Lys Leu Asn Thr Asn Pro Glu Lys
1115 1120 1125
Val Asn Ile Thr Gln Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln
1130 1135 1140
Lys Ala Phe Val Leu Thr Tyr Ile Arg Asn Lys Phe Ala His Asn
1145 1150 1155
Gln Leu Pro Lys Lys Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr
1160 1165 1170
Gly Lys Ile Glu Lys Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu
1175 1180 1185
Val Phe Lys Arg Glu Lys Glu Ala Leu Ile Lys
1190 1195
<210> 106
<211> 1175
<212> PRT
<213> Porphyromonas gulae
<400> 106
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Ile Asp His Glu His Asn Asp Glu Val
180 185 190
Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Met Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Met Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly His Asp Glu Val Ala Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser Tyr Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Arg Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr
1055 1060 1065
Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 107
<211> 1090
<212> PRT
<213> Prevotella sp.
<400> 107
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Asn Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Asn Asp Lys Glu Asp Ser Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Glu Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asp Asp Asp Phe Gln Thr Phe Tyr Gln Trp Asn Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Gln Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys
1085 1090
<210> 108
<211> 1150
<212> PRT
<213> Flavobacterium branchiophilum
<400> 108
Met Glu Asn Leu Asn Lys Ile Leu Asp Lys Glu Asn Glu Ile Cys Ile
1 5 10 15
Ser Lys Ile Phe Asn Thr Lys Gly Ile Ala Ala Pro Ile Thr Glu Lys
20 25 30
Ala Leu Asp Asn Ile Lys Ser Lys Gln Lys Asn Asp Leu Asn Lys Glu
35 40 45
Ala Arg Leu His Tyr Phe Ser Ile Gly His Ser Phe Lys Gln Ile Asp
50 55 60
Thr Lys Lys Val Phe Asp Tyr Val Leu Ile Glu Glu Leu Lys Asp Glu
65 70 75 80
Lys Pro Leu Lys Phe Ile Thr Leu Gln Lys Asp Phe Phe Thr Lys Glu
85 90 95
Phe Ser Ile Lys Leu Gln Lys Leu Ile Asn Ser Ile Arg Asn Ile Asn
100 105 110
Asn His Tyr Val His Asn Phe Asn Asp Ile Asn Leu Asn Lys Ile Asp
115 120 125
Ser Asn Val Phe His Phe Leu Lys Glu Ser Phe Glu Leu Ala Ile Ile
130 135 140
Glu Lys Tyr Tyr Lys Val Asn Lys Lys Tyr Pro Leu Asp Asn Glu Ile
145 150 155 160
Val Leu Phe Leu Lys Glu Leu Phe Ile Lys Asp Glu Asn Thr Ala Leu
165 170 175
Leu Asn Tyr Phe Thr Asn Leu Ser Lys Asp Glu Ala Ile Glu Tyr Ile
180 185 190
Leu Thr Phe Thr Ile Thr Glu Asn Lys Ile Trp Asn Ile Asn Asn Glu
195 200 205
His Asn Ile Leu Asn Ile Glu Lys Gly Lys Tyr Leu Thr Phe Glu Ala
210 215 220
Met Leu Phe Leu Ile Thr Ile Phe Leu Tyr Lys Asn Glu Ala Asn His
225 230 235 240
Leu Leu Pro Lys Leu Tyr Asp Phe Lys Asn Asn Lys Ser Lys Gln Glu
245 250 255
Leu Phe Thr Phe Phe Ser Lys Lys Phe Thr Ser Gln Asp Ile Asp Ala
260 265 270
Glu Glu Gly His Leu Ile Lys Phe Arg Asp Met Ile Gln Tyr Leu Asn
275 280 285
His Tyr Pro Thr Ala Trp Asn Asn Asp Leu Lys Leu Glu Ser Glu Asn
290 295 300
Lys Asn Lys Ile Met Thr Thr Lys Leu Ile Asp Ser Ile Ile Glu Phe
305 310 315 320
Glu Leu Asn Ser Asn Tyr Pro Ser Phe Ala Thr Asp Ile Gln Phe Lys
325 330 335
Lys Glu Ala Lys Ala Phe Leu Phe Ala Ser Asn Lys Lys Arg Asn Gln
340 345 350
Thr Ser Phe Ser Asn Lys Ser Tyr Asn Glu Glu Ile Arg His Asn Pro
355 360 365
His Ile Lys Gln Tyr Arg Asp Glu Ile Ala Ser Ala Leu Thr Pro Ile
370 375 380
Ser Phe Asn Val Lys Glu Asp Lys Phe Lys Ile Phe Val Lys Lys His
385 390 395 400
Val Leu Glu Glu Tyr Phe Pro Asn Ser Ile Gly Tyr Glu Lys Phe Leu
405 410 415
Glu Tyr Asn Asp Phe Thr Glu Lys Glu Lys Glu Asp Phe Gly Leu Lys
420 425 430
Leu Tyr Ser Asn Pro Lys Thr Asn Lys Leu Ile Glu Arg Ile Asp Asn
435 440 445
His Lys Leu Val Lys Ser His Gly Arg Asn Gln Asp Arg Phe Met Asp
450 455 460
Phe Ser Met Arg Phe Leu Ala Glu Asn Asn Tyr Phe Gly Lys Asp Ala
465 470 475 480
Phe Phe Lys Cys Tyr Lys Phe Tyr Asp Thr Gln Glu Gln Asp Glu Phe
485 490 495
Leu Gln Ser Asn Glu Asn Asn Asp Asp Val Lys Phe His Lys Gly Lys
500 505 510
Val Thr Thr Tyr Ile Lys Tyr Glu Glu His Leu Lys Asn Tyr Ser Tyr
515 520 525
Trp Asp Cys Pro Phe Val Glu Glu Asn Asn Ser Met Ser Val Lys Ile
530 535 540
Ser Ile Gly Ser Glu Glu Lys Ile Leu Lys Ile Gln Arg Asn Leu Met
545 550 555 560
Ile Tyr Phe Leu Glu Asn Ala Leu Tyr Asn Glu Asn Val Glu Asn Gln
565 570 575
Gly Tyr Lys Leu Val Asn Asn Tyr Tyr Arg Glu Leu Lys Lys Asp Val
580 585 590
Glu Glu Ser Ile Ala Ser Leu Asp Leu Ile Lys Ser Asn Pro Asp Phe
595 600 605
Lys Ser Lys Tyr Lys Lys Ile Leu Pro Lys Arg Leu Leu His Asn Tyr
610 615 620
Ala Pro Ala Lys Gln Asp Lys Ala Pro Glu Asn Ala Phe Glu Thr Leu
625 630 635 640
Leu Lys Lys Ala Asp Phe Arg Glu Glu Gln Tyr Lys Lys Leu Leu Lys
645 650 655
Lys Ala Glu His Glu Lys Asn Lys Glu Asp Phe Val Lys Arg Asn Lys
660 665 670
Gly Lys Gln Phe Lys Leu His Phe Ile Arg Lys Ala Cys Gln Met Met
675 680 685
Tyr Phe Lys Glu Lys Tyr Asn Thr Leu Lys Glu Gly Asn Ala Ala Phe
690 695 700
Glu Lys Lys Asp Pro Val Ile Glu Lys Arg Lys Asn Lys Glu His Glu
705 710 715 720
Phe Gly His His Lys Asn Leu Asn Ile Thr Arg Glu Glu Phe Asn Asp
725 730 735
Tyr Cys Lys Trp Met Phe Ala Phe Asn Gly Asn Asp Ser Tyr Lys Lys
740 745 750
Tyr Leu Arg Asp Leu Phe Ser Glu Lys His Phe Phe Asp Asn Gln Glu
755 760 765
Tyr Lys Asn Leu Phe Glu Ser Ser Val Asn Leu Glu Ala Phe Tyr Ala
770 775 780
Lys Thr Lys Glu Leu Phe Lys Lys Trp Ile Glu Thr Asn Lys Pro Thr
785 790 795 800
Asn Asn Glu Asn Arg Tyr Thr Leu Glu Asn Tyr Lys Asn Leu Ile Leu
805 810 815
Gln Lys Gln Val Phe Ile Asn Val Tyr His Phe Ser Lys Tyr Leu Ile
820 825 830
Asp Lys Asn Leu Leu Asn Ser Glu Asn Asn Val Ile Gln Tyr Lys Ser
835 840 845
Leu Glu Asn Val Glu Tyr Leu Ile Ser Asp Phe Tyr Phe Gln Ser Lys
850 855 860
Leu Ser Ile Asp Gln Tyr Lys Thr Cys Gly Lys Leu Phe Asn Lys Leu
865 870 875 880
Lys Ser Asn Lys Leu Glu Asp Cys Leu Leu Tyr Glu Ile Ala Tyr Asn
885 890 895
Tyr Ile Asp Lys Lys Asn Val His Lys Ile Asp Ile Gln Lys Ile Leu
900 905 910
Thr Ser Lys Ile Ile Leu Thr Ile Asn Asp Ala Asn Thr Pro Tyr Lys
915 920 925
Ile Ser Val Pro Phe Asn Lys Leu Glu Arg Tyr Thr Glu Met Ile Ala
930 935 940
Ile Lys Asn Gln Asn Asn Leu Lys Ala Arg Phe Leu Ile Asp Leu Pro
945 950 955 960
Leu Tyr Leu Ser Lys Asn Lys Ile Lys Lys Gly Lys Asp Ser Ala Gly
965 970 975
Tyr Glu Ile Ile Ile Lys Asn Asp Leu Glu Ile Glu Asp Ile Asn Thr
980 985 990
Ile Asn Asn Lys Ile Ile Asn Asp Ser Val Lys Phe Thr Glu Val Leu
995 1000 1005
Met Glu Leu Glu Lys Tyr Phe Ile Leu Lys Asp Lys Cys Ile Leu
1010 1015 1020
Ser Lys Asn Tyr Ile Asp Asn Ser Glu Ile Pro Ser Leu Lys Gln
1025 1030 1035
Phe Ser Lys Val Trp Ile Lys Glu Asn Glu Asn Glu Ile Ile Asn
1040 1045 1050
Tyr Arg Asn Ile Ala Cys His Phe His Leu Pro Leu Leu Glu Thr
1055 1060 1065
Phe Asp Asn Leu Leu Leu Asn Val Glu Gln Lys Phe Ile Lys Glu
1070 1075 1080
Glu Leu Gln Asn Val Ser Thr Ile Asn Asp Leu Ser Lys Pro Gln
1085 1090 1095
Glu Tyr Leu Ile Leu Leu Phe Ile Lys Phe Lys His Asn Asn Phe
1100 1105 1110
Tyr Leu Asn Leu Phe Asn Lys Asn Glu Ser Lys Thr Ile Lys Asn
1115 1120 1125
Asp Lys Glu Val Lys Lys Asn Arg Val Leu Gln Lys Phe Ile Asn
1130 1135 1140
Gln Val Ile Leu Lys Lys Lys
1145 1150
<210> 109
<211> 1159
<212> PRT
<213> Myroides odoratimimus
<400> 109
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Asp
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Phe Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Asp Lys Glu Thr Val
225 230 235 240
Val Ala Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser
245 250 255
Asn Asp Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr
260 265 270
Leu Leu Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala
275 280 285
Asn Leu Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser
290 295 300
Ile Lys Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg
305 310 315 320
Gly Leu Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr
325 330 335
Leu Leu Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val
340 345 350
Tyr Gln His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp
355 360 365
Asn Glu Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu
370 375 380
Ser Arg Val Thr His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe
385 390 395 400
Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr
405 410 415
Leu Arg Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr
420 425 430
Lys Gln Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val
435 440 445
Thr Val Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr
450 455 460
Phe His Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp
465 470 475 480
Thr Leu Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu
485 490 495
Gln His Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val
500 505 510
Lys Leu Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala
515 520 525
Arg Lys Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys
530 535 540
Tyr Asp Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser
545 550 555 560
Glu Lys Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met
565 570 575
Asn Asp Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu
580 585 590
Leu Lys Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile
595 600 605
Gly Lys Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile
610 615 620
Leu Lys Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys
625 630 635 640
Ile Thr Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile
645 650 655
Leu Glu Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr
660 665 670
Lys Phe Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn
675 680 685
Ala Glu Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg
690 695 700
Phe Met Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Ile
705 710 715 720
Glu Leu Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu
725 730 735
Glu Leu Ile Leu Ser Asn Met Val Met Val Lys Asp Tyr Pro Ile Glu
740 745 750
Leu Ile Asp Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn
755 760 765
Lys Tyr Leu Glu Ala Arg Leu Glu Tyr Ile Glu Asn Val Ile Thr Arg
770 775 780
Val Lys Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu
785 790 795 800
Cys Phe Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp
805 810 815
Lys Gln Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly
820 825 830
Phe Met Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Lys Gln
835 840 845
His Lys Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser
850 855 860
Asn Tyr Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu
865 870 875 880
Asp Lys Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln
885 890 895
Lys Asn Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu
900 905 910
Val Leu Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr
915 920 925
Gln Thr Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr
930 935 940
Gln Glu Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln
945 950 955 960
Leu Cys Asp Gly Leu Val His Ile Asp Asn Val Lys Leu Lys Asp Ile
965 970 975
Gly Asn Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu
980 985 990
Thr Tyr Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val
995 1000 1005
Asp Ser Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr
1010 1015 1020
Glu Ser Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile
1025 1030 1035
Glu Cys Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys
1040 1045 1050
Gln Ser Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu
1055 1060 1065
Leu Pro Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr
1070 1075 1080
Asp Val Lys Phe Lys Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala
1085 1090 1095
Gly Glu Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn
1100 1105 1110
Lys Phe Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe
1115 1120 1125
Cys Glu Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala
1130 1135 1140
Glu Tyr Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala
1145 1150 1155
Asn
<210> 110
<211> 1214
<212> PRT
<213> Flavobacterium columnare
<400> 110
Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His
1 5 10 15
Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala
20 25 30
Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn
35 40 45
Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe
50 55 60
Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu
65 70 75 80
Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His
85 90 95
Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile
100 105 110
Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr
115 120 125
Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val
130 135 140
Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu
145 150 155 160
Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln
165 170 175
Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn
180 185 190
Leu Glu Asn Ala Val Phe Asn His Cys Leu Ile Pro Phe Leu Glu Glu
195 200 205
Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr
210 215 220
Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser
225 230 235 240
Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln
245 250 255
Val Phe Thr Ser Gly Leu Glu Arg Phe Lys Ala Lys Val Asn Thr Ile
260 265 270
Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile
275 280 285
Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg
290 295 300
Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr
305 310 315 320
His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile
325 330 335
Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser
340 345 350
Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg
355 360 365
Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His
370 375 380
Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met
385 390 395 400
Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val
405 410 415
Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser
420 425 430
Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe
435 440 445
Glu Lys Leu Ser Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys
450 455 460
Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Asn Pro
465 470 475 480
Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg
485 490 495
Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser
500 505 510
Gln Asn Lys Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln
515 520 525
Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys
530 535 540
Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu
545 550 555 560
Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu
565 570 575
Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile
580 585 590
Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr
595 600 605
Leu Ile Lys Thr Ile Asn Thr Asp Ser Ser Val Thr Phe Glu Asn Gln
610 615 620
Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Leu Gln Lys Glu Leu Thr
625 630 635 640
Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Glu His Glu Ile Glu Val
645 650 655
Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro
660 665 670
Lys Asn Lys Val Asp Asp Lys Lys Leu Gln Arg Lys Tyr Val Phe Tyr
675 680 685
Arg Asn Glu Ile Arg Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile
690 695 700
His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu
705 710 715 720
Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile
725 730 735
Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr
740 745 750
Lys Gly Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe
755 760 765
Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Ser Thr Glu Ser
770 775 780
Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys
785 790 795 800
Lys Glu Leu Ser Lys Arg Leu Lys Tyr Ile Phe Ile Val Phe Gln Lys
805 810 815
Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr
820 825 830
Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr
835 840 845
Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe
850 855 860
Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr
865 870 875 880
Pro Asp Ile Val Glu Arg Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg
885 890 895
Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val
900 905 910
Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu
915 920 925
Ser Asp Phe Tyr Val Ser Lys Ala Glu Arg Glu Lys Ile Lys Ala Asp
930 935 940
Ala Lys Ala Tyr Gln Lys Leu Asn Asp Ser Ser Leu Trp Asn Lys Val
945 950 955 960
Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu
965 970 975
Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala
980 985 990
Thr Leu Leu Thr Tyr Asp Ala Arg Thr Trp Thr Tyr Ala Leu Gln Lys
995 1000 1005
Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr
1010 1015 1020
Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys
1025 1030 1035
Glu Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Lys Ile Leu Asp
1040 1045 1050
Lys Phe Tyr Asp Phe Ser Asn Asn Ala Ser His Pro Glu Asp Leu
1055 1060 1065
Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu
1070 1075 1080
Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn
1085 1090 1095
Leu Glu Asn Ile Asp Ile Glu Ile Leu Leu Lys Tyr Tyr Asp Tyr
1100 1105 1110
Asn Thr Glu Glu Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp
1115 1120 1125
Glu Lys Ala Lys Ile Ile Asn Thr Lys Glu Asn Tyr Asn Lys Ile
1130 1135 1140
Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg
1145 1150 1155
Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp
1160 1165 1170
Leu Ala Asn Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala
1175 1180 1185
Thr Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Lys Glu Leu Trp
1190 1195 1200
Glu Asn Lys Glu Lys Lys Asp Lys Thr Gln Val
1205 1210
<210> 111
<211> 1119
<212> PRT
<213> Porphyromonas gingivalis
<400> 111
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Ser Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Val Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Glu Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Ser Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Thr Leu Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Val
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 112
<211> 1175
<212> PRT
<213> Porphyromonas sp.
<400> 112
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu Arg Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Asp Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Lys Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr
1055 1060 1065
Leu Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 113
<211> 1132
<212> PRT
<213> Prevotella intermedia
<400> 113
Met Glu Asp Asp Lys Lys Thr Lys Glu Ser Thr Asn Met Leu Asp Asn
1 5 10 15
Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val Tyr
20 25 30
Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys Lys
35 40 45
Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile Lys
50 55 60
Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu Arg Leu
65 70 75 80
Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala Ile Tyr
85 90 95
Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys Gln Ala
100 105 110
Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu Phe Leu
115 120 125
Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys Tyr Ser
130 135 140
Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys Lys Met
145 150 155 160
Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp Tyr Gln
165 170 175
His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu Asp Arg
180 185 190
Thr Glu Glu Glu Phe Asn Tyr Tyr Phe Thr Thr Asn Lys Lys Gly Asn
195 200 205
Ile Thr Ala Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys
210 215 220
Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys Asp Asn
225 230 235 240
Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Ser Arg
245 250 255
Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp
260 265 270
Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu
275 280 285
Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val Pro Phe
290 295 300
Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys Asn
305 310 315 320
Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr
325 330 335
Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp Leu
340 345 350
Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln Lys
355 360 365
Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile Gln
370 375 380
Glu Phe Ala Lys Gln Asn Arg Thr Asp Glu Trp Lys Ala Ile Val Lys
385 390 395 400
Asp Phe Asp Thr Tyr Glu Thr Ser Glu Glu Pro Tyr Ile Ser Glu Thr
405 410 415
Ala Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe Arg
420 425 430
Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu Asn
435 440 445
Asn Glu Lys Arg Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala Glu Ala
450 455 460
Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu
465 470 475 480
Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile Val
485 490 495
Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Ile Tyr Lys Leu Tyr Asp
500 505 510
Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu Lys Tyr
515 520 525
Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met Val
530 535 540
Ala Ile Leu Tyr Asp Glu His Lys Asp Met Ala Glu Glu Ala Lys Arg
545 550 555 560
Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala Thr Leu
565 570 575
Glu Lys Gln Thr Gln Gly Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg
580 585 590
Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met Met
595 600 605
Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn Asn
610 615 620
Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala
625 630 635 640
Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val Asn
645 650 655
Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys Trp
660 665 670
Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu Thr Lys
675 680 685
Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys Asn
690 695 700
Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr Leu
705 710 715 720
Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr
725 730 735
Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Glu Glu
740 745 750
Tyr Glu Lys Val Glu Thr Leu Asp Arg Val Gly Leu Val Thr Lys Val
755 760 765
Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu Glu Tyr
770 775 780
Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln Pro Phe
785 790 795 800
Tyr Gly Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp Glu Lys
805 810 815
Asp Phe Leu Pro Ser Glu Glu Arg Lys Lys Leu Trp Gly Asp Lys Lys
820 825 830
Tyr Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys Leu Thr
835 840 845
Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln Ser Trp
850 855 860
Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile Val
865 870 875 880
Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val Glu Gly
885 890 895
Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile Asp Thr
900 905 910
Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val Met Pro
915 920 925
Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His Asn Ile
930 935 940
Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr Lys Thr
945 950 955 960
Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg
965 970 975
Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Thr Glu Leu
980 985 990
Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly Glu
995 1000 1005
Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu Leu Leu
1010 1015 1020
Glu Glu Thr Leu Ile Glu Lys Tyr Lys Thr Leu Pro Thr Asp Asn
1025 1030 1035
Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp Glu Ala
1040 1045 1050
Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val Ala Val
1055 1060 1065
Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn Arg Ile
1070 1075 1080
Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala Asp Thr
1085 1090 1095
Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys Asp Lys
1100 1105 1110
Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys Pro Ile
1115 1120 1125
Glu Thr Lys Glu
1130
<210> 114
<211> 1134
<212> PRT
<213> Prevotella intermedia
<400> 114
Met Lys Met Glu Asp Asp Lys Lys Thr Lys Glu Ser Thr Asn Met Leu
1 5 10 15
Asp Asn Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Val Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn
35 40 45
Lys Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala
50 55 60
Ile Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu
65 70 75 80
Arg Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala
85 90 95
Ile Tyr Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys
100 105 110
Gln Ala Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu
115 120 125
Phe Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys
130 135 140
Tyr Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys
145 150 155 160
Lys Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp
165 170 175
Tyr Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu
180 185 190
Asp Arg Thr Glu Glu Glu Phe Asn Tyr Tyr Phe Thr Thr Asn Lys Lys
195 200 205
Gly Asn Ile Thr Ala Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu
210 215 220
Glu Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys
225 230 235 240
Asp Asn Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg
245 250 255
Ser Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln
260 265 270
Asp Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys
275 280 285
Ser Leu Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val
290 295 300
Pro Phe Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe
305 310 315 320
Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu
325 330 335
Arg Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile
340 345 350
Asp Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly
355 360 365
Gln Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg
370 375 380
Ile Gln Glu Phe Ala Lys Gln Asn Arg Thr Asp Glu Trp Lys Ala Ile
385 390 395 400
Val Lys Asp Phe Asp Thr Tyr Glu Thr Ser Glu Glu Pro Tyr Ile Ser
405 410 415
Glu Thr Ala Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg
420 425 430
Phe Arg Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly
435 440 445
Glu Asn Asn Glu Lys Arg Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala
450 455 460
Glu Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr
465 470 475 480
Leu Leu Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser
485 490 495
Ile Val Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Ile Tyr Lys Leu
500 505 510
Tyr Asp Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu
515 520 525
Lys Tyr Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln
530 535 540
Met Val Ala Ile Leu Tyr Asp Glu His Lys Asp Met Ala Glu Glu Ala
545 550 555 560
Lys Arg Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala
565 570 575
Thr Leu Glu Lys Gln Thr Gln Gly Glu Ile Glu Asp Gly Gly Arg Asn
580 585 590
Ile Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp
595 600 605
Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu
610 615 620
Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser
625 630 635 640
Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln
645 650 655
Val Asn Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr
660 665 670
Lys Trp Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu
675 680 685
Thr Lys Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu
690 695 700
Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu
705 710 715 720
Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile
725 730 735
Phe Thr Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser
740 745 750
Glu Glu Tyr Glu Lys Val Glu Thr Leu Asp Arg Val Gly Leu Val Thr
755 760 765
Lys Val Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu
770 775 780
Glu Tyr Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln
785 790 795 800
Pro Phe Tyr Gly Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp
805 810 815
Glu Lys Asp Phe Leu Pro Ser Glu Glu Arg Lys Lys Leu Trp Gly Asp
820 825 830
Lys Lys Tyr Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys
835 840 845
Leu Thr Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln
850 855 860
Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp
865 870 875 880
Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val
885 890 895
Glu Gly Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile
900 905 910
Asp Thr Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val
915 920 925
Met Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His
930 935 940
Asn Ile Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr
945 950 955 960
Lys Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp
965 970 975
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Thr
980 985 990
Glu Leu Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu
995 1000 1005
Gly Glu Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu
1010 1015 1020
Leu Leu Glu Glu Thr Leu Ile Glu Lys Tyr Lys Thr Leu Pro Thr
1025 1030 1035
Asp Asn Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp
1040 1045 1050
Glu Ala Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val
1055 1060 1065
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn
1070 1075 1080
Arg Ile Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala
1085 1090 1095
Asp Thr Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys
1100 1105 1110
Asp Lys Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys
1115 1120 1125
Pro Ile Glu Thr Lys Glu
1130
<210> 115
<211> 1133
<212> PRT
<213> Prevotella intermedia
<400> 115
Met Glu Asp Asp Lys Lys Thr Thr Asp Ser Ile Ser Tyr Glu Leu Lys
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys
35 40 45
Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile
50 55 60
Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu Arg
65 70 75 80
Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala Ile
85 90 95
Tyr Ser Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys Gln
100 105 110
Ala Lys Ala Gln Ser Phe Asp Ser Leu Lys His Cys Leu Phe Leu Phe
115 120 125
Leu Glu Lys Leu Gln Glu Thr Arg Asn Tyr Tyr Ser His Tyr Lys Tyr
130 135 140
Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Lys Glu Leu Leu Lys Lys
145 150 155 160
Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp Tyr
165 170 175
Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu Asp
180 185 190
Arg Thr Glu Glu Asp Phe Asn Tyr Tyr Phe Thr Arg Asn Lys Lys Gly
195 200 205
Asn Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu
210 215 220
Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Arg Gly Phe Lys Asp
225 230 235 240
Asn Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Ser
245 250 255
Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp
260 265 270
Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser
275 280 285
Leu Tyr Glu Arg Leu Gln Gly Glu Asp Arg Glu Lys Phe Lys Val Pro
290 295 300
Phe Asp Pro Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys
305 310 315 320
Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg
325 330 335
Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp
340 345 350
Leu Gly Thr Phe His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln
355 360 365
Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile
370 375 380
Gln Glu Phe Ala Lys Gln Asn Arg Pro Asp Glu Trp Lys Ala Ile Val
385 390 395 400
Lys Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu
405 410 415
Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe
420 425 430
Arg Asn Asp Asn Asp Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu
435 440 445
Asn Asn Glu Lys Ser Lys Tyr Lys Leu Asp Lys Gln Tyr Gln Ala Glu
450 455 460
Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu
465 470 475 480
Leu Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile
485 490 495
Val Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Met Tyr Lys Leu Tyr
500 505 510
Asp Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Asp Asp Leu Glu Lys
515 520 525
Tyr Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met
530 535 540
Val Ala Ile Leu Tyr Asp Glu His Lys Asp Met Val Lys Glu Ala Lys
545 550 555 560
Arg Lys Gln Arg Lys Met Val Lys Asp Thr Glu Lys Leu Leu Ala Ala
565 570 575
Leu Glu Lys Gln Thr Gln Glu Lys Thr Glu Asp Gly Gly Arg Asn Ile
580 585 590
Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met
595 600 605
Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn
610 615 620
Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu
625 630 635 640
Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val
645 650 655
Asn Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys
660 665 670
Trp Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Ser Tyr Leu Thr
675 680 685
Lys Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys
690 695 700
Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr
705 710 715 720
Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe
725 730 735
Thr Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Lys
740 745 750
Glu Tyr Glu Lys Val Glu Ala Leu Asp Arg Val Gly Leu Val Thr Lys
755 760 765
Val Ile Pro Leu Phe Phe Lys Lys Glu Asp Ser Lys Asp Lys Glu Glu
770 775 780
Asp Leu Lys Lys Asp Ala Gln Lys Glu Ile Asn Asn Cys Val Gln Pro
785 790 795 800
Phe Tyr Ser Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro Asp Glu
805 810 815
Lys Asp Phe Leu His Arg Glu Glu Arg Ile Glu Leu Trp Asp Lys Lys
820 825 830
Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Val Lys Ser Lys Lys Leu
835 840 845
Thr Asp Lys Glu Lys Glu Glu Tyr Arg Ser Tyr Leu Glu Phe Gln Ser
850 855 860
Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile
865 870 875 880
Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys Val Glu
885 890 895
Gly Leu Asn Val Glu Glu Leu Lys Lys Leu Arg Leu Lys Asp Ile Asp
900 905 910
Thr Asp Thr Ala Lys Gln Glu Lys Asn Asn Ile Leu Asn Arg Val Met
915 920 925
Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Asp Ser His Asn
930 935 940
Ile Val Lys Asp Arg Pro Leu His Thr Val Tyr Ile Glu Glu Thr Lys
945 950 955 960
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg
965 970 975
Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Ser Ser Glu Ala Glu
980 985 990
Leu Lys Ser Asn Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly
995 1000 1005
Glu Tyr Gln Asn Ala Arg Ile Glu Thr Ile Lys Asp Met Leu Leu
1010 1015 1020
Leu Glu Glu Thr Leu Ile Glu Lys Tyr Lys Asn Leu Pro Thr Asp
1025 1030 1035
Asn Phe Ser Asp Met Leu Asn Gly Trp Leu Glu Gly Lys Asp Glu
1040 1045 1050
Ala Asp Lys Ala Arg Phe Gln Asn Asp Val Lys Leu Leu Val Ala
1055 1060 1065
Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asn Arg
1070 1075 1080
Ile Ala Phe Ala Asn Ile Asn Pro Phe Ser Leu Ser Ser Ala Asp
1085 1090 1095
Thr Ser Glu Glu Lys Lys Leu Asp Ile Ala Asn Gln Leu Lys Asp
1100 1105 1110
Lys Thr His Lys Ile Ile Lys Arg Ile Ile Glu Ile Glu Lys Pro
1115 1120 1125
Ile Glu Thr Lys Glu
1130
<210> 116
<211> 1127
<212> PRT
<213> Prevotella buccae
<400> 116
Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile
1 5 10 15
Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Lys Glu Lys Pro
20 25 30
Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe
35 40 45
Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn
50 55 60
Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly
65 70 75 80
Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val
85 90 95
Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala
100 105 110
Ala Tyr Glu Met Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg
115 120 125
Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val
130 135 140
Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser
145 150 155 160
His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser
165 170 175
Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val
180 185 190
Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe
195 200 205
Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile
210 215 220
Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met
225 230 235 240
Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys
245 250 255
Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg
260 265 270
Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile
275 280 285
Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met
290 295 300
Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr
305 310 315 320
Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp
325 330 335
Ile Phe Ser Asp Asp Tyr Asn Ala Glu Glu Glu Pro Phe Lys Asn Thr
340 345 350
Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe
355 360 365
Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly
370 375 380
Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu
385 390 395 400
Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp
405 410 415
Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp
420 425 430
Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala
435 440 445
Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser
450 455 460
Ala His Asn Asn Leu Phe Pro Ser Leu Gln Thr Asp Lys Thr Cys Asn
465 470 475 480
Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe
485 490 495
Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu
500 505 510
Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile
515 520 525
Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala
530 535 540
Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Arg Arg Leu Gln Asn
545 550 555 560
Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu
565 570 575
Lys Gly Arg Gln Lys Asp Met Gly Lys Glu Ala Glu Arg Lys Ile Gly
580 585 590
Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln
595 600 605
Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys
610 615 620
Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln
625 630 635 640
Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala
645 650 655
Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly
660 665 670
Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val
675 680 685
Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His
690 695 700
Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys
705 710 715 720
Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His
725 730 735
Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr
740 745 750
Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro
755 760 765
Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp
770 775 780
Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro
785 790 795 800
Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp
805 810 815
Tyr Pro Phe Asn Ile Gly Asn Arg Leu Lys Pro Lys Lys Arg Gln Phe
820 825 830
Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu
835 840 845
Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu
850 855 860
Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys
865 870 875 880
Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met
885 890 895
Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile
900 905 910
Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile
915 920 925
Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly
930 935 940
Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr
945 950 955 960
Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp
965 970 975
Arg Arg Leu Asn Gly Leu Phe Ser Phe Ala Glu Thr Thr Asp Leu Asn
980 985 990
Leu Glu Glu His Pro Ile Ser Lys Leu Ser Val Asp Leu Glu Leu Ile
995 1000 1005
Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly
1010 1015 1020
Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp
1025 1030 1035
Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn
1040 1045 1050
Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg
1055 1060 1065
Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu
1070 1075 1080
Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr
1085 1090 1095
Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val
1100 1105 1110
Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn
1115 1120 1125
<210> 117
<211> 1125
<212> PRT
<213> Prevotella pallens
<400> 117
Met Lys Glu Glu Glu Lys Gly Lys Thr Pro Val Val Ser Thr Tyr Asn
1 5 10 15
Lys Asp Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His
20 25 30
Asn Val Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Gly Glu Gly
35 40 45
Glu Ile Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Lys Ser Trp Asn
50 55 60
Glu Ile Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile
65 70 75 80
Lys His Phe Pro Phe Leu Glu Val Thr Thr Tyr Gln Arg Asn Ser Ala
85 90 95
Asp Thr Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu
100 105 110
Glu Ser Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp
115 120 125
Leu Arg Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg
130 135 140
Pro Lys Phe Glu Glu Asp Leu Gln Glu Lys Met Tyr Asn Ile Phe Asp
145 150 155 160
Ala Ser Ile Gln Leu Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile
165 170 175
Lys Thr Glu Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys
180 185 190
Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu
195 200 205
Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln
210 215 220
Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Glu Ser Tyr Gln Lys Met
225 230 235 240
Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg
245 250 255
Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn
260 265 270
Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu
275 280 285
Asp Arg Lys Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr
290 295 300
Asp Ala Glu Gln Glu Pro Phe Lys Asn Ala Leu Val Arg His Gln Asp
305 310 315 320
Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe
325 330 335
Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile
340 345 350
Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His
355 360 365
Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg
370 375 380
Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr
385 390 395 400
Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu
405 410 415
Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp
420 425 430
Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys
435 440 445
Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu
450 455 460
Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp
465 470 475 480
Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys
485 490 495
Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu
500 505 510
Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Lys Ile Asn Ser Ile
515 520 525
Asp Lys Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His
530 535 540
Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Ser Glu His Lys Asp Met
545 550 555 560
Ala Thr Glu Ala Lys Arg Lys Gln Glu Glu Met Leu Ala Asp Val Gln
565 570 575
Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn
580 585 590
Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Glu Ile Ala Ser Trp
595 600 605
Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu
610 615 620
Gly Asn Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met
625 630 635 640
Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg
645 650 655
Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Ser Asn Pro His Pro Phe
660 665 670
Leu Asn Asn Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe Tyr
675 680 685
Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys Pro
690 695 700
Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys
705 710 715 720
Thr Asn Cys Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu
725 730 735
Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu His
740 745 750
Arg Lys Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val Ala
755 760 765
Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val Gln
770 775 780
Pro Phe Tyr Asn Tyr Leu Phe Asn Val Gly Asn Ile Asn Lys Pro Asp
785 790 795 800
Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg Lys
805 810 815
Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu Asn
820 825 830
Pro Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu
835 840 845
Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met Glu
850 855 860
Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile Tyr
865 870 875 880
Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr Glu
885 890 895
Glu Lys Asn Gly Glu Glu Lys Ile Ile Lys Glu Lys Asn Asn Ile Leu
900 905 910
Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg Glu
915 920 925
Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe Phe
930 935 940
Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser Phe
965 970 975
Val Lys Thr His Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser Lys
980 985 990
Ser Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile Glu
995 1000 1005
Ile Ile Lys Asp Met Leu Ala Leu Glu Glu Thr Leu Ile Asp Lys
1010 1015 1020
Tyr Asn Ser Leu Asp Thr Asp Asn Phe His Asn Met Leu Thr Gly
1025 1030 1035
Trp Leu Lys Leu Lys Asp Glu Pro Asp Lys Ala Ser Phe Gln Asn
1040 1045 1050
Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn
1055 1060 1065
Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro
1070 1075 1080
Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu Gly
1085 1090 1095
Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu Lys
1100 1105 1110
Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu
1115 1120 1125
<210> 118
<211> 1157
<212> PRT
<213> Myroides odoratimimus
<400> 118
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala
225 230 235 240
Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp
245 250 255
Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu
260 265 270
Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu
275 280 285
Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys
290 295 300
Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu
305 310 315 320
Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu
325 330 335
Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln
340 345 350
His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu
355 360 365
Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg
370 375 380
Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr
385 390 395 400
Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg
405 410 415
Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln
420 425 430
Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val
435 440 445
Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Asn Tyr Phe His
450 455 460
Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu
465 470 475 480
Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His
485 490 495
Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu
500 505 510
Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys
515 520 525
Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp
530 535 540
Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys
545 550 555 560
Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp
565 570 575
Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys
580 585 590
Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys
595 600 605
Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys
610 615 620
Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr
625 630 635 640
Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu
645 650 655
Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe
660 665 670
Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu
675 680 685
Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met
690 695 700
Thr Glu Glu Phe Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu
705 710 715 720
Gln Lys Leu Phe Ala Tyr Tyr Asp Thr Ser Lys Ser Asp Leu Asp Leu
725 730 735
Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile
740 745 750
Ala Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr
755 760 765
Leu Glu Ala Arg Leu Gly Tyr Met Glu Asn Val Ile Thr Arg Val Lys
770 775 780
Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe
785 790 795 800
Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp Lys Gln
805 810 815
Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met
820 825 830
Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys
835 840 845
Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr
850 855 860
Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu Asp Lys
865 870 875 880
Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn
885 890 895
Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu
900 905 910
Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr
915 920 925
Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu
930 935 940
Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys
945 950 955 960
Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn
965 970 975
Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr
980 985 990
Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val Asp Ser
995 1000 1005
Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser
1010 1015 1020
Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys
1025 1030 1035
Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser
1040 1045 1050
Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Val Pro
1055 1060 1065
Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val
1070 1075 1080
Lys Phe Ile Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala Gly Glu
1085 1090 1095
Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe
1100 1105 1110
Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu
1115 1120 1125
Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr
1130 1135 1140
Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Thr Ser
1145 1150 1155
<210> 119
<211> 1157
<212> PRT
<213> Myroides odoratimimus
<400> 119
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala
225 230 235 240
Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp
245 250 255
Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu
260 265 270
Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu
275 280 285
Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys
290 295 300
Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu
305 310 315 320
Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu
325 330 335
Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln
340 345 350
His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu
355 360 365
Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg
370 375 380
Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr
385 390 395 400
Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg
405 410 415
Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln
420 425 430
Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val
435 440 445
Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr Phe His
450 455 460
Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu
465 470 475 480
Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His
485 490 495
Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu
500 505 510
Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys
515 520 525
Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp
530 535 540
Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys
545 550 555 560
Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp
565 570 575
Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys
580 585 590
Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys
595 600 605
Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys
610 615 620
Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr
625 630 635 640
Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu
645 650 655
Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe
660 665 670
Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu
675 680 685
Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met
690 695 700
Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu
705 710 715 720
Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu Glu Leu
725 730 735
Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile
740 745 750
Asp Leu Val Arg Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr
755 760 765
Leu Glu Ala Arg Leu Gly Tyr Ile Glu Asn Val Ile Thr Arg Val Lys
770 775 780
Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe
785 790 795 800
Ala Phe Leu Lys Glu Ser Asn Tyr Thr Val Ala Ser Leu Asp Lys Gln
805 810 815
Ile Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met
820 825 830
Asp Ser Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys
835 840 845
Glu Asp Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr
850 855 860
Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Ile Thr Glu Asp Lys
865 870 875 880
Arg Glu Gln Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn
885 890 895
Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu
900 905 910
Lys Leu Pro Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr
915 920 925
Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu
930 935 940
Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys
945 950 955 960
Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn
965 970 975
Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr
980 985 990
Gln Ser Asp Ile Val Trp Ser Gly Tyr Leu Ser Asn Glu Val Asp Ser
995 1000 1005
Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser
1010 1015 1020
Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys
1025 1030 1035
Ile Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser
1040 1045 1050
Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Leu Pro
1055 1060 1065
Arg Gly Thr Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val
1070 1075 1080
Lys Phe Lys Lys Glu Glu Ile Met Gln Leu Gly Gln Val Arg Glu
1085 1090 1095
Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe
1100 1105 1110
Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu
1115 1120 1125
Asn Asn Tyr Arg Pro Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr
1130 1135 1140
Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala Ser
1145 1150 1155
<210> 120
<211> 1224
<212> PRT
<213> Bergeyella zoohelcum
<400> 120
Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe
1 5 10 15
Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Phe Asn Ala Ala Met
20 25 30
Glu Asn Thr Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly
35 40 45
Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn
50 55 60
Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr
65 70 75 80
Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu
85 90 95
Arg Lys Glu Asn Phe Lys Lys Asn Phe Lys Gly Ile Ile Lys Ala Val
100 105 110
Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu
115 120 125
Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr
130 135 140
Val Leu Thr Val Lys Lys Lys Lys Val Lys Thr Asp Lys Thr Lys Glu
145 150 155 160
Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys
165 170 175
Lys Leu Glu Tyr Leu Arg Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg
180 185 190
Arg Asn Gln Arg Glu Arg Gly Glu Lys Glu Leu Val Ala Pro Phe Lys
195 200 205
Tyr Ser Asp Lys Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala
210 215 220
Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser
225 230 235 240
Lys Ala Lys Tyr Asn Thr Lys Ser Asp Pro Gln Gln Glu Glu Gly Asp
245 250 255
Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu
260 265 270
Phe Leu Thr Lys Gln Glu Ile His Ala Phe Lys Ser Lys Ile Ala Gly
275 280 285
Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser Glu Ala Thr Val
290 295 300
Ser His Gly Lys Asn Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe
305 310 315 320
Ser His Leu Ala Tyr Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu
325 330 335
Ile Asn Tyr Gly Glu Ala Glu Asn Ala Glu Gln Leu Ser Val Tyr Ala
340 345 350
Lys Glu Thr Leu Met Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro
355 360 365
Asp Val Val Tyr Gln Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile
370 375 380
Glu Asp Trp Asn Glu Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr
385 390 395 400
Met Glu Glu Glu Gln Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu
405 410 415
Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln
420 425 430
Phe Pro Thr Leu Arg Phe Gln Val His Leu Gly Asn Tyr Leu His Asp
435 440 445
Ser Arg Pro Lys Glu Asn Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys
450 455 460
Ile Thr Val Phe Gly Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu
465 470 475 480
Phe Ile Lys Asn Thr Glu Thr Asn Glu Asp Arg Glu His Tyr Trp Glu
485 490 495
Ile Phe Pro Asn Pro Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val
500 505 510
Asn Asp Lys Asp Phe Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys
515 520 525
Gln Pro Val Ala Gly Lys Ile Gly Ile Lys Val Lys Leu Leu Asn Gln
530 535 540
Gln Tyr Val Ser Glu Val Asp Lys Ala Val Lys Ala His Gln Leu Lys
545 550 555 560
Gln Arg Lys Ala Ser Lys Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile
565 570 575
Val Pro Ile Asn Glu Ser Asn Pro Lys Glu Ala Ile Val Phe Gly Gly
580 585 590
Gln Pro Thr Ala Tyr Leu Ser Met Asn Asp Ile His Ser Ile Leu Tyr
595 600 605
Glu Phe Phe Asp Lys Trp Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys
610 615 620
Gly Glu Lys Glu Leu Arg Lys Glu Ile Gly Lys Glu Leu Glu Lys Lys
625 630 635 640
Ile Val Gly Lys Ile Gln Ala Gln Ile Gln Gln Ile Ile Asp Lys Asp
645 650 655
Thr Asn Ala Lys Ile Leu Lys Pro Tyr Gln Asp Gly Asn Ser Thr Ala
660 665 670
Ile Asp Lys Glu Lys Leu Ile Lys Asp Leu Lys Gln Glu Gln Asn Ile
675 680 685
Leu Gln Lys Leu Lys Asp Glu Gln Thr Val Arg Glu Lys Glu Tyr Asn
690 695 700
Asp Phe Ile Ala Tyr Gln Asp Lys Asn Arg Glu Ile Asn Lys Val Arg
705 710 715 720
Asp Arg Asn His Lys Gln Tyr Leu Lys Asp Asn Leu Lys Arg Lys Tyr
725 730 735
Pro Glu Ala Pro Ala Arg Lys Glu Val Leu Tyr Tyr Arg Glu Lys Gly
740 745 750
Lys Val Ala Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Thr
755 760 765
Asp Phe Lys Asn Glu Trp Lys Gly Glu Gln His Ser Leu Leu Gln Lys
770 775 780
Ser Leu Ala Tyr Tyr Glu Gln Cys Lys Glu Glu Leu Lys Asn Leu Leu
785 790 795 800
Pro Glu Lys Val Phe Gln His Leu Pro Phe Lys Leu Gly Gly Tyr Phe
805 810 815
Gln Gln Lys Tyr Leu Tyr Gln Phe Tyr Thr Cys Tyr Leu Asp Lys Arg
820 825 830
Leu Glu Tyr Ile Ser Gly Leu Val Gln Gln Ala Glu Asn Phe Lys Ser
835 840 845
Glu Asn Lys Val Phe Lys Lys Val Glu Asn Glu Cys Phe Lys Phe Leu
850 855 860
Lys Lys Gln Asn Tyr Thr His Lys Glu Leu Asp Ala Arg Val Gln Ser
865 870 875 880
Ile Leu Gly Tyr Pro Ile Phe Leu Glu Arg Gly Phe Met Asp Glu Lys
885 890 895
Pro Thr Ile Ile Lys Gly Lys Thr Phe Lys Gly Asn Glu Ala Leu Phe
900 905 910
Ala Asp Trp Phe Arg Tyr Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe
915 920 925
Tyr Asp Thr Glu Asn Tyr Pro Leu Val Glu Leu Glu Lys Lys Gln Ala
930 935 940
Asp Arg Lys Arg Lys Thr Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val
945 950 955 960
Phe Thr Leu Leu Met Ala Lys His Ile Phe Lys Ser Val Phe Lys Gln
965 970 975
Asp Ser Ile Asp Gln Phe Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu
980 985 990
Glu Arg Leu Gly Asn Gln Glu Arg Ala Arg Gln Thr Gly Glu Arg Asn
995 1000 1005
Thr Asn Tyr Ile Trp Asn Lys Thr Val Asp Leu Lys Leu Cys Asp
1010 1015 1020
Gly Lys Ile Thr Val Glu Asn Val Lys Leu Lys Asn Val Gly Asp
1025 1030 1035
Phe Ile Lys Tyr Glu Tyr Asp Gln Arg Val Gln Ala Phe Leu Lys
1040 1045 1050
Tyr Glu Glu Asn Ile Glu Trp Gln Ala Phe Leu Ile Lys Glu Ser
1055 1060 1065
Lys Glu Glu Glu Asn Tyr Pro Tyr Val Val Glu Arg Glu Ile Glu
1070 1075 1080
Gln Tyr Glu Lys Val Arg Arg Glu Glu Leu Leu Lys Glu Val His
1085 1090 1095
Leu Ile Glu Glu Tyr Ile Leu Glu Lys Val Lys Asp Lys Glu Ile
1100 1105 1110
Leu Lys Lys Gly Asp Asn Gln Asn Phe Lys Tyr Tyr Ile Leu Asn
1115 1120 1125
Gly Leu Leu Lys Gln Leu Lys Asn Glu Asp Val Glu Ser Tyr Lys
1130 1135 1140
Val Phe Asn Leu Asn Thr Glu Pro Glu Asp Val Asn Ile Asn Gln
1145 1150 1155
Leu Lys Gln Glu Ala Thr Asp Leu Glu Gln Lys Ala Phe Val Leu
1160 1165 1170
Thr Tyr Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Lys Lys
1175 1180 1185
Glu Phe Trp Asp Tyr Cys Gln Glu Lys Tyr Gly Lys Ile Glu Lys
1190 1195 1200
Glu Lys Thr Tyr Ala Glu Tyr Phe Ala Glu Val Phe Lys Lys Glu
1205 1210 1215
Lys Glu Ala Leu Ile Lys
1220
<210> 121
<211> 1150
<212> PRT
<213> Prevotella saccharolytica
<400> 121
Met Met Glu Lys Glu Asn Val Gln Gly Ser His Ile Tyr Tyr Glu Pro
1 5 10 15
Thr Asp Lys Cys Phe Trp Ala Ala Phe Tyr Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Leu Thr Ile Ala His Ile Asn Ser Phe Val Asn Ser Lys Lys
35 40 45
Gly Ile Asn Asn Asp Asp Lys Val Leu Asp Ile Ile Asp Asp Trp Ser
50 55 60
Lys Phe Asp Asn Asp Leu Leu Met Gly Ala Arg Leu Asn Lys Leu Ile
65 70 75 80
Leu Lys His Phe Pro Phe Leu Lys Ala Pro Leu Tyr Gln Leu Ala Lys
85 90 95
Arg Lys Thr Arg Lys Gln Gln Gly Lys Glu Gln Gln Asp Tyr Glu Lys
100 105 110
Lys Gly Asp Glu Asp Pro Glu Val Ile Gln Glu Ala Ile Ala Asn Ala
115 120 125
Phe Lys Met Ala Asn Val Arg Lys Thr Leu His Ala Phe Leu Lys Gln
130 135 140
Leu Glu Asp Leu Arg Asn His Phe Ser His Tyr Asn Tyr Asn Ser Pro
145 150 155 160
Ala Lys Lys Met Glu Val Lys Phe Asp Asp Gly Phe Cys Asn Lys Leu
165 170 175
Tyr Tyr Val Phe Asp Ala Ala Leu Gln Met Val Lys Asp Asp Asn Arg
180 185 190
Met Asn Pro Glu Ile Asn Met Gln Thr Asp Phe Glu His Leu Val Arg
195 200 205
Leu Gly Arg Asn Arg Lys Ile Pro Asn Thr Phe Lys Tyr Asn Phe Thr
210 215 220
Asn Ser Asp Gly Thr Ile Asn Asn Asn Gly Leu Leu Phe Phe Val Ser
225 230 235 240
Leu Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Lys
245 250 255
Gly Phe Lys Gly Gly Thr Glu Asn Tyr Met Arg Met Thr Asn Glu Val
260 265 270
Phe Cys Arg Asn Arg Met Val Ile Pro Lys Leu Arg Leu Glu Thr Asp
275 280 285
Tyr Asp Asn His Gln Leu Met Phe Asp Met Leu Asn Glu Leu Val Arg
290 295 300
Cys Pro Leu Ser Leu Tyr Lys Arg Leu Lys Gln Glu Asp Gln Asp Lys
305 310 315 320
Phe Arg Val Pro Ile Glu Phe Leu Asp Glu Asp Asn Glu Ala Asp Asn
325 330 335
Pro Tyr Gln Glu Asn Ala Asn Ser Asp Glu Asn Pro Thr Glu Glu Thr
340 345 350
Asp Pro Leu Lys Asn Thr Leu Val Arg His Gln His Arg Phe Pro Tyr
355 360 365
Phe Val Leu Arg Tyr Phe Asp Leu Asn Glu Val Phe Lys Gln Leu Arg
370 375 380
Phe Gln Ile Asn Leu Gly Cys Tyr His Phe Ser Ile Tyr Asp Lys Thr
385 390 395 400
Ile Gly Glu Arg Thr Glu Lys Arg His Leu Thr Arg Thr Leu Phe Gly
405 410 415
Phe Asp Arg Leu Gln Asn Phe Ser Val Lys Leu Gln Pro Glu His Trp
420 425 430
Lys Asn Met Val Lys His Leu Asp Thr Glu Glu Ser Ser Asp Lys Pro
435 440 445
Tyr Leu Ser Asp Ala Met Pro His Tyr Gln Ile Glu Asn Glu Lys Ile
450 455 460
Gly Ile His Phe Leu Lys Thr Asp Thr Glu Lys Lys Glu Thr Val Trp
465 470 475 480
Pro Ser Leu Glu Val Glu Glu Val Ser Ser Asn Arg Asn Lys Tyr Lys
485 490 495
Ser Glu Lys Asn Leu Thr Ala Asp Ala Phe Leu Ser Thr His Glu Leu
500 505 510
Leu Pro Met Met Phe Tyr Tyr Gln Leu Leu Ser Ser Glu Glu Lys Thr
515 520 525
Arg Ala Ala Ala Gly Asp Lys Val Gln Gly Val Leu Gln Ser Tyr Arg
530 535 540
Lys Lys Ile Phe Asp Ile Tyr Asp Asp Phe Ala Asn Gly Thr Ile Asn
545 550 555 560
Ser Met Gln Lys Leu Asp Glu Arg Leu Ala Lys Asp Asn Leu Leu Arg
565 570 575
Gly Asn Met Pro Gln Gln Met Leu Ala Ile Leu Glu His Gln Glu Pro
580 585 590
Asp Met Glu Gln Lys Ala Lys Glu Lys Leu Asp Arg Leu Ile Thr Glu
595 600 605
Thr Lys Lys Arg Ile Gly Lys Leu Glu Asp Gln Phe Lys Gln Lys Val
610 615 620
Arg Ile Gly Lys Arg Arg Ala Asp Leu Pro Lys Val Gly Ser Ile Ala
625 630 635 640
Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln Pro Ala Lys Arg Asn
645 650 655
Ala Asp Asn Thr Gly Val Pro Asp Ser Lys Ala Asn Ser Thr Glu Tyr
660 665 670
Arg Leu Leu Gln Glu Ala Leu Ala Phe Tyr Ser Ala Tyr Lys Asp Arg
675 680 685
Leu Glu Pro Tyr Phe Arg Gln Val Asn Leu Ile Gly Gly Thr Asn Pro
690 695 700
His Pro Phe Leu His Arg Val Asp Trp Lys Lys Cys Asn His Leu Leu
705 710 715 720
Ser Phe Tyr His Asp Tyr Leu Glu Ala Lys Glu Gln Tyr Leu Ser His
725 730 735
Leu Ser Pro Ala Asp Trp Gln Lys His Gln His Phe Leu Leu Leu Lys
740 745 750
Val Arg Lys Asp Ile Gln Asn Glu Lys Lys Asp Trp Lys Lys Ser Leu
755 760 765
Val Ala Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Leu Phe Thr
770 775 780
Glu Ser Ile Lys Thr Trp Phe Ser Thr Asp Ala Asp Lys Val Gln Ile
785 790 795 800
Thr Asp Thr Lys Leu Phe Glu Asn Arg Val Gly Leu Ile Ala Lys Leu
805 810 815
Ile Pro Leu Tyr Tyr Asp Lys Val Tyr Asn Asp Lys Pro Gln Pro Phe
820 825 830
Tyr Gln Tyr Pro Phe Asn Ile Asn Asp Arg Tyr Lys Pro Glu Asp Thr
835 840 845
Arg Lys Arg Phe Thr Ala Ala Ser Ser Lys Leu Trp Asn Glu Lys Lys
850 855 860
Met Leu Tyr Lys Asn Ala Gln Pro Asp Ser Ser Asp Lys Ile Glu Tyr
865 870 875 880
Pro Gln Tyr Leu Asp Phe Leu Ser Trp Lys Lys Leu Glu Arg Glu Leu
885 890 895
Arg Met Leu Arg Asn Gln Asp Met Met Val Trp Leu Met Cys Lys Asp
900 905 910
Leu Phe Ala Gln Cys Thr Val Glu Gly Val Glu Phe Ala Asp Leu Lys
915 920 925
Leu Ser Gln Leu Glu Val Asp Val Asn Val Gln Asp Asn Leu Asn Val
930 935 940
Leu Asn Asn Val Ser Ser Met Ile Leu Pro Leu Ser Val Tyr Pro Ser
945 950 955 960
Asp Ala Gln Gly Asn Val Leu Arg Asn Ser Lys Pro Leu His Thr Val
965 970 975
Tyr Val Gln Glu Asn Asn Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys
980 985 990
Ser Leu Leu Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Ala
995 1000 1005
Ala Glu Gly Glu Asp Leu Gln Gln His Pro Leu Thr Lys Asn Arg
1010 1015 1020
Leu Glu Tyr Glu Leu Ser Ile Tyr Gln Thr Met Arg Ile Ser Val
1025 1030 1035
Phe Glu Gln Thr Leu Gln Leu Glu Lys Ala Ile Leu Thr Arg Asn
1040 1045 1050
Lys Thr Leu Cys Gly Asn Asn Phe Asn Asn Leu Leu Asn Ser Trp
1055 1060 1065
Ser Glu His Arg Thr Asp Lys Lys Thr Leu Gln Pro Asp Ile Asp
1070 1075 1080
Phe Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro
1085 1090 1095
Met Ser Thr Asn Thr Val Met Gln Gly Ile Glu Lys Phe Asn Ile
1100 1105 1110
Gln Thr Pro Lys Leu Glu Glu Lys Asp Gly Leu Gly Ile Ala Ser
1115 1120 1125
Gln Leu Ala Lys Lys Thr Lys Asp Ala Ala Ser Arg Leu Gln Asn
1130 1135 1140
Ile Ile Asn Gly Gly Thr Asn
1145 1150
<210> 122
<211> 1175
<212> PRT
<213> Porphyromonas gingivalis
<400> 122
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala
500 505 510
Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp
530 535 540
Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Asn Ala Ser Arg Glu Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr Leu Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr
945 950 955 960
Asp Val His Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Gln Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr
1055 1060 1065
Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Thr Leu Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Met Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 123
<211> 1115
<212> PRT
<213> Bacteroides pyogenes
<400> 123
Met Glu Ser Ile Lys Asn Ser Gln Lys Ser Thr Gly Lys Thr Leu Gln
1 5 10 15
Lys Asp Pro Pro Tyr Phe Gly Leu Tyr Leu Asn Met Ala Leu Leu Asn
20 25 30
Val Arg Lys Val Glu Asn His Ile Arg Lys Trp Leu Gly Asp Val Ala
35 40 45
Leu Leu Pro Glu Lys Ser Gly Phe His Ser Leu Leu Thr Thr Asp Asn
50 55 60
Leu Ser Ser Ala Lys Trp Thr Arg Phe Tyr Tyr Lys Ser Arg Lys Phe
65 70 75 80
Leu Pro Phe Leu Glu Met Phe Asp Ser Asp Lys Lys Ser Tyr Glu Asn
85 90 95
Arg Arg Glu Thr Thr Glu Cys Leu Asp Thr Ile Asp Arg Gln Lys Ile
100 105 110
Ser Ser Leu Leu Lys Glu Val Tyr Gly Lys Leu Gln Asp Ile Arg Asn
115 120 125
Ala Phe Ser His Tyr His Ile Asp Asp Gln Ser Val Lys His Thr Ala
130 135 140
Leu Ile Ile Ser Ser Glu Met His Arg Phe Ile Glu Asn Ala Tyr Ser
145 150 155 160
Phe Ala Leu Gln Lys Thr Arg Ala Arg Phe Thr Gly Val Phe Val Glu
165 170 175
Thr Asp Phe Leu Gln Ala Glu Glu Lys Gly Asp Asn Lys Lys Phe Phe
180 185 190
Ala Ile Gly Gly Asn Glu Gly Ile Lys Leu Lys Asp Asn Ala Leu Ile
195 200 205
Phe Leu Ile Cys Leu Phe Leu Asp Arg Glu Glu Ala Phe Lys Phe Leu
210 215 220
Ser Arg Ala Thr Gly Phe Lys Ser Thr Lys Glu Lys Gly Phe Leu Ala
225 230 235 240
Val Arg Glu Thr Phe Cys Ala Leu Cys Cys Arg Gln Pro His Glu Arg
245 250 255
Leu Leu Ser Val Asn Pro Arg Glu Ala Leu Leu Met Asp Met Leu Asn
260 265 270
Glu Leu Asn Arg Cys Pro Asp Ile Leu Phe Glu Met Leu Asp Glu Lys
275 280 285
Asp Gln Lys Ser Phe Leu Pro Leu Leu Gly Glu Glu Glu Gln Ala His
290 295 300
Ile Leu Glu Asn Ser Leu Asn Asp Glu Leu Cys Glu Ala Ile Asp Asp
305 310 315 320
Pro Phe Glu Met Ile Ala Ser Leu Ser Lys Arg Val Arg Tyr Lys Asn
325 330 335
Arg Phe Pro Tyr Leu Met Leu Arg Tyr Ile Glu Glu Lys Asn Leu Leu
340 345 350
Pro Phe Ile Arg Phe Arg Ile Asp Leu Gly Cys Leu Glu Leu Ala Ser
355 360 365
Tyr Pro Lys Lys Met Gly Glu Glu Asn Asn Tyr Glu Arg Ser Val Thr
370 375 380
Asp His Ala Met Ala Phe Gly Arg Leu Thr Asp Phe His Asn Glu Asp
385 390 395 400
Ala Val Leu Gln Gln Ile Thr Lys Gly Ile Thr Asp Glu Val Arg Phe
405 410 415
Ser Leu Tyr Ala Pro Arg Tyr Ala Ile Tyr Asn Asn Lys Ile Gly Phe
420 425 430
Val Arg Thr Gly Gly Ser Asp Lys Ile Ser Phe Pro Thr Leu Lys Lys
435 440 445
Lys Gly Gly Glu Gly His Cys Val Ala Tyr Thr Leu Gln Asn Thr Lys
450 455 460
Ser Phe Gly Phe Ile Ser Ile Tyr Asp Leu Arg Lys Ile Leu Leu Leu
465 470 475 480
Ser Phe Leu Asp Lys Asp Lys Ala Lys Asn Ile Val Ser Gly Leu Leu
485 490 495
Glu Gln Cys Glu Lys His Trp Lys Asp Leu Ser Glu Asn Leu Phe Asp
500 505 510
Ala Ile Arg Thr Glu Leu Gln Lys Glu Phe Pro Val Pro Leu Ile Arg
515 520 525
Tyr Thr Leu Pro Arg Ser Lys Gly Gly Lys Leu Val Ser Ser Lys Leu
530 535 540
Ala Asp Lys Gln Glu Lys Tyr Glu Ser Glu Phe Glu Arg Arg Lys Glu
545 550 555 560
Lys Leu Thr Glu Ile Leu Ser Glu Lys Asp Phe Asp Leu Ser Gln Ile
565 570 575
Pro Arg Arg Met Ile Asp Glu Trp Leu Asn Val Leu Pro Thr Ser Arg
580 585 590
Glu Lys Lys Leu Lys Gly Tyr Val Glu Thr Leu Lys Leu Asp Cys Arg
595 600 605
Glu Arg Leu Arg Val Phe Glu Lys Arg Glu Lys Gly Glu His Pro Val
610 615 620
Pro Pro Arg Ile Gly Glu Met Ala Thr Asp Leu Ala Lys Asp Ile Ile
625 630 635 640
Arg Met Val Ile Asp Gln Gly Val Lys Gln Arg Ile Thr Ser Ala Tyr
645 650 655
Tyr Ser Glu Ile Gln Arg Cys Leu Ala Gln Tyr Ala Gly Asp Asp Asn
660 665 670
Arg Arg His Leu Asp Ser Ile Ile Arg Glu Leu Arg Leu Lys Asp Thr
675 680 685
Lys Asn Gly His Pro Phe Leu Gly Lys Val Leu Arg Pro Gly Leu Gly
690 695 700
His Thr Glu Lys Leu Tyr Gln Arg Tyr Phe Glu Glu Lys Lys Glu Trp
705 710 715 720
Leu Glu Ala Thr Phe Tyr Pro Ala Ala Ser Pro Lys Arg Val Pro Arg
725 730 735
Phe Val Asn Pro Pro Thr Gly Lys Gln Lys Glu Leu Pro Leu Ile Ile
740 745 750
Arg Asn Leu Met Lys Glu Arg Pro Glu Trp Arg Asp Trp Lys Gln Arg
755 760 765
Lys Asn Ser His Pro Ile Asp Leu Pro Ser Gln Leu Phe Glu Asn Glu
770 775 780
Ile Cys Arg Leu Leu Lys Asp Lys Ile Gly Lys Glu Pro Ser Gly Lys
785 790 795 800
Leu Lys Trp Asn Glu Met Phe Lys Leu Tyr Trp Asp Lys Glu Phe Pro
805 810 815
Asn Gly Met Gln Arg Phe Tyr Arg Cys Lys Arg Arg Val Glu Val Phe
820 825 830
Asp Lys Val Val Glu Tyr Glu Tyr Ser Glu Glu Gly Gly Asn Tyr Lys
835 840 845
Lys Tyr Tyr Glu Ala Leu Ile Asp Glu Val Val Arg Gln Lys Ile Ser
850 855 860
Ser Ser Lys Glu Lys Ser Lys Leu Gln Val Glu Asp Leu Thr Leu Ser
865 870 875 880
Val Arg Arg Val Phe Lys Arg Ala Ile Asn Glu Lys Glu Tyr Gln Leu
885 890 895
Arg Leu Leu Cys Glu Asp Asp Arg Leu Leu Phe Met Ala Val Arg Asp
900 905 910
Leu Tyr Asp Trp Lys Glu Ala Gln Leu Asp Leu Asp Lys Ile Asp Asn
915 920 925
Met Leu Gly Glu Pro Val Ser Val Ser Gln Val Ile Gln Leu Glu Gly
930 935 940
Gly Gln Pro Asp Ala Val Ile Lys Ala Glu Cys Lys Leu Lys Asp Val
945 950 955 960
Ser Lys Leu Met Arg Tyr Cys Tyr Asp Gly Arg Val Lys Gly Leu Met
965 970 975
Pro Tyr Phe Ala Asn His Glu Ala Thr Gln Glu Gln Val Glu Met Glu
980 985 990
Leu Arg His Tyr Glu Asp His Arg Arg Arg Val Phe Asn Trp Val Phe
995 1000 1005
Ala Leu Glu Lys Ser Val Leu Lys Asn Glu Lys Leu Arg Arg Phe
1010 1015 1020
Tyr Glu Glu Ser Gln Gly Gly Cys Glu His Arg Arg Cys Ile Asp
1025 1030 1035
Ala Leu Arg Lys Ala Ser Leu Val Ser Glu Glu Glu Tyr Glu Phe
1040 1045 1050
Leu Val His Ile Arg Asn Lys Ser Ala His Asn Gln Phe Pro Asp
1055 1060 1065
Leu Glu Ile Gly Lys Leu Pro Pro Asn Val Thr Ser Gly Phe Cys
1070 1075 1080
Glu Cys Ile Trp Ser Lys Tyr Lys Ala Ile Ile Cys Arg Ile Ile
1085 1090 1095
Pro Phe Ile Asp Pro Glu Arg Arg Phe Phe Gly Lys Leu Leu Glu
1100 1105 1110
Gln Lys
1115
<210> 124
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 124
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 125
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 125
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 126
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 126
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Ile Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Ile Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 127
<211> 1125
<212> PRT
<213> Prevotella intermedia
<400> 127
Met Lys Met Glu Asp Asp Lys Lys Thr Thr Glu Ser Thr Asn Met Leu
1 5 10 15
Asp Asn Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Val Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn
35 40 45
Lys Lys Asp Gln Asp Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala
50 55 60
Ile Lys Thr His Trp Glu Lys Val Asn Gly Asp Leu Asn Lys Thr Glu
65 70 75 80
Arg Leu Arg Glu Leu Met Thr Lys His Phe Pro Phe Leu Glu Thr Ala
85 90 95
Ile Tyr Thr Lys Asn Lys Glu Asp Lys Glu Glu Val Lys Gln Glu Lys
100 105 110
Gln Ala Glu Ala Gln Ser Leu Glu Ser Leu Lys Asp Cys Leu Phe Leu
115 120 125
Phe Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys
130 135 140
Tyr Ser Glu Ser Thr Lys Glu Pro Met Leu Glu Glu Gly Leu Leu Glu
145 150 155 160
Lys Met Tyr Asn Ile Phe Asp Asp Asn Ile Gln Leu Val Ile Lys Asp
165 170 175
Tyr Gln His Asn Lys Asp Ile Asn Pro Asp Glu Asp Phe Lys His Leu
180 185 190
Asp Arg Lys Gly Gln Phe Lys Tyr Ser Phe Ala Asp Asn Glu Gly Asn
195 200 205
Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu Lys
210 215 220
Lys Asp Ala Ile Trp Met Gln Gln Lys Leu Thr Gly Phe Lys Asp Asn
225 230 235 240
Arg Glu Ser Lys Lys Lys Met Thr His Glu Val Phe Cys Arg Arg Arg
245 250 255
Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp
260 265 270
Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu
275 280 285
Tyr Glu Arg Leu Gln Gly Glu Tyr Arg Lys Lys Phe Asn Val Pro Phe
290 295 300
Asp Ser Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys Asn
305 310 315 320
Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr
325 330 335
Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp Leu
340 345 350
Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Gln Lys
355 360 365
Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile Gln
370 375 380
Glu Phe Ala Lys Gln Asn Arg Pro Asp Glu Trp Lys Ala Leu Val Lys
385 390 395 400
Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu Thr
405 410 415
Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe Arg
420 425 430
Asn Gly Asn Lys Glu Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu Asn
435 440 445
Asn Glu Lys Ser Lys Tyr Lys Leu Asp Lys Pro Tyr Gln Ala Glu Ala
450 455 460
Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu
465 470 475 480
Leu Lys Lys Glu Glu Pro Asn Asn Asp Lys Lys Asn Ala Ser Ile Val
485 490 495
Glu Gly Phe Ile Lys Arg Glu Ile Arg Asp Met Tyr Lys Leu Tyr Asp
500 505 510
Ala Phe Ala Asn Gly Glu Ile Asn Asn Ile Gly Asp Leu Glu Lys Tyr
515 520 525
Cys Glu Asp Lys Gly Ile Pro Lys Arg His Leu Pro Lys Gln Met Val
530 535 540
Ala Ile Leu Tyr Asp Glu Pro Lys Asp Met Val Lys Glu Ala Lys Arg
545 550 555 560
Lys Gln Lys Glu Met Val Lys Asp Thr Lys Lys Leu Leu Ala Thr Leu
565 570 575
Glu Lys Gln Thr Gln Glu Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg
580 585 590
Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met Met
595 600 605
Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Asn Pro Leu Asn Asn
610 615 620
Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala
625 630 635 640
Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val Asn
645 650 655
Leu Ile Asn Ser Ser Asn Pro His Pro Phe Leu Lys Trp Thr Lys Trp
660 665 670
Glu Glu Cys Asn Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Thr Lys
675 680 685
Lys Ile Glu Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Glu Lys Asn
690 695 700
Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn Arg Glu Thr Leu
705 710 715 720
Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr
725 730 735
Glu Pro Ile Arg Glu Trp Phe Lys Arg His Gln Asn Asp Ser Lys Glu
740 745 750
Tyr Glu Lys Val Glu Ala Leu Lys Arg Val Gly Leu Val Thr Lys Val
755 760 765
Ile Pro Leu Phe Phe Lys Glu Glu Tyr Phe Lys Glu Asp Ala Gln Lys
770 775 780
Glu Ile Asn Asn Cys Val Gln Pro Phe Tyr Ser Phe Pro Tyr Asn Val
785 790 795 800
Gly Asn Ile His Lys Pro Asp Glu Lys Asp Phe Leu Pro Ser Glu Glu
805 810 815
Arg Lys Lys Leu Trp Gly Asp Lys Lys Asp Lys Phe Lys Gly Tyr Lys
820 825 830
Ala Lys Val Lys Ser Lys Lys Leu Thr Asp Lys Glu Lys Glu Glu Tyr
835 840 845
Arg Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu
850 855 860
Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Thr Glu
865 870 875 880
Leu Ile Asp Lys Met Lys Val Glu Gly Leu Asn Val Glu Glu Leu Gln
885 890 895
Lys Leu Arg Leu Lys Asp Ile Asp Thr Asp Thr Ala Lys Gln Glu Lys
900 905 910
Asn Asn Ile Leu Asn Arg Ile Met Pro Met Gln Leu Pro Val Thr Val
915 920 925
Tyr Glu Ile Asp Asp Ser His Asn Ile Val Lys Asp Arg Pro Leu His
930 935 940
Thr Val Tyr Ile Glu Glu Thr Lys Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Ser Ser Lys Ala Glu Leu Lys Asp Lys Pro Ile Ser Lys
980 985 990
Ser Val Val Glu Tyr Glu Leu Gly Glu Tyr Gln Asn Ala Arg Ile Glu
995 1000 1005
Thr Ile Lys Asp Met Leu Leu Leu Glu Lys Thr Leu Ile Lys Lys
1010 1015 1020
Tyr Glu Lys Leu Pro Thr Asp Asn Phe Ser Asp Met Leu Asn Gly
1025 1030 1035
Trp Leu Glu Gly Lys Asp Glu Ser Asp Lys Ala Arg Phe Gln Asn
1040 1045 1050
Asp Val Lys Leu Leu Val Ala Val Arg Asn Ala Phe Ser His Asn
1055 1060 1065
Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro
1070 1075 1080
Phe Ser Leu Ser Ser Ala Asp Ile Ser Glu Glu Lys Lys Leu Asp
1085 1090 1095
Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Ile Ile Lys Lys
1100 1105 1110
Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu
1115 1120 1125
<210> 128
<211> 1161
<212> PRT
<213> Bacteroidetes bacterium
<400> 128
Met Glu Asn Gln Thr Gln Lys Gly Lys Gly Ile Tyr Tyr Tyr Tyr Thr
1 5 10 15
Lys Asn Glu Asp Lys His Tyr Phe Gly Ser Phe Leu Asn Leu Ala Asn
20 25 30
Asn Asn Ile Glu Gln Ile Ile Glu Glu Phe Arg Ile Arg Leu Ser Leu
35 40 45
Lys Asp Glu Lys Asn Ile Lys Glu Ile Ile Asn Asn Tyr Phe Thr Asp
50 55 60
Lys Lys Ser Tyr Thr Asp Trp Glu Arg Gly Ile Asn Ile Leu Lys Glu
65 70 75 80
Tyr Leu Pro Val Ile Asp Tyr Leu Asp Leu Ala Ile Thr Asp Lys Glu
85 90 95
Phe Glu Lys Ile Asp Leu Lys Gln Lys Glu Thr Ala Lys Arg Lys Tyr
100 105 110
Phe Arg Thr Asn Phe Ser Leu Leu Ile Asp Thr Ile Ile Asp Leu Arg
115 120 125
Asn Phe Tyr Thr His Tyr Phe His Lys Pro Ile Ser Ile Asn Pro Asp
130 135 140
Val Ala Lys Phe Leu Asp Lys Asn Leu Leu Asn Val Cys Leu Asp Ile
145 150 155 160
Lys Lys Gln Lys Met Lys Thr Asp Lys Thr Lys Gln Ala Leu Lys Asp
165 170 175
Gly Leu Asp Lys Glu Leu Lys Lys Leu Ile Glu Leu Lys Lys Ala Glu
180 185 190
Leu Lys Glu Lys Lys Ile Lys Thr Trp Asn Ile Thr Glu Asn Val Glu
195 200 205
Gly Ala Val Tyr Asn Asp Ala Phe Asn His Met Val Tyr Lys Asn Asn
210 215 220
Ala Gly Val Thr Ile Leu Lys Asp Tyr His Lys Ser Ile Leu Pro Asp
225 230 235 240
Asp Lys Ile Asp Ser Glu Leu Lys Leu Asn Phe Ser Ile Ser Gly Leu
245 250 255
Val Phe Leu Leu Ser Met Phe Leu Ser Lys Lys Glu Ile Glu Gln Phe
260 265 270
Lys Ser Asn Leu Glu Gly Phe Lys Gly Lys Val Ile Gly Glu Asn Gly
275 280 285
Glu Tyr Glu Ile Ser Lys Phe Asn Asn Ser Leu Lys Tyr Met Ala Thr
290 295 300
His Trp Ile Phe Ser Tyr Leu Thr Phe Lys Gly Leu Lys Gln Arg Val
305 310 315 320
Lys Asn Thr Phe Asp Lys Glu Thr Leu Leu Met Gln Met Ile Asp Glu
325 330 335
Leu Asn Lys Val Pro His Glu Val Tyr Gln Thr Leu Ser Lys Glu Gln
340 345 350
Gln Asn Glu Phe Leu Glu Asp Ile Asn Glu Tyr Val Gln Asp Asn Glu
355 360 365
Glu Asn Lys Lys Ser Met Glu Asn Ser Ile Val Val His Pro Val Ile
370 375 380
Arg Lys Arg Tyr Asp Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu
385 390 395 400
Asp Glu Phe Ala Asn Phe Pro Thr Leu Lys Phe Phe Val Thr Ala Gly
405 410 415
Asn Phe Val His Asp Lys Arg Glu Lys Gln Ile Gln Gly Ser Met Leu
420 425 430
Thr Ser Asp Arg Met Ile Lys Glu Lys Ile Asn Val Phe Gly Lys Leu
435 440 445
Thr Glu Ile Ala Lys Tyr Lys Ser Asp Tyr Phe Ser Asn Glu Asn Thr
450 455 460
Leu Glu Thr Ser Glu Trp Glu Leu Phe Pro Asn Pro Ser Tyr Leu Leu
465 470 475 480
Ile Gln Asn Asn Ile Pro Val His Ile Asp Leu Ile His Asn Thr Glu
485 490 495
Glu Ala Lys Gln Cys Gln Ile Ala Ile Asp Arg Ile Lys Cys Thr Thr
500 505 510
Asn Pro Ala Lys Lys Arg Asn Thr Arg Lys Ser Lys Glu Glu Ile Ile
515 520 525
Lys Ile Ile Tyr Gln Lys Asn Lys Asn Ile Lys Tyr Gly Asp Pro Thr
530 535 540
Ala Leu Leu Ser Ser Asn Glu Leu Pro Ala Leu Ile Tyr Glu Leu Leu
545 550 555 560
Val Asn Lys Lys Ser Gly Lys Glu Leu Glu Asn Ile Ile Val Glu Lys
565 570 575
Ile Val Asn Gln Tyr Lys Thr Ile Ala Gly Phe Glu Lys Gly Gln Asn
580 585 590
Leu Ser Asn Ser Leu Ile Thr Lys Lys Leu Lys Lys Ser Glu Pro Asn
595 600 605
Glu Asp Lys Ile Asn Ala Glu Lys Ile Ile Leu Ala Ile Asn Arg Glu
610 615 620
Leu Glu Ile Thr Glu Asn Lys Leu Asn Ile Ile Lys Asn Asn Arg Ala
625 630 635 640
Glu Phe Arg Thr Gly Ala Lys Arg Lys His Ile Phe Tyr Ser Lys Glu
645 650 655
Leu Gly Gln Glu Ala Thr Trp Ile Ala Tyr Asp Leu Lys Arg Phe Met
660 665 670
Pro Glu Ala Ser Arg Lys Glu Trp Lys Gly Phe His His Ser Glu Leu
675 680 685
Gln Lys Phe Leu Ala Phe Tyr Asp Arg Asn Lys Asn Asp Ala Lys Ala
690 695 700
Leu Leu Asn Met Phe Trp Asn Phe Asp Asn Asp Gln Leu Ile Gly Asn
705 710 715 720
Asp Leu Asn Ser Ala Phe Arg Glu Phe His Phe Asp Lys Phe Tyr Glu
725 730 735
Lys Tyr Leu Ile Lys Arg Asp Glu Ile Leu Glu Gly Phe Lys Ser Phe
740 745 750
Ile Ser Asn Phe Lys Asp Glu Pro Lys Leu Leu Lys Lys Gly Ile Lys
755 760 765
Asp Ile Tyr Arg Val Phe Asp Lys Arg Tyr Tyr Ile Ile Lys Ser Thr
770 775 780
Asn Ala Gln Lys Glu Gln Leu Leu Ser Lys Pro Ile Cys Leu Pro Arg
785 790 795 800
Gly Ile Phe Asp Asn Lys Pro Thr Tyr Ile Glu Gly Val Lys Val Glu
805 810 815
Ser Asn Ser Ala Leu Phe Ala Asp Trp Tyr Gln Tyr Thr Tyr Ser Asp
820 825 830
Lys His Glu Phe Gln Ser Phe Tyr Asp Met Pro Arg Asp Tyr Lys Glu
835 840 845
Gln Phe Glu Lys Phe Glu Leu Asn Asn Ile Lys Ser Ile Gln Asn Lys
850 855 860
Lys Asn Leu Asn Lys Ser Asp Lys Phe Ile Tyr Phe Arg Tyr Lys Gln
865 870 875 880
Asp Leu Lys Ile Lys Gln Ile Lys Ser Gln Asp Leu Phe Ile Lys Leu
885 890 895
Met Val Asp Glu Leu Phe Asn Val Val Phe Lys Asn Asn Ile Glu Leu
900 905 910
Asn Leu Lys Lys Leu Tyr Gln Thr Ser Asp Glu Arg Phe Lys Asn Gln
915 920 925
Leu Ile Ala Asp Val Gln Lys Asn Arg Glu Lys Gly Asp Thr Ser Asp
930 935 940
Asn Lys Met Asn Glu Asn Phe Ile Trp Asn Met Thr Ile Pro Leu Ser
945 950 955 960
Leu Cys Asn Gly Gln Ile Glu Glu Pro Lys Val Lys Leu Lys Asp Ile
965 970 975
Gly Lys Phe Arg Lys Leu Glu Thr Asp Asp Lys Val Ile Gln Leu Leu
980 985 990
Glu Tyr Asp Lys Ser Lys Val Trp Lys Lys Leu Glu Ile Glu Asp Glu
995 1000 1005
Leu Glu Asn Met Pro Asn Ser Tyr Glu Arg Ile Arg Arg Glu Lys
1010 1015 1020
Leu Leu Lys Gly Ile Gln Glu Phe Glu His Phe Leu Leu Glu Lys
1025 1030 1035
Glu Lys Phe Asp Gly Ile Asn His Pro Lys His Phe Glu Gln Asp
1040 1045 1050
Leu Asn Pro Asn Phe Lys Thr Tyr Val Ile Asn Gly Val Leu Arg
1055 1060 1065
Lys Asn Ser Lys Leu Asn Tyr Thr Glu Ile Asp Lys Leu Leu Asp
1070 1075 1080
Leu Glu His Ile Ser Ile Lys Asp Ile Glu Thr Ser Ala Lys Glu
1085 1090 1095
Ile His Leu Ala Tyr Phe Leu Ile His Val Arg Asn Lys Phe Gly
1100 1105 1110
His Asn Gln Leu Pro Lys Leu Glu Ala Phe Glu Leu Met Lys Lys
1115 1120 1125
Tyr Tyr Lys Lys Asn Asn Glu Glu Thr Tyr Ala Glu Tyr Phe His
1130 1135 1140
Lys Val Ser Ser Gln Ile Val Asn Glu Phe Lys Asn Ser Leu Glu
1145 1150 1155
Lys His Ser
1160
<210> 129
<211> 1165
<212> PRT
<213> Chryseobacterium jejuense
<400> 129
Met Glu Lys Thr Gln Thr Gly Leu Gly Ile Tyr Tyr Asp His Thr Lys
1 5 10 15
Leu Gln Asp Lys Tyr Phe Phe Gly Gly Phe Phe Asn Leu Ala Gln Asn
20 25 30
Asn Ile Asp Asn Val Ile Lys Ala Phe Ile Ile Lys Phe Phe Pro Glu
35 40 45
Arg Lys Asp Lys Asp Ile Asn Ile Ala Gln Phe Leu Asp Ile Cys Phe
50 55 60
Lys Asp Asn Asp Ala Asp Ser Asp Phe Gln Lys Lys Asn Lys Phe Leu
65 70 75 80
Arg Ile His Phe Pro Val Ile Gly Phe Leu Thr Ser Asp Asn Asp Lys
85 90 95
Ala Gly Phe Lys Lys Lys Phe Ala Leu Leu Leu Lys Thr Ile Ser Glu
100 105 110
Leu Arg Asn Phe Tyr Thr His Tyr Tyr His Lys Ser Ile Glu Phe Pro
115 120 125
Ser Glu Leu Phe Glu Leu Leu Asp Asp Ile Phe Val Lys Thr Thr Ser
130 135 140
Glu Ile Lys Lys Leu Lys Lys Lys Asp Asp Lys Thr Gln Gln Leu Leu
145 150 155 160
Asn Lys Asn Leu Ser Glu Glu Tyr Asp Ile Arg Tyr Gln Gln Gln Ile
165 170 175
Glu Arg Leu Lys Glu Leu Lys Ala Gln Gly Lys Arg Val Ser Leu Thr
180 185 190
Asp Glu Thr Ala Ile Arg Asn Gly Val Phe Asn Ala Ala Phe Asn His
195 200 205
Leu Ile Tyr Arg Asp Gly Glu Asn Val Lys Pro Ser Arg Leu Tyr Gln
210 215 220
Ser Ser Tyr Ser Glu Pro Asp Pro Ala Glu Asn Gly Ile Ser Leu Ser
225 230 235 240
Gln Asn Ser Ile Leu Phe Leu Leu Ser Met Phe Leu Glu Arg Lys Glu
245 250 255
Thr Glu Asp Leu Lys Ser Arg Val Lys Gly Phe Lys Ala Lys Ile Ile
260 265 270
Lys Gln Gly Glu Glu Gln Ile Ser Gly Leu Lys Phe Met Ala Thr His
275 280 285
Trp Val Phe Ser Tyr Leu Cys Phe Lys Gly Ile Lys Gln Lys Leu Ser
290 295 300
Thr Glu Phe His Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu
305 310 315 320
Ser Lys Val Pro Asp Glu Val Tyr Ser Ala Phe Asp Ser Lys Thr Lys
325 330 335
Glu Lys Phe Leu Glu Asp Ile Asn Glu Tyr Met Lys Glu Gly Asn Ala
340 345 350
Asp Leu Ser Leu Glu Asp Ser Lys Val Ile His Pro Val Ile Arg Lys
355 360 365
Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu
370 375 380
Tyr Leu Ser Ser Thr Ser Leu Lys Phe Gln Val His Val Gly Asn Tyr
385 390 395 400
Val His Asp Arg Arg Val Lys His Ile Asn Gly Thr Gly Phe Gln Thr
405 410 415
Glu Arg Ile Val Lys Asp Arg Ile Lys Val Phe Gly Arg Leu Ser Asn
420 425 430
Ile Ser Asn Leu Lys Ala Asp Tyr Ile Lys Glu Gln Leu Glu Leu Pro
435 440 445
Asn Asp Ser Asn Gly Trp Glu Ile Phe Pro Asn Pro Ser Tyr Ile Phe
450 455 460
Ile Asp Asn Asn Val Pro Ile His Val Leu Ala Asp Glu Ala Thr Lys
465 470 475 480
Lys Gly Ile Glu Leu Phe Lys Asp Lys Arg Arg Lys Glu Gln Pro Glu
485 490 495
Glu Leu Gln Lys Arg Lys Gly Lys Ile Ser Lys Tyr Asn Ile Val Ser
500 505 510
Met Ile Tyr Lys Glu Ala Lys Gly Lys Asp Lys Leu Arg Ile Asp Glu
515 520 525
Pro Leu Ala Leu Leu Ser Leu Asn Glu Ile Pro Ala Leu Leu Tyr Gln
530 535 540
Ile Leu Glu Lys Gly Ala Thr Pro Lys Asp Ile Glu Leu Ile Ile Lys
545 550 555 560
Asn Lys Leu Thr Glu Arg Phe Glu Lys Ile Lys Asn Tyr Asp Pro Glu
565 570 575
Thr Pro Ala Pro Ala Ser Gln Ile Ser Lys Arg Leu Arg Asn Asn Thr
580 585 590
Thr Ala Lys Gly Gln Glu Ala Leu Asn Ala Glu Lys Leu Ser Leu Leu
595 600 605
Ile Glu Arg Glu Ile Glu Asn Thr Glu Thr Lys Leu Ser Ser Ile Glu
610 615 620
Glu Lys Arg Leu Lys Ala Lys Lys Glu Gln Arg Arg Asn Thr Pro Gln
625 630 635 640
Arg Ser Ile Phe Ser Asn Ser Asp Leu Gly Arg Ile Ala Ala Trp Leu
645 650 655
Ala Asp Asp Ile Lys Arg Phe Met Pro Ala Glu Gln Arg Lys Asn Trp
660 665 670
Lys Gly Tyr Gln His Ser Gln Leu Gln Gln Ser Leu Ala Tyr Phe Glu
675 680 685
Lys Arg Pro Gln Glu Ala Phe Leu Leu Leu Lys Glu Gly Trp Asp Thr
690 695 700
Ser Asp Gly Ser Ser Tyr Trp Asn Asn Trp Val Met Asn Ser Phe Leu
705 710 715 720
Glu Asn Asn His Phe Glu Lys Phe Tyr Lys Asn Tyr Leu Met Lys Arg
725 730 735
Val Lys Tyr Phe Ser Glu Leu Ala Gly Asn Ile Lys Gln His Thr His
740 745 750
Asn Thr Lys Phe Leu Arg Lys Phe Ile Lys Gln Gln Met Pro Ala Asp
755 760 765
Leu Phe Pro Lys Arg His Tyr Ile Leu Lys Asp Leu Glu Thr Glu Lys
770 775 780
Asn Lys Val Leu Ser Lys Pro Leu Val Phe Ser Arg Gly Leu Phe Asp
785 790 795 800
Asn Asn Pro Thr Phe Ile Lys Gly Val Lys Val Thr Glu Asn Pro Glu
805 810 815
Leu Phe Ala Glu Trp Tyr Ser Tyr Gly Tyr Lys Thr Glu His Val Phe
820 825 830
Gln His Phe Tyr Gly Trp Glu Arg Asp Tyr Asn Glu Leu Leu Asp Ser
835 840 845
Glu Leu Gln Lys Gly Asn Ser Phe Ala Lys Asn Ser Ile Tyr Tyr Asn
850 855 860
Arg Glu Ser Gln Leu Asp Leu Ile Lys Leu Lys Gln Asp Leu Lys Ile
865 870 875 880
Lys Lys Ile Lys Ile Gln Asp Leu Phe Leu Lys Arg Ile Ala Glu Lys
885 890 895
Leu Phe Glu Asn Val Phe Asn Tyr Pro Thr Thr Leu Ser Leu Asp Glu
900 905 910
Phe Tyr Leu Thr Gln Glu Glu Arg Ala Glu Lys Glu Arg Ile Ala Leu
915 920 925
Ala Gln Ser Leu Arg Glu Glu Gly Asp Asn Ser Pro Asn Ile Ile Lys
930 935 940
Asp Asp Phe Ile Trp Ser Lys Thr Ile Ala Phe Arg Ser Lys Gln Ile
945 950 955 960
Tyr Glu Pro Ala Ile Lys Leu Lys Asp Ile Gly Lys Phe Asn Arg Phe
965 970 975
Val Leu Asp Asp Glu Glu Ser Lys Ala Ser Lys Leu Leu Ser Tyr Asp
980 985 990
Lys Asn Lys Ile Trp Asn Lys Glu Gln Leu Glu Arg Glu Leu Ser Ile
995 1000 1005
Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu Lys Leu Phe Lys
1010 1015 1020
Glu Ile Gln Asn Leu Glu Leu Gln Ile Leu Ser Asn Trp Ser Trp
1025 1030 1035
Asp Gly Ile Asn His Pro Arg Glu Phe Glu Met Glu Asp Gln Lys
1040 1045 1050
Asn Thr Arg His Pro Asn Phe Lys Met Tyr Leu Val Asn Gly Ile
1055 1060 1065
Leu Arg Lys Asn Ile Asn Leu Tyr Lys Glu Asp Glu Asp Phe Trp
1070 1075 1080
Leu Glu Ser Leu Lys Glu Asn Asp Phe Lys Thr Leu Pro Ser Glu
1085 1090 1095
Val Leu Glu Thr Lys Ser Glu Met Val Gln Leu Leu Phe Leu Val
1100 1105 1110
Ile Leu Ile Arg Asn Gln Phe Ala His Asn Gln Leu Pro Glu Ile
1115 1120 1125
Gln Phe Tyr Asn Phe Ile Arg Lys Asn Tyr Pro Glu Ile Gln Asn
1130 1135 1140
Asn Thr Val Ala Glu Leu Tyr Leu Asn Leu Ile Lys Leu Ala Val
1145 1150 1155
Gln Lys Leu Lys Asp Asn Ser
1160 1165
<210> 130
<211> 1156
<212> PRT
<213> Chryseobacterium carnipullorum
<400> 130
Met Asn Thr Arg Val Thr Gly Met Gly Val Ser Tyr Asp His Thr Lys
1 5 10 15
Lys Glu Asp Lys His Phe Phe Gly Gly Phe Leu Asn Leu Ala Gln Asp
20 25 30
Asn Ile Thr Ala Val Ile Lys Ala Phe Cys Ile Lys Phe Asp Lys Asn
35 40 45
Pro Met Ser Ser Val Gln Phe Ala Glu Ser Cys Phe Thr Asp Lys Asp
50 55 60
Ser Asp Thr Asp Phe Gln Asn Lys Val Arg Tyr Val Arg Thr His Leu
65 70 75 80
Pro Val Ile Gly Tyr Leu Asn Tyr Gly Gly Asp Arg Asn Thr Phe Arg
85 90 95
Gln Lys Leu Ser Thr Leu Leu Lys Ala Val Asp Ser Leu Arg Asn Phe
100 105 110
Tyr Thr His Tyr Tyr His Ser Pro Leu Ala Leu Ser Thr Glu Leu Phe
115 120 125
Glu Leu Leu Asp Thr Val Phe Ala Ser Val Ala Val Glu Val Lys Gln
130 135 140
His Lys Met Lys Asp Asp Lys Thr Arg Gln Leu Leu Ser Lys Ser Leu
145 150 155 160
Ala Glu Glu Leu Asp Ile Arg Tyr Lys Gln Gln Leu Glu Arg Leu Lys
165 170 175
Glu Leu Lys Glu Gln Gly Lys Asn Ile Asp Leu Arg Asp Glu Ala Gly
180 185 190
Ile Arg Asn Gly Val Leu Asn Ala Ala Phe Asn His Leu Ile Tyr Lys
195 200 205
Glu Gly Glu Ile Ala Lys Pro Thr Leu Ser Tyr Ser Ser Phe Tyr Tyr
210 215 220
Gly Ala Asp Ser Ala Glu Asn Gly Ile Thr Ile Ser Gln Ser Gly Leu
225 230 235 240
Leu Phe Leu Leu Ser Met Phe Leu Gly Lys Lys Glu Ile Glu Asp Leu
245 250 255
Lys Ser Arg Ile Arg Gly Phe Lys Ala Lys Ile Val Arg Asp Gly Glu
260 265 270
Glu Asn Ile Ser Gly Leu Lys Phe Met Ala Thr His Trp Ile Phe Ser
275 280 285
Tyr Leu Ser Phe Lys Gly Met Lys Gln Arg Leu Ser Thr Asp Phe His
290 295 300
Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu Ser Lys Val Pro
305 310 315 320
Asp Glu Val Tyr His Asp Phe Asp Thr Ala Thr Arg Glu Lys Phe Val
325 330 335
Glu Asp Ile Asn Glu Tyr Ile Arg Glu Gly Asn Glu Asp Phe Ser Leu
340 345 350
Gly Asp Ser Thr Ile Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asn
355 360 365
Lys Phe Asn Tyr Phe Ala Val Arg Phe Leu Asp Glu Phe Ile Lys Phe
370 375 380
Pro Ser Leu Arg Phe Gln Val His Leu Gly Asn Phe Val His Asp Arg
385 390 395 400
Arg Ile Lys Asp Ile His Gly Thr Gly Phe Gln Thr Glu Arg Val Val
405 410 415
Lys Asp Arg Ile Lys Val Phe Gly Lys Leu Ser Glu Ile Ser Ser Leu
420 425 430
Lys Thr Glu Tyr Ile Glu Lys Glu Leu Asp Leu Asp Ser Asp Thr Gly
435 440 445
Trp Glu Ile Phe Pro Asn Pro Ser Tyr Val Phe Ile Asp Asn Asn Ile
450 455 460
Pro Ile Tyr Ile Ser Thr Asn Lys Thr Phe Lys Asn Gly Ser Ser Glu
465 470 475 480
Phe Ile Lys Leu Arg Arg Lys Glu Lys Pro Glu Glu Met Lys Met Arg
485 490 495
Gly Glu Asp Lys Lys Glu Lys Arg Asp Ile Ala Ser Met Ile Gly Asn
500 505 510
Ala Gly Ser Leu Asn Ser Lys Thr Pro Leu Ala Met Leu Ser Leu Asn
515 520 525
Glu Met Pro Ala Leu Leu Tyr Glu Ile Leu Val Lys Lys Thr Thr Pro
530 535 540
Glu Glu Ile Glu Leu Ile Ile Lys Glu Lys Leu Asp Ser His Phe Glu
545 550 555 560
Asn Ile Lys Asn Tyr Asp Pro Glu Lys Pro Leu Pro Ala Ser Gln Ile
565 570 575
Ser Lys Arg Leu Arg Asn Asn Thr Thr Asp Lys Gly Lys Lys Val Ile
580 585 590
Asn Pro Glu Lys Leu Ile His Leu Ile Asn Lys Glu Ile Asp Ala Thr
595 600 605
Glu Ala Lys Phe Ala Leu Leu Ala Lys Asn Arg Lys Glu Leu Lys Glu
610 615 620
Lys Phe Arg Gly Lys Pro Leu Arg Gln Thr Ile Phe Ser Asn Met Glu
625 630 635 640
Leu Gly Arg Glu Ala Thr Trp Leu Ala Asp Asp Ile Lys Arg Phe Met
645 650 655
Pro Asp Ile Leu Arg Lys Asn Trp Lys Gly Tyr Gln His Asn Gln Leu
660 665 670
Gln Gln Ser Leu Ala Phe Phe Asn Ser Arg Pro Lys Glu Ala Phe Thr
675 680 685
Ile Leu Gln Asp Gly Trp Asp Phe Ala Asp Gly Ser Ser Phe Trp Asn
690 695 700
Gly Trp Ile Ile Asn Ser Phe Val Lys Asn Arg Ser Phe Glu Tyr Phe
705 710 715 720
Tyr Glu Ala Tyr Phe Glu Gly Arg Lys Glu Tyr Phe Ser Ser Leu Ala
725 730 735
Glu Asn Ile Lys Gln His Thr Ser Asn His Arg Asn Leu Arg Arg Phe
740 745 750
Ile Asp Gln Gln Met Pro Lys Gly Leu Phe Glu Asn Arg His Tyr Leu
755 760 765
Leu Glu Asn Leu Glu Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Leu
770 775 780
Val Phe Pro Arg Gly Leu Phe Asp Thr Lys Pro Thr Phe Ile Lys Gly
785 790 795 800
Ile Lys Val Asp Glu Gln Pro Glu Leu Phe Ala Glu Trp Tyr Gln Tyr
805 810 815
Gly Tyr Ser Thr Glu His Val Phe Gln Asn Phe Tyr Gly Trp Glu Arg
820 825 830
Asp Tyr Asn Asp Leu Leu Glu Ser Glu Leu Glu Lys Asp Asn Asp Phe
835 840 845
Ser Lys Asn Ser Ile His Tyr Ser Arg Thr Ser Gln Leu Glu Leu Ile
850 855 860
Lys Leu Lys Gln Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Leu
865 870 875 880
Phe Leu Lys Leu Ile Ala Gly His Ile Phe Glu Asn Ile Phe Lys Tyr
885 890 895
Pro Ala Ser Phe Ser Leu Asp Glu Leu Tyr Leu Thr Gln Glu Glu Arg
900 905 910
Leu Asn Lys Glu Gln Glu Ala Leu Ile Gln Ser Gln Arg Lys Glu Gly
915 920 925
Asp His Ser Asp Asn Ile Ile Lys Asp Asn Phe Ile Gly Ser Lys Thr
930 935 940
Val Thr Tyr Glu Ser Lys Gln Ile Ser Glu Pro Asn Val Lys Leu Lys
945 950 955 960
Asp Ile Gly Lys Phe Asn Arg Phe Leu Leu Asp Asp Lys Val Lys Thr
965 970 975
Leu Leu Ser Tyr Asn Glu Asp Lys Val Trp Asn Lys Asn Asp Leu Asp
980 985 990
Leu Glu Leu Ser Ile Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu
995 1000 1005
Lys Leu Phe Lys Lys Ile Gln Asn Phe Glu Leu Gln Thr Leu Thr
1010 1015 1020
Asp Trp Pro Trp Asn Gly Thr Asp His Pro Glu Glu Phe Gly Thr
1025 1030 1035
Thr Asp Asn Lys Gly Val Asn His Pro Asn Phe Lys Met Tyr Val
1040 1045 1050
Val Asn Gly Ile Leu Arg Lys His Thr Asp Trp Phe Lys Glu Gly
1055 1060 1065
Glu Asp Asn Trp Leu Glu Asn Leu Asn Glu Thr His Phe Lys Asn
1070 1075 1080
Leu Ser Phe Gln Glu Leu Glu Thr Lys Ser Lys Ser Ile Gln Thr
1085 1090 1095
Ala Phe Leu Ile Ile Met Ile Arg Asn Gln Phe Ala His Asn Gln
1100 1105 1110
Leu Pro Ala Val Gln Phe Phe Glu Phe Ile Gln Lys Lys Tyr Pro
1115 1120 1125
Glu Ile Gln Gly Ser Thr Thr Ser Glu Leu Tyr Leu Asn Phe Ile
1130 1135 1140
Asn Leu Ala Val Val Glu Leu Leu Glu Leu Leu Glu Lys
1145 1150 1155
<210> 131
<211> 1036
<212> PRT
<213> Chryseobacterium ureilyticum
<400> 131
Met Glu Thr Gln Ile Leu Gly Asn Gly Ile Ser Tyr Asp His Thr Lys
1 5 10 15
Thr Glu Asp Lys His Phe Phe Gly Gly Phe Leu Asn Thr Ala Gln Asn
20 25 30
Asn Ile Asp Leu Leu Ile Lys Ala Tyr Ile Ser Lys Phe Glu Ser Ser
35 40 45
Pro Arg Lys Leu Asn Ser Val Gln Phe Pro Asp Val Cys Phe Lys Lys
50 55 60
Asn Asp Ser Asp Ala Asp Phe Gln His Lys Leu Gln Phe Ile Arg Lys
65 70 75 80
His Leu Pro Val Ile Gln Tyr Leu Lys Tyr Gly Gly Asn Arg Glu Val
85 90 95
Leu Lys Glu Lys Phe Arg Leu Leu Leu Gln Ala Val Asp Ser Leu Arg
100 105 110
Asn Phe Tyr Thr His Phe Tyr His Lys Pro Ile Gln Leu Pro Asn Glu
115 120 125
Leu Leu Thr Leu Leu Asp Thr Ile Phe Gly Glu Ile Gly Asn Glu Val
130 135 140
Arg Gln Asn Lys Met Lys Asp Asp Lys Thr Arg His Leu Leu Lys Lys
145 150 155 160
Asn Leu Ser Glu Glu Leu Asp Phe Arg Tyr Gln Glu Gln Leu Glu Arg
165 170 175
Leu Arg Lys Leu Lys Ser Glu Gly Lys Lys Val Asp Leu Arg Asp Thr
180 185 190
Glu Ala Ile Arg Asn Gly Val Leu Asn Ala Ala Phe Asn His Leu Ile
195 200 205
Phe Lys Asp Ala Glu Asp Phe Lys Pro Thr Val Ser Tyr Ser Ser Tyr
210 215 220
Tyr Tyr Asp Ser Asp Thr Ala Glu Asn Gly Ile Ser Ile Ser Gln Ser
225 230 235 240
Gly Leu Leu Phe Leu Leu Ser Met Phe Leu Gly Arg Arg Glu Met Glu
245 250 255
Asp Leu Lys Ser Arg Val Arg Gly Phe Lys Ala Arg Ile Ile Lys His
260 265 270
Glu Glu Gln His Val Ser Gly Leu Lys Phe Met Ala Thr His Trp Val
275 280 285
Phe Ser Glu Phe Cys Phe Lys Gly Ile Lys Thr Arg Leu Asn Ala Asp
290 295 300
Tyr His Glu Glu Thr Leu Leu Ile Gln Leu Ile Asp Glu Leu Ser Lys
305 310 315 320
Val Pro Asp Glu Leu Tyr Arg Ser Phe Asp Val Ala Thr Arg Glu Arg
325 330 335
Phe Ile Glu Asp Ile Asn Glu Tyr Ile Arg Asp Gly Lys Glu Asp Lys
340 345 350
Ser Leu Ile Glu Ser Lys Ile Val His Pro Val Ile Arg Lys Arg Tyr
355 360 365
Glu Ser Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Val
370 375 380
Asn Phe Pro Thr Leu Arg Phe Gln Val His Ala Gly Asn Tyr Val His
385 390 395 400
Asp Arg Arg Ile Lys Ser Ile Glu Gly Thr Gly Phe Lys Thr Glu Arg
405 410 415
Leu Val Lys Asp Arg Ile Lys Val Phe Gly Lys Leu Ser Thr Ile Ser
420 425 430
Ser Leu Lys Ala Glu Tyr Leu Ala Lys Ala Val Asn Ile Thr Asp Asp
435 440 445
Thr Gly Trp Glu Leu Leu Pro His Pro Ser Tyr Val Phe Ile Asp Asn
450 455 460
Asn Ile Pro Ile His Leu Thr Val Asp Pro Ser Phe Lys Asn Gly Val
465 470 475 480
Lys Glu Tyr Gln Glu Lys Arg Lys Leu Gln Lys Pro Glu Glu Met Lys
485 490 495
Asn Arg Gln Gly Gly Asp Lys Met His Lys Pro Ala Ile Ser Ser Lys
500 505 510
Ile Gly Lys Ser Lys Asp Ile Asn Pro Glu Ser Pro Val Ala Leu Leu
515 520 525
Ser Met Asn Glu Ile Pro Ala Leu Leu Tyr Glu Ile Leu Val Lys Lys
530 535 540
Ala Ser Pro Glu Glu Val Glu Ala Lys Ile Arg Gln Lys Leu Thr Ala
545 550 555 560
Val Phe Glu Arg Ile Arg Asp Tyr Asp Pro Lys Val Pro Leu Pro Ala
565 570 575
Ser Gln Val Ser Lys Arg Leu Arg Asn Asn Thr Asp Thr Leu Ser Tyr
580 585 590
Asn Lys Glu Lys Leu Val Glu Leu Ala Asn Lys Glu Val Glu Gln Thr
595 600 605
Glu Arg Lys Leu Ala Leu Ile Thr Lys Asn Arg Arg Glu Cys Arg Glu
610 615 620
Lys Val Lys Gly Lys Phe Lys Arg Gln Lys Val Phe Lys Asn Ala Glu
625 630 635 640
Leu Gly Thr Glu Ala Thr Trp Leu Ala Asn Asp Ile Lys Arg Phe Met
645 650 655
Pro Glu Glu Gln Lys Lys Asn Trp Lys Gly Tyr Gln His Ser Gln Leu
660 665 670
Gln Gln Ser Leu Ala Phe Phe Glu Ser Arg Pro Gly Glu Ala Arg Ser
675 680 685
Leu Leu Gln Ala Gly Trp Asp Phe Ser Asp Gly Ser Ser Phe Trp Asn
690 695 700
Gly Trp Val Met Asn Ser Phe Ala Arg Asp Asn Thr Phe Asp Gly Phe
705 710 715 720
Tyr Glu Ser Tyr Leu Asn Gly Arg Met Lys Tyr Phe Leu Arg Leu Ala
725 730 735
Asp Asn Ile Ala Gln Gln Ser Ser Thr Asn Lys Leu Ile Ser Asn Phe
740 745 750
Ile Lys Gln Gln Met Pro Lys Gly Leu Phe Asp Arg Arg Leu Tyr Met
755 760 765
Leu Glu Asp Leu Ala Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Leu
770 775 780
Ile Phe Pro Arg Gly Ile Phe Asp Asp Lys Pro Thr Phe Lys Lys Gly
785 790 795 800
Val Gln Val Ser Glu Glu Pro Glu Ala Phe Ala Asp Trp Tyr Ser Tyr
805 810 815
Gly Tyr Asp Val Lys His Lys Phe Gln Glu Phe Tyr Ala Trp Asp Arg
820 825 830
Asp Tyr Glu Glu Leu Leu Arg Glu Glu Leu Glu Lys Asp Thr Ala Phe
835 840 845
Thr Lys Asn Ser Ile His Tyr Ser Arg Glu Ser Gln Ile Glu Leu Leu
850 855 860
Ala Lys Lys Gln Asp Leu Lys Val Lys Lys Val Arg Ile Gln Asp Leu
865 870 875 880
Tyr Leu Lys Leu Met Ala Glu Phe Leu Phe Glu Asn Val Phe Gly His
885 890 895
Glu Leu Ala Leu Pro Leu Asp Gln Phe Tyr Leu Thr Gln Glu Glu Arg
900 905 910
Leu Lys Gln Glu Gln Glu Ala Ile Val Gln Ser Gln Arg Pro Lys Gly
915 920 925
Asp Asp Ser Pro Asn Ile Val Lys Glu Asn Phe Ile Trp Ser Lys Thr
930 935 940
Ile Pro Phe Lys Ser Gly Arg Val Phe Glu Pro Asn Val Lys Leu Lys
945 950 955 960
Asp Ile Gly Lys Phe Arg Asn Leu Leu Thr Asp Glu Lys Val Asp Ile
965 970 975
Leu Leu Ser Tyr Asn Asn Thr Glu Ile Gly Lys Gln Val Ile Glu Asn
980 985 990
Glu Leu Ile Ile Gly Ala Gly Ser Tyr Glu Phe Ile Arg Arg Glu Gln
995 1000 1005
Leu Phe Lys Glu Ile Gln Gln Met Lys Arg Leu Ser Leu Arg Ser
1010 1015 1020
Val Arg Gly Met Gly Val Pro Ile Arg Leu Asn Leu Lys
1025 1030 1035
<210> 132
<211> 1127
<212> PRT
<213> Prevotella buccae
<400> 132
Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile
1 5 10 15
Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Gln Glu Lys Pro
20 25 30
Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe
35 40 45
Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn
50 55 60
Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Asp
65 70 75 80
Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val
85 90 95
Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala
100 105 110
Ala Tyr Glu Ile Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg
115 120 125
Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val
130 135 140
Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser
145 150 155 160
His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser
165 170 175
Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val
180 185 190
Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe
195 200 205
Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile
210 215 220
Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met
225 230 235 240
Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys
245 250 255
Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg
260 265 270
Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile
275 280 285
Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met
290 295 300
Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr
305 310 315 320
Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp
325 330 335
Ile Phe Ser Asp Asp Tyr Asp Ala Glu Glu Glu Pro Phe Lys Asn Thr
340 345 350
Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe
355 360 365
Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly
370 375 380
Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu
385 390 395 400
Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp
405 410 415
Phe Ala Gln Gln Asn Gln Pro Glu Val Trp Arg Lys Leu Val Lys Asp
420 425 430
Leu Asp Tyr Phe Glu Ala Ser Gln Glu Pro Tyr Ile Pro Lys Thr Ala
435 440 445
Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser
450 455 460
Thr His Asn Asn Leu Phe Pro Ser Leu Lys Thr Glu Lys Thr Cys Asn
465 470 475 480
Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe
485 490 495
Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu
500 505 510
Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile
515 520 525
Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala
530 535 540
Asn Gly Glu Ile Asn Ser Ile Ala Asp Leu Thr Cys Arg Leu Gln Lys
545 550 555 560
Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu
565 570 575
Glu Gly Arg Gln Lys Asp Met Glu Lys Glu Ala Glu Arg Lys Ile Gly
580 585 590
Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln
595 600 605
Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys
610 615 620
Ser Gly Lys Ile Ala Asp Trp Leu Val Asn Asp Met Met Arg Phe Gln
625 630 635 640
Pro Val Gln Lys Asp Gln Asn Asn Ile Pro Ile Asn Asn Ser Lys Ala
645 650 655
Asn Ser Thr Glu Tyr Arg Met Leu Gln Arg Ala Leu Ala Leu Phe Gly
660 665 670
Ser Glu Asn Phe Arg Leu Lys Ala Tyr Phe Asn Gln Met Asn Leu Val
675 680 685
Gly Asn Asp Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His
690 695 700
Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys
705 710 715 720
Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His
725 730 735
Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr
740 745 750
Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro
755 760 765
Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp
770 775 780
Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro
785 790 795 800
Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp
805 810 815
Tyr Pro Phe Asn Ile Gly Asn Lys Leu Lys Pro Gln Lys Gly Gln Phe
820 825 830
Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu
835 840 845
Phe Lys Asn Tyr Pro Ser Glu Lys Lys Lys Thr Asp Leu Ala Tyr Leu
850 855 860
Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys
865 870 875 880
Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Asn Met
885 890 895
Ala Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile
900 905 910
Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile
915 920 925
Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly
930 935 940
Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr
945 950 955 960
Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Val Leu Ala Lys Asp
965 970 975
Arg Arg Leu Asn Gly Leu Leu Ser Phe Ala Glu Thr Thr Asp Ile Asp
980 985 990
Leu Glu Lys Asn Pro Ile Thr Lys Leu Ser Val Asp His Glu Leu Ile
995 1000 1005
Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly
1010 1015 1020
Leu Glu Lys Lys Leu Ile Asn Lys Tyr Pro Thr Leu Pro Thr Asp
1025 1030 1035
Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn
1040 1045 1050
Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg
1055 1060 1065
Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu
1070 1075 1080
Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr
1085 1090 1095
Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val
1100 1105 1110
Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn
1115 1120 1125
<210> 133
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 133
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asn Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 134
<211> 1175
<212> PRT
<213> Porphyromonas gingivalis
<400> 134
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Val Gly Ile Glu Tyr Ala Ser Trp Glu Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr
945 950 955 960
Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr
1055 1060 1065
Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Thr Ile Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Leu
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Leu Ala Lys Glu Met Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 135
<211> 1125
<212> PRT
<213> Prevotella pallens
<400> 135
Met Lys Glu Glu Glu Lys Gly Lys Thr Pro Val Val Ser Thr Tyr Asn
1 5 10 15
Lys Asp Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His
20 25 30
Asn Val Tyr Ile Thr Val Asn His Ile Asn Lys Ile Leu Gly Glu Gly
35 40 45
Glu Ile Asn Arg Asp Gly Tyr Glu Asn Thr Leu Glu Lys Ser Trp Asn
50 55 60
Glu Ile Lys Asp Ile Asn Lys Lys Asp Arg Leu Ser Lys Leu Ile Ile
65 70 75 80
Lys His Phe Pro Phe Leu Glu Val Thr Thr Tyr Gln Arg Asn Ser Ala
85 90 95
Asp Thr Thr Lys Gln Lys Glu Glu Lys Gln Ala Glu Ala Gln Ser Leu
100 105 110
Glu Ser Leu Lys Lys Ser Phe Phe Val Phe Ile Tyr Lys Leu Arg Asp
115 120 125
Leu Arg Asn His Tyr Ser His Tyr Lys His Ser Lys Ser Leu Glu Arg
130 135 140
Pro Lys Phe Glu Glu Asp Leu Gln Glu Lys Met Tyr Asn Ile Phe Asp
145 150 155 160
Ala Ser Ile Gln Leu Val Lys Glu Asp Tyr Lys His Asn Thr Asp Ile
165 170 175
Lys Thr Glu Glu Asp Phe Lys His Leu Asp Arg Lys Gly Gln Phe Lys
180 185 190
Tyr Ser Phe Ala Asp Asn Glu Gly Asn Ile Thr Glu Ser Gly Leu Leu
195 200 205
Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Val Gln
210 215 220
Lys Lys Leu Glu Gly Phe Lys Cys Ser Asn Glu Ser Tyr Gln Lys Met
225 230 235 240
Thr Asn Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Leu Arg
245 250 255
Leu Gln Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu Asn
260 265 270
Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Arg Glu Glu
275 280 285
Asp Arg Lys Lys Phe Arg Val Pro Ile Glu Ile Ala Asp Glu Asp Tyr
290 295 300
Asp Ala Glu Gln Glu Pro Phe Lys Asn Ala Leu Val Arg His Gln Asp
305 310 315 320
Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile Phe
325 330 335
Thr Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser Ile
340 345 350
Tyr Lys Lys Gln Ile Gly Asp Tyr Lys Glu Ser His His Leu Thr His
355 360 365
Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Thr Lys Gln Asn Arg
370 375 380
Pro Asp Glu Trp Arg Lys Phe Val Lys Thr Phe Asn Ser Phe Glu Thr
385 390 395 400
Ser Lys Glu Pro Tyr Ile Pro Glu Thr Thr Pro His Tyr His Leu Glu
405 410 415
Asn Gln Lys Ile Gly Ile Arg Phe Arg Asn Asp Asn Asp Lys Ile Trp
420 425 430
Pro Ser Leu Lys Thr Asn Ser Glu Lys Asn Glu Lys Ser Lys Tyr Lys
435 440 445
Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Val His Glu Leu
450 455 460
Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu Lys Thr Glu Asn Thr Asp
465 470 475 480
Asn Asp Asn Glu Ile Glu Thr Lys Lys Lys Glu Asn Lys Asn Asp Lys
485 490 495
Gln Glu Lys His Lys Ile Glu Glu Ile Ile Glu Asn Lys Ile Thr Glu
500 505 510
Ile Tyr Ala Leu Tyr Asp Ala Phe Ala Asn Gly Lys Ile Asn Ser Ile
515 520 525
Asp Lys Leu Glu Glu Tyr Cys Lys Gly Lys Asp Ile Glu Ile Gly His
530 535 540
Leu Pro Lys Gln Met Ile Ala Ile Leu Lys Ser Glu His Lys Asp Met
545 550 555 560
Ala Thr Glu Ala Lys Arg Lys Gln Glu Glu Met Leu Ala Asp Val Gln
565 570 575
Lys Ser Leu Glu Ser Leu Asp Asn Gln Ile Asn Glu Glu Ile Glu Asn
580 585 590
Val Glu Arg Lys Asn Ser Ser Leu Lys Ser Gly Glu Ile Ala Ser Trp
595 600 605
Leu Val Asn Asp Met Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu
610 615 620
Gly Asn Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met
625 630 635 640
Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg
645 650 655
Tyr Phe Arg Gln Val Asn Leu Ile Glu Ser Ser Asn Pro His Pro Phe
660 665 670
Leu Asn Asn Thr Glu Trp Glu Lys Cys Asn Asn Ile Leu Ser Phe Tyr
675 680 685
Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu Ser Leu Lys Pro
690 695 700
Glu Asp Trp Glu Lys Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys
705 710 715 720
Thr Asn Cys Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu
725 730 735
Pro Arg Gly Ile Phe Thr Glu Pro Ile Arg Lys Trp Phe Met Glu His
740 745 750
Arg Lys Asn Ile Thr Val Ala Glu Leu Lys Arg Val Gly Leu Val Ala
755 760 765
Lys Val Ile Pro Leu Phe Phe Ser Glu Glu Tyr Lys Asp Ser Val Gln
770 775 780
Pro Phe Tyr Asn Tyr Leu Phe Asn Val Gly Asn Ile Asn Lys Pro Asp
785 790 795 800
Glu Lys Asn Phe Leu Asn Cys Glu Glu Arg Arg Glu Leu Leu Arg Lys
805 810 815
Lys Lys Asp Glu Phe Lys Lys Met Thr Asp Lys Glu Lys Glu Glu Asn
820 825 830
Pro Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu
835 840 845
Arg Leu Val Arg Asn Gln Asp Ile Val Thr Trp Leu Leu Cys Met Glu
850 855 860
Leu Phe Asn Lys Lys Lys Ile Lys Glu Leu Asn Val Glu Lys Ile Tyr
865 870 875 880
Leu Lys Asn Ile Asn Thr Asn Thr Thr Lys Lys Glu Lys Asn Thr Glu
885 890 895
Glu Lys Asn Gly Glu Glu Lys Ile Ile Lys Glu Lys Asn Asn Ile Leu
900 905 910
Asn Arg Ile Met Pro Met Arg Leu Pro Ile Lys Val Tyr Gly Arg Glu
915 920 925
Asn Phe Ser Lys Asn Lys Lys Lys Lys Ile Arg Arg Asn Thr Phe Phe
930 935 940
Thr Val Tyr Ile Glu Glu Lys Gly Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ala Leu Glu Arg Asp Arg Arg Leu Gly Gly Leu Phe Ser Phe
965 970 975
Val Lys Thr His Ser Lys Ala Glu Ser Lys Ser Asn Thr Ile Ser Lys
980 985 990
Ser Arg Val Glu Tyr Glu Leu Gly Glu Tyr Gln Lys Ala Arg Ile Glu
995 1000 1005
Ile Ile Lys Asp Met Leu Ala Leu Glu Glu Thr Leu Ile Asp Lys
1010 1015 1020
Tyr Asn Ser Leu Asp Thr Asp Asn Phe His Asn Met Leu Thr Gly
1025 1030 1035
Trp Leu Lys Leu Lys Asp Glu Pro Asp Lys Ala Ser Phe Gln Asn
1040 1045 1050
Asp Val Asp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn
1055 1060 1065
Gln Tyr Pro Met Arg Asn Arg Ile Ala Phe Ala Asn Ile Asn Pro
1070 1075 1080
Phe Ser Leu Ser Ser Ala Asn Thr Ser Glu Glu Lys Gly Leu Gly
1085 1090 1095
Ile Ala Asn Gln Leu Lys Asp Lys Thr His Lys Thr Ile Glu Lys
1100 1105 1110
Ile Ile Glu Ile Glu Lys Pro Ile Glu Thr Lys Glu
1115 1120 1125
<210> 136
<211> 1157
<212> PRT
<213> Myroides odoratimimus
<400> 136
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala
225 230 235 240
Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp
245 250 255
Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu
260 265 270
Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu
275 280 285
Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys
290 295 300
Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu
305 310 315 320
Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu
325 330 335
Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln
340 345 350
His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu
355 360 365
Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg
370 375 380
Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr
385 390 395 400
Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg
405 410 415
Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln
420 425 430
Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val
435 440 445
Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Asn Tyr Phe His
450 455 460
Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu
465 470 475 480
Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His
485 490 495
Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu
500 505 510
Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys
515 520 525
Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp
530 535 540
Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys
545 550 555 560
Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp
565 570 575
Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys
580 585 590
Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys
595 600 605
Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys
610 615 620
Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr
625 630 635 640
Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu
645 650 655
Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe
660 665 670
Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu
675 680 685
Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met
690 695 700
Thr Glu Glu Phe Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu
705 710 715 720
Gln Lys Leu Phe Ala Tyr Tyr Asp Thr Ser Lys Ser Asp Leu Asp Leu
725 730 735
Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile
740 745 750
Ala Leu Val Lys Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr
755 760 765
Leu Glu Ala Arg Leu Gly Tyr Met Glu Asn Val Ile Thr Arg Val Lys
770 775 780
Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe
785 790 795 800
Thr Phe Leu Lys Lys Ser Asn Tyr Thr Val Val Ser Leu Asp Lys Gln
805 810 815
Val Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met
820 825 830
Asp Asp Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys
835 840 845
Glu Lys Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr
850 855 860
Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Thr Thr Glu Asp Lys
865 870 875 880
Arg Glu Lys Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn
885 890 895
Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu
900 905 910
Lys Leu Ser Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr
915 920 925
Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu
930 935 940
Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys
945 950 955 960
Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn
965 970 975
Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr
980 985 990
Gln Ser Asp Ile Val Trp Ser Ala Tyr Leu Ser Asn Glu Val Asp Ser
995 1000 1005
Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser
1010 1015 1020
Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys
1025 1030 1035
Ser Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser
1040 1045 1050
Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Val Pro
1055 1060 1065
Ile Gly Met Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val
1070 1075 1080
Lys Phe Ile Lys Glu Glu Ile Ile Gln Leu Gly Gln Ala Gly Glu
1085 1090 1095
Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe
1100 1105 1110
Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu
1115 1120 1125
Asn Asn Tyr Arg Ser Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr
1130 1135 1140
Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Thr Ser
1145 1150 1155
<210> 137
<211> 1157
<212> PRT
<213> Myroides odoratimimus
<400> 137
Met Lys Asp Ile Leu Thr Thr Asp Thr Thr Glu Lys Gln Asn Arg Phe
1 5 10 15
Tyr Ser His Lys Ile Ala Asp Lys Tyr Phe Phe Gly Gly Tyr Phe Asn
20 25 30
Leu Ala Ser Asn Asn Ile Tyr Glu Val Phe Glu Glu Val Asn Lys Arg
35 40 45
Asn Thr Phe Gly Lys Leu Ala Lys Arg Asp Asn Gly Asn Leu Lys Asn
50 55 60
Tyr Ile Ile His Val Phe Lys Asp Glu Leu Ser Ile Ser Asp Phe Glu
65 70 75 80
Lys Arg Val Ala Ile Phe Ala Ser Tyr Phe Pro Ile Leu Glu Thr Val
85 90 95
Asp Lys Lys Ser Ile Lys Glu Arg Asn Arg Thr Ile Asp Leu Thr Leu
100 105 110
Ser Gln Arg Ile Arg Gln Phe Arg Glu Met Leu Ile Ser Leu Val Thr
115 120 125
Ala Val Asp Gln Leu Arg Asn Phe Tyr Thr His Tyr His His Ser Glu
130 135 140
Ile Val Ile Glu Asn Lys Val Leu Asp Phe Leu Asn Ser Ser Leu Val
145 150 155 160
Ser Thr Ala Leu His Val Lys Asp Lys Tyr Leu Lys Thr Asp Lys Thr
165 170 175
Lys Glu Phe Leu Lys Glu Thr Ile Ala Ala Glu Leu Asp Ile Leu Ile
180 185 190
Glu Ala Tyr Lys Lys Lys Gln Ile Glu Lys Lys Asn Thr Arg Phe Lys
195 200 205
Ala Asn Lys Arg Glu Asp Ile Leu Asn Ala Ile Tyr Asn Glu Ala Phe
210 215 220
Trp Ser Phe Ile Asn Asp Lys Asp Lys Asp Lys Glu Thr Val Val Ala
225 230 235 240
Lys Gly Ala Asp Ala Tyr Phe Glu Lys Asn His His Lys Ser Asn Asp
245 250 255
Pro Asp Phe Ala Leu Asn Ile Ser Glu Lys Gly Ile Val Tyr Leu Leu
260 265 270
Ser Phe Phe Leu Thr Asn Lys Glu Met Asp Ser Leu Lys Ala Asn Leu
275 280 285
Thr Gly Phe Lys Gly Lys Val Asp Arg Glu Ser Gly Asn Ser Ile Lys
290 295 300
Tyr Met Ala Thr Gln Arg Ile Tyr Ser Phe His Thr Tyr Arg Gly Leu
305 310 315 320
Lys Gln Lys Ile Arg Thr Ser Glu Glu Gly Val Lys Glu Thr Leu Leu
325 330 335
Met Gln Met Ile Asp Glu Leu Ser Lys Val Pro Asn Val Val Tyr Gln
340 345 350
His Leu Ser Thr Thr Gln Gln Asn Ser Phe Ile Glu Asp Trp Asn Glu
355 360 365
Tyr Tyr Lys Asp Tyr Glu Asp Asp Val Glu Thr Asp Asp Leu Ser Arg
370 375 380
Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Arg Phe Asn Tyr
385 390 395 400
Phe Ala Ile Arg Phe Leu Asp Glu Phe Phe Asp Phe Pro Thr Leu Arg
405 410 415
Phe Gln Val His Leu Gly Asp Tyr Val His Asp Arg Arg Thr Lys Gln
420 425 430
Leu Gly Lys Val Glu Ser Asp Arg Ile Ile Lys Glu Lys Val Thr Val
435 440 445
Phe Ala Arg Leu Lys Asp Ile Asn Ser Ala Lys Ala Ser Tyr Phe His
450 455 460
Ser Leu Glu Glu Gln Asp Lys Glu Glu Leu Asp Asn Lys Trp Thr Leu
465 470 475 480
Phe Pro Asn Pro Ser Tyr Asp Phe Pro Lys Glu His Thr Leu Gln His
485 490 495
Gln Gly Glu Gln Lys Asn Ala Gly Lys Ile Gly Ile Tyr Val Lys Leu
500 505 510
Arg Asp Thr Gln Tyr Lys Glu Lys Ala Ala Leu Glu Glu Ala Arg Lys
515 520 525
Ser Leu Asn Pro Lys Glu Arg Ser Ala Thr Lys Ala Ser Lys Tyr Asp
530 535 540
Ile Ile Thr Gln Ile Ile Glu Ala Asn Asp Asn Val Lys Ser Glu Lys
545 550 555 560
Pro Leu Val Phe Thr Gly Gln Pro Ile Ala Tyr Leu Ser Met Asn Asp
565 570 575
Ile His Ser Met Leu Phe Ser Leu Leu Thr Asp Asn Ala Glu Leu Lys
580 585 590
Lys Thr Pro Glu Glu Val Glu Ala Lys Leu Ile Asp Gln Ile Gly Lys
595 600 605
Gln Ile Asn Glu Ile Leu Ser Lys Asp Thr Asp Thr Lys Ile Leu Lys
610 615 620
Lys Tyr Lys Asp Asn Asp Leu Lys Glu Thr Asp Thr Asp Lys Ile Thr
625 630 635 640
Arg Asp Leu Ala Arg Asp Lys Glu Glu Ile Glu Lys Leu Ile Leu Glu
645 650 655
Gln Lys Gln Arg Ala Asp Asp Tyr Asn Tyr Thr Ser Ser Thr Lys Phe
660 665 670
Asn Ile Asp Lys Ser Arg Lys Arg Lys His Leu Leu Phe Asn Ala Glu
675 680 685
Lys Gly Lys Ile Gly Val Trp Leu Ala Asn Asp Ile Lys Arg Phe Met
690 695 700
Phe Lys Glu Ser Lys Ser Lys Trp Lys Gly Tyr Gln His Thr Glu Leu
705 710 715 720
Gln Lys Leu Phe Ala Tyr Phe Asp Thr Ser Lys Ser Asp Leu Glu Leu
725 730 735
Ile Leu Ser Asp Met Val Met Val Lys Asp Tyr Pro Ile Glu Leu Ile
740 745 750
Asp Leu Val Arg Lys Ser Arg Thr Leu Val Asp Phe Leu Asn Lys Tyr
755 760 765
Leu Glu Ala Arg Leu Gly Tyr Ile Glu Asn Val Ile Thr Arg Val Lys
770 775 780
Asn Ser Ile Gly Thr Pro Gln Phe Lys Thr Val Arg Lys Glu Cys Phe
785 790 795 800
Ala Phe Leu Lys Glu Ser Asn Tyr Thr Val Ala Ser Leu Asp Lys Gln
805 810 815
Ile Glu Arg Ile Leu Ser Met Pro Leu Phe Ile Glu Arg Gly Phe Met
820 825 830
Asp Ser Lys Pro Thr Met Leu Glu Gly Lys Ser Tyr Gln Gln His Lys
835 840 845
Glu Asp Phe Ala Asp Trp Phe Val His Tyr Lys Glu Asn Ser Asn Tyr
850 855 860
Gln Asn Phe Tyr Asp Thr Glu Val Tyr Glu Ile Ile Thr Glu Asp Lys
865 870 875 880
Arg Glu Gln Ala Lys Val Thr Lys Lys Ile Lys Gln Gln Gln Lys Asn
885 890 895
Asp Val Phe Thr Leu Met Met Val Asn Tyr Met Leu Glu Glu Val Leu
900 905 910
Lys Leu Pro Ser Asn Asp Arg Leu Ser Leu Asn Glu Leu Tyr Gln Thr
915 920 925
Lys Glu Glu Arg Ile Val Asn Lys Gln Val Ala Lys Asp Thr Gln Glu
930 935 940
Arg Asn Lys Asn Tyr Ile Trp Asn Lys Val Val Asp Leu Gln Leu Cys
945 950 955 960
Glu Gly Leu Val Arg Ile Asp Lys Val Lys Leu Lys Asp Ile Gly Asn
965 970 975
Phe Arg Lys Tyr Glu Asn Asp Ser Arg Val Lys Glu Phe Leu Thr Tyr
980 985 990
Gln Ser Asp Ile Val Trp Ser Gly Tyr Leu Ser Asn Glu Val Asp Ser
995 1000 1005
Asn Lys Leu Tyr Val Ile Glu Arg Gln Leu Asp Asn Tyr Glu Ser
1010 1015 1020
Ile Arg Ser Lys Glu Leu Leu Lys Glu Val Gln Glu Ile Glu Cys
1025 1030 1035
Ile Val Tyr Asn Gln Val Ala Asn Lys Glu Ser Leu Lys Gln Ser
1040 1045 1050
Gly Asn Glu Asn Phe Lys Gln Tyr Val Leu Gln Gly Leu Leu Pro
1055 1060 1065
Arg Gly Thr Asp Val Arg Glu Met Leu Ile Leu Ser Thr Asp Val
1070 1075 1080
Lys Phe Lys Lys Glu Glu Ile Met Gln Leu Gly Gln Val Arg Glu
1085 1090 1095
Val Glu Gln Asp Leu Tyr Ser Leu Ile Tyr Ile Arg Asn Lys Phe
1100 1105 1110
Ala His Asn Gln Leu Pro Ile Lys Glu Phe Phe Asp Phe Cys Glu
1115 1120 1125
Asn Asn Tyr Arg Pro Ile Ser Asp Asn Glu Tyr Tyr Ala Glu Tyr
1130 1135 1140
Tyr Met Glu Ile Phe Arg Ser Ile Lys Glu Lys Tyr Ala Ser
1145 1150 1155
<210> 138
<211> 1127
<212> PRT
<213> Prevotella sp.
<400> 138
Met Gln Lys Gln Asp Lys Leu Phe Val Asp Arg Lys Lys Asn Ala Ile
1 5 10 15
Phe Ala Phe Pro Lys Tyr Ile Thr Ile Met Glu Asn Gln Glu Lys Pro
20 25 30
Glu Pro Ile Tyr Tyr Glu Leu Thr Asp Lys His Phe Trp Ala Ala Phe
35 40 45
Leu Asn Leu Ala Arg His Asn Val Tyr Thr Thr Ile Asn His Ile Asn
50 55 60
Arg Arg Leu Glu Ile Ala Glu Leu Lys Asp Asp Gly Tyr Met Met Gly
65 70 75 80
Ile Lys Gly Ser Trp Asn Glu Gln Ala Lys Lys Leu Asp Lys Lys Val
85 90 95
Arg Leu Arg Asp Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala
100 105 110
Ala Tyr Glu Ile Thr Asn Ser Lys Ser Pro Asn Asn Lys Glu Gln Arg
115 120 125
Glu Lys Glu Gln Ser Glu Ala Leu Ser Leu Asn Asn Leu Lys Asn Val
130 135 140
Leu Phe Ile Phe Leu Glu Lys Leu Gln Val Leu Arg Asn Tyr Tyr Ser
145 150 155 160
His Tyr Lys Tyr Ser Glu Glu Ser Pro Lys Pro Ile Phe Glu Thr Ser
165 170 175
Leu Leu Lys Asn Met Tyr Lys Val Phe Asp Ala Asn Val Arg Leu Val
180 185 190
Lys Arg Asp Tyr Met His His Glu Asn Ile Asp Met Gln Arg Asp Phe
195 200 205
Thr His Leu Asn Arg Lys Lys Gln Val Gly Arg Thr Lys Asn Ile Ile
210 215 220
Asp Ser Pro Asn Phe His Tyr His Phe Ala Asp Lys Glu Gly Asn Met
225 230 235 240
Thr Ile Ala Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Asp Lys Lys
245 250 255
Asp Ala Ile Trp Met Gln Lys Lys Leu Lys Gly Phe Lys Asp Gly Arg
260 265 270
Asn Leu Arg Glu Gln Met Thr Asn Glu Val Phe Cys Arg Ser Arg Ile
275 280 285
Ser Leu Pro Lys Leu Lys Leu Glu Asn Val Gln Thr Lys Asp Trp Met
290 295 300
Gln Leu Asp Met Leu Asn Glu Leu Val Arg Cys Pro Lys Ser Leu Tyr
305 310 315 320
Glu Arg Leu Arg Glu Lys Asp Arg Glu Ser Phe Lys Val Pro Phe Asp
325 330 335
Ile Phe Ser Asp Asp Tyr Asp Ala Glu Glu Glu Pro Phe Lys Asn Thr
340 345 350
Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Val Leu Arg Tyr Phe
355 360 365
Asp Leu Asn Glu Ile Phe Glu Gln Leu Arg Phe Gln Ile Asp Leu Gly
370 375 380
Thr Tyr His Phe Ser Ile Tyr Asn Lys Arg Ile Gly Asp Glu Asp Glu
385 390 395 400
Val Arg His Leu Thr His His Leu Tyr Gly Phe Ala Arg Ile Gln Asp
405 410 415
Phe Ala Pro Gln Asn Gln Pro Glu Glu Trp Arg Lys Leu Val Lys Asp
420 425 430
Leu Asp His Phe Glu Thr Ser Gln Glu Pro Tyr Ile Ser Lys Thr Ala
435 440 445
Pro His Tyr His Leu Glu Asn Glu Lys Ile Gly Ile Lys Phe Cys Ser
450 455 460
Thr His Asn Asn Leu Phe Pro Ser Leu Lys Arg Glu Lys Thr Cys Asn
465 470 475 480
Gly Arg Ser Lys Phe Asn Leu Gly Thr Gln Phe Thr Ala Glu Ala Phe
485 490 495
Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu Leu Leu
500 505 510
Thr Lys Asp Tyr Ser Arg Lys Glu Ser Ala Asp Lys Val Glu Gly Ile
515 520 525
Ile Arg Lys Glu Ile Ser Asn Ile Tyr Ala Ile Tyr Asp Ala Phe Ala
530 535 540
Asn Asn Glu Ile Asn Ser Ile Ala Asp Leu Thr Cys Arg Leu Gln Lys
545 550 555 560
Thr Asn Ile Leu Gln Gly His Leu Pro Lys Gln Met Ile Ser Ile Leu
565 570 575
Glu Gly Arg Gln Lys Asp Met Glu Lys Glu Ala Glu Arg Lys Ile Gly
580 585 590
Glu Met Ile Asp Asp Thr Gln Arg Arg Leu Asp Leu Leu Cys Lys Gln
595 600 605
Thr Asn Gln Lys Ile Arg Ile Gly Lys Arg Asn Ala Gly Leu Leu Lys
610 615 620
Ser Gly Lys Ile Ala Asp Trp Leu Val Ser Asp Met Met Arg Phe Gln
625 630 635 640
Pro Val Gln Lys Asp Thr Asn Asn Ala Pro Ile Asn Asn Ser Lys Ala
645 650 655
Asn Ser Thr Glu Tyr Arg Met Leu Gln His Ala Leu Ala Leu Phe Gly
660 665 670
Ser Glu Ser Ser Arg Leu Lys Ala Tyr Phe Arg Gln Met Asn Leu Val
675 680 685
Gly Asn Ala Asn Pro His Pro Phe Leu Ala Glu Thr Gln Trp Glu His
690 695 700
Gln Thr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Glu Ala Arg Lys
705 710 715 720
Lys Tyr Leu Lys Gly Leu Lys Pro Gln Asn Trp Lys Gln Tyr Gln His
725 730 735
Phe Leu Ile Leu Lys Val Gln Lys Thr Asn Arg Asn Thr Leu Val Thr
740 745 750
Gly Trp Lys Asn Ser Phe Asn Leu Pro Arg Gly Ile Phe Thr Gln Pro
755 760 765
Ile Arg Glu Trp Phe Glu Lys His Asn Asn Ser Lys Arg Ile Tyr Asp
770 775 780
Gln Ile Leu Ser Phe Asp Arg Val Gly Phe Val Ala Lys Ala Ile Pro
785 790 795 800
Leu Tyr Phe Ala Glu Glu Tyr Lys Asp Asn Val Gln Pro Phe Tyr Asp
805 810 815
Tyr Pro Phe Asn Ile Gly Asn Lys Leu Lys Pro Gln Lys Gly Gln Phe
820 825 830
Leu Asp Lys Lys Glu Arg Val Glu Leu Trp Gln Lys Asn Lys Glu Leu
835 840 845
Phe Lys Asn Tyr Pro Ser Glu Lys Asn Lys Thr Asp Leu Ala Tyr Leu
850 855 860
Asp Phe Leu Ser Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Ile Lys
865 870 875 880
Asn Gln Asp Ile Val Thr Trp Leu Met Phe Lys Glu Leu Phe Lys Thr
885 890 895
Thr Thr Val Glu Gly Leu Lys Ile Gly Glu Ile His Leu Arg Asp Ile
900 905 910
Asp Thr Asn Thr Ala Asn Glu Glu Ser Asn Asn Ile Leu Asn Arg Ile
915 920 925
Met Pro Met Lys Leu Pro Val Lys Thr Tyr Glu Thr Asp Asn Lys Gly
930 935 940
Asn Ile Leu Lys Glu Arg Pro Leu Ala Thr Phe Tyr Ile Glu Glu Thr
945 950 955 960
Glu Thr Lys Val Leu Lys Gln Gly Asn Phe Lys Val Leu Ala Lys Asp
965 970 975
Arg Arg Leu Asn Gly Leu Leu Ser Phe Ala Glu Thr Thr Asp Ile Asp
980 985 990
Leu Glu Lys Asn Pro Ile Thr Lys Leu Ser Val Asp Tyr Glu Leu Ile
995 1000 1005
Lys Tyr Gln Thr Thr Arg Ile Ser Ile Phe Glu Met Thr Leu Gly
1010 1015 1020
Leu Glu Lys Lys Leu Ile Asp Lys Tyr Ser Thr Leu Pro Thr Asp
1025 1030 1035
Ser Phe Arg Asn Met Leu Glu Arg Trp Leu Gln Cys Lys Ala Asn
1040 1045 1050
Arg Pro Glu Leu Lys Asn Tyr Val Asn Ser Leu Ile Ala Val Arg
1055 1060 1065
Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Ala Thr Leu
1070 1075 1080
Phe Ala Glu Val Lys Lys Phe Thr Leu Phe Pro Ser Val Asp Thr
1085 1090 1095
Lys Lys Ile Glu Leu Asn Ile Ala Pro Gln Leu Leu Glu Ile Val
1100 1105 1110
Gly Lys Ala Ile Lys Glu Ile Glu Lys Ser Glu Asn Lys Asn
1115 1120 1125
<210> 139
<211> 1119
<212> PRT
<213> Porphyromonas gingivalis
<400> 139
Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Asp Glu Ala
500 505 510
Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Val Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Ile Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Asn Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Gly Asn Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 140
<211> 1154
<212> PRT
<213> Paludibacter propionicigenes
<400> 140
Met Lys Thr Ser Ala Asn Asn Ile Tyr Phe Asn Gly Ile Asn Ser Phe
1 5 10 15
Lys Lys Ile Phe Asp Ser Lys Gly Ala Ile Ala Pro Ile Ala Glu Lys
20 25 30
Ser Cys Arg Asn Phe Asp Ile Lys Ala Gln Asn Asp Val Asn Lys Glu
35 40 45
Gln Arg Ile His Tyr Phe Ala Val Gly His Thr Phe Lys Gln Leu Asp
50 55 60
Thr Glu Asn Leu Phe Glu Tyr Val Leu Asp Glu Asn Leu Arg Ala Lys
65 70 75 80
Arg Pro Thr Arg Phe Ile Ser Leu Gln Gln Phe Asp Lys Glu Phe Ile
85 90 95
Glu Asn Ile Lys Arg Leu Ile Ser Asp Ile Arg Asn Ile Asn Ser His
100 105 110
Tyr Ile His Arg Phe Asp Pro Leu Lys Ile Asp Ala Val Pro Thr Asn
115 120 125
Ile Ile Asp Phe Leu Lys Glu Ser Phe Glu Leu Ala Val Ile Gln Ile
130 135 140
Tyr Leu Lys Glu Lys Gly Ile Asn Tyr Leu Gln Phe Ser Glu Asn Pro
145 150 155 160
His Ala Asp Gln Lys Leu Val Ala Phe Leu His Asp Lys Phe Leu Pro
165 170 175
Leu Asp Glu Lys Lys Thr Ser Met Leu Gln Asn Glu Thr Pro Gln Leu
180 185 190
Lys Glu Tyr Lys Glu Tyr Arg Lys Tyr Phe Lys Thr Leu Ser Lys Gln
195 200 205
Ala Ala Ile Asp Gln Leu Leu Phe Ala Glu Lys Glu Thr Asp Tyr Ile
210 215 220
Trp Asn Leu Phe Asp Ser His Pro Val Leu Thr Ile Ser Ala Gly Lys
225 230 235 240
Tyr Leu Ser Phe Tyr Ser Cys Leu Phe Leu Leu Ser Met Phe Leu Tyr
245 250 255
Lys Ser Glu Ala Asn Gln Leu Ile Ser Lys Ile Lys Gly Phe Lys Lys
260 265 270
Asn Thr Thr Glu Glu Glu Lys Ser Lys Arg Glu Ile Phe Thr Phe Phe
275 280 285
Ser Lys Arg Phe Asn Ser Met Asp Ile Asp Ser Glu Glu Asn Gln Leu
290 295 300
Val Lys Phe Arg Asp Leu Ile Leu Tyr Leu Asn His Tyr Pro Val Ala
305 310 315 320
Trp Asn Lys Asp Leu Glu Leu Asp Ser Ser Asn Pro Ala Met Thr Asp
325 330 335
Lys Leu Lys Ser Lys Ile Ile Glu Leu Glu Ile Asn Arg Ser Phe Pro
340 345 350
Leu Tyr Glu Gly Asn Glu Arg Phe Ala Thr Phe Ala Lys Tyr Gln Ile
355 360 365
Trp Gly Lys Lys His Leu Gly Lys Ser Ile Glu Lys Glu Tyr Ile Asn
370 375 380
Ala Ser Phe Thr Asp Glu Glu Ile Thr Ala Tyr Thr Tyr Glu Thr Asp
385 390 395 400
Thr Cys Pro Glu Leu Lys Asp Ala His Lys Lys Leu Ala Asp Leu Lys
405 410 415
Ala Ala Lys Gly Leu Phe Gly Lys Arg Lys Glu Lys Asn Glu Ser Asp
420 425 430
Ile Lys Lys Thr Glu Thr Ser Ile Arg Glu Leu Gln His Glu Pro Asn
435 440 445
Pro Ile Lys Asp Lys Leu Ile Gln Arg Ile Glu Lys Asn Leu Leu Thr
450 455 460
Val Ser Tyr Gly Arg Asn Gln Asp Arg Phe Met Asp Phe Ser Ala Arg
465 470 475 480
Phe Leu Ala Glu Ile Asn Tyr Phe Gly Gln Asp Ala Ser Phe Lys Met
485 490 495
Tyr His Phe Tyr Ala Thr Asp Glu Gln Asn Ser Glu Leu Glu Lys Tyr
500 505 510
Glu Leu Pro Lys Asp Lys Lys Lys Tyr Asp Ser Leu Lys Phe His Gln
515 520 525
Gly Lys Leu Val His Phe Ile Ser Tyr Lys Glu His Leu Lys Arg Tyr
530 535 540
Glu Ser Trp Asp Asp Ala Phe Val Ile Glu Asn Asn Ala Ile Gln Leu
545 550 555 560
Lys Leu Ser Phe Asp Gly Val Glu Asn Thr Val Thr Ile Gln Arg Ala
565 570 575
Leu Leu Ile Tyr Leu Leu Glu Asp Ala Leu Arg Asn Ile Gln Asn Asn
580 585 590
Thr Ala Glu Asn Ala Gly Lys Gln Leu Leu Gln Glu Tyr Tyr Ser His
595 600 605
Asn Lys Ala Asp Leu Ser Ala Phe Lys Gln Ile Leu Thr Gln Gln Asp
610 615 620
Ser Ile Glu Pro Gln Gln Lys Thr Glu Phe Lys Lys Leu Leu Pro Arg
625 630 635 640
Arg Leu Leu Asn Asn Tyr Ser Pro Ala Ile Asn His Leu Gln Thr Pro
645 650 655
His Ser Ser Leu Pro Leu Ile Leu Glu Lys Ala Leu Leu Ala Glu Lys
660 665 670
Arg Tyr Cys Ser Leu Val Val Lys Ala Lys Ala Glu Gly Asn Tyr Asp
675 680 685
Asp Phe Ile Lys Arg Asn Lys Gly Lys Gln Phe Lys Leu Gln Phe Ile
690 695 700
Arg Lys Ala Trp Asn Leu Met Tyr Phe Arg Asn Ser Tyr Leu Gln Asn
705 710 715 720
Val Gln Ala Ala Gly His His Lys Ser Phe His Ile Glu Arg Asp Glu
725 730 735
Phe Asn Asp Phe Ser Arg Tyr Met Phe Ala Phe Glu Glu Leu Ser Gln
740 745 750
Tyr Lys Tyr Tyr Leu Asn Glu Met Phe Glu Lys Lys Gly Phe Phe Glu
755 760 765
Asn Asn Glu Phe Lys Ile Leu Phe Gln Ser Gly Thr Ser Leu Glu Asn
770 775 780
Leu Tyr Glu Lys Thr Lys Gln Lys Phe Glu Ile Trp Leu Ala Ser Asn
785 790 795 800
Thr Ala Lys Thr Asn Lys Pro Asp Asn Tyr His Leu Asn Asn Tyr Glu
805 810 815
Gln Gln Phe Ser Asn Gln Leu Phe Phe Ile Asn Leu Ser His Phe Ile
820 825 830
Asn Tyr Leu Lys Ser Thr Gly Lys Leu Gln Thr Asp Ala Asn Gly Gln
835 840 845
Ile Ile Tyr Glu Ala Leu Asn Asn Val Gln Tyr Leu Ile Pro Glu Tyr
850 855 860
Tyr Tyr Thr Asp Lys Pro Glu Arg Ser Glu Ser Lys Ser Gly Asn Lys
865 870 875 880
Leu Tyr Asn Lys Leu Lys Ala Thr Lys Leu Glu Asp Ala Leu Leu Tyr
885 890 895
Glu Met Ala Met Cys Tyr Leu Lys Ala Asp Lys Gln Ile Ala Asp Lys
900 905 910
Ala Lys His Pro Ile Thr Lys Leu Leu Thr Ser Asp Val Glu Phe Asn
915 920 925
Ile Thr Asn Lys Glu Gly Ile Gln Leu Tyr His Leu Leu Val Pro Phe
930 935 940
Lys Lys Ile Asp Ala Phe Ile Gly Leu Lys Met His Lys Glu Gln Gln
945 950 955 960
Asp Lys Lys His Pro Thr Ser Phe Leu Ala Asn Ile Val Asn Tyr Leu
965 970 975
Glu Leu Val Lys Asn Asp Lys Asp Ile Arg Lys Thr Tyr Glu Ala Phe
980 985 990
Ser Thr Asn Pro Val Lys Arg Thr Leu Thr Tyr Asp Asp Leu Ala Lys
995 1000 1005
Ile Asp Gly His Leu Ile Ser Lys Ser Ile Lys Phe Thr Asn Val
1010 1015 1020
Thr Leu Glu Leu Glu Arg Tyr Phe Ile Phe Lys Glu Ser Leu Ile
1025 1030 1035
Val Lys Lys Gly Asn Asn Ile Asp Phe Lys Tyr Ile Lys Gly Leu
1040 1045 1050
Arg Asn Tyr Tyr Asn Asn Glu Lys Lys Lys Asn Glu Gly Ile Arg
1055 1060 1065
Asn Lys Ala Phe His Phe Gly Ile Pro Asp Ser Lys Ser Tyr Asp
1070 1075 1080
Gln Leu Ile Arg Asp Ala Glu Val Met Phe Ile Ala Asn Glu Val
1085 1090 1095
Lys Pro Thr His Ala Thr Lys Tyr Thr Asp Leu Asn Lys Gln Leu
1100 1105 1110
His Thr Val Cys Asp Lys Leu Met Glu Thr Val His Asn Asp Tyr
1115 1120 1125
Phe Ser Lys Glu Gly Asp Gly Lys Lys Lys Arg Glu Ala Ala Gly
1130 1135 1140
Gln Lys Tyr Phe Glu Asn Ile Ile Ser Ala Lys
1145 1150
<210> 141
<211> 1119
<212> PRT
<213> Porphyromonas gingivalis
<400> 141
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Glu Asp Thr Asp Gly Ala
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Ala His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala
500 505 510
Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Met Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Trp Val Gln Pro
785 790 795 800
Phe Tyr Asn Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Ile Cys
865 870 875 880
Gly Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val Gln Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Cys
1010 1015 1020
Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Phe Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 142
<211> 1179
<212> PRT
<213> Flavobacterium columnare
<400> 142
Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His
1 5 10 15
Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala
20 25 30
Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn
35 40 45
Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe
50 55 60
Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu
65 70 75 80
Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His
85 90 95
Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile
100 105 110
Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr
115 120 125
Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val
130 135 140
Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu
145 150 155 160
Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln
165 170 175
Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn
180 185 190
Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu
195 200 205
Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr
210 215 220
Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser
225 230 235 240
Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln
245 250 255
Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile
260 265 270
Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile
275 280 285
Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg
290 295 300
Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr
305 310 315 320
His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile
325 330 335
Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser
340 345 350
Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg
355 360 365
Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His
370 375 380
Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met
385 390 395 400
Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val
405 410 415
Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser
420 425 430
Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe
435 440 445
Glu Lys Leu Ser Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys
450 455 460
Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Asn Pro
465 470 475 480
Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg
485 490 495
Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser
500 505 510
Gln Asn Lys Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln
515 520 525
Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys
530 535 540
Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu
545 550 555 560
Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu
565 570 575
Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile
580 585 590
Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr
595 600 605
Leu Ile Lys Thr Ile Asn Thr Asp Ser Ser Val Thr Phe Glu Asn Gln
610 615 620
Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Ile Gln Lys Glu Leu Thr
625 630 635 640
Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Glu His Glu Ile Glu Val
645 650 655
Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro
660 665 670
Lys Asn Lys Val Asp Asp Lys Lys Leu Gln Arg Lys Tyr Val Phe Tyr
675 680 685
Arg Asn Glu Ile Arg Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile
690 695 700
His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu
705 710 715 720
Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile
725 730 735
Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr
740 745 750
Lys Gly Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe
755 760 765
Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser
770 775 780
Thr Phe Leu Glu Asn Gly Leu Ile Gly Leu Pro Pro Lys Ile Leu Lys
785 790 795 800
Lys Glu Leu Ser Lys Arg Phe Lys Tyr Ile Phe Ile Val Phe Gln Lys
805 810 815
Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr
820 825 830
Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr
835 840 845
Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe
850 855 860
Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr
865 870 875 880
Pro Asp Ile Val Glu Arg Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg
885 890 895
Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val
900 905 910
Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu
915 920 925
Ser Asp Phe Tyr Val Ser Lys Ala Glu Arg Glu Lys Ile Lys Ala Asp
930 935 940
Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Ser Leu Trp Asn Lys Val
945 950 955 960
Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu
965 970 975
Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala
980 985 990
Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys
995 1000 1005
Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr
1010 1015 1020
Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys
1025 1030 1035
Glu Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Glu
1040 1045 1050
Glu Tyr Thr Asp Phe Leu Ser Thr Gln Ile His Pro Ala Asp Phe
1055 1060 1065
Glu Arg Glu Gly Asn Pro Asn Phe Lys Lys Tyr Leu Ala His Ser
1070 1075 1080
Ile Leu Glu Asn Glu Asp Asp Leu Asp Lys Leu Pro Glu Lys Val
1085 1090 1095
Glu Ala Met Arg Glu Leu Asp Glu Thr Ile Thr Asn Pro Ile Ile
1100 1105 1110
Lys Lys Ala Ile Val Leu Ile Ile Ile Arg Asn Lys Met Ala His
1115 1120 1125
Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp Leu Ala Asn Arg Phe
1130 1135 1140
Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala Thr Tyr Phe Asn Arg
1145 1150 1155
Val Phe Glu Thr Ile Thr Lys Glu Leu Trp Glu Asn Lys Glu Lys
1160 1165 1170
Lys Asp Lys Thr Gln Val
1175
<210> 143
<211> 1145
<212> PRT
<213> Psychroflexus torquis
<400> 143
Met Glu Ser Ile Ile Gly Leu Gly Leu Ser Phe Asn Pro Tyr Lys Thr
1 5 10 15
Ala Asp Lys His Tyr Phe Gly Ser Phe Leu Asn Leu Val Glu Asn Asn
20 25 30
Leu Asn Ala Val Phe Ala Glu Phe Lys Glu Arg Ile Ser Tyr Lys Ala
35 40 45
Lys Asp Glu Asn Ile Ser Ser Leu Ile Glu Lys His Phe Ile Asp Asn
50 55 60
Met Ser Ile Val Asp Tyr Glu Lys Lys Ile Ser Ile Leu Asn Gly Tyr
65 70 75 80
Leu Pro Ile Ile Asp Phe Leu Asp Asp Glu Leu Glu Asn Asn Leu Asn
85 90 95
Thr Arg Val Lys Asn Phe Lys Lys Asn Phe Ile Ile Leu Ala Glu Ala
100 105 110
Ile Glu Lys Leu Arg Asp Tyr Tyr Thr His Phe Tyr His Asp Pro Ile
115 120 125
Thr Phe Glu Asp Asn Lys Glu Pro Leu Leu Glu Leu Leu Asp Glu Val
130 135 140
Leu Leu Lys Thr Ile Leu Asp Val Lys Lys Lys Tyr Leu Lys Thr Asp
145 150 155 160
Lys Thr Lys Glu Ile Leu Lys Asp Ser Leu Arg Glu Glu Met Asp Leu
165 170 175
Leu Val Ile Arg Lys Thr Asp Glu Leu Arg Glu Lys Lys Lys Thr Asn
180 185 190
Pro Lys Ile Gln His Thr Asp Ser Ser Gln Ile Lys Asn Ser Ile Phe
195 200 205
Asn Asp Ala Phe Gln Gly Leu Leu Tyr Glu Asp Lys Gly Asn Asn Lys
210 215 220
Lys Thr Gln Val Ser His Arg Ala Lys Thr Arg Leu Asn Pro Lys Asp
225 230 235 240
Ile His Lys Gln Glu Glu Arg Asp Phe Glu Ile Pro Leu Ser Thr Ser
245 250 255
Gly Leu Val Phe Leu Met Ser Leu Phe Leu Ser Lys Lys Glu Ile Glu
260 265 270
Asp Phe Lys Ser Asn Ile Lys Gly Phe Lys Gly Lys Val Val Lys Asp
275 280 285
Glu Asn His Asn Ser Leu Lys Tyr Met Ala Thr His Arg Val Tyr Ser
290 295 300
Ile Leu Ala Phe Lys Gly Leu Lys Tyr Arg Ile Lys Thr Asp Thr Phe
305 310 315 320
Ser Lys Glu Thr Leu Met Met Gln Met Ile Asp Glu Leu Ser Lys Val
325 330 335
Pro Asp Cys Val Tyr Gln Asn Leu Ser Glu Thr Lys Gln Lys Asp Phe
340 345 350
Ile Glu Asp Trp Asn Glu Tyr Phe Lys Asp Asn Glu Glu Asn Thr Glu
355 360 365
Asn Leu Glu Asn Ser Arg Val Val His Pro Val Ile Arg Lys Arg Tyr
370 375 380
Glu Asp Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala
385 390 395 400
Asn Phe Lys Thr Leu Lys Phe Gln Val Phe Met Gly Tyr Tyr Ile His
405 410 415
Asp Gln Arg Thr Lys Thr Ile Gly Thr Thr Asn Ile Thr Thr Glu Arg
420 425 430
Thr Val Lys Glu Lys Ile Asn Val Phe Gly Lys Leu Ser Lys Met Asp
435 440 445
Asn Leu Lys Lys His Phe Phe Ser Gln Leu Ser Asp Asp Glu Asn Thr
450 455 460
Asp Trp Glu Phe Phe Pro Asn Pro Ser Tyr Asn Phe Leu Thr Gln Ala
465 470 475 480
Asp Asn Ser Pro Ala Asn Asn Ile Pro Ile Tyr Leu Glu Leu Lys Asn
485 490 495
Gln Gln Ile Ile Lys Glu Lys Asp Ala Ile Lys Ala Glu Val Asn Gln
500 505 510
Thr Gln Asn Arg Asn Pro Asn Lys Pro Ser Lys Arg Asp Leu Leu Asn
515 520 525
Lys Ile Leu Lys Thr Tyr Glu Asp Phe His Gln Gly Asp Pro Thr Ala
530 535 540
Ile Leu Ser Leu Asn Glu Ile Pro Ala Leu Leu His Leu Phe Leu Val
545 550 555 560
Lys Pro Asn Asn Lys Thr Gly Gln Gln Ile Glu Asn Ile Ile Arg Ile
565 570 575
Lys Ile Glu Lys Gln Phe Lys Ala Ile Asn His Pro Ser Lys Asn Asn
580 585 590
Lys Gly Ile Pro Lys Ser Leu Phe Ala Asp Thr Asn Val Arg Val Asn
595 600 605
Ala Ile Lys Leu Lys Lys Asp Leu Glu Ala Glu Leu Asp Met Leu Asn
610 615 620
Lys Lys His Ile Ala Phe Lys Glu Asn Gln Lys Ala Ser Ser Asn Tyr
625 630 635 640
Asp Lys Leu Leu Lys Glu His Gln Phe Thr Pro Lys Asn Lys Arg Pro
645 650 655
Glu Leu Arg Lys Tyr Val Phe Tyr Lys Ser Glu Lys Gly Glu Glu Ala
660 665 670
Thr Trp Leu Ala Asn Asp Ile Lys Arg Phe Met Pro Lys Asp Phe Lys
675 680 685
Thr Lys Trp Lys Gly Cys Gln His Ser Glu Leu Gln Arg Lys Leu Ala
690 695 700
Phe Tyr Asp Arg His Thr Lys Gln Asp Ile Lys Glu Leu Leu Ser Gly
705 710 715 720
Cys Glu Phe Asp His Ser Leu Leu Asp Ile Asn Ala Tyr Phe Gln Lys
725 730 735
Asp Asn Phe Glu Asp Phe Phe Ser Lys Tyr Leu Glu Asn Arg Ile Glu
740 745 750
Thr Leu Glu Gly Val Leu Lys Lys Leu His Asp Phe Lys Asn Glu Pro
755 760 765
Thr Pro Leu Lys Gly Val Phe Lys Asn Cys Phe Lys Phe Leu Lys Arg
770 775 780
Gln Asn Tyr Val Thr Glu Ser Pro Glu Ile Ile Lys Lys Arg Ile Leu
785 790 795 800
Ala Lys Pro Thr Phe Leu Pro Arg Gly Val Phe Asp Glu Arg Pro Thr
805 810 815
Met Lys Lys Gly Lys Asn Pro Leu Lys Asp Lys Asn Glu Phe Ala Glu
820 825 830
Trp Phe Val Glu Tyr Leu Glu Asn Lys Asp Tyr Gln Lys Phe Tyr Asn
835 840 845
Ala Glu Glu Tyr Arg Met Arg Asp Ala Asp Phe Lys Lys Asn Ala Val
850 855 860
Ile Lys Lys Gln Lys Leu Lys Asp Phe Tyr Thr Leu Gln Met Val Asn
865 870 875 880
Tyr Leu Leu Lys Glu Val Phe Gly Lys Asp Glu Met Asn Leu Gln Leu
885 890 895
Ser Glu Leu Phe Gln Thr Arg Gln Glu Arg Leu Lys Leu Gln Gly Ile
900 905 910
Ala Lys Lys Gln Met Asn Lys Glu Thr Gly Asp Ser Ser Glu Asn Thr
915 920 925
Arg Asn Gln Thr Tyr Ile Trp Asn Lys Asp Val Pro Val Ser Phe Phe
930 935 940
Asn Gly Lys Val Thr Ile Asp Lys Val Lys Leu Lys Asn Ile Gly Lys
945 950 955 960
Tyr Lys Arg Tyr Glu Arg Asp Glu Arg Val Lys Thr Phe Ile Gly Tyr
965 970 975
Glu Val Asp Glu Lys Trp Met Met Tyr Leu Pro His Asn Trp Lys Asp
980 985 990
Arg Tyr Ser Val Lys Pro Ile Asn Val Ile Asp Leu Gln Ile Gln Glu
995 1000 1005
Tyr Glu Glu Ile Arg Ser His Glu Leu Leu Lys Glu Ile Gln Asn
1010 1015 1020
Leu Glu Gln Tyr Ile Tyr Asp His Thr Thr Asp Lys Asn Ile Leu
1025 1030 1035
Leu Gln Asp Gly Asn Pro Asn Phe Lys Met Tyr Val Leu Asn Gly
1040 1045 1050
Leu Leu Ile Gly Ile Lys Gln Val Asn Ile Pro Asp Phe Ile Val
1055 1060 1065
Leu Lys Gln Asn Thr Asn Phe Asp Lys Ile Asp Phe Thr Gly Ile
1070 1075 1080
Ala Ser Cys Ser Glu Leu Glu Lys Lys Thr Ile Ile Leu Ile Ala
1085 1090 1095
Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Asn Lys Met Ile
1100 1105 1110
Tyr Asp Leu Ala Asn Glu Phe Leu Lys Ile Glu Lys Asn Glu Thr
1115 1120 1125
Tyr Ala Asn Tyr Tyr Leu Lys Val Leu Lys Lys Met Ile Ser Asp
1130 1135 1140
Leu Ala
1145
<210> 144
<211> 948
<212> PRT
<213> Riemerella anatipestifer
<400> 144
Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu
1 5 10 15
Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys
20 25 30
Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg
35 40 45
Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe
50 55 60
Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn
65 70 75 80
Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser
85 90 95
Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr Thr Glu Val
100 105 110
Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg
115 120 125
Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg
130 135 140
Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn Lys Lys His
145 150 155 160
Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln
165 170 175
Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr
180 185 190
Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg
195 200 205
Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys
210 215 220
Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Ser
225 230 235 240
Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp
245 250 255
Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser Asn Gln Pro
260 265 270
Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile
275 280 285
Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Ile
290 295 300
Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Gly Phe
305 310 315 320
Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro Leu Met Phe
325 330 335
Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu Thr Val
340 345 350
Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg Ile Asn
355 360 365
Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro Leu Gly
370 375 380
Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln Pro Asp
385 390 395 400
Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala Glu Thr
405 410 415
Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser Pro Lys
420 425 430
Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu Ala Asp
435 440 445
Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala Tyr Asp Ala
450 455 460
Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu Phe Trp
465 470 475 480
Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn Arg Leu
485 490 495
Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn Pro His
500 505 510
Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu Val Asp
515 520 525
Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu Ala Ile
530 535 540
Lys His Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu Lys Val
545 550 555 560
Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln Gly Gly
565 570 575
Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu Thr Leu
580 585 590
Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu Ile Lys Lys
595 600 605
His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr Phe Lys
610 615 620
Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser Tyr Lys
625 630 635 640
Leu Glu Ala Lys Ala Pro Leu Leu Lys Lys Glu Glu His Tyr Glu Tyr
645 650 655
Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg Leu Glu
660 665 670
Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys Arg Trp
675 680 685
Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp Ile Met
690 695 700
Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys Glu Leu
705 710 715 720
Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val Asn Val
725 730 735
Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu Pro Met
740 745 750
Val Leu Pro Val Lys Val Tyr Pro Thr Thr Ala Phe Gly Glu Val Gln
755 760 765
Tyr His Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu Gln Thr
770 775 780
Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg
785 790 795 800
Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr Gln Lys
805 810 815
His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile Tyr Gln
820 825 830
Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu Glu Lys
835 840 845
Leu Leu Asn Lys His Ala Ser Leu Ser Ser Leu Glu Asn Glu Phe Arg
850 855 860
Thr Leu Leu Glu Glu Trp Lys Lys Lys Tyr Ala Ala Ser Ser Met Val
865 870 875 880
Thr Asp Lys His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala Phe Cys
885 890 895
His Asn Gln Tyr Pro Phe Tyr Lys Glu Thr Leu His Ala Pro Ile Leu
900 905 910
Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly Leu Gly
915 920 925
Ile Ala Glu Ala Leu Leu Lys Val Leu Arg Glu Tyr Cys Glu Ile Val
930 935 940
Lys Ser Gln Ile
945
<210> 145
<211> 1139
<212> PRT
<213> Prevotella pleuritidis
<400> 145
Met Glu Asn Asp Lys Arg Leu Glu Glu Ser Ala Cys Tyr Thr Leu Asn
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Val Asn His Ile Asn Lys Thr Leu Glu Leu Lys Asn Lys
35 40 45
Lys Asn Gln Glu Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile
50 55 60
Lys Thr His Trp Ala Lys Val Asn Gly Asp Leu Asn Lys Thr Asp Arg
65 70 75 80
Leu Arg Glu Leu Met Ile Lys His Phe Pro Phe Leu Glu Ala Ala Ile
85 90 95
Tyr Ser Asn Asn Lys Glu Asp Lys Glu Glu Val Lys Glu Glu Lys Gln
100 105 110
Ala Lys Ala Gln Ser Phe Lys Ser Leu Lys Asp Cys Leu Phe Leu Phe
115 120 125
Leu Glu Lys Leu Gln Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys Tyr
130 135 140
Ser Glu Ser Ser Lys Glu Pro Glu Phe Glu Glu Gly Leu Leu Glu Lys
145 150 155 160
Met Tyr Asn Thr Phe Asp Ala Ser Ile Arg Leu Val Lys Glu Asp Tyr
165 170 175
Gln Tyr Asn Lys Asp Ile Asp Pro Glu Lys Asp Phe Lys His Leu Glu
180 185 190
Arg Lys Glu Asp Phe Asn Tyr Leu Phe Thr Asp Lys Asp Asn Lys Gly
195 200 205
Lys Ile Thr Lys Asn Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu
210 215 220
Lys Lys Asp Ala Ile Trp Met Gln Gln Lys Phe Arg Gly Phe Lys Asp
225 230 235 240
Asn Arg Gly Asn Lys Glu Lys Met Thr His Glu Val Phe Cys Arg Ser
245 250 255
Arg Met Leu Leu Pro Lys Ile Arg Leu Glu Ser Thr Gln Thr Gln Asp
260 265 270
Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser
275 280 285
Leu Tyr Glu Arg Leu Gln Gly Ala Tyr Arg Glu Lys Phe Lys Val Pro
290 295 300
Phe Asp Ser Ile Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Arg
305 310 315 320
Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg
325 330 335
Tyr Phe Asp Tyr Asn Glu Ile Phe Lys Asn Leu Arg Phe Gln Ile Asp
340 345 350
Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Leu Ile Gly Gly Lys
355 360 365
Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile
370 375 380
Gln Glu Phe Thr Lys Gln Asn Arg Pro Asp Lys Trp Gln Ala Ile Ile
385 390 395 400
Lys Asp Leu Asp Thr Tyr Glu Thr Ser Asn Glu Arg Tyr Ile Ser Glu
405 410 415
Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Phe
420 425 430
Arg Asn Asp Asn Asn Asp Ile Trp Pro Ser Leu Lys Thr Asn Gly Glu
435 440 445
Lys Asn Glu Lys Ser Lys Tyr Asn Leu Asp Lys Pro Tyr Gln Ala Glu
450 455 460
Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr Tyr Leu
465 470 475 480
Leu Leu Lys Met Glu Asn Thr Asp Asn Asp Lys Glu Asp Asn Glu Val
485 490 495
Gly Thr Lys Lys Lys Gly Asn Lys Asn Asn Lys Gln Glu Lys His Lys
500 505 510
Ile Glu Glu Ile Ile Glu Asn Lys Ile Lys Asp Ile Tyr Ala Leu Tyr
515 520 525
Asp Ala Phe Thr Asn Gly Glu Ile Asn Ser Ile Asp Glu Leu Ala Glu
530 535 540
Gln Arg Glu Gly Lys Asp Ile Glu Ile Gly His Leu Pro Lys Gln Leu
545 550 555 560
Ile Val Ile Leu Lys Asn Lys Ser Lys Asp Met Ala Glu Lys Ala Asn
565 570 575
Arg Lys Gln Lys Glu Met Ile Lys Asp Thr Lys Lys Arg Leu Ala Thr
580 585 590
Leu Asp Lys Gln Val Lys Gly Glu Ile Glu Asp Gly Gly Arg Asn Ile
595 600 605
Arg Leu Leu Lys Ser Gly Glu Ile Ala Arg Trp Leu Val Asn Asp Met
610 615 620
Met Arg Phe Gln Pro Val Gln Lys Asp Asn Glu Gly Lys Pro Leu Asn
625 630 635 640
Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Met Leu Gln Arg Ser Leu
645 650 655
Ala Leu Tyr Asn Lys Glu Glu Lys Pro Thr Arg Tyr Phe Arg Gln Val
660 665 670
Asn Leu Ile Lys Ser Ser Asn Pro His Pro Phe Leu Glu Asp Thr Lys
675 680 685
Trp Glu Glu Cys Tyr Asn Ile Leu Ser Phe Tyr Arg Asn Tyr Leu Lys
690 695 700
Ala Lys Ile Lys Phe Leu Asn Lys Leu Lys Pro Glu Asp Trp Lys Lys
705 710 715 720
Asn Gln Tyr Phe Leu Met Leu Lys Glu Pro Lys Thr Asn Arg Lys Thr
725 730 735
Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg Gly Ile Phe
740 745 750
Thr Glu Pro Ile Lys Glu Trp Phe Lys Arg His Gln Asn Asp Ser Glu
755 760 765
Glu Tyr Lys Lys Val Glu Ala Leu Asp Arg Val Gly Leu Val Ala Lys
770 775 780
Val Ile Pro Leu Phe Phe Lys Glu Glu Tyr Phe Lys Glu Asp Ala Gln
785 790 795 800
Lys Glu Ile Asn Asn Cys Val Gln Pro Phe Tyr Ser Phe Pro Tyr Asn
805 810 815
Val Gly Asn Ile His Lys Pro Glu Glu Lys Asn Phe Leu His Cys Glu
820 825 830
Glu Arg Arg Lys Leu Trp Asp Lys Lys Lys Asp Lys Phe Lys Gly Tyr
835 840 845
Lys Ala Lys Glu Lys Ser Lys Lys Met Thr Asp Lys Glu Lys Glu Glu
850 855 860
His Arg Ser Tyr Leu Glu Phe Gln Ser Trp Asn Lys Phe Glu Arg Glu
865 870 875 880
Leu Arg Leu Val Arg Asn Gln Asp Ile Leu Thr Trp Leu Leu Cys Thr
885 890 895
Lys Leu Ile Asp Lys Leu Lys Ile Asp Glu Leu Asn Ile Glu Glu Leu
900 905 910
Gln Lys Leu Arg Leu Lys Asp Ile Asp Thr Asp Thr Ala Lys Lys Glu
915 920 925
Lys Asn Asn Ile Leu Asn Arg Val Met Pro Met Arg Leu Pro Val Thr
930 935 940
Val Tyr Glu Ile Asp Lys Ser Phe Asn Ile Val Lys Asp Lys Pro Leu
945 950 955 960
His Thr Val Tyr Ile Glu Glu Thr Gly Thr Lys Leu Leu Lys Gln Gly
965 970 975
Asn Phe Lys Ala Leu Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser
980 985 990
Phe Val Lys Thr Ser Ser Glu Ala Glu Ser Lys Ser Lys Pro Ile Ser
995 1000 1005
Lys Leu Arg Val Glu Tyr Glu Leu Gly Ala Tyr Gln Lys Ala Arg
1010 1015 1020
Ile Asp Ile Ile Lys Asp Met Leu Ala Leu Glu Lys Thr Leu Ile
1025 1030 1035
Asp Asn Asp Glu Asn Leu Pro Thr Asn Lys Phe Ser Asp Met Leu
1040 1045 1050
Lys Ser Trp Leu Lys Gly Lys Gly Glu Ala Asn Lys Ala Arg Leu
1055 1060 1065
Gln Asn Asp Val Gly Leu Leu Val Ala Val Arg Asn Ala Phe Ser
1070 1075 1080
His Asn Gln Tyr Pro Met Tyr Asn Ser Glu Val Phe Lys Gly Met
1085 1090 1095
Lys Leu Leu Ser Leu Ser Ser Asp Ile Pro Glu Lys Glu Gly Leu
1100 1105 1110
Gly Ile Ala Lys Gln Leu Lys Asp Lys Ile Lys Glu Thr Ile Glu
1115 1120 1125
Arg Ile Ile Glu Ile Glu Lys Glu Ile Arg Asn
1130 1135
<210> 146
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 146
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 147
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 147
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asn Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 148
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 148
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 149
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 149
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asp Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Gln Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg His Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu Arg Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Val Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Ile Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Ile Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 150
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 150
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Arg Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 151
<211> 1133
<212> PRT
<213> Prevotella falsenii
<400> 151
Met Lys Asn Asp Asn Asn Ser Thr Lys Ser Thr Asp Tyr Thr Leu Gly
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Val Asn His Ile Asn Lys Val Leu Glu Leu Lys Asn Lys
35 40 45
Lys Asp Gln Glu Ile Ile Ile Asp Asn Asp Gln Asp Ile Leu Ala Ile
50 55 60
Lys Thr Leu Trp Gly Lys Val Asp Thr Asp Ile Asn Lys Lys Asp Arg
65 70 75 80
Leu Arg Glu Leu Ile Met Lys His Phe Pro Phe Leu Glu Ala Ala Thr
85 90 95
Tyr Gln Gln Ser Ser Thr Asn Asn Thr Lys Gln Lys Glu Glu Glu Gln
100 105 110
Ala Lys Ala Gln Ser Phe Glu Ser Leu Lys Asp Cys Leu Phe Leu Phe
115 120 125
Leu Glu Lys Leu Arg Glu Ala Arg Asn Tyr Tyr Ser His Tyr Lys His
130 135 140
Ser Lys Ser Leu Glu Glu Pro Lys Leu Glu Glu Lys Leu Leu Glu Asn
145 150 155 160
Met Tyr Asn Ile Phe Asp Thr Asn Val Gln Leu Val Ile Lys Asp Tyr
165 170 175
Glu His Asn Lys Asp Ile Asn Pro Glu Glu Asp Phe Lys His Leu Gly
180 185 190
Arg Ala Glu Gly Glu Phe Asn Tyr Tyr Phe Thr Arg Asn Lys Lys Gly
195 200 205
Asn Ile Thr Glu Ser Gly Leu Leu Phe Phe Val Ser Leu Phe Leu Glu
210 215 220
Lys Lys Asp Ala Ile Trp Ala Gln Thr Lys Ile Lys Gly Phe Lys Asp
225 230 235 240
Asn Arg Glu Asn Lys Gln Lys Met Thr His Glu Val Phe Cys Arg Ser
245 250 255
Arg Met Leu Leu Pro Lys Leu Arg Leu Glu Ser Thr Gln Thr Gln Asp
260 265 270
Trp Ile Leu Leu Asp Met Leu Asn Glu Leu Ile Arg Cys Pro Lys Ser
275 280 285
Leu Tyr Lys Arg Leu Gln Gly Glu Lys Arg Glu Lys Phe Arg Val Pro
290 295 300
Phe Asp Pro Ala Asp Glu Asp Tyr Asp Ala Glu Gln Glu Pro Phe Lys
305 310 315 320
Asn Thr Leu Val Arg His Gln Asp Arg Phe Pro Tyr Phe Ala Leu Arg
325 330 335
Tyr Phe Asp Tyr Asn Glu Ile Phe Thr Asn Leu Arg Phe Gln Ile Asp
340 345 350
Leu Gly Thr Tyr His Phe Ser Ile Tyr Lys Lys Gln Ile Gly Asp Lys
355 360 365
Lys Glu Asp Arg His Leu Thr His Lys Leu Tyr Gly Phe Glu Arg Ile
370 375 380
Gln Glu Phe Ala Lys Glu Asn Arg Pro Asp Glu Trp Lys Ala Leu Val
385 390 395 400
Lys Asp Leu Asp Thr Phe Glu Glu Ser Asn Glu Pro Tyr Ile Ser Glu
405 410 415
Thr Thr Pro His Tyr His Leu Glu Asn Gln Lys Ile Gly Ile Arg Asn
420 425 430
Lys Asn Lys Lys Lys Lys Lys Thr Ile Trp Pro Ser Leu Glu Thr Lys
435 440 445
Thr Thr Val Asn Glu Arg Ser Lys Tyr Asn Leu Gly Lys Ser Phe Lys
450 455 460
Ala Glu Ala Phe Leu Ser Val His Glu Leu Leu Pro Met Met Phe Tyr
465 470 475 480
Tyr Leu Leu Leu Asn Lys Glu Glu Pro Asn Asn Gly Lys Ile Asn Ala
485 490 495
Ser Lys Val Glu Gly Ile Ile Glu Lys Lys Ile Arg Asp Ile Tyr Lys
500 505 510
Leu Tyr Gly Ala Phe Ala Asn Glu Glu Ile Asn Asn Glu Glu Glu Leu
515 520 525
Lys Glu Tyr Cys Glu Gly Lys Asp Ile Ala Ile Arg His Leu Pro Lys
530 535 540
Gln Met Ile Ala Ile Leu Lys Asn Glu Tyr Lys Asp Met Ala Lys Lys
545 550 555 560
Ala Glu Asp Lys Gln Lys Lys Met Ile Lys Asp Thr Lys Lys Arg Leu
565 570 575
Ala Ala Leu Asp Lys Gln Val Lys Gly Glu Val Glu Asp Gly Gly Arg
580 585 590
Asn Ile Lys Pro Leu Lys Ser Gly Arg Ile Ala Ser Trp Leu Val Asn
595 600 605
Asp Met Met Arg Phe Gln Pro Val Gln Arg Asp Arg Asp Gly Tyr Pro
610 615 620
Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Gln Leu Leu Gln Arg
625 630 635 640
Thr Leu Ala Leu Phe Gly Ser Glu Arg Glu Arg Leu Ala Pro Tyr Phe
645 650 655
Arg Gln Met Asn Leu Ile Gly Lys Asp Asn Pro His Pro Phe Leu Lys
660 665 670
Asp Thr Lys Trp Lys Glu His Asn Asn Ile Leu Ser Phe Tyr Arg Ser
675 680 685
Tyr Leu Glu Ala Lys Lys Asn Phe Leu Gly Ser Leu Lys Pro Glu Asp
690 695 700
Trp Lys Lys Asn Gln Tyr Phe Leu Lys Leu Lys Glu Pro Lys Thr Asn
705 710 715 720
Arg Glu Thr Leu Val Gln Gly Trp Lys Asn Gly Phe Asn Leu Pro Arg
725 730 735
Gly Ile Phe Thr Glu Pro Ile Arg Glu Trp Phe Ile Arg His Gln Asn
740 745 750
Glu Ser Glu Glu Tyr Lys Lys Val Lys Asp Phe Asp Arg Ile Gly Leu
755 760 765
Val Ala Lys Val Ile Pro Leu Phe Phe Lys Glu Asp Tyr Gln Lys Glu
770 775 780
Ile Glu Asp Tyr Val Gln Pro Phe Tyr Gly Tyr Pro Phe Asn Val Gly
785 790 795 800
Asn Ile His Asn Ser Gln Glu Gly Thr Phe Leu Asn Lys Lys Glu Arg
805 810 815
Glu Glu Leu Trp Lys Gly Asn Lys Thr Lys Phe Lys Asp Tyr Lys Thr
820 825 830
Lys Glu Lys Asn Lys Glu Lys Thr Asn Lys Asp Lys Phe Lys Lys Lys
835 840 845
Thr Asp Glu Glu Lys Glu Glu Phe Arg Ser Tyr Leu Asp Phe Gln Ser
850 855 860
Trp Lys Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln Asp Ile
865 870 875 880
Val Thr Trp Leu Leu Cys Met Glu Leu Ile Asp Lys Leu Lys Ile Asp
885 890 895
Glu Leu Asn Ile Glu Glu Leu Gln Lys Leu Arg Leu Lys Asp Ile Asp
900 905 910
Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg Ile Met
915 920 925
Pro Met Glu Leu Pro Val Thr Val Tyr Glu Thr Asp Asp Ser Asn Asn
930 935 940
Ile Ile Lys Asp Lys Pro Leu His Thr Ile Tyr Ile Lys Glu Ala Glu
945 950 955 960
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys Asp Arg
965 970 975
Arg Leu Asn Gly Leu Phe Ser Phe Val Glu Thr Ser Ser Glu Ala Glu
980 985 990
Leu Lys Ser Lys Pro Ile Ser Lys Ser Leu Val Glu Tyr Glu Leu Gly
995 1000 1005
Glu Tyr Gln Arg Ala Arg Val Glu Ile Ile Lys Asp Met Leu Arg
1010 1015 1020
Leu Glu Glu Thr Leu Ile Gly Asn Asp Glu Lys Leu Pro Thr Asn
1025 1030 1035
Lys Phe Arg Gln Met Leu Asp Lys Trp Leu Glu His Lys Lys Glu
1040 1045 1050
Thr Asp Asp Thr Asp Leu Lys Asn Asp Val Lys Leu Leu Thr Glu
1055 1060 1065
Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Arg Asp Arg
1070 1075 1080
Ile Ala Phe Ala Asn Ile Lys Pro Phe Ser Leu Ser Ser Ala Asn
1085 1090 1095
Thr Ser Asn Glu Glu Gly Leu Gly Ile Ala Lys Lys Leu Lys Asp
1100 1105 1110
Lys Thr Lys Glu Thr Ile Asp Arg Ile Ile Glu Ile Glu Glu Gln
1115 1120 1125
Thr Ala Thr Lys Arg
1130
<210> 152
<211> 1116
<212> PRT
<213> Prevotella pleuritidis
<400> 152
Met Glu Asn Asp Lys Arg Leu Glu Glu Ser Thr Cys Tyr Thr Leu Asn
1 5 10 15
Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn Val
20 25 30
Tyr Ile Thr Ile Asn His Ile Asn Lys Leu Leu Glu Ile Arg Gln Ile
35 40 45
Asp Asn Asp Glu Lys Val Leu Asp Ile Lys Ala Leu Trp Gln Lys Val
50 55 60
Asp Lys Asp Ile Asn Gln Lys Ala Arg Leu Arg Glu Leu Met Ile Lys
65 70 75 80
His Phe Pro Phe Leu Glu Ala Ala Ile Tyr Ser Asn Asn Lys Glu Asp
85 90 95
Lys Glu Glu Val Lys Glu Glu Lys Gln Ala Lys Ala Gln Ser Phe Lys
100 105 110
Ser Leu Lys Asp Cys Leu Phe Leu Phe Leu Glu Lys Leu Gln Glu Ala
115 120 125
Arg Asn Tyr Tyr Ser His Tyr Lys Ser Ser Glu Ser Ser Lys Glu Pro
130 135 140
Glu Phe Glu Glu Gly Leu Leu Glu Lys Met Tyr Asn Thr Phe Gly Val
145 150 155 160
Ser Ile Arg Leu Val Lys Glu Asp Tyr Gln Tyr Asn Lys Asp Ile Asp
165 170 175
Pro Glu Lys Asp Phe Lys His Leu Glu Arg Lys Glu Asp Phe Asn Tyr
180 185 190
Leu Phe Thr Asp Lys Asp Asn Lys Gly Lys Ile Thr Lys Asn Gly Leu
195 200 205
Leu Phe Phe Val Ser Leu Phe Leu Glu Lys Lys Asp Ala Ile Trp Met
210 215 220
Gln Gln Lys Leu Arg Gly Phe Lys Asp Asn Arg Gly Asn Lys Glu Lys
225 230 235 240
Met Thr His Glu Val Phe Cys Arg Ser Arg Met Leu Leu Pro Lys Ile
245 250 255
Arg Leu Glu Ser Thr Gln Thr Gln Asp Trp Ile Leu Leu Asp Met Leu
260 265 270
Asn Glu Leu Ile Arg Cys Pro Lys Ser Leu Tyr Glu Arg Leu Gln Gly
275 280 285
Ala Tyr Arg Glu Lys Phe Lys Val Pro Phe Asp Ser Ile Asp Glu Asp
290 295 300
Tyr Asp Ala Glu Gln Glu Pro Phe Arg Asn Thr Leu Val Arg His Gln
305 310 315 320
Asp Arg Phe Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Tyr Asn Glu Ile
325 330 335
Phe Lys Asn Leu Arg Phe Gln Ile Asp Leu Gly Thr Tyr His Phe Ser
340 345 350
Ile Tyr Lys Lys Leu Ile Gly Asp Asn Lys Glu Asp Arg His Leu Thr
355 360 365
His Lys Leu Tyr Gly Phe Glu Arg Ile Gln Glu Phe Ala Lys Gln Lys
370 375 380
Arg Pro Asn Glu Trp Gln Ala Leu Val Lys Asp Leu Asp Ile Tyr Glu
385 390 395 400
Thr Ser Asn Glu Gln Tyr Ile Ser Glu Thr Thr Pro His Tyr His Leu
405 410 415
Glu Asn Gln Lys Ile Gly Ile Arg Phe Lys Asn Lys Lys Asp Lys Ile
420 425 430
Trp Pro Ser Leu Glu Thr Asn Gly Lys Glu Asn Glu Lys Ser Lys Tyr
435 440 445
Asn Leu Asp Lys Ser Phe Gln Ala Glu Ala Phe Leu Ser Ile His Glu
450 455 460
Leu Leu Pro Met Met Phe Tyr Asp Leu Leu Leu Lys Lys Glu Glu Pro
465 470 475 480
Asn Asn Asp Glu Lys Asn Ala Ser Ile Val Glu Gly Phe Ile Lys Lys
485 490 495
Glu Ile Lys Arg Met Tyr Ala Ile Tyr Asp Ala Phe Ala Asn Glu Glu
500 505 510
Ile Asn Ser Lys Glu Gly Leu Glu Glu Tyr Cys Lys Asn Lys Gly Phe
515 520 525
Gln Glu Arg His Leu Pro Lys Gln Met Ile Ala Ile Leu Thr Asn Lys
530 535 540
Ser Lys Asn Met Ala Glu Lys Ala Lys Arg Lys Gln Lys Glu Met Ile
545 550 555 560
Lys Asp Thr Lys Lys Arg Leu Ala Thr Leu Asp Lys Gln Val Lys Gly
565 570 575
Glu Ile Glu Asp Gly Gly Arg Asn Ile Arg Leu Leu Lys Ser Gly Glu
580 585 590
Ile Ala Arg Trp Leu Val Asn Asp Met Met Arg Phe Gln Ser Val Gln
595 600 605
Lys Asp Lys Glu Gly Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr
610 615 620
Glu Tyr Gln Met Leu Gln Arg Ser Leu Ala Leu Tyr Asn Lys Glu Gln
625 630 635 640
Lys Pro Thr Pro Tyr Phe Ile Gln Val Asn Leu Ile Lys Ser Ser Asn
645 650 655
Pro His Pro Phe Leu Glu Glu Thr Lys Trp Glu Glu Cys Asn Asn Ile
660 665 670
Leu Ser Phe Tyr Arg Ser Tyr Leu Glu Ala Lys Lys Asn Phe Leu Glu
675 680 685
Ser Leu Lys Pro Glu Asp Trp Lys Lys Asn Gln Tyr Phe Leu Met Leu
690 695 700
Lys Glu Pro Lys Thr Asn Arg Lys Thr Leu Val Gln Gly Trp Lys Asn
705 710 715 720
Gly Phe Asn Leu Pro Arg Gly Ile Phe Thr Glu Pro Ile Lys Glu Trp
725 730 735
Phe Lys Arg His Gln Asn Asp Ser Glu Glu Tyr Lys Lys Val Glu Ala
740 745 750
Leu Asp Arg Val Gly Leu Val Ala Lys Val Ile Pro Leu Phe Phe Lys
755 760 765
Glu Glu Tyr Phe Lys Glu Asp Ala Gln Lys Glu Ile Asn Asn Cys Val
770 775 780
Gln Pro Phe Tyr Ser Phe Pro Tyr Asn Val Gly Asn Ile His Lys Pro
785 790 795 800
Glu Glu Lys Asn Phe Leu His Cys Glu Glu Arg Arg Lys Leu Trp Asp
805 810 815
Lys Lys Lys Asp Lys Phe Lys Gly Tyr Lys Ala Lys Glu Lys Ser Lys
820 825 830
Lys Met Thr Asp Lys Glu Lys Glu Glu His Arg Ser Tyr Leu Glu Phe
835 840 845
Gln Ser Trp Asn Lys Phe Glu Arg Glu Leu Arg Leu Val Arg Asn Gln
850 855 860
Asp Ile Val Thr Trp Leu Leu Cys Thr Glu Leu Ile Asp Lys Leu Lys
865 870 875 880
Ile Asp Glu Leu Asn Ile Glu Glu Leu Gln Lys Leu Arg Leu Lys Asp
885 890 895
Ile Asp Thr Asp Thr Ala Lys Lys Glu Lys Asn Asn Ile Leu Asn Arg
900 905 910
Ile Met Pro Met Gln Leu Pro Val Thr Val Tyr Glu Ile Asp Lys Ser
915 920 925
Phe Asn Ile Val Lys Asp Lys Pro Leu His Thr Ile Tyr Ile Glu Glu
930 935 940
Thr Gly Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ala Leu Val Lys
945 950 955 960
Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Lys Thr Ser Ser Glu
965 970 975
Ala Glu Ser Lys Ser Lys Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
980 985 990
Leu Gly Ala Tyr Gln Lys Ala Arg Ile Asp Ile Ile Lys Asp Met Leu
995 1000 1005
Ala Leu Glu Lys Thr Leu Ile Asp Asn Asp Glu Asn Leu Pro Thr
1010 1015 1020
Asn Lys Phe Ser Asp Met Leu Lys Ser Trp Leu Lys Gly Lys Gly
1025 1030 1035
Glu Ala Asn Lys Ala Arg Leu Gln Asn Asp Val Asp Leu Leu Val
1040 1045 1050
Ala Ile Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asn
1055 1060 1065
Ser Glu Val Phe Lys Gly Met Lys Leu Leu Ser Leu Ser Ser Asp
1070 1075 1080
Ile Pro Glu Lys Glu Gly Leu Gly Ile Ala Lys Gln Leu Lys Asp
1085 1090 1095
Lys Ile Lys Glu Thr Ile Glu Arg Ile Ile Glu Ile Glu Lys Glu
1100 1105 1110
Ile Arg Asn
1115
<210> 153
<211> 1119
<212> PRT
<213> Porphyromonas gingivalis
<400> 153
Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Gly Thr Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Ile Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp
530 535 540
Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val His Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala
1100 1105 1110
Glu Arg Ile Ile Gln Val
1115
<210> 154
<211> 1175
<212> PRT
<213> Porphyromonas gulae
<400> 154
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Met Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asn Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Asp Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr
1055 1060 1065
Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 155
<211> 1119
<212> PRT
<213> Porphyromonas gulae
<400> 155
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Val Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asn Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu Asp Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Gln Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Pro Asn Val Gln Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Glu Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val
995 1000 1005
Phe Glu Leu Thr Leu Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 156
<211> 1119
<212> PRT
<213> Porphyromonas gulae
<400> 156
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Gly Pro Tyr Glu Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Lys Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Ser Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu His Lys Asn Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu Asp Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Asn Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Asp Val His Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Glu Asn Phe Arg Glu Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Gly Lys Trp Pro Asp Leu His Gly Lys Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 157
<211> 1175
<212> PRT
<213> Porphyromonas gulae
<400> 157
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Asp Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Ser Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Lys Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr
1055 1060 1065
Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile
1160 1165 1170
Gln Val
1175
<210> 158
<211> 1119
<212> PRT
<213> Porphyromonas gulae
<400> 158
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Phe Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Glu Val
180 185 190
Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Gly Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Pro Tyr Glu Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Gly Ile Leu Ser Gln Glu Arg Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Gln Glu His Pro Tyr His Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Pro Asn Val Gln Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Glu Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Ala Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr
1010 1015 1020
Pro His Leu Pro Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Thr Lys Trp Pro Glu Leu His Gly Lys Val
1040 1045 1050
Arg Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Trp Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Ile
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 159
<211> 1174
<212> PRT
<213> Porphyromonas gulae
<400> 159
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Gly Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Tyr His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Gly Pro Tyr Glu Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Leu Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Cys Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Thr Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Thr Ile Leu Ser Gln Glu Arg Lys Asp Met Lys
565 570 575
Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Ala Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn Cys Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Asp Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Asp Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Met Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Lys Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asn Thr
995 1000 1005
Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp Arg
1010 1015 1020
Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu Ala
1025 1030 1035
Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu Leu
1040 1045 1050
Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr Leu
1055 1060 1065
Arg Leu Glu Glu Ser Leu Leu Ser Arg Tyr Pro His Leu Pro Asp
1070 1075 1080
Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu Leu
1085 1090 1095
Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile Ala
1100 1105 1110
Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp Glu
1115 1120 1125
Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro Asp
1130 1135 1140
Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu Ser
1145 1150 1155
Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile Gln
1160 1165 1170
Ala
<210> 160
<211> 1135
<212> PRT
<213> Porphyromonas gulae
<400> 160
Met Asn Thr Val Pro Ala Thr Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Ile Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Cys Phe Asp Pro Asp Ser Gly Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Lys Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Ala Tyr Thr Phe Ala Cys Glu Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Leu Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Phe Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Asp Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Arg Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Tyr Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Glu Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp His Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 161
<211> 1218
<212> PRT
<213> Capnocytophaga cynodegmi
<400> 161
Met Glu Asn Lys Thr Ser Leu Gly Asn Asn Ile Tyr Tyr Asn Pro Phe
1 5 10 15
Lys Pro Gln Asp Lys Ser Tyr Phe Ala Gly Tyr Leu Asn Ala Ala Met
20 25 30
Glu Asn Ile Asp Ser Val Phe Arg Glu Leu Gly Lys Arg Leu Lys Gly
35 40 45
Lys Glu Tyr Thr Ser Glu Asn Phe Phe Asp Ala Ile Phe Lys Glu Asn
50 55 60
Ile Ser Leu Val Glu Tyr Glu Arg Tyr Val Lys Leu Leu Ser Asp Tyr
65 70 75 80
Phe Pro Met Ala Arg Leu Leu Asp Lys Lys Glu Val Pro Ile Lys Glu
85 90 95
Arg Lys Glu Asn Phe Lys Lys Asn Phe Arg Gly Ile Ile Lys Ala Val
100 105 110
Arg Asp Leu Arg Asn Phe Tyr Thr His Lys Glu His Gly Glu Val Glu
115 120 125
Ile Thr Asp Glu Ile Phe Gly Val Leu Asp Glu Met Leu Lys Ser Thr
130 135 140
Val Leu Thr Val Lys Lys Lys Lys Ile Lys Thr Asp Lys Thr Lys Glu
145 150 155 160
Ile Leu Lys Lys Ser Ile Glu Lys Gln Leu Asp Ile Leu Cys Gln Lys
165 170 175
Lys Leu Glu Tyr Leu Lys Asp Thr Ala Arg Lys Ile Glu Glu Lys Arg
180 185 190
Arg Asn Gln Arg Glu Arg Gly Glu Lys Lys Leu Val Pro Arg Phe Glu
195 200 205
Tyr Ser Asp Arg Arg Asp Asp Leu Ile Ala Ala Ile Tyr Asn Asp Ala
210 215 220
Phe Asp Val Tyr Ile Asp Lys Lys Lys Asp Ser Leu Lys Glu Ser Ser
225 230 235 240
Lys Thr Lys Tyr Asn Thr Glu Ser Tyr Pro Gln Gln Glu Glu Gly Asp
245 250 255
Leu Lys Ile Pro Ile Ser Lys Asn Gly Val Val Phe Leu Leu Ser Leu
260 265 270
Phe Leu Ser Lys Gln Glu Val His Ala Phe Lys Ser Lys Ile Ala Gly
275 280 285
Phe Lys Ala Thr Val Ile Asp Glu Ala Thr Val Ser His Arg Lys Asn
290 295 300
Ser Ile Cys Phe Met Ala Thr His Glu Ile Phe Ser His Leu Ala Tyr
305 310 315 320
Lys Lys Leu Lys Arg Lys Val Arg Thr Ala Glu Ile Asn Tyr Ser Glu
325 330 335
Ala Glu Asn Ala Glu Gln Leu Ser Ile Tyr Ala Lys Glu Thr Leu Met
340 345 350
Met Gln Met Leu Asp Glu Leu Ser Lys Val Pro Asp Val Val Tyr Gln
355 360 365
Asn Leu Ser Glu Asp Val Gln Lys Thr Phe Ile Glu Asp Trp Asn Glu
370 375 380
Tyr Leu Lys Glu Asn Asn Gly Asp Val Gly Thr Met Glu Glu Glu Gln
385 390 395 400
Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asp Lys Phe Asn Tyr
405 410 415
Phe Ala Ile Arg Phe Leu Asp Glu Phe Ala Gln Phe Pro Thr Leu Arg
420 425 430
Phe Gln Val His Leu Gly Asn Tyr Leu His Asp Ser Arg Pro Lys Glu
435 440 445
His Leu Ile Ser Asp Arg Arg Ile Lys Glu Lys Ile Thr Val Phe Gly
450 455 460
Arg Leu Ser Glu Leu Glu His Lys Lys Ala Leu Phe Ile Lys Asn Thr
465 470 475 480
Glu Thr Asn Glu Asp Arg Lys His Tyr Trp Glu Val Phe Pro Asn Pro
485 490 495
Asn Tyr Asp Phe Pro Lys Glu Asn Ile Ser Val Asn Asp Lys Asp Phe
500 505 510
Pro Ile Ala Gly Ser Ile Leu Asp Arg Glu Lys Gln Pro Thr Ala Gly
515 520 525
Lys Ile Gly Ile Lys Val Asn Leu Leu Asn Gln Lys Tyr Ile Ser Glu
530 535 540
Val Asp Lys Ala Val Lys Ala His Gln Leu Lys Gln Arg Asn Asn Lys
545 550 555 560
Pro Ser Ile Gln Asn Ile Ile Glu Glu Ile Val Pro Ile Asn Gly Ser
565 570 575
Asn Pro Lys Glu Ile Ile Val Phe Gly Gly Gln Pro Thr Ala Tyr Leu
580 585 590
Ser Met Asn Asp Ile His Ser Ile Leu Tyr Glu Phe Phe Asp Lys Trp
595 600 605
Glu Lys Lys Lys Glu Lys Leu Glu Lys Lys Gly Glu Lys Glu Leu Arg
610 615 620
Lys Glu Ile Gly Lys Glu Leu Glu Glu Lys Ile Val Gly Lys Ile Gln
625 630 635 640
Thr Gln Ile Gln Gln Ile Ile Asp Lys Asp Ile Asn Ala Lys Ile Leu
645 650 655
Lys Pro Tyr Gln Asp Asp Asp Ser Thr Ala Ile Asp Lys Glu Lys Leu
660 665 670
Ile Lys Asp Leu Lys Gln Glu Gln Lys Ile Leu Gln Lys Leu Lys Asn
675 680 685
Glu Gln Thr Ala Arg Glu Lys Glu Tyr Gln Glu Cys Ile Ala Tyr Gln
690 695 700
Glu Glu Ser Arg Lys Ile Lys Arg Ser Asp Lys Ser Arg Gln Lys Tyr
705 710 715 720
Leu Arg Asn Gln Leu Lys Arg Lys Tyr Pro Glu Val Pro Thr Arg Lys
725 730 735
Glu Ile Leu Tyr Tyr Gln Glu Lys Gly Lys Val Ala Val Trp Leu Ala
740 745 750
Asn Asp Ile Lys Arg Phe Met Pro Thr Asp Phe Lys Asn Glu Trp Lys
755 760 765
Gly Glu Gln His Ser Leu Leu Gln Lys Ser Leu Ala Tyr Tyr Glu Gln
770 775 780
Cys Lys Glu Glu Leu Lys Asn Leu Leu Pro Gln Gln Lys Val Phe Lys
785 790 795 800
His Leu Pro Phe Glu Leu Gly Gly His Phe Gln Gln Lys Tyr Leu Tyr
805 810 815
Gln Phe Tyr Thr Arg Tyr Leu Asp Lys Arg Leu Glu His Ile Ser Gly
820 825 830
Leu Val Gln Gln Ala Glu Asn Phe Lys Asn Glu Asn Lys Val Phe Lys
835 840 845
Lys Val Glu Asn Glu Cys Phe Lys Phe Leu Lys Lys Gln Asn Tyr Thr
850 855 860
His Lys Gly Leu Asp Ala Gln Ala Gln Ser Val Leu Gly Tyr Pro Ile
865 870 875 880
Phe Leu Glu Arg Gly Phe Met Asp Glu Lys Pro Thr Ile Ile Lys Gly
885 890 895
Lys Thr Phe Lys Gly Asn Glu Ser Leu Phe Thr Asp Trp Phe Arg Tyr
900 905 910
Tyr Lys Glu Tyr Gln Asn Phe Gln Thr Phe Tyr Asp Thr Glu Asn Tyr
915 920 925
Pro Leu Val Glu Leu Glu Lys Lys Gln Ala Asp Arg Lys Arg Glu Thr
930 935 940
Lys Ile Tyr Gln Gln Lys Lys Asn Asp Val Phe Thr Leu Leu Met Ala
945 950 955 960
Lys His Ile Phe Lys Ser Val Phe Lys Gln Asp Ser Ile Asp Arg Phe
965 970 975
Ser Leu Glu Asp Leu Tyr Gln Ser Arg Glu Glu Arg Leu Glu Asn Gln
980 985 990
Glu Lys Ala Lys Gln Thr Gly Glu Arg Asn Thr Asn Tyr Ile Trp Asn
995 1000 1005
Lys Thr Val Asp Leu Asn Leu Cys Asp Gly Lys Val Thr Val Glu
1010 1015 1020
Asn Val Lys Leu Lys Asn Val Gly Asn Phe Ile Lys Tyr Glu Tyr
1025 1030 1035
Asp Gln Arg Val Gln Thr Phe Leu Lys Tyr Glu Glu Asn Ile Lys
1040 1045 1050
Trp Gln Ala Phe Leu Ile Lys Glu Ser Lys Glu Glu Glu Asn Tyr
1055 1060 1065
Pro Tyr Ile Val Glu Arg Glu Ile Glu Gln Tyr Glu Lys Val Arg
1070 1075 1080
Arg Glu Glu Leu Leu Lys Glu Val His Leu Ile Glu Glu Tyr Ile
1085 1090 1095
Leu Glu Lys Val Lys Asp Lys Glu Ile Leu Lys Lys Gly Asp Asn
1100 1105 1110
Gln Asn Phe Lys Tyr Tyr Ile Leu Asn Gly Leu Leu Lys Gln Leu
1115 1120 1125
Lys Asn Glu Asp Val Glu Ser Tyr Lys Val Phe Asn Leu Asn Thr
1130 1135 1140
Lys Pro Glu Asp Val Asn Ile Asn Gln Leu Lys Gln Glu Ala Thr
1145 1150 1155
Asp Leu Glu Gln Lys Ala Phe Val Leu Thr Tyr Ile Arg Asn Lys
1160 1165 1170
Phe Ala His Asn Gln Leu Pro Lys Lys Glu Phe Trp Asp Tyr Cys
1175 1180 1185
Gln Glu Lys Tyr Gly Lys Ile Glu Lys Glu Lys Thr Tyr Ala Glu
1190 1195 1200
Tyr Phe Ala Glu Val Phe Lys Arg Glu Lys Glu Ala Leu Met Lys
1205 1210 1215
<210> 162
<211> 1090
<212> PRT
<213> Prevotella sp.
<400> 162
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Ile Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Ser
145 150 155 160
Lys Tyr Tyr Thr Val Ala Leu Arg Asn Thr Lys Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Asn Ile Lys Lys Ile Thr
180 185 190
Lys Asp Ala Tyr Gly Lys Arg Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Leu Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Thr Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Ala Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Val Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Ser Asp Lys Gly Ser Ser Ala Pro Leu Leu Pro Leu Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Leu Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Ala Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Thr Gly Leu Cys Asn
690 695 700
Glu Ile Lys Arg Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr His
785 790 795 800
Tyr Met Asp Met Leu Lys Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Cys Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Ile Val Ser Lys Glu Asp Ile Met Glu Glu Phe Asn Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Ile Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys
1085 1090
<210> 163
<211> 1090
<212> PRT
<213> Prevotella sp.
<400> 163
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Gln Ala Ser His Tyr Lys Thr Tyr Asp Glu Lys Leu Ile Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Leu Ser Gly Met Ile Asn
145 150 155 160
Asn Tyr Tyr Thr Val Ala Leu Arg Asn Met Asn Glu Arg Tyr Gly Tyr
165 170 175
Lys Thr Glu Asp Leu Ala Phe Ile Gln Asp Lys Arg Phe Lys Phe Val
180 185 190
Lys Asp Ala Tyr Gly Lys Lys Lys Ser Gln Val Asn Thr Gly Phe Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Gln Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Ile Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Gln Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Ile Lys Arg Cys Pro Asn Glu
290 295 300
Leu Phe Glu Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asn Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Val Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Asp Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Ser Asp Glu Glu Thr Pro Ala Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Lys
485 490 495
Lys Thr Glu Lys Leu Ile Val Asp Val His Asn Arg Tyr Lys Arg Leu
500 505 510
Phe Lys Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Ile Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Ala Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asn
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Val Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Ile Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Asp Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Arg Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
Ser Cys Phe Thr Ser Val Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Ser Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Val Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Lys Tyr Thr
930 935 940
Ile Thr Ser Glu Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asp Thr Val Ser Lys Glu Asp Ile Met Glu Glu Phe Lys Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Ser Ala Arg Val Asp Arg Glu
1010 1015 1020
Glu Lys Val Asp Phe Lys Ser Ile Leu Lys Ile Leu Leu Asn Asn
1025 1030 1035
Lys Asn Ile Asn Lys Glu Gln Ser Asp Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Val Val Glu
1055 1060 1065
Ile Arg Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys
1085 1090
<210> 164
<211> 1090
<212> PRT
<213> Prevotella sp.
<400> 164
Met Asn Ile Pro Ala Leu Val Glu Asn Gln Lys Lys Tyr Phe Gly Thr
1 5 10 15
Tyr Ser Val Met Ala Met Leu Asn Ala Gln Thr Val Leu Asp His Ile
20 25 30
Gln Lys Val Ala Asp Ile Glu Gly Glu Gln Asn Glu Asn Asn Glu Asn
35 40 45
Leu Trp Phe His Pro Val Met Ser His Leu Tyr Asn Ala Lys Asn Gly
50 55 60
Tyr Asp Lys Gln Pro Glu Lys Thr Met Phe Ile Ile Glu Arg Leu Gln
65 70 75 80
Ser Tyr Phe Pro Phe Leu Lys Ile Met Ala Glu Asn Gln Arg Glu Tyr
85 90 95
Ser Asn Gly Lys Tyr Lys Gln Asn Arg Val Glu Val Asn Ser Asn Asp
100 105 110
Ile Phe Glu Val Leu Lys Arg Ala Phe Gly Val Leu Lys Met Tyr Arg
115 120 125
Asp Leu Thr Asn His Tyr Lys Thr Tyr Glu Glu Lys Leu Ile Asp Gly
130 135 140
Cys Glu Phe Leu Thr Ser Thr Glu Gln Pro Phe Ser Gly Met Ile Ser
145 150 155 160
Lys Tyr Tyr Thr Val Ala Leu Arg Asn Thr Lys Glu Arg Tyr Gly Tyr
165 170 175
Lys Ala Glu Asp Leu Ala Phe Ile Gln Asp Asn Arg Tyr Lys Phe Thr
180 185 190
Lys Asp Ala Tyr Gly Lys Arg Lys Ser Gln Val Asn Thr Gly Ser Phe
195 200 205
Leu Ser Leu Gln Asp Tyr Asn Gly Asp Thr Thr Lys Lys Leu His Leu
210 215 220
Ser Gly Val Gly Ile Ala Leu Leu Ile Cys Leu Phe Leu Asp Lys Gln
225 230 235 240
Tyr Ile Asn Leu Phe Leu Ser Arg Leu Pro Ile Phe Ser Ser Tyr Asn
245 250 255
Ala Gln Ser Glu Glu Arg Arg Ile Ile Ile Arg Ser Phe Gly Ile Asn
260 265 270
Ser Ile Lys Gln Pro Lys Asp Arg Ile His Ser Glu Lys Ser Asn Lys
275 280 285
Ser Val Ala Met Asp Met Leu Asn Glu Val Lys Arg Cys Pro Asp Glu
290 295 300
Leu Phe Thr Thr Leu Ser Ala Glu Lys Gln Ser Arg Phe Arg Ile Ile
305 310 315 320
Ser Asp Asp His Asn Glu Val Leu Met Lys Arg Ser Ser Asp Arg Phe
325 330 335
Val Pro Leu Leu Leu Gln Tyr Ile Asp Tyr Gly Lys Leu Phe Asp His
340 345 350
Ile Arg Phe His Val Asn Met Gly Lys Leu Arg Tyr Leu Leu Lys Ala
355 360 365
Asp Lys Thr Cys Ile Asp Gly Gln Thr Arg Val Arg Val Ile Glu Gln
370 375 380
Pro Leu Asn Gly Phe Gly Arg Leu Glu Glu Val Glu Thr Met Arg Lys
385 390 395 400
Gln Glu Asn Gly Thr Phe Gly Asn Ser Gly Ile Arg Ile Arg Asp Phe
405 410 415
Glu Asn Met Lys Arg Asp Asp Ala Asn Pro Ala Asn Tyr Pro Tyr Ile
420 425 430
Val Glu Thr Tyr Thr His Tyr Ile Leu Glu Asn Asn Lys Val Glu Met
435 440 445
Phe Ile Ser Asp Glu Glu Asn Pro Thr Pro Leu Leu Pro Val Ile Glu
450 455 460
Asp Asp Arg Tyr Val Val Lys Thr Ile Pro Ser Cys Arg Met Ser Thr
465 470 475 480
Leu Glu Ile Pro Ala Met Ala Phe His Met Phe Leu Phe Gly Ser Glu
485 490 495
Lys Thr Glu Lys Leu Ile Ile Asp Val His Asp Arg Tyr Lys Arg Leu
500 505 510
Phe Gln Ala Met Gln Lys Glu Glu Val Thr Ala Glu Asn Ile Ala Ser
515 520 525
Phe Gly Ile Ala Glu Ser Asp Leu Pro Gln Lys Ile Met Asp Leu Ile
530 535 540
Ser Gly Asn Ala His Gly Lys Asp Val Asp Ala Phe Ile Arg Leu Thr
545 550 555 560
Val Asp Asp Met Leu Thr Asp Thr Glu Arg Arg Ile Lys Arg Phe Lys
565 570 575
Asp Asp Arg Lys Ser Ile Arg Ser Ala Asp Asn Lys Met Gly Lys Arg
580 585 590
Gly Phe Lys Gln Ile Ser Thr Gly Lys Leu Ala Asp Phe Leu Ala Lys
595 600 605
Asp Ile Val Leu Phe Gln Pro Ser Val Asn Asp Gly Glu Asn Lys Ile
610 615 620
Thr Gly Leu Asn Tyr Arg Ile Met Gln Ser Ala Ile Ala Val Tyr Asp
625 630 635 640
Ser Gly Asp Asp Tyr Glu Ala Lys Gln Gln Phe Lys Leu Met Phe Glu
645 650 655
Lys Ala Arg Leu Ile Gly Lys Gly Thr Thr Glu Pro His Pro Phe Leu
660 665 670
Tyr Lys Val Phe Val Arg Ser Ile Pro Ala Asn Ala Val Asp Phe Tyr
675 680 685
Glu Arg Tyr Leu Ile Glu Arg Lys Phe Tyr Leu Ile Gly Leu Ser Asn
690 695 700
Glu Ile Lys Lys Gly Asn Arg Val Asp Val Pro Phe Ile Arg Arg Asp
705 710 715 720
Gln Asn Lys Trp Lys Thr Pro Ala Met Lys Thr Leu Gly Arg Ile Tyr
725 730 735
Ser Glu Asp Leu Pro Val Glu Leu Pro Arg Gln Met Phe Asp Asn Glu
740 745 750
Ile Lys Ser His Leu Lys Ser Leu Pro Gln Met Glu Gly Ile Asp Phe
755 760 765
Asn Asn Ala Asn Val Thr Tyr Leu Ile Ala Glu Tyr Met Lys Arg Val
770 775 780
Leu Asn Asp Asp Phe Gln Thr Phe Tyr Gln Trp Lys Arg Asn Tyr Arg
785 790 795 800
Tyr Met Asp Met Leu Arg Gly Glu Tyr Asp Arg Lys Gly Ser Leu Gln
805 810 815
His Cys Phe Thr Ser Ile Glu Glu Arg Glu Gly Leu Trp Lys Glu Arg
820 825 830
Ala Ser Arg Thr Glu Arg Tyr Arg Lys Leu Ala Ser Asn Lys Ile Arg
835 840 845
Ser Asn Arg Gln Met Arg Asn Ala Ser Ser Glu Glu Ile Glu Thr Ile
850 855 860
Leu Asp Lys Arg Leu Ser Asn Cys Arg Asn Glu Tyr Gln Lys Ser Glu
865 870 875 880
Lys Ile Ile Arg Arg Tyr Arg Val Gln Asp Ala Leu Leu Phe Leu Leu
885 890 895
Ala Lys Lys Thr Leu Thr Glu Leu Ala Asp Phe Asp Gly Glu Arg Phe
900 905 910
Lys Leu Lys Glu Ile Met Pro Asp Ala Glu Lys Gly Ile Leu Ser Glu
915 920 925
Ile Met Pro Met Ser Phe Thr Phe Glu Lys Gly Gly Lys Ile Tyr Thr
930 935 940
Ile Thr Ser Gly Gly Met Lys Leu Lys Asn Tyr Gly Asp Phe Phe Val
945 950 955 960
Leu Ala Ser Asp Lys Arg Ile Gly Asn Leu Leu Glu Leu Val Gly Ser
965 970 975
Asn Thr Val Ser Lys Glu Asp Ile Met Glu Glu Phe Lys Lys Tyr Asp
980 985 990
Gln Cys Arg Pro Glu Ile Ser Ser Ile Val Phe Asn Leu Glu Lys Trp
995 1000 1005
Ala Phe Asp Thr Tyr Pro Glu Leu Pro Ala Arg Val Asp Arg Lys
1010 1015 1020
Glu Lys Val Asp Phe Trp Ser Ile Leu Asp Val Leu Ser Asn Asn
1025 1030 1035
Lys Asp Ile Asn Asn Glu Gln Ser Tyr Ile Leu Arg Lys Ile Arg
1040 1045 1050
Asn Ala Phe Asp His Asn Asn Tyr Pro Asp Lys Gly Ile Val Glu
1055 1060 1065
Ile Lys Ala Leu Pro Glu Ile Ala Met Ser Ile Lys Lys Ala Phe
1070 1075 1080
Gly Glu Tyr Ala Ile Met Lys
1085 1090
<210> 165
<211> 1131
<212> PRT
<213> Phaeodactylibacter xiamenensis
<400> 165
Met Thr Asn Thr Pro Lys Arg Arg Thr Leu His Arg His Pro Ser Tyr
1 5 10 15
Phe Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Met Ile Met
20 25 30
Glu His Leu Ser Thr Lys Tyr Asp Met Glu Asp Lys Asn Thr Leu Asp
35 40 45
Glu Ala Gln Leu Pro Asn Ala Lys Leu Phe Gly Cys Leu Lys Lys Arg
50 55 60
Tyr Gly Lys Pro Asp Val Thr Glu Gly Val Ser Arg Asp Leu Arg Arg
65 70 75 80
Tyr Phe Pro Phe Leu Asn Tyr Pro Leu Phe Leu His Leu Glu Lys Gln
85 90 95
Gln Asn Ala Glu Gln Ala Ala Thr Tyr Asp Ile Asn Pro Glu Asp Ile
100 105 110
Glu Phe Thr Leu Lys Gly Phe Phe Arg Leu Leu Asn Gln Met Arg Asn
115 120 125
Asn Tyr Ser His Tyr Ile Ser Asn Thr Asp Tyr Gly Lys Phe Asp Lys
130 135 140
Leu Pro Val Gln Asp Ile Tyr Glu Ala Ala Ile Phe Arg Leu Leu Asp
145 150 155 160
Arg Gly Lys His Thr Lys Arg Phe Asp Val Phe Glu Ser Lys His Thr
165 170 175
Arg His Leu Glu Ser Asn Asn Ser Glu Tyr Arg Pro Arg Ser Leu Ala
180 185 190
Asn Ser Pro Asp His Glu Asn Thr Val Ala Phe Val Thr Cys Leu Phe
195 200 205
Leu Glu Arg Lys Tyr Ala Phe Pro Phe Leu Ser Arg Leu Asp Cys Phe
210 215 220
Arg Ser Thr Asn Asp Ala Ala Glu Gly Asp Pro Leu Ile Arg Lys Ala
225 230 235 240
Ser His Glu Cys Tyr Thr Met Phe Cys Cys Arg Leu Pro Gln Pro Lys
245 250 255
Leu Glu Ser Ser Asp Ile Leu Leu Asp Met Val Asn Glu Leu Gly Arg
260 265 270
Cys Pro Ser Ala Leu Tyr Asn Leu Leu Ser Glu Glu Asp Gln Ala Arg
275 280 285
Phe His Ile Lys Arg Glu Glu Ile Thr Gly Phe Glu Glu Asp Pro Asp
290 295 300
Glu Glu Leu Glu Gln Glu Ile Val Leu Lys Arg His Ser Asp Arg Phe
305 310 315 320
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Asp Thr Glu Ala Phe Gln Thr
325 330 335
Leu Arg Phe Asp Val Tyr Leu Gly Arg Trp Arg Thr Lys Pro Val Tyr
340 345 350
Lys Lys Arg Ile Tyr Gly Gln Glu Arg Asp Arg Val Leu Thr Gln Ser
355 360 365
Ile Arg Thr Phe Thr Arg Leu Ser Arg Leu Leu Pro Ile Tyr Glu Asn
370 375 380
Val Lys His Asp Ala Val Arg Gln Asn Glu Glu Asp Gly Lys Leu Val
385 390 395 400
Asn Pro Asp Val Thr Ser Gln Phe His Lys Ser Trp Ile Gln Ile Glu
405 410 415
Ser Asp Asp Arg Ala Phe Leu Ser Asp Arg Ile Glu His Phe Ser Pro
420 425 430
His Tyr Asn Phe Gly Asp Gln Val Ile Gly Leu Lys Phe Ile Asn Pro
435 440 445
Asp Arg Tyr Ala Ala Ile Gln Asn Val Phe Pro Lys Leu Pro Gly Glu
450 455 460
Glu Lys Lys Asp Lys Asp Ala Lys Leu Val Asn Glu Thr Ala Asp Ala
465 470 475 480
Ile Ile Ser Thr His Glu Ile Arg Ser Leu Phe Leu Tyr His Tyr Leu
485 490 495
Ser Lys Lys Pro Ile Ser Ala Gly Asp Glu Arg Arg Phe Ile Gln Val
500 505 510
Asp Thr Glu Thr Phe Ile Lys Gln Tyr Ile Asp Thr Ile Lys Leu Phe
515 520 525
Phe Glu Asp Ile Lys Ser Gly Glu Leu Gln Pro Ile Ala Asp Pro Pro
530 535 540
Asn Tyr Gln Lys Asn Glu Pro Leu Pro Tyr Val Arg Gly Asp Lys Glu
545 550 555 560
Lys Thr Gln Glu Glu Arg Ala Gln Tyr Arg Glu Arg Gln Lys Glu Ile
565 570 575
Lys Glu Arg Arg Lys Glu Leu Asn Thr Leu Leu Gln Asn Arg Tyr Gly
580 585 590
Leu Ser Ile Gln Tyr Ile Pro Ser Arg Leu Arg Glu Tyr Leu Leu Gly
595 600 605
Tyr Lys Lys Val Pro Tyr Glu Lys Leu Ala Leu Gln Lys Leu Arg Ala
610 615 620
Gln Arg Lys Glu Val Lys Lys Arg Ile Lys Asp Ile Glu Lys Met Arg
625 630 635 640
Thr Pro Arg Val Gly Glu Gln Ala Thr Trp Leu Ala Glu Asp Ile Val
645 650 655
Phe Leu Thr Pro Pro Lys Met His Thr Pro Glu Arg Lys Thr Thr Lys
660 665 670
His Pro Gln Lys Leu Asn Asn Asp Gln Phe Arg Ile Met Gln Ser Ser
675 680 685
Leu Ala Tyr Phe Ser Val Asn Lys Lys Ala Ile Lys Lys Phe Phe Gln
690 695 700
Lys Glu Thr Gly Ile Gly Leu Ser Asn Arg Glu Thr Ser His Pro Phe
705 710 715 720
Leu Tyr Arg Ile Asp Val Gly Arg Cys Arg Gly Ile Leu Asp Phe Tyr
725 730 735
Thr Gly Tyr Leu Lys Tyr Lys Met Asp Trp Leu Asp Asp Ala Ile Lys
740 745 750
Lys Val Asp Asn Arg Lys His Gly Lys Lys Glu Ala Lys Lys Tyr Glu
755 760 765
Lys Tyr Leu Pro Ser Ser Ile Gln His Lys Thr Pro Leu Glu Leu Asp
770 775 780
Tyr Thr Arg Leu Pro Val Tyr Leu Pro Arg Gly Leu Phe Lys Lys Ala
785 790 795 800
Ile Val Lys Ala Leu Ala Ala His Ala Asp Phe Gln Val Glu Pro Glu
805 810 815
Glu Asp Asn Val Ile Phe Cys Leu Asp Gln Leu Leu Asp Gly Asp Thr
820 825 830
Gln Asp Phe Tyr Asn Trp Gln Arg Tyr Tyr Arg Ser Ala Leu Thr Glu
835 840 845
Lys Glu Thr Asp Asn Gln Leu Val Leu Ala His Pro Tyr Ala Glu Gln
850 855 860
Ile Leu Gly Thr Ile Lys Thr Leu Glu Gly Lys Gln Lys Asn Asn Lys
865 870 875 880
Leu Gly Asn Lys Ala Lys Gln Lys Ile Lys Asp Glu Leu Ile Asp Leu
885 890 895
Lys Arg Ala Lys Arg Arg Leu Leu Asp Arg Glu Gln Tyr Leu Arg Ala
900 905 910
Val Gln Ala Glu Asp Arg Ala Leu Trp Leu Met Ile Gln Glu Arg Gln
915 920 925
Lys Gln Lys Ala Glu His Glu Glu Ile Ala Phe Asp Gln Leu Asp Leu
930 935 940
Lys Asn Ile Thr Lys Ile Leu Thr Glu Ser Ile Asp Ala Arg Leu Arg
945 950 955 960
Ile Pro Asp Thr Lys Val Asp Ile Thr Asp Lys Leu Pro Leu Arg Arg
965 970 975
Tyr Gly Asp Leu Arg Arg Val Ala Lys Asp Arg Arg Leu Val Asn Leu
980 985 990
Ala Ser Tyr Tyr His Val Ala Gly Leu Ser Glu Ile Pro Tyr Asp Leu
995 1000 1005
Val Lys Lys Glu Leu Glu Glu Tyr Asp Arg Arg Arg Val Ala Phe
1010 1015 1020
Phe Glu His Val Tyr Gln Phe Glu Lys Glu Val Tyr Asp Arg Tyr
1025 1030 1035
Ala Ala Glu Leu Arg Asn Glu Asn Pro Lys Gly Glu Ser Thr Tyr
1040 1045 1050
Phe Ser His Trp Glu Tyr Val Ala Val Ala Val Lys His Ser Ala
1055 1060 1065
Asp Thr His Phe Asn Glu Leu Phe Lys Glu Lys Val Met Gln Leu
1070 1075 1080
Arg Asn Lys Phe His His Asn Glu Phe Pro Tyr Phe Asp Trp Leu
1085 1090 1095
Leu Pro Glu Val Glu Lys Ala Ser Ala Ala Leu Tyr Ala Asp Arg
1100 1105 1110
Val Phe Asp Val Ala Glu Gly Tyr Tyr Gln Lys Met Arg Lys Leu
1115 1120 1125
Met Arg Gln
1130
<210> 166
<211> 1155
<212> PRT
<213> Flavobacterium sp.
<400> 166
Met Asp Asn Asn Ile Thr Val Glu Lys Thr Glu Leu Gly Leu Gly Ile
1 5 10 15
Thr Tyr Asn His Asp Lys Val Glu Asp Lys His Tyr Phe Gly Gly Phe
20 25 30
Phe Asn Leu Ala Gln Asn Asn Ile Asp Leu Val Ala Gln Glu Phe Lys
35 40 45
Lys Arg Leu Leu Ile Gln Gly Lys Asp Ser Ile Asn Ile Phe Ala Asn
50 55 60
Tyr Phe Ser Asp Gln Cys Ser Ile Thr Asn Leu Glu Arg Gly Ile Lys
65 70 75 80
Ile Leu Ala Glu Tyr Phe Pro Val Val Ser Tyr Ile Asp Leu Asp Glu
85 90 95
Lys Asn Lys Ser Lys Ser Ile Arg Glu His Leu Ile Leu Leu Leu Glu
100 105 110
Thr Ile Asn Asn Leu Arg Asn Tyr Tyr Thr His Tyr Tyr His Lys Lys
115 120 125
Ile Ile Ile Asp Gly Ser Leu Phe Pro Leu Leu Asp Thr Ile Leu Leu
130 135 140
Lys Val Val Leu Glu Ile Lys Lys Lys Lys Leu Lys Glu Asp Lys Thr
145 150 155 160
Lys Gln Leu Leu Lys Lys Gly Leu Glu Lys Glu Met Thr Ile Leu Phe
165 170 175
Asn Leu Met Lys Ala Glu Gln Lys Glu Lys Lys Ile Lys Gly Trp Asn
180 185 190
Ile Asp Glu Asn Ile Lys Gly Ala Val Leu Asn Arg Ala Phe Ser His
195 200 205
Leu Leu Tyr Asn Asp Glu Leu Ser Asp Tyr Arg Lys Ser Lys Tyr Asn
210 215 220
Thr Glu Asp Glu Thr Leu Lys Asp Thr Leu Thr Glu Ser Gly Ile Leu
225 230 235 240
Phe Leu Leu Ser Phe Phe Leu Asn Lys Lys Glu Gln Glu Gln Leu Lys
245 250 255
Ala Asn Ile Lys Gly Tyr Lys Gly Lys Ile Ala Ser Ile Pro Asp Glu
260 265 270
Glu Ile Thr Leu Lys Asn Asn Ser Leu Arg Asn Met Ala Thr His Trp
275 280 285
Thr Tyr Ser His Leu Thr Tyr Lys Gly Leu Lys His Arg Ile Lys Thr
290 295 300
Asp His Glu Lys Glu Thr Leu Leu Val Asn Met Val Asp Tyr Leu Ser
305 310 315 320
Lys Val Pro His Glu Ile Tyr Gln Asn Leu Ser Glu Gln Asn Lys Ser
325 330 335
Leu Phe Leu Glu Asp Ile Asn Glu Tyr Met Arg Asp Asn Glu Glu Asn
340 345 350
His Asp Ser Ser Glu Ala Ser Arg Val Ile His Pro Val Ile Arg Lys
355 360 365
Arg Tyr Glu Asn Lys Phe Ala Tyr Phe Ala Ile Arg Phe Leu Asp Glu
370 375 380
Phe Ala Glu Phe Pro Thr Leu Arg Phe Met Val Asn Val Gly Asn Tyr
385 390 395 400
Ile His Asp Asn Arg Lys Lys Asp Ile Gly Gly Thr Ser Leu Ile Thr
405 410 415
Asn Arg Thr Ile Lys Gln Gln Ile Asn Val Phe Gly Asn Leu Thr Glu
420 425 430
Ile His Lys Lys Lys Asn Asp Tyr Phe Glu Lys Glu Glu Asn Lys Glu
435 440 445
Lys Thr Leu Glu Trp Glu Leu Phe Pro Asn Pro Ser Tyr His Phe Gln
450 455 460
Lys Glu Asn Ile Pro Ile Phe Ile Asp Leu Glu Lys Ser Lys Glu Thr
465 470 475 480
Asn Asp Leu Ala Lys Glu Tyr Ala Lys Glu Lys Lys Lys Ile Phe Gly
485 490 495
Ser Ser Arg Lys Lys Gln Gln Asn Thr Ala Lys Lys Asn Arg Glu Thr
500 505 510
Ile Ile Asn Leu Val Phe Asp Lys Tyr Lys Thr Ser Asp Arg Lys Thr
515 520 525
Val Thr Phe Glu Gln Pro Thr Ala Leu Leu Ser Phe Asn Glu Leu Asn
530 535 540
Ser Phe Leu Tyr Ala Phe Leu Val Glu Asn Lys Thr Gly Lys Glu Leu
545 550 555 560
Glu Lys Ile Ile Ile Glu Lys Ile Ala Asn Gln Tyr Gln Ile Leu Lys
565 570 575
Asn Cys Ser Ser Thr Val Asp Lys Thr Asn Asp Asn Ile Pro Lys Ser
580 585 590
Ile Lys Lys Ile Val Asn Thr Thr Thr Asp Ser Phe Tyr Phe Glu Gly
595 600 605
Lys Lys Ile Asp Ile Glu Lys Leu Glu Lys Asp Ile Thr Ile Glu Ile
610 615 620
Glu Lys Thr Asn Glu Lys Leu Glu Thr Ile Lys Glu Asn Glu Glu Ser
625 630 635 640
Ala Gln Asn Tyr Lys Arg Asn Glu Arg Asn Thr Gln Lys Arg Lys Leu
645 650 655
Tyr Arg Lys Tyr Val Phe Phe Thr Asn Glu Ile Gly Ile Glu Ala Thr
660 665 670
Trp Ile Thr Asn Asp Ile Leu Arg Phe Leu Asp Asn Lys Glu Asn Trp
675 680 685
Lys Gly Tyr Gln His Ser Glu Leu Gln Lys Phe Ile Ser Gln Tyr Asp
690 695 700
Asn Tyr Lys Lys Glu Ala Leu Gly Leu Leu Glu Ser Glu Trp Asn Leu
705 710 715 720
Glu Ser Asp Ala Phe Phe Gly Gln Asn Leu Lys Arg Met Phe Gln Ser
725 730 735
Asn Ser Thr Phe Glu Thr Phe Tyr Lys Lys Tyr Leu Asp Asn Arg Lys
740 745 750
Asn Thr Leu Glu Thr Tyr Leu Ser Ala Ile Glu Asn Leu Lys Thr Met
755 760 765
Thr Asp Val Arg Pro Lys Val Leu Lys Lys Lys Trp Thr Glu Leu Phe
770 775 780
Arg Phe Phe Asp Lys Lys Ile Tyr Leu Leu Ser Thr Ile Glu Thr Lys
785 790 795 800
Ile Asn Glu Leu Ile Thr Lys Pro Ile Asn Leu Ser Arg Gly Ile Phe
805 810 815
Glu Glu Lys Pro Thr Phe Ile Asn Gly Lys Asn Pro Asn Lys Glu Asn
820 825 830
Asn Gln His Leu Phe Ala Asn Trp Phe Ile Tyr Ala Lys Lys Gln Thr
835 840 845
Ile Leu Gln Asp Phe Tyr Asn Leu Pro Leu Glu Gln Pro Lys Ala Ile
850 855 860
Thr Asn Leu Lys Lys His Lys Tyr Lys Leu Glu Arg Ser Ile Asn Asn
865 870 875 880
Leu Lys Ile Glu Asp Ile Tyr Ile Lys Gln Met Val Asp Phe Leu Tyr
885 890 895
Gln Lys Leu Phe Glu Gln Ser Phe Ile Gly Ser Leu Gln Asp Leu Tyr
900 905 910
Thr Ser Lys Glu Lys Arg Glu Ile Glu Lys Gly Lys Ala Lys Asn Glu
915 920 925
Gln Thr Pro Asp Glu Ser Phe Ile Trp Lys Lys Gln Val Glu Ile Asn
930 935 940
Thr His Asn Gly Arg Ile Ile Ala Lys Thr Lys Ile Lys Asp Ile Gly
945 950 955 960
Lys Phe Lys Asn Leu Leu Thr Asp Asn Lys Ile Ala His Leu Ile Ser
965 970 975
Tyr Asp Asp Arg Ile Trp Asp Phe Ser Leu Asn Asn Asp Gly Asp Ile
980 985 990
Thr Lys Lys Leu Tyr Ser Ile Asn Thr Glu Leu Glu Ser Tyr Glu Thr
995 1000 1005
Ile Arg Arg Glu Lys Leu Leu Lys Gln Ile Gln Gln Phe Glu Gln
1010 1015 1020
Phe Leu Leu Glu Gln Glu Thr Glu Tyr Ser Ala Glu Arg Lys His
1025 1030 1035
Pro Glu Lys Phe Glu Lys Asp Cys Asn Pro Asn Phe Lys Lys Tyr
1040 1045 1050
Ile Ile Glu Gly Val Leu Asn Lys Ile Ile Pro Asn His Glu Ile
1055 1060 1065
Glu Glu Ile Glu Ile Leu Lys Ser Lys Glu Asp Val Phe Lys Ile
1070 1075 1080
Asn Phe Ser Asp Ile Leu Ile Leu Asn Asn Asp Asn Ile Lys Lys
1085 1090 1095
Gly Tyr Leu Leu Ile Met Ile Arg Asn Lys Phe Ala His Asn Gln
1100 1105 1110
Leu Ile Asp Lys Asn Leu Phe Asn Phe Ser Leu Gln Leu Tyr Ser
1115 1120 1125
Lys Asn Glu Asn Glu Asn Phe Ser Glu Tyr Leu Asn Lys Val Cys
1130 1135 1140
Gln Asn Ile Ile Gln Glu Phe Lys Glu Lys Leu Lys
1145 1150 1155
<210> 167
<211> 1175
<212> PRT
<213> Porphyromonas gulae
<400> 167
Met Thr Glu Gln Ser Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Leu Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Gln Asp Val Leu Ser Phe Lys Ala Leu Trp
50 55 60
Lys Asn Phe Asp Asn Asp Leu Glu Arg Lys Ser Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Lys Ser Ser Gly Asn Lys Ser Ser Lys Asn Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Ser Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Tyr Gly His Asn Asp Asn Pro Ser Phe Lys His His Phe Val Asp
210 215 220
Ser Glu Gly Met Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Pro Leu Tyr Asp Arg Leu Arg Glu Lys Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Pro Asp Glu Asp Asp Thr Asp Gly Gly
325 330 335
Gly Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Met Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Ser Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Met Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Thr Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Ile Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Leu Lys
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Lys Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Ile Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Lys Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Arg Ala Arg Lys Ala Phe Leu Glu Arg Ile Gly Arg
705 710 715 720
Ser Asp Arg Met Glu Asn Arg Pro Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Arg Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Glu Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Ser Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Glu Arg Ala Glu Glu Trp Glu Arg Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Tyr Ala Ser Pro Gly Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Arg Asp Leu Ser Leu Trp Glu Ala
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Arg Ala Asp Lys Ile Asn Leu Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Gln Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Pro
945 950 955 960
Asn Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn Arg Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Gly Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Val Phe Glu Leu Thr
1055 1060 1065
Leu Arg Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Ala Lys Trp Pro Glu Leu His Gly Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Thr Val Glu Arg Ile Ile
1160 1165 1170
Gln Val
1175
<210> 168
<211> 1145
<212> PRT
<213> Chryseobacterium sp.
<400> 168
Met Glu Thr Gln Thr Ile Gly His Gly Ile Ala Tyr Asp His Ser Lys
1 5 10 15
Ile Gln Asp Lys His Phe Phe Gly Gly Phe Leu Asn Leu Ala Glu Asn
20 25 30
Asn Ile Lys Ala Val Leu Lys Ala Phe Ser Glu Lys Phe Asn Val Gly
35 40 45
Asn Val Asp Val Lys Gln Phe Ala Asp Val Ser Leu Lys Asp Asn Leu
50 55 60
Pro Asp Asn Asp Phe Gln Lys Arg Val Ser Phe Leu Lys Met Tyr Phe
65 70 75 80
Pro Val Val Asp Phe Ile Asn Ile Pro Asn Asn Arg Ala Lys Phe Arg
85 90 95
Ser Asp Leu Thr Thr Leu Phe Lys Ser Val Asp Gln Leu Arg Asn Phe
100 105 110
Tyr Thr His Tyr Tyr His Lys Pro Leu Asp Phe Asp Ala Ser Leu Phe
115 120 125
Ile Leu Leu Asp Asp Ile Phe Ala Arg Thr Ala Lys Glu Val Arg Asp
130 135 140
Gln Lys Met Lys Asp Asp Lys Thr Arg Gln Leu Leu Ser Lys Ser Leu
145 150 155 160
Ser Glu Glu Leu Gln Lys Gly Tyr Glu Leu Gln Leu Glu Arg Leu Lys
165 170 175
Glu Leu Asn Arg Leu Gly Lys Lys Val Asn Ile His Asp Gln Leu Gly
180 185 190
Ile Lys Asn Gly Val Leu Asn Asn Ala Phe Asn His Leu Ile Tyr Lys
195 200 205
Asp Gly Glu Ser Phe Lys Thr Lys Leu Thr Tyr Ser Ser Ala Leu Thr
210 215 220
Ser Phe Glu Ser Ala Glu Asn Gly Ile Glu Ile Ser Gln Ser Gly Leu
225 230 235 240
Leu Phe Leu Leu Ser Met Phe Leu Lys Arg Lys Glu Ile Glu Asp Leu
245 250 255
Lys Asn Arg Asn Lys Gly Phe Lys Ala Lys Val Val Ile Asp Glu Asp
260 265 270
Gly Lys Val Asn Gly Leu Lys Phe Met Ala Thr His Trp Val Phe Ser
275 280 285
Tyr Leu Cys Phe Lys Gly Leu Lys Ser Lys Leu Ser Thr Glu Phe His
290 295 300
Glu Glu Thr Leu Leu Ile Gln Ile Ile Asp Glu Leu Ser Lys Val Pro
305 310 315 320
Asp Glu Leu Tyr Cys Ala Phe Asp Lys Glu Thr Arg Asp Lys Phe Ile
325 330 335
Glu Asp Ile Asn Glu Tyr Val Lys Glu Gly His Gln Asp Phe Ser Leu
340 345 350
Glu Asp Ala Lys Val Ile His Pro Val Ile Arg Lys Arg Tyr Glu Asn
355 360 365
Lys Phe Asn Tyr Phe Ala Ile Arg Phe Leu Asp Glu Phe Val Lys Phe
370 375 380
Pro Ser Leu Arg Phe Gln Val His Val Gly Asn Tyr Val His Asp Arg
385 390 395 400
Arg Ile Lys Asn Ile Asp Gly Thr Thr Phe Glu Thr Glu Arg Val Val
405 410 415
Lys Asp Arg Ile Lys Val Phe Gly Arg Leu Ser Glu Ile Ser Ser Tyr
420 425 430
Lys Ala Gln Tyr Leu Ser Ser Val Ser Asp Lys His Asp Glu Thr Gly
435 440 445
Trp Glu Ile Phe Pro Asn Pro Ser Tyr Val Phe Ile Asn Asn Asn Ile
450 455 460
Pro Ile His Ile Ser Val Asp Thr Ser Phe Lys Lys Glu Ile Ala Asp
465 470 475 480
Phe Lys Lys Leu Arg Arg Ala Gln Val Pro Asp Glu Leu Lys Ile Arg
485 490 495
Gly Ala Glu Lys Lys Arg Lys Phe Glu Ile Thr Gln Met Ile Gly Ser
500 505 510
Lys Ser Val Leu Asn Gln Glu Glu Pro Ile Ala Leu Leu Ser Leu Asn
515 520 525
Glu Ile Pro Ala Leu Leu Tyr Glu Ile Leu Ile Asn Gly Lys Glu Pro
530 535 540
Ala Glu Ile Glu Arg Ile Ile Lys Asp Lys Leu Asn Glu Arg Gln Asp
545 550 555 560
Val Ile Lys Asn Tyr Asn Pro Glu Asn Trp Leu Pro Ala Ser Gln Ile
565 570 575
Ser Arg Arg Leu Arg Ser Asn Lys Gly Glu Arg Ile Ile Asn Thr Asp
580 585 590
Lys Leu Leu Gln Leu Val Thr Lys Glu Leu Leu Val Thr Glu Gln Lys
595 600 605
Leu Lys Ile Ile Ser Asp Asn Arg Glu Ala Leu Lys Gln Lys Lys Glu
610 615 620
Gly Lys Tyr Ile Arg Lys Phe Ile Phe Thr Asn Ser Glu Leu Gly Arg
625 630 635 640
Glu Ala Ile Trp Leu Ala Asp Asp Ile Lys Arg Phe Met Pro Ala Asp
645 650 655
Val Arg Lys Glu Trp Lys Gly Tyr Gln His Ser Gln Leu Gln Gln Ser
660 665 670
Leu Ala Phe Tyr Asn Ser Arg Pro Lys Glu Ala Leu Ala Ile Leu Glu
675 680 685
Ser Ser Trp Asn Leu Lys Asp Glu Lys Ile Ile Trp Asn Glu Trp Ile
690 695 700
Leu Lys Ser Phe Thr Gln Asn Lys Phe Phe Asp Ala Phe Tyr Asn Glu
705 710 715 720
Tyr Leu Lys Gly Arg Lys Lys Tyr Phe Ala Phe Leu Ser Glu His Ile
725 730 735
Val Gln Tyr Thr Ser Asn Ala Lys Asn Leu Gln Lys Phe Ile Lys Gln
740 745 750
Gln Met Pro Lys Asp Leu Phe Glu Lys Arg His Tyr Ile Ile Glu Asp
755 760 765
Leu Gln Thr Glu Lys Asn Lys Ile Leu Ser Lys Pro Phe Ile Phe Pro
770 775 780
Arg Gly Ile Phe Asp Lys Lys Pro Thr Phe Ile Lys Gly Val Lys Val
785 790 795 800
Glu Asp Ser Pro Glu Ser Phe Ala Asn Trp Tyr Gln Tyr Gly Tyr Gln
805 810 815
Lys Asp His Gln Phe Gln Lys Phe Tyr Asp Trp Lys Arg Asp Tyr Ser
820 825 830
Asp Val Phe Leu Glu His Leu Gly Lys Pro Phe Ile Asn Asn Gly Asp
835 840 845
Arg Arg Thr Leu Gly Met Glu Glu Leu Lys Glu Arg Ile Ile Ile Lys
850 855 860
Gln Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Leu Phe Leu Arg
865 870 875 880
Leu Ile Ala Glu Asn Leu Phe Gln Lys Val Phe Lys Tyr Ser Ala Lys
885 890 895
Leu Pro Leu Ser Asp Phe Tyr Leu Thr Gln Glu Glu Arg Met Glu Lys
900 905 910
Glu Asn Met Ala Ala Leu Gln Asn Val Arg Glu Glu Gly Asp Lys Ser
915 920 925
Pro Asn Ile Ile Lys Asp Asn Phe Ile Trp Ser Lys Met Ile Pro Tyr
930 935 940
Lys Lys Gly Gln Ile Ile Glu Asn Ala Val Lys Leu Lys Asp Ile Gly
945 950 955 960
Lys Leu Asn Val Leu Ser Leu Asp Asp Lys Val Gln Thr Leu Leu Ser
965 970 975
Tyr Asp Asp Ala Lys Pro Trp Ser Lys Ile Ala Leu Glu Asn Glu Phe
980 985 990
Ser Ile Gly Glu Asn Ser Tyr Glu Val Ile Arg Arg Glu Lys Leu Phe
995 1000 1005
Lys Glu Ile Gln Gln Phe Glu Ser Glu Ile Leu Phe Arg Ser Gly
1010 1015 1020
Trp Asp Gly Ile Asn His Pro Ala Gln Leu Glu Asp Asn Arg Asn
1025 1030 1035
Pro Lys Phe Lys Met Tyr Ile Val Asn Gly Ile Leu Arg Lys Ser
1040 1045 1050
Ala Gly Leu Tyr Ser Gln Gly Glu Asp Ile Trp Phe Glu Tyr Asn
1055 1060 1065
Ala Asp Phe Asn Asn Leu Asp Ala Asp Val Leu Glu Thr Lys Ser
1070 1075 1080
Glu Leu Val Gln Leu Ala Phe Leu Val Thr Ala Ile Arg Asn Lys
1085 1090 1095
Phe Ala His Asn Gln Leu Pro Ala Lys Glu Phe Tyr Phe Tyr Ile
1100 1105 1110
Arg Ala Lys Tyr Gly Phe Ala Asp Glu Pro Ser Val Ala Leu Val
1115 1120 1125
Tyr Leu Asn Phe Thr Lys Tyr Ala Ile Asn Glu Phe Lys Lys Val
1130 1135 1140
Met Ile
1145
<210> 169
<211> 948
<212> PRT
<213> Riemerella anatipestifer
<400> 169
Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu
1 5 10 15
Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys
20 25 30
Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg
35 40 45
Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe
50 55 60
Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn
65 70 75 80
Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser
85 90 95
Gly Phe Lys Ala Ser His Lys Gln Arg Glu Lys Met Thr Thr Glu Val
100 105 110
Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg
115 120 125
Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg
130 135 140
Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asn Lys Lys His
145 150 155 160
Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln
165 170 175
Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr
180 185 190
Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg
195 200 205
Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys
210 215 220
Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Ser
225 230 235 240
Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp
245 250 255
Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser Asn Gln Pro
260 265 270
Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile
275 280 285
Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Ile
290 295 300
Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Gly Phe
305 310 315 320
Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro Leu Met Phe
325 330 335
Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu Thr Val
340 345 350
Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg Ile Asn
355 360 365
Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro Leu Gly
370 375 380
Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln Pro Asp
385 390 395 400
Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala Glu Thr
405 410 415
Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser Pro Lys
420 425 430
Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu Ala Asp
435 440 445
Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala Tyr Asp Ala
450 455 460
Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu Phe Trp
465 470 475 480
Phe Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn Arg Leu
485 490 495
Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn Pro His
500 505 510
Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu Val Asp
515 520 525
Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu Ala Ile
530 535 540
Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu Lys Ile
545 550 555 560
Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln Gly Gly
565 570 575
Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu Thr Leu
580 585 590
Ser Glu Asp Leu Met Leu Ser Lys Pro Ile Arg Lys Glu Ile Lys Lys
595 600 605
His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr Phe Lys
610 615 620
Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser Tyr Lys
625 630 635 640
Leu Glu Ala Lys Ala Pro Leu Leu Lys Arg Glu Glu His Tyr Glu Tyr
645 650 655
Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg Leu Glu
660 665 670
Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys Arg Trp
675 680 685
Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp Val Met
690 695 700
Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys Glu Leu
705 710 715 720
Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val Asn Val
725 730 735
Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu Pro Met
740 745 750
Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly Glu Val Gln
755 760 765
Tyr His Lys Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu His Thr
770 775 780
Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp Arg Arg
785 790 795 800
Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr Gln Lys
805 810 815
His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile Tyr Gln
820 825 830
Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu Glu Lys
835 840 845
Leu Leu Asn Lys His Thr Ser Leu Ser Ser Leu Glu Asn Glu Phe Arg
850 855 860
Ala Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala Ser Ser Met Val
865 870 875 880
Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala Phe Cys
885 890 895
His Asn Gln Tyr Pro Phe Tyr Lys Glu Ala Leu His Ala Pro Ile Pro
900 905 910
Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly Leu Gly
915 920 925
Ile Ala Glu Ala Leu Leu Lys Val Leu Arg Glu Tyr Cys Glu Ile Val
930 935 940
Lys Ser Gln Ile
945
<210> 170
<211> 1175
<212> PRT
<213> Porphyromonas gingivalis
<400> 170
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Ala His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Lys Tyr Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Glu Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Leu Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln Leu Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Ala
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Val Gly Ile Glu Tyr Ala Ser Trp Glu Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr His Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr
945 950 955 960
Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Glu Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr
1055 1060 1065
Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Ser Phe Arg Glu Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Thr Ile Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Leu
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Leu Ala Lys Glu Met Val Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 171
<211> 1175
<212> PRT
<213> Porphyromonas gingivalis
<400> 171
Met Thr Glu Gln Asn Glu Lys Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Lys Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Ser Gln Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Met Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Gly Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Thr Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Cys Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Ala
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Cys Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Phe Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Arg Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Asp Glu Ile Asn Thr Arg Asp
530 535 540
Glu Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Lys His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Val Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Gly Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Leu Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Asp Leu Glu Ala Trp Ser His Ser Ala Ala Arg
835 840 845
Arg Ile Glu Asp Ala Phe Ala Gly Ile Glu Asn Ala Ser Arg Glu Asn
850 855 860
Lys Lys Lys Ile Glu Gln Leu Leu Gln Asp Leu Ser Leu Trp Glu Thr
865 870 875 880
Phe Glu Ser Lys Leu Lys Val Lys Ala Asp Lys Ile Asn Ile Ala Lys
885 890 895
Leu Lys Lys Glu Ile Leu Glu Ala Lys Glu His Pro Tyr Leu Asp Phe
900 905 910
Lys Ser Trp Gln Lys Phe Glu Arg Glu Leu Arg Leu Val Lys Asn Gln
915 920 925
Asp Ile Ile Thr Trp Met Met Cys Arg Asp Leu Met Glu Glu Asn Lys
930 935 940
Val Glu Gly Leu Asp Thr Gly Thr Leu Tyr Leu Lys Asp Ile Arg Thr
945 950 955 960
Asp Val Gln Glu Gln Gly Ser Leu Asn Val Leu Asn His Val Lys Pro
965 970 975
Met Arg Leu Pro Val Val Val Tyr Arg Ala Asp Ser Arg Gly His Val
980 985 990
His Lys Glu Gln Ala Pro Leu Ala Thr Val Tyr Ile Glu Glu Arg Asp
995 1000 1005
Thr Lys Leu Leu Lys Gln Gly Asn Phe Lys Ser Phe Val Lys Asp
1010 1015 1020
Arg Arg Leu Asn Gly Leu Phe Ser Phe Val Asp Thr Gly Ala Leu
1025 1030 1035
Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu Arg Val Glu Tyr Glu
1040 1045 1050
Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala Phe Glu Gln Thr
1055 1060 1065
Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Tyr Pro His Leu Pro
1070 1075 1080
Asp Glu Asn Phe Arg Lys Met Leu Glu Ser Trp Ser Asp Pro Leu
1085 1090 1095
Leu Asp Lys Trp Pro Asp Leu His Arg Lys Val Arg Leu Leu Ile
1100 1105 1110
Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr Pro Met Tyr Asp
1115 1120 1125
Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp Pro Ser Ser Pro
1130 1135 1140
Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile Ala His Arg Leu
1145 1150 1155
Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala Glu Arg Ile Ile
1160 1165 1170
Gln Ala
1175
<210> 172
<211> 1213
<212> PRT
<213> Flavobacterium columnare
<400> 172
Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His
1 5 10 15
Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala
20 25 30
Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn
35 40 45
Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe
50 55 60
Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu
65 70 75 80
Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His
85 90 95
Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile
100 105 110
Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr
115 120 125
Ile Asn Pro Lys Val Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val
130 135 140
Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu
145 150 155 160
Leu Leu Lys Glu Lys Phe Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln
165 170 175
Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn
180 185 190
Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu
195 200 205
Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr
210 215 220
Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser
225 230 235 240
Gly Leu Val Phe Leu Ile Ser Phe Phe Leu His Arg Lys Glu Phe Gln
245 250 255
Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile
260 265 270
Lys Glu Glu Glu Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile
275 280 285
Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg
290 295 300
Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr
305 310 315 320
His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile
325 330 335
Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser
340 345 350
Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg
355 360 365
Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His
370 375 380
Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met
385 390 395 400
Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val
405 410 415
Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser
420 425 430
Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe
435 440 445
Glu Lys Leu Gly Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys
450 455 460
Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Ser Pro
465 470 475 480
Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg
485 490 495
Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser
500 505 510
Gln Asn Arg Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln
515 520 525
Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys
530 535 540
Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu
545 550 555 560
Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu
565 570 575
Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile
580 585 590
Arg Asp Phe Thr Leu Asp Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr
595 600 605
Leu Thr Lys Thr Ile Ser Thr Asp Thr Ser Val Thr Phe Glu Asn Gln
610 615 620
Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Leu Gln Lys Glu Leu Thr
625 630 635 640
Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Gln His Glu Ile Glu Val
645 650 655
Asp Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro
660 665 670
Lys Asp Lys Val Asp Asp Asn Lys Leu Gln Arg Lys Tyr Val Phe Tyr
675 680 685
Arg Asn Glu Ile Gly Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile
690 695 700
His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu
705 710 715 720
Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile
725 730 735
Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr
740 745 750
Lys Asp Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe
755 760 765
Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser
770 775 780
Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys
785 790 795 800
Lys Glu Leu Ser Lys Arg Leu Asn Tyr Ile Phe Ile Val Phe Gln Lys
805 810 815
Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr
820 825 830
Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr
835 840 845
Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe
850 855 860
Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr
865 870 875 880
Pro Asp Lys Ile Glu Asn Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg
885 890 895
Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val
900 905 910
Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu
915 920 925
Ser Asp Phe Tyr Val Ser Lys Thr Asp Arg Glu Lys Ile Lys Ala Asp
930 935 940
Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Phe Leu Trp Asn Lys Val
945 950 955 960
Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu
965 970 975
Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala
980 985 990
Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys
995 1000 1005
Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr
1010 1015 1020
Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys
1025 1030 1035
Lys Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Asp
1040 1045 1050
Lys Phe Tyr Asp Phe Ser Asn Asn Ala Thr His Pro Glu Asp Leu
1055 1060 1065
Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu
1070 1075 1080
Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn
1085 1090 1095
Leu Glu Asn Ile Asp Ile Glu Ile Leu Ile Lys Tyr Tyr Asp Tyr
1100 1105 1110
Asn Thr Glu Lys Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp
1115 1120 1125
Glu Lys Ala Lys Ile Val Asn Thr Lys Glu Asn Tyr Asn Lys Ile
1130 1135 1140
Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg
1145 1150 1155
Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp
1160 1165 1170
Leu Ala Thr Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala
1175 1180 1185
Cys Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Thr Glu Leu Trp
1190 1195 1200
Glu Asn Lys Lys Lys Ala Lys Glu Ile Val
1205 1210
<210> 173
<211> 1119
<212> PRT
<213> Porphyromonas gingivalis
<400> 173
Met Thr Glu Gln Asn Glu Arg Pro Tyr Asn Gly Thr Tyr Tyr Thr Leu
1 5 10 15
Glu Asp Lys His Phe Trp Ala Ala Phe Phe Asn Leu Ala Arg His Asn
20 25 30
Ala Tyr Ile Thr Leu Thr His Ile Asp Arg Gln Leu Ala Tyr Ser Lys
35 40 45
Ala Asp Ile Thr Asn Asp Glu Asp Ile Leu Phe Phe Lys Gly Gln Trp
50 55 60
Lys Asn Leu Asp Asn Asp Leu Glu Arg Lys Ala Arg Leu Arg Ser Leu
65 70 75 80
Ile Leu Lys His Phe Ser Phe Leu Glu Gly Ala Ala Tyr Gly Lys Lys
85 90 95
Leu Phe Glu Asn Lys Ser Ser Gly Asn Lys Ser Ser Lys Lys Lys Glu
100 105 110
Leu Thr Lys Lys Glu Lys Glu Glu Leu Gln Ala Asn Ala Leu Ser Leu
115 120 125
Asp Asn Leu Lys Ser Ile Leu Phe Asp Phe Leu Gln Lys Leu Lys Asp
130 135 140
Phe Arg Asn Tyr Tyr Ser His Tyr Arg His Pro Glu Ser Ser Glu Leu
145 150 155 160
Pro Leu Phe Asp Gly Asn Met Leu Gln Arg Leu Tyr Asn Val Phe Asp
165 170 175
Val Ser Val Gln Arg Val Lys Arg Asp His Glu His Asn Asp Lys Val
180 185 190
Asp Pro His Arg His Phe Asn His Leu Val Arg Lys Gly Lys Lys Asp
195 200 205
Arg Cys Gly Asn Asn Asp Asn Pro Phe Phe Lys His His Phe Val Asp
210 215 220
Arg Glu Gly Lys Val Thr Glu Ala Gly Leu Leu Phe Phe Val Ser Leu
225 230 235 240
Phe Leu Glu Lys Arg Asp Ala Ile Trp Met Gln Lys Lys Ile Arg Gly
245 250 255
Phe Lys Gly Gly Thr Glu Ala Tyr Gln Gln Met Thr Asn Glu Val Phe
260 265 270
Cys Arg Ser Arg Ile Ser Leu Pro Lys Leu Lys Leu Glu Ser Leu Arg
275 280 285
Thr Asp Asp Trp Met Leu Leu Asp Met Leu Asn Glu Leu Val Arg Cys
290 295 300
Pro Lys Ser Leu Tyr Asp Arg Leu Arg Glu Glu Asp Arg Ala Arg Phe
305 310 315 320
Arg Val Pro Val Asp Ile Leu Ser Asp Glu Asp Asp Thr Asp Gly Thr
325 330 335
Glu Glu Asp Pro Phe Lys Asn Thr Leu Val Arg His Gln Asp Arg Phe
340 345 350
Pro Tyr Phe Ala Leu Arg Tyr Phe Asp Leu Lys Lys Val Phe Thr Ser
355 360 365
Leu Arg Phe His Ile Asp Leu Gly Thr Tyr His Phe Ala Ile Tyr Lys
370 375 380
Lys Asn Ile Gly Glu Gln Pro Glu Asp Arg His Leu Thr Arg Asn Leu
385 390 395 400
Tyr Gly Phe Gly Arg Ile Gln Asp Phe Ala Glu Glu His Arg Pro Glu
405 410 415
Glu Trp Lys Arg Leu Val Arg Asp Leu Asp Tyr Phe Glu Thr Gly Asp
420 425 430
Lys Pro Tyr Ile Thr Gln Thr Thr Pro His Tyr His Ile Glu Lys Gly
435 440 445
Lys Ile Gly Leu Arg Phe Val Pro Glu Gly Gln His Leu Trp Pro Ser
450 455 460
Pro Glu Val Gly Ala Thr Arg Thr Gly Arg Ser Lys Tyr Ala Gln Asp
465 470 475 480
Lys Arg Leu Thr Ala Glu Ala Phe Leu Ser Val His Glu Leu Met Pro
485 490 495
Met Met Phe Tyr Tyr Phe Leu Leu Arg Glu Lys Tyr Ser Glu Glu Val
500 505 510
Ser Ala Glu Lys Val Gln Gly Arg Ile Lys Arg Val Ile Glu Asp Val
515 520 525
Tyr Ala Val Tyr Asp Ala Phe Ala Arg Gly Glu Ile Asp Thr Leu Asp
530 535 540
Arg Leu Asp Ala Cys Leu Ala Asp Lys Gly Ile Arg Arg Gly His Leu
545 550 555 560
Pro Arg Gln Met Ile Ala Ile Leu Ser Gln Glu His Lys Asp Met Glu
565 570 575
Glu Lys Val Arg Lys Lys Leu Gln Glu Met Ile Ala Asp Thr Asp His
580 585 590
Arg Leu Asp Met Leu Asp Arg Gln Thr Asp Arg Lys Ile Arg Ile Gly
595 600 605
Arg Lys Asn Ala Gly Leu Pro Lys Ser Gly Val Ile Ala Asp Trp Leu
610 615 620
Val Arg Asp Met Met Arg Phe Gln Pro Val Ala Lys Asp Thr Ser Gly
625 630 635 640
Lys Pro Leu Asn Asn Ser Lys Ala Asn Ser Thr Glu Tyr Arg Met Leu
645 650 655
Gln Arg Ala Leu Ala Leu Phe Gly Gly Glu Lys Glu Arg Leu Thr Pro
660 665 670
Tyr Phe Arg Gln Met Asn Leu Thr Gly Gly Asn Asn Pro His Pro Phe
675 680 685
Leu His Glu Thr Arg Trp Glu Ser His Thr Asn Ile Leu Ser Phe Tyr
690 695 700
Arg Ser Tyr Leu Lys Ala Arg Lys Ala Phe Leu Gln Ser Ile Gly Arg
705 710 715 720
Ser Asp Arg Glu Glu Asn His Arg Phe Leu Leu Leu Lys Glu Pro Lys
725 730 735
Thr Asp Arg Gln Thr Leu Val Ala Gly Trp Lys Ser Glu Phe His Leu
740 745 750
Pro Arg Gly Ile Phe Thr Glu Ala Val Arg Asp Cys Leu Ile Glu Met
755 760 765
Gly Tyr Asp Glu Val Gly Ser Tyr Lys Glu Val Gly Phe Met Ala Lys
770 775 780
Ala Val Pro Leu Tyr Phe Glu Arg Ala Cys Lys Asp Arg Val Gln Pro
785 790 795 800
Phe Tyr Asp Tyr Pro Phe Asn Val Gly Asn Ser Leu Lys Pro Lys Lys
805 810 815
Gly Arg Phe Leu Ser Lys Glu Lys Arg Ala Glu Glu Trp Glu Ser Gly
820 825 830
Lys Glu Arg Phe Arg Leu Ala Lys Leu Lys Lys Glu Ile Leu Glu Ala
835 840 845
Lys Glu His Pro Tyr Leu Asp Phe Lys Ser Trp Gln Lys Phe Glu Arg
850 855 860
Glu Leu Arg Leu Val Lys Asn Gln Asp Ile Ile Thr Trp Met Met Cys
865 870 875 880
Arg Asp Leu Met Glu Glu Asn Lys Val Glu Gly Leu Asp Thr Gly Thr
885 890 895
Leu Tyr Leu Lys Asp Ile Arg Thr Glu Val Gln Glu Gln Gly Ser Leu
900 905 910
Asn Val Leu Asn Arg Val Lys Pro Met Arg Leu Pro Val Val Val Tyr
915 920 925
Arg Ala Asp Ser Arg Gly His Val His Lys Glu Gln Ala Pro Leu Ala
930 935 940
Thr Val Tyr Ile Glu Glu Arg Asp Thr Lys Leu Leu Lys Gln Gly Asn
945 950 955 960
Phe Lys Ser Phe Val Lys Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe
965 970 975
Val Asp Thr Gly Gly Leu Ala Met Glu Gln Tyr Pro Ile Ser Lys Leu
980 985 990
Arg Val Glu Tyr Glu Leu Ala Lys Tyr Gln Thr Ala Arg Val Cys Ala
995 1000 1005
Phe Glu Gln Thr Leu Glu Leu Glu Glu Ser Leu Leu Thr Arg Cys
1010 1015 1020
Pro His Leu Pro Asp Lys Asn Phe Arg Lys Met Leu Glu Ser Trp
1025 1030 1035
Ser Asp Pro Leu Leu Asp Lys Trp Pro Asp Leu Gln Arg Glu Val
1040 1045 1050
Trp Leu Leu Ile Ala Val Arg Asn Ala Phe Ser His Asn Gln Tyr
1055 1060 1065
Pro Met Tyr Asp Glu Ala Val Phe Ser Ser Ile Arg Lys Tyr Asp
1070 1075 1080
Pro Ser Ser Pro Asp Ala Ile Glu Glu Arg Met Gly Leu Asn Ile
1085 1090 1095
Ala His Arg Leu Ser Glu Glu Val Lys Gln Ala Lys Glu Met Ala
1100 1105 1110
Glu Arg Ile Ile Gln Ala
1115
<210> 174
<211> 1135
<212> PRT
<213> Porphyromonas gingivalis
<400> 174
Met Asn Thr Val Pro Ala Ser Glu Asn Lys Gly Gln Ser Arg Thr Val
1 5 10 15
Glu Asp Asp Pro Gln Tyr Phe Gly Leu Tyr Leu Asn Leu Ala Arg Glu
20 25 30
Asn Leu Ile Glu Val Glu Ser His Val Arg Ile Lys Phe Gly Lys Lys
35 40 45
Lys Leu Asn Glu Glu Ser Leu Lys Gln Ser Leu Leu Cys Asp His Leu
50 55 60
Leu Ser Val Asp Arg Trp Thr Lys Val Tyr Gly His Ser Arg Arg Tyr
65 70 75 80
Leu Pro Phe Leu His Tyr Phe Asp Pro Asp Ser Gln Ile Glu Lys Asp
85 90 95
His Asp Ser Lys Thr Gly Val Asp Pro Asp Ser Ala Gln Arg Leu Ile
100 105 110
Arg Glu Leu Tyr Ser Leu Leu Asp Phe Leu Arg Asn Asp Phe Ser His
115 120 125
Asn Arg Leu Asp Gly Thr Thr Phe Glu His Leu Glu Val Ser Pro Asp
130 135 140
Ile Ser Ser Phe Ile Thr Gly Thr Tyr Ser Leu Ala Cys Gly Arg Ala
145 150 155 160
Gln Ser Arg Phe Ala Asp Phe Phe Lys Pro Asp Asp Phe Val Leu Ala
165 170 175
Lys Asn Arg Lys Glu Gln Leu Ile Ser Val Ala Asp Gly Lys Glu Cys
180 185 190
Leu Thr Val Ser Gly Leu Ala Phe Phe Ile Cys Leu Phe Leu Asp Arg
195 200 205
Glu Gln Ala Ser Gly Met Leu Ser Arg Ile Arg Gly Phe Lys Arg Thr
210 215 220
Asp Glu Asn Trp Ala Arg Ala Val His Glu Thr Phe Cys Asp Leu Cys
225 230 235 240
Ile Arg His Pro His Asp Arg Leu Glu Ser Ser Asn Thr Lys Glu Ala
245 250 255
Leu Leu Leu Asp Met Leu Asn Glu Leu Asn Arg Cys Pro Arg Ile Leu
260 265 270
Tyr Asp Met Leu Pro Glu Glu Glu Arg Ala Gln Phe Leu Pro Ala Leu
275 280 285
Asp Glu Asn Ser Met Asn Asn Leu Ser Glu Asn Ser Leu Asn Glu Glu
290 295 300
Ser Arg Leu Leu Trp Asp Gly Ser Ser Asp Trp Ala Glu Ala Leu Thr
305 310 315 320
Lys Arg Ile Arg His Gln Asp Arg Phe Pro Tyr Leu Met Leu Arg Phe
325 330 335
Ile Glu Glu Met Asp Leu Leu Lys Gly Ile Arg Phe Arg Val Asp Leu
340 345 350
Gly Glu Ile Glu Leu Asp Ser Tyr Ser Lys Lys Val Gly Arg Asn Gly
355 360 365
Glu Tyr Asp Arg Thr Ile Thr Asp His Ala Leu Ala Phe Gly Lys Leu
370 375 380
Ser Asp Phe Gln Asn Glu Glu Glu Val Ser Arg Met Ile Ser Gly Glu
385 390 395 400
Ala Ser Tyr Pro Val Arg Phe Ser Leu Phe Ala Pro Arg Tyr Ala Ile
405 410 415
Tyr Asp Asn Lys Ile Gly Tyr Cys His Thr Ser Asp Pro Val Tyr Pro
420 425 430
Lys Ser Lys Thr Gly Glu Lys Arg Ala Leu Ser Asn Pro Gln Ser Met
435 440 445
Gly Phe Ile Ser Val His Asp Leu Arg Lys Leu Leu Leu Met Glu Leu
450 455 460
Leu Cys Glu Gly Ser Phe Ser Arg Met Gln Ser Gly Phe Leu Arg Lys
465 470 475 480
Ala Asn Arg Ile Leu Asp Glu Thr Ala Glu Gly Lys Leu Gln Phe Ser
485 490 495
Ala Leu Phe Pro Glu Met Arg His Arg Phe Ile Pro Pro Gln Asn Pro
500 505 510
Lys Ser Lys Asp Arg Arg Glu Lys Ala Glu Thr Thr Leu Glu Lys Tyr
515 520 525
Lys Gln Glu Ile Lys Gly Arg Lys Asp Lys Leu Asn Ser Gln Leu Leu
530 535 540
Ser Ala Phe Asp Met Asn Gln Arg Gln Leu Pro Ser Arg Leu Leu Asp
545 550 555 560
Glu Trp Met Asn Ile Arg Pro Ala Ser His Ser Val Lys Leu Arg Thr
565 570 575
Tyr Val Lys Gln Leu Asn Glu Asp Cys Arg Leu Arg Leu Arg Lys Phe
580 585 590
Arg Lys Asp Gly Asp Gly Lys Ala Arg Ala Ile Pro Leu Val Gly Glu
595 600 605
Met Ala Thr Phe Leu Ser Gln Asp Ile Val Arg Met Ile Ile Ser Glu
610 615 620
Glu Thr Lys Lys Leu Ile Thr Ser Ala Tyr Tyr Asn Glu Met Gln Arg
625 630 635 640
Ser Leu Ala Gln Tyr Ala Gly Glu Glu Asn Arg Arg Gln Phe Arg Ala
645 650 655
Ile Val Ala Glu Leu His Leu Leu Asp Pro Ser Ser Gly His Pro Phe
660 665 670
Leu Ser Ala Thr Met Glu Thr Ala His Arg Tyr Thr Glu Asp Phe Tyr
675 680 685
Lys Cys Tyr Leu Glu Lys Lys Arg Glu Trp Leu Ala Lys Thr Phe Tyr
690 695 700
Arg Pro Glu Gln Asp Glu Asn Thr Lys Arg Arg Ile Ser Val Phe Phe
705 710 715 720
Val Pro Asp Gly Glu Ala Arg Lys Leu Leu Pro Leu Leu Ile Arg Arg
725 730 735
Arg Met Lys Glu Gln Asn Asp Leu Gln Asp Trp Ile Arg Asn Lys Gln
740 745 750
Ala His Pro Ile Asp Leu Pro Ser His Leu Phe Asp Ser Lys Ile Met
755 760 765
Glu Leu Leu Lys Val Lys Asp Gly Lys Lys Lys Trp Asn Glu Ala Phe
770 775 780
Lys Asp Trp Trp Ser Thr Lys Tyr Pro Asp Gly Met Gln Pro Phe Tyr
785 790 795 800
Gly Leu Arg Arg Glu Leu Asn Ile His Gly Lys Ser Val Ser Tyr Ile
805 810 815
Pro Ser Asp Gly Lys Lys Phe Ala Asp Cys Tyr Thr His Leu Met Glu
820 825 830
Lys Thr Val Gln Asp Lys Lys Arg Glu Leu Arg Thr Ala Gly Lys Pro
835 840 845
Val Pro Pro Asp Leu Ala Ala Asp Ile Lys Arg Ser Phe His Arg Ala
850 855 860
Val Asn Glu Arg Glu Phe Met Leu Arg Leu Val Gln Glu Asp Asp Arg
865 870 875 880
Leu Met Leu Met Ala Ile Asn Lys Met Met Thr Asp Arg Glu Glu Asp
885 890 895
Ile Leu Pro Gly Leu Lys Asn Ile Asp Ser Ile Leu Asp Lys Glu Asn
900 905 910
Gln Phe Ser Leu Ala Val His Ala Lys Val Leu Glu Lys Glu Gly Glu
915 920 925
Gly Gly Asp Asn Ser Leu Ser Leu Val Pro Ala Thr Ile Glu Ile Lys
930 935 940
Ser Lys Arg Lys Asp Trp Ser Lys Tyr Ile Arg Tyr Arg Tyr Asp Arg
945 950 955 960
Arg Val Pro Gly Leu Met Ser His Phe Pro Glu His Lys Ala Thr Leu
965 970 975
Asp Glu Val Lys Thr Leu Leu Gly Glu Tyr Asp Arg Cys Arg Ile Lys
980 985 990
Ile Phe Asp Trp Ala Phe Ala Leu Glu Gly Ala Ile Met Ser Asp Arg
995 1000 1005
Asp Leu Lys Pro Tyr Leu His Glu Ser Ser Ser Arg Glu Gly Lys
1010 1015 1020
Ser Gly Glu His Ser Thr Leu Val Lys Met Leu Val Glu Lys Lys
1025 1030 1035
Gly Cys Leu Thr Pro Asp Glu Ser Gln Tyr Leu Ile Leu Ile Arg
1040 1045 1050
Asn Lys Ala Ala His Asn Gln Phe Pro Cys Ala Ala Glu Met Pro
1055 1060 1065
Leu Ile Tyr Arg Asp Val Ser Ala Lys Val Gly Ser Ile Glu Gly
1070 1075 1080
Ser Ser Ala Lys Asp Leu Pro Glu Gly Ser Ser Leu Val Asp Ser
1085 1090 1095
Leu Trp Lys Lys Tyr Glu Met Ile Ile Arg Lys Ile Leu Pro Ile
1100 1105 1110
Leu Asp Pro Glu Asn Arg Phe Phe Gly Lys Leu Leu Asn Asn Met
1115 1120 1125
Ser Gln Pro Ile Asn Asp Leu
1130 1135
<210> 175
<211> 950
<212> PRT
<213> Riemerella anatipestifer
<400> 175
Met Phe Phe Ser Phe His Asn Ala Gln Arg Val Ile Phe Lys His Leu
1 5 10 15
Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu Asp Tyr Lys
20 25 30
Ala His Phe Thr Val Asn Leu Thr Arg Asp Phe Ala His Leu Asn Arg
35 40 45
Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asn Arg Tyr Arg Phe
50 55 60
Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe Phe Thr Asn
65 70 75 80
Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys Lys Val Ser
85 90 95
Gly Phe Lys Ala Ser His Lys Gln Ser Glu Lys Met Thr Thr Glu Val
100 105 110
Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu Glu Ser Arg
115 120 125
Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu Leu Ser Arg
130 135 140
Cys Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Lys Asp Lys Lys Cys
145 150 155 160
Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu Glu Glu Gln
165 170 175
Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg Phe Pro Tyr
180 185 190
Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys Ser Ile Arg
195 200 205
Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr Asp Lys Lys
210 215 220
Ile Gly Tyr Glu Gln Glu Lys Arg His Leu Thr Arg Thr Leu Leu Asn
225 230 235 240
Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro Gln Glu Trp
245 250 255
Lys Ala Leu Thr Lys Asp Leu Asp Tyr Asn Glu Thr Ser Asn Gln Pro
260 265 270
Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp Asn Lys Ile
275 280 285
Gly Phe Arg Leu Arg Thr Ser Lys Glu Leu Tyr Pro Ser Leu Glu Val
290 295 300
Lys Asp Gly Ala Asn Arg Ile Ala Lys Tyr Pro Tyr Asn Ser Asp Phe
305 310 315 320
Val Ala His Ala Phe Ile Ser Ile Ser Val His Glu Leu Leu Pro Leu
325 330 335
Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys Glu
340 345 350
Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu Arg
355 360 365
Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu Pro
370 375 380
Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys Gln
385 390 395 400
Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile Ala
405 410 415
Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser Ser
420 425 430
Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val Leu
435 440 445
Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Val Tyr
450 455 460
Asp Ala Gln Asn Gln Pro Ile Lys Ser Ser Lys Ala Asn Ser Thr Glu
465 470 475 480
Ser Arg Leu Ile Arg Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys Asn
485 490 495
Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr Asn
500 505 510
Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn Leu
515 520 525
Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu Glu
530 535 540
Ala Ile Lys His Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu Leu
545 550 555 560
Lys Val Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu Gln
565 570 575
Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg Glu
580 585 590
Thr Leu Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu Ile
595 600 605
Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu Tyr
610 615 620
Phe Lys Glu Lys Tyr Gln Asp Lys His Gln Ser Phe Tyr Asn Leu Ser
625 630 635 640
Tyr Lys Leu Glu Ala Lys Ala Pro Leu Leu Lys Lys Glu Glu His Tyr
645 650 655
Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Ser Gln Arg
660 665 670
Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr Lys
675 680 685
Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln Asp
690 695 700
Ile Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe Lys
705 710 715 720
Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala Val
725 730 735
Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr Leu
740 745 750
Pro Met Val Leu Pro Val Lys Val Tyr Pro Thr Thr Ala Phe Gly Glu
755 760 765
Val Gln Tyr His Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu Glu
770 775 780
Gln Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys Asp
785 790 795 800
Arg His Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp Thr
805 810 815
Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu Ile
820 825 830
Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Ser Leu Glu
835 840 845
Glu Lys Leu Leu Asn Lys His Ala Ser Leu Ser Ser Leu Glu Asn Glu
850 855 860
Phe Arg Thr Leu Leu Glu Glu Trp Lys Lys Lys Tyr Ala Ala Ser Ser
865 870 875 880
Met Val Thr Asp Lys His Ile Ala Phe Ile Ala Ser Val Arg Asn Ala
885 890 895
Phe Cys His Asn Gln Tyr Pro Phe Tyr Lys Glu Thr Leu His Ala Pro
900 905 910
Ile Leu Leu Phe Thr Val Ala Gln Pro Thr Thr Glu Glu Lys Asp Gly
915 920 925
Leu Gly Ile Ala Glu Ala Leu Leu Arg Val Leu Arg Glu Tyr Cys Glu
930 935 940
Ile Val Lys Ser Gln Ile
945 950
<210> 176
<211> 1213
<212> PRT
<213> Flavobacterium columnare
<400> 176
Met Ser Ser Lys Asn Glu Ser Tyr Asn Lys Gln Lys Thr Phe Asn His
1 5 10 15
Tyr Lys Gln Glu Asp Lys Tyr Phe Phe Gly Gly Phe Leu Asn Asn Ala
20 25 30
Asp Asp Asn Leu Arg Gln Val Gly Lys Glu Phe Lys Thr Arg Ile Asn
35 40 45
Phe Asn His Asn Asn Asn Glu Leu Ala Ser Val Phe Lys Asp Tyr Phe
50 55 60
Asn Lys Glu Lys Ser Val Ala Lys Arg Glu His Ala Leu Asn Leu Leu
65 70 75 80
Ser Asn Tyr Phe Pro Val Leu Glu Arg Ile Gln Lys His Thr Asn His
85 90 95
Asn Phe Glu Gln Thr Arg Glu Ile Phe Glu Leu Leu Leu Asp Thr Ile
100 105 110
Lys Lys Leu Arg Asp Tyr Tyr Thr His His Tyr His Lys Pro Ile Thr
115 120 125
Ile Asn Pro Lys Ile Tyr Asp Phe Leu Asp Asp Thr Leu Leu Asp Val
130 135 140
Leu Ile Thr Ile Lys Lys Lys Lys Val Lys Asn Asp Thr Ser Arg Glu
145 150 155 160
Leu Leu Lys Glu Lys Leu Arg Pro Glu Leu Thr Gln Leu Lys Asn Gln
165 170 175
Lys Arg Glu Glu Leu Ile Lys Lys Gly Lys Lys Leu Leu Glu Glu Asn
180 185 190
Leu Glu Asn Ala Val Phe Asn His Cys Leu Arg Pro Phe Leu Glu Glu
195 200 205
Asn Lys Thr Asp Asp Lys Gln Asn Lys Thr Val Ser Leu Arg Lys Tyr
210 215 220
Arg Lys Ser Lys Pro Asn Glu Glu Thr Ser Ile Thr Leu Thr Gln Ser
225 230 235 240
Gly Leu Val Phe Leu Met Ser Phe Phe Leu His Arg Lys Glu Phe Gln
245 250 255
Val Phe Thr Ser Gly Leu Glu Gly Phe Lys Ala Lys Val Asn Thr Ile
260 265 270
Lys Glu Glu Lys Ile Ser Leu Asn Lys Asn Asn Ile Val Tyr Met Ile
275 280 285
Thr His Trp Ser Tyr Ser Tyr Tyr Asn Phe Lys Gly Leu Lys His Arg
290 295 300
Ile Lys Thr Asp Gln Gly Val Ser Thr Leu Glu Gln Asn Asn Thr Thr
305 310 315 320
His Ser Leu Thr Asn Thr Asn Thr Lys Glu Ala Leu Leu Thr Gln Ile
325 330 335
Val Asp Tyr Leu Ser Lys Val Pro Asn Glu Ile Tyr Glu Thr Leu Ser
340 345 350
Glu Lys Gln Gln Lys Glu Phe Glu Glu Asp Ile Asn Glu Tyr Met Arg
355 360 365
Glu Asn Pro Glu Asn Glu Asp Ser Thr Phe Ser Ser Ile Val Ser His
370 375 380
Lys Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe Asn Tyr Phe Ala Met
385 390 395 400
Arg Phe Leu Asp Glu Tyr Ala Glu Leu Pro Thr Leu Arg Phe Met Val
405 410 415
Asn Phe Gly Asp Tyr Ile Lys Asp Arg Gln Lys Lys Ile Leu Glu Ser
420 425 430
Ile Gln Phe Asp Ser Glu Arg Ile Ile Lys Lys Glu Ile His Leu Phe
435 440 445
Glu Lys Leu Gly Leu Val Thr Glu Tyr Lys Lys Asn Val Tyr Leu Lys
450 455 460
Glu Thr Ser Asn Ile Asp Leu Ser Arg Phe Pro Leu Phe Pro Ser Pro
465 470 475 480
Ser Tyr Val Met Ala Asn Asn Asn Ile Pro Phe Tyr Ile Asp Ser Arg
485 490 495
Ser Asn Asn Leu Asp Glu Tyr Leu Asn Gln Lys Lys Lys Ala Gln Ser
500 505 510
Gln Asn Arg Lys Arg Asn Leu Thr Phe Glu Lys Tyr Asn Lys Glu Gln
515 520 525
Ser Lys Asp Ala Ile Ile Ala Met Leu Gln Lys Glu Ile Gly Val Lys
530 535 540
Asp Leu Gln Gln Arg Ser Thr Ile Gly Leu Leu Ser Cys Asn Glu Leu
545 550 555 560
Pro Ser Met Leu Tyr Glu Val Ile Val Lys Asp Ile Lys Gly Ala Glu
565 570 575
Leu Glu Asn Lys Ile Ala Gln Lys Ile Arg Glu Gln Tyr Gln Ser Ile
580 585 590
Arg Asp Phe Thr Leu Asn Ser Pro Gln Lys Asp Asn Ile Pro Thr Thr
595 600 605
Leu Ile Lys Thr Ile Ser Thr Asp Thr Ser Val Thr Phe Glu Asn Gln
610 615 620
Pro Ile Asp Ile Pro Arg Leu Lys Asn Ala Ile Gln Lys Glu Leu Ala
625 630 635 640
Leu Thr Gln Glu Lys Leu Leu Asn Val Lys Gln His Glu Ile Glu Val
645 650 655
Asn Asn Tyr Asn Arg Asn Lys Asn Thr Tyr Lys Phe Lys Asn Gln Pro
660 665 670
Lys Asp Lys Val Asp Asp Asn Lys Leu Gln Arg Lys Tyr Val Phe Tyr
675 680 685
Arg Asn Glu Ile Gly Gln Glu Ala Asn Trp Leu Ala Ser Asp Leu Ile
690 695 700
His Phe Met Lys Asn Lys Ser Leu Trp Lys Gly Tyr Met His Asn Glu
705 710 715 720
Leu Gln Ser Phe Leu Ala Phe Phe Glu Asp Lys Lys Asn Asp Cys Ile
725 730 735
Ala Leu Leu Glu Thr Val Phe Asn Leu Lys Glu Asp Cys Ile Leu Thr
740 745 750
Lys Asp Leu Lys Asn Leu Phe Leu Lys His Gly Asn Phe Ile Asp Phe
755 760 765
Tyr Lys Glu Tyr Leu Lys Leu Lys Glu Asp Phe Leu Asn Thr Glu Ser
770 775 780
Thr Phe Leu Glu Asn Gly Phe Ile Gly Leu Pro Pro Lys Ile Leu Lys
785 790 795 800
Lys Glu Leu Ser Lys Arg Leu Asn Tyr Ile Phe Ile Val Phe Gln Lys
805 810 815
Arg Gln Phe Ile Ile Lys Glu Leu Glu Glu Lys Lys Asn Asn Leu Tyr
820 825 830
Ala Asp Ala Ile Asn Leu Ser Arg Gly Ile Phe Asp Glu Lys Pro Thr
835 840 845
Met Ile Pro Phe Lys Lys Pro Asn Pro Asp Glu Phe Ala Ser Trp Phe
850 855 860
Val Ala Ser Tyr Gln Tyr Asn Asn Tyr Gln Ser Phe Tyr Glu Leu Thr
865 870 875 880
Pro Asp Lys Ile Glu Asn Asp Lys Lys Lys Lys Tyr Lys Asn Leu Arg
885 890 895
Ala Ile Asn Lys Val Lys Ile Gln Asp Tyr Tyr Leu Lys Leu Met Val
900 905 910
Asp Thr Leu Tyr Gln Asp Leu Phe Asn Gln Pro Leu Asp Lys Ser Leu
915 920 925
Ser Asp Phe Tyr Val Ser Lys Thr Asp Arg Glu Lys Ile Lys Ala Asp
930 935 940
Ala Lys Ala Tyr Gln Lys Arg Asn Asp Ser Phe Leu Trp Asn Lys Val
945 950 955 960
Ile His Leu Ser Leu Gln Asn Asn Arg Ile Thr Ala Asn Pro Lys Leu
965 970 975
Lys Asp Ile Gly Lys Tyr Lys Arg Ala Leu Gln Asp Glu Lys Ile Ala
980 985 990
Thr Leu Leu Thr Tyr Asp Asp Arg Thr Trp Thr Tyr Ala Leu Gln Lys
995 1000 1005
Pro Glu Lys Glu Asn Glu Asn Asp Tyr Lys Glu Leu His Tyr Thr
1010 1015 1020
Ala Leu Asn Met Glu Leu Gln Glu Tyr Glu Lys Val Arg Ser Lys
1025 1030 1035
Lys Leu Leu Lys Gln Val Gln Glu Leu Glu Lys Gln Ile Leu Asp
1040 1045 1050
Lys Phe Tyr Asp Phe Ser Asn Asn Ala Thr His Pro Glu Asp Leu
1055 1060 1065
Glu Ile Glu Asp Lys Lys Gly Lys Arg His Pro Asn Phe Lys Leu
1070 1075 1080
Tyr Ile Thr Lys Ala Leu Leu Lys Asn Glu Ser Glu Ile Ile Asn
1085 1090 1095
Leu Glu Asn Ile Asp Ile Glu Ile Leu Ile Lys Tyr Tyr Asp Tyr
1100 1105 1110
Asn Thr Glu Lys Leu Lys Glu Lys Ile Lys Asn Met Asp Glu Asp
1115 1120 1125
Glu Lys Ala Lys Ile Val Asn Thr Lys Glu Asn Tyr Asn Lys Ile
1130 1135 1140
Thr Asn Val Leu Ile Lys Lys Ala Leu Val Leu Ile Ile Ile Arg
1145 1150 1155
Asn Lys Met Ala His Asn Gln Tyr Pro Pro Lys Phe Ile Tyr Asp
1160 1165 1170
Leu Ala Thr Arg Phe Val Pro Lys Lys Glu Glu Glu Tyr Phe Ala
1175 1180 1185
Cys Tyr Phe Asn Arg Val Phe Glu Thr Ile Thr Thr Glu Leu Trp
1190 1195 1200
Glu Asn Lys Lys Lys Ala Lys Glu Ile Val
1205 1210
<210> 177
<211> 1095
<212> PRT
<213> Riemerella anatipestifer
<400> 177
Met Glu Lys Pro Leu Pro Pro Asn Val Tyr Thr Leu Lys His Lys Phe
1 5 10 15
Phe Trp Gly Ala Phe Leu Asn Ile Ala Arg His Asn Ala Phe Ile Thr
20 25 30
Ile Cys His Ile Asn Glu Gln Leu Gly Leu Thr Thr Pro Pro Asn Asp
35 40 45
Asp Lys Ile Ala Asp Val Val Cys Gly Thr Trp Asn Asn Ile Leu Asn
50 55 60
Asn Asp His Asp Leu Leu Lys Lys Ser Gln Leu Thr Glu Leu Ile Leu
65 70 75 80
Lys His Phe Pro Phe Leu Ala Ala Met Cys Tyr His Pro Pro Lys Lys
85 90 95
Glu Gly Lys Lys Lys Gly Ser Gln Lys Glu Gln Gln Lys Glu Lys Glu
100 105 110
Asn Glu Ala Gln Ser Gln Ala Glu Ala Leu Asn Pro Ser Glu Leu Ile
115 120 125
Lys Val Leu Lys Thr Leu Val Lys Gln Leu Arg Thr Leu Arg Asn Tyr
130 135 140
Tyr Ser His His Ser His Lys Lys Pro Asp Ala Glu Lys Asp Ile Phe
145 150 155 160
Lys His Leu Tyr Lys Ala Phe Asp Ala Ser Leu Arg Met Val Lys Glu
165 170 175
Asp Tyr Lys Ala His Phe Thr Val Asn Leu Thr Gln Asp Phe Ala His
180 185 190
Leu Asn Arg Lys Gly Lys Asn Lys Gln Asp Asn Pro Asp Phe Asp Arg
195 200 205
Tyr Arg Phe Glu Lys Asp Gly Phe Phe Thr Glu Ser Gly Leu Leu Phe
210 215 220
Phe Thr Asn Leu Phe Leu Asp Lys Arg Asp Ala Tyr Trp Met Leu Lys
225 230 235 240
Lys Val Ser Gly Phe Lys Ala Ser His Lys Gln Ser Glu Lys Met Thr
245 250 255
Thr Glu Val Phe Cys Arg Ser Arg Ile Leu Leu Pro Lys Leu Arg Leu
260 265 270
Glu Ser Arg Tyr Asp His Asn Gln Met Leu Leu Asp Met Leu Ser Glu
275 280 285
Leu Ser Arg Tyr Pro Lys Leu Leu Tyr Glu Lys Leu Ser Glu Glu Asp
290 295 300
Lys Lys Arg Phe Gln Val Glu Ala Asp Gly Phe Leu Asp Glu Ile Glu
305 310 315 320
Glu Glu Gln Asn Pro Phe Lys Asp Thr Leu Ile Arg His Gln Asp Arg
325 330 335
Phe Pro Tyr Phe Ala Leu Arg Tyr Leu Asp Leu Asn Glu Ser Phe Lys
340 345 350
Ser Ile Arg Phe Gln Val Asp Leu Gly Thr Tyr His Tyr Cys Ile Tyr
355 360 365
Asp Lys Lys Ile Gly Asp Glu Gln Glu Lys Arg His Leu Thr Arg Thr
370 375 380
Leu Leu Ser Phe Gly Arg Leu Gln Asp Phe Thr Glu Ile Asn Arg Pro
385 390 395 400
Gln Glu Trp Lys Ala Leu Thr Lys Asp Leu Asp Tyr Lys Glu Thr Ser
405 410 415
Lys Gln Pro Phe Ile Ser Lys Thr Thr Pro His Tyr His Ile Thr Asp
420 425 430
Asn Lys Ile Gly Phe Arg Leu Gly Thr Ser Lys Glu Leu Tyr Pro Ser
435 440 445
Leu Glu Val Lys Asp Gly Ala Asn Arg Ile Ala Gln Tyr Pro Tyr Asn
450 455 460
Ser Asp Phe Val Ala His Ala Phe Ile Ser Val His Glu Leu Leu Pro
465 470 475 480
Leu Met Phe Tyr Gln His Leu Thr Gly Lys Ser Glu Asp Leu Leu Lys
485 490 495
Glu Thr Val Arg His Ile Gln Arg Ile Tyr Lys Asp Phe Glu Glu Glu
500 505 510
Arg Ile Asn Thr Ile Glu Asp Leu Glu Lys Ala Asn Gln Gly Arg Leu
515 520 525
Pro Leu Gly Ala Phe Pro Lys Gln Met Leu Gly Leu Leu Gln Asn Lys
530 535 540
Gln Pro Asp Leu Ser Glu Lys Ala Lys Ile Lys Ile Glu Lys Leu Ile
545 550 555 560
Ala Glu Thr Lys Leu Leu Ser His Arg Leu Asn Thr Lys Leu Lys Ser
565 570 575
Ser Pro Lys Leu Gly Lys Arg Arg Glu Lys Leu Ile Lys Thr Gly Val
580 585 590
Leu Ala Asp Trp Leu Val Lys Asp Phe Met Arg Phe Gln Pro Val Ala
595 600 605
Tyr Asp Ala Gln Asn Gln Pro Ile Glu Ser Ser Lys Ala Asn Ser Thr
610 615 620
Glu Phe Gln Leu Ile Gln Arg Ala Leu Ala Leu Tyr Gly Gly Glu Lys
625 630 635 640
Asn Arg Leu Glu Gly Tyr Phe Lys Gln Thr Asn Leu Ile Gly Asn Thr
645 650 655
Asn Pro His Pro Phe Leu Asn Lys Phe Asn Trp Lys Ala Cys Arg Asn
660 665 670
Leu Val Asp Phe Tyr Gln Gln Tyr Leu Glu Gln Arg Glu Lys Phe Leu
675 680 685
Glu Ala Ile Lys Asn Gln Pro Trp Glu Pro Tyr Gln Tyr Cys Leu Leu
690 695 700
Leu Lys Ile Pro Lys Glu Asn Arg Lys Asn Leu Val Lys Gly Trp Glu
705 710 715 720
Gln Gly Gly Ile Ser Leu Pro Arg Gly Leu Phe Thr Glu Ala Ile Arg
725 730 735
Glu Thr Leu Ser Lys Asp Leu Thr Leu Ser Lys Pro Ile Arg Lys Glu
740 745 750
Ile Lys Lys His Gly Arg Val Gly Phe Ile Ser Arg Ala Ile Thr Leu
755 760 765
Tyr Phe Arg Glu Lys Tyr Gln Asp Asp His Gln Ser Phe Tyr Asp Leu
770 775 780
Pro Tyr Lys Leu Glu Ala Lys Ala Ser Pro Leu Pro Lys Lys Glu His
785 790 795 800
Tyr Glu Tyr Trp Gln Gln Asn Lys Pro Gln Ser Pro Thr Glu Leu Gln
805 810 815
Arg Leu Glu Leu His Thr Ser Asp Arg Trp Lys Asp Tyr Leu Leu Tyr
820 825 830
Lys Arg Trp Gln His Leu Glu Lys Lys Leu Arg Leu Tyr Arg Asn Gln
835 840 845
Asp Val Met Leu Trp Leu Met Thr Leu Glu Leu Thr Lys Asn His Phe
850 855 860
Lys Glu Leu Asn Leu Asn Tyr His Gln Leu Lys Leu Glu Asn Leu Ala
865 870 875 880
Val Asn Val Gln Glu Ala Asp Ala Lys Leu Asn Pro Leu Asn Gln Thr
885 890 895
Leu Pro Met Val Leu Pro Val Lys Val Tyr Pro Ala Thr Ala Phe Gly
900 905 910
Glu Val Gln Tyr Gln Glu Thr Pro Ile Arg Thr Val Tyr Ile Arg Glu
915 920 925
Glu Gln Thr Lys Ala Leu Lys Met Gly Asn Phe Lys Ala Leu Val Lys
930 935 940
Asp Arg Arg Leu Asn Gly Leu Phe Ser Phe Ile Lys Glu Glu Asn Asp
945 950 955 960
Thr Gln Lys His Pro Ile Ser Gln Leu Arg Leu Arg Arg Glu Leu Glu
965 970 975
Ile Tyr Gln Ser Leu Arg Val Asp Ala Phe Lys Glu Thr Leu Asn Leu
980 985 990
Glu Glu Lys Leu Leu Lys Lys His Thr Ser Leu Ser Ser Val Glu Asn
995 1000 1005
Lys Phe Arg Ile Leu Leu Glu Glu Trp Lys Lys Glu Tyr Ala Ala
1010 1015 1020
Ser Ser Met Val Thr Asp Glu His Ile Ala Phe Ile Ala Ser Val
1025 1030 1035
Arg Asn Ala Phe Cys His Asn Gln Tyr Pro Phe Tyr Glu Glu Ala
1040 1045 1050
Leu His Ala Pro Ile Pro Leu Phe Thr Val Ala Gln Gln Thr Thr
1055 1060 1065
Glu Glu Lys Asp Gly Leu Gly Ile Ala Glu Ala Leu Leu Arg Val
1070 1075 1080
Leu Arg Glu Tyr Cys Glu Ile Val Lys Ser Gln Ile
1085 1090 1095
<210> 178
<211> 1149
<212> PRT
<213> Sinomicrobium oceani
<400> 178
Met Glu Ser Thr Thr Thr Leu Gly Leu His Leu Lys Tyr Gln His Asp
1 5 10 15
Leu Phe Glu Asp Lys His Tyr Phe Gly Gly Gly Val Asn Leu Ala Val
20 25 30
Gln Asn Ile Glu Ser Ile Phe Gln Ala Phe Ala Glu Arg Tyr Gly Ile
35 40 45
Gln Asn Pro Leu Arg Lys Asn Gly Val Pro Ala Ile Asn Asn Ile Phe
50 55 60
His Asp Asn Ile Ser Ile Ser Asn Tyr Lys Glu Tyr Leu Lys Phe Leu
65 70 75 80
Lys Gln Tyr Leu Pro Val Val Gly Phe Leu Glu Lys Ser Asn Glu Ile
85 90 95
Asn Ile Phe Glu Phe Arg Glu Asp Phe Glu Ile Leu Ile Asn Ala Ile
100 105 110
Tyr Lys Leu Arg His Phe Tyr Thr His Tyr Tyr His Ser Pro Ile Lys
115 120 125
Leu Glu Asp Arg Phe Tyr Thr Cys Leu Asn Glu Leu Phe Val Ala Val
130 135 140
Ala Ile Gln Val Lys Lys His Lys Met Lys Ser Asp Lys Thr Arg Gln
145 150 155 160
Leu Leu Asn Lys Asn Leu His Gln Leu Leu Gln Gln Leu Ile Glu Gln
165 170 175
Lys Arg Glu Lys Leu Lys Asp Lys Lys Ala Glu Gly Glu Lys Val Ser
180 185 190
Leu Asp Thr Lys Ser Ile Glu Asn Ala Val Leu Asn Asp Ala Phe Val
195 200 205
His Leu Leu Asp Lys Asp Glu Asn Ile Arg Leu Asn Tyr Ser Ser Arg
210 215 220
Leu Ser Glu Asp Ile Ile Thr Lys Asn Gly Ile Thr Leu Ser Ile Ser
225 230 235 240
Gly Leu Leu Phe Leu Leu Ser Leu Phe Leu Gln Arg Lys Glu Ala Glu
245 250 255
Asp Leu Arg Ser Arg Ile Glu Gly Phe Lys Gly Lys Gly Asn Glu Leu
260 265 270
Arg Phe Met Ala Thr His Trp Val Phe Ser Tyr Leu Asn Val Lys Arg
275 280 285
Ile Lys His Arg Leu Asn Thr Asp Phe Gln Lys Glu Thr Leu Leu Ile
290 295 300
Gln Ile Ala Asp Glu Leu Ser Lys Val Pro Asp Glu Val Tyr Lys Thr
305 310 315 320
Leu Asp His Glu Asn Arg Ser Lys Phe Leu Glu Asp Ile Asn Glu Tyr
325 330 335
Ile Arg Glu Gly Asn Glu Asp Ala Ser Leu Asn Glu Ser Thr Val Val
340 345 350
His Gly Val Ile Arg Lys Arg Tyr Glu Asn Lys Phe His Tyr Leu Val
355 360 365
Leu Arg Tyr Leu Asp Glu Phe Val Asp Phe Pro Ser Leu Arg Phe Gln
370 375 380
Val His Leu Gly Asn Tyr Ile His Asp Arg Arg Asp Lys Val Ile Asp
385 390 395 400
Gly Thr Asn Phe Ile Thr Asn Arg Val Ile Lys Glu Pro Ile Lys Val
405 410 415
Phe Gly Lys Leu Ser His Val Ser Lys Leu Lys Ser Asp Tyr Met Glu
420 425 430
Ser Leu Ser Arg Glu His Lys Asn Gly Trp Asp Val Phe Pro Asn Pro
435 440 445
Ser Tyr Asn Phe Val Gly His Asn Ile Pro Ile Phe Ile Asn Leu Arg
450 455 460
Ser Ala Ser Ser Lys Gly Lys Glu Leu Tyr Arg Asp Leu Met Lys Ile
465 470 475 480
Lys Ser Glu Lys Lys Lys Lys Ser Arg Glu Glu Gly Ile Pro Met Glu
485 490 495
Arg Arg Asp Gly Lys Pro Thr Lys Ile Glu Ile Ser Asn Gln Ile Asp
500 505 510
Arg Asn Ile Lys Asp Asn Asn Phe Lys Asp Ile Tyr Pro Gly Glu Pro
515 520 525
Leu Ala Met Leu Ser Leu Asn Glu Leu Pro Ala Leu Leu Phe Glu Leu
530 535 540
Leu Arg Arg Pro Ser Ile Thr Pro Gln Asp Ile Glu Asp Arg Met Val
545 550 555 560
Glu Lys Leu Tyr Glu Arg Phe Gln Ile Ile Arg Asp Tyr Lys Pro Gly
565 570 575
Asp Gly Leu Ser Thr Ser Lys Ile Ser Lys Lys Leu Arg Lys Ala Asp
580 585 590
Asn Ser Thr Arg Leu Asp Gly Lys Lys Leu Leu Arg Ala Ile Gln Thr
595 600 605
Glu Thr Arg Asn Ala Arg Glu Lys Leu His Thr Leu Glu Glu Asn Lys
610 615 620
Ala Leu Gln Lys Asn Arg Lys Arg Arg Thr Val Tyr Thr Thr Arg Glu
625 630 635 640
Gln Gly Arg Glu Ala Ser Trp Leu Ala Gln Asp Leu Lys Arg Phe Met
645 650 655
Pro Ile Ala Ser Arg Lys Glu Trp Arg Gly Tyr His His Ser Gln Leu
660 665 670
Gln Gln Ile Leu Ala Phe Tyr Asp Gln Asn Pro Lys Gln Pro Leu Glu
675 680 685
Leu Leu Glu Gln Phe Trp Asp Leu Lys Glu Asp Thr Tyr Val Trp Asn
690 695 700
Ser Trp Ile His Lys Ser Leu Ser Gln His Asn Gly Phe Val Pro Met
705 710 715 720
Tyr Glu Gly Tyr Leu Lys Gly Arg Leu Gly Tyr Tyr Lys Lys Leu Glu
725 730 735
Ser Asp Ile Ile Gly Phe Leu Glu Glu His Lys Val Leu Lys Arg Tyr
740 745 750
Tyr Thr Gln Gln His Leu Asn Val Ile Phe Arg Glu Arg Leu Tyr Phe
755 760 765
Ile Lys Thr Glu Thr Lys Gln Lys Leu Glu Leu Leu Ala Arg Pro Leu
770 775 780
Val Phe Pro Arg Gly Ile Phe Asp Asp Lys Pro Thr Phe Val Gln Asp
785 790 795 800
Lys Lys Val Val Asp His Pro Glu Leu Phe Ala Asp Trp Tyr Val Tyr
805 810 815
Ser Tyr Lys Asp Asp His Ser Phe Gln Glu Phe Tyr His Tyr Lys Arg
820 825 830
Asp Tyr Asn Glu Ile Phe Glu Thr Glu Leu Ser Trp Asp Ile Asp Phe
835 840 845
Lys Asp Asn Lys Arg Gln Leu Asn Pro Ser Glu Gln Met Asp Leu Phe
850 855 860
Arg Met Lys Trp Asp Leu Lys Ile Lys Lys Ile Lys Ile Gln Asp Ile
865 870 875 880
Phe Leu Lys Ile Val Ala Glu Asp Ile Tyr Leu Lys Ile Phe Gly His
885 890 895
Lys Ile Pro Leu Ser Leu Ser Asp Phe Tyr Ile Ser Arg Gln Glu Arg
900 905 910
Leu Thr Leu Asp Glu Gln Ala Val Ala Gln Ser Met Arg Leu Pro Gly
915 920 925
Asp Thr Ser Glu Asn Gln Ile Lys Glu Ser Asn Leu Trp Gln Thr Thr
930 935 940
Val Pro Tyr Glu Lys Glu Gln Ile Arg Glu Pro Lys Ile Lys Leu Lys
945 950 955 960
Asp Ile Gly Lys Phe Lys Tyr Phe Leu Gln Gln Gln Lys Val Leu Asn
965 970 975
Leu Leu Lys Tyr Asp Pro Gln His Val Trp Thr Lys Ala Glu Leu Glu
980 985 990
Glu Glu Leu Tyr Ile Gly Lys His Ser Tyr Glu Val Val Arg Arg Glu
995 1000 1005
Met Leu Leu Gln Lys Cys His Gln Leu Glu Lys His Ile Leu Glu
1010 1015 1020
Gln Phe Arg Phe Asp Gly Ser Asn His Pro Arg Glu Leu Glu Gln
1025 1030 1035
Gly Asn His Pro Asn Phe Lys Met Tyr Ile Val Asn Gly Ile Leu
1040 1045 1050
Thr Lys Arg Gly Glu Leu Glu Ile Glu Ala Glu Asn Trp Trp Leu
1055 1060 1065
Glu Leu Gly Asn Ser Lys Asn Ser Leu Asp Lys Val Glu Val Glu
1070 1075 1080
Leu Leu Thr Met Lys Thr Ile Pro Glu Gln Lys Ala Phe Leu Leu
1085 1090 1095
Ile Leu Ile Arg Asn Lys Phe Ala His Asn Gln Leu Pro Ala Asp
1100 1105 1110
Asn Tyr Phe His Tyr Ala Ser Asn Leu Met Asn Leu Lys Lys Ser
1115 1120 1125
Asp Thr Tyr Ser Leu Phe Trp Phe Thr Val Ala Asp Thr Ile Val
1130 1135 1140
Gln Glu Phe Met Ser Leu
1145
<210> 179
<211> 1133
<212> PRT
<213> Reichenbachiella agariperforans
<400> 179
Met Lys Thr Asn Pro Leu Ile Ala Ser Ser Gly Glu Lys Pro Asn Tyr
1 5 10 15
Lys Lys Phe Asn Thr Glu Ser Asp Lys Ser Phe Lys Lys Ile Phe Gln
20 25 30
Asn Lys Gly Ser Ile Ala Pro Ile Ala Glu Lys Ala Cys Lys Asn Phe
35 40 45
Glu Ile Lys Ser Lys Ser Pro Val Asn Arg Asp Gly Arg Leu His Tyr
50 55 60
Phe Ser Val Gly His Ala Phe Lys Asn Ile Asp Ser Lys Asn Val Phe
65 70 75 80
Arg Tyr Glu Leu Asp Glu Ser Gln Met Asp Met Lys Pro Thr Gln Phe
85 90 95
Leu Ala Leu Gln Lys Glu Phe Phe Asp Phe Gln Gly Ala Leu Asn Gly
100 105 110
Leu Leu Lys His Ile Arg Asn Val Asn Ser His Tyr Val His Thr Phe
115 120 125
Glu Lys Leu Glu Ile Gln Ser Ile Asn Gln Lys Leu Ile Thr Phe Leu
130 135 140
Ile Glu Ala Phe Glu Leu Ala Val Ile His Ser Tyr Leu Asn Glu Glu
145 150 155 160
Glu Leu Ser Tyr Glu Ala Tyr Lys Asp Asp Pro Gln Ser Gly Gln Lys
165 170 175
Leu Val Gln Phe Leu Cys Asp Lys Phe Tyr Pro Asn Lys Glu His Glu
180 185 190
Val Glu Glu Arg Lys Thr Ile Leu Ala Lys Asn Lys Arg Gln Ala Leu
195 200 205
Glu His Leu Leu Phe Ile Glu Val Thr Ser Asp Ile Asp Trp Lys Leu
210 215 220
Phe Glu Lys His Lys Val Phe Thr Ile Ser Asn Gly Lys Tyr Leu Ser
225 230 235 240
Phe His Ala Cys Leu Phe Leu Leu Ser Leu Phe Leu Tyr Lys Ser Glu
245 250 255
Ala Asn Gln Leu Ile Ser Lys Ile Lys Gly Phe Lys Arg Asn Asp Asp
260 265 270
Asn Gln Tyr Arg Ser Lys Arg Gln Ile Phe Thr Phe Phe Ser Lys Lys
275 280 285
Phe Thr Ser Gln Asp Val Asn Ser Glu Glu Gln His Leu Val Lys Phe
290 295 300
Arg Asp Val Ile Gln Tyr Leu Asn His Tyr Pro Ser Ala Trp Asn Lys
305 310 315 320
His Leu Glu Leu Lys Ser Gly Tyr Pro Gln Met Thr Asp Lys Leu Met
325 330 335
Arg Tyr Ile Val Glu Ala Glu Ile Tyr Arg Ser Phe Pro Asp Gln Thr
340 345 350
Asp Asn His Arg Phe Leu Leu Phe Ala Ile Arg Glu Phe Phe Gly Gln
355 360 365
Ser Cys Leu Asp Thr Trp Thr Gly Asn Thr Pro Ile Asn Phe Ser Asn
370 375 380
Gln Glu Gln Lys Gly Phe Ser Tyr Glu Ile Asn Thr Ser Ala Glu Ile
385 390 395 400
Lys Asp Ile Glu Thr Lys Leu Lys Ala Leu Val Leu Lys Gly Pro Leu
405 410 415
Asn Phe Lys Glu Lys Lys Glu Gln Asn Arg Leu Glu Lys Asp Leu Arg
420 425 430
Arg Glu Lys Lys Glu Gln Pro Thr Asn Arg Val Lys Glu Lys Leu Leu
435 440 445
Thr Arg Ile Gln His Asn Met Leu Tyr Val Ser Tyr Gly Arg Asn Gln
450 455 460
Asp Arg Phe Met Asp Phe Ala Ala Arg Phe Leu Ala Glu Thr Asp Tyr
465 470 475 480
Phe Gly Lys Asp Ala Lys Phe Lys Met Tyr Gln Phe Tyr Thr Ser Asp
485 490 495
Glu Gln Arg Asp His Leu Lys Glu Gln Lys Lys Glu Leu Pro Lys Lys
500 505 510
Glu Phe Glu Lys Leu Lys Tyr His Gln Ser Lys Leu Val Asp Tyr Phe
515 520 525
Thr Tyr Ala Glu Gln Gln Ala Arg Tyr Pro Asp Trp Asp Thr Pro Phe
530 535 540
Val Val Glu Asn Asn Ala Ile Gln Ile Lys Val Thr Leu Phe Asn Gly
545 550 555 560
Ala Lys Lys Ile Val Ser Val Gln Arg Asn Leu Met Leu Tyr Leu Leu
565 570 575
Glu Asp Ala Leu Tyr Ser Glu Lys Arg Glu Asn Ala Gly Lys Gly Leu
580 585 590
Ile Ser Gly Tyr Phe Val His His Gln Lys Glu Leu Lys Asp Gln Leu
595 600 605
Asp Ile Leu Glu Lys Glu Thr Glu Ile Ser Arg Glu Gln Lys Arg Glu
610 615 620
Phe Lys Lys Leu Leu Pro Lys Arg Leu Leu His Arg Tyr Ser Pro Ala
625 630 635 640
Gln Ile Asn Asp Thr Thr Glu Trp Asn Pro Met Glu Val Ile Leu Glu
645 650 655
Glu Ala Lys Ala Gln Glu Gln Arg Tyr Gln Leu Leu Leu Glu Lys Ala
660 665 670
Ile Leu His Gln Thr Glu Glu Asp Phe Leu Lys Arg Asn Lys Gly Lys
675 680 685
Gln Phe Lys Leu Arg Phe Val Arg Lys Ala Trp His Leu Met Tyr Leu
690 695 700
Lys Glu Leu Tyr Met Asn Lys Val Ala Glu His Gly His His Lys Ser
705 710 715 720
Phe His Ile Thr Lys Glu Glu Phe Asn Asp Phe Cys Arg Trp Met Phe
725 730 735
Ala Phe Asp Glu Val Pro Lys Tyr Lys Glu Tyr Leu Cys Asp Tyr Phe
740 745 750
Ser Gln Lys Gly Phe Phe Asn Asn Ala Glu Phe Lys Asp Leu Ile Glu
755 760 765
Ser Ser Thr Ser Leu Asn Asp Leu Tyr Glu Lys Thr Lys Gln Arg Phe
770 775 780
Glu Gly Trp Ser Lys Asp Leu Thr Lys Gln Ser Asp Glu Asn Lys Tyr
785 790 795 800
Leu Leu Ala Asn Tyr Glu Ser Met Leu Lys Asp Asp Met Leu Tyr Val
805 810 815
Asn Ile Ser His Phe Ile Ser Tyr Leu Glu Ser Lys Gly Lys Ile Asn
820 825 830
Arg Asn Ala His Gly His Ile Ala Tyr Lys Ala Leu Asn Asn Val Pro
835 840 845
His Leu Ile Glu Glu Tyr Tyr Tyr Lys Asp Arg Leu Ala Pro Glu Glu
850 855 860
Tyr Lys Ser His Gly Lys Leu Tyr Asn Lys Leu Lys Thr Val Lys Leu
865 870 875 880
Glu Asp Ala Leu Leu Tyr Glu Met Ala Met His Tyr Leu Ser Leu Glu
885 890 895
Pro Ala Leu Val Pro Lys Val Lys Thr Lys Val Lys Asp Ile Leu Ser
900 905 910
Ser Asn Ile Ala Phe Asp Ile Lys Asp Ala Ala Gly His His Leu Tyr
915 920 925
His Leu Leu Ile Pro Phe His Lys Ile Asp Ser Phe Val Ala Leu Ile
930 935 940
Asn His Gln Ser Gln Gln Glu Lys Asp Pro Asp Lys Thr Ser Phe Leu
945 950 955 960
Ala Lys Ile Gln Pro Tyr Leu Glu Lys Val Lys Asn Ser Lys Asp Leu
965 970 975
Lys Ala Val Tyr His Tyr Tyr Lys Asp Thr Pro His Thr Leu Arg Tyr
980 985 990
Glu Asp Leu Asn Met Ile His Ser His Ile Val Ser Gln Ser Val Gln
995 1000 1005
Phe Thr Lys Val Ala Leu Lys Leu Glu Glu Tyr Phe Ile Ala Lys
1010 1015 1020
Lys Ser Ile Thr Leu Gln Ile Ala Arg Gln Ile Ser Tyr Ser Glu
1025 1030 1035
Ile Ala Asp Leu Ser Asn Tyr Phe Thr Asp Glu Val Arg Asn Thr
1040 1045 1050
Ala Phe His Phe Asp Val Pro Glu Thr Ala Tyr Ser Met Ile Leu
1055 1060 1065
Gln Gly Ile Glu Ser Glu Phe Leu Asp Arg Glu Ile Lys Pro Gln
1070 1075 1080
Lys Pro Lys Ser Leu Ser Glu Leu Ser Thr Gln Gln Val Ser Val
1085 1090 1095
Cys Thr Ala Phe Leu Glu Thr Leu His Asn Asn Leu Phe Asp Arg
1100 1105 1110
Lys Asp Asp Lys Lys Glu Arg Leu Ser Lys Ala Arg Glu Arg Tyr
1115 1120 1125
Phe Glu Gln Ile Asn
1130
<210> 180
<211> 1816
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
consensus sequence"
<220>
<221> MOD_RES
<222> (30)..(30)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (33)..(33)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (38)..(38)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (41)..(41)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (43)..(43)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (45)..(45)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (49)..(49)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (73)..(73)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (85)..(86)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (102)..(102)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (105)..(108)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (138)..(139)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (143)..(143)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (146)..(148)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (153)..(158)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (160)..(160)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (180)..(180)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (183)..(183)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (189)..(189)
<223> Any amino acid
<220>
<221> VARIANT
<222> (195)..(195)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (196)..(196)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (198)..(199)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (203)..(204)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (212)..(212)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (214)..(214)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (217)..(217)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (220)..(220)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (228)..(228)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (234)..(235)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (241)..(243)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (249)..(249)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (255)..(255)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (257)..(257)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (268)..(268)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (270)..(270)
<223> Any amino acid
<220>
<221> VARIANT
<222> (271)..(271)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (272)..(272)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (293)..(293)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (301)..(302)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (304)..(304)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (311)..(312)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (317)..(318)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (325)..(326)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (328)..(328)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (336)..(336)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (338)..(338)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (342)..(344)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (346)..(347)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (349)..(350)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (359)..(359)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (361)..(361)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (363)..(363)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (371)..(371)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (377)..(378)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (391)..(391)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (402)..(403)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (406)..(406)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (416)..(418)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (422)..(423)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (425)..(425)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (427)..(427)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (429)..(429)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (433)..(434)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (436)..(436)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (438)..(438)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (440)..(441)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (444)..(444)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (446)..(446)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (449)..(450)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (457)..(458)
<223> Any amino acid
<220>
<221> VARIANT
<222> (459)..(459)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (469)..(469)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (474)..(475)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (481)..(482)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (486)..(486)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (489)..(489)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (492)..(492)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (497)..(499)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (504)..(504)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (506)..(507)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (510)..(510)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (514)..(514)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (530)..(530)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (532)..(533)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (540)..(541)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (546)..(546)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (555)..(555)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (560)..(560)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (580)..(580)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (583)..(583)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (585)..(585)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (593)..(594)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (604)..(604)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (611)..(611)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (613)..(614)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (631)..(631)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (634)..(634)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (644)..(644)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (646)..(646)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (648)..(648)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (650)..(650)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (652)..(652)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (671)..(671)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (675)..(677)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (679)..(679)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (681)..(682)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (697)..(697)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (703)..(703)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (713)..(716)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (721)..(721)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (725)..(726)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (729)..(729)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (734)..(737)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (739)..(739)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (742)..(743)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (745)..(747)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (751)..(753)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (760)..(760)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (763)..(764)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (766)..(767)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (770)..(771)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (783)..(783)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (788)..(788)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (808)..(808)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (812)..(812)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (814)..(814)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (816)..(816)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (826)..(826)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (838)..(840)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (843)..(843)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (847)..(847)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (851)..(851)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (856)..(856)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (859)..(859)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (861)..(861)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (873)..(873)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (878)..(878)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (882)..(884)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (889)..(892)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (898)..(900)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (903)..(903)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (908)..(909)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (912)..(912)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (915)..(915)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (918)..(918)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (932)..(932)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (934)..(935)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (939)..(939)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (941)..(941)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (944)..(944)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (946)..(946)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (951)..(951)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (961)..(961)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (963)..(963)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (965)..(965)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (980)..(980)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (988)..(988)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (992)..(993)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1001)..(1001)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1003)..(1003)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1005)..(1005)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1019)..(1019)
<223> Any amino acid
<220>
<221> VARIANT
<222> (1021)..(1021)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (1023)..(1023)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1025)..(1025)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1029)..(1029)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1033)..(1033)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1048)..(1049)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1055)..(1058)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1060)..(1060)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1063)..(1065)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1068)..(1068)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1071)..(1071)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1075)..(1075)
<223> Any amino acid
<220>
<221> VARIANT
<222> (1078)..(1078)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (1081)..(1081)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1088)..(1088)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1090)..(1090)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1111)..(1111)
<223> Any amino acid
<220>
<221> VARIANT
<222> (1113)..(1113)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (1136)..(1137)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1140)..(1140)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1149)..(1149)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1154)..(1154)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1157)..(1158)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1162)..(1162)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1167)..(1169)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1171)..(1173)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1175)..(1175)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1187)..(1187)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1194)..(1194)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1208)..(1208)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1210)..(1213)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1225)..(1225)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1228)..(1228)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1234)..(1237)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1240)..(1242)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1244)..(1244)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1264)..(1264)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1268)..(1268)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1282)..(1282)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1284)..(1284)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1292)..(1293)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1302)..(1302)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1309)..(1309)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1313)..(1313)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1320)..(1320)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1324)..(1324)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1326)..(1327)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1331)..(1331)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1334)..(1334)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1336)..(1336)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1341)..(1341)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1350)..(1350)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1360)..(1364)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1366)..(1366)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1369)..(1369)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1375)..(1376)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1393)..(1395)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1397)..(1397)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1400)..(1400)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1408)..(1408)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1410)..(1410)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1420)..(1420)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1440)..(1440)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1446)..(1446)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1452)..(1452)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1457)..(1457)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1459)..(1459)
<223> Any amino acid
<220>
<221> VARIANT
<222> (1461)..(1461)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (1463)..(1463)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1465)..(1466)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1470)..(1470)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1472)..(1472)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1475)..(1475)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1484)..(1485)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1494)..(1494)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1496)..(1498)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1500)..(1501)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1504)..(1504)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1506)..(1506)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1508)..(1511)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1513)..(1514)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1518)..(1518)
<223> Any amino acid
<220>
<221> VARIANT
<222> (1522)..(1522)
<223> /replace="Ile"
<220>
<221> MOD_RES
<222> (1530)..(1530)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1532)..(1532)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1535)..(1537)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1539)..(1540)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1542)..(1542)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1548)..(1548)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1559)..(1559)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1565)..(1565)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1568)..(1568)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1580)..(1581)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1584)..(1585)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1588)..(1588)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1596)..(1596)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1602)..(1602)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1633)..(1635)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1640)..(1640)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1643)..(1646)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1653)..(1653)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1659)..(1659)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1668)..(1668)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1675)..(1676)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1683)..(1683)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1694)..(1696)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1705)..(1705)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1716)..(1718)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1720)..(1720)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1726)..(1726)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1733)..(1733)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1755)..(1756)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1758)..(1759)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1763)..(1763)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (1767)..(1767)
<223> Any amino acid
<220>
<221> MISC_FEATURE
<222> (1)..(1816)
<223> /note="Variant residues given in the sequence have no
preference with respect to those in the annotations
for variant positions"
<400> 180
Met Trp Ile Ser Ile Lys Thr Leu Ile His His Leu Gly Val Leu Phe
1 5 10 15
Phe Cys Asp Met Gly Asn Leu Phe Gly His Met Lys Ile Xaa Lys Val
20 25 30
Xaa His Glu Lys Arg Xaa Ala Lys Xaa Lys Xaa Pro Xaa Lys Lys Val
35 40 45
Xaa Val Lys Arg Lys Tyr Ser Gly Gly Gly Leu Leu Leu Asn Tyr Asn
50 55 60
Glu Asn Pro Asn Lys Asn Lys Ser Xaa Glu Asn Ile Leu Ile Lys Lys
65 70 75 80
Lys Ile Ser Phe Xaa Xaa Leu Lys Ser Ser Ser Lys Leu Asx Lys Thr
85 90 95
Ile Asn Lys Pro Asp Xaa Lys Lys Xaa Xaa Xaa Xaa Leu Gln Trp Phe
100 105 110
Leu Ser Glu Ile Val Lys Lys Ile Asn Arg Arg Asn Gly Leu Val Leu
115 120 125
Ser Asp Met Leu Ser Val Asp Lys Arg Xaa Xaa Glu Lys Ile Xaa Glu
130 135 140
Lys Xaa Xaa Xaa Leu Lys Tyr Phe Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa
145 150 155 160
Lys Leu His Gln Glu Lys Pro Ser Lys Lys Leu Phe Asn Leu Lys Asp
165 170 175
Leu Lys Glu Xaa Glu Glu Xaa Val Leu Phe Leu Lys Xaa Lys Phe Lys
180 185 190
Asn Glu Leu Xaa Tyr Xaa Xaa Glu Asn Asp Xaa Xaa Lys Asp Ile Glu
195 200 205
Lys Ile Leu Xaa Glu Xaa Leu Arg Xaa Gly Phe Xaa Pro Ala Asp Lys
210 215 220
Lys Leu Lys Xaa Lys Phe Leu Ile Glu Xaa Xaa Trp Gly Ile Phe Ser
225 230 235 240
Xaa Xaa Xaa Lys Leu Glu Pro Tyr Xaa Ile Gln Glu Asp Phe Xaa Glu
245 250 255
Xaa Tyr Ile Glu Asp Phe Lys Lys Leu Asn Lys Xaa Lys Xaa Leu Xaa
260 265 270
Lys Ser Ile Glu Asn Asn Lys Ile Val Ser Gln Lys Ser Ser Asp Ser
275 280 285
Gln Ile Tyr Glu Xaa Gly Lys Asn Ile Ile Met Ser Xaa Xaa Gly Xaa
290 295 300
Ile Glu Ser Ile Ile Glu Xaa Xaa Ser Lys Arg Lys Xaa Xaa Leu Asp
305 310 315 320
Lys Tyr Ala Thr Xaa Xaa Leu Xaa Glu Lys Leu Leu Leu Asp Glu Xaa
325 330 335
Leu Xaa Ile Glu Gln Xaa Xaa Xaa Asn Xaa Xaa Glu Xaa Xaa Asp Lys
340 345 350
Leu Ala Ser Asn Leu Lys Xaa Tyr Xaa Leu Xaa Lys Leu Tyr Phe Tyr
355 360 365
Val Lys Xaa Asp Lys Lys Lys Ser Xaa Xaa Glu Val Ala Lys Ala Ala
370 375 380
Val Ser Ala Ala Lys Asp Xaa Asn Lys Asp Lys Tyr Gln Asn Glu Val
385 390 395 400
Trp Xaa Xaa His Glu Xaa Arg Lys Glu Asp Lys Arg Asp Phe Ile Xaa
405 410 415
Xaa Xaa Leu Glu Ile Xaa Xaa Ile Xaa Lys Xaa Ile Xaa Lys Val Lys
420 425 430
Xaa Xaa Ile Xaa Lys Xaa Ala Xaa Xaa Glu Ala Xaa Glu Xaa Ile Lys
435 440 445
Xaa Xaa Asn Ile Gly Lys Tyr Arg Xaa Xaa Leu Asp Leu Phe Glu Leu
450 455 460
Glu Glu Asp Asn Xaa Leu Asn Gln Phe Xaa Xaa Phe Val Asn Ile Glu
465 470 475 480
Xaa Xaa Lys Phe Phe Xaa His Tyr Xaa Pro Asn Xaa Ile Lys Arg Ile
485 490 495
Xaa Xaa Xaa Lys Asn Asp Ala Xaa Ala Xaa Xaa Leu Lys Xaa Gly Glu
500 505 510
Leu Xaa Lys Lys Val Glu Lys Gln Leu Lys Asn Gly Ala Leu Ser Ile
515 520 525
Tyr Xaa Ile Xaa Xaa Gly Lys Ala Val Tyr Tyr Xaa Xaa Phe Ala Met
530 535 540
Lys Xaa Leu Ala Asp Ser Asp Tyr Trp Thr Xaa Lys Asp Leu Glu Xaa
545 550 555 560
Ile Lys Ile Ser Glu Ala Phe Leu Arg Lys Phe Ile Gly Ala Cys Ser
565 570 575
Phe Ala Tyr Xaa Ser Leu Xaa Ala Xaa Asn Ile Leu Gln Pro Glu Cys
580 585 590
Xaa Xaa Asp Ile Leu Gly Lys Gly Asp Leu Leu Xaa Lys Ala Thr Val
595 600 605
Asn Ile Xaa Gln Xaa Xaa Ser Glu His Ile Met Tyr Leu Gly Lys Leu
610 615 620
Arg His Asn Asp Ile Asp Xaa Leu Leu Xaa Phe Lys Glu Asp Ile Ala
625 630 635 640
Lys Ser Thr Xaa Lys Xaa Gly Xaa Gly Xaa Leu Xaa Lys Asn Leu Ile
645 650 655
Gln Phe Phe Gly Gly Glu Ser Thr Trp Asp Asn Lys Ile Phe Xaa Ala
660 665 670
Ala Tyr Xaa Xaa Xaa Leu Xaa Gly Xaa Xaa Glu Asn Glu Asp Phe Leu
675 680 685
Gly Trp Ala Leu Arg Gly Ala Ile Xaa Ser Ile Arg Asn Glu Xaa Phe
690 695 700
His Ser Phe Lys Ile Lys Lys His Xaa Xaa Xaa Xaa Phe Leu Asn Ile
705 710 715 720
Xaa Asn Phe Ile Xaa Xaa Lys Leu Xaa Glu Phe Glu Lys Xaa Xaa Xaa
725 730 735
Xaa Lys Xaa Lys Glu Xaa Xaa His Xaa Xaa Xaa Thr Ser Tyr Xaa Xaa
740 745 750
Xaa Leu Ile Lys Lys Leu Phe Xaa Asn Glu Xaa Xaa Lys Xaa Xaa Leu
755 760 765
Pro Xaa Xaa Ile Lys Glu Leu Lys Leu Lys Ser Ser Gly Val Xaa Met
770 775 780
Tyr Tyr Ser Xaa Asp Asp Leu Lys Lys Leu Leu Glu Asn Ile Tyr Phe
785 790 795 800
Lys Phe Ser Leu Leu Lys Ile Xaa Glu Glu Asn Xaa Glu Xaa Ala Xaa
805 810 815
Phe Val Pro Ser Phe Lys Lys Val Tyr Xaa Arg Ala Asp Gly Val Lys
820 825 830
Gly Phe Asp Tyr Gln Xaa Xaa Xaa Thr Arg Xaa His Ala Tyr Xaa Leu
835 840 845
Lys Leu Xaa Pro Phe Phe Asp Xaa Glu Glu Xaa Glu Xaa Glu Ala Phe
850 855 860
Asn Ala Arg Tyr Tyr Leu Leu Lys Xaa Ile Tyr Tyr Asn Xaa Ile Leu
865 870 875 880
Glu Xaa Xaa Xaa Glu Glu Asn Glu Xaa Xaa Xaa Xaa Phe Leu Pro Lys
885 890 895
Phe Xaa Xaa Xaa Asn Asn Xaa Ala Phe Arg Glu Xaa Xaa Asn Phe Xaa
900 905 910
Ala Asp Xaa Ile Glu Xaa Tyr Tyr Lys Arg Leu Gln Ile Asn Lys Lys
915 920 925
Lys Gly Ala Xaa Lys Xaa Xaa Lys Lys Lys Xaa Gln Xaa Lys Val Xaa
930 935 940
Asn Xaa Tyr Asn Arg Lys Xaa Phe Ala Tyr Ala Phe Glu Asn Ile Arg
945 950 955 960
Xaa Met Xaa Phe Xaa Glu Thr Pro Arg Glu Tyr Met Gln Tyr Ile Gln
965 970 975
Ser Glu Tyr Xaa Ile Glu Asn Asn Gly Lys Glu Xaa Lys Lys Ser Xaa
980 985 990
Xaa Glu Asn Lys Arg Asn Lys Asp Xaa Phe Xaa His Xaa Glu Lys Phe
995 1000 1005
Leu Leu Gln Val Phe Ile Lys Gly Phe Asp Xaa Tyr Leu Asp Xaa
1010 1015 1020
Arg Xaa Glu Asn Phe Xaa Phe Ile Leu Xaa Pro Glu Pro Gln Asn
1025 1030 1035
Gly Thr Lys Glu Tyr Leu Tyr Glu Glu Xaa Xaa Ala Ile Leu Asp
1040 1045 1050
Glu Xaa Xaa Xaa Xaa Asn Xaa Leu Arg Xaa Xaa Xaa Ile Thr Xaa
1055 1060 1065
Asn Lys Xaa Leu Lys Leu Xaa Glu Phe Leu Pro Glu Xaa Lys Ser
1070 1075 1080
Asp Ile Lys Val Xaa Pro Xaa Leu Val Glu Glu Ile Tyr Asp Tyr
1085 1090 1095
Ile Lys Lys Ile Lys Ile Asn Lys Ile Lys Lys Asp Xaa Glu Leu
1100 1105 1110
Ala Phe Trp Gln Asp Ala Ala Leu Tyr Leu Phe Cys Glu Lys Leu
1115 1120 1125
Leu Asp Ala Arg His Leu Ser Xaa Xaa Leu Arg Xaa Glu Leu Ile
1130 1135 1140
Lys Tyr Lys Gln Phe Xaa Lys Asp Ile Lys Xaa Arg Ala Xaa Xaa
1145 1150 1155
Asn Gly Asn Xaa Ile Asn His Ser Xaa Xaa Xaa Asn Xaa Xaa Xaa
1160 1165 1170
Val Xaa Glu Cys Thr Asp Glu Leu Glu Ile Ile Glu Leu Xaa Leu
1175 1180 1185
Leu Leu Asn Asp Arg Xaa Ser Asn Asp Phe Lys Asp Tyr Phe Asp
1190 1195 1200
Asp Glu Glu Ala Xaa Ile Xaa Xaa Xaa Xaa Leu Cys Arg Ile Ile
1205 1210 1215
Phe Tyr Ala Glu Tyr Leu Xaa Lys Tyr Xaa Lys Glu Glu Asp Asp
1220 1225 1230
Xaa Xaa Xaa Xaa Ala Glu Xaa Xaa Xaa Phe Xaa Ala Leu Glu Pro
1235 1240 1245
Phe Cys Gln Ser Asp Thr Ala Arg Glu Ala Lys Asn Asp Ile Tyr
1250 1255 1260
Xaa Asp Gly Gly Xaa Asn Pro Glu Leu Arg Val Pro Ile Leu Asn
1265 1270 1275
Arg Gly Ile Xaa Gln Xaa Lys Lys Ile Tyr Gly Thr Glu Xaa Xaa
1280 1285 1290
Leu Glu Lys Leu Phe Asp Lys Asn Xaa Leu Phe Asx Ile Asp Gly
1295 1300 1305
Xaa Asx Ile Pro Xaa Phe Lys Val Ser Glu Glu Xaa Ala Ile Ile
1310 1315 1320
Xaa Glu Xaa Xaa Glu Lys Lys Xaa Glu Ile Xaa Glu Xaa Ser Gln
1325 1330 1335
Tyr Lys Xaa Arg Gly Glu Leu His Thr Glu Trp Xaa Gln Lys Ala
1340 1345 1350
Arg Glu Ile Glu Glu Tyr Xaa Xaa Xaa Xaa Xaa Lys Xaa Lys Phe
1355 1360 1365
Xaa Lys Lys Pro Gln Asn Xaa Xaa Phe Glu Lys Arg Phe Ile Glu
1370 1375 1380
Lys His Gly Gln Glu Tyr Lys Lys Ala Xaa Xaa Xaa Ile Xaa Glu
1385 1390 1395
Tyr Xaa Trp Leu Lys Asn Lys Val Glu Xaa Asn Xaa Leu Asn Glu
1400 1405 1410
Leu His Glu Leu Leu Ile Xaa Leu Leu Gly Arg Leu Ile Gly Tyr
1415 1420 1425
Ser Ala Leu Phe Glu Arg Asp Leu Gln Tyr Phe Xaa Asn Gly Phe
1430 1435 1440
His Tyr Xaa Cys Leu Asn Asn Asp Xaa Glu Lys Leu Ala Xaa Tyr
1445 1450 1455
Xaa Asn Leu Ser Xaa Val Xaa Xaa Lys Asn Arg Xaa Ile Xaa Lys
1460 1465 1470
Ala Xaa Leu Tyr Gln Ile Phe Ala Met Tyr Xaa Xaa Gly Leu Pro
1475 1480 1485
Phe Tyr Ser Lys Asp Xaa Asp Xaa Xaa Xaa Ala Xaa Xaa Ser Gly
1490 1495 1500
Xaa Lys Xaa Ser Xaa Xaa Xaa Xaa Ser Xaa Xaa Thr Ala Gly Xaa
1505 1510 1515
Gly Lys Lys Leu Lys Lys Phe Lys Lys Tyr Ser Xaa Tyr Xaa Leu
1520 1525 1530
Ile Xaa Xaa Xaa Leu Xaa Xaa Asp Xaa Ser Lys Lys Leu Asp Xaa
1535 1540 1545
Tyr Leu Ala Gly Leu Glu Leu Phe Glu Asn Xaa Glu Glu His Asp
1550 1555 1560
Asn Xaa Thr Glu Xaa Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr
1565 1570 1575
Leu Xaa Xaa Ala Gly Xaa Xaa Ala Asp Xaa Ser Leu Leu Glu Leu
1580 1585 1590
Tyr Asn Xaa Leu Arg Asp Arg Leu Xaa Ser Tyr Asp Arg Lys Leu
1595 1600 1605
Lys Asn Ala Val Ser Lys Ser Leu Ile Asp Ile Leu Asp Arg His
1610 1615 1620
Gly Met Ile Leu Lys Phe Lys Phe Lys Xaa Xaa Xaa Lys Leu Ile
1625 1630 1635
Gly Xaa Asn Asp Xaa Xaa Xaa Xaa Ala Ile Lys His Lys Asp Xaa
1640 1645 1650
Ala Arg Ile Thr Ile Xaa Glu Pro Asn Gly Val Thr Ser Glu Xaa
1655 1660 1665
Phe Thr Tyr Lys Leu Leu Xaa Xaa Val Ala Ala Leu Glu Ile Xaa
1670 1675 1680
Ser Leu Glu Pro Lys Lys Ile Arg His Leu Xaa Xaa Xaa Ala Arg
1685 1690 1695
Leu Leu Tyr Tyr Pro Lys Xaa Ala Thr Ala Gln Ser Gln Pro Asp
1700 1705 1710
Gln Lys Xaa Xaa Xaa Lys Xaa Lys Lys Lys Asn Ile Xaa Lys Gly
1715 1720 1725
Tyr Ile Glu Arg Xaa Thr Asn Gln Val Ser Ser Asn Gln Glu Glu
1730 1735 1740
Tyr Cys Glu Leu Val Lys Lys Leu Leu Glu Thr Xaa Xaa Leu Xaa
1745 1750 1755
Xaa Leu Ala Val Xaa Gly Val Ala Xaa Asx Ile Gly Leu His Ile
1760 1765 1770
Ser Arg Leu Arg Arg Ile Arg Glu Asp Ala Ile Ile Val Gly Arg
1775 1780 1785
Arg Tyr Arg Phe Arg Val Glu Ile Tyr Val Pro Pro Lys Ser Asn
1790 1795 1800
Thr Ser Lys Leu Asn Ala Ala Asp Leu Val Arg Ile Asp
1805 1810 1815
<210> 181
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 181
ttgccatgac ccttgccgtt gttg 24
<210> 182
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 182
tgatgatgca gtagtcagga cctt 24
<210> 183
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 183
caagtttgtg tacccgagga tttg 24
<210> 184
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 184
agctagtccc aataaatatg cgct 24
<210> 185
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 185
ctgtagtcgt tggctgtggt 20
<210> 186
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 186
cagcgttccc caagaagagt 20
<210> 187
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 187
agattgctgt tctaccaagt aatccata 28
<210> 188
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 188
tatggattac ttggtagaac agcaatct 28
<210> 189
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 189
atcagggcaa acagaacttt gactccca 28
<210> 190
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 190
gtgcagccag ctttccgggc attggctt 28
<210> 191
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 191
tagattgctg ttctaccaag taatccat 28
<210> 192
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 192
tccttgatta cacgatggaa tttgctgt 28
<210> 193
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 193
atgataatgc aatagcagga caggatga 28
<210> 194
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 194
aatttctcga actaatgtat agaaggca 28
<210> 195
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 195
ccaccaccac cgcctcccgc cgcccccg 28
<210> 196
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 196
tgctcccatc atctcaagta cctcagca 28
<210> 197
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 197
cccttgacac gaacaggtgg gcattcag 28
<210> 198
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 198
agaaggtcac ctgtacggcg agcacggc 28
<210> 199
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 199
cagatccgct tgagggtggc gatctggt 28
<210> 200
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 200
ccggacgatc gggcatcccc gccatctc 28
<210> 201
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 201
gactgagcac aaagcttccc agatagaa 28
<210> 202
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 202
accatccaag aatgccatct tagaacca 28
<210> 203
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 203
cctggcaaac aacctgtaga gcaccgag 28
<210> 204
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 204
tagattgctg tttcacacag atatgcat 28
<210> 205
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 205
tataatggtg aatatcttca aatgattt 28
<210> 206
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 206
atgtatagaa ggcatcatca acaccctg 28
<210> 207
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 207
ggttaaaaat ttacagattg tgctgagc 28
<210> 208
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 208
gtagatgctc tttcctcctg tgccatct 28
<210> 209
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 209
cagtttgaag ttctcatcgg ggaagcgc 28
<210> 210
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 210
cagtgttggt aggagtttgt tacaaaag 28
<210> 211
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 211
cttggccaag tctgttatgt tcacctga 28
<210> 212
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 212
caaaatgtac tcagcttcaa tcacaaat 28
<210> 213
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 213
ggttatagct tgacaagcaa ttaacttt 28
<210> 214
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 214
tccttgatta cacgatggaa tttgctgt 28
<210> 215
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 215
atgataatgc aatagcagga caggatga 28
<210> 216
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 216
aatttctcga actaatgtat agaaggca 28
<210> 217
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 217
gcgtgagcca ccgcgcctgg ccggctgt 28
<210> 218
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 218
ccagctgcag atgctgcagt ttttggcg 28
<210> 219
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 219
atcagggcaa acagaacttt gactccca 28
<210> 220
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 220
ttcagggcaa acagaacttt gactccca 28
<210> 221
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 221
atctgggcaa acagaacttt gactccca 28
<210> 222
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 222
atcaggccaa acagaacttt gactccca 28
<210> 223
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 223
atcagggcat acagaacttt gactccca 28
<210> 224
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 224
atcagggcaa actgaacttt gactccca 28
<210> 225
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 225
atcagggcaa acagatcttt gactccca 28
<210> 226
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 226
atcagggcaa acagaactat gactccca 28
<210> 227
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 227
atcagggcaa acagaacttt gtctccca 28
<210> 228
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 228
atcagggcaa acagaacttt gactgcca 28
<210> 229
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 229
atcagggcaa acagaacttt gactccct 28
<210> 230
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 230
atgataatgc aatagcagga caggatga 28
<210> 231
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 231
ttgataatgc aatagcagga caggatga 28
<210> 232
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 232
atgttaatgc aatagcagga caggatga 28
<210> 233
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 233
atgatattgc aatagcagga caggatga 28
<210> 234
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 234
atgataatgg aatagcagga caggatga 28
<210> 235
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 235
atgataatgc aaaagcagga caggatga 28
<210> 236
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 236
atgataatgc aataggagga caggatga 28
<210> 237
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 237
atgataatgc aatagcagca caggatga 28
<210> 238
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 238
atgataatgc aatagcagga ctggatga 28
<210> 239
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 239
atgataatgc aatagcagga caggttga 28
<210> 240
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 240
atgataatgc aatagcagga caggatgt 28
<210> 241
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 241
gtgcagccag ctttccgggc attggctt 28
<210> 242
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 242
ctgcagccag ctttccgggc attggctt 28
<210> 243
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 243
gtggagccag ctttccgggc attggctt 28
<210> 244
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 244
gtgcaggcag ctttccgggc attggctt 28
<210> 245
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 245
gtgcagccac ctttccgggc attggctt 28
<210> 246
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 246
gtgcagccag ctatccgggc attggctt 28
<210> 247
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 247
gtgcagccag ctttcggggc attggctt 28
<210> 248
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 248
gtgcagccag ctttccggcc attggctt 28
<210> 249
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 249
gtgcagccag ctttccgggc aatggctt 28
<210> 250
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 250
gtgcagccag ctttccgggc attgcctt 28
<210> 251
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 251
gtgcagccag ctttccgggc attggcta 28
<210> 252
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 252
tataatggtg aatatcttca aatgattt 28
<210> 253
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 253
aataatggtg aatatcttca aatgattt 28
<210> 254
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 254
tattatggtg aatatcttca aatgattt 28
<210> 255
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 255
tataatcgtg aatatcttca aatgattt 28
<210> 256
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 256
tataatggtc aatatcttca aatgattt 28
<210> 257
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 257
tataatggtg aaaatcttca aatgattt 28
<210> 258
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 258
tataatggtg aatatgttca aatgattt 28
<210> 259
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 259
tataatggtg aatatcttga aatgattt 28
<210> 260
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 260
tataatggtg aatatcttca attgattt 28
<210> 261
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 261
tataatggtg aatatcttca aatgtttt 28
<210> 262
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 262
tataatggtg aatatcttca aatgatta 28
<210> 263
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 263
gtagatgctc tttcctcctg tgccatct 28
<210> 264
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 264
ctagatgctc tttcctcctg tgccatct 28
<210> 265
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 265
gtacatgctc tttcctcctg tgccatct 28
<210> 266
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 266
gtagatcctc tttcctcctg tgccatct 28
<210> 267
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 267
gtagatgctg tttcctcctg tgccatct 28
<210> 268
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 268
gtagatgctc ttacctcctg tgccatct 28
<210> 269
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 269
gtagatgctc tttccacctg tgccatct 28
<210> 270
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 270
gtagatgctc tttcctccag tgccatct 28
<210> 271
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 271
gtagatgctc tttcctcctg tcccatct 28
<210> 272
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 272
gtagatgctc tttcctcctg tgccttct 28
<210> 273
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 273
gtagatgctc tttcctcctg tgccatca 28
<210> 274
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 274
gtgcagccag ctttccgggc attggctt 28
<210> 275
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 275
cagcagccag ctttccgggc attggctt 28
<210> 276
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 276
gtggtgccag ctttccgggc attggctt 28
<210> 277
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 277
gtgcagggag ctttccgggc attggctt 28
<210> 278
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 278
gtgcagccac gtttccgggc attggctt 28
<210> 279
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 279
gtgcagccag ctaaccgggc attggctt 28
<210> 280
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 280
gtgcagccag ctttcgcggc attggctt 28
<210> 281
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 281
gtgcagccag ctttccggcg attggctt 28
<210> 282
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 282
gtgcagccag ctttccgggc aaaggctt 28
<210> 283
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 283
gtgcagccag ctttccgggc attgcgtt 28
<210> 284
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 284
ctgctgccag ctttccgggc attggctt 28
<210> 285
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 285
ctgcagcctg ctttccgggc attggctt 28
<210> 286
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 286
ctgcagccag ctatccgggc attggctt 28
<210> 287
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 287
ctgcagccag ctttcccggc attggctt 28
<210> 288
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 288
gtggagcgag ctttccgggc attggctt 28
<210> 289
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 289
gtggagccag cattccgggc attggctt 28
<210> 290
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 290
gtggagccag ctttcggggc attggctt 28
<210> 291
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 291
gtggagccag ctttccgggg attggctt 28
<210> 292
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 292
gtgcaggcag gtttccgggc attggctt 28
<210> 293
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 293
gtgcaggcag ctttgcgggc attggctt 28
<210> 294
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 294
gtgcaggcag ctttccggcc attggctt 28
<210> 295
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 295
gtgcaggcag ctttccgggc ataggctt 28
<210> 296
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 296
gtgcagccac cttaccgggc attggctt 28
<210> 297
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 297
gtgcagccac ctttccgcgc attggctt 28
<210> 298
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 298
gtgcagccac ctttccgggc aatggctt 28
<210> 299
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 299
gtgcagccac ctttccgggc attgggtt 28
<210> 300
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 300
gtgcagccag ctatcccggc attggctt 28
<210> 301
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 301
gtgcagccag ctatccgggc tttggctt 28
<210> 302
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 302
gtgcagccag ctatccgggc attgcctt 28
<210> 303
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 303
gtgcagccag ctttcggggg attggctt 28
<210> 304
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 304
gtgcagccag ctttcggggc attcgctt 28
<210> 305
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 305
gtgcagccag ctttcggggc attggcta 28
<210> 306
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 306
gtgcagccag ctttccggcc ataggctt 28
<210> 307
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 307
gtgcagccag ctttccggcc attggcat 28
<210> 308
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 308
atcagggcaa acagaacttt gactccca 28
<210> 309
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 309
gctgtaataa ttaggtaaca tttatttc 28
<210> 310
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 310
gtcagtgttg gtaggagttt gttacaaa 28
<210> 311
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 311
gtgcagccag ctttccgggc attggctt 28
<210> 312
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 312
ctggcggcgg gtgtggacgg gcggcgga 28
<210> 313
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 313
gagccacacg cagctcattg tagaaggt 28
<210> 314
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 314
aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48
<210> 315
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 315
aagccaaugc ccggaaagcu gcucgagcag cuuuccgggc auuggcuu 48
<210> 316
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 316
uagauugcug uucuaccaag ucucgagacu ugguagaaca gcaaucua 48
<210> 317
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 317
acagcaaauu ccaucgugua acucgaguua cacgauggaa uuugcugu 48
<210> 318
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 318
auccuguccu gcuauugcau ucucgagaau gcaauagcag gacaggau 48
<210> 319
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 319
ccuucuauac auuaguucga gcucgagcuc gaacuaaugu auagaagg 48
<210> 320
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 320
aagccaaugc ccggaaagcu gcucgagcag cuuuccgggc auuggcuu 48
<210> 321
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 321
agauuccugg guucaaggac ucucgagagu ccuugaaccc aggaaucu 48
<210> 322
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 322
aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48
<210> 323
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 323
aaguggcugg agacaucauu gcucgagcaa ugaugucucc agccacuu 48
<210> 324
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 324
aagccguguc cgucccguac acucgagugu acgggacgga cacggcuu 48
<210> 325
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 325
aagaccuuaa uucuugccgu ucucgagaac ggcaagaauu aaggucuu 48
<210> 326
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 326
aaucauuuga agauauucac ccucgagggu gaauaucuuc aaaugauu 48
<210> 327
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 327
aggguguuga ugaugccuuc ucucgagaga aggcaucauc aacacccu 48
<210> 328
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 328
aaucuguaaa uuuuuaaccu acucgaguag guuaaaaauu uacagauu 48
<210> 329
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 329
agauggcaca ggaggaaaga gcucgagcuc uuuccuccug ugccaucu 48
<210> 330
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 330
agcgcuuccc cgaugagaac ucucgagagu ucucaucggg gaagcgcu 48
<210> 331
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 331
aacauaacag acuuggccaa gcucgagcuu ggccaagucu guuauguu 48
<210> 332
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 332
aagcugagua cauuuugcug gcucgagcca gcaaaaugua cucagcuu 48
<210> 333
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 333
aaguuaauug cuugucaagc ucucgagagc uugacaagca auuaacuu 48
<210> 334
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 334
aaaguucugu uugcccugau ccucgaggau cagggcaaac agaacuuu 48
<210> 335
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 335
uguuaccuaa uuauuacagc ccucgagggc uguaauaauu agguaaca 48
<210> 336
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 336
aacuccuacc aacacugacc acucgagugg ucaguguugg uaggaguu 48
<210> 337
<211> 48
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 337
aacuucgcga ccacggaucu ccucgaggag auccgugguc gcgaaguu 48
<210> 338
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 338
gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60
agaacagcaa ucuacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120
uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176
<210> 339
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 339
ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60
agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuccagac 120
uuuacgaaac acggaaaccg aagaccauuc auguuguugc ugccggaagc auaaag 176
<210> 340
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 340
gggccccucc guucgcguuu acgcggacgg ugagacugaa gauaauaugg auuacuuggu 60
agaacagcaa ucuaaacuca uucucuuuaa aauaucguuc gaacuggacu cccggucguu 120
uuaacucgac uggggccaaa acgaaacagu ggcacuaccc cgccggaagc auaaag 176
<210> 341
<211> 174
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 341
ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60
agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuguuuua 120
aaucaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174
<210> 342
<211> 174
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 342
ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60
agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuugcccca 120
aaccaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174
<210> 343
<211> 174
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 343
ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60
agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuuggggga 120
aagcaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174
<210> 344
<211> 174
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 344
ggguaggugu uccacagggu agccagcagc auccugcgau gcaaauaugg auuacuuggu 60
agaacagcaa ucuaauccgg aacauaaugg ugcagggcgc ugacuuccgc guuugaaaaa 120
aaacaaacac ggaaaccgaa gaccauucau guuguugcug ccggaagcau aaag 174
<210> 345
<211> 178
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 345
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu uucuuuucuu cgauguggau 60
ugguuuacca ggauuuagac uaccccaaaa acgaagggga cuaaaacgua aaauagauac 120
aauaacuucu ucuacaugau uuagacuacc ccaaaaacga aggggacuaa aacgcgcg 178
<210> 346
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 346
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aatccat 67
<210> 347
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 347
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aatccata 68
<210> 348
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 348
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aatcca 66
<210> 349
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 349
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aatcc 65
<210> 350
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 350
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aatc 64
<210> 351
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 351
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aat 63
<210> 352
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 352
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
aa 62
<210> 353
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 353
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
a 61
<210> 354
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 354
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaagt 60
<210> 355
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 355
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaag 59
<210> 356
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 356
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctaccaa 58
<210> 357
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 357
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctacca 57
<210> 358
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 358
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctacc 56
<210> 359
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 359
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tctac 55
<210> 360
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 360
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tcta 54
<210> 361
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 361
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tct 53
<210> 362
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 362
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt tc 52
<210> 363
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 363
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt t 51
<210> 364
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 364
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctgt 50
<210> 365
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 365
ggggatttag actaccccaa aaacgaaggg gactaaaact agattgctg 49
<210> 366
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 366
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aauccau 67
<210> 367
<211> 66
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 367
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aaucca 66
<210> 368
<211> 65
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 368
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aaucc 65
<210> 369
<211> 64
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 369
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aauc 64
<210> 370
<211> 63
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 370
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aau 63
<210> 371
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 371
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
aa 62
<210> 372
<211> 61
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 372
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
a 61
<210> 373
<211> 60
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 373
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaagu 60
<210> 374
<211> 59
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 374
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaag 59
<210> 375
<211> 58
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 375
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaa 58
<210> 376
<211> 57
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 376
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacca 57
<210> 377
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 377
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacc 56
<210> 378
<211> 55
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 378
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuac 55
<210> 379
<211> 54
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 379
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucua 54
<210> 380
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 380
ggggauuuag acuaccccaa aaacgaaggg gacuaaaaca agauugcugu ucuaccaagu 60
aauccau 67
<210> 381
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 381
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu acauugcugu ucuaccaagu 60
aauccau 67
<210> 382
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 382
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agaaugcugu ucuaccaagu 60
aauccau 67
<210> 383
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 383
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauuccugu ucuaccaagu 60
aauccau 67
<210> 384
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 384
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcagu ucuaccaagu 60
aauccau 67
<210> 385
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 385
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcuga ucuaccaagu 60
aauccau 67
<210> 386
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 386
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu uguaccaagu 60
aauccau 67
<210> 387
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 387
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuuccaagu 60
aauccau 67
<210> 388
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 388
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuacgaagu 60
aauccau 67
<210> 389
<211> 67
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 389
ggggauuuag acuaccccaa aaacgaaggg gacuaaaacu agauugcugu ucuaccaugu 60
aauccau 67
<210> 390
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 390
gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60
agaacagcaa ucuacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120
uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176
<210> 391
<211> 176
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 391
gggggccagu gaauucgagc ucgguacccg gggauccucu agaaauaugg auuacuuggu 60
agaacagcaa uguacucgac cugcaggcau gcaagcuugg cguaaucaug gucauagcug 120
uuuccugugu uuauccgcuc acaauuccac acaacauacg agccggaagc auaaag 176
<210> 392
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
probe"
<400> 392
ccgagaacaa cga 13
<210> 393
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 393
aagttctgtt tgccctgatc t 21
<210> 394
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<400> 394
ggccacgatg ttgaagtct 19
<210> 395
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 395
ccaccccaat atcgaagggg actaaaac 28
<210> 396
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 396
gatttagact accccaaaaa cgaaggggac taaaac 36
<210> 397
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 397
gtaagagact acctctatat gaaagaggac taaaac 36
<210> 398
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 398
gtattgagaa aagccagata tagttggcaa tagac 35
<210> 399
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 399
gttgatgaga agagcccaag atagagggca ataac 35
<210> 400
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 400
gtctattgcc ctctatatcg ggctgttctc caaac 35
<210> 401
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 401
attaaagact acctctaaat gtaagaggac tataac 36
<210> 402
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 402
aatataaact acctctaaat gtaagaggac tataac 36
<210> 403
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 403
cttgtggatt atcccaaaat tgaagggaac tacaac 36
<210> 404
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 404
gatttagagt acctcaaaat agaagaggtc taaaac 36
<210> 405
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 405
gatttagagt acctcaaaac aaaagaggac taaaac 36
<210> 406
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 406
gatatagata accccaaaaa cgaagggatc taaaac 36
<210> 407
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 407
gcctcacatc accgccaaga cgacggcgga ctgaac 36
<210> 408
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 408
gcctcacatc accgccaaga cgacggcgga ctgaac 36
<210> 409
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 409
gcctcacatc accgccaaga cgacggcgga ctgaac 36
<210> 410
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 410
augggaguca aaguucuguu ugcccugauc ugcauc 36
<210> 411
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 411
auggaagcca augcccggaa agcuggcugc accagg 36
<210> 412
<211> 1152
<212> PRT
<213> Leptotrichia wadei
<400> 412
Met Lys Val Thr Lys Val Asp Gly Ile Ser His Lys Lys Tyr Ile Glu
1 5 10 15
Glu Gly Lys Leu Val Lys Ser Thr Ser Glu Glu Asn Arg Thr Ser Glu
20 25 30
Arg Leu Ser Glu Leu Leu Ser Ile Arg Leu Asp Ile Tyr Ile Lys Asn
35 40 45
Pro Asp Asn Ala Ser Glu Glu Glu Asn Arg Ile Arg Arg Glu Asn Leu
50 55 60
Lys Lys Phe Phe Ser Asn Lys Val Leu His Leu Lys Asp Ser Val Leu
65 70 75 80
Tyr Leu Lys Asn Arg Lys Glu Lys Asn Ala Val Gln Asp Lys Asn Tyr
85 90 95
Ser Glu Glu Asp Ile Ser Glu Tyr Asp Leu Lys Asn Lys Asn Ser Phe
100 105 110
Ser Val Leu Lys Lys Ile Leu Leu Asn Glu Asp Val Asn Ser Glu Glu
115 120 125
Leu Glu Ile Phe Arg Lys Asp Val Glu Ala Lys Leu Asn Lys Ile Asn
130 135 140
Ser Leu Lys Tyr Ser Phe Glu Glu Asn Lys Ala Asn Tyr Gln Lys Ile
145 150 155 160
Asn Glu Asn Asn Val Glu Lys Val Gly Gly Lys Ser Lys Arg Asn Ile
165 170 175
Ile Tyr Asp Tyr Tyr Arg Glu Ser Ala Lys Arg Asn Asp Tyr Ile Asn
180 185 190
Asn Val Gln Glu Ala Phe Asp Lys Leu Tyr Lys Lys Glu Asp Ile Glu
195 200 205
Lys Leu Phe Phe Leu Ile Glu Asn Ser Lys Lys His Glu Lys Tyr Lys
210 215 220
Ile Arg Glu Tyr Tyr His Lys Ile Ile Gly Arg Lys Asn Asp Lys Glu
225 230 235 240
Asn Phe Ala Lys Ile Ile Tyr Glu Glu Ile Gln Asn Val Asn Asn Ile
245 250 255
Lys Glu Leu Ile Glu Lys Ile Pro Asp Met Ser Glu Leu Lys Lys Ser
260 265 270
Gln Val Phe Tyr Lys Tyr Tyr Leu Asp Lys Glu Glu Leu Asn Asp Lys
275 280 285
Asn Ile Lys Tyr Ala Phe Cys His Phe Val Glu Ile Glu Met Ser Gln
290 295 300
Leu Leu Lys Asn Tyr Val Tyr Lys Arg Leu Ser Asn Ile Ser Asn Asp
305 310 315 320
Lys Ile Lys Arg Ile Phe Glu Tyr Gln Asn Leu Lys Lys Leu Ile Glu
325 330 335
Asn Lys Leu Leu Asn Lys Leu Asp Thr Tyr Val Arg Asn Cys Gly Lys
340 345 350
Tyr Asn Tyr Tyr Leu Gln Val Gly Glu Ile Ala Thr Ser Asp Phe Ile
355 360 365
Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile Gly Val
370 375 380
Ser Ser Val Ala Tyr Phe Ser Leu Arg Asn Ile Leu Glu Thr Glu Asn
385 390 395 400
Glu Asn Gly Ile Thr Gly Arg Met Arg Gly Lys Thr Val Lys Asn Asn
405 410 415
Lys Gly Glu Glu Lys Tyr Val Ser Gly Glu Val Asp Lys Ile Tyr Asn
420 425 430
Glu Asn Lys Gln Asn Glu Val Lys Glu Asn Leu Lys Met Phe Tyr Ser
435 440 445
Tyr Asp Phe Asn Met Asp Asn Lys Asn Glu Ile Glu Asp Phe Phe Ala
450 455 460
Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
465 470 475 480
Asn Leu Glu Leu Glu Gly Lys Asp Ile Phe Ala Phe Lys Asn Ile Ala
485 490 495
Pro Ser Glu Ile Ser Lys Lys Met Phe Gln Asn Glu Ile Asn Glu Lys
500 505 510
Lys Leu Lys Leu Lys Ile Phe Lys Gln Leu Asn Ser Ala Asn Val Phe
515 520 525
Asn Tyr Tyr Glu Lys Asp Val Ile Ile Lys Tyr Leu Lys Asn Thr Lys
530 535 540
Phe Asn Phe Val Asn Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys
545 550 555 560
Leu Tyr Asn Lys Ile Glu Asp Leu Arg Asn Thr Leu Lys Phe Phe Trp
565 570 575
Ser Val Pro Lys Asp Lys Glu Glu Lys Asp Ala Gln Ile Tyr Leu Leu
580 585 590
Lys Asn Ile Tyr Tyr Gly Glu Phe Leu Asn Lys Phe Val Lys Asn Ser
595 600 605
Lys Val Phe Phe Lys Ile Thr Asn Glu Val Ile Lys Ile Asn Lys Gln
610 615 620
Arg Asn Gln Lys Thr Gly His Tyr Lys Tyr Gln Lys Phe Glu Asn Ile
625 630 635 640
Glu Lys Thr Val Pro Val Glu Tyr Leu Ala Ile Ile Gln Ser Arg Glu
645 650 655
Met Ile Asn Asn Gln Asp Lys Glu Glu Lys Asn Thr Tyr Ile Asp Phe
660 665 670
Ile Gln Gln Ile Phe Leu Lys Gly Phe Ile Asp Tyr Leu Asn Lys Asn
675 680 685
Asn Leu Lys Tyr Ile Glu Ser Asn Asn Asn Asn Asp Asn Asn Asp Ile
690 695 700
Phe Ser Lys Ile Lys Ile Lys Lys Asp Asn Lys Glu Lys Tyr Asp Lys
705 710 715 720
Ile Leu Lys Asn Tyr Glu Lys His Asn Arg Asn Lys Glu Ile Pro His
725 730 735
Glu Ile Asn Glu Phe Val Arg Glu Ile Lys Leu Gly Lys Ile Leu Lys
740 745 750
Tyr Thr Glu Asn Leu Asn Met Phe Tyr Leu Ile Leu Lys Leu Leu Asn
755 760 765
His Lys Glu Leu Thr Asn Leu Lys Gly Ser Leu Glu Lys Tyr Gln Ser
770 775 780
Ala Asn Lys Glu Glu Thr Phe Ser Asp Glu Leu Glu Leu Ile Asn Leu
785 790 795 800
Leu Asn Leu Asp Asn Asn Arg Val Thr Glu Asp Phe Glu Leu Glu Ala
805 810 815
Asn Glu Ile Gly Lys Phe Leu Asp Phe Asn Glu Asn Lys Ile Lys Asp
820 825 830
Arg Lys Glu Leu Lys Lys Phe Asp Thr Asn Lys Ile Tyr Phe Asp Gly
835 840 845
Glu Asn Ile Ile Lys His Arg Ala Phe Tyr Asn Ile Lys Lys Tyr Gly
850 855 860
Met Leu Asn Leu Leu Glu Lys Ile Ala Asp Lys Ala Lys Tyr Lys Ile
865 870 875 880
Ser Leu Lys Glu Leu Lys Glu Tyr Ser Asn Lys Lys Asn Glu Ile Glu
885 890 895
Lys Asn Tyr Thr Met Gln Gln Asn Leu His Arg Lys Tyr Ala Arg Pro
900 905 910
Lys Lys Asp Glu Lys Phe Asn Asp Glu Asp Tyr Lys Glu Tyr Glu Lys
915 920 925
Ala Ile Gly Asn Ile Gln Lys Tyr Thr His Leu Lys Asn Lys Val Glu
930 935 940
Phe Asn Glu Leu Asn Leu Leu Gln Gly Leu Leu Leu Lys Ile Leu His
945 950 955 960
Arg Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg
965 970 975
Leu Lys Gly Glu Phe Pro Glu Asn His Tyr Ile Glu Glu Ile Phe Asn
980 985 990
Phe Asp Asn Ser Lys Asn Val Lys Tyr Lys Ser Gly Gln Ile Val Glu
995 1000 1005
Lys Tyr Ile Asn Phe Tyr Lys Glu Leu Tyr Lys Asp Asn Val Glu
1010 1015 1020
Lys Arg Ser Ile Tyr Ser Asp Lys Lys Val Lys Lys Leu Lys Gln
1025 1030 1035
Glu Lys Lys Asp Leu Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn
1040 1045 1050
Tyr Ile Pro His Ala Glu Ile Ser Leu Leu Glu Val Leu Glu Asn
1055 1060 1065
Leu Arg Lys Leu Leu Ser Tyr Asp Arg Lys Leu Lys Asn Ala Ile
1070 1075 1080
Met Lys Ser Ile Val Asp Ile Leu Lys Glu Tyr Gly Phe Val Ala
1085 1090 1095
Thr Phe Lys Ile Gly Ala Asp Lys Lys Ile Glu Ile Gln Thr Leu
1100 1105 1110
Glu Ser Glu Lys Ile Val His Leu Lys Asn Leu Lys Lys Lys Lys
1115 1120 1125
Leu Met Thr Asp Arg Asn Ser Glu Glu Leu Cys Glu Leu Val Lys
1130 1135 1140
Val Met Phe Glu Tyr Lys Ala Leu Glu
1145 1150
<210> 413
<211> 40
<212> DNA
<213> Leptotrichia wadei
<400> 413
tctgtttgcc ctgatctgca tcgctgtggc cgaggccaag 40
<210> 414
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 414
actagacgta gcgacaccgg ctccggtt 28
<210> 415
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 415
gggactagac gtagcgacac cggctccg 28
<210> 416
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 416
aacgggacta gacgtagcga caccggct 28
<210> 417
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 417
caaacgggac tagacgtagc gacaccgg 28
<210> 418
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 418
agacaaacgg gactagacgt agcgacac 28
<210> 419
<211> 70
<212> RNA
<213> Leptotrichia wadei
<400> 419
uacccgggga uccucuagaa auauggauua cuugguagaa cagcaaucua cucgaccugc 60
aggcaugcaa 70
<210> 420
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 420
ccaccccaau aucgaagggg acuaaaacua gauugcuguu cuaccaagua auccau 56
<210> 421
<211> 65
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 421
gauuuagacu accccaaaaa cgaaggggac uaaaacuaga uugcuguucu accaaguaau 60
ccaua 65
<210> 422
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 422
uagauugcug uucuaccaag uaau 24
<210> 423
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 423
uagauugcug uucuaccaag uaa 23
<210> 424
<211> 10
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 424
uagauugcug 10
<210> 425
<211> 1197
<212> PRT
<213> Leptotrichia wadei
<400> 425
Met Lys Val Thr Lys Ile Asp Gly Leu Ser His Lys Lys Phe Glu Asp
1 5 10 15
Glu Gly Lys Leu Val Lys Phe Arg Asn Asn Lys Asn Ile Asn Glu Ile
20 25 30
Lys Glu Arg Leu Lys Lys Leu Lys Glu Leu Lys Leu Asp Asn Tyr Ile
35 40 45
Lys Asn Pro Glu Asn Val Lys Asn Lys Asp Lys Asp Ala Glu Lys Glu
50 55 60
Thr Lys Ile Arg Arg Thr Asn Leu Lys Lys Tyr Phe Ser Glu Ile Ile
65 70 75 80
Leu Arg Lys Glu Asp Glu Lys Tyr Ile Leu Lys Lys Thr Lys Lys Phe
85 90 95
Lys Asp Ile Asn Gln Glu Ile Asp Tyr Tyr Asp Val Lys Ser Lys Lys
100 105 110
Asn Gln Gln Glu Ile Phe Asp Val Leu Lys Glu Ile Leu Glu Leu Lys
115 120 125
Ile Lys Glu Thr Glu Lys Glu Glu Ile Ile Thr Phe Asp Ser Glu Lys
130 135 140
Leu Lys Lys Val Phe Gly Glu Asp Phe Val Lys Lys Glu Ala Lys Ile
145 150 155 160
Lys Ala Ile Glu Lys Ser Leu Lys Ile Asn Lys Ala Asn Tyr Lys Lys
165 170 175
Asp Ser Ile Lys Ile Gly Asp Asp Lys Tyr Ser Asn Val Lys Gly Glu
180 185 190
Asn Lys Arg Ser Arg Ile Tyr Glu Tyr Tyr Lys Lys Ser Glu Asn Leu
195 200 205
Lys Lys Phe Glu Glu Asn Ile Arg Glu Ala Phe Glu Lys Leu Tyr Thr
210 215 220
Glu Glu Asn Ile Lys Glu Leu Tyr Ser Lys Ile Glu Glu Ile Leu Lys
225 230 235 240
Lys Thr His Leu Lys Ser Ile Val Arg Glu Phe Tyr Gln Asn Glu Ile
245 250 255
Ile Gly Glu Ser Glu Phe Ser Lys Lys Asn Gly Asp Gly Ile Ser Ile
260 265 270
Leu Tyr Asn Gln Ile Lys Asp Ser Ile Lys Lys Glu Glu Asn Phe Ile
275 280 285
Glu Phe Ile Glu Asn Thr Gly Asn Leu Glu Leu Lys Glu Leu Thr Lys
290 295 300
Ser Gln Ile Phe Tyr Lys Tyr Phe Leu Glu Asn Glu Glu Leu Asn Asp
305 310 315 320
Glu Asn Ile Lys Phe Ala Phe Cys Tyr Phe Val Glu Ile Glu Val Asn
325 330 335
Asn Leu Leu Lys Glu Asn Val Tyr Lys Ile Lys Arg Phe Asn Glu Ser
340 345 350
Asn Lys Lys Arg Ile Glu Asn Ile Phe Glu Tyr Gly Lys Leu Lys Lys
355 360 365
Leu Ile Val Tyr Lys Leu Glu Asn Lys Leu Asn Asn Tyr Val Arg Asn
370 375 380
Cys Gly Lys Tyr Asn Tyr His Met Glu Asn Gly Asp Ile Ala Thr Ser
385 390 395 400
Asp Ile Asn Met Arg Asn Arg Gln Thr Glu Ala Phe Leu Arg Ser Ile
405 410 415
Ile Gly Val Ser Ser Phe Gly Tyr Phe Ser Leu Arg Asn Ile Leu Gly
420 425 430
Val Asn Asp Asp Asp Phe Tyr Glu Thr Glu Glu Asp Leu Thr Lys Lys
435 440 445
Glu Arg Arg Asn Leu Glu Lys Ala Lys Glu Asp Ile Thr Ile Lys Asn
450 455 460
Thr Phe Asp Glu Val Val Val Lys Ser Phe Gln Lys Lys Gly Ile Tyr
465 470 475 480
Asn Ile Lys Glu Asn Leu Lys Met Phe Tyr Gly Asp Ser Phe Asp Asn
485 490 495
Ala Asp Lys Asp Glu Leu Lys Gln Phe Phe Val Asn Met Leu Asn Ala
500 505 510
Ile Thr Ser Ile Arg His Arg Val Val His Tyr Asn Met Asn Thr Asn
515 520 525
Ser Glu Asn Ile Phe Asn Phe Ser Gly Ile Glu Val Ser Lys Leu Leu
530 535 540
Lys Ser Ile Phe Glu Lys Glu Thr Asp Lys Arg Glu Leu Lys Leu Lys
545 550 555 560
Ile Phe Arg Gln Leu Asn Ser Ala Gly Val Phe Asp Tyr Trp Glu Asn
565 570 575
Arg Lys Ile Asp Lys Tyr Leu Glu Asn Ile Glu Phe Lys Phe Val Asn
580 585 590
Lys Asn Ile Pro Phe Val Pro Ser Phe Thr Lys Leu Tyr Asn Arg Ile
595 600 605
Asp Asn Leu Lys Gly Asn Asn Ala Leu Asn Leu Gly Tyr Ile Asn Ile
610 615 620
Pro Lys Arg Lys Glu Ala Arg Asp Ser Gln Ile Tyr Leu Leu Lys Asn
625 630 635 640
Ile Tyr Tyr Gly Glu Phe Val Glu Lys Phe Val Asn Asn Asn Asp Asn
645 650 655
Phe Glu Lys Ile Phe Arg Glu Ile Ile Glu Ile Asn Lys Lys Asp Gly
660 665 670
Thr Asn Thr Lys Thr Lys Phe Tyr Lys Leu Glu Lys Phe Glu Thr Leu
675 680 685
Lys Ala Asn Ala Pro Ile Glu Tyr Leu Glu Lys Leu Gln Ser Leu His
690 695 700
Gln Ile Asn Tyr Asn Arg Glu Lys Val Glu Glu Asp Lys Asp Ile Tyr
705 710 715 720
Val Asp Phe Val Gln Lys Ile Phe Leu Lys Gly Phe Ile Asn Tyr Leu
725 730 735
Gln Gly Ser Asp Leu Leu Lys Ser Leu Asn Leu Leu Asn Leu Lys Lys
740 745 750
Asp Glu Ala Ile Ala Asn Lys Lys Ser Phe Tyr Asp Glu Lys Leu Lys
755 760 765
Leu Trp Gln Asn Asn Gly Ser Asn Leu Ser Lys Met Pro Glu Glu Ile
770 775 780
Tyr Asp Tyr Ile Lys Lys Ile Lys Ile Asn Lys Ile Asn Tyr Ser Asp
785 790 795 800
Arg Met Ser Ile Phe Tyr Leu Leu Leu Lys Leu Ile Asp His Lys Glu
805 810 815
Leu Thr Asn Leu Arg Gly Asn Leu Glu Lys Tyr Val Ser Met Asn Lys
820 825 830
Asn Lys Ile Tyr Ser Glu Glu Leu Asn Ile Val Asn Leu Val Ser Leu
835 840 845
Asp Asn Asn Lys Val Arg Ala Asn Phe Asn Leu Lys Pro Glu Asp Ile
850 855 860
Gly Lys Phe Leu Lys Thr Glu Thr Ser Ile Arg Asn Ile Asn Gln Leu
865 870 875 880
Asn Asn Phe Ser Glu Ile Phe Ala Asp Gly Glu Asn Val Ile Lys His
885 890 895
Arg Ser Phe Tyr Asn Ile Lys Lys Tyr Gly Ile Leu Asp Leu Leu Glu
900 905 910
Lys Ile Val Asp Lys Ala Asp Leu Lys Ile Thr Lys Glu Glu Ile Lys
915 920 925
Lys Tyr Glu Asn Leu Gln Asn Glu Leu Lys Arg Asn Asp Phe Tyr Lys
930 935 940
Ile Gln Glu Arg Ile His Arg Asn Tyr Asn Gln Lys Pro Phe Leu Ile
945 950 955 960
Lys Asn Asn Glu Lys Asp Phe Asn Asp Tyr Lys Lys Ala Ile Glu Asn
965 970 975
Ile Gln Asn Tyr Thr Gln Leu Lys Asn Lys Ile Glu Phe Asn Asp Leu
980 985 990
Asn Leu Leu Gln Ser Leu Leu Phe Arg Ile Leu His Arg Leu Ala Gly
995 1000 1005
Tyr Thr Ser Leu Trp Glu Arg Asp Leu Gln Phe Lys Leu Lys Gly
1010 1015 1020
Glu Tyr Pro Glu Asn Lys Tyr Ile Asp Glu Ile Phe Asn Phe Asp
1025 1030 1035
Asn Ser Lys Asn Lys Ile Tyr Asn Glu Lys Asn Glu Arg Gly Gly
1040 1045 1050
Ser Val Val Ser Lys Tyr Gly Tyr Phe Leu Val Glu Lys Asp Gly
1055 1060 1065
Glu Ile Gln Arg Lys Asn Ala Arg Asp Lys Lys Lys Asn Lys Ile
1070 1075 1080
Ile Lys Lys Glu Gly Leu Glu Ile Arg Asn Tyr Ile Ala His Phe
1085 1090 1095
Asn Tyr Ile Pro Asp Ala Thr Lys Ser Ile Leu Glu Ile Leu Glu
1100 1105 1110
Glu Leu Arg Asn Leu Leu Lys Tyr Asp Arg Lys Leu Lys Asn Ala
1115 1120 1125
Val Met Lys Ser Ile Lys Asp Ile Phe Lys Glu Tyr Gly Leu Ile
1130 1135 1140
Ile Glu Phe Lys Ile Ser His Val Asn Asn Ser Glu Lys Ile Glu
1145 1150 1155
Val Leu Asn Val Asp Ser Glu Lys Ile Lys His Leu Lys Asn Asn
1160 1165 1170
Gly Leu Val Thr Thr Arg Asn Ser Glu Asp Leu Cys Glu Leu Ile
1175 1180 1185
Lys Met Met Leu Glu Tyr Lys Lys Ser
1190 1195
<210> 426
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 426
gtgcagccag ctttccgggc attggctt 28
<210> 427
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 427
ctgctgccag ctttccgggc attggctt 28
<210> 428
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 428
ctgcagcctg ctttccgggc attggctt 28
<210> 429
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 429
ctgcagccag ctatccgggc attggctt 28
<210> 430
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 430
ctgcagccag ctttcccggc attggctt 28
<210> 431
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 431
gtggagcgag ctttccgggc attggctt 28
<210> 432
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 432
gtggagccag cattccgggc attggctt 28
<210> 433
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 433
gtggagccag ctttcggggc attggctt 28
<210> 434
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 434
gtggagccag ctttccgggg attggctt 28
<210> 435
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 435
gtgcaggcag gtttccgggc attggctt 28
<210> 436
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 436
gtgcaggcag ctttgcgggc attggctt 28
<210> 437
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 437
gtgcaggcag ctttccggcc attggctt 28
<210> 438
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 438
gtgcaggcag ctttccgggc ataggctt 28
<210> 439
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 439
gtgcagccac cttaccgggc attggctt 28
<210> 440
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 440
gtgcagccac ctttccgcgc attggctt 28
<210> 441
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 441
gtgcagccac ctttccgggc aatggctt 28
<210> 442
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 442
gtgcagccac ctttccgggc attgggtt 28
<210> 443
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 443
gtgcagccag ctatcccggc attggctt 28
<210> 444
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 444
gtgcagccag ctatccgggc tttggctt 28
<210> 445
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 445
gtgcagccag ctatccgggc attgcctt 28
<210> 446
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 446
gtgcagccag ctttcggggg attggctt 28
<210> 447
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 447
gtgcagccag ctttcggggc attcgctt 28
<210> 448
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 448
gtgcagccag ctttcggggc attggcta 28
<210> 449
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 449
gtgcagccag ctttccggcc ataggctt 28
<210> 450
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 450
gtgcagccag ctttccggcc attggcat 28
<210> 451
<211> 16
<212> PRT
<213> Lactococcus lactis
<400> 451
Leu Gln Lys Phe Thr Gly Asp Ile Glu Asn Leu Val Lys Ala Ser Leu
1 5 10 15
<210> 452
<211> 15
<212> PRT
<213> Lactococcus lactis
<400> 452
Trp Ile Arg Ala Gly Trp Phe Ile Arg Asn Arg Ser Ala His Tyr
1 5 10 15
<210> 453
<211> 16
<212> PRT
<213> Lactococcus lactis
<400> 453
Leu Gln Lys Phe Thr Gly Asp Ile Glu Asn Leu Val Lys Ala Ser Leu
1 5 10 15
<210> 454
<211> 15
<212> PRT
<213> Lactococcus lactis
<400> 454
Trp Ile Arg Ala Gly Trp Phe Ile Arg Asn Arg Ser Ala His Tyr
1 5 10 15
<210> 455
<211> 16
<212> PRT
<213> Thermus aquaticus
<400> 455
Pro Leu Glu Glu Arg Gly Val Ala Glu Ala Trp Leu Asn Ala Lys Val
1 5 10 15
<210> 456
<211> 10
<212> PRT
<213> Thermus aquaticus
<400> 456
Ala Asp Leu Arg Asn Asp Val Ala His Ala
1 5 10
<210> 457
<211> 16
<212> PRT
<213> Thermus aquaticus
<400> 457
Pro Leu Glu Glu Arg Gly Val Ala Glu Ala Trp Leu Asn Ala Lys Val
1 5 10 15
<210> 458
<211> 10
<212> PRT
<213> Thermus aquaticus
<400> 458
Ala Asp Leu Arg Asn Asp Val Ala His Ala
1 5 10
<210> 459
<211> 16
<212> PRT
<213> Mycobacterium tuberculosis
<400> 459
Arg Ser Ala Thr Pro Ala Ile Thr Ile Val Leu Arg Ala Ala Val Ala
1 5 10 15
<210> 460
<211> 15
<212> PRT
<213> Mycobacterium tuberculosis
<400> 460
Leu Gly Arg Phe Glu Ser Arg Val Arg Asn Thr Ala Ala His Glu
1 5 10 15
<210> 461
<211> 16
<212> PRT
<213> Mycobacterium tuberculosis
<400> 461
Arg Ser Ala Thr Pro Ala Ile Thr Ile Val Leu Arg Ala Ala Val Ala
1 5 10 15
<210> 462
<211> 15
<212> PRT
<213> Mycobacterium tuberculosis
<400> 462
Leu Gly Arg Phe Glu Ser Arg Val Arg Asn Thr Ala Ala His Glu
1 5 10 15
<210> 463
<211> 16
<212> PRT
<213> Escherichia coli
<400> 463
Leu Tyr Pro Glu Leu Arg Thr Ile Glu Gly Val Leu Lys Ser Lys Met
1 5 10 15
<210> 464
<211> 14
<212> PRT
<213> Escherichia coli
<400> 464
Ala Tyr Thr Phe Phe Asn Val Glu Arg His Ser Leu Phe His
1 5 10
<210> 465
<211> 16
<212> PRT
<213> Escherichia coli
<400> 465
Leu Tyr Pro Glu Leu Arg Thr Ile Glu Gly Val Leu Lys Ser Lys Met
1 5 10 15
<210> 466
<211> 14
<212> PRT
<213> Escherichia coli
<400> 466
Ala Tyr Thr Phe Phe Asn Val Glu Arg His Ser Leu Phe His
1 5 10
<210> 467
<211> 16
<212> PRT
<213> Homo sapiens
<400> 467
Gly Asn Glu Leu Pro Leu Ala Val Ala Ser Thr Ala Asp Leu Ile Arg
1 5 10 15
<210> 468
<211> 15
<212> PRT
<213> Homo sapiens
<400> 468
Ile Pro Asp Trp Ile Val Asp Leu Arg His Glu Leu Thr His Lys
1 5 10 15
<210> 469
<211> 16
<212> PRT
<213> Homo sapiens
<400> 469
Gly Asn Glu Leu Pro Leu Ala Val Ala Ser Thr Ala Asp Leu Ile Arg
1 5 10 15
<210> 470
<211> 15
<212> PRT
<213> Homo sapiens
<400> 470
Ile Pro Asp Trp Ile Val Asp Leu Arg His Glu Leu Thr His Lys
1 5 10 15
<210> 471
<211> 16
<212> PRT
<213> Thermus thermophilus
<400> 471
Ile Gln Arg Phe Glu Tyr Thr Phe Glu Ala Phe Trp Lys Ala Leu Gln
1 5 10 15
<210> 472
<211> 15
<212> PRT
<213> Thermus thermophilus
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<400> 472
Leu Ala Leu Gly Xaa Val Asp Asp Arg Ser Leu Thr Val His Thr
1 5 10 15
<210> 473
<211> 16
<212> PRT
<213> Thermus thermophilus
<400> 473
Ile Gln Arg Phe Glu Tyr Thr Phe Glu Ala Phe Trp Lys Ala Leu Gln
1 5 10 15
<210> 474
<211> 15
<212> PRT
<213> Thermus thermophilus
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Any amino acid
<400> 474
Leu Ala Leu Gly Xaa Val Asp Asp Arg Ser Leu Thr Val His Thr
1 5 10 15
<210> 475
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 475
Asp Tyr Glu Ile Ile Lys Ala Glu Glu Ser Leu Gln Arg Asp Ile Ser
1 5 10 15
<210> 476
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 476
Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe His Phe
1 5 10 15
<210> 477
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 477
Leu Ile Lys Trp Cys Tyr Leu Arg Glu Arg Asp Leu Met Tyr Phe Gln
1 5 10 15
<210> 478
<211> 14
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 478
Phe Arg Asn Glu Ile Asp His Phe His Tyr Phe Tyr Asp Arg
1 5 10
<210> 479
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 479
Asp Tyr Glu Leu Ile Lys Ala Glu Glu Met Leu Gln Arg Glu Thr Ala
1 5 10 15
<210> 480
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 480
Leu Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe His Tyr
1 5 10 15
<210> 481
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 481
Leu Ile Asn Trp Ile Tyr Leu Arg Glu Arg Asp Leu Met Asn Phe Gln
1 5 10 15
<210> 482
<211> 14
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 482
Leu Arg Asn Tyr Ile Glu His Phe Arg Tyr Tyr Ser Ser Phe
1 5 10
<210> 483
<211> 16
<212> PRT
<213> Clostridium aminophilum
<400> 483
Asp Tyr Glu Gln Ile Arg Ala Asp Glu Thr Leu Gln Arg Gln Leu Ser
1 5 10 15
<210> 484
<211> 15
<212> PRT
<213> Clostridium aminophilum
<400> 484
Leu Arg Lys Ala Ile Tyr Ser Leu Arg Asn Glu Thr Phe His Phe
1 5 10 15
<210> 485
<211> 16
<212> PRT
<213> Clostridium aminophilum
<400> 485
Leu Ile Ser Trp Ser Phe Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln
1 5 10 15
<210> 486
<211> 14
<212> PRT
<213> Clostridium aminophilum
<400> 486
Val Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Thr Ser
1 5 10
<210> 487
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 487
Asp Tyr Glu Gln Ile Lys Ala Asp Glu Met Leu Gln Arg Glu Val Ala
1 5 10 15
<210> 488
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 488
Ile Ile Gln Ile Ile Tyr Ser Leu Arg Asn Lys Ser Phe His Phe
1 5 10 15
<210> 489
<211> 16
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 489
Leu Ile Ser Trp Ser Tyr Leu Arg Glu Arg Asp Leu Leu Tyr Phe Gln
1 5 10 15
<210> 490
<211> 14
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium sequence"
<400> 490
Leu Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Tyr Gly
1 5 10
<210> 491
<211> 16
<212> PRT
<213> Carnobacterium gallinarum
<400> 491
Lys Leu Gln Glu Ile Gly Ile Tyr Glu Gly Phe Gln Thr Lys Phe Met
1 5 10 15
<210> 492
<211> 15
<212> PRT
<213> Carnobacterium gallinarum
<400> 492
Leu Arg Gly Ser Val Gln Gln Ile Arg Asn Glu Ile Phe His Ser
1 5 10 15
<210> 493
<211> 16
<212> PRT
<213> Carnobacterium gallinarum
<400> 493
Met Val Gly Phe Ser Ala Leu Phe Glu Arg Asp Leu Val Tyr Phe Ser
1 5 10 15
<210> 494
<211> 14
<212> PRT
<213> Carnobacterium gallinarum
<400> 494
Ile Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu
1 5 10
<210> 495
<211> 16
<212> PRT
<213> Carnobacterium gallinarum
<400> 495
Thr Leu Gln Glu Ile Gly Met Tyr Glu Gly Thr Gln Thr Lys Phe Met
1 5 10 15
<210> 496
<211> 15
<212> PRT
<213> Carnobacterium gallinarum
<400> 496
Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe His Gln
1 5 10 15
<210> 497
<211> 16
<212> PRT
<213> Carnobacterium gallinarum
<400> 497
Met Val Gly Phe Ser Val Leu Phe Glu Arg Asp Phe Val Tyr Met Gly
1 5 10 15
<210> 498
<211> 14
<212> PRT
<213> Carnobacterium gallinarum
<400> 498
Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp
1 5 10
<210> 499
<211> 16
<212> PRT
<213> Paludibacter propionicigenes
<400> 499
Asp Leu Ile Arg Ile Lys Thr Asn Glu Ala Phe Val Leu Asn Leu Thr
1 5 10 15
<210> 500
<211> 15
<212> PRT
<213> Paludibacter propionicigenes
<400> 500
Ile Arg Gly Ala Val Gln Gln Ile Arg Asn Asn Val Asn His Tyr
1 5 10 15
<210> 501
<211> 16
<212> PRT
<213> Paludibacter propionicigenes
<400> 501
Met Ala Gly Phe Val Ala Leu Phe Asp Arg Asp Phe Gln Phe Phe Asp
1 5 10 15
<210> 502
<211> 14
<212> PRT
<213> Paludibacter propionicigenes
<400> 502
Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu Thr Lys Asp
1 5 10
<210> 503
<211> 16
<212> PRT
<213> Listeria seeligeri
<400> 503
Ser Leu Gln Lys Ile Lys Ile Glu Glu Ala Phe Ala Leu Lys Phe Ile
1 5 10 15
<210> 504
<211> 15
<212> PRT
<213> Listeria seeligeri
<400> 504
Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile Ile His Leu
1 5 10 15
<210> 505
<211> 16
<212> PRT
<213> Listeria seeligeri
<400> 505
Leu Ala Gly Tyr Met Ser Ile Ala Asp Arg Asp Phe Gln Phe Ser Ser
1 5 10 15
<210> 506
<211> 14
<212> PRT
<213> Listeria seeligeri
<400> 506
Lys Arg Asn Asn Ile Ser His Phe Asn Tyr Leu Asn Gly Gln
1 5 10
<210> 507
<211> 16
<212> PRT
<213> Listeria weihenstephanensis
<400> 507
Asp Leu Gln Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile
1 5 10 15
<210> 508
<211> 15
<212> PRT
<213> Listeria weihenstephanensis
<400> 508
Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys
1 5 10 15
<210> 509
<211> 16
<212> PRT
<213> Listeria weihenstephanensis
<400> 509
Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln Cys Met Ala
1 5 10 15
<210> 510
<211> 14
<212> PRT
<213> Listeria weihenstephanensis
<400> 510
Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys
1 5 10
<210> 511
<211> 16
<212> PRT
<213> Listeria newyorkensis
<400> 511
Asp Leu Gln Asp Ile Arg Ser Gly Glu Ala Phe Ser Phe Lys Phe Ile
1 5 10 15
<210> 512
<211> 15
<212> PRT
<213> Listeria newyorkensis
<400> 512
Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr His Cys
1 5 10 15
<210> 513
<211> 16
<212> PRT
<213> Listeria newyorkensis
<400> 513
Tyr Val Gly Tyr Val Ala Ile Ala Asp Arg Asp Phe Gln Cys Met Ala
1 5 10 15
<210> 514
<211> 14
<212> PRT
<213> Listeria newyorkensis
<400> 514
Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys
1 5 10
<210> 515
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 515
Asp Leu Glu Tyr Ile Lys Thr Lys Glu Thr Leu Ile Arg Lys Met Ala
1 5 10 15
<210> 516
<211> 15
<212> PRT
<213> Leptotrichia wadei
<400> 516
Ile Ser Tyr Ser Ile Tyr Asn Val Arg Asn Gly Val Gly His Phe
1 5 10 15
<210> 517
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 517
Asn Val Ala Phe Phe Asn Lys Trp Glu Arg Asp Phe Lys Phe Ile Val
1 5 10 15
<210> 518
<211> 14
<212> PRT
<213> Leptotrichia wadei
<400> 518
Phe Arg Asn Tyr Ile Ala His Phe Leu His Leu His Thr Lys
1 5 10
<210> 519
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 519
Ile Asn Met Arg Asn Arg Gln Thr Glu Ala Phe Leu Arg Ser Ile Ile
1 5 10 15
<210> 520
<211> 15
<212> PRT
<213> Leptotrichia wadei
<400> 520
Met Leu Asn Ala Ile Thr Ser Ile Arg His Arg Val Val His Tyr
1 5 10 15
<210> 521
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 521
Leu Ala Gly Tyr Thr Ser Leu Trp Glu Arg Asp Leu Gln Phe Lys Leu
1 5 10 15
<210> 522
<211> 14
<212> PRT
<213> Leptotrichia wadei
<400> 522
Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro Asp Ala
1 5 10
<210> 523
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 523
Phe Ile Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile
1 5 10 15
<210> 524
<211> 15
<212> PRT
<213> Leptotrichia wadei
<400> 524
Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
1 5 10 15
<210> 525
<211> 16
<212> PRT
<213> Leptotrichia wadei
<400> 525
Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu
1 5 10 15
<210> 526
<211> 14
<212> PRT
<213> Leptotrichia wadei
<400> 526
Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala
1 5 10
<210> 527
<211> 16
<212> PRT
<213> Rhodobacter capsulatus
<400> 527
Gly Gln Thr Glu Ile Lys Glu Ser Glu Ile Phe Val Arg Leu Trp Val
1 5 10 15
<210> 528
<211> 15
<212> PRT
<213> Rhodobacter capsulatus
<400> 528
Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe His Leu
1 5 10 15
<210> 529
<211> 16
<212> PRT
<213> Rhodobacter capsulatus
<400> 529
Leu Ile Asp Tyr Ala Gly Ala Tyr Glu Arg Asp Thr Gly Thr Phe Leu
1 5 10 15
<210> 530
<211> 14
<212> PRT
<213> Rhodobacter capsulatus
<400> 530
Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala
1 5 10
<210> 531
<211> 16
<212> PRT
<213> Leptotrichia buccalis
<400> 531
Phe Ile Ala Arg Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile
1 5 10 15
<210> 532
<211> 15
<212> PRT
<213> Leptotrichia buccalis
<400> 532
Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
1 5 10 15
<210> 533
<211> 16
<212> PRT
<213> Leptotrichia buccalis
<400> 533
Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu
1 5 10 15
<210> 534
<211> 14
<212> PRT
<213> Leptotrichia buccalis
<400> 534
Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala
1 5 10
<210> 535
<211> 16
<212> PRT
<213> Leptotrichia sp.
<400> 535
Phe Ile Val Gly Asn Arg Gln Asn Glu Ala Phe Leu Arg Asn Ile Ile
1 5 10 15
<210> 536
<211> 15
<212> PRT
<213> Leptotrichia sp.
<400> 536
Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val His Phe
1 5 10 15
<210> 537
<211> 16
<212> PRT
<213> Leptotrichia sp.
<400> 537
Leu Val Gly Tyr Thr Ser Ile Trp Glu Arg Asp Leu Arg Phe Arg Leu
1 5 10 15
<210> 538
<211> 14
<212> PRT
<213> Leptotrichia sp.
<400> 538
Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro Asn Ala
1 5 10
<210> 539
<211> 16
<212> PRT
<213> Leptotrichia sp.
<400> 539
Asp Phe Ser Arg Leu His Ala Lys Glu Glu Leu Asp Leu Glu Leu Ile
1 5 10 15
<210> 540
<211> 15
<212> PRT
<213> Leptotrichia sp.
<400> 540
Phe Gln Lys Glu Gly Tyr Leu Leu Arg Asn Lys Ile Leu His Asn
1 5 10 15
<210> 541
<211> 16
<212> PRT
<213> Leptotrichia sp.
<400> 541
Leu Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1 5 10 15
<210> 542
<211> 14
<212> PRT
<213> Leptotrichia sp.
<400> 542
Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro
1 5 10
<210> 543
<211> 16
<212> PRT
<213> Leptotrichia shahii
<400> 543
Asp Phe Ser Arg Leu His Ala Lys Glu Glu Leu Asp Leu Glu Leu Ile
1 5 10 15
<210> 544
<211> 15
<212> PRT
<213> Leptotrichia shahii
<400> 544
Phe Thr Lys Ile Gly Thr Asn Glu Arg Asn Arg Ile Leu His Ala
1 5 10 15
<210> 545
<211> 16
<212> PRT
<213> Leptotrichia shahii
<400> 545
Leu Ala Ile Gln Met Ala Arg Phe Glu Arg Asp Met His Tyr Ile Val
1 5 10 15
<210> 546
<211> 14
<212> PRT
<213> Leptotrichia shahii
<400> 546
Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro
1 5 10
<210> 547
<211> 18
<212> PRT
<213> Leptotrichia shahii
<400> 547
Ile Arg Lys Phe Thr Lys Ile Gly Thr Asn Glu Arg Asn Arg Ile Leu
1 5 10 15
His Ala
<210> 548
<211> 15
<212> PRT
<213> Leptotrichia shahii
<400> 548
Ser Ile Arg Asn Tyr Ile Ser His Phe Tyr Ile Val Arg Asn Pro
1 5 10 15
<210> 549
<211> 18
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 549
Leu Tyr Ser Leu Lys Ser Met Leu Tyr Ser Met Arg Asn Ser Ser Phe
1 5 10 15
His Phe
<210> 550
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 550
Ile Phe Arg Asn Glu Ile Asp His Phe His Tyr Phe Tyr Asp Arg
1 5 10 15
<210> 551
<211> 18
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 551
Leu Thr Asp Leu Lys Asp Val Ile Tyr Ser Met Arg Asn Asp Ser Phe
1 5 10 15
His Tyr
<210> 552
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 552
Glu Leu Arg Asn Tyr Ile Glu His Phe Arg Tyr Tyr Ser Ser Phe
1 5 10 15
<210> 553
<211> 18
<212> PRT
<213> Clostridium aminophilum
<400> 553
Ala Asp Asp Leu Arg Lys Ala Ile Tyr Ser Leu Arg Asn Glu Thr Phe
1 5 10 15
His Phe
<210> 554
<211> 15
<212> PRT
<213> Clostridium aminophilum
<400> 554
Asp Val Arg Lys Tyr Val Asp His Phe Lys Tyr Tyr Ala Thr Ser
1 5 10 15
<210> 555
<211> 18
<212> PRT
<213> Camobacterium gallinarum
<400> 555
Ile Trp Ala Leu Arg Gly Ser Val Gln Gln Ile Arg Asn Glu Ile Phe
1 5 10 15
His Ser
<210> 556
<211> 15
<212> PRT
<213> Camobacterium gallinarum
<400> 556
Lys Ile Arg Asn Gln Thr Ala His Leu Ser Val Leu Gln Leu Glu
1 5 10 15
<210> 557
<211> 18
<212> PRT
<213> Camobacterium gallinarum
<400> 557
Leu Trp Ala Ile Arg Gly Ala Val Gln Arg Val Arg Asn Gln Ile Phe
1 5 10 15
His Gln
<210> 558
<211> 15
<212> PRT
<213> Camobacterium gallinarum
<400> 558
Glu Ile Arg Asn Asn Ile Ala His Leu His Val Leu Arg Asn Asp
1 5 10 15
<210> 559
<211> 18
<212> PRT
<213> Paludibacter propionicigenes
<400> 559
Leu Trp Gly Ile Arg Gly Ala Val Gln Gln Ile Arg Asn Asn Val Asn
1 5 10 15
His Tyr
<210> 560
<211> 15
<212> PRT
<213> Paludibacter propionicigenes
<400> 560
Asp Ile Arg Asn His Ile Ala His Phe Asn Tyr Leu Thr Lys Asp
1 5 10 15
<210> 561
<211> 18
<212> PRT
<213> Listeria weihenstephanensis
<400> 561
Ile Trp Ala Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr
1 5 10 15
His Cys
<210> 562
<211> 15
<212> PRT
<213> Listeria weihenstephanensis
<400> 562
Asn Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys
1 5 10 15
<210> 563
<211> 18
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 563
Ile Trp Ala Ile Arg Gly Ser Ile Gln Gln Ile Arg Asn Glu Val Tyr
1 5 10 15
His Cys
<210> 564
<211> 15
<212> PRT
<213> Unknown
<220>
<221> source
<223> /note="Description of Unknown:
Lachnospiraceae bacterium"
<400> 564
Asn Ala Arg Asn His Ile Ala His Leu Asn Tyr Leu Ser Leu Lys
1 5 10 15
<210> 565
<211> 18
<212> PRT
<213> Leptotrichia wadei
<400> 565
Phe Ala Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val
1 5 10 15
His Phe
<210> 566
<211> 15
<212> PRT
<213> Leptotrichia wadei
<400> 566
Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala
1 5 10 15
<210> 567
<211> 18
<212> PRT
<213> Rhodobacter capsulatus
<400> 567
Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe
1 5 10 15
His Leu
<210> 568
<211> 15
<212> PRT
<213> Rhodobacter capsulatus
<400> 568
Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala
1 5 10 15
<210> 569
<211> 18
<212> PRT
<213> Rhodobacter capsulatus
<400> 569
Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe
1 5 10 15
His Leu
<210> 570
<211> 15
<212> PRT
<213> Rhodobacter capsulatus
<400> 570
Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala
1 5 10 15
<210> 571
<211> 18
<212> PRT
<213> Rhodobacter capsulatus
<400> 571
Val Phe Ala Leu Leu Arg Tyr Leu Arg Gly Cys Arg Asn Gln Thr Phe
1 5 10 15
His Leu
<210> 572
<211> 15
<212> PRT
<213> Rhodobacter capsulatus
<400> 572
Gln Thr Arg Lys Asp Leu Ala His Phe Asn Val Leu Asp Arg Ala
1 5 10 15
<210> 573
<211> 18
<212> PRT
<213> Leptotrichia wadei
<400> 573
Phe Ala Asn Ile Asp Glu Ala Ile Ser Ser Ile Arg His Gly Ile Val
1 5 10 15
His Phe
<210> 574
<211> 15
<212> PRT
<213> Leptotrichia wadei
<400> 574
Tyr Ile Arg Asn Tyr Ile Ala His Phe Asn Tyr Ile Pro His Ala
1 5 10 15
<210> 575
<211> 18
<212> PRT
<213> Listeria seeligeri
<400> 575
Ser Trp Gly Leu Arg Gly Ala Ile Ala Pro Ile Arg Asn Glu Ile Ile
1 5 10 15
His Leu
<210> 576
<211> 15
<212> PRT
<213> Listeria seeligeri
<400> 576
Glu Lys Arg Asn Asn Ile Ser His Phe Asn Tyr Leu Asn Gly Gln
1 5 10 15
<210> 577
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"
<400> 577
His His His His His His
1 5
Claims (1)
- 본원 발명의 설명에 기재된 모든 발명.
Applications Claiming Priority (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662351662P | 2016-06-17 | 2016-06-17 | |
US201662351803P | 2016-06-17 | 2016-06-17 | |
US62/351,662 | 2016-06-17 | ||
US62/351,803 | 2016-06-17 | ||
US201662376377P | 2016-08-17 | 2016-08-17 | |
US62/376,377 | 2016-08-17 | ||
US201662410366P | 2016-10-19 | 2016-10-19 | |
US62/410,366 | 2016-10-19 | ||
US201662432240P | 2016-12-09 | 2016-12-09 | |
US62/432,240 | 2016-12-09 | ||
US201762471792P | 2017-03-15 | 2017-03-15 | |
US62/471,792 | 2017-03-15 | ||
US201762484786P | 2017-04-12 | 2017-04-12 | |
US62/484,786 | 2017-04-12 | ||
KR1020197001527A KR20190019168A (ko) | 2016-06-17 | 2017-06-19 | 제vi형 crispr 오솔로그 및 시스템 |
PCT/US2017/038154 WO2017219027A1 (en) | 2016-06-17 | 2017-06-19 | Type vi crispr orthologs and systems |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197001527A Division KR20190019168A (ko) | 2016-06-17 | 2017-06-19 | 제vi형 crispr 오솔로그 및 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230156150A true KR20230156150A (ko) | 2023-11-13 |
Family
ID=59295312
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237037115A KR20230156150A (ko) | 2016-06-17 | 2017-06-19 | 제vi형 crispr 오솔로그 및 시스템 |
KR1020197001527A KR20190019168A (ko) | 2016-06-17 | 2017-06-19 | 제vi형 crispr 오솔로그 및 시스템 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197001527A KR20190019168A (ko) | 2016-06-17 | 2017-06-19 | 제vi형 crispr 오솔로그 및 시스템 |
Country Status (9)
Country | Link |
---|---|
US (3) | US11788083B2 (ko) |
EP (1) | EP3455357A1 (ko) |
JP (3) | JP7267013B2 (ko) |
KR (2) | KR20230156150A (ko) |
CN (1) | CN109642231A (ko) |
AU (4) | AU2017283713B2 (ko) |
BR (1) | BR112018076190A2 (ko) |
CA (1) | CA3028158A1 (ko) |
WO (1) | WO2017219027A1 (ko) |
Families Citing this family (122)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2510488B (en) | 2011-06-23 | 2020-04-08 | Univ Texas | Identifying peptides at the single molecule level |
US11435358B2 (en) | 2011-06-23 | 2022-09-06 | Board Of Regents, The University Of Texas System | Single molecule peptide sequencing |
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
EP3543703A1 (en) | 2014-09-15 | 2019-09-25 | Board of Regents, The University of Texas System | Improved single molecule peptide sequencing |
AU2015342749B2 (en) | 2014-11-07 | 2022-01-27 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
US11390884B2 (en) | 2015-05-11 | 2022-07-19 | Editas Medicine, Inc. | Optimized CRISPR/cas9 systems and methods for gene editing in stem cells |
KR20180031671A (ko) | 2015-06-09 | 2018-03-28 | 에디타스 메디신, 인코포레이티드 | 이식의 개선을 위한 crispr/cas-관련 방법 및 조성물 |
WO2017053879A1 (en) | 2015-09-24 | 2017-03-30 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
JP2019500899A (ja) | 2015-11-23 | 2019-01-17 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | CRISPR/Cas9の核送達を通じた細胞RNAの追跡と操作 |
EP3433363A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
US11236313B2 (en) | 2016-04-13 | 2022-02-01 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
US10337051B2 (en) * | 2016-06-16 | 2019-07-02 | The Regents Of The University Of California | Methods and compositions for detecting a target RNA |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
WO2018064352A1 (en) | 2016-09-30 | 2018-04-05 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
GB2569733B (en) | 2016-09-30 | 2022-09-14 | Univ California | RNA-guided nucleic acid modifying enzymes and methods of use thereof |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
CA3049961A1 (en) * | 2016-12-09 | 2018-06-14 | The Broad Institute, Inc. | Crispr effector system based diagnostics |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
EP4095263A1 (en) | 2017-01-06 | 2022-11-30 | Editas Medicine, Inc. | Methods of assessing nuclease cleavage |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
US11174515B2 (en) * | 2017-03-15 | 2021-11-16 | The Broad Institute, Inc. | CRISPR effector system based diagnostics |
US11021740B2 (en) | 2017-03-15 | 2021-06-01 | The Broad Institute, Inc. | Devices for CRISPR effector system based diagnostics |
EP4361261A3 (en) | 2017-03-15 | 2024-07-10 | The Broad Institute Inc. | Novel cas13b orthologues crispr enzymes and systems |
US11104937B2 (en) | 2017-03-15 | 2021-08-31 | The Broad Institute, Inc. | CRISPR effector system based diagnostics |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
US11963966B2 (en) | 2017-03-31 | 2024-04-23 | Dana-Farber Cancer Institute, Inc. | Compositions and methods for treating ovarian tumors |
US11618928B2 (en) | 2017-04-12 | 2023-04-04 | The Broad Institute, Inc. | CRISPR effector system based diagnostics for malaria detection |
KR20200006054A (ko) | 2017-04-12 | 2020-01-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 신규 타입 vi crispr 오르소로그 및 시스템 |
BR112019021719A2 (pt) | 2017-04-21 | 2020-06-16 | The General Hospital Corporation | Variantes de cpf1 (cas12a) com especificidade para pam alterada |
EP3615672A1 (en) | 2017-04-28 | 2020-03-04 | Editas Medicine, Inc. | Methods and systems for analyzing guide rna molecules |
EP3622062A4 (en) | 2017-05-10 | 2020-10-14 | The Regents of the University of California | DIRECTED EDITING OF CELLULAR RNA BY NUCLEAR ADMINISTRATION OF CRISPR / CAS9 |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
CN110997908A (zh) | 2017-06-09 | 2020-04-10 | 爱迪塔斯医药公司 | 工程化的cas9核酸酶 |
WO2018232195A1 (en) | 2017-06-14 | 2018-12-20 | The Broad Institute, Inc. | Compositions and methods targeting complement component 3 for inhibiting tumor growth |
WO2019005886A1 (en) * | 2017-06-26 | 2019-01-03 | The Broad Institute, Inc. | CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS |
US11168322B2 (en) | 2017-06-30 | 2021-11-09 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
US12049643B2 (en) | 2017-07-14 | 2024-07-30 | The Broad Institute, Inc. | Methods and compositions for modulating cytotoxic lymphocyte activity |
EP3654993A4 (en) | 2017-07-17 | 2021-08-25 | The Broad Institute, Inc. | HUMAN COLON CELL ATLAS IN GOOD HEALTH WITH HEMORRHAGIC RECTO-COLITIS |
JP2020534795A (ja) | 2017-07-28 | 2020-12-03 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
KR20200074104A (ko) * | 2017-10-04 | 2020-06-24 | 더 브로드 인스티튜트, 인코퍼레이티드 | 표적화된 핵산 편집을 위한 시스템, 방법, 및 조성물 |
WO2019071051A1 (en) * | 2017-10-04 | 2019-04-11 | The Broad Institute, Inc. | DIAGNOSTICS BASED ON A CRISPR EFFECTOR SYSTEM |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
EP3701042A4 (en) * | 2017-10-23 | 2021-08-11 | The Broad Institute, Inc. | SYSTEMS, PROCEDURES AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITING |
WO2019089808A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Class 2 crispr/cas compositions and methods of use |
SG11202003863VA (en) | 2017-11-01 | 2020-05-28 | Univ California | Casz compositions and methods of use |
WO2019113506A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | Methods and compositions for multiplexing single cell and single nuclei sequencing |
WO2019126716A1 (en) * | 2017-12-22 | 2019-06-27 | The Broad Institute, Inc. | Cas12b systems, methods, and compositions for targeted rna base editing |
RU2020124203A (ru) * | 2017-12-22 | 2022-01-24 | Зе Броад Институт, Инк. | Мультиплексная диагностика на основе эффекторной системы crispr |
BR112020015093A2 (pt) * | 2018-01-29 | 2020-12-08 | The Broad Institute, Inc. | Diagnóstico baseado no sistema de efetor crispr |
CN108559738A (zh) * | 2018-02-12 | 2018-09-21 | 南昌大学 | 一种植物rna修饰和编辑的系统及方法 |
WO2019178427A1 (en) | 2018-03-14 | 2019-09-19 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
DK3765616T3 (da) | 2018-03-14 | 2023-08-21 | Arbor Biotechnologies Inc | Nye enzymer og systemer målrettet crispr dna og rna |
WO2019189827A1 (ja) * | 2018-03-30 | 2019-10-03 | 国立大学法人 岡山大学 | 核酸構築物、医薬組成物、抗がん剤、抗ウイルス剤及び抗菌剤 |
CN108796036B (zh) * | 2018-04-03 | 2021-11-19 | 交弘生物科技(上海)有限公司 | 基于原核Argonaute蛋白的核酸检测方法及其应用 |
US11795456B2 (en) | 2018-04-16 | 2023-10-24 | Georgia Tech Research Corporation | MRNA driven expression of RNA editors for treatment of pathologies |
WO2019204828A1 (en) * | 2018-04-20 | 2019-10-24 | The Regents Of The University Of California | Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna |
US11957695B2 (en) | 2018-04-26 | 2024-04-16 | The Broad Institute, Inc. | Methods and compositions targeting glucocorticoid signaling for modulating immune responses |
CN108546718B (zh) * | 2018-05-16 | 2021-07-09 | 康春生 | crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用 |
WO2019222555A1 (en) | 2018-05-16 | 2019-11-21 | Arbor Biotechnologies, Inc. | Novel crispr-associated systems and components |
CN110527697B (zh) * | 2018-05-23 | 2023-07-07 | 中国科学院分子植物科学卓越创新中心 | 基于CRISPR-Cas13a的RNA定点编辑技术 |
US12036240B2 (en) | 2018-06-14 | 2024-07-16 | The Broad Institute, Inc. | Compositions and methods targeting complement component 3 for inhibiting tumor growth |
US20190390193A1 (en) * | 2018-06-23 | 2019-12-26 | John Lawrence Mee | Reversible method for sustainable human cognitive enhancement |
JP2021528091A (ja) | 2018-06-26 | 2021-10-21 | ザ・ブロード・インスティテュート・インコーポレイテッド | Crisprダブルニッカーゼに基づく増幅の組成物、システム、及び方法 |
JP2021528090A (ja) | 2018-06-26 | 2021-10-21 | マサチューセッツ インスティテュート オブ テクノロジー | Crisprエフェクター系に基づく増幅法、システム、及び診断法 |
WO2020000454A1 (zh) * | 2018-06-29 | 2020-01-02 | 深圳市博奥康生物科技有限公司 | 一种表达LwCas13a基因的质粒、构建方法及其应用 |
EP3827093A4 (en) * | 2018-07-23 | 2022-10-05 | Board of Regents, The University of Texas System | IDENTIFICATION BY SINGLE MOLECULE SEQUENCING OF POST-TRANSLATIONAL MODIFICATIONS ON PROTEINS |
JP6915820B2 (ja) * | 2018-07-25 | 2021-08-04 | 国立研究開発法人産業技術総合研究所 | 植物における標的dnaのメチル化を抑制する方法 |
EP3830256A2 (en) * | 2018-07-31 | 2021-06-09 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2020028729A1 (en) | 2018-08-01 | 2020-02-06 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
CA3110998A1 (en) * | 2018-09-06 | 2020-03-12 | The Regents Of The University Of California | Rna and dna base editing via engneered adar recruitment |
EP3650553B1 (en) * | 2018-11-07 | 2023-07-12 | Siemens Healthcare GmbH | Method for detection of specific nucleic acids |
BR112021009425A2 (pt) | 2018-11-14 | 2021-11-23 | Massachusetts Inst Technology | Sistemas e métodos de diagnóstico por gotículas com base no sistema crispr |
WO2020102608A2 (en) | 2018-11-14 | 2020-05-22 | President And Fellows Of Harvard College | Multiplexing highly evolving viral variants with sherlock |
AU2019381258B2 (en) * | 2018-11-15 | 2024-02-01 | China Agricultural University | CRISPR-Cas12j enzyme and system |
US20220282275A1 (en) * | 2018-11-15 | 2022-09-08 | The Broad Institute, Inc. | G-to-t base editors and uses thereof |
WO2020124050A1 (en) | 2018-12-13 | 2020-06-18 | The Broad Institute, Inc. | Tiled assays using crispr-cas based detection |
EP3931313A2 (en) | 2019-01-04 | 2022-01-05 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
US11739156B2 (en) | 2019-01-06 | 2023-08-29 | The Broad Institute, Inc. Massachusetts Institute of Technology | Methods and compositions for overcoming immunosuppression |
EP3911741A1 (en) * | 2019-01-14 | 2021-11-24 | University of Rochester | Targeted nuclear rna cleavage and polyadenylation with crispr-cas |
WO2020186231A2 (en) | 2019-03-14 | 2020-09-17 | The Broad Institute, Inc. | Crispr effector system based multiplex diagnostics |
WO2020191102A1 (en) | 2019-03-18 | 2020-09-24 | The Broad Institute, Inc. | Type vii crispr proteins and systems |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
WO2020192712A1 (en) * | 2019-03-26 | 2020-10-01 | Peking University | Method for identifying functional elements |
CN109913502A (zh) * | 2019-04-16 | 2019-06-21 | 和元生物技术(上海)股份有限公司 | 一种Cas9-gRNA表达系统及其应用 |
US20220251152A1 (en) | 2019-04-24 | 2022-08-11 | Novartis Ag | Compositions and methods for selective protein degradation |
EP3997222A4 (en) * | 2019-07-12 | 2023-08-09 | Duke University | 3' UTR CRISPR DCAS 13 ENGINEERING SYSTEM AND METHODS OF USE |
CN110819652A (zh) * | 2019-08-21 | 2020-02-21 | 山东金城生物药业有限公司 | 一种谷氨酸棒杆菌同时基因敲除及基因表达抑制的双功能系统及应用 |
WO2021046257A1 (en) | 2019-09-03 | 2021-03-11 | The Broad Institute, Inc. | Crispr effector system based multiplex cancer diagnostics |
JP2022546592A (ja) | 2019-09-03 | 2022-11-04 | マイエロイド・セラピューティクス,インコーポレーテッド | ゲノム組込みのための方法および組成物 |
US20230025039A1 (en) | 2019-09-20 | 2023-01-26 | The Broad Institute, Inc. | Novel type vi crispr enzymes and systems |
US11844800B2 (en) | 2019-10-30 | 2023-12-19 | Massachusetts Institute Of Technology | Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia |
EP4069842A1 (en) | 2019-12-02 | 2022-10-12 | Shape Therapeutics Inc. | Therapeutic editing |
EP4100424A2 (en) * | 2020-02-07 | 2022-12-14 | University of Rochester | Targeted translation of rna with crispr-cas13 to enhance protein synthesis |
CN111337666B (zh) * | 2020-02-12 | 2021-04-02 | 山东大学 | I-motif重组介导的FRET探针及其原位成像癌细胞表面蛋白质同源二聚化的应用 |
AU2020431316A1 (en) * | 2020-02-28 | 2022-10-20 | Huigene Therapeutics Co., Ltd. | Type VI-E and type VI-F CRISPR-Cas system and uses thereof |
US11639523B2 (en) | 2020-03-23 | 2023-05-02 | The Broad Institute, Inc. | Type V CRISPR-Cas systems and use thereof |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
JP7419168B2 (ja) * | 2020-06-10 | 2024-01-22 | 株式会社東芝 | 改変型piggyBacトランスポゼースのポリペプチド、それをコードするポリヌクレオチド、導入キャリア、キット、細胞のゲノムに目的配列を組込む方法及び細胞製造方法 |
WO2022068912A1 (en) | 2020-09-30 | 2022-04-07 | Huigene Therapeutics Co., Ltd. | Engineered crispr/cas13 system and uses thereof |
WO2022188039A1 (en) | 2021-03-09 | 2022-09-15 | Huigene Therapeutics Co., Ltd. | Engineered crispr/cas13 system and uses thereof |
EP4222253A1 (en) * | 2020-09-30 | 2023-08-09 | HuidaGene Therapeutics Co., Ltd. | Engineered crispr/cas13 system and uses thereof |
CN112430586B (zh) * | 2020-11-16 | 2021-09-07 | 珠海舒桐医疗科技有限公司 | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 |
CN116917478A (zh) * | 2020-12-22 | 2023-10-20 | 亥姆霍兹慕尼黑中心-德国健康与环境研究中心(有限公司) | Crispr/cas13在rna病毒和/或细菌诱导的疾病的治疗中的应用 |
EP4276182A1 (en) * | 2021-01-05 | 2023-11-15 | Kawasaki Gakuen Educational Foundation | Transcriptional product in cells of organism including human, transfected rna, and tool for purifying complex thereof |
EP4347818A2 (en) | 2021-06-01 | 2024-04-10 | Arbor Biotechnologies, Inc. | Gene editing systems comprising a crispr nuclease and uses thereof |
US20240309343A1 (en) * | 2021-07-08 | 2024-09-19 | Korea Advanced Institute Of Science And Technology | RNA expression modulating or editing method via regulation of Cas13 protein |
US11814689B2 (en) | 2021-07-21 | 2023-11-14 | Montana State University | Nucleic acid detection using type III CRISPR complex |
EP4215612A1 (en) * | 2022-01-20 | 2023-07-26 | Sartorius Stedim Cellca GmbH | Genome editing with crispr/cas nucleases comprising collateral activity |
US20240301447A1 (en) | 2023-02-15 | 2024-09-12 | Arbor Biotechnologies, Inc. | Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript |
Family Cites Families (133)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
ATE141646T1 (de) | 1986-04-09 | 1996-09-15 | Genzyme Corp | Genetisch transformierte tiere, die ein gewünschtes protein in milch absondern |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
CA2004574A1 (en) * | 1988-12-05 | 1990-06-05 | Barbara C. Chu | Target nucleic acid amplification/detection systems |
US5703055A (en) | 1989-03-21 | 1997-12-30 | Wisconsin Alumni Research Foundation | Generation of antibodies through lipid mediated DNA delivery |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
AU7979491A (en) | 1990-05-03 | 1991-11-27 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5210015A (en) | 1990-08-06 | 1993-05-11 | Hoffman-La Roche Inc. | Homogeneous assay system using the nuclease activity of a nucleic acid polymerase |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
GB9114259D0 (en) | 1991-07-02 | 1991-08-21 | Ici Plc | Plant derived enzyme and dna sequences |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
WO1994002620A2 (en) | 1992-07-27 | 1994-02-03 | Pioneer Hi-Bred International, Inc. | An improved method of agrobacterium-mediated transformation of cultured soybean cells |
US5593972A (en) | 1993-01-26 | 1997-01-14 | The Wistar Institute | Genetic immunization |
CA2163129A1 (en) | 1993-05-17 | 1994-11-24 | Flossie Wong-Staal | Ribozyme gene therapy for hiv infection and aids |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5543158A (en) | 1993-07-23 | 1996-08-06 | Massachusetts Institute Of Technology | Biodegradable injectable nanoparticles |
US6007845A (en) | 1994-07-22 | 1999-12-28 | Massachusetts Institute Of Technology | Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers |
EP0831854A4 (en) | 1995-06-06 | 2001-01-24 | Isis Pharmaceuticals Inc | OLIGONUCLEOTIDS WITH PHOSPHOROTHIOATE BINDINGS OF HIGH CHIRAL PURITY |
US5985662A (en) | 1995-07-13 | 1999-11-16 | Isis Pharmaceuticals Inc. | Antisense inhibition of hepatitis B virus replication |
US5985309A (en) | 1996-05-24 | 1999-11-16 | Massachusetts Institute Of Technology | Preparation of particles for inhalation |
US5855913A (en) | 1997-01-16 | 1999-01-05 | Massachusetts Instite Of Technology | Particles incorporating surfactants for pulmonary drug delivery |
US5846946A (en) | 1996-06-14 | 1998-12-08 | Pasteur Merieux Serums Et Vaccins | Compositions and methods for administering Borrelia DNA |
GB9907461D0 (en) | 1999-03-31 | 1999-05-26 | King S College London | Neurite regeneration |
GB9720465D0 (en) | 1997-09-25 | 1997-11-26 | Oxford Biomedica Ltd | Dual-virus vectors |
CN100342008C (zh) | 1997-10-24 | 2007-10-10 | 茵维特罗根公司 | 利用具重组位点的核酸进行重组克隆 |
US6750059B1 (en) | 1998-07-16 | 2004-06-15 | Whatman, Inc. | Archiving of vectors |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7868149B2 (en) | 1999-07-20 | 2011-01-11 | Monsanto Technology Llc | Plant genome sequence and uses thereof |
US6603061B1 (en) | 1999-07-29 | 2003-08-05 | Monsanto Company | Agrobacterium-mediated plant transformation method |
GB0024550D0 (ko) | 2000-10-06 | 2000-11-22 | Oxford Biomedica Ltd | |
AU2002336760A1 (en) | 2001-09-26 | 2003-06-10 | Mayo Foundation For Medical Education And Research | Mutable vaccines |
GB0125216D0 (en) | 2001-10-19 | 2001-12-12 | Univ Strathclyde | Dendrimers for use in targeted delivery |
US20090100536A1 (en) | 2001-12-04 | 2009-04-16 | Monsanto Company | Transgenic plants with enhanced agronomic traits |
AU2002353231B2 (en) | 2001-12-21 | 2008-10-16 | Oxford Biomedica (Uk) Limited | Method for producing a transgenic organism using a lentiviral expression vector such as EIAV |
DK1519714T3 (da) | 2002-06-28 | 2011-01-31 | Protiva Biotherapeutics Inc | Fremgangsmåde og apparat til fremstilling af liposomer |
GB0220467D0 (en) | 2002-09-03 | 2002-10-09 | Oxford Biomedica Ltd | Composition |
US20040142476A1 (en) | 2002-11-01 | 2004-07-22 | New England Biolabs, Inc. | Organellar targeting of RNA and its use in the interruption of environmental gene flow |
EP2567693B1 (en) | 2003-07-16 | 2015-10-21 | Protiva Biotherapeutics Inc. | Lipid encapsulated interfering RNA |
US7803397B2 (en) | 2003-09-15 | 2010-09-28 | Protiva Biotherapeutics, Inc. | Polyethyleneglycol-modified lipid compounds and uses thereof |
GB0325379D0 (en) | 2003-10-30 | 2003-12-03 | Oxford Biomedica Ltd | Vectors |
AU2005252273B2 (en) | 2004-06-07 | 2011-04-28 | Arbutus Biopharma Corporation | Lipid encapsulated interfering RNA |
ATE537263T1 (de) | 2004-06-07 | 2011-12-15 | Protiva Biotherapeutics Inc | Kationische lipide und verwendungsverfahren |
AU2005274948B2 (en) | 2004-07-16 | 2011-09-22 | Genvec, Inc. | Vaccines against aids comprising CMV/R-nucleic acid constructs |
GB0422877D0 (en) | 2004-10-14 | 2004-11-17 | Univ Glasgow | Bioactive polymers |
WO2007048046A2 (en) | 2005-10-20 | 2007-04-26 | Protiva Biotherapeutics, Inc. | Sirna silencing of filovirus gene expression |
ES2377660T3 (es) | 2005-10-28 | 2012-03-29 | Mitsubishi Tanabe Pharma Corporation | Nuevo péptido que penetra en las células |
US8101741B2 (en) | 2005-11-02 | 2012-01-24 | Protiva Biotherapeutics, Inc. | Modified siRNA molecules and uses thereof |
GB0526211D0 (en) | 2005-12-22 | 2006-02-01 | Oxford Biomedica Ltd | Viral vectors |
US7915399B2 (en) | 2006-06-09 | 2011-03-29 | Protiva Biotherapeutics, Inc. | Modified siRNA molecules and uses thereof |
JP2008078613A (ja) | 2006-08-24 | 2008-04-03 | Rohm Co Ltd | 窒化物半導体の製造方法及び窒化物半導体素子 |
WO2008042156A1 (en) | 2006-09-28 | 2008-04-10 | Northwestern University | Maximizing oligonucleotide loading on gold nanoparticle |
CA2670096A1 (en) | 2006-11-21 | 2008-05-29 | The Samuel Roberts Noble Foundation, Inc. | Biofuel production methods and compositions |
WO2008149176A1 (en) | 2007-06-06 | 2008-12-11 | Cellectis | Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof |
AU2008346801A1 (en) | 2007-12-31 | 2009-07-16 | Nanocor Therapeutics, Inc. | RNA interference for the treatment of heart failure |
HUE034483T2 (en) | 2008-04-15 | 2018-02-28 | Protiva Biotherapeutics Inc | New lipid preparations for introducing a nucleic acid |
US8575305B2 (en) | 2008-06-04 | 2013-11-05 | Medical Research Council | Cell penetrating peptides |
JP2011526619A (ja) | 2008-06-30 | 2011-10-13 | サイレンシード リミテッド | 局所ドラッグデリバリーシステム、その方法、および、その組成物 |
EP2309980A1 (en) | 2008-07-08 | 2011-04-20 | S.I.F.I. Societa' Industria Farmaceutica Italiana | Ophthalmic compositions for treating pathologies of the posterior segment of the eye |
CA2742954C (en) | 2008-11-07 | 2018-07-10 | Massachusetts Institute Of Technology | Aminoalcohol lipidoids and uses thereof |
GB2465749B (en) | 2008-11-25 | 2013-05-08 | Algentech Sas | Plant cell transformation method |
US20120047601A1 (en) | 2009-02-17 | 2012-02-23 | The Regents Of The University Of California | Method of Reducing Acetylation in Plants to Improve Biofuel Production |
US8236943B2 (en) | 2009-07-01 | 2012-08-07 | Protiva Biotherapeutics, Inc. | Compositions and methods for silencing apolipoprotein B |
WO2011000107A1 (en) | 2009-07-01 | 2011-01-06 | Protiva Biotherapeutics, Inc. | Novel lipid formulations for delivery of therapeutic agents to solid tumors |
US20110027239A1 (en) | 2009-07-29 | 2011-02-03 | Tissue Genesis, Inc. | Adipose-derived stromal cells (asc) as delivery tool for treatment of cancer |
WO2011028929A2 (en) | 2009-09-03 | 2011-03-10 | The Regents Of The University Of California | Nitrate-responsive promoter |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
US20120003201A1 (en) | 2010-04-21 | 2012-01-05 | Nicholas Susanne B | Vault agents for chronic kidney disease |
US8771985B2 (en) | 2010-04-26 | 2014-07-08 | Sangamo Biosciences, Inc. | Genome editing of a Rosa locus using zinc-finger nucleases |
US8372951B2 (en) | 2010-05-14 | 2013-02-12 | National Tsing Hua University | Cell penetrating peptides for intracellular delivery |
CN102946907A (zh) | 2010-05-28 | 2013-02-27 | 牛津生物医学(英国)有限公司 | 慢病毒载体向脑的递送 |
US9193827B2 (en) | 2010-08-26 | 2015-11-24 | Massachusetts Institute Of Technology | Poly(beta-amino alcohols), their preparation, and uses thereof |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
PL2691443T3 (pl) | 2011-03-28 | 2021-08-30 | Massachusetts Institute Of Technology | Sprzężone lipomery i ich zastosowania |
DE12722942T1 (de) | 2011-03-31 | 2021-09-30 | Modernatx, Inc. | Freisetzung und formulierung von manipulierten nukleinsäuren |
US20120295960A1 (en) | 2011-05-20 | 2012-11-22 | Oxford Biomedica (Uk) Ltd. | Treatment regimen for parkinson's disease |
EP2751567B1 (en) | 2011-09-01 | 2019-05-08 | University of Iowa Research Foundation | Oligonucleotide-based probes for detection of bacterial nucleases |
JP2015501844A (ja) | 2011-12-16 | 2015-01-19 | モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. | 修飾ヌクレオシド、ヌクレオチドおよび核酸組成物 |
US20130185823A1 (en) | 2012-01-16 | 2013-07-18 | Academia Sinica | Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root |
DE202013012241U1 (de) * | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
US8614194B1 (en) | 2012-07-25 | 2013-12-24 | Kaohsiung Medical University | Anionic cell penetrating peptide and its use for intracellular delivery |
ES2757623T3 (es) | 2012-07-25 | 2020-04-29 | Broad Inst Inc | Proteínas de unión a ADN inducibles y herramientas de perturbación genómica y aplicaciones de las mismas |
ES2926021T3 (es) | 2012-10-23 | 2022-10-21 | Toolgen Inc | Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma |
EP2825654B1 (en) | 2012-12-12 | 2017-04-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
MX2015007549A (es) | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
BR112015013784A2 (pt) | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
PL2896697T3 (pl) | 2012-12-12 | 2016-01-29 | Broad Inst Inc | Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją |
PL2898075T3 (pl) | 2012-12-12 | 2016-09-30 | PROJEKTOWANIE i OPTYMALIZACJA ULEPSZONYCH SYSTEMÓW, SPOSOBY I KOMPOZYCJE ENZYMÓW DO MANIPULACJI SEKWENCJĄ | |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
CN105793425B (zh) | 2013-06-17 | 2021-10-26 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
WO2014204723A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions |
CN107995927B (zh) | 2013-06-17 | 2021-07-30 | 布罗德研究所有限公司 | 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途 |
EP3011029B1 (en) | 2013-06-17 | 2019-12-11 | The Broad Institute, Inc. | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
ES2767318T3 (es) | 2013-06-17 | 2020-06-17 | Broad Inst Inc | Suministro, modificación y optimización de sistemas, métodos y composiciones para generar modelos y actuar sobre enfermedades y trastornos de células posmitóticas |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
EP3835419A1 (en) * | 2013-12-12 | 2021-06-16 | The Regents of The University of California | Methods and compositions for modifying a single stranded target nucleic acid |
US9068179B1 (en) * | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
JP2017501149A (ja) | 2013-12-12 | 2017-01-12 | ザ・ブロード・インスティテュート・インコーポレイテッド | 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用 |
CA3012631A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
US20170211142A1 (en) * | 2015-10-22 | 2017-07-27 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US11118194B2 (en) * | 2015-12-18 | 2021-09-14 | The Regents Of The University Of California | Modified site-directed modifying polypeptides and methods of use thereof |
SG11201804038VA (en) * | 2016-01-08 | 2018-06-28 | Univ California | Conditionally active heterodimeric polypeptides and methods of use thereof |
US11427837B2 (en) * | 2016-01-12 | 2022-08-30 | The Regents Of The University Of California | Compositions and methods for enhanced genome editing |
WO2017136335A1 (en) * | 2016-02-01 | 2017-08-10 | The Regents Of The University Of California | Self-inactivating endonuclease-encoding nucleic acids and methods of using the same |
US11666666B2 (en) * | 2016-02-11 | 2023-06-06 | The Regents Of The University Of California | Methods and compositions for modifying a mutant dystrophin gene in a cell's genome |
WO2017160752A1 (en) * | 2016-03-14 | 2017-09-21 | Intellia Therapeutics, Inc. | Methods and compositions for gene editing |
KR102617874B1 (ko) * | 2016-03-30 | 2023-12-22 | 인텔리아 테라퓨틱스, 인크. | Crispr/cas 성분을 위한 지질 나노입자 제제 |
WO2017173092A1 (en) * | 2016-03-31 | 2017-10-05 | The Regents Of The University Of California | Methods for genome editing in zygotes |
WO2017189336A1 (en) * | 2016-04-25 | 2017-11-02 | The Regents Of The University Of California | Methods and compositions for genomic editing |
US10337051B2 (en) | 2016-06-16 | 2019-07-02 | The Regents Of The University Of California | Methods and compositions for detecting a target RNA |
CA3049961A1 (en) * | 2016-12-09 | 2018-06-14 | The Broad Institute, Inc. | Crispr effector system based diagnostics |
US11174515B2 (en) * | 2017-03-15 | 2021-11-16 | The Broad Institute, Inc. | CRISPR effector system based diagnostics |
US11021740B2 (en) * | 2017-03-15 | 2021-06-01 | The Broad Institute, Inc. | Devices for CRISPR effector system based diagnostics |
-
2017
- 2017-06-19 KR KR1020237037115A patent/KR20230156150A/ko not_active Application Discontinuation
- 2017-06-19 CA CA3028158A patent/CA3028158A1/en active Pending
- 2017-06-19 KR KR1020197001527A patent/KR20190019168A/ko not_active IP Right Cessation
- 2017-06-19 BR BR112018076190A patent/BR112018076190A2/pt not_active Application Discontinuation
- 2017-06-19 JP JP2018566199A patent/JP7267013B2/ja active Active
- 2017-06-19 CN CN201780050351.5A patent/CN109642231A/zh active Pending
- 2017-06-19 AU AU2017283713A patent/AU2017283713B2/en active Active
- 2017-06-19 WO PCT/US2017/038154 patent/WO2017219027A1/en unknown
- 2017-06-19 US US16/310,577 patent/US11788083B2/en active Active
- 2017-06-19 EP EP17736810.7A patent/EP3455357A1/en active Pending
-
2018
- 2018-11-30 AU AU2018271372A patent/AU2018271372A1/en not_active Abandoned
-
2021
- 2021-06-07 AU AU2021203747A patent/AU2021203747B2/en active Active
-
2022
- 2022-12-23 JP JP2022206177A patent/JP2023052051A/ja active Pending
-
2023
- 2023-06-13 US US18/334,046 patent/US20230383282A1/en active Pending
- 2023-06-13 US US18/334,074 patent/US20240191223A1/en active Pending
- 2023-06-16 JP JP2023098872A patent/JP2023134453A/ja active Pending
- 2023-06-27 AU AU2023204078A patent/AU2023204078A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2017283713A1 (en) | 2018-12-20 |
JP2023134453A (ja) | 2023-09-27 |
CA3028158A1 (en) | 2017-12-21 |
WO2017219027A1 (en) | 2017-12-21 |
US20230383282A1 (en) | 2023-11-30 |
JP2023052051A (ja) | 2023-04-11 |
JP2019524072A (ja) | 2019-09-05 |
EP3455357A1 (en) | 2019-03-20 |
BR112018076190A2 (pt) | 2019-06-18 |
AU2021203747A1 (en) | 2021-07-01 |
JP7267013B2 (ja) | 2023-05-01 |
KR20190019168A (ko) | 2019-02-26 |
US20240191223A1 (en) | 2024-06-13 |
AU2023204078A1 (en) | 2023-07-13 |
AU2018271372A1 (en) | 2019-01-17 |
AU2021203747B2 (en) | 2023-11-09 |
US11788083B2 (en) | 2023-10-17 |
US20190359971A1 (en) | 2019-11-28 |
AU2017283713B2 (en) | 2021-04-08 |
CN109642231A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021203747B2 (en) | Novel Type VI CRISPR orthologs and systems | |
US11773412B2 (en) | Crispr enzymes and systems | |
US20200231975A1 (en) | Novel type vi crispr orthologs and systems | |
AU2016342038B2 (en) | Type VI-B CRISPR enzymes and systems | |
JP2023052236A (ja) | 新規vi型crisprオルソログ及び系 | |
EP3645728A1 (en) | Novel type vi crispr orthologs and systems | |
US20200308560A1 (en) | Novel type vi crispr orthologs and systems | |
KR20240155360A (ko) | 신규 타입 vi crispr 오르소로그 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal |