KR20240031238A - Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 - Google Patents
Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 Download PDFInfo
- Publication number
- KR20240031238A KR20240031238A KR1020237044997A KR20237044997A KR20240031238A KR 20240031238 A KR20240031238 A KR 20240031238A KR 1020237044997 A KR1020237044997 A KR 1020237044997A KR 20237044997 A KR20237044997 A KR 20237044997A KR 20240031238 A KR20240031238 A KR 20240031238A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleotides
- sequence
- rna
- gene editing
- polypeptide
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 422
- 238000010362 genome editing Methods 0.000 title claims abstract description 270
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 71
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract 38
- 102100034343 Integrase Human genes 0.000 claims abstract description 380
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims abstract description 360
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 343
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 342
- 229920001184 polypeptide Polymers 0.000 claims abstract description 338
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 193
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 171
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 171
- 230000027455 binding Effects 0.000 claims abstract description 142
- 238000010839 reverse transcription Methods 0.000 claims abstract description 133
- 125000006850 spacer group Chemical group 0.000 claims abstract description 69
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 63
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 57
- 239000002773 nucleotide Substances 0.000 claims description 1217
- 125000003729 nucleotide group Chemical group 0.000 claims description 1215
- 230000004927 fusion Effects 0.000 claims description 104
- 239000012634 fragment Substances 0.000 claims description 87
- 238000006467 substitution reaction Methods 0.000 claims description 66
- 239000013598 vector Substances 0.000 claims description 64
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 60
- 238000000034 method Methods 0.000 claims description 60
- 108020004414 DNA Proteins 0.000 claims description 54
- 102000053602 DNA Human genes 0.000 claims description 52
- 230000000295 complement effect Effects 0.000 claims description 50
- 108090000623 proteins and genes Proteins 0.000 claims description 44
- 230000000694 effects Effects 0.000 claims description 43
- 230000035772 mutation Effects 0.000 claims description 36
- 108020004566 Transfer RNA Proteins 0.000 claims description 30
- 230000004048 modification Effects 0.000 claims description 30
- 238000012986 modification Methods 0.000 claims description 30
- 238000011144 upstream manufacturing Methods 0.000 claims description 24
- 239000013603 viral vector Substances 0.000 claims description 24
- 108020004999 messenger RNA Proteins 0.000 claims description 17
- 239000013604 expression vector Substances 0.000 claims description 13
- 230000002068 genetic effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 102000004678 Exoribonucleases Human genes 0.000 claims description 10
- 108010002700 Exoribonucleases Proteins 0.000 claims description 10
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 8
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 7
- 239000008194 pharmaceutical composition Substances 0.000 claims description 6
- 230000002829 reductive effect Effects 0.000 claims description 6
- 238000000338 in vitro Methods 0.000 claims description 5
- 150000002632 lipids Chemical class 0.000 claims description 5
- 239000002105 nanoparticle Substances 0.000 claims description 5
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- 241000713333 Mouse mammary tumor virus Species 0.000 claims description 2
- 229920002477 rna polymer Polymers 0.000 description 461
- 210000004027 cell Anatomy 0.000 description 52
- 230000004568 DNA-binding Effects 0.000 description 47
- 150000001413 amino acids Chemical class 0.000 description 47
- 238000003780 insertion Methods 0.000 description 35
- 230000037431 insertion Effects 0.000 description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 description 34
- 238000012217 deletion Methods 0.000 description 33
- 230000037430 deletion Effects 0.000 description 33
- 239000000203 mixture Substances 0.000 description 29
- 238000003776 cleavage reaction Methods 0.000 description 25
- 230000007017 scission Effects 0.000 description 25
- 210000004899 c-terminal region Anatomy 0.000 description 24
- 238000007481 next generation sequencing Methods 0.000 description 24
- 102000040430 polynucleotide Human genes 0.000 description 23
- 108091033319 polynucleotide Proteins 0.000 description 23
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 21
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 21
- 239000002157 polynucleotide Substances 0.000 description 21
- 108010061833 Integrases Proteins 0.000 description 18
- 102000018120 Recombinases Human genes 0.000 description 18
- 108010091086 Recombinases Proteins 0.000 description 18
- 108091079001 CRISPR RNA Proteins 0.000 description 17
- 230000014509 gene expression Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 125000005647 linker group Chemical group 0.000 description 16
- 102000004169 proteins and genes Human genes 0.000 description 14
- 230000008685 targeting Effects 0.000 description 13
- 241000700605 Viruses Species 0.000 description 12
- 238000006471 dimerization reaction Methods 0.000 description 12
- 235000004252 protein component Nutrition 0.000 description 12
- 235000018102 proteins Nutrition 0.000 description 12
- 102000003960 Ligases Human genes 0.000 description 10
- 108090000364 Ligases Proteins 0.000 description 10
- 108010042407 Endonucleases Proteins 0.000 description 9
- 108091023037 Aptamer Proteins 0.000 description 8
- 102100031780 Endonuclease Human genes 0.000 description 8
- 108060002716 Exonuclease Proteins 0.000 description 8
- 102000013165 exonuclease Human genes 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 108700004991 Cas12a Proteins 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 150000004713 phosphodiesters Chemical class 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- -1 Cst2 Proteins 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000001681 protective effect Effects 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 101710203526 Integrase Proteins 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 241000723666 Carnation ringspot virus Species 0.000 description 4
- 230000026279 RNA modification Effects 0.000 description 4
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000012636 effector Substances 0.000 description 4
- 231100000221 frame shift mutation induction Toxicity 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 3
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 3
- 101710144268 B- and T-lymphocyte attenuator Proteins 0.000 description 3
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 3
- 101710145992 B-cell lymphoma/leukemia 11A Proteins 0.000 description 3
- 102100024263 CD160 antigen Human genes 0.000 description 3
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 3
- 102100037249 Egl nine homolog 1 Human genes 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 101000761938 Homo sapiens CD160 antigen Proteins 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 102100037248 Prolyl hydroxylase EGLN2 Human genes 0.000 description 3
- 102100037247 Prolyl hydroxylase EGLN3 Human genes 0.000 description 3
- 241000723670 Red clover necrotic mosaic virus Species 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 241001135988 Sweet clover necrotic mosaic virus Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000011191 terminal modification Methods 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 description 2
- GNKZMNRKLCTJAY-UHFFFAOYSA-N 4'-Methylacetophenone Chemical compound CC(=O)C1=CC=C(C)C=C1 GNKZMNRKLCTJAY-UHFFFAOYSA-N 0.000 description 2
- 108010071258 4-hydroxy-2-oxoglutarate aldolase Proteins 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000713840 Avian erythroblastosis virus Species 0.000 description 2
- 241000713838 Avian myeloblastosis virus Species 0.000 description 2
- 241000714197 Avian myeloblastosis-associated virus Species 0.000 description 2
- 108010074708 B7-H1 Antigen Proteins 0.000 description 2
- 102100022970 Basic leucine zipper transcriptional factor ATF-like Human genes 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 102100038078 CD276 antigen Human genes 0.000 description 2
- 108010069682 CSK Tyrosine-Protein Kinase Proteins 0.000 description 2
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 2
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000709744 Enterobacterio phage MS2 Species 0.000 description 2
- 102100027581 Forkhead box protein P3 Human genes 0.000 description 2
- 101150106478 GPS1 gene Proteins 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 102100030648 Glyoxylate reductase/hydroxypyruvate reductase Human genes 0.000 description 2
- 101710200205 Glyoxylate reductase/hydroxypyruvate reductase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102100040754 Guanylate cyclase soluble subunit alpha-1 Human genes 0.000 description 2
- 102100040739 Guanylate cyclase soluble subunit beta-1 Human genes 0.000 description 2
- 102100028963 Guanylate cyclase soluble subunit beta-2 Human genes 0.000 description 2
- 102100028008 Heme oxygenase 2 Human genes 0.000 description 2
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 2
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 2
- 101000903742 Homo sapiens Basic leucine zipper transcriptional factor ATF-like Proteins 0.000 description 2
- 101000881648 Homo sapiens Egl nine homolog 1 Proteins 0.000 description 2
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 description 2
- 101001038755 Homo sapiens Guanylate cyclase soluble subunit alpha-1 Proteins 0.000 description 2
- 101001038731 Homo sapiens Guanylate cyclase soluble subunit beta-1 Proteins 0.000 description 2
- 101001059095 Homo sapiens Guanylate cyclase soluble subunit beta-2 Proteins 0.000 description 2
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 2
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 2
- 101000945351 Homo sapiens Killer cell immunoglobulin-like receptor 3DL1 Proteins 0.000 description 2
- 101000687344 Homo sapiens PR domain zinc finger protein 1 Proteins 0.000 description 2
- 101000881650 Homo sapiens Prolyl hydroxylase EGLN2 Proteins 0.000 description 2
- 101000881678 Homo sapiens Prolyl hydroxylase EGLN3 Proteins 0.000 description 2
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 2
- 101000634853 Homo sapiens T cell receptor alpha chain constant Proteins 0.000 description 2
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 2
- 101000666896 Homo sapiens V-type immunoglobulin domain-containing suppressor of T-cell activation Proteins 0.000 description 2
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 2
- 102100040061 Indoleamine 2,3-dioxygenase 1 Human genes 0.000 description 2
- 101710120843 Indoleamine 2,3-dioxygenase 1 Proteins 0.000 description 2
- 102100030236 Interleukin-10 receptor subunit alpha Human genes 0.000 description 2
- 101710146672 Interleukin-10 receptor subunit alpha Proteins 0.000 description 2
- 102100020788 Interleukin-10 receptor subunit beta Human genes 0.000 description 2
- 101710199214 Interleukin-10 receptor subunit beta Proteins 0.000 description 2
- 108010038501 Interleukin-6 Receptors Proteins 0.000 description 2
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 description 2
- 108010043610 KIR Receptors Proteins 0.000 description 2
- 102000002698 KIR Receptors Human genes 0.000 description 2
- 102100033627 Killer cell immunoglobulin-like receptor 3DL1 Human genes 0.000 description 2
- 102100034671 L-lactate dehydrogenase A chain Human genes 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 108010088350 Lactate Dehydrogenase 5 Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 102100020943 Leukocyte-associated immunoglobulin-like receptor 1 Human genes 0.000 description 2
- 241000213996 Melilotus Species 0.000 description 2
- 235000000839 Melilotus officinalis subsp suaveolens Nutrition 0.000 description 2
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 2
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 2
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 description 2
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 description 2
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 2
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 102100024894 PR domain zinc finger protein 1 Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010071690 Prealbumin Proteins 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 2
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 2
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 241000713824 Rous-associated virus Species 0.000 description 2
- 101000844752 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) DNA-binding protein 7d Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 description 2
- 101710090983 T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 description 2
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 2
- 102100033456 TGF-beta receptor type-1 Human genes 0.000 description 2
- 108091007178 TNFRSF10A Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108010011702 Transforming Growth Factor-beta Type I Receptor Proteins 0.000 description 2
- 102000009190 Transthyretin Human genes 0.000 description 2
- 102100040113 Tumor necrosis factor receptor superfamily member 10A Human genes 0.000 description 2
- 102100040112 Tumor necrosis factor receptor superfamily member 10B Human genes 0.000 description 2
- 101710178278 Tumor necrosis factor receptor superfamily member 10B Proteins 0.000 description 2
- 102100031167 Tyrosine-protein kinase CSK Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 description 2
- 102100038282 V-type immunoglobulin domain-containing suppressor of T-cell activation Human genes 0.000 description 2
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 2
- 208000020329 Zika virus infectious disease Diseases 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 2
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 2
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010052621 fas Receptor Proteins 0.000 description 2
- 102000018823 fas Receptor Human genes 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010062584 glycollate oxidase Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 108010031102 heme oxygenase-2 Proteins 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 102000006639 indoleamine 2,3-dioxygenase Human genes 0.000 description 2
- 108020004201 indoleamine 2,3-dioxygenase Proteins 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010025001 leukocyte-associated immunoglobulin-like receptor 1 Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 229940096913 pseudoisocytidine Drugs 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- OYTVCAGSWWRUII-DWJKKKFUSA-N 1-Methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=O)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O OYTVCAGSWWRUII-DWJKKKFUSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- HQHQCEKUGWOYPS-URBBEOKESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(octadecylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 HQHQCEKUGWOYPS-URBBEOKESA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- CWXIOHYALLRNSZ-JWMKEVCDSA-N 2-Thiodihydropseudouridine Chemical compound C1C(C(=O)NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O CWXIOHYALLRNSZ-JWMKEVCDSA-N 0.000 description 1
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- LCKIHCRZXREOJU-KYXWUPHJSA-N 2-[[5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]methylamino]ethanesulfonic acid Chemical compound C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O LCKIHCRZXREOJU-KYXWUPHJSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 description 1
- VRVXMIJPUBNPGH-XVFCMESISA-N 2-thio-dihydrouridine Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)N1CCC(=O)NC1=S VRVXMIJPUBNPGH-XVFCMESISA-N 0.000 description 1
- ZVGONGHIVBJXFC-WCTZXXKLSA-N 2-thio-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)N=CC=C1 ZVGONGHIVBJXFC-WCTZXXKLSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- ZSIINYPBPQCZKU-BQNZPOLKSA-O 4-Methoxy-1-methylpseudoisocytidine Chemical compound C[N+](CC1[C@H]([C@H]2O)O[C@@H](CO)[C@@H]2O)=C(N)N=C1OC ZSIINYPBPQCZKU-BQNZPOLKSA-O 0.000 description 1
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 description 1
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DMUQOPXCCOBPID-XUTVFYLZSA-N 4-Thio-1-methylpseudoisocytidine Chemical compound CN1C=C(C(=S)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O DMUQOPXCCOBPID-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- ZMWILHKEADCYLW-KCGFPETGSA-N 4-amino-1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-methoxyoxolan-2-yl]-5-methylpyrimidin-2-one Chemical compound CO[C@@]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=O)N=C(N)C(=C1)C ZMWILHKEADCYLW-KCGFPETGSA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- GCNTZFIIOFTKIY-UHFFFAOYSA-N 4-hydroxypyridine Chemical compound OC1=CC=NC=C1 GCNTZFIIOFTKIY-UHFFFAOYSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- FIWQPTRUVGSKOD-UHFFFAOYSA-N 4-thio-1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=S FIWQPTRUVGSKOD-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- XUNBIDXYAUXNKD-DBRKOABJSA-N 5-aza-2-thio-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)N=CN=C1 XUNBIDXYAUXNKD-DBRKOABJSA-N 0.000 description 1
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- RPQQZHJQUBDHHG-FNCVBFRFSA-N 5-methyl-zebularine Chemical compound C1=C(C)C=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RPQQZHJQUBDHHG-FNCVBFRFSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- CBNRZZNSRJQZNT-IOSLPCCCSA-O 6-thio-7-deaza-guanosine Chemical compound CC1=C[NH+]([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C(NC(N)=N2)=C1C2=S CBNRZZNSRJQZNT-IOSLPCCCSA-O 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N Adenosine Natural products C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 102000007471 Adenosine A2A receptor Human genes 0.000 description 1
- 108010085277 Adenosine A2A receptor Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000710073 Bean yellow mosaic virus Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101710185679 CD276 antigen Proteins 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- DCYBPMFXJCWXNB-JWIUVKOKSA-N CNDAC Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](C#N)[C@H](O)[C@@H](CO)O1 DCYBPMFXJCWXNB-JWIUVKOKSA-N 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101150066398 CXCR4 gene Proteins 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 101100298998 Caenorhabditis elegans pbs-3 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 description 1
- 102000014414 Citramalyl-CoA lyases Human genes 0.000 description 1
- 108050003472 Citramalyl-CoA lyases Proteins 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 1
- 102000010170 Death domains Human genes 0.000 description 1
- 108050001718 Death domains Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- 101710111663 Egl nine homolog 1 Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- SAMRUMKYXPVKPA-VFKOLLTISA-N Enocitabine Chemical compound O=C1N=C(NC(=O)CCCCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 SAMRUMKYXPVKPA-VFKOLLTISA-N 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101000884279 Homo sapiens CD276 antigen Proteins 0.000 description 1
- 101000710917 Homo sapiens Citramalyl-CoA lyase, mitochondrial Proteins 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 101001055145 Homo sapiens Interleukin-2 receptor subunit beta Proteins 0.000 description 1
- 101000836954 Homo sapiens Sialic acid-binding Ig-like lectin 10 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 1
- 101000851370 Homo sapiens Tumor necrosis factor receptor superfamily member 9 Proteins 0.000 description 1
- 101000955999 Homo sapiens V-set domain-containing T-cell activation inhibitor 1 Proteins 0.000 description 1
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100026879 Interleukin-2 receptor subunit beta Human genes 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 101710197058 Lectin 7 Proteins 0.000 description 1
- 101710197064 Lectin 9 Proteins 0.000 description 1
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-N Metaphosphoric acid Chemical compound OP(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-N 0.000 description 1
- 102000006833 Multifunctional Enzymes Human genes 0.000 description 1
- 108010047290 Multifunctional Enzymes Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- 102000004722 NADPH Oxidases Human genes 0.000 description 1
- 108010002998 NADPH Oxidases Proteins 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 101710141230 Natural killer cell receptor 2B4 Proteins 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- XMIFBEZRFMTGRL-TURQNECASA-N OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S XMIFBEZRFMTGRL-TURQNECASA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 101150044917 Prl3b1 gene Proteins 0.000 description 1
- 101150113550 Prl3d1 gene Proteins 0.000 description 1
- 108010043005 Prolyl Hydroxylases Proteins 0.000 description 1
- 102000004079 Prolyl Hydroxylases Human genes 0.000 description 1
- 101710170760 Prolyl hydroxylase EGLN2 Proteins 0.000 description 1
- 101710170720 Prolyl hydroxylase EGLN3 Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000712909 Reticuloendotheliosis virus Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 102100027164 Sialic acid-binding Ig-like lectin 10 Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241000205091 Sulfolobus solfataricus Species 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 1
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 102100036856 Tumor necrosis factor receptor superfamily member 9 Human genes 0.000 description 1
- 241001069823 UR2 sarcoma virus Species 0.000 description 1
- 108010079206 V-Set Domain-Containing T-Cell Activation Inhibitor 1 Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000714476 Y73 sarcoma virus Species 0.000 description 1
- 241001531188 [Eubacterium] rectale Species 0.000 description 1
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000005266 avian sarcoma Diseases 0.000 description 1
- 102000012740 beta Adrenergic Receptors Human genes 0.000 description 1
- 108010079452 beta Adrenergic Receptors Proteins 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- FUHMZYWBSHTEDZ-UHFFFAOYSA-M bispyribac-sodium Chemical compound [Na+].COC1=CC(OC)=NC(OC=2C(=C(OC=3N=C(OC)C=C(OC)N=3)C=CC=2)C([O-])=O)=N1 FUHMZYWBSHTEDZ-UHFFFAOYSA-M 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 101150037603 cst-1 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- ANCLJVISBRWUTR-UHFFFAOYSA-N diaminophosphinic acid Chemical compound NP(N)(O)=O ANCLJVISBRWUTR-UHFFFAOYSA-N 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000961 floxuridine Drugs 0.000 description 1
- ODKNJVUHOIMIIZ-RRKCRQDMSA-N floxuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 ODKNJVUHOIMIIZ-RRKCRQDMSA-N 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- IJJVMEJXYNJXOJ-UHFFFAOYSA-N fluquinconazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1N1C(=O)C2=CC(F)=CC=C2N=C1N1C=NC=N1 IJJVMEJXYNJXOJ-UHFFFAOYSA-N 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 150000002339 glycosphingolipids Chemical class 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 108010070387 guanylate cyclase 1 Proteins 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229940100601 interleukin-6 Drugs 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-N selenophosphoric acid Chemical compound OP(O)([SeH])=O JRPHGDYSKGJTKZ-UHFFFAOYSA-N 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- GFFXZLZWLOBBLO-ASKVSEFXSA-N tezacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C/F)/[C@H](O)[C@@H](CO)O1 GFFXZLZWLOBBLO-ASKVSEFXSA-N 0.000 description 1
- 229950006410 tezacitabine Drugs 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 210000005239 tubule Anatomy 0.000 description 1
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- QAOHCFGKCWTBGC-QHOAOGIMSA-N wybutosine Chemical compound C1=NC=2C(=O)N3C(CC[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QAOHCFGKCWTBGC-QHOAOGIMSA-N 0.000 description 1
- QAOHCFGKCWTBGC-UHFFFAOYSA-N wybutosine Natural products C1=NC=2C(=O)N3C(CCC(NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1C1OC(CO)C(O)C1O QAOHCFGKCWTBGC-UHFFFAOYSA-N 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
(a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산; (b) 역전사효소(RT) 폴리펩타이드 또는 RT 폴리펩타이드를 암호화하는 제2 핵산; (c) 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산으로서, gRNA는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 관심 게놈 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하고, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 제3 핵산; 및 (d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 제4 핵산을 포함하는 유전자 편집 시스템.
Description
관련 출원에 대한 상호참조
본 출원은 35 U.S.C. § 119(e)하에 2021년 6월 1일자로 출원된 미국 특허 가출원 제63/195,621호, 2021년 8월 23일자로 출원된 미국 특허 가출원 제63/236,047호, 2021년 10월 28일자로 출원된 미국 특허 가출원 제63/272,937호 및 2022년 1월 14일자로 출원된 미국 특허 가출원 제63/299,695호에 대한 우선권을 주장하며, 이들 기초출원 각각의 내용은 전체가 참조에 의해 본 명세서에 원용된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출되고 여기에 전체가 참조에 의해 원용되어 있는 서열 목록을 포함한다. 2022년 5월 30일에 생성된 상기 ASCII 사본은 이름이 116928-0042-0001WO00_SEQ.txt이고, 크기가 385,353 바이트이다.
집합적으로 CRISPR-Cas 또는 CRISPR/Cas 시스템으로 알려진 일정한 간격으로 주기적으로 분포하는 짧은 회문 반복서열(Clustered Regularly Interspaced Short Palindromic Repeat: CRISPR) 및 CRISPR-관련(Cas) 유전자는 외부 유전적 요소로부터 특정 종을 방어하는 고세균 및 세균의 적응 면역계이다.
본 개시내용은 적어도 부분적으로 유형 V CRISPR 뉴클레이스 폴리펩타이드(예를 들어, Cas12i2 폴리펩타이드) 및 역전사효소뿐만 아니라 CRISPR 뉴클레이스 폴리펩타이드에 의한 관심 유전자 부위에서의 절단을 매개하는 가이드 RNA(gRNA) 및 관심 게놈 부위에 혼입될 목적하는 서열의 합성을 매개하는 역전사 공여체 RNA를 포함하는 유전자 편집 시스템의 개발에 기초하고 있다. 본 명세서에 보고된 바와 같이, 본 명세서에 개시된 유전자 편집 시스템은 높은 편집 효율과 정확성으로 다양한 게놈 부위에서 성공적인 유전자 편집을 달성하였다. 이론에 얽매이지 않고, 본 명세서에 개시된 유전자 편집 시스템은 다음과 같은 유리한 특징 중 적어도 하나를 보여준다:
1. Cas12i 폴리펩타이드에 특이적인 것과 같은 본 명세서에 기재된 편집 주형 RNA 중 다수는 트랜스-활성화 CRISPR RNA(trans-activating CRISPR RNA: tracrRNA) 구성요소를 필요로 하지 않으므로, 프라임 편집 가이드 RNA(prime editing guide RNA: pegRNA)보다 작다. 추가적으로, Cas12i 폴리펩타이드-역전사효소 융합체와 같은 본 명세서에 기재된 CRISPR 뉴클레이스-역전사효소 융합체 중 다수는 Cas9-역전사효소 융합체보다 작다. 이들 양태는 모두 전달 및 합성 비용의 측면에서 바람직하다.
2. 본 명세서에 기재된 편집 주형 RNA는 pegRNA의 프라이머 결합 부위(primer binding site: PBS)보다 더 긴 PBS를 갖도록 설계될 수 있다. 이 특징은 표적 핵산에 혼입시키는 편집 효율을 증가시킬 수 있다.
3. 본 명세서에 기재된 바와 같이 비-PAM 가닥(즉, PAM 모티프가 존재하는 가닥의 상보적 가닥; 본 명세서에서 표적 가닥으로도 기재됨)에만 결합하도록 설계된 편집 주형 RNA를 포함하는 유전자 편집 시스템은 프라임 편집 시스템에 비 해 더 넓은 창에 걸쳐 편집을 혼입시킬 수 있다. 특히, Cas12i 폴리펩타이드-역전사효소 시스템은 Cas12i 폴리펩타이드 및 RNA 가이드의 전체 인식 서열을 다시 작성할 수 있다. 따라서, 이러한 유전자 편집 시스템은 CRISPR 뉴클레이스-역전사효소 융합체 및 편집 주형 RNA에 의한 표적 핵산의 재표적화를 회피하는 데 더 효율적일 수 있다.
따라서, 유전자 편집 시스템, 약제학적 조성물 또는 이를 포함하는 키트, 유전자 편집 시스템을 사용하여 유전자 변형된 세포를 생산하는 방법 및 이에 따라 생성된 세포가 본 명세서에 제공된다.
일부 양태에서, 본 개시내용은 다음을 포함하는 유전자 편집 시스템을 특징으로 한다: (a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산; (b) 역전사효소(reverse transcriptase: RT) 폴리펩타이드 또는 RT 폴리펩타이드를 암호화하는 제2 핵산; (c) 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산으로서, gRNA는 유형 V CRISPR 뉴클레이스(CRISPR 뉴클레이스 결합 부위)에 의해 인식 가능한 하나 이상의 결합 부위 및 관심 게놈 부위 내 표적 서열에 특이적인 스페이서 서열을 포함하고, 표적 서열은 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)에 인접해 있는, 상기 가이드 RNA(gRNA) 또는 gRNA를 암호화하는 제3 핵산; 및 (d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템 내의 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12 폴리펩타이드이다. 일부 예에서, Cas12 폴리펩타이드는 Cas12i 폴리펩타이드, 예를 들어, Cas12i2 폴리펩타이드이다. 일부 경우에, Cas12i 폴리펩타이드는 서열번호 2와 적어도 95% 동일한 아미노산 서열을 포함하는 Cas12i2 폴리펩타이드이다.
일부 경우에, Cas12i2 폴리펩타이드는 서열번호 2의 D581, G624, F626, P868, I926, V1030, E1035 및/또는 S1046 위치에 하나 이상의 돌연변이를 포함한다. 예를 들어, 하나 이상의 돌연변이는 아미노산 치환이며, 이는 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R, S1046G 또는 이들의 조합이다. 일례에서, Cas12i2 폴리펩타이드는 D581, D911, I926 및 V1030의 위치에 돌연변이(예를 들어, D581R, D911R, I926R 및 V1030G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, I926 및 V1030의 위치에 돌연변이(예를 들어, D581R, I926R 및 V1030G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, I926, V1030 및 S1046 위치에 돌연변이(예를 들어, D581R, I926R, V1030G 및 S1046G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, G624, F626, I926, V1030, E1035 및 S1046 위치에 돌연변이(예를 들어, D581R, G624R, F626R, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환)를 포함한다. 또 다른 예에서, Cas12i2 폴리펩타이드는 D581, G624, F626, P868, I926, V1030, E1035 및 S1046 위치에 돌연변이(예를 들어, D581R, G624R, F626R, P868T, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환)를 포함한다. 본 명세서에 개시된 임의의 유전자 편집 시스템에 사용하기 위한 예시적인 Cas12i2 폴리펩타이드는 서열번호 3 내지 7 중 어느 하나의 아미노산 서열을 포함할 수 있다. 일부 예에서, 예시적인 Cas12i2 폴리펩타이드는 서열번호 4의 아미노산 서열을 포함할 수 있다. 다른 예에서, 예시적인 Cas12i2 폴리펩타이드는 서열번호 7의 아미노산 서열을 포함할 수 있다.
다른 경우에, Cas12i 폴리펩타이드는 감소된 crRNA 처리 활성을 가지며, 선택적으로 Cas12i 폴리펩타이드는 서열번호 2의 H485 위치 및/또는 H486 위치에 돌연변이를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산을 포함할 수 있다. 일부 경우에, 제1 핵산은 제1 벡터(예를 들어, 아데노-관련 바이러스 벡터 또는 AAV 벡터와 같은 바이러스 벡터)에 위치한다. 다른 경우에, 제1 핵산은 제1 메신저 RNA(mRNA)이다.
본 명세서에 개시된 임의의 유전자 편집 시스템에서, RT 폴리펩타이드는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV)-RT, 마우스 유방 종양 바이러스(mouse mammary tumor virus: MMTV)-RT, 마라톤-RT 또는 RTx-RT(예를 들어, 서열번호 29의 아미노산 서열을 포함할 수 있는 MMLV RT)일 수 있다. 일부 경우에, 유전자 편집 시스템은 RT 폴리펩타이드를 포함한다. 대안적으로, 시스템은 RT 폴리펩타이드를 암호화하는 제2 핵산을 포함한다. 일부 경우에, 제2 핵산은 제2 벡터(예를 들어, 아데노-관련 바이러스 벡터 또는 AAV 벡터와 같은 바이러스 벡터)에 위치한다. 일례에서, 유전자 편집 시스템은 유형 V CRISPR 폴리펩타이드를 암호화하는 제1 핵산 및 RT 폴리펩타이드를 암호화하는 제2 핵산 모두를 포함하는 벡터(예를 들어, 바이러스 벡터)를 포함한다. 다른 예에서, RT를 암호화하는 제2 핵산은 제2 mRNA이다. 일례에서, 유전자 편집 시스템은 유형 V CRISPR 폴리펩타이드를 암호화하는 제1 mRNA 및 RT를 암호화하는 제2 mRNA를 모두 포함하는 단일 RNA 분자를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드와 RT 폴리펩타이드를 포함하는 융합 폴리펩타이드 또는 융합 폴리펩타이드를 암호화하는 핵산(예를 들어, 바이러스 벡터와 같은 벡터)을 포함한다. 대안적으로, 유전자 편집 시스템은 2개의 개별 폴리펩타이드로서 유형 V CRISPR 뉴클레이스 폴리펩타이드 및 RT 폴리펩타이드를 포함한다.
본 명세서에 개시된 임의의 유전자 편집 시스템에서, 스페이서 서열은 20개 내지 30개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, 스페이서 서열은 20개의 뉴클레오타이드 길이이다.
일부 실시형태에서, PAM은 5'-TTN-3'의 모티프를 포함한다. 일부 경우에(예를 들어, Cas12i2 폴리펩타이드와 관련하여), PAM은 표적 서열에 대해 5'에 위치할 수 있다.
일부 실시형태에서, 하나 이상의 CRISPR 뉴클레이스 결합 부위는 직접 반복 서열(들)이다. 일부 경우에, 각각의 직접 반복 서열은 23개 내지 36개의 뉴클레오타이드 길이이다. 일례에서, 직접 반복 서열은 23개의 뉴클레오타이드 길이이다. 일부 예에서, 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나(예를 들어, 서열번호 17) 또는 이의 단편과 적어도 90% 동일하다. 특정 예에서, 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나(예를 들어, 서열번호 17) 또는 이의 단편이다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 gRNA를 포함한다. 대안적으로, 유전자 편집 시스템은 gRNA를 암호화하는 제3 핵산을 포함한다. 일부 예에서, 제3 핵산은 제3 벡터에 위치하며, 이는 선택적으로 바이러스 벡터이다. 일부 예에서, 유전자 편집 시스템은 gRNA를 암호화하는 제3 핵산 및 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 RT 폴리펩타이드를 암호화하는 제1 및/또는 제2 핵산을 포함하는 바이러스 벡터와 같은 벡터를 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템의 RT 공여체 RNA의 PBS는 5개 내지 100개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, PBS는 10개 내지 60개의 뉴클레오타이드 길이이다. 특정 예에서, PBS는 10개 내지 30개의 뉴클레오타이드 길이이다. 일부 경우에, PBS는 표적 서열의 상보적 영역에 인접한 PBS-표적화 부위에 결합한다. PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 있다. 예를 들어, PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드(예를 들어, 4개 내지 10개의 뉴클레오타이드)일 수 있다. 대안적으로, PBS-표적화 부위는 표적 서열의 상보적 영역과 중첩될 수 있다. 다른 경우에, PBS-표적화 부위는 표적 서열에 인접하거나 또는 이와 중첩된다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템의 RT 공여체 RNA의 주형 서열은 5개 내지 100개의 뉴클레오타이드 길이일 수 있다. 예를 들어, 주형 서열은 30개 내지 50개의 뉴클레오타이드 길이일 수 있다. 일부 경우에, 주형 서열은 관심 게놈 부위와 상동일 수 있고, 관심 게놈 부위에 비해 하나 이상의 뉴클레오타이드 변이를 포함한다. 일부 예에서, 적어도 하나의 뉴클레오타이드 변이는 표적 서열 내에 위치한다. 대안적으로 또는 이에 더하여, 적어도 하나의 뉴클레오타이드 변이는 PAM에 위치한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템은 RT 공여체 RNA를 포함한다. 대안적으로, 유전자 편집 시스템은 RT 공여체 RNA를 암호화하는 제4 핵산을 포함한다. 일부 예에서, 제4 핵산은 제4 벡터에 위치하며, 이는 선택적으로 제4 바이러스 벡터이다. 일부 경우에, 유전자 편집 시스템은 RT 공여체 RNA를 암호화하는 핵산 및 가이드 RNA, 유형 V CRISPR 뉴클레이스 폴리펩타이드 및 RT 폴리펩타이드를 암호화하는 하나 이상의 추가적인 핵산을 포함하는 바이러스 벡터와 같은 벡터를 포함한다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 gRNA 및 RT 공여체 RNA를 포함하는 단일 RNA 분자를 포함한다. 이러한 단일 RNA는 임의의 적합한 순서로 배열될 수 있는 CRISPR 뉴클레이스 결합 부위, 스페이서 서열, PBS 및 주형 서열을 포함한다. 일부 예에서, 단일 RNA 분자는 gRNA와 RT 공여체 RNA 사이에 링커를 추가로 포함한다. 이러한 링커는 헤어핀 구조를 포함할 수 있다. 일례에서, 단일 RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 링커, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다. 또 다른 예에서, 단일 RNA 분자는, 5'에서 3'로, 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다.
일부 경우에, 본 명세서에 개시된 임의의 단일 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함할 수 있다. 5' 말단 보호 단편 및 3' 말단 보호 단편 각각은 2차 구조, 예를 들어, 헤어핀, 슈도노트(pseudoknot) 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 특정 예에서, 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다는 CRISPR 뉴클레이스 결합 부위 중 하나 이상을 포함할 수 있다. 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다는 임의의 인간 서열과 상동이 아닌(염기 페어링을 통해 임의의 인간 서열에 결합할 수 없음) 하나 이상의 분절을 추가로 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 2개의 개별 RNA 분자로서 임의의 gRNA 및 임의의 RT 공여체 RNA를 포함한다. 일부 예에서, gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함할 수 있다. 각각의 보호 단편은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
본 명세서에 개시된 임의의 유전자 편집 시스템은 하나 이상의 지질 나노입자(lipid nanoparticle: LNP)를 포함할 수 있으며, 이는 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 암호화 핵산, RT 폴리펩타이드 또는 암호화 핵산, 가이드 RNA 또는 암호화 핵산, RT 공여체 RNA 또는 암호화 핵산 또는 이들의 임의의 조합을 포괄한다. 대안적으로, 유전자 편집 시스템은 (i) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 암호화 핵산, RT 폴리펩타이드 또는 암호화 핵산, 가이드 RNA 또는 암호화 핵산, RT 공여체 RNA 또는 암호화 핵산으로부터 선택되는 최대 3개의 구성요소를 집합적으로 포함하는 하나 이상의 지질 나노입자(LNP); 및 (ii) 유전자 편집 시스템의 나머지 구성요소를 암호화하는 하나 이상의 벡터를 포함할 수 있다. 일부 경우에, 하나 이상의 벡터는 하나 이상의 바이러스 벡터, 예를 들어, 하나 이상의 아데노-관련 바이러스(AAV) 벡터일 수 있다.
일부 예에서, 본 명세서에 개시된 유전자 편집 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드, RT 폴리펩타이드, gRNA 및 RT 공여체 RNA를 포함한다. 일부 경우에, 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 RT 폴리펩타이드는 gRNA 및/또는 RT 공여체 RNA와 복합체(예를 들어, 리보핵단백질(ribonucleoprotein: RNP) 복합체)를 형성한다.
일부 양태에서, 본 개시내용은 또한 본 명세서에 개시된 임의의 유전자 편집 시스템 및 약제학적으로 허용 가능한 담체를 포함하는 약제학적 조성물 및 유전자 편집 시스템의 구성요소를 포함하는 키트를 제공한다.
다른 양태에서, 본 개시내용은 또한 세포를 유전자 편집하는 방법을 특징으로 하며, 해당 방법은 숙주 세포를 유전자 편집하기 위해 숙주 세포를 본 명세서에 개시된 임의의 유전자 편집 시스템 또는 이를 포함하는 약제학적 조성물과 접촉시키는 단계를 포함한다. 일부 예에서, 숙주 세포는 시험관내에서 배양된다. 다른 예에서, 접촉시키는 단계는 유전자 편집 시스템을 숙주 세포를 포함하는 대상체에게 투여하는 것에 의해 수행된다.
또한, 본 개시내용의 범위 내에 본 명세서에 개시된 유전자 편집 시스템에 의해 생산될 수 있는 유전자 변형된 세포의 집단이 있다. 일부 예에서, 유전자 변형된 세포는 유전자 편집 시스템에 의해 편집될 수 없는 세포를 포함할 수 있으며, 예를 들어, PAM, 표적 서열 또는 둘 다에 하나 이상의 변형을 포함할 수 있다.
또 다른 양태에서, 본 개시내용은 (i) 유형 V CRISPR 뉴클레이스(CRISPR 뉴클레이스 결합 부위)에 의해 인식 가능한 하나 이상의 결합 부위; (ii) 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열로서, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 스페이서 서열; (iii) 프라이머 결합 부위(PBS); 및 (iv) 주형 서열을 포함하는 유전자 편집 RNA 분자를 특징으로 한다. 일부 실시형태에서, 유전자 편집 RNA 분자는 본 명세서에 개시된 것과 같은 하나 이상의 링커를 추가로 포함할 수 있다.
일부 예에서, RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 주형 서열 및 PBS를 포함한다. 다른 예에서, RNA 분자는, 5'에서 3'로, CRISPR 뉴클레이스 결합 부위, 스페이서 서열, 링커, 주형 서열 및 PBS를 포함한다. 또 다른 예에서, RNA 분자는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다. 또 다른 예에서, RNA 분자는, 5'에서 3'로, 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 부위 및 스페이서 서열을 포함한다.
본 명세서에 개시된 임의의 유전자 편집 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함할 수 있다. 보호 단편 각각은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
또한, 본 개시내용은 (i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하는 가이드 RNA로서, 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 가이드 RNA; 및 (ii) 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산으로서, RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 RT 공여체 RNA를 암호화하는 제4 핵산을 포함하는 유전자 편집 RNA 분자(2개의 개별 RNA 분자) 세트를 특징으로 한다. 일부 예에서, gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함한다. 각각의 보호 단편은 2차 구조, 예를 들어, 헤어핀, 슈도노트 또는 삼중 구조를 형성할 수 있다. 일부 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 예에서, 5' 말단 보호 단편 및/또는 3' 말단 보호 단편은 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함한다.
또한, 본 명세서에 개시된 바와 같은 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트를 암호화하는 DNA 분자 또는 DNA 분자 세트가 본 명세서에 제공된다. 일부 예에서, 제76항의 DNA 분자 또는 DNA 분자 세트는 벡터 또는 벡터 세트에 포함되며, 선택적으로 벡터 또는 벡터 세트는 바이러스 벡터이다.
또한, CRISPR 뉴클레이스 및 역전사효소를 포함하는 융합 폴리펩타이드가 본 명세서에 제공된다. 임의의 이러한 CRISPR 뉴클레이스-RT 융합 폴리펩타이드는 본 명세서에 개시된 유전자 편집 시스템에 사용될 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 유형 V CRISPR 뉴클레이스, 예를 들어, Cas12i 폴리펩타이드이다. 일부 예에서, Cas12i 폴리펩타이드는 Cas12i2 폴리펩타이드, 예를 들어, 본 명세서에 개시된 것이다. 특정 예에서, 융합 폴리펩타이드는 25 내지 26 및 219 내지 223의 아미노산 서열을 포함할 수 있다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i4 폴리펩타이드이다. 일부 예에서, Cas12i4 폴리펩타이드는 MMLV RT와 같은 역전사효소와 융합될 수 있다. 이러한 융합 Cas12i4-RT 융합 폴리펩타이드는 서열번호 53의 아미노산 서열을 포함할 수 있다.
발현 벡터와 같은 벡터(예를 들어, 바이러스 벡터)를 포함하여 임의의 CRISPR 뉴클레이스-RT 융합 폴리펩타이드를 암호화하는 임의의 핵산도 본 개시내용의 범위 내에 있다.
본 발명의 하나 이상의 실시형태의 세부사항은 아래의 설명에서 제시된다. 본 발명의 다른 특징 또는 장점은 다음의 도면과 여러 실시형태의 상세한 설명, 그리고 첨부된 청구범위로부터 명백해질 것이다.
다음 도면은 본 명세서의 일부를 형성하고 본 개시내용의 소정의 양태를 추가로 입증하기 위해 포함되며, 이는 본 명세서에 제시된 특정 실시형태의 상세한 설명과 함께 도면을 참조함으로써 더 잘 이해될 수 있다.
도 1a 내지 도 1b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 1a는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. PBS는 표적 핵산의 PAM-가닥(비표적 가닥으로도 알려져 있음)에 대한 실질적인 상보성을 포함한다. 도 1b는 역전사효소에 융합된 Cas9 닉케이스(nickase)(왼쪽) 및 역전사효소에 융합된 Cas12i 닉케이스(오른쪽)를 보여준다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 PAM 가닥에 혼입된다.
도 2는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 PAM 가닥에 대한 상보성을 포함한다.
도 3은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RT 공여체 RNA를 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 편집은 CRISPR 뉴클레이스에 의한 절단 후 게놈에 혼입된다.
도 4는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RNA 역전사 주형 서열을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. 편집은 CRISPR 뉴클레이스의 존재하에 게놈에 혼입된다.
도 5는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 표적 핵산에 대한 미스매치를 포함하는 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS를 포함한다. PBS는 표적 핵산의 비-PAM 가닥(표적 가닥 또는 TS로도 알려져 있음)에 대한 상보성을 포함한다.
도 6a 내지 도 6b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 6a는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. RNA 가이드의 스페이서 서열 및 PBS가 표적 핵산에 결합되면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. PAM 가닥 및 비-PAM 가닥에서 변이형 Cas12i2 절단 부위는 삼각형으로 표시된다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 비-PAM 가닥에 혼입된다. 도 6b는 편집, 역전사 주형 서열 및 PBS의 위치 지정을 보여주며, 여기서 역전사 주형 서열 및 PBS의 길이는 다양할 수 있다.
도 7은 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다.
도 8a 내지 도 8c는 예시적인 Cas12i2 RNA 가이드-RT 공여체 RNA 융합체를 보여주는 개략도를 포함한다. 도 8a는 실시예 1에서 테스트된 RT 공여체 RNA에 융합된 변이형 Cas12i2 RNA 가이드의 개략도이다. RNA 가이드의 스페이서는 5'-TTT-3' PAM에 인접한 비-PAM 가닥에 결합한다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 스페이서 서열 및 PBS가 표적 핵산에 결합하면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. 이 개략도에서, PBS는 13개의 뉴클레오타이드 길이이고, 역전사 주형 서열은 34개의 뉴클레오타이드 길이이다. PBS는 비-PAM 가닥에 대한 상보성이 절단 부위(삼각형)에서 시작하도록 설계되었다. 도 8b은 실시예 1에서 테스트된 바와 같이 AAVS1_T7 게놈 부위를 표적으로 하는 예시적인 RNA 가이드-RT 공여체 RNA 융합체를 보여준다. 다양한 PBS 길이가 테스트되었다(13개, 30개 및 60개의 뉴클레오타이드). RNA 가이드-RT 공여체 RNA 융합체는 표적 서열에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 8c는 실시예 1에 기술된 바와 같이 AAVS1_T7 게놈 부위(상부 패널), EMX1_T6 게놈 부위(중간 패널) 및 VEGFA_T5 게놈 부위(하부 패널)에 도입된 암호화된 편집(치환, 삽입 및 결실)을 보여준다. 도 8a의 서열은 위에서 아래로 서열번호 65 내지 67이다. 도 8b의 서열은 위에서 아래로 서열번호 74 내지 80 및 87 내지 89이다. 도 8c의 서열은 위에서 아래로 서열번호 248 내지 259이다.
도 9a 내지 도 9j는 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 9a는 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드(read)의 백분율을 보여준다. 도 9b는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9c는 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9d는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T7 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9e는 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 도입된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9f는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 도입된 indel 및 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, EMX1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9g는 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9h는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T2 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9i는 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9j는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T5 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다.
도 10은 역전사효소에 융합된 Cas12i 폴리펩타이드(예를 들어, Cas12i2 닉케이스)를 보여주는 개략도이다. RNA 가이드의 5' 말단 또는 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 암호화된 편집은 표적 핵산의 PAM 가닥에 혼입된다. RNA 가이드-RT 공여체 RNA의 말단은 엑소뉴클레이스 또는 엔도뉴클레이스 활성을 방지하기 위해 보호될 수 있다. PBS 길이는 약 3개 내지 100개의 뉴클레오타이드로 다양할 수 있으며, PAM 가닥에 대한 실질적인 상보성을 포함할 수 있다. 헤어핀과 같이 구조화된 RNA는 스페이서와 역전사 주형 서열 사이에 도입될 수 있다.
도 11은 제2 직접 반복(DR)-스페이서 서열에 추가로 융합된 RNA 가이드-RT 공여체 RNA를 보여주는 개략도이다. 추가적인 DR-스페이서는 엑소뉴클레이스 활성을 저해한다.
도 12a 내지 도 12b는 편집 주형 RNA(유전자 편집 RNA)의 예시적인 설계를 보여주는 개략도를 포함한다. 도 12a는 3' 말단 보호를 추가로 포함하는 편집 주형 RNA(5'- 뉴클레이스 결합 서열 - DNA-결합 서열 - 역전사 주형 - PBS -3')를 도시하는 개략도이다. 3' 말단 보호는 화학적 말단 보호(도면의 상단 부분) 또는 헤어핀(도면의 하단 부분)일 수 있다. 헤어핀은 직접 반복 서열과 같은 뉴클레이스 결합 서열일 수 있다. 도 12b는 5' 말단 보호가 있거나 없는 편집 주형 RNA(5'-역전사 주형 - PBS 뉴클레이스 결합 서열 - DNA-결합 서열-3')를 도시하는 개략도이다. 5' 말단 보호는 도면의 하단 부분에 나타낸 바와 같은 헤어핀(예를 들어, 직접 반복 서열과 같은 뉴클레이스 결합 서열)일 수 있다.
도 13a 내지 도 13d는 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 13a는 AAVS1_T7 게놈 부위(서열번호 30)에서 서열번호 112의 RNA 가이드 또는 서열번호 123 내지 137의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13b는 EMX1_T6 게놈 부위(서열번호 34)에서 서열번호 114의 RNA 가이드 또는 서열번호 138 내지 152의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13c는 VEGFA_T2(서열번호 36)에서 서열번호 116의 RNA 가이드 또는 서열번호 153 내지 167의 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13d는 VEGFA_T5 게놈 부위(서열번호 38)에서 서열번호 118의 RNA 가이드 또는 서열번호 168 내지 182의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다.
도 14a 내지 도 14c는 RNA 가이드 또는 편집 주형 RNA를 사용하여 Cas12i2의 절단 패턴을 확인하는 데 사용되는 검정의 단계를 도시하는 개략도를 포함한다. 도 14a는 표적 서열 및 바코드를 포함하는 올리고 구성을 보여준다. 도 14b는 5' 및 3' 오버행을 평활 말단화(blunt)시키기 위한 절단 산물의 처리 또는 5' 오버행을 필인(fill in)시키기 위한 말단 복구를 보여준다. 도 14c는 절단 산물의 증폭을 보여준다.
도 15a 내지 도 15e는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집을 보여주는 다이어그램을 포함한다. 도 15a는 AAVS1_T2 게놈 부위의 PAM 가닥 및 비-PAM 가닥에서 서열번호 2의 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 도시하는 개략도이다. 도 15b는 필인 처리 후 5' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15c는 필인 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15d는 평활 말단화(blunting) 처리 후 5' 절단 산물로부터 얻은 리드 길이의 히스토그램이다. 도 15e는 평활 말단화 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 각각의 리드 길이 히스토그램은 도 15b 내지 도 15e의 x-축에 도시된 바와 같이 표적 서열에 매핑된다.
도 16a 내지 도 16b는 EMX1_T6 게놈 부위(도 16a) 및 VEGFA_T5 게놈 부위(도 16b)의 PAM 가닥 또는 비-PAM 가닥에서 서열번호 2의 Cas12i2 또는 서열번호 4의 변이형 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 보여준다. 기준 막대(오른쪽)는 시퀀싱 리드 수로 측정된 경우 절단 빈도를 나타낸다.
도 17a 내지 도 17b는 예시적인 게놈 크기에서의 유전자 편집 결과를 보여주는 다이어그램을 포함한다. 도 17a는 AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 34개의 뉴클레오타이드 역전사 주형 서열 및 3개, 8개, 13개, 30개 또는 60개의 뉴클레오타이드 PBS로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17b는 AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 데 있어서 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 13개의 뉴클레오타이드 PBS 및 14개, 24개, 34개, 44개 또는 54개의 뉴클레오타이드 역전사 주형 서열로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17a의 서열은, 위에서 아래로, 서열번호 90 내지 92이다. 도 17b의 서열은, 위에서 아래로, 서열번호 90 내지 92이다.
도 18은 U2OS 세포의 AAVS1_T7 게놈 부위(서열번호 32) 및 EMX1_T6 게놈 부위(서열번호 34)에 혼입된 암호화된 편집을 보여준다.
도 19a 내지 도 19b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집 절차를 예시하는 개략도를 포함한다. 도 19a는 역전사효소 및 pegRNA에 융합된 Cas9를 포함하는 Cas9 프라임 편집기를 도시하는 개략도이다. Cas9에 의한 PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 pegRNA의 혼성화는 역전사가 개시되게 한다. 도 19b는 역전사효소 및 편집 주형 RNA에 융합된 유형 V CRISPR 뉴클레이스를 도시하는 개략도이다. 유형 V CRISPR 뉴클레이스에 의한 비-PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 편집 주형 RNA의 혼성화는 역전사가 개시되게 한다.
도 20a 내지 도 20c는 나타낸 바와 같이 Cas12i2-RT 융합 폴리펩타이드를 갖는 다양한 게놈 부위에서의 편지을 보여주는 다이어그램을 포함한다. 도 20a는 AAVS1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20b는 EMX1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20c는 VEGFA 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 21은 변이형 Cas12i2(서열번호 4) 또는 변이형 Cas12i2-RT 융합체(서열번호 219)와 RNA 가이드 또는 편집 주형 RNA에 의해 도입된 indel 편집 또는 암호화된 편집을 포함하는 NGS 리드 %를 보여주는 플롯이다. RNA 가이드 및 편집 주형 RNA는 변형되지 않았거나, 또는 말단 포스포로티오에이트 백본 연결 및/또는 2'O-메틸 뉴클레오타이드로 구성되었다.
도 22는 AAVS1 게놈 부위에서 변이형 Cas12i4-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 23은 AAVS1, EMX1 또는 VEGFA 게놈 부위에서 변이형 Cas12i2 또는 변이형 Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 1a 내지 도 1b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 1a는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. PBS는 표적 핵산의 PAM-가닥(비표적 가닥으로도 알려져 있음)에 대한 실질적인 상보성을 포함한다. 도 1b는 역전사효소에 융합된 Cas9 닉케이스(nickase)(왼쪽) 및 역전사효소에 융합된 Cas12i 닉케이스(오른쪽)를 보여준다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 PAM 가닥에 혼입된다.
도 2는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 PAM 가닥에 대한 상보성을 포함한다.
도 3은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RT 공여체 RNA를 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 편집은 CRISPR 뉴클레이스에 의한 절단 후 게놈에 혼입된다.
도 4는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드), 역전사효소 폴리펩타이드, RNA 가이드 및 RNA 역전사 주형 서열을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. 편집은 CRISPR 뉴클레이스의 존재하에 게놈에 혼입된다.
도 5는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 표적 핵산에 대한 미스매치를 포함하는 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS를 포함한다. PBS는 표적 핵산의 비-PAM 가닥(표적 가닥 또는 TS로도 알려져 있음)에 대한 상보성을 포함한다.
도 6a 내지 도 6b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 보여주는 개략도를 포함한다. 도 6a는 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 3' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. RNA 가이드의 스페이서 서열 및 PBS가 표적 핵산에 결합되면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. PAM 가닥 및 비-PAM 가닥에서 변이형 Cas12i2 절단 부위는 삼각형으로 표시된다. RNA 가이드의 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 편집은 표적 핵산의 비-PAM 가닥에 혼입된다. 도 6b는 편집, 역전사 주형 서열 및 PBS의 위치 지정을 보여주며, 여기서 역전사 주형 서열 및 PBS의 길이는 다양할 수 있다.
도 7은 역전사효소 폴리펩타이드(예를 들어, Cas12i 폴리펩타이드)에 융합된 CRISPR 뉴클레이스 및 RNA 가이드의 5' 말단에서 RT 공여체 RNA에 융합된 RNA 가이드를 포함하는 예시적인 유전자 편집 시스템을 보여주는 개략도이다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다.
도 8a 내지 도 8c는 예시적인 Cas12i2 RNA 가이드-RT 공여체 RNA 융합체를 보여주는 개략도를 포함한다. 도 8a는 실시예 1에서 테스트된 RT 공여체 RNA에 융합된 변이형 Cas12i2 RNA 가이드의 개략도이다. RNA 가이드의 스페이서는 5'-TTT-3' PAM에 인접한 비-PAM 가닥에 결합한다. RT 공여체 RNA는 역전사 주형 서열 및 PBS를 포함한다. 스페이서 서열 및 PBS가 표적 핵산에 결합하면, 역전사 주형 서열은 짝을 이루지 않은 뉴클레오타이드의 루프를 형성한다. PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. 이 개략도에서, PBS는 13개의 뉴클레오타이드 길이이고, 역전사 주형 서열은 34개의 뉴클레오타이드 길이이다. PBS는 비-PAM 가닥에 대한 상보성이 절단 부위(삼각형)에서 시작하도록 설계되었다. 도 8b은 실시예 1에서 테스트된 바와 같이 AAVS1_T7 게놈 부위를 표적으로 하는 예시적인 RNA 가이드-RT 공여체 RNA 융합체를 보여준다. 다양한 PBS 길이가 테스트되었다(13개, 30개 및 60개의 뉴클레오타이드). RNA 가이드-RT 공여체 RNA 융합체는 표적 서열에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 8c는 실시예 1에 기술된 바와 같이 AAVS1_T7 게놈 부위(상부 패널), EMX1_T6 게놈 부위(중간 패널) 및 VEGFA_T5 게놈 부위(하부 패널)에 도입된 암호화된 편집(치환, 삽입 및 결실)을 보여준다. 도 8a의 서열은 위에서 아래로 서열번호 65 내지 67이다. 도 8b의 서열은 위에서 아래로 서열번호 74 내지 80 및 87 내지 89이다. 도 8c의 서열은 위에서 아래로 서열번호 248 내지 259이다.
도 9a 내지 도 9j는 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 9a는 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드(read)의 백분율을 보여준다. 도 9b는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9c는 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9d는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 AAVS1_T7 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, AAVS1_T7 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9e는 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 도입된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9f는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 EMX1_T6 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 도입된 indel 및 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, EMX1_T6 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9g는 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9h는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T2 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T2 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다. 도 9i는 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드를 사용하여 서열번호 4의 변이형 Cas12i2와 서열번호 25 및 서열번호 26의 C-말단 및 N-말단 Cas12i2-MMLV RT 융합체에 의해 유도된 indel 및 암호화된 편집으로 분석된 NGS 리드의 백분율을 보여준다. 도 9j는 서열번호 26 및 서열번호 25의 N-말단 및 C-말단 Cas12i2-MMLV RT 융합체와 VEGFA_T5 게놈 부위를 표적으로 하는 RNA 가이드-RT 공여체 RNA 융합체에 의해 유도된 indel 및 암호화된 편집을 사용하여 분석된 NGS 리드의 백분율을 보여준다. RNA 가이드-RT 공여체 RNA 융합체는 13개, 30개 또는 60개의 뉴클레오타이드의 PBS 길이를 갖고, VEGFA_T5 게놈 부위에 치환(S), 삽입(I), 결실(D) 또는 헤어핀(H)을 도입하도록 설계되었다.
도 10은 역전사효소에 융합된 Cas12i 폴리펩타이드(예를 들어, Cas12i2 닉케이스)를 보여주는 개략도이다. RNA 가이드의 5' 말단 또는 3' 말단에 융합된 RT 공여체 RNA를 사용하면, 암호화된 편집은 표적 핵산의 PAM 가닥에 혼입된다. RNA 가이드-RT 공여체 RNA의 말단은 엑소뉴클레이스 또는 엔도뉴클레이스 활성을 방지하기 위해 보호될 수 있다. PBS 길이는 약 3개 내지 100개의 뉴클레오타이드로 다양할 수 있으며, PAM 가닥에 대한 실질적인 상보성을 포함할 수 있다. 헤어핀과 같이 구조화된 RNA는 스페이서와 역전사 주형 서열 사이에 도입될 수 있다.
도 11은 제2 직접 반복(DR)-스페이서 서열에 추가로 융합된 RNA 가이드-RT 공여체 RNA를 보여주는 개략도이다. 추가적인 DR-스페이서는 엑소뉴클레이스 활성을 저해한다.
도 12a 내지 도 12b는 편집 주형 RNA(유전자 편집 RNA)의 예시적인 설계를 보여주는 개략도를 포함한다. 도 12a는 3' 말단 보호를 추가로 포함하는 편집 주형 RNA(5'- 뉴클레이스 결합 서열 - DNA-결합 서열 - 역전사 주형 - PBS -3')를 도시하는 개략도이다. 3' 말단 보호는 화학적 말단 보호(도면의 상단 부분) 또는 헤어핀(도면의 하단 부분)일 수 있다. 헤어핀은 직접 반복 서열과 같은 뉴클레이스 결합 서열일 수 있다. 도 12b는 5' 말단 보호가 있거나 없는 편집 주형 RNA(5'-역전사 주형 - PBS 뉴클레이스 결합 서열 - DNA-결합 서열-3')를 도시하는 개략도이다. 5' 말단 보호는 도면의 하단 부분에 나타낸 바와 같은 헤어핀(예를 들어, 직접 반복 서열과 같은 뉴클레이스 결합 서열)일 수 있다.
도 13a 내지 도 13d는 본 명세서에 개시된 예시적인 유전자 편집 시스템으로부터 발생하는 유전자 편집 효율을 보여주는 다이어그램을 포함한다. 도 13a는 AAVS1_T7 게놈 부위(서열번호 30)에서 서열번호 112의 RNA 가이드 또는 서열번호 123 내지 137의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13b는 EMX1_T6 게놈 부위(서열번호 34)에서 서열번호 114의 RNA 가이드 또는 서열번호 138 내지 152의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13c는 VEGFA_T2(서열번호 36)에서 서열번호 116의 RNA 가이드 또는 서열번호 153 내지 167의 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다. 도 13d는 VEGFA_T5 게놈 부위(서열번호 38)에서 서열번호 118의 RNA 가이드 또는 서열번호 168 내지 182의 편집 주형 RNA를 사용한 Cas12i2(서열번호 4) 및 Cas12i2-RT(서열번호 25)의 활성을 보여준다. indel을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 흰색 막대로 표시되고, Cas12i2-RT의 경우 회색 막대로 표시되었다. 암호화된 편집을 갖는 것으로 분석된 NGS 리드 %는 Cas12i2의 경우 체크무늬 막대로 표시되고, Cas12i2-RT의 경우 검은색 막대로 표시되었다.
도 14a 내지 도 14c는 RNA 가이드 또는 편집 주형 RNA를 사용하여 Cas12i2의 절단 패턴을 확인하는 데 사용되는 검정의 단계를 도시하는 개략도를 포함한다. 도 14a는 표적 서열 및 바코드를 포함하는 올리고 구성을 보여준다. 도 14b는 5' 및 3' 오버행을 평활 말단화(blunt)시키기 위한 절단 산물의 처리 또는 5' 오버행을 필인(fill in)시키기 위한 말단 복구를 보여준다. 도 14c는 절단 산물의 증폭을 보여준다.
도 15a 내지 도 15e는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집을 보여주는 다이어그램을 포함한다. 도 15a는 AAVS1_T2 게놈 부위의 PAM 가닥 및 비-PAM 가닥에서 서열번호 2의 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 도시하는 개략도이다. 도 15b는 필인 처리 후 5' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15c는 필인 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 도 15d는 평활 말단화(blunting) 처리 후 5' 절단 산물로부터 얻은 리드 길이의 히스토그램이다. 도 15e는 평활 말단화 처리 후 3' 절단 산물의 증폭으로부터 얻은 리드 길이의 히스토그램이다. 각각의 리드 길이 히스토그램은 도 15b 내지 도 15e의 x-축에 도시된 바와 같이 표적 서열에 매핑된다.
도 16a 내지 도 16b는 EMX1_T6 게놈 부위(도 16a) 및 VEGFA_T5 게놈 부위(도 16b)의 PAM 가닥 또는 비-PAM 가닥에서 서열번호 2의 Cas12i2 또는 서열번호 4의 변이형 Cas12i2에 의해 유도된 시험관내 절단 부위(삼각형)를 보여준다. 기준 막대(오른쪽)는 시퀀싱 리드 수로 측정된 경우 절단 빈도를 나타낸다.
도 17a 내지 도 17b는 예시적인 게놈 크기에서의 유전자 편집 결과를 보여주는 다이어그램을 포함한다. 도 17a는 AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 34개의 뉴클레오타이드 역전사 주형 서열 및 3개, 8개, 13개, 30개 또는 60개의 뉴클레오타이드 PBS로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17b는 AAVS1_T7 게놈 부위(서열번호 30), EMX1_T6 게놈 부위(서열번호 34) 또는 VEGFA_T5 게놈 부위(서열번호 38)에 4개의 뉴클레오타이드 삽입을 도입하는 데 있어서 편집 주형 RNA에 의한 활성을 보여준다. 편집 주형 RNA는 13개의 뉴클레오타이드 PBS 및 14개, 24개, 34개, 44개 또는 54개의 뉴클레오타이드 역전사 주형 서열로 구성된다. 암호화된 편집 대 총 편집의 비는 y-축에 도시되어 있다. 도 17a의 서열은, 위에서 아래로, 서열번호 90 내지 92이다. 도 17b의 서열은, 위에서 아래로, 서열번호 90 내지 92이다.
도 18은 U2OS 세포의 AAVS1_T7 게놈 부위(서열번호 32) 및 EMX1_T6 게놈 부위(서열번호 34)에 혼입된 암호화된 편집을 보여준다.
도 19a 내지 도 19b는 본 명세서에 개시된 예시적인 유전자 편집 시스템을 사용하는 유전자 편집 절차를 예시하는 개략도를 포함한다. 도 19a는 역전사효소 및 pegRNA에 융합된 Cas9를 포함하는 Cas9 프라임 편집기를 도시하는 개략도이다. Cas9에 의한 PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 pegRNA의 혼성화는 역전사가 개시되게 한다. 도 19b는 역전사효소 및 편집 주형 RNA에 융합된 유형 V CRISPR 뉴클레이스를 도시하는 개략도이다. 유형 V CRISPR 뉴클레이스에 의한 비-PAM 가닥의 절단 후 표적 DNA에 프라이머가 생성된다. 프라이머와 편집 주형 RNA의 혼성화는 역전사가 개시되게 한다.
도 20a 내지 도 20c는 나타낸 바와 같이 Cas12i2-RT 융합 폴리펩타이드를 갖는 다양한 게놈 부위에서의 편지을 보여주는 다이어그램을 포함한다. 도 20a는 AAVS1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20b는 EMX1 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다. 도 20c는 VEGFA 게놈 부위에서 서열번호 219 내지 223의 변이형 Cas12i2-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 21은 변이형 Cas12i2(서열번호 4) 또는 변이형 Cas12i2-RT 융합체(서열번호 219)와 RNA 가이드 또는 편집 주형 RNA에 의해 도입된 indel 편집 또는 암호화된 편집을 포함하는 NGS 리드 %를 보여주는 플롯이다. RNA 가이드 및 편집 주형 RNA는 변형되지 않았거나, 또는 말단 포스포로티오에이트 백본 연결 및/또는 2'O-메틸 뉴클레오타이드로 구성되었다.
도 22는 AAVS1 게놈 부위에서 변이형 Cas12i4-RT 융합체에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
도 23은 AAVS1, EMX1 또는 VEGFA 게놈 부위에서 변이형 Cas12i2 또는 변이형 Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA에 의해 도입된 indel 편집(흰색 막대) 또는 암호화된 편집(회색 막대)을 포함하는 NGS 리드 %를 보여주는 플롯이다.
본 개시내용은 유형 V 뉴클레이스 또는 이를 암호화하는 핵산, RNA 가이드 또는 이를 암호화하는 핵산, 역전사효소 또는 이를 암호화하는 핵산 및 RT 공여체 RNA 또는 이를 암호화하는 핵산을 포함하는 유전자 편집 시스템에 관한 것이다. 또한, 본 명세서에 개시된 임의의 유전자 편집 시스템, 본 명세서에 개시된 임의의 유전자 편집 시스템을 사용하여 세포를 유전자 편집하는 방법, 이에 따라 생산된 유전적으로 조작된 세포 및 유전자 편집 시스템과 관련된 유전자 편집 RNA 분자 또는 RNA 분자 세트뿐만 아니라 이를 생산하기 위한 DNA 분자(들)를 포함하는 약제학적 조성물 및 키트가 본 명세서에 제공된다.
정의
본 개시내용은 특정 실시형태 및 소정의 도면을 참조하여 설명될 것이지만, 본 개시내용은 이에 제한되지 않고 청구범위에 의해서만 제한된다. 이하에 제시된 용어는 일반적으로 달리 명시되지 않는 한 일반적인 의미로 이해되어야 한다.
본 명세서에서 사용되는 용어 "활성"은 생물학적 활성을 지칭한다. 일부 실시형태에서, 활성은 효과기 활성을 지칭한다. 일부 실시형태에서, 활성은 효소적 활성, 예를 들어, 효과기의 촉매 능력을 포함한다. 예를 들어, 활성은 뉴클레이스 활성을 포함할 수 있다. 또 다른 예에서, 활성은 RNA로부터 DNA를 생성하거나 또는 표적 서열에 편집을 도입시키는 효소의 능력을 지칭한다.
본 명세서에서 사용되는 용어 "~에 인접해 있는"은 또 다른 뉴클레오타이드 또는 아미노산 서열에 매우 근접한 뉴클레오타이드 또는 아미노산 서열을 지칭한다. 일부 실시형태에서, 뉴클레오타이드가 두 서열을 분리하지 않는(즉, 바로 인접해 있는) 경우, 뉴클레오타이드 서열은 또 다른 뉴클레오타이드 서열에 인접해 있다. 일부 실시형태에서, 소수의 뉴클레오타이드(예를 들어, 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드)가 두 서열을 분리하는 경우, 뉴클레오타이드 서열은 또 다른 뉴클레오타이드 서열과 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개 또는 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 최대 2개의 뉴클레오타이드, 최대 5개의 뉴클레오타이드, 최대 8개의 뉴클레오타이드, 최대 10개의 뉴클레오타이드, 최대 12개의 뉴클레오타이드 또는 최대 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다. 일부 실시형태에서, 제1 서열은, 두 서열이 2개 내지 5개의 뉴클레오타이드, 4개 내지 6개의 뉴클레오타이드, 4개 내지 8개의 뉴클레오타이드, 4개 내지 10개의 뉴클레오타이드, 6개 내지 8개의 뉴클레오타이드, 6개 내지 10개의 뉴클레오타이드, 6개 내지 12개의 뉴클레오타이드, 8개 내지 10개의 뉴클레오타이드, 8개 내지 12개의 뉴클레오타이드, 10개 내지 12개의 뉴클레오타이드, 10개 내지 15개의 뉴클레오타이드 또는 12개 내지 15개의 뉴클레오타이드만큼 분리되어 있는 경우, 제2 서열에 인접해 있다.
본 명세서에서 사용되는 용어 "CRISPR 뉴클레이스"는 핵산에 결합하고 단일-가닥 절단 또는 이중-가닥 절단을 도입할 수 있는 RNA-가이드된 효과기를 지칭한다. 일부 실시형태에서, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스 또는 유형 V CRISPR 뉴클레이스이다. 일부 실시형태에서, CRISPR 뉴클레이스는 문헌[Makarova et al. "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPRJ. 1(5):325-36 (2018)]에 기술되어 있는 바와 같은 효과기이다.
본 명세서에서 사용되는 용어 "유형 II" 및 "유형 II 뉴클레이스"는 RuvC 도메인 및 HNH 도메인을 포함하는 뉴클레이스를 지칭한다. 유형 II 뉴클레이스는 유형 II-A 뉴클레이스, 유형 II-B 뉴클레이스 또는 유형 II-C 뉴클레이스일 수 있다. 일부 실시형태에서, 유형 II 뉴클레이스는 tracrRNA를 필요로 한다. 일부 실시형태에서, 유형 II 뉴클레이스는 Cas9 폴리펩타이드이다. Cas9 폴리펩타이드는 이중-가닥 DNA 표적을 절단할 수 있거나 또는 닉케이스일 수 있다.
본 명세서에서 사용되는 용어 "유형 V" 및 "유형 V 뉴클레이스"는 RuvC 도메인을 갖는 RNA-가이드된 CRISPR 뉴클레이스를 지칭한다. 일부 실시형태에서, 유형 V 뉴클레이스는 tracrRNA를 필요로 하지 않는다. 일부 실시형태에서, 유형 V 뉴클레이스는 tracrRNA를 필요로 한다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12 폴리펩타이드, 예컨대, Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드이다.
본 명세서에서 사용되는 용어 "Cas12i 폴리펩타이드"(본 명세서에서 Cas12i로도 지칭됨)는 RNA 가이드에 의해 특정된 표적 핵산 상의 표적 서열에 결합하는 폴리펩타이드를 지칭하되, 폴리펩타이드는 야생형 Cas12i 폴리펩타이드와 적어도 일부 아미노산 서열 상동성을 갖는다. 일부 실시형태에서, Cas12i 폴리펩타이드는 본 명세서에 언급된 특허 대상과 목적에 대해 참조에 의해 원용되어 있는 미국 특허 제10,808,245호의 서열번호 1 내지 5 및 11 내지 18 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 포함한다. 일부 실시형태에서, Cas12i 폴리펩타이드는 본 출원의 서열번호 8, 2, 11 및 9 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 포함한다. 일부 실시형태에서, 본 개시내용의 Cas12i 폴리펩타이드는 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO/2021/202800에 기술되어 있는 바와 같은 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, Cas12i 폴리펩타이드 표적 핵산(예를 들어, 닉(nick) 또는 이중 가닥 절단)을 절단한다.
두 핵산 또는 두 아미노산 서열의 "동일성 퍼센트"(일명 서열 동일성)는 문헌[Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993]에서와 같이 수정된 문헌[Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990]의 알고리즘을 사용하여 결정된다. 이러한 알고리즘은 문헌[Altschul, et al. J. Mol. Biol. 215:403-10, 1990]의 NBLAST 및 XBLAST 프로그램(버전 2.0)에 통합되어 있다. BLAST 뉴클레오타이드 검색은 본 발명의 핵산 분자와 상동인 뉴클레오타이드 서열을 얻기 위해 NBLAST 프로그램, 점수=100, 단어 길이=12를 사용하여 수행될 수 있다. BLAST 단백질 검색은 본 발명의 단백질 분자와 상동인 아미노산 서열을 얻기 위해 XBLAST 프로그램, 점수=50, 단어 길이=3을 사용하여 수행될 수 있다. 두 서열 사이에 갭이 존재하는 경우, 문헌[Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997]에 기술되어 있는 바와 같은 Gapped BLAST가 이용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 각각의 프로그램(예를 들어, XBLAST 및 NBLAST)에 대한 기본 매개변수가 사용될 수 있다.
본 명세서에서 사용되는 용어 "복합체"는 2개 이상의 분자의 그룹을 지칭한다. 일부 실시형태에서, 복합체는 서로 상호작용(예를 들어, 결합, 접촉, 부착)하는 폴리펩타이드 및 핵산 분자를 포함한다. 일부 실시형태에서, 용어 "복합체"는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)와 역전사효소 폴리펩타이드의 회합을 지칭하는 데 사용된다. 예를 들어, CRISPR 뉴클레이스(예를 들어, 본 명세서에 개시된 바와 같은 Cas12i2 폴리펩타이드)와 역전사효소 폴리펩타이드의 복합체는, 예를 들어, 이량체화 도메인(예를 들어, 류신 지퍼)을 통한 두 폴리펩타이드의 이종이량체, 항체, 나노바디 또는 압타머일 수 있다. 일부 실시형태에서, 용어 "복합체"는 RNA 가이드와 RT 공여체 RNA의 회합을 지칭하는 데 사용된다. 일부 실시형태에서, 용어 "복합체"는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 폴리펩타이드, RNA 가이드 및 RT 공여체 RNA의 회합을 지칭하는 데 사용된다. 일부 실시형태에서, 용어 "복합체"는 역전사효소 폴리펩타이드와 RT 공여체 RNA의 회합을 지칭하는 데 사용된다.
본 명세서에서 사용되는 용어 "뉴클레이스에 의해 인식 가능한 결합 부위" 또는 "뉴클레이스 결합 서열"은 CRISPR 뉴클레이스에 결합할 수 있는 서열을 지칭한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 RNA 서열이다. 일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열이다. 일부 실시형태에서, 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스 또는 유형 V CRISPR 뉴클레이스(예를 들어, 유형 II CRISPR 뉴클레이스에 의해 인식 가능한 결합 부위 또는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 결합 부위)에 결합할 수 있다.
본 명세서에서 사용되는 용어 "결실"은 참조 서열에 대해 핵산 서열에서의 뉴클레오타이드 또는 뉴클레오타이드들의 손실을 지칭한다. 결실을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 결실을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 결실은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 결실은 프레임시프트 돌연변이 또는 비프레임시프트 돌연변이일 수 있다. 본 명세서에 기재된 결실은 최대 수 킬로베이스의 결실을 지칭한다.
본 명세서에서 사용되는 용어 "편집"은 관심 게놈 부위와 같은 표적 핵산의 뉴클레오타이드 서열에 도입된 하나 이상의 변형을 지칭한다. 편집은 서열 본 명세서에 정의된 바와 같은 표적 내에서 발생할 수 있다. 대안적으로, 편집은 표적 서열 외부(예를 들어, 표적 서열에 인접한 곳)에서 발생할 수 있다. 편집은 하나 이상의 치환, 하나 이상의 삽입, 하나 이상의 결실 또는 이들의 조합일 수 있다.
본 명세서에서 사용되는 용어 "융합" 및 "융합된"은 적어도 2개의 뉴클레오타이드 또는 단백질 분자의 연결을 지칭한다. 예를 들어, "융합" 및 "융합된"은 자연에서 별개의 유전자(예를 들어, 유형 V 뉴클레이스 및 역전사효소 폴리펩타이드)에 의해 암호화되는 적어도 2개의 폴리펩타이드 도메인의 연결을 지칭할 수 있다. 융합은 N-말단 융합, C-말단 융합 또는 분자내 융합일 수 있다. 일부 양태에서, 도메인은 단일 폴리펩타이드를 생산하기 위해 전사되고 번역된다. 또한, 본 명세서에서 사용되는 용어 "융합" 및 "융합된"은 2개의 RNA 분자(예를 들어, RNA 가이드 및 RT 공여체 RNA)와 같은 2개의 핵산 분자의 연결을 지칭하는 데 사용된다. 융합은 5' 융합, 3' 융합 또는 분자내 융합일 수 있다.
본 명세서에서 사용되는 용어 "삽입"은 참조 서열에 대해 핵산 서열에서의 뉴클레오타이드 또는 뉴클레오타이드들의 획득을 지칭한다. 삽입을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 삽입을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 삽입은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 삽입은 프레임시프트 돌연변이 또는 비프레임시프트 돌연변이일 수 있다. 본 명세서에 기재된 삽입은 최대 수 킬로베이스의 삽입을 지칭한다.
본 명세서에서 사용되는 용어 "프로토스페이서 인접 모티프" 또는 "PAM 서열"은 표적 서열에 인접한 DNA 서열을 지칭한다. 일부 실시형태에서, PAM 서열은 효소 활성을 위해 필요하다. 이중-가닥 DNA 분자에서, PAM 모티프를 포함하는 가닥은 "PAM-가닥"이라고 하고, 상보적 가닥은 "비-PAM 가닥"이라고 한다. RNA 가이드는 본 명세서에 개시된 표적 서열과 상보적인 비-PAM 가닥 부위에 결합하고, 본 명세서에 기재된 바와 같은 PAM 서열은 PAM-가닥에 존재한다.
본 명세서에서 사용되는 용어 "PAM 가닥"은 PAM 모티프를 포함하는 표적 핵산(이중-가닥) 가닥을 지칭한다. 일부 실시형태에서, PAM 가닥은 코딩(예를 들어, 센스) 가닥이다. 다른 실시형태에서, PAM 가닥은 논코딩(예를 들어, 안티센스 가닥)이다. 용어 "비-PAM 가닥"은 PAM 가닥의 상보적 가닥을 지칭한다. gRNA는 염기-페어링을 통해 비-PAM 가닥과 결합하기 때문에, 비-PAM 가닥은 표적 가닥으로도 알려져 있는 반면, PAM 가닥은 비표적 가닥으로도 알려져 있다.
본 명세서에서 사용되는 용어 "표적 서열"은 PAM 모티프에 인접한(PAM 가닥 상의) DNA 단편을 지칭한다. 표적 서열의 상보적 영역은 비-PAM 가닥에 있다. 표적 서열은 PAM 모티프에 바로 인접할 수 있다. 대안적으로, 표적 서열 및 PAM은 작은 서열 분절(예를 들어, 최대 5개의 뉴클레오타이드, 예를 들어, 최대 4개, 3개, 2개 또는 1개의 뉴클레오타이드)만큼 별도로 존재할 수 있다. 표적 서열은 PAM 모티프를 인식하는 CRISPR 뉴클레이스에 따라 PAM 모티프의 3' 말단 또는 PAM 모티프의 5' 말단에 위치할 수 있으며, 이는 당업계에 공지되어 있다. 예를 들어, 표적 서열은 Cas12i 폴리펩타이드(예를 들어, 본 명세서에 개시된 것들과 같은 Cas12i2 폴리펩타이드)의 경우 PAM 모티프의 3' 말단에 위치한다.
본 명세서에서 사용되는 용어 "RNA 가이드" 또는 "RNA 가이드 서열"은 본 명세서에 기재된 CRISPR 뉴클레이스의 관심 게놈 부위로의 표적화를 용이하게 하는 RNA 분자 또는 변형된 RNA 분자를 지칭한다. 예를 들어, RNA 가이드는 PAM 가닥이 표적 서열과 상보적인, 예를 들어, 특정 핵산 서열과 상보적이도록 설계된 비-PAM 가닥의 부위를 인식(이에 결합)하는 분자일 수 있다. RNA 가이드는 스페이서 및 뉴클레이스 결합 서열(예를 들어, 직접 반복(DR) 서열)을 포함한다. 용어 CRISPR RNA(crRNA), pre-crRNA 및 성숙 crRNA도 본 명세서에서 RNA 가이드를 지칭하는 데 사용된다. RNA 가이드의 5' 말단 또는 3' 말단은 본 명세서에 개시된 바와 같은 RT 공여체 RNA에 융합될 수 있다. 일부 경우에, RNA 가이드는, 예를 들어, 표적 서열의 상보적 서열에 결합하는 RNA 가이드에 포함된 DNA-결합 서열에 하나 이상의 데옥시리보뉴클레오타이드를 포함하는 변형된 RNA 분자일 수 있다. 일부 예에서, DNA-결합 서열은 DNA 서열 또는 DNA/RNA 하이브리드 서열을 포함할 수 있다.
본 명세서에서 사용되는 용어 "스페이서" 및 "스페이서 서열"(일명 DNA-결합 서열)은 표적 서열(DNA 서열)의 RNA 등가물인 RNA 가이드의 일부이다. 스페이서는 표적 서열(PAM 가닥 내)과 상보적인 부위에서 염기-페어링을 통해 비-PAM 가닥에 결합할 수 있는 서열을 포함한다. 이러한 스페이서는 표적 서열에 특이적인 것으로도 알려져 있다. 일부 경우에, 스페이서는 RNA-DNA 서열 차이를 제외하고 표적 서열과 적어도 75%(예를 들어, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98% 또는 적어도 99%) 동일할 수 있다. 일부 경우에, 스페이서는 RNA-DNA 서열 차이를 제외하고 표적 서열과 100% 동일할 수 있다.
본 명세서에서 사용되는 용어 "상보적"은 제1 및 제2 폴리뉴클레오타이드가 염기-페어링을 통해 이중-가닥 복합체를 형성하여 제1 폴리뉴클레오타이드와 복합체를 형성하는 효과기 폴리펩타이드(예를 들어, Cas12i2 폴리펩타이드, Cas12i2-역전사효소 융합 폴리펩타이드 또는 이들의 변이체)가 제2 폴리뉴클레오타이드에 작용(예를 들어, 절단)할 수 있도록 제2 폴리뉴클레오타이드(예를 들어, 표적 서열의 상보적 서열)에 대해 소정의 수준의 상보성을 갖는 제1 폴리뉴클레오타이드(예를 들어, RNA 가이드의 스페이서 서열)를 지칭한다. 일부 실시형태에서, 제1 폴리뉴클레오타이드는 제2 폴리뉴클레오타이드와 실질적으로 상보적일 수 있으며, 즉, 제2 폴리뉴클레오타이드와 적어도 약 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 상보성을 가질 수 있다. 일부 실시형태에서, 제1 폴리뉴클레오타이드는 제2 폴리뉴클레오타이드와 완전히 상보적이며, 즉, 제2 폴리뉴클레오타이드와 100%의 상보성을 갖는다.
본 명세서에서 사용되는 용어 "역전사효소" 및 "RT"는 전형적으로 RNA- 및 DNA-의존적 DNA 중합 활성 및 RNA-DNA 하이브리드에서 RNA의 절단을 촉매하는 RNase H 활성을 포함하는 3가지 효소적 활성을 갖는 다기능성 효소를 지칭한다. 역전사효소는 RNA 주형으로부터 DNA를 생성할 수 있다.
본 명세서에서 사용되는 용어 "역전사 공여체 RNA" 및 "RT 공여체 RNA"는 역전사 주형 서열(주형 서열) 및 프라이머 결합 부위(PBS)를 포함하는 RNA 분자를 지칭한다. RT 공여체 RNA는 RNA 가이드의 5' 말단 또는 3' 말단에서 RNA 가이드에 융합될 수 있다.
본 명세서에서 사용되는 용어 "PBS-표적화 부위"는 PBS가 결합하는 영역을 지칭한다. PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역(예를 들어, 상류)에 인접할 수 있다. 예를 들어, PBS-표적화 부위는 표적 서열과 상보적인 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드(예를 들어, 3개의 뉴클레오타이드 또는 4개의 뉴클레오타이드)일 수 있다. 일부 경우에, PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역에 바로 인접할 수 있다. 다른 예에서, PBS-표적화 부위는 표적 서열과 상보적인 비-PAM 가닥의 영역과 중첩될 수 있다. 대안적으로, PBS-표적화 부위는 PAM 가닥 상의 표적 서열에 인접하거나, 이의 상류에 있거나 또는 이와 중첩될 수 있다.
본 명세서에서 사용되는 용어 "역전사 주형 서열" 또는 "주형 서열"은 역전사효소에 의한 DNA 합성을 위한 주형의 역할을 하는 RNA 분자 또는 RT 공여체 RNA의 단편을 지칭한다. 일부 실시형태에서, 역전사 주형 서열은 유전자 편집이 필요한 게놈 부위에 혼입될 편집을 포함한다. 일부 경우에, RT 공여체 RNA의 역전사 주형 서열에 의해 매개되는 편집은 PAM 서열, 표적 서열 또는 둘 다를 방해하거나 또는 제거한다.
본 명세서에서 사용되는 용어 "편집 주형 RNA" 또는 "유전자 편집 RNA"(상호교환적으로 사용됨)는 RNA 가이드(스페이서 및 본 명세서에 개시된 것들과 같은 CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위 포함) 및 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함하는 RNA 분자 또는 RNA 분자 세트를 지칭한다. 유전자 편집 RNA는 CRISPR 뉴클레이스에 의해 관심 게놈 부위 내의 표적 서열에서 절단을 매개하고, 유전자 편집 RNA의 주형 서열을 기반으로 CRISPR 뉴클레이스 절단에 의해 생성된 자유 DNA 가닥의 자유 3' 말단에서 DNA 단편을 합성할 수 있다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는 RT 공여체 RNA에 연결된(예를 들어, 융합된) RNA 가이드를 포함하는 단일 RNA 분자이다. 일부 실시형태에서, 편집 주형 RNA는, 5'에서 3'로, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위, 스페이서 서열, PBS 및 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는, 5'에서 3'로, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위, 스페이서, 주형 서열 및 PBS를 포함한다. 일부 실시형태에서, 편집 주형 RNA 또는 유전자 편집 RNA는, 5'에서 3'로, 주형 서열, PBS, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위 및 스페이서 서열을 포함한다. 일부 실시형태에서, 편집 주형 RNA는 링커를 추가로 포함한다. 예를 들어, 일부 실시형태에서, 편집 주형 RNA는 CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위와 PBS 사이 또는 스페이서 서열과 RT 공여체 RNA 사이에 링커를 포함한다.
본 명세서에서 사용되는 용어 "치환"은 참조 서열에 대해 뉴클레오타이드 또는 뉴클레오타이드들의 다른 뉴클레오타이드 또는 뉴클레오타이드들로의 대체를 지칭한다. 치환을 포함하는 서열을 만드는 방법에는 특별한 과정이 암시되어 있지 않다. 예를 들어, 치환을 포함하는 서열은 개별 뉴클레오타이드로부터 직접 합성될 수 있다. 다른 실시형태에서, 치환은 참조 서열을 제공한 다음 변경함으로써 이루어진다. 핵산 서열은 유기체의 게놈에 있을 수 있다. 핵산 서열은 세포에 있을 수 있다. 핵산 서열은 DNA 서열일 수 있다. 본 명세서에 기재된 치환은 최대 수 킬로베이스의 치환을 지칭한다.
본 명세서에서 사용되는 용어 "상류" 및 "하류"는 단일 핵산(예를 들어, DNA) 서열 내의 상대적 위치를 지칭한다. "상류" 및 "하류"는 각각 RNA 전사가 일어나는 5'에서 3' 방향과 관련된다. 첫 번째 서열의 3' 말단이 두 번째 서열의 5' 말단 앞에서 발생할 때, 첫 번째 서열은 두 번째 서열의 상류이다. 첫 번째 서열의 5' 말단이 두 번째 서열의 3' 말단 뒤에서 발생할 때, 첫 번째 서열은 두 번째 서열의 하류이다. 일부 실시형태에서, 용어 "상류" 및 하류"는 비-PAM 가닥과 관련하여 사용된다. 예를 들어, 일부 실시형태에서, PBS는 표적 서열의 상류에 있는 비-PAM 가닥 서열과 상보적이다. 이와 같이, 일부 실시형태에서, PBS는 스페이서 서열이 결합하는 서열의 상류 서열에 결합하고, 스페이서 서열은 PBS가 결합하는 서열의 하류에 결합한다.
I. 유전자 편집 시스템
프라임 편집은 표적 서열에 치환, 작은 삽입 또는 작은 결실을 도입하기 위해 개발되었다. 프라임 편집 접근법은 역전사효소에 융합된 Cas9 닉케이스 및 프라임 편집 가이드 RNA(pegRNA)에 의존한다. pegRNA는 표적 유전자좌의 비-PAM 가닥(PAM 서열의 반대편 가닥)에 결합할 수 있는 스페이서 서열, 표적 유전자좌의 PAM 가닥(PAM 서열을 포함하는 가닥)에 결합할 수 있는 프라이머 결합 부위(PBS) 및 편집을 포함하는 역전사 주형 서열을 포함한다. pegRNA의 스페이서 서열 비-PAM 가닥의 표적 서열에 결합하고, 닉케이스 Cas9는 PAM 가닥에 닉을 형성한다. 이는 PBS에 혼성화할 수 있는 표적 유전자좌의 PAM 가닥에 3' 플랩(flap)을 노출시킨다. 그런 다음, 역전사효소는 역전사 주형을 카피하여 3' 플랩을 연장시킨다. 예를 들어, 도 19a를 참조한다. DNA 복구 메커니즘을 통해, 편집은 표적 유전자좌에 혼입된다.
일부 양태에서, 편집 표적 핵산을 (예를 들어, 관심 게놈 부위에서) 편집할 수 있는, 예를 들어, 게놈 부위에 삽입, 결실, 치환 또는 이들의 조합을 도입할 수 있는 유전자 편집 시스템이 본 명세서에 제공된다. 편집은 표적 핵산의 가닥 중 하나에서 발생할 수 있다. 본 명세서에 개시된 유전자 편집 시스템은 적어도 하나의 단백질 구성요소 또는 이를 암호화하는 뉴클레오타이드 서열, 및 적어도 하나의 RNA 구성요소 또는 이를 암호화하는 뉴클레오타이드 서열을 포함한다. 단백질 구성요소는 RNA 구성요소에 의해 가이드되어 목적하는 부위에서 표적 핵산을 절단하는 활성 및 RNA 구성요소의 일부를 주형으로 사용하여 절단으로 인해 생성된 DNA 가닥의 자유 3' 말단에서 시작하여 새로운 DNA 서열을 합성하는 활성을 갖는다. 그런 다음, 새로 합성된 DNA 단편은, 예를 들어, 숙주 세포의 DNA 복구 메커니즘을 통해 표적 핵산에 혼입되어 표적 핵산의 유전적 편집을 유도할 수 있다.
본 명세서에 개시된 유전자 편집 시스템의 단백질 구성요소는 CRISPR 뉴클레이스(예를 들어, 변이형 Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소(RT) 폴리펩타이드를 포함할 수 있다. 일부 예에서, CRISPR 뉴클레이스 및 RT 폴리펩타이드는 2개의 별도의 폴리펩타이드이다. 다른 예에서, CRISPR 뉴클레이스 및 RT 폴리펩타이드는 융합 폴리펩타이드의 일부이다.
본 명세서에 개시된 유전자 편집 시스템의 RNA 구성요소는 설계된 바와 같이 표적 핵산의 특정 부위에서 CRISPR 뉴클레이스 절단을 매개하는 가이드 RNA(gRNA)(본 명세서에서 RNA 가이드 또는 CRISPR RNA(crRNA)로도 기재됨) 및 RT 폴리펩타이드에 의한 역전사를 매개하고 역전사를 위한 주형 서열을 제공하는 역전사 공여체 RNA(RT 공여체 RNA)를 포함할 수 있다. 일부 예에서, gRNA 및 RT 공여체 RNA는 2개의 개별 RNA 분자이다. 다른 예에서, gRNA 및 RT 공여체 RNA는 단일 RNA 분자의 일부이다.
본 명세서에 나타낸 바와 같이 그리고 이론에 얽매이지 않고, 본 명세서에 기재된 유전자 편집 시스템은 해당 분야에 비해 여러 가지 장점을 제공한다. 예를 들어, Cas12i CRISPR 뉴클레이스와 같은 유형 V CRISPR 뉴클레이스로는 RNA-주형 편집은 입증되지 않았다. Cas9개의 뉴클레이스보다 작은 유형 V 뉴클레이스가 풍부하다. 예를 들어, Cas12i2는 1,054개의 아미노산 길이인 반면, S. 피오게네스(S. pyogenes) Cas9(SpCas9)는 1,368개의 아미노산 길이이고, S. 써모필루스(S. thermophilus) Cas9(StCas9)는 1,128개의 아미노산 길이이고, FnCpf1은 1,300개의 아미노산 길이이고, AsCpf1은 1,307개의 아미노산 길이이고, LbCpf1은 1,246개의 아미노산 길이이다. 추가적으로, 유형 V 뉴클레이스는 트랜스-활성화 CRISPR RNA(tracrRNA)가 필요하지 않은 RNA 가이드를 이용하므로 Cas9 RNA 가이드보다 작다. Cas12i 폴리펩타이드와 RNA 가이드 크기가 작을수록 전달에 유리하다. 추가적으로, 표적 가닥(비-PAM 가닥)과 같은 표적 유전자좌의 단일 가닥에 결합하는 단일 편집 주형 RNA를 이용하는 임의의 CRISPR 뉴클레이스로는 RNA-주형 편집이 입증되지 않았다. 본 명세서에 나타낸 바와 같이, Cas12i 폴리펩타이드를 포함하는 유전자 편집 시스템도 SpCas9 폴리펩타이드를 포함하는 유전자 편집 시스템에 비해 감소된 표적외 활성을 보여준다. 전체가 참조에 의해 원용되어 있는 PCT/US2021/025257을 참조한다.
A.
CRISPR 뉴클레이스
본 명세서에 개시된 임의의 유전자 편집 시스템은 CRISPR 뉴클레이스를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 본 명세서의 다른 곳에 기재된 바와 같은 뉴클레이스 결합 서열에 결합할 수 있고/있거나 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열에서 DNA를 절단한다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열을 특이적으로 인식하고/하거나 이에 결합하는 본 명세서의 다른 곳에 기재된 DNA-결합 서열을 통해 표적 서열에 동원된다. 일부 실시형태에서, CRISPR 뉴클레이스는 표적 서열에서 DNA의 가닥 중 하나 또는 둘 다를 절단한다. 일부 실시형태에서, 하나 초과의 CRISPR 뉴클레이스가 표적 서열에 동원되고, 하나 이상의 CRISPR 뉴클레이스는 표적 서열에서 또는 그 근처에서 DNA의 가닥 중 하나 또는 둘 다를 절단한다. 이러한 실시형태에서, CRISPR 뉴클레이스는 뉴클레이스 활성을 보유하거나 또는 가질 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 감소된 또는 제한된 뉴클레이스 활성을 보유할 수 있다. 일부 실시형태에서, 본 명세서의 다른 곳에 기재된 바와 같은 CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 본 명세서의 다른 곳에 기재된 바와 같은 편집 주형 RNA의 적어도 하나의 뉴클레이스 결합 서열에 결합할 수 있으며 이에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합체는 편집 주형 RNA의 적어도 하나의 DNA-결합 서열을 통해 표적 서열에 결합할 수 있으며 이에 결합한다. 이러한 실시형태에서, CRISPR 뉴클레이스는 뉴클레이스 결합 서열과 편집 주형 RNA의 DNA-결합 서열에 결합함으로써 표적 서열에 동원되거나 또는 이에 근접하게 된다. 추가의 이러한 실시형태에서, 역전사효소는 본 명세서의 다른 곳에 기재된 바와 같은 역전사 주형 서열을 DNA로 전사할 수 있으며 이를 전사한다.
일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 역전사 주형 서열을 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 역전사 주형 서열을 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 PBS에서 시작하여 5'에서 3'(예를 들어, PBS의 5' 또는 3' 말단)로 전사한다. 일부 실시형태에서, 표적 핵산의 비-PAM 가닥의 자유 3' 말단에 PBS를 혼성화한 후, CRISPR 뉴클레이스-역전사효소 융합체는 비-PAM 가닥의 3' 말단으로부터 역전사 주형 서열을 전사한다. 일부 실시형태에서, 표적 핵산의 PAM 가닥의 자유 3' 말단에 PBS를 혼성화한 후, CRISPR 뉴클레이스-역전사효소 융합체는 PAM 가닥의 3' 말단으로부터 역전사 주형 서열을 전사한다.
일부 실시형태에서, CRISPR 뉴클레이스는 RNA-가이드된 CRISPR 뉴클레이스이다. 일부 실시형태에서, CRISPR 뉴클레이스는 DNA-표적화 뉴클레이스이다.
일부 실시형태에서, CRISPR 뉴클레이스는 Cas9(예를 들어, Cas9 및 nCas9), Cas12a/Cpf1, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i 및 Cas12j/ CasPhi)이다. Cas 효소의 비제한적인 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas5d, Cas5t, Cas5h, Cas5a, Cas6, Cas7, Cas8, Cas8a, Cas8b, Cas8c, Cas9(Csn1 또는 Csx12로도 알려져 있음), Cas10, Cas10d, Cas12a/Cpfl, Cas12b/C2c1, Cas12c/C2c3, Cas12d/CasY, Cas12e/CasX, Cas12g, Cas12h, Cas12i, Cas12j/CasΦ, Cpf1, Csy1, Csy2, Csy3, Csy4, Cse1, Cse2, Cse3, Cse4, Cse5e, Csc1, Csc2, Csa5, Csn1, Csn2, Csm1, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csxl7, Csxl4, Csx10, Csxl6, CsaX, Csx3, Csx1, Csx1S, Csx11, Csf1, Csf2, CsO, Csf4, Csd1, Csd2, Cst1, Cst2, Csh1, Csh2, Csa1, Csa2, Csa3, Csa4, Csa5, 유형 II CRISPR 뉴클레이스, 유형 V CRISPR 뉴클레이스, 유형 VI CRISPR 뉴클레이스, CARF, DinG, 이들의 상동체 또는 이들의 변형 또는 조작된 버전을 포함한다. 다른 CRISPR 뉴클레이스도 본 개시내용의 범위 내에 있지만, 본 개시내용에 구체적으로 나열되지는 않을 수도 있다. 예를 들어, 문헌[Makarova et al. "Classification and Nomenclature of CRISPR-Cas Systems: Where from Here?" CRISPRJ. 1(5):325-36 (2018)]을 참조한다.
일부 실시형태에서, CRISPR 뉴클레이스는 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있는 뉴클레이스이다.
일부 실시형태에서, 본 발명의 조성물은 유형 V CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스)를 포함한다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12 CRISPR 뉴클레이스이다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) CRISPR 뉴클레이스이다. 일부 실시형태에서, 유형 V 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) CRISPR 뉴클레이스의 변이체(예를 들어, 기능적 변이체)이다. 일부 실시형태에서, 유형 V 뉴클레이스는 야생형 유형 V 뉴클레이스 서열(예를 들어, Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi)의 야생형 아미노산 서열)과 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 포함한다.
일부 실시형태에서, 본 발명의 유형 V 뉴클레이스는 Cas12i CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas12i CRISPR 뉴클레이스는 서열번호 1과 같은 뉴클레오타이드 서열을 포함하는 Cas12i2 CRISPR 뉴클레이스이거나 또는 서열번호 2와 같은 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 야생형 CRISPR 뉴클레이스의 변이체이되, 야생형은 서열번호 1과 같은 뉴클레오타이드 서열을 포함하거나 또는 서열번호 2와 같은 아미노산 서열을 포함하는 폴리펩타이드에 의해 암호화된다. 표 1을 참조한다.
일부 실시형태에서, 본 발명의 유형 II 뉴클레이스는 Cas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 서열번호 120과 같은 아미노산 서열을 포함하는 SpCas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 닉케이스, 예를 들어, 서열번호 121과 같은 아미노산 서열을 포함하는 nSpCas9이다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 상이한 종의 Cas9 CRISPR 뉴클레이스이다. 일부 실시형태에서, Cas9 CRISPR 뉴클레이스는 서열번호 122와 같은 아미노산 서열을 포함하는 SaCas9 CRISPR 뉴클레이스이다. 표 1을 참조한다.
본 명세서에 기재된 CRISPR 뉴클레이스를 암호화하는 핵산 서열은 참조 핵산 서열, 예를 들어, 서열번호 1과 실질적으로 동일할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스는 참조 핵산 서열, 예를 들어, 야생형 폴리펩타이드를 암호화하는 핵산 서열, 예를 들어, 서열번호 1과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.5%의 서열 동일성을 갖는 서열을 포함하는 핵산에 의해 암호화된다. 이러한 두 핵산 사이의 동일성 퍼센트는 최적으로 정렬된 두 핵산 서열을 검사하거나 또는 표준 매개변수를 사용하는 소프트웨어 프로그램 또는 알고리즘(예를 들어, BLAST, ALIGN, CLUSTAL)을 사용하여 수동으로 결정될 수 있다. 두 핵산 서열이 실질적으로 동일하다는 한 가지 지표는 핵산 분자가 엄격한 조건하에서(예를 들어, 중간 내지 높은 엄격성의 범위 내에서) 다른 것의 상보적 서열에 혼성화된다는 것이다.
일부 실시형태에서, CRISPR 뉴클레이스는 참조 핵산 서열, 예를 들어, CRISPR 뉴클레이스를 암호화하는 핵산 서열, 예를 들어, 서열번호 1과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 이상의 서열 동일성을 갖지만 100%의 서열 동일성을 갖는 것은 아닌 핵산 서열에 의해 암호화된다.
일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 서열번호 2와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 CRISPR 뉴클레이스는 서열번호 2와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%를 초과하지만 100%는 아닌 동일성을 갖는 서열을 포함한다.
일부 실시형태에서, 본 발명은 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 2의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 심지어 적어도 99% 그러나 100%는 아닌 서열 동일성을 갖는 CRISPR 뉴클레이스를 설명한다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스는 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO/2021/202800에 기술되어 이는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i2 폴리펩타이드는 WO/2021/202800의 표 2에 나열되어 있는 아미노산 치환 중 하나 이상을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 3의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 4의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 5의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 495의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 PCT/US2021/025257의 서열번호 496의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 참조에 의해 원용되어 있는 WO/2021/202800의 서열번호 3 내지 146 및 495 내지 512 중 어느 하나와 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는 변이형 Cas12i2 폴리펩타이드이다.
일부 실시형태에서, CRISPR 뉴클레이스는 Cas12i 폴리펩타이드이다. 일부 실시형태에서, CRISPR 뉴클레이스는 Cas12i1 폴리펩타이드이다. 일부 실시형태에서, Cas12i1 폴리펩타이드는 변이형 Cas12i1 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 Casi1 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 8의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하는 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i1 폴리펩타이드를 암호화하는 핵산은 서열번호 8과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i1 폴리펩타이드는 서열번호 8과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i1 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 8 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i3 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas12i3 폴리펩타이드는 변이형 Cas12i3 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i3 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 11의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i3 폴리펩타이드를 암호화하는 핵산은 서열번호 11과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i3 폴리펩타이드는 서열번호 11과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i3 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 11 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, Cas12i 폴리펩타이드는 Cas12i4 폴리펩타이드이다. 일부 실시형태에서, 본 발명의 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas12i4 폴리펩타이드는 변이형 Cas12i4 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas12i4 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 9 또는 서열번호 10의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas12i4 폴리펩타이드를 암호화하는 핵산은 서열번호 9 또는 서열번호 10과 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas12i4 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 9 또는 서열번호 10 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스, 예를 들어, Cas9개의 뉴클레이스이다. 일부 실시형태에서, Cas9개의 뉴클레이스는 S. 피오게네스 또는 S. 아우레우스(S. aureus)로부터의 Cas9 또는 이의 변이체이다. 예를 들어, 전체가 참조에 의해 원용되어 있는 U.S. 20190136248을 참조한다. 일부 실시형태에서, Cas9 폴리펩타이드는 닉케이스이다.
일부 실시형태에서, 본 발명의 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 폴리펩타이드 서열을 포함한다. 일부 실시형태에서, 본 발명의 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 폴리펩타이드 서열을 포함한다.
일부 실시형태에서, Cas9 폴리펩타이드는 변이형 Cas9 폴리펩타이드이다. 일부 실시형태에서, 변이형 Cas9 폴리펩타이드는 하나 이상의 참조 폴리펩타이드, 예를 들어, 야생형 폴리펩타이드와 특정 정도의 아미노산 서열 동일성, 예를 들어, 서열번호 120 내지 122 중 어느 하나의 아미노산 서열과 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100%의 서열 동일성을 갖는다. 상동성 또는 동일성은, 예를 들어, 본 명세서에 기재된 바와 같이 BLAST, ALIGN 또는 CLUSTAL과 같은 프로그램을 사용하여 아미노산 서열 정렬에 의해 결정될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 변이형 Cas9 폴리펩타이드를 암호화하는 핵산은 서열번호 120 내지 122 중 어느 하나와 적어도 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 동일성을 갖는 아미노산 서열을 암호화한다. 일부 실시형태에서, 변이형 Cas9 폴리펩타이드는 서열번호 120 내지 122 중 어느 하나와 50%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 초과의 동일성을 갖는 서열을 갖는다.
일부 실시형태에서, 효소적 활성, 예를 들어, 뉴클레이스 또는 엔도뉴클레이스 활성을 갖는 본 명세서에 기재된 변이형 Cas9 폴리펩타이드는, 임의의 이전에 기재된 정렬 방법을 사용하여 정렬될 때, CRISPR 뉴클레이스 및 서열번호 120 또는 서열번호 121 중 어느 하나의 아미노산 서열과 100개, 95개, 90개, 85개, 80개, 75개, 70개, 65개, 60개, 55개, 50개, 40개, 35개, 30개, 25개, 20개, 19개, 18개, 17개, 16개, 15개, 14개, 13개, 12개, 11개, 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 2개 또는 1개의 아미노산 잔기(들)만큼 다른 아미노산 서열을 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스 또는 유형 II 뉴클레이스)는 야생형 폴리펩타이드의 하나 이상(예를 들어, 여러 개)의 아미노산에 변경을 포함하되, 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개, 51개, 52개, 53개, 54개, 55개, 56개, 57개, 58개, 59개, 60개, 61개, 62개, 63개, 64개, 65개, 66개, 67개, 68개, 69개, 70개, 71개, 72개, 73개, 74개, 75개, 76개, 77개, 78개, 79개, 80개, 81개, 82개, 83개, 84개, 85개, 86개, 87개, 88개, 89개, 90개, 91개, 92개, 93개, 94개, 95개, 96개, 97개, 98개, 99개, 100개, 101개, 102개, 103개, 104개, 105개, 106개, 107개, 108개, 109개, 110개, 111개, 112개, 113개, 114개, 115개, 116개, 117개, 118개, 119개, 120개, 121개, 122개, 123개, 124개, 125개, 126개, 127개, 128개, 129개, 130개, 131개, 132개, 133개, 134개, 135개, 136개, 137개, 138개, 139개, 140개, 141개, 142개, 143개, 144개, 145개, 146개, 147개, 148개, 149개, 150개, 151개, 152개, 153개, 154개, 155개, 156개, 157개, 158개, 159개, 160개, 161개, 162개, 162개, 164개, 164개, 165개, 166개, 167개, 168개, 169개, 170개, 171개, 172개, 173개, 174개, 175개, 176개, 177개, 178개, 179개, 180개, 181개, 182개, 183개, 184개, 185개, 186개, 187개, 188개, 189개, 190개, 191개, 193개, 194개, 195개, 196개, 197개, 198개, 199개, 200개 이상이 변경된다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 crRNA 처리 활성을 포함한다. 일부 실시형태에서, 유형 V 뉴클레이스(예를 들어, Cas12i 폴리펩타이드)는 crRNA 처리 활성이 결여되어 있는 변이체이다. 예를 들어, 유형 V 뉴클레이스가 변이형 Cas12i2 폴리펩타이드인 일부 실시형태에서, 변이형 Cas12i2 폴리펩타이드는 H485 또는 H486 치환을 포함한다. 일부 실시형태에서, 서열번호 2 내지 7 중 어느 하나와 적어도 90%의 동일성(예를 들어, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%)을 갖는 변이형 Cas12i2 폴리펩타이드는 H485 또는 H486 돌연변이를 추가로 포함한다. 일부 실시형태에서, H485 또는 H486 돌연변이를 포함하는 변이형 Cas12i2 폴리펩타이드는 감소된 crRNA 처리 활성을 포함하거나 또는 crRNA 처리 활성이 결여되어 있다.
일부 실시형태에서, 본 명세서에 기재된 CRISPR 뉴클레이스를 암호화하는 뉴클레오타이드 서열은 특정 숙주 세포 또는 유기체에서 사용하기 위해 코돈-최적화될 수 있다. 예를 들어, 핵산은 마우스, 래트, 토끼, 개, 가축 또는 비인간 영장류를 포함하는 임의의 비인간 진핵생물에 대해 코돈-최적화될 수 있다. 코돈 사용 표는, 예를 들어, www.kazusa.orjp/codon/에서 입수 가능한 "코돈 사용 데이터베이스"에서 쉽게 이용할 수 있으며, 이러한 표는 다양한 방식으로 적합화될 수 있다. 전체가 참조에 의해 본 명세서에 원용되어 있는 문헌[Nakamura et al. Nucl. Acids Res. 28:292 (2000)]을 참조한다. Gene Forge(Aptagen; 펜실베니아주 자코부스 소재)와 같은 특정 숙주 세포에서의 발현을 위해 특정 서열을 최적화하는 코돈을 위한 컴퓨터 알고리즘도 이용 가능하다.
본 명세서에 기재된 변화는 하나 이상의 아미노산 변화일 수 있지만, CRISPR 뉴클레이스에 대한 변화는 또한 아미노- 및/또는 카복실-말단 연장으로서 폴리펩타이드의 융합과 같은 구조적 또는 실질적인 특성일 수 있다. 예를 들어, CRISPR 뉴클레이스는 추가적인 펩타이드, 예를 들어, 하나 이상의 펩타이드를 포함할 수 있다. 추가적인 펩타이드의 예는 폴리히스티딘 태그(His-태그), Myc 및 FLAG와 같은 표지를 위한 에피토프 펩타이드를 포함할 수 있다. 일부 실시형태에서, 본 명세서에 기재된 CRISPR 뉴클레이스는 형광 단백질(예를 들어, 녹색 형광 단백질(green fluorescent protein: GFP) 또는 황색 형광 단백질(yellow fluorescent protein: YFP))과 같은 검출 가능한 모이어티에 융합될 수 있다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 핵 국재화 신호(nuclear localization signal: NLS)를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 핵외 수송 신호(nuclear export signal: NES)를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 NLS 및 적어도 1개(예를 들어, 2개, 3개, 4개, 5개, 6개 이상)의 NES를 포함한다.
일부 실시형태에서, CRISPR 뉴클레이스는 적어도 RuvC 도메인을 포함하지만, 전체 CRISPR 뉴클레이스보다 적다. 일부 실시형태에서, CRISPR 뉴클레이스는 야생형 CRISPR 뉴클레이스에 대해 절단된 CRISPR 뉴클레이스이다. 일부 실시형태에서, 절단된 CRISPR 뉴클레이스는 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 전체 CRISPR 뉴클레이스의 적어도 하나의 기능적 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 2개의 RuvC 도메인 또는 적어도 2개의 RuvC 모티프를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 3개의 RuvC 도메인 또는 적어도 3개의 RuvC 모티프를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 하나의 촉매 활성이 없는(catalytically dead) RuvC 도메인 및 적어도 하나의 촉매적으로 활성인 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 하나 이상의 유형 V 또는 유형 II 뉴클레이스로부터의 2개의 RuvC 도메인을 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 적어도 RuvC 도메인 및 이량체화 도메인을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 폴리머레이스에 융합된다. 일부 실시형태에서, 이전 실시형태 중 어느 하나에 기재된 바와 같은 CRISPR 뉴클레이스는 역전사효소 폴리펩타이드에 융합된다. 일부 실시형태에서, CRISPR 뉴클레이스는 N-말단 역전사효소 폴리펩타이드를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 C-말단 역전사효소 폴리펩타이드를 포함한다. 일부 실시형태에서, CRISPR 뉴클레이스는 CRISPR 뉴클레이스 내의 분자내 위치에 역전사효소 폴리펩타이드를 포함한다(예를 들어, 역전사효소는 CRISPR 뉴클레이스의 루프 내에 있음).
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 역전사효소 폴리펩타이드와 (예를 들어, 정전기적 상호작용을 통해) 상호작용한다. 일부 실시형태에서, CRISPR 뉴클레이스는 이량체화 도메인을 포함한다. 본 명세서에서 사용되는 용어 "이량체화 도메인"은 별도의 양립 가능한 폴리펩타이드 도메인(예를 들어, 제2 양립 가능한 이량체화 도메인)에 특이적으로 결합할 수 있는 폴리펩타이드 도메인을 지칭한다. 일부 실시형태에서, 이량체는 제1 이량체화 도메인과 제2 양립 가능한 이량체화 도메인 사이의 비공유 결합에 의해 형성된다. 일부 실시형태에서, 이량체화 도메인은 류신 지퍼, 나노바디 또는 항체이다. 일부 실시형태에서, 이량체화 도메인은 역전사효소 폴리펩타이드를 동원한다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소 폴리펩타이드는 이중 코일 펩타이드(coiled-coil) 이종이량체를 통해 상호작용한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 라이게이스(ligase), 인테그레이스(integrase) 및/또는 리콤비네이스(recombinase)와 상호작용한다. 일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스는 라이게이스, 인테그레이스 및/또는 리콤비네이스에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 CRISPR 뉴클레이스의 N-말단 또는 C-말단에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 CRISPR 뉴클레이스에 내부적으로 융합된다. 일부 실시형태에서, 인테그레이스는 세린 인테그레이스이다. 일부 실시형태에서, 인테그레이스는 Bxb1, TP901 또는 PhiBT1 인테그레이스이다. 일부 실시형태에서, 리콤비네이스는 세린 리콤비네이스 또는 타이로신 리콤비네이스이다. 일부 실시형태에서, 리콤비네이스는 CRE 리콤비네이스이다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용하거나 또는 이에 융합된 CRISPR 뉴클레이스는 추가로 역전사효소와 상호작용하거나 또는 이에 융합된다.
B.
역전사효소
다양한 실시형태에서, 본 명세서에 개시된 조성물은 CRISPR 뉴클레이스에 대한 융합체로서 제공될 수 있는 폴리머레이스(예를 들어, DNA-의존적 DNA 폴리머레이스 또는 RNA-의존적 DNA 폴리머레이스) 또는 이들의 변이체를 포함한다. 폴리머레이스는 야생형 폴리머레이스, 기능적 단편, 변이체, 절단된 변이체 등일 수 있다. 폴리머레이스는 진핵생물, 원핵생물, 고세균 또는 바이러스 유기체로부터의 야생형 폴리머레이스를 포함할 수 있고/있거나 폴리머레이스는 유전 공학, 돌연변이 유발, 유도 진화-기반 과정에 의해 변형될 수 있다.
본 명세서에 개시된 바와 같은 것들(예를 들어, 표 7 및 표 17에 나타낸 것들)과 같은 임의의 CRISPR 뉴클레이스-RT 융합 폴리펩타이드, 이들의 암호화 핵산, 이를 포함하는 벡터, 이를 제조하는 방법도 본 개시내용의 범위 내에 있다.
일부 실시형태에서, 폴리머레이스는 역전사효소이다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 임의의 자연 발생적 유기체 또는 바이러스로부터 얻거나 또는 상업적 또는 비상업적 공급원으로부터 얻은 임의의 야생형 역전사효소이다. 역전사효소 폴리펩타이드도 변이형 역전사효소 폴리펩타이드일 수 있다.
역전사효소 폴리펩타이드는 다수의 다양한 공급원으로부터 얻을 수 있다. 예를 들어, 유전자는 레트로바이러스에 감염된 진핵생물 세포로부터 또는 전체 레트로바이러스 게놈의 일부 또는 전체를 포함하는 플라스미드로부터 얻을 수 있다. 또한, 역전사효소 유전자를 포함하는 RNA는 레트로바이러스로부터 얻을 수 있다. 일부 실시형태에서, 역전사효소는 개별 성분으로 발현되거나 또는 그렇지 않으면 이로 제공되며, 즉, 이는 CRISPR 뉴클레이스(예를 들어, Cas12i) 폴리펩타이드와의 융합체 단백질이 아니다.
당업자는 라우스 육종 바이러스(Rous Sarcoma Virus: RSV) 역전사효소, 조류 골수아세포 백혈증 바이러스(Avian Myeloblastosis Virus: AMV) 역전사효소, 조류 적아세포증 바이러스(Avian Erythroblastosis Virus: AEV) 헬퍼 바이러스 MCAV 역전사효소, 조류 골수세포증 바이러스 MC29 헬퍼 바이러스 MCAV 역전사효소, 조류 세망내피증 바이러스(Reticuloendotheliosis Virus: REV-T) 헬퍼 바이러스 REV-A 역전사효소, 조류 육종 바이러스 UR2 헬퍼 바이러스 UR2AV 역전사효소, 조류 육종 바이러스 Y73 헬퍼 바이러스 YAV 역전사효소, 라우스 관련 바이러스(Rous Associated Virus: RAV) 역전사효소 및 골수아세포 백혈증 관련 바이러스(Myeloblastosis Associated Virus: MAV) 역전사효소를 포함하지만 이에 제한되지 않는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV) 역전사효소, 인간 면역결핍 바이러스(Human Immunodeficiency Virus: HIV) 역전사효소 및 조류 육종-백혈증 바이러스(avian Sarcoma-Leukosis Virus: ASLV) 역전사효소를 포함하지만 이에 제한되지 않는 역전사효소가 당업계에 공지되어 있으며 본 명세서에 기재된 조성물에 적합하게 사용될 수 있음을 인식할 것이다.
일부 실시형태에서, 역전사효소는 에우박테리움 렉탈레(Eubacterium rectale)로부터의 MMLV-RT, MarathonRT, 또는 RTX 역전사효소, 또는 MMLV-RT, MarathonRT 또는 RTX 역전사효소의 변이체이다. 일부 실시형태에서, 역전사효소는 표 2에 나타낸 서열, 이들의 변이체 또는 이들의 오쏘로그이다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 CRISPR 뉴클레이스에 융합된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 N-말단 CRISPR 뉴클레이스를 포함한다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 C-말단 CRISPR 뉴클레이스를 포함한다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 역전사효소 폴리펩타이드(예를 들어, CRISPR 뉴클레이스) 내의 분자내 위치에 있고 역전사효소 폴리펩타이드의 루프 내에 있는 CRISPR 뉴클레이스를 포함한다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 이량체화 도메인을 포함한다. 일부 실시형태에서, 이량체화 도메인은 류신 지퍼, 나노바디 또는 항체이다. 일부 실시형태에서, 이량체화 도메인은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 동원한다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 "오류 유발성(error-prone)" 역전사효소 변이체이다. 당업계에 공지되어 있고/있거나 이용 가능한 오류 유발성 역전사효소가 사용될 수 있다. 역전사효소는 자연적으로 임의의 교정 기능을 갖지 않는다는 것을 알 것이며; 따라서, 역전사효소의 오류율은 일반적으로 교정 활성을 포함하는 DNA 폴리머레이스보다 높다. 일부 실시형태에서, 역전사효소는 합성된 약 15,000개의 뉴클레오타이드에서 오류율이 1 미만인 경우 "오류 유발성"인 것으로 간주된다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 RNase H 도메인에 돌연변이 또는 돌연변이들을 갖는다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 RNase H 도메인을 포함하지 않는다(예를 들어, RNase H 도메인은 역전사효소 폴리펩타이드로부터 제거되었음). 일부 실시형태에서, RNase H 도메인은 역전사효소 폴리펩타이드에서 절단된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 RNA-의존적 DNA 폴리머레이스 도메인에 돌연변이 또는 돌연변이들을 갖는다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 내열성 특성이 변경된 변이체이다. 고온을 견디는 역전사효소의 능력은 cDNA 합성의 중요한 양태이다. 반응 온도가 상승하면 강력한 2차 구조 및/또는 높은 GC 함량을 갖는 RNA를 변성시키는 데 도움이 되어 역전사효소가 서열을 판독할 수 있게 한다. 결과적으로, 더 높은 온도에서 역전사를 수행하면 전장 cDNA 합성 및 더 높은 수율이 가능해진다. 야생형 M-MLV 역전사효소는 전형적으로 37℃ 내지 48℃ 범위의 최적 온도를 갖지만; 49℃, 50℃, 51℃, 52℃, 53℃, 54℃, 55℃, 56℃, 57℃, 58℃, 59℃, 60℃, 61℃, 62℃, 63℃, 64℃, 65℃, 66℃ 이상을 포함하여 48℃보다 더 높은 온도에서 역전사 활성을 허용하는 돌연변이가 도입될 수 있다.
본 명세서에서 사용되는 변이형 역전사효소 폴리펩타이드는 임의의 야생형 역전사효소, 돌연변이 역전사효소, 또는 역전사효소의 단편 또는 본 명세서에 개시 또는 상정되거나 또는 당업계에 공지된 다른 역전사효소 변이체를 포함하는 임의의 참조 역전사효소 폴리펩타이드와 적어도 약 20% 동일, 적어도 약 25% 동일, 적어도 약 30% 동일, 적어도 약 35% 동일, 적어도 약 40% 동일, 적어도 약 45% 동일, 적어도 약 50% 동일, 적어도 약 55% 동일, 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일하거나 또는 적어도 약 99.9% 동일할 수 있다. 일부 실시형태에서, 역전사효소 변이체는 참조 역전사효소와 비교하여 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 21개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개, 50개 또는 최대 100개, 또는 최대 200개, 또는 최대 300개, 또는 최대 400개 또는 최대 500개 이상의 아미노산 변화를 가질 수 있다. 일부 실시형태에서, 역전사효소 변이체는 참조 역전사효소의 단편을 포함하며, 단편은 참조 역전사효소의 상응하는 단편과 적어도 약 20% 동일, 적어도 약 25% 동일, 적어도 약 30% 동일, 적어도 약 35% 동일, 적어도 약 40% 동일, 적어도 약 45% 동일, 적어도 약 50% 동일, 적어도 약 55% 동일, 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 96% 동일, 적어도 약 97% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일, 적어도 약 99.5% 동일하거나 또는 적어도 약 99.9% 동일하다.
오류 유발성 역전사효소, 내열성 역전사효소 및 진행성이 증가된 역전사효소를 비롯한 변이형 역전사효소는 돌연변이 유발 또는 진화적 절차를 비롯한 다양한 일상적인 전략에 의해 조작될 수 있다. 일부 경우에, 변이체는 단일 돌연변이를 도입함으로써 생산될 수 있다. 다른 경우에, 변이체는 하나 초과의 돌연변이가 필요할 수 있다. 하나 초과의 돌연변이를 포함하는 돌연변이의 경우, 특정 돌연변이에 의해 발생하는 다른 돌연변이와 분리하여 부위-지정 돌연변이 유발에 의해 확인된 돌연변이를 야생형 유전자에 도입함으로써 주어진 돌연변이의 효과가 평가될 수 있다. 그런 다음, 이렇게 생성된 단일 돌연변이의 스크리닝 검정은 해당 돌연변이만의 효과를 결정할 수 있을 것이다.
일부 실시형태에서, 역전사효소 폴리펩타이드는 역전사효소의 연장률 및/또는 효율을 개선하기 위해 도메인을 포함하거나 또는 이에 융합된다. 일부 실시형태에서, 역전사효소 폴리펩타이드는 술폴로부스 솔파타리쿠스(Sulfolobus solfataricus)로부터의 Sso7d 폴리펩타이드와 같은 Sso7d 폴리펩타이드에 융합된다. 예를 들어, 문헌[Wang et al., Nucleic Acids Res. 32(3): 1197-207 (2004)]을 참조한다.
일부 실시형태에서, 본 명세서의 다른 곳에 기재된 바와 같은 CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 적어도 하나의 뉴클레이스 결합 서열에 결합할 수 있으며 이에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 적어도 하나의 DNA-결합 서열을 통해 표적 서열에 결합할 수 있으며 이에 결합한다. 이러한 실시형태에서, CRISPR 뉴클레이스-역전사효소 융합 폴리펩타이드는 편집 주형 RNA의 뉴클레이스 결합 서열과 DNA-결합 서열을 통한 CRISPR 뉴클레이스의 결합을 통해 표적 서열에 동원되거나 또는 이에 근접하게 된다.
일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 5' 말단에서 시작하여 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 3' 말단에서 시작하여 표적 핵산의 비-PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 5' 말단에서 시작하여 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, 역전사효소는 역전사 주형 서열을 PBS의 3' 말단에서 시작하여 표적 핵산의 PAM 가닥으로 전사한다. 일부 실시형태에서, PBS의 표적 핵산의 비-PAM 가닥으로의 결합 후, 역전사효소는 역전사 주형 서열을 비-PAM 가닥의 자유 3' 말단에서 전사한다. 일부 실시형태에서, PBS의 표적 핵산의 PAM 가닥으로의 혼성화 후, 역전사효소는 역전사 주형 서열을 PAM 가닥의 자유 3' 말단에서 전사한다.
일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 역전사효소는 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용한다. 일부 실시형태에서, 본 명세서에 기재된 실시형태 중 어느 하나에서와 같은 역전사효소는 라이게이스, 인테그레이스 및/또는 리콤비네이스에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 역전사효소의 N-말단 또는 C-말단에 융합된다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스는 역전사효소에 내부적으로 융합된다. 일부 실시형태에서, 인테그레이스는 세린 인테그레이스이다. 일부 실시형태에서, 인테그레이스는 Bxb1, TP901 또는 PhiBT1 인테그레이스이다. 일부 실시형태에서, 리콤비네이스는 세린 리콤비네이스 또는 타이로신 리콤비네이스이다. 일부 실시형태에서, 리콤비네이스는 CRE 리콤비네이스이다. 일부 실시형태에서, 라이게이스, 인테그레이스 및/또는 리콤비네이스와 상호작용하거나 또는 이에 융합된 역전사효소는 추가로 CRISPR 뉴클레이스와 상호작용하거나 또는 이에 융합된다.
C.
유전자 편집 RNA 분자
본 명세서에 개시된 임의의 유전자 편집 시스템은 RNA 가이드 및 RNA 역전사효소(RT) 공여체(RT 공여체 RNA)를 포함하는 편집 주형 RNA(들)(유전자 편집 RNA)를 포함할 수 있다. 편집 주형 RNA(들)는 목적하는 게놈 부위와 같은 표적 핵산의 서열을 편집하는 데 도움을 준다. 일부 실시형태에서, 편집 주형 RNA는 RNA 가이드(예를 들어, 뉴클레이스 결합 서열 및 DNA-결합 서열 포함)와 RT 공여체 RNA 모두를 포함하는 단일 RNA 분자일 수 있다. 다른 실시형태에서, 편집 주형 RNA는 RNA 가이드 및 RT 공여체 RNA를 개별 RNA 분자로서 포함한다.
일부 실시형태에서, 편집 주형 RNA 또는 이의 임의의 부분은 벡터에 암호화된다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
i. RNA 가이드
본 명세서에 개시된 임의의 유전자 편집 시스템에서, 편집 주형 RNA는 유전자 편집 시스템에도 포함된 CRISPR 뉴클레이스를 통해 표적 핵산의 절단을 매개하는 RNA 가이드를 포함한다. RNA 가이드(또는 gRNA)는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다. 뉴클레이스 결합 서열은 결합을 위해 CRISPR 뉴클레이스에 의해 인식될 수 있는 하나 이상의 결합 부위를 포함할 수 있다. 일부 경우에, gRNA는 뉴클레이스 결합 서열과 스페이서 서열을 모두 포함하는 단일 RNA 분자이다. 대안적으로, gRNA는 뉴클레이스 결합 서열 및 스페이서를 2개의 개별 RNA 분자로서 포함할 수 있다.
일부 실시형태에서, RNA 가이드는 RNA 가이드의 5' 말단, RNA 가이드의 3' 말단 또는 RNA 가이드 내의 분자내 위치에 RNA 연장부를 포함한다. 다양한 실시형태에서, RNA 연장부는 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 21개의 뉴클레오타이드, 적어도 22개의 뉴클레오타이드, 적어도 23개의 뉴클레오타이드, 적어도 24개의 뉴클레오타이드, 적어도 25개의 뉴클레오타이드, 적어도 26개의 뉴클레오타이드, 적어도 27개의 뉴클레오타이드, 적어도 28개의 뉴클레오타이드, 적어도 29개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 31개의 뉴클레오타이드, 적어도 32개의 뉴클레오타이드, 적어도 33개의 뉴클레오타이드, 적어도 34개의 뉴클레오타이드, 적어도 35개의 뉴클레오타이드, 적어도 36개의 뉴클레오타이드, 적어도 37개의 뉴클레오타이드, 적어도 38개의 뉴클레오타이드, 적어도 39개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 41개의 뉴클레오타이드, 적어도 42개의 뉴클레오타이드, 적어도 43개의 뉴클레오타이드, 적어도 44개의 뉴클레오타이드, 적어도 45개의 뉴클레오타이드, 적어도 46개의 뉴클레오타이드, 적어도 47개의 뉴클레오타이드, 적어도 48개의 뉴클레오타이드, 적어도 49개의 뉴클레오타이드 또는 적어도 50개의 뉴클레오타이드 길이이다. 일부 실시형태에서, RNA 연장부는 역전사 공여체 RNA("RT 공여체 RNA")이다(예를 들어, RNA 가이드는 RT 공여체 RNA에 융합됨). 일부 실시형태에서, RT 공여체 RNA는 본 명세서에 기재된 바와 같은 프라이머 결합 부위(PBS) 및 역전사 주형 서열을 포함한다.
뉴클레이스 결합 서열
일부 실시형태에서, 본 명세서에 기재된 바와 같은 조성물은 뉴클레이스 결합 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 CRISPR 뉴클레이스 결합 서열이다(예를 들어, 뉴클레이스 결합 서열은 유형 V 뉴클레이스 또는 유형 II 뉴클레이스에 결합할 수 있음). 일부 실시형태에서, 뉴클레이스 결합 서열은 추가의 핵산 결합 서열(예를 들어, DNA 결합 서열)이다.
일부 실시형태에서, 뉴클레이스 결합 서열은 RNA 가이드를 포함한다. RNA 가이드는 특이적 결합 친화도로 본 명세서에 기재된 CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스 또는 유형 II 뉴클레이스) 중 어느 하나에 결합할 수 있다. 일부 실시형태에서, RNA 가이드는 표적 서열에 대한 특이적 결합 친화도를 추가로 포함한다. 일부 실시형태에서, 본 명세서에 기재된 조성물은 2개 이상(예를 들어, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 이상)의 RNA 가이드를 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 벡터에 암호화된다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열을 포함한다. 소정의 실시형태에서, 뉴클레이스 결합 서열은 DNA-결합 서열(예를 들어, DNA-표적화 서열 또는 스페이서)에 연결된 직접 반복 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 직접 반복 서열 및 DNA-결합 서열 또는 직접 반복- DNA-결합 서열 -직접 반복 서열을 포함한다. 일부 실시형태에서, 뉴클레이스 결합 서열은 절단된 직접 반복 서열 및 처리된 또는 성숙 crRNA의 전형적인 DNA-결합 서열을 포함한다.
일부 실시형태에서, 뉴클레이스 결합 서열(예를 들어, 직접 반복 서열)은 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드에 결합할 수 있다. 일부 실시형태에서, 직접 반복 서열은 Cas9 폴리펩타이드에 결합할 수 있다.
뉴클레이스 결합 서열이 공개적으로 이용 가능한 CRISPR 뉴클레이스에 대한 직접 반복인 실시형태에서, 이러한 직접 반복 서열은 당업계에 공지되어 있다. 일부 실시형태에서, CRISPR 뉴클레이스에 결합할 수 있는 직접 반복 서열은 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있는 임의의 것들이다.
CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 90%의 동일성을 포함한다. CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 95%의 동일성을 포함한다. CRISPR 뉴클레이스가 Cas12i 폴리펩타이드인 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나를 포함한다. 일부 실시형태에서, 직접 반복 서열은 서열번호 12 내지 24 중 어느 하나의 일부를 포함한다.
다른 유형 V CRISPR 뉴클레이스와 같은 다른 CRISPR 뉴클레이스에 대한 뉴클레이스 결합 서열은 당업계에 공지되어 있고/있거나 아래 표 4 내지 표 6에 제공되어 있다.
DNA-결합 서열
RNA 가이드는 또한 DNA-결합 서열을 포함할 수 있다. 일부 실시형태에서, DNA-결합 서열은 DNA-표적화 서열(예를 들어, 스페이서)이다. 스페이서는 약 7개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 스페이서는 약 7개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드 또는 약 7개의 뉴클레오타이드 내지 약 19개의 뉴클레오타이드 길이를 가질 수 있다. 예를 들어, 스페이서는 약 7개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 45개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 60개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 70개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 90개의 뉴클레오타이드, 약 7개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 45개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 60개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 70개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 80개의 뉴클레오타이드, 약 10개의 뉴클레오타이드 내지 약 90개의 뉴클레오타이드 또는 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이를 가질 수 있다.
일부 실시형태에서, RNA 가이드의 스페이서는 일반적으로 7개 내지 50개의 뉴클레오타이드 또는 15개 내지 35개의 뉴클레오타이드(예를 들어, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개, 31개, 32개, 33개, 34개, 35개, 36개, 37개, 38개, 39개, 40개, 41개, 42개, 43개, 44개, 45개, 46개, 47개, 48개, 49개 또는 50개의 뉴클레오타이드) 길이를 갖고 특정 표적 서열과 상보적이도록 설계될 수 있다. 일부 실시형태에서, RNA 가이드는 18개 내지 22개의 뉴클레오타이드 길이를 갖도록 설계될 수 있다.
일부 실시형태에서, DNA-결합 서열은 본 명세서에 기재된 바와 같은 표적 서열과 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 적어도 약 99.5%의 서열 동일성을 가지며, 염기-페어링을 통해 표적 서열의 상보적 영역에 결합할 수 있다.
일부 실시형태에서, DNA-결합 서열은 RNA 염기만을 포함한다. 일부 실시형태에서, DNA-결합 서열은 DNA 염기를 포함한다(예를 들어, 스페이서는 적어도 하나의 티민을 포함함). 일부 실시형태에서, DNA-결합 서열은 RNA 염기 및 DNA 염기를 포함한다(예를 들어, DNA-결합 서열은 적어도 하나의 티민 및 적어도 하나의 우라실을 포함함).
일부 경우에, 본 명세서에 개시된 RNA 가이드는 링커 서열, 5' 말단 및/또는 3' 말단 보호 단편(본 명세서의 개시내용 참조) 또는 이들의 조합을 추가로 포함할 수 있다.
본 명세서에 개시된 임의의 RNA 가이드의 스페이서는 표적 서열에 특이적일 수 있으며, 즉, 염기-페어링을 통해 표적 서열의 상보적 영역에 결합할 수 있다. 일부 경우에, 표적 서열은, 예를 들어, 유전자 편집이 필요한 관심 게놈 부위 내에 있을 수 있다.
일부 실시형태에서, 표적 서열은 PAM 서열에 인접해 있다. PAM 서열은 당업계에 공지되어 있다. 일부 실시형태에서, CRISPR 뉴클레이스에 의해 인식될 수 있는 PAM 서열은 각각의 관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적을 위해 원용되어 있는 WO2021055874, WO2020206036, WO2020191102, WO2020186213, WO2020028555, WO2020033601, WO2019126762, WO2019126774, WO2019071048, WO2019018423, WO2019005866, WO2018191388, WO2018170333, WO2018035388, WO2018035387, WO2017219027, WO2017189308, WO2017184768, WO2017106657, WO2016205749, WO2017070605, WO2016205764, WO2016205711, WO2016028682, WO2015089473, WO2014093595, WO2015089427, WO2014204725, WO2015070083, WO2014093655, WO2014093694, WO2014093712, WO2014093635, WO2021133829, WO2021007177, WO2020197934, WO2020181102, WO2020181101, WO2020041456, WO2020023529, WO2020005980, WO2019104058, WO2019089820, WO2019089808, WO2019089804, WO2019089796, WO2019036185, WO2018226855, WO2018213351, WO2018089664, WO2018064371, WO2018064352, WO2017106569, WO2017048969, WO2016196655, WO2016106239, WO2016036754, WO2015103153, WO2015089277, WO2014150624, WO2013176772, WO2021119563, WO2021118626, WO2020247883, WO2020247882, WO2020223634, WO2020142754, WO2020086475, WO2020028729, WO2019241452, WO2019173248, WO2018236548, WO2018183403, WO2017027423, WO2018106727, WO2018071672, WO2017096328, WO2017070598, WO2016201155, WO2014150624, WO2013098244, WO2021113522, WO2021050534, WO2021046442, WO2021041569, WO2021007563, WO2020252378, WO2020180699, WO2020018142, WO2019222555, WO2019178428, WO2019178427 또는 WO2019006471에 개시되어 있다.
유전자 편집 시스템이 Cas12i 폴리펩타이드를 포함하는 경우, PAM 서열은 5'-NTTN-3'(또는 5'-TTN-3')를 포함하되, N은 임의의 뉴클레오타이드(예를 들어, A, G, T 또는 C)이다. PAM 서열은 표적 서열의 상류에 있다. 다른 CRISPR 뉴클레이스와 회합된 PAM 서열은 서열 5'-TTY-3' 또는 5'-TTB-3'을 포함할 수 있되, Y는 C 또는 T이고, B는 G, T 또는 C이다. PAM 서열은 표적 서열에 바로 인접할 수 있거나, 예를 들어, 표적 서열의 소수(예를 들어, 1개, 2개, 3개, 4개 또는 5개)의 뉴클레오타이드 내에 있을 수 있다.
아래 표 4 내지 표 6은 당업계에 공지된 예시적인 유형 V CRISPR 뉴클레이스 및 이의 상응하는 뉴클레이스 결합 서열 및 PAM 서열을 제공한다. 이러한 서열을 통해 당업자는 또 다른 유형 V CRISPR 뉴클레이스를 사용하여 본 명세서에 기재된 바와 같은 편집 주형 RNA를 설계할 수 있다.
관련 개시내용이 본 명세서에 언급된 특허 대상 및 목적에 대해 참조에 의해 원용되어 있는 문헌[Zetsche et al., Cell 163:759-771 (2015)]을 참조한다.
아래 표 6은 당업계에 공지된 추가적인 유형 V CRISPR 뉴클레이스에 대한 정보를 제공한다.
ii. RNA 역전사효소 공여체 또는 RT 공여체 RNA
본 명세서에 개시된 임의의 유전자 편집 시스템의 편집 주형 RNA는 또한 RNA 역전사효소(RT) 공여체(RT 공여체 RNA)를 포함할 수 있다. RT 공여체 RNA는 (i) 프라이머 결합 부위(PBS) 및 (ii) 역전사 주형 서열을 포함할 수 있다. 일부 경우에, RT 공여체 RNA는 (iii) 뉴클레오타이드 링커 서열, (iv) 5' 말단 및/또는 3' 말단 보호 단편(본 명세서의 개시내용 참조) 또는 이들의 조합을 추가로 포함할 수 있다. 일부 실시형태에서, 편집 주형 RNA는 하나 이상의 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA는 하나 이상의 PBS, 하나 이상의 역전사 주형 서열 및/또는 하나 이상의 뉴클레오타이드 링커 서열을 포함한다. 일부 실시형태에서, 제1 편집 주형 RNA는 하나 이상의 PBS를 포함하고, 제2 편집 주형 RNA는 하나 이상의 역전사 주형 서열을 포함한다.
일부 실시형태에서, RT 공여체 RNA는 압타머를 포함한다. 일부 실시형태에서, 압타머는 역전사효소 폴리펩타이드를 동원한다.
프라이머 결합 부위(PBS)
일부 실시형태에서, 본 명세서에 개시된 바와 같은 RT 공여체 RNA의 PBS는 염기-페어링을 통해 DNA 가닥에 결합할 수 있는 RNA 서열이다. DNA 가닥은 CRISPR 뉴클레이스에 의해 닉을 형성할 수 있거나 또는 절단될 수 있다. 일부 실시형태에서, PBS는 염기-페어링을 통해 DNA 가닥(PBS-표적화 부위)에 결합할 수 있는 RNA 서열을 포함한다. DNA 가닥은 자유 3' 자유 말단을 가질 수 있거나 또는 3' 자유 말단은 동일한 유전자 편집 시스템에 포함된 CRISPR 뉴클레이스에 의한 절단을 통해 생성될 수 있다. 일부 예에서, PBS-표적화 부위는 PAM 서열과 동일한 DNA 가닥(PAM 가닥)에 위치할 수 있다. 일부 예에서, PBS-표적화 부위는 PAM 가닥의 상보적 가닥(비-PAM 가닥)에 위치할 수 있다.
일부 실시형태에서, PBS는 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이(예를 들어, 약 3개의 뉴클레오타이드, 5개의 뉴클레오타이드, 8개의 뉴클레오타이드, 10개의 뉴클레오타이드, 13개의 뉴클레오타이드, 15개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드, 100개의 뉴클레오타이드, 110개의 뉴클레오타이드, 120개의 뉴클레오타이드, 130개의 뉴클레오타이드, 140개의 뉴클레오타이드, 150개의 뉴클레오타이드, 160개의 뉴클레오타이드, 170개의 뉴클레오타이드, 180개의 뉴클레오타이드, 190개의 뉴클레오타이드, 200개의 뉴클레오타이드 또는 그 사이의 임의의 길이)이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이(예를 들어, 약 3개의 뉴클레오타이드, 5개의 뉴클레오타이드, 8개의 뉴클레오타이드, 10개의 뉴클레오타이드, 13개의 뉴클레오타이드, 15개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드 또는 100개의 뉴클레오타이드 또는 그 사이의 임의의 길이)이다.
일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 40개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 30개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 10개의 뉴클레오타이드 내지 약 15개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 11개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 12개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 13개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 14개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 30개의 뉴클레오타이드 길이이다.
Cas12i 폴리펩타이드(예를 들어, 본 명세서에 개시된 것과 같은 Cas12i2 폴리펩타이드)를 포함하는 유전자 편집 시스템에서, RT 공여체 RNA의 PBS는 비-PAM 가닥의 영역(PBS-표적화 부위)에 결합할 수 있다. 일부 경우에, PBS-표적화 부위는 표적 서열의 상보적 영역의 상류에 위치할 수 있다. 예를 들어, PBS-표적화 부위는 상보적 영역의 상류에 있는 최대 20개의 뉴클레오타이드, 예를 들어, 최대 15개의 뉴클레오타이드, 최대 10개의 뉴클레오타이드 또는 최대 5개의 뉴클레오타이드일 수 있다. 특정 예에서, PBS-표적화 부위는 상보적 영역의 상류에 있는 약 3개의 뉴클레오타이드 내지 약 10개의 뉴클레오타이드일 수 있다. 특정 예에서, PBS-표적화 부위는 상보적 영역의 상류에 있는 1개의 뉴클레오타이드, 1개 내지 2개의 뉴클레오타이드, 1개 내지 3개의 뉴클레오타이드, 1개 내지 4개의 뉴클레오타이드, 1개 내지 5개의 뉴클레오타이드, 1개 내지 6개의 뉴클레오타이드, 1개 내지 7개의 뉴클레오타이드, 1개 내지 8개의 뉴클레오타이드, 1개 내지 9개의 뉴클레오타이드, 1개 내지 10개의 뉴클레오타이드, 2개 내지 3개의 뉴클레오타이드, 2개 내지 4개의 뉴클레오타이드, 2개 내지 5개의 뉴클레오타이드, 2개 내지 6개의 뉴클레오타이드, 2개 내지 7개의 뉴클레오타이드, 2개 내지 8개의 뉴클레오타이드, 2개 내지 9개의 뉴클레오타이드, 2개 내지 10개의 뉴클레오타이드, 3개 내지 4개의 뉴클레오타이드, 3개 내지 5개의 뉴클레오타이드, 3개 내지 6개의 뉴클레오타이드, 3개 내지 7개의 뉴클레오타이드, 3개 내지 8개의 뉴클레오타이드, 3개 내지 9개의 뉴클레오타이드, 3개 내지 10개의 뉴클레오타이드, 4개 내지 5개의 뉴클레오타이드, 4개 내지 6개의 뉴클레오타이드, 4개 내지 7개의 뉴클레오타이드, 4개 내지 8개의 뉴클레오타이드, 4개 내지 9개의 뉴클레오타이드, 4개 내지 10개의 뉴클레오타이드, 5개 내지 6개의 뉴클레오타이드, 5개 내지 7개의 뉴클레오타이드, 5개 내지 8개의 뉴클레오타이드, 5개 내지 9개의 뉴클레오타이드, 5개 내지 10개의 뉴클레오타이드, 6개 내지 7개의 뉴클레오타이드, 6개 내지 8개의 뉴클레오타이드, 6개 내지 9개의 뉴클레오타이드, 6개 내지 10개의 뉴클레오타이드, 7개 내지 8개의 뉴클레오타이드, 7개 내지 9개의 뉴클레오타이드, 7개 내지 10개의 뉴클레오타이드, 8개 내지 9개의 뉴클레오타이드, 8개 내지 10개의 뉴클레오타이드, 9개 내지 10개의 뉴클레오타이드 또는 10개의 뉴클레오타이드일 수 있다. 다른 경우에, PBS-표적화 부위는 상보적 영역과 중첩될 수 있다. 자유 3' 말단이 표적 서열 및 상보적 영역 내 또는 그 근처의 유전자 편집 시스템에서 Cas12i 폴리펩타이드에 의해 생성될 때, 상보적 영역의 상류 또는 이와 중첩되는 부위에서 비-PAM 가닥에 대한 PBS 결합은 비-PAM 가닥에서 생성된 자유 3' 말단에서 시작하여 유전자 편집 시스템에서 RT 폴리펩타이드에 의해 DNA 합성을 효율적으로 촉진할 수 있다. 예시적인 예시는 도 12a 및 도 12b에 제공되어 있다.
역전사 주형 서열
역전사 주형 서열(주형 서열)은 본 명세서에 개시된 유전자 편집 시스템에서 RT 폴리펩타이드에 의해 매개되는 역전사를 위한 주형 역할을 한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 암호화된 편집을 갖는 서열을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 암호화된 편집을 갖는 이의 상보적 영역에 대한 서열 상동성을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드, 20개의 뉴클레오타이드, 30개의 뉴클레오타이드, 40개의 뉴클레오타이드, 50개의 뉴클레오타이드, 60개의 뉴클레오타이드, 70개의 뉴클레오타이드, 80개의 뉴클레오타이드, 90개의 뉴클레오타이드, 100개의 뉴클레오타이드, 110개의 뉴클레오타이드 또는 120개의 뉴클레오타이드 길이 또는 그 사이의 임의의 길이이다.
일부 실시형태에서, 역전사 주형 서열은 약 25개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 26개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 27개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 28개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 29개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 30개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 31개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 32개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 33개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 34개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 35개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 36개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 37개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 38개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 39개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 40개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 41개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 42개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 43개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 44개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 45개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 46개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 47개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 48개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 49개의 뉴클레오타이드이다. 일부 실시형태에서, 역전사 주형 서열은 약 50개의 뉴클레오타이드이다.
일부 실시형태에서, 역전사 주형 서열은 표적 서열에 대해 적어도 하나의 암호화된 편집을 포함한다. 다른 실시형태에서, 역전사 주형 서열은 표적 서열의 상보적 영역에 대해 적어도 하나의 암호화된 편집을 포함한다. 일부 실시형태에서, 적어도 하나의 암호화된 편집은 적어도 하나의 치환, 삽입 및/또는 결실을 포함한다. 일부 실시형태에서, 표적 서열의 편집은 표적 서열의 서열에 대한 치환, 삽입 및/또는 결실을 포함한다. 일부 실시형태에서, 역전사 주형 서열은 적어도 하나의 LoxP 부위를 포함한다.
일부 실시형태에서, 편집은 G에서 T로의 치환, G에서 A로의 치환, G에서 C로의 치환, T에서 G로의 치환, T에서 A로의 치환, T에서 C로의 치환, C에서 G로의 치환, C에서 T로의 치환, C에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환 또는 A에서 C로의 치환과 같은 단일 또는 다중-뉴클레오타이드 치환일 수 있다. 일부 실시형태에서, 서열의 변화는 G:C 염기쌍을 T:A 염기쌍으로, G:C 염기쌍을 A:T 염기쌍으로, G:C 염기쌍을 C:G 염기쌍으로, T:A 염기쌍을 G:C 염기쌍으로, T:A 염기쌍을 A:T 염기쌍으로, T:A 염기쌍을 C:G 염기쌍으로, C:G 염기쌍을 G:C 염기쌍으로, C:G 염기쌍을 T:A 염기쌍으로, C:G 염기쌍을 A:T 염기쌍으로, A:T 염기쌍을 T:A 염기쌍으로, A:T 염기쌍을 G:C 염기쌍으로 또는 A:T 염기쌍을 C:G 염기쌍으로 전환할 수 있다.
일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 치환은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, 치환은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 치환은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 편집은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이인 단일 또는 다중-뉴클레오타이드 삽입을 포함한다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 삽입은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 삽입은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 편집은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이인 단일 또는 다중-뉴클레오타이드 결실을 포함한다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 결실은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 단일 또는 다중-뉴클레오타이드 결실은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 결실은 최대 약 10,000개의 염기(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 결실은 1개의 염기, 약 10개의 염기, 약 20개의 염기, 약 30개의 염기, 약 40개의 염기, 약 50개의 염기, 약 60개의 염기, 약 70개의 염기, 약 80개의 염기, 약 90개의 염기, 약 100개의 염기, 약 200개의 염기, 약 300개의 염기, 약 400개의 염기, 약 500개의 염기, 약 600개의 염기, 약 700개의 염기, 약 800개의 염기, 약 900개의 염기, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 역전사 주형 서열은 약 5개의 뉴클레오타이드 내지 약 10,000개의 뉴클레오타이드 길이, 예를 들어, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 또는 약 1킬로베이스(kb), 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이인 적어도 하나의 암호화된 편집을 포함한다.
역전사 주형 서열은 본 명세서에 기재된 유전자 편집 시스템의 역전사효소에 의해 DNA로 전사될 수 있다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, 비-PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은, 5'에서 3'로, 비-PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5'이다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 3'이다. 일부 실시형태에서, 역전사 주형 서열은 PBS로부터 3' 연장을 통해 PAM 가닥의 DNA로 전사된다. 일부 실시형태에서, 역전사 주형 서열은 PBS로부터 3' 연장을 통해 비-PAM 가닥의 DNA로 전사된다.
iii. 추가적인 요소
일부 실시형태에서, 편집 주형 RNA는 하나 이상의 추가적인 요소를 포함할 수 있다. 예를 들어, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA는 RNA 분자의 한쪽 말단 또는 양쪽 말단에 하나 이상의 보호 단편을 포함할 수 있다. 대안적으로 또는 이에 더하여, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA는 RNA 분자 내부(예를 들어, 편집 주형 RNA의 서열 중 하나 이상 사이, 예를 들어, PBS와 역전사 주형 서열, 예를 들어, 링커 사이)에 추가적인 요소를 포함할 수 있다. 일부 실시형태에서, 편집 주형 RNA는, 예를 들어, RNA 가이드(뉴클레이스 결합 서열 또는 DNA-결합 서열) 또는 RT 공여체 RNA(PBS 또는 역전사 주형 서열)와 같은 편집 주형 RNA의 하나 이상의 서열 사이에 추가적인 요소를 포함한다.
일부 실시형태에서, 편집 주형 RNA는 추가적인 요소, 예를 들어, 하나 이상의 말단에 직접 반복 서열을 포함한다. 일부 실시형태에서, 직접 반복 서열은 CRISPR 뉴클레이스(예를 들어, 유형 V 뉴클레이스, 예컨대, 변이형 Cas12i2 폴리펩타이드, 또는 변이형 Cas12i2-역전사효소 융합 폴리펩타이드 또는 Cas12i4-역전사효소 융합 폴리펩타이드)를 동원할 수 있다.
일부 실시형태에서, 추가적인 요소 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이일 수 있다.
일부 예에서, 편집 주형 RNA는 선택적 뉴클레오타이드 링커를 포함할 수 있다. 이러한 선택적 뉴클레오타이드 링커 서열은 적어도 3개의 뉴클레오타이드, 적어도 4개의 뉴클레오타이드, 적어도 5개의 뉴클레오타이드, 적어도 6개의 뉴클레오타이드, 적어도 7개의 뉴클레오타이드, 적어도 8개의 뉴클레오타이드, 적어도 9개의 뉴클레오타이드, 적어도 10개의 뉴클레오타이드, 적어도 11개의 뉴클레오타이드, 적어도 12개의 뉴클레오타이드, 적어도 13개의 뉴클레오타이드, 적어도 14개의 뉴클레오타이드, 적어도 15개의 뉴클레오타이드, 적어도 16개의 뉴클레오타이드, 적어도 17개의 뉴클레오타이드, 적어도 18개의 뉴클레오타이드, 적어도 19개의 뉴클레오타이드, 적어도 20개의 뉴클레오타이드, 적어도 30개의 뉴클레오타이드, 적어도 40개의 뉴클레오타이드, 적어도 50개의 뉴클레오타이드, 적어도 60개의 뉴클레오타이드, 적어도 70개의 뉴클레오타이드, 적어도 80개의 뉴클레오타이드, 적어도 90개의 뉴클레오타이드, 적어도 100개의 뉴클레오타이드, 적어도 200개의 뉴클레오타이드, 적어도 300개의 뉴클레오타이드, 적어도 400개의 뉴클레오타이드 또는 적어도 500개의 뉴클레오타이드 길이일 수 있다. 일부 실시형태에서, 선택적 뉴클레오타이드 링커는 임의의 뉴클레이스 결합 서열, DNA-결합 서열, PBS 및/또는 역전사 주형 서열 사이에 있다.
일부 예에서, 편집 주형 RNA 또는 gRNA 및/또는 이의 RT 공여체 RNA의 5' 말단 및/또는 3' 말단은 엑소뉴클레이스 활성에 대한 RNA 분자의 저항성을 향상시킬 수 있는 보호 단편을 포함할 수 있다. 예를 들어, 도 11을 참조한다. 일부 경우에, 말단 보호 단편은 헤어핀, 슈도노트 또는 삼중 구조와 같은 2차 구조를 형성할 수 있는 뉴클레오타이드 서열을 포함할 수 있다. 다른 경우에, 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA의 서열을 포함할 수 있다. 일부 실시형태에서, 변형은 지카-유사(Zika-like) 슈도노트, 뮤린 백혈병 바이러스 슈도노트(MLV-PK) 서열, 레드 클로버 괴사 모자이크 바이러스(red clover necrotic mosaic virus: RCNMV) 서열, 스위트 클로버 괴사 모자이크 바이러스(sweet clover necrotic mosaic virus: SCNMV) 서열, 카네이션 링스팟 바이러스(carnation ringspot virus: CRSV) 서열, preQ 서열 또는 RNA 박테리오파지 MS2 서열이다. 특정 예에서, 말단 보호 단편은 하나 이상의 CRISPR 뉴클레이스 결합 부위(예를 들어, Cas12i2 폴리펩타이드와 같은 Cas12i 폴리펩타이드에 대한 결합 부위) 및 선택적으로 임의의 인간 서열과 상동성을 공유하지 않는 하나 이상의 분절(예를 들어, 스페이서)을 포함할 수 있다. 일부 경우에, 하나 이상의 분절은 인간 게놈의 임의의 서열과 85% 이하로 동일한 서열에 결합한다. 도 10, 도 11, 도 12a 및 도 12b를 참조한다. 이러한 말단 보호 단편은 표적외 유전자 편집을 유도하지 않고 엑소리보뉴클레이스 활성을 저해하기 위해 동일한 유전자 편집 시스템에 포함된 CRISPR 뉴클레이스를 동원할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 적어도 하나의 편집 주형 RNA(예를 들어, 유전자 편집 RNA) 또는 이를 암호화하는 뉴클레오타이드 서열을 포함한다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 핵산(예를 들어, DNA 또는 표적 핵산)에 추가로 결합할 수 있다. 일부 예에서, 적어도 하나의 편집 주형 RNA는 뉴클레이스 결합 서열(예를 들어, CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위) 및 DNA-결합 서열(예를 들어, 스페이서)을 포함한다. 일부 경우에, 적어도 하나의 편집 주형 RNA는 gRNA(뉴클레이스 결합 서열 및 스페이서 포함) 및 RT 공여체 RNA를 포함한다. 일부 실시형태에서, 편집 주형 RNA는 RT 공여체 RNA에 연결된 RNA 가이드를 포함한다. 예를 들어, 도 19b를 참조한다.
iv. 핵산의 변형
본 명세서에 개시된 바와 같은 유전자 편집 시스템의 임의의 RNA 구성요소, 예를 들어, 편집 주형 RNA, RNA 가이드, RT 공여체 RNA는 하나 이상의 변형을 포함할 수 있다.
예시적인 변형은 당, 핵염기, 뉴클레오사이드간 연결(예를 들어, 연결 포스페이트/포스포다이에스터 연결/포스포다이에스터 백본) 및 이들의 임의의 조합에 대한 임의의 변형을 포함할 수 있다. 본 명세서에 제공된 예시적인 변형 중 일부는 아래에 자세히 설명되어 있다.
RNA 가이드 또는 조성물의 구성요소를 암호화하는 임의의 핵산 서열은 당, 핵염기 또는 뉴클레오사이드간 연결(예를 들어, 연결 포스페이트/포스포다이에스터 연결/포스포다이에스터 백본)과 같은 임의의 유용한 변형을 포함할 수 있다. 피리미딘 핵염기의 하나 이상의 원자는 선택적으로 치환된 아미노, 선택적으로 치환된 티올, 선택적으로 치환된 알킬(예를 들어, 메틸 또는 에틸) 또는 할로(예를 들어, 클로로 또는 플루오로)로 대체되거나 또는 치환될 수 있다. 소정의 실시형태에서, 변형(예를 들어, 하나 이상의 변형)은 당 및 뉴클레오사이드간 연결 각각에 존재한다. 변형은 리보핵산(RNA)의 데옥시리보핵산(DNA), 트레오스 핵산(threose nucleic acid: TNA), 글리콜 핵산(glycol nucleic acid: GNA), 펩타이드 핵산(peptide nucleic acid: PNA), 잠금 핵산(locked nucleic acid: LNA) 또는 이의 하이브리드로의 변형일 수 있다. 추가적인 변형은 본 명세서에 기재되어 있다.
일부 실시형태에서, 변형은 화학적 또는 세포 유도성 변형을 포함할 수 있다. 예를 들어, 세포내 RNA 변형의 일부 비제한적인 예는 문헌[Lewis and Pan in "RNA modifications and structures cooperate to guide RNA-protein interactions" from Nat Reviews Mol Cell Biol, 2017, 18:202-210]에 기술되어 있다.
다양한 당 변형, 뉴클레오타이드 변형 및/또는 뉴클레오사이드간 연결(예를 들어, 백본 구조)이 서열의 다양한 위치에 존재할 수 있다. 당업자는 뉴클레오타이드 유사체 또는 다른 변형(들)이 서열의 기능이 실질적으로 감소되지 않는 서열의 임의의 위치(들)에 위치할 수 있다는 것을 이해할 것이다. 서열은 (전체 뉴클레오타이드 함량과 관련하여 또는 하나 이상의 유형의 뉴클레오타이드, 즉, A, G, U 또는 C 중 임의의 하나 이상과 관련하여) 약 1% 내지 약 100% 또는 임의의 그 사이에 있는 백분율(예를 들어, 1% 내지 20%, 1% 내지 25%, 1% 내지 50%, 1% 내지 60%, 1% 내지 70%, 1% 내지 80%, 1% 내지 90%, 1% 내지 95%, 10% 내지 20%, 10% 내지 25%, 10% 내지 50%, 10% 내지 60%, 10% 내지 70%, 10% 내지 80%, 10% 내지 90%, 10% 내지 95%, 10% 내지 100%, 20% 내지 25%, 20% 내지 50%, 20% 내지 60%, 20% 내지 70%, 20% 내지 80%, 20% 내지 90%, 20% 내지 95%, 20% 내지 100%, 50% 내지 60%, 50% 내지 70%, 50% 내지 80%, 50% 내지 90%, 50% 내지 95%, 50% 내지 100%, 70% 내지 80%, 70% 내지 90%, 70% 내지 95%, 70% 내지 100%, 80% 내지 90%, 80% 내지 95%, 80% 내지 100%, 90% 내지 95%, 90% 내지 100% 및 95% 내지 100%)만큼 변형된 뉴클레오타이드를 포함할 수 있다.
일부 실시형태에서, 서열의 하나 이상의 리보뉴클레오타이드에서 당 변형(예를 들어, 2' 위치 또는 4' 위치에) 또는 당의 대체는 백본 변형뿐만 아니라 포스포다이에스터 연결의 변형 또는 대체를 포함할 수 있다. 서열의 특정 예는 변형된 백본을 포함하거나 또는 포스포다이에스터 연결의 변형 또는 대체를 포함하는 뉴클레오사이드간 변형과 같은 천연 뉴클레오사이드간 연결이 없는 서열을 포함하지만 이에 제한되지 않는다. 변형된 백본을 갖는 서열은 특히 백본에 인 원자가 없는 서열을 포함한다. 본 출원의 목적을 위해 그리고 때때로 당업계에서 언급되는 바와 같이, 뉴클레오사이드간 백본에 인 원자를 갖지 않는 변형된 RNA도 올리고뉴클레오사이드로 간주될 수 있다. 특정 실시형태에서, 서열은 뉴클레오사이드간 백본에 인 원자를 갖는 리보뉴클레오타이드를 포함할 것이다.
변형된 서열 백본은, 예를 들어, 포스포로티오에이트, 카이랄 포스포로티오에이트, 포스포로다이티오에이트, 포스포트라이에스터, 아미노알킬포스포트라이에스터, 메틸 및 다른 알킬 포스포네이트, 예컨대, 3'-알킬렌 포스포네이트 및 카이랄 포스포네이트, 포스피네이트, 포스포라미데이트, 예컨대, 3'-아미노 포스포라미데이트 및 아미노알킬포스포라미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트라이에스터 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트, 이들의 2'-5' 연결된 유사체 및 뉴클레오사이드 단위의 인접한 쌍이 3'-5'에서 5'-3' 또는 2'-5'에서 5'-2'로 연결된 역전된 반전된 극성(inverted polarity)을 갖는 것들을 포함할 수 있다. 다양한 염, 혼합염 및 유리산 형태도 포함된다. 일부 실시형태에서, 서열은 음으로 또는 양으로 하전될 수 있다.
서열에 혼입될 수 있는 변형된 뉴클레오타이드는 뉴클레오사이드간 연결(예를 들어, 포스페이트 백본)에서 변형될 수 있다. 본 명세서에서, 폴리뉴클레오타이드 백본의 맥락에서, 어구 "포스페이트" 및 "포스포다이에스터"는 상호교환적으로 사용된다. 백본 포스페이트기는 하나 이상의 산소 원자를 다른 치환기로 대체함으로써 변형될 수 있다. 또한, 변형된 뉴클레오사이드 및 뉴클레오타이드는 본 명세서에 기재된 바와 같이 변형되지 않은 포스페이트 모이어티를 또 다른 뉴클레오사이드간 연결로 대체하는 것을 포함할 수 있다. 변형된 포스페이트기의 예는 포스포로티오에이트, 포스포로셀레네이트, 보라노포스페이트, 보라노포스페이트 에스터, 하이드로겐 포스포네이트, 포스포라미데이트, 포스포로다이아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트라이에스터를 포함하지만 이에 제한되지 않는다. 포스포로다이티오에이트는 비연결 산소가 모두 황으로 대체되어 있다. 포스페이트 링커는 또한 연결 산소를 질소(브리지된 포스포라미데이트), 황(브리지된 포스포로티오에이트) 및 탄소(브리지된 메틸렌-포스포네이트)로 대체하여 변형될 수 있다.
α-티오 치환된 포스페이트 모이어티는 비천연 포스포로티오에이트 백본 연결을 통해 RNA 및 DNA 중합체에 안정성을 부여하기 위해 제공된다. 포스포로티오에이트 DNA 및 RNA는 뉴클레이스 저항성이 증가하고 이후에 세포 환경에서 반감기가 길어진다.
특정 실시형태에서, 변형된 뉴클레오사이드는 알파-티오-뉴클레오사이드(예를 들어, 5'-O-(1-티오포스페이트)-아데노신, 5'-O-(1-티오포스페이트)-사이티딘(a-티오-사이티딘), 5'-O-(1-티오포스페이트)-구아노신, 5'-O-(1-티오포스페이트)-우리딘 또는 5'-O-(1-티오포스페이트)-슈도우리딘)을 포함한다.
인 원자를 포함하지 않는 뉴클레오사이드간 연결을 포함하여 본 발명에 따라 사용될 수 있는 다른 뉴클레오사이드간 연결이 본 명세서에 기재되어 있다.
일부 실시형태에서, 서열은 하나 이상의 세포독성 뉴클레오사이드를 포함할 수 있다. 예를 들어, 세포독성 뉴클레오사이드는 이작용성 변형과 같이 서열에 혼입될 수 있다. 세포독성 뉴클레오사이드는 아데노신 아라비노사이드, 5-아자사이티딘, 4'-티오-아라사이티딘, 사이클로펜텐일사이토신, 클라드리빈, 클로파라빈, 시타라빈, 사이토신 아라비노사이드, 1-(2-C-사이아노-2-데옥시-베타-D-아라비노-펜토퓨라노실)-사이토신, 데시타빈, 5-플루오로우라실, 플루다라빈, 플록스우리딘, 젬시타빈, 테가푸르와 우라실의 조합, 테가푸르((RS)-5-플루오로-1-(테트라하이드로퓨란-2-일)피리미딘-2,4(1H,3H)-다이온), 트록사시타빈, 테자시타빈, 2'-데옥시-2'-메틸리덴사이티딘(DMDC) 및 6-머캅토퓨린을 포함할 수 있지만 이에 제한되지 않는다. 추가적인 예는 플루다라빈 포스페이트, N4-베헤노일-1-베타-D-아라비노퓨라노실사이토신, N4-옥타데실-1-베타-D-아라비노퓨라노실사이토신, N4-팔미토일-1-(2-C-사이아노-2-데옥시-베타-D-아라비노-펜토퓨라노실) 사이토신 및 P-4055(시타라빈 5'-엘라이드산 에스터)를 포함한다.
일부 실시형태에서, 서열은 하나 이상의 전사 후 변형(예를 들어, 캐핑, 절단, 폴리아데닐화, 스플라이싱, 폴리-A 서열, 메틸화, 아실화, 인산화, 라이신 및 아르기닌 잔기의 메틸화, 티올기 및 타이로신 잔기의 아세틸화 및 나이트로실화 등)을 포함한다. 하나 이상의 전사 후 변형은 RNA에서 확인된 임의의 100개 이상의 다양한 뉴클레오사이드 변형과 같은 임의의 전사 후 변형일 수 있다(Rozenski, J, Crain, P, and McCloskey, J. (1999). The RNA Modification Database: 1999 update. Nucl Acids Res 27: 196-197). 일부 실시형태에서, 첫 번째 단리된 핵산은 메신저 RNA(mRNA)를 포함한다. 일부 실시형태에서, mRNA는 피리딘-4-온 리보뉴클레오사이드, 5-아자-우리딘, 2-티오-5-아자-우리딘, 2-티오우리딘, 4-티오-슈도우리딘, 2-티오-슈도우리딘, 5-하이드록시우리딘, 3-메틸우리딘, 5-카복시메틸-우리딘, 1-카복시메틸-슈도우리딘, 5-프로핀일-우리딘, 1-프로핀일-슈도우리딘, 5-타우리노메틸우리딘, 1-타우리노메틸-슈도우리딘, 5-타우리노메틸-2-티오-우리딘, 1-타우리노메틸-4-티오-우리딘, 5-메틸-우리딘, 1-메틸-슈도우리딘, 4-티오-1-메틸-슈도우리딘, 2-티오-1-메틸-슈도우리딘, 1-메틸-1-데아자-슈도우리딘, 2-티오-1-메틸-1-데아자-슈도우리딘, 다이하이드로우리딘, 다이하이드로슈도우리딘, 2-티오-다이하이드로우리딘, 2-티오-다이하이드로슈도우리딘, 2-메톡시우리딘, 2-메톡시-4-티오-우리딘, 4-메톡시-슈도우리딘 및 4-메톡시-2-티오-슈도우리딘으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 5-아자-사이티딘, 슈도아이소사이티딘, 3-메틸-사이티딘, N4-아세틸사이티딘, 5-폼일사이티딘, N4-메틸사이티딘, 5-하이드록시메틸사이티딘, 1-메틸-슈도아이소사이티딘, 피롤로-사이티딘, 피롤로-슈도아이소사이티딘, 2-티오-사이티딘, 2-티오-5-메틸-사이티딘, 4-티오-슈도아이소사이티딘, 4-티오-1-메틸-슈도아이소사이티딘, 4-티오-1-메틸-1-데아자-슈도아이소사이티딘, 1-메틸-1-데아자-슈도아이소사이티딘, 제불라린, 5-아자-제불라린, 5-메틸-제불라린, 5-아자-2-티오-제불라린, 2-티오-제불라린, 2-메톡시-사이티딘, 2-메톡시-5-메틸-사이티딘, 4-메톡시-슈도아이소사이티딘 및 4-메톡시-1-메틸-슈도아이소사이티딘으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 2-아미노퓨린, 2, 6-다이아미노퓨린, 7-데아자-아데닌, 7-데아자-8-아자-아데닌, 7-데아자-2-아미노퓨린, 7-데아자-8-아자-2-아미노퓨린, 7-데아자-2,6-다이아미노퓨린, 7-데아자-8-아자-2,6-다이아미노퓨린, 1-메틸아데노신, N6-메틸아데노신, N6-아이소펜텐일아데노신, N6-(시스-하이드록시아이소펜텐일)아데노신, 2-메틸티오-N6-(시스-하이드록시아이소펜텐일) 아데노신, N6-글리신일카바모일아데노신, N6-트레오닐카바모일아데노신, 2-메틸티오-N6-트레오닐 카바모일아데노신, N6,N6-다이메틸아데노신, 7-메틸아데닌, 2-메틸티오-아데닌 및 2-메톡시-아데닌으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다. 일부 실시형태에서, mRNA는 이노신, 1-메틸-이노신, 와이오신, 와이뷰토신, 7-데아자-구아노신, 7-데아자-8-아자-구아노신, 6-티오-구아노신, 6-티오-7-데아자-구아노신, 6-티오-7-데아자-8-아자-구아노신, 7-메틸-구아노신, 6-티오-7-메틸-구아노신, 7-메틸이노신, 6-메톡시-구아노신, 1-메틸구아노신, N2-메틸구아노신, N2,N2-다이메틸구아노신, 8-옥소-구아노신, 7-메틸-8-옥소-구아노신, 1-메틸-6-티오-구아노신, N2-메틸-6-티오-구아노신 및 N2,N2-다이메틸-6-티오-구아노신으로 이루어진 군으로부터 선택되는 적어도 하나의 뉴클레오사이드를 포함한다.
서열은 분자의 전체 길이에 따라 균일하게 변형될 수 있거나 또는 변형되지 않을 수 있다. 예를 들어, 하나 이상 또는 모든 유형의 뉴클레오타이드(예를 들어, 자연 발생적 뉴클레오타이드, 퓨린 또는 피리미딘, 또는 A, G, U, C, I, pU 중 임의의 하나 이상 또는 모두)는 서열 또는 이의 주어진 미리 결정된 서열 영역에서 균일하게 변형될 수 있거나 또는 변형되지 않을 수 있다. 일부 실시형태에서, 서열은 슈도우리딘을 포함한다. 일부 실시형태에서, 서열은 서열을 바이러스 RNA에 비해 내인성으로 특성화하는 면역계에 도움이 될 수 있는 이노신을 포함한다. 이노신의 혼입은 또한 개선된 RNA 안정성/감소된 분해를 매개할 수 있다. 예를 들어, 전체가 참조에 의해 원용되어 있는 문헌[Yu, Z. et al. (2015) RNA editing by ADAR1 marks dsRNA as "self". Cell Res. 25, 1283-1284]을 참조한다.
일부 실시형태에서, 편집 주형 RNA와 같은 본 명세서에 기재된 임의의 RNA 서열은 말단 변형(예를 들어, 5' 말단 변형 또는 3' 말단 변형)을 포함할 수 있다. 일부 실시형태에서, 말단 변형은 화학적 변형이다. 일부 실시형태에서, 말단 변형은 구조적 변형이다. 본 개시내용을 참조한다.
본 명세서에 개시된 유전자 편집 시스템이 CRISPR 뉴클레이스 및/또는 RT 폴리펩타이드를 암호화하는 핵산을 포함하는 경우, 이러한 핵산 분자는 적용 가능한 경우 본 명세서에 개시된 임의의 변형을 포함할 수 있다.
D.
예시적인 유전자 편집 시스템
본 명세서에 기재된 예시적인 유전자 편집 시스템은 단지 예시를 위한 것이다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 1a 및 도 1b에 도시되어 있다. 이러한 예시적인 설계에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함), 본 명세서에 개시된 임의의 추가적인 요소 또는 이들의 조합을 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 경우에, PBS는 약 3개 내지 약 24개의 뉴클레오타이드(예를 들어, 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 PAM 가닥에 위치할 수 있는 상응하는 PBS-표적화 부위와 적어도 약 75%의 상보성을 가질 수 있다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, 링커는 RNA 가이드의 DNA-결합 서열(스페이서)과 역전사 주형 서열 사이에 존재한다. 일부 예에서, 링커는 하나 이상의 헤어핀을 포함한다. 예를 들어, 헤어핀은 PBS와 DNA-결합 서열 사이의 어닐링을 감소시킬 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다.
다른 실시형태에서, 본 명세서에 개시된 바와 같은 예시적인 유전자 편집 시스템은 도 2에 도시되어 있다. 이러한 예시적인 설계에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함), 추가적인 요소 중 하나 이상 또는 이들의 조합을 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 24개의 뉴클레오타이드(예를 들어, 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개 또는 24개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 PAM 가닥에 위치할 수 있는 상응하는 PBS-표적화 부위와 적어도 약 75%의 상보성을 갖는다. 일부 실시형태에서, 링커는 RNA 가이드의 DNA-결합 서열과 PBS 사이에 존재한다. 일부 예에서, 링커는 하나 이상의 헤어핀을 포함한다. 예를 들어, 헤어핀은 PBS와 DNA-결합 서열 사이의 어닐링을 감소시킬 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다.
도 1a, 도 1b 및 도 2에 도시되어 있는 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM-가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 도 1a, 도 1b 및 도 2의 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 염기-페어링으로 가닥을 다시 교환하여 편집을 혼입시킬 수 있다.
또 다른 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 3에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템은 2개의 RNA 분자: 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함하는 RNA 가이드 및 RT 공여체 RNA를 포함한다. RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함할 수 있다. 일부 예에서, 역전사 주형 서열은 편집을 암호화하지 않는다. 다른 예에서, RT 공여체 RNA는 PBS 및 편집을 암호화하는 역전사 주형 서열을 포함한다. 일부 실시형태에서, 역전사 주형 서열 또는 이의 일부는 염기 페어링을 통해 표적 핵산에 결합할 수 있다.
일부 경우에, PBS는 최대 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드 길이이다. 일부 실시형태에서, RT 공여체 RNA의 역전사 주형 서열은 5' 말단에 압타머를 포함한다. 일부 실시형태에서, 압타머는 역전사효소 폴리펩타이드를 동원한다. 일부 실시형태에서, RT 공여체 RNA의 PBS는 편집 주형 RNA의 임의의 다른 부분(예를 들어, 뉴클레이스 결합 서열 및/또는 DNA-결합 서열)에 상보적이지 않다.
도 3에 도시된 예시적인 유전자 편집 시스템은 1개 또는 2개의 단백질 구성요소를 포함할 수 있다. 예를 들어, 예시적인 유전자 편집 시스템은 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 갖는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소 폴리펩타이드를 2개의 개별 폴리펩타이드로서 포함할 수 있다.
도 3에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM 가닥 또는 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)가 표적 핵산으로부터 방출된 후, PAM 가닥 또는 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 혼성화로 가닥이 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킬 수 있다. 예시적인 유전자 편집 시스템은 표적 핵산의 PAM 원위 영역을 편집하는 데 사용될 수 있다.
또 다른 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 4에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템은 2개의 RNA 분자: RNA 가이드 및 RT 공여체 RNA를 2개의 개별 RNA 분자로 포함할 수 있다. 예시적인 유전자 편집 시스템은 본 명세서에 개시된 바와 같은 1개 또는 2개의 단백질 구성요소를 포함할 수 있다. 예를 들어, 예시적인 유전자 편집 시스템은 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 갖는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 대안적으로, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소 폴리펩타이드는 서로 융합되지 않는다(2개의 별도의 폴리펩타이드임).
도 4에 도시된 예시적인 유전자 편집 시스템은 PAM 가닥 또는 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 예시적인 유전자 편집 시스템을 사용하면, PAM 가닥 또는 비-PAM 가닥의 자유 3' 말단은 동일한 유전자 편집 시스템에서 RT 공여체 RNA의 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 사용하여 연장되고, 상보적 게놈 가닥과의 혼성화로 가닥이 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킬 수 있다.
일부 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 5에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 경우에, PBS는 표적 서열의 상보적 영역의 상류에 있는 비-PAM 가닥의 부위에 결합한다.
일부 예에서, PBS는 약 3개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드(예를 들어, 약 3개, 5개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 또는 100개의 뉴클레오타이드) 길이이다. 일부 실시형태에서, DNA-결합 서열(스페이서)은 약 20개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열은 PAM 서열로부터 약 10개의 뉴클레오타이드 내지 약 25개의 뉴클레오타이드가 혼입된 적어도 하나의 편집을 포함한다.
일부 예에서, 예시적인 유전자 편집 시스템은 5' 융합 또는 3' 융합 파트너를 포함하는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 5' 융합 또는 3' 융합 파트너는 역전사효소 폴리펩타이드를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다.
도 5에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 이러한 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, DNA-결합 서열을 주형으로 사용하여 연장될 수 있다. 비-PAM 가닥의 RT 연장은 상보적 게놈 가닥과의 염기-페어링으로 다시 교환되어 RT 공여체 RNA로부터 편집을 혼입시킨다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 6a 및 도 6b에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, PBS는 PAM 가닥의 표적 서열의 상보적 영역의 상류에 있는 비-PAM 가닥의 영역에 상보적이다. 일부 예에서, 헤어핀은 RNA 가이드의 DNA-결합 서열과 역전사 주형 서열 사이에 존재한다. 일부 실시형태에서, 헤어핀은 역전사 주형 서열 내에 존재한다. 일부 실시형태에서, 주형 서열 내 편집은 편집이 혼입되는 표적 핵산에 헤어핀을 생성할 수 있다.
일부 예에서, 예시적인 유전자 편집 시스템은 N-말단 또는 C-말단 융합 파트너를 포함하는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함할 수 있다.
일부 실시형태에서, 예시적인 유전자 편집 시스템은 도 7에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. 일부 실시형태에서, PBS는 약 5개 내지 약 20개의 뉴클레오타이드(예를 들어, 약 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개의 뉴클레오타이드) 길이이다. 대안적으로 또는 이에 더하여, PBS는 비-PAM 가닥의 영역(상응하는 PBS-표적화 부위)과 적어도 약 75%의 상보성을 갖는다. 일부 경우에, 링커는 RNA 가이드의 뉴클레이스 결합 서열과 RT 공여체 RNA의 PBS 사이에 존재한다. 대안적으로 또는 이에 더하여, 헤어핀은 RNA 가이드의 DNA-결합 서열과 RT 공여체 RNA의 역전사 주형 서열 사이에 존재할 수 있다. 일부 실시형태에서, 헤어핀은 역전사 주형 서열 내에 존재한다. 일부 실시형태에서, 주형 서열 내의 편집은 편집이 혼입되는 표적 핵산에서 헤어핀을 생성할 수 있다.
일부 경우에, 예시적인 유전자 편집 시스템의 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 역전사효소 폴리펩타이드를 포함할 수 있는 N-말단 또는 C-말단 융합 파트너를 포함할 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다(예를 들어, 본 명세서에 개시된 것).
도 6a, 도 6b 또는 도 7에 도시된 예시적인 유전자 편집 시스템은 표적 핵산(예를 들어, 관심 게놈 부위)의 비-PAM 가닥을 편집하는 데 사용될 수 있다. 이론에 얽매이지 않고, 예시적인 유전자 편집 시스템을 사용하면, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 절단 동안, 비-PAM 가닥의 자유 3' 말단은 PBS와 염기쌍을 형성하고, 역전사 주형 서열을 주형으로 연장될 수 있다. 비-PAM 가닥의 RT 연장은 상보적 게놈 가닥과의 염기쌍으로 다시 교환되어 RT 공여체 RNA로부터 적어도 하나의 편집을 혼입시킨다.
본 명세서에 개시된 예시적인 유전자 편집 시스템, 예를 들어, 도 6a, 도 6b 및 도 7에 도시된 것들은 PAM 가닥의 표적 서열과 상보적인 비-PAM 가닥의 영역 내에 적어도 하나의 PAM-근위 편집을 혼입시키는 데 사용될 수 있다. 일부 예에서, 예시적인 유전자 편집 시스템은 PAM 서열 및/또는 PAM 서열의 상류에 있는 서열을 (예를 들어, PAM 서열 및/또는 상류 서열과 상보적인 영역에 변이를 도입함으로써) 변형시키는 데 사용될 수 있다. 이러한 예시적인 유전자 편집 시스템은 동일한 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)에 의한 생성된 변형된 유전적 유전자좌의 재표적화를 방지하는 데 사용될 수 있다.
일부 실시형태에서, 본 명세서에 개시된 예시적인 유전자 편집 시스템은 도 10에 도시되어 있다. 이러한 예시적인 유전자 편집 시스템에서, RNA 가이드는 RT 공여체 RNA(PBS 및 역전사 주형 서열 포함)를 포함할 수 있는 3' 융합 파트너를 포함할 수 있다. 대안적으로, RNA 가이드는 RT 공여체 RNA(역전사 주형 서열 및 PBS 포함)를 포함할 수 있는 5' 융합 파트너를 포함할 수 있다. PBS의 길이는 가변적일 수 있다. 예를 들어, PBS 길이는 약 3개의 뉴클레오타이드 내지 약 16개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, PBS는 표적 핵산(예를 들어, 관심 게놈 부위)의, 예를 들어, 표적 서열과 중첩되는 PAM 가닥 상의 영역에 결합할 수 있다. 일부 예에서, 헤어핀은 RNA 가이드의 DNA-결합 서열과 RT 공여체 RNA의 역전사 주형 서열 사이에 존재한다. RNA 가이드-역전사 주형 서열의 한쪽 또는 양쪽 말단은 엑소뉴클레이스 또는 엔도뉴클레이스 활성을 방지하기 위해 보호 단편, 예를 들어, 본 명세서에 개시된 것들을 포함할 수 있다.
예시적인 유전자 편집 시스템은 N-말단 또는 C-말단 융합 파트너를 포함할 수 있는 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)를 포함할 수 있다. 일부 예에서, N-말단 또는 C-말단 융합 파트너는 역전사효소 폴리펩타이드를 포함한다. 일부 예에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스)는 crRNA 처리 활성이 결여되어 있다. 일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 일부 예에서, 편집은 도 10에 도시된 예시적인 유전자 편집 시스템을 사용하여 표적 핵산의 PAM 가닥으로 혼입된다.
RNA 가이드의 3' 말단 서열에 융합된 RT 공여체 RNA 서열 또는 RNA 가이드의 5' 말단 서열에 융합된 RT 공여체 RNA 서열을 포함하는 도 1 내지 도 7, 도 8a 내지 도 8c 및 도 10에 도시된 예시적인 편집 주형 RNA는 대신 RNA 가이드 서열의 내부 위치에 융합된 RT 공여체 RNA 서열을 포함할 수 있거나 또는 그 반대일 수 있다. 예를 들어, RT 공여체 RNA는 RNA 가이드, sgRNA 또는 RNA 가이드-tracrRNA(예를 들어, sgRNA)의 내부 위치에 융합될 수 있다.
(예를 들어, RT 공여체 RNA를 사용한 5' 연장 또는 3' 연장을 통해) 연장된 RNA 가이드 말단은 편집 혼입의 효율과 함께 역전사 주형 서열 농도를 감소시키는 엑소뉴클레이스 및/또는 엔도뉴클레이스 활성에 취약할 수 있다. 일부 실시형태에서, RNA 가이드-RT 공여체 RNA 융합체는 엑소뉴클레이스 활성을 저해하거나 또는 방지하기 위해 첨가된 2차 구조를 추가로 포함한다. 일부 실시형태에서, 첨가된 2차 구조는 삼중 구조, 슈도노트, xrRNA, 원형 RNA, tRNA 또는 절단형 tRNA이다. 일부 실시형태에서, 첨가된 2차 구조는 지카-유사 슈도노트, 뮤린 백혈병 바이러스 슈도노트(MLV-PK) 서열, 레드 클로버 괴사 모자이크 바이러스(RCNMV) 서열, 스위트 클로버 괴사 모자이크 바이러스(SCNMV) 서열, 카네이션 링스팟 바이러스(CRSV) 서열, preQ 서열 또는 RNA 박테리오파지 MS2 서열이다. 일부 실시형태에서, 첨가된 2차 구조는 염기-적층 또는 3'-말단 염기 페어링을 통해 이루어진다. 다른 실시형태에서, 첨가된 2차 구조는 뉴클레이스 결합 서열 또는 뉴클레이스 결합 서열 및 DNA-결합 서열이다. 도 10, 도 11, 도 12a 및 도 12b를 참조한다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 비포유동물 표적에 대해 지시된다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 비인간 표적에 대해 지시된다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 인간 게놈에서 발견되지 않는다. 일부 실시형태에서, 첨가된 DNA-결합 서열은 인간 게놈의 임의의 서열과 85% 이상 동일하다. 실시예 2를 참조한다.
이론에 얽매이지 않고, 뉴클레이스 결합 서열 및 DNA-결합 서열의 첨가는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스-역전사효소 융합체를 동원할 수 있다. 단백질-RNA 상호작용을 통해, 결합된 CRISPR 뉴클레이스는 내인성 엑소뉴클레이스 및 엔도뉴클레이스에 대한 저항성을 제공할 수 있다. 일부 실시형태에서, 추가적인 뉴클레이스 결합 서열 및 DNA-결합 서열은 RNA-처리 활성이 결여되어 있는 CRISPR 뉴클레이스를 동원한다. 일부 실시형태에서, 2차 구조는 압타머(예를 들어, RNA 압타머)이며, 조성물은 압타머와 상호작용하는 단백질을 추가로 포함한다. 일부 실시형태에서, 압타머 및 압타머-상호작용 단백질을 포함하는 조성물은 내인성 엑소뉴클레이스 및/또는 엔도뉴클레이스 활성을 저해한다.
본 명세서에 개시된 바와 같은 추가적인 예시적인 유전자 편집 시스템은 단지 예시의 목적으로만 아래에 제공된다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 적어도 하나의 RNA 가이드(또는 본 명세서에서 상호교환적으로 사용되는 가이드 RNA) 및 적어도 하나의 RT 공여체 RNA를 포함한다. 일부 예에서, 적어도 하나의 RNA 가이드는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다. RNA 가이드는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 예에서, 적어도 하나의 RNA 가이드는 추가로, 예를 들어, 스페이서 영역을 통해 표적 핵산에 결합할 수 있다. 일부 예에서, RT 공여체 RNA는 적어도 하나의 프라이머 결합 부위(PBS) 및 적어도 하나의 역전사 주형 서열을 포함한다. PBS는 센스 가닥 또는 안티센스 가닥일 수 있는 표적 핵산의 한 가닥에 결합할 수 있다. PBS가 결합하는 영역은 본 명세서에서 PBS-표적화 부위로 기술된다. 적어도 하나의 역전사 주형 서열은 표적 핵산의 상응하는 서열에 대해 적어도 하나의 뉴클레오타이드 변이(암호화된 편집)을 갖는 서열을 포함할 수 있다. 일부 경우에, 적어도 하나의 암호화된 편집은 삽입, 치환 및/또는 결실이다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 적어도 하나의 RNA 가이드, 적어도 하나의 RT 공여체 RNA 및 적어도 하나의 다른 서열을 포함한다. 일부 실시형태에서, 적어도 하나의 RNA 가이드는 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다. 일부 실시형태에서, RNA 가이드는 CRISPR 뉴클레이스(예를 들어, 유형 V CRISPR 뉴클레이스)에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RNA 가이드는 추가로 표적 핵산에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RT 공여체 RNA의 PBS는 표적 핵산의 비-PAM 가닥에 결합할 수 있다. 일부 실시형태에서, 적어도 하나의 RT 공여체 RNA의 PBS는 표적 핵산의 PAM 가닥에 결합할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 적어도 하나를 포함할 수 있으며, RNA 가이드 및 RT 공여체 RNA를 포함할 수 있다. 일부 예에서, CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 적어도 하나가 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스, 역전사효소, RNA 가이드 및 RT 공여체 RNA 중 적어도 하나가 별도의 조성물로 제공된다. 일부 실시형태에서, 적어도 하나의 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA 중 하나 이상이 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소를 포함하는 조성물이 편집 주형 RNA를 포함하는 조성물과 별도로 제공된다. 일부 실시형태에서, 적어도 하나의 CRISPR 뉴클레이스, 역전사효소, RNA 가이드 및 RT 공여체 RNA 중 하나 이상이 별도의 조성물로 제공된다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소를 포함하는 조성물이 RNA 가이드 및 RT 공여체 RNA를 포함하는 조성물과 별도로 제공된다.
일부 실시형태에서, 본 명세서에 제공된 유전자 편집 시스템은 유전자 편집이 필요한 게놈 부위일 수 있는 표적 핵산에 결합할 수 있다. 일부 실시형태에서, 편집 주형 RNA와 같은 조성물의 하나 이상의 구성요소는 표적 핵산에 결합한다. 일부 실시형태에서, RNA 가이드 및 RT 공여체 RNA와 같은 조성물의 하나 이상의 구성요소는 표적 핵산에 결합한다. 일부 실시형태에서, 표적 핵산은 DNA이다. 일부 실시형태에서, 본 발명의 조성물은 표적 핵산을 변형시키거나 또는 변형시킬 수 있다. 일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소와 같은 조성물의 구성요소 중 하나 이상은 표적 핵산을 변형시킨다. 일부 실시형태에서, 본 발명의 조성물은 치환, 삽입 또는 결실을 표적 핵산에 도입한다. 일부 실시형태에서, 본 발명의 조성물은 치환, 삽입 또는 결실을 표적 핵산의 비-PAM 가닥에 도입할 수 있다. 일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 치환, 삽입 또는 결실을 표적 핵산의 PAM 가닥에 도입할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 단백질 구성요소를 암호화하는 하나 이상의 핵산(예를 들어, 벡터 예컨대, 바이러스 벡터)을 포함할 수 있다. 일부 예에서, 유전자 편집 시스템은 CRISPR 뉴클레이스와 RT 폴리펩타이드 모두를 암호화하는 하나의 벡터를 포함할 수 있다. 대안적으로 또는 이에 더하여, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 유전자 편집 RNA, 가이드 RNA 또는 둘 다의 RNA 구성요소를 포함할 수 있다. 대안적으로, 유전자 편집 시스템은 RNA 구성요소를 암호화하는 하나 이상의 핵산(벡터)을 포함할 수 있다. 예를 들어, 유전자 편집 시스템은 유전자 편집 RNA와 RNA 가이드 모두를 코딩하는 하나의 벡터(예를 들어, AAV 벡터와 같은 바이러스 벡터)를 포함할 수 있다.
일부 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소와 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 포함할 수 있다. 다른 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소와 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 암호화하는 하나 이상의 핵산을 포함할 수 있다. 또 다른 예에서, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 암호화하는 하나 이상의 핵산과 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 포함할 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 유전자 편집 시스템은 CRISPR 뉴클레이스, RT 폴리펩타이드 또는 둘 다의 단백질 구성요소를 암호화하는 하나 이상의 핵산과 유전자 편집 RNA 및 RNA 가이드의 RNA 구성요소를 암호화하는 하나 이상의 핵산을 포함할 수 있다. 일부 경우에, 유전자 편집 시스템은 유전자 편집 시스템의 여러 구성요소를 암호화하는 하나의 벡터를 포함할 수 있다.
일부 실시형태에서, 본 명세서에 개시된 유전자 편집 시스템은 유전자 편집 시스템의 단백질 및/또는 RNA 구성요소 또는 이들의 암호화 핵산 중 하나 이상을 포함하는 하나 이상의 지질 나노입자(LNP)를 포함한다. 다른 실시형태에서, 유전자 편집 시스템은 구성요소의 일부를 포함하는 하나 이상의 LNP 및 나머지 구성요소를 암호화하는 하나 이상의 벡터를 포함할 수 있다.
II. 유전자 편집 시스템 구성요소의 제조
단백질 구성요소, RNA 구성요소 또는 이들의 암호화 핵산은 본 명세서에 개시된 방법 중 통상적인 방법에 의해 제조될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 또는 CRISPR 뉴클레이스-역전사효소 융합체는 (a) 단백질을 생산할 수 있는 세균 세포 또는 포유동물 세포와 같은 숙주 세포를 배양하고, 이렇게 생산된 단백질을 단리하고, 선택적으로 단백질을 정제함으로써 제조될 수 있다. 이렇게 제조된 CRISPR 뉴클레이스, 역전사효소 또는 융합체 단백질은 편집 주형 RNA와 복합체를 형성할 수 있다.
CRISPR 뉴클레이스 및 역전사효소는 또한 (b) 공지된 유전 공학 기법, 구체적으로, 세균으로부터 본 발명의 CRISPR 뉴클레이스 및 역전사효소를 암호화하는 유전자를 단리하고, 재조합 발현 벡터를 구축한 다음, 숙주 세포에서 편집 주형 RNA와 복합체를 형성하는 재조합 단백질의 발현을 위해 편집 주형 RNA를 발현하는 적절한 숙주 세포에 벡터를 전달함으로써 제조될 수 있다. 대안적으로, CRISPR 뉴클레이스 및 역전사효소는 (c) 시험관내에서 전사-번역 시스템과 커플링된 다음, 편집 주형 RNA와 복합체를 형성함으로써 제조될 수 있다. 본 발명의 CRISPR 뉴클레이스 및 역전사효소의 제조에 사용될 수 있는 세균은 본 발명의 CRISPR 뉴클레이스 및 역전사효소를 생산할 수 있는 한 특별히 제한되지 않는다. 세균의 일부 비제한적인 예는 본 명세서에 기재된 대장균 세포를 포함한다.
달리 명시하지 않는 한, 본 명세서에 제공된 모든 조성물, 복합체 및 폴리펩타이드는 해당 조성물 또는 복합체 또는 폴리펩타이드의 활성 수준을 기준으로 제조되었으며, 불순물, 예를 들어, 상업적으로 이용 가능한 공급원에 존재할 수 있는 잔류 용매 또는 부산물은 배제되어 있다. 효소적 성분의 중량은 총 활성 단백질을 기준으로 한다. 모든 백분율 및 비는 달리 명시하지 않는 한 중량 기준으로 계산된다. 모든 백분율 및 비는 달리 명시하지 않는 한 전체 조성물을 기준으로 계산된다. 예시된 조성물에서, 효소 수준은 전체 조성물의 중량을 기준으로 순수한 효소로 표시되며, 달리 명시하지 않는 한 성분은 전체 조성물의 중량을 기준으로 표시된다.
A.
벡터
본 개시내용은 본 명세서에 기재된 CRISPR 뉴클레이스, 역전사효소 또는 이들의 융합 폴리펩타이드를 발현하기 위한 하나 이상의 벡터를 제공하거나 또는 본 명세서에 기재된 구성요소를 암호화하는 핵산이 벡터에 혼입될 수 있다. 일부 실시형태에서, 본 명세서에 개시된 벡터는 CRISPR 뉴클레이스, 역전사효소 또는 융합 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함한다. 본 개시내용은 또한 편집 주형 RNA 또는 이의 임의의 부분, 예를 들어, RNA 가이드 또는 RT 공여체 RNA를 암호화하는 하나 이상의 벡터를 제공한다. 일부 실시형태에서, 벡터는 Pol II 프로모터 또는 Pol III 프로모터를 포함한다.
천연 또는 합성 폴리뉴클레오타이드의 발현은 전형적으로 관심 유전자를 암호화하는 폴리뉴클레오타이드, 예를 들어, CRISPR 뉴클레이스, 역전사효소 또는 융합 폴리펩타이드 및/또는 편집 주형 RNA를 암호화하는 뉴클레오타이드 서열을 프로모터에 작동 가능하게 연결시키고, 작제물을 발현 벡터에 혼입시킴으로써 달성된다. 발현 벡터는 본 발명의 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA를 암호화하는 폴리뉴클레오타이드를 포함하며 진핵생물 세포 내에서의 복제 및 통합에 적합할 수 있는 한 특별히 제한되지 않는다.
전형적인 발현 벡터는 목적하는 폴리뉴클레오타이드의 발현에 유용한 전사 및 번역 종결자, 개시 서열 및 프로모터를 포함한다. 예를 들어, RNA 폴리머레이스에 대한 인식 서열을 운반하는 플라스미드 벡터(pSP64, pBluescript 등)가 사용될 수 있다. 렌티바이러스와 같은 레트로바이러스로부터 유래된 것들을 포함하는 벡터는 이식유전자의 장기적이고 안정적인 통합 및 이의 딸 세포에서의 증식을 허용하므로 장기간 유전자 전달을 달성하는 데 적합한 도구이다. 벡터의 예는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터를 포함한다. 발현 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다.
바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 다양한 바이러스학 및 분자생물학 매뉴얼에 기술되어 있다. 벡터로서 유용한 바이러스는 파지 바이러스, 레트로바이러스, 아데노바이러스, 아데노-관련 바이러스, 헤르페스 바이러스 및 렌티바이러스를 포함하지만 이에 제한되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체에서 기능적인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레이스 부위 및 하나 이상의 선별 마커를 포함한다.
벡터의 종류는 특별히 제한되지 않으며, 숙주 세포에서 발현될 수 있는 벡터가 적절하게 선택될 수 있다. 보다 구체적으로는, 숙주 세포의 종류에 따라, 폴리뉴클레오타이드로부터 폴리펩타이드(들)의 발현을 보장하기 위한 프로모터 서열이 적절하게 선택되고, 발현 벡터의 제조를 위해 이 프로모터 서열 및 폴리뉴클레오타이드가 임의의 다양한 플라스미드 등에 삽입된다.
추가적인 프로모터 요소, 예를 들어, 강화 서열은 전사 개시의 빈도를 조절한다. 전형적으로, 이들은 시작 부위의 상류의 30bp 내지 110bp 영역에 위치하지만, 최근에는 다수의 프로모터가 시작 부위의 하류에도 기능적 요소를 포함하는 것으로 나타났다. 프로모터에 따라, 개별 요소는 전사를 활성화시키기 위해 협력적으로 또는 독립적으로 기능할 수 있는 것으로 보인다.
또한, 본 개시내용은 구성적 프로모터의 사용으로 제한되어서는 안 된다. 유도성 프로모터도 본 개시내용의 일부로서 상정된다. 유도성 프로모터의 사용은 발현이 요구될 때 작동 가능하게 연결된 폴리뉴클레오타이드 서열의 발현을 켜거나 또는 발현이 요구되지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예는 메탈로티오닌 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터 및 테트라사이클린 프로모터를 포함하지만 이에 제한되지 않는다.
도입될 발현 벡터는 또한 바이러스 벡터를 통해 형질감염 또는 감염시키려는 세포 집단으로부터 발현 세포의 확인 및 선택을 용이하게 하기 위해 선별 마커 유전자 또는 리포터 유전자 또는 둘 다를 포함할 수 있다. 다른 양태에서, 선별 마커는 별도의 DNA 조각에 운반되어 공동 형질감염 절차에 사용될 수 있다. 선별 마커 및 리포터 유전자는 모두 숙주 세포에서 발현 가능하도록 적절한 전사 제어 서열과 측접할 수 있다. 이러한 마커의 예는 진핵생물 세포 배양의 경우 다이하이드로폴레이트 리덕테이스 유전자 및 네오마이신 저항성 유전자; 및 대장균 및 다른 세균 배양의 경우 테트라사이클린 저항성 유전자 및 암피실린 저항성 유전자를 포함한다. 이러한 선별 마커를 사용함으로써, 본 발명의 폴리펩타이드(들)를 암호화하는 폴리뉴클레오타이드가 숙주 세포에 전달되어 반드시 발현되는지 여부를 확인할 수 있다.
재조합 발현 벡터의 제조 방법은 특별히 제한되지 않으며, 이의 예는 플라스미드, 파지 또는 코스미드를 사용하는 방법을 포함한다.
B.
발현 방법
본 개시내용은 CRISPR 뉴클레이스 및 역전사효소를 번역하는 단계 및 본 명세서에 기재된 편집 주형 RNA를 발현하는 단계를 포함하는 단백질 발현 방법을 포함한다.
일부 실시형태에서, 본 명세서에 기재된 숙주 세포는 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA를 발현시키는 데 사용된다. 숙주 세포는 특별히 제한되지 않으며, 바람직하게는 다양한 공지된 세포가 사용된다. 숙주 세포의 특정 예는 대장균과 같은 세균, 효모(출아 효모인 사카로마이세스 세레비시아에(Saccharomyces cerevisiae) 및 분열 효모인 스키조사카로마이세스 폼베(Schizosaccharomyces pombe)), 선충류(카에노랍디티스 엘레간스(Caenorhabditis elegans)), 제노푸스 라에비스(Xenopus laevis) 난모세포 및 동물 세포(예를 들어, CHO 세포, COS 세포 및 HEK293 세포)를 포함한다. 위에 기재된 발현 벡터를 숙주 세포에 전달하는 방법, 즉, 형질전환 방법은 특별히 제한되지 않으며, 전기천공법, 칼슘 포스페이트 방법, 리포솜 방법 및 DEAE 덱스트란 방법과 같은 공지된 방법이 사용될 수 있다.
숙주가 발현 벡터로 형질전환된 후, 숙주 세포는 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 생산을 위해 배양(cultured), 재배(cultivated) 또는 육종(bred)될 수 있다. CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 발현 후, 숙주 세포가 수집되고, CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA가 배양물 등으로부터 통상적인 방법(예를 들어, 여과, 원심분리, 세포 파괴, 겔 여과 크로마토그래피, 이온 교환 크로마토그래피 등)에 따라 정제될 수 있다.
일부 실시형태에서, CRISPR 뉴클레이스 및 역전사효소 발현을 위한 방법은 폴리펩타이드(들)의 적어도 5개의 아미노산, 적어도 10개의 아미노산, 적어도 15개의 아미노산, 적어도 20개의 아미노산, 적어도 50개의 아미노산, 적어도 100개의 아미노산, 적어도 150개의 아미노산, 적어도 200개의 아미노산, 적어도 250개의 아미노산, 적어도 300개의 아미노산, 적어도 400개의 아미노산, 적어도 500개의 아미노산, 적어도 600개의 아미노산, 적어도 700개의 아미노산, 적어도 800개의 아미노산, 적어도 900개의 아미노산 또는 적어도 1000개의 아미노산의 번역을 포함한다. 일부 실시형태에서, 단백질 발현을 위한 방법은 CRISPR 뉴클레이스 및 역전사효소의 약 5개의 아미노산, 약 10개의 아미노산, 약 15개의 아미노산, 약 20개의 아미노산, 약 50개의 아미노산, 약 100개의 아미노산, 약 150개의 아미노산, 약 200개의 아미노산, 약 250개의 아미노산, 약 300개의 아미노산, 약 400개의 아미노산, 약 500개의 아미노산, 약 600개의 아미노산, 약 700개의 아미노산, 약 800개의 아미노산, 약 900개의 아미노산, 약 1000개의 아미노산 이상의 번역을 포함한다.
숙주 세포에서 성숙 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA의 생산 수준을 결정하기 위해 다양한 방법이 사용될 수 있다. 이러한 방법은, 예를 들어, 본 명세서의 다른 곳에 기재된 바와 같은 단백질 또는 표지 태그에 특이적인 다중클론 또는 단일클론 항체를 이용하는 방법을 포함하지만 이에 제한되지 않는다. 예시적인 방법은 효소결합 면역흡착 검정(ELISA), 방사면역검정(MA), 형광 면역검정(FIA) 및 형광 활성화 세포 분류(FACS)를 포함하지만 이에 제한되지 않는다. 이들 및 다른 검정은 당업계에 잘 알려져 있다(예를 들어, 문헌[Maddox et al., J. Exp. Med. 158:1211 [1983]] 참조).
본 개시내용은 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 암호화하는 폴리리보뉴클레오타이드를 숙주 세포에 제공하는 단계(여기서, 폴리리보뉴클레오타이드는 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 암호화함), 세포에서 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 발현시키는 단계 및 세포로부터 CRISPR 뉴클레이스, 역전사효소 및/또는 편집 주형 RNA를 얻는 단계를 포함하는, 세포에서의 CRISPR 뉴클레이스 및 역전사효소 및/또는 편집 주형 RNA의 생체내 발현 방법을 제공한다.
III. 유전자 편집 방법
임의의 유전자 편집 시스템은 관심 유전자 부위, 예를 들어, 유전적 편집이 필요한 유전자 부위일 수 있는 표적 핵산을 유전적으로 변형(편집)시키기 위해, 예를 들어, 유전적 돌연변이를 고정시키기 위해, 보호 돌연변이를 도입하기 위해, 유전자 발현을 조절하기 위한 변형을 도입하기 위해 사용될 수 있다.
본 명세서에 개시된 유전자 편집 시스템 및 조성물 편집을 다양한 표적 서열에 편집하고 도입하는 데 적용 가능하다. 일부 실시형태에서, 표적 서열은 DNA 유전자좌와 같은 DNA 분자이다(본 명세서에서 표적 서열 또는 표적 적중(on-target) 서열로도 지칭됨). 일부 실시형태에서, 표적 서열은 RNA 유전자좌 또는 mRNA와 같은 RNA이다. 일부 실시형태에서, 표적 서열은 단일-가닥(예를 들어, 단일-가닥 DNA)이다. 일부 실시형태에서, 표적 서열은 이중-가닥(예를 들어, 이중-가닥 DNA)이다. 일부 실시형태에서, 표적 서열은 단일-가닥 및 이중-가닥 영역을 모두 포함한다. 일부 실시형태에서, 표적 서열은 선형이다. 일부 실시형태에서, 표적 서열은 원형이다. 일부 실시형태에서, 표적 서열은 메틸화된 뉴클레오타이드, 손상된 뉴클레오타이드 또는 뉴클레오타이드 유사체와 같은 하나 이상의 변형된 뉴클레오타이드를 포함한다. 일부 실시형태에서, 표적 서열은 변형되지 않는다. 일부 실시형태에서, 단일-가닥 표적 서열은 PAM 서열이 필요하지 않다.
표적 서열은 약 100bp, 200bp, 500bp, 1000bp, 2000bp, 5000bp, 10kb, 20kb, 50kb, 100kb, 200kb, 500kb, 1Mb 이상 중 적어도 어느 하나와 같은 임의의 길이일 수 있다. 표적 서열은 또한 임의의 서열을 포함할 수 있다. 일부 실시형태에서, 표적 서열은 적어도 약 40%, 45%, 50%, 55%, 60%, 65% 이상의 GC 함량 중 어느 하나를 갖는 것과 같이 GC가 풍부하다. 일부 실시형태에서, 표적 서열은 적어도 약 70%, 80% 이상의 GC 함량을 갖는다. 일부 실시형태에서, 표적 서열은 GC가 풍부하지 않은 표적 서열에 있는 GC가 풍부한 단편이다. 일부 실시형태에서, 표적 서열은 GC가 풍부하지 않다. 일부 실시형태에서, 표적 서열은 하나 이상의 2차 구조 또는 더 높은 차수의 구조를 갖는다. 일부 실시형태에서, 표적 서열은 리보핵단백질에 의해 표적 서열에 접근할 수 없도록 하기 위해 염색질에서와 같은 응축된 상태가 아니다.
일부 실시형태에서, 표적 핵산은 세포의 게놈 부위이다. 일부 경우에, 유전적 편집이 일어나는 표적 핵산은 단백질-코딩 영역에 있을 수 있다. 대안적으로, 표적 핵산은 프로모터, 인핸서, 5' 또는 3' 비번역 영역과 같은 조절 영역에 있을 수 있다. 다른 경우에, 표적 핵산은 트랜스포존, miRNA, tRNA, 리보솜 RNA, 리보자임 또는 lincRNA와 같은 논코딩 유전자에 있을 수 있다.
A.
유전적 편집을 위한 예시적인 유전자
본 명세서에 개시된 임의의 유전자 편집 시스템은 표적 관심 유전자, 예를 들어, 질환(예를 들어, 유전자 질환)과 관련된 유전자를 편집하는 데 사용될 수 있다. 일부 실시형태에서, 표적 유전자는 대상체에서 면역반응에 관여하는 유전자일 수 있다. 예를 들어, 표적 유전자는 면역관문 유전자일 수 있다.
예시적인 표적 유전자는 BCL11A 인트론 적혈구 인핸서, CD3, 베타-2 마이크로글로불린(B2M), T 세포 수용체 알파 불변영역(T Cell Receptor Alpha Constant: TRAC), 예정 세포사 1(PDCD1), T-세포 수용체 알파, T-세포 수용체 베타, B-세포 림프종/백혈병 11A(BCL11A), 세포독성 T-림프구 항원 4(CTLA-4), 케모카인(C-C 모티프) 수용체 5(유전자/유사유전자)(CCR5), CXCR4 유전자, CD160 분자(CD160), 아데노신 A2a 수용체(ADORA), CD276, B7-H3, B7-H4, BTLA, 나이코틴아마이드 아데닌 다이뉴클레오타이드 포스페이트 NADPH 옥시데이스 아이소형 2(NOX2), T 세포 활성화의 V-도메인 Ig 억제인자(VISTA), 시알산-결합 면역글로불린-유형 렉틴 7(SIGLEC7), 시알산-결합 면역글로불린-유형 렉틴 9(SIGLEC9), SIGLEC10, T 세포 활성화 저해인자 1을 포함하는 V-세트 도메인(VTCN1), B 및 T 림프구 감쇠기(BTLA), 인돌아민 2,3-다이옥시게네이스(IDO), 인돌아민 2,3-다이옥시게네이스 1(IDO1), 살해-세포 면역글로불린-유사 수용체(KIR), 살해 세포 면역글로불린-유사 수용체, 3개 도메인, 긴 세포질 꼬리, 1(KIR3DL1), 림프구-활성화 유전자 3(LAG3), T-세포 면역글로불린 도메인 및 뮤신 도메인 3(TIM3), A형 간염 바이러스 세포 수용체 2(HAVCR2), 자연 살해 세포 수용체 2B4(CD244), 하이포잔틴 포스포리보실트랜스퍼레이스 1(HPRT), Ig 및 ITIM 도메인을 갖는 T-세포 면역수용체(TIGIT), CD96 분자(CD96), 세포독성 및 조절 T-세포 분자(CRTAM), 백혈구 관련 면역글로불린 유사 수용체 1(LAIR1), 아데노-관련 바이러스 통합 부위 1(AAVS1), AAVS 2, AAVS3, AAVS4, AAVS5, AAVS6, AAVS7, AAVS8, 형질전환 성장 인자 베타 수용체 II(TGFBRII), 형질전환 성장 인자 베타 수용체 I(TGFBR1), SMAD 패밀리 구성원 2(SMAD2), SMAD 패밀리 구성원 3(SMAD3), SMAD 패밀리 구성원 4(SMAD4), SKI 전암 유전자(SKI), SKI-유사 전암 유전자(SKIL), egl-9 패밀리 저산소증-유도 인자 1(EGLN1), egl-9 패밀리 저산소증-유도 인자 2(EGLN2), egl-9 패밀리 저산소증-유도 인자 3(EGLN3), 단백질 포스파테이스 1 조절 서브유닛 12C(PPP1R12C), TGFB 유도 인자 호메오박스 1(TGIF1), 종양 괴사 인자 수용체 슈퍼패밀리 구성원, 종양 괴사 인자 수용체 슈퍼패밀리 구성원 10b(TNFRSF10B), 종양 괴사 인자 수용체 슈퍼패밀리 구성원 10a(TNFRSF10A), BY55, B7H5, 카스페이스 8(CASP8), 카스페이스 10(CASP10), 카스페이스 3(CASP3), 카스페이스 6(CASP6), 카스페이스 7(CASP7), 사멸 도메인을 통해 회합된 Fas(FADD), Fas 세포 표면 사멸 수용체(FAS), 인터류킨 10 수용체 서브유닛 알파(IL10RA), 인터류킨 10 수용체 서브유닛 베타(IL10RB), 헴 옥시게네이스 2(HMOX2), 인터류킨 6 수용체(IL6R), 인터류킨 6 신호 전달인자(IL6ST), c-src 타이로신 카이네이스(CSK), 글리코스핑고지질 마이크로도메인 1을 갖는 인단백질 막 앵커(PAG1), 구아닐레이트 사이클레이스 1, 가용성, 베타 3(GUCY1B3), 신호전달 역치 조절 막횡단 어댑터 1(SIT1), 포크헤드 박스 P3(FOXP3), PR 도메인 1(PRDM1), 염기성 류신 지퍼 전사 인자, ATF-유사(BATF), 구아닐레이트 사이클레이스 1, 가용성, 알파 2(GUCY1A2), 구아닐레이트 사이클레이스 1, 가용성, 알파 3(GUCY1A3), 구아닐레이트 사이클레이스 1, 가용성, 베타 2(GUCY1B2), 단백질의 프롤릴 하이드록실레이스 도메인(PHD1, PHD2, PHD3) 패밀리, CD27, CD28, CD40, CD122, CD137, OX40, GITR 및 ICOS를 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, 변형된 유전자는 예정사 리간드 1(PD-L1), 클래스 II 주요 조직적합성 복합체 전사촉진인자(CIITA), 시트라말릴-CoA 라이에이스(CLYBL), 트랜스티레틴(TTR), 락테이트 데하이드로게네이스-A(LDHA), 하이드록시산 옥시데이스-1(hydroxyacid oxidase 1: HAO1), 알라닌-글리옥실레이트 및 세린-피루베이트 아미노트랜스퍼레이스(AGXT), 글리옥실레이트 리덕테이스/하이드록시피루베이트 리덕테이스(GRHPR), 4-하이드록시-2-옥소글루타레이트 알돌레이스(HOGA), 폴리피리미딘 관 결합 단백질 1(PTBP1), 스타트민 2(STMN2) 또는 액틴 베타(ACTB)이다.
본 개시내용은 또한 본 명세서에 개시된 바와 같은 유전자 편집 시스템을 사용하여 본 명세서에 개시된 바와 같은 임의의 표적 유전자를 유전자 편집하는 방법을 제공한다.
B. 편집
일부 양태에서, 본 명세서에 기재된 유전자 편집 시스템을 사용하여 적어도 하나의 편집을 표적 핵산(예를 들어, 본 명세서에 개시된 임의의 표적 유전자와 같은 관심 게놈 부위)에 도입하는 방법이 본 명세서에 제공된다. 일부 실시형태에서, 편집은 표적 핵산에 대한 치환, 삽입, 결실 또는 이들의 조합을 포함할 수 있다. 일부 예에서, 편집은 G에서 T로의 치환, G에서 A로의 치환, G에서 C로의 치환, T에서 G로의 치환, T에서 A로의 치환, T에서 C로의 치환, C에서 G로의 치환, C에서 T로의 치환, C에서 A로의 치환, A에서 T로의 치환, A에서 G로의 치환 또는 A에서 C로의 치환과 같은 단일 뉴클레오타이드 치환일 수 있다. 일부 예에서, 편집은 G:C 염기쌍을 T:A 염기쌍으로, G:C 염기쌍을 A:T 염기쌍으로, G:C 염기쌍을 C:G 염기쌍으로, T:A 염기쌍을 G:C 염기쌍으로, T:A 염기쌍을 A:T 염기쌍으로, T:A 염기쌍을 C:G 염기쌍으로, C:G 염기쌍을 G:C 염기쌍으로, C:G 염기쌍을 T:A 염기쌍으로, C:G 염기쌍을 A:T 염기쌍으로, A:T 염기쌍을 T:A 염기쌍으로, A:T 염기쌍을 G:C 염기쌍으로 또는 A:T 염기쌍을 C:G 염기쌍으로 전환할 수 있다.
일부 실시형태에서, 적어도 하나의 편집을 표적 핵산에 도입하기 위한 방법이 기술되되, 편집은 적어도 하나의 치환, 적어도 하나의 삽입 및/또는 적어도 하나의 결실이다. 일부 실시형태에서, 편집은 적어도 하나의 치환, 삽입 또는 결실을 포함한다. 일부 실시형태에서, 치환, 삽입 또는 결실은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개 또는 적어도 500개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 i1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드 또는 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 1개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이, 예를 들어, 1개의 뉴클레오타이드 내지 5개의 뉴클레오타이드, 5개의 뉴클레오타이드 내지 10개의 뉴클레오타이드, 10개의 뉴클레오타이드 내지 15개의 뉴클레오타이드, 15개의 뉴클레오타이드 내지 20개의 뉴클레오타이드, 20개의 뉴클레오타이드 내지 25개의 뉴클레오타이드, 25개의 뉴클레오타이드 내지 30개의 뉴클레오타이드, 30개의 뉴클레오타이드 내지 35개의 뉴클레오타이드, 35개의 뉴클레오타이드 내지 40개의 뉴클레오타이드, 40개의 뉴클레오타이드 내지 45개의 뉴클레오타이드, 45개의 뉴클레오타이드 내지 50개의 뉴클레오타이드, 50개의 뉴클레오타이드 내지 55개의 뉴클레오타이드, 55개의 뉴클레오타이드 내지 60개의 뉴클레오타이드, 60개의 뉴클레오타이드 내지 65개의 뉴클레오타이드, 65개의 뉴클레오타이드 내지 70개의 뉴클레오타이드, 70개의 뉴클레오타이드 내지 75개의 뉴클레오타이드, 75개의 뉴클레오타이드 내지 80개의 뉴클레오타이드, 80개의 뉴클레오타이드 내지 85개의 뉴클레오타이드, 85개의 뉴클레오타이드 내지 90개의 뉴클레오타이드, 90개의 뉴클레오타이드 내지 95개의 뉴클레오타이드, 95개의 뉴클레오타이드 내지 100개의 뉴클레오타이드, 100개의 뉴클레오타이드 내지 105개의 뉴클레오타이드, 105개의 뉴클레오타이드 내지 110개의 뉴클레오타이드, 110개의 뉴클레오타이드 내지 115개의 뉴클레오타이드, 115개의 뉴클레오타이드 내지 120개의 뉴클레오타이드, 120개의 뉴클레오타이드 내지 125개의 뉴클레오타이드, 125개의 뉴클레오타이드 내지 130개의 뉴클레오타이드, 130개의 뉴클레오타이드 내지 135개의 뉴클레오타이드, 135개의 뉴클레오타이드 내지 140개의 뉴클레오타이드, 140개의 뉴클레오타이드 내지 145개의 뉴클레오타이드, 145개의 뉴클레오타이드 내지 150개의 뉴클레오타이드, 150개의 뉴클레오타이드 내지 155개의 뉴클레오타이드, 155개의 뉴클레오타이드 내지 160개의 뉴클레오타이드, 160개의 뉴클레오타이드 내지 165개의 뉴클레오타이드, 165개의 뉴클레오타이드 내지 170개의 뉴클레오타이드, 170개의 뉴클레오타이드 내지 175개의 뉴클레오타이드, 175개의 뉴클레오타이드 내지 180개의 뉴클레오타이드, 180개의 뉴클레오타이드 내지 185개의 뉴클레오타이드, 185개의 뉴클레오타이드 내지 190개의 뉴클레오타이드, 190개의 뉴클레오타이드 내지 195개의 뉴클레오타이드, 195개의 뉴클레오타이드 내지 200개의 뉴클레오타이드, 200개의 뉴클레오타이드 내지 210개의 뉴클레오타이드, 210개의 뉴클레오타이드 내지 220개의 뉴클레오타이드, 220개의 뉴클레오타이드 내지 230개의 뉴클레오타이드, 230개의 뉴클레오타이드 내지 240개의 뉴클레오타이드, 240개의 뉴클레오타이드 내지 250개의 뉴클레오타이드, 250개의 뉴클레오타이드 내지 260개의 뉴클레오타이드, 260개의 뉴클레오타이드 내지 270개의 뉴클레오타이드, 270개의 뉴클레오타이드 내지 280개의 뉴클레오타이드, 280개의 뉴클레오타이드 내지 290개의 뉴클레오타이드 또는 290개의 뉴클레오타이드 내지 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 치환, 삽입 또는 결실은 최대 약 10,000개의 염기쌍(10kb) 길이이다. 예를 들어, 일부 실시형태에서, 치환, 삽입 또는 결실은 1개의 염기쌍, 약 10개의 염기쌍, 약 20개의 염기쌍, 약 30개의 염기쌍, 약 40개의 염기쌍, 약 50개의 염기쌍, 약 60개의 염기쌍, 약 70개의 염기쌍, 약 80개의 염기쌍, 약 90개의 염기쌍, 약 100개의 염기쌍, 약 200개의 염기쌍, 약 300개의 염기쌍, 약 400개의 염기쌍, 약 500개의 염기쌍, 약 600개의 염기쌍, 약 700개의 염기쌍, 약 800개의 염기쌍, 약 900개의 염기쌍, 약 1kb, 약 1.1kb, 약 1.2kb, 약 1.3kb, 약 1.4kb, 약 1.5kb, 약 1.6kb, 약 1.7kb, 약 1.8kb, 약 1.9kb, 약 2kb, 약 2.1kb, 약 2.2kb, 약 2.3kb, 약 2.4kb, 약 2.5kb, 약 2.6kb, 약 2.7kb, 약 2.8kb, 약 2.9kb, 3kb, 4kb, 5kb, 6kb, 7kb, 8kb, 9kb 또는 10kb 길이이다.
일부 실시형태에서, 삽입은 헤어핀이거나 또는 이를 포함한다. 예를 들어, 역전사효소는 표적 핵산에 혼입될 수 있는 헤어핀을 전사할 수 있다. 다른 실시형태에서, 역전사 주형 서열은 헤어핀 구조를 포함하고, 역전사효소는 헤어핀에서 역전사 주형 서열의 전사를 중단시킨다.
일부 실시형태에서, 편집은 유형 II PAM 서열(예를 들어, SpCas9의 경우 5'-NGG-3') 또는 유형 V PAM 서열(예를 들어, Cas12i 폴리펩타이드의 경우 5'-NTTN-3')의 약 500개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열에 인접하여, 예를 들어, PAM 서열의 상류 또는 하류에 있는 약 500개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 400개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 400개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 300개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 300개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 200개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 100개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 50개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 30개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다. 일부 실시형태에서, 편집은 PAM 서열의 상류 또는 하류에 있는 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 300개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 290개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 280개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 270개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 260개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 250개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 240개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 230개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2020개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 210개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 190개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 180개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 170개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 160개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 150개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 140개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 130개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 120개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 110개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 90개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 80개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 70개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 60개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 40개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 9개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 8개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 7개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 6개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 4개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 3개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 1개의 뉴클레오타이드 내에서 시작된다.
일부 실시형태에서, 편집은 PAM 서열에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 1개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 2개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 3개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 4개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 6개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 7개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 8개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 9개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 11개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 12개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 13개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 14개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 15개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 16개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 17개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 18개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 19개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 20개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 21개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 22개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 23개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 24개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 26개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 27개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 28개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 29개의 뉴클레오타이드 내에서 시작된다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 30개의 뉴클레오타이드 내에서 시작된다.
일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 300개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 290개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 280개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 270개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 260개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 250개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 240개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 230개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2020개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 210개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 190개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 180개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 170개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 160개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 150개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 140개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 130개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 120개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 110개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 90개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 80개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 70개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 60개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 40개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 9개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 8개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 7개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 6개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 4개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 3개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 2개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM 서열의 상류에 있는 약 1개의 뉴클레오타이드 내에서 끝난다.
일부 실시형태에서, 편집은 PAM 서열에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 1개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 2개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 3개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 4개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 5개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 6개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 7개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 8개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 9개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 10개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 11개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 12개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 13개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 14개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 15개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 16개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 17개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 18개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 19개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 20개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 21개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 22개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 23개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 24개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 25개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 26개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 27개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 28개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 29개의 뉴클레오타이드 내에서 끝난다. 일부 실시형태에서, 편집은 PAM의 하류에 있는 약 30개의 뉴클레오타이드 내에서 끝난다.
C.
비-PAM 가닥 편집
일부 실시형태에서, 본 명세서에 개시된 바와 같은 적합한 유전자 편집 시스템, 예를 들어, 도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 또는 도 12b에 도시된 것들을 사용하여 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하는 방법이 본 명세서에 제공된다. 적어도 하나의 편집은 유전자 편집 시스템에 포함된 역전사 주형 서열을 사용하여 처음에 비-PAM 가닥에 도입될 수 있다. 세포 DNA 복구 기구를 통해, 적어도 하나의 편집이 결국 표적 핵산의 양쪽 가닥에 도입될 것이다. 유전자 편집 시스템은 (a) CRISPR 뉴클레이스 결합 서열, (b) DNA-결합 서열 및 (c) RT 공여체 RNA를 포함하는 비-PAM 가닥을 표적으로 하는 편집 주형 RNA를 포함할 수 있다. 일부 실시형태에서, RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다.
일부 실시형태에서, RT 공여체 RNA의 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하기 위한 방법 및 유전자 편집 시스템 또는 조성물이 기술된다. 일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 비-PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다.
일부 실시형태에서, RT 공여체 RNA(예를 들어, 편집 주형 RNA의 RT 공여체 RNA)의 PBS는 비-PAM 가닥(PBS-표적화 부위)의 영역에 결합한다. 역전사 주형 서열은 비-PAM 가닥에 혼입될 편집을 포함한다. 일부 예에서, 역전사 주형은 PAM-가닥과의 서열 유사성을 포함한다. 일부 예에서, 역전사 주형은 PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, 비-PAM 가닥은 염기-페어링을 통해 RT 공여체 RNA의 PBS에 결합하고, 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)는 카피 역전사 주형 서열을 카피한다. 상보적 게놈 가닥과의 염기-페어링으로 다시 가닥을 교환한 후, 편집이 표적 핵산에 혼입된다.
일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: CRISPR 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 서열 및 PBS를 포함한다(예를 들어, 도 5, 도 6a, 도 6b, 도 8a 및 도 12a 참조). 일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서) 또는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다(도 7 및 도 12b).
일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열의 5' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 및 도 12a). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열과 PBS에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 PBS의 3' 연장부이다(도 7 및 도 12b). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스(예를 들어, Cas12i1, Cas12i2, Cas12i3 또는 Cas12i4 폴리펩타이드와 같은 Cas12i 폴리펩타이드)에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열(예를 들어, Cas9 직접 반복 서열 또는 Cas12i 직접 반복 서열)이다.
일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열과 PBS에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 및 도 12b). 일부 실시형태에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열을 포함할 수 있다. 일부 실시형태에서, DNA-결합 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다.
일부 실시형태에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 7, 도 8a, 도 12a 및 도 12b). 일부 실시형태에서, PBS는 역전사 주형 서열과 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열 및 PBS는 표적 핵산의 동일한 가닥(예를 들어, 비-PAM 가닥)에 결합한다.
일부 실시형태에서, 역전사 주형 서열은 PBS와 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 및 도 12a). 일부 실시형태에서, 역전사 주형 서열은 DNA-표적화 서열의 3' 연장부이다(도 5, 도 6a, 도 6b, 도 8a 및 도 12a). 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 7 및 도 12b). 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는 DNA-결합 서열과 PBS가 표적 핵산에 결합될 때 짝을 이루지 않은 뉴클레오타이드의 루프를 포함한다. 도 6a, 도 6b, 도 8a 및 도 12a를 참조한다. 일부 실시형태에서, 비-PAM 가닥을 표적으로 하는 편집 주형 RNA는 PBS에 인접한 루프를 포함한다. 도 7 및 도 12b를 참조한다. 일부 실시형태에서, 루프는 역전사 주형 서열을 포함하며 PBS가 뒤따른다. 일부 실시형태에서, PBS는 표적 핵산의 비-PAM 가닥에 대한 상보성을 포함한다. 일부 실시형태에서, 루프의 서열은 PAM 가닥과의 서열 유사성을 포함한다. 일부 실시형태에서, 루프는 PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, 편집은 치환, 삽입 또는 결실이다. 일부 실시형태에서, 루프는 헤어핀을 포함한다.
D.
PAM 가닥 편집
일부 실시형태에서, 도 1a, 도 1b, 도 2, 도 3, 도 4 또는 도 10에 도시된 것들과 같은 본 명세서에 개시된 적합한 유전자 편집 시스템을 사용하여 적어도 하나의 편집을 표적 핵산(예를 들어, 관심 게놈 부위)의 PAM 가닥에 도입하기 위한 방법이 본 명세서에 제공된다. 이러한 방법은 (a) CRISPR 뉴클레이스 결합 서열, (b) DNA-결합 서열, 및 (c) 및 RT 공여체 RNA를 포함할 수 있는 PAM 가닥을 표적으로 하는 편집 주형 RNA의 사용을 포함할 수 있다(도 1a, 도 1b, 도 2 및 도 10). 일부 예에서, PAM 가닥을 표적으로 하는 조성물은 RNA 가이드 및 RT 공여체 RNA를 포함한다(도 3 및 도 4). 일부 예에서, RT 공여체 RNA는 PBS 및 역전사 주형 서열을 포함한다.
일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다. 일부 실시형태에서, 역전사 주형 서열의 5'에서 3' 전사를 통해 적어도 하나의 편집을 표적 핵산의 PAM 가닥에 도입하기 위한 방법 및 조성물이 기술된다.
일부 경우에, RT 공여체 RNA(예를 들어, 편집 주형 RNA의 RT 공여체 RNA)의 PBS는 PAM 가닥에 결합한다. RT 공여체 RNA의 역전사 주형 서열은 PAM 가닥에 혼입될 편집을 포함한다. 일부 예에서, 역전사 주형은 비-PAM 가닥과의 서열 유사성을 포함한다. 일부 실시형태에서, 역전사 주형은 비-PAM 가닥의 서열에 대한 편집을 포함한다. 일부 실시형태에서, PAM 가닥은 염기-페어링을 통해 RT 공여체 RNA의 PBS에 결합할 수 있고, 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)는 역전사 주형 서열을 카피한다. 상보적 게놈 가닥과의 염기-페어링으로 다시 가닥을 교환한 후, 편집이 표적 핵산에 혼입된다.
일부 실시형태에서, PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성 요소: CRISPR 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 서열 및 PBS를 포함한다(도 1a, 도 1b 및 도 10). 일부 실시형태에서, PAM 가닥을 표적으로 하는 편집 주형 RNA는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열 또는, 5'에서 3'로, 다음 구성요소: 역전사 주형 서열, PBS, 링커, CRISPR 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다(도 2).
일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 1a, 도 1b, 도 2 및 도 10). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열과 PBS에 인접해 있다(도 2). 일부 실시형태에서 DNA-결합 서열은 PBS의 3' 연장부이다(도 2). 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스(예를 들어, Cas12i1, Cas12i2, Cas12i3 또는 Cas12i4 폴리펩타이드와 같은 Cas12i 폴리펩타이드)에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열(예를 들어, Cas9 직접 반복 서열 또는 Cas12i 직접 반복 서열)이다.
일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다(도 1a, 도 1b, 도 2 및 도 10). 일부 실시형태에서, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열과 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열의 3' 연장부이다(도 10). 일부 실시형태에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열이다. 일부 실시형태에서, DNA-결합 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다. 일부 실시형태에서, DNA-결합 서열은 스페이서 서열이다.
일부 실시형태에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 1a, 도 2, 도 1b 및 도 10). 일부 실시형태에서, PBS는 CRISPR 뉴클레이스 결합 서열에 인접해 있다. 일부 실시형태에서, CRISPR 뉴클레이스 결합 서열은 PBS의 3' 연장부이다(도 2). 일부 실시형태에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 일부 실시형태에서, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 실시형태에서, DNA-결합 서열 및 PBS는 표적 핵산의 상이한 가닥에 결합한다(예를 들어, DNA-결합 서열은 표적 가닥에 결합하고, PBS는 PAM 가닥에 결합함).
일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 DNA-결합 서열의 3' 연장부이다(도 1a, 도 1b 및 도 10). 일부 실시형태에서, 역전사 주형 서열은 PBS에 인접해 있다. 일부 실시형태에서, 역전사 주형 서열은 PBS의 5' 연장부이다(도 1a, 도 1b, 도 2). 일부 실시형태에서, PBS는 역전사 주형 서열의 3' 연장부이다(도 10). 일부 실시형태에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 실시형태에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
E. 세포 내 유전자 편집
일부 양태에서, 본 명세서에 또한 개시된 바와 같은 적합한 유전자 편집 시스템을 사용하여 세포에서 관심 게놈 부위(예를 들어, 본 명세서에 개시된 바와 같은 표적 유전자)를 편집하는 방법이 본 명세서에 제공된다. 이 방법을 수행하기 위해, 유전자 편집 시스템은 세포 집단에 전달되거나 또는 도입될 수 있다. 일부 경우에, 목적하는 유전자 편집을 포함하는 세포는 수집되고, 선택적으로 배양되고, 시험관내에서 확장될 수 있다.
본 명세서에 기재된 세포는 다양한 세포일 수 있다. 일부 실시형태에서, 세포는 단리된 세포이다. 일부 실시형태에서, 세포는 세포 배양물 또는 두 가지 이상의 세포 유형의 공동 배양물에 있다. 일부 실시형태에서, 세포는 생체외에 있다. 일부 실시형태에서, 세포는 살아있는 유기체로부터 얻어지고, 세포 배양물에서 유지된다. 일부 실시형태에서, 세포는 단일-세포 유기체이다.
일부 실시형태에서, 세포는 원핵생물 세포이다. 일부 실시형태에서, 세포는 세균 세포이거나 또는 세균 세포로부터 유래된다. 일부 실시형태에서, 세포는 고세균 세포이거나 또는 고세균 세포로부터 유래된다.
일부 실시형태에서, 세포는 진핵생물 세포이다. 일부 실시형태에서, 세포는 식물 세포이거나 또는 식물 세포로부터 유래된다. 일부 실시형태에서, 세포는 진균 세포이거나 또는 진균 세포로부터 유래된다. 일부 실시형태에서, 세포는 동물 세포이거나 또는 동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 무척추동물 세포이거나 또는 무척추동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 척추동물 세포이거나 또는 척추동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 포유동물 세포이거나 또는 포유동물 세포로부터 유래된다. 일부 실시형태에서, 세포는 인간 세포이다. 일부 실시형태에서, 세포는 제브라 피쉬 세포이다. 일부 실시형태에서, 세포는 영장류 세포이다. 일부 실시형태에서, 세포는 설치류 세포이다. 일부 실시형태에서, 세포는 합성적으로 만들어지며, 때로는 인공 세포라고도 불린다.
일부 실시형태에서, 세포는 세포주로부터 유래된다. 조직 배양을 위한 매우 다양한 세포주가 당업계에 공지되어 있다. 세포주의 예는 293T, MF7, K562, HeLa, CHO 및 이들의 형질전환 변이체를 포함하지만 이에 제한되지 않는다. 세포주는 당업자에게 공지된 다양한 공급원으로부터 입수 가능하다(예를 들어, 아메리칸 타입 컬처 컬렉션(American Type Culture Collection: ATCC)(버니지아주 머내서스 소재) 참조). 일부 실시형태에서, 세포는 불멸이거나 또는 불멸화된 세포이다. 일부 실시형태에서, 세포는 전능성(totipotent) 줄기 세포(예를 들어, 전능성(omnipotent)), 만능성(pluripotent) 줄기 세포, 다능성(multipotent) 줄기 세포, 협능성(oligopotent) 줄기 세포 또는 단능성(unipotent) 줄기 세포와 같은 줄기 세포이다. 일부 실시형태에서, 세포는 유도 만능성 줄기 세포(induced pluripotent stem cell: iPSC)이거나 또는 iPSC로부터 유래된다. 일부 실시형태에서, 세포는 중간엽 줄기 세포이다. 일부 실시형태에서, 세포는 배아 줄기 세포이다. 일부 실시형태에서, 세포는 조혈 줄기 세포이다. 일부 실시형태에서, 세포는 분화된 세포이다. 예를 들어, 일부 실시형태에서, 분화된 세포는 근육 세포(예를 들어, 근세포(myocyte)), 지방 세포(예를 들어, 지방세포(adipocyte)), 골세포(예를 들어, 골아세포(osteoblast), 골세포(osteocyte), 파골세포(osteoclast)), 혈액 세포(예를 들어, 단핵구, 림프구, 호중구, 호산구, 호염기구, 마크로파지, 적혈구 또는 혈소판), 신경 세포(예를 들어, 뉴런), 상피 세포, 면역세포(예를 들어, 림프구, 호중구, 단핵구 또는 마크로파지), 간 세포(liver cell 또는 hepatocyte), 섬유아세포 또는 성세포(sex cell)이다. 일부 실시형태에서, 세포는 최종적으로 분화된 세포이다. 예를 들어, 일부 실시형태에서, 최종적으로 분화된 세포는 신경 세포, 지방세포, 심근세포, 골격근 세포, 표피 세포 또는 장 세포이다. 일부 실시형태에서, 세포는 신경교세포이다. 일부 실시형태에서, 세포는 알파 세포, 베타 세포, 델타 세포 또는 장크롬친화성 세포를 포함하는 췌장 섬 세포이다. 일부 실시형태에서, 세포는 면역세포이다. 일부 실시형태에서, 면역세포는 T 세포이다. 일부 실시형태에서, 면역세포는 B 세포이다. 일부 실시형태에서, 면역세포는 자연 살해(Natural Killer: NK) 세포이다. 일부 실시형태에서, 면역세포는 종양 침윤 림프구(Tumor Infiltrating Lymphocyte: TIL)이다. 일부 실시형태에서, 세포는 포유동물 세포, 예를 들어, 인간 세포 또는 영장류 세포 또는 뮤린 세포이다. 일부 실시형태에서, 뮤린 세포는 야생형 마우스, 면역 반응 억제 마우스 또는 질환-특이적 마우스 모델로부터 유래된다. 일부 실시형태에서, 세포는 살아있는 조직, 기관 또는 유기체 내의 세포이다.
일부 실시형태에서, 세포는 1차 세포이다. 예를 들어, 1차 세포의 배양은 0회, 1회, 2회, 4회, 5회, 10회, 15회 이상 계대될 수 있다. 일부 실시형태에서, 1차 세포는 임의의 공지된 방법에 의해 개체로부터 수거된다. 예를 들어, 백혈구는 성분채집술, 백혈구성분채집술, 밀도 구배 분리 등에 의해 수거될 수 있다. 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등과 같은 조직으로부터의 세포는 생검에 의해 수거될 수 있다. 수거된 세포의 분산 또는 현탁을 위해 적절한 용액이 사용될 수 있다. 이러한 용액은 저농도의 허용 가능한 완충액과 함께 송아지 태아 혈청 또는 기타 자연 발생적 인자가 편리하게 보충된 일반적으로 균형 잡힌 염 용액(예를 들어, 일반 식염수, 인산 완충 식염수(PBS), 행크의 균형 잡힌 염 용액 등)일 수 있다. 완충액은 HEPES, 포스페이트 완충액, 락테이트 완충액 등을 포함할 수 있다. 세포는 즉시 사용될 수 있거나 또는 보관될 수 있다(예를 들어, 동결에 의해). 동결된 세포는 해동될 수 있고, 재사용할 수 있다. 세포는 DMSO, 혈청, 배지 완충액(예를 들어, 10% DMSO, 50% 혈청, 40% 완충 배지) 및/또는 동결 온도에서 세포를 보존하는 데 사용되는 몇몇 다른 이러한 일반적인 용액에서 동결될 수 있다.
본 명세서에 개시된 유전자 편집 시스템이 복수의 세포에 도입되는 실시형태에서, 세포의 적어도 약 0.5%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 1%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 2%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 3%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 4%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 5%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 10%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 20%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 30%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 40%가 목적하는 편집을 포함한다. 일부 실시형태에서, 세포의 적어도 약 50%가 목적하는 편집을 포함한다.
예를 들어, 본 명세서에 또한 개시된 임의의 유전자 편집 시스템을 사용하여 본 명세서에 개시된 방법에 의해 생산된 목적하는 유전적 편집을 보유한 세포도 본 개시내용의 범위 내에 있다. 일부 경우에, 본 명세서에 기재된 바와 같은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA에 의해 변형된 세포는 생체분자를 제조하기 위한 발현 시스템으로서 유용할 수 있다. 예를 들어, 변형된 세포는 단백질(예를 들어, 사이토카인, 항체, 항체-기반 분자), 펩타이드, 지질, 탄수화물, 핵산, 아미노산 및 바이타민과 같은 생체분자를 생산하는 데 유용할 수 있다. 다른 실시형태에서, 변형된 세포는 렌티바이러스, 아데노바이러스, 아데노-관련 바이러스 및 종양 용해성 바이러스 벡터와 같은 바이러스 벡터의 생산에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 세포독성 연구에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 질환 모델로서 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 백신 생산에 유용할 수 있다. 일부 실시형태에서, 변형된 세포는 치료에 유용할 수 있다. 예를 들어, 일부 실시형태에서, 변형된 세포는 수혈 및 이식과 같은 세포 요법에 유용할 수 있다.
일부 실시형태에서, 본 명세서에 기재된 바와 같은 CRISPR 뉴클레이스, 역전사효소 및 편집 주형 RNA에 의해 변형된 세포는 변형된 게놈 서열을 포함하는 신규한 세포주를 확립하는 데 유용할 수 있다. 일부 실시형태에서, 본 개시내용의 변형된 세포는 변형된 줄기 세포의 결실을 포함하는 하나 이상의 세포 계통으로 분화되는 변형된 줄기 세포(예를 들어, 변형된 전능성/전능성 줄기 세포, 변형된 만능성 줄기 세포, 변형된 다능성 줄기 세포, 변형된 협능성 줄기 세포 또는 변형된 단능성 줄기 세포)이다. 본 개시내용은 본 개시내용의 변형된 세포를 포함하거나 또는 이로부터 생성된 유기체(예컨대, 동물, 식물 또는 균류)를 추가로 제공한다.
F. 세포로의 유전자 편집 시스템의 전달
일부 실시형태에서, 임의의 유전자 편집 시스템 또는 이의 구성요소는, 예를 들어, 담체 및/또는 중합체성 담체, 예를 들어, 리포솜 또는 지질 나노입자와 같은 담체를 포함하여 제형화될 수 있고, 공지된 방법에 의해 세포(예를 들어, 원핵생물, 진핵생물, 식물, 포유동물 등)에 전달될 수 있다. 이러한 방법은 형질감염(예를 들어, 지질-매개성, 양이온성 중합체, 칼슘 포스페이트, 덴드리머); 전기천공법 또는 막 파괴의 다른 방법(예를 들어, 뉴클레오펙션(nucleofection)), 바이러스 전달(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, AAV), 미세주입, 미세입자 투사("유전자 총(gene gun)"), 퓨진(fugene), 직접 초음파 로딩(direct sonic loading), 세포 압착, 광학 형질감염, 원형질체 융합, 임페일펙션(impalefection), 마그네토펙션(magnetofection), 엑소솜-매개성 전달, 지질 나노입자-매개성 전달 및 이들의 임의의 조합을 포함하지만 이에 제한되지 않는다.
일부 실시형태에서, 방법은 하나 이상의 핵산(예를 들어, CRISPR 뉴클레이스, 역전사효소, 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA) 등을 암호화하는 핵산), 이의 하나 이상의 전사체 및/또는 미리 형성된 리보핵단백질을 세포에 전달하는 단계를 포함한다. 예시적인 세포내 전달 방법은 바이러스 또는 바이러스-유사 작용제; 칼슘 포스페이트, 덴드리머, 리포솜 또는 양이온성 중합체(예를 들어, DEAE-덱스트란 또는 폴리에틸렌이민)를 사용하는 것과 같은 화학-기반 형질감염 방법; 미세주입, 전기천공법, 세포 압착, 초음파 천공, 광학 형질감염, 임페일펙션, 원형질체 융합, 세균 접합, 플라스미드 또는 트랜스포존의 전달과 같은 비화학적 방법; 유전자 총, 마그네토펙션 또는 자성 보조 형질감염, 입자 충격을 사용하는 것과 같은 입자-기반 방법; 및 뉴클레오펙션과 같은 하이브리드 방법을 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, 본 출원은 이러한 방법에 의해 생산된 세포 및 이러한 세포를 포함하거나 또는 이로부터 생산된 유기체(예컨대, 동물, 식물 또는 균류)를 추가로 제공한다. 일부 실시형태에서, 본 발명의 조성물은 DNA 복구 또는 DNA 복구 기구에 영향을 미치는 작용제(예를 들어, 화합물, 분자 또는 생체분자)와 함께 추가로 전달된다. 일부 실시형태에서, 본 발명의 조성물은 세포 주기에 영향을 미치는 작용제(예를 들어, 화합물, 분자 또는 생체분자)와 함께 추가로 전달된다.
일부 실시형태에서, CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스와 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)를 포함하는 제1 조성물이 세포에 전달된다. 일부 실시형태에서, RNA 가이드 또는 RNA 가이드 및 RT 공여체 RNA(예를 들어, 편집 주형 RNA)를 포함하는 제2 조성물이 세포에 전달된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉되기 전에 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉되는 것과 동시에 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제2 조성물이 세포와 접촉된 후 세포와 접촉된다. 일부 실시형태에서, 제1 조성물은 제1 전달 방법에 의해 전달되고, 제2 조성물은 제2 전달 방법에 의해 전달된다. 일부 실시형태에서, 제1 전달 방법은 제2 전달 방법과 동일하다. 예를 들어, 일부 실시형태에서, 제1 조성물과 제2 조성물은 바이러스 전달을 통해 전달된다. 일부 실시형태에서, 제1 전달 방법은 제2 전달 방법과 상이하다. 예를 들어, 일부 실시형태에서, 제1 조성물은 바이러스 전달에 의해 전달되고, 제2 조성물은 지질 나노입자-매개성 전달에 의해 전달되고, 제2 조성물은 바이러스 전달에 의해 전달되거나 또는 제1 조성물은 지질 나노입자-매개성 전달에 의해 전달되고, 제2 조성물은 바이러스 전달에 의해 전달된다.
IV. 치료적 응용
본 명세서에 개시된 바와 같은 이러한 유전자 편집 시스템을 사용하여 생성된 임의의 유전자 편집 시스템 또는 변형된 세포는 유전자 편집 시스템에 의해 도입되거나 또는 변형된 세포에 의해 운반되는 유전자 편집으로부터 이익을 얻을 수 있는 질환을 치료하는 데 사용될 수 있다. 예를 들어, 질환은 유전자 질환일 수 있으며, 유전자 편집은 유전자 질환과 관련된 유전자 돌연변이를 고친다. 대안적으로, 질환은 유전자의 비정상적인 발현과 관련이 있을 수 있으며, 유전자 편집은 이러한 비정상적인 발현을 구제한다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템을 치료를 필요로 하는 대상체(예를 들어, 인간 환자)에게 투여하는 단계를 포함하는, 질환을 치료하는 방법이 본 명세서에 제공된다. 유전자 편집 시스템은 유전자 편집이 필요한 특정 조직 또는 특정 유형의 세포에 전달될 수 있다. 유전자 편집 시스템은 구성요소 중 하나 이상을 포함하는 LNP, 구성요소 중 하나 이상을 암호화하는 하나 이상의 벡터(예를 들어, 바이러스 벡터) 또는 이들의 조합을 포함할 수 있다. 유전자 편집 시스템의 구성요소는 하나 이상의 약제학적으로 허용 가능한 담체를 추가로 포함할 수 있는 약제학적 조성물을 형성하도록 제형화될 수 있다.
일부 실시형태에서, 본 명세서에 개시된 임의의 유전자 편집 시스템을 사용하여 생산된 변형된 세포는 치료를 필요로 하는 대상체(예를 들어, 인간 환자)에게 투여될 수 있다. 변형된 세포는 본 명세서에 기재된 치환, 삽입 및/또는 결실을 포함할 수 있다. 일부 예에서, 변형된 세포는 CRISPR 뉴클레이스, 역전사효소 폴리펩타이드 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)에 의해 변형된 세포주를 포함할 수 있다. 일부 경우에, 변형된 세포는 다양한 유형의 유전자 편집을 갖는 세포를 포함하는 이종 집단일 수 있다. 대안적으로, 변형된 세포는 하나의 특정 유전자 편집을 포함하는 실질적으로 균질한 세포 집단(예를 들어, 전체 집단 중 적어도 80%의 세포)을 포함할 수 있다. 일부 예에서, 세포는 적합한 배지에 현탁될 수 있다.
일부 실시형태에서, 유전자 편집 시스템 또는 이의 구성요소 또는 변형된 세포를 포함하는 조성물이 본 명세서에 제공된다. 이러한 조성물은 약제학적 조성물일 수 있다. 유용한 약제학적 조성물은 경구, 직장, 질, 비경구, 국소, 폐, 비강내, 병변내, 협측, 안구, 정맥내, 기관내 또는 또 다른 투여 경로에 적합한 제형으로 제조, 패키징 또는 판매될 수 있다. 본 개시내용의 약제학적 조성물은 단일 단위 용량 또는 복수의 단일 단위 용량으로 대량으로 제조, 패키징 또는 판매될 수 있다. 본 명세서에서 사용되는 "단위 용량"은 미리 결정된 수의 세포를 포함하는 약제학적 조성물의 개별적인 양이다. 세포의 수는 일반적으로 대상체에게 투여될 세포의 투여량과 동일하거나 또는, 예를 들어, 이러한 투여량의 1/2 또는 1/3과 같은 투여량의 편리한 분율(fraction)과 동일하다.
비경구 투여에 적합한 약제학적 조성물의 제형은 멸균수 또는 멸균 등장성 식염수와 같은 약제학적으로 허용 가능한 담체와 조합된 활성제(예를 들어, 유전자 편집 시스템 또는 이의 구성요소 또는 변형된 세포)를 포함할 수 있다. 이러한 제형은 볼루스 투여 또는 연속 투여에 적합한 형태로 제조, 패키징 또는 판매될 수 있다. 일부 주사용 제형은 보존제를 포함하는 앰풀 또는 다회 투여 용기와 같은 단위 투여 형태로 제조, 패키징 또는 판매될 수 있다. 비경구 투여를 위한 일부 제형은 현탁액, 용액, 유성 또는 수성 비히클 중 에멀션, 페이스트 및 이식형 지속 방출 또는 생분해성 제형을 포함하지만 이에 제한되지 않는다. 일부 제형은 현탁제, 안정화제 또는 분산제를 포함하지만 이에 제한되지 않는 하나 이상의 추가적인 성분을 추가로 포함할 수 있다.
약제학적 조성물은 멸균 주사용 수성 또는 유성 현탁액 또는 용액의 형태일 수 있다. 이러한 현탁액 또는 용액은 공지된 기술에 따라 제형화될 수 있고, 세포 이외에 본 명세서에 기재된 분산제, 습윤제 또는 현탁제와 같은 추가적인 성분을 포함할 수 있다. 이러한 멸균 주사용 제형은 물 또는 식염수와 같은 무독성의 비경구적으로 허용 가능한 희석제 또는 용매를 사용하여 제조될 수 있다. 다른 허용 가능한 희석제 및 용매는 링거 용액, 등장성 소듐 클로라이드 용액 및 합성 모노- 또는 다이-글리세리드와 같은 고정유를 포함하지만 이에 제한되지 않는다. 유용한 기타 비경구적으로 투여 가능한 제형은 패키징된 형태로, 리포솜 제제로 또는 생분해성 중합체 시스템의 구성요소로서 세포를 포함할 수 있는 것들을 포함한다. 지속 방출 또는 이식을 위한 일부 조성물은 에멀션, 이온 교환 수지, 난용성 중합체 또는 난용성 염과 같은 약제학적으로 허용 가능한 중합체성 또는 소수성 물질을 포함할 수 있다.
V. 키트 및 이의 용도
본 개시내용은 또한, 예를 들어, 본 명세서에 기재된 방법을 수행하기 위해 사용될 수 있는 키트 또는 시스템을 제공한다. 일부 실시형태에서, 키트 또는 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소를 포함한다. 일부 실시형태에서, 키트 또는 시스템은 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소를 암호화하는 폴리뉴클레오타이드를 포함하고, 선택적으로 폴리뉴클레오타이드는, 예를 들어, 본 명세서에 기재된 바와 같은 벡터 내에 포함된다. 일부 실시형태에서, 키트 또는 시스템은 유형 V 뉴클레이스-역전사효소 융합 폴리펩타이드(예를 들어, Cas12i2-RT 융합체 또는 Cas12i4-RT 융합체와 같은 Cas12i-역전사효소 융합 폴리펩타이드)를 포함한다. 키트 또는 시스템은 또한 본 명세서에 기재된 바와 같은 역전사효소 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)를 포함할 수 있다. 본 발명의 키트 또는 시스템의 RNA 가이드 및/또는 RT 공여체 RNA는 관심 서열을 표적화하도록 설계될 수 있다. CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스), 역전사효소 및 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)는 키트 또는 시스템 내의 동일한 바이알 또는 다른 용기에 패키징될 수 있거나 또는 사용하기 전에 내용물이 혼합될 수 있는 별도의 바이알 또는 다른 용기에 패키징될 수 있다. 키트 또는 시스템은 선택적으로 편집 주형 RNA(예를 들어, RNA 가이드 및 RT 공여체 RNA)와 함께 CRISPR 뉴클레이스(예를 들어, Cas12i 폴리펩타이드와 같은 유형 V 뉴클레이스) 및 역전사효소의 사용을 위한 완충액 및/또는 지침을 추가적으로 포함할 수 있다.
일부 실시형태에서, 키트는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스 및 역전사효소(예를 들어, CRISPR 뉴클레이스-역전사효소 융합체)를 포함하는 제1 조성물을 포함한다. 일부 실시형태에서, 키트는 RNA 가이드 또는 RNA 가이드 및 RT 공여체 RNA(예를 들어, 편집 주형 RNA)를 포함하는 제2 조성물을 포함한다. 일부 실시형태에서, 제1 조성물 및 제2 조성물은 동일한 바이알 내에 패키징된다. 일부 실시형태에서, 제1 조성물 및 제2 조성물은 상이한 바이알 내에 패키징된다.
일부 실시형태에서, 키트는 연구 목적으로 유용할 수 있다. 예를 들어, 일부 실시형태에서, 키트는 유전자 기능을 연구하는 데 유용할 수 있다.
본 명세서에 인용된 모든 참조문헌 및 간행물은 참조에 의해 본 명세서에 원용된다.
추가적인 실시형태
본 개시내용의 범위 내에 있는 추가적인 실시형태도 아래에 제공된다.
실시형태 1: 다음을 포함하는 조성물:
(a) 선택적으로 Cas12 폴리펩타이드인, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산;
(b) 유형 V 뉴클레이스 결합 서열(예를 들어, 직접 반복 서열) 및 DNA-결합 서열(예를 들어, 스페이서 서열)을 포함하는, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산;
(c) 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산; 및
(d) 프라이머 결합을 포함하는 역전사 공여체 RNA(RT 공여체 RNA).
실시형태 1에서, 유형 V CRISPR 뉴클레이스는 Cas12a(Cpf1), Cas12b(C2c1), Cas12c, Cas12d, Cas12e, Cas12f, Cas12h, Cas12i 또는 Cas12j(CasPhi) 폴리펩타이드일 수 있다. 일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12i 폴리펩타이드이며, 선택적으로 Cas12i1 폴리펩타이드 또는 변이형 Cas12i1 폴리펩타이드, Cas12i2 폴리펩타이드 또는 변이형 Cas12i2 폴리펩타이드, Cas12i3 폴리펩타이드 또는 변이형 Cas12i3 폴리펩타이드 또는 Cas12i4 폴리펩타이드 또는 변이형 Cas12i4 폴리펩타이드를 포함한다.
실시형태 2: 실시형태 1의 조성물은 다음 중 하나일 수 있는 Cas12i 폴리펩타이드를 포함할 수 있다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 80%의 동일성; 선택적으로 서열번호 8과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%의 동일성; 선택적으로 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 80%의 동일성; 선택적으로 서열번호 11과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9와 적어도 80%의 동일성 또는 서열번호 10과 적어도 80%의 동일성; 선택적으로 서열번호 9와 적어도 95%의 동일성 또는 서열번호 10과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함한다.
특정 예에서, 실시형태 2의 조성물은 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8에 제시된 아미노산 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나에 제시된 아미노산 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11에 제시된 아미노산 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10에 제시된 아미노산 서열을 포함한다.
본 명세서에 개시된 실시형태 2의 임의의 조성물은 감소된 crRNA 처리 활성을 갖거나 또는 crRNA 처리 활성이 결여되어 있는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다. 예를 들어, 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12i2 폴리펩타이드이되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다. 일부 경우에, Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%의 동일성을 포함하되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다. 일부 예에서, Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 포함하되, Cas12i2 폴리펩타이드는 H485 또는 H486 위치에 치환을 포함한다.
본 명세서에 개시된 실시형태 2의 임의의 조성물은 에피토프 펩타이드, 핵 국재화 신호 및 핵외 수송 신호 중 적어도 하나를 포함하는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함할 수 있다.
일부 예에서, 실시형태 2의 조성물은 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 12 내지 14 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 15 내지 17 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 18 내지 20 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 적어도 80%(예를 들어, 적어도 95%)의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 21 내지 24 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다.
일부 예에서, 실시형태 2의 조성물 다음 중 하나를 포함한다:
(a) Cas12i1 폴리펩타이드는 서열번호 8과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 12 내지 14 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(b) Cas12i2 폴리펩타이드는 서열번호 2 내지 7 중 어느 하나와 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 15 내지 17 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고;
(c) Cas12i3 폴리펩타이드는 서열번호 11과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 18 내지 20 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함하고; 그리고
(d) Cas12i4 폴리펩타이드는 서열번호 9 또는 서열번호 10과 적어도 95%의 동일성을 갖는 아미노산 서열을 포함하고, 직접 반복 서열은 서열번호 21 내지 24 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다.
실시형태 3: 본 명세서에 개시된 실시형태 1 또는 실시형태 2의 임의의 조성물의 스페이서 서열은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, 스페이서 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, 스페이서 서열은 표적 핵산의 표적 가닥(예를 들어, 표적 서열의 상보적 서열)에 실질적으로 상보적이다. 일부 예에서, 표적 서열은 비표적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 인접해 있다.
실시형태 4: 실시형태 1, 2 또는 3의 임의의 조성물은 Cas12i 폴리펩타이드인 유형 V 뉴클레이스를 포함할 수 있고, PAM 서열은 5'-NTTN-3'으로 제시된 서열을 포함하되, N은 임의의 뉴클레오타이드이다.
실시형태 5: 임의의 이전 실시형태의 임의의 조성물에서, 역전사효소 폴리펩타이드는 MMLV-RT, MMTV-RT, 마라톤-RT 또는 RTX 역전사효소를 포함한다.
실시형태 6: 임의의 실시형태 1 내지 5의 임의의 조성물에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드에 융합된다. 일부 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 N-말단에 융합된다. 다른 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 C-말단에 융합된다. 또 다른 예에서, 역전사효소 폴리펩타이드는 유형 V CRISPR 뉴클레이스 폴리펩타이드의 루프 내에 삽입된다.
실시형태 7: 임의의 실시형태 1 내지 5의 임의의 조성물에서, 역전사효소 폴리펩타이드 및 유형 V CRISPR 뉴클레이스 폴리펩타이드는 류신 지퍼, 나노바디, 항체 또는 이중 코일 도메인을 통해 복합체를 형성한다.
실시형태 8: 임의의 실시형태 1 내지 7의 임의의 조성물에서, RT 공여체 RNA는 RNA 가이드에 융합될 수 있다. 일부 예에서, RT 공여체 RNA는 RNA 가이드의 5' 말단에 융합될 수 있다. 다른 예에서, RT 공여체 RNA는 RNA 가이드의 3' 말단에 융합될 수 있다. 일부 경우에, RNA 가이드의 스페이서 서열은 RT 공여체 RNA의 역전사 주형 서열에 인접해 있다. 대안적으로, RNA 가이드의 스페이서 서열은 RT 공여체 RNA의 PBS에 인접해 있다. 다른 경우에, RNA 가이드의 직접 반복 서열은 RT RNA 공여체의 역전사 주형 서열에 인접해 있다. 대안적으로, RNA 가이드의 직접 반복 서열은 RT 공여체 RNA의 PBS에 인접해 있다.
일부 예에서, RT 공여체 RNA-RNA 가이드 융합체 폴리뉴클레오타이드는 링커를 추가로 포함할 수 있다. 일부 경우에, 링커는 직접 반복 서열과 PBS 사이에 있다. 다른 경우에, 링커는 스페이서 서열과 역전사 주형 서열 사이에 있다. 링커는 약 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이일 수 있다. 일부 예에서, 링커는 헤어핀을 포함한다.
실시형태 9: 실시형태 1 내지 8 중 어느 하나의 임의의 조성물에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이일 수 있다. 예를 들어, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다. 일부 경우에, PBS는 비표적 가닥(PAM 가닥)의 자유 3' 말단과 혼성화(염기-페어링을 통해 결합)한다. 다른 경우에, PBS는 표적 가닥(비-PAM 가닥)의 자유 3' 말단과 혼성화한다.
실시형태 10: 실시형태 1 내지 9 중 어느 하나의 임의의 조성물에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 예를 들어, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
실시형태 11: 실시형태 1 내지 10 중 어느 하나의 임의의 조성물에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥(이중-가닥)에 대한 실질적인 상보성을 갖는다. 예를 들어, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 75%의 상보성을 포함한다. 다른 예에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 85%의 상보성을 포함한다. 다른 예에서, PBS는 표적 핵산의 표적 가닥 또는 비표적 가닥과 적어도 약 95%의 상보성을 포함한다.
실시형태 12: 실시형태 1 내지 11 중 어느 하나의 임의의 조성물에서, 역전사 주형 서열은 압타머를 포함한다. 일부 경우에, 압타머는 역전사효소 폴리펩타이드를 동원한다.
실시형태 13: 실시형태 1 내지 11 중 어느 하나의 임의의 조성물에서, 역전사 주형은, 예를 들어, 5' 말단 또는 3' 말단에 변형을 포함한다. 일부 예에서, 변형은 화학적 변형이다. 다른 예에서, 변형은 2차 구조를 포함하는 핵산 서열이다. 특정 예에서, 변형은 헤어핀, 슈도노트, 삼중 구조, 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA이다. 다른 특정 예에서, 변형은 뉴클레이스 결합 서열(예를 들어, 하나 이상의 직접 반복 서열) 또는 뉴클레이스 결합 서열 및 DNA-결합 서열(스페이서)을 포함한다.
실시형태 1 내지 13 중 어느 하나의 임의의 조성물은 표적 가닥 또는 비표적 가닥에 편집을 도입할 수 있다. 일부 예에서, 편집은 치환, 삽입 또는 결실이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환이다. 일부 경우에, 편집은 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 경우에, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입, 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 예에서, 삽입은 헤어핀을 포함한다. 또 다른 경우에, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실이다. 예를 들어, 편집은 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생한다. 일례에서, 편집은 PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생한다. 또 다른 예에서, 편집은 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 일부 예에서, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지)한다.
실시형태 14: 실시형태 1 내지 13의 임의의 조성물에서, 표적 서열은 세포에 존재한다.
실시형태 15: 실시형태 1 내지 14의 임의의 조성물은 세포로의 전달을 위해 제형화될 수 있다. 일부 예에서, 세포는 포유동물 세포, 예를 들어, 인간 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 단일 전달 비히클로 제형화된다.
다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 2개 이상의 전달 비히클로 제형화된다.
또 다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 단일 전달 비히클로 제형화된다.
일부 예에서, RNA 가이드 및 RT 공여체 RNA는 단일 전달 비히클로 제형화된다. 일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 제1 전달 비히클로 제형화되고, RNA 가이드 및 RT 공여체 RNA는 제2 전달 비히클로 제형화된다.
실시형태 16: 실시형태 1 내지 15 중 어느 하나의 임의의 조성물에서, 적용 가능한 경우, 유형 V CRISPR 뉴클레이스 폴리펩타이드, 역전사효소 폴리펩타이드, RNA 가이드 및/또는 RT 공여체 RNA는 하나 이상의 벡터, 예를 들어, 하나 이상의 발현 벡터에서 암호화된다.
실시형태 17: 임의의 실시형태 1 내지 16의 조성물의 유형 V CRISPR 뉴클레이스 폴리펩타이드, 역전사효소 폴리펩타이드, RNA 가이드 및/또는 RT 공여체 RNA를 암호화하는 서열을 포함하는 벡터.
실시형태 18: 실시형태 1 내지 16 중 어느 하나의 조성물 또는 실시형태 17의 벡터를 포함하는 세포. 일부 예에서, 세포는 포유동물 세포, 예를 들어, 인간 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 19: 실시형태 17의 벡터를 발현시키는 방법.
실시형태 20: 실시형태 1 내지 17 중 어느 하나의 조성물을 생산하는 방법.
실시형태 21: 실시형태 1 내지 16 중 어느 하나의 조성물을 전달하는 방법.
일부 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 단일 전달 비히클로 전달된다.
다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산, RNA 가이드 또는 RNA 가이드를 암호화하는 핵산, 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산 및 RT 공여체 RNA는 2개 이상의 전달 비히클로 전달된다.
또 다른 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 단일 전달 비히클로 전달된다.
일부 경우에, RNA 가이드 및 RT 공여체 RNA는 단일 전달 비히클로 전달된다.
특정 예에서, 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산은 제1 전달 비히클로 전달되고, RNA 가이드 및 RT 공여체 RNA는 제2 전달 비히클로 전달된다.
실시형태 22: 실시형태 1 내지 16 중 어느 하나의 조성물을 표적 핵산에 결합시키는 방법. 일부 예에서, 표적 핵산은 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 23: 표적 핵산을 실시형태 1 내지 16 중 어느 하나의 조성물과 접촉시키는 단계를 포함하는, 편집을 표적 핵산에 도입하는 방법. 일부 예에서, 조성물은 편집을 표적 핵산의 표적 가닥 또는 비표적 가닥에 도입한다. 일부 경우에, 편집은 치환, 삽입 또는 결실이다.
특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 경우에, 삽입은 헤어핀을 포함한다. 또 다른 특정 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 경우에, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 내에서 발생하고, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 내에서 발생하고, PAM 서열의 약 50개의 뉴클레오타이드 내에서 발생하고, PAM 서열의 약 30개의 뉴클레오타이드 내에서 발생하거나 또는 PAM 서열의 약 20개의 뉴클레오타이드 내에서 발생한다.
일부 경우에, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 상류에 있는 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
대안적으로, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다.
실시형태 24: 편집 주형 RNA는,
(a) CRISPR 뉴클레이스 결합 서열;
(b) 표적 가닥 및 비표적 가닥을 포함하는 표적 핵산의 표적 가닥(예를 들어, 표적 서열의 상보적 서열)과 상보적인 DNA-결합 서열로서, 표적 서열은 비표적 가닥의 프로토스페이서 인접 모티프(PAM) 서열에 인접해 있는, 상기 DNA-결합 서열; 및
(c) 프라이머 결합 부위(PBS) 및 역전사 주형 서열을 포함하는 역전사 공여체 RNA(RT 공여체 RNA)로서, PBS는 표적 서열에 인접한 서열과 실질적으로 상보적이고, 역전사 주형 서열은 표적 핵산에 대해 적어도 하나의 암호화된 편집을 포함하는, 상기 역전사 공여체 RNA
를 포함하되, DNA-결합 서열과 PBS는 표적 핵산의 동일한 가닥에 결합한다.
실시형태 25: 실시형태 24의 편집 주형 RNA에서, DNA-결합 서열과 PBS는 표적 핵산의 표적 가닥(비-PAM 가닥)에 결합한다.
실시형태 26: 실시형태 24의 편집 주형 RNA에서, 적어도 하나의 암호화된 편집은 표적 핵산의 비표적 가닥(PAM 가닥)에 대한 것이다.
실시형태 27: 실시형태 24 내지 26 중 어느 하나의 편집 주형 RNA는 표적 핵산에 결합될 때 짝을 이루지 않은 뉴클레오타이드의 영역을 포함한다. 예를 들어, 짝을 이루지 않은 뉴클레오타이드의 영역은 DNA-결합 서열에 인접해 있다. 대안적으로 또는 이에 더하여, 짝을 이루지 않은 뉴클레오타이드의 영역은 PBS에 인접해 있다. 일부 경우에, 짝을 이루지 않은 뉴클레오타이드의 영역은 역전사 주형 서열을 포함한다.
실시형태 28: 실시형태 24 내지 27 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열, PBS 및 역전사 주형 서열은 RNA 서열이다.
실시형태 29: 실시형태 24 내지 28 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 유형 II CRISPR 뉴클레이스에 결합한다.
실시형태 30: 실시형태 24 내지 28 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 유형 V CRISPR 뉴클레이스에 결합한다. 일부 예에서, CRISPR 뉴클레이스 결합 서열은 Cas12i 폴리펩타이드 또는 변이형 Cas12i 폴리펩타이드에 결합한다. 일부 경우에, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나와 적어도 80%의 동일성을 갖는 폴리펩타이드에 결합한다. 일례에서, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나와 적어도 95%의 동일성을 갖는 폴리펩타이드에 결합한다. 또 다른 예에서, CRISPR 뉴클레이스 결합 서열은 서열번호 2 내지 11 중 어느 하나의 아미노산 서열을 포함하는 폴리펩타이드에 결합한다.
실시형태 31: 실시형태 24 내지 30 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 감소된 crRNA 처리 활성을 갖고 있거나 또는 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스에 결합한다.
실시형태 32: 실시형태 24 내지 31 중 어느 하나의 임의의 편집 주형 RNA에서, 적용 가능한 경우, CRISPR 뉴클레이스 결합 서열은 직접 반복 서열이다. 일부 예에서, CRISPR 뉴클레이스 결합 서열은 Cas9 직접 반복 서열이다. 다른 예에서, CRISPR 뉴클레이스 결합 서열은 Cas12i 직접 반복 서열이다. 일부 경우에, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 90%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다. 예를 들어, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나와 적어도 95%의 동일성을 갖는 뉴클레오타이드 서열을 포함한다. 일례에서, CRISPR 뉴클레이스 결합 서열은 서열번호 12 내지 24 중 어느 하나에 제시된 뉴클레오타이드 서열을 포함한다.
실시형태 33: 실시형태 24 내지 32 중 어느 하나의 임의의 편집 주형 RNA에서, CRISPR 뉴클레이스 결합 서열은 DNA-결합 서열에 인접해 있다. 예를 들어, DNA-결합 서열은 CRISPR 뉴클레이스 결합 서열의 3' 연장부이다.
실시형태 34: 실시형태 24 내지 33 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열은 RNA 서열, DNA 서열 또는 RNA/DNA 하이브리드 서열이다.
실시형태 35, 실시형태 24 내지 34 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열(예를 들어, 스페이서 서열)은 약 10개의 뉴클레오타이드 내지 약 50개의 뉴클레오타이드 길이를 포함한다. 일부 예에서, DNA-결합 서열은 약 15개의 뉴클레오타이드 내지 약 35개의 뉴클레오타이드 길이를 포함한다.
실시형태 36, 실시형태 24 내지 35 중 어느 하나의 임의의 편집 주형 RNA에서, DNA-결합 서열은 PBS에 인접해 있다. 일부 예에서, PBS는 DNA-결합 서열의 3' 연장부이다.
실시형태 37: 실시형태 24 내지 36 중 어느 하나의 임의의 편집 주형 RNA에서, PBS는 약 3개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드 길이이다. 예를 들어, PBS는 약 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개 또는 110개의 뉴클레오타이드 길이이다.
실시형태 38: 실시형태 24 내지 37 중 어느 하나의 임의의 편집 주형 RNA에서, PBS는 역전사 주형 서열에 인접해 있다. 일부 예에서, 역전사 주형 서열은 PBS의 3' 연장부이다.
실시형태 39: 실시형태 24 내지 38 중 어느 하나의 임의의 편집 주형 RNA에서, 역전사 주형 서열은 약 10개의 뉴클레오타이드 내지 약 300개의 뉴클레오타이드 길이이다. 일부 예에서, 역전사 주형 서열은 약 10개, 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개, 100개, 105개, 110개, 115개 또는 120개의 뉴클레오타이드 길이이다.
실시형태 40: 실시형태 24 내지 39 중 어느 하나의 임의의 편집 주형 RNA는, 5'에서 3'로, 뉴클레이스 결합 서열, DNA-결합 서열, 역전사 주형 및 PBS를 포함할 수 있다.
실시형태 41: 실시형태 24 내지 39 중 어느 하나의 임의의 편집 주형 RNA는, 5'에서 3'로, 역전사 주형, PBS, 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함할 수 있다.
실시형태 42: 실시형태 24 내지 41 중 어느 하나의 임의의 편집 주형 RNA에서, PBS의 3' 말단은 변형을 포함한다.
실시형태 43: 실시형태 24 내지 42 중 어느 하나의 임의의 편집 주형 RNA에서, 역전사 주형의 5' 말단은 변형을 포함한다.
실시형태 44: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 화학적 변형이다.
실시형태 45: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 2차 구조를 포함하는 핵산 서열이다. 예를 들어, 변형은 헤어핀, 슈도노트, 삼중 구조, xrRNA, tRNA 또는 절단형 tRNA이다.
실시형태 46: 실시형태 42 또는 43의 편집 주형 RNA에서, 변형은 뉴클레이스 결합 서열 또는 뉴클레이스 결합 서열 및 DNA-결합 서열을 포함한다.
실시형태 47: 실시형태 24 내지 47 중 어느 하나의 임의의 편집 주형 RNA는 치환, 삽입 또는 결실일 수 있는 편집을 유발할 수 있다. 일부 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환이다. 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입이다. 일부 경우에, 삽입은 헤어핀을 포함한다. 또 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실이다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 이내, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 이내, PAM 서열의 약 50개의 뉴클레오타이드 이내, PAM 서열의 약 30개의 뉴클레오타이드 이내 또는 PAM 서열의 약 20개의 뉴클레오타이드 이내에 있다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 일례에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 또 다른 예에서, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 대안적으로 또는 이에 더하여, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지한다(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지함).
실시형태 48: 실시형태 24 내지 47 중 어느 하나의 편집 주형 RNA는 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 49: 실시형태 24 내지 47 중 어느 하나의 편집 주형 RNA는 세포 예를 들어, 인간 세포와 같은 포유동물 세포로의 전달을 위해 제형화된다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다. 일부 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다. 다른 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 폴리펩타이드 또는 CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다.
실시형태 50: 실시형태 24 내지 49 중 어느 하나의 편집 주형 RNA는, 적용 가능한 경우, 벡터에 암호화된다.
실시형태 51: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 암호화하는 서열을 포함하는 벡터.
실시형태 52: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 포함하는 복합체. 일부 예에서, 복합체는 CRISPR 뉴클레이스를 포함한다. 다른 예에서, 복합체는 표적 서열 또는 표적 핵산을 포함한다. 또 다른 예에서, 복합체는 CRISPR 뉴클레이스 및 표적 서열 또는 표적 핵산을 포함한다.
일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 다른 예에서, CRISPR 뉴클레이스는 DNA 이중체의 두 가닥을 모두 절단한다. 또 다른 예에서, CRISPR 뉴클레이스는 평활 절단(blunt cutting) 뉴클레이스이다. 대안적으로, CRISPR 뉴클레이스는 점착 절단(staggered cutting) 뉴클레이스이다.
실시형태 53: 실시형태 24 내지 52 중 어느 하나의 편집 주형 RNA, 벡터 또는 복합체를 포함하는 세포. 일부 경우에, 세포는 인간 세포와 같은 포유동물 세포이다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
실시형태 54: 실시형태 31의 벡터를 발현시키는 방법.
실시형태 55: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 생산하는 방법.
실시형태 56: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 절단하는 방법. 일부 경우에, 편집 주형 RNA는 CRISPR 뉴클레이스 또는 CRISPR 뉴클레이스를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다. 다른 예에서, 편집 주형 RNA는 CRISPR 뉴클레이스 폴리펩타이드 또는 CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 핵산 및 역전사효소 폴리펩타이드 또는 역전사효소 폴리펩타이드를 암호화하는 핵산과 함께 단일 전달 비히클로 제형화된다.
실시형태 57: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 CRISPR 뉴클레이스와 결합시키는 방법.
실시형태 58: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 표적 서열 또는 표적 핵산과 결합시키는 방법.
실시형태 59: 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA를 CRISPR 뉴클레이스 및 표적 서열 또는 표적 핵산과 결합시키는 방법.
실시형태 60: 표적 핵산을 실시형태 24 내지 50 중 어느 하나의 편집 주형 RNA 및 CRISPR 뉴클레이스와 접촉시키는 단계를 포함하는, 표적 핵산에 편집을 도입시키는 방법. 일부 경우에, CRISPR 뉴클레이스는 유형 II CRISPR 뉴클레이스이다. 다른 경우에, CRISPR은 유형 V CRISPR 뉴클레이스이다. 예를 들어, CRISPR 뉴클레이스는 Cas12i 폴리펩타이드 또는 변이형 Cas12i 폴리펩타이드이다. 특정 예에서, CRISPR 뉴클레이스는 임의의 서열번호 2 내지 11과 적어도 80%의 동일성, 예를 들어, 임의의 서열번호 2 내지 11과 적어도 95%의 동일성을 갖는 폴리펩타이드이다. 일례에서, CRISPR 뉴클레이스는 임의의 서열번호 2 내지 11의 아미노산 서열을 포함하는 폴리펩타이드이다.
일부 예에서, CRISPR 뉴클레이스는 감소된 crRNA 처리 활성을 포함하거나 또는 crRNA 처리 활성이 결여되어 있는 CRISPR 뉴클레이스이다.
일부 예에서, CRISPR 뉴클레이스는 닉케이스이다. 대안적으로, CRISPR 뉴클레이스는 DNA 이중체의 두 가닥을 모두 절단한다. 일부 경우에, CRISPR 뉴클레이스는 평활 절단 뉴클레이스이다. 대안적으로, CRISPR 뉴클레이스는 점착 절단 뉴클레이스이다.
실시형태 61: 실시형태 60의 방법에서, 편집 주형 RNA는 편집을 표적 핵산의 표적 가닥에 도입한다. 일부 예에서, 편집은 치환, 삽입 또는 결실이다. 예를 들어, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 치환, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 치환 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 치환일 수 있다. 대안적으로, 편집은 1개의 뉴클레오타이드 내지 약 200개의 뉴클레오타이드의 삽입, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 삽입 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 삽입일 수 있다. 일부 경우에, 삽입은 헤어핀을 포함한다. 다른 예에서, 편집은 1개의 뉴클레오타이드 내지 약 100개의 뉴클레오타이드의 결실, 예를 들어, 1개의 뉴클레오타이드 내지 약 120개의 뉴클레오타이드의 결실 또는 1개의 뉴클레오타이드 내지 약 20개의 뉴클레오타이드의 결실일 수 있다.
일부 예에서, 편집은 PAM 서열의 약 200개의 뉴클레오타이드 이내, 예를 들어, PAM 서열의 약 100개의 뉴클레오타이드 이내, PAM 서열의 약 50개의 뉴클레오타이드 이내, PAM 서열의 약 30개의 뉴클레오타이드 이내 또는 PAM 서열의 약 20개의 뉴클레오타이드 이내에 있다.
일부 예에서, 편집은 PAM 서열의 상류에 있는 약 200개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, 예를 들어, PAM 서열의 상류에 있는 약 100개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 50개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 30개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 20개의 뉴클레오타이드 내에서 시작되고/되거나 끝나고, PAM 서열의 상류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝나거나 또는 PAM 서열의 상류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
다른 예에서, 편집은 PAM 서열의 하류에 있는 약 5개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 일례에서, 편집은 PAM 서열의 하류에 있는 약 10개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다. 또 다른 예에서, 편집은 PAM 서열의 하류에 있는 약 25개의 뉴클레오타이드 내에서 시작되고/되거나 끝난다.
일부 예에서, 편집은 PAM 서열을 제거하거나 또는 변경한다. 대안적으로 또는 이에 더하여, 편집은 유형 V CRISPR 뉴클레이스 폴리펩타이드에 의한 재표적화를 방지한다(예를 들어, 표적 서열에 대한 유형 V CRISPR 뉴클레이스의 결합을 방지함).
일부 예에서, 표적 핵산은 세포, 예를 들어, 인간 세포와 같은 포유동물 세포에 존재한다. 일례에서, 세포는 간 세포(예를 들어, 간세포)이다.
일반적인 기법
본 개시내용의 실시는 달리 명시하지 않는 한 당해 분야의 기술 내에 있는 분자생물학(재조합 기법 포함), 미생물학, 세포 생물학, 생화학 및 면역학의 통상적인 기법을 사용할 것이다. 이러한 기법은 문헌[Molecular Cloning: A Laboratory Manual, second edition (Sambrook, et al., 1989) Cold Spring Harbor Press; Oligonucleotide Synthesis (M. J. Gait, ed. 1984); Methods in Molecular Biology, Humana Press; Cell Biology: A Laboratory Notebook (J. E. Cellis, ed., 1989) Academic Press; Animal Cell Culture (R. I. Freshney, ed. 1987); Introduction to Cell and Tissue Culture (J. P. Mather and P. E. Roberts, 1998) Plenum Press; Cell and Tissue Culture: Laboratory Procedures (A. Doyle, J. B. Griffiths, and D. G. Newell, eds. 1993-8) J. Wiley and Sons; Methods in Enzymology (Academic Press, Inc.); Handbook of Experimental Immunology (D. M. Weir and C. C. Blackwell, eds.): Gene Transfer Vectors for Mammalian Cells (J. M. Miller and M. P. Calos, eds., 1987); Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds. 1987); PCR: The Polymerase Chain Reaction, (Mullis, et al., eds. 1994); Current Protocols in Immunology (J. E. Coligan et al., eds., 1991); Short Protocols in Molecular Biology (Wiley and Sons, 1999); Immunobiology (C. A. Janeway and P. Travers, 1997); Antibodies (P. Finch, 1997); Antibodies: a practice approach (D. Catty., ed., IRL Press, 1988-1989); Monoclonal antibodies: a practical approach (P. Shepherd and C. Dean, eds., Oxford University Press, 2000); Using antibodies: a laboratory manual (E. Harlow and D. Lane (Cold Spring Harbor Laboratory Press, 1999); The Antibodies (M. Zanetti and J. D. Capra, eds. Harwood Academic Publishers, 1995); DNA Cloning: A practical Approach, Volumes I and II (D.N. Glover ed. 1985); Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds.(1985); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984); Animal Cell Culture (R.I. Freshney, ed. (1986); Immobilized Cells and Enzymes (lRL Press, (1986); 및 B. Perbal, A practical Guide To Molecular Cloning (1984); F.M. Ausubel et al. (eds.)]과 같은 문헌에 자세히 설명되어 있다.
추가 설명 없이도, 당업자는 위의 설명에 기초하여 본 발명을 최대한 활용할 수 있다고 여겨진다. 따라서, 다음의 특정 실시형태는 단지 예시적인 것으로 해석되어야 하며, 어떤 식으로든 개시내용의 나머지 부분을 제한하지 않는 것으로 해석되어야 한다. 본 명세서에 인용된 모든 간행물은 본 명세서에 언급된 목적 또는 특허 대상에 참조에 의해 원용된다.
실시예
다음 실시예는 본 발명의 일부 실시형태를 추가로 설명하기 위해 제공되지만 본 발명의 범위를 제한하려는 의도는 아니며; 당업자에게 공지된 다른 절차, 방법론 또는 기법이 대안적으로 사용될 수 있다는 것이 이들의 예시적인 특성에 의해 이해될 것이다.
실시예 1 - 포유동물 세포에서 표적 가닥의 RNA-주형 편집
본 실시예는 포유동물 유전자의 표적 가닥 편집(예를 들어, 선택된 포유동물 유전자의 비-PAM 가닥에 결합하는 편집 주형 RNA를 사용)을 설명한다.
변이형 Cas12i2(서열번호 4)와 서열번호 29의 돌연변이 MMLV 역전사효소의 융합체를 pcda3.1 백본(Invitrogen)에 클로닝하였다. 변이형 Cas12i2에 대한 N-말단 및 C-말단 RT 융합체의 구성은 표 7에 나타나 있다. 변이형 Cas12i2와의 RT 융합체의 발현을 위한 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액).
표 8에 나타나 있고 도 8a에 도시된 바와 같은 다양한 RNA 가이드-RT 공여체 RNA 융합체 구성을 테스트하였다. 역전사 주형 서열 및 PBS를 RNA 가이드의 3' 말단에 융합시켰다. 치환, 삽입, 결실 또는 헤어핀을 AAVS1_T7 표적 또는 VEGFA_T5 표적에 도입하도록 역전사 주형 서열을 설계하였다. RNA 가이드-RT 공여체 RNA 융합체의 서열은 표 9에 나타나 있으며, 부분적으로 도 8b에 도시되어 있다. 표 9 및 도 8b에서, "S"는 치환을 지칭하고, "I"는 삽입을 지칭하고, "D"는 결실을 지칭하고, "H"는 헤어핀을 지칭하며, PBS 길이는 괄호 안에 있다. 대조군으로 사용된 RNA 가이드의 서열만이 표 10에 나타나 있다. RNA 가이드-RT 공여체 RNA 융합체 또는 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙(maxi-prep)하였다. 각각의 RNA 가이드를 발현하는 플라스미드/RT 공여체 RNA 플라스미드(또는 RNA 가이드)의 작업 용액을 물(편집 주형 RNA 작업 용액)에서 제조하였다.
형질감염 대략 16시간 전에, DMEM/10%FBS+Pen/Strep 중 25,000개의 HEK293T 세포를 w96-웰 플레이트의 각 웰에 플레이팅하였다. 형질감염 당일, 세포는 70% 내지 90% 컨플루언트 상태였다. 형질감염될 각 웰에 Lipofectamine™ 2000(Themo Fisher)과 Opti-MEM™ 배지(Thermo Fisher)의 혼합물을 준비한 다음, 실온에서 5분 내지 20분 동안 인큐베이션하였다(용액 1). 인큐베이션 후, Lipofectamine™:OptiMEM™ 혼합물을 변이형 Cas12i2-RT 융합체 작업 용액, RNA 작업 용액 및 OptiMEM™ 배지를 포함하는 별도의 혼합물에 첨가하였다(용액 2). 용액 1과 용액 2의 혼합물을 위아래로 피펫팅하여 혼합한 다음, 실온에서 25분 동안 인큐베이션하였다. 인큐베이션 후, 용액 1과 용액 2의 혼합물을 세포가 담긴 96 웰 플레이트의 각 웰에 적가하였다. 형질감염 72시간 후, 각 웰의 중앙에 TrypLE™(ThermoFisher)를 첨가하여 세포를 트립신 처리하고, 대략 5분 동안 인큐베이션하였다. 그런 다음, 성장 배지를 각 웰에 첨가하고, 혼합하여 세포를 재현탁시켰다. 그런 다음, 세포를 400g에서 10분 동안 원심분리하고, 상청액을 버렸다. QuickExtract™ 완충액(Lucigen)을 원래 세포 현탁액 부피의 1/5 양으로 첨가하였다. 세포를 65℃에서 15분, 68℃에서 15분 및 98℃에서 10분 동안 인큐베이션하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5 중간 또는 고출력 키트로 수행하였다.
도 9a 및 도 9b는 AAVS1_T6에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9c 및 도 9d는 AAVS1_T7에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9e 및 도 9f는 EMX1_T6에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9g 및 도 9h는 VEGFA_T2에서 변이형 Cas12i2에 의한 활성을 보여주고, 도 9i 및 도 9j는 VEGFA_T5에서 변이형 Cas12i2에 의한 활성을 보여준다. NGS 리드의 백분율은 y-축에 표시되고, 총 편집은 밝은 회색 막대로 표시되고, 암호화된 편집은 어두운 회색 막대로 표시된다. 데이터는 2개의 생체 복제물의 평균이며, 이들 각각은 3개의 기술적 복제물을 갖고 있다. 도 9a, 도 9c, 도 9e, 도 9g 및 도 9i에 도시된 바와 같이, 변이형 Cas12i2 및 변이형 Cas12i2-RT 융합체는 AAVS1_T6, AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5를 표적으로 하는 RNA 가이드의 존재하에 활성 뉴클레이스였다.
도 9b, 도 9d, 도 9f, 도 9h 및 도 9j에 도시된 바와 같이, RNA 가이드-RT 공여체 RNA 융합체 서열의 존재하에 변이형 Cas12i2-RT 융합체는 암호화된 치환, 삽입 및 결실을 AAVS1_T6, AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5에 도입시킬 수 있다. 13개, 30개 및 60개의 뉴클레오타이드의 PBS 길이에서 활성이 관찰되었다. C-말단 MMLV RT 융합체에 의한 편집은 변이형 Cas12i2와 N-말단 MMLV RT 융합체에 의한 편집을 초과하였다. 변이형 Cas12i2를 사용한 편집은 약 1% 내지 5% 범위이다.
본 실시예는 편집 주형 RNA 및 Cas12i2-RT 융합체를 사용하여 특정 편집이 선택된 포유동물 게놈 부위에 혼입되었음을 보여준다.
실시예 2 - 말단 보호된 편집 주형 RNA를 사용한 포유동물 세포에서의 표적 가닥의 편집
본 실시예는 포유동물 유전자의 표적 가닥 편집(예를 들어, 선택된 포유동물 유전자의 비-PAM 가닥에 결합하는 편집 주형 RNA 사용)을 설명한다.
서열번호 4의 변이형 Cas12i2와 서열번호 25의 변이형 Cas12i2-RT 융합체를 각각 pcda3.1 백본(Invitrogen)에 클로닝하였다. 변이형 Cas12i2와의 RT 융합체의 발현을 위한 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액).
표 11에 나타나 있고 도 12a 및 도 12b에 도시된 바와 같은 다양한 RNA 가이드-RT 공여체 RNA 융합체 구성을 테스트하였다. 역전사 주형 서열과 PBS를 RNA 가이드의 5' 말단 또는 3' 말단에 융합시켰다. 추가적인 DR-스페이서 서열을 5' 또는 3' 말단에 추가하였다. 말단 보호를 위해 사용된 스페이서 서열은 인간을 표적으로 하지 않았다(즉, 인간 게놈의 임의의 서열을 표적으로 하지 않았다). RNA 가이드-RT 공여체 RNA 융합체의 서열은 표 12에 나타나 있고; RT 공여체에 암호화된 목적하는 편집은 소문자로 표시된다. 대조군으로 사용된 RNA 가이드만의 서열은 표 13에 나타나 있다. RNA 가이드-RT 공여체 RNA 융합체 또는 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하였다. RNA 가이드/RT 공여체 RNA 플라스미드(또는 RNA 가이드)를 발현하는 각 플라스미드의 작업 용액을 물에서 제조하였다(편집 주형 RNA 작업 용액).
형질감염 대략 16시간 전에, DMEM/10%FBS+Pen/Strep 중 25,000개의 HEK293T 세포를 w96-웰 플레이트의 각 웰에 플레이팅하였다. 형질감염 당일, 세포는 70% 내지 90% 컨플루언트하였다. 형질감염될 각 웰에 Lipofectamine™ 2000(Themo Fisher)과 Opti-MEM™ 배지(Thermo Fisher)의 혼합물을 준비한 다음, 실온에서 5분 내지 20분 동안 인큐베이션하였다(용액 1). 인큐베이션 후, Lipofectamine™:OptiMEM™ 혼합물을 변이형 Cas12i2-RT 융합체 작업 용액, RNA 작업 용액 및 OptiMEM™ 배지를 포함하는 별도의 혼합물에 첨가하였다(용액 2). 용액 1과 용액 2의 혼합물을 위아래로 피펫팅하여 혼합한 다음, 실온에서 25분 동안 인큐베이션하였다. 인큐베이션 후, 용액 1과 용액 2의 혼합물을 세포가 담긴 96 웰 플레이트의 각 웰에 적가하였다. 형질감염 72시간 후, 각 웰의 중앙에 TrypLE™(ThermoFisher)를 첨가하여 세포를 트립신 처리하고, 대략 5분 동안 인큐베이션하였다. 그런 다음, 성장 배지를 각 웰에 첨가하고, 혼합하여 세포를 재현탁시켰다. 그런 다음, 세포를 400g에서 10분 동안 원심분리하고, 상청액을 버렸다. QuickExtract™ 완충액(Lucigen)을 원래 세포 현탁액 부피의 1/5 양으로 첨가하였다. 세포를 65℃에서 15분, 68℃에서 15분 및 98℃에서 10분 동안 인큐베이션하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5(Illumina) 중간 또는 고출력 키트로 수행하였다.
도 13a는 AAVS1_T7에 대한 활성을 보여주고, 도 13b는 EMX1_T6에 대한 활성을 보여주고, 도 13c는 VEGFA_T2에 대한 활성을 보여주고, 도 13d는 VEGFA_T5에 대한 활성을 보여준다. NGS 리드의 백분율은 y-축에 표시된다. 데이터는 3개의 기술적 복제물의 평균이다.
도 13a, 도 13b, 도 13c 및 도 13d에 도시된 바와 같이, 서열번호 4의 변이형 Cas12i2 및 서열번호 25의 변이형 Cas12i2-RT 융합체는 AAVS1_T7, EMX1_T6, VEGFA_T2 또는 VEGFA_T5를 표적으로 하는 RNA 가이드의 존재하에 활성 뉴클레이스였다(gRNA 샘플 참조). 목적하는 편집은 RT(서열번호 25의 변이형 Cas12i2-RT 융합체)의 존재하에서만 관찰되었다. Indel과 암호화된 편집은 서열번호 25의 변이형 Cas12i2-RT 융합체를 사용한 테스트된 편집 주형 RNA 각각에 대해 관찰되었다. 말단 보호된 5' 연장 편집 주형 RNA(말단 보호 - 역전사 주형 서열 - PBS - 뉴클레이스 결합 서열 - DNA-결합 서열)는 말단 보호가 없는 5' 연장 편집 주형 RNA(역전사 주형 서열 - PBS - 뉴클레이스 결합 서열 - DNA-결합 서열)와 비교하여 목적하는 편집을 갖는 더 높은 수의 리드를 보여주었다.
본 실시예는 편집 주형 RNA와 Cas12i2-RT 융합체의 여러 구성을 사용하여 특정 편집이 선택된 포유동물 게놈 부위에 혼입되었음을 보여준다.
실시예 3 - Cas12i2에 대한 시험관내 절단 패턴의 결정
본 실시예에서, RNA 가이드를 사용하여 변이형 Cas12i2의 시험관내 절단 패턴을 결정하였다. 이중 가닥 DNA 표적에서 Cas12i2에 의해 생성된 절단 부위의 결정은 편집 주형 RNA의 PBS 구성요소의 설계를 가능하게 한다.
절단 패턴을 결정하기 위한 검정의 개략도가 도 14a 내지 도 14c에 도시되어 있다. 절단 부위 분석을 위해 표적 서열을 포함하는 올리고를 먼저 설계하였다. 올리고는 표적의 양쪽 말단에 12개의 뉴클레오타이드 측접 서열을 갖는 표적 서열, 내부 바코드 및 표적화 증폭을 허용하는 프라이밍 부위로 구성되었다(도 14a). 도 14b에 도시된 바와 같이, 모든 절단 산물은 두 부분으로 나누었으며, 절반은 5' 및 3' 오버행을 평활 말단화시키는 녹두 뉴클레이스(mung bean nuclease: MBN)로 처리하고(평활 말단화 처리), 나머지 절반의 반응물은 말단 복구시키고(NEBNext DNA 라이브러리 프렙의 일부, New England Biolabs), 5' 오버행은 필인시켰다(필인 처리). 그런 다음, 두 부분 모두에 NGS 라이브러리 준비 및 반-표적화 증폭을 적용하였다. 유형 V CRISPR 뉴클레이스는 회색 화살표로 표시된 바와 같이 5' 오버행이 있는 점착 절단을 생성하는 것으로 나타났다. 이러한 절단 부위는 임의의 5' 오버행을 채우기 위한 필인 처리로 포착되었다. 따라서, 이러한 산물의 5' 및 3' 시퀀싱은 표적 가닥 및 비표적 가닥의 절단 부위를 나타낸다. Cpf1에 대한 최근 연구에서는 특히 필인 방법으로 포착되지 않은 비표적 가닥에서 추가적인 절단 부위가 나타났다. 이러한 절단 부위를 포착하기 위해, 평활 말단화 방법을 사용하면 모든 5' 및 3' 오버행이 평활 말단화된다. 결과적으로, 평활 말단화 방법에서 5' 절단 산물은 비표적 가닥의 임의의 추가적인 절단 부위를 나타내고, 3' 절단 산물은 표적 가닥의 추가적인 절단 부위를 나타낸다. NEBNext 어댑터 결찰 후 반-표적 증폭은 5' 및 3' 절단 산물의 특정 증폭을 가능하게 하였으며; 증폭된 산물을 풀링하고 NGS로 분석하였다(도 14c).
IR800 및 IR700 표지된 정방향 및 역방향 프라이머를 각각 사용하는 PCR 증폭에 의해 DNA 기질을 생성하여 IR800 표지된 표적 가닥 및 IR700 표지된 비표적 가닥을 갖는 dsDNA 표적을 생성하였다. PCR 산물을 CleanNGS SPRI 비드를 1.8x의 비드 대 PCR 산물의 비로 사용하여 세척하였다. 정제된 Cas12i2를 crRNA와 함께 사전 인큐베이션하여 NEBuffer 3(10mM Tris-HCl(pH 7.9), 150mM NaCl, 10mM MgCl2, 1mM DTT)에서 37℃에서 10분 동안 RNP를 형성시켰다. NEBuffer 3에 연속 희석된 RNP와 혼합된 dsDNA 기질을 포함하는 시험관내 절단 반응을 37℃에서 1시간 동안 수행하였다. EDTA로 반응을 중지시켰다. 반응물을 RNase 칵테일(37℃에서 15분)로 처리한 후, 프로테이네이스 K 처리(37℃에서 15분)하였다. 반응물을 15% TBE-Urea 겔을 사용하여 변성 겔 전기영동으로 분석하고, Odyssey CLx(LI-COR) 영상 장치에서 이미지화하였다. DNA 기질 및 RNA 가이드 서열은 표 14에 나타나 있으며; 표적 서열은 굵게 표시되어 있다.
절단 위치를 결정하기 위한 시험관내 절단 단편 분석을 위해, 반응 산물을 SPRI 비드와 아이소프로필 알코올(IPA SPRI)을 사용하여 정제하였다. 정제된 반응물을 두 부분으로 나누었다. 절반은 녹두 뉴클레이스(New England Biolabs)로 30℃에서 30분 동안 처리하여 5' 및 3' 오버행을 모두 제거하여 평활 말단을 생성한 후 IPA SPRI로 정제하였다. 그런 다음, 제조업체의 지침에 따라 NEBNext Ultra-II DNA 라이브러리 프렙 키트(New England Biolabs)를 사용하여 시퀀싱하기 위해 녹두 뉴클레이스 처리된 반쪽과 처리되지 않은 반쪽 모두를 준비하였다. 반-표적 증폭을 사용하여 각 샘플에 대해 5' 및 3' 절단 산물을 별도로 증폭하였다. 시퀀싱 전에 모든 앰플리콘을 풀링하고 겔을 추출하였다. 각 샘플에 대해, 녹두 뉴클레이스 및 비녹두 뉴클레이스 처리된 샘플의 5' 및 3' 절단 산물에 대해 얻은 리드 길이를 히스토그램으로 플로팅하고 표적 서열에 매핑하였다.
전체 절단 패턴을 얻기 위해, 4개의 히스토그램 모두로부터 얻은 데이터를 취하여 도 15a 내지 도 15e 및 도 16에 도시된 바와 같이 R-루프 다이어그램에 시각화하였다. 도 15b 내지 도 15e는 AAVS1_T2에 대한 5' 및 3' 절단 산물의 반-표적 증폭으로부터 얻은 리드 길이의 히스토그램을 보여준다. 도 15b 및 도 15d는 각각 필인 및 평활 말단화 처리에 대한 5' 절단 산물의 리드 길이 히스토그램을 보여준다. 도 15c 및 도 15e는 각각 필인 및 평활 말단화 처리에 대한 3' 절단 산물의 리드 길이 히스토그램을 보여준다. 각각의 리드 길이 히스토그램을 x-축에 표시된 표적 서열에 매핑하였다. PAM 서열(5'-NTTT-3')도 표시되어 있다. 히스토그램으로부터 얻은 절단 부위는 도 15a의 R-루프 다이어그램에서 삼각형으로 표시된다. 도 16은 Cas12i2(서열번호 2) 또는 변이형 Cas12i2(서열번호 4)를 포함하는 RNP에 대한 AAVS1_T2 및 EMX1_T6의 절단 부위를 비교한 것이다. 기준 막대(오른쪽)는 시퀀싱 리드의 수로 측정된 경우 절단 빈도를 나타낸다.
모든 표적에 대해, 표적 가닥 및 비표적 가닥 모두에서 다양한 빈도의 다중 절단 부위가 관찰되었다. 비표적 가닥에서, 스페이서 영역(즉, RNA 가이드 결합 영역) 내뿐만 아니라 스페이서 영역의 외부에서 검출된 여러 절단 부위에서 광범위한 절단 프로파일이 관찰되었다. 이는 Cas12i2 결합 시, 이중-가닥 DNA가 스페이서 영역(즉, RNA 가이드 결합 영역)으로부터 여러 염기쌍을 풀고 단일 가닥 DNA로 존재하여 절단을 위해 Cas12i2에 접근할 수 있음을 나타낸다. 표적 가닥의 절단 부위는 스페이서 영역의 외부(즉, RNA 가이드 결합 영역의 외부)에서 일관되게 관찰되었다. AAVS1_T2의 경우, 표적 가닥 절단 부위는 PAM 서열의 22개 내지 24개의 뉴클레오타이드 위치에서 관찰되었다. VEGFA_T5 및 EMX1_T6의 경우, 표적 가닥 절단 부위는 PAM 서열의 22개 내지 23개의 뉴클레오타이드 위치에서 관찰되었다. 따라서, 이는 표적 가닥을 표적으로 하도록 설계된 편집 주형 RNA가 PAM 서열의 22개 내지 24개의 뉴클레오타이드에서 시작하는 PBS를 포함해야 함을 보여준다.
실시예 4 - 다양한 PBS 및 역전사 주형 서열 길이를 갖는 편집 주형 RNA를 사용한 포유동물 세포에서의 표적 가닥의 편집
본 실시예는 3개 내지 60개의 뉴클레오타이드의 PBS 길이 및 14개 내지 54개의 뉴클레오타이드의 역전사 주형 서열 길이를 갖는 편집 주형 RNA를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 25의 변이형 Cas12i2-RT 융합체를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다(변이형 Cas12i2-RT 융합체 작업 용액). 편집 주형 RNA 서열은 표 15에 나타나 있다. 첫 번째 조건의 세트에서, 역전사 주형 서열은 34개의 뉴클레오타이드 길이였고, PBS는 3개, 8개, 13개, 30개 또는 60개의 뉴클레오타이드 길이였다. 두 번째 조건의 세트에서, PBS는 13개의 뉴클레오타이드 길이였고, 역전사 주형 서열은 14개, 24개, 34개, 44개 또는 54개의 뉴클레오타이드 길이였다. 각각의 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하였다. 각각의 편집 주형 RNA를 발현하는 플라스미드의 작업 용액을 물에서 제조하였다(편집 주형 RNA 작업 용액).
세포를 실시예 2에 기술된 바와 같이 형질감염시키고 분석하였다. 도 17a는 AAVS1_T7의 경우 서열번호 25의 Cas12i2-RT와 서열번호 183 내지 187의 편집 주형 RNA, EMX1_T6의 경우 서열번호 25의 Cas12i2-RT와 서열번호 193 내지 197의 편집 주형 RNA 및 VEGFA_T5의 경우 서열번호 25의 Cas12i2-RT와 서열번호 203 내지 207의 편집 주형 RNA의 활성을 보여준다. 도 17b는 AAVS1_T7의 경우 서열번호 25의 Cas12i2-RT와 서열번호 188 내지 192의 편집 주형 RNA, EMX1_T6의 경우 서열번호 25의 Cas12i2-RT와 서열번호 198 내지 202의 편집 주형 RNA 및 VEGFA_T5의 경우 서열번호 25의 Cas12i2-RT와 서열번호 208 내지 212의 편집 주형 RNA의 활성을 보여준다. 암호화된 편집 대 총 indel의 비는 도 17a 및 도 17b의 y-축에 나타나 있다.
도 17a에 도시된 바와 같이, 테스트된 각각의 PBS 길이로 인해 암호화된 편집이 선택된 표적 부위로 혼입되었다. 13개, 30개 및 60개의 뉴클레오타이드의 PBS 길이를 사용하면 암호화된 편집 대 총 indel의 비가 가장 높아졌다. 도 17b에 도시된 바와 같이, 24개, 34개, 44개 및 54개의 뉴클레오타이드의 테스트된 역전사 주형 서열 길이로 인해 암호화된 편집이 존재하게 되었다. EMX1_T6의 경우, 암호화된 편집은 13개의 뉴클레오타이드 길이의 PBS 및 34개 또는 44개의 뉴클레오타이드 길이의 역전사 주형 서열을 갖는 편집 주형 RNA를 사용한 총 편집의 약 30%를 차지하였다. 따라서, 본 실시예는 다양한 PBS 및 역전사 주형 서열 길이를 갖는 편집 주형 RNA가 포유동물 세포에서 암호화된 편집을 표적 서열에 도입시킴을 보여준다.
실시예 5 - U2OS 세포에서의 표적 가닥의 RNA-주형 편집
본 실시예는 U2OS 세포에서의 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 25의 변이형 Cas12i2-RT 융합체를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다. 각각의 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고 맥시 프렙하였다. 각각의 편집 주형 RNA를 포함하는 플라스미드의 작업 용액을 물에서 제조하였다. 편집 주형 RNA 서열은 표 16에 나타나 있다. 추가적인 DR-스페이서 서열을 3' 말단에 추가하였으며, 추가적인 스페이서 서열은 인간을 표적으로 하지 않았다(즉, 이는 인간 게놈의 임의의 서열을 표적으로 하지 않았다). RT 공여체에 암호화된 목적하는 편집은 표 16에 소문자로 표시되어 있다.
U2OS 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 McCoy's-5A 배지(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 세포를 트립신 처리하고, 재현탁시키고, TrypLE™ Express(Thermo Fisher)를 사용하여 계수하였다. 800ng의 Cas12i2-RT 융합체 플라스미드와 200ng의 각각의 편집 주형 RNA 플라스미드의 혼합물을 사용하여 제조업체의 사전 설정된 DN-100 프로그램에 따라 SF 세포주 뉴클레오펙터 키트(Lonza)를 사용하여 400,000개 세포의 집단을 뉴클레오펙션시켰다. 그런 다음, 세포를 재현탁시키고, 미리 예열된 성장 배지가 담긴 96-웰 플레이트(40,000개 세포/웰)에 다시 플레이팅하였다. 뉴클레오펙션된 세포를 72시간 동안 배양하고 수거하였다.
실시예 2에 기술된 바와 같이 NGS로 편집을 분석하였다. 도 18에 도시된 바와 같이, 각각의 역전사 주형 서열에 의해 암호화된 편집은 NGS 리드의 약 5% 내지 8%에서 확인되었다. 암호화된 편집은 AAVS1_T7의 경우 총 indel의 대략 20%, EMX1_T6의 경우 총 indel의 대략 10%를 차지하였다. 따라서, 본 실시예 및 이전 실시예는 암호화된 편집이 여러 세포주의 유전자에 도입될 수 있음을 보여준다.
실시예 6 -
Cas12i2-RT 융합체를 사용한 표적 가닥의 RNA-주형 편집
본 실시예는 MMLV RT(서열번호 29), RNase H 도메인(서열번호 224)이 결여되어 있는 서열번호 29의 MMLV RT의 변이체 또는 마라톤 RT(서열번호 232)에 융합된 Cas12i2 변이체를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
표 14의 Cas12i2-RT 융합체 서열을 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. C-말단 RT 융합체는 Cas12i2의 N-말단에 있는 His 태그와 Cas12i2의 C-말단에 있는 이분형 뉴클레오플라스민 NLS(npNLS)로 구성되었다. npNLS 바로 뒤에는 GS-XTEN-GS 링커가 있었다. RT의 C-말단에는 이분형 SV40 NLS 태그가 있었다. N-말단 RT 융합체는 N-말단에 있는 이분형 SV40 NLS 태그와 RT의 C-말단에 있는 GS-XTEN-GS 링커에 이어서 Cas12i2로 구성되었다. Cas12i2의 C-말단에는 이분형 뉴클레오플라스민 NLS(bpNLS)가 있었다. Cas12i2-RT 플라스미드의 작업 용액을 물에서 제조하였다.
표적 및 상응하는 편집 주형 RNA 서열은 표 18에 나타나 있다. RT 주형은 40개의 뉴클레오타이드 길이였고, PBS는 13개의 뉴클레오타이드 길이였다. 암호화된 편집은 PAM 서열을 제거하기 위한 4개의 뉴클레오타이드 치환뿐만 아니라 단일 염기 치환이었다. 편집 주형 RNA를 추가적인 직접 반복 서열과 비표적화 스페이서 서열로 추가로 말단 보호시켰다. 편집 주형 RNA를 U6 프로모터가 있는 플라스미드 백본에 클로닝하고, 맥시 프렙하고, 각각의 편집 주형 RNA 플라스미드의 작업 용액을 물에서 제조하였다.
HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 형질감염시켰다. 각각의 Cas12i2-RT 융합체 플라스미드와 편집 주형 RNA 플라스미드를 Opti-MEM™ 배지(Thermo Fisher)에 희석한 다음, Opti-MEM™에 희석된 Lipofectamine™ 2000(Themo Fisher)과 혼합하였다. Lipofectamine™ 2000 용액을 웰에 적가하고, 형질감염된 세포를 72시간 동안 배양한 후 수거하였다.
2라운드의 PCR에 의해 차세대 시퀀싱을 위한 샘플을 준비하였다. 1라운드(PCR1)를 사용하여 표적에 따라 특정 게놈 영역을 증폭시켰다. PCR1 산물을 칼럼 정제에 의해 정제하였다. 2라운드 PCR(PCR2)을 수행하여 Illumina 어댑터 및 인덱스를 추가하였다. 그런 다음, 반응물을 풀링하고, 칼럼 정제에 의해 정제하였다. 시퀀싱 실행은 150 주기의 NextSeq v2.5 중간 또는 고출력 키트로 수행하였다.
도 20a, 도 20b 및 도 20c는 각각 AAVS1_T7, EMX1_T6 및 VEGFA_T5에 대한 표 19의 Cas12i2-RT 융합체에 의한 활성을 보여준다. Indel 편집(표적 서열 내 또는 이에 인접하여 삽입 또는 결실을 포함하는 총 NGS 리드의 백분율) 및 정밀 편집(편집 주형 RNA에 의해 암호화된 편집을 포함하는 총 NGS 리드의 백분율)이 y-축에 표시되어 있다. Indel 편집은 흰색 막대로 표시되고, 암호화된 편집은 회색 막대로 표시된다. 표시된 데이터는 2개의 생체 복제물의 평균이다. 도 20a, 도 20b 및 도 20c에 도시된 바와 같이, Cas12i2-RT 융합체는 편집 주형 RNA의 존재하에 활성 뉴클레이스였다. 또한, Cas12i2-RT 융합체 각각은 편집 주형 RNA에 의해 암호화된 편집을 표적 서열에 도입하였다. 서열번호 220의 Cas12i2-RT 융합체로 편집된 3개의 표적 각각에 대해, NGS 리드의 대략 15%가 편집 주형 RNA에 의해 암호화된 편집으로 구성되었다. 따라서, MMLV의 RNase H 도메인의 결실은 포유동물 게놈에 indel 및 정확한 편집을 도입하는 Cas12i2-RT 융합체의 능력에 유의미한 영향을 미치는 것으로 보이지 않는다. 또한, 마라톤 RT를 포함하는 Cas12i2-RT 융합체는 암호화된 편집을 표적 서열에 도입할 수 있었다(도 20a, 도 20b 및 도 20c).
따라서, 본 실시예는 암호화된 편집이 여러 RT 서열 및 Cas12i2-RT 융합체를 사용하여 포유동물 유전자의 표적 가닥에 혼입될 수 있음을 보여준다.
실시예 7 -
화학적으로 변형된 편집 주형 RNA를 사용한 RNA-주형 편집
본 실시예는 서열번호 219의 플라스미드-암호화된 Cas12i2-RT 융합체 및 말단 포스포로티오에이트 백본 연결 및/또는 2'O-메틸 뉴클레오타이드를 포함하는 편집 주형 RNA를 사용한 포유동물 유전자인 VEGFA의 표적 가닥 편집을 설명한다. 표적 서열은 TTAAACTCTCCATGGACCAG(서열번호 38)였다.
서열번호 4의 변이형 Cas12i2 및 서열번호 219의 Cas12i2-RT 융합체를 pcDNA3.1 백본(Invitrogen)에 개별적으로 클로닝하였다. RNA 가이드 및 편집 주형 RNA 서열을 IDT에 의해 합성하였다. HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 D10 중 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 TransIT-X2®(Mirus Bio)로 형질감염시켰다. 그런 다음, DNA + 형질감염 시약 용액을 세포의 웰에 적가하였다. 100ng의 Cas12i2 또는 Cas12i2-RT 플라스미드 DNA와 9몰의 합성된 RNA 가이드(IDT)의 혼합물을 Opti-MEM™ 배지(Thermo Fisher)에 희석한 다음, 제조업체의 지침에 따라 Opti-Opti-MEM™에 희석된 Lipofectamine™ 2000과 혼합하였다. 형질감염된 세포를 72시간 동안 배양한 후 수거하였다.
편집을 이전 실시예에 기술된 바와 같이 NGS로 분석하였다. 도 21에 도시된 바와 같이, VEGFA-T5 표적 부위에서 암호화된 편집을 각각의 편집 주형 RNA 및 서열번호 219의 Cas12i2-RT 융합체로 검출하였다. 대조군(gRNA 및 편집 주형 RNA + Cas12i2) 샘플에서 암호화된 편집은 검출되지 않았다. 변형되지 않은 편집 주형 RNA와 비교하여 변형된 편집 주형 RNA을 사용하여 더 높은 비율의 NGS 리드에서 암호화된 편집이 검출되었다. PS-2'-O-Me 변형을 사용하면 암호화된 편집을 포함하는 NGS 리드의 백분율이 가장 높아졌다.
따라서, 본 실시예는 관심 게놈 부위가 화학적으로 변형된 편집 주형 RNA 및 Cas12i2-RT 융합체에 의해 편집될 수 있음을 보여준다.
실시예 8 -
Cas12i4-RT 융합체를 사용한 RNA-주형 편집
본 실시예는 MMLV RT(서열번호 29)에 융합된 Cas12i4 변이체를 사용한 AAVS1의 표적 가닥 편집을 설명한다.
표 20의 Cas12i4-RT 융합체 서열을 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. C-말단 RT 융합체는 Cas12i4의 N-말단에 있는 His 태그와 Cas12i4의 C-말단에 있는 뉴클레오플라스민 NLS로 구성되었다. NLS의 바로 뒤에는 Flex XTEN 링커가 있었다. RT의 C-말단에는 이분형 SV40 NLS 태그가 있었다. N-말단 RT 융합체는 N-말단에 있는 이분형 SV40 NLS 태그와 RT의 C-말단에 있는 Flex XTEN 링커에 이어서 Cas12i4로 구성되었다. Cas12i4의 C-말단에는 뉴클레오플라스민 NLS가 있었다. Cas12i4-RT 플라스미드의 작업 용액을 물에서 제조하였다.
표적, RNA 가이드 및 편집 주형 RNA 서열은 표 21에 나타나 있다. RT 주형은 46개의 뉴클레오타이드 길이였고, PBS는 13개의 뉴클레오타이드 길이였다. 암호화된 편집은 PAM 서열을 제거하기 위한 4개의 뉴클레오타이드 치환뿐만 아니라 단일 염기 치환이었다. 편집 주형 RNA 및 RNA 가이드를 U6 프로모터가 있는 플라스미드 백본에 개별적으로 클로닝하고, 맥시 프렙하고, 각각의 RNA 가이드 또는 편집 주형 RNA 플라스미드의 작업 용액을 물에서 제조하였다.
HEK293T 세포를 실시예 6에 기술된 바와 같이 형질감염시키고 수거하였다. 이전 실시예에 기술된 바와 같이 NGS를 수행하였다. 도 22에 도시된 바와 같이, AAVS1_T7 표적 부위에서 암호화된 편집을 편집 주형 RNA, 및 Cas12i4-RT 융합체 중 하나로 검출하였다. 대조군(gRNA 및 편집 주형 RNA + Cas12i4) 샘플에서 암호화된 편집은 검출되지 않았다. 변이형 Cas12i4에 대한 MMLV의 N-말단 융합체와 비교하여 변이형 Cas12i4에 대한 MMLV의 C-말단 융합체를 사용하여 더 높은 비율의 NGS 리드에서 암호화된 편집이 검출되었다.
따라서, 본 실시예는 관심 게놈 부위가 편집 주형 RNA 및 Cas12i4-RT 융합체에 의해 편집될 수 있음을 보여준다.
실시예 9 -
Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA를 사용한 RNA-주형 편집
본 실시예는 Cas12i2-RT 융합체, RNA 가이드 및 RT 공여체 RNA를 사용한 포유동물 유전자의 표적 가닥 편집을 설명한다.
서열번호 219의 Cas12i2-RT 융합체를 pcDNA3.1 백본(Invitrogen)에 클로닝하였다. Cas12i2-RT 플라스미드의 작업 용액을 물에서 제조하였다. 표 22의 RNA 가이드 및 RT 공여체 RNA를 U6 프로모터가 있는 플라스미드 백본에 개별적으로 클로닝하고, 맥시 프렙하고, 각각의 RNA 가이드 또는 RT 공여체 RNA 플라스미드의 작업 용액을 물에서 제조하였다. RT 공여체 RNA는, 5'에서 3'의 순서로, 다음의 구성요소: 직접 반복 - 비표적화 스페이서 - RT 주형 - PBS - 직접 반복 - 비표적화 스페이서로 구성되었다. 직접 반복 및 RT 주형과 PBS에 측접하는 스페이서 서열은 말단 보호 역할을 하였다.
HEK293T 세포는 아메리칸 타입 컬처 컬렉션에서 공급받았으며, D10 배지: 10% FBS(Corning) 및 100 U/㎖ 페니실린-스트렙토마이신(HyClone™)이 보충된 DMEM(Thermo Fisher) + GlutaMAX™(Thermo Fisher) 및 피루베이트(Thermo Fisher)에서 90% 미만의 컨플루언시를 유지하였다. 형질도입 전에, HEK293T 세포를 조직 배양 처리된 96-웰 플레이트에 웰당 25,000개의 세포로 플레이팅하였다. 15시간 내지 18시간 후, 세포를 형질감염시켰다. 각각의 Cas12i2-RT 융합체 플라스미드, RNA 가이드 플라스미드 및 RT 공여체 RNA 플라스미드를 Opti-Opti-MEM™ 배지(Thermo Fisher)로 희석한 다음, Opti-Opti-MEM™에 희석된 Lipofectamine™ 2000(Themo Fisher)과 혼합하였다. Lipofectamine™ 2000 용액을 웰에 적가하고, 형질감염된 세포를 72시간 동안 배양하여 수거하였다.
이전 실시예에 기술된 바와 같이 NGS를 추가로 수행하였다. 도 23에 도시된 바와 같이, Cas12i2-RT 융합체, 각각의 RNA 가이드 및 각각의 RT 공여체 RNA를 사용한 형질감염 후 각각의 표적 부위에서 암호화된 편집이 검출되었다. 대조군(Cas12i2) 샘플에서 암호화된 편집은 검출되지 않았다. 따라서, 본 실시예는 선택된 게놈 부위가 Cas12i2-RT 융합체와 2개의 RNA 구성요소, RNA 가이드와 RT 공여체 RNA에 의해 편집될 수 있음을 보여준다. 암호화된 편집을 관심 게놈 부위에 혼입시키기 위해 RNA 가이드와 RT 공여체 RNA를 융합시킬 필요는 없다.
기타 실시형태
본 명세서에 개시된 모든 특징은 임의의 조합으로 결합될 수 있다. 본 명세서에 개시된 각 특징은 동일하거나, 동등하거나 또는 유사한 목적을 제공하는 대체 특징으로 대체될 수 있다. 따라서, 달리 명시적으로 언급되지 않는 한, 개시된 각 특징은 등가 또는 유사한 특징의 일반적인 시리즈의 예일 뿐이다.
상기 설명으로부터, 당업자는 본 발명의 본질적인 특징을 쉽게 확인할 수 있으며, 이의 사상과 범위를 벗어나지 않고 본 발명을 다양한 용도와 조건에 적합화시키기 위해 다양한 변경 및 수정을 가할 수 있다. 따라서, 다른 실시형태도 청구범위 내에 있다.
등가물
여러 가지 본 발명의 실시형태가 본 명세서에 기술되고 예시되었지만, 당업자라면 기능을 수행하고/하거나 본 명세서에 기재된 결과 및/또는 하나 이상의 이점을 얻기 위한 다양한 다른 수단 및/또는 구조를 쉽게 구상할 수 있을 것이며, 이러한 변형 및/또는 수정 각각은 본 명세서에 기재된 본 발명의 실시형태의 범위 내에 있는 것으로 간주된다.
보다 일반적으로, 당업자라면 본 명세서에 기술된 모든 매개변수, 치수, 물질 및 구성이 예시적임을 의미하며 실제 매개변수, 치수, 물질 및/또는 구성은 본 발명의 교시가 사용되는 특정 응용 분야 또는 응용 분야들에 따라 달라질 것이라는 점을 쉽게 이해할 수 있을 것이다. 당업자는 단지 일상적인 실험을 사용하여 본 명세서에 기술된 특정 발명의 실시형태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 따라서, 전술한 실시형태는 단지 예로서 제시된 것이며, 첨부된 청구범위 및 그 등가물의 범위 내에서, 본 발명의 실시형태는 구체적으로 설명되고 청구된 것과 다르게 실시될 수 있다는 것이 이해되어야 한다. 본 개시내용의 독창적인 실시형태는 본 명세서에 기술된 각각의 개별적인 특징, 시스템, 물품, 물질, 키트 및/또는 방법에 관한 것이다. 또한, 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법이 상호 모순되지 않는 경우, 두 개 이상의 이러한 특징, 시스템, 물품, 물질, 키트 및/또는 방법의 조합은 본 개시내용의 범위 내에 포함된다.
본 명세서에 정의되고 사용되는 모든 정의는 사전적 정의, 참조에 의해 원용되어 있는 문서의 정의 및/또는 정의된 용어의 일반적인 의미를 제어하는 것으로 이해되어야 한다.
본 명세서에 개시된 모든 참고문헌, 특허 및 특허 출원은 각각 인용된 특허 대상과 관련하여 참조에 의해 인용되며, 일부 경우에는 문서 전체를 포괄할 수 있다.
본 명세서 및 청구범위에 사용되는 "단수형"은 달리 명확하게 나타내지 않는 한 "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본 명세서 및 청구범위에 사용되는 어구 "및/또는"은 결합된 요소 중 "둘 중 하나 또는 둘 다", 즉, 일부 경우에는 결합적으로 존재하고 다른 경우에는 분리적으로 존재하는 요소를 의미하는 것으로 이해되어야 한다. "및/또는"으로 나열된 여러 요소는 동일한 방식, 즉, 이렇게 결합된 요소 중 "하나 이상"으로 해석되어야 한다. "및/또는" 절에 의해 구체적으로 식별되는 요소 외에 구체적으로 식별되는 요소와 관련이 있는지 여부에 관계없이, 다른 요소가 선택적으로 존재할 수 있다. 따라서, 비제한적인 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때 "A 및/또는 B"에 대한 언급은 일 실시형태에서는 A만(선택적으로 B 이외의 요소를 포함); 또 다른 실시형태에서는 B만(선택적으로 A 이외의 요소를 포함); 또 다른 실시형태에서는 A와 B 모두(선택적으로 다른 요소를 포함); 등을 지칭할 수 있다.
본 명세서 및 청구범위에 사용되는 바와 같이, "또는"은 위에서 정의된 바와 같이 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로 해석되어야 하며, 즉, 요소의 수 또는 목록 중 적어도 하나뿐만 아니라 하나 초과를 포함하고 선택적으로 추가적인 미등록 항목을 포함하는 것으로 해석되어야 한다. "~ 중 하나만" 또는 "~중 정확히 하나" 또는 청구범위에서 사용되는 경우 "~로 이루어진"과 같이 반대로 명확하게 표시된 용어만이 숫자 또는 요소의 목록 중 정확히 하나의 요소를 포함하는 것을 의미할 것이다. 일반적으로, 본 명세서에서 사용되는 용어 "또는"은 "둘 중 하나", "~ 중 하나", "~ 중 하나만" 또는 "~ 중 정확히 하나"와 같은 배타적인 용어가 앞에 올 경우 배타적인 대안(즉, "둘 중 하나 또는 둘 다 아닌")을 나타내는 것으로만 해석되어야 한다. 청구범위에서 사용되는 경우 "~로 본질적으로 이루어지는"은 특허법 분야에서 사용되는 바와 같은 일반적인 의미를 가질 것이다.
본 명세서 및 청구범위에 사용되는 바와 같이, 하나 이상의 요소의 목록과 관련하여 어구 "적어도 하나"는 요소의 목록의 요소 중 임의의 중 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하는 것으로 이해되어야 하지만, 요소의 목록 내에 구체적으로 나열된 각각의 모든 요소 중 적어도 하나를 반드시 포함할 필요는 없으며 요소의 목록에 있는 요소의 임의의 조합을 제외하지 않는다. 이 정의는 또한 구체적으로 식별된 요소와 관련이 있는지 여부에 관계없이 "적어도 하나"라는 어구가 참조하는 요소의 목록 내에서 특별히 식별된 요소 이외의 요소가 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, "A와 B 중 적어도 하나"(또는 동등하게는 "A 또는 B 중 적어도 하나" 또는 동등하게는 "A 및/또는 B 중 적어도 하나")는 일 실시형태에서는 B가 존재하지 않는 선택적으로 하나 초과를 포함하는 적어도 하나의 A(그리고 선택적으로 B 이외의 요소를 포함함); 또 다른 실시형태에서는 A가 존재하지 않는 선택적으로 하나 초과를 포함하는 적어도 하나의 B(그리고 선택적으로 A 이외의 요소를 포함함); 또 다른 실시형태에서는 선택적으로 하나 초과를 포함하는 적어도 하나의 A 및 선택적으로 하나 초과를 포함하는 적어도 하나의 B(그리고 선택적으로 다른 요소를 포함함); 등을 지칭할 수 있다.
또한, 명확하게 반대로 나타내지 않는 한, 하나 초과의 단계 또는 행위를 포함하는 본 명세서에 청구된 임의의 방법에서, 방법의 단계 또는 행위의 순서가 반드시 방법의 단계 또는 행위가 언급되는 순서로 제한되는 것은 아니라는 점을 이해하여야 한다.
SEQUENCE LISTING
<110> Arbor Biotechnologies, Inc.
<120> GENE EDITING SYSTEMS COMPRISING A CRISPR NUCLEASE AND USES THEREOF
<130> 116928-0042-0001WO00
<140> PCT/US2022/031821
<141> 2022-06-01
<150> US 63/299,695
<151> 2022-01-14
<150> US 63/272,937
<151> 2021-10-28
<150> US 63/236,047
<151> 2021-08-23
<150> US 63/195,621
<151> 2021-06-01
<160> 259
<170> PatentIn version 3.5
<210> 1
<211> 3162
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60
ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120
caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180
cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240
agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300
ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360
tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420
gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480
agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540
agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600
ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660
accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720
gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780
attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840
gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900
accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960
ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020
gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080
aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140
attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200
ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260
aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320
aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380
cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440
cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500
gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560
ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620
accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680
atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740
gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800
aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860
aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920
aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980
gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040
aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100
ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160
aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220
tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280
aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340
agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400
ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460
acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520
aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580
aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640
tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700
tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760
ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820
agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880
agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940
gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000
accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060
gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120
gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162
<210> 2
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 3
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 4
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 5
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 6
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 6
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 7
<211> 1054
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 7
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 8
<211> 1093
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys
1010 1015 1020
Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu
1025 1030 1035
Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys
1040 1045 1050
Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe
1055 1060 1065
Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu
1070 1075 1080
Val Asp Ile Gln Lys Asp Phe Lys Lys Lys
1085 1090
<210> 9
<211> 1074
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 10
<211> 1074
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 11
<211> 1098
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu
1 5 10 15
Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu
20 25 30
Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly
35 40 45
Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro
50 55 60
His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val
65 70 75 80
Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser
85 90 95
Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser
100 105 110
His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg
115 120 125
Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln
130 135 140
Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu
145 150 155 160
Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu
165 170 175
Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu
180 185 190
Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe
195 200 205
Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala
210 215 220
Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly
225 230 235 240
Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp
245 250 255
Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln
260 265 270
Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp
275 280 285
Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr
290 295 300
Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser
305 310 315 320
Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln
325 330 335
Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys
340 345 350
Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn
355 360 365
Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu
370 375 380
Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn
385 390 395 400
Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly
405 410 415
Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr
420 425 430
Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn
435 440 445
Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His
450 455 460
Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys
465 470 475 480
Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile
485 490 495
Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro
500 505 510
Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met
515 520 525
His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala
530 535 540
Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys
545 550 555 560
Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln
565 570 575
Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu
580 585 590
Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr
595 600 605
Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu
610 615 620
Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile
625 630 635 640
Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu
645 650 655
Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln
660 665 670
Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val
675 680 685
Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser
690 695 700
Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His
705 710 715 720
Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe
725 730 735
Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln
740 745 750
Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg
755 760 765
Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln
770 775 780
Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met
785 790 795 800
Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe
805 810 815
Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu
820 825 830
Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu
835 840 845
Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala
850 855 860
Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile
865 870 875 880
Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys
885 890 895
Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys
900 905 910
Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro
915 920 925
Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser
930 935 940
Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp
945 950 955 960
Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys
965 970 975
Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met
980 985 990
Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val
995 1000 1005
Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile
1010 1015 1020
Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu
1025 1030 1035
Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp
1040 1045 1050
Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe
1055 1060 1065
Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu
1070 1075 1080
Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met
1085 1090 1095
<210> 12
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 13
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
aauuuuugug cccaucguug gcac 24
<210> 14
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
auuuuugugc ccaucguugg cac 23
<210> 15
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
guugcaaaac ccaagaaauc cgucuuucau ugacgg 36
<210> 16
<211> 34
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
gcaacaccua agaaauccgu cuuucauuga cggg 34
<210> 17
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
agaaauccgu cuuucauuga cgg 23
<210> 18
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
cuagcaauga ccuaauagug uguccuuagu ugacau 36
<210> 19
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
ccuacaauac cuaagaaauc cguccuaagu ugacgg 36
<210> 20
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
auaguguguc cuuaguugac au 22
<210> 21
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 22
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 22
cccacaauac cugagaaauc cguccuacgu ugacgg 36
<210> 23
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
ucucaacgau agucagacau guguccucag ugacac 36
<210> 24
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
agacaugugu ccucagugac ac 22
<210> 25
<211> 1798
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 25
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1055 1060 1065
Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
1070 1075 1080
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser
1085 1090 1095
Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His
1100 1105 1110
Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu
1115 1120 1125
Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu
1130 1135 1140
Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser
1145 1150 1155
Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg
1160 1165 1170
Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile
1175 1180 1185
Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val
1190 1195 1200
Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg
1205 1210 1215
Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn
1220 1225 1230
Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr
1235 1240 1245
Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His
1250 1255 1260
Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
1265 1270 1275
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
1280 1285 1290
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp
1295 1300 1305
Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
1310 1315 1320
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys
1325 1330 1335
Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly
1340 1345 1350
Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val
1355 1360 1365
Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr
1370 1375 1380
Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr
1385 1390 1395
Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg
1400 1405 1410
Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro
1415 1420 1425
Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln
1430 1435 1440
Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala
1445 1450 1455
Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp
1460 1465 1470
Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly
1475 1480 1485
Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro
1490 1495 1500
Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
1505 1510 1515
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
1520 1525 1530
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln
1535 1540 1545
Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
1550 1555 1560
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val
1565 1570 1575
Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu
1580 1585 1590
Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg
1595 1600 1605
Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp
1610 1615 1620
Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala
1625 1630 1635
Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala
1640 1645 1650
Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu
1655 1660 1665
Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr
1670 1675 1680
Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu
1685 1690 1695
Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile
1700 1705 1710
Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu
1715 1720 1725
Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly
1730 1735 1740
His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
1745 1750 1755
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
1760 1765 1770
Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu
1775 1780 1785
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1790 1795
<210> 26
<211> 1798
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr
20 25 30
Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe
35 40 45
Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln
50 55 60
Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile
65 70 75 80
Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His
85 90 95
Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro
100 105 110
Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr
115 120 125
Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile
130 135 140
His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro
145 150 155 160
Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
165 170 175
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg
180 185 190
Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro
195 200 205
Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
210 215 220
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
225 230 235 240
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
245 250 255
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg
260 265 270
Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu
275 280 285
Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys
290 295 300
Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg
305 310 315 320
Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe
325 330 335
Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu
340 345 350
Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln
355 360 365
Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro
370 375 380
Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu
385 390 395 400
Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
405 410 415
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val
420 425 430
Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly
435 440 445
Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
450 455 460
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
465 470 475 480
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
485 490 495
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His
500 505 510
Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu
515 520 525
Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly
530 535 540
Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr
545 550 555 560
Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser
565 570 575
Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala
580 585 590
Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala
595 600 605
Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr
610 615 620
Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu
625 630 635 640
Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
645 650 655
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp
660 665 670
Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr
675 680 685
Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser
690 695 700
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
705 710 715 720
Ser Gly Gly Ser Ser Gly Gly Ser Met Ser Ser Ala Ile Lys Ser Tyr
725 730 735
Lys Ser Val Leu Arg Pro Asn Glu Arg Lys Asn Gln Leu Leu Lys Ser
740 745 750
Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala Phe Phe Phe Lys Met Leu
755 760 765
Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu Ile Val Arg Phe Ser Thr
770 775 780
Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala Leu Trp Cys Ala Val Asn
785 790 795 800
Trp Phe Arg Pro Val Ser Gln Asp Ser Leu Thr His Thr Ile Ala Ser
805 810 815
Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr Tyr Gly Gly Thr Ala Ser
820 825 830
Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser Ile Gly Glu Ser Tyr Tyr
835 840 845
Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp Leu Cys Arg Glu Leu Gly
850 855 860
Val Glu Val Ser Asp Leu Thr His Asp Leu Glu Ile Leu Cys Arg Glu
865 870 875 880
Lys Cys Leu Ala Val Ala Thr Glu Ser Asn Gln Asn Asn Ser Ile Ile
885 890 895
Ser Val Leu Phe Gly Thr Gly Glu Lys Glu Asp Arg Ser Val Lys Leu
900 905 910
Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile Ser Asn Leu Lys Glu Ile
915 920 925
Pro Lys Asn Val Ala Pro Ile Gln Glu Ile Ile Leu Asn Val Ala Lys
930 935 940
Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr Ala Gly Asn Leu Gly Ala
945 950 955 960
Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys Asp Gly Gln Lys Glu Phe
965 970 975
Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys Lys Val Ile Arg Gly Lys
980 985 990
Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu Glu Leu Arg Ser Tyr Val
995 1000 1005
Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp Ala Trp Gly Glu Met
1010 1015 1020
Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys Ser Thr Arg Asn
1025 1030 1035
Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys Glu Ile Gln
1040 1045 1050
Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp Phe Phe
1055 1060 1065
Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys Val
1070 1075 1080
His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
1085 1090 1095
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys
1100 1105 1110
Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
1115 1120 1125
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp
1130 1135 1140
Ile Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys
1145 1150 1155
Ser Gln Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr
1160 1165 1170
Trp Thr Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp
1175 1180 1185
Arg Pro Asn Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu
1190 1195 1200
Arg His Pro Asp Gly Arg Trp Lys Lys Ala His Ile Pro Phe Tyr
1205 1210 1215
Asp Thr Arg Phe Phe Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro
1220 1225 1230
Val Asp Thr Cys Gln Phe Arg Thr Pro Arg Phe Gly Tyr His Leu
1235 1240 1245
Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg Val Asn Lys Lys His
1250 1255 1260
Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg Leu Ala Ile Gln
1265 1270 1275
Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr Glu Ile Ser
1280 1285 1290
Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val Lys Phe
1295 1300 1305
Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg Phe
1310 1315 1320
Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
1325 1330 1335
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys
1340 1345 1350
Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
1355 1360 1365
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala
1370 1375 1380
Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val
1385 1390 1395
Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val
1400 1405 1410
Thr Val Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln
1415 1420 1425
Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg
1430 1435 1440
Asp Ile Val Arg Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg
1445 1450 1455
Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp Cys Gly Val Thr Arg
1460 1465 1470
Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu Thr Val Lys Ala Val
1475 1480 1485
Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr Ala Leu Asn Ala Ser
1490 1495 1500
Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp Pro
1505 1510 1515
Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile Arg Thr Arg
1520 1525 1530
Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu Ile Gln
1535 1540 1545
Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly Asp
1550 1555 1560
Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
1565 1570 1575
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln
1580 1585 1590
Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
1595 1600 1605
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys
1610 1615 1620
Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly
1625 1630 1635
Asp Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn
1640 1645 1650
Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu
1655 1660 1665
Ser His Tyr Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp
1670 1675 1680
Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn
1685 1690 1695
Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu Ala Val Val Tyr Ile
1700 1705 1710
Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala Thr His Lys Val Ala
1715 1720 1725
Thr Gly Ala Val Ser Ile Val Phe Asp Gln Lys Gln Val Trp Val
1730 1735 1740
Cys Asn Ala Asp His Val Ala Ala Ala Asn Ile Ala Leu Thr Gly
1745 1750 1755
Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu Glu Asn Pro Asp Gly
1760 1765 1770
Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys Arg Pro Ala Ala Thr
1775 1780 1785
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1790 1795
<210> 27
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 28
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (40)..(43)
<223> modified with phosphorothioate
<400> 28
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 29
<211> 678
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
gtagcctctc ccgctctggt 20
<210> 31
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (40)..(42)
<223> modified with 2'-O-methylation
<400> 31
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
gggaagtggt tggtcagcat 20
<210> 33
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (40)..(42)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (40)..(43)
<223> modified with phosphorothioate
<400> 33
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
gagccagtgt tgctagtcaa 20
<210> 35
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
aatcctccac cagtcatggt 20
<210> 37
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (87)..(90)
<223> modified with phosphorothioate
<400> 37
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
ttaaactctc catggaccag 20
<210> 39
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (87)..(89)
<223> modified with 2'-O-methylation
<400> 39
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 40
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugauuua ggcucccucu 120
gucuggauca guccucc 137
<210> 41
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugau 107
<210> 42
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugcacccc cauaaggggg 60
gacauucuuu guagccucuc cccgaguggu ucagggccca gcuaggg 107
<210> 43
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg 90
<210> 44
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cucccagcgg cucugguuca gggcccagcu aggg 94
<210> 45
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cucccugguu cagggcccag cuaggg 86
<210> 46
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (87)..(89)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (87)..(90)
<223> modified with phosphorothioate
<400> 46
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 47
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 48
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (104)..(107)
<223> modified with phosphorothioate
<400> 48
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 49
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (104)..(106)
<223> modified with 2'-O-methylation
<400> 49
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 50
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(4)
<223> modified with phosphorothioate
<220>
<221> misc_feature
<222> (1)..(3)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (104)..(106)
<223> modified with 2'-O-methylation
<220>
<221> misc_feature
<222> (104)..(107)
<223> modified with phosphorothioate
<400> 50
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 51
<211> 1074
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 52
<211> 1832
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ala
1 5 10 15
Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys
20 25 30
Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg
35 40 45
Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu
50 55 60
Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val Cys Ala
65 70 75 80
Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys Asp Gly
85 90 95
Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys
100 105 110
Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp
115 120 125
Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg
130 135 140
Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met Leu Phe
145 150 155 160
Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala
165 170 175
Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys
180 185 190
Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn Glu Asn
195 200 205
Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala
210 215 220
Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly
225 230 235 240
Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met Val Ser
245 250 255
Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val Leu Lys
260 265 270
Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln
275 280 285
Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val Tyr Ser
290 295 300
Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg
305 310 315 320
Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys
325 330 335
Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn
340 345 350
Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile
355 360 365
Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu
370 375 380
Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile Gln
385 390 395 400
Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro Ile Arg
405 410 415
Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser Ala Glu
420 425 430
Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys Ile Ser
435 440 445
Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp Ala Phe
450 455 460
Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys Arg His
465 470 475 480
Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg Ala Glu
485 490 495
Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe Tyr Asn
500 505 510
Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val Ala Glu
515 520 525
Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp
530 535 540
Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys
545 550 555 560
Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr
565 570 575
Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu
580 585 590
Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg
595 600 605
Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn
610 615 620
Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro Gly
625 630 635 640
Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr Ile Lys
645 650 655
Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser Thr Thr
660 665 670
Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg Phe Lys
675 680 685
Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile Arg Gln
690 695 700
Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile Pro Glu
705 710 715 720
Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val Phe Asn
725 730 735
Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala Lys Lys
740 745 750
Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser Lys Asp
755 760 765
Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp Ala Ser
770 775 780
Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn
785 790 795 800
Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val
805 810 815
Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg
820 825 830
Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu
835 840 845
Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val
850 855 860
Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp Cys
865 870 875 880
Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe His Gly
885 890 895
Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln Asp Pro
900 905 910
Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala Arg Phe
915 920 925
Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg Asn Phe
930 935 940
Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr Lys Gln
945 950 955 960
Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His Ala Glu
965 970 975
Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys Ile Leu
980 985 990
Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly Gly Arg
995 1000 1005
Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro Ile
1010 1015 1020
Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu Val
1025 1030 1035
Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser Lys
1040 1045 1050
Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys Ala
1055 1060 1065
Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr Ser
1070 1075 1080
Gln Leu Pro Gln Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1085 1090 1095
Gln Ala Lys Lys Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1115 1120 1125
Ser Gly Gly Ser Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu
1130 1135 1140
Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly
1145 1150 1155
Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly
1160 1165 1170
Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu
1175 1180 1185
Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser
1190 1195 1200
Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu
1205 1210 1215
Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro
1220 1225 1230
Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
1235 1240 1245
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
1250 1255 1260
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser
1265 1270 1275
His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
1280 1285 1290
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp
1295 1300 1305
Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg
1310 1315 1320
Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala
1325 1330 1335
Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu
1340 1345 1350
Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser
1355 1360 1365
Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu
1370 1375 1380
Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys
1385 1390 1395
Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln
1400 1405 1410
Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro
1415 1420 1425
Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala
1430 1435 1440
Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala
1445 1450 1455
Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly
1460 1465 1470
Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
1475 1480 1485
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
1490 1495 1500
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr
1505 1510 1515
Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
1520 1525 1530
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met
1535 1540 1545
Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr
1550 1555 1560
Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala
1565 1570 1575
Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met
1580 1585 1590
Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe
1595 1600 1605
Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro
1610 1615 1620
Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala
1625 1630 1635
His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala
1640 1645 1650
Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly
1655 1660 1665
Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile
1670 1675 1680
Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu
1685 1690 1695
Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys
1700 1705 1710
Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
1715 1720 1725
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
1730 1735 1740
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys
1745 1750 1755
Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
1760 1765 1770
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala
1775 1780 1785
Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr
1790 1795 1800
Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala
1805 1810 1815
Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1820 1825 1830
<210> 53
<211> 1818
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr
20 25 30
Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe
35 40 45
Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln
50 55 60
Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile
65 70 75 80
Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His
85 90 95
Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro
100 105 110
Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr
115 120 125
Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile
130 135 140
His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro
145 150 155 160
Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
165 170 175
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg
180 185 190
Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro
195 200 205
Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
210 215 220
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
225 230 235 240
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
245 250 255
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg
260 265 270
Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu
275 280 285
Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys
290 295 300
Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg
305 310 315 320
Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe
325 330 335
Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu
340 345 350
Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln
355 360 365
Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro
370 375 380
Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu
385 390 395 400
Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
405 410 415
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val
420 425 430
Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly
435 440 445
Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
450 455 460
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
465 470 475 480
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
485 490 495
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His
500 505 510
Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu
515 520 525
Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly
530 535 540
Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr
545 550 555 560
Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser
565 570 575
Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala
580 585 590
Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala
595 600 605
Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr
610 615 620
Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu
625 630 635 640
Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
645 650 655
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp
660 665 670
Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr
675 680 685
Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser
690 695 700
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
705 710 715 720
Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Ser Ile Ser Arg Pro Tyr
725 730 735
Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys Lys Glu Met Leu Asp Lys
740 745 750
Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg Val Phe Ala Asp Leu Ala
755 760 765
Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu Met Ala Lys Ser Leu Glu
770 775 780
Pro Glu Ser Asp Ser Glu Leu Val Cys Ala Ile Gly Trp Phe Arg Leu
785 790 795 800
Val Asp Lys Thr Ile Trp Ser Lys Asp Gly Ile Lys Gln Glu Asn Leu
805 810 815
Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys Glu Ala Ser Glu Val Val
820 825 830
Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp Lys Tyr Val Trp Ile Asp
835 840 845
Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg Glu Leu Gly Thr Arg Asn
850 855 860
Leu Ser Glu Asp Phe Glu Cys Met Leu Phe Glu Gln Tyr Ile Arg Leu
865 870 875 880
Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala Ile Ser Asn Met Phe Gly
885 890 895
Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys Arg Met Tyr Ala Thr Arg
900 905 910
Met Lys Asp Trp Leu Glu Ala Asn Glu Asn Ile Thr Trp Glu Gln Tyr
915 920 925
Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala Lys Asn Leu Glu Gln Val
930 935 940
Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly Ala Asp Pro Phe Phe Lys
945 950 955 960
Tyr Ser Phe Ser Lys Glu Gly Met Val Ser Lys Lys Glu His Ala Gln
965 970 975
Gln Leu Asp Lys Phe Lys Thr Val Leu Lys Asn Lys Ala Arg Asp Leu
980 985 990
Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln Tyr Leu Glu Ala Glu Ile
995 1000 1005
Gly Ile Pro Val Asp Ala Asn Val Tyr Ser Gln Met Phe Ser Asn
1010 1015 1020
Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg Asn Met Ser Phe
1025 1030 1035
Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys Asp Leu Asn
1040 1045 1050
Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn Gly Phe
1055 1060 1065
Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile Thr
1070 1075 1080
Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu
1085 1090 1095
Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile
1100 1105 1110
Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
1115 1120 1125
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val
1130 1135 1140
Ser Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu
1145 1150 1155
Glu Lys Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn
1160 1165 1170
Arg Tyr Trp Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met
1175 1180 1185
Pro Ala Asp Lys Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe
1190 1195 1200
Lys Met Trp Leu Arg Ala Glu Leu His Tyr Asp Gly Lys Lys Ala
1205 1210 1215
Lys Ala His Leu Pro Phe Tyr Asn Ala Arg Phe Phe Glu Glu Val
1220 1225 1230
Tyr Cys Tyr His Pro Ser Val Ala Glu Ile Thr Pro Phe Lys Thr
1235 1240 1245
Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp Ile Pro Asp Tyr Val
1250 1255 1260
Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys Ala Thr Lys Arg
1265 1270 1275
Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr Thr Arg Val
1280 1285 1290
Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu Asn Asp
1295 1300 1305
Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg Pro
1310 1315 1320
Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn
1325 1330 1335
Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro
1340 1345 1350
Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
1355 1360 1365
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn
1370 1375 1380
Ser Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser
1385 1390 1395
Glu Arg Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg
1400 1405 1410
Lys Leu Ile Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly
1415 1420 1425
Gln Asp Tyr Ile Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly
1430 1435 1440
Glu Thr Leu Tyr Val Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val
1445 1450 1455
Ser Lys His Arg Lys Ala Lys Lys Pro Val Glu Gly Ile Leu Asp
1460 1465 1470
Glu Ile Glu Ala Trp Thr Ser Lys Asp Lys Asp Ser Cys Ser Leu
1475 1480 1485
Met Arg Leu Ser Ser Leu Ser Asp Ala Ser Met Gln Gly Ile Ala
1490 1495 1500
Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn Lys Asn Gly Cys
1505 1510 1515
Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val Leu Tyr Ala
1520 1525 1530
Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg Ser Glu
1535 1540 1545
Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu Leu
1550 1555 1560
Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val
1565 1570 1575
Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp
1580 1585 1590
Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
1595 1600 1605
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His
1610 1615 1620
Gln Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met
1625 1630 1635
Arg Ala Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp
1640 1645 1650
His Val Arg Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr
1655 1660 1665
Gly Leu Tyr Tyr Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr
1670 1675 1680
Gly Leu Glu Glu His Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys
1685 1690 1695
Phe Tyr Asp Phe Arg Lys Ile Leu Glu Asp Lys Asn Leu Thr Ser
1700 1705 1710
Val Ile Ile Pro Lys Arg Gly Gly Arg Ile Tyr Met Ala Thr Asn
1715 1720 1725
Pro Val Thr Ser Asp Ser Thr Pro Ile Thr Tyr Ala Gly Lys Thr
1730 1735 1740
Tyr Asn Arg Cys Asn Ala Asp Glu Val Ala Ala Ala Asn Ile Val
1745 1750 1755
Ile Ser Val Leu Ala Pro Arg Ser Lys Lys Asn Arg Glu Gln Asp
1760 1765 1770
Asp Ile Pro Leu Ile Thr Lys Lys Ala Glu Ser Lys Ser Pro Pro
1775 1780 1785
Lys Asp Arg Lys Arg Ser Lys Thr Ser Gln Leu Pro Gln Lys Lys
1790 1795 1800
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1805 1810 1815
<210> 54
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 55
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 56
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60
cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107
<210> 57
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 58
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugagcgg ucagcaugga uuauagccga aggc 94
<210> 59
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggcaug gauuauagcc gaaggc 86
<210> 60
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
agacaugugu ccucagugac acgggaagug guuggucagc au 42
<210> 61
<211> 95
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
agacaugugu ccucagugac acgggaagug guuggucagc auugauucca gcuacucugg 60
gaagugguug cagugcaugg auuauagccg aaggc 95
<210> 62
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 63
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 64
<211> 149
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 65
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
gattccagct actttgggaa gtggttggtc agcatggatt atagccgaag gccccag 57
<210> 66
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
ctaaggtcga tgaaaccctt caccaaccag tcgtacctaa tatcggcttc cggggtc 57
<210> 67
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggucag cauggauuau agccgaaggc 90
<210> 68
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 69
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 70
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
agaaauccgu cuuucauuga cgggagccag uguugcuagu caagcacccc cauaaggggg 60
uuccuucuuu gagccagugu ugcgagucaa gggcagcaug cugggcc 107
<210> 71
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc 90
<210> 72
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugagcgc uagucaaggg cagcaugcug ggcc 94
<210> 73
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugucaag ggcagcaugc ugggcc 86
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
gggaagtggt tggtcagcat 20
<210> 75
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggucag cauggauuau agccgaaggc 90
<210> 76
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 77
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugagcgg ucagcaugga uuauagccga aggc 94
<210> 78
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggcaug gauuauagcc gaaggc 86
<210> 79
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60
cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107
<210> 80
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 81
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugcccc caggaugcgu 120
ggagggaggg gucugug 137
<210> 82
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugc 107
<210> 83
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
agaaauccgu cuuucauuga cggaauccuc caccagucau ggugcacccc cauaaggggg 60
agauaccuuu aauccuccac cacgaguggu gacaacccca agcagcc 107
<210> 84
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc 90
<210> 85
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccaagcgg ucauggugac aaccccaagc agcc 94
<210> 86
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccauggug acaaccccaa gcagcc 86
<210> 87
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 88
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
ugggaagugg uuggucagca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 89
<211> 29
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
ggcuauaauc caugcaagug accaaccac 29
<210> 90
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
gggaagtggt tgcagtgcat 20
<210> 91
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
gagccagtgt tggatctcaa 20
<210> 92
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
ttaaactctc caacctccag 20
<210> 93
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
uaauuucuac uguuguagau 20
<210> 94
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
agaaaugcau gguucucaug c 21
<210> 95
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 96
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 97
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 97
agaaauccgu cuuucauuga cgguuaaacu cuccauggac caggcacccc cauaaggggg 60
aaaagacuuu uuaaacucuc cacgagccag gcucauccag cuuccca 107
<210> 98
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccacgagc caggcucauc cagcuuccca 90
<210> 99
<211> 94
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccaagcgu ggaccaggcu cauccagcuu ccca 94
<210> 100
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccaccagg cucauccagc uuccca 86
<210> 101
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
aaaauuaccu aguaauuagg u 21
<210> 102
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
ggauuucuac uuuuguagau 20
<210> 103
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 103
aaauuucuac uuuuguagau 20
<210> 104
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 104
cgcgcccacg cggggcgcga c 21
<210> 105
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 105
uaauuucuac ucuuguagau 20
<210> 106
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 106
gaauuucuac uauuguagau 20
<210> 107
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 107
gaaucucuac ucuuuguaga u 21
<210> 108
<211> 19
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 108
uaauuucuac uuuguagau 19
<210> 109
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 109
aaauuucuac uguuuguaga u 21
<210> 110
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 110
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggu 43
<210> 111
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 111
gaauuucuac uuuuguagau 20
<210> 112
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 112
agaaauccgu cuuucauuga cgggggaagu gguuggucag cau 43
<210> 113
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 113
uaauuucuac uaaguguaga u 21
<210> 114
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 114
agaaauccgu cuuucauuga cgggagccag uguugcuagu caa 43
<210> 115
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 115
uaauuucuac uauuguagau 20
<210> 116
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 116
agaaauccgu cuuucauuga cggaauccuc caccagucau ggu 43
<210> 117
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 117
uaauuucuac uucgguagau 20
<210> 118
<211> 43
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 118
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 119
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 119
uaauuucuac uauuguagau 20
<210> 120
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 120
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 121
<211> 1368
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 121
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 122
<211> 1053
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 122
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 123
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 123
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 124
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 124
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 125
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 125
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 126
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 126
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 127
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 127
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 128
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 128
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 129
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 129
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcaga aauccgucuu 60
ucauugacgg gggaaguggu uggucagcau 90
<210> 130
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 130
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60
uguuagaaau ccgucuuuca uugacggggg aagugguugg ucagcau 107
<210> 131
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 131
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60
uguucuagca guuccacucc ugggcagccc gagaagaaau ccgucuuuca uugacggggg 120
aagugguugg ucagcau 137
<210> 132
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 132
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggggaagu 120
gguuggucag cau 133
<210> 133
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 133
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gggaaguggu uggucagcau 150
<210> 134
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 134
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgagaaga aauccgucuu ucauugacgg gggaaguggu uggucagcau 180
<210> 135
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 135
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcagaa auccgucuuu cauugacggg 120
ggaagugguu ggucagcau 139
<210> 136
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 136
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guuagaaauc 120
cgucuuucau ugacggggga agugguuggu cagcau 156
<210> 137
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 137
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guucuagcag 120
uuccacuccu gggcagcccg agaagaaauc cgucuuucau ugacggggga agugguuggu 180
cagcau 186
<210> 138
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 138
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 139
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 139
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 140
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 140
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 141
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 141
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 142
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 142
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 143
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 143
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 144
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 144
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggccaga aauccgucuu 60
ucauugacgg gagccagugu ugcuagucaa 90
<210> 145
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 145
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60
gccaagaaau ccgucuuuca uugacgggag ccaguguugc uagucaa 107
<210> 146
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 146
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60
gccaauguga ccgucagucu ccuuccugaa ggacagaaau ccgucuuuca uugacgggag 120
ccaguguugc uagucaa 137
<210> 147
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 147
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggagccag 120
uguugcuagu caa 133
<210> 148
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 148
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gagccagugu ugcuagucaa 150
<210> 149
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 149
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gagccagugu ugcuagucaa 180
<210> 150
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 150
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggccagaa auccgucuuu cauugacggg 120
agccaguguu gcuagucaa 139
<210> 151
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 151
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaagaaauc 120
cgucuuucau ugacgggagc caguguugcu agucaa 156
<210> 152
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 152
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaaugugac 120
cgucagucuc cuuccugaag gacagaaauc cgucuuucau ugacgggagc caguguugcu 180
agucaa 186
<210> 153
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 153
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc 90
<210> 154
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 154
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugc 107
<210> 155
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 155
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugug 137
<210> 156
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 156
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 157
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 157
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 158
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 158
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugugaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 159
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 159
agauaccuau aauccuccac cacaguuggu gacaacccca agcagccaga aauccgucuu 60
ucauugacgg aauccuccac cagucauggu 90
<210> 160
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 160
agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60
gugcagaaau ccgucuuuca uugacggaau ccuccaccag ucauggu 107
<210> 161
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 161
agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60
gugcccccag gaugcgugga gggagggguc ugugagaaau ccgucuuuca uugacggaau 120
ccuccaccag ucauggu 137
<210> 162
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 162
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cggaauccuc 120
caccagucau ggu 133
<210> 163
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 163
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg aauccuccac cagucauggu 150
<210> 164
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 164
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugugaga aauccgucuu ucauugacgg aauccuccac cagucauggu 180
<210> 165
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 165
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagccagaa auccgucuuu cauugacgga 120
auccuccacc agucauggu 139
<210> 166
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 166
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcagaaauc 120
cgucuuucau ugacggaauc cuccaccagu cauggu 156
<210> 167
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 167
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcccccagg 120
augcguggag ggaggggucu gugagaaauc cgucuuucau ugacggaauc cuccaccagu 180
cauggu 186
<210> 168
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 168
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 169
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 169
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 170
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 170
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 171
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 171
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 172
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 172
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 173
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 173
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 174
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 174
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaga aauccgucuu 60
ucauugacgg uuaaacucuc cauggaccag 90
<210> 175
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 175
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60
agaaagaaau ccgucuuuca uugacgguua aacucuccau ggaccag 107
<210> 176
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 176
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60
agaagggggg gcacucagga cucucuccaa gagaagaaau ccgucuuuca uugacgguua 120
aacucuccau ggaccag 137
<210> 177
<211> 133
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 177
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgguuaaacu 120
cuccauggac cag 133
<210> 178
<211> 150
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 178
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120
ucauugacgg uuaaacucuc cauggaccag 150
<210> 179
<211> 180
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 179
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagagaaga aauccgucuu ucauugacgg uuaaacucuc cauggaccag 180
<210> 180
<211> 139
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 180
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaagaa auccgucuuu cauugacggu 120
uaaacucucc auggaccag 139
<210> 181
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 181
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaagaaauc 120
cgucuuucau ugacgguuaa acucuccaug gaccag 156
<210> 182
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 182
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaggggggg 120
cacucaggac ucucuccaag agaagaaauc cgucuuucau ugacgguuaa acucuccaug 180
gaccag 186
<210> 183
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 183
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau 80
<210> 184
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 184
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccg 85
<210> 185
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 185
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 186
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 186
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 187
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 187
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 188
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 188
agaaauccgu cuuucauuga cgggggaagu gguuggucag cauugcagug cauggauuau 60
agccgaaggc 70
<210> 189
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 189
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugggaagu gguugcagug 60
cauggauuau agccgaaggc 80
<210> 190
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 190
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 191
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 191
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugugauga uuccagcuac 60
uuugggaagu gguugcagug cauggauuau agccgaaggc 100
<210> 192
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 192
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugguggga aaggugauga 60
uuccagcuac uuugggaagu gguugcagug cauggauuau agccgaaggc 110
<210> 193
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 193
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc 80
<210> 194
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 194
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcu 85
<210> 195
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 195
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 196
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 196
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 197
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 197
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 198
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 198
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauggaucu caagggcagc 60
augcugggcc 70
<210> 199
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 199
agaaauccgu cuuucauuga cgggagccag uguugcuagu caagagccag uguuggaucu 60
caagggcagc augcugggcc 80
<210> 200
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 200
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 201
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 201
agaaauccgu cuuucauuga cgggagccag uguugcuagu caaauccaaa gcuuuccuuc 60
uuugagccag uguuggaucu caagggcagc augcugggcc 100
<210> 202
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 202
agaaauccgu cuuucauuga cgggagccag uguugcuagu caaugaaguc gccauccaaa 60
gcuuuccuuc uuugagccag uguuggaucu caagggcagc augcugggcc 110
<210> 203
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 203
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc 80
<210> 204
<211> 85
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 204
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcu 85
<210> 205
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 205
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 206
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 206
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 207
<211> 137
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 207
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 208
<211> 70
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 208
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagcaaccuc caggcucauc 60
cagcuuccca 70
<210> 209
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 209
agaaauccgu cuuucauuga cgguuaaacu cuccauggac caguuaaacu cuccaaccuc 60
caggcucauc cagcuuccca 80
<210> 210
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 210
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 211
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 211
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagagguaac accaaaagac 60
uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 100
<210> 212
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 212
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagccccauu accagguaac 60
accaaaagac uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 110
<210> 213
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 213
tccatgtctc gttatacgct gtggttcgcc aacaacacta gtactactga taaattaccc 60
cccaagtccc tcacctctcc aaagctgccc atactactac actagtttga cagctagctc 120
agtcctaggt ataatgctag c 141
<210> 214
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 214
tccatgtctc gttatacgct gtggttcgcc aacatatagt tcactactag catgctgccc 60
ttgactagca acactggctc aaagaaggaa agactactta tagttcttga cagctagctc 120
agtcctaggt ataatgctag c 141
<210> 215
<211> 143
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 215
tccatgtctc gttatacgct gtggttcgcc aacgcaggaa cgacactact agctggatga 60
gcctggtcca tggagagttt aaaaagtctt ttggactact ggaacgactt gacagctagc 120
tcagtcctag gtataatgct agc 143
<210> 216
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 216
agaaatccgt ctttcattga cggggagagg tgagggactt ggg 43
<210> 217
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 217
agaaatccgt ctttcattga cgggagccag tgttgctagt caa 43
<210> 218
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 218
agaaatccgt ctttcattga cggttaaact ctccatggac cag 43
<210> 219
<211> 1812
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 219
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys Phe
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu
1115 1120 1125
Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser
1130 1135 1140
Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala
1145 1150 1155
Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr
1160 1165 1170
Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
1175 1180 1185
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
1190 1195 1200
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
1205 1210 1215
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu
1220 1225 1230
Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro
1235 1240 1245
Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr
1250 1255 1260
Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
1265 1270 1275
Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
1280 1285 1290
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
1295 1300 1305
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
1310 1315 1320
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr
1325 1330 1335
Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
1340 1345 1350
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr
1355 1360 1365
Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys
1370 1375 1380
Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu
1385 1390 1395
Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro
1400 1405 1410
Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
1415 1420 1425
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
1430 1435 1440
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
1445 1450 1455
Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu
1460 1465 1470
Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu
1475 1480 1485
Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro
1490 1495 1500
Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
1505 1510 1515
Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
1520 1525 1530
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
1535 1540 1545
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
1550 1555 1560
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala
1565 1570 1575
Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
1580 1585 1590
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln
1595 1600 1605
His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro
1610 1615 1620
Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr
1625 1630 1635
Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly
1640 1645 1650
Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu
1655 1660 1665
Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr
1670 1675 1680
Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr
1685 1690 1695
Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile
1700 1705 1710
Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys
1715 1720 1725
Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro
1730 1735 1740
Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly His
1745 1750 1755
Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg
1760 1765 1770
Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
1775 1780 1785
Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu Phe
1790 1795 1800
Glu Ser Pro Lys Lys Lys Arg Lys Val
1805 1810
<210> 220
<211> 1620
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 220
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu
1115 1120 1125
Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser
1130 1135 1140
Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala
1145 1150 1155
Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr
1160 1165 1170
Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
1175 1180 1185
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
1190 1195 1200
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
1205 1210 1215
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu
1220 1225 1230
Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro
1235 1240 1245
Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr
1250 1255 1260
Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
1265 1270 1275
Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
1280 1285 1290
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
1295 1300 1305
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
1310 1315 1320
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr
1325 1330 1335
Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
1340 1345 1350
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr
1355 1360 1365
Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys
1370 1375 1380
Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu
1385 1390 1395
Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro
1400 1405 1410
Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
1415 1420 1425
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
1430 1435 1440
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
1445 1450 1455
Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu
1460 1465 1470
Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu
1475 1480 1485
Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro
1490 1495 1500
Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
1505 1510 1515
Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
1520 1525 1530
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
1535 1540 1545
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
1550 1555 1560
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala
1565 1570 1575
Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
1580 1585 1590
Leu Asn Pro Ala Thr Leu Leu Pro Met Lys Arg Thr Ala Asp Gly
1595 1600 1605
Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1610 1615 1620
<210> 221
<211> 1562
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 221
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser
1115 1120 1125
Ser Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys
1130 1135 1140
Gly Ala Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu
1145 1150 1155
His Leu Ala Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr
1160 1165 1170
Arg Lys Tyr Lys Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys
1175 1180 1185
Pro Asp Gly Gly Val Arg Asn Leu Gly Val Pro Thr Val Thr Asp
1190 1195 1200
Arg Phe Ile Gln Gln Ala Ile Ala Gln Val Leu Thr Pro Ile Tyr
1205 1210 1215
Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe Arg Pro Asn Arg
1220 1225 1230
Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile Met Asn Asp
1235 1240 1245
Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe Phe Asp
1250 1255 1260
Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr Ile
1265 1270 1275
Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser
1280 1285 1290
Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
1295 1300 1305
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu
1310 1315 1320
Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val
1325 1330 1335
Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
1340 1345 1350
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys
1355 1360 1365
Leu Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro
1370 1375 1380
Ser Gly Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg
1385 1390 1395
Ala His Gln Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys
1400 1405 1410
Phe Lys Lys Arg Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val
1415 1420 1425
Ser Asn Ser Tyr Lys Val Glu Lys Leu Asn Gln Leu Ile Arg Gly
1430 1435 1440
Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met Lys Thr Leu Cys Lys
1445 1450 1455
Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg Met Cys Ile Trp
1460 1465 1470
Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn Leu Val Lys
1475 1480 1485
Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr Thr Gly
1490 1495 1500
Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val Ala
1505 1510 1515
Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu
1520 1525 1530
Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Met Lys Arg Thr Ala
1535 1540 1545
Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1550 1555 1560
<210> 222
<211> 1548
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 222
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser
20 25 30
Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala
35 40 45
Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala
50 55 60
Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys
65 70 75 80
Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val
85 90 95
Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala
100 105 110
Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His
115 120 125
Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr
130 135 140
Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp
145 150 155 160
Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu
165 170 175
Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys
180 185 190
Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile
195 200 205
Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile
210 215 220
Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe
225 230 235 240
Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
245 250 255
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu
260 265 270
Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly
275 280 285
Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln
290 295 300
Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg
305 310 315 320
Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys
325 330 335
Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys
340 345 350
Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg
355 360 365
Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn
370 375 380
Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg
385 390 395 400
Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly
405 410 415
Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu
420 425 430
Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly
435 440 445
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
450 455 460
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser
465 470 475 480
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
485 490 495
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
500 505 510
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
515 520 525
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
530 535 540
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
545 550 555 560
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
565 570 575
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
580 585 590
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
595 600 605
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
610 615 620
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
625 630 635 640
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
645 650 655
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
660 665 670
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
675 680 685
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
690 695 700
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
705 710 715 720
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
725 730 735
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
740 745 750
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
755 760 765
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
770 775 780
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
785 790 795 800
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
805 810 815
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
820 825 830
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
835 840 845
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
850 855 860
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
865 870 875 880
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
885 890 895
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
900 905 910
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
915 920 925
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
930 935 940
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
945 950 955 960
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
965 970 975
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
980 985 990
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
995 1000 1005
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile
1010 1015 1020
Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
1025 1030 1035
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg
1040 1045 1050
Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln
1055 1060 1065
Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser
1070 1075 1080
His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His
1085 1090 1095
Lys Glu Leu Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile
1100 1105 1110
Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser
1115 1120 1125
Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys
1130 1135 1140
Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys
1145 1150 1155
Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala
1160 1165 1170
Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr
1175 1180 1185
Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu
1190 1195 1200
Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp
1205 1210 1215
Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu
1220 1225 1230
Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
1235 1240 1245
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg
1250 1255 1260
Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
1265 1270 1275
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala
1280 1285 1290
Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile
1295 1300 1305
Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys
1310 1315 1320
Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe
1325 1330 1335
Asn Lys Ile Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe
1340 1345 1350
Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His
1355 1360 1365
Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro
1370 1375 1380
Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn
1385 1390 1395
Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly
1400 1405 1410
Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu
1415 1420 1425
Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys
1430 1435 1440
Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu
1445 1450 1455
Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala
1460 1465 1470
Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln
1475 1480 1485
Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn
1490 1495 1500
Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1505 1510 1515
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys
1520 1525 1530
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1535 1540 1545
<210> 223
<211> 1548
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 223
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser
20 25 30
Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala
35 40 45
Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala
50 55 60
Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys
65 70 75 80
Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val
85 90 95
Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala
100 105 110
Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His
115 120 125
Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr
130 135 140
Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp
145 150 155 160
Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu
165 170 175
Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys
180 185 190
Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile
195 200 205
Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile
210 215 220
Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe
225 230 235 240
Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
245 250 255
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu
260 265 270
Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly
275 280 285
Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln
290 295 300
Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg
305 310 315 320
Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys
325 330 335
Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys
340 345 350
Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg
355 360 365
Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn
370 375 380
Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg
385 390 395 400
Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly
405 410 415
Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu
420 425 430
Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly
435 440 445
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
450 455 460
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser
465 470 475 480
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
485 490 495
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
500 505 510
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
515 520 525
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
530 535 540
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
545 550 555 560
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
565 570 575
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
580 585 590
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
595 600 605
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
610 615 620
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
625 630 635 640
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
645 650 655
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
660 665 670
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
675 680 685
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
690 695 700
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
705 710 715 720
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
725 730 735
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
740 745 750
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
755 760 765
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
770 775 780
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
785 790 795 800
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
805 810 815
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
820 825 830
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
835 840 845
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
850 855 860
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
865 870 875 880
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
885 890 895
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
900 905 910
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
915 920 925
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
930 935 940
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
945 950 955 960
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
965 970 975
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
980 985 990
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
995 1000 1005
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile
1010 1015 1020
Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
1025 1030 1035
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg
1040 1045 1050
Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln
1055 1060 1065
Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser
1070 1075 1080
His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His
1085 1090 1095
Lys Glu Leu Arg Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile
1100 1105 1110
Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser
1115 1120 1125
Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys
1130 1135 1140
Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys
1145 1150 1155
Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala
1160 1165 1170
Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr
1175 1180 1185
Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu
1190 1195 1200
Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp
1205 1210 1215
Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu
1220 1225 1230
Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
1235 1240 1245
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg
1250 1255 1260
Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
1265 1270 1275
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala
1280 1285 1290
Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile
1295 1300 1305
Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys
1310 1315 1320
Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe
1325 1330 1335
Asn Lys Ile Arg Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe
1340 1345 1350
Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His
1355 1360 1365
Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro
1370 1375 1380
Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn
1385 1390 1395
Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly
1400 1405 1410
Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu
1415 1420 1425
Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys
1430 1435 1440
Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu
1445 1450 1455
Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala
1460 1465 1470
Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln
1475 1480 1485
Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn
1490 1495 1500
Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp Glu
1505 1510 1515
Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser Lys
1520 1525 1530
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1535 1540 1545
<210> 224
<211> 486
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 224
Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro
485
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<211> 487
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 230
Met Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly
1 5 10 15
Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala
20 25 30
Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala
35 40 45
Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile
50 55 60
Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
65 70 75 80
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val
85 90 95
Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn
100 105 110
Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp
115 120 125
Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro
130 135 140
Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln
145 150 155 160
Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu
165 170 175
Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His
180 185 190
Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala
195 200 205
Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr
210 215 220
Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys
225 230 235 240
Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg
245 250 255
Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro
260 265 270
Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Thr Ala Gly Phe Cys
275 280 285
Arg Leu Trp Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro
290 295 300
Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
305 310 315 320
Ala Tyr Gln Glu Ile Leu Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly
325 330 335
Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln
340 345 350
Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg
355 360 365
Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp
370 375 380
Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp
385 390 395 400
Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His
405 410 415
Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn
420 425 430
Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val
435 440 445
Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu
450 455 460
Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala
465 470 475 480
His Gly Thr Arg Pro Asp Leu
485
<210> 231
<211> 231
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 231
Met Leu Gln Leu Gly His Leu Glu Glu Ser Asn Ser Pro Trp Asn Thr
1 5 10 15
Pro Val Phe Val Ile Lys Lys Lys Ser Gly Lys Trp Arg Leu Leu Gln
20 25 30
Asp Leu Arg Ala Val Asn Ala Thr Met His Asp Met Gly Ala Leu Gln
35 40 45
Pro Gly Leu Pro Ser Pro Val Ala Val Pro Lys Gly Trp Glu Ile Ile
50 55 60
Ile Ile Asp Leu Gln Asp Cys Phe Phe Asn Ile Lys Leu His Pro Glu
65 70 75 80
Asp Cys Lys Arg Phe Ala Phe Ser Val Pro Ser Pro Asn Phe Lys Arg
85 90 95
Pro Tyr Gln Arg Phe Gln Trp Lys Val Leu Pro Gln Gly Met Lys Asn
100 105 110
Ser Pro Thr Leu Cys Gln Lys Phe Val Asp Lys Ala Ile Leu Thr Val
115 120 125
Arg Asp Lys Tyr Gln Asp Ser Tyr Ile Val His Tyr Met Asp Asp Ile
130 135 140
Leu Leu Ala His Pro Ser Arg Ser Ile Val Asp Glu Ile Leu Thr Ser
145 150 155 160
Met Ile Gln Ala Leu Asn Lys His Gly Leu Val Val Ser Thr Glu Lys
165 170 175
Ile Gln Lys Tyr Asp Asn Leu Lys Tyr Leu Gly Thr His Ile Gln Gly
180 185 190
Asp Ser Val Ser Tyr Gln Lys Leu Gln Ile Arg Thr Asp Lys Leu Arg
195 200 205
Thr Leu Asn Asp Phe Gln Lys Leu Leu Gly Asn Ile Asn Trp Ile Arg
210 215 220
Pro Phe Leu Lys Leu Thr Thr
225 230
<210> 232
<211> 427
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 232
Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu
1 5 10 15
Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val
20 25 30
Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly
35 40 45
Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro
50 55 60
Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu
65 70 75 80
Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln
85 90 95
Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly
100 105 110
Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn
115 120 125
Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys
130 135 140
Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg
145 150 155 160
Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val
165 170 175
Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
180 185 190
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn
195 200 205
Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr
210 215 220
Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg
225 230 235 240
Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys
245 250 255
Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr
260 265 270
Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala
275 280 285
Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu
290 295 300
Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys
305 310 315 320
Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser
325 330 335
Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu
340 345 350
Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys
355 360 365
Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala
370 375 380
Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn
385 390 395 400
Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met
405 410 415
Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys
420 425
<210> 233
<211> 774
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 233
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 234
<211> 774
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 234
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asp Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 235
<211> 774
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 235
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Ser Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Ser Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Leu Asp Ile Gly Thr
130 135 140
Pro Cys His Glu Gly Glu Val Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Thr Arg Val Ile Thr Trp Arg Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Leu Ser Thr Glu Arg Glu Met Ile Gln
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Glu Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Ile
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Met Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Leu Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Glu Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Tyr Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Trp Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 236
<211> 683
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 236
Met Asp His Leu Leu Leu Lys Thr Gln Thr Gln Thr Glu Gln Val Met
1 5 10 15
Asn Val Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg Leu Tyr Phe
20 25 30
Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp Thr Gly Ala
35 40 45
Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu His Trp Val
50 55 60
Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly Ser Ser Ile
65 70 75 80
Thr Ile Ser Lys Val Cys Lys Asp Ile Asp Leu Ile Ile Ala Gly Glu
85 90 95
Ile Phe Arg Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly Ile Asp Phe
100 105 110
Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe Ile Gln Phe
115 120 125
Thr Asp Arg Val Ile Phe Thr Lys Asn Lys Ser Tyr Pro Val His Ile
130 135 140
Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly Phe Leu Glu
145 150 155 160
Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro Val Asn Ile
165 170 175
Ser Thr Asn Lys Ile Glu Asn Pro Leu Glu Glu Ile Ala Ile Leu Ser
180 185 190
Glu Gly Arg Arg Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg
195 200 205
Met Gln Lys Ile Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro
210 215 220
Leu Asp Pro Asn Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu
225 230 235 240
Ser Asp Pro Ser Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro
245 250 255
Met Asp Arg Glu Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu
260 265 270
Lys Val Ile Lys Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu
275 280 285
Val Asn Asn Glu Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val
290 295 300
Asn Tyr Lys Ala Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu
305 310 315 320
Pro Asn Lys Asp Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe
325 330 335
Ser Ser Phe Asp Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln
340 345 350
Glu Ser Arg Pro Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu
355 360 365
Trp Asn Val Val Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln
370 375 380
Arg His Met Asp Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val
385 390 395 400
Tyr Val Asp Asp Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu
405 410 415
Leu His Val Ala Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile
420 425 430
Leu Ser Lys Lys Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu
435 440 445
Gly Leu Glu Ile Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu
450 455 460
Glu His Ile Asn Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu
465 470 475 480
Gln Arg Phe Leu Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys
485 490 495
Leu Ala Gln Ile Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val
500 505 510
Pro Trp Arg Trp Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys
515 520 525
Lys Asn Leu Gln Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu
530 535 540
Lys Leu Ile Ile Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met
545 550 555 560
Leu Lys Ala Ile Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys
565 570 575
Arg Tyr Ala Ser Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser
580 585 590
Asn Asp Lys Glu Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser
595 600 605
Ile Tyr Leu Thr Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His
610 615 620
Phe Lys Ser Phe Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly
625 630 635 640
Arg Asn Ile Arg Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val
645 650 655
Glu His Ile Lys Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg
660 665 670
Glu Phe Asn Lys Val Asn Ser Ser Gly Gly Ser
675 680
<210> 237
<211> 329
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 237
Met Gly Ile His Gly Val Pro Ala Ala Met Lys Ser Ala Glu Tyr Leu
1 5 10 15
Asn Thr Phe Arg Leu Arg Asn Leu Gly Leu Pro Val Met Asn Asn Leu
20 25 30
His Asp Met Ser Lys Ala Thr Arg Ile Ser Val Glu Thr Leu Arg Leu
35 40 45
Leu Ile Tyr Thr Ala Asp Phe Arg Tyr Arg Ile Tyr Thr Val Glu Lys
50 55 60
Lys Gly Pro Glu Lys Arg Met Arg Thr Ile Tyr Gln Pro Ser Arg Glu
65 70 75 80
Leu Lys Ala Leu Gln Gly Trp Val Leu Arg Asn Ile Leu Asp Lys Leu
85 90 95
Ser Ser Ser Pro Phe Ser Ile Gly Phe Glu Lys His Gln Ser Ile Leu
100 105 110
Asn Asn Ala Thr Pro His Ile Gly Ala Asn Phe Ile Leu Asn Ile Asp
115 120 125
Leu Glu Asp Phe Phe Pro Ser Leu Thr Ala Asn Lys Val Phe Gly Val
130 135 140
Phe His Ser Leu Gly Tyr Asn Arg Leu Ile Ser Ser Val Leu Thr Lys
145 150 155 160
Ile Cys Cys Tyr Lys Asn Leu Leu Pro Gln Gly Ala Pro Ser Ser Pro
165 170 175
Lys Leu Ala Asn Leu Ile Cys Ser Lys Leu Asp Tyr Arg Ile Gln Gly
180 185 190
Tyr Ala Gly Ser Arg Gly Leu Ile Tyr Thr Arg Tyr Ala Asp Asp Leu
195 200 205
Thr Leu Ser Ala Gln Ser Met Lys Lys Val Val Lys Ala Arg Asp Phe
210 215 220
Leu Phe Ser Ile Ile Pro Ser Glu Gly Leu Val Ile Asn Ser Lys Lys
225 230 235 240
Thr Cys Ile Ser Gly Pro Arg Ser Gln Arg Lys Val Thr Gly Leu Val
245 250 255
Ile Ser Gln Glu Lys Val Gly Ile Gly Arg Glu Lys Tyr Lys Glu Ile
260 265 270
Arg Ala Lys Ile His His Ile Phe Cys Gly Lys Ser Ser Glu Ile Glu
275 280 285
His Val Arg Gly Trp Leu Ser Phe Ile Leu Ser Val Asp Ser Lys Ser
290 295 300
His Arg Arg Leu Ile Thr Tyr Ile Ser Lys Leu Glu Lys Lys Tyr Gly
305 310 315 320
Lys Asn Pro Leu Asn Lys Ala Lys Thr
325
<210> 238
<211> 235
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 238
Met Glu Lys Glu Gly Gln Leu Glu Glu Ala Pro Pro Thr Asn Pro Tyr
1 5 10 15
Asn Thr Pro Thr Phe Ala Ile Lys Lys Lys Asp Lys Asn Lys Trp Arg
20 25 30
Met Leu Ile Asp Phe Arg Glu Leu Asn Lys Val Thr Gln Asp Phe Thr
35 40 45
Glu Ile Gln Leu Gly Ile Pro His Pro Ala Gly Leu Ala Lys Lys Arg
50 55 60
Arg Ile Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile Pro Leu
65 70 75 80
His Glu Asp Phe Arg Pro Tyr Thr Ala Phe Thr Leu Pro Ser Val Asn
85 90 95
Asn Ala Glu Pro Gly Lys Arg Tyr Ile Tyr Lys Val Leu Pro Gln Gly
100 105 110
Trp Lys Gly Ser Pro Ala Ile Phe Gln His Thr Met Arg Gln Val Leu
115 120 125
Glu Pro Phe Arg Lys Ala Asn Lys Asp Val Ile Ile Ile Gln Tyr Met
130 135 140
Asp Asp Ile Leu Ile Ala Ser Asp Arg Thr Asp Leu Glu His Asp Arg
145 150 155 160
Val Val Leu Gln Leu Lys Glu Leu Leu Asn Gly Leu Gly Phe Ser Thr
165 170 175
Pro Asp Glu Lys Phe Gln Lys Asp Pro Pro Ile His Trp Met Gly Tyr
180 185 190
Glu Leu Trp Pro Thr Lys Trp Lys Leu Gln Lys Ile Gln Leu Pro Gln
195 200 205
Lys Glu Ile Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Val Leu
210 215 220
Asn Trp Ala Ala Gln Leu Tyr Pro Gly Ile Lys
225 230 235
<210> 239
<211> 235
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 239
Met Glu Glu Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr
1 5 10 15
Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg
20 25 30
Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp
35 40 45
Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys
50 55 60
Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu
65 70 75 80
Asp Glu Ser Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn
85 90 95
Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly
100 105 110
Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu
115 120 125
Glu Pro Phe Arg Ile Lys Asn Pro Glu Ile Val Ile Tyr Gln Tyr Met
130 135 140
Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr
145 150 155 160
Lys Ile Glu Glu Leu Arg Ala His Leu Leu Ser Trp Gly Phe Thr Thr
165 170 175
Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr
180 185 190
Glu Leu His Pro Asp Arg Trp Thr Val Gln Pro Ile Asp Leu Pro Glu
195 200 205
Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu
210 215 220
Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys
225 230 235
<210> 240
<211> 441
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 240
Met Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly
1 5 10 15
Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile
20 25 30
Lys Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile
35 40 45
Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile
50 55 60
Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu
65 70 75 80
Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro
85 90 95
His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val
100 105 110
Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr
115 120 125
Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg
130 135 140
Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile
145 150 155 160
Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn
165 170 175
Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser
180 185 190
Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln
195 200 205
His Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys
210 215 220
Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp
225 230 235 240
Thr Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn
245 250 255
Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr
260 265 270
Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys
275 280 285
Ala Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu
290 295 300
Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr
305 310 315 320
Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly
325 330 335
Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr
340 345 350
Gly Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln
355 360 365
Leu Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp
370 375 380
Gly Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu
385 390 395 400
Thr Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu
405 410 415
Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys
420 425 430
Glu Pro Ile Val Gly Ala Glu Thr Phe
435 440
<210> 241
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 241
aauagcggcc cuaagaaauc cgucuuucau ugacgg 36
<210> 242
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 242
auuggaacug gcgagaaauc cgucuuucau ugacgg 36
<210> 243
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 243
ccagcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 244
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 244
cggcgcucga auaggaaauc cgucuuucau ugacgg 36
<210> 245
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 245
guggcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 246
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 246
guugcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 247
<211> 36
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 247
guugcaaugc cuaagaaauc cgucuuucau ugacgg 36
<210> 248
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 248
gggaagtggt tggtcagcat 20
<210> 249
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 249
gggaagtggt tgcgaggcat 20
<210> 250
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 250
gggaagtggt tgagcggtca 20
<210> 251
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 251
gggaagtggt tggcat 16
<210> 252
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 252
gagccagtgt tgctagtcaa 20
<210> 253
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 253
gagccagtgt tgcgagtcaa 20
<210> 254
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 254
gagccagtgt tgagcgctag 20
<210> 255
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 255
gagccagtgt tgtcaa 16
<210> 256
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 256
ttaaactctc catggaccag 20
<210> 257
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 257
ttaaactctc cacgagccag 20
<210> 258
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 258
ttaaactctc caagcgtgga 20
<210> 259
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 259
ttaaactctc caccag 16
Claims (88)
- 유전자 편집 시스템으로서,
(a) 유형 V CRISPR 뉴클레이스 폴리펩타이드 또는 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산;
(b) 역전사효소(reverse transcriptase: RT) 폴리펩타이드 또는 상기 RT 폴리펩타이드를 암호화하는 제2 핵산;
(c) 가이드 RNA(gRNA) 또는 상기 gRNA를 암호화하는 제3 핵산으로서, 상기 gRNA는 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 관심 게놈 부위 내의 표적 서열에 특이적인 스페이서 서열, 프로토스페이서 인접 모티프(protospacer adjacent motif: PAM)에 인접한 표적 서열을 포함하는, 상기 가이드 RNA(gRNA) 또는 상기 gRNA를 암호화하는 제3 핵산; 및
(d) 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산으로서, 상기 RT 공여체 RNA는 프라이머 결합 부위(primer binding site: PBS) 및 주형 서열을 포함하는, 상기 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산
을 포함하는, 유전자 편집 시스템. - 제1항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드는 Cas12 폴리펩타이드인, 유전자 편집 시스템.
- 제2항에 있어서, 상기 Cas12 폴리펩타이드는 Cas12i 폴리펩타이드이고, 선택적으로 Cas12i2 폴리펩타이드인, 유전자 편집 시스템.
- 제3항에 있어서, 상기 Cas12i 폴리펩타이드는 서열번호 2와 적어도 95% 동일한 아미노산 서열을 포함하는 Cas12i2 폴리펩타이드인, 유전자 편집 시스템.
- 제4항에 있어서, 상기 Cas12i2 폴리펩타이드는 서열번호 2의 D581, G624, F626, P868, I926, V1030, E1035 및/또는 S1046 위치에 하나 이상의 돌연변이를 포함하는, 유전자 편집 시스템.
- 제5항에 있어서, 상기 하나 이상의 돌연변이는 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R, S1046G 또는 이들의 조합인 아미노산 치환인, 유전자 편집 시스템.
- 제5항에 있어서, 상기 Cas12i2 폴리펩타이드는,
(i) 선택적으로 D581R, D911R, I926R 및 V1030G의 아미노산 치환인 D581, D911, I926 및 V1030 위치에서의 돌연변이;
(ii) 선택적으로 D581R, I926R 및 V1030G의 아미노산 치환인 D581, I926 및 V1030 위치에서의 돌연변이;
(iii) 선택적으로 D581R, I926R, V1030G 및 S1046G의 아미노산 치환인 D581, I926, V1030 및 S1046 위치에서의 돌연변이;
(iv) 선택적으로 D581R, G624R, F626R, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환인 D581, G624, F626, I926, V1030, E1035 및 S1046 위치에서의 돌연변이; 또는
(v) 선택적으로 D581R, G624R, F626R, P868T, I926R, V1030G, E1035R 및 S1046G의 아미노산 치환인 D581, G624, F626, P868, I926, V1030, E1035 및 S1046 위치에서의 돌연변이
를 포함하는, 유전자 편집 시스템. - 제7항에 있어서, 상기 Cas12i2 폴리펩타이드는 서열번호 3 내지 7 중 어느 하나, 선택적으로 서열번호 4 또는 서열번호 7의 아미노산 서열을 포함하는, 유전자 편집 시스템.
- 제4항 또는 제5항에 있어서, 상기 Cas12i 폴리펩타이드는 감소된 crRNA 처리 활성을 갖되, 선택적으로 상기 Cas12i 폴리펩타이드는 서열번호 2의 H485 위치 및/또는 H486 위치에 돌연변이를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드를 암호화하는 제1 핵산을 포함하는, 유전자 편집 시스템.
- 제11항에 있어서, 상기 제1 핵산은, 선택적으로 제1 바이러스 벡터인 제1 벡터에 위치하는, 유전자 편집 시스템.
- 제11항에 있어서, 상기 제1 핵산은 제1 메신저 RNA(mRNA)인, 유전자 편집 시스템.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 RT 폴리펩타이드는 몰로니 뮤린 백혈병 바이러스(Moloney Murine Leukemia Virus: MMLV)-RT, 마우스 유방 종양 바이러스(mouse mammary tumor virus: MMTV)-RT, 마라톤-RT 또는 RTx-RT인, 유전자 편집 시스템.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 시스템은 RT 폴리펩타이드를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 시스템은 RT 폴리펩타이드를 암호화하는 제2 핵산을 포함하는, 유전자 편집 시스템.
- 제16항에 있어서, 상기 제2 핵산은, 선택적으로 제2 바이러스 벡터인 제2 벡터에 위치하는, 유전자 편집 시스템.
- 제17항에 있어서, 상기 제2 벡터는 상기 제1 벡터와 동일한, 유전자 편집 시스템.
- 제16항에 있어서, 상기 제2 핵산은 제2 mRNA인, 유전자 편집 시스템.
- 제17항에 있어서, 상기 제1 mRNA 및 상기 제2 mRNA는 단일 RNA 분자에 위치하는, 유전자 편집 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 유전자 편집 시스템은 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드와 상기 RT 폴리펩타이드를 포함하는 융합 폴리펩타이드를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드와 상기 RT 폴리펩타이드는 별도의 폴리펩타이드인, 유전자 편집 시스템.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 스페이서 서열은 20개 내지 30개의 뉴클레오타이드 길이, 선택적으로 20개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
- 제3항 내지 제23항 중 어느 한 항에 있어서, 상기 PAM은, 선택적으로 상기 표적 서열의 5'에 위치하는 5'-TTN-3'의 모티프를 포함하는, 유전자 편집 시스템.
- 제3항 내지 제24항 중 어느 한 항에 있어서, 상기 하나 이상의 CRISPR 뉴클레이스 결합 부위는 직접 반복 서열(들)인, 유전자 편집 시스템.
- 제25항에 있어서, 각각의 직접 반복 서열은 23개 내지 36개의 뉴클레오타이드 길이, 선택적으로 23개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
- 제26항에 있어서, 상기 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나 또는 이의 단편과 적어도 90% 동일한, 유전자 편집 시스템.
- 제27항에 있어서, 상기 직접 반복 서열은 적어도 23개의 뉴클레오타이드 길이인 서열번호 15 내지 17 및 241 내지 247 중 어느 하나 또는 이의 단편이고; 선택적으로 상기 직접 반복 서열은 서열번호 17인, 유전자 편집 시스템.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 시스템은 상기 gRNA를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 상기 시스템은 상기 gRNA를 암호화하는 상기 제3 핵산을 포함하는, 유전자 편집 시스템.
- 제30항에 있어서, 상기 제3 핵산은, 선택적으로 바이러스 벡터인 제3 벡터에 위치하는, 유전자 편집 시스템.
- 제31항에 있어서, 상기 제3 벡터는 상기 제1 벡터 및/또는 상기 제2 벡터와 동일한, 유전자 편집 시스템.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 PBS는 5개 내지 100개의 뉴클레오타이드 길이, 선택적으로 10개 내지 60개의 뉴클레오타이드 길이, 바람직하게는 10개 내지 30개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS는 상기 표적 서열의 상보적 영역에 인접한 PBS-표적화 부위에 결합하고, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역의 상류에 있는, 유전자 편집 시스템.
- 제34항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역의 상류에 있는 3개 내지 10개의 뉴클레오타이드인, 유전자 편집 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열의 상보적 영역과 중첩되는, 유전자 편집 시스템.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 상기 PBS-표적화 부위는 상기 표적 서열에 인접하거나 또는 이와 중첩되는, 유전자 편집 시스템.
- 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 주형 서열은 5개 내지 100개의 뉴클레오타이드 길이, 선택적으로 30개 내지 50개의 뉴클레오타이드 길이인, 유전자 편집 시스템.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 상기 주형 서열은 상기 관심 게놈 부위와 상동성이고, 상기 관심 게놈 부위에 대해 하나 이상의 뉴클레오타이드 변이를 포함하는, 유전자 편집 시스템.
- 제39항에 있어서, 상기 적어도 하나의 뉴클레오타이드 변이는 상기 표적 서열 내에 위치하는, 유전자 편집 시스템.
- 제39항 또는 제40항에 있어서, 상기 적어도 하나의 뉴클레오타이드 변이는 PAM에 위치하는, 유전자 편집 시스템.
- 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 시스템은 상기 RT 공여체 RNA를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 시스템은 상기 RT 공여체 RNA를 암호화하는 상기 제4 핵산을 포함하는, 유전자 편집 시스템.
- 제43항에 있어서, 상기 제4 핵산은, 선택적으로 제4 바이러스 벡터인 제4 벡터에 위치하는, 유전자 편집 시스템.
- 제44항에 있어서, 상기 4 벡터는 상기 제1 벡터, 상기 제2 벡터 및/또는 상기 제3 벡터와 동일한, 유전자 편집 시스템.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 gRNA 및 상기 RT 공여체 RNA는, 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 PBS 및 상기 주형 서열을 포함하는 단일 RNA 분자에 위치하는, 유전자 편집 시스템.
- 제46항에 있어서, 상기 단일 RNA 분자는 상기 gRNA와 상기 RT 공여체 RNA 사이에 링커를 추가로 포함하는, 유전자 편집 시스템.
- 제47항에 있어서, 상기 링커는 헤어핀을 포함하는, 유전자 편집 시스템.
- 제46항 내지 제48항 중 어느 한 항에 있어서, 상기 단일 RNA 분자는, 5'에서 3'로,
(i) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 주형 서열 및 상기 PBS;
(ii) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 링커, 상기 주형 서열 및 상기 PBS;
(iii) 상기 주형 서열, 상기 PBS, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열; 또는
(iv) 상기 주형 서열, 상기 PBS, 상기 링커, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열
을 포함하는, 유전자 편집 시스템. - 제46항 내지 제49항 중 어느 한 항에 있어서, 상기 단일 RNA 분자는 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함하며, 상기 5' 말단 보호 단편 및 상기 3' 말단 보호 단편 각각은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하는, 유전자 편집 시스템.
- 제50항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 시스템.
- 제50항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 시스템.
- 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 gRNA 및 상기 RT 공여체 RNA는 2개의 개별 RNA 분자인, 유전자 편집 시스템.
- 제53항에 있어서, 상기 gRNA, RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함하는, 유전자 편집 시스템.
- 제54항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 시스템.
- 제54항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 시스템.
- 제1항 내지 제56항 중 어느 한 항에 있어서, 상기 시스템은 요소 (a), (b), (c), (d) 또는 이들의 임의의 조합을 포함하는 하나 이상의 지질 나노입자(LNP)를 포함하는, 유전자 편집 시스템.
- 제1항 내지 제57항 중 어느 한 항에 있어서, 상기 시스템은 (i) (a) 내지 (d) 중 최대 3개의 요소를 집합적으로 포함하는 하나 이상의 지질 나노입자(LNP) 및 (ii) 하나 이상의 벡터를 포함하는, 유전자 편집 시스템.
- 제58항에 있어서, 상기 하나 이상의 벡터는, 선택적으로 아데노-관련 바이러스(AAV) 벡터인 하나 이상의 바이러스 벡터인, 유전자 편집 시스템.
- 제1항 내지 제56항 중 어느 한 항에 있어서, 상기 시스템은 유형 V CRISPR 뉴클레이스 폴리펩타이드, RT 폴리펩타이드, gRNA 및 RT 공여체 RNA를 포함하는, 유전자 편집 시스템.
- 제60항에 있어서, 상기 유형 V CRISPR 뉴클레이스 폴리펩타이드 및/또는 상기 RT 폴리펩타이드는 상기 gRNA 및/또는 상기 RT 공여체 RNA와 복합체를 형성하는, 유전자 편집 시스템.
- 제1항 내지 제61항 중 어느 하나의 시스템을 포함하는 약제학적 조성물.
- 제1항 내지 제61항 중 어느 하나에 제시된 시스템의 (a) 내지 (d)의 요소를 포함하는 키트.
- 세포를 유전자 편집하는 방법으로서, 숙주 세포와 제1항 내지 제61항 중 어느 하나의 유전자 편집 시스템 또는 제62항의 약제학적 조성물을 접촉시켜 상기 숙주 세포를 유전자 편집하는 접촉 단계를 포함하는, 방법.
- 제64항에 있어서, 상기 숙주 세포는 시험관내에서 배양된, 방법.
- 제65항에 있어서, 상기 접촉 단계는 상기 유전자 편집 시스템을 상기 숙주 세포를 포함하는 대상체에게 투여함으로써 수행되는, 방법.
- 제1항 내지 제61항 중 어느 하나의 유전자 편집 시스템에 의해 생산되는 유전자 변형된 세포의 집단.
- 제67항에 있어서, 상기 유전자 편집 시스템에 의해 편집될 수 없는 유전자 변형된 세포를 포함하는, 유전자 변형된 세포의 집단.
- 제68항에 있어서, 상기 유전자 변형된 세포는 상기 PAM, 상기 표적 서열 또는 둘 다에 하나 이상의 변형을 포함하는, 유전자 변형된 세포의 집단.
- 유전자 편집 RNA 분자로서,
(i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위);
(ii) 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열로서, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 스페이서 서열;
(iii) 프라이머 결합 부위(PBS); 및
(iv) 주형 서열
을 포함하는, 유전자 편집 RNA 분자. - 제70항에 있어서, 하나 이상의 링커를 추가로 포함하는, 유전자 편집 RNA 분자.
- 제70항 또는 제71항에 있어서, 상기 RNA 분자는, 5'에서 3'로,
(i) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 주형 서열 및 상기 PBS;
(ii) 상기 CRISPR 뉴클레이스 결합 부위, 상기 스페이서 서열, 상기 링커, 상기 주형 서열 및 상기 PBS;
(iii) 상기 주형 서열, 상기 PBS, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열; 또는
(iv) 상기 주형 서열, 상기 PBS, 상기 링커, 상기 CRISPR 뉴클레이스 결합 부위 및 상기 스페이서 서열
을 포함하는, 유전자 편집 RNA 분자. - 제70항 내지 제72항 중 어느 한 항에 있어서, 5' 말단 보호 단편, 3' 말단 보호 단편 또는 둘 다를 추가로 포함하는, 유전자 편집 RNA 분자.
- 제73항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 형성하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 RNA 분자.
- 제73항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 RNA 분자.
- 유전자 편집 RNA 분자 세트로서,
(i) 유형 V CRISPR 뉴클레이스에 의해 인식 가능한 하나 이상의 결합 부위(CRISPR 뉴클레이스 결합 부위) 및 유전자 부위 내의 표적 서열에 특이적인 스페이서 서열을 포함하는 가이드 RNA로서, 상기 표적 서열은 프로토스페이서 인접 모티프(PAM)에 인접한, 상기 가이드 RNA; 및
(ii) 역전사 공여체 RNA(RT 공여체 RNA) 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산으로서, 상기 RT 공여체 RNA는 프라이머 결합 부위(PBS) 및 주형 서열을 포함하는, 상기 RT 공여체 RNA 또는 상기 RT 공여체 RNA를 암호화하는 제4 핵산
을 포함하는, 유전자 편집 RNA 분자 세트. - 제76항에 있어서, 상기 gRNA, 상기 RT 공여체 RNA 또는 둘 다는 5' 말단 보호 단편 및/또는 3' 말단 보호 단편을 추가로 포함하는, 유전자 편집 RNA 분자 세트.
- 제77항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은, 선택적으로 헤어핀, 슈도노트 또는 삼중 구조인 2차 구조를 포함하거나 또는 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 엑소리보뉴클레이스-저항성 RNA(xrRNA), 전달 RNA(tRNA) 또는 절단형 tRNA인, 유전자 편집 RNA 분자 세트.
- 제77항에 있어서, 상기 5' 말단 보호 단편 및/또는 상기 3' 말단 보호 단편은 상기 CRISPR 뉴클레이스 결합 부위 중 하나 이상 및 선택적으로 임의의 인간 서열과 상동이 아닌 하나 이상의 분절을 포함하는, 유전자 편집 RNA 분자 세트.
- 제70항 내지 제79항 중 어느 한 항에 있어서,
(i) 상기 유형 V CRISPR 뉴클레이스 결합 부위는 제25항 내지 제28항 중 어느 한 항에 제시되어 있고;
(ii) 상기 스페이서 서열은 제23항 또는 제24항에 제시되어 있고;
(iii) 상기 PBS는 제33항 내지 제37항 중 어느 한 항에 제시되어 있고; 그리고/또는
(iv) 상기 주형 서열은 제38항 내지 제41항 중 어느 한 항에 제시되어 있는, 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트. - DNA 분자 또는 DNA 분자 세트로서, 제70항 내지 제80항 중 어느 한 항에 제시된 유전자 편집 RNA 분자 또는 유전자 편집 RNA 분자 세트를 암호화하는, DNA 분자 또는 DNA 분자 세트.
- 제81항에 있어서, 벡터 또는 벡터 세트에 포함되어 있으며, 선택적으로 상기 벡터 또는 벡터 세트는 바이러스 벡터인, DNA 분자 또는 DNA 분자 세트.
- CRISPR 뉴클레이스 및 역전사효소를 포함하는 융합 폴리펩타이드.
- 제83항에 있어서, 상기 CRISPR 뉴클레이스는 유형 V CRISPR 뉴클레이스이고, 선택적으로 Cas12i 폴리펩타이드인, 융합 폴리펩타이드.
- 제84항에 있어서, 상기 Cas12i 폴리펩타이드는 선택적으로 제4항 내지 제9항 중 어느 한 항에 제시되어 있는 Cas12i2 폴리펩타이드인, 융합 폴리펩타이드.
- 제85항에 있어서, 서열번호 25 내지 26 및 219 내지 223 중 어느 하나의 아미노산 서열을 포함하는, 융합 폴리펩타이드.
- 제83항 내지 제86항 중 어느 한 항의 융합 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 포함하는 핵산.
- 제87항에 있어서, 벡터, 선택적으로 발현 벡터인, 핵산.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163195621P | 2021-06-01 | 2021-06-01 | |
US63/195,621 | 2021-06-01 | ||
US202163236047P | 2021-08-23 | 2021-08-23 | |
US63/236,047 | 2021-08-23 | ||
US202163272937P | 2021-10-28 | 2021-10-28 | |
US63/272,937 | 2021-10-28 | ||
US202263299695P | 2022-01-14 | 2022-01-14 | |
US63/299,695 | 2022-01-14 | ||
PCT/US2022/031821 WO2022256440A2 (en) | 2021-06-01 | 2022-06-01 | Gene editing systems comprising a crispr nuclease and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240031238A true KR20240031238A (ko) | 2024-03-07 |
Family
ID=82492907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237044997A KR20240031238A (ko) | 2021-06-01 | 2022-06-01 | Crispr 뉴클레이스를 포함하는 유전자 편집 시스템 및 이의 용도 |
Country Status (10)
Country | Link |
---|---|
US (2) | US20230023791A1 (ko) |
EP (1) | EP4347818A2 (ko) |
JP (1) | JP2024520528A (ko) |
KR (1) | KR20240031238A (ko) |
AU (1) | AU2022284804A1 (ko) |
BR (1) | BR112023024985A2 (ko) |
CA (1) | CA3222023A1 (ko) |
IL (1) | IL308806A (ko) |
TW (1) | TW202313971A (ko) |
WO (1) | WO2022256440A2 (ko) |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
DK3401400T3 (da) | 2012-05-25 | 2019-06-03 | Univ California | Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
PT2898075E (pt) | 2012-12-12 | 2016-06-16 | Harvard College | Manipulação e otimização de sistemas, métodos e composições de enzima melhorados para manipulação de sequências |
PT2896697E (pt) | 2012-12-12 | 2015-12-31 | Massachusetts Inst Technology | Engenharia de sistemas, métodos e composições guia otimizadas para a manipulação de sequências |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
CN105658796B (zh) | 2012-12-12 | 2021-10-26 | 布罗德研究所有限公司 | 用于序列操纵的crispr-cas组分系统、方法以及组合物 |
EP2971167B1 (en) | 2013-03-14 | 2019-07-31 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
EP4245853A3 (en) | 2013-06-17 | 2023-10-18 | The Broad Institute, Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
US9834791B2 (en) | 2013-11-07 | 2017-12-05 | Editas Medicine, Inc. | CRISPR-related methods and compositions with governing gRNAS |
US9994831B2 (en) | 2013-12-12 | 2018-06-12 | The Regents Of The University Of California | Methods and compositions for modifying a single stranded target nucleic acid |
CN105899657A (zh) | 2013-12-12 | 2016-08-24 | 布罗德研究所有限公司 | 用于改变基因产物表达的crispr-cas系统和方法、结构信息以及诱导型模块化cas酶 |
WO2015089473A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
WO2015103153A1 (en) | 2013-12-31 | 2015-07-09 | The Regents Of The University Of California | Cas9 crystals and methods of use thereof |
WO2016028682A1 (en) | 2014-08-17 | 2016-02-25 | The Broad Institute Inc. | Genome editing using cas9 nickases |
WO2016036754A1 (en) | 2014-09-02 | 2016-03-10 | The Regents Of The University Of California | Methods and compositions for rna-directed target dna modification |
WO2016106239A1 (en) | 2014-12-23 | 2016-06-30 | The Regents Of The University Of California | Methods and compositions for nucleic acid integration |
WO2016186946A1 (en) | 2015-05-15 | 2016-11-24 | Pioneer Hi-Bred International, Inc. | Rapid characterization of cas endonuclease systems, pam sequences and guide rna elements |
EP3303634B1 (en) | 2015-06-03 | 2023-08-30 | The Regents of The University of California | Cas9 variants and methods of use thereof |
US20160362667A1 (en) | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
AU2016279062A1 (en) | 2015-06-18 | 2019-03-28 | Omar O. Abudayyeh | Novel CRISPR enzymes and systems |
EP3666895A1 (en) | 2015-06-18 | 2020-06-17 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US9580727B1 (en) | 2015-08-07 | 2017-02-28 | Caribou Biosciences, Inc. | Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides |
US11008555B2 (en) | 2015-09-17 | 2021-05-18 | The Regents Of The University Of California | Variant Cas9 polypeptides comprising internal insertions |
KR20180133374A (ko) | 2015-10-22 | 2018-12-14 | 더 브로드 인스티튜트, 인코퍼레이티드 | 타입 vi-b crispr 효소 및 시스템 |
ES2699848T3 (es) | 2015-10-23 | 2019-02-13 | Caribou Biosciences Inc | Acido nucleico CRISPR clase 2 de tipo cruzado modificado que se dirige a ácidos nucleicos |
US9771600B2 (en) | 2015-12-04 | 2017-09-26 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
EP3390624A4 (en) | 2015-12-18 | 2019-07-10 | The Regents of The University of California | MODIFIED POLYPEPTIDES AND METHOD OF USE THEREOF |
WO2017106657A1 (en) | 2015-12-18 | 2017-06-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
KR102670601B1 (ko) | 2016-04-19 | 2024-05-29 | 더 브로드 인스티튜트, 인코퍼레이티드 | 신규한 crispr 효소 및 시스템 |
AU2017257274B2 (en) | 2016-04-19 | 2023-07-13 | Massachusetts Institute Of Technology | Novel CRISPR enzymes and systems |
JP7267013B2 (ja) | 2016-06-17 | 2023-05-01 | ザ・ブロード・インスティテュート・インコーポレイテッド | Vi型crisprオルソログ及び系 |
CN110114461A (zh) | 2016-08-17 | 2019-08-09 | 博德研究所 | 新型crispr酶和系统 |
WO2018035387A1 (en) | 2016-08-17 | 2018-02-22 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
KR20230169449A (ko) | 2016-09-30 | 2023-12-15 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | Rna-가이드된 핵산 변형 효소 및 이의 사용 방법 |
AU2017335890B2 (en) | 2016-09-30 | 2024-05-09 | The Regents Of The University Of California | RNA-guided nucleic acid modifying enzymes and methods of use thereof |
EP3526326A4 (en) | 2016-10-12 | 2020-07-29 | The Regents of The University of Colorado, A Body Corporate | NEW MODIFIED AND CHEMERICAL NUCLEASES |
WO2018089664A1 (en) | 2016-11-11 | 2018-05-17 | The Regents Of The University Of California | Variant rna-guided polypeptides and methods of use |
US9816093B1 (en) | 2016-12-06 | 2017-11-14 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
CA3056236A1 (en) | 2017-03-15 | 2018-09-20 | The Broad Institute, Inc. | Novel cas13b orthologues crispr enzymes and systems |
PT3526324T (pt) | 2017-03-28 | 2021-10-20 | Locanabio Inc | Proteína associada a crispr (cas) |
WO2018191388A1 (en) | 2017-04-12 | 2018-10-18 | The Broad Institute, Inc. | Novel type vi crispr orthologs and systems |
US11692184B2 (en) | 2017-05-16 | 2023-07-04 | The Regents Of The University Of California | Thermostable RNA-guided endonucleases and methods of use thereof |
WO2018226855A1 (en) | 2017-06-06 | 2018-12-13 | The General Hospital Corporation | Engineered crispr-cas9 nucleases |
RU2022103603A (ru) | 2017-06-23 | 2022-03-11 | Инскрипта, Инк. | Направляемые нуклеиновыми кислотами нуклеазы |
EP3645728A4 (en) | 2017-06-26 | 2021-03-24 | The Broad Institute, Inc. | NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS |
US11168322B2 (en) | 2017-06-30 | 2021-11-09 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
US20200231975A1 (en) | 2017-07-17 | 2020-07-23 | The Broad Institute, Inc. | Novel type vi crispr orthologs and systems |
US20200115688A1 (en) | 2017-08-15 | 2020-04-16 | The Regents Of The University Of California | Compositions and methods for enhancing genome editing |
EP3692145A4 (en) | 2017-10-04 | 2021-11-24 | The Broad Institute, Inc. | NUCLEIC ACID TARGETED EDITING SYSTEMS, METHODS AND COMPOSITIONS |
US20200255858A1 (en) | 2017-11-01 | 2020-08-13 | Jillian F. Banfield | Casy compositions and methods of use |
EP3704239A4 (en) | 2017-11-01 | 2021-08-18 | The Regents of The University of California | CASZ COMPOSITIONS AND METHOD OF USE |
JP2021501611A (ja) | 2017-11-01 | 2021-01-21 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Cas12c組成物及び使用方法 |
US11970719B2 (en) | 2017-11-01 | 2024-04-30 | The Regents Of The University Of California | Class 2 CRISPR/Cas compositions and methods of use |
US10253365B1 (en) | 2017-11-22 | 2019-04-09 | The Regents Of The University Of California | Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs |
WO2019126762A2 (en) | 2017-12-22 | 2019-06-27 | The Broad Institute, Inc. | Cas12a systems, methods, and compositions for targeted rna base editing |
US20200392473A1 (en) | 2017-12-22 | 2020-12-17 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2019173248A1 (en) | 2018-03-07 | 2019-09-12 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
DE202019005567U1 (de) * | 2018-03-14 | 2021-02-16 | Arbor Biotechnologies, Inc. | Neue CRISPR-DNA-Targeting-Enzyme und -Systeme |
WO2019178428A1 (en) | 2018-03-14 | 2019-09-19 | Arbor Biotechnologies, Inc. | Novel crispr dna and rna targeting enzymes and systems |
US20210198664A1 (en) | 2018-05-16 | 2021-07-01 | Arbor Biotechnologies, Inc. | Novel crispr-associated systems and components |
WO2019241452A1 (en) | 2018-06-13 | 2019-12-19 | Caribou Biosciences, Inc. | Engineered cascade components and cascade complexes |
EP3814488A4 (en) | 2018-06-26 | 2022-06-22 | The Regents of The University of California | RNA-GUIDED EFFECTIVE PROTEINS AND METHODS OF USE THEREOF |
WO2020018142A1 (en) | 2018-07-16 | 2020-01-23 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
US20210284981A1 (en) | 2018-07-24 | 2021-09-16 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
SG11202102068TA (en) | 2018-07-31 | 2021-03-30 | Broad Inst Inc | Novel crispr enzymes and systems |
EP3830301B1 (en) | 2018-08-01 | 2024-05-22 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
WO2020033601A1 (en) | 2018-08-07 | 2020-02-13 | The Broad Institute, Inc. | Novel cas12b enzymes and systems |
WO2020041456A1 (en) | 2018-08-22 | 2020-02-27 | The Regents Of The University Of California | Variant type v crispr/cas effector polypeptides and methods of use thereof |
EP3870697A4 (en) | 2018-10-22 | 2022-11-09 | Inscripta, Inc. | MODIFIED ENZYMES |
WO2020142754A2 (en) | 2019-01-04 | 2020-07-09 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
US20220049273A1 (en) | 2019-03-01 | 2022-02-17 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
CN114040971A (zh) | 2019-03-07 | 2022-02-11 | 加利福尼亚大学董事会 | CRISPR-Cas效应子多肽及其使用方法 |
EP4219700A1 (en) | 2019-03-07 | 2023-08-02 | The Regents of the University of California | Crispr-cas effector polypeptides and methods of use thereof |
US20220154222A1 (en) | 2019-03-14 | 2022-05-19 | The Broad Institute, Inc. | Novel nucleic acid modifiers |
US20220177863A1 (en) | 2019-03-18 | 2022-06-09 | The Broad Institute, Inc. | Type vii crispr proteins and systems |
DE112020001342T5 (de) * | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
US20220153779A1 (en) | 2019-03-22 | 2022-05-19 | The Regents Of The University Of California | Compositions and methods for modification of target molecules |
WO2020206036A1 (en) | 2019-04-01 | 2020-10-08 | The Broad Institute, Inc. | Novel nucleic acid modifier |
MX2021013302A (es) | 2019-05-01 | 2022-01-31 | Mammoth Biosciences Inc | Nucleasas programables y metodos de uso. |
WO2020247883A2 (en) | 2019-06-07 | 2020-12-10 | Scribe Therapeutics Inc. | Deep mutational evolution of biomolecules |
CN114375334A (zh) | 2019-06-07 | 2022-04-19 | 斯克里贝治疗公司 | 工程化CasX系统 |
CA3142019A1 (en) | 2019-06-14 | 2020-12-17 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
US20220315914A1 (en) | 2019-07-08 | 2022-10-06 | The Regents Of The University Of California | Variant type v crispr/cas effector polypeptides and methods of use thereof |
JP2022540153A (ja) | 2019-07-11 | 2022-09-14 | アーバー バイオテクノロジーズ, インコーポレイテッド | 新規crispr dnaターゲティング酵素及びシステム |
US20230016656A1 (en) | 2019-08-27 | 2023-01-19 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
CA3153005A1 (en) | 2019-09-05 | 2021-03-11 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
CN114340657A (zh) | 2019-09-09 | 2022-04-12 | 阿伯生物技术公司 | 新型crispr dna靶向酶及系统 |
US20230025039A1 (en) | 2019-09-20 | 2023-01-26 | The Broad Institute, Inc. | Novel type vi crispr enzymes and systems |
JP2023505600A (ja) * | 2019-11-05 | 2023-02-09 | ペアーワイズ プランツ サービシズ, インコーポレイテッド | 対立遺伝子のrnaにコードされたdnaの置換のための組成物および方法 |
WO2021113522A1 (en) | 2019-12-04 | 2021-06-10 | Arbor Biotechnologies, Inc. | Compositions comprising a nuclease and uses thereof |
EP4069837A4 (en) | 2019-12-10 | 2024-03-13 | Inscripta, Inc. | NEW MAD NUCLEASES |
US10704033B1 (en) | 2019-12-13 | 2020-07-07 | Inscripta, Inc. | Nucleic acid-guided nucleases |
WO2021133829A1 (en) | 2019-12-23 | 2021-07-01 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
US20230332119A1 (en) * | 2020-03-31 | 2023-10-19 | Arbor Biotechnologies, Inc. | Compositions comprising a cas12i2 variant polypeptide and uses thereof |
-
2022
- 2022-06-01 EP EP22741037.0A patent/EP4347818A2/en active Pending
- 2022-06-01 CA CA3222023A patent/CA3222023A1/en active Pending
- 2022-06-01 BR BR112023024985A patent/BR112023024985A2/pt unknown
- 2022-06-01 US US17/830,212 patent/US20230023791A1/en active Pending
- 2022-06-01 WO PCT/US2022/031821 patent/WO2022256440A2/en active Application Filing
- 2022-06-01 KR KR1020237044997A patent/KR20240031238A/ko unknown
- 2022-06-01 IL IL308806A patent/IL308806A/en unknown
- 2022-06-01 US US18/565,148 patent/US20240102007A1/en active Pending
- 2022-06-01 AU AU2022284804A patent/AU2022284804A1/en active Pending
- 2022-06-01 TW TW111120437A patent/TW202313971A/zh unknown
- 2022-06-01 JP JP2023573350A patent/JP2024520528A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4347818A2 (en) | 2024-04-10 |
AU2022284804A1 (en) | 2023-12-07 |
AU2022284804A9 (en) | 2023-12-14 |
BR112023024985A2 (pt) | 2024-02-20 |
CA3222023A1 (en) | 2022-12-08 |
US20240102007A1 (en) | 2024-03-28 |
IL308806A (en) | 2024-01-01 |
TW202313971A (zh) | 2023-04-01 |
WO2022256440A3 (en) | 2023-02-09 |
JP2024520528A (ja) | 2024-05-24 |
WO2022256440A2 (en) | 2022-12-08 |
US20230023791A1 (en) | 2023-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115698278A (zh) | 包含Cas12i2变体多肽的组合物及其用途 | |
JP2021517815A (ja) | Cas9塩基エディターを使用するリンパ球造血系操作 | |
US20240093228A1 (en) | Compositions comprising a nuclease and uses thereof | |
US20230287456A1 (en) | Compositions comprising a cas12i polypeptide and uses thereof | |
US20230203539A1 (en) | Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof | |
JP2023549084A (ja) | Pdcd1を標的とするrnaガイドを含む組成物及びその使用 | |
US20240102007A1 (en) | Gene editing systems comprising a crispr nuclease and uses thereof | |
CN116507629A (zh) | Rna支架 | |
CN117813379A (zh) | 包括crispr核酸酶的基因编辑系统和其用途 | |
US20230193243A1 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof | |
US20230059141A1 (en) | Gene editing systems comprising a nuclease and uses thereof | |
US20230399639A1 (en) | Compositions comprising an rna guide targeting b2m and uses thereof | |
JP2023549080A (ja) | Bcl11aを標的とするrnaガイドを含む組成物及びその使用 | |
JP2023548588A (ja) | Tracを標的とするrnaガイドを含む組成物及びその使用 | |
WO2024118747A1 (en) | Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof | |
JP2024520691A (ja) | ヒドロキシ酸オキシダーゼ1(hao1)を標的とするrnaガイドを含む遺伝子編集システム及びそれらの使用 | |
TW202334421A (zh) | 包含靶向ciita之rna引導之組合物及其用途 | |
CN118019846A (zh) | 包含crispr核酸酶的组合物及其用途 | |
JP2023539569A (ja) | ヌクレアーゼを含む組成物及びその使用 | |
TW202321447A (zh) | 包含crispr核酸酶之組成物及其用途 | |
WO2023019243A1 (en) | Compositions comprising a variant cas12i3 polypeptide and uses thereof | |
WO2023086938A2 (en) | Type v nucleases | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 |