TW202313971A - 包含crispr核酸酶的基因編輯系統及其用途 - Google Patents
包含crispr核酸酶的基因編輯系統及其用途 Download PDFInfo
- Publication number
- TW202313971A TW202313971A TW111120437A TW111120437A TW202313971A TW 202313971 A TW202313971 A TW 202313971A TW 111120437 A TW111120437 A TW 111120437A TW 111120437 A TW111120437 A TW 111120437A TW 202313971 A TW202313971 A TW 202313971A
- Authority
- TW
- Taiwan
- Prior art keywords
- nucleotides
- sequence
- gene editing
- rna
- polypeptide
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 416
- 238000010362 genome editing Methods 0.000 title claims abstract description 260
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 68
- 102100034343 Integrase Human genes 0.000 claims abstract description 346
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 334
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 331
- 229920001184 polypeptide Polymers 0.000 claims abstract description 326
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims abstract description 325
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 175
- 230000027455 binding Effects 0.000 claims abstract description 161
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 156
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 156
- 238000010839 reverse transcription Methods 0.000 claims abstract description 109
- 125000006850 spacer group Chemical group 0.000 claims abstract description 66
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 59
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 53
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 38
- 125000003729 nucleotide group Chemical group 0.000 claims description 1357
- 239000002773 nucleotide Substances 0.000 claims description 1313
- 239000012634 fragment Substances 0.000 claims description 84
- 238000006467 substitution reaction Methods 0.000 claims description 71
- 230000004927 fusion Effects 0.000 claims description 68
- 239000013598 vector Substances 0.000 claims description 67
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 64
- 108020004414 DNA Proteins 0.000 claims description 54
- 102000053602 DNA Human genes 0.000 claims description 52
- 230000000295 complement effect Effects 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 40
- 230000000694 effects Effects 0.000 claims description 35
- 230000004048 modification Effects 0.000 claims description 35
- 238000012986 modification Methods 0.000 claims description 35
- 230000035772 mutation Effects 0.000 claims description 35
- 230000008685 targeting Effects 0.000 claims description 32
- 108020004566 Transfer RNA Proteins 0.000 claims description 30
- 238000011144 upstream manufacturing Methods 0.000 claims description 29
- 239000013603 viral vector Substances 0.000 claims description 25
- 108020004999 messenger RNA Proteins 0.000 claims description 17
- 102000004678 Exoribonucleases Human genes 0.000 claims description 10
- 108010002700 Exoribonucleases Proteins 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 9
- 230000002068 genetic effect Effects 0.000 claims description 9
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 8
- 230000002829 reductive effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 150000002632 lipids Chemical class 0.000 claims description 6
- 239000002105 nanoparticle Substances 0.000 claims description 6
- 239000008194 pharmaceutical composition Substances 0.000 claims description 6
- 230000001681 protective effect Effects 0.000 claims description 4
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 3
- 238000000338 in vitro Methods 0.000 claims description 3
- 241000713333 Mouse mammary tumor virus Species 0.000 claims description 2
- 229920002477 rna polymer Polymers 0.000 description 365
- 210000004027 cell Anatomy 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 47
- 230000004568 DNA-binding Effects 0.000 description 46
- 108090000623 proteins and genes Proteins 0.000 description 40
- 108091028043 Nucleic acid sequence Proteins 0.000 description 35
- 238000003780 insertion Methods 0.000 description 30
- 230000037431 insertion Effects 0.000 description 30
- 239000002253 acid Substances 0.000 description 29
- 239000000203 mixture Substances 0.000 description 29
- 238000012217 deletion Methods 0.000 description 28
- 230000037430 deletion Effects 0.000 description 28
- 102000040430 polynucleotide Human genes 0.000 description 28
- 108091033319 polynucleotide Proteins 0.000 description 28
- 239000002157 polynucleotide Substances 0.000 description 28
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 20
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 20
- 108010061833 Integrases Proteins 0.000 description 18
- 102000018120 Recombinases Human genes 0.000 description 18
- 108010091086 Recombinases Proteins 0.000 description 18
- 241000700605 Viruses Species 0.000 description 16
- 125000005647 linker group Chemical group 0.000 description 16
- 102000004169 proteins and genes Human genes 0.000 description 16
- 108091079001 CRISPR RNA Proteins 0.000 description 15
- 230000014509 gene expression Effects 0.000 description 15
- 210000004899 c-terminal region Anatomy 0.000 description 14
- 235000004252 protein component Nutrition 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- -1 vectors Chemical class 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 239000002777 nucleoside Substances 0.000 description 13
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 238000006471 dimerization reaction Methods 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 125000003835 nucleoside group Chemical group 0.000 description 11
- 102000003960 Ligases Human genes 0.000 description 10
- 108090000364 Ligases Proteins 0.000 description 10
- 108091023037 Aptamer Proteins 0.000 description 9
- 108010042407 Endonucleases Proteins 0.000 description 8
- 238000010348 incorporation Methods 0.000 description 8
- 108700004991 Cas12a Proteins 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 7
- 229910019142 PO4 Inorganic materials 0.000 description 7
- 230000002255 enzymatic effect Effects 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 108060002716 Exonuclease Proteins 0.000 description 6
- 101710203526 Integrase Proteins 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- 102000013165 exonuclease Human genes 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 229930182470 glycoside Natural products 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- 230000026279 RNA modification Effects 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 3
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 3
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 3
- 101710145992 B-cell lymphoma/leukemia 11A Proteins 0.000 description 3
- 102100024263 CD160 antigen Human genes 0.000 description 3
- 102100037249 Egl nine homolog 1 Human genes 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 3
- 101000761938 Homo sapiens CD160 antigen Proteins 0.000 description 3
- 102000002698 KIR Receptors Human genes 0.000 description 3
- 108010043610 KIR Receptors Proteins 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 102100037248 Prolyl hydroxylase EGLN2 Human genes 0.000 description 3
- 102100037247 Prolyl hydroxylase EGLN3 Human genes 0.000 description 3
- 241000723670 Red clover necrotic mosaic virus Species 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 241001135988 Sweet clover necrotic mosaic virus Species 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 108010070387 guanylate cyclase 1 Proteins 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000011191 terminal modification Methods 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 description 2
- GNKZMNRKLCTJAY-UHFFFAOYSA-N 4'-Methylacetophenone Chemical compound CC(=O)C1=CC=C(C)C=C1 GNKZMNRKLCTJAY-UHFFFAOYSA-N 0.000 description 2
- 108010071258 4-hydroxy-2-oxoglutarate aldolase Proteins 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 2
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000713838 Avian myeloblastosis virus Species 0.000 description 2
- 108010074708 B7-H1 Antigen Proteins 0.000 description 2
- 102100038078 CD276 antigen Human genes 0.000 description 2
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 2
- 108010069682 CSK Tyrosine-Protein Kinase Proteins 0.000 description 2
- 102000008203 CTLA-4 Antigen Human genes 0.000 description 2
- 108010021064 CTLA-4 Antigen Proteins 0.000 description 2
- 241000723666 Carnation ringspot virus Species 0.000 description 2
- 108090000397 Caspase 3 Proteins 0.000 description 2
- 102000004018 Caspase 6 Human genes 0.000 description 2
- 108090000425 Caspase 6 Proteins 0.000 description 2
- 108090000567 Caspase 7 Proteins 0.000 description 2
- 102100026549 Caspase-10 Human genes 0.000 description 2
- 108090000572 Caspase-10 Proteins 0.000 description 2
- 102100029855 Caspase-3 Human genes 0.000 description 2
- 102100038902 Caspase-7 Human genes 0.000 description 2
- 102100026548 Caspase-8 Human genes 0.000 description 2
- 108090000538 Caspase-8 Proteins 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 2
- 102100027816 Cytotoxic and regulatory T-cell molecule Human genes 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- FLFGNMFWNBOBGE-FNNZEKJRSA-N Elacytarabine Chemical compound O[C@H]1[C@H](O)[C@@H](COC(=O)CCCCCCC/C=C/CCCCCCCC)O[C@H]1N1C(=O)N=C(N)C=C1 FLFGNMFWNBOBGE-FNNZEKJRSA-N 0.000 description 2
- 241000709744 Enterobacterio phage MS2 Species 0.000 description 2
- 102100026693 FAS-associated death domain protein Human genes 0.000 description 2
- 102100027581 Forkhead box protein P3 Human genes 0.000 description 2
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 102100030648 Glyoxylate reductase/hydroxypyruvate reductase Human genes 0.000 description 2
- 101710200205 Glyoxylate reductase/hydroxypyruvate reductase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 2
- 101000881648 Homo sapiens Egl nine homolog 1 Proteins 0.000 description 2
- 101000911074 Homo sapiens FAS-associated death domain protein Proteins 0.000 description 2
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 description 2
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 2
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 2
- 101000687344 Homo sapiens PR domain zinc finger protein 1 Proteins 0.000 description 2
- 101000881650 Homo sapiens Prolyl hydroxylase EGLN2 Proteins 0.000 description 2
- 101000881678 Homo sapiens Prolyl hydroxylase EGLN3 Proteins 0.000 description 2
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 2
- 101000863692 Homo sapiens Ski oncogene Proteins 0.000 description 2
- 101000688996 Homo sapiens Ski-like protein Proteins 0.000 description 2
- 101000596234 Homo sapiens T-cell surface protein tactile Proteins 0.000 description 2
- 101000712669 Homo sapiens TGF-beta receptor type-2 Proteins 0.000 description 2
- 101000666896 Homo sapiens V-type immunoglobulin domain-containing suppressor of T-cell activation Proteins 0.000 description 2
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 2
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 2
- 102100040061 Indoleamine 2,3-dioxygenase 1 Human genes 0.000 description 2
- 101710120843 Indoleamine 2,3-dioxygenase 1 Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 102100030236 Interleukin-10 receptor subunit alpha Human genes 0.000 description 2
- 102100020788 Interleukin-10 receptor subunit beta Human genes 0.000 description 2
- 101710199214 Interleukin-10 receptor subunit beta Proteins 0.000 description 2
- 108010038501 Interleukin-6 Receptors Proteins 0.000 description 2
- 102100037792 Interleukin-6 receptor subunit alpha Human genes 0.000 description 2
- 102100037795 Interleukin-6 receptor subunit beta Human genes 0.000 description 2
- 101710152369 Interleukin-6 receptor subunit beta Proteins 0.000 description 2
- 102100034671 L-lactate dehydrogenase A chain Human genes 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 108010088350 Lactate Dehydrogenase 5 Proteins 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 102100020943 Leukocyte-associated immunoglobulin-like receptor 1 Human genes 0.000 description 2
- 241000213996 Melilotus Species 0.000 description 2
- 235000000839 Melilotus officinalis subsp suaveolens Nutrition 0.000 description 2
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 2
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 2
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 description 2
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 description 2
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 2
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 102100038082 Natural killer cell receptor 2B4 Human genes 0.000 description 2
- OSRWYQUSDMUYBS-UHFFFAOYSA-N OBO.OP(O)(O)=O Chemical compound OBO.OP(O)(O)=O OSRWYQUSDMUYBS-UHFFFAOYSA-N 0.000 description 2
- 102100024894 PR domain zinc finger protein 1 Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010071690 Prealbumin Proteins 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 102100024216 Programmed cell death 1 ligand 1 Human genes 0.000 description 2
- 102100040678 Programmed cell death protein 1 Human genes 0.000 description 2
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 2
- 102000000279 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 2
- 108050008721 Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 101000844752 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) DNA-binding protein 7d Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 2
- 102100029969 Ski oncogene Human genes 0.000 description 2
- 102100024451 Ski-like protein Human genes 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 230000006044 T cell activation Effects 0.000 description 2
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 2
- 108091008874 T cell receptors Proteins 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 102100035268 T-cell surface protein tactile Human genes 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 102100033456 TGF-beta receptor type-1 Human genes 0.000 description 2
- 102100033455 TGF-beta receptor type-2 Human genes 0.000 description 2
- 108091007178 TNFRSF10A Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108010011702 Transforming Growth Factor-beta Type I Receptor Proteins 0.000 description 2
- 102000009190 Transthyretin Human genes 0.000 description 2
- 235000015724 Trifolium pratense Nutrition 0.000 description 2
- 102100040113 Tumor necrosis factor receptor superfamily member 10A Human genes 0.000 description 2
- 102100040112 Tumor necrosis factor receptor superfamily member 10B Human genes 0.000 description 2
- 101710178278 Tumor necrosis factor receptor superfamily member 10B Proteins 0.000 description 2
- 102100031167 Tyrosine-protein kinase CSK Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 description 2
- 102100038282 V-type immunoglobulin domain-containing suppressor of T-cell activation Human genes 0.000 description 2
- 208000020329 Zika virus infectious disease Diseases 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 101150010487 are gene Proteins 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 2
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 2
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 108010052621 fas Receptor Proteins 0.000 description 2
- 102000018823 fas Receptor Human genes 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010062584 glycollate oxidase Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 102000006639 indoleamine 2,3-dioxygenase Human genes 0.000 description 2
- 108020004201 indoleamine 2,3-dioxygenase Proteins 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010025001 leukocyte-associated immunoglobulin-like receptor 1 Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000001338 necrotic effect Effects 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 229940096913 pseudoisocytidine Drugs 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 235000013526 red clover Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- OYTVCAGSWWRUII-DWJKKKFUSA-N 1-Methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=O)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O OYTVCAGSWWRUII-DWJKKKFUSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- JPSUPBADUYKBMS-BQEQVSEESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(docosylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 JPSUPBADUYKBMS-BQEQVSEESA-N 0.000 description 1
- HQHQCEKUGWOYPS-URBBEOKESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(octadecylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 HQHQCEKUGWOYPS-URBBEOKESA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- CWXIOHYALLRNSZ-JWMKEVCDSA-N 2-Thiodihydropseudouridine Chemical compound C1C(C(=O)NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O CWXIOHYALLRNSZ-JWMKEVCDSA-N 0.000 description 1
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 description 1
- CDSZITPHFYDYIK-UHFFFAOYSA-N 2-[[ethyl(2-methylpropoxy)phosphinothioyl]sulfanylmethyl]isoindole-1,3-dione Chemical compound C1=CC=C2C(=O)N(CSP(=S)(OCC(C)C)CC)C(=O)C2=C1 CDSZITPHFYDYIK-UHFFFAOYSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- WBVPJIKOWUQTSD-ZOQUXTDFSA-N 2-methoxyuridine Chemical compound COC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WBVPJIKOWUQTSD-ZOQUXTDFSA-N 0.000 description 1
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 description 1
- VRVXMIJPUBNPGH-XVFCMESISA-N 2-thio-dihydrouridine Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)N1CCC(=O)NC1=S VRVXMIJPUBNPGH-XVFCMESISA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- HLLSOEKIMZEGFV-UHFFFAOYSA-N 4-(dibutylsulfamoyl)benzoic acid Chemical compound CCCCN(CCCC)S(=O)(=O)C1=CC=C(C(O)=O)C=C1 HLLSOEKIMZEGFV-UHFFFAOYSA-N 0.000 description 1
- ZSIINYPBPQCZKU-BQNZPOLKSA-O 4-Methoxy-1-methylpseudoisocytidine Chemical compound C[N+](CC1[C@H]([C@H]2O)O[C@@H](CO)[C@@H]2O)=C(N)N=C1OC ZSIINYPBPQCZKU-BQNZPOLKSA-O 0.000 description 1
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 description 1
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DMUQOPXCCOBPID-XUTVFYLZSA-N 4-Thio-1-methylpseudoisocytidine Chemical compound CN1C=C(C(=S)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O DMUQOPXCCOBPID-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- PULHLIOPJXPGJN-BWVDBABLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)-3-methylideneoxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C)[C@H](O)[C@@H](CO)O1 PULHLIOPJXPGJN-BWVDBABLSA-N 0.000 description 1
- GCNTZFIIOFTKIY-UHFFFAOYSA-N 4-hydroxypyridine Chemical compound OC1=CC=NC=C1 GCNTZFIIOFTKIY-UHFFFAOYSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- FIWQPTRUVGSKOD-UHFFFAOYSA-N 4-thio-1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=S FIWQPTRUVGSKOD-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- CBNRZZNSRJQZNT-IOSLPCCCSA-O 6-thio-7-deaza-guanosine Chemical compound CC1=C[NH+]([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C(NC(N)=N2)=C1C2=S CBNRZZNSRJQZNT-IOSLPCCCSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 102000007471 Adenosine A2A receptor Human genes 0.000 description 1
- 108010085277 Adenosine A2A receptor Proteins 0.000 description 1
- 102000008102 Ankyrins Human genes 0.000 description 1
- 108010049777 Ankyrins Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 description 1
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 102100027207 CD27 antigen Human genes 0.000 description 1
- 101710185679 CD276 antigen Proteins 0.000 description 1
- 101150013553 CD40 gene Proteins 0.000 description 1
- DCYBPMFXJCWXNB-JWIUVKOKSA-N CNDAC Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](C#N)[C@H](O)[C@@H](CO)O1 DCYBPMFXJCWXNB-JWIUVKOKSA-N 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101150066398 CXCR4 gene Proteins 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 102100034229 Citramalyl-CoA lyase, mitochondrial Human genes 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 101710167716 Cytotoxic and regulatory T-cell molecule Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- 101710111663 Egl nine homolog 1 Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 102100040739 Guanylate cyclase soluble subunit beta-1 Human genes 0.000 description 1
- 108010078851 HIV Reverse Transcriptase Proteins 0.000 description 1
- 102100028008 Heme oxygenase 2 Human genes 0.000 description 1
- 241000709721 Hepatovirus A Species 0.000 description 1
- 102100035081 Homeobox protein TGIF1 Human genes 0.000 description 1
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 1
- 101000884279 Homo sapiens CD276 antigen Proteins 0.000 description 1
- 101000710917 Homo sapiens Citramalyl-CoA lyase, mitochondrial Proteins 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 101001038731 Homo sapiens Guanylate cyclase soluble subunit beta-1 Proteins 0.000 description 1
- 101001079615 Homo sapiens Heme oxygenase 2 Proteins 0.000 description 1
- 101000596925 Homo sapiens Homeobox protein TGIF1 Proteins 0.000 description 1
- 101001083151 Homo sapiens Interleukin-10 receptor subunit alpha Proteins 0.000 description 1
- 101001055145 Homo sapiens Interleukin-2 receptor subunit beta Proteins 0.000 description 1
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 1
- 101000836954 Homo sapiens Sialic acid-binding Ig-like lectin 10 Proteins 0.000 description 1
- 101000697510 Homo sapiens Stathmin-2 Proteins 0.000 description 1
- 101000634853 Homo sapiens T cell receptor alpha chain constant Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 101000801234 Homo sapiens Tumor necrosis factor receptor superfamily member 18 Proteins 0.000 description 1
- 101000851370 Homo sapiens Tumor necrosis factor receptor superfamily member 9 Proteins 0.000 description 1
- 101000955999 Homo sapiens V-set domain-containing T-cell activation inhibitor 1 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 1
- 108091008036 Immune checkpoint proteins Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 101710146672 Interleukin-10 receptor subunit alpha Proteins 0.000 description 1
- 102100026879 Interleukin-2 receptor subunit beta Human genes 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000017578 LAG3 Human genes 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 101710197058 Lectin 7 Proteins 0.000 description 1
- 101710197064 Lectin 9 Proteins 0.000 description 1
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 102100020862 Lymphocyte activation gene 3 protein Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102000043131 MHC class II family Human genes 0.000 description 1
- 108091054438 MHC class II family Proteins 0.000 description 1
- 108700002010 MHC class II transactivator Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-N Metaphosphoric acid Chemical compound OP(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-N 0.000 description 1
- 102000029749 Microtubule Human genes 0.000 description 1
- 108091022875 Microtubule Proteins 0.000 description 1
- 102000006833 Multifunctional Enzymes Human genes 0.000 description 1
- 108010047290 Multifunctional Enzymes Proteins 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- 102000004722 NADPH Oxidases Human genes 0.000 description 1
- 108010002998 NADPH Oxidases Proteins 0.000 description 1
- IIHXWNBJSQOEIO-TURQNECASA-N NCCS(=O)(=O)Cc1cn([C@@H]2O[C@H](CO)[C@@H](O)[C@H]2O)c(=S)[nH]c1=O Chemical compound NCCS(=O)(=O)Cc1cn([C@@H]2O[C@H](CO)[C@@H](O)[C@H]2O)c(=S)[nH]c1=O IIHXWNBJSQOEIO-TURQNECASA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 101710141230 Natural killer cell receptor 2B4 Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- TTZMPOZCBFTTPR-UHFFFAOYSA-N O=P1OCO1 Chemical compound O=P1OCO1 TTZMPOZCBFTTPR-UHFFFAOYSA-N 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108090000417 Oxygenases Proteins 0.000 description 1
- 102000004020 Oxygenases Human genes 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 108010089430 Phosphoproteins Proteins 0.000 description 1
- 102000007982 Phosphoproteins Human genes 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- 101150044917 Prl3b1 gene Proteins 0.000 description 1
- 101150113550 Prl3d1 gene Proteins 0.000 description 1
- 108010043005 Prolyl Hydroxylases Proteins 0.000 description 1
- 102000004079 Prolyl Hydroxylases Human genes 0.000 description 1
- 101710170760 Prolyl hydroxylase EGLN2 Proteins 0.000 description 1
- 101710170720 Prolyl hydroxylase EGLN3 Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091008103 RNA aptamers Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000712909 Reticuloendotheliosis virus Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 241000700141 Rotifera Species 0.000 description 1
- AOJVRZDSVISDLJ-WOUKDFQISA-N S(=O)(=O)(CCN)C=1C(NC(N([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C1)=O)=O Chemical compound S(=O)(=O)(CCN)C=1C(NC(N([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C1)=O)=O AOJVRZDSVISDLJ-WOUKDFQISA-N 0.000 description 1
- XIIBZNWQLXBQCC-HNBLOZHYSA-N S(=O)(=O)(CCN)N1C=C([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C(NC1=O)=O Chemical compound S(=O)(=O)(CCN)N1C=C([C@]2([C@H](O)[C@H](O)[C@@H](CO)O2)C)C(NC1=O)=O XIIBZNWQLXBQCC-HNBLOZHYSA-N 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 102100027164 Sialic acid-binding Ig-like lectin 10 Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 102000005465 Stathmin Human genes 0.000 description 1
- 108050003387 Stathmin Proteins 0.000 description 1
- 102100028051 Stathmin-2 Human genes 0.000 description 1
- 241000205091 Sulfolobus solfataricus Species 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 1
- 102100033728 Tumor necrosis factor receptor superfamily member 18 Human genes 0.000 description 1
- 102100022153 Tumor necrosis factor receptor superfamily member 4 Human genes 0.000 description 1
- 101710165473 Tumor necrosis factor receptor superfamily member 4 Proteins 0.000 description 1
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 1
- 102100036856 Tumor necrosis factor receptor superfamily member 9 Human genes 0.000 description 1
- 241001069823 UR2 sarcoma virus Species 0.000 description 1
- 108010079206 V-Set Domain-Containing T-Cell Activation Inhibitor 1 Proteins 0.000 description 1
- OIRDTQYFTABQOQ-UHTZMRCNSA-N Vidarabine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1O OIRDTQYFTABQOQ-UHTZMRCNSA-N 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000714476 Y73 sarcoma virus Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 241001531188 [Eubacterium] rectale Species 0.000 description 1
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000005266 avian sarcoma Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- FUHMZYWBSHTEDZ-UHFFFAOYSA-M bispyribac-sodium Chemical compound [Na+].COC1=CC(OC)=NC(OC=2C(=C(OC=3N=C(OC)C=C(OC)N=3)C=CC=2)C([O-])=O)=N1 FUHMZYWBSHTEDZ-UHFFFAOYSA-M 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 108010072917 class-I restricted T cell-associated molecule Proteins 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 101150037603 cst-1 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229960000684 cytarabine Drugs 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 210000005220 cytoplasmic tail Anatomy 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000925 erythroid effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- IJJVMEJXYNJXOJ-UHFFFAOYSA-N fluquinconazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1N1C(=O)C2=CC(F)=CC=C2N=C1N1C=NC=N1 IJJVMEJXYNJXOJ-UHFFFAOYSA-N 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 102000027596 immune receptors Human genes 0.000 description 1
- 108091008915 immune receptors Proteins 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 210000004688 microtubule Anatomy 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-N phosphoramidic acid Chemical compound NP(O)(O)=O PTMHPRAIXMAOOB-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 230000005758 transcription activity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 150000005691 triesters Chemical class 0.000 description 1
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960003636 vidarabine Drugs 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07049—RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicinal Preparation (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
揭露了一種基因編輯系統,其包含:(a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸;(b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸;(c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
Description
相關申請的交叉引用。本申請根據35 U.S.C. § 119(e) 要求2021年6月1日提交的美國臨時申請案號63/195,621、2021年8月23日提交的美國臨時申請案號63/236,047、2021年10月28日提交的美國臨時申請案號63/272,937和2022年1月14日提交的美國臨時申請案號63/299,695的權益,將每一篇文獻的內容藉由引用以其全文併入本文。
序列表。本申請含有一份已經以ASCII格式電子提交的序列表並且將該序列表藉由引用以其全文特此併入。創建於2022年5月30日的所述ASCII副本名為116928-0042-0001WO00_SEQ.txt且大小為385,353位元組。
本發明關於一種包含CRISPR核酸酶的基因編輯系統及其用途。
規律間隔重複短迴文序列簇(CRISPR)和CRISPR相關(Cas)基因(統稱為CRISPR-Cas或CRISPR/Cas系統)係古細菌和細菌中針對外來遺傳元件而防禦特定物種的適應性免疫系統。
本揭露至少部分基於基因編輯系統的開發,該基因編輯系統涉及V型CRISPR核酸酶多肽(例如,Cas12i2多肽)和反轉錄酶以及介導由CRISPR核酸酶多肽在目的遺傳位點處進行切割的指導RNA(gRNA)和介導被摻入到目的基因組位點的所希望序列的合成的反轉錄供體RNA。如本文所報導的,本文揭露的基因編輯系統已經在多個基因組位點處以高編輯效率和準確性實現了成功的基因編輯。不受理論束縛,本文揭露的基因編輯系統表現出以下有利特徵中的至少一個:
1. 本文所述之許多編輯模板RNA(例如對Cas12i多肽具有特異性的那些)不需要反式激活CRISPR RNA(tracrRNA)組分,並因此比先導編輯指導RNA(pegRNA)更小。此外,本文所述之許多CRISPR核酸酶-反轉錄酶融合物(例如Cas12i多肽-反轉錄酶融合物)比Cas9-反轉錄酶融合物更小。就遞送和合成成本而言,這兩個方面都是較佳的。
2. 本文所述之編輯模板RNA可以被設計為具有比pegRNA的PBS更長的引物結合位點(PBS)。該特徵可以提高編輯摻入到靶核酸的效率。
3. 如本文所述,與先導編輯系統相比,包含編輯模板RNA的基因編輯系統能夠在更寬的視窗上摻入編輯,其中將該編輯模板RNA設計用於僅結合非PAM股(即PAM模體所在股的互補股;本文也描述為靶股)。特別是,Cas12i多肽-反轉錄酶系統能夠重寫Cas12i多肽和RNA指導物的完整識別序列。因此,該等基因編輯系統可以更有效地避免CRISPR核酸酶-反轉錄酶融合物和編輯模板RNA對靶核酸的重新靶向。
因此,本文提供了基因編輯系統、包含該等基因編輯系統的藥物組成物或套組(kit)、使用該基因編輯系統產生經基因修飾的細胞之方法,以及由此產生的所得細胞。
在一些方面,本揭露的特徵在於基因編輯系統,其包含:(a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸;(b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸;(c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
在一些實施方式中,本文揭露的任何基因編輯系統中的V型CRISPR核酸酶多肽係Cas12多肽。在一些實例中,Cas12多肽係Cas12i多肽,例如Cas12i2多肽。在一些情況下,Cas12i多肽係Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 2具有至少95%同一性的胺基酸序列。
在一些情況下,Cas12i2多肽在SEQ ID NO: 2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046處包含一或多個突變。例如,一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。在一個實例中,Cas12i2多肽在位置D581、D911、I926和V1030處包含突變(例如,D581R、D911R、I926R和V1030G的胺基酸取代)。在另一個實例中,Cas12i2多肽在位置D581、I926和V1030處包含突變(例如,D581R、I926R和V1030G的胺基酸取代)。在又另一個實例中,Cas12i2多肽在位置D581、I926、V1030和S1046處包含突變(例如,D581R、I926R、V1030G和S1046G的胺基酸取代)。在仍另一個實例中,Cas12i2多肽在位置D581、G624、F626、I926、V1030、E1035和S1046處包含突變(例如,D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的胺基酸取代)。在另一個實例中,Cas12i2多肽在位置D581、G624、F626、P868、I926、V1030、E1035和S1046處包含突變(例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的胺基酸取代)。用於在本文揭露的任何基因編輯系統中使用的示例性Cas12i2多肽可以包含SEQ ID NO: 3-7中任一個的胺基酸序列。在一些實例中,示例性Cas12i2多肽可以包含SEQ ID NO: 4的胺基酸序列。在其他實例中,示例性Cas12i2多肽可以包含SEQ ID NO: 7的胺基酸序列。
在其他情況下,Cas12i多肽具有降低的crRNA加工活性,視需要其中該Cas12i多肽在SEQ ID NO: 2的位置H485和/或位置H486處包含突變。
在一些實施方式中,本文揭露的任何基因編輯系統可以包含V型CRISPR核酸酶多肽。可替代地,基因編輯系統可以包含編碼V型CRISPR核酸酶多肽的第一核酸。在一些情況下,第一核酸位於第一載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在其他情況下,第一核酸係第一信使RNA(mRNA)。
在本文揭露的任何基因編輯系統中,RT多肽可為莫洛尼鼠白血病病毒(MMLV)-RT、小鼠乳腺腫瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT(例如,MMLV RT,其可以包含SEQ ID NO: 29的胺基酸序列)。在一些情況下,基因編輯系統包含RT多肽。可替代地,該系統包含編碼RT多肽的第二核酸。在一些情況下,第二核酸位於第二載體(例如,病毒載體,如腺相關病毒載體或AAV載體)中。在一個實例中,基因編輯系統包含載體(例如,病毒載體),該載體包含編碼V型CRISPR多肽的第一核酸和編碼RT多肽的第二核酸兩者。在其他實例中,編碼RT的第二核酸係第二mRNA。在一個實例中,基因編輯系統包含單個RNA分子,該單個RNA分子包含編碼V型CRISPR多肽的第一mRNA和編碼RT的第二mRNA兩者。
在一些實施方式中,本文揭露的基因編輯系統包含融合多肽,該融合多肽包含V型CRISPR核酸酶多肽和RT多肽,或編碼該融合多肽的核酸(例如,載體,如病毒載體)。可替代地,基因編輯系統包含V型CRISPR核酸酶多肽和RT多肽作為兩種單獨的多肽。
在本文揭露的任何基因編輯系統中,間隔子的長度可為20-30個核苷酸。在一些實例中,間隔子的長度為20個核苷酸。
在一些實施方式中,PAM包含5’-TTN-3’的模體。在一些情況下(例如,與Cas12i2多肽結合),PAM可以位於靶序列的5’。
在一些實施方式中,一或多個CRISPR核酸酶結合位點係一或多個同向重複序列。在一些情況下,每個同向重複序列的長度為23-36個核苷酸。在一個實例中,同向重複序列的長度為23個核苷酸。在一些實例中,同向重複序列與SEQ ID NO: 15-17和241-247中的任一個(例如,SEQ ID NO: 17)或其長度為至少23個核苷酸的片段具有至少90%同一性。在特定實例中,同向重複序列係SEQ ID NO: 15-17和241-247中的任一個(例如,SEQ ID NO: 17),或其長度為至少23個核苷酸的片段。
在一些實施方式中,本文揭露的基因編輯系統包含gRNA。可替代地,基因編輯系統包含編碼gRNA的第三核酸。在一些實例中,第三核酸位於第三載體中,該第三載體視需要是病毒載體。在一些實例中,基因編輯系統可以包含載體(例如病毒載體),該載體包含編碼gRNA的第三核酸和編碼V型CRISPR核酸酶多肽和/或RT多肽的第一和/或第二核酸。
在一些實施方式中,本文揭露的任何基因編輯系統的RT供體RNA中的PBS的長度可為5-100個核苷酸。在一些實例中,PBS的長度為10-60個核苷酸。在特定實例中,PBS的長度為10-30個核苷酸。在一些情況下,PBS結合與靶序列的互補區相鄰的PBS靶向位點。PBS靶向位點位於靶序列互補區的上游。例如,PBS靶向位點可為靶序列互補區上游的3-10個核苷酸(例如,4-10個核苷酸)。可替代地,PBS靶向位點可以與靶序列的互補區重疊。在其他情況下,PBS靶向位點與靶序列相鄰或重疊。
在一些實施方式中,本文揭露的任何基因編輯系統的RT供體RNA中的模板序列的長度可為5-100個核苷酸。例如,模板序列的長度可為30-50個核苷酸。在一些情況下,模板序列可以與目的基因組位點同源並且包含相對於該目的基因組位點的一或多個核苷酸變化。在一些實例中,至少一個核苷酸變化位於靶序列內。可替代地或另外地,至少一個核苷酸變化位於PAM內。
在一些實施方式中,本文揭露的任何基因編輯系統包含RT供體RNA。可替代地,基因編輯系統包含編碼RT供體RNA的第四核酸。在一些實例中,第四核酸位於第四載體中,該第四載體視需要是第四病毒載體。在一些情況下,基因編輯系統包含載體(例如病毒載體),該載體包含編碼RT供體RNA的核酸,以及編碼指導RNA、V型CRISPR核酸酶多肽和RT多肽的一或多種另外的核酸。
在一些實施方式中,本文揭露的基因編輯系統包含單個RNA分子,該單個RNA分子包含gRNA和RT供體RNA。這樣的單個RNA包含CRISPR核酸酶結合位點、間隔子序列、PBS和模板序列,它們可以以任何合適的順序排列。在一些實例中,單個RNA分子進一步包含gRNA和RT供體RNA之間的連接子。這樣的連接子可以包含髮夾結構。在一個實例中,單個RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、模板序列和PBS。在另一個實例中,單個RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、連接子、模板序列和PBS。在又另一個實例中,單個RNA分子從5’到3’包含:模板序列、PBS、CRISPR核酸酶結合位點和間隔子序列。在又另一個實例中,單個RNA分子從5’到3’包含:模板序列、PBS、連接子、CRISPR核酸酶結合位點和間隔子序列。
在一些情況下,本文揭露的任何單個RNA分子可以進一步包含5’末端保護片段、3’末端保護片段或兩者。5’末端保護片段和3’末端保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在特定實例中,5’末端保護片段、3’末端保護片段或兩者可以包含CRISPR核酸酶結合位點中的一或多個。5’末端保護片段、3’末端保護片段或兩者可以進一步包含與任何人序列不同源(不能經由鹼基配對與任何人序列結合)的一或多個區段。
在一些實施方式中,本文揭露的基因編輯系統包含該等gRNA中的任一個和該等RT供體RNA中的任一個作為兩種單獨的RNA分子。在一些實例中,gRNA、RT供體RNA或兩者可以進一步包含5’末端保護片段和/或3’末端保護片段。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
本文揭露的基因編輯系統中的任一個可以包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包括V型CRISPR核酸酶多肽或編碼核酸、RT多肽或編碼核酸、指導RNA或編碼核酸、RT供體RNA或編碼核酸,或其任何組合。可替代地,基因編輯系統可以包含 (i) 一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒集合地包括選自V型CRISPR核酸酶多肽或編碼核酸、RT多肽或編碼核酸、指導RNA或編碼核酸、RT供體RNA或編碼核酸的多達三種組分;和 (ii) 編碼基因編輯系統中其餘組分的一或多種載體。在一些情況下,一或多種載體可為一或多種病毒載體,例如一或多種腺相關病毒(AAV)載體。
在一些實例中,本文揭露的基因編輯系統包含V型CRISPR核酸酶多肽、RT多肽、gRNA和RT供體RNA。在一些情況下,V型CRISPR核酸酶多肽和/或RT多肽與gRNA和/或RT供體RNA形成複合物(例如,核糖核蛋白(RNP)複合物)。
在一些方面,本揭露還提供了包含本文揭露的基因編輯系統中任一個和藥學上可接受的載劑的藥物組成物,以及包含該基因編輯系統的組分的套組。
在其他方面,本揭露的特徵還在於用於基因編輯細胞之方法,該方法包括使宿主細胞與本文揭露的基因編輯系統中任一個或包含該基因編輯系統的藥物組成物接觸以對該宿主細胞進行基因編輯。在一些實例中,宿主細胞在體外培養。在其他實例中,接觸步驟藉由向包含宿主細胞的受試者投與基因編輯系統來進行。
同樣在本揭露之範圍內的係可以藉由本文揭露的基因編輯系統產生的經基因修飾的細胞群。在一些實例中,經基因修飾的細胞可以包含不能被基因編輯系統編輯的細胞,例如,在PAM、靶序列或兩者中包含一或多個修飾。
在又其他方面,本揭露的特徵在於基因編輯RNA分子,其包含:(i) 可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點);(ii) 對遺傳位點內的靶序列具有特異性的間隔子,該靶序列與原間隔子相鄰模體(PAM)相鄰;(iii) 引物結合位點(PBS);和 (iv) 模板序列。在一些實施方式中,基因編輯RNA分子可以進一步包含一或多個連接子,例如本文揭露的那些。
在一些實例中,RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、模板序列和PBS。在其他實例中,RNA分子從5’到3’包含:CRISPR核酸酶結合位點、間隔子序列、連接子、模板序列和PBS。在又其他實例中,RNA分子從5’到3’包含:模板序列、PBS、CRISPR核酸酶結合位點和間隔子序列。在仍其他實例中,RNA分子從5’到3’包含:模板序列、PBS、連接子、CRISPR核酸酶結合位點和間隔子序列。
本文揭露的基因編輯RNA分子中任一個可以進一步包含5’末端保護片段、3’末端保護片段或兩者。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
另外地,本揭露的特徵在於基因編輯RNA分子組(兩種單獨的RNA分子),其包含:(i) 指導RNA,其包含可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點),和對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (ii) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。在一些實例中,gRNA、RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。保護片段中的每一個可以形成二級結構,例如髮夾、假結或三鏈體結構。在一些實例中,5’末端保護片段和/或3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他實例中,5’末端保護片段和/或3’末端保護片段包含CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
本文還提供了編碼如本文揭露的基因編輯RNA分子或基因編輯RNA分子組的DNA分子或DNA分子組。在一些實例中,如請求項76所述之DNA分子或DNA分子組,其包括在載體或載體組中,視需要其中該載體或載體組係病毒載體。
另外地,本文提供了包含CRISPR核酸酶和反轉錄酶的融合多肽。在一些實施方式中,CRISPR核酸酶係V型CRISPR核酸酶,例如Cas12i多肽。在一些實例中,Cas12i多肽係Cas12i2多肽,例如,本文揭露的那些。在特定實例中,融合多肽可以包含25-26和219-223的胺基酸序列。編碼該等CRISPR核酸酶-RT融合多肽中任一個的該等核酸(包括載體,例如表現載體(例如,病毒載體))中任一個也在本揭露之範圍內。
在下面的描述中闡述了本發明之一或多個實施方式的細節。根據以下附圖和幾個實施方式的詳細說明以及從所附請求項,本發明之其他特徵或優點將顯而易見。
本揭露關於基因編輯系統,其包含V型核酸酶或編碼該V型核酸酶的核酸、RNA指導物或編碼該RNA指導物的核酸、反轉錄酶或編碼該反轉錄酶的核酸、以及RT供體RNA或編碼該RT供體RNA的核酸。本文還提供了包含本文揭露的任一基因編輯系統的藥物組成物和套組、使用本文揭露的任一基因編輯系統對細胞進行基因編輯之方法、由此產生的經基因工程改造的細胞和參與基因編輯系統的基因編輯RNA分子或RNA分子組,以及用於產生此類基因編輯RNA分子或RNA分子組的一或多個DNA分子。
定義
本揭露將針對特定實施方式並參考某些附圖進行描述,但是本揭露不限於此,而是僅由請求項來限定。除非另有說明,否則下文陳述的術語通常應以其常見意義來理解。
如本文所用,術語「活性」係指生物活性。在一些實施方式中,活性係指效應子活性。在一些實施方式中,活性包括酶活性,例如效應子的催化能力。例如,活性可以包括核酸酶活性。在另一個實例中,活性係指酶從RNA生成DNA或將編輯引入到靶序列的能力。
如本文所用,術語「相鄰」係指一個核苷酸或胺基酸序列緊鄰另一個核苷酸或胺基酸序列。在一些實施方式中,如果沒有核苷酸將一個核苷酸序列與另一個核苷酸序列分開,則這兩個序列相鄰(即,緊鄰)。在一些實施方式中,如果少量核苷酸(例如,約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)將一個核苷酸序列與另一個核苷酸序列分開,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔約5、6、7、8、9、10、11、12、13、14或15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔多達2個核苷酸、多達5個核苷酸、多達8個核苷酸、多達10個核苷酸、多達12個核苷酸或多達15個核苷酸,則這兩個序列相鄰。在一些實施方式中,如果第一序列與第二序列相隔2-5個核苷酸、4-6個核苷酸、4-8個核苷酸、4-10個核苷酸、6-8個核苷酸、6-10個核苷酸、6-12個核苷酸、8-10個核苷酸、8-12個核苷酸、10-12個核苷酸、10-15個核苷酸或12-15個核苷酸,則這兩個序列相鄰。
如本文所用,術語「CRISPR核酸酶」係指能夠結合核酸並引入單股斷裂或雙股斷裂的RNA指導的效應子。在一些實施方式中,CRISPR核酸酶係II型CRISPR核酸酶或V型CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係如Makarova等人的「Classification and Nomenclature of CRISPR-Cas Systems: Where from Here? [CRISPR-Cas系統的分類和命名:從何而來?]」 CRISPRJ. 1(5):325-36 (2018) 中所述之效應子。
如本文所用,術語「II型」和「II型核酸酶」係指包含RuvC結構域和HNH結構域的核酸酶。II型核酸酶可為II-A型核酸酶、II-B型核酸酶或II-C型核酸酶。在一些實施方式中,II型核酸酶需要tracrRNA。在一些實施方式中,II型核酸酶係Cas9多肽。Cas9多肽可以切割雙股DNA靶標或作為切口酶。
如本文所用,術語「V型」和「V型核酸酶」係指RNA指導的具有RuvC結構域的CRISPR核酸酶。在一些實施方式中,V型核酸酶不需要tracrRNA。在一些實施方式中,V型核酸酶需要tracrRNA。在一些實施方式中,V型核酸酶係Cas12多肽,例如Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。
如本文所用,術語「Cas12i多肽」(本文也稱為Cas12i)係指與RNA指導物指定的靶核酸上的靶序列結合的多肽,其中該多肽與野生型Cas12i多肽具有至少一些胺基酸序列同源性。在一些實施方式中,Cas12i多肽與美國專利案號10,808,245之SEQ ID NO: 1-5和11-18中任一項包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,出於本文引用的主題和目的,將該文獻藉由引用併入。在一些實施方式中,Cas12i多肽與本申請的SEQ ID NO: 8、2、11和9中任一項包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,本揭露的Cas12i多肽係如 WO/2021/202800中所述之Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。在一些實施方式中,Cas12i多肽切割靶核酸(例如,作為切口或雙股斷裂)。
使用Karlin和Altschul
Proc. Natl. Acad. Sci.USA [美國國家科學院院刊] 87:2264-68, 1990的演算法,按Karlin和Altschul
Proc. Natl. Acad. Sci. USA [美國國家科學院院刊] 90:5873-77, 1993所改良的,確定兩個核酸或兩個胺基酸序列的「同一性百分比」(又稱為序列同一性)。這種演算法併入Altschul等人,
J. Mol. Biol.[分子生物學雜誌] 215:403-10, 1990的NBLAST和XBLAST程式(2.0版)中。BLAST核苷酸搜索可以用NBLAST程式進行,得分 = 100,字長為-12,以獲得與本發明之核酸分子同源的核苷酸序列。可以用XBLAST程式(得分 = 50,字長 = 3)來進行BLAST蛋白質搜索,以獲得與本發明之蛋白質分子同源的胺基酸序列。在兩個序列之間存在空位的情況下,可以利用如Altschul等人,
Nucleic Acids Res[核酸研究] 25(17): 3389-3402, 1997中描述的空位BLAST。當利用BLAST程式和空位BLAST程式時,可以使用相應程式(例如,XBLAST和NBLAST)的缺省參數。
如本文所用,術語「複合物」係指兩個或更多個分子的組化。在一些實施方式中,複合物包含彼此相互作用(例如,結合、接觸、黏附)的多肽和核酸分子。在一些實施方式中,術語「複合物」用於指CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)與反轉錄酶多肽的結合。例如,CRISPR核酸酶(例如,本文揭露的Cas12i2多肽)和反轉錄酶多肽的複合物可為這兩種多肽的異二聚體,例如,經由二聚化結構域(例如,白胺酸拉鍊)、抗體、奈米抗體或適配體。在一些實施方式中,術語「複合物」用於指RNA指導物與RT供體RNA的結合。在一些實施方式中,術語「複合物」用於指CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶多肽、RNA指導物和RT供體RNA的結合。在一些實施方式中,術語「複合物」用於指反轉錄酶多肽與RT供體RNA的結合。
如本文所用,術語「可被核酸酶識別的結合位點」或「核酸酶結合序列」係指能夠與CRISPR核酸酶結合的序列。在一些實施方式中,核酸酶結合序列係RNA序列。在一些實施方式中,核酸酶結合序列係同向重複序列。在一些實施方式中,核酸酶結合序列能夠與II型CRISPR核酸酶或V型CRISPR核酸酶(例如,可被II型CRISPR核酸酶識別的結合位點,或可被V型CRISPR核酸酶識別的結合位點)結合。
如本文所用,術語「缺失」係指相對於參考序列,核酸序列中的一或多個核苷酸的丟失。在如何製備包含缺失的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含缺失的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生缺失。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。缺失可為框移突變或非框移突變。本文所述之缺失係指插入多達數個千鹼基。
如本文所用,術語「編輯」係指將一或多個修飾引入到靶核酸中的核苷酸序列中,例如目的基因組位點。編輯可以發生在如本文所定義的靶序列內。可替代地,編輯可以發生在靶序列之外(例如,與靶序列相鄰)。編輯可為一或多個取代、一或多個插入、一或多個缺失或其組合。
如本文所用,術語「融合」和「融合的」係指連接至少兩個核苷酸或蛋白質分子。例如,「融合」和「融合的」可以指連接由自然界中單獨的基因(例如,V型核酸酶和反轉錄酶多肽)編碼的至少兩個多肽結構域。融合可為N-末端融合、C-末端融合或分子內融合。在一些方面,將該等結構域轉錄和翻譯以產生單一多肽。還如本文所用,術語「融合」和「融合的」用於指連接兩個核酸分子,例如兩個RNA分子(例如,RNA指導物和RT供體RNA)。融合可為5’融合、3’融合或分子內融合。
如本文所用,術語「插入」係指相對於參考序列,核酸序列中的一或多個核苷酸的增加。在如何製備包含插入的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含插入的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生插入。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。插入可為框移突變或非框移突變。本文所述之插入係指插入多達數個千鹼基。
如本文所用,術語「原間隔子相鄰模體」或「PAM序列」係指與靶序列相鄰的DNA序列。在一些實施方式中,PAM序列係酶活性所需的。在雙股DNA分子中,含有PAM模體的股稱為「PAM股」,互補股稱為「非PAM股」。RNA指導物結合至與本文揭露的靶序列互補的非PAM股中的位點,並且如本文所述之PAM序列存在於PAM股中。
如本文所用,術語「PAM股」係指包含PAM模體的靶核酸(雙股)的股。在一些實施方式中,PAM股係編碼(例如,有義)股。在其他實施方式中,PAM股係非編碼股(例如,反義股)。術語「非PAM股」係指PAM股的互補股。由於gRNA經由鹼基配對結合非PAM股,因此非PAM股也稱為靶股,而PAM股也稱為非靶股。
如本文所用,術語「靶序列」係指與PAM模體(在PAM股上)相鄰的DNA片段。靶序列的互補區位於非PAM股上。靶序列可以緊鄰PAM模體。可替代地,靶序列和PAM可以由小的序列區段(例如,多達5個核苷酸,例如多達4、3、2或1個核苷酸)分開。靶序列可以位於PAM模體的3’末端或PAM模體的5’末端,這取決於識別該PAM模體的CRISPR核酸酶,這係本領域已知的。例如,對於Cas12i多肽(例如,Cas12i2多肽,例如本文揭露的那些)而言,靶序列位於PAM模體的3’末端。
如本文所用,術語「RNA指導物」或「RNA指導序列」係指促進本文所述之CRISPR核酸酶靶向目的基因組位點的RNA分子或經修飾的RNA分子。例如,RNA指導物可為識別(例如,結合)與PAM股中的靶序列互補(例如,被設計為與特定核酸序列互補)的非PAM股中的位點的分子。RNA指導物包含間隔子和核酸酶結合序列(例如,同向重複(DR)序列)。術語CRISPR RNA(crRNA)、pre-crRNA和成熟crRNA在本文中也用於指RNA指導物。RNA指導物的5’末端或3’末端可以與如本文揭露的RT供體RNA融合。在一些情況下,RNA指導物可為經修飾的RNA分子,該經修飾的RNA分子例如在包含在RNA指導物中的DNA結合序列(其結合靶序列)中包含一或多個去氧核糖核苷酸。在一些實例中,DNA結合序列可以含有DNA序列或DNA/RNA雜合序列。
如本文所用,術語「間隔子」和「間隔子序列」(也稱為DNA結合序列)係RNA指導物中的一部分,該RNA指導物係靶序列(DNA序列)的RNA等價物。間隔子含有能夠經由鹼基配對在與靶序列互補的位點處(在PAM股中)與非PAM股結合的序列。這樣的間隔子也稱為對靶序列具有特異性。在一些情況下,除RNA-DNA序列差異以外,間隔子可以與靶序列具有至少75%同一性(例如,至少80%、至少85%、至少90%、至少95%、至少98%或至少99%)。在一些情況下,除RNA-DNA序列差異外,間隔子可以與靶序列具有100%同一性。
如本文所用,術語「互補的」係指與第二多核苷酸(例如,靶序列的互補序列)具有一定水平互補性的第一多核苷酸(例如,RNA指導物的間隔子序列),使得該第一和第二多核苷酸可以經由鹼基配對形成雙股複合物,以允許與第一多核苷酸複合的效應多肽(例如,Cas12i2多肽、Cas12i2-反轉錄酶融合多肽或其變體)作用於(例如,切割)第二多核苷酸。在一些實施方式中,第一多核苷酸可以與第二多核苷酸基本上互補,即與第二多核苷酸具有至少約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互補性。在一些實施方式中,第一多核苷酸與第二多核苷酸完全互補,即與第二多核苷酸具有100%互補性。
如本文所用,術語「反轉錄酶」和「RT」係指典型地具有三種酶活性(包括RNA和DNA依賴性DNA聚合活性和催化RNA-DNA雜合體中RNA的切割的RNA酶H活性)的多功能酶。反轉錄酶可以從RNA模板生成DNA。
如本文所用,術語「反轉錄供體RNA」和「RT供體RNA」係指包含反轉錄模板序列(模板序列)和引物結合位點(PBS)的RNA分子。RT供體RNA可以在RNA指導物的5’末端或3’末端與該RNA指導物融合。
如本文所用,術語「PBS靶向位點」係指PBS結合的區域。PBS靶向位點可以與非PAM股的與靶序列互補的區域相鄰(例如,其上游)。例如,PBS靶向位點可為與靶序列互補的區域上游的3-10個核苷酸(例如,3個核苷酸或4個核苷酸)。在一些情況下,PBS靶向位點可以緊鄰非PAM鏈的與靶序列互補的區域。在其他實例中,PBS靶向位點可以與非PAM股的與靶序列互補的區域重疊。可替代地,PBS靶向位點可以與PAM股上的靶序列相鄰、位於其上游或與其重疊。
如本文所用,術語「反轉錄模板序列」或「模板序列」係指作為藉由反轉錄酶進行DNA合成的模板的RNA分子或RT供體RNA片段。在一些實施方式中,反轉錄模板序列包含將被摻入到需要基因編輯的基因組位點的編輯。在一些情況下,由RT供體RNA中的反轉錄模板序列介導的編輯會破壞或去除PAM序列、靶序列或兩者。
如本文所用,術語「編輯模板RNA」或「基因編輯RNA」(本文可互換使用)係指RNA分子或RNA分子組,該RNA分子或RNA分子組包含RNA指導物(包含間隔子和可被CRISPR核酸酶識別的一或多個結合位點,例如本文揭露的那些)和RT供體RNA(包含PBS和反轉錄模板序列)。基因編輯RNA能夠介導CRISPR核酸酶在目的基因組位點內的靶序列處的切割以及從基於基因編輯RNA中的模板序列的CRISPR核酸酶切割產生的游離DNA股的游離3’末端進行的DNA片段的合成。在一些實施方式中,編輯模板RNA或基因編輯RNA係包含與RT供體RNA連接(例如,融合)的RNA指導物的單個RNA分子。在一些實施方式中,編輯模板RNA從5’到3’包含可被CRISPR核酸酶識別的一或多個結合位點、間隔子序列、PBS和RT供體RNA。在一些實施方式中,編輯模板RNA或基因編輯RNA從5’到3’包含可被CRISPR核酸酶識別的一或多個結合位點、間隔子、模板序列和PBS。在一些實施方式中,編輯模板RNA或基因編輯RNA從5’到3’包含模板序列、PBS、可被CRISPR核酸酶識別的一或多個結合位點和間隔子序列。在一些實施方式中,編輯模板RNA進一步包含連接子。例如,在一些實施方式中,編輯模板RNA包含在可被CRISPR核酸酶識別的一或多個結合位點與PBS之間或在間隔子序列與RT供體RNA之間的連接子。
如本文所用,術語「取代」係指相對於參考序列,不同的一或多個核苷酸對一或多個核苷酸的取代。在如何製備包含取代的序列中沒有暗指特定的過程。例如,可以從單個核苷酸直接合成包含取代的序列。在其他實施方式中,藉由提供參考序列然後改變參考序列來產生取代。核酸序列可以在生物體的基因組中。核酸序列可以在細胞中。核酸序列可為DNA序列。本文所述之取代係指取代多達數個千鹼基。
如本文所用,術語「上游」和「下游」係指單個核酸(例如,DNA)序列內的相對位置。「上游」和「下游」分別指RNA轉錄發生的5’到3’方向。當第一序列的3’末端出現在第二序列的5’末端之前時,第一序列位於第二序列的上游。當第一序列的5’末端出現在第二序列的3’末端之後時,第一序列位於第二序列的下游。在一些實施方式中,參考非PAM股使用術語「上游」和「下游」。例如,在一些實施方式中,PBS與靶序列上游的非PAM股序列互補。因此,在一些實施方式中,PBS與間隔子序列結合的序列上游的序列結合,並且該間隔子序列結合PBS結合的序列的下游。
I. 基因編輯系統
先導編輯被開發用於將取代、小插入或小缺失引入到靶序列。先導編輯方法依賴於與反轉錄酶融合的Cas9切口酶和先導編輯指導RNA(pegRNA)。pegRNA包含能夠與靶基因座的非PAM股(與PAM序列相對的股)結合的間隔子序列、能夠與靶基因座的PAM股(包含PAM序列的股)結合的引物結合位點(PBS)和包含編輯的反轉錄模板序列。pegRNA的間隔子序列與非PAM股上的靶序列結合,切口酶Cas9在PAM股上產生切口。這暴露了可以與PBS雜交的靶基因座的PAM股上的3’ flap。然後反轉錄酶複製反轉錄模板,從而延伸3’ flap。參見例如
圖 19A。通過DNA修復機制,將編輯摻入到靶基因座中。
在一些方面,本文提供了基因編輯系統,其能夠編輯靶核酸(例如,在目的基因組位點處),例如,在基因組位點處引入添加、缺失、取代或其組合。編輯可以發生在靶核酸的任一條股上。本文揭露的基因編輯系統包含至少一種蛋白質組分或編碼該蛋白質組分的核苷酸序列,以及至少一種RNA組分或編碼該RNA組分的核苷酸序列。蛋白質組分具有由RNA組分指導在所希望位點處切割靶核酸的活性和合成新DNA序列的活性,該合成從由於切割產生的DNA股的游離3’末端開始,使用部分RNA組分作為模板。然後可以經由例如宿主細胞中的DNA修復機制將新合成的DNA片段摻入到靶核酸中,從而對該靶核酸進行基因編輯。
本文揭露的基因編輯系統中的蛋白質組分可以包含CRISPR核酸酶(例如,V型核酸酶,如變體Cas12i多肽)和反轉錄酶(RT)多肽。在一些實例中,CRISPR核酸酶和RT多肽係兩種單獨的多肽。在其他實例中,CRISPR核酸酶和RT多肽係融合多肽的一部分。
本文揭露的基因編輯系統中的RNA組分可以包含指導RNA(gRNA)(在本文中也描述為RNA指導物,其介導如設計的靶核酸中特定位點處的CRISPR核酸酶切割)和反轉錄供體RNA(RT供體RNA,其藉由RT多肽介導反轉錄,並為反轉錄提供模板序列)。在一些實例中,gRNA和RT供體RNA係兩種單獨的RNA分子。在其他實例中,gRNA和RT供體RNA係單個RNA分子的一部分。
如本文所示且不受理論束縛,本文所述之基因編輯系統提供了優於本領域的幾個優點。例如,尚未證明用V型CRISPR核酸酶(例如Cas12i CRISPR核酸酶)進行的RNA模板化編輯。有大量小於Cas9核酸酶的V型核酸酶。例如,Cas12i2的長度為1,054個胺基酸,而釀膿鏈球菌(
S. pyogenes)Cas9(SpCas9)的長度為1,368個胺基酸,嗜熱鏈球菌Cas9(StCas9)的長度為1,128個胺基酸,FnCpf1的長度為1,300個胺基酸,AsCpf1的長度為1,307個胺基酸,以及LbCpf1的長度為1,246個胺基酸。此外,V型核酸酶利用不需要反式激活CRISPR RNA(tracrRNA)的RNA指導物,並因此比Cas9 RNA指導物小。較小的Cas12i多肽和RNA指導物大小有益於遞送。此外,尚未用任何CRISPR核酸酶利用單個編輯模板RNA證明RNA模板化編輯,該編輯模板RNA結合靶基因座的單股,例如靶股(非PAM股)。如本文所示,與包含SpCas9多肽的基因編輯系統相比,包含Cas12i多肽的基因編輯系統還表現出降低的脫靶活性。參見PCT/US 2021/025257,將其藉由引用以其全文併入。
A.CRISPR 核酸酶
本文揭露的基因編輯系統中任一個可以包含CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶能夠結合和/或結合至如本文其他地方所述之核酸酶結合序列。在一些實施方式中,CRISPR核酸酶在靶序列處切割DNA。在一些實施方式中,經由本文其他地方所述之特異性識別和/或結合靶序列的DNA結合序列將CRISPR核酸酶募集至靶序列。在一些實施方式中,CRISPR核酸酶在靶序列處切割一條或兩條DNA股。在一些實施方式中,將多於一種CRISPR核酸酶募集至靶序列,並且一或多種CRISPR核酸酶在靶序列處或靶序列附近切割一條或兩條DNA股。在此類實施方式中,CRISPR核酸酶可以具有或能夠具有核酸酶活性。在一些實施方式中,CRISPR核酸酶可以具有降低的或有限的核酸酶活性。在一些實施方式中,如本文其他地方所述之CRISPR核酸酶-反轉錄酶融合多肽能夠結合並結合至如本文其他地方所述之編輯模板RNA中的至少一個核酸酶結合序列。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合物能夠結合並通過編輯模板RNA中的至少一個DNA結合序列結合至靶序列。在此類實施方式中,藉由與核酸酶結合序列和編輯模板RNA的DNA結合序列結合,將CRISPR核酸酶募集至靶序列或使其靠近靶序列。此外,在此類實施方式中,反轉錄酶能夠轉錄並將如本文其他地方所述之反轉錄模板序列轉錄成DNA。
在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽將反轉錄模板序列轉錄成靶核酸的非PAM股。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽將反轉錄模板序列轉錄成靶核酸的PAM股。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽從PBS(例如,PBS的5’或3’末端)開始自5’到3’轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的非PAM股的游離3’末端雜交後,CRISPR核酸酶-反轉錄酶融合物從非PAM的3’末端轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的PAM股的游離3’末端雜交後,CRISPR核酸酶-反轉錄酶融合物從PAM的3’末端轉錄反轉錄模板序列。
在一些實施方式中,CRISPR核酸酶係RNA指導的CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係DNA靶向核酸酶。
在一些實施方式中,CRISPR核酸酶係Cas9(例如,Cas9和nCas9)、Casl2a/Cpf1、Cas12b/C2c1、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i、和Casl2j/CasPhi)。Cas酶之非限制性實例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也稱為Csn1或Csxl2)、Cas10、Cas10d、Casl2a/Cpfl、Casl2b/C2cl、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i、Casl2j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csnl、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csxl6、CsaX、Csx3、Csx1、CsxlS、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、II型CRISPR核酸酶、V型CRISPR核酸酶、VI型CRISPR核酸酶、CARF、DinG,其同源物或其經修飾或經工程改造的版本。其他CRISPR核酸酶也在本揭露之範圍內,儘管它們可能未在本揭露中特別列出。參見例如,Makarova等人的「Classification and Nomenclature of CRISPR-Cas Systems: Where from Here? [CRISPR-Cas系統的分類和命名:從何而來?]」 CRISPRJ. 1(5):325-36 (2018)。
在一些實施方式中,CRISPR核酸酶係以下文獻中揭露的核酸酶:WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將該等文獻藉由引用併入。
在一些實施方式中,本發明之組成物包含V型CRISPR核酸酶(例如,V型核酸酶)。在一些實施方式中,V型核酸酶係Cas12 CRISPR核酸酶。在一些實施方式中,V型核酸酶係Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶。在一些實施方式中,V型核酸酶係Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶的變體(例如,功能性變體)。在一些實施方式中,V型核酸酶包含與野生型V型核酸酶序列(例如,Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)的野生型胺基酸序列)具有至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。
在一些實施方式中,本發明之V型核酸酶係Cas12i CRISPR核酸酶。在一些實施方式中,Cas12i CRISPR核酸酶係包含核苷酸序列(例如SEQ ID NO: 1)的Cas12i2 CRISPR核酸酶或由包含胺基酸序列(例如SEQ ID NO: 2)的多肽編碼。在一些實施方式中,本發明之CRISPR核酸酶係野生型CRISPR核酸酶的變體,其中該野生型包含核苷酸序列(例如SEQ ID NO: 1)或由包含胺基酸序列(例如SEQ ID NO: 2)的多肽編碼。參見表1。
在一些實施方式中,本發明之II型核酸酶係Cas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係包含胺基酸序列(例如SEQ ID NO: 120)的SpCas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係切口酶,例如包含胺基酸序列(例如SEQ ID NO: 121)的nSpCas9。在一些實施方式中,本發明之CRISPR核酸酶係不同種類的Cas9 CRISPR核酸酶。在一些實施方式中,Cas9 CRISPR核酸酶係包含胺基酸序列(例如SEQ ID NO: 122)的SaCas9 CRISPR核酸酶。參見表1。
[
表 1]
.Cas12i 和 Cas9 序列 .
SEQ ID NO | 序列 | 描述 |
1 | ATGAGCAGCGCGATCAAAAGCTACAAGAGCGTTCTGCGTCCGAACGAGCGTAAGAACCAACTGCTGAAAAGCACCATTCAGTGCCTGGAAGACGGTAGCGCGTTCTTTTTCAAGATGCTGCAAGGCCTGTTTGGTGGCATCACCCCGGAGATTGTTCGTTTCAGCACCGAACAGGAGAAACAGCAACAGGATATCGCGCTGTGGTGCGCGGTTAACTGGTTCCGTCCGGTGAGCCAAGACAGCCTGACCCACACCATTGCGAGCGATAACCTGGTGGAGAAGTTTGAGGAATACTATGGTGGCACCGCGAGCGACGCGATCAAACAGTACTTCAGCGCGAGCATTGGCGAAAGCTACTATTGGAACGACTGCCGTCAACAGTACTATGATCTGTGCCGTGAGCTGGGTGTTGAGGTGAGCGACCTGACCCATGATCTGGAGATCCTGTGCCGTGAAAAGTGCCTGGCGGTTGCGACCGAGAGCAACCAGAACAACAGCATCATTAGCGTTCTGTTTGGCACCGGCGAAAAAGAGGACCGTAGCGTGAAACTGCGTATCACCAAGAAAATTCTGGAGGCGATCAGCAACCTGAAAGAAATCCCGAAGAACGTTGCGCCGATTCAAGAGATCATTCTGAACGTGGCGAAAGCGACCAAGGAAACCTTCCGTCAGGTGTATGCGGGTAACCTGGGTGCGCCGAGCACCCTGGAGAAATTTATCGCGAAGGACGGCCAAAAAGAGTTCGATCTGAAGAAACTGCAGACCGACCTGAAGAAAGTTATTCGTGGTAAAAGCAAGGAGCGTGATTGGTGCTGCCAGGAAGAGCTGCGTAGCTACGTGGAGCAAAACACCATCCAGTATGACCTGTGGGCGTGGGGCGAAATGTTCAACAAAGCGCACACCGCGCTGAAAATCAAGAGCACCCGTAACTACAACTTTGCGAAGCAACGTCTGGAACAGTTCAAAGAGATTCAGAGCCTGAACAACCTGCTGGTTGTGAAGAAGCTGAACGACTTTTTCGATAGCGAATTTTTCAGCGGCGAGGAAACCTACACCATCTGCGTTCACCATCTGGGTGGCAAGGACCTGAGCAAACTGTATAAGGCGTGGGAGGATGATCCGGCGGACCCGGAAAACGCGATTGTGGTTCTGTGCGACGATCTGAAAAACAACTTTAAGAAAGAGCCGATCCGTAACATTCTGCGTTACATCTTCACCATTCGTCAAGAATGCAGCGCGCAGGACATCCTGGCGGCGGCGAAGTACAACCAACAGCTGGATCGTTATAAAAGCCAAAAGGCGAACCCGAGCGTTCTGGGTAACCAGGGCTTTACCTGGACCAACGCGGTGATCCTGCCGGAGAAGGCGCAGCGTAACGACCGTCCGAACAGCCTGGATCTGCGTATTTGGCTGTACCTGAAACTGCGTCACCCGGACGGTCGTTGGAAGAAACACCATATCCCGTTCTACGATACCCGTTTCTTCCAAGAAATTTATGCGGCGGGCAACAGCCCGGTTGACACCTGCCAGTTTCGTACCCCGCGTTTCGGTTATCACCTGCCGAAACTGACCGATCAGACCGCGATCCGTGTTAACAAGAAACATGTGAAAGCGGCGAAGACCGAGGCGCGTATTCGTCTGGCGATCCAACAGGGCACCCTGCCGGTGAGCAACCTGAAGATCACCGAAATTAGCGCGACCATCAACAGCAAAGGTCAAGTGCGTATTCCGGTTAAGTTTGACGTGGGTCGTCAAAAAGGCACCCTGCAGATCGGTGACCGTTTCTGCGGCTACGATCAAAACCAGACCGCGAGCCACGCGTATAGCCTGTGGGAAGTGGTTAAAGAGGGTCAATACCATAAAGAGCTGGGCTGCTTTGTTCGTTTCATCAGCAGCGGTGACATCGTGAGCATTACCGAGAACCGTGGCAACCAATTTGATCAGCTGAGCTATGAAGGTCTGGCGTACCCGCAATATGCGGACTGGCGTAAGAAAGCGAGCAAGTTCGTGAGCCTGTGGCAGATCACCAAGAAAAACAAGAAAAAGGAAATCGTGACCGTTGAAGCGAAAGAGAAGTTTGACGCGATCTGCAAGTACCAGCCGCGTCTGTATAAATTCAACAAGGAGTACGCGTATCTGCTGCGTGATATTGTTCGTGGCAAAAGCCTGGTGGAACTGCAACAGATTCGTCAAGAGATCTTTCGTTTCATTGAACAGGACTGCGGTGTTACCCGTCTGGGCAGCCTGAGCCTGAGCACCCTGGAAACCGTGAAAGCGGTTAAGGGTATCATTTACAGCTATTTTAGCACCGCGCTGAACGCGAGCAAGAACAACCCGATCAGCGACGAACAGCGTAAAGAGTTTGATCCGGAACTGTTCGCGCTGCTGGAAAAGCTGGAGCTGATTCGTACCCGTAAAAAGAAACAAAAAGTGGAACGTATCGCGAACAGCCTGATTCAGACCTGCCTGGAGAACAACATCAAGTTCATTCGTGGTGAAGGCGACCTGAGCACCACCAACAACGCGACCAAGAAAAAGGCGAACAGCCGTAGCATGGATTGGTTGGCGCGTGGTGTTTTTAACAAAATCCGTCAACTGGCGCCGATGCACAACATTACCCTGTTCGGTTGCGGCAGCCTGTACACCAGCCACCAGGACCCGCTGGTGCATCGTAACCCGGATAAAGCGATGAAGTGCCGTTGGGCGGCGATCCCGGTTAAGGACATTGGCGATTGGGTGCTGCGTAAGCTGAGCCAAAACCTGCGTGCGAAAAACATCGGCACCGGCGAGTACTATCACCAAGGTGTTAAAGAGTTCCTGAGCCATTATGAACTGCAGGACCTGGAGGAAGAGCTGCTGAAGTGGCGTAGCGATCGTAAAAGCAACATTCCGTGCTGGGTGCTGCAGAACCGTCTGGCGGAGAAGCTGGGCAACAAAGAAGCGGTGGTTTACATCCCGGTTCGTGGTGGCCGTATTTATTTTGCGACCCACAAGGTGGCGACCGGTGCGGTGAGCATCGTTTTCGACCAAAAACAAGTGTGGGTTTGCAACGCGGATCATGTTGCGGCGGCGAACATCGCGCTGACCGTGAAGGGTATTGGCGAACAAAGCAGCGACGAAGAGAACCCGGATGGTAGCCGTATCAAACTGCAGCTGACCAGC | 編碼Cas12i2的核苷酸序列 |
2 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFDVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNIGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTVKGIGEQSSDEENPDGSRIKLQLTS | Cas12i2胺基酸序列 |
3 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGRWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTS | PCT/US 2021/025257的SEQ ID NO: 3的變體Cas12i2 |
4 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTS | PCT/US 2021/025257的SEQ ID NO: 4的變體Cas12i2 |
5 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGGRIKLQLTS | PCT/US 2021/025257的SEQ ID NO:5的變體Cas12i2 |
6 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTS | PCT/US 2021/025257的SEQ ID NO: 495的變體Cas12i2 |
7 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKHHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTS | PCT/US 2021/025257的SEQ ID NO: 496的變體Cas12i2 |
8 | MSNKEKNASETRKAYTTKMIPRSHDRMKLLGNFMDYLMDGTPIFFELWNQFGGGIDRDIISGTANKDKISDDLLLAVNWFKVMPINSKPQGVSPSNLANLFQQYSGSEPDIQAQEYFASNFDTEKHQWKDMRVEYERLLAELQLSRSDMHHDLKLMYKEKCIGLSLSTAHYITSVMFGTGAKNNRQTKHQFYSKVIQLLEESTQINSVEQLASIILKAGDCDSYRKLRIRCSRKGATPSILKIVQDYELGTNHDDEVNVPSLIANLKEKLGRFEYECEWKCMEKIKAFLASKVGPYYLGSYSAMLENALSPIKGMTTKNCKFVLKQIDAKNDIKYENEPFGKIVEGFFDSPYFESDTNVKWVLHPHHIGESNIKTLWEDLNAIHSKYEEDIASLSEDKKEKRIKVYQGDVCQTINTYCEEVGKEAKTPLVQLLRYLYSRKDDIAVDKIIDGITFLSKKHKVEKQKINPVIQKYPSFNFGNNSKLLGKIISPKDKLKHNLKCNRNQVDNYIWIEIKVLNTKTMRWEKHHYALSSTRFLEEVYYPATSENPPDALAARFRTKTNGYEGKPALSAEQIEQIRSAPVGLRKVKKRQMRLEAARQQNLLPRYTWGKDFNINICKRGNNFEVTLATKVKKKKEKNYKVVLGYDANIVRKNTYAAIEAHANGDGVIDYNDLPVKPIESGFVTVESQVRDKSYDQLSYNGVKLLYCKPHVESRRSFLEKYRNGTMKDNRGNNIQIDFMKDFEAIADDETSLYYFNMKYCKLLQSSIRNHSSQAKEYREEIFELLRDGKLSVLKLSSLSNLSFVMFKVAKSLIGTYFGHLLKKPKNSKSDVKAPPITDEDKQKADPEMFALRLALEEKRLNKVKSKKEVIANKIVAKALELRDKYGPVLIKGENISDTTKKGKKSSTNSFLMDWLARGVANKVKEMVMMHQGLEFVEVNPNFTSHQDPFVHKNPENTFRARYSRCTPSELTEKNRKEILSFLSDKPSKRPTNAYYNEGAMAFLATYGLKKNDVLGVSLEKFKQIMANILHQRSEDQLLFPSRGGMFYLATYKLDADATSVNWNGKQFWVCNADLVAAYNVGLVDIQKDFKKK | Cas12i1(美國專利案號10,808,245之SEQ ID NO: 3) |
9 | MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLEAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTGVDKTTNCSFMIKRENDEYKLVINRKISVDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNEEQDDIPLITKKAESKSPPKDRKRSKTSQLPQK | Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16) |
10 | MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKHHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQK | 變體Cas12i4 |
11 | MSISNNNILPYNPKLLPDDRKHKMLVDTFNQLDLIRNNLHDMIIALYGALKYDNIKQFASKEKPHISADALCSINWFRLVKTNERKPAIESNQIISKFIQYSGHTPDKYALSHITGNHEPSHKWIDCREYAINYARIMHLSFSQFQDLATACLNCKILILNGTLTSSWAWGANSALFGGSDKENFSVKAKILNSFIENLKDEMNTTKFQVVEKVCQQIGSSDAADLFDLYRSTVKDGNRGPATGRNPKVMNLFSQDGEISSEQREDFIESFQKVMQEKNSKQIIPHLDKLKYHLVKQSGLYDIYSWAAAIKNANSTIVASNSSNLNTILNKTEKQQTFEELRKDEKIVACSKILLSVNDTLPEDLHYNPSTSNLGKNLDVFFDLLNENSVHTIENKEEKNKIVKECVNQYMEECKGLNKPPMPVLLTFISDYAHKHQAQDFLSAAKMNFIDLKIKSIKVVPTVHGSSPYTWISNLSKKNKDGKMIRTPNSSLIGWIIPPEEIHDQKFAGQNPIIWAVLRVYCNNKWEMHHFPFSDSRFFTEVYAYKPNLPYLPGGENRSKRFGYRHSTNLSNESRQILLDKSKYAKANKSVLRCMENMTHNVVFDPKTSLNIRIKTDKNNSPVLDDKGRITFVMQINHRILEKYNNTKIEIGDRILAYDQNQSENHTYAILQRTEEGSHAHQFNGWYVRVLETGKVTSIVQGLSGPIDQLNYDGMPVTSHKFNCWQADRSAFVSQFASLKISETETFDEAYQAINAQGAYTWNLFYLRILRKALRVCHMENINQFREEILAISKNRLSPMSLGSLSQNSLKMIRAFKSIINCYMSRMSFVDELQKKEGDLELHTIMRLTDNKLNDKRVEKINRASSFLTNKAHSMGCKMIVGESDLPVADSKTSKKQNVDRMDWCARALSHKVEYACKLMGLAYRGIPAYMSSHQDPLVHLVESKRSVLRPRFVVADKSDVKQHHLDNLRRMLNSKTKVGTAVYYREAVELMCEELGIHKTDMAKGKVSLSDFVDKFIGEKAIFPQRGGRFYMSTKRLTTGAKLICYSGSDVWLSDADEIAAINIGMFVVCDQTGAFKKKKKEKLDDEECDILPFRPM | Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14) |
120 | MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD | SpCas9 |
121 | MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD | nSpCas9 |
122 | MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG | SaCas9 |
編碼本文所述之CRISPR核酸酶的核酸序列可以與參考核酸序列(例如,SEQ ID NO: 1)基本上相同。在一些實施方式中,CRISPR核酸酶由以下核酸編碼,該核酸包含與參考核酸序列(例如,編碼野生型多肽的核酸序列,如SEQ ID NO: 1)具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列同一性的序列。可以藉由檢查兩個最佳比對的核酸序列或藉由使用軟體程式或演算法(例如,BLAST、ALIGN、CLUSTAL)使用標準參數手動確定兩個此類核酸之間的同一性百分比。兩個核酸序列基本上相同的一個指示係核酸分子在嚴格條件下(例如,在中等至高度嚴格的範圍內)與另一個核酸分子的互補序列雜交。
在一些實施方式中,CRISPR核酸酶由以下核酸序列編碼,該核酸序列與參考核酸序列(例如,編碼CRISPR核酸酶的核酸序列,如SEQ ID NO: 1)具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更高序列同一性、但非100%序列同一性。
在一些實施方式中,本發明之CRISPR核酸酶包含與SEQ ID NO: 2具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之CRISPR核酸酶包含與SEQ ID NO: 2具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%、但非100%同一性的序列。
在一些實施方式中,本發明描述了CRISPR核酸酶,該CRISPR核酸酶與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如與SEQ ID NO: 2的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%、但非100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,CRISPR核酸酶係WO/2021/202800中所述之變體Cas12i2多肽,出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。在一些實施方式中,變體Cas12i2多肽包含WO/2021/202800的表2中列出的胺基酸取代中的一或多個。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 3中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 4中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 5中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 495中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與PCT/US 2021/025257的SEQ ID NO: 496中胺基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些實施方式中,CRISPR核酸酶係變體Cas12i2多肽,該變體Cas12i2多肽與WO/2021/202800(將該文獻藉由引用併入)的SEQ ID NO: 3-146和495-512中任一項具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。
在一些實施方式中,CRISPR核酸酶係Cas12i多肽。在一些實施方式中,CRISPR核酸酶係Cas12i1多肽。在一些實施方式中,Cas12i1多肽係變體Cas12i1多肽。在一些實施方式中,本發明之變體Cas12i1多肽包含與SEQ ID NO: 8具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之變體Cas12i1多肽包含與SEQ ID NO: 8具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,CRISPR核酸酶與一或多種參考多肽(例如,野生型Casi1多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 8的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i1多肽的核酸編碼與SEQ ID NO: 8具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i1多肽具有與SEQ ID NO: 8具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i1多肽包含與CRISPR核酸酶和SEQ ID NO: 8中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i多肽係Cas12i3多肽。在一些實施方式中,本發明之Cas12i3多肽包含與SEQ ID NO: 11具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas12i3多肽包含與SEQ ID NO: 11具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas12i3多肽係變體Cas12i3多肽。在一些實施方式中,變體Cas12i3多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 11的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i3多肽的核酸編碼與SEQ ID NO: 11具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i3多肽具有與SEQ ID NO: 11具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i3多肽包含與CRISPR核酸酶和SEQ ID NO: 11中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,Cas12i多肽係Cas12i4多肽。在一些實施方式中,本發明之Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas12i4多肽係變體Cas12i4多肽。在一些實施方式中,變體Cas12i4多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 9或SEQ ID NO: 10的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas12i4多肽的核酸編碼與SEQ ID NO: 9或SEQ ID NO: 10具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas12i4多肽具有與SEQ ID NO: 9或SEQ ID NO: 10具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas12i4多肽包含與CRISPR核酸酶和SEQ ID NO: 9或SEQ ID NO: 10中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,CRISPR核酸酶係II型CRISPR核酸酶,例如,Cas9核酸酶。在一些實施方式中,Cas9核酸酶係來自釀膿鏈球菌或金黃色葡萄球菌(
S. aureus)的Cas9或其變體。參見例如U.S. 20190136248,將其藉由引用以其全文併入。在一些實施方式中,Cas9多肽係切口酶。
在一些實施方式中,本發明之Cas9多肽包含與SEQ ID NO: 120-122中任一項具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些實施方式中,本發明之Cas9多肽包含與SEQ ID NO: 120-122中任一項具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些實施方式中,Cas9多肽係變體Cas9多肽。在一些實施方式中,變體Cas9多肽與一或多種參考多肽(例如,野生型多肽)具有特定程度的胺基酸序列同一性,例如,與SEQ ID NO: 120-122中任一項的胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以藉由胺基酸序列比對確定,例如使用如本文所述之程式如BLAST、ALIGN或CLUSTAL。
在一些實施方式中,編碼如本文所述之變體Cas9多肽的核酸編碼與SEQ ID NO: 120-122中任一項具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的胺基酸序列。在一些實施方式中,變體Cas9多肽具有與SEQ ID NO: 120-122中任一項具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些實施方式中,當使用任一先前所述之比對方法進行比對時,本文所述之具有酶活性(例如,核酸酶或核酸內切酶活性)的變體Cas9多肽包含與CRISPR核酸酶和SEQ ID NO: 120或SEQ ID NO: 121中任一者的胺基酸序列差異100、95、90、85、80、75、70、65、60、55、50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1個胺基酸殘基的胺基酸序列。
在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽或II型核酸酶)在野生型多肽的一或多個(例如,幾個)胺基酸處包含改變,其中至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200或更多個胺基酸被改變。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶包含crRNA加工活性。在一些實施方式中,V型核酸酶(例如,Cas12i多肽)係缺乏crRNA加工活性的變體。例如,在其中V型核酸酶係變體Cas12i2多肽的一些實施方式中,變體Cas12i2多肽包含H485或H486取代。在一些實施方式中,與SEQ ID NO: 2-7中任一項具有至少90%同一性(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的變體Cas12i2多肽進一步包含H485或H486突變。在一些實施方式中,包含H485或H486突變的變體Cas12i2多肽包含降低的crRNA加工活性或缺乏crRNA加工活性。
在一些實施方式中,編碼本文所述之CRISPR核酸酶的核苷酸序列可以經密碼子優化用於在特定的宿主細胞或生物體中使用。例如,核酸可以經密碼子優化以用於任何非人真核生物(包括小鼠、大鼠、兔、狗、家畜或非人靈長類動物)。密碼子使用表係易於獲得的,例如在www.kazusa.orjp/codon/上可獲得的「密碼子使用數據庫(Codon Usage Database)」中,並且該等表可以按多種方式進行改編。參見Nakamura等人
Nucl. Acids Res.[核酸研究] 28:292 (2000),將其藉由引用以其全文併入本文。用於密碼子優化特定序列以在特定宿主細胞中表現的電腦演算法也是可得的,諸如基因製造(Gene Forge)(Aptagen公司;賓夕法尼亞州雅各斯(Jacobus, PA))。
儘管本文所述之改變可為一或多個胺基酸改變,但CRISPR核酸酶的改變也可為結構性或實質性的,例如作為胺基和/或羧基末端延伸的多肽融合。例如,CRISPR核酸酶可以含有另外的肽,例如一或多種肽。另外的肽之實例可以包括用於標記的表位肽,例如多組胺酸標籤(His-標籤)、Myc和FLAG。在一些實施方式中,可以將本文所述之CRISPR核酸酶與可檢測部分如螢光蛋白(例如綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))融合。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)核定位訊號(NLS)。在一些實施方式中,CRISPR核酸酶包含至少一個(例如,兩個、三個、四個、五個、六個或更多個)出核訊號(NES)。在一些實施方式中,CRISPR核酸酶包含至少一個(例如,兩種、三個、四個、五個、六個或更多個)NLS和至少一個(例如,兩個、三個、四個、五個、六個或更多個)NES。
在一些實施方式中,CRISPR核酸酶至少包含RuvC結構域但少於整個CRISPR核酸酶。在一些實施方式中,CRISPR核酸酶係相對於野生型CRISPR核酸酶截短的CRISPR核酸酶。在一些實施方式中,截短的CRISPR核酸酶包含RuvC結構域。在一些實施方式中,CRISPR核酸酶包含整個CRISPR核酸酶的至少一個功能性結構域。在一些實施方式中,CRISPR核酸酶包含至少兩個RuvC結構域或至少兩個RuvC模體。在一些實施方式中,CRISPR核酸酶包含至少三個RuvC結構域或至少三個RuvC模體。在一些實施方式中,CRISPR核酸酶包含至少一個催化死亡型RuvC結構域和至少一個催化活性型RuvC結構域。在一些實施方式中,CRISPR核酸酶包含來自一或多個V型或II型核酸酶的兩個RuvC結構域。在一些實施方式中,CRISPR核酸酶至少包含RuvC結構域和二聚化結構域。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與聚合酶融合。在一些實施方式中,如前述實施方式中任一項所述之CRISPR核酸酶與反轉錄酶多肽融合。在一些實施方式中,CRISPR核酸酶包含N-末端反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶包含C-末端反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶在CRISPR核酸酶內的分子內位置處包含反轉錄酶多肽(例如,反轉錄酶在該CRISPR核酸酶的環內)。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與反轉錄酶多肽相互作用(例如,通過靜電相互作用)。在一些實施方式中,CRISPR核酸酶包含二聚化結構域。如本文所用,術語「二聚化結構域」係指能夠特異性結合單獨且相容的多肽結構域(例如,第二相容的二聚化結構域)的多肽結構域。在一些實施方式中,二聚體藉由第一二聚化結構域和第二相容二聚化結構域之間的非共價鍵形成。在一些實施方式中,二聚化結構域係白胺酸拉鍊、奈米抗體或抗體。在一些實施方式中,二聚化結構域募集反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶和反轉錄酶多肽通過捲曲螺旋肽異二聚體相互作用。
在一些實施方式中,如本文所述之任一實施方式中的CRISPR核酸酶與連接酶、整合酶和/或重組酶相互作用。在一些實施方式中,將如本文所述之任一實施方式中的CRISPR核酸酶與連接酶、整合酶和/或重組酶融合。在一些實施方式中,將連接酶、整合酶和/或重組酶與CRISPR核酸酶的N-末端或C-末端融合。在一些實施方式中,將連接酶、整合酶和/或重組酶在內部與CRISPR核酸酶融合。在一些實施方式中,整合酶係絲胺酸整合酶。在一些實施方式中,整合酶係Bxb1、TP901或PhiBT1整合酶。在一些實施方式中,重組酶係絲胺酸重組酶或酪胺酸重組酶。在一些實施方式中,重組酶係CRE重組酶。在一些實施方式中,與連接酶、整合酶和/或重組酶相互作用或融合的CRISPR核酸酶進一步與反轉錄酶相互作用或融合。
B. 反轉錄酶
在各個實施方式中,本文揭露的組成物包括聚合酶(例如,DNA依賴性DNA聚合酶或RNA依賴性DNA聚合酶)或其變體,其可以作為與CRISPR核酸酶的融合物提供。聚合酶可為野生型聚合酶、功能性片段、變體、截短的變體等。聚合酶可以包括來自真核、原核、古細菌或病毒生物的野生型聚合酶,和/或聚合酶可以藉由基因工程、誘變、基於定向進化的過程進行修飾。
該等CRISPR核酸酶-RT融合多肽(例如本文揭露的那些(例如,表7和17中所示的那些))中任一個、它們的編碼核酸、包含其的載體和其製備方法也在本揭露之範圍內。
在一些實施方式中,聚合酶係反轉錄酶。在一些實施方式中,反轉錄酶多肽係從任何天然存在的生物體或病毒獲得的或從商業或非商業來源獲得的任何野生型反轉錄酶。反轉錄酶多肽也可為變體反轉錄酶多肽。
反轉錄酶多肽可以從多種不同的來源獲得。例如,基因可以從被反轉錄病毒感染的真核細胞或從包含部分或整個反轉錄病毒基因組的質體中獲得。另外地,包含反轉錄酶基因的RNA可以從反轉錄病毒中獲得。在一些實施方式中,反轉錄酶作為單獨組分表現或以其他方式提供,即,不作為與CRISPR核酸酶(例如,Cas12i)多肽的融合蛋白。
熟悉該項技術者將認識到反轉錄酶係本領域已知的,包括但不限於莫洛尼鼠白血病病毒(MMLV)反轉錄酶、人類免疫缺陷病毒(HIV)反轉錄酶和禽肉瘤-白血病病毒(ASLV)反轉錄酶,其包括但不限於勞斯氏肉瘤病毒(RSV)反轉錄酶、禽成髓細胞瘤病毒(AMV)反轉錄酶、禽骨髓成紅血細胞增多症病毒(AEV)輔助病毒MCAV反轉錄酶、禽骨髓細胞瘤病毒MC29輔助病毒MCAV反轉錄酶、家禽網狀內皮症病毒(REV-T)輔助病毒REV-A反轉錄酶、禽肉瘤病毒UR2輔助病毒UR2AV反轉錄酶、禽肉瘤病毒Y73輔助病毒YAV反轉錄酶、勞斯氏(Rous)相關病毒(RAV)反轉錄酶和成髓細胞血症相關病毒(MAV)反轉錄酶,它們可以適當地用於本文所述之組成物中。
在一些實施方式中,反轉錄酶係MMLV-RT,來自直腸真桿菌(
Eubacterium rectale)的MarathonRT,或RTX反轉錄酶,或MMLV-RT、MarathonRT或RTX反轉錄酶的變體。在一些實施方式中,反轉錄酶係表2中所示的序列、其變體或其直系同源物。
[
表 2]
. 反轉錄酶序列 .
反轉錄酶 | 序列 |
MMLV-RT | MTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(SEQ ID NO: 29) |
MMLV-RT_2 | MTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFDEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGTAGFCRLWIPGFAEMAAPLYPLTKTGTLFNWGPDQQKAYQEILQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDL(SEQ ID NO: 230) |
MMTV-RT | MLQLGHLEESNSPWNTPVFVIKKKSGKWRLLQDLRAVNATMHDMGALQPGLPSPVAVPKGWEIIIIDLQDCFFNIKLHPEDCKRFAFSVPSPNFKRPYQRFQWKVLPQGMKNSPTLCQKFVDKAILTVRDKYQDSYIVHYMDDILLAHPSRSIVDEILTSMIQALNKHGLVVSTEKIQKYDNLKYLGTHIQGDSVSYQKLQIRTDKLRTLNDFQKLLGNINWIRPFLKLTT(SEQ ID NO: 231) |
MarathonRT | MDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTC(SEQ ID NO: 232) |
RTX反轉錄酶 | MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLAFDIETLYHEGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYLTMTIKEIEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIEKQVLPAVERILRAFGYRKEDLRYQKTRQVGLSARLKPKGT(SEQ ID NO: 233) |
RTX-exoMinus | MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLAFDIETLYHEGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYDGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYLTMTIKEIEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIEKQVLPAVERILRAFGYRKEDLRYQKTRQVGLSARLKPKGT(SEQ ID NO: 234) |
B11 RT | MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYLYALLKDDSAIEEVKKITAERHSTVVTVKRVEKVQKKFLGRSVEVWKLYFTHPQDVPAIMDKIREHPAVIDIYEYDIPFAIRYLIDKGLVPMEGDEELKLLALDIGTPCHEGEVFAEGPILMISYADEEGTRVITWRNVDLPYVDVLSTEREMIQRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFTLGREGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTVNLPIYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFMPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRHQSHEGGYIKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKRMKATIDPIERKLLDYRQRAIKILANSLYGYYGYARARWYCKECAESVIAWGREYITMTIKEIEEKYGFKLIYSDTDGFFATIPGAEAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGLFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHKQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIVDRAIPFDEFDPTKHKYDAEYYIENQVLPAVERILRAYGYRKEDLWYQKTRQVGLSARLKPKGT(SEQ ID NO: 235) |
RT CaMV | MDHLLLKTQTQTEQVMNVTNPNSIYIKGRLYFKGYKKIELHCFVDTGASLCIASKFVIPEEHWVNAERPIMVKIADGSSITISKVCKDIDLIIAGEIFRIPTVYQQESGIDFIIGNNFCQLYEPFIQFTDRVIFTKNKSYPVHIAKLTRAVRVGTEGFLESMKKRSKTQQPEPVNISTNKIENPLEEIAILSEGRRLSEEKLFITQQRMQKIEELLEKVCSENPLDPNKTKQWMKASIKLSDPSKAIKVKPMKYSPMDREEFDKQIKELLDLKVIKPSKSPHMAPAFLVNNEAEKRRGKKRMVVNYKAMNKATVGDAYNLPNKDELLTLIRGKKIFSSFDCKSGFWQVLLDQESRPLTAFTCPQGHYEWNVVPFGLKQAPSIFQRHMDEAFRVFRKFCCVYVDDILVFSNNEEDHLLHVAMILQKCNQHGIILSKKKAQLFKKKINFLGLEIDEGTHKPQGHILEHINKFPDTLEDKKQLQRFLGILTYASDYIPKLAQIRKPLQAKLKENVPWRWTKEDTLYMQKVKKNLQGFPPLHHPLPEEKLIIETDASDDYWGGMLKAIKINEGTNTELICRYASGSFKAAEKNYHSNDKETLAVINTIKKFSIYLTPVHFLIRTDNTHFKSFVNLNYKGDSKLGRNIRWQAWLSHYSFDVEHIKGTDNHFADFLSREFNKVNSSGGS(SEQ ID NO: 236) |
RT反轉錄子 | MGIHGVPAAMKSAEYLNTFRLRNLGLPVMNNLHDMSKATRISVETLRLLIYTADFRYRIYTVEKKGPEKRMRTIYQPSRELKALQGWVLRNILDKLSSSPFSIGFEKHQSILNNATPHIGANFILNIDLEDFFPSLTANKVFGVFHSLGYNRLISSVLTKICCYKNLLPQGAPSSPKLANLICSKLDYRIQGYAGSRGLIYTRYADDLTLSAQSMKKVVKARDFLFSIIPSEGLVINSKKTCISGPRSQRKVTGLVISQEKVGIGREKYKEIRAKIHHIFCGKSSEIEHVRGWLSFILSVDSKSHRRLITYISKLEKKYGKNPLNKAKT(SEQ ID NO: 237) |
HIV2 | MEKEGQLEEAPPTNPYNTPTFAIKKKDKNKWRMLIDFRELNKVTQDFTEIQLGIPHPAGLAKKRRITVLDVGDAYFSIPLHEDFRPYTAFTLPSVNNAEPGKRYIYKVLPQGWKGSPAIFQHTMRQVLEPFRKANKDVIIIQYMDDILIASDRTDLEHDRVVLQLKELLNGLGFSTPDEKFQKDPPIHWMGYELWPTKWKLQKIQLPQKEIWTVNDIQKLVGVLNWAAQLYPGIK(SEQ ID NO: 238) |
HIV1 | MEEEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDESFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRIKNPEIVIYQYMDDLYVGSDLEIGQHRTKIEELRAHLLSWGFTTPDKKHQKEPPFLWMGYELHPDRWTVQPIDLPEKDSWTVNDIQKLVGKLNWASQIYAGIK(SEQ ID NO: 239) |
HIV-1 RT p51 | MPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEDFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGLTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGTKALTEVIPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKITTESIVIWGKTPKFKLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETF(SEQ ID NO: 240) |
缺乏RNA酶H結構域的MMLV RT | STLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLP(SEQ ID NO: 224) |
在一些實施方式中,反轉錄酶多肽與本文所述之任一實施方式中的CRISPR核酸酶融合。在一些實施方式中,反轉錄酶多肽包含N-末端CRISPR核酸酶。在一些實施方式中,反轉錄酶多肽包含C-末端CRISPR核酸酶。在一些實施方式中,反轉錄酶多肽在反轉錄酶多肽內的分子內位置處包含CRISPR核酸酶(例如,CRISPR核酸酶在反轉錄酶多肽的環內)。
在一些實施方式中,反轉錄酶多肽包含二聚化結構域。在一些實施方式中,二聚化結構域係白胺酸拉鍊、奈米抗體或抗體。在一些實施方式中,二聚化結構域募集CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。
在一些實施方式中,反轉錄酶多肽係「易錯」反轉錄酶變體。可以使用本領域已知和/或可獲得的易錯反轉錄酶。應當理解,反轉錄酶天然不具有任何校對功能;因此,反轉錄酶的錯誤率通常高於具有校對活性的DNA聚合酶。在一些實施方式中,如果反轉錄酶在合成的約15,000個核苷酸中具有小於一個錯誤的錯誤率,則認為該反轉錄酶係「易錯」的。
在一些實施方式中,反轉錄酶多肽在RNA酶H結構域中具有一或多個突變。在一些實施方式中,反轉錄酶多肽不包含RNA酶H結構域(例如,RNA酶H結構域已從反轉錄酶多肽中去除)。在一些實施方式中,RNA酶H結構域在反轉錄酶多肽中被截短。在一些實施方式中,反轉錄酶多肽在RNA依賴性DNA聚合酶結構域中具有一或多個突變。在一些實施方式中,反轉錄酶多肽係具有改變的熱穩定性特徵的變體。反轉錄酶耐受高溫的能力係cDNA合成的重要方面。升高的反應溫度有助於使具有強二級結構和/或高GC含量的RNA變性,從而允許反轉錄酶讀通整個序列。因此,在較高溫度下進行反轉錄能夠實現全長cDNA合成和更高的產量。野生型M-MLV反轉錄酶的最佳溫度典型地在37°C-48°C的範圍內;然而,可能會引入在超過48°C的更高溫度下允許反轉錄活性的突變,更高的溫度包括49°C、50°C、51°C、52°C、53°C、54°C、55°C、56°C、57°C、58°C、59°C、60°C、61°C、62°C、63°C、64°C、65°C、66°C或更高。
本文使用的變體反轉錄酶多肽可以與任何參考反轉錄酶多肽(包括任何野生型反轉錄酶、突變反轉錄酶或反轉錄酶的片段,或本文揭露或預期的或本領域已知的其他反轉錄酶變體)具有至少約20%同一性、至少約25%同一性、至少約30%同一性、至少約35%同一性、至少約40%同一性、至少約45%同一性、至少約50%同一性、至少約55%同一性、至少約60%同一性、至少約65%同一性、至少約70%同一性、至少約75%同一性、至少約80%同一性、至少約85%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。在一些實施方式中,與參考反轉錄酶相比,反轉錄酶變體可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或多達100或多達200或多達300或多達400或多達500或更多個胺基酸變化。在一些實施方式中,反轉錄酶變體包含參考反轉錄酶的片段,使得該片段與該參考反轉錄酶的相應片段具有至少約20%同一性、至少約25%同一性、至少約30%同一性、至少約35%同一性、至少約40%同一性、至少約45%同一性、至少約50%同一性、至少約55%同一性、至少約60%同一性、至少約65%同一性、至少約70%同一性、至少約75%同一性、至少約80%同一性、至少約85%同一性、至少約90%同一性、至少約95%同一性、至少約96%同一性、至少約97%同一性、至少約98%同一性、至少約99%同一性、至少約99.5%同一性或至少約99.9%同一性。
變體反轉錄酶(包括易錯反轉錄酶、熱穩定反轉錄酶和具有增加的持續合成能力的反轉錄酶)可以藉由各種常規策略(包括誘變或進化過程)進行工程改造。在一些情況下,可以藉由引入單個突變來產生變體。在其他情況下,變體可能需要多於一個突變。對於包含多於一個突變的那些突變體,可以藉由定點誘變將鑒定的突變引入野生型基因來評估給定突變的作用,該給定突變與特定突變體攜帶的其他突變分離。然後,如此產生的單個突變體的篩選測定將允許確定該單獨突變的作用。
在一些實施方式中,反轉錄酶多肽包含或融合至結構域以提高該反轉錄酶的延伸率和/或效率。在一些實施方式中,反轉錄酶多肽融合至Sso7d多肽,例如來自硫磺礦硫化葉菌(
Sulfolobus solfataricus)的Sso7d多肽。參見例如,Wang等人, Nucleic Acids Res.[核酸研究] 32(3): 1197-207 (2004)。
在一些實施方式中,如本文其他地方所述之CRISPR核酸酶-反轉錄酶融合多肽能夠結合並結合至編輯模板RNA中的至少一個核酸酶結合序列。在一些實施方式中,CRISPR核酸酶-反轉錄酶融合多肽能夠結合並通過編輯模板RNA中的至少一個DNA結合序列結合至靶序列。在此類實施方式中,通過經由核酸酶結合序列和編輯模板RNA的DNA結合序列結合CRISPR核酸酶,CRISPR核酸酶-反轉錄酶融合多肽募集至靶序列或使其靠近靶序列。
在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的5’末端開始轉錄成靶核酸的非PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的3’末端開始轉錄成靶核酸的非PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的5’末端開始轉錄成靶核酸的PAM股。在一些實施方式中,反轉錄酶將反轉錄模板序列從PBS的3’末端開始轉錄成靶核酸的PAM股。在一些實施方式中,在PBS與靶核酸的非PAM股結合後,反轉錄酶從非PAM股的游離3’末端轉錄反轉錄模板序列。在一些實施方式中,在PBS與靶核酸的PAM股雜交後,反轉錄酶從PAM股的游離3’末端轉錄反轉錄模板序列。
在一些實施方式中,如本文所述之任一實施方式中的反轉錄酶與連接酶、整合酶和/或重組酶相互作用。在一些實施方式中,將如本文所述之任一實施方式中的反轉錄酶與連接酶、整合酶和/或重組酶融合。在一些實施方式中,將連接酶、整合酶和/或重組酶與反轉錄酶的N-末端或C-末端融合。在一些實施方式中,將連接酶、整合酶和/或重組酶在反轉錄酶的內部融合。在一些實施方式中,整合酶係絲胺酸整合酶。在一些實施方式中,整合酶係Bxb1、TP901或PhiBT1整合酶。在一些實施方式中,重組酶係絲胺酸重組酶或酪胺酸重組酶。在一些實施方式中,重組酶係CRE重組酶。在一些實施方式中,與連接酶、整合酶和/或重組酶相互作用或融合的反轉錄酶進一步與CRISPR核酸酶相互作用或融合。
C. 基因編輯 RNA 分子
本文揭露的任一基因編輯系統可以包含一或多個編輯模板RNA(基因編輯RNA),該一或多個編輯模板RNA包含RNA指導物和RNA反轉錄酶(RT)供體(RT供體RNA)。該一或多個編輯模板RNA有助於編輯靶核酸中的序列,例如所希望的基因組位點。在一些實施方式中,編輯模板RNA可為包含RNA指導物(例如,包含核酸酶結合序列和DNA結合序列)和RT供體RNA兩者的單個RNA分子。在其他實施方式中,編輯模板RNA包含RNA指導物和RT供體RNA作為單獨的RNA分子。
在一些實施方式中,編輯模板RNA或其任何部分在載體中編碼。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。
i.RNA 指導物
在本文揭露的任一基因編輯系統中,編輯模板RNA包含RNA指導物,該RNA指導物經由也包含在基因編輯系統中的CRISPR核酸酶介導靶核酸的切割。RNA指導物(或gRNA)包含核酸酶結合序列和DNA結合序列(間隔子)。核酸酶結合序列可以包含一或多個可以被CRISPR核酸酶識別用於結合的結合位點。在一些情況下,gRNA係包含核酸酶結合序列和間隔子序列兩者的單個RNA分子。可替代地,gRNA可以包含核酸酶結合序列和間隔子作為兩種單獨的RNA分子。
在一些實施方式中,RNA指導物在RNA指導物的5’末端、在RNA指導物的3’末端或在RNA指導物內的分子內位置處包含RNA延伸。在各個實施方式中,RNA延伸的長度為至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少21個核苷酸、至少22個核苷酸、至少23個核苷酸、至少24個核苷酸、至少25個核苷酸、至少26個核苷酸、至少27個核苷酸、至少28個核苷酸、至少29個核苷酸、至少30個核苷酸、至少31個核苷酸、至少32個核苷酸、至少33個核苷酸、至少34個核苷酸、至少35個核苷酸、至少36個核苷酸、至少37個核苷酸、至少38個核苷酸、至少39個核苷酸、至少40個核苷酸、至少41個核苷酸、至少42個核苷酸、至少43個核苷酸、至少44個核苷酸、至少45個核苷酸、至少46個核苷酸、至少47個核苷酸、至少48個核苷酸、至少49個核苷酸或至少50個核苷酸。在一些實施方式中,RNA延伸係反轉錄供體RNA(「RT供體RNA」)(例如,RNA指導物與RT供體RNA融合)。在一些實施方式中,RT供體RNA包含如本文所述之引物結合位點(PBS)和反轉錄模板序列。
核酸酶結合序列
在一些實施方式中,如本文所述之組成物包含核酸酶結合序列。在一些實施方式中,核酸酶結合序列係CRISPR核酸酶結合序列(例如,核酸酶結合序列能夠結合V型核酸酶或II型核酸酶)。在一些實施方式中,核酸酶結合序列進一步是核酸結合序列(例如,DNA結合序列)。
在一些實施方式中,核酸酶結合序列包含RNA指導物。RNA指導物可以以特異性結合親和力結合本文所述之任何一種CRISPR核酸酶(例如,V型核酸酶或II型核酸酶)。在一些實施方式中,RNA指導物進一步包含對靶序列的特異性結合親和力。在一些實施方式中,本文所述之組成物包含兩個或更多個RNA指導物(例如,2、3、4、5、6、7、8、9或更多個)。在一些實施方式中,在載體中編碼核酸酶結合序列。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。
在一些實施方式中,核酸酶結合序列包含同向重複序列。在某些實施方式中,核酸酶結合序列包括與DNA結合序列(例如,DNA靶向序列或間隔子)連接的同向重複序列。在一些實施方式中,核酸酶結合序列包括同向重複序列和DNA結合序列或同向重複-DNA結合序列-同向重複序列。在一些實施方式中,核酸酶結合序列包括截短的同向重複序列和DNA結合序列,這係經加工或成熟crRNA的典型特徵。
在一些實施方式中,核酸酶結合序列(例如,同向重複序列)能夠結合Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些實施方式中,同向重複序列能夠結合Cas9多肽。
在其中核酸酶結合序列係針對可公開獲得的CRISPR核酸酶的同向重複序列的實施方式中,那些同向重複序列係本領域已知的。在一些實施方式中,能夠結合CRISPR核酸酶的同向重複序列係以下文獻中揭露的那些中的任一個:WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將該等文獻的相關揭露藉由引用併入。
在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列與SEQ ID NO: 12-24中任一項包含至少90%同一性。在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列與SEQ ID NO: 12-24中任一項包含至少95%同一性。在其中CRISPR核酸酶係Cas12i多肽的一些實施方式中,同向重複序列包含SEQ ID NO: 12-24中的任一項。在一些實施方式中,同向重複序列包含SEQ ID NO: 12-24中任一項的一部分。
[
表 3]
. 同向重複序列 .
序列識別字 | 同向重複序列 | Cas12i 描述 |
SEQ ID NO: 12 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC | Cas12i1(本申請之SEQ ID NO: 8) |
SEQ ID NO: 13 | AAUUUUUGUGCCCAUCGUUGGCAC | Cas12i1(本申請之SEQ ID NO: 8) |
SEQ ID NO: 14 | AUUUUUGUGCCCAUCGUUGGCAC | Cas12i1(本申請之SEQ ID NO: 8) |
SEQ ID NO: 15 | GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 16 | GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 17 | AGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 18 | CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU | Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11) |
SEQ ID NO: 19 | CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG | Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11) |
SEQ ID NO: 20 | AUAGUGUGUCCUUAGUUGACAU | Cas12i3(美國專利案號10,808,245之SEQ ID NO: 14或本申請之SEQ ID NO: 11) |
SEQ ID NO: 21 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC | Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10) |
SEQ ID NO: 22 | CCCACAAUACCUGAGAAAUCCGUCCUACGUUGACGG | Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10) |
SEQ ID NO: 23 | UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC | Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10) |
SEQ ID NO: 24 | AGACAUGUGUCCUCAGUGACAC | Cas12i4(美國專利案號10,808,245之SEQ ID NO: 16,本申請之SEQ ID NO: 9或10) |
SEQ ID NO: 241 | AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 242 | AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 243 | CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 244 | CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 245 | GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 246 | GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
SEQ ID NO: 247 | GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG | Cas12i2(美國專利案號10,808,245之SEQ ID NO: 5或本申請之SEQ ID NO: 2-7) |
其他CRISPR核酸酶(如其他V型CRISPR核酸酶)的核酸酶結合序列係本領域已知的和/或者在下
表 4-6中提供。
DNA結合序列
RNA指導物也可以包含DNA結合序列。在一些實施方式中,DNA結合序列係DNA靶向序列(例如,間隔子)。間隔子的長度可以為從約7個核苷酸至約100個核苷酸。例如,間隔子的長度可以為從約7個核苷酸至約80個核苷酸、從約7個核苷酸至約50個核苷酸、從約7個核苷酸至約40個核苷酸、從約7個核苷酸至約30個核苷酸、從約7個核苷酸至約25個核苷酸、從約7個核苷酸至約20個核苷酸或從約7個核苷酸至約19個核苷酸。例如,間隔子的長度可以為從約7個核苷酸至約20個核苷酸、從約7個核苷酸至約25個核苷酸、從約7個核苷酸至約30個核苷酸、從約7個核苷酸至約35個核苷酸、從約7個核苷酸至約40個核苷酸、從約7個核苷酸至約45個核苷酸、從約7個核苷酸至約50個核苷酸、從約7個核苷酸至約60個核苷酸、從約7個核苷酸至約70個核苷酸、從約7個核苷酸至約80個核苷酸、從約7個核苷酸至約90個核苷酸、從約7個核苷酸至約100個核苷酸、從約10個核苷酸至約25個核苷酸、從約10個核苷酸至約30個核苷酸、從約10個核苷酸至約35個核苷酸、從約10個核苷酸至約40個核苷酸、從約10個核苷酸至約45個核苷酸、從約10個核苷酸至約50個核苷酸、從約10個核苷酸至約60個核苷酸、從約10個核苷酸至約70個核苷酸、從約10個核苷酸至約80個核苷酸、從約10個核苷酸至約90個核苷酸或從約10個核苷酸至約100個核苷酸。
在一些實施方式中,通常將RNA指導物中的間隔子設計為長度係7和50個核苷酸之間或15和35個核苷酸之間(例如,7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50個核苷酸)並且與特定靶序列互補。在一些實施方式中,可以設計RNA指導物的長度為18-22個核苷酸。
在一些實施方式中,DNA結合序列與如本文所述之靶序列具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列同一性,並能夠經由鹼基配對與靶序列的互補區結合。
在一些實施方式中,DNA結合序列僅包含RNA鹼基。在一些實施方式中,DNA結合序列包含DNA鹼基(例如,間隔子包含至少一個胸腺嘧啶)。在一些實施方式中,DNA結合序列包含RNA鹼基和DNA鹼基(例如,DNA結合序列包含至少一個胸腺嘧啶和至少一個尿嘧啶)。
在一些情況下,本文揭露的RNA指導物可以進一步包含連接子序列、5’末端和/或3’末端保護片段(參見本文揭露內容)或其組合。
本文揭露的任一RNA指導物中的間隔子可以對靶序列具有特異性,即,能夠經由鹼基配對與靶序列的互補區結合。在一些情況下,靶序列可能在目的基因組位點內,例如,在需要基因編輯的地方。
在一些實施方式中,靶序列與PAM序列相鄰。PAM序列係本領域已知的。在一些實施方式中,能夠被CRISPR核酸酶識別的PAM序列揭露於WO 2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO 2019006471,出於本文引用的主題和目的,將每篇文獻中的相關揭露內容併入。
當基因編輯系統包含Cas12i多肽時,PAM序列包含5’-NTTN-3’(或5’-TTN-3’),其中N係任何核苷酸(例如,A、G、T或C)。PAM序列位於靶序列的上游。與其他CRISPR核酸酶相關聯的PAM序列可以包含序列5’-TTY-3’或5’-TTB-3’,其中Y係C或T,並且B係G、T或C。PAM序列可以緊鄰靶序列,或例如在靶序列的少量(例如,1、2、3、4或5個)核苷酸內。
下
表 4-6提供了示例性V型CRISPR核酸酶及其相應的核酸酶結合序列和如本領域已知的PAM序列。該等序列允許熟悉該項技術者用另一種V型CRISPR核酸酶設計如本文所述之編輯模板RNA。
[
表 4]
. 示例性 V 型 CRISPR 核酸酶的 PAM 序列
a:出於本文引用的主題和目的,將該等引用文獻的相關揭露藉由引用併入。
*:V代表A、C或G;R代表A或G;B代表C、G或T;(T)視需要的;na代表沒有PAM
[
表 5]
.Cas12 家族蛋白的同向重複序列
亞型 | 蛋白質名稱 | 通常關聯的 PAM* | Tracr 要求 | 參考 a |
A | Cas12a(Cpf1) | (T)TTV | 否 | Zetsche等人, Cell [細胞], 163:759-771; 2015 |
B | Cas12b | TTN | 是 | Shmakov等人, Mol. Cell [分子細胞] 60, 385-397; 2015 |
C | Cas12c | TG或TN | 是 | Yan等人, Science [科學] 363, 88-91; 2019; Harrington等人, Mol. Cell [分子細胞] 79, 416-424 e415; 2020 |
D | Cas12d | TA或TG | 否 | Chen L. X.等人, Front. Microbiol. [微生物學前沿] 10:928; 2019; Harrington等人, 2020 |
E | Cas12e | TTCN | 是 | Liu J. J.等人, Nature [自然] 566, 218-223; 2019 |
F | Cas14(Cas12f) | -- | 是(Cas14a) 否(Cas14b和Cas14c) | Harrington等人, Science [科學] 362, 839-842; 2018 |
G | Cas12g | na | 是 | Yan等人, Science [科學] 363, 88-91; 2019; PCT/US 2019/022376 |
H | Cas12h | RTR | 否 | Yan等人, 2019; PCT/US 2020/063125 |
I | Cas12i | TTN | 否 | Yan等人, 2019; PCT/US 2021/025257 |
CRISPR-Casɸ | Cas12j | TBN | 否 | Pausch等人 Science [科學] 369, 333-337; 2020 |
Cpf1 蛋白 | SEQ ID NO: | 同向重複 |
FnCpf1 | 93 | UAAUUUCUACUGUUGUAGAU |
Lb3Cpf1 | 94 | AGAAAUGCAUGGUUCUCAUGC |
BpCpf1 | 101 | AAAAUUACCUAGUAAUUAGGU |
PeCpf1 | 102 | GGAUUUCUACUUUUGUAGAU |
PbCpf1 | 103 | AAAUUUCUACUUUUGUAGAU |
SsCpf1 | 104 | CGCGCCCACGCGGGGCGCGAC |
AsCpf1 | 105 | UAAUUUCUACUCUUGUAGAU |
Lb2Cpf1 | 106 | GAAUUUCUACUAUUGUAGAU |
CMtCpf1 | 107 | GAAUCUCUACUCUUUGUAGAU |
EeCpf1 | 108 | UAAUUUCUACUUUGUAGAU |
MbCpf1 | 109 | AAAUUUCUACUGUUUGUAGAU |
LiCpf1 | 111 | GAAUUUCUACUUUUGUAGAU |
LbCpf1 | 113 | UAAUUUCUACUAAGUGUAGAU |
PcCpf1 | 115 | UAAUUUCUACUAUUGUAGAU |
PdCpf1 | 117 | UAAUUUCUACUUCGGUAGAU |
PmCpf1 | 119 | UAAUUUCUACUAUUGUAGAU |
還參見Zetsche等人, Cell [細胞] 163:759-771 (2015),出於本文引用的主題和目的,將該文獻的相關揭露藉由引用併入。
下表6提供了如本領域已知的另外的V型CRISPR核酸酶的資訊。
[
表 6]
. 另外的 V 型 CRISPR 核酸酶
a:出於本文引用的主題和目的,將該等引用文獻的相關揭露藉由引用併入。
ii.RNA 反轉錄酶供體或 RT 供體 RNA
亞型 | 蛋白質名稱 | 參考 a |
B | Cas12b | Shmakov等人, 2015 |
C | Cas12c | Yan等人, 2019; Harrington等人, 2020 |
D | Cas12d | Harrington等人, 2020 |
E | Cas12e | Liu J. J. 等人, 2019 |
F | Cas14(cas12f) | Harrington等人, 2018 |
本文揭露的任一基因編輯系統中的編輯模板RNA還可以包含RNA反轉錄酶(RT)供體(RT供體RNA)。RT供體RNA可以包含:(i) 引物結合位點(PBS),和 (ii) 反轉錄模板序列。在一些情況下,RT供體RNA可以進一步包含:(iii) 核苷酸連接子序列,(iv) 5’末端和/或3’末端保護片段(參見本文揭露內容)或其組合。在一些實施方式中,編輯模板RNA包含一或多個RT供體RNA。在一些實施方式中,編輯模板RNA包含一或多個PBS、一或多個反轉錄模板序列、和/或一或多個核苷酸連接子序列。在一些實施方式中,第一編輯模板RNA包含一或多個PBS,並且第二編輯模板RNA包含一或多個反轉錄模板序列。
在一些實施方式中,RT供體RNA包含適配體。在一些實施方式中,適配體募集反轉錄酶多肽。
引物結合位點(PBS)
在一些實施方式中,如本文揭露的RT供體RNA中的PBS係能夠經由鹼基配對與DNA股結合的RNA序列。DNA股已經或可以被CRISPR核酸酶產生切口或切割。在一些實施方式中,PBS包含能夠經由鹼基配對與DNA股(PBS靶向位點)結合的RNA序列。DNA股可以具有游離的3’游離末端,或者可以經由同一基因編輯系統中包含的CRISPR核酸酶的切割產生3’游離末端。在一些實例中,PBS靶向位點可以位於與PAM序列相同的DNA股(PAM股)上。在一些實例中,PBS靶向位點可以位於PAM股的互補股(非PAM股)上。
在一些實施方式中,PBS的長度為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,PBS的長度為約3個核苷酸至約200個核苷酸(例如,約3個核苷酸、5個核苷酸、8個核苷酸、10個核苷酸、13個核苷酸、15個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸、100個核苷酸、110個核苷酸、120個核苷酸、130個核苷酸、140個核苷酸、150個核苷酸、160個核苷酸、170個核苷酸、180個核苷酸、190個核苷酸、200個核苷酸或之間的任何長度)。在一些實施方式中,PBS的長度為約3個核苷酸至約100個核苷酸(例如,約3個核苷酸、5個核苷酸、8個核苷酸、10個核苷酸、13個核苷酸、15個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸或100個核苷酸或之間的任何長度)。
在一些實施方式中,PBS的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約40個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約30個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約20個核苷酸。在一些實施方式中,PBS的長度為約10個核苷酸至約15個核苷酸。在一些實施方式中,PBS的長度為約11個核苷酸。在一些實施方式中,PBS的長度為約12個核苷酸。在一些實施方式中,PBS的長度為約13個核苷酸。在一些實施方式中,PBS的長度為約14個核苷酸。在一些實施方式中,PBS的長度為約30個核苷酸。
在包含Cas12i多肽(例如,如本文所揭露的那些Cas12i2多肽)的基因編輯系統中,RT供體RNA中的PBS可以與非PAM股上的區域(PBS靶向位點)結合。在一些情況下,PBS靶向位點可以位於靶序列互補區的上游。例如,PBS靶向位點可為互補區上游的多達20個核苷酸,例如,多達15個核苷酸、多達10個核苷酸或多達5個核苷酸。在特定實例中,PBS靶向位點可為互補區上游的約3個核苷酸至約10個核苷酸。在特定實例中,PBS靶向位點可為互補區上游的1個核苷酸、1-2個核苷酸、1-3個核苷酸、1-4個核苷酸、1-5個核苷酸、1-6個核苷酸、1-7個核苷酸、1-8個核苷酸、1-9個核苷酸、1-10個核苷酸、2-3個核苷酸、2-4個核苷酸、2-5個核苷酸、2-6個核苷酸、2-7個核苷酸、2-8個核苷酸、2-9個核苷酸、2-10個核苷酸、3-4個核苷酸、3-5個核苷酸、3-6個核苷酸、3-7個核苷酸、3-8個核苷酸、3-9個核苷酸、3-10個核苷酸、4-5個核苷酸、4-6個核苷酸、4-7個核苷酸、4-8個核苷酸、4-9個核苷酸、4-10個核苷酸、5-6個核苷酸、5-7個核苷酸、5-8個核苷酸、5-9個核苷酸、5-10個核苷酸、6-7個核苷酸、6-8個核苷酸、6-9個核苷酸、6-10個核苷酸、7-8個核苷酸、7-9個核苷酸、7-10個核苷酸、8-9個核苷酸、8-10個核苷酸、9-10個核苷酸或10個核苷酸。在其他情況下,PBS靶向位點可以與互補區重疊。當基因編輯系統中的Cas12i多肽在靶序列和互補區內或附近產生游離的3’末端時,在互補區上游或與其重疊的位點與非PAM股結合的PBS可以有效地促進基因編輯系統中RT多肽進行DNA合成,該合成從非PAM股中產生的游離3’末端開始。
圖 12A和
圖 12B中提供了示例性說明。
反轉錄模板序列
反轉錄模板序列(模板序列)作為由本文所揭露的基因編輯系統中的RT多肽介導的反轉錄模板。在一些實施方式中,反轉錄模板序列包含具有至少一個經編碼的編輯的序列。在一些實施方式中,反轉錄模板序列包含與靶序列或其具有至少一個經編碼的編輯的互補區的序列同源性。在一些實施方式中,反轉錄模板序列的長度為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸、20個核苷酸、30個核苷酸、40個核苷酸、50個核苷酸、60個核苷酸、70個核苷酸、80個核苷酸、90個核苷酸、100個核苷酸、110個核苷酸或120個核苷酸或之間的任何長度。
在一些實施方式中,反轉錄模板序列為約25個核苷酸。在一些實施方式中,反轉錄模板序列為約26個核苷酸。在一些實施方式中,反轉錄模板序列為約27個核苷酸。在一些實施方式中,反轉錄模板序列為約28個核苷酸。在一些實施方式中,反轉錄模板序列為約29個核苷酸。在一些實施方式中,反轉錄模板序列為約30個核苷酸。在一些實施方式中,反轉錄模板序列為約31個核苷酸。在一些實施方式中,反轉錄模板序列為約32個核苷酸。在一些實施方式中,反轉錄模板序列為約33個核苷酸。在一些實施方式中,反轉錄模板序列為約34個核苷酸。在一些實施方式中,反轉錄模板序列為約35個核苷酸。在一些實施方式中,反轉錄模板序列為約36個核苷酸。在一些實施方式中,反轉錄模板序列為約37個核苷酸。在一些實施方式中,反轉錄模板序列為約38個核苷酸。在一些實施方式中,反轉錄模板序列為約39個核苷酸。在一些實施方式中,反轉錄模板序列為約40個核苷酸。在一些實施方式中,反轉錄模板序列為約41個核苷酸。在一些實施方式中,反轉錄模板序列為約42個核苷酸。在一些實施方式中,反轉錄模板序列為約43個核苷酸。在一些實施方式中,反轉錄模板序列為約44個核苷酸。在一些實施方式中,反轉錄模板序列為約45個核苷酸。在一些實施方式中,反轉錄模板序列為約46個核苷酸。在一些實施方式中,反轉錄模板序列為約47個核苷酸。在一些實施方式中,反轉錄模板序列為約48個核苷酸。在一些實施方式中,反轉錄模板序列為約49個核苷酸。在一些實施方式中,反轉錄模板序列為約50個核苷酸。
在一些實施方式中,反轉錄模板序列包含相對於靶序列的至少一個經編碼的編輯。在其他實施方式中,反轉錄模板序列包含相對於靶序列互補區的至少一個經編碼的編輯。在一些實施方式中,至少一個經編碼的編輯包含至少一個取代、插入、和/或缺失。在一些實施方式中,靶序列中的編輯包含相對於靶序列的序列的取代、插入、和/或缺失。在一些實施方式中,反轉錄模板序列包含至少一個LoxP位點。
在一些實施方式中,編輯可為單或多核苷酸取代,例如G到T取代、G到A取代、G到C取代、T到G取代、T到A取代、T到C取代、C到G取代、C到T取代、C到A取代、A到T取代、A到G取代或A到C取代。在一些實施方式中,序列的變化可以進行以下鹼基對的轉化:G:C鹼基對到T:A鹼基對、G:C鹼基對到A:T鹼基對、G:C鹼基對到C:G鹼基對、T:A鹼基對到G:C鹼基對、T:A鹼基對到A:T鹼基對、T:A鹼基對到C:G鹼基對、C:G鹼基對到G:C鹼基對、C:G鹼基對到T:A鹼基對、C:G鹼基對到A:T鹼基對、A:T鹼基對到T:A鹼基對、A:T鹼基對到G:C鹼基對或A:T鹼基對到C:G鹼基對。
在一些實施方式中,單或多核苷酸取代的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,取代的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,取代的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,取代的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,取代的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,編輯包含單或多核苷酸插入,該單或多核苷酸插入的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,單或多核苷酸插入的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,插入的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,編輯包含單或多核苷酸缺失,該單或多核苷酸缺失的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,單或多核苷酸缺失的長度為從1個核苷酸至約200個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,單或多核苷酸缺失的長度為從1個核苷酸至約300個核苷酸,例如,長度為1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,缺失的長度為多達約10,000個鹼基(10 kb)。例如,在一些實施方式中,缺失的長度為1個鹼基、約10個鹼基、約20個鹼基、約30個鹼基、約40個鹼基、約50個鹼基、約60個鹼基、約70個鹼基、約80個鹼基、約90個鹼基、約100個鹼基、約200個鹼基、約300個鹼基、約400個鹼基、約500個鹼基、約600個鹼基、約700個鹼基、約800個鹼基、約900個鹼基、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,反轉錄模板序列包含至少一個經編碼的編輯並且長度為從約5個核苷酸至約10,000個核苷酸,例如,長度為從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸或約1千鹼基(kb)、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
反轉錄模板序列可以藉由本文所述之基因編輯系統的反轉錄酶轉錄成DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成非PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列從5’到3’轉錄成非PAM股的DNA。在一些實施方式中,反轉錄模板序列係PBS的5’。在一些實施方式中,反轉錄模板序列係PBS的3’。在一些實施方式中,反轉錄模板序列通過從PBS的3’延伸轉錄成PAM股的DNA。在一些實施方式中,反轉錄模板序列通過從PBS的3’延伸轉錄成非PAM股的DNA。
iii. 另外的元件
在一些實施方式中,編輯模板RNA可以包含一或多種另外的元件。例如,編輯模板RNA或其gRNA和/或RT供體RNA可以在RNA分子的一端或兩端包含一或多個保護片段。可替代地或另外地,編輯模板RNA或其gRNA和/或RT供體RNA可以包含RNA分子內部另外的元件(例如,在編輯模板RNA中的一或多個序列之間,例如,在PBS和反轉錄模板序列之間,例如連接子)。在一些實施方式中,編輯模板RNA在該編輯模板RNA的一或多個序列之間包含另外的元件,例如像RNA指導物(核酸酶結合序列或DNA結合序列)或RT供體RNA(PBS或反轉錄模板序列)。
在一些實施方式中,編輯模板RNA在一或多個末端處包含另外的元件,例如同向重複序列。在一些實施方式中,同向重複序列可以募集CRISPR核酸酶(例如,V型核酸酶,例如變體Cas12i2多肽或變體Cas12i2-反轉錄酶融合多肽)。
在一些實施方式中,另外的元件的長度可以為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。
在一些實例中,編輯模板RNA可以包含視需要的核苷酸連接子。這樣視需要的核苷酸連接子序列的長度可以為至少3個核苷酸、至少4個核苷酸、至少5個核苷酸、至少6個核苷酸、至少7個核苷酸、至少8個核苷酸、至少9個核苷酸、至少10個核苷酸、至少11個核苷酸、至少12個核苷酸、至少13個核苷酸、至少14個核苷酸、至少15個核苷酸、至少16個核苷酸、至少17個核苷酸、至少18個核苷酸、至少19個核苷酸、至少20個核苷酸、至少30個核苷酸、至少40個核苷酸、至少50個核苷酸、至少60個核苷酸、至少70個核苷酸、至少80個核苷酸、至少90個核苷酸、至少100個核苷酸、至少200個核苷酸、至少300個核苷酸、至少400個核苷酸或至少500個核苷酸。在一些實施方式中,視需要的核苷酸連接子位於核酸酶結合序列、DNA結合序列、PBS和/或反轉錄模板序列中的任一個之間。
在一些實例中,編輯模板RNA或其gRNA和/或RT供體RNA的5’末端和/或3’末端可以含有保護片段,該保護片段可增強RNA分子對核酸外切酶活性的抗性。參見例如
圖 11。在一些情況下,末端保護片段可以包含能夠形成二級結構(例如髮夾、假結或三鏈體結構)的核苷酸序列。在其他情況下,末端保護片段可以包含外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA的序列。在一些實施方式中,修飾係寨卡樣(Zika-like)假結、鼠白血病病毒假結(MLV-PK)序列、紅三葉草(red clover)壞死鑲嵌病毒(RCNMV)序列、甜三葉草(sweet clover)壞死鑲嵌病毒(SCNMV)序列、康乃馨輪點病毒(CRSV)序列、preQ序列或RNA噬菌體MS2序列。在特定實例中,末端保護片段可以包含一或多個CRISPR核酸酶結合位點(例如,Cas12i多肽如Cas12i2多肽的結合位點),以及視需要與任何人序列不具有同源性的一或多個區段(例如,間隔子)。在一些情況下,一或多個區段結合至與人基因組的任何序列不超過85%同一性的序列。參見
圖 10 、圖 11、
圖 12A和
圖 12B。這樣的末端保護片段可以募集包含在同一基因編輯系統中的CRISPR核酸酶以抑制外切核糖核酸酶的活性,而不會誘導脫靶基因編輯。
在一些實施方式中,本文揭露的基因編輯系統包含至少一個編輯模板RNA(例如,基因編輯RNA)或編碼其的核苷酸序列。在一些實例中,至少一個編輯模板RNA能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實例中,至少一個編輯模板RNA進一步能夠與核酸(例如,DNA或靶核酸)結合。在一些實例中,至少一個編輯模板RNA包含核酸酶結合序列(例如,可被CRISPR核酸酶識別的一或多個結合位點)和DNA結合序列(例如,間隔子)。在一些情況下,至少一個編輯模板RNA包含gRNA(包含核酸酶結合序列和間隔子)和RT供體RNA。在一些實施方式中,編輯模板RNA包含與RT供體RNA連接的RNA指導物。參見例如,
圖 19B。
iv. 核酸的修飾
如本文揭露的基因編輯系統中的任一種RNA組分,例如編輯模板RNA、RNA指導物、RT供體RNA,可以包括一或多個修飾。
示例性修飾可以包括對糖、核鹼基、核苷間連接(例如,對連接的磷酸酯/對磷酸二酯連接/對磷酸二酯主鏈)及其任何組合的任何修飾。以下詳細描述了本文提供的一些示例性修飾。
RNA指導物或編碼組成物組分的任一核酸序列可以包括任何有用的修飾,例如對糖、核鹼基或核苷間連接(例如,對連接的磷酸酯/對磷酸二酯連接/對磷酸二酯主鏈)的修飾。嘧啶核鹼基的一或多個原子可以被視需要取代的胺基、視需要取代的硫醇、視需要取代的烷基(例如甲基或乙基)或鹵代(例如氯代或氟代)替代或取代。在某些實施方式中,在糖和核苷間連接中的每一個中存在修飾(例如,一或多個修飾)。修飾可為對核糖核酸(RNA)到去氧核糖核酸(DNA)、蘇糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其雜交體的修飾。本文描述了另外的修飾。
在一些實施方式中,修飾可以包括化學或細胞誘導的修飾。例如,細胞內RNA修飾的一些非限制性實例由Lewis和Pan在「RNA modifications and structures cooperate to guide RNA-protein interactions [RNA修飾和結構協作指導RNA-蛋白質相互作用]」, Nat Reviews Mol Cell Biol [自然評論:分子細胞生物學], 2017, 18:202-210中所描述。
不同的糖修飾、核苷酸修飾和/或核苷間連接(例如,主鏈結構)可以存在於序列中的不同位置。熟悉該項技術者將理解,核苷酸類似物或其他一或多個修飾可以位於序列的任何一或多個位置,使得該序列的功能基本上不降低。序列可以包括從約1%至約100%的經修飾核苷酸(相對於總核苷酸含量,或相對於一或多種類型的核苷酸,即A、G、U或C中的任何一或多種)或任何中間百分比(例如,從1%至20%>、從1%至25%、從1%至50%、從1%至60%、從1%至70%、從1%至80%、從1%至90%、從1%至95%、從10%至20%、從10%至25%、從10%至50%、從10%至60%、從10%至70%、從10%至80%、從10%至90%、從10%至95%、從10%至100%、從20%至25%、從20%至50%、從20%至60%、從20%至70%、從20%至80%、從20%至90%、從20%至95%、從20%至100%、從50%至60%、從50%至70%、從50%至80%、從50%至90%、從50%至95%、從50%至100%、從70%至80%、從70%至90%、從70%至95%、從70%至100%、從80%至90%、從80%至95%、從80%至100%、從90%至95%、從90%至100%和從95%至100%)。
在一些實施方式中,序列的一或多個核糖核苷酸的糖修飾(例如在2'位置或4'位置)或糖替代以及主鏈修飾可以包括磷酸二酯連接的修飾或替代。序列之特定實例包括但不限於包括經修飾的主鏈或非天然核苷間連接(例如核苷間修飾,包括磷酸二酯連接的修飾或替代)的序列。具有經修飾的主鏈的序列尤其包括在主鏈中不具有磷原子的那些。出於本申請之目的,並且如本領域中有時提及的,在其核苷間主鏈中不具有磷原子的經修飾的RNA也可以被認為是寡核苷。在特定的實施方式中,序列將包括在其核苷間主鏈中具有磷原子的核糖核苷酸。
經修飾的序列主鏈可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、胺基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3’-伸烷基膦酸酯和手性膦酸酯)、亞膦酸酯、胺基磷酸酯(如3’-胺基胺基磷酸酯和胺基烷基胺基磷酸酯)、硫羰胺基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯、和具有正常3'-5’連接的硼烷磷酸酯、該等酯的2’-5’連接的類似物,以及具有相反極性的那些,其中相鄰的核苷單元對3’-5’連接至5’-3’或2’-5’連接至5'-2’。也包括各種鹽、混合鹽和游離酸形式。在一些實施方式中,序列可以帶負電荷或帶正電荷。
可在核苷間連接(例如磷酸酯主鏈)上修飾可摻入序列中的經修飾的核苷酸。在本文中,在多核苷酸主鏈之上下文中,短語「磷酸酯」和「磷酸二酯」可互換使用。可以藉由用不同的取代基替代一或多個氧原子來修飾主鏈磷酸酯基團。此外,經修飾的核苷和核苷酸可以包括用如本文所述之另一個核苷間連接進行的對未修飾的磷酸酯部分的整體替代。經修飾的磷酸酯基團之實例包括但不限於硫代磷酸酯、亞磷酸硒酸酯、硼酸磷酸酯、硼酸磷酸酯、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的兩個非連接氧都被硫替代。也可以藉由用氮(橋連的胺基磷酸酯)、硫(橋連的硫代磷酸酯)和碳(橋連的亞甲基膦酸酯)替代連接氧來修飾磷酸酯連接子。
提供α-硫代取代的磷酸酯部分以通過非天然硫代磷酸酯主鏈連接賦予RNA和DNA聚合物穩定性。硫代磷酸酯DNA和RNA具有增強的核酸酶抗性,並因此在細胞環境中具有更長的半衰期。
在特定的實施方式中,經修飾的核苷包括α-硫代-核苷(例如5’
-O-(1-硫代磷酸)-腺苷、5’-
O-(1-硫代磷酸)-胞苷(α-硫代胞苷)、5’-
O-(1-硫代磷酸)-鳥苷、5’-
O-(1-硫代磷酸)-尿苷或5’-
O-(1-硫代磷酸)-假尿苷)。
本文描述了可根據本發明使用的其他核苷間連接,包括不含磷原子的核苷間連接。
在一些實施方式中,序列可以包括一或多個細胞毒性核苷。例如,可以將細胞毒性核苷摻入序列中,如雙官能修飾。細胞毒性核苷可以包括但不限於阿糖腺苷、5-氮雜胞苷、4'-硫代阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱、氯法拉濱、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-去氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他濱、5-氟尿嘧啶、氟達拉濱、氟尿苷、吉西他濱、替加氟和尿嘧啶的組合、替加氟((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱、替紮西他濱、2'-去氧-2'-亞甲基胞苷(DMDC)和6-巰基嘌呤。其他實例包括氟達拉濱磷酸酯、N4-山崳醯基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯呋喃糖基胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5’-反油酸酯)。
在一些實施方式中,序列包括一或多個轉錄後修飾(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、醯化、磷酸化、離胺酸和精胺酸殘基的甲基化、乙醯化、以及硫醇基團和酪胺酸殘基的亞硝基化等)。該一或多個轉錄後修飾可為任何轉錄後修飾,諸如已經在RNA中鑒定出的多於一百種不同的核苷修飾中的任一種(Rozenski, J, Crain, P和McCloskey, J. (1999).The RNA Modification Database: 1999 update. [RNA修飾資料庫:1999年更新]Nucl Acids Res [核酸研究] 27: 196-197)。在一些實施方式中,第一分離核酸包含信使RNA(mRNA)。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:吡啶-4-酮核糖核苷、5-氮雜-尿苷、2-硫代-5-氮雜-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫代-二氫尿苷、2-硫代-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞苷、5-羥基甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假異胞苷、4-硫代-1-甲基-假異胞苷、4-硫代-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、折布拉林(zebularine)、5-氮雜-折布拉林、5-甲基-折布拉林、5-氮雜-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷和4-甲氧基-1-甲基-假異胞苷。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲基硫代-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯胺甲醯基腺苷、N6-蘇胺醯胺甲醯基腺苷、2-甲基硫代-N6-蘇胺醯胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些實施方式中,mRNA包含至少一種選自以下群組的核苷,該群組由以下組成:1-甲基-肌苷、懷俄苷、懷丁苷、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫代-鳥苷、6-硫代-7-去氮-鳥苷、6-硫代-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫代-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫代-鳥苷、N2-甲基-6-硫代-鳥苷、和N2,N2-二甲基-6-硫代-鳥苷。
序列沿著分子的整個長度可以被或者可以不被均一地修飾。例如,一或多種或所有類型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一或多種或全部)在序列中,或在其給定的預定序列區域中可以被或可以不被均一地修飾。在一些實施方式中,序列包括假尿苷。在一些實施方式中,序列包括肌苷,該肌苷可以説明免疫系統將序列相對於病毒RNA表徵為內源性。肌苷的摻入還可以介導改善的RNA穩定性/減少降解。參見例如,Yu, Z.等人, (2015) RNA editing by ADAR1 marks dsRNA as 「self」. [藉由ADAR1進行的RNA編輯將dsRNA標記為「自身」]Cell Res. [細胞研究] 25, 1283-1284,將該文獻藉由引用以其全文併入。
在一些實施方式中,本文所述之任何RNA序列(例如編輯模板RNA)可以包含末端修飾(例如,5’末端修飾或3’末端修飾)。在一些實施方式中,末端修飾係化學修飾。在一些實施方式中,末端修飾係結構修飾。參見本文揭露內容。
當本文揭露的基因編輯系統包含編碼CRISPR核酸酶和/或RT多肽的核酸時,在適用的情況下,此類核酸分子可以含有本文揭露的任一修飾。
D. 示例性基因編輯系統
本文所述之示例性基因編輯系統僅旨在是說明性的。
在一些實施方式中,示例性基因編輯系統描繪於
圖 1A和
圖 1B中。在該等示例性設計中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)、本文揭露的任一另外的元件或其組合。在一些情況下,PBS的長度為約3至約24個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24個核苷酸)。可替代地或另外地,PBS可以與可能位於PAM股上的相應PBS靶向位點具有至少約75%的互補性。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸(例如,約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,連接子存在於RNA指導物中的DNA結合序列(間隔子)和反轉錄模板序列之間。在一些實例中,連接子包含一或多個髮夾。例如,髮夾可以減少PBS和DNA結合序列之間的退火。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體。在一些實施方式中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。
在其他實施方式中,如本文揭露的示例性基因編輯系統描繪於
圖 2中。在該等示例性設計中,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)、一或多種另外的元件或其組合。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸(例如,約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,PBS的長度為約3個核苷酸至約24個核苷酸(例如,約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24個核苷酸)。可替代地或另外地,PBS與可能位於PAM股上的相應PBS靶向位點具有至少約75%的互補性。在一些實施方式中,連接子存在於RNA指導物的DNA結合序列和PBS之間。在一些實例中,連接子包含一或多個髮夾。例如,髮夾可以減少PBS和DNA結合序列之間的退火。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體。在一些實施方式中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。
圖 1A、
圖 1B和
圖 2中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的PAM股。不希望受理論束縛,使用該等示例性基因編輯系統
圖 1A、
圖 1B和
圖 2,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,PAM股的游離3’末端可以與PBS鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股的鹼基配對,從而導致編輯摻入。
在又其他實施方式中,本文揭露的示例性基因編輯系統描繪於
圖 3中。這樣的示例性基因編輯系統包含兩種RNA分子:包含核酸酶結合序列和DNA結合序列(間隔子)的RNA指導物、以及RT供體RNA。RT供體RNA可以包含PBS和反轉錄模板序列。在一些實例中,反轉錄模板序列不編碼編輯。在其他實例中,RT供體RNA包含PBS和編碼編輯的反轉錄模板序列。在一些實施方式中,反轉錄模板序列或其一部分可以經由鹼基配對與靶核酸結合。
在一些情況下,PBS的長度為多達約100個核苷酸。在一些實施方式中,PBS的長度為約3個核苷酸至約100個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約100個核苷酸。在一些實施方式中,RT供體RNA的反轉錄模板序列在5’末端包含適配體。在一些實施方式中,適配體募集反轉錄酶多肽。在一些實施方式中,RT供體RNA的PBS不與編輯模板RNA的任何其他部分(例如,核酸酶結合序列和/或DNA結合序列)互補。
圖 3中描繪的示例性基因編輯系統可以包含一種或兩種蛋白質組分。例如,示例性基因編輯系統可以包含具有N-末端或C-末端融合配偶體的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該融合配偶體可以包含反轉錄酶多肽。可替代地,基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶多肽作為兩種單獨的多肽。
圖 3中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的PAM股或非PAM股。不希望受理論束縛,使用這樣的示例性基因編輯系統,在從靶核酸釋放CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)之後,PAM股或者非PAM股的游離3’末端可以與PBS進行鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股雜交,從而導致摻入來自RT供體RNA的編輯。示例性基因編輯系統可用於在靶核酸的PAM遠端區域進行編輯。
在仍其他實施方式中,本文揭露的示例性基因編輯系統描繪於
圖 4中。這樣的示例性基因編輯系統可以包含兩種RNA分子:RNA指導物和RT供體RNA作為兩種單獨的RNA分子。示例性基因編輯系統可以包含如本文揭露的一種或兩種蛋白質組分。例如,示例性基因編輯系統可以包含具有N-末端或C-末端融合配偶體的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該融合配偶體可以包含反轉錄酶多肽。可替代地,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶多肽不彼此融合(係兩種單獨的多肽)。
圖 4中描繪的示例性基因編輯系統可用於編輯PAM股或非PAM股。不希望受理論束縛,使用示例性基因編輯系統,PAM股或非PAM股的游離3’末端可以與同一基因編輯系統中的RT供體RNA的PBS鹼基配對,使用反轉錄模板序列作為模板進行延伸,並且進行股交換回到與互補基因組股雜交,從而導致摻入來自RT供體RNA的編輯。
在一些實施方式中,本文揭露的示例性基因編輯系統描繪於
圖 5中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。在一些情況下,PBS結合靶序列互補區上游的非PAM股上的位點。
在一些實例中,PBS的長度為約3個核苷酸至約100個核苷酸(例如,約3、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個核苷酸)。在一些實施方式中,DNA結合序列(間隔子)的長度為約20個核苷酸至約25個核苷酸。在一些實施方式中,DNA結合序列包含摻入來自PAM序列的約10個核苷酸至約25個核苷酸的至少一個編輯。
在一些實例中,示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶包含5’融合配偶體或3’融合配偶體。5’融合配偶體或3’融合配偶體可以包含反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性。
圖 5中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的非PAM股。不希望受理論束縛,使用這樣的示例性基因編輯系統,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,非PAM股的游離3’末端可以與PBS鹼基配對,並且使用DNA結合序列作為模板進行延伸。非PAM股上的RT延伸交換回到與互補基因組股鹼基配對,從而導致摻入來自RT供體RNA的編輯。
在一些實施方式中,示例性基因編輯系統描繪於
圖 6A和
圖 6B中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。在一些實施方式中,PBS與非PAM股中的區域互補,該區域位於PAM股上靶序列的互補區上游。在一些實例中,髮夾存在於RNA指導物的DNA結合序列和反轉錄模板序列之間。在一些實施方式中,髮夾存在於反轉錄模板序列內。在一些實施方式中,模板序列中的編輯可以在其中摻入編輯的靶核酸中創建髮夾。
在一些實例中,示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶包含N-末端或C-末端融合配偶體。N-末端或C-末端融合配偶體可以包含反轉錄酶多肽。
在一些實施方式中,示例性基因編輯系統描繪於
圖 7中。在這樣的示例性基因編輯系統中,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)。在一些實施方式中,PBS的長度為約5至約20個核苷酸(例如,約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個核苷酸)。可替代地或另外地,PBS與非PAM股上的區域(相應的PBS靶向位點)具有至少約75%的互補性。在一些情況下,連接子存在於RNA指導物的核酸酶結合序列和RT供體RNA的PBS之間。可替代地或另外地,髮夾可以存在於RNA指導物的DNA結合序列和RT供體RNA的反轉錄模板序列之間。在一些實施方式中,髮夾存在於反轉錄模板序列內。在一些實施方式中,模板序列中的編輯可以在其中摻入編輯的靶核酸中創建髮夾。
在一些情況下,示例性基因編輯系統中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包含N-末端或C-末端融合配偶體,該融合配偶體可以包含反轉錄酶多肽。在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性(例如,本文揭露的那些)。
圖 6A、
圖 6B或
圖 7中描繪的示例性基因編輯系統可用於編輯靶核酸(例如,目的基因組位點)的非PAM股。不希望受理論束縛,使用示例性基因編輯系統,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期間,非PAM股的游離3’末端可以與PBS鹼基配對,並且使用反轉錄模板序列作為模板進行延伸。非PAM股上的RT延伸交換回到與互補基因組股鹼基配對,從而導致摻入來自RT供體RNA的至少一個編輯。
本文揭露的示例性基因編輯系統(例如
圖 6A、
圖 6B或
圖 7中描繪的那些)可用於在非PAM股上與PAM股上的靶序列互補的區域內摻入至少一個PAM近端編輯。在一些實例中,示例性基因編輯系統可用於修飾PAM序列和/或PAM序列上游的序列(例如,經由在與PAM序列和/或上游序列互補的區域中引入變化)。此類示例性基因編輯系統可用於防止所得經修飾的遺傳基因座被相同的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)重新靶向。
在一些實施方式中,本文揭露的示例性基因編輯系統描繪於
圖 10中。在這樣的示例性基因編輯系統中,RNA指導物可以包含3’融合配偶體,該3’融合配偶體可以包含RT供體RNA(包含PBS和反轉錄模板序列)。可替代地,RNA指導物可以包含5’融合配偶體,該5’融合配偶體可以包含RT供體RNA(包含反轉錄模板序列和PBS)。PBS的長度係可變的。例如,PBS的長度可以為約3個核苷酸至約16個核苷酸。在一些實例中,PBS能夠與靶核酸的PAM股上的區域,例如,與靶序列重疊的區域(例如,目的基因組位點)結合。在一些實例中,髮夾存在於RNA指導物的DNA結合序列和RT供體RNA的反轉錄模板序列之間。RNA指導物-反轉錄模板序列的一端或兩端可包括保護片段(例如本文揭露的那些)以防止核酸外切酶或核酸內切酶活性。
示例性基因編輯系統可以包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),該CRISPR核酸酶可以包含N-末端或C-末端融合配偶體。在一些實例中,N-末端或C-末端融合配偶體包含反轉錄酶多肽。在一些實例中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA加工活性。在一些實例中,CRISPR核酸酶係切口酶。在一些實例中,使用
圖 10中描繪的示例性基因編輯系統將編輯摻入靶核酸的PAM股中。
圖 1- 圖 7 、圖 8A- 圖 8C 和圖 10中描繪的示例性編輯模板RNA(其包含與RNA指導序列的3’末端融合的RT供體RNA序列或與RNA指導序列的5’末端融合的RT供體RNA序列)可以代替包含與RNA指導序列的內部位置融合的RT供體RNA序列,或反之亦然。例如,RT供體RNA可以與RNA指導物、sgRNA或RNA指導物-tracrRNA(例如,sgRNA)的內部位置融合。
延伸的RNA指導物末端(例如,通過使用RT供體RNA進行的5’延伸或3’延伸)可能容易受到核酸外切酶和/或核酸內切酶活性的影響,這會降低反轉錄模板序列濃度以及編輯摻入的效率。在一些實施方式中,RNA指導物-RT供體RNA融合物進一步包含添加的二級結構以抑制或防止核酸外切酶活性。在一些實施方式中,添加的二級結構係三鏈體結構、假結、xrRNA、環狀RNA、tRNA或截短的tRNA。在一些實施方式中,添加的二級結構係寨卡樣假結、鼠白血病病毒假結(MLV-PK)序列、紅三葉草壞死鑲嵌病毒(RCNMV)序列、甜三葉草壞死鑲嵌病毒(SCNMV)序列、康乃馨輪點病毒(CRSV)序列、preQ序列或RNA噬菌體MS2序列。在一些實施方式中,添加的二級結構係通過鹼基堆疊或3’末端鹼基配對。在其他實施方式中,添加的二級結構係核酸酶結合序列或核酸酶結合序列和DNA結合序列。參見
圖 10 、圖 11、
圖 12A和
圖 12B。在一些實施方式中,添加的DNA結合序列針對非哺乳動物靶標。在一些實施方式中,添加的DNA結合序列針對非人靶標。在一些實施方式中,在人基因組中未發現添加的DNA結合序列。在一些實施方式中,添加的DNA結合序列與人基因組的任何序列具有不超過85%同一性。參見實例2。
不希望受理論束縛,添加核酸酶結合序列和DNA結合序列可以募集CRISPR核酸酶或CRISPR核酸酶-反轉錄酶融合物。通過蛋白質-RNA相互作用,結合的CRISPR核酸酶可以提供對內源性核酸外切酶和核酸內切酶的抗性。在一些實施方式中,另外的核酸酶結合序列和DNA結合序列募集缺乏RNA加工活性的CRISPR核酸酶。在一些實施方式中,二級結構係適配體(例如,RNA適配體),並且組成物進一步包含與該適配體相互作用的蛋白質。在一些實施方式中,包含適配體和適配體相互作用蛋白質的組成物抑制內源性核酸外切酶和/或核酸內切酶活性。
下文提供了另外的如本文揭露的示例性基因編輯系統,僅用於說明目的。
在一些實施方式中,如本文揭露的基因編輯系統包含至少一個RNA指導物(或指導RNA,它們在本文可互換使用)和至少一個RT供體RNA。在一些實例中,至少一個RNA指導物包含核酸酶結合序列和DNA結合序列(間隔子)。RNA指導物可能能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實例中,至少一個RNA指導物進一步能夠例如經由間隔子區域與靶核酸結合。在一些實例中,RT供體RNA包含至少一個引物結合位點(PBS)和至少一個反轉錄模板序列。PBS能夠與靶核酸的一條股結合,該股可為有義股或反義股。PBS結合的區域在本文中被描述為PBS靶向位點。至少一個反轉錄模板序列可以包含相對於靶核酸的相應序列具有至少一個核苷酸變化(經編碼的編輯)的序列。在一些情況下,至少一個經編碼的編輯係插入、取代和/或缺失。
在一些實施方式中,本文揭露的基因編輯系統包含至少一個RNA指導物、至少一個RT供體RNA和至少一個其他序列。在一些實施方式中,至少一個RNA指導物包含核酸酶結合序列和DNA結合序列。在一些實施方式中,RNA指導物能夠與CRISPR核酸酶(例如,V型CRISPR核酸酶)結合。在一些實施方式中,至少一個RNA指導物進一步能夠與靶核酸結合。在一些實施方式中,至少一個RT供體RNA的PBS能夠與靶核酸的非PAM股結合。在一些實施方式中,至少一個RT供體RNA的PBS能夠與靶核酸的PAM股結合。
在一些實施方式中,本文揭露的基因編輯系統可以包含CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種,該編輯模板RNA可以包含RNA指導物和RT供體RNA。在一些實例中,CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種在單獨的組成物中提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶、RNA指導物和RT供體RNA中的至少一種在單獨的組成物中提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶和編輯模板RNA中的至少一種中的一或多個在分開的組成物中提供。在一些實施方式中,包含CRISPR核酸酶和反轉錄酶的組成物與包含編輯模板RNA的組成物分開提供。在一些實施方式中,CRISPR核酸酶、反轉錄酶、RNA指導物和RT供體RNA中的至少一種中的一或多個在分開的組成物中提供。在一些實施方式中,包含CRISPR核酸酶和反轉錄酶的組成物與包含RNA指導物和RT供體RNA的組成物分開提供。
在一些實施方式中,本文提供的基因編輯系統可能能夠與靶核酸結合,該靶核酸可為需要基因編輯的基因組位點。在一些實施方式中,組成物的一或多種組分(例如,編輯模板RNA)結合靶核酸。在一些實施方式中,組成物的一或多種組分(例如,RNA指導物和RT供體RNA)結合靶核酸。在一些實施方式中,靶核酸係DNA。在一些實施方式中,本發明之組成物修飾或能夠修飾靶核酸。在一些實施方式中,組成物的一或多種組分(例如,CRISPR核酸酶和反轉錄酶)修飾靶核酸。在一些實施方式中,本發明之組成物將取代、插入或缺失引入到靶核酸中。在一些實施方式中,本發明之組成物能夠將取代、插入或缺失引入到靶核酸的非PAM股中。在一些實施方式中,如本文揭露的基因編輯系統能夠將取代、插入或缺失引入到靶核酸的PAM股中。
在一些實施方式中,本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分。可替代地,基因編輯系統可以包含編碼蛋白質組分的一或多種核酸(例如,載體,如病毒載體)。在一些實例中,基因編輯系統可以包含編碼CRISPR核酸酶和編碼RT多肽兩者的一種載體。可替代地或另外地,如本文所揭露的基因編輯系統可以包含基因編輯RNA、指導RNA或兩者的RNA組分。可替代地,基因編輯系統可以包含編碼RNA組分的一或多種核酸(載體)。例如,基因編輯系統可以包含編碼基因編輯RNA和RNA指導物兩者的一種載體(例如,病毒載體,如AAV載體)。
在一些實例中,如本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及基因編輯RNA和RNA指導物的RNA組分。在其他實例中,如本文揭露的基因編輯系統可以包含CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及編碼基因編輯RNA和RNA指導物的RNA組分的一或多種核酸。在又其他實例中,如本文揭露的基因編輯系統可以包含一或多種核酸,該一或多種核酸編碼CRISPR核酸酶、RT多肽或兩者的蛋白質組分,以及基因編輯RNA和RNA指導物的RNA組分。可替代地,如本文揭露的基因編輯系統可以包含編碼CRISPR核酸酶、RT多肽或兩者的蛋白質組分的一或多種核酸,以及編碼基因編輯RNA和RNA指導物的RNA組分的一或多種核酸。在一些情況下,基因編輯系統可以包含一種載體,該載體編碼基因編輯系統的多個組分。
在一些實施方式中,本文揭露的基因編輯系統包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包含基因編輯系統的一或多種蛋白質組分和/或RNA組分,或其編碼核酸。在其他實施方式中,基因編輯系統可以包含一或多種LNP,該一或多種LNP包含部分組分和編碼剩餘組分的一或多種載體。
II. 基因編輯系統組分的製備
可以藉由本文揭露的方法中的常規方法製備蛋白質組分、RNA組分或其編碼核酸。
在一些實施方式中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶或CRISPR核酸酶-反轉錄酶融合物可以藉由以下來製備:(a) 培養能夠產生蛋白質的宿主細胞(例如,細菌細胞或哺乳動物細胞),分離由此產生的蛋白質,並且視需要純化蛋白質。如此製備的CRISPR核酸酶、反轉錄酶或融合蛋白可以與編輯模板RNA複合。
CRISPR核酸酶和反轉錄酶也可以藉由 (b) 已知的基因工程技術製備,特別地,藉由從細菌中分離編碼本發明之CRISPR核酸酶和反轉錄酶的基因,構建重組表現載體,然後將載體轉移到合適的宿主細胞中,該宿主細胞表現編輯模板RNA,用於在宿主細胞中表現與編輯模板RNA複合的重組蛋白。可替代地,CRISPR核酸酶和反轉錄酶可以藉由 (c) 體外偶合的轉錄-翻譯系統來製備然後與編輯模板RNA複合。可用於製備本發明之CRISPR核酸酶和反轉錄酶的細菌沒有特別限制,只要它們可以產生本發明之CRISPR核酸酶和反轉錄酶即可。細菌的一些非限制性實例包括本文所述之大腸桿菌細胞。
除非另有說明,否則本文提供的所有組成物和複合物和多肽係參照該組成物或複合物或多肽的活性水平而製備的,並且不包括雜質,例如可能存在於市售來源中的殘留溶劑或副產物。酶組分重量基於總活性蛋白質。除非另外指明,否則所有百分比和比率均按重量進行計算。除非另外指明,否則所有百分比和比率均基於總組成物計算。在示例性組成物中,酶水平以總組成物的重量計按純酶表示,除非另有說明,否則成分以總組成物的重量表示。
A. 載體
本揭露提供了用於表現本文所述之CRISPR核酸酶、反轉錄酶或其融合多肽的一或多種載體,或者可將編碼本文所述組分的核酸摻入載體中。在一些實施方式中,本文揭露的載體包括編碼CRISPR核酸酶、反轉錄酶或融合多肽的核苷酸序列。本揭露還提供了編碼編輯模板RNA或其任何部分(例如,RNA指導物或RT供體RNA)的一或多種載體。在一些實施方式中,載體包含Pol II啟動子或Pol III啟動子。
天然或合成的多核苷酸的表現典型地藉由以下實現:將編碼目的基因的多核苷酸(例如,編碼CRISPR核酸酶、反轉錄酶或融合多肽和/或編輯模板RNA的核苷酸序列)可操作地連接至啟動子,並且將構建體併入表現載體中。表現載體沒有特別的限制,只要它包含編碼本發明之CRISPR核酸酶和反轉錄酶和/或編輯模板RNA的多核苷酸,並且可以適合於在真核細胞中複製和整合。
典型的表現載體包括可用於表現所希望多核苷酸的轉錄和翻譯終止子、起始序列和啟動子。例如,可使用攜帶RNA聚合酶識別序列的質體載體(pSP64、pBluescript等)。包括來源於反轉錄病毒如慢病毒的那些載體係實現長期基因轉移的合適工具,因為它們允許轉基因的長期穩定整合及其在子細胞中的繁殖。載體之實例包括表現載體、複製載體、探針產生載體、和定序載體。可以按病毒載體的形式,將表現載體提供給細胞。
病毒載體技術係本領域眾所周知的,並且描述於多種病理學和分子生物學手冊。可用作載體的病毒包括但不限於噬菌體病毒、反轉錄病毒、腺病毒、腺相關病毒、皰疹病毒和慢病毒。通常,合適的載體含有在至少一種生物體中有複製功能的起點、啟動子序列、方便的限制性內切酶位點、和一或多種選擇性標誌物。
載體的種類沒有特別限制,可以適當地選擇可以在宿主細胞中表現的載體。更特別地,根據宿主細胞的種類,適當地選擇啟動子序列以確保從多核苷酸表現一或多種多肽,並將該啟動子序列和多核苷酸插入各種質體等的任一種中,用於製備表現載體。
另外的啟動子元件(例如,增強序列)調節轉錄起始的頻率。典型地,該等元件位於起始位點上游30-110 bp的區域中,儘管最近已經顯示許多啟動子也含有起始位點下游的功能元件。取決於啟動子,似乎單個元件可以共同地或獨立地發揮功能,以激活轉錄。
此外,本揭露不應限於使用組成型啟動子。誘導型啟動子也被考慮作為本揭露的一部分。誘導型啟動子的使用提供了分子開關,該分子開關能夠當需要該啟動子可操作地連接的多核苷酸序列的表現時啟動這種表現,或者當不需要表現時關閉表現。誘導型啟動子之實例包括但不限於金屬硫蛋白啟動子、糖皮質激素啟動子、孕酮啟動子、和四環素啟動子。
待引入的表現載體還可以含有選擇性標誌物基因或報告基因或二者,從而便於從尋求通過病毒載體轉染或感染的細胞的群體中,鑒定和選擇表現性細胞。在其他方面,選擇性標誌物可以在一段單獨的DNA上進行,並且用於共轉染程序。選擇性標誌物和報告基因二者側翼可為適當的轉錄控制序列,以使得能夠在宿主細胞中表現。這種標誌物之實例包括用於真核細胞培養的二氫葉酸還原酶基因和新黴素抗性基因;以及用於大腸桿菌和其他細菌培養的四環素抗性基因和胺苄青黴素抗性基因。藉由使用這樣的選擇標誌物,可以確認編碼本發明之一或多種多肽的多核苷酸是否已被轉移到宿主細胞中,然後定被成功表現。
重組表現載體的製備方法沒有特別限制,其實例包括使用質體、噬菌體或黏質體的方法。
B. 表現方法
本揭露包括用於蛋白質表現之方法,該方法包括翻譯CRISPR核酸酶和反轉錄酶,並且表現本文所述之編輯模板RNA。
在一些實施方式中,本文所述之宿主細胞用於表現CRISPR核酸酶和反轉錄酶和/或編輯模板RNA。宿主細胞沒有特別限制,並且可以較佳的是使用各種已知的細胞。宿主細胞之特定實例包括細菌,例如大腸桿菌、酵母(出芽酵母(budding yeast)、釀酒酵母(
Saccharomyces cerevisiae)和裂殖酵母(fission yeast)、粟酒裂殖酵母(
Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲(
Caenorhabditis elegans))、非洲爪蟾(
Xenopus laevis)卵母細胞和動物細胞(例如,CHO細胞、COS細胞和HEK293細胞)。用於將上述表現載體轉移到宿主細胞中之方法(即轉化方法)沒有特別限制,並且可以使用已知的方法,例如電穿孔、磷酸鈣法、脂質體法和DEAE葡聚糖法。
在用表現載體轉化宿主後,可以培養、培育或繁殖宿主細胞,用於產生CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。CRISPR核酸酶、反轉錄酶和/或編輯模板RNA表現後,可以收集宿主細胞,並根據常規方法(例如,過濾、離心、細胞破碎、凝膠過濾層析、離子交換層析等)從培養物等中純化CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。
在一些實施方式中,用於CRISPR核酸酶和反轉錄酶表現之方法包括翻譯一或多種多肽的至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸、或至少1000個胺基酸。在一些實施方式中,用於蛋白質表現之方法包括翻譯CRISPR核酸酶和反轉錄酶的約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多個胺基酸。
可以使用多種方法以確定宿主細胞中成熟CRISPR核酸酶、反轉錄酶和/或編輯模板RNA的產生水平。此類方法包括但不限於例如利用對蛋白質特異的多株或單株抗體或如本文其他地方所述之標記標籤的方法。示例性方法包括但不限於酶聯免疫吸附測定(ELISA)、放射免疫測定(MA)、螢光免疫測定(FIA)和螢光激活細胞分選術(FACS)。該等和其他測定法係本領域熟知的(參見例如,Maddox等人, J. Exp. Med.[實驗醫學雜誌] 158:1211 [1983])。
本揭露提供了在細胞中體內表現CRISPR核酸酶和反轉錄酶和/或編輯模板RNA之方法,該等方法包括向宿主細胞提供編碼CRISPR核酸酶、反轉錄酶和/或編輯模板RNA的多核糖核苷酸(其中多核糖核苷酸編碼CRISPR核酸酶、反轉錄酶和/或編輯模板RNA),在細胞中表現CRISPR核酸酶、反轉錄酶和/或編輯模板RNA,並且從細胞中獲得CRISPR核酸酶、反轉錄酶和/或編輯模板RNA。
III. 基因編輯方法
可以使用該等基因編輯系統中任一個以對靶核酸(該靶核酸可為目的基因位點,例如需要基因編輯的基因位點)進行基因修飾(編輯),例如以修復基因突變,以引入保護性突變,以引入修飾用於調節基因的表現等。
本文揭露的基因編輯系統和組成物適合用於進行編輯並將編輯引入到多種靶序列。在一些實施方式中,靶序列係DNA分子,例如DNA基因座(在本文中稱為靶序列或中靶序列)。在一些實施方式中,靶序列係RNA,例如RNA基因座或mRNA。在一些實施方式中,靶序列係單股的(例如,單股DNA)。在一些實施方式中,靶序列係雙股的(例如,雙股DNA)。在一些實施方式中,靶序列包含單股區域和雙股區域。在一些實施方式中,靶序列係線性的。在一些實施方式中,靶序列係環狀的。在一些實施方式中,靶序列包含一或多種經修飾的核苷酸,例如甲基化核苷酸、受損核苷酸或核苷酸類似物。在一些實施方式中,靶序列未經修飾。在一些實施方式中,單股靶序列不需要PAM序列。
靶序列可以具有任何長度,例如約至少100 bp、200 bp、500 bp、1000 bp、2000 bp、5000 bp、10 kb、20 kb、50 kb、100 kb、200 kb、 500 kb、1 Mb之一或更長。靶序列還可以包含任何序列。在一些實施方式中,靶序列富含GC,例如具有至少約40%、45%、50%、55%、60%、65%之一或更高的GC含量。在一些實施方式中,靶序列具有至少約70%、80%或更多的GC含量。在一些實施方式中,靶序列係非富含GC的靶序列中的富含GC的片段。在一些實施方式中,靶序列不是富含GC的。在一些實施方式中,靶序列具有一或多種二級結構或更高級結構。在一些實施方式中,靶序列不處於使核糖核蛋白不能接近靶序列的縮合狀態,例如處在染色質中。
在一些實施方式中,靶核酸係細胞中的基因組位點。在一些情況下,將發生遺傳編輯的靶核酸可以位於蛋白質編碼區中。可替代地,靶核酸可以位於調節區,例如啟動子、強化子、5’或3’非翻譯區。在其他情況下,靶核酸可以位於非編碼基因中,例如轉座子、miRNA、tRNA、核糖體RNA、核酶或lincRNA。
A. 用於基因編輯的示例性基因
可以使用本文揭露的基因編輯系統中任一個以編輯目的靶基因,例如涉及疾病(例如,遺傳性疾病)的基因。在一些實施方式中,靶基因可為參與受試者免疫反應的基因。例如,靶基因可為免疫檢查點基因。
示例性靶基因包括但不限於
BCL11A內含子紅系強化子、CD3、β-2微球蛋白(B2M)、T細胞受體α恆定區(TRAC)、計劃性細胞死亡1(PDCD1)、T細胞受體α、T細胞受體β,B細胞淋巴瘤/白血病11A(BCL11A),細胞毒性T淋巴球抗原4(CTLA-4),趨化因子(C-C模體)受體5(基因/假基因)(CCR5),CXCR4基因,CD160分子(CD160)、腺苷A2a受體(ADORA)、CD276、B7-H3、B7-H4、BTLA、菸鹼醯胺腺嘌呤二核苷酸磷酸NADPH氧化酶異構物2(NOX2)、T細胞活化的V結構域Ig抑制因子(VISTA)、唾液酸-結合免疫球蛋白型凝集素7(SIGLEC7)、唾液酸結合免疫球蛋白型凝集素9(SIGLEC9)、SIGLEC10、含有T細胞活化抑制劑的V組結構域1(VTCN1)、B和T淋巴球相關(BTLA)、吲哚胺2,3-雙加氧酶(IDO)、吲哚胺2,3-雙加氧酶1(IDO1)、殺手細胞免疫球蛋白樣受體(KIR)、殺手細胞免疫球蛋白樣受體三個結構域長胞質尾1(KIR3DL1)、淋巴球激活基因3(LAG3)、T細胞免疫球蛋白結構域和黏蛋白結構域3(TIM3)、甲型肝炎病毒細胞受體2(HAVCR2)、自然殺手細胞受體2B4(CD244)、次黃嘌呤磷酸核糖基轉移酶1(HPRT)、具有Ig和ITIM結構域的T細胞免疫受體(TIGIT)、CD96分子(CD96)、細胞毒性和調節性T細胞分子(CRTAM)、白血球相關免疫球蛋白樣受體1(LAIR1)、腺相關病毒整合位點1(AAVS1)、AAVS 2、AAVS3、AAVS4、AAVS5、AAVS6、AAVS7、AAVS8、轉化生長因子β受體II(TGFBRII)、轉化生長因子β受體I(TGFBR1)、SMAD家族成員2(SMAD2)、SMAD家族成員3(SMAD3)、SMAD家族成員4(SMAD4)、SKI原癌基因(SKI)、SKI樣原癌基因(SKIL)、egl-9家族缺氧誘導因子1(EGLN1)、egl-9家族缺氧誘導因子2(EGLN2)、egl-9家族缺氧誘導因子3(EGLN3)、蛋白磷酸酶1調節亞基12C(PPP1R12C)、TGFB誘導因子同源框1(TGIF1)、腫瘤壞死因子受體超家族成員、腫瘤壞死因子受體超家族成員10b(TNFRSF10B)、腫瘤壞死因子受體超家族成員10a(TNFRSF10A)、BY55、B7H5、半胱天冬酶8(CASP8)、半胱天冬酶10(CASP10)、半胱天冬酶3(CASP3)、半胱天冬酶6(CASP6)、半胱天冬酶7(CASP7)、經由死亡結構域相關的Fas(FADD)、Fas細胞表面死亡受體(FAS)、介白素10受體亞基α(IL10RA)、介白素10受體亞基β(IL10RB)、血基質加氧酶2(HMOX2)、介白素6受體(IL6R)、介白素6信號轉導子(IL6ST)、c-src酪胺酸激酶(CSK)、磷蛋白膜錨鞘糖脂微結構域1(PAG1)、鳥苷酸環化酶1(可溶性)β3(GUCY1B3)、傳訊閾值調節跨膜適配體1(SIT1)、叉頭框P3(FOXP3)、PR結構域1(PRDM1)、鹼性白胺酸拉鍊轉錄因子(ATF樣)(BATF)、鳥苷酸環化酶1(可溶性)α2(GUCY1A2)、鳥苷酸環化酶1(可溶性)α3(GUCY1A3)、鳥苷酸環化酶1(可溶性)β2(GUCY1B2)、脯胺醯羥化酶結構域(PHD1、PHD2、PHD3)蛋白質家族、CD27、CD28、CD40、CD122、CD137、OX40、GITR和ICOS。在一些實施方式中,經修飾的基因係計畫性死亡配體1(PD-L1)、II類主要組織相容性複合物反式激活因子(CIITA)、檸蘋醯輔酶A裂解酶(CLYBL)、運甲狀腺素蛋白(TTR)、乳酸脫氫酶-A(LDHA)、羥基酸氧化酶1(HAO1)、丙胺酸-乙醛酸酯和絲胺酸-丙酮酸酯胺基轉移酶(AGXT)、乙醛酸酯還原酶/羥基丙酮酸酯還原酶(GRHPR)、4-羥基-2-氧戊二酸酯醛縮酶(HOGA)、聚嘧啶串結合蛋白1(PTBP1)、微管解聚蛋白(stathmin)2(STMN2)或肌動蛋白β(ACTB)。
本揭露提供了使用如本文還揭露的基因編輯系統對如本文揭露的任何靶基因進行基因編輯之方法。
B. 編輯
在一些方面,本文提供了使用本文所述之基因編輯系統將至少一個編輯引入靶核酸(例如,如本文揭露的任何靶基因中的目的基因組位點)之方法。在一些實施方式中,編輯可以包括將取代、插入、缺失或其組合引入到靶核酸。在一些實例中,編輯可為單核苷酸取代,例如,G到T取代、G到A取代、G到C取代、T到G取代、T到A取代、T到C取代、C到G取代、C到T取代、C到A取代、A到T取代、A到G取代或A到C取代。在一些實例中,編輯可以進行以下鹼基對的轉化:G:C鹼基對到T:A鹼基對、G:C鹼基對到A:T鹼基對、G:C鹼基對到C:G鹼基對、T:A鹼基對到G:C鹼基對、T:A鹼基對到A:T鹼基對、T:A鹼基對到C:G鹼基對、C:G鹼基對到G:C鹼基對、C:G鹼基對到T:A鹼基對、C:G鹼基對到A:T鹼基對、A:T鹼基對到T:A鹼基對、A:T鹼基對到G:C鹼基對或A:T鹼基對到C:G鹼基對。
在一些實施方式中,描述了用於將至少一個編輯引入到靶核酸之方法,其中該編輯係至少一個取代、至少一個插入和/或至少一個缺失。在一些實施方式中,編輯包含至少一個取代、插入或缺失。在一些實施方式中,取代、插入或缺失的長度為至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500個核苷酸。在一些實施方式中,取代、插入或缺失的長度為從1個核苷酸至約200個核苷酸,例如,1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸或從195個核苷酸至200個核苷酸。在一些實施方式中,取代、插入或缺失的長度為從1個核苷酸至約300個核苷酸,例如,1個核苷酸至5個核苷酸、從5個核苷酸至10個核苷酸、從10個核苷酸至15個核苷酸、從15個核苷酸至20個核苷酸、從20個核苷酸至25個核苷酸、從25個核苷酸至30個核苷酸、從30個核苷酸至35個核苷酸、從35個核苷酸至40個核苷酸、從40個核苷酸至45個核苷酸、從45個核苷酸至50個核苷酸、從50個核苷酸至55個核苷酸、從55個核苷酸至60個核苷酸、從60個核苷酸至65個核苷酸、從65個核苷酸至70個核苷酸、從70個核苷酸至75個核苷酸、從75個核苷酸至80個核苷酸、從80個核苷酸至85個核苷酸、從85個核苷酸至90個核苷酸、從90個核苷酸至95個核苷酸、從95個核苷酸至100個核苷酸、從100個核苷酸至105個核苷酸、從105個核苷酸至110個核苷酸、從110個核苷酸至115個核苷酸、從115個核苷酸至120個核苷酸、從120個核苷酸至125個核苷酸、從125個核苷酸至130個核苷酸、從130個核苷酸至135個核苷酸、從135個核苷酸至140個核苷酸、從140個核苷酸至145個核苷酸、從145個核苷酸至150個核苷酸、從150個核苷酸至155個核苷酸、從155個核苷酸至160個核苷酸、從160個核苷酸至165個核苷酸、從165個核苷酸至170個核苷酸、從170個核苷酸至175個核苷酸、從175個核苷酸至180個核苷酸、從180個核苷酸至185個核苷酸、從185個核苷酸至190個核苷酸、從190個核苷酸至195個核苷酸、從195個核苷酸至200個核苷酸、從200個核苷酸至210個核苷酸、從210個核苷酸至220個核苷酸、從220個核苷酸至230個核苷酸、從230個核苷酸至240個核苷酸、從240個核苷酸至250個核苷酸、從250個核苷酸至260個核苷酸、從260個核苷酸至270個核苷酸、從270個核苷酸至280個核苷酸、從280個核苷酸至290個核苷酸或從290個核苷酸至300個核苷酸。在一些實施方式中,取代、插入或缺失的長度為多達約10,000個鹼基對(10 kb)。例如,在一些實施方式中,取代、插入或缺失的長度為1個鹼基對、約10個鹼基對、約20個鹼基對、約30個鹼基對、約40個鹼基對、約50個鹼基對、約60個鹼基對、約70個鹼基對、約80個鹼基對、約90個鹼基對、約100個鹼基對、約200個鹼基對、約300個鹼基對、約400個鹼基對、約500個鹼基對、約600個鹼基對、約700個鹼基對、約800個鹼基對、約900個鹼基對、約1 kb、約1.1 kb、約1.2 kb、約1.3 kb、約1.4 kb、約1.5 kb、約1.6 kb、約1.7 kb、約1.8 kb、約1.9 kb、約2 kb、約2.1 kb、約2.2 kb、約2.3 kb、約2.4 kb、約2.5 kb、約2.6 kb、約2.7 kb、約2.8 kb、約2.9 kb、3 kb、4 kb、5 kb、6 kb、7 kb、8 kb、9 kb或10 kb。
在一些實施方式中,插入係髮夾或包含髮夾。例如,反轉錄酶可以轉錄髮夾,該髮夾可以被摻入到靶核酸中。在其他實施方式中,反轉錄模板序列包括髮夾結構,並且反轉錄酶在髮夾處停止轉錄反轉錄模板序列。
在一些實施方式中,編輯發生於II型PAM序列(例如,對於SpCas9的5’-NGG-3’)或V型PAM序列(例如,對於Cas12i多肽的5’-NTTN-3’)的約500個核苷酸內。在一些實施方式中,編輯鄰近PAM序列發生,例如在PAM序列上游或下游的約500個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約400個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約400個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約300個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約300個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約200個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約200個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約100個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約100個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約50個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約50個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約30個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約30個核苷酸內。在一些實施方式中,編輯發生於PAM序列的約20個核苷酸內。在一些實施方式中,編輯發生於PAM序列上游或下游的約20個核苷酸內。
在一些實施方式中,編輯起始於PAM序列上游的約300個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約290個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約280個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約270個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約260個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約250個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約240個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約230個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約2020個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約210個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約200個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約190個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約180個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約170個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約160個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約150個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約140個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約130個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約120個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約110個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約100個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約90個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約80個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約70個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約60個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約50個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約40個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約30個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約20個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約10個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約9個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約8個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約7個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約6個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約5個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約4個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約3個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約2個核苷酸內。在一些實施方式中,編輯起始於PAM序列上游的約1個核苷酸內。
在一些實施方式中,編輯起始於PAM序列。在一些實施方式中,編輯起始於PAM序列下游的約1個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約2個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約3個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約4個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約5個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約6個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約7個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約8個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約9個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約10個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約11個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約12個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約13個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約14個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約15個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約16個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約17個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約18個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約19個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約20個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約21個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約22個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約23個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約24個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約25個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約26個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約27個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約28個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約29個核苷酸內。在一些實施方式中,編輯起始於PAM序列下游的約30個核苷酸內。
在一些實施方式中,編輯結束於PAM序列上游的約300個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約290個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約280個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約270個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約260個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約250個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約240個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約230個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約2020個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約210個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約200個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約190個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約180個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約170個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約160個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約150個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約140個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約130個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約120個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約110個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約100個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約90個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約80個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約70個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約60個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約50個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約40個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約30個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約20個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約10個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約9個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約8個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約7個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約6個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約5個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約4個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約3個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約2個核苷酸內。在一些實施方式中,編輯結束於PAM序列上游的約1個核苷酸內。
在一些實施方式中,編輯結束於PAM序列。在一些實施方式中,編輯結束於PAM下游的約1個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約2個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約3個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約4個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約5個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約6個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約7個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約8個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約9個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約10個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約11個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約12個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約13個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約14個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約15個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約16個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約17個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約18個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約19個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約20個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約21個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約22個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約23個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約24個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約25個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約26個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約27個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約28個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約29個核苷酸內。在一些實施方式中,編輯結束於PAM下游的約30個核苷酸內。
C. 非 PAM 股編輯
在一些實施方式中,本文提供了使用如本文揭露的合適的基因編輯系統,例如
圖 5、
圖 6A、
圖 6B、
圖 7、
圖 8A、
圖 12A或
圖 12B中所示的那些,將至少一個編輯引入到靶核酸的非PAM股之方法。最初可以使用包含在基因編輯系統中的反轉錄模板序列將至少一個編輯引入到非PAM股。經由細胞DNA修復機制,最終將至少一個編輯引入到靶核酸的兩條股中。基因編輯系統可以包含靶向非PAM股的編輯模板RNA,該編輯模板RNA包含 (a) CRISPR核酸酶結合序列,(b) DNA結合序列,和 (c) RT供體RNA。在一些實施方式中,RT供體RNA包含PBS和反轉錄模板序列。
在一些實施方式中,描述了用於通過RT供體RNA的反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的非PAM股之方法和基因編輯系統或組成物。在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的非PAM股之方法和組成物。
在一些實施方式中,RT供體RNA(例如,編輯模板RNA的RT供體RNA)的PBS與非PAM股上的區域(PBS靶向位點)結合。反轉錄模板序列包含待摻入到非PAM股的編輯。在一些實例中,反轉錄模板包含與PAM股的序列相似性。在一些實例中,反轉錄模板包含相對於PAM股的序列的編輯。在一些實施方式中,非PAM股經由鹼基配對結合RT供體RNA的PBS,並且反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)複製反轉錄模板序列。在股交換回到與互補基因組股的鹼基配對之後,編輯被摻入到靶核酸中。
在一些實施方式中,靶向非PAM股的編輯模板RNA從5’到3’包含以下組分:CRISPR核酸酶結合序列、DNA結合序列、反轉錄模板序列和PBS(參見例如,
圖 5、
圖 6A、
圖 6B、
圖 8A和
圖 12A)。在一些實施方式中,靶向非PAM股的編輯模板RNA從5’到3’包含以下組分:反轉錄模板序列、PBS、CRISPR核酸酶結合序列和DNA結合序列(間隔子),或從5’到3’包含以下組分:反轉錄模板序列、PBS、連接子、CRISPR核酸酶結合序列和DNA結合序列(
圖 7和
圖 12B)。
在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列相鄰。在一些實施方式中,CRISPR核酸酶結合序列係DNA結合序列的5’延伸(
圖 5、
圖 6A、
圖 6B、
圖 8A和
圖 12A)。在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列和PBS相鄰。在一些實施方式中,CRISPR核酸酶結合序列係PBS的3’延伸(
圖 7和
圖 12B)。在一些實施方式中,CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列與V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)結合。在一些實施方式中,CRISPR核酸酶結合序列與缺乏crRNA加工活性的CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列係同向重複序列(例如,Cas9同向重複序列或Cas12i同向重複序列)。
在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列和PBS相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸(
圖 5、
圖 6A、
圖 6B、
圖 7、
圖 8A、
圖 12A和
圖 12B)。在一些實施方式中,DNA結合序列可以包含RNA序列、DNA序列或RNA/DNA雜合序列。在一些實施方式中,DNA結合序列的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,DNA結合序列的長度為約15個核苷酸至約35個核苷酸。
在一些實施方式中,PBS與反轉錄模板序列相鄰。在一些實施方式中,PBS係反轉錄模板序列的3’延伸(
圖 5、
圖 6A、
圖 6B、
圖 7、
圖 8A、
圖 12A和
圖 12B)。在一些實施方式中,PBS與反轉錄模板序列和CRISPR核酸酶結合序列相鄰。在一些實施方式中,PBS的長度在約3個核苷酸和約200個核苷酸之間。在一些實施方式中,PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些實施方式中,DNA結合序列和PBS與靶核酸的同一條股(例如,非PAM股)結合。
在一些實施方式中,反轉錄模板序列與PBS和DNA結合序列相鄰。在一些實施方式中,反轉錄模板序列係PBS的5’延伸(
圖 5、
圖 6A、
圖 6B、
圖 8A和
圖 12A)。在一些實施方式中,反轉錄模板序列係DNA靶向序列的3’延伸(
圖 5、
圖 6A、
圖 6B、
圖 8A和
圖 12A)。在一些實施方式中,反轉錄模板序列係PBS的5’延伸(
圖 7和
圖 12B)。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
在一些實施方式中,當DNA結合序列和PBS與靶核酸結合時,靶向非PAM股的編輯模板RNA包含未配對的核苷酸環。參見
圖 6A、
圖 6B、
圖 8A和
圖 12A。在一些實施方式中,靶向非PAM股的編輯模板RNA包含與PBS相鄰的環。參見
圖 7和
圖 12B。在一些實施方式中,環包含反轉錄模板序列並且其後係PBS。在一些實施方式中,PBS包含與靶核酸的非PAM股的互補性。在一些實施方式中,環的序列包含與PAM股的序列相似性。在一些實施方式中,環包含相對於PAM股的序列的編輯。在一些實施方式中,編輯係取代、插入或缺失。在一些實施方式中,環包含髮夾。
D. PAM 股編輯
在一些實施方式中,本文提供了使用本文揭露的合適的基因編輯系統(例如,
圖 1A、
圖 1B 、圖 2、
圖 3、
圖 4或
圖 10中描述的那些)將至少一個編輯引入到靶核酸(例如,目的基因組位點)的PAM股之方法。這樣的方法可以涉及使用靶向PAM股的編輯模板RNA,該編輯模板RNA可以包含 (a) CRISPR核酸酶結合序列,(b) DNA結合序列,和 (c) RT供體RNA(
圖 1A、
圖 1B 、圖 2和
圖 10)。在一些實例中,靶向PAM股的組成物包含RNA指導物和RT供體RNA(
圖 3和
圖 4)。在一些實例中,RT供體RNA包含PBS和反轉錄模板序列。
在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的PAM股之方法和組成物。在一些實施方式中,描述了用於通過反轉錄模板序列的5’至3’轉錄將至少一個編輯引入到靶核酸的PAM股之方法和組成物。
在一些情況下,RT供體RNA(例如,編輯模板RNA的RT供體RNA)的PBS與PAM股結合。RT供體RNA的反轉錄模板序列包含待摻入PAM股的編輯。在一些實例中,反轉錄模板包含與非PAM股的序列相似性。在一些實施方式中,反轉錄模板包含相對於非PAM股的序列的編輯。在一些實施方式中,PAM股可以經由鹼基配對與RT供體RNA的PBS結合,並且反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)複製反轉錄模板序列。在股交換回到與互補基因組股的鹼基配對之後,編輯被摻入到靶核酸中。
在一些實施方式中,靶向PAM股的編輯模板RNA從5’到3’包含以下組分:CRISPR核酸酶結合序列、DNA結合序列、反轉錄模板序列和PBS(
圖 1A、
圖 1B和
圖 10)。在一些實施方式中,靶向PAM股的編輯模板RNA從5’到3’包含以下組分:反轉錄模板序列、PBS、CRISPR核酸酶結合序列、DNA結合序列,或從5’到3’包含以下組分:反轉錄模板序列、PBS、連接子、CRISPR核酸酶結合序列和DNA結合序列(
圖 2)。
在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸(
圖 1A、
圖 1B 、圖 2和
圖 10)。在一些實施方式中,CRISPR核酸酶結合序列與DNA結合序列和PBS相鄰(
圖 2)。在一些實施方式中,DNA結合序列係PBS的3’延伸(
圖 2)。在一些實施方式中,CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列與V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)結合。在一些實施方式中,CRISPR核酸酶結合序列與缺乏crRNA加工活性的CRISPR核酸酶結合。在一些實施方式中,CRISPR核酸酶結合序列係同向重複序列(例如,Cas9同向重複序列或Cas12i同向重複序列)。
在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列相鄰。在一些實施方式中,DNA結合序列係CRISPR核酸酶結合序列的3’延伸(
圖 1A、
圖 1B 、圖 2和
圖 10)。在一些實施方式中,DNA結合序列與CRISPR核酸酶結合序列和反轉錄模板序列相鄰。在一些實施方式中,反轉錄模板序列係DNA結合序列的3’延伸(
圖 10)。在一些實施方式中,DNA結合序列係RNA序列、DNA序列或RNA/DNA雜合序列。在一些實施方式中,DNA結合序列的長度為約10個核苷酸至約50個核苷酸。在一些實施方式中,DNA結合序列的長度為約15個核苷酸至約35個核苷酸。在一些實施方式中,DNA結合序列係間隔子序列。
在一些實施方式中,PBS與反轉錄模板序列相鄰。在一些實施方式中,PBS係反轉錄模板序列的3’延伸(
圖 1A、
圖 2 、圖 1B和
圖 10)。在一些實施方式中,PBS與CRISPR核酸酶結合序列相鄰。在一些實施方式中,CRISPR核酸酶結合序列係PBS的3’延伸(
圖 2)。在一些實施方式中,PBS的長度在約3個核苷酸和約200個核苷酸之間。在一些實施方式中,PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些實施方式中,DNA結合序列和PBS與靶核酸的不同股結合(例如,DNA結合序列與靶股結合,而PBS與PAM股結合)。
在一些實施方式中,反轉錄模板序列與DNA結合序列相鄰。在一些實施方式中,反轉錄模板序列係DNA結合序列的3’延伸(
圖 1A、
圖 1B和
圖 10)。在一些實施方式中,反轉錄模板序列與PBS相鄰。在一些實施方式中,反轉錄模板序列係PBS的5’延伸(
圖 1A、
圖 1B、
圖 2)。在一些實施方式中,PBS係反轉錄模板序列的3’延伸(
圖 10)。在一些實施方式中,反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實施方式中,反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
E. 細胞中的基因編輯
在一些方面,本文提供了使用同樣如本文揭露的合適基因編輯系統在細胞中編輯目的基因組位點(例如,如本文揭露的靶基因)之方法。為了執行這種方法,可以將基因編輯系統遞送至或引入到細胞群。在一些情況下,可以收集包含所希望的基因編輯的細胞,並視需要對其進行體外培養和擴增。
本文所述之細胞可為多種細胞。在一些實施方式中,細胞係分離的細胞。在一些實施方式中,細胞在細胞培養物或兩種或更多種細胞類型的共培養物中。在一些實施方式中,細胞係離體的。在一些實施方式中,細胞獲得自活生物體,並維持在細胞培養物中。在一些實施方式中,細胞係單細胞生物體。
在一些實施方式中,細胞係原核細胞。在一些實施方式中,細胞係細菌細胞或源自細菌細胞。在一些實施方式中,細胞係古細菌細胞或來源於古細菌細胞。
在一些實施方式中,細胞係真核細胞。在一些實施方式中,細胞係植物細胞或源自植物細胞。在一些實施方式中,細胞係真菌細胞或源自真菌細胞。在一些實施方式中,細胞係動物細胞或源自動物細胞。在一些實施方式中,細胞係無脊椎動物細胞或源自無脊椎動物細胞。在一些實施方式中,細胞係脊椎動物細胞或源自脊椎動物細胞。在一些實施方式中,細胞係哺乳動物細胞或源自哺乳動物細胞。在一些實施方式中,細胞係人細胞。在一些實施方式中,細胞係斑馬魚細胞。在一些實施方式中,細胞係靈長類細胞。在一些實施方式中,細胞係齧齒動物細胞。在一些實施方式中,細胞係合成製備的,有時稱為人工細胞。
在一些實施方式中,細胞來源於細胞系。用於組織培養的多種多樣的細胞系係本領域已知的。細胞系之實例包括但不限於293T、MF7、K562、HeLa、CHO及其轉基因品種。細胞系可從熟悉該項技術者已知的多種來源獲得(例如,參見美國典型培養物保藏中心(ATCC)(維吉尼亞州馬納薩斯(Manassas, Va.)))。在一些實施方式中,細胞係永生或永生化細胞。在一些實施方式中,細胞係幹細胞,諸如全能幹細胞(例如,萬能)、富潛能幹細胞、多潛能幹細胞、寡潛能幹細胞或單潛能幹細胞。在一些實施方式中,細胞係誘導富潛能幹細胞(iPSC)或來源於iPSC。在一些實施方式中,細胞係間葉幹細胞。在一些實施方式中,細胞係胚幹細胞。在一些實施方式中,細胞係造血幹細胞。在一些實施方式中,細胞係分化細胞。例如,在一些實施方式中,分化細胞係肌肉細胞(例如,肌細胞)、脂肪細胞(例如,脂細胞(adipocyte))、骨細胞(bone cell)(例如,成骨細胞、骨細胞(osteocyte)、破骨細胞)、血球(例如,單核細胞、淋巴球、嗜中性球、嗜酸性球、嗜鹼性球、巨噬細胞、紅血球或血小板)、神經細胞(例如,神經元)、上皮細胞、免疫細胞(例如,淋巴球、嗜中性球、單核細胞或巨噬細胞)、肝臟細胞(例如,肝細胞)、成纖維細胞或性細胞。在一些實施方式中,細胞係終末分化細胞。例如,在一些實施方式中,終末分化細胞係神經元細胞、脂細胞、心肌細胞、骨骼肌細胞、表皮細胞或腸道細胞。在一些實施方式中,細胞係神經膠質細胞。在一些實施方式中,細胞係胰島細胞,包括α細胞、β細胞、δ細胞或腸親鉻細胞。在一些實施方式中,細胞係免疫細胞。在一些實施方式中,免疫細胞係T細胞。在一些實施方式中,免疫細胞係B細胞。在一些實施方式中,免疫細胞係自然殺手(NK)細胞。在一些實施方式中,免疫細胞係腫瘤浸潤淋巴球(TIL)。在一些實施方式中,細胞係哺乳動物細胞,例如人細胞或靈長類動物細胞或鼠類細胞。在一些實施方式中,鼠類細胞來源於野生型小鼠、免疫抑制小鼠或疾病特異性小鼠模型。在一些實施方式中,細胞係活組織、器官或生物體內的細胞。
在一些實施方式中,細胞係原代細胞。例如,原代細胞的培養物可以傳代0次、1次、2次、4次、5次、10次、15次或更多。在一些實施方式中,藉由任何已知方法從個體收穫原代細胞。例如,可藉由分離術、白血球分離術、密度梯度分離等收穫白血球。可藉由活組織檢查收穫來自諸如皮膚、肌肉、骨髓、脾、肝、胰臟、肺、腸、胃等組織的細胞。可以使用合適的溶液來分散或懸浮收穫的細胞。這樣的溶液通常可為平衡鹽溶液(例如生理鹽水,磷酸鹽緩衝鹽水(PBS),漢克平衡鹽溶液等),方便地補充有胎牛血清或其他自然發生的因子,與可接受的低濃度緩衝液結合。緩衝液可以包括HEPES、磷酸鹽緩衝液、乳酸緩衝液,等。細胞可以立即使用,也可以儲存(例如,藉由冷凍)。冷凍的細胞可以解凍並且能夠重複使用。細胞可以在DMSO、血清、培養基緩衝液(例如10% DMSO、50%血清、40%緩衝培養基)和/或其他一些這樣的用於在冷凍溫度下保存細胞的常用溶液中冷凍。
在其中將本文揭露的基因編輯系統引入到多個細胞的實施方式中,至少約0.5%的細胞包含所希望的編輯。在一些實施方式中,至少約1%的細胞包含所希望的編輯。在一些實施方式中,至少約2%的細胞包含所希望的編輯。在一些實施方式中,至少約3%的細胞包含所希望的編輯。在一些實施方式中,至少約4%的細胞包含所希望的編輯。在一些實施方式中,至少約5%的細胞包含所希望的編輯。在一些實施方式中,至少約10%的細胞包含所希望的編輯。在一些實施方式中,至少約20%的細胞包含所希望的編輯。在一些實施方式中,至少約30%的細胞包含所希望的編輯。在一些實施方式中,至少約40%的細胞包含所希望的編輯。在一些實施方式中,至少約50%的細胞包含所希望的編輯。
攜帶所希望的基因編輯(例如,藉由本文揭露的方法使用本文也揭露的任何基因編輯系統產生)的細胞也在本揭露之範圍內。在一些情況下,由如本文所述之CRISPR核酸酶、反轉錄酶和編輯模板RNA修飾的細胞可以用作製造生物分子的表現系統。例如,經修飾的細胞可以用於產生生物分子,例如蛋白質(例如,細胞介素、抗體、基於抗體的分子)、肽、脂質、碳水化合物、核酸、胺基酸和維生素。在其他實施方式中,經修飾的細胞可以用於產生病毒載體,例如慢病毒、腺病毒、腺相關病毒和溶瘤病毒載體。在一些實施方式中,經修飾的細胞可以用於細胞毒性研究。在一些實施方式中,經修飾的細胞可以用作疾病模型。在一些實施方式中,經修飾的細胞可以用於疫苗生產。在一些實施方式中,經修飾的細胞可以用於治療。例如,在一些實施方式中,經修飾的細胞可以用於細胞療法,例如輸血和移植。
在一些實施方式中,由如本文所述之CRISPR核酸酶、反轉錄酶和編輯模板RNA修飾的細胞可以用於建立包含經修飾的基因組序列的新細胞系。在一些實施方式中,本揭露的經修飾細胞係經修飾的幹細胞(例如,經修飾的全能/萬能幹細胞、經修飾的多潛能幹細胞、經修飾的富潛能幹細胞、經修飾的寡潛能幹細胞或經修飾的單潛能幹細胞),該等經修飾的幹細胞分化成一或多種細胞譜系,包含缺失經修飾的幹細胞。本揭露進一步提供了包含或由本揭露的經修飾的細胞產生的生物體(例如,動物、植物或真菌)。
F. 基因編輯系統向細胞中的遞送
在一些實施方式中,可以配製任何基因編輯系統或其組分,例如,包括載劑,如載劑和/或聚合物載劑,例如脂質體或脂質奈米顆粒,並藉由已知方法將其遞送至細胞(例如,原核、真核、植物、哺乳動物等)。此類方法包括但不限於轉染(例如,脂質介導的陽離子聚合物、磷酸鈣、樹狀聚合物);電穿孔或其他破壞膜的方法(例如,核轉染)、病毒遞送(例如,慢病毒、反轉錄病毒、腺病毒、AAV)、顯微注射、微粒轟擊(「基因槍」)、fugene、直接聲波載入、細胞擠壓、光轉染、原生質體融合、刺穿感染、磁轉染、胞泌體介導的轉移、脂質奈米顆粒介導的轉移、及其任何組合。
在一些實施方式中,該方法包括向細胞遞送一或多種核酸(例如,編碼CRISPR核酸酶、反轉錄酶、編輯模板RNA(例如,RNA指導物和RT供體RNA)等的核酸)、其一或多種轉錄物,和/或預先形成的核糖核蛋白。示例性細胞內遞送方法包括但不限於:病毒或病毒樣藥劑;基於化學的轉染方法,例如使用磷酸鈣、樹枝狀大分子、脂質體或陽離子聚合物(例如,DEAE-葡聚糖或聚乙烯亞胺)的轉染方法;非化學方法,例如顯微注射、電穿孔、細胞擠壓、聲孔效應、光轉染、刺穿感染、原生質體融合、細菌軛合、質體或轉座子的遞送;基於顆粒的方法,例如使用基因槍、磁轉染或磁輔助轉染、粒子轟擊;和雜合方法,例如核轉染。在一些實施方式中,本申請進一步提供了藉由此類方法產生的細胞,以及包含此類細胞的或由此類細胞產生的生物體(例如,動物、植物或真菌)。在一些實施方式中,本發明之組成物進一步與影響DNA修復或DNA修復機制的藥劑(例如,化合物、分子或生物分子)一起遞送。在一些實施方式中,本發明之組成物進一步與影響細胞週期的藥劑(例如,化合物、分子或生物分子)一起遞送。
在一些實施方式中,將包含CRISPR核酸酶或CRISPR核酸酶與反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)的第一組成物遞送至細胞。在一些實施方式中,將包含RNA指導物或RNA指導物與RT供體RNA(例如,編輯模板RNA)的第二組成物遞送至細胞。在一些實施方式中,在使第二組成物與細胞接觸之前,使第一組成物與細胞接觸。在一些實施方式中,在使第二組成物與細胞接觸的同時,使第一組成物與細胞接觸。在一些實施方式中,在使第二組成物與細胞接觸之後,使第一組成物與細胞接觸。在一些實施方式中,將第一組成物藉由第一遞送方法遞送,並且經第二組成物藉由第二遞送方法遞送。在一些實施方式中,第一遞送方法與第二遞送方法相同。例如,在一些實施方式中,將第一組成物和第二組成物經由病毒遞送進行遞送。在一些實施方式中,第一遞送方法不同於第二遞送方法。例如,在一些實施方式中,將第一組成物藉由病毒遞送進行遞送並且將第二組成物藉由脂質奈米顆粒介導的轉移進行遞送並且將第二組成物藉由病毒遞送進行遞送,或者將第一組成物藉由脂質奈米顆粒介導的轉移進行遞送並且將第二組成物藉由病毒遞送進行遞送。
IV. 治療性應用
使用如本文揭露的這樣的基因編輯系統產生的任何基因編輯系統或經修飾的細胞可以用於治療可能受益於藉由基因編輯系統引入或由經修飾的細胞攜帶的基因編輯的疾病。例如,該疾病可能是遺傳性疾病,並且基因編輯修復了與該遺傳性疾病相關的基因突變。可替代地,該疾病可能與基因的異常表現有關,並且基因編輯可挽救這種異常表現。
在一些實施方式中,本文提供了用於治療疾病之方法,該方法包括向需要治療的受試者(例如,人患者)投與本文揭露的任一基因編輯系統。可以將基因編輯系統遞送至需要基因編輯的特定組織或特定類型的細胞。基因編輯系統可以包含含有該等組分中的一或多種的LNP、編碼該等組分中的一或多種的一或多種載體(例如,病毒載體)或其組合。可以配製基因編輯系統的組分以形成藥物組成物,該藥物組成物可以進一步包含一或多種藥學上可接受的載劑。
在一些實施方式中,可以將使用本文揭露的任一基因編輯系統產生的經修飾細胞投與於需要治療的受試者(例如,人患者)。經修飾的細胞可以包含本文所述之取代、插入和/或缺失。在一些實例中,經修飾的細胞可以包括由CRISPR核酸酶、反轉錄酶多肽和編輯模板RNA(例如,RNA指導物和RT供體RNA)修飾的細胞系。在一些情況下,經修飾的細胞可為包含具有不同類型基因編輯的細胞的異質群體。可替代地,經修飾的細胞可以包含含有一種特定基因編輯的基本上同質的細胞群(例如,整個群體中至少80%的細胞)。在一些實例中,可以使細胞懸浮於合適的培養基中。
在一些實施方式中,本文提供了包含基因編輯系統或其組分或經修飾的細胞的組成物。這樣的組成物可為藥物組成物。可以將有用的藥物組成物以適合於口服、直腸、陰道、腸胃外、局部、肺、鼻內、病灶內、口腔、眼部、靜脈內、器官內或另一途徑投與的配製物製備、包裝或銷售。本揭露的藥物組成物可以作為單一單位劑量或作為多個單一單位劑量進行批量製備、包裝或出售。如本文所用,「單位劑量」係包含預定量的細胞的藥物組成物的離散量。細胞的量通常等於將投與於受試者的細胞的劑量或這種劑量的方便分數,例如像這種劑量的二分之一或三分之一。
適合於腸胃外投與的藥物組成物的配製物可以包含與藥學上可接受的載劑(例如,無菌水或無菌等滲鹽水)組合的活性劑(例如,基因編輯系統或其組分或經修飾的細胞)。這樣的配製物能以適合於推注投與或連續投與的形式來製備、包裝或出售。一些可注射配製物能以單位劑型來製備、包裝或出售,例如在安瓿或含有防腐劑的多劑量容器中。一些用於腸胃外投與的配製物包括但不限於懸浮液、溶液、油性或水性媒介物中的乳液、糊劑以及可植入的持續釋放或生物可降解配製物。該等配製物可以進一步包含一或多種另外的成分,包括但不限於懸浮劑、穩定劑或分散劑。
藥物組成物可以呈無菌可注射水性或油性懸浮液或溶液的形式。這種懸浮液或溶液可以根據已知技術來配製,並且除了細胞之外還可以包含其他成分,例如本文所述之分散劑、潤濕劑或懸浮劑。這種無菌可注射配製物可以使用無毒的腸胃外可接受的稀釋劑或溶劑(例如,水或鹽水)來製備。其他可接受的稀釋劑以及溶劑包括但不限於林格溶液、等滲氯化鈉溶液以及固定油諸如合成的甘油單酯或甘油二酯。其他有用的腸胃外投與的配製物包括以下配製物,該等配製物可以包含在脂質體配製物或作為生物可降解聚合物系統的組分的呈包裝形式的細胞。一些用於持續釋放或植入的組成物可以包含藥學上可接受的聚合物或疏水材料,例如乳液、離子交換樹脂、微溶聚合物或微溶鹽。
V. 套組及其用途
本揭露還提供了可用於例如執行本文所述方法的套組或系統。在一些實施方式中,套組或系統包括CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶。在一些實施方式中,套組或系統包括編碼CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶的多核苷酸,並且視需要該多核苷酸包含在載體中,例如,如本文所述。在一些實施方式中,套組或系統包括V型核酸酶-反轉錄酶融合多肽(例如,Cas12i-反轉錄酶融合多肽)。套組或系統還可以包括如本文所述之反轉錄酶和編輯模板RNA(例如,RNA指導物和RT供體RNA)。可以將本發明之套組或系統的RNA指導物和/或RT供體RNA設計為靶向目的序列。CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、反轉錄酶和編輯模板RNA(例如,RNA指導物和RT供體RNA)可以包裝在套組或系統內的相同小瓶或其他容器中,或可以包裝在單獨的小瓶或其他容器中,其中的內容物可以在使用前混合。另外地,套組或系統可以視需要包括緩衝液和/或使用CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和反轉錄酶以及編輯模板RNA(例如,RNA指導物和RT供體RNA)的說明書。
在一些實施方式中,套組包含第一組成物,該第一組成物包含CRISPR核酸酶或CRISPR核酸酶與反轉錄酶(例如,CRISPR核酸酶-反轉錄酶融合物)。在一些實施方式中,套組包含第二組成物,該第二組成物包含RNA指導物或RNA指導物與RT供體RNA(例如,編輯模板RNA)。在一些實施方式中,第一組成物和第二組成物包裝在同一小瓶內。在一些實施方式中,第一組成物和第二組成物包裝在不同的小瓶中。
在一些實施方式中,套組可用於研究目的。例如,在一些實施方式中,套組可用於研究基因功能。
將本文引用的所有文獻和出版物藉由引用特此併入。
另外的實施方式
下文提供了另外的實施方式,該等實施方式也在本揭露之範圍內。
實施方式1:一種組成物,其包含:
(a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸,該V型CRISPR核酸酶多肽視需要是Cas12多肽;
(b) RNA指導物或編碼該RNA指導物的核酸,其中該RNA指導物包含V型核酸酶結合序列(例如,同向重複序列)和DNA結合序列(例如,間隔子序列);
(c) 反轉錄酶多肽或編碼該反轉錄酶多肽的核酸;以及
(d) 包含引物結合的反轉錄供體RNA(RT供體RNA)
在實施方式1中,該V型CRISPR核酸酶可為Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些實例中,該V型CRISPR核酸酶多肽係Cas12i多肽,該Cas12i多肽視需要包含Cas12i1多肽或變體Cas12i1多肽、Cas12i2多肽或變體Cas12i2多肽、Cas12i3多肽或變體Cas12i3多肽或Cas12i4多肽或變體Cas12i4多肽。
實施方式2:如實施方式1所述之組成物可以包含Cas12i多肽,該Cas12i多肽可為以下之一:
(a) Cas12i1多肽包含與SEQ ID NO: 8具有至少80%同一性、視需要與SEQ ID NO: 8具有至少95%同一性的胺基酸序列;
(b) Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少80%同一性、視需要與SEQ ID NO: 2-7中任一項具有至少95%同一性的胺基酸序列;
(c) Cas12i3多肽包含與SEQ ID NO: 11具有至少80%同一性、視需要與SEQ ID NO: 11具有至少95%同一性的胺基酸序列;以及
(d) Cas12i4多肽包含與SEQ ID NO: 9具有至少80%同一性或與SEQ ID NO: 10具有至少80%同一性、視需要與SEQ ID NO: 9具有至少95%同一性或與SEQ ID NO: 10具有至少95%同一性的胺基酸序列。
在特定實例中,如實施方式2所述之組成物包含以下之一:
(a) Cas12i1多肽包含SEQ ID NO: 8所示的胺基酸序列;
(b) Cas12i2多肽包含SEQ ID NO: 2-7中任一項所示的胺基酸序列;
(c) Cas12i3多肽包含SEQ ID NO: 11所示的胺基酸序列;以及
(d) Cas12i4多肽包含SEQ ID NO: 9或SEQ ID NO: 10所示的胺基酸序列。
本文揭露的如實施方式2所述之任一組成物可以包含具有降低的crRNA加工活性或缺乏crRNA加工活性的V型CRISPR核酸酶多肽。例如,該V型CRISPR核酸酶多肽係Cas12i2多肽,並且其中該Cas12i2多肽在位置H485或H486處包含取代。在一些情況下,該Cas12i2多肽與SEQ ID NO: 2-7中任一項具有至少80%同一性,並且其中該Cas12i2多肽在位置H485或H486處包含取代。在一些實例中,該Cas12i2多肽與SEQ ID NO: 2-7中任一項具有至少95%同一性,並且其中該Cas12i2多肽在位置H485或H486處包含取代。
本文揭露的如實施方式2所述之任一組成物可以包含V型CRISPR核酸酶多肽,該V型CRISPR核酸酶多肽包含以下中的至少一種:表位肽、核定位訊號和出核訊號。
在一些實例中,如實施方式2所述之組成物包含以下之一:
(a) Cas12i1多肽包含與SEQ ID NO: 8具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 12-14中任一項具有至少90%同一性的核苷酸序列;
(b) Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 15-17中任一項具有至少90%同一性的核苷酸序列;
(c) Cas12i3多肽包含與SEQ ID NO: 11具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 18-20中任一項具有至少90%同一性的核苷酸序列;以及
(d) Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有至少80%(例如,至少95%)同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 21-24中任一項具有至少90%同一性的核苷酸序列。
在一些實例中,如實施方式2所述之組成物包含以下之一:
(a) Cas12i1多肽包含與SEQ ID NO: 8具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 12-14中任一項具有至少95%同一性的核苷酸序列;
(b) Cas12i2多肽包含與SEQ ID NO: 2-7中任一項具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 15-17中任一項具有至少95%同一性的核苷酸序列;
(c) Cas12i3多肽包含與SEQ ID NO: 11具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 18-20中任一項具有至少95%同一性的核苷酸序列;以及
(d) Cas12i4多肽包含與SEQ ID NO: 9或SEQ ID NO: 10具有至少95%同一性的胺基酸序列,並且同向重複序列包含與SEQ ID NO: 21-24中任一項具有至少95%同一性的核苷酸序列。
實施方式3:本文揭露的如實施方式1或實施方式2所述之任一組成物的間隔子序列的長度為從約10個核苷酸至約50個核苷酸。在一些實例中,間隔子序列的長度為從約15個核苷酸至約35個核苷酸。在一些實例中,間隔子序列與靶核酸的靶序列基本上互補。在一些實例中,靶序列與原間隔子相鄰模體(PAM)序列相鄰。
實施方式4:如實施方式1、2或3所述之任一組成物可以包含V型核酸酶,該V型核酸酶係Cas12i多肽,並且其中該PAM序列包含如5’-NTTN-3’所示的序列,其中N係任何核苷酸。
實施方式5:在如任何前述實施方式所述之任一組成物中,該反轉錄酶多肽包含MMLV-RT、MMTV-RT、Marathon-RT或RTX反轉錄酶。
實施方式6:在如實施方式1-5中任一項所述之任一組成物中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽融合。在一些實例中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽的N-末端融合。在其他實例中,該反轉錄酶多肽與該V型CRISPR核酸酶多肽的C-末端融合。在又其他實例中,該反轉錄酶多肽插入該V型CRISPR核酸酶多肽的環內。
實施方式7:在如實施方式1-5中任一項所述之任一組成物中,該反轉錄酶多肽和該V型CRISPR核酸酶多肽通過白胺酸拉鍊、奈米抗體、抗體或捲曲螺旋結構域形成複合物。
實施方式8:在如實施方式1-7中任一項所述之任一組成物中,該RT供體RNA可以與該RNA指導物融合。在一些實例中,該RT供體RNA與該RNA指導物的5’末端融合。在其他實例中,該RT供體RNA與該RNA指導物的3’末端融合。在一些情況下,該RNA指導物的間隔子序列與該RT供體RNA中的反轉錄模板序列相鄰。可替代地,該RNA指導物的間隔子序列與該RT供體RNA中的PBS相鄰。在其他情況下,該RNA指導物的同向重複序列與該RT RNA供體中的反轉錄模板序列相鄰。可替代地,該RNA指導物的同向重複序列與該RT供體RNA中的PBS相鄰。
在一些實例中,該RT供體RNA-RNA指導物融合物多核苷酸可以進一步包含連接子。在一些情況下,該連接子位於該同向重複序列和該PBS之間。在其他情況下,該連接子位於該間隔子序列和該反轉錄模板序列之間。該連接子的長度可以在約1個核苷酸和約200個核苷酸之間。在一些實例中,該連接子包含髮夾。
實施方式9:在如實施方式1-8中任一項所述之任一組成物中,該PBS的長度可以在約3個核苷酸和約200個核苷酸之間。例如,該PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。在一些情況下,該PBS與該非靶股(PAM股)的游離3’末端雜交(經由鹼基配對結合)。在其他情況下,該PBS與該靶股(非PAM股)的游離3’末端雜交。
實施方式10:在如實施方式1-9中任一項所述之任一組成物中,該反轉錄模板序列的長度在約10個核苷酸和約300個核苷酸之間。例如,該反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
實施方式11:在如實施方式1-10中任一項所述之任一組成物中,該PBS與該靶核酸(其係雙股的)的靶股或非靶股具有基本互補性。例如,該PBS與該靶核酸的靶股或非靶股具有至少約75%的互補性。在其他實例中,該PBS與該靶核酸的靶股或非靶股具有至少約85%的互補性。在其他實例中,該PBS與該靶核酸的靶股或非靶股具有至少約95%的互補性。
實施方式12:在如實施方式1-11中任一項所述之任一組成物中,該反轉錄模板序列包含適配體。在一些情況下,該適配體募集該反轉錄酶多肽。
實施方式13:在如實施方式1-11中任一項所述之任一組成物中,該反轉錄模板例如在5’末端或3’末端包含修飾。在一些實例中,該修飾係化學修飾。在其他實例中,該修飾係包含二級結構的核酸序列。在特定實例中,該修飾係髮夾、假結、三鏈體結構、外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。在其他特定實例中,該修飾包含核酸酶結合序列(例如,一或多個同向重複序列)或核酸酶結合序列與DNA結合序列(間隔子)。
如實施方式1-13中任一項所述之任一組成物可以將編輯引入到該靶股或該非靶股中。在一些實例中,該編輯係取代、插入或缺失。在一些情況下,該編輯係1個核苷酸至約200個核苷酸的取代。在一些情況下,該編輯係1個核苷酸至約120個核苷酸的取代。在一些情況下,該編輯係1個核苷酸至約20個核苷酸的取代。在其他情況下,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,1個核苷酸至約20個核苷酸的插入。在一些實例中,該插入包含髮夾。在又其他情況下,該編輯係1個核苷酸至約100個核苷酸的缺失。例如,該編輯係1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯發生於該PAM序列的約200個核苷酸內。在一個實例中,該編輯發生於該PAM序列的約100個核苷酸內。在另一個實例中,該編輯發生於該PAM序列的約50個核苷酸內。在又另一個實例中,該編輯發生於該PAM序列的約30個核苷酸內。在仍另一個實例中,該編輯發生於該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內、起始和/或結束於該PAM序列上游的約5個核苷酸內或起始和/或結束於該PAM序列下游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內,例如,起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。在一些實例中,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
實施方式14:在如實施方式1-13所述之任一組成物中,該靶序列存在於細胞中。
實施方式15:如實施方式1-14所述之任一組成物可以被配製用於遞送至細胞。在一些實例中,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在單一遞送媒介物中配製。
在其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在兩種或更多種遞送媒介物中配製。
在又其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中配製。
在一些實例中,該RNA指導物和該RT供體RNA在單一遞送媒介物中配製。在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在第一遞送媒介物中配製,並且該RNA指導物和該RT供體RNA在第二遞送媒介物中配製。
實施方式16:在如實施方式1-15中任一項所述之任一組成物中,在適用的情況下,該V型CRISPR核酸酶多肽、反轉錄酶多肽、RNA指導物和/或RT供體RNA在一或多種載體(例如,一或多種表現載體)中編碼。
實施方式17:一種載體,其包含編碼如實施方式1-16中任一項所述之組成物的V型CRISPR核酸酶多肽、反轉錄酶多肽、RNA指導物和/或RT供體RNA的序列。
實施方式18:一種細胞,其包含如實施方式1-16中任一項所述之組成物或如實施方式17所述之載體。在一些實例中,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式19:一種表現如實施方式17所述之載體之方法。
實施方式20:一種產生如實施方式1-17中任一項所述之組成物之方法。
實施方式21:一種遞送如實施方式1-16中任一項所述之組成物之方法。
在一些實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在單一遞送媒介物中遞送。
在其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、該RNA指導物或編碼該RNA指導物的核酸、該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸、以及該RT供體RNA在兩種或更多種遞送媒介物中遞送。
在又其他實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中遞送。
在一些情況下,該RNA指導物和該RT供體RNA在單一遞送媒介物中遞送。
在特定實例中,該V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的核酸、和該反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在第一遞送媒介物中遞送,並且該RNA指導物和該RT供體RNA在第二遞送媒介物中遞送。
實施方式22:一種將如實施方式1-16中任一項所述之組成物與靶核酸結合之方法。在一些實例中,該靶核酸存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式23:一種將編輯引入到靶核酸中之方法,該方法包括使該靶核酸與如實施方式1-16中任一項所述之組成物接觸。在一些實例中,該組成物將編輯引入到該靶核酸的靶股或非靶股中。在一些情況下,該編輯係取代、插入或缺失。
在特定實例中,該編輯係1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。在其他特定實例中,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在又其他特定實例中,該編輯係1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失或1個核苷酸至約20個核苷酸的缺失。
在一些情況下,該編輯發生於該PAM序列的約200個核苷酸內,例如,發生於該PAM序列的約100個核苷酸內、發生於該PAM序列的約50個核苷酸內、發生於該PAM序列的約30個核苷酸內或發生於該PAM序列的約20個核苷酸內。
在一些情況下,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
可替代地,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內,例如,起始和/或結束於該PAM序列下游的約10個核苷酸內或起始和/或結束於該PAM序列下游的約5個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。
實施方式24:一種編輯模板RNA,其包含:
(a) CRISPR核酸酶結合序列;
(b) 與包含靶股和非靶股的靶核酸的靶序列互補的DNA結合序列,其中該靶序列與原間隔子相鄰模體(PAM)序列相鄰;以及
(c) 反轉錄供體RNA(RT供體RNA),其包含引物結合位點(PBS)和反轉錄模板序列,其中該PBS與相鄰於該靶序列的序列基本上互補,並且其中該反轉錄模板序列包含相對於該靶核酸的至少一個經編碼的編輯,並且
其中該DNA結合序列和該PBS與該靶核酸的同一條股結合。
實施方式25:在如實施方式24所述之編輯模板RNA中,該DNA結合序列和該PBS與該靶核酸的靶股(非PAM股)結合。
實施方式26:在如實施方式24所述之編輯模板RNA中,至少一個經編碼的編輯係相對於該靶核酸的非靶股(PAM股)。
實施方式27:如實施方式24-26中任一項所述之編輯模板RNA當與該靶核酸結合時包含未配對核苷酸區域。例如,該未配對核苷酸區域與該DNA結合序列相鄰。可替代地或另外地,該未配對核苷酸區域與該PBS相鄰。在一些情況下,該未配對核苷酸區域包含反轉錄模板序列。
實施方式28:在如實施方式24-27中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列、PBS和反轉錄模板序列係RNA序列。
實施方式29:在如實施方式24-28中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與II型CRISPR核酸酶結合。
實施方式30:在如實施方式24-28中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與V型CRISPR核酸酶結合。在一些實例中,該CRISPR核酸酶結合序列與Cas12i多肽或變體Cas12i多肽結合。在一些情況下,該CRISPR核酸酶結合序列與多肽結合,該多肽與SEQ ID NO: 2-11中任一項具有至少80%同一性。在一個實例中,該CRISPR核酸酶結合序列與多肽結合,該多肽與SEQ ID NO: 2-11中任一項具有至少95%同一性。在另一個實例中,該CRISPR核酸酶結合序列與包含SEQ ID NO: 2-11中任一項的胺基酸序列的多肽結合。
實施方式31:在如實施方式24-30中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與具有降低的crRNA加工活性或缺乏crRNA加工活性的CRISPR核酸酶結合。
實施方式32:在如實施方式24-31中任一項所述之任一編輯模板RNA中,在適用的情況下,該CRISPR核酸酶結合序列係同向重複序列。在一些實例中,該CRISPR核酸酶結合序列係Cas9同向重複序列。在其他實例中,該CRISPR核酸酶結合序列係Cas12i同向重複序列。在一些情況下,該CRISPR核酸酶結合序列包含與SEQ ID NO: 12-24中任一項具有至少90%同一性的核苷酸序列。例如,該CRISPR核酸酶結合序列包含與SEQ ID NO: 12-24中任一項具有至少95%同一性的核苷酸序列。在一個實例中,該CRISPR核酸酶結合序列包含SEQ ID NO: 12-24中任一項所示的核苷酸序列。
實施方式33:在如實施方式24-32中任一項所述之任一編輯模板RNA中,該CRISPR核酸酶結合序列與該DNA結合序列相鄰。例如,該DNA結合序列係該CRISPR核酸酶結合序列的3’延伸。
實施方式34:在如實施方式24-33中任一項所述之任一編輯模板RNA中,該DNA結合序列係RNA序列、DNA序列或RNA/DNA雜合序列。
實施方式35,在如實施方式24-34中任一項所述之任一編輯模板RNA中,該DNA結合序列(例如,間隔子序列)的長度為約10個核苷酸至約50個核苷酸。在一些實例中,該DNA結合序列的長度為約15個核苷酸至約35個核苷酸。
實施方式36,在如實施方式24-35中任一項所述之任一編輯模板RNA中,
該DNA結合序列與該PBS相鄰。在一些實例中,該PBS係DNA結合序列的3’延伸。
實施方式37:在如實施方式24-36中任一項所述之任一編輯模板RNA中,該PBS的長度在約3個核苷酸和約200個核苷酸之間。例如,該PBS的長度為約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105或110個核苷酸。
實施方式38:在如實施方式24-37中任一項所述之任一編輯模板RNA中,該PBS與該反轉錄模板序列相鄰。在一些實例中,該反轉錄模板序列係PBS的3’延伸。
實施方式39:在如實施方式24-38中任一項所述之任一編輯模板RNA中,該反轉錄模板序列的長度為約10個核苷酸至約300個核苷酸。在一些實例中,該反轉錄模板序列的長度為約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115或120個核苷酸。
實施方式40:如實施方式24-39中任一項所述之任一編輯模板RNA從5’至3’可以包含核酸酶結合序列、DNA結合序列、反轉錄模板和PBS。
實施方式41:如實施方式24-39中任一項所述之任一編輯模板RNA從5’至3’可以包含反轉錄模板、PBS、核酸酶結合序列和DNA結合序列。
實施方式42:在如實施方式24-41中任一項所述之任一編輯模板中,該PBS的3’末端包含修飾。
實施方式43:在如實施方式24-42中任一項所述之任一編輯模板RNA中,該反轉錄模板的5’末端包含修飾。
實施方式44:在如實施方式42或43所述之編輯模板RNA中,該修飾係化學修飾。
實施方式45:在如實施方式42或43所述之編輯模板RNA中,該修飾係包含二級結構的核酸序列。例如,該修飾係髮夾、假結、三鏈體結構、xrRNA、tRNA或截短的tRNA。
實施方式46:在如實施方式42或43所述之編輯模板RNA中,該修飾包含核酸酶結合序列或核酸酶結合序列與DNA結合序列。
實施方式47:如實施方式24-47中任一項所述之任一編輯模板RNA可以引起編輯,該編輯可為取代、插入或缺失。在一些實例中,該編輯係1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。在其他實例中,該編輯係1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在又其他實例中,該編輯係1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯在該PAM序列的約200個核苷酸內,例如,該PAM序列的約100個核苷酸內、該PAM序列的約50個核苷酸內、該PAM序列的約30個核苷酸內或該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約5個核苷酸內。在一個實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內。在另一個實例中,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。可替代地或另外地,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
實施方式48:如實施方式24-47中任一項所述之編輯模板RNA存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式49:如實施方式24-47中任一項所述之編輯模板RNA被配製用於遞送至細胞,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。在一些實例中,該編輯模板RNA與CRISPR核酸酶或編碼該CRISPR核酸酶的核酸在單一遞送媒介物中一起配製。在其他實例中,該編輯模板RNA與CRISPR核酸酶多肽或編碼該CRISPR核酸酶多肽的核酸和反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中一起配製。
實施方式50:在適用的情況下,如實施方式24-49中任一項所述之編輯模板RNA在載體中編碼。
實施方式51:一種載體,其包含編碼如實施方式24-50中任一項所述之編輯模板RNA的序列。
實施方式52:一種複合物,其包含如實施方式24-50中任一項所述之編輯模板RNA。在一些實例中,該複合物包含CRISPR核酸酶。在其他實例中,該複合物包含靶序列或靶核酸。在又其他實例中,該複合物包含CRISPR核酸酶和靶序列或靶核酸。
在一些實例中,該CRISPR核酸酶係切口酶。在其他實例中,該CRISPR核酸酶切割DNA雙股體的兩條股。在又其他實例中,該CRISPR核酸酶係平末端切割核酸酶。可替代地,該CRISPR核酸酶係交錯切割核酸酶。
實施方式53:一種細胞,其包含如實施方式24-52中任一項所述之編輯模板RNA、載體或複合物。在一些情況下,該細胞係哺乳動物細胞,例如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
實施方式54:一種表現如實施方式31所述之載體之方法。
實施方式55:一種產生如實施方式24-50中任一項所述之編輯模板RNA之方法。
實施方式56:一種遞送如實施方式24-50中任一項所述之編輯模板RNA之方法。在一些情況下,該編輯模板RNA與CRISPR核酸酶或編碼該CRISPR核酸酶的核酸在單一遞送媒介物中一起配製。在其他實例中,該編輯模板RNA與CRISPR核酸酶多肽或編碼該CRISPR核酸酶多肽的核酸和反轉錄酶多肽或編碼該反轉錄酶多肽的核酸在單一遞送媒介物中一起配製。
實施方式57:一種將如實施方式24-50中任一項所述之編輯模板RNA與CRISPR核酸酶結合之方法。
實施方式58:一種將如實施方式24-50中任一項所述之編輯模板RNA與靶序列或靶核酸結合之方法。
實施方式59:一種將如實施方式24-50中任一項所述之編輯模板RNA與CRISPR核酸酶和靶序列或靶核酸結合之方法。
實施方式60:一種將編輯引入到靶核酸之方法,該方法包括使該靶核酸與如實施方式24-50中任一項所述之編輯模板RNA和CRISPR核酸酶接觸。在一些情況下,該CRISPR核酸酶係II型CRISPR核酸酶。在其他情況下,該CRISPR係V型CRISPR核酸酶。例如,該CRISPR核酸酶係Cas12i多肽或變體Cas12i多肽。在特定實例中,該CRISPR核酸酶係與SEQ ID NO: 2-11中任一項具有至少80%同一性、例如與SEQ ID NO: 2-11中任一項具有至少95%同一性的多肽。在一個實例中,該CRISPR核酸酶係包含SEQ ID NO: 2-11中任一項的胺基酸序列的多肽。
在一些實例中,該CRISPR核酸酶係包含降低的crRNA加工活性或缺乏crRNA加工活性的CRISPR核酸酶。
在一些實例中,該CRISPR核酸酶係切口酶。可替代地,該CRISPR核酸酶切割DNA雙股體的兩條股。在一些情況下,該CRISPR核酸酶係平末端切割核酸酶。可替代地,該CRISPR核酸酶係交錯切割核酸酶。
實施方式61:在如實施方式60所述之方法中,該編輯模板RNA將編輯引入到該靶核酸的靶股中。在一些實例中,該編輯係取代、插入或缺失。例如,該編輯可為1個核苷酸至約200個核苷酸的取代,例如,1個核苷酸至約120個核苷酸的取代,或1個核苷酸至約20個核苷酸的取代。可替代地,該編輯可為1個核苷酸至約200個核苷酸的插入,例如,1個核苷酸至約120個核苷酸的插入,或1個核苷酸至約20個核苷酸的插入。在一些情況下,該插入包含髮夾。在其他實例中,該編輯可為1個核苷酸至約100個核苷酸的缺失,例如,1個核苷酸至約120個核苷酸的缺失,或1個核苷酸至約20個核苷酸的缺失。
在一些實例中,該編輯在該PAM序列的約200個核苷酸內,例如,該PAM序列的約100個核苷酸內、該PAM序列的約50個核苷酸內、該PAM序列的約30個核苷酸內或該PAM序列的約20個核苷酸內。
在一些實例中,該編輯起始和/或結束於該PAM序列上游的約200個核苷酸內,例如,起始和/或結束於該PAM序列上游的約100個核苷酸內、起始和/或結束於該PAM序列上游的約50個核苷酸內、起始和/或結束於該PAM序列上游的約30個核苷酸內、起始和/或結束於該PAM序列上游的約20個核苷酸內、起始和/或結束於該PAM序列上游的約10個核苷酸內或起始和/或結束於該PAM序列上游的約5個核苷酸內。
在其他實例中,該編輯起始和/或結束於該PAM序列下游的約5個核苷酸內。在一個實例中,該編輯起始和/或結束於該PAM序列下游的約10個核苷酸內。在另一個實例中,該編輯起始和/或結束於該PAM序列下游的約25個核苷酸內。
在一些實例中,該編輯去除或改變PAM序列。可替代地或另外地,該編輯防止V型CRISPR核酸酶多肽重新靶向(例如,防止V型CRISPR核酸酶與靶序列結合)。
在一些實例中,該靶核酸存在於細胞中,例如哺乳動物細胞,如人細胞。在一個實例中,該細胞係肝臟細胞(例如,肝細胞)。
一般技術
除非另有說明,否則本揭露之實踐將使用分子生物學(包括重組技術)、微生物學、細胞生物學、生物化學和免疫學的常規技術,其在本領域的技術範圍內。在文獻中充分解釋了這樣的技術,該等文獻係例如
Molecular Cloning: A Laboratory Manual[分子選殖:實驗室手冊], 第二版(Sambrook等人, 1989) Cold Spring Harbor Press [冷泉港出版社];
Oligonucleotide Synthesis[寡核苷酸合成](M. J. Gait編輯 1984);
Methods in Molecular Biology[分子生物學方法], Humana Press [胡瑪納出版社];
Cell Biology: A Laboratory Notebook[細胞生物學:實驗室筆記本](J. E. Cellis編輯, 1989) Academic Press [學術出版社];Animal Cell Culture [動物細胞培養](R. I. Freshney編輯 1987);Introduction to Cell and Tissue Culture [細胞和組織培養介紹](J. P. Mather和P. E. Roberts, 1998)Plenum Press [普萊紐姆出版社];Cell and Tissue Culture: Laboratory Procedures [細胞和組織培養:實驗室程序](A. Doyle, J. B. Griffiths和D. G. Newell編輯 1993-8)J. Wiley and Sons [約翰·威利父子出版社];Methods in Enzymology [酶學方法](Academic Press, Inc. [學術出版公司]);Handbook of Experimental Immunology [實驗免疫學手冊](D. M. Weir和C. C. Blackwell編輯): Gene Transfer Vectors for Mammalian Cells [用於哺乳動物細胞的基因轉移載體](J. M. Miller和M. P. Calos編輯, 1987);Current Protocols in Molecular Biology [分子生物學現代方案](F. M. Ausubel等人編輯 1987);PCR: The Polymerase Chain Reaction [PCR:聚合酶鏈反應](Mullis等人編輯 1994);Current Protocols in Immunology [免疫學現代方法](J. E. Coligan等人編輯, 1991);Short Protocols in Molecular Biology [分子生物學中的短程式](Wiley and Son [約翰·威利父子出版社], 1999);Immunobiology [免疫生物學](C. A. Janeway和P. Travers, 1997);Antibodies [抗體](P. Finch, 1997);Antibodies: a practice approach [抗體:實用方法](D. Catty.編輯, IRL Press [IRL出版社], 1988-1989);Monoclonal antibodies: a practical approach [單株抗體:實用方法](P. Shepherd和C. Dean編輯, Oxford University Press [牛津大學出版社], 2000);Using antibodies: a laboratory manual [使用抗體:實驗室手冊](E. Harlow和D. Lane, Cold Spring Harbor Laboratory Press [冷泉港實驗室出版社], 1999);The Antibodies [抗體](M. Zanetti和J. D. Capra編輯 Harwood Academic Publishers [哈伍德學術出版社], 1995);
DNA Cloning: A practical Approach[DNA選殖:實用方法], 第I和II卷(D.N. Glover編輯 1985);
Nucleic Acid Hybridization[核酸雜交](B.D. Hames & S.J. Higgins編輯 (1985));
Transcription and Translation[轉錄和翻譯](B.D. Hames & S.J. Higgins編輯 (1984));
Animal Cell Culture[動物細胞培養](R.I. Freshney編輯 (1986));
Immobilized Cells and Enzymes[固定化細胞和酶](lRL Press [lRL出版社], (1986));以及B. Perbal,
A practical Guide To Molecular Cloning[分子選殖的實踐指南] (1984);F.M. Ausubel等人 (編輯)。
在沒有進一步詳細描述的情況下,據信熟悉該項技術者基於以上描述可以最大程度地利用本發明。因此,以下特定實施方式應解釋為僅是說明性的,而不以任何方式限制本揭露的其餘部分。出於本文引用的目的或主題,將本文引用的所有出版物藉由引用併入。
實例
提供以下實例以進一步說明本發明之一些實施方式但並非旨在限制本發明之範圍;藉由它們的示例性性質將理解,可以可替代地使用熟悉該項技術者已知的其他程序、方法或技術。
實例 1 -
哺乳動物細胞中靶股的 RNA 模板化編輯
本實例描述了哺乳動物基因的靶股編輯。
將變體Cas12i2(SEQ ID NO: 4)與SEQ ID NO: 29的突變MMLV反轉錄酶的融合物選殖到pcda3.1主鏈(英傑公司(Invitrogen))中。表7中示出了變體Cas12i2的N-末端和C-末端RT融合物的構造。在水中製備用於表現與變體Cas12i2的RT融合物的質體的工作溶液(變體Cas12i2-RT融合工作溶液)。
[
表 7]
.CAS-RT 融合設計和序列
詳細描述 | 簡要描述 | 序列 |
Cas12i2變體(H485A) - NLS - 2xSGGS - XTEN(16aa) - 2xSGGS - mutMMLVRT- NLS | C_MMLV_Cas12i2變體 | MSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 25) |
NLS - mutMMLVRT- 2xSGGS - XTEN(16aa) - 2xSGGS - Cas12i2變體(H485A) - NLS | N_MMLV_Cas12i2變體 | MKRTADGSEFESPKKKRKVTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 26) |
MMLV | MMLV | MTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSP(SEQ ID NO: 29) |
測試了各種RNA指導物-RT供體RNA融合物構造,如表8所示和
圖 8A所描繪的。將反轉錄模板序列和PBS與RNA指導物的3’末端融合。反轉錄模板序列設計用於將取代、插入、缺失或髮夾引入到AAVS1_T7靶標或VEGFA_T5靶標。RNA指導物-RT供體RNA融合物的序列示出於表9中並且部分描繪於
圖 8B中。在表9和
圖 8B中,「S」係指取代,「I」係指插入,「D」係指缺失,並且「H」係指髮夾,並且括弧內為PBS長度。僅用作對照的RNA指導物的序列示出於表10中。將RNA指導物-RT供體RNA融合物或RNA指導物選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現每種RNA指導物的質體/RT供體RNA質體(或RNA指導物)的工作溶液(編輯模板RNA工作溶液)。
[
表 8]
.RNA 指導物 -RT 供體 RNA 融合物設計 .
[
表 9]
.RNA 指導物 -RT 供體融合序列 .
[
表 10]
.RNA 指導物對照序列 .
構造 | 核酸酶 | 描述 |
DR - 間隔子 - 反轉錄模板序列 - PBS | Cas12i2變體 | 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 髮夾:視需要的 |
DR - 間隔子 | Cas12i2變體 | 對照(無RT供體RNA) |
靶標 | Cas-RT融合物 | RNA指導物-RT供體RNA描述 | RNA指導物-RT供體RNA序列 |
AAVS1_T6 GTAGCCTCTCCCGCTCTGGT (SEQ ID NO: 30) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGGAUCCAGAUCUGGGUGAUUUAGGCUCCCUCUGUCUGGAUCAGUCCUCC(SEQ ID NO: 40) |
AAVS1_T6 (SEQ ID NO: 30) | N_MMLV_變體Cas12i2 或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGGAUCCAGAUCUGGGUGAU(SEQ ID NO: 41) |
AAVS1_T6 (SEQ ID NO: 30) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGCACCCCCAUAAGGGGGGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 42) |
AAVS1_T6 (SEQ ID NO: 30) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCCGAGUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 43) |
AAVS1_T6 (SEQ ID NO: 30) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCAGCGGCUCUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 44) |
AAVS1_T6 (SEQ ID NO: 30) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGUGACAUUCUUUGUAGCCUCUCCCUGGUUCAGGGCCCAGCUAGGG(SEQ ID NO: 45) |
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 54) |
AAVS1_T7 (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 55) |
AAVS1_T7 (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGCACCCCCAUAAGGGGGCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 56) |
AAVS1_T7 (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCGAGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 57) |
AAVS1_T7 (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGAGCGGUCAGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 58) |
AAVS1_T7 (SEQ ID NO: 32) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 59) |
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 68) |
EMX1_T6 (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 69) |
EMX1_T6 (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAGCACCCCCAUAAGGGGGUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 70) |
EMX1_T6 (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGCGAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 71) |
EMX1_T6 (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGAGCGCUAGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 72) |
EMX1_T6 (SEQ ID NO: 34) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 73) |
VEGFA_T2 AATCCTCCACCAGTCATGGT (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCCCACACAUUUUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUG(SEQ ID NO: 81) |
VEGFA_T2 (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCCCACACAUUUUCAAGUGC(SEQ ID NO: 82) |
VEGFA_T2 (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUGCACCCCCAUAAGGGGGAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 83) |
VEGFA_T2 (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCACGAGUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 84) |
VEGFA_T2 (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCAAGCGGUCAUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 85) |
VEGFA_T2 (SEQ ID NO: 36) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUUUAAUCCUCCACCAUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 86) |
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 95) |
VEGFA_T5 (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 96) |
VEGFA_T5 (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(H) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGGCACCCCCAUAAGGGGGAAAAGACUUUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 97) |
VEGFA_T5 (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(S) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCACGAGCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 98) |
VEGFA_T5 (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(I) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCAAGCGUGGACCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 99) |
VEGFA_T5 (SEQ ID NO: 38) | N_MMLV_變體Cas12i2或C_MMLV_變體Cas12i2 | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(D) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUGUUUAAACUCUCCACCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 100) |
靶標 | Cas或Cas-RT融合物 | RNA指導序列 |
AAVS1_T6 | 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 | AGAAAUCCGUCUUUCAUUGACGGGUAGCCUCUCCCGCUCUGGU(SEQ ID NO: 110) |
AAVS1_T7 | Cas12i2變體,N_MMLV_Cas12i2變體,和C_MMLV_Cas12i2變體 | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112) |
EMX1-T6 | 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114) |
VEGFA_T2 | 變體Cas12i2,N_MMLV_變體Cas12i2,和C_MMLV_變體Cas12i2 | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116) |
VEGFA_T5 | Cas12i2變體,N_MMLV_Cas12i2變體,和C_MMLV_Cas12i2變體 | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 118) |
在轉染前大約16小時,將在DMEM/10%FBS+青黴素/鏈黴素中的25,000個HEK293T細胞鋪板至96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine™ 2000(賽默飛世爾公司(Themo Fisher))和Opti-MEM™培養基(賽默飛世爾公司)的混合物,然後在室溫下孵育5-20分鐘(溶液1)。孵育後,將Lipofectamine™:OptiMEM™混合物添加到含有變體Cas12i2-RT融合物工作溶液、RNA工作溶液和OptiMEM™培養基的單獨混合物中(溶液2)。將溶液1和溶液2混合物藉由向上和向下吸移進行混合,且然後在室溫下孵育25分鐘。孵育後,將溶液1和溶液2混合物逐滴添加到含有細胞的96孔板的每個孔中。轉染後72小時,藉由向每個孔的中心添加TrypLE™(賽默飛世爾公司)對細胞進行胰蛋白酶化並孵育大約5分鐘。然後將生長培養基添加到每個孔中並且混合以重懸細胞。然後將細胞以400 g旋轉沈降10分鐘,並且棄去上清液。將QuickExtract™緩衝液(盧西根公司(Lucigen))添加至原始細胞懸浮液體積的量的1/5。將細胞在65°C下孵育15分鐘,在68°C下孵育15分鐘,並且在98°C下孵育10分鐘。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5中等或高輸出套組進行定序運行。
圖 9A和
圖 9B示出了變體Cas12i2對AAVS1_T6的活性,
圖 9C和
圖 9D示出了變體Cas12i2對AAVS1_T7的活性,
圖 9E和
圖 9F示出了變體Cas12i2對EMX1_T6的活性,
圖 9G和
圖 9H示出了變體Cas12i2對VEGFA_T2的活性,以及
圖 9I和
圖 9J示出了變體Cas12i2對VEGFA_T5的活性。編輯比率(包含所希望編輯的讀段相對於讀段總數的百分比)示出於y軸上,總編輯以淺灰色示出,而經編碼的編輯以深灰色示出。顯示的數據係兩個生物重複的平均值,各自具有三個技術重複。如
圖 9A 、圖 9C、
圖 9E、
圖 9G和
圖 9I所示,在靶向AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5的RNA指導物的存在的情況下,變體Cas12i2和變體Cas12i2-RT融合物係活性核酸酶。
如
圖 9B 、圖 9D、
圖 9F、
圖 9H和
圖 9J所示,在RNA指導物-RT供體RNA融合物序列存在的情況下,變體Cas12i2-RT融合物能夠將經編碼的取代、插入和缺失引入到AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5。PBS長度為13、30和60個核苷酸的情況下觀察到活性。C-末端MMLV RT融合物的編輯超過了與變體Cas12i2的N-末端MMLV RT融合物的編輯。用變體Cas12i2進行編輯的範圍為約1%-5%。
本實例示出了使用編輯模板RNA和Cas12i2-RT融合物將特定編輯摻入到所選的哺乳動物基因組位點。
實例 2 - 使用末端保護的編輯模板 RNA 編輯哺乳動物細胞中的靶股
本實例描述了哺乳動物基因的靶股編輯。
將SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 25的變體Cas12i2-RT融合物各自選殖到pcda3.1主鏈(英傑公司)中。在水中製備用於表現與變體Cas12i2的RT融合物的質體的工作溶液(變體Cas12i2-RT融合工作溶液)。
測試了各種RNA指導物-RT供體RNA融合物構造,如表11所示以及
圖 12A和
圖 12B所描繪的。將反轉錄模板序列和PBS與RNA指導物的5’末端或3’末端融合。在5’或3’末端添加另外的DR-間隔子序列。用於末端保護的間隔子序列係非人靶向的(即,它不靶向人基因組中的任何序列)。RNA指導物-RT供體RNA融合物的序列示出於表12中;在RT供體中編碼的所希望的編輯以小寫字母示出。僅用作對照的RNA指導物的序列示出於表13中。將RNA指導物-RT供體RNA融合物或RNA指導物選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現RNA指導物的每種質體/RT供體RNA質體(或RNA指導物)的工作溶液(編輯模板RNA工作溶液)。
[
表 11]
.RNA 指導物 -RT 供體 RNA 融合物設計
[
表 12]
.RNA 指導物 -RT 供體融合序列
[
表 13]
.RNA 指導物對照序列
轉染前大約16小時,將DMEM/10%FBS+青黴素/鏈黴素中的25,000個HEK293T細胞
構造 | 描述 |
DR - 間隔子 - 反轉錄模板序列 - PBS | 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 |
DR - 間隔子 - 反轉錄模板序列 - PBS - 末端保護 | 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 末端保護:DR-間隔子(非人) |
反轉錄模板序列 - PBS - DR - 間隔子 | 反轉錄模板序列:34個核苷酸 PBS:13、30或60個核苷酸 |
末端保護- 反轉錄模板序列 - PBS - DR - 間隔子 | 末端保護:DR-間隔子(非人) 反轉錄模板序列:34或40個核苷酸 PBS:13、30或60個核苷酸 |
DR - 間隔子 | 對照(無RT供體RNA) |
靶標 | RNA指導物-RT供體RNA描述 | RNA指導物-RT供體RNA序列 |
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 123) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 124) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 125) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 126) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 127) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 128) |
AAVS1_T7 (SEQ ID NO: 32) | 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 129) |
AAVS1_T7 (SEQ ID NO: 32) | 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 | CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 130) |
AAVS1_T7 (SEQ ID NO: 32) | 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 | CAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 131) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 132) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 133) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 134) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 135) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 136) |
AAVS1_T7 (SEQ ID NO: 32) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGAAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 137) |
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 138) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 139) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 140) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 141) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 142) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 143) |
EMX1_T6 (SEQ ID NO: 34) | 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 144) |
EMX1_T6 (SEQ ID NO: 34) | 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 | UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 145) |
EMX1_T6 (SEQ ID NO: 34) | 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 | UUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 146) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 147) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 148) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 149) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 150) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 151) |
EMX1_T6 (SEQ ID NO: 34) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGACAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 152) |
VEGFA_T2 AATCCTCCACCAGTCATGGT (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCC(SEQ ID NO: 153) |
VEGFA_T2 (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGC(SEQ ID NO: 154) |
VEGFA_T2 (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUG(SEQ ID NO: 155) |
VEGFA_T2 (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 156) |
VEGFA_T2 (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 157) |
VEGFA_T2 (SEQ ID NO: 36) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 158) |
VEGFA_T2 (SEQ ID NO: 36) | 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 159) |
VEGFA_T2 (SEQ ID NO: 36) | 反轉錄模板序列(34 nt) - PBS(30 nt) -核酸酶結合序列 - DNA結合序列 | AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 160) |
VEGFA_T2 (SEQ ID NO: 36) | 反轉錄模板序列(34 nt) - PBS(60 nt) -核酸酶結合序列 - DNA結合序列 | AGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 161) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 162) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 163) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 164) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) -核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 165) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 166) |
VEGFA_T2 (SEQ ID NO: 36) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAUACUAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCCCCCAGGAUGCGUGGAGGGAGGGGUCUGUGAGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 167) |
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 168) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 169) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 170) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 171) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 172) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 末端保護 | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGC(SEQ ID NO: 173) |
VEGFA_T5 (SEQ ID NO: 38) | 反轉錄模板序列(34 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 | AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 174) |
VEGFA_T5 (SEQ ID NO: 38) | 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 175) |
VEGFA_T5 (SEQ ID NO: 38) | 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 176) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 177) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 178) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(34 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 179) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(13 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 180) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(30 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 181) |
VEGFA_T5 (SEQ ID NO: 38) | 末端保護 - 反轉錄模板序列(40 nt) - PBS(60 nt) - 核酸酶結合序列 - DNA結合序列 | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAACACCAAAAGACUacUUAAACUCUCCAaccUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGAAGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 182) |
靶標 | RNA指導序列 |
AAVS1_T7 (SEQ ID NO: 32) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112) |
EMX1-T6 (SEQ ID NO: 34) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114) |
VEGFA_T2 (SEQ ID NO: 36) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116) |
VEGFA_T5 (SEQ ID NO: 38) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 118) |
鋪板到96孔板的每個孔中。在轉染的當天,細胞係70%-90%匯合的。對於待轉染的每個孔,製備Lipofectamine™ 2000(賽默飛世爾公司)和Opti-MEM™(賽默飛世爾公司)的混合物,然後在室溫下孵育5-20分鐘(溶液1)。孵育後,將Lipofectamine™:OptiMEM™混合物添加到含有變體Cas12i2-RT融合物工作溶液、RNA工作溶液和OptiMEM™培養基的單獨混合物中(溶液2)。將溶液1和溶液2混合物藉由向上和向下吸移進行混合,且然後在室溫下孵育25分鐘。孵育後,將溶液1和溶液2混合物逐滴添加到含有細胞的96孔板的每個孔中。轉染後72小時,藉由向每個孔的中心添加TrypLE™(賽默飛世爾公司)對細胞進行胰蛋白酶化並孵育大約5分鐘。然後將生長培養基添加到每個孔中並且混合以重懸細胞。然後將細胞以400 g旋轉沈降10分鐘,並且棄去上清液。將QuickExtract™緩衝液(盧西根公司(Lucigen))添加至原始細胞懸浮液體積的量的1/5。將細胞在65°C下孵育15分鐘,在68°C下孵育15分鐘,並且在98°C下孵育10分鐘。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5(依諾米那公司(Illumina))中等或高輸出套組進行定序運行。
圖 13A示出了對AAVS1_T7的活性,
圖 13B示出了對EMX1_T6的活性,
圖 13C示出了對VEGFA_T2的活性,以及
圖 13D示出了對VEGFA_T5的活性。讀段百分比示出於y軸上。數據係三個技術重複的平均值。
如
圖 13A、
圖 13B、
圖 13C和
圖 13D所示,在靶向AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5(參見gRNA樣本)的RNA指導物存在的情況下,SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 25的變體Cas12i2-RT融合物係活性核酸酶。僅在RT(SEQ ID NO: 25的變體Cas12i2-RT融合物)存在下才觀察到所希望的編輯。在SEQ ID NO: 25的變體Cas12i2-RT融合物的情況下對於測試的編輯模板RNA中的每一種,觀察到插入缺失和經編碼的編輯。與沒有末端保護的5’延伸編輯模板RNA(反轉錄模板序列 - PBS -核酸酶結合序列 - DNA結合序列)相比,具有末端保護的5’延伸編輯模板RNA(末端保護- 反轉錄模板序列 - PBS -核酸酶結合序列 - DNA結合序列)展示出具有所希望編輯的更多數量的讀段。
本實例示出了使用編輯模板RNA和Cas12i2-RT融合物的多種構造將特定編輯摻入到所選的哺乳動物基因組位點。
實例 3 - Cas12i2 的體外切割模式的確定
在本實例中,確定了具有RNA指導物的變體Cas12i2的體外切割模式。確定Cas12i2在雙股DNA靶標上產生的切割位點使得設計編輯模板RNA的PBS組分成為可能。
用於確定切割模式的測定的示意圖示出於
圖 14A- 圖 14C中。首先設計了含有靶序列的寡核苷酸用於切割位點分析。寡核苷酸包含在靶標兩端具有12個核苷酸側翼序列的靶序列、內部條碼和允許靶向擴增的引發位點(
圖 14A )。如
圖 14B所示,將所有切割產物分成兩半,其中一半用綠豆核酸酶(MBN)處理,綠豆核酸酶使5’和3’突出端平端化(平端化處理),而對另一半反應物進行末端修復(部分NEBNext DNA文庫製備,新英格蘭生物實驗室(New England Biolabs)),其中5’突出端被填充(填充處理)。然後對這兩半進行NGS文庫製備和半靶向擴增。已示出V型CRISPR核酸酶產生交錯切割,其中5’突出端如灰色箭頭所示。該等切割位點藉由填充處理被捕獲以填充任何5’突出端。因此,該等產物的5’和3’定序表明靶股和非靶股上的切割位點。近期用Cpf1開展的工作指示了另外的切割位點,特別是在藉由填充方法未捕獲的非靶股上。為了捕獲該等切割位點,平端化方法導致所有5’和3’突出端的平端化。因此,平端化方法中的5’切割產物表示非靶股上的任何另外的切割位點,而3’切割產物表示靶股上的另外切割位點。NEBNext銜接子連接後的半靶向擴增允許5’和3’切割產物的特異性擴增;池化擴增的產物並藉由NGS分析(
圖 14C)。
分別使用經IR800和IR700標記的正向和反向引物藉由PCR擴增產生DNA底物,從而產生具有經IR800標記的靶股和經IR700標記的非靶股的dsDNA靶標。使用CleanNGS SPRI珠以珠比PCR產物為1.8倍比率對PCR產物進行清理。將純化的Cas12i2與crRNA在NEBuffer 3(10 mM Tris-HCl,pH 7.9,150 mM NaCl,10 mM MgCl
2,1 mM DTT)中在37°C下一起預孵育10 min以形成RNP。在37°C下,使包含與在NEBuffer 3中連續稀釋的RNP混合的dsDNA底物的體外切割反應進行1小時。將反應用EDTA淬滅。將反應物用RNA酶混合物處理(37°C持續15 min),隨後進行蛋白酶K處理(37°C持續15 min)。使用15% TBE-尿素凝膠藉由變性凝膠電泳分析反應物,並在Odyssey CLx(LI-COR)成像儀上成像。DNA底物和RNA指導序列示出於表14中;靶序列呈粗體。
[
表 14]
. 切割測定序列
靶標 | dsDNA底物 | crRNA |
AAVS1_T2 | TCCATGTCTCGTTATACGCTGTGGTTCGCCAACAACACTAGTACTACTGATAAATTACCC CCCAAGTCCCTCACCTCTCCAAAGCTGCCCATACTACTACACTAGTTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 213) | AGAAATCCGTCTTTCATTGACGG GGAGAGGTGAGGGACTTGGG(SEQ ID NO: 216) |
EMX1_T6 | TCCATGTCTCGTTATACGCTGTGGTTCGCCAACATATAGTTCACTACTAGCATGCTGCCC TTGACTAGCAACACTGGCTCAAAGAAGGAAAGACTACTTATAGTTCTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 214) | AGAAATCCGTCTTTCATTGACGG GAGCCAGTGTTGCTAGTCAA(SEQ ID NO: 217) |
VEGFA_T5 | TCCATGTCTCGTTATACGCTGTGGTTCGCCAACGCAGGAACGACACTACTAGCTGGATGAGC CTGGTCCATGGAGAGTTTAAAAAGTCTTTTGGACTACTGGAACGACTTGACAGCTAGCTCAGTCCTAGGTATAATGCTAGC(SEQ ID NO: 215) | AGAAATCCGTCTTTCATTGACGG TTAAACTCTCCATGGACCAG(SEQ ID NO: 218) |
對於用於確定切割位置的體外切割片段分析,使用SPRI珠和異丙醇(IPA SPRI)純化反應產物。將純化的反應物分成兩半部分。一半用綠豆核酸酶(新英格蘭生物實驗室)在30°C下處理30分鐘,以去除所有5’和3’突出端以產生平末端,隨後用IPA SPRI純化。然後使用NEBNext Ultra-II DNA文庫製備型套組(新英格蘭生物實驗室)按照製造商的說明準備綠豆核酸酶處理的和未經處理的兩半部分用於定序。使用半靶向擴增以分別擴增每個樣本的5’和3’切割產物。在定序前將所有擴增物池化並進行凝膠提取。對於每個樣本,將針對綠豆核酸酶和非綠豆核酸酶處理樣本的5’和3’切割產物獲得的讀段長度繪製為長條圖並映射到靶序列。
為了獲得完整的切割模式,獲取來自所有四個長條圖的數據並將其在R環圖上進行視覺化,如
圖 15A- 圖 15E 和圖 16所示。
圖 15B- 圖 15E示出了從AAVS1_T2的5’和3’切割產物的半靶向擴增獲得的讀段長度的長條圖。
圖 15B和
圖 15D分別示出了填充和平端化處理的5’切割產物的讀段長度長條圖。
圖 15C 和圖 15E分別示出了填充和平端化處理的3’切割產物的讀段長度長條圖。將每個讀段長度長條圖映射到x軸上示出的靶序列。還指示了PAM序列(5’-NTTT-3’)。從長條圖獲得的切割位點在
圖 15A的R環圖中用三角形表示。
圖 16比較了對於包含Cas12i2(SEQ ID NO: 2)或變體Cas12i2(SEQ ID NO: 4)的RNP而言AAVS1_T2和EMX1_T6上的切割位點。比例尺(右)代表如藉由定序讀段的數量測量的切割頻率。
對於所有靶標,在靶股和非靶股上均觀察到多個頻率不同的切割位點。在非靶股上,觀察到廣泛的切割譜,其中在間隔子區域(即,RNA指導物結合區)內以及該間隔子區域外部檢測到幾個切割位點。這表明在與Cas12i2結合後,雙股DNA可能會被從間隔子區域(即,RNA指導物結合區)解旋幾個鹼基對並以單股DNA存在,從而使其易於被Cas12i2切割。在間隔子區域外(即,RNA指導物結合區之外)始終觀察到靶股上的切割位點。對於AAVS1_T2,在距PAM序列22至24個核苷酸的位置處觀察到靶股切割位點。對於VEGFA_T5和EMX1_T6,在距PAM序列22至23個核苷酸的位置處觀察到靶股切割位點。因此,這表明設計用於靶向靶股的編輯模板RNA應該包含距PAM序列22到24個核苷酸的位置處開始的PBS。
實例 4 - 使用具有各種 PBS 和反轉錄模板序列長度的編輯模板 RNA 編輯哺乳動物細胞中的靶股
本實例描述了使用編輯模板RNA進行的哺乳動物基因的靶股編輯,該編輯模板RNA具有PBS(長度為3至60個核苷酸)和反轉錄模板序列(長度為14到54個核苷酸)。
在水中製備包含SEQ ID NO: 25的變體Cas12i2-RT融合物的質體的工作溶液(變體Cas12i2-RT融合物工作溶液)。編輯模板RNA序列示出於表15中。在一組條件中,反轉錄模板序列的長度為34個核苷酸,且PBS的長度為3、8、13、30或60個核苷酸。在第二組條件中,PBS的長度為13個核苷酸,且反轉錄模板序列的長度為14、24、34、44或54個核苷酸。將每種編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備表現每種編輯模板RNA的質體的工作溶液(編輯模板RNA工作溶液)。
[
表 15]
. 編輯模板 RNA 序列
靶標 | 編輯模板RNA描述 | 編輯模板RNA序列 |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAU(SEQ ID NO: 183) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCG(SEQ ID NO: 184) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 185) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUU(SEQ ID NO: 186) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUCUAGCAGUUCCACUCCUGGGCAGCCCGAGA(SEQ ID NO: 187) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 188) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 189) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 190) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGUGAUGAUUCCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 191) |
AAVS1_T7 (SEQ ID NO: 32) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAUGGUGGGAAAGGUGAUGAUUCCAGCUACUUUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 192) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGC(SEQ ID NO: 193) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCU(SEQ ID NO: 194) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 195) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCA(SEQ ID NO: 196) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAUGUGACCGUCAGUCUCCUUCCUGAAGGAC(SEQ ID NO: 197) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 198) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 199) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 200) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAAUCCAAAGCUUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 201) |
EMX1_T6 (SEQ ID NO: 34) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAAUGAAGUCGCCAUCCAAAGCUUUCCUUCUUUGAGCCAGUGUUGGAUCUCAAGGGCAGCAUGCUGGGCC(SEQ ID NO: 202) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(3 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUC(SEQ ID NO: 203) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(8 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCU(SEQ ID NO: 204) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 205) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(30 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAA(SEQ ID NO: 206) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(60 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAACAAAGCCCCCAAGAAGGGGGGGCACUCAGGACUCUCUCCAAGAGA(SEQ ID NO: 207) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(14 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 208) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(24 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 209) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(34 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 210) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(44 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGAGGUAACACCAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 211) |
VEGFA_T5 (SEQ ID NO: 38) | 核酸酶結合序列 - DNA結合序列 - 反轉錄模板序列(54 nt) - PBS(13 nt) | AGAAAUCCGUCUUUCAUUGACGGUUAAACUCUCCAUGGACCAGCCCCAUUACCAGGUAACACCAAAAGACUUCUUAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCA(SEQ ID NO: 212) |
如實例2所述,轉染並分析細胞。
圖 17A示出了SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 183-187的編輯模板RNA對AAVS1_T7的活性、SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 193-197的編輯模板RNA對EMX1_T6的活性、以及SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 203-207的編輯模板RNA對VEGFA_T5的活性。
圖 17B示出了SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 188-192的編輯模板RNA對AAVS1_T7的活性、SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 198-202的編輯模板RNA對EMX1_T6的活性、以及SEQ ID NO: 25的Cas12i2-RT和SEQ ID NO: 208-212的編輯模板RNA對VEGFA_T5的活性。經編碼的編輯與總插入缺失的比率示出於
圖 17A和
圖 17B的y軸上。
如
圖 17A所示,測試的PBS長度的每一個導致存在經編碼的編輯。使用長度為13、30和60個核苷酸的PBS導致經編碼的編輯比總插入缺失的比率最高。如
圖 17B所示,測試的長度為24、34、44和54個核苷酸的反轉錄模板序列導致存在經編碼的編輯。對於EMX1_T6,經編碼的編輯占使用編輯模板RNA進行的總編輯的約30%,該等編輯模板RNA具有PBS(長度為13個核苷酸)和反轉錄模板序列(長度為34或44個核苷酸)。因此,本實例表明,具有各種PBS和反轉錄模板序列長度的編輯模板RNA將經編碼的編輯引入到哺乳動物細胞中的靶序列中。
實例 5 -
U2OS
細胞中靶股的 RNA 模板化編輯
本實例描述了U2OS細胞中哺乳動物基因的靶股編輯。
在水中製備包含SEQ ID NO: 25的變體Cas12i2-RT融合物的質體的工作溶液。將每種編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備。在水中製備包含每種編輯模板RNA的質體的工作溶液。編輯模板RNA序列示出於表16中。將另外的DR-間隔子序列添加到3’末端,其中該另外的間隔子序列係非人靶向的(即,它不靶向人基因組中的任何序列)。在RT供體中編碼的所希望的編輯在表16中以小寫字母示出。
[
表 16]
. 編輯模板 RNA 序列
靶標 | 編輯模板RNA序列 |
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT(SEQ ID NO: 32) | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUGAUUCCAGCUACUaUGGGAAGUGGUUGcaguGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 136) |
EMX1_T6 GAGCCAGTGTTGCTAGTCAA(SEQ ID NO: 34) | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAAAGCUUUCCUUCUaUGAGCCAGUGUUGgaucUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 151) |
U2OS細胞由美國典型培養物保藏中心提供,並在補充有10% FBS(康寧公司(Corning))和100 U/mL青黴素-鏈黴素(HyClone™)的McCoy's-5A培養基(賽默飛世爾公司)中保持低於90%的融合度。使用TrypLE™ Express(賽默飛世爾公司)對細胞進行胰蛋白酶消化、重懸和計數。使用SF細胞系核轉染套組(龍沙公司(Lonza))按照製造商預設的DN-100程式用800 ng的Cas12i2-RT融合物質體和200 ng的每種編輯模板RNA質體的混合物對具有400,000個細胞的群體進行核轉染。然後將細胞重懸並且重新鋪板在含有預熱生長培養基的96孔板中(40,000個細胞/孔)。將核轉染的細胞培養72 h並收穫。
如實例2所述,藉由NGS對編輯進行分析。如
圖 18所示,在約5%-8%的NGS讀段中鑒定到由每個反轉錄模板序列編碼的編輯。經編碼的編輯總計大約占總插入缺失的20%(對於AAVS1_T7),以及大約占總插入缺失的10%(對於EMX1_T6)。因此,本實例和前述實例表明經編碼的編輯能夠被引入到多個細胞系的基因中。
實例 6 -
用 Cas12i2-RT 融合物對靶股進行 RNA 模板化編輯
本實例描述了使用與MMLV RT(SEQ ID NO: 29)、缺乏RNA酶H結構域的SEQ ID NO: 29的MMLV RT變體(SEQ ID NO: 224)或Marathon RT(SEQ ID NO: 232)融合的Cas12i2變體對哺乳動物基因進行靶股編輯。
將表14的Cas12i2-RT融合物序列選殖到pcDNA3.1主鏈(英傑公司)中。C-末端RT融合物在Cas12i2的N-末端包含His標籤,並且在Cas12i2的C-末端包含二分核質蛋白NLS(npNLS)。緊隨npNLS的係GS-XTEN-GS連接子。在RT的C-末端係二分SV40 NLS標籤。N-末端RT融合物在N-末端包含二分SV40 NLS標籤,並且在RT的C-末端包含GS-XTEN-GS連接子,隨後是Cas12i2。在Cas12i2的C-末端係二分核質蛋白NLS(bpNLS)。在水中製備Cas12i2-RT質體的工作溶液。
[
表 17]
.CAS-RT 融合物序列
描述 | 序列 |
在C-末端與MMLV RT融合的SEQ ID NO: 4的變體Cas12i2 | MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 219) |
在C-末端與具有RNA酶H缺失的MMLV融合的SEQ ID NO: 7的變體Cas12i2 | MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPMKRTADGSEFESPKKKRKV(SEQ ID NO: 220) |
在C-末端與Marathon RT融合的SEQ ID NO: 7的變體Cas12i2 | MKIEEGKGHHHHHHMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCMKRTADGSEFESPKKKRKV(SEQ ID NO: 221) |
在N-末端與Marathon RT融合的SEQ ID NO: 4的變體Cas12i2 | MKRTADGSEFESPKKKRKVMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELGCFVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLAPMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGEQSSDEENPDGSRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 222) |
在N-末端與Marathon RT融合的SEQ ID NO: 7的變體Cas12i2 | MKRTADGSEFESPKKKRKVMDTSNLMEQILSSDNLNRAYLQVVRNKGAEGVDGMKYTELKEHLAKNGETIKGQLRTRKYKPQPARRVEIPKPDGGVRNLGVPTVTDRFIQQAIAQVLTPIYEEQFHDHSYGFRPNRCAQQAILTALNIMNDGNDWIVDIDLEKFFDTVNHDKLMTLIGRTIKDGDVISIVRKYLVSGIMIDDEYEDSIVGTPQGGNLSPLLANIMLNELDKEMEKRGLNFVRYADDCIIMVGSEMSANRVMRNISRFIEEKLGLKVNMTKSKVDRPSGLKYLGFGFYFDPRAHQFKAKPHAKSVAKFKKRMKELTCRSWGVSNSYKVEKLNQLIRGWINYFKIGSMKTLCKELDSRIRYRLRMCIWKQWKTPQNQEKNLVKLGIDRNTARRVAYTGKRIAYVCNKGAVNVAISNKRLASFGLISMLDYYIEKCVTCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMSSAIKSYKSVLRPNERKNQLLKSTIQCLEDGSAFFFKMLQGLFGGITPEIVRFSTEQEKQQQDIALWCAVNWFRPVSQDSLTHTIASDNLVEKFEEYYGGTASDAIKQYFSASIGESYYWNDCRQQYYDLCRELGVEVSDLTHDLEILCREKCLAVATESNQNNSIISVLFGTGEKEDRSVKLRITKKILEAISNLKEIPKNVAPIQEIILNVAKATKETFRQVYAGNLGAPSTLEKFIAKDGQKEFDLKKLQTDLKKVIRGKSKERDWCCQEELRSYVEQNTIQYDLWAWGEMFNKAHTALKIKSTRNYNFAKQRLEQFKEIQSLNNLLVVKKLNDFFDSEFFSGEETYTICVHHLGGKDLSKLYKAWEDDPADPENAIVVLCDDLKNNFKKEPIRNILRYIFTIRQECSAQDILAAAKYNQQLDRYKSQKANPSVLGNQGFTWTNAVILPEKAQRNDRPNSLDLRIWLYLKLRHPDGRWKKAHIPFYDTRFFQEIYAAGNSPVDTCQFRTPRFGYHLPKLTDQTAIRVNKKHVKAAKTEARIRLAIQQGTLPVSNLKITEISATINSKGQVRIPVKFRVGRQKGTLQIGDRFCGYDQNQTASHAYSLWEVVKEGQYHKELRCRVRFISSGDIVSITENRGNQFDQLSYEGLAYPQYADWRKKASKFVSLWQITKKNKKKEIVTVEAKEKFDAICKYQPRLYKFNKEYAYLLRDIVRGKSLVELQQIRQEIFRFIEQDCGVTRLGSLSLSTLETVKAVKGIIYSYFSTALNASKNNPISDEQRKEFDPELFALLEKLELIRTRKKKQKVERIANSLIQTCLENNIKFIRGEGDLSTTNNATKKKANSRSMDWLARGVFNKIRQLATMHNITLFGCGSLYTSHQDPLVHRNPDKAMKCRWAAIPVKDIGDWVLRKLSQNLRAKNRGTGEYYHQGVKEFLSHYELQDLEEELLKWRSDRKSNIPCWVLQNRLAEKLGNKEAVVYIPVRGGRIYFATHKVATGAVSIVFDQKQVWVCNADHVAAANIALTGKGIGRQSSDEENPDGGRIKLQLTSKRPAATKKAGQAKKKK(SEQ ID NO: 223) |
靶標和相應的編輯模板RNA序列示出於表18中。RT模板的長度為40個核苷酸,而PBS的長度為13個核苷酸。經編碼的編輯係4-核苷酸取代以及單鹼基取代以去除PAM序列。用另外的同向重複序列和非靶向間隔子序列進一步對編輯模板RNA進行末端保護。將編輯模板RNA選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種編輯模板RNA質體的工作溶液。
[
表 18]
. 編輯模板 RNA 序列
靶標 | 編輯模板RNA序列 |
AAVS1_T7 GGGAAGTGGTTGGTCAGCAT (SEQ ID NO: 32) | AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCUGAUUCCAGCUAC-UAUGGGAAGUGGUUGCAGUGCAUGGAUUAUAGCCGAAGGCAGAAAUCCGUCUUUCAU-UGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 135) |
EMX1_T6 GAGCCAGTGTTGCTAGTCAA (SEQ ID NO: 34) | AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCAAA-GCUUUCCUUCUAUGAGCCAGUGUUGGAUCUCAAGGGCAG-CAUGCUGGGCCAGAAAUCCGUCUUUCAU-UGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 150) |
VEGFA_T5 TTAAACTCTCCATGGACCAG (SEQ ID NO: 38) | AGAAAUCCGUCUUUCAUUGACGGGCACAC-GACGAUGUAAUCGCAACACCAAAAGACUAC-U-UAAACUCUCCAACCUCCAGGCUCAUCCAGCUUCCCAAGAAAUCCGUCUUUCAUUGAC-GGUUAAACUCUCCAUGGACCAG(SEQ ID NO: 180) |
HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX
TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone
TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中。15-18 h後,轉染細胞。將每個Cas12i2-RT融合物質體和編輯模板RNA質體在Opti-MEM
TM培養基(賽默飛世爾公司)中稀釋,然後與在Opti-MEM
TM中稀釋的Lipofectamine
TM2000(賽默飛世爾公司)混合。將Lipofectamine
TM2000溶液逐滴添加到孔中,並將轉染的細胞培養72 h後收穫。
藉由兩輪PCR製備用於下一代定序的樣本。使用第一輪(PCR1)來擴增根據靶標的特定基因組區域。藉由柱純化對PCR1產物進行純化。進行第2輪PCR(PCR2)以添加依諾米那銜接子和索引。然後將反應物池化並且藉由柱純化進行純化。用150次循環NextSeq v2.5中等或高輸出套組進行定序運行。
圖 20A、
圖 20B和
圖 20C分別示出了表19的Cas12i2-RT融合物對AAVS1_T7、EMX1_T6和VEGFA_T5的活性。插入缺失編輯(包含在靶序列內或鄰近靶序列的插入或缺失的總NGS讀段的百分比)和精確編輯(包含由編輯模板RNA編碼的編輯的總NGS讀段的百分比)示出於y軸上。插入缺失編輯示出為白色柱,而經編碼的編輯示出為灰色柱。顯示的數據係兩個生物重複的平均值。如
圖 20A、
圖 20B和
圖 20C所示,在編輯模板RNA存在下,Cas12i2-RT融合物係活性核酸酶。此外,Cas12i2-RT融合物中的每一個將由編輯模板RNA編碼的編輯引入到靶序列中。對於用SEQ ID NO: 220的Cas12i2-RT融合物編輯的三個靶標中的每一個,大約15%的NGS讀段包含由編輯模板RNA編碼的編輯。因此,MMLV的RNA酶H結構域的缺失似乎對Cas12i2-RT融合物將插入缺失和精確編輯引入到哺乳動物基因組中的能力沒有顯著影響。此外,包含Marathon RT的Cas12i2-RT融合物能夠將經編碼的編輯引入到靶序列中(
圖 20A、
圖 20B和
圖 20C)。
因此,本實例表明使用多個RT序列和Cas12i2-RT融合物使經編碼的編輯能夠被摻入到哺乳動物基因的靶股中。
實例 7 -
使用經化學修飾的編輯模板 RNA 進行 RNA 模板化編輯
本實例描述了使用質體編碼的SEQ ID NO: 219的Cas12i2-RT融合物和包含末端硫代磷酸酯主股連接和/或2'O-甲基核苷酸的編輯模板RNA,進行哺乳動物基因VEGFA的靶股編輯。靶序列係TTAAACTCTCCATGGACCAG(SEQ ID NO: 38)。
[
表 19]
.RNA 指導物和編輯模板 RNA 序列 .
RNA 構建體 | RNA 序列 |
未經修飾的RNA指導物 | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArG(SEQ ID NO: 27) |
PS修飾的RNA指導物 | rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArC*rC*rA*rG(SEQ ID NO: 28) |
2’-O-Me修飾的RNA指導物 | mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrAmCmCmArG(SEQ ID NO: (SEQ ID NO: 31) |
PS-2’-O-Me修飾的RNA指導物 | mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrAmC*mC*mA*rG(SEQ ID NO: 33) |
未經修飾的編輯模板RNA(PBS 13 nt) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrA(SEQ ID NO: 35) |
PS修飾的編輯模板RNA(PBS 13 nt) | rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrC*rC*rC*rA(SEQ ID NO: 37) |
2’-O-Me修飾的編輯模板RNA(PBS 13 nt) | mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUmCmCmCrA(SEQ ID NO: 39) |
PS-2’-O-Me編輯模板RNA(PBS 13 nt) | mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUmC*mC*mC*rA(SEQ ID NO: 46) |
未經修飾的編輯模板RNA(PBS 30 nt) | rArGrArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrArArGrArA(SEQ ID NO: 47) |
PS修飾的編輯模板RNA(PBS 30 nt) | rA*rG*rA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrArA*rG*rA*rA(SEQ ID NO: 48) |
2’-O-Me修飾的編輯模板RNA(PBS 30 nt) | mAmGmArArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrAmAmGmArA(SEQ ID NO: 49) |
PS-2’-O-Me編輯模板RNA(PBS 30 nt) | mA*mG*mA*rArArUrCrCrGrUrCrUrUrUrCrArUrUrGrArCrGrGrUrUrArArArCrUrCrUrCrCrArUrGrGrArCrCrArGrArArArArGrArCrUrUrUrUrUrArArArCrUrCrUrCrCrArArCrCrUrCrCrArGrGrCrUrCrArUrCrCrArGrCrUrUrCrCrCrArArArCrArArArGrCrCrCrCrCrAmA*mG*mA*rA(SEQ ID NO: 50) |
將SEQ ID NO: 4的變體Cas12i2和SEQ ID NO: 219的Cas12i2-RT融合物分別選殖到pcDNA3.1主鏈(英傑公司)中。由IDT合成RNA指導物和編輯模板RNA序列。HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX
TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone
TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中的D10中。15-18 h後,藉由TransIT-X2®(米納斯生物公司(Mirus Bio))轉染細胞。然後將DNA和轉染試劑溶液逐滴添加到細胞孔中。將100 ng的Cas12i2或Cas12i2-RT質體DNA和9 pmol的合成RNA指導物(IDT)的混合物在Opti-MEM
TM培養基(賽默飛世爾公司)中稀釋,然後按照製造商的說明與在Opti-MEM
TM中稀釋的Lipofectamine
TM2000混合。將轉染的細胞培養72 h然後收穫。
如前述實例所述,藉由NGS對編輯進行分析。如
圖 21所示,檢測到VEGFA-T5靶位點處的用每種編輯模板RNA和SEQ ID NO: 219的Cas12i2-RT融合物進行的經編碼的編輯。在對照(gRNA和編輯模板RNA + Cas12i2)樣本中未檢測到經編碼的編輯。與未經修飾的編輯模板RNA相比,使用經修飾的編輯模板RNA在更高百分比的NGS讀段中檢測到經編碼的編輯。使用PS-2'-O-Me修飾導致包含經編碼的編輯的NGS讀段百分比最高。
因此,本實例表明,目的基因組位點能夠藉由化學修飾的編輯模板RNA和Cas12i2-RT融合物被編輯。
實例 8 -
使用 Cas12i4-RT 融合物進行 RNA 模板化編輯
本實例描述了使用與MMLV RT(SEQ ID NO: 29)融合的Cas12i4變體對AAVS1的靶股編輯。
將表20的Cas12i4-RT融合物序列選殖到pcDNA3.1主鏈(英傑公司)中。C-末端RT融合物在Cas12i4的N-末端包含His標籤,並且在Cas12i4的C-末端包含核質蛋白NLS。緊隨NLS的係Flex XTEN連接子。在RT的C-末端係二分SV40 NLS標籤。N-末端RT融合物在N-末端包含二分SV40 NLS標籤,並且在RT的C-末端包含Flex XTEN連接子,隨後是Cas12i4。在Cas12i4的C-末端係核質蛋白NLS。在水中製備Cas12i4-RT質體的工作溶液。
[
表 20]
變體 CAS12I4 和變體 CAS12I4-RT 融合物序列
描述 | 序列 |
變體Cas12i4 | MASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQK(SEQ ID NO: 51) |
在C-末端與MMLV RT融合的變體Cas12i4 | MKIEEGKGHHHHHHMASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQKKRPAATKKAGQAKKKKSGGSSGGSSGSETPGTSESATPESSGGSSGGSTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPMKRTADGSEFESPKKKRKV(SEQ ID NO: 52) |
在N-末端與MMLV RT融合的變體Cas12i4 | MKRTADGSEFESPKKKRKVTLNIEDEYRLHETSKEPDVSLGSTWLSDFPQAWAETGGMGLAVRQAPLIIPLKATSTPVSIKQYPMSQEARLGIKPHIQRLLDQGILVPCQSPWNTPLLPVKKPGTNDYRPVQDLREVNKRVEDIHPTVPNPYNLLSGLPPSHQWYTVLDLKDAFFCLRLHPTSQPLFAFEWRDPEMGISGQLTWTRLPQGFKNSPTLFNEALHRDLADFRIQHPDLILLQYVDDLLLAATSELDCQQGTRALLQTLGNLGYRASAKKAQICQKQVKYLGYLLKEGQRWLTEARKETVMGQPTPKTPRQLREFLGKAGFCRLFIPGFAEMAAPLYPLTKPGTLFNWGPDQQKAYQEIKQALLTAPALGLPDLTKPFELFVDEKQGYAKGVLTQKLGPWRRPVAYLSKKLDPVAAGWPPCLRMVAAIAVLTKDAGKLTMGQPLVILAPHAVEALVKQPPDRWLSNARMTHYQALLLDTDRVQFGPVVALNPATLLPLPEEGLQHNCLDILAEAHGTRPDLTDQPLPDADHTWYTDGSSLLQEGQRKAGAAVTTETEVIWAKALPAGTSAQRAELIALTQALKMAEGKKLNVYTDSRYAFATAHIHGEIYRRRGWLTSEGKEIKNKDEILALLKALFLPKRLSIIHCPGHQKGHSAEARGNRMADQAARKAAITETPDTSTLLIENSSPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMASISRPYGTKLRPDARKKEMLDKFFNTLTKGQRVFADLALCIYGSLTLEMAKSLEPESDSELVCAIGWFRLVDKTIWSKDGIKQENLVKQYEAYSGKEASEVVKTYLNSPSSDKYVWIDCRQKFLRFQRELGTRNLSEDFECMLFEQYIRLTKGEIEGYAAISNMFGNGEKEDRSKKRMYATRMKDWLEANENITWEQYREALKNQLNAKNLEQVVANYKGNAGGADPFFKYSFSKEGMVSKKEHAQQLDKFKTVLKNKARDLNFPNKEKLKQYLEAEIGIPVDANVYSQMFSNGVSEVQPKTTRNMSFSNEKLDLLTELKDLNKGDGFEYAREVLNGFFDSELHTTEDKFNITSRYLGGDKSNRLSKLYKIWKKEGVDCEEGIQQFCEAVKDKMGQIPIRNVLKYLWQFRETVSAEDFEAAAKANHLEEKISRVKAHPIVISNRYWAFGTSALVGNIMPADKRHQGEYAGQNFKMWLRAELHYDGKKAKAHLPFYNARFFEEVYCYHPSVAEITPFKTKQFGCEIGKDIPDYVSVALKDNPYKKATKRILRAIYNPVANTTRVDKTTNCSFMIKRENDEYKLVINRKISRDRPKRIEVGRTIMGYDRNQTASDTYWIGRLVPPGTRGAYRIGEWSVQYIKSGPVLSSTQGVNNSTTDQLVYNGMPSSSERFKAWKKARMAFIRKLIRQLNDEGLESKGQDYIPENPSSFDVRGETLYVFNSNYLKALVSKHRKAKKPVEGILDEIEAWTSKDKDSCSLMRLSSLSDASMQGIASLKSLINSYFNKNGCKTIEDKEKFNPVLYAKLVEVEQRRTNKRSEKVGRIAGSLEQLALLNGVEVVIGEADLGEVEKGKSKKQNSRNMDWCAKQVAQRLEYKLAFHGIGYFGVNPMYTSHQDPFEHRRVADHIVMRARFEEVNVENIAEWHVRNFSNYLRADSGTGLYYKQATMDFLKHYGLEEHAEGLENKKIKFYDFRKILEDKNLTSVIIPKRGGRIYMATNPVTSDSTPITYAGKTYNRCNADEVAAANIVISVLAPRSKKNREQDDIPLITKKAESKSPPKDRKRSKTSQLPQKKRPAATKKAGQAKKKK(SEQ ID NO: 53) |
靶標、RNA指導物和編輯模板RNA序列示出於表21中。RT模板的長度為46個核苷酸,而PBS的長度為13個核苷酸。經編碼的編輯係4-核苷酸取代以及單鹼基取代以去除PAM序列。將編輯模板RNA和RNA指導物分別選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種RNA指導物或編輯模板RNA質體的工作溶液。
[
表 21]
. 靶標和 RNA 序列 .
描述 | 序列 |
AAVS1_T7靶標 | GGGAAGTGGTTGGTCAGCAT(SEQ ID NO: 32) |
Cas12i4 RNA指導物 | AGACAUGUGUCCUCAGUGACACGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 60) |
Cas12i4編輯模板RNA | AGACAUGUGUCCUCAGUGACACGGGAAGUGGUUGGUCAGCAUUGAUUCCAGCUACUcUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGC(SEQ ID NO: 61) |
如實例6所述,轉染並收穫HEK293T細胞。如前述實例所述,進一步進行NGS。如
圖 22所示,檢測到AAVS1_T7靶位點處的用編輯模板RNA和任一Cas12i4-RT融合物進行的經編碼的編輯。在對照(gRNA和編輯模板RNA + Cas12i4)樣本中未檢測到經編碼的編輯。與MMLV跟變體Cas12i4的N-末端融合物相比,使用MMLV跟變體Cas12i4的C-末端融合物在更高百分比的NGS讀段中檢測到經編碼的編輯。
因此,本實例表明,目的基因組位點能夠藉由編輯模板RNA和Cas12i4-RT融合物被編輯。
實例 9 -
使用 Cas12i2-RT 融合物、 RNA 指導物和 RT 供體 RNA 進行 RNA 模板化編輯
本實例描述了使用Cas12i2-RT融合物、RNA指導物和RT供體RNA對哺乳動物基因進行靶股編輯。
將SEQ ID NO: 219的Cas12i2-RT融合物選殖到pcDNA3.1主鏈(英傑公司)中。在水中製備Cas12i2-RT質體的工作溶液。將表22的RNA指導物和RT供體RNA分別選殖到具有U6啟動子的質體主鏈中並進行大量製備,並在水中製備每種RNA指導物或RT供體RNA質體的工作溶液。RT供體RNA以從5’到3’的順序包含以下組分:同向重複 - 非靶向間隔子 - RT模板 - PBS - 同向重複 - 非靶向間隔子。RT模板和PBS側翼的同向重複序列和間隔子序列用作末端保護。
[
表 22]
. 靶標、 RNA 指導物和 RT 供體 RNA 序列
靶標 | RNA 指導序列 | RT 供體 RNA 序列 |
AAVS1_T7 (SEQ ID NO: 32) | AGAAAUCCGUCUUUCAUUGACGGGGGAAGUGGUUGGUCAGCAU(SEQ ID NO: 112) | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCCAGCUACUaUGGGAAGUGGUUGcagUGCAUGGAUUAUAGCCGAAGGCCCCAGCUUUGCCUUGUUAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 62) |
EMX1_T6(SEQ ID NO: 34) | AGAAAUCCGUCUUUCAUUGACGGGAGCCAGUGUUGCUAGUCAA(SEQ ID NO: 114) | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCUUCCUUCUaUGAGCCAGUGUUGgaUcUCAAGGGCAGCAUGCUGGGCCCGUCCCACUACAGGCCAAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 63) |
VEGFA_T2(SEQ ID NO: 36) | AGAAAUCCGUCUUUCAUUGACGGAAUCCUCCACCAGUCAUGGU(SEQ ID NO: 116) | AGAAAUCCGUCUUUCAUUGACGGGCACACGACGAUGUAAUCGCAGAUACCUaUAAUCCUCCACCAcagUUGGUGACAACCCCAAGCAGCCCACACAUUcUCAAGUGCAGAAAUCCGUCUUUCAUUGACGGGACGCUACUAUAGCUGCAC(SEQ ID NO: 64) |
HEK293T細胞由美國典型培養物保藏中心提供,並在以下D10培養基中保持低於90%的融合度:DMEM(賽默飛世爾公司)加GlutaMAX
TM(賽默飛世爾公司)和丙酮酸鹽(賽默飛世爾公司),補充有10% FBS(康寧公司)和100 U/mL青黴素-鏈黴素(HyClone
TM)。在轉導之前,將HEK293T細胞以25,000個細胞/孔鋪板在經組織培養物處理的96孔板中。15-18 h後,轉染細胞。將每個Cas12i2-RT融合物質體、RNA指導物質體和RT供體RNA質體在Opti-MEM
TM培養基(賽默飛世爾公司)中稀釋,然後與在Opti-MEM
TM中稀釋的Lipofectamine
TM2000(賽默飛世爾公司)混合。將Lipofectamine
TM2000溶液逐滴添加到孔中,並將轉染的細胞培養72 h後收穫。
如前述實例所述,進一步進行NGS。如
圖 23所示,在用Cas12i2-RT融合物、各自的RNA指導物和各自的RT供體RNA轉染後,檢測到每個靶位點處的經編碼的編輯。在對照(Cas12i2)樣本中未檢測到經編碼的編輯。因此,本實例表明,目的基因組位點能夠藉由Cas12i2-RT融合物和兩種RNA組分(RNA指導物和RT供體RNA)被編輯。不需要使RNA指導物與RT供體RNA融合以將經編碼的編輯摻入到目的基因組位點。
無
申請檔含有至少一幅彩色附圖。
[
圖 1A- 圖 1B]包括顯示本文揭露的示例性基因編輯系統之示意圖。
圖 1A係顯示基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含反轉錄模板序列和PBS。PBS包含與靶核酸的PAM股(也稱為非靶股)的基本互補性。
圖 1B示出了與反轉錄酶融合的Cas9切口酶(左)和與反轉錄酶融合的Cas12i切口酶(右)。使用與RNA指導物的3’末端融合的RT供體RNA,將編輯摻入到靶核酸的PAM股中。
[
圖 2]係顯示示例性基因編輯系統的示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的5’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS和反轉錄模板序列。PBS包含與靶核酸的PAM股的互補性。
[
圖 3]係顯示CRISPR核酸酶(例如,Cas12i多肽)、反轉錄酶多肽、RNA指導物和RT供體RNA之示意圖。RT供體RNA包含反轉錄模板序列和PBS。藉由CRISPR核酸酶切割後,編輯被摻入到基因組中。
[
圖 4]係顯示CRISPR核酸酶(例如,Cas12i多肽)、反轉錄酶多肽、RNA指導物和RNA反轉錄模板序列之示意圖。RT供體RNA包含PBS和反轉錄模板序列。在CRISPR核酸酶存在的情況下,編輯被摻入到基因組中。
[
圖 5]係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和含有與靶核酸錯配的、在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS。PBS包含與靶核酸的非PAM股(也稱為靶股或TS)的互補性。
[
圖 6A- 圖 6B]包括顯示本文揭露的示例性基因編輯系統之示意圖。
圖 6A係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的3’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含反轉錄模板序列和PBS。當RNA指導物的間隔子序列和PBS與靶核酸結合時,反轉錄模板序列形成未配對核苷酸的環。PBS包含與靶核酸的非PAM股的互補性。PAM股和非PAM股中的變體Cas12i2切割位點由三角形表示。使用與RNA指導物的3’末端融合的RT供體RNA,將編輯摻入到靶核酸的非PAM股中。
圖 6B示出了編輯、反轉錄模板序列和PBS的定位,其中該反轉錄模板序列和PBS的長度可以變化。
[
圖 7]係顯示示例性基因編輯系統之示意圖,該基因編輯系統包含與反轉錄酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA指導物的5’末端與RT供體RNA融合的RNA指導物。RT供體RNA包含PBS和反轉錄模板序列。PBS包含與靶核酸的非PAM股的互補性。
[
圖 8A- 圖 8C]包括顯示示例性Cas12i2 RNA指導物-RT供體RNA融合物之示意圖。
圖 8A係與RT供體RNA融合的變體Cas12i2 RNA指導物之示意圖,在實例1中對其進行了測試。RNA指導物的間隔子結合至與5’-TTT-3’PAM相鄰的非PAM股。RT供體RNA包含反轉錄模板序列和PBS。當間隔子序列和PBS與靶核酸結合時,反轉錄模板序列形成未配對核苷酸的環。PBS包含與靶核酸的非PAM股的互補性。在此示意圖中,PBS的長度為13個核苷酸,反轉錄模板序列的長度為34個核苷酸。設計PBS使得與非PAM股的互補性始於切割位點(三角形)。
圖 8B示出了靶向AAVS1_T7基因組位點的示例性RNA指導物-RT供體RNA融合物,如實例1中所測試的。測試了各種PBS長度(13、30和60個核苷酸)。設計RNA指導物-RT供體RNA融合物以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入靶序列。
圖 8C示出了引入到AAVS1_T7基因組位點(上圖)、EMX1_T6基因組位點(中圖)和VEGFA_T5基因組位點(下圖)中的經編碼的編輯(取代、插入和缺失),如實例1中所述。
圖 8A中的序列從上到下係SEQ ID NO: 65-67。
圖 8B中的序列從上到下係SEQ ID NO: 74-80和87-89。
[
圖 9A- 圖 9J]包括顯示由本文揭露的示例性基因編輯系統產生的基因編輯效率之圖。
圖 9A示出了就由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向AAVS1_T6基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導的插入缺失和經編碼的編輯方面而言,分析的具有編輯的序列數目與所分析的序列總數目之比率。
圖 9B示出了就由SEQ ID NO: 26和SEQ ID NO: 25以及靶向AAVS1_T6基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導的插入缺失和編輯方面而言,分析的具有經編碼的編輯的序列數目與所分析的序列總數目之比率。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入AAVS1_T6基因組位點中。
圖 9C示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向AAVS1_T7基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。
圖 9D示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向AAVS1_T7基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入AAVS1_T7基因組位點中。
圖 9E示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向EMX1_T6基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。
圖 9F示出了分析的具有插入缺失和編輯的序列之百分比,該等插入缺失和編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向EMX1_T6基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入EMX1_T6基因組位點中。
圖 9G示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向VEGFA_T2基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。
圖 9H示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向VEGFA_T2基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入VEGFA_T2基因組位點中。
圖 9I示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 4的變體Cas12i2以及SEQ ID NO: 25和SEQ ID NO: 26與靶向VEGFA_T5基因組位點的RNA指導物的C-末端和N-末端Cas12i2-MMLV RT融合物誘導。
圖 9J示出了分析的具有插入缺失和經編碼的編輯的序列之百分比,該等插入缺失和經編碼的編輯由SEQ ID NO: 26和SEQ ID NO: 25以及靶向VEGFA_T5基因組位點的RNA指導物-RT供體RNA融合物的N-末端和C-末端Cas12i2-MMLV RT融合物誘導。RNA指導物-RT供體RNA融合物具有長度為13、30或60個核苷酸的PBS,並且被設計以將取代(S)、插入(I)、缺失(D)或髮夾(H)引入VEGFA_T5基因組位點中。
[
圖 10]係顯示與反轉錄酶融合的Cas12i多肽(例如,Cas12i2切口酶)之示意圖。使用與RNA指導物的5’末端或3’末端融合的RT供體RNA,將經編碼的編輯摻入到靶核酸的PAM股中。可以保護RNA指導物-RT供體RNA的末端以防止核酸外切酶或核酸內切酶活性。PBS長度可以在約3-100個核苷酸之間變化並且包含與PAM股的基本互補性。可以在間隔子和反轉錄模板序列之間引入結構化RNA,例如髮夾。
[
圖 11]係顯示進一步與第二同向重複(DR)-間隔子序列融合的RNA指導物-RT供體RNA之示意圖。另外的DR-間隔子抑制核酸外切酶活性。
[
圖 12A- 圖 12B]包括顯示編輯模板RNA(基因編輯RNA)的示例性設計之示意圖。
圖 12A係描繪進一步包含3’末端保護的編輯模板RNA(5’-核酸酶結合序列-DNA結合序列-反轉錄模板-PBS-3’)之示意圖。3’末端保護可為化學末端保護(圖的頂部)或髮夾(圖的底部)。髮夾可為核酸酶結合序列,例如同向重複序列。
圖 12B係描繪具有和不具有5’末端保護的編輯模板RNA(5’-反轉錄模板-PBS核酸酶結合序列-DNA結合序列-3’)之示意圖。5’末端保護可為髮夾(例如,核酸酶結合序列,如同向重複序列),如圖底部所示。
[
圖 13A- 圖 13D]包括顯示由本文揭露的示例性基因編輯系統產生的基因編輯效率之圖。
圖 13A示出了具有SEQ ID NO: 112的RNA指導物或SEQ ID NO: 123-137的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在AAVS1_T7基因組位點(SEQ ID NO: 30)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。
圖 13B示出了具有SEQ ID NO: 114的RNA指導物或SEQ ID NO: 138-152的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在EMX1_T6基因組位點(SEQ ID NO: 34)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。
圖 13C示出了具有SEQ ID NO: 116的RNA指導物或SEQ ID NO: 153-167的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在VEGFA_T2(SEQ ID NO: 36)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。
圖 13D示出了具有SEQ ID NO: 118的RNA指導物或SEQ ID NO: 168-182的編輯模板RNA的Cas12i2(SEQ ID NO: 4)和Cas12i2-RT(SEQ ID NO: 25)在VEGFA_T5基因組位點(SEQ ID NO: 38)處的活性。白色柱(對於Cas12i2)和灰色柱(對於Cas12i2-RT)示出了分析為具有插入缺失的讀段%。網格柱(對於Cas12i2)和黑色柱(對於Cas12i2-RT)中示出了分析為具有經編碼的編輯的讀段%。
[
圖 14A- 圖 14C]包括描繪用於鑒定具有RNA指導物或編輯模板RNA的Cas12i2的切割模式的測定步驟之示意圖。
圖 14A示出了包含靶序列和條碼的寡核苷酸構造。
圖 14B示出了對切割產物的處理以平端化5’和3’突出端或末端修復以填充5’突出端。
圖 14C示出了切割產物的擴增。
[
圖 15A- 圖 15E]包括顯示使用本文揭露的示例性基因編輯系統進行基因編輯之圖。
圖 15A係描繪在AAVS1_T2基因組位點的PAM股和非PAM股上由SEQ ID NO: 2的Cas12i2誘導的體外切割位點(三角形)之示意圖。
圖 15B係在填充處理後從5’切割產物的擴增獲得的讀段長度之長條圖。
圖 15C係在填充處理後從3’切割產物的擴增獲得的讀段長度之長條圖。
圖 15D係在平端化處理後從5’切割產物的擴增獲得的讀段長度之長條圖。
圖 15E係在平端化處理後從3’切割產物的擴增獲得的讀段長度之長條圖。將每個讀段長度長條圖映射到靶序列,如
圖 15B- 圖 15E的x軸所示。
[
圖 16A- 圖 16B]示出了在EMX1_T6基因組位點(
圖 16A)和VEGFA_T5基因組位點(
圖 16B)的PAM股或非PAM股上由SEQ ID NO: 2的Cas12i2或SEQ ID NO: 4的變體Cas12i2誘導的體外切割位點(三角形)。比例尺(右)代表如藉由定序讀段的數量測量的切割頻率。
[
圖 17A- 圖 17B]包括顯示示例性基因組大小的基因編輯結果之圖。
圖 17A示出了藉由編輯模板RNA將4-核苷酸插入引入到AAVS1_T7基因組位點(SEQ ID NO: 30)、EMX1_T6基因組位點(SEQ ID NO: 34)或VEGFA_T5基因組位點(SEQ ID NO: 38)的活性。編輯模板RNA包含34-核苷酸反轉錄模板序列和3、8、13、30或60-核苷酸PBS。經編碼的編輯與總編輯的比率顯示在y軸上。
圖 17B示出了藉由編輯模板RNA將4-核苷酸插入引入到AAVS1_T7基因組位點(SEQ ID NO: 30)、EMX1_T6基因組位點(SEQ ID NO: 34)或VEGFA_T5基因組位點(SEQ ID NO: 38)的活性。編輯模板RNA包含13-核苷酸PBS和14、24、34、44或54-核苷酸反轉錄模板序列。經編碼的編輯與總編輯的比率顯示在y軸上。
圖 17A中的序列從上到下係SEQ ID NO: 90-92。
圖 17B中的序列從上到下係SEQ ID NO: 90-92。
[
圖 18]示出了摻入到U2OS細胞中的AAVS1_T7基因組位點(SEQ ID NO: 32)和EMX1_T6基因組位點(SEQ ID NO: 34)的經編碼的編輯。
[
圖 19A- 圖 19B]包括說明使用本文揭露的示例性基因編輯系統的基因編輯程序之示意圖。
圖 19A係描繪包含與反轉錄酶和pegRNA融合的Cas9的Cas9先導編輯器之示意圖。在Cas9切割PAM股後,生成在靶DNA上的引物。引物與pegRNA的雜交啟動反轉錄。
圖 19B係描繪與反轉錄酶和編輯模板RNA融合的V型CRISPR核酸酶之示意圖。在V型CRISPR核酸酶切割非PAM股後,生成在靶DNA上的引物。引物與編輯模板RNA的雜交啟動反轉錄。
[
圖 20A- 圖 20C]包括顯示在多個基因組位點處用所指示的Cas12i2-RT融合多肽進行的編輯之圖。
圖 20A係顯示在AAVS1基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
圖 20B係顯示在EMX1基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
圖 20C係顯示在VEGFA基因組位點處包含由SEQ ID NO: 219-223的變體Cas12i2-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
[
圖 21]係顯示包含由變體Cas12i2(SEQ ID NO: 4)或變體Cas12i2-RT融合物(SEQ ID NO: 219)和RNA指導物或編輯模板引入的插入缺失編輯或經編碼的編輯的NGS讀段%之圖。RNA指導物和編輯模板RNA未經修飾,或包含末端硫代磷酸酯主鏈連接和/或2'O-甲基核苷酸。
[
圖 22]係顯示在AAVS1基因組位點處包含由變體Cas12i4-RT融合物引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
[
圖 23]係顯示在AAVS1、EMX1或VEGFA基因組位點處包含由變體Cas12i2或變體Cas12i2-RT融合物、RNA指導物和RT供體RNA引入的插入缺失編輯(白色柱)或經編碼的編輯(灰色柱)的NGS讀段%之圖。
無
序列表 <![CDATA[<110> 美商喬木生物技術公司(Arbor Biotechnologies)]]> <![CDATA[<120> 包含CRISPR核酸酶的組合物及其用途]]> <![CDATA[<140> 111120437]]> <![CDATA[<141> 2022-06-01]]> <![CDATA[<150> US 63/299,695]]> <![CDATA[<151> 2022-01-14]]> <![CDATA[<150> US 63/272,937]]> <![CDATA[<151> 2021-10-28]]> <![CDATA[<150> US 63/236,047]]> <![CDATA[<151> 2021-08-23]]> <![CDATA[<150> US 63/195,621]]> <![CDATA[<151> 2021-06-01]]> <![CDATA[<160> 247 ]]> <![CDATA[<170> PatentIn 3.5版]]> <![CDATA[<210> 1]]> <![CDATA[<211> 3162]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 1]]> atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60 ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120 caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180 cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240 agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300 ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360 tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420 gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480 agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540 agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600 ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660 accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720 gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780 attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840 gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900 accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960 ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020 gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080 aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140 attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200 ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260 aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320 aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380 cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440 cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500 gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560 ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620 accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680 atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740 gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800 aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860 aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920 aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980 gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040 aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100 ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160 aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220 tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280 aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340 agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400 ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460 acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520 aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580 aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640 tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700 tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760 ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820 agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880 agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940 gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000 accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060 gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120 gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162 <![CDATA[<210> 2]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 2]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 3]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 3]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 4]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 4]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 5]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 5]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 6]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 6]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 7]]> <![CDATA[<211> 1054]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 7]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg 610 615 620 Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser <![CDATA[<210> 8]]> <![CDATA[<211> 1093]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 8]]> Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr 1 5 10 15 Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn 20 25 30 Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp 35 40 45 Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala 50 55 60 Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe 65 70 75 80 Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn 85 90 95 Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln 100 105 110 Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp 115 120 125 Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu 130 135 140 Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys 145 150 155 160 Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met 165 170 175 Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr 180 185 190 Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val 195 200 205 Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr 210 215 220 Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile 225 230 235 240 Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu 245 250 255 Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg 260 265 270 Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe 275 280 285 Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met 290 295 300 Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys 305 310 315 320 Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu 325 330 335 Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr 340 345 350 Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile 355 360 365 Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His 370 375 380 Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu 385 390 395 400 Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr 405 410 415 Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu 420 425 430 Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile 435 440 445 Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln 450 455 460 Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn 465 470 475 480 Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys 485 490 495 His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile 500 505 510 Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His 515 520 525 Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala 530 535 540 Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys 545 550 555 560 Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu 565 570 575 Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln 580 585 590 Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr 595 600 605 Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe 610 615 620 Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr 625 630 635 640 Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr 645 650 655 Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn 660 665 670 Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser 675 680 685 Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys 690 695 700 Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu 705 710 715 720 Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln 725 730 735 Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser 740 745 750 Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile 755 760 765 Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu 770 775 780 Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser 785 790 795 800 Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr 805 810 815 Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val 820 825 830 Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu 835 840 845 Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val 850 855 860 Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu 865 870 875 880 Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile 885 890 895 Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu 900 905 910 Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val 915 920 925 Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr 930 935 940 Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg 945 950 955 960 Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg 965 970 975 Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr 980 985 990 Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly 995 1000 1005 Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys 1010 1015 1020 Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu 1025 1030 1035 Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys 1040 1045 1050 Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe 1055 1060 1065 Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu 1070 1075 1080 Val Asp Ile Gln Lys Asp Phe Lys Lys Lys 1085 1090 <![CDATA[<210> 9]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 9]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 10]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> ]]>合成的 <![CDATA[<400> 10]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 11]]> <![CDATA[<211> 1098]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 11]]> Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu 1 5 10 15 Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu 20 25 30 Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly 35 40 45 Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro 50 55 60 His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val 65 70 75 80 Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser 85 90 95 Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser 100 105 110 His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg 115 120 125 Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln 130 135 140 Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu 145 150 155 160 Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu 165 170 175 Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu 180 185 190 Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe 195 200 205 Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala 210 215 220 Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly 225 230 235 240 Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp 245 250 255 Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln 260 265 270 Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp 275 280 285 Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr 290 295 300 Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser 305 310 315 320 Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln 325 330 335 Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys 340 345 350 Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn 355 360 365 Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu 370 375 380 Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn 385 390 395 400 Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly 405 410 415 Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr 420 425 430 Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn 435 440 445 Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His 450 455 460 Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys 465 470 475 480 Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile 485 490 495 Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro 500 505 510 Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met 515 520 525 His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala 530 535 540 Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys 545 550 555 560 Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln 565 570 575 Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu 580 585 590 Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr 595 600 605 Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu 610 615 620 Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile 625 630 635 640 Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu 645 650 655 Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln 660 665 670 Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val 675 680 685 Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser 690 695 700 Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His 705 710 715 720 Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe 725 730 735 Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln 740 745 750 Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg 755 760 765 Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln 770 775 780 Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met 785 790 795 800 Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe 805 810 815 Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu 820 825 830 Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu 835 840 845 Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala 850 855 860 Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile 865 870 875 880 Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys 885 890 895 Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys 900 905 910 Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro 915 920 925 Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser 930 935 940 Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp 945 950 955 960 Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys 965 970 975 Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met 980 985 990 Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val 995 1000 1005 Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile 1010 1015 1020 Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu 1025 1030 1035 Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp 1040 1045 1050 Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe 1055 1060 1065 Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu 1070 1075 1080 Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met 1085 1090 1095 <![CDATA[<210> 12]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 12]]> guuggaauga cuaauuuuug ugcccaccgu uggcac 36 <![CDATA[<210> 13]]> <![CDATA[<211> 24]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 13]]> aauuuuugug cccaucguug gcac 24 <![CDATA[<210> 14]]> <![CDATA[<211> 23]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 14]]> auuuuugugc ccaucguugg cac 23 <![CDATA[<210> 15]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 15]]> guugcaaaac ccaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 16]]> <![CDATA[<211> 34]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 16]]> gcaacaccua agaaauccgu cuuucauuga cggg 34 <![CDATA[<210> 17]]> <![CDATA[<211> 23]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 17]]> agaaauccgu cuuucauuga cgg 23 <![CDATA[<210> 18]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 18]]> cuagcaauga ccuaauagug uguccuuagu ugacau 36 <![CDATA[<210> 19]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 19]]> ccuacaauac cuaagaaauc cguccuaagu ugacgg 36 <![CDATA[<210> 20]]> <![CDATA[<211> 22]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 20]]> auaguguguc cuuaguugac au 22 <![CDATA[<210> 21]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 21]]> guuggaauga cuaauuuuug ugcccaccgu uggcac 36 <![CDATA[<210> 22]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 22]]> cccacaauac cugagaaauc cguccuacgu ugacgg 36 <![CDATA[<210> 23]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 23]]> ucucaacgau agucagacau guguccucag ugacac 36 <![CDATA[<210> 24]]> <![CDATA[<211> 22]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 24]]> agacaugugu ccucagugac ac 22 <![CDATA[<210> 25]]> <![CDATA[<211> 1798]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 25]]> Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu 1 5 10 15 Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly 20 25 30 Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr 35 40 45 Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp 50 55 60 Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp 65 70 75 80 Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu 85 90 95 Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser 100 105 110 Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr 115 120 125 Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His 130 135 140 Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu 145 150 155 160 Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu 165 170 175 Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu 180 185 190 Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln 195 200 205 Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln 210 215 220 Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile 225 230 235 240 Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp 245 250 255 Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys 260 265 270 Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp 275 280 285 Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys 290 295 300 Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln 305 310 315 320 Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu 325 330 335 Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr 340 345 350 Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys 355 360 365 Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu 370 375 380 Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 385 390 395 400 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile 405 410 415 Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln 420 425 430 Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn 435 440 445 Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser 450 455 460 Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly 465 470 475 480 Arg Trp Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln 485 490 495 Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg 500 505 510 Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala 515 520 525 Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg 530 535 540 Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 545 550 555 560 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile 565 570 575 Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly 580 585 590 Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr 595 600 605 Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly 610 615 620 Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 625 630 635 640 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr 645 650 655 Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu 660 665 670 Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu 675 680 685 Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr 690 695 700 Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly 705 710 715 720 Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe 725 730 735 Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser 740 745 750 Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe 755 760 765 Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln 770 775 780 Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 785 790 795 800 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn 805 810 815 Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly 820 825 830 Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn 835 840 845 Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg 850 855 860 Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 865 870 875 880 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala 885 890 895 Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp 900 905 910 Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr 915 920 925 Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu 930 935 940 Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys 945 950 955 960 Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu 965 970 975 Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile 980 985 990 Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe 995 1000 1005 Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala 1010 1015 1020 Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser 1025 1030 1035 Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr 1040 1045 1050 Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1055 1060 1065 Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr 1070 1075 1080 Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser 1085 1090 1095 Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His 1100 1105 1110 Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu 1115 1120 1125 Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu 1130 1135 1140 Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser 1145 1150 1155 Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg 1160 1165 1170 Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile 1175 1180 1185 Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val 1190 1195 1200 Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg 1205 1210 1215 Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn 1220 1225 1230 Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr 1235 1240 1245 Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His 1250 1255 1260 Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu 1265 1270 1275 Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 1280 1285 1290 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp 1295 1300 1305 Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 1310 1315 1320 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys 1325 1330 1335 Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly 1340 1345 1350 Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val 1355 1360 1365 Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr 1370 1375 1380 Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr 1385 1390 1395 Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg 1400 1405 1410 Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro 1415 1420 1425 Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln 1430 1435 1440 Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala 1445 1450 1455 Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp 1460 1465 1470 Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly 1475 1480 1485 Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro 1490 1495 1500 Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile 1505 1510 1515 Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 1520 1525 1530 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln 1535 1540 1545 Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 1550 1555 1560 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val 1565 1570 1575 Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu 1580 1585 1590 Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg 1595 1600 1605 Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp 1610 1615 1620 Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala 1625 1630 1635 Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala 1640 1645 1650 Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu 1655 1660 1665 Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr 1670 1675 1680 Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu 1685 1690 1695 Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile 1700 1705 1710 Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu 1715 1720 1725 Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly 1730 1735 1740 His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala 1745 1750 1755 Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 1760 1765 1770 Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu 1775 1780 1785 Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1790 1795 <![CDATA[<210> 26]]> <![CDATA[<211> 1798]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 26]]> Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 20 25 30 Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 35 40 45 Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 50 55 60 Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 65 70 75 80 Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 85 90 95 Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 100 105 110 Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 115 120 125 Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 130 135 140 His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 145 150 155 160 Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 165 170 175 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 180 185 190 Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 195 200 205 Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 210 215 220 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 225 230 235 240 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 245 250 255 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 260 265 270 Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 275 280 285 Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 290 295 300 Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 305 310 315 320 Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 325 330 335 Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 340 345 350 Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 355 360 365 Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 370 375 380 Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 385 390 395 400 Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 405 410 415 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 420 425 430 Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 435 440 445 Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 450 455 460 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 465 470 475 480 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 485 490 495 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 500 505 510 Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 515 520 525 Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 530 535 540 Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 545 550 555 560 Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 565 570 575 Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 580 585 590 Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 595 600 605 Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 610 615 620 Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 625 630 635 640 Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 645 650 655 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 660 665 670 Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 675 680 685 Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 690 695 700 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 705 710 715 720 Ser Gly Gly Ser Ser Gly Gly Ser Met Ser Ser Ala Ile Lys Ser Tyr 725 730 735 Lys Ser Val Leu Arg Pro Asn Glu Arg Lys Asn Gln Leu Leu Lys Ser 740 745 750 Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala Phe Phe Phe Lys Met Leu 755 760 765 Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu Ile Val Arg Phe Ser Thr 770 775 780 Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala Leu Trp Cys Ala Val Asn 785 790 795 800 Trp Phe Arg Pro Val Ser Gln Asp Ser Leu Thr His Thr Ile Ala Ser 805 810 815 Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr Tyr Gly Gly Thr Ala Ser 820 825 830 Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser Ile Gly Glu Ser Tyr Tyr 835 840 845 Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp Leu Cys Arg Glu Leu Gly 850 855 860 Val Glu Val Ser Asp Leu Thr His Asp Leu Glu Ile Leu Cys Arg Glu 865 870 875 880 Lys Cys Leu Ala Val Ala Thr Glu Ser Asn Gln Asn Asn Ser Ile Ile 885 890 895 Ser Val Leu Phe Gly Thr Gly Glu Lys Glu Asp Arg Ser Val Lys Leu 900 905 910 Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile Ser Asn Leu Lys Glu Ile 915 920 925 Pro Lys Asn Val Ala Pro Ile Gln Glu Ile Ile Leu Asn Val Ala Lys 930 935 940 Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr Ala Gly Asn Leu Gly Ala 945 950 955 960 Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys Asp Gly Gln Lys Glu Phe 965 970 975 Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys Lys Val Ile Arg Gly Lys 980 985 990 Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu Glu Leu Arg Ser Tyr Val 995 1000 1005 Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp Ala Trp Gly Glu Met 1010 1015 1020 Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys Ser Thr Arg Asn 1025 1030 1035 Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys Glu Ile Gln 1040 1045 1050 Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp Phe Phe 1055 1060 1065 Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys Val 1070 1075 1080 His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 1085 1090 1095 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys 1100 1105 1110 Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile 1115 1120 1125 Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp 1130 1135 1140 Ile Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys 1145 1150 1155 Ser Gln Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr 1160 1165 1170 Trp Thr Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp 1175 1180 1185 Arg Pro Asn Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu 1190 1195 1200 Arg His Pro Asp Gly Arg Trp Lys Lys Ala His Ile Pro Phe Tyr 1205 1210 1215 Asp Thr Arg Phe Phe Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro 1220 1225 1230 Val Asp Thr Cys Gln Phe Arg Thr Pro Arg Phe Gly Tyr His Leu 1235 1240 1245 Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg Val Asn Lys Lys His 1250 1255 1260 Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg Leu Ala Ile Gln 1265 1270 1275 Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr Glu Ile Ser 1280 1285 1290 Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val Lys Phe 1295 1300 1305 Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg Phe 1310 1315 1320 Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 1325 1330 1335 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys 1340 1345 1350 Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu 1355 1360 1365 Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala 1370 1375 1380 Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val 1385 1390 1395 Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val 1400 1405 1410 Thr Val Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln 1415 1420 1425 Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg 1430 1435 1440 Asp Ile Val Arg Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg 1445 1450 1455 Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp Cys Gly Val Thr Arg 1460 1465 1470 Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu Thr Val Lys Ala Val 1475 1480 1485 Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr Ala Leu Asn Ala Ser 1490 1495 1500 Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp Pro 1505 1510 1515 Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile Arg Thr Arg 1520 1525 1530 Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu Ile Gln 1535 1540 1545 Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly Asp 1550 1555 1560 Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 1565 1570 1575 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln 1580 1585 1590 Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu 1595 1600 1605 Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys 1610 1615 1620 Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly 1625 1630 1635 Asp Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn 1640 1645 1650 Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu 1655 1660 1665 Ser His Tyr Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp 1670 1675 1680 Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn 1685 1690 1695 Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu Ala Val Val Tyr Ile 1700 1705 1710 Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala Thr His Lys Val Ala 1715 1720 1725 Thr Gly Ala Val Ser Ile Val Phe Asp Gln Lys Gln Val Trp Val 1730 1735 1740 Cys Asn Ala Asp His Val Ala Ala Ala Asn Ile Ala Leu Thr Gly 1745 1750 1755 Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu Glu Asn Pro Asp Gly 1760 1765 1770 Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys Arg Pro Ala Ala Thr 1775 1780 1785 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1790 1795 <![CDATA[<210> 27]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 27]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <![CDATA[<210> 28]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (40)..(43)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 28]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <![CDATA[<210> 29]]> <![CDATA[<211> 678]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 29]]> Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys 485 490 495 Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp 500 505 510 Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser 515 520 525 Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu 530 535 540 Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln 545 550 555 560 Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly 565 570 575 Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala 580 585 590 His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 595 600 605 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala 610 615 620 Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln 625 630 635 640 Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala 645 650 655 Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu 660 665 670 Ile Glu Asn Ser Ser Pro 675 <![CDATA[<210> 30]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 30]]> gtagcctctc ccgctctggt 20 <![CDATA[<210> 31]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (40)..(42)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<400> 31]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <![CDATA[<210> 32]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 32]]> gggaagtggt tggtcagcat 20 <![CDATA[<210> 33]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (40)..(42)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (40)..(43)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 33]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <![CDATA[<210> 34]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 34]]> gagccagtgt tgctagtcaa 20 <![CDATA[<210> 35]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 35]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 36]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 36]]> aatcctccac cagtcatggt 20 <![CDATA[<210> 37]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (87)..(90)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 37]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 38]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> ]]> 人工序列 <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 38]]> ttaaactctc catggaccag 20 <![CDATA[<210> 39]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (87)..(89)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<400> 39]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 40]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 40]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugauuua ggcucccucu 120 gucuggauca guccucc 137 <![CDATA[<210> 41]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 41]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugau 107 <![CDATA[<210> 42]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 42]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugcacccc cauaaggggg 60 gacauucuuu guagccucuc cccgaguggu ucagggccca gcuaggg 107 <![CDATA[<210> 43]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 43]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cuccccgagu gguucagggc ccagcuaggg 90 <![CDATA[<210> 44]]> <![CDATA[<211> 94]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 44]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cucccagcgg cucugguuca gggcccagcu aggg 94 <![CDATA[<210> 45]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 45]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60 cucccugguu cagggcccag cuaggg 86 <![CDATA[<210> 46]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (87)..(89)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (87)..(90)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 46]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 47]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 47]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 48]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫]]>代磷酸酯修飾的 <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (104)..(107)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 48]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 49]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (104)..(106)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<400> 49]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 50]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(4)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (1)..(3)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (104)..(106)]]> <![CDATA[<223> 用2'-O-甲基化修飾的]]> <![CDATA[<220>]]> <![CDATA[<221> 尚未歸類的特徵]]> <![CDATA[<222> (104)..(107)]]> <![CDATA[<223> 用硫代磷酸酯修飾的]]> <![CDATA[<400> 50]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 51]]> <![CDATA[<211> 1074]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 51]]> Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala 1 5 10 15 Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly 20 25 30 Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr 35 40 45 Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val 50 55 60 Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys 65 70 75 80 Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser 85 90 95 Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser 100 105 110 Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe 115 120 125 Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met 130 135 140 Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr 145 150 155 160 Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser 165 170 175 Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn 180 185 190 Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu 195 200 205 Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala 210 215 220 Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met 225 230 235 240 Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val 245 250 255 Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu 260 265 270 Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val 275 280 285 Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr 290 295 300 Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu 305 310 315 320 Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val 325 330 335 Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe 340 345 350 Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser 355 360 365 Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly 370 375 380 Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 385 390 395 400 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser 405 410 415 Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys 420 425 430 Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp 435 440 445 Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys 450 455 460 Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg 465 470 475 480 Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe 485 490 495 Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val 500 505 510 Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly 515 520 525 Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr 530 535 540 Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala 545 550 555 560 Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys 565 570 575 Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg 580 585 590 Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp 595 600 605 Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro 610 615 620 Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 625 630 635 640 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser 645 650 655 Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg 660 665 670 Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile 675 680 685 Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile 690 695 700 Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val 705 710 715 720 Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala 725 730 735 Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser 740 745 750 Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp 755 760 765 Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr 770 775 780 Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn 785 790 795 800 Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn 805 810 815 Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu 820 825 830 Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly 835 840 845 Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp 850 855 860 Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 865 870 875 880 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln 885 890 895 Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala 900 905 910 Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg 915 920 925 Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr 930 935 940 Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His 945 950 955 960 Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys 965 970 975 Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly 980 985 990 Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro 995 1000 1005 Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu 1010 1015 1020 Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser 1025 1030 1035 Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys 1040 1045 1050 Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr 1055 1060 1065 Ser Gln Leu Pro Gln Lys 1070 <![CDATA[<210> 52]]> <![CDATA[<211> 1832]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 52]]> Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ala 1 5 10 15 Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys 20 25 30 Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg 35 40 45 Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu 50 55 60 Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val Cys Ala 65 70 75 80 Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys Asp Gly 85 90 95 Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys 100 105 110 Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp 115 120 125 Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg 130 135 140 Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met Leu Phe 145 150 155 160 Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala 165 170 175 Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys 180 185 190 Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn Glu Asn 195 200 205 Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala 210 215 220 Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly 225 230 235 240 Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met Val Ser 245 250 255 Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val Leu Lys 260 265 270 Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln 275 280 285 Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val Tyr Ser 290 295 300 Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg 305 310 315 320 Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys 325 330 335 Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn 340 345 350 Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile 355 360 365 Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu 370 375 380 Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile Gln 385 390 395 400 Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro Ile Arg 405 410 415 Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser Ala Glu 420 425 430 Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys Ile Ser 435 440 445 Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp Ala Phe 450 455 460 Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys Arg His 465 470 475 480 Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg Ala Glu 485 490 495 Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe Tyr Asn 500 505 510 Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val Ala Glu 515 520 525 Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp 530 535 540 Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys 545 550 555 560 Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr 565 570 575 Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu 580 585 590 Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg 595 600 605 Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn 610 615 620 Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro Gly 625 630 635 640 Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr Ile Lys 645 650 655 Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser Thr Thr 660 665 670 Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg Phe Lys 675 680 685 Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile Arg Gln 690 695 700 Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile Pro Glu 705 710 715 720 Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val Phe Asn 725 730 735 Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala Lys Lys 740 745 750 Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser Lys Asp 755 760 765 Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp Ala Ser 770 775 780 Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn 785 790 795 800 Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val 805 810 815 Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg 820 825 830 Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu 835 840 845 Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val 850 855 860 Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp Cys 865 870 875 880 Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe His Gly 885 890 895 Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln Asp Pro 900 905 910 Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala Arg Phe 915 920 925 Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg Asn Phe 930 935 940 Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr Lys Gln 945 950 955 960 Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His Ala Glu 965 970 975 Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys Ile Leu 980 985 990 Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly Gly Arg 995 1000 1005 Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro Ile 1010 1015 1020 Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu Val 1025 1030 1035 Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser Lys 1040 1045 1050 Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys Ala 1055 1060 1065 Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr Ser 1070 1075 1080 Gln Leu Pro Gln Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly 1085 1090 1095 Gln Ala Lys Lys Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 1115 1120 1125 Ser Gly Gly Ser Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu 1130 1135 1140 Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly 1145 1150 1155 Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly 1160 1165 1170 Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu 1175 1180 1185 Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser 1190 1195 1200 Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu 1205 1210 1215 Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro 1220 1225 1230 Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val 1235 1240 1245 Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 1250 1255 1260 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser 1265 1270 1275 His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 1280 1285 1290 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp 1295 1300 1305 Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg 1310 1315 1320 Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala 1325 1330 1335 Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu 1340 1345 1350 Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser 1355 1360 1365 Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu 1370 1375 1380 Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 1385 1390 1395 Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln 1400 1405 1410 Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro 1415 1420 1425 Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala 1430 1435 1440 Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala 1445 1450 1455 Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly 1460 1465 1470 Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu 1475 1480 1485 Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 1490 1495 1500 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr 1505 1510 1515 Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 1520 1525 1530 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met 1535 1540 1545 Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr 1550 1555 1560 Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala 1565 1570 1575 Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met 1580 1585 1590 Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe 1595 1600 1605 Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro 1610 1615 1620 Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala 1625 1630 1635 His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala 1640 1645 1650 Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly 1655 1660 1665 Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile 1670 1675 1680 Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu 1685 1690 1695 Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys 1700 1705 1710 Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His 1715 1720 1725 Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu 1730 1735 1740 Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys 1745 1750 1755 Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 1760 1765 1770 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala 1775 1780 1785 Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr 1790 1795 1800 Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala 1805 1810 1815 Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1820 1825 1830 <![CDATA[<210> 53]]> <![CDATA[<211> 1818]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 53]]> Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr 20 25 30 Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe 35 40 45 Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln 50 55 60 Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile 65 70 75 80 Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His 85 90 95 Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro 100 105 110 Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr 115 120 125 Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile 130 135 140 His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro 145 150 155 160 Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys 165 170 175 Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg 180 185 190 Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro 195 200 205 Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg 210 215 220 Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln 225 230 235 240 Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 245 250 255 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg 260 265 270 Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu 275 280 285 Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys 290 295 300 Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg 305 310 315 320 Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe 325 330 335 Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu 340 345 350 Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln 355 360 365 Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro 370 375 380 Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu 385 390 395 400 Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys 405 410 415 Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val 420 425 430 Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly 435 440 445 Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys 450 455 460 Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln 465 470 475 480 Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 485 490 495 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His 500 505 510 Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu 515 520 525 Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly 530 535 540 Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr 545 550 555 560 Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser 565 570 575 Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala 580 585 590 Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala 595 600 605 Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr 610 615 620 Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu 625 630 635 640 Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly 645 650 655 His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp 660 665 670 Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr 675 680 685 Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser 690 695 700 Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser 705 710 715 720 Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Ser Ile Ser Arg Pro Tyr 725 730 735 Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys Lys Glu Met Leu Asp Lys 740 745 750 Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg Val Phe Ala Asp Leu Ala 755 760 765 Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu Met Ala Lys Ser Leu Glu 770 775 780 Pro Glu Ser Asp Ser Glu Leu Val Cys Ala Ile Gly Trp Phe Arg Leu 785 790 795 800 Val Asp Lys Thr Ile Trp Ser Lys Asp Gly Ile Lys Gln Glu Asn Leu 805 810 815 Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys Glu Ala Ser Glu Val Val 820 825 830 Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp Lys Tyr Val Trp Ile Asp 835 840 845 Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg Glu Leu Gly Thr Arg Asn 850 855 860 Leu Ser Glu Asp Phe Glu Cys Met Leu Phe Glu Gln Tyr Ile Arg Leu 865 870 875 880 Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala Ile Ser Asn Met Phe Gly 885 890 895 Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys Arg Met Tyr Ala Thr Arg 900 905 910 Met Lys Asp Trp Leu Glu Ala Asn Glu Asn Ile Thr Trp Glu Gln Tyr 915 920 925 Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala Lys Asn Leu Glu Gln Val 930 935 940 Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly Ala Asp Pro Phe Phe Lys 945 950 955 960 Tyr Ser Phe Ser Lys Glu Gly Met Val Ser Lys Lys Glu His Ala Gln 965 970 975 Gln Leu Asp Lys Phe Lys Thr Val Leu Lys Asn Lys Ala Arg Asp Leu 980 985 990 Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln Tyr Leu Glu Ala Glu Ile 995 1000 1005 Gly Ile Pro Val Asp Ala Asn Val Tyr Ser Gln Met Phe Ser Asn 1010 1015 1020 Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg Asn Met Ser Phe 1025 1030 1035 Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys Asp Leu Asn 1040 1045 1050 Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn Gly Phe 1055 1060 1065 Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile Thr 1070 1075 1080 Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu 1085 1090 1095 Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile 1100 1105 1110 Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro 1115 1120 1125 Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val 1130 1135 1140 Ser Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu 1145 1150 1155 Glu Lys Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn 1160 1165 1170 Arg Tyr Trp Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met 1175 1180 1185 Pro Ala Asp Lys Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe 1190 1195 1200 Lys Met Trp Leu Arg Ala Glu Leu His Tyr Asp Gly Lys Lys Ala 1205 1210 1215 Lys Ala His Leu Pro Phe Tyr Asn Ala Arg Phe Phe Glu Glu Val 1220 1225 1230 Tyr Cys Tyr His Pro Ser Val Ala Glu Ile Thr Pro Phe Lys Thr 1235 1240 1245 Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp Ile Pro Asp Tyr Val 1250 1255 1260 Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys Ala Thr Lys Arg 1265 1270 1275 Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr Thr Arg Val 1280 1285 1290 Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu Asn Asp 1295 1300 1305 Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg Pro 1310 1315 1320 Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn 1325 1330 1335 Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro 1340 1345 1350 Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr 1355 1360 1365 Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn 1370 1375 1380 Ser Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser 1385 1390 1395 Glu Arg Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg 1400 1405 1410 Lys Leu Ile Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly 1415 1420 1425 Gln Asp Tyr Ile Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly 1430 1435 1440 Glu Thr Leu Tyr Val Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val 1445 1450 1455 Ser Lys His Arg Lys Ala Lys Lys Pro Val Glu Gly Ile Leu Asp 1460 1465 1470 Glu Ile Glu Ala Trp Thr Ser Lys Asp Lys Asp Ser Cys Ser Leu 1475 1480 1485 Met Arg Leu Ser Ser Leu Ser Asp Ala Ser Met Gln Gly Ile Ala 1490 1495 1500 Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn Lys Asn Gly Cys 1505 1510 1515 Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val Leu Tyr Ala 1520 1525 1530 Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg Ser Glu 1535 1540 1545 Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu Leu 1550 1555 1560 Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val 1565 1570 1575 Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp 1580 1585 1590 Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe 1595 1600 1605 His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His 1610 1615 1620 Gln Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met 1625 1630 1635 Arg Ala Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp 1640 1645 1650 His Val Arg Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr 1655 1660 1665 Gly Leu Tyr Tyr Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr 1670 1675 1680 Gly Leu Glu Glu His Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys 1685 1690 1695 Phe Tyr Asp Phe Arg Lys Ile Leu Glu Asp Lys Asn Leu Thr Ser 1700 1705 1710 Val Ile Ile Pro Lys Arg Gly Gly Arg Ile Tyr Met Ala Thr Asn 1715 1720 1725 Pro Val Thr Ser Asp Ser Thr Pro Ile Thr Tyr Ala Gly Lys Thr 1730 1735 1740 Tyr Asn Arg Cys Asn Ala Asp Glu Val Ala Ala Ala Asn Ile Val 1745 1750 1755 Ile Ser Val Leu Ala Pro Arg Ser Lys Lys Asn Arg Glu Gln Asp 1760 1765 1770 Asp Ile Pro Leu Ile Thr Lys Lys Ala Glu Ser Lys Ser Pro Pro 1775 1780 1785 Lys Asp Arg Lys Arg Ser Lys Thr Ser Gln Leu Pro Gln Lys Lys 1790 1795 1800 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1805 1810 1815 <![CDATA[<210> 54]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 54]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <![CDATA[<210> 55]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 55]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <![CDATA[<210> 56]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 56]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60 cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107 <![CDATA[<210> 57]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 57]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <![CDATA[<210> 58]]> <![CDATA[<211> ]]> 94 <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 58]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugagcgg ucagcaugga uuauagccga aggc 94 <![CDATA[<210> 59]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 59]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggcaug gauuauagcc gaaggc 86 <![CDATA[<210> 60]]> <![CDATA[<211> 42]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 60]]> agacaugugu ccucagugac acgggaagug guuggucagc au 42 <![CDATA[<210> 61]]> <![CDATA[<211> 95]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 61]]> agacaugugu ccucagugac acgggaagug guuggucagc auugauucca gcuacucugg 60 gaagugguug cagugcaugg auuauagccg aaggc 95 <![CDATA[<210> 62]]> <![CDATA[<211> 149]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 62]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <![CDATA[<210> 63]]> <![CDATA[<211> 149]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 63]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <![CDATA[<210> 64]]> <![CDATA[<211> 149]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 64]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg gacgcuacua uagcugcac 149 <![CDATA[<210> 65]]> <![CDATA[<211> 57]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 65]]> gattccagct actttgggaa gtggttggtc agcatggatt atagccgaag gccccag 57 <![CDATA[<210> 66]]> <![CDATA[<211> 57]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 66]]> ctaaggtcga tgaaaccctt caccaaccag tcgtacctaa tatcggcttc cggggtc 57 <![CDATA[<210> 67]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 67]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggucag cauggauuau agccgaaggc 90 <![CDATA[<210> 68]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 68]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <![CDATA[<210> 69]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 69]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc cgucccacua caggcca 107 <![CDATA[<210> 70]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 70]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caagcacccc cauaaggggg 60 uuccuucuuu gagccagugu ugcgagucaa gggcagcaug cugggcc 107 <![CDATA[<210> 71]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 71]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugcgagu caagggcagc augcugggcc 90 <![CDATA[<210> 72]]> <![CDATA[<211> 94]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 72]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugagcgc uagucaaggg cagcaugcug ggcc 94 <![CDATA[<210> 73]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 73]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguugucaag ggcagcaugc ugggcc 86 <![CDATA[<210> 74]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 74]]> gggaagtggt tggtcagcat 20 <![CDATA[<210> 75]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 75]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggucag cauggauuau agccgaaggc 90 <![CDATA[<210> 76]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 76]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <![CDATA[<210> 77]]> <![CDATA[<211> 94]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 77]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugagcgg ucagcaugga uuauagccga aggc 94 <![CDATA[<210> 78]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 78]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguuggcaug gauuauagcc gaaggc 86 <![CDATA[<210> 79]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 79]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60 cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107 <![CDATA[<210> 80]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 80]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <![CDATA[<210> 81]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 81]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugcccc caggaugcgu 120 ggagggaggg gucugug 137 <![CDATA[<210> 82]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 82]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugc 107 <![CDATA[<210> 83]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 83]]> agaaauccgu cuuucauuga cggaauccuc caccagucau ggugcacccc cauaaggggg 60 agauaccuuu aauccuccac cacgaguggu gacaacccca agcagcc 107 <![CDATA[<210> 84]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 84]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccacgagu ggugacaacc ccaagcagcc 90 <![CDATA[<210]]>> 85]]> <br/><![CDATA[<211> 94]]> <br/><![CDATA[<212> RNA]]> <br/><![CDATA[<213> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 85]]> <br/><![CDATA[agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccaagcgg ucauggugac aaccccaagc agcc 94 <![CDATA[<210> 86]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 86]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60 caccauggug acaaccccaa gcagcc 86 <![CDATA[<210> 87]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 87]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcgagg cauggauuau agccgaaggc 90 <![CDATA[<210> 88]]> <![CDATA[<211> 96]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 88]]> ugggaagugg uuggucagca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96 <![CDATA[<210> 89]]> <![CDATA[<211> 29]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 89]]> ggcuauaauc caugcaagug accaaccac 29 <![CDATA[<210> 90]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 90]]> gggaagtggt tgcagtgcat 20 <![CDATA[<210> 91]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 91]]> gagccagtgt tggatctcaa 20 <![CDATA[<210> 92]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 92]]> ttaaactctc caacctccag 20 <![CDATA[<210> 93]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 93]]> uaauuucuac uguuguagau 20 <![CDATA[<210> 94]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 94]]> agaaaugcau gguucucaug c 21 <![CDATA[<210> 95]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 95]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <![CDATA[<210> 96]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 96]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60 cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 97]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 97]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac caggcacccc cauaaggggg 60 aaaagacuuu uuaaacucuc cacgagccag gcucauccag cuuccca 107 <![CDATA[<210> 98]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 98]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccacgagc caggcucauc cagcuuccca 90 <![CDATA[<21]]>0> 99]]> <br/><![CDATA[<211> 94]]> <br/><![CDATA[<212> RNA]]> <br/><![CDATA[<213> 人工序列]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 99]]> <br/><![CDATA[agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccaagcgu ggaccaggcu cauccagcuu ccca 94 <![CDATA[<210> 100]]> <![CDATA[<211> 86]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 100]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60 cuccaccagg cucauccagc uuccca 86 <![CDATA[<210> 101]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 101]]> aaaauuaccu aguaauuagg u 21 <![CDATA[<210> 102]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 102]]> ggauuucuac uuuuguagau 20 <![CDATA[<210> 103]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 103]]> aaauuucuac uuuuguagau 20 <![CDATA[<210> 104]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 104]]> cgcgcccacg cggggcgcga c 21 <![CDATA[<210> 105]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 1]]>05 uaauuucuac ucuuguagau 20 <![CDATA[<210> 106]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 106]]> gaauuucuac uauuguagau 20 <![CDATA[<210> 107]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 107]]> gaaucucuac ucuuuguaga u 21 <![CDATA[<210> 108]]> <![CDATA[<211> 19]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 108]]> uaauuucuac uuuguagau 19 <![CDATA[<210> 109]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 109]]> aaauuucuac uguuuguaga u 21 <![CDATA[<210> 110]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 110]]> agaaauccgu cuuucauuga cggguagccu cucccgcucu ggu 43 <![CDATA[<210> 111]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 111]]> gaauuucuac uuuuguagau 20 <![CDATA[<210> 112]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 112]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag cau 43 <![CDATA[<210> 113]]> <![CDATA[<211> 21]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 113]]> uaauuucuac uaaguguaga u 21 <![CDATA[<210> 114]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 114]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caa 43 <![CDATA[<210> 115]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 115]]> uaauuucuac uauuguagau 20 <![CDATA[<210> 116]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 116]]> agaaauccgu cuuucauuga cggaauccuc caccagucau ggu 43 <![CDATA[<210> 117]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 117]]> uaauuucuac uucgguagau 20 <![CDATA[<210> 118]]> <![CDATA[<211> 43]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 118]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43 <![CDATA[<210> 119]]> <![CDATA[<211> 20]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 119]]> uaauuucuac uauuguagau 20 <![CDATA[<210> 120]]> <![CDATA[<211> 1368]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 120]]> Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <![CDATA[<210> 121]]> <![CDATA[<211> 1368]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 121]]> Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <![CDATA[<210> 122]]> <![CDATA[<211> 1053]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 122]]> Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val 1 5 10 15 Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly 20 25 30 Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg 35 40 45 Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile 50 55 60 Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His 65 70 75 80 Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu 85 90 95 Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu 100 105 110 Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr 115 120 125 Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala 130 135 140 Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys 145 150 155 160 Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr 165 170 175 Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln 180 185 190 Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg 195 200 205 Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys 210 215 220 Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe 225 230 235 240 Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr 245 250 255 Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn 260 265 270 Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe 275 280 285 Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu 290 295 300 Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys 305 310 315 320 Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr 325 330 335 Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala 340 345 350 Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu 355 360 365 Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser 370 375 380 Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile 385 390 395 400 Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala 405 410 415 Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln 420 425 430 Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro 435 440 445 Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile 450 455 460 Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg 465 470 475 480 Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys 485 490 495 Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr 500 505 510 Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp 515 520 525 Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu 530 535 540 Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro 545 550 555 560 Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys 565 570 575 Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu 580 585 590 Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile 595 600 605 Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu 610 615 620 Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp 625 630 635 640 Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu 645 650 655 Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys 660 665 670 Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp 675 680 685 Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp 690 695 700 Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys 705 710 715 720 Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys 725 730 735 Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu 740 745 750 Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp 755 760 765 Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile 770 775 780 Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu 785 790 795 800 Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu 805 810 815 Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His 820 825 830 Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly 835 840 845 Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr 850 855 860 Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile 865 870 875 880 Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp 885 890 895 Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr 900 905 910 Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val 915 920 925 Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser 930 935 940 Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala 945 950 955 960 Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly 965 970 975 Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile 980 985 990 Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met 995 1000 1005 Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys 1010 1015 1020 Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu 1025 1030 1035 Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly 1040 1045 1050 <![CDATA[<210> 123]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 123]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <![CDATA[<210> 124]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 124]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <![CDATA[<210> 125]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> ]]> 125 agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <![CDATA[<210> 126]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 126]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <![CDATA[<210> 127]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 127]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <![CDATA[<210> 128]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 128]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <![CDATA[<210> 129]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 129]]> cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcaga aauccgucuu 60 ucauugacgg gggaaguggu uggucagcau 90 <![CDATA[<210> 130]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 130]]> cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60 uguuagaaau ccgucuuuca uugacggggg aagugguugg ucagcau 107 <![CDATA[<210> 131]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 131]]> cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60 uguucuagca guuccacucc ugggcagccc gagaagaaau ccgucuuuca uugacggggg 120 aagugguugg ucagcau 137 <![CDATA[<210> 132]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 132]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggggaagu 120 gguuggucag cau 133 <![CDATA[<210> 133]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 133]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120 ucauugacgg gggaaguggu uggucagcau 150 <![CDATA[<210> 134]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 134]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgagaaga aauccgucuu ucauugacgg gggaaguggu uggucagcau 180 <![CDATA[<210> 135]]> <![CDATA[<211> 139]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 135]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcagaa auccgucuuu cauugacggg 120 ggaagugguu ggucagcau 139 <![CDATA[<210> 136]]> <![CDATA[<211> 156]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 136]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guuagaaauc 120 cgucuuucau ugacggggga agugguuggu cagcau 156 <![CDATA[<210> 137]]> <![CDATA[<211> 186]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 137]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60 ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guucuagcag 120 uuccacuccu gggcagcccg agaagaaauc cgucuuucau ugacggggga agugguuggu 180 cagcau 186 <![CDATA[<210> 138]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 138]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <![CDATA[<210> 139]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 139]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107 <![CDATA[<210> 140]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 140]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <![CDATA[<210> 141]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 141]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <![CDATA[<210> 142]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 142]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <![CDATA[<210> ]]> 143 <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 143]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <![CDATA[<210> 144]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 144]]> uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggccaga aauccgucuu 60 ucauugacgg gagccagugu ugcuagucaa 90 <![CDATA[<210> 145]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 145]]> uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60 gccaagaaau ccgucuuuca uugacgggag ccaguguugc uagucaa 107 <![CDATA[<210> 146]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 146]]> uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60 gccaauguga ccgucagucu ccuuccugaa ggacagaaau ccgucuuuca uugacgggag 120 ccaguguugc uagucaa 137 <![CDATA[<210> 147]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 147]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggagccag 120 uguugcuagu caa 133 <![CDATA[<210> 148]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 148]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120 ucauugacgg gagccagugu ugcuagucaa 150 <![CDATA[<210> 149]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 149]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gagccagugu ugcuagucaa 180 <![CDATA[<210> 150]]> <![CDATA[<211> 139]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 150]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggccagaa auccgucuuu cauugacggg 120 agccaguguu gcuagucaa 139 <![CDATA[<210> 151]]> <![CDATA[<211> 156]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 151]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaagaaauc 120 cgucuuucau ugacgggagc caguguugcu agucaa 156 <![CDATA[<210> 152]]> <![CDATA[<211> 186]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 152]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60 agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaaugugac 120 cgucagucuc cuuccugaag gacagaaauc cgucuuucau ugacgggagc caguguugcu 180 agucaa 186 <![CDATA[<210> 153]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 153]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc 90 <![CDATA[<210> 154]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 154]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugc 107 <![CDATA[<210> 155]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 155]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugug 137 <![CDATA[<210> 156]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 156]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <![CDATA[<210> 157]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 157]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <![CDATA[<210> 158]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 158]]> agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugugaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <![CDATA[<210> 159]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 159]]> agauaccuau aauccuccac cacaguuggu gacaacccca agcagccaga aauccgucuu 60 ucauugacgg aauccuccac cagucauggu 90 <![CDATA[<210> 160]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 160]]> agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60 gugcagaaau ccgucuuuca uugacggaau ccuccaccag ucauggu 107 <![CDATA[<210> 161]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 161]]> agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60 gugcccccag gaugcgugga gggagggguc ugugagaaau ccgucuuuca uugacggaau 120 ccuccaccag ucauggu 137 <![CDATA[<210> 162]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 162]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cggaauccuc 120 caccagucau ggu 133 <![CDATA[<210> 163]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 163]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120 ucauugacgg aauccuccac cagucauggu 150 <![CDATA[<210> 164]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 164]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60 caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120 ggagggaggg gucugugaga aauccgucuu ucauugacgg aauccuccac cagucauggu 180 <![CDATA[<210> 165]]> <![CDATA[<211> 139]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 165]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagccagaa auccgucuuu cauugacgga 120 auccuccacc agucauggu 139 <![CDATA[<210> 166]]> <![CDATA[<211> 156]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 166]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcagaaauc 120 cgucuuucau ugacggaauc cuccaccagu cauggu 156 <![CDATA[<210> 167]]> <![CDATA[<211> 186]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 167]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60 auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcccccagg 120 augcguggag ggaggggucu gugagaaauc cgucuuucau ugacggaauc cuccaccagu 180 cauggu 186 <![CDATA[<210> 168]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 168]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 169]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 169]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 17]]>0 <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 170]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <![CDATA[<210> 171]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 171]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgggcacacg 120 acgauguaau cgc 133 <![CDATA[<210> 172]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 172]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120 ucauugacgg gcacacgacg auguaaucgc 150 <![CDATA[<210> 173]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 173]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180 <![CDATA[<210> 174]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 174]]> aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaga aauccgucuu 60 ucauugacgg uuaaacucuc cauggaccag 90 <![CDATA[<210> 175]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 175]]> aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60 agaaagaaau ccgucuuuca uugacgguua aacucuccau ggaccag 107 <![CDATA[<210> 176]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 176]]> aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60 agaagggggg gcacucagga cucucuccaa gagaagaaau ccgucuuuca uugacgguua 120 aacucuccau ggaccag 137 <![CDATA[<210> 177]]> <![CDATA[<211> 133]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 177]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgguuaaacu 120 cuccauggac cag 133 <![CDATA[<210> 178]]> <![CDATA[<211> 150]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<22]]>3> 合成的]]> <br/> <br/><![CDATA[<400> 178]]> <br/><![CDATA[agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120 ucauugacgg uuaaacucuc cauggaccag 150 <![CDATA[<210> 179]]> <![CDATA[<211> 180]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 179]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagagaaga aauccgucuu ucauugacgg uuaaacucuc cauggaccag 180 <![CDATA[<210> 180]]> <![CDATA[<211> 139]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 180]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaagaa auccgucuuu cauugacggu 120 uaaacucucc auggaccag 139 <![CDATA[<210> 181]]> <![CDATA[<211> 156]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 181]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaagaaauc 120 cgucuuucau ugacgguuaa acucuccaug gaccag 156 <![CDATA[<210> 182]]> <![CDATA[<211> 186]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 182]]> agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60 uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaggggggg 120 cacucaggac ucucuccaag agaagaaauc cgucuuucau ugacgguuaa acucuccaug 180 gaccag 186 <![CDATA[<210> 183]]> <![CDATA[<211> 80]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 183]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau 80 <![CDATA[<210> 184]]> <![CDATA[<211> 85]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 184]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccg 85 <![CDATA[<210> 185]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 185]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <![CDATA[<210> 186]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 186]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107 <![CDATA[<210> 187]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 187]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120 uccugggcag cccgaga 137 <![CDATA[<210> 188]]> <![CDATA[<211> 70]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 188]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag cauugcagug cauggauuau 60 agccgaaggc 70 <![CDATA[<210> 189]]> <![CDATA[<211> 80]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 189]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caugggaagu gguugcagug 60 cauggauuau agccgaaggc 80 <![CDATA[<210> 190]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 190]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60 gguugcagug cauggauuau agccgaaggc 90 <![CDATA[<210> 191]]> <![CDATA[<211> 100]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 191]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caugugauga uuccagcuac 60 uuugggaagu gguugcagug cauggauuau agccgaaggc 100 <![CDATA[<210> 192]]> <![CDATA[<211> 110]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 192]]> agaaauccgu cuuucauuga cgggggaagu gguuggucag caugguggga aaggugauga 60 uuccagcuac uuugggaagu gguugcagug cauggauuau agccgaaggc 110 <![CDATA[<210> 193]]> <![CDATA[<211> 80]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 193]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc 80 <![CDATA[<210> 194]]> <![CDATA[<211> 85]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 194]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcu 85 <![CDATA[<210> 195]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 195]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <![CDATA[<210> 196]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 196]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107 <![CDATA[<210> 197]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 197]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120 ucuccuuccu gaaggac 137 <![CDATA[<210> 198]]> <![CDATA[<211> 70]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 198]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauggaucu caagggcagc 60 augcugggcc 70 <![CDATA[<210> 199]]> <![CDATA[<211> ]]>80 <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 199]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caagagccag uguuggaucu 60 caagggcagc augcugggcc 80 <![CDATA[<210> 200]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 200]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60 uguuggaucu caagggcagc augcugggcc 90 <![CDATA[<210> 201]]> <![CDATA[<211> 100]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 201]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caaauccaaa gcuuuccuuc 60 uuugagccag uguuggaucu caagggcagc augcugggcc 100 <![CDATA[<210> 202]]> <![CDATA[<211> 110]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 202]]> agaaauccgu cuuucauuga cgggagccag uguugcuagu caaugaaguc gccauccaaa 60 gcuuuccuuc uuugagccag uguuggaucu caagggcagc augcugggcc 110 <![CDATA[<210> 203]]> <![CDATA[<211> 80]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 203]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc 80 <![CDATA[<210> 204]]> <![CDATA[<211> 85]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 204]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcu 85 <![CDATA[<210> 205]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 205]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 206]]> <![CDATA[<211> 107]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 206]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107 <![CDATA[<210> 207]]> <![CDATA[<211> 137]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 207]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120 ggacucucuc caagaga 137 <![CDATA[<210> 208]]> <![CDATA[<211> 70]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 208]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagcaaccuc caggcucauc 60 cagcuuccca 70 <![CDATA[<210> 209]]> <![CDATA[<211> 80]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 209]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac caguuaaacu cuccaaccuc 60 caggcucauc cagcuuccca 80 <![CDATA[<210> 210]]> <![CDATA[<211> 90]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 210]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60 cuccaaccuc caggcucauc cagcuuccca 90 <![CDATA[<210> 211]]> <![CDATA[<211> 100]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 211]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagagguaac accaaaagac 60 uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 100 <![CDATA[<210> 212]]> <![CDATA[<211> 110]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 212]]> agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagccccauu accagguaac 60 accaaaagac uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 110 <![CDATA[<210> 213]]> <![CDATA[<211> 141]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 213]]> tccatgtctc gttatacgct gtggttcgcc aacaacacta gtactactga taaattaccc 60 cccaagtccc tcacctctcc aaagctgccc atactactac actagtttga cagctagctc 120 agtcctaggt ataatgctag c 141 <![CDATA[<210> 214]]> <![CDATA[<211> 141]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 214]]> tccatgtctc gttatacgct gtggttcgcc aacatatagt tcactactag catgctgccc 60 ttgactagca acactggctc aaagaaggaa agactactta tagttcttga cagctagctc 120 agtcctaggt ataatgctag c 141 <![CDATA[<210> 215]]> <![CDATA[<211> 143]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 215]]> tccatgtctc gttatacgct gtggttcgcc aacgcaggaa cgacactact agctggatga 60 gcctggtcca tggagagttt aaaaagtctt ttggactact ggaacgactt gacagctagc 120 tcagtcctag gtataatgct agc 143 <![CDATA[<210> 216]]> <![CDATA[<211> 43]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 216]]> agaaatccgt ctttcattga cggggagagg tgagggactt ggg 43 <![CDATA[<210> 217]]> <![CDATA[<211> 43]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 217]]> agaaatccgt ctttcattga cgggagccag tgttgctagt caa 43 <![CDATA[<210> 218]]> <![CDATA[<211> 43]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 218]]> agaaatccgt ctttcattga cggttaaact ctccatggac cag 43 <![CDATA[<210> ]]> 219 <![CDATA[<211> 1812]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 219]]> Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys Phe 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu 1115 1120 1125 Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser 1130 1135 1140 Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala 1145 1150 1155 Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr 1160 1165 1170 Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 1175 1180 1185 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu 1190 1195 1200 Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 1205 1210 1215 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu 1220 1225 1230 Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro 1235 1240 1245 Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr 1250 1255 1260 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro 1265 1270 1275 Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 1280 1285 1290 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 1295 1300 1305 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 1310 1315 1320 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr 1325 1330 1335 Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 1340 1345 1350 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr 1355 1360 1365 Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys 1370 1375 1380 Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu 1385 1390 1395 Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro 1400 1405 1410 Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 1415 1420 1425 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu 1430 1435 1440 Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 1445 1450 1455 Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu 1460 1465 1470 Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu 1475 1480 1485 Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro 1490 1495 1500 Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val 1505 1510 1515 Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 1520 1525 1530 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 1535 1540 1545 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 1550 1555 1560 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala 1565 1570 1575 Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 1580 1585 1590 Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln 1595 1600 1605 His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro 1610 1615 1620 Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr 1625 1630 1635 Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly 1640 1645 1650 Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu 1655 1660 1665 Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr 1670 1675 1680 Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr 1685 1690 1695 Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile 1700 1705 1710 Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys 1715 1720 1725 Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro 1730 1735 1740 Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly His 1745 1750 1755 Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg 1760 1765 1770 Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile 1775 1780 1785 Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu Phe 1790 1795 1800 Glu Ser Pro Lys Lys Lys Arg Lys Val 1805 1810 <![CDATA[<210> 220]]> <![CDATA[<211> 1620]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 220]]> Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu 1115 1120 1125 Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser 1130 1135 1140 Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala 1145 1150 1155 Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr 1160 1165 1170 Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu 1175 1180 1185 Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu 1190 1195 1200 Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 1205 1210 1215 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu 1220 1225 1230 Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro 1235 1240 1245 Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr 1250 1255 1260 Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro 1265 1270 1275 Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met 1280 1285 1290 Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe 1295 1300 1305 Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 1310 1315 1320 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr 1325 1330 1335 Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln 1340 1345 1350 Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr 1355 1360 1365 Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys 1370 1375 1380 Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu 1385 1390 1395 Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro 1400 1405 1410 Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu 1415 1420 1425 Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu 1430 1435 1440 Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 1445 1450 1455 Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu 1460 1465 1470 Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu 1475 1480 1485 Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro 1490 1495 1500 Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val 1505 1510 1515 Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala 1520 1525 1530 Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu 1535 1540 1545 Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 1550 1555 1560 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala 1565 1570 1575 Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala 1580 1585 1590 Leu Asn Pro Ala Thr Leu Leu Pro Met Lys Arg Thr Ala Asp Gly 1595 1600 1605 Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1610 1615 1620 <![CDATA[<210> 221]]> <![CDATA[<211> 1562]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<22]]>0>]]> <br/><![CDATA[<223> 合成的]]> <br/> <br/><![CDATA[<400> 221]]> <br/> <br/><![CDATA[Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser 1 5 10 15 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 20 25 30 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 35 40 45 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 50 55 60 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 65 70 75 80 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 85 90 95 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 100 105 110 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 115 120 125 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 130 135 140 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 145 150 155 160 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 165 170 175 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 180 185 190 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 195 200 205 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 210 215 220 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 225 230 235 240 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 245 250 255 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 260 265 270 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 275 280 285 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 290 295 300 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 305 310 315 320 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 325 330 335 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 340 345 350 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 355 360 365 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 370 375 380 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 385 390 395 400 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 405 410 415 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 420 425 430 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 435 440 445 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 450 455 460 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 465 470 475 480 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 485 490 495 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 500 505 510 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 515 520 525 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 530 535 540 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg 545 550 555 560 Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr 565 570 575 Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val 580 585 590 Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg 595 600 605 Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu 610 615 620 Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg 625 630 635 640 Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg 645 650 655 Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln 660 665 670 Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln 675 680 685 Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys 690 695 700 Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe 705 710 715 720 Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser 725 730 735 Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu 740 745 750 Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu 755 760 765 Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 770 775 780 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys 785 790 795 800 Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile 805 810 815 Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu 820 825 830 Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly 835 840 845 Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg 850 855 860 Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu 865 870 875 880 Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr 885 890 895 Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys 900 905 910 Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu 915 920 925 Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu 930 935 940 Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln 945 950 955 960 Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn 965 970 975 Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn 980 985 990 Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe 995 1000 1005 Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp 1010 1015 1020 Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala 1025 1030 1035 Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp 1040 1045 1050 Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser 1055 1060 1065 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1070 1075 1080 Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro 1085 1090 1095 Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser 1100 1105 1110 Gly Gly Ser Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser 1115 1120 1125 Ser Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys 1130 1135 1140 Gly Ala Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu 1145 1150 1155 His Leu Ala Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr 1160 1165 1170 Arg Lys Tyr Lys Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys 1175 1180 1185 Pro Asp Gly Gly Val Arg Asn Leu Gly Val Pro Thr Val Thr Asp 1190 1195 1200 Arg Phe Ile Gln Gln Ala Ile Ala Gln Val Leu Thr Pro Ile Tyr 1205 1210 1215 Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe Arg Pro Asn Arg 1220 1225 1230 Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile Met Asn Asp 1235 1240 1245 Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe Phe Asp 1250 1255 1260 Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr Ile 1265 1270 1275 Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser 1280 1285 1290 Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 1295 1300 1305 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu 1310 1315 1320 Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val 1325 1330 1335 Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 1340 1345 1350 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys 1355 1360 1365 Leu Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro 1370 1375 1380 Ser Gly Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg 1385 1390 1395 Ala His Gln Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys 1400 1405 1410 Phe Lys Lys Arg Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val 1415 1420 1425 Ser Asn Ser Tyr Lys Val Glu Lys Leu Asn Gln Leu Ile Arg Gly 1430 1435 1440 Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met Lys Thr Leu Cys Lys 1445 1450 1455 Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg Met Cys Ile Trp 1460 1465 1470 Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn Leu Val Lys 1475 1480 1485 Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr Thr Gly 1490 1495 1500 Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val Ala 1505 1510 1515 Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu 1520 1525 1530 Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Met Lys Arg Thr Ala 1535 1540 1545 Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val 1550 1555 1560 <![CDATA[<210> 222]]> <![CDATA[<211> 1548]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 222]]> Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 20 25 30 Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 35 40 45 Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 50 55 60 Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 65 70 75 80 Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 85 90 95 Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 100 105 110 Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 115 120 125 Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 130 135 140 Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 145 150 155 160 Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 165 170 175 Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 180 185 190 Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 195 200 205 Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 210 215 220 Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 225 230 235 240 Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 245 250 255 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 260 265 270 Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 275 280 285 Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 290 295 300 Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 305 310 315 320 Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 325 330 335 Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 340 345 350 Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 355 360 365 Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 370 375 380 Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 385 390 395 400 Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 405 410 415 Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 420 425 430 Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 435 440 445 Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 450 455 460 Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 465 470 475 480 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 485 490 495 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 500 505 510 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 515 520 525 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 530 535 540 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 545 550 555 560 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 565 570 575 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 580 585 590 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 595 600 605 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 610 615 620 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 625 630 635 640 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 645 650 655 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 660 665 670 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 675 680 685 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 690 695 700 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 705 710 715 720 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 725 730 735 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 740 745 750 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 755 760 765 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 770 775 780 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 785 790 795 800 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 805 810 815 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 820 825 830 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 835 840 845 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 850 855 860 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 865 870 875 880 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 885 890 895 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 900 905 910 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 915 920 925 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 930 935 940 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 945 950 955 960 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 965 970 975 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 980 985 990 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 995 1000 1005 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile 1010 1015 1020 Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 1025 1030 1035 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg 1040 1045 1050 Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln 1055 1060 1065 Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser 1070 1075 1080 His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His 1085 1090 1095 Lys Glu Leu Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile 1100 1105 1110 Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser 1115 1120 1125 Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys 1130 1135 1140 Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys 1145 1150 1155 Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala 1160 1165 1170 Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr 1175 1180 1185 Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu 1190 1195 1200 Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp 1205 1210 1215 Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu 1220 1225 1230 Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 1235 1240 1245 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg 1250 1255 1260 Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 1265 1270 1275 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala 1280 1285 1290 Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile 1295 1300 1305 Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys 1310 1315 1320 Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe 1325 1330 1335 Asn Lys Ile Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe 1340 1345 1350 Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His 1355 1360 1365 Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro 1370 1375 1380 Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn 1385 1390 1395 Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly 1400 1405 1410 Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu 1415 1420 1425 Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys 1430 1435 1440 Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu 1445 1450 1455 Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala 1460 1465 1470 Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln 1475 1480 1485 Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn 1490 1495 1500 Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu 1505 1510 1515 Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys 1520 1525 1530 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1535 1540 1545 <![CDATA[<210> 223]]> <![CDATA[<211> 1548]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 223]]> Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys 1 5 10 15 Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser 20 25 30 Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala 35 40 45 Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala 50 55 60 Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys 65 70 75 80 Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val 85 90 95 Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala 100 105 110 Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His 115 120 125 Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr 130 135 140 Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp 145 150 155 160 Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu 165 170 175 Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys 180 185 190 Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile 195 200 205 Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile 210 215 220 Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe 225 230 235 240 Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser 245 250 255 Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu 260 265 270 Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly 275 280 285 Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln 290 295 300 Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg 305 310 315 320 Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys 325 330 335 Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys 340 345 350 Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg 355 360 365 Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn 370 375 380 Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg 385 390 395 400 Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly 405 410 415 Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu 420 425 430 Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly 435 440 445 Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu 450 455 460 Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser 465 470 475 480 Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys 485 490 495 Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala 500 505 510 Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu 515 520 525 Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala 530 535 540 Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu 545 550 555 560 Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr 565 570 575 Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser 580 585 590 Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp 595 600 605 Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu 610 615 620 Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn 625 630 635 640 Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu 645 650 655 Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile 660 665 670 Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile 675 680 685 Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr 690 695 700 Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys 705 710 715 720 Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys 725 730 735 Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu 740 745 750 Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp 755 760 765 Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys 770 775 780 Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys 785 790 795 800 Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp 805 810 815 Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys 820 825 830 Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp 835 840 845 Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp 850 855 860 Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg 865 870 875 880 Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala 885 890 895 Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala 900 905 910 Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val 915 920 925 Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp 930 935 940 Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp 945 950 955 960 Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile 965 970 975 Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro 980 985 990 Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg 995 1000 1005 Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile 1010 1015 1020 Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys 1025 1030 1035 Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg 1040 1045 1050 Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln 1055 1060 1065 Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser 1070 1075 1080 His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His 1085 1090 1095 Lys Glu Leu Arg Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile 1100 1105 1110 Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser 1115 1120 1125 Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys 1130 1135 1140 Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys 1145 1150 1155 Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala 1160 1165 1170 Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr 1175 1180 1185 Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu 1190 1195 1200 Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp 1205 1210 1215 Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu 1220 1225 1230 Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr 1235 1240 1245 Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg 1250 1255 1260 Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu 1265 1270 1275 Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala 1280 1285 1290 Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile 1295 1300 1305 Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys 1310 1315 1320 Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe 1325 1330 1335 Asn Lys Ile Arg Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe 1340 1345 1350 Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His 1355 1360 1365 Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro 1370 1375 1380 Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn 1385 1390 1395 Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly 1400 1405 1410 Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu 1415 1420 1425 Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys 1430 1435 1440 Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu 1445 1450 1455 Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala 1460 1465 1470 Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln 1475 1480 1485 Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn 1490 1495 1500 Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp Glu 1505 1510 1515 Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser Lys 1520 1525 1530 Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1535 1540 1545 <![CDATA[<210> 224]]> <![CDATA[<211> 486]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 224]]> Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys 1 5 10 15 Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln 20 25 30 Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro 35 40 45 Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln 50 55 60 Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln 65 70 75 80 Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn 85 90 95 Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro 100 105 110 Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro 115 120 125 Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His 130 135 140 Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg 145 150 155 160 Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro 165 170 175 Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly 180 185 190 Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu 195 200 205 Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val 210 215 220 Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly 225 230 235 240 Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser 245 250 255 Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr 260 265 270 Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr 275 280 285 Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe 290 295 300 Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu 305 310 315 320 Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn 325 330 335 Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu 340 345 350 Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu 355 360 365 Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln 370 375 380 Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu 385 390 395 400 Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala 405 410 415 Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro 420 425 430 Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro 435 440 445 Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu 450 455 460 Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn 465 470 475 480 Pro Ala Thr Leu Leu Pro 485 <![CDATA[<210> 225]]> <![CDATA[<400> 225]]> 000 <![CDATA[<210> 226]]> <![CDATA[<400> 226]]> 000 <![CDATA[<210> 227]]> <![CDATA[<400> 227]]> 000 <![CDATA[<210> 228]]> <![CDATA[<400> 228]]> 000 <![CDATA[<210> 229]]> <![CDATA[<400> 229]]> 000 <![CDATA[<210> 230]]> <![CDATA[<211> 487]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 230]]> Met Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly 1 5 10 15 Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala 20 25 30 Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala 35 40 45 Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile 50 55 60 Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys 65 70 75 80 Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val 85 90 95 Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn 100 105 110 Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp 115 120 125 Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro 130 135 140 Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln 145 150 155 160 Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu 165 170 175 Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His 180 185 190 Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala 195 200 205 Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr 210 215 220 Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys 225 230 235 240 Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg 245 250 255 Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro 260 265 270 Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Thr Ala Gly Phe Cys 275 280 285 Arg Leu Trp Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro 290 295 300 Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys 305 310 315 320 Ala Tyr Gln Glu Ile Leu Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly 325 330 335 Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln 340 345 350 Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg 355 360 365 Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp 370 375 380 Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp 385 390 395 400 Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His 405 410 415 Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn 420 425 430 Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val 435 440 445 Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu 450 455 460 Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala 465 470 475 480 His Gly Thr Arg Pro Asp Leu 485 <![CDATA[<210> 231]]> <![CDATA[<211> 231]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 231]]> Met Leu Gln Leu Gly His Leu Glu Glu Ser Asn Ser Pro Trp Asn Thr 1 5 10 15 Pro Val Phe Val Ile Lys Lys Lys Ser Gly Lys Trp Arg Leu Leu Gln 20 25 30 Asp Leu Arg Ala Val Asn Ala Thr Met His Asp Met Gly Ala Leu Gln 35 40 45 Pro Gly Leu Pro Ser Pro Val Ala Val Pro Lys Gly Trp Glu Ile Ile 50 55 60 Ile Ile Asp Leu Gln Asp Cys Phe Phe Asn Ile Lys Leu His Pro Glu 65 70 75 80 Asp Cys Lys Arg Phe Ala Phe Ser Val Pro Ser Pro Asn Phe Lys Arg 85 90 95 Pro Tyr Gln Arg Phe Gln Trp Lys Val Leu Pro Gln Gly Met Lys Asn 100 105 110 Ser Pro Thr Leu Cys Gln Lys Phe Val Asp Lys Ala Ile Leu Thr Val 115 120 125 Arg Asp Lys Tyr Gln Asp Ser Tyr Ile Val His Tyr Met Asp Asp Ile 130 135 140 Leu Leu Ala His Pro Ser Arg Ser Ile Val Asp Glu Ile Leu Thr Ser 145 150 155 160 Met Ile Gln Ala Leu Asn Lys His Gly Leu Val Val Ser Thr Glu Lys 165 170 175 Ile Gln Lys Tyr Asp Asn Leu Lys Tyr Leu Gly Thr His Ile Gln Gly 180 185 190 Asp Ser Val Ser Tyr Gln Lys Leu Gln Ile Arg Thr Asp Lys Leu Arg 195 200 205 Thr Leu Asn Asp Phe Gln Lys Leu Leu Gly Asn Ile Asn Trp Ile Arg 210 215 220 Pro Phe Leu Lys Leu Thr Thr 225 230 <![CDATA[<210> 232]]> <![CDATA[<211> 427]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 232]]> Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu 1 5 10 15 Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val 20 25 30 Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly 35 40 45 Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro 50 55 60 Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu 65 70 75 80 Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln 85 90 95 Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly 100 105 110 Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn 115 120 125 Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys 130 135 140 Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg 145 150 155 160 Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val 165 170 175 Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr 180 185 190 Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn 195 200 205 Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr 210 215 220 Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg 225 230 235 240 Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys 245 250 255 Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr 260 265 270 Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala 275 280 285 Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu 290 295 300 Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys 305 310 315 320 Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser 325 330 335 Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu 340 345 350 Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys 355 360 365 Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala 370 375 380 Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn 385 390 395 400 Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met 405 410 415 Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys 420 425 <![CDATA[<210> 233]]> <![CDATA[<211> 774]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 233]]> Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <![CDATA[<210> 234]]> <![CDATA[<211> 774]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223]]>> 合成的]]> <br/> <br/><![CDATA[<400> 234]]> <br/> <br/><![CDATA[Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asp Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <![CDATA[<210> 235]]> <![CDATA[<211> 774]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 235]]> Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile 1 5 10 15 Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Ser Thr Val Val Thr 50 55 60 Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Ser Val 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile 85 90 95 Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Leu Asp Ile Gly Thr 130 135 140 Pro Cys His Glu Gly Glu Val Phe Ala Glu Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Glu Gly Thr Arg Val Ile Thr Trp Arg Asn Val 165 170 175 Asp Leu Pro Tyr Val Asp Val Leu Ser Thr Glu Arg Glu Met Ile Gln 180 185 190 Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Glu Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Ile 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Met Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His 370 375 380 Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Ile Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile 515 520 525 Glu Glu Lys Tyr Gly Phe Lys Leu Ile Tyr Ser Asp Thr Asp Gly Phe 530 535 540 Phe Ala Thr Ile Pro Gly Ala Glu Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Tyr Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Trp Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg 755 760 765 Leu Lys Pro Lys Gly Thr 770 <![CDATA[<210> 236]]> <![CDATA[<211> 683]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 236]]> Met Asp His Leu Leu Leu Lys Thr Gln Thr Gln Thr Glu Gln Val Met 1 5 10 15 Asn Val Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg Leu Tyr Phe 20 25 30 Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp Thr Gly Ala 35 40 45 Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu His Trp Val 50 55 60 Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly Ser Ser Ile 65 70 75 80 Thr Ile Ser Lys Val Cys Lys Asp Ile Asp Leu Ile Ile Ala Gly Glu 85 90 95 Ile Phe Arg Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly Ile Asp Phe 100 105 110 Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe Ile Gln Phe 115 120 125 Thr Asp Arg Val Ile Phe Thr Lys Asn Lys Ser Tyr Pro Val His Ile 130 135 140 Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly Phe Leu Glu 145 150 155 160 Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro Val Asn Ile 165 170 175 Ser Thr Asn Lys Ile Glu Asn Pro Leu Glu Glu Ile Ala Ile Leu Ser 180 185 190 Glu Gly Arg Arg Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg 195 200 205 Met Gln Lys Ile Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro 210 215 220 Leu Asp Pro Asn Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu 225 230 235 240 Ser Asp Pro Ser Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro 245 250 255 Met Asp Arg Glu Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu 260 265 270 Lys Val Ile Lys Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu 275 280 285 Val Asn Asn Glu Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val 290 295 300 Asn Tyr Lys Ala Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu 305 310 315 320 Pro Asn Lys Asp Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe 325 330 335 Ser Ser Phe Asp Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln 340 345 350 Glu Ser Arg Pro Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu 355 360 365 Trp Asn Val Val Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln 370 375 380 Arg His Met Asp Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val 385 390 395 400 Tyr Val Asp Asp Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu 405 410 415 Leu His Val Ala Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile 420 425 430 Leu Ser Lys Lys Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu 435 440 445 Gly Leu Glu Ile Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu 450 455 460 Glu His Ile Asn Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu 465 470 475 480 Gln Arg Phe Leu Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys 485 490 495 Leu Ala Gln Ile Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val 500 505 510 Pro Trp Arg Trp Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys 515 520 525 Lys Asn Leu Gln Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu 530 535 540 Lys Leu Ile Ile Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met 545 550 555 560 Leu Lys Ala Ile Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys 565 570 575 Arg Tyr Ala Ser Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser 580 585 590 Asn Asp Lys Glu Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser 595 600 605 Ile Tyr Leu Thr Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His 610 615 620 Phe Lys Ser Phe Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly 625 630 635 640 Arg Asn Ile Arg Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val 645 650 655 Glu His Ile Lys Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg 660 665 670 Glu Phe Asn Lys Val Asn Ser Ser Gly Gly Ser 675 680 <![CDATA[<210> 237]]> <![CDATA[<211> 329]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 237]]> Met Gly Ile His Gly Val Pro Ala Ala Met Lys Ser Ala Glu Tyr Leu 1 5 10 15 Asn Thr Phe Arg Leu Arg Asn Leu Gly Leu Pro Val Met Asn Asn Leu 20 25 30 His Asp Met Ser Lys Ala Thr Arg Ile Ser Val Glu Thr Leu Arg Leu 35 40 45 Leu Ile Tyr Thr Ala Asp Phe Arg Tyr Arg Ile Tyr Thr Val Glu Lys 50 55 60 Lys Gly Pro Glu Lys Arg Met Arg Thr Ile Tyr Gln Pro Ser Arg Glu 65 70 75 80 Leu Lys Ala Leu Gln Gly Trp Val Leu Arg Asn Ile Leu Asp Lys Leu 85 90 95 Ser Ser Ser Pro Phe Ser Ile Gly Phe Glu Lys His Gln Ser Ile Leu 100 105 110 Asn Asn Ala Thr Pro His Ile Gly Ala Asn Phe Ile Leu Asn Ile Asp 115 120 125 Leu Glu Asp Phe Phe Pro Ser Leu Thr Ala Asn Lys Val Phe Gly Val 130 135 140 Phe His Ser Leu Gly Tyr Asn Arg Leu Ile Ser Ser Val Leu Thr Lys 145 150 155 160 Ile Cys Cys Tyr Lys Asn Leu Leu Pro Gln Gly Ala Pro Ser Ser Pro 165 170 175 Lys Leu Ala Asn Leu Ile Cys Ser Lys Leu Asp Tyr Arg Ile Gln Gly 180 185 190 Tyr Ala Gly Ser Arg Gly Leu Ile Tyr Thr Arg Tyr Ala Asp Asp Leu 195 200 205 Thr Leu Ser Ala Gln Ser Met Lys Lys Val Val Lys Ala Arg Asp Phe 210 215 220 Leu Phe Ser Ile Ile Pro Ser Glu Gly Leu Val Ile Asn Ser Lys Lys 225 230 235 240 Thr Cys Ile Ser Gly Pro Arg Ser Gln Arg Lys Val Thr Gly Leu Val 245 250 255 Ile Ser Gln Glu Lys Val Gly Ile Gly Arg Glu Lys Tyr Lys Glu Ile 260 265 270 Arg Ala Lys Ile His His Ile Phe Cys Gly Lys Ser Ser Glu Ile Glu 275 280 285 His Val Arg Gly Trp Leu Ser Phe Ile Leu Ser Val Asp Ser Lys Ser 290 295 300 His Arg Arg Leu Ile Thr Tyr Ile Ser Lys Leu Glu Lys Lys Tyr Gly 305 310 315 320 Lys Asn Pro Leu Asn Lys Ala Lys Thr 325 <![CDATA[<210> 238]]> <![CDATA[<211> 235]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 238]]> Met Glu Lys Glu Gly Gln Leu Glu Glu Ala Pro Pro Thr Asn Pro Tyr 1 5 10 15 Asn Thr Pro Thr Phe Ala Ile Lys Lys Lys Asp Lys Asn Lys Trp Arg 20 25 30 Met Leu Ile Asp Phe Arg Glu Leu Asn Lys Val Thr Gln Asp Phe Thr 35 40 45 Glu Ile Gln Leu Gly Ile Pro His Pro Ala Gly Leu Ala Lys Lys Arg 50 55 60 Arg Ile Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile Pro Leu 65 70 75 80 His Glu Asp Phe Arg Pro Tyr Thr Ala Phe Thr Leu Pro Ser Val Asn 85 90 95 Asn Ala Glu Pro Gly Lys Arg Tyr Ile Tyr Lys Val Leu Pro Gln Gly 100 105 110 Trp Lys Gly Ser Pro Ala Ile Phe Gln His Thr Met Arg Gln Val Leu 115 120 125 Glu Pro Phe Arg Lys Ala Asn Lys Asp Val Ile Ile Ile Gln Tyr Met 130 135 140 Asp Asp Ile Leu Ile Ala Ser Asp Arg Thr Asp Leu Glu His Asp Arg 145 150 155 160 Val Val Leu Gln Leu Lys Glu Leu Leu Asn Gly Leu Gly Phe Ser Thr 165 170 175 Pro Asp Glu Lys Phe Gln Lys Asp Pro Pro Ile His Trp Met Gly Tyr 180 185 190 Glu Leu Trp Pro Thr Lys Trp Lys Leu Gln Lys Ile Gln Leu Pro Gln 195 200 205 Lys Glu Ile Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Val Leu 210 215 220 Asn Trp Ala Ala Gln Leu Tyr Pro Gly Ile Lys 225 230 235 <![CDATA[<210> 239]]> <![CDATA[<211> 235]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 239]]> Met Glu Glu Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr 1 5 10 15 Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg 20 25 30 Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp 35 40 45 Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys 50 55 60 Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu 65 70 75 80 Asp Glu Ser Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn 85 90 95 Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly 100 105 110 Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu 115 120 125 Glu Pro Phe Arg Ile Lys Asn Pro Glu Ile Val Ile Tyr Gln Tyr Met 130 135 140 Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr 145 150 155 160 Lys Ile Glu Glu Leu Arg Ala His Leu Leu Ser Trp Gly Phe Thr Thr 165 170 175 Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr 180 185 190 Glu Leu His Pro Asp Arg Trp Thr Val Gln Pro Ile Asp Leu Pro Glu 195 200 205 Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu 210 215 220 Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys 225 230 235 <![CDATA[<210> 240]]> <![CDATA[<211> 441]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 240]]> Met Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly 1 5 10 15 Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile 20 25 30 Lys Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile 35 40 45 Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile 50 55 60 Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu 65 70 75 80 Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro 85 90 95 His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val 100 105 110 Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr 115 120 125 Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg 130 135 140 Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile 145 150 155 160 Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn 165 170 175 Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser 180 185 190 Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln 195 200 205 His Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys 210 215 220 Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp 225 230 235 240 Thr Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn 245 250 255 Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr 260 265 270 Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys 275 280 285 Ala Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu 290 295 300 Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr 305 310 315 320 Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly 325 330 335 Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr 340 345 350 Gly Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln 355 360 365 Leu Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp 370 375 380 Gly Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu 385 390 395 400 Thr Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu 405 410 415 Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys 420 425 430 Glu Pro Ile Val Gly Ala Glu Thr Phe 435 440 <![CDATA[<210> 241]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 241]]> aauagcggcc cuaagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 242]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 242]]> auuggaacug gcgagaaauc cgucuuucau ugacgg 36 <![CDATA[<210> 243]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 合成的]]> <![CDATA[<400> 243]]> ccagcaacac cuaagaaauc cgucuuucau ugacgg 36
Claims (88)
- 一種基因編輯系統,其包含: (a) V型CRISPR核酸酶多肽或編碼該V型CRISPR核酸酶多肽的第一核酸; (b) 反轉錄酶(RT)多肽或編碼該RT多肽的第二核酸; (c) 指導RNA(gRNA)或編碼該gRNA的第三核酸,其中該gRNA包含可被該V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點)和對目的基因組位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (d) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
- 如請求項1所述之基因編輯系統,其中該V型CRISPR核酸酶多肽係Cas12多肽。
- 如請求項2所述之基因編輯系統,其中該Cas12多肽係Cas12i多肽,該Cas12i多肽視需要是Cas12i2多肽。
- 如請求項3所述之基因編輯系統,其中該Cas12i多肽係Cas12i2多肽,該Cas12i2多肽包含與SEQ ID NO: 2具有至少95%同一性的胺基酸序列。
- 如請求項4所述之基因編輯系統,其中該Cas12i2多肽在SEQ ID NO: 2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046處包含一或多個突變。
- 如請求項5所述之基因編輯系統,其中該一或多個突變係胺基酸取代,該等胺基酸取代視需要是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其組合。
- 如請求項5所述之基因編輯系統,其中該Cas12i2多肽包含: (i) 在位置D581、D911、I926和V1030處的突變,該等突變視需要是胺基酸取代D581R、D911R、I926R和V1030G; (ii) 在位置D581、I926和V1030處的突變,該等突變視需要是胺基酸取代D581R、I926R和V1030G; (iii) 在位置D581、I926、V1030和S1046處的突變,該等突變視需要是胺基酸取代D581R、I926R、V1030G和S1046G; (iv) 在位置D581、G624、F626、I926、V1030、E1035和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G;或者 (v) 在位置D581、G624、F626、P868、I926、V1030、E1035和S1046處的突變,該等突變視需要是胺基酸取代D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G。
- 如請求項7所述之基因編輯系統,其中該Cas12i2多肽包含以下的胺基酸序列:SEQ ID NO: 3-7中任一個,視需要SEQ ID NO:4或SEQ ID NO: 7。
- 如請求項4或請求項5所述之基因編輯系統,其中該Cas12i多肽具有降低的crRNA加工活性,視需要其中該Cas12i多肽在SEQ ID NO: 2的位置H485和/或位置H486處包含突變。
- 如請求項1-9中任一項所述之基因編輯系統,其中該系統包含該V型CRISPR核酸酶多肽。
- 如請求項1-10中任一項所述之基因編輯系統,其中該系統包含編碼該V型CRISPR核酸酶多肽的第一核酸。
- 如請求項11所述之基因編輯系統,其中該第一核酸位於第一載體中,該第一載體視需要是第一病毒載體。
- 如請求項11所述之基因編輯系統,其中該第一核酸係第一信使RNA(mRNA)。
- 如請求項1-13中任一項所述之基因編輯系統,其中該RT多肽係莫洛尼鼠白血病病毒(MMLV)-RT、小鼠乳腺腫瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT。
- 如請求項1-14中任一項所述之基因編輯系統,其中該系統包含該RT多肽。
- 如請求項1-14中任一項所述之基因編輯系統,其中該系統包含編碼該RT多肽的該第二核酸。
- 如請求項16所述之基因編輯系統,其中該第二核酸位於第二載體中,該第二載體視需要是第二病毒載體。
- 如請求項17所述之基因編輯系統,其中該第二載體與該第一載體相同。
- 如請求項16所述之基因編輯系統,其中該第二核酸係第二mRNA。
- 如請求項17所述之基因編輯系統,其中該第一mRNA和該第二mRNA位於單個RNA分子上。
- 如請求項1-15中任一項所述之基因編輯系統,其中該基因編輯系統包含融合多肽,該融合多肽包含該V型CRISPR核酸酶多肽和該RT多肽。
- 如請求項1-15中任一項所述之基因編輯系統,其中該V型CRISPR核酸酶多肽和該RT多肽係單獨的多肽。
- 如請求項1-22中任一項所述之基因編輯系統,其中該間隔子的長度為20-30個核苷酸,視需要長度為20個核苷酸。
- 如請求項3-23中任一項所述之基因編輯系統,其中該PAM包含5’-TTN-3’的模體,該模體視需要位於該靶序列的5’。
- 如請求項3-24中任一項所述之基因編輯系統,其中該一或多個CRISPR核酸酶結合位點係一或多個同向重複序列。
- 如請求項25所述之基因編輯系統,其中每個同向重複序列的長度為23-36個核苷酸,視需要長度為23個核苷酸。
- 如請求項26所述之基因編輯系統,其中該同向重複序列與SEQ ID NO: 15-17和241-247中的任一個或其長度為至少23個核苷酸的片段具有至少90%同一性。
- 如請求項27所述之基因編輯系統,其中該同向重複序列係SEQ ID NO: 15-17和241-247中的任一個,或其長度為至少23個核苷酸的片段;視需要其中該同向重複序列係SEQ ID NO: 17。
- 如請求項1-28中任一項所述之基因編輯系統,其中該系統包含該gRNA。
- 如請求項1-28中任一項所述之基因編輯系統,其中該系統包含編碼該gRNA的該第三核酸。
- 如請求項30所述之基因編輯系統,其中該第三核酸位於第三載體中,該第三載體視需要是病毒載體。
- 如請求項31所述之基因編輯系統,其中該第三載體與該第一載體和/或該第二載體相同。
- 如請求項1-32中任一項所述之基因編輯系統,其中該PBS的長度為5-100個核苷酸,視需要長度為10-60個核苷酸,較佳的是長度為10-30個核苷酸。
- 如請求項1-33中任一項所述之基因編輯系統,其中該PBS結合與該靶序列的互補區相鄰的PBS靶向位點,並且其中該PBS靶向位點位於該靶序列的互補區的上游。
- 如請求項34所述之基因編輯系統,其中該PBS靶向位點係該靶序列的互補區上游的3-10個核苷酸。
- 如請求項1-33中任一項所述之基因編輯系統,其中該PBS靶向位點與該靶序列的互補區重疊。
- 如請求項1-33中任一項所述之基因編輯系統,其中該PBS靶向位點與該靶序列相鄰或重疊。
- 如請求項1-37中任一項所述之基因編輯系統,其中該模板序列的長度為5-100個核苷酸,視需要長度為30-50個核苷酸。
- 如請求項1-38中任一項所述之基因編輯系統,其中該模板序列與該目的基因組位點同源並且包含相對於該目的基因組位點的一或多個核苷酸變化。
- 如請求項39所述之基因編輯系統,其中至少一個核苷酸變化位於該靶序列內。
- 如請求項39或請求項40所述之基因編輯系統,其中至少一個核苷酸變化位於該PAM內。
- 如請求項1-41中任一項所述之基因編輯系統,其中該系統包含該RT供體RNA。
- 如請求項1-41中任一項所述之基因編輯系統,其中該系統包含編碼該RT供體RNA的該第四核酸。
- 如請求項43所述之基因編輯系統,其中該第四核酸位於第四載體中,該第四載體視需要是第四病毒載體。
- 如請求項44所述之基因編輯系統,其中該第四載體與該第一載體、該第二載體和/或該第三載體相同。
- 如請求項1-45中任一項所述之基因編輯系統,其中該gRNA和該RT供體RNA位於單個RNA分子上,該單個RNA分子包含該CRISPR核酸酶結合位點、該間隔子序列、該PBS和該模板序列。
- 如請求項46所述之基因編輯系統,其中該單個RNA分子進一步包含該gRNA和該RT供體RNA之間的連接子。
- 如請求項47所述之基因編輯系統,其中該連接子包含髮夾。
- 如請求項46-48中任一項所述之基因編輯系統,其中該單個RNA分子從5’到3’包含: (i) 該CRISPR核酸酶結合位點、該間隔子序列、該模板序列和該PBS; (ii) 該CRISPR核酸酶結合位點、該間隔子序列、該連接子、該模板序列和該PBS; (iii) 該模板序列、該PBS、該CRISPR核酸酶結合位點和該間隔子序列;或者 (iv) 該模板序列、該PBS、該連接子、該CRISPR核酸酶結合位點和該間隔子序列。
- 如請求項46-49中任一項所述之基因編輯系統,其中該單個RNA分子進一步包含5’末端保護片段、3’末端保護片段或兩者,該5’末端保護片段和該3’末端保護片段中的每一個形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構。
- 如請求項50所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
- 如請求項50所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
- 如請求項1-45中任一項所述之基因編輯系統,其中該gRNA和該RT供體RNA係兩種單獨的RNA分子。
- 如請求項53所述之基因編輯系統,其中該gRNA、該RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。
- 如請求項54所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
- 如請求項54所述之基因編輯系統,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
- 如請求項1-56中任一項所述之基因編輯系統,其中該系統包含一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒包括元件 (a)、(b)、(c)、(d) 或其任何組合。
- 如請求項1-57中任一項所述之基因編輯系統,其中該系統包含 (i) 一或多種脂質奈米顆粒(LNP),該一或多種脂質奈米顆粒集合地包括 (a)-(d) 中的多達三種元件,以及 (ii) 一或多種載體。
- 如請求項58所述之基因編輯系統,其中該一或多種載體係一或多種病毒載體,該一或多種病毒載體視需要是腺相關病毒(AAV)載體。
- 如請求項1-56中任一項所述之基因編輯系統,其中該系統包含該V型CRISPR核酸酶多肽、該RT多肽、該gRNA和該RT供體RNA。
- 如請求項60所述之基因編輯系統,其中該V型CRISPR核酸酶多肽和/或該RT多肽與該gRNA和/或該RT供體RNA形成複合物。
- 一種藥物組成物,其包含如請求項1-61中任一項所述之系統。
- 一種套組,其包含如請求項1-61中任一項所示的系統的 (a)-(d) 的元件。
- 一種對細胞進行基因編輯之方法,該方法包括使宿主細胞與如請求項1-61中任一項所述之基因編輯系統或如請求項62所述之藥物組成物接觸以對該宿主細胞進行基因編輯。
- 如請求項64所述之方法,其中該宿主細胞在體外培養。
- 如請求項65所述之方法,其中該接觸步驟藉由向包含該宿主細胞的受試者投與該基因編輯系統來進行。
- 一種經基因修飾的細胞的群體,該群體藉由如請求項1-61中任一項所述之基因編輯系統產生。
- 如請求項67所述之經基因修飾的細胞的群體,該群體包含不能被該基因編輯系統編輯的經基因修飾的細胞。
- 如請求項68所述之經基因修飾的細胞的群體,其中該等經基因修飾的細胞在該PAM、該靶序列或兩者中包含一或多個修飾。
- 一種基因編輯RNA分子,其包含: (i) 可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點); (ii) 對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰; (iii) 引物結合位點(PBS);以及 (iv) 模板序列。
- 如請求項70所述之基因編輯RNA分子,其進一步包含一或多個連接子。
- 如請求項70或請求項71所述之基因編輯RNA分子,其中該RNA分子從5’到3’包含: (i) 該CRISPR核酸酶結合位點、該間隔子序列、該模板序列和該PBS; (ii) 該CRISPR核酸酶結合位點、該間隔子序列、該連接子、該模板序列和該PBS; (iii) 該模板序列、該PBS、該CRISPR核酸酶結合位點和該間隔子序列;或者 (iv) 該模板序列、該PBS、該連接子、該CRISPR核酸酶結合位點和該間隔子序列。
- 如請求項70-72中任一項所述之基因編輯RNA分子,其進一步包含5’末端保護片段、3’末端保護片段或兩者。
- 如請求項73所述之基因編輯RNA分子,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
- 如請求項73所述之基因編輯RNA分子,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
- 一種基因編輯RNA分子組,其包含: (i) 指導RNA,該指導RNA包含可被V型CRISPR核酸酶識別的一或多個結合位點(CRISPR核酸酶結合位點),和對遺傳位點內的靶序列具有特異性的間隔子序列,該靶序列與原間隔子相鄰模體(PAM)相鄰;以及 (ii) 反轉錄供體RNA(RT供體RNA)或編碼該RT供體RNA的第四核酸,其中該RT供體RNA包含引物結合位點(PBS)和模板序列。
- 如請求項76所述之基因編輯RNA分子組,其中該gRNA、該RT供體RNA或兩者進一步包含5’末端保護片段和/或3’末端保護片段。
- 如請求項77所述之基因編輯RNA分子組,其中該5’末端保護片段和/或該3’末端保護片段形成二級結構,該二級結構視需要是髮夾、假結或三鏈體結構,或其中該5’末端保護片段和/或該3’末端保護片段係外切核糖核酸酶抗性RNA(xrRNA)、轉移RNA(tRNA)或截短的tRNA。
- 如請求項77所述之基因編輯RNA分子組,其中該5’末端保護片段和/或該3’末端保護片段包含該CRISPR核酸酶結合位點中的一或多個,以及視需要與任何人序列不同源的一或多個區段。
- 如請求項70-75中任一項所述之基因編輯RNA分子或如請求項76-79中任一項所述之基因編輯RNA分子組,其中: (i) 該V型CRISPR核酸酶結合位點如請求項25-28中的任一項中所述; (ii) 該間隔子如請求項23-24中的任一項中所述; (iii) 該PBS如請求項33-37中的任一項中所述;和/或 (iv) 該模板序列如請求項38-41中的任一項中所述。
- 一種DNA分子或DNA分子組,其編碼如請求項70-80中任一項所示的基因編輯RNA分子或基因編輯RNA分子組。
- 如請求項81所述之DNA分子或DNA分子組,其包括在載體或載體組中,視需要其中該載體或載體組係病毒載體。
- 一種融合多肽,其包含CRISPR核酸酶和反轉錄酶。
- 如請求項83所述之融合多肽,其中該CRISPR核酸酶係V型CRISPR核酸酶,該V型CRISPR核酸酶視需要是Cas12i多肽。
- 如請求項84所述之融合多肽,其中該Cas12i多肽係Cas12i2多肽,該Cas12i2多肽視需要如請求項4-9中的任一項中所述。
- 如請求項85所述之融合多肽,其包含SEQ ID NO: 25-26和219-223中任一個的胺基酸序列。
- 一種核酸,其包含編碼如請求項83-86中任一項所述之融合多肽的核苷酸序列。
- 如請求項87所述之核酸,其係載體,視需要表現載體。
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163195621P | 2021-06-01 | 2021-06-01 | |
US63/195,621 | 2021-06-01 | ||
US202163236047P | 2021-08-23 | 2021-08-23 | |
US63/236,047 | 2021-08-23 | ||
US202163272937P | 2021-10-28 | 2021-10-28 | |
US63/272,937 | 2021-10-28 | ||
US202263299695P | 2022-01-14 | 2022-01-14 | |
US63/299,695 | 2022-01-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202313971A true TW202313971A (zh) | 2023-04-01 |
Family
ID=82492907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111120437A TW202313971A (zh) | 2021-06-01 | 2022-06-01 | 包含crispr核酸酶的基因編輯系統及其用途 |
Country Status (10)
Country | Link |
---|---|
US (2) | US20240102007A1 (zh) |
EP (1) | EP4347818A2 (zh) |
JP (1) | JP2024520528A (zh) |
KR (1) | KR20240031238A (zh) |
AU (1) | AU2022284804A1 (zh) |
BR (1) | BR112023024985A2 (zh) |
CA (1) | CA3222023A1 (zh) |
IL (1) | IL308806A (zh) |
TW (1) | TW202313971A (zh) |
WO (1) | WO2022256440A2 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024163585A1 (en) * | 2023-02-01 | 2024-08-08 | Arbor Biotechnologies, Inc. | Gene editing systems comprising type v crispr nuclease and engineered guide rna |
US20240301447A1 (en) | 2023-02-15 | 2024-09-12 | Arbor Biotechnologies, Inc. | Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
AU2013359212B2 (en) | 2012-12-12 | 2017-01-19 | Massachusetts Institute Of Technology | Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
EP3825401A1 (en) | 2012-12-12 | 2021-05-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
ES2598115T3 (es) | 2012-12-12 | 2017-01-25 | The Broad Institute, Inc. | Ingeniería de sistemas, métodos y composiciones de guía optimizadas para manipulación de secuencias |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
AU2014281027A1 (en) | 2013-06-17 | 2016-01-28 | Massachusetts Institute Of Technology | Optimized CRISPR-Cas double nickase systems, methods and compositions for sequence manipulation |
WO2015070083A1 (en) | 2013-11-07 | 2015-05-14 | Editas Medicine,Inc. | CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS |
WO2015089427A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes |
WO2015089277A1 (en) | 2013-12-12 | 2015-06-18 | The Regents Of The University Of California | Methods and compositions for modifying a single stranded target nucleic acid |
WO2015089473A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
US9963689B2 (en) | 2013-12-31 | 2018-05-08 | The Regents Of The University Of California | Cas9 crystals and methods of use thereof |
ES2780904T3 (es) | 2014-08-17 | 2020-08-27 | Broad Inst Inc | Edición genómica usando nickasas Cas9 |
EP3188763B1 (en) | 2014-09-02 | 2020-05-13 | The Regents of The University of California | Methods and compositions for rna-directed target dna modification |
US11053271B2 (en) | 2014-12-23 | 2021-07-06 | The Regents Of The University Of California | Methods and compositions for nucleic acid integration |
AU2016265560B2 (en) | 2015-05-15 | 2022-07-28 | Pioneer Hi-Bred International, Inc. | Rapid characterization of Cas endonuclease systems, PAM sequences and guide RNA elements |
WO2016196655A1 (en) | 2015-06-03 | 2016-12-08 | The Regents Of The University Of California | Cas9 variants and methods of use thereof |
US20160362667A1 (en) | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2016205749A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Novel crispr enzymes and systems |
FI3430134T3 (fi) | 2015-06-18 | 2023-01-13 | Uusia CRISPR-entsyymejä ja järjestelmiä | |
US9580727B1 (en) | 2015-08-07 | 2017-02-28 | Caribou Biosciences, Inc. | Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides |
WO2017048969A1 (en) | 2015-09-17 | 2017-03-23 | The Regents Of The University Of California | Variant cas9 polypeptides comprising internal insertions |
WO2017070605A1 (en) | 2015-10-22 | 2017-04-27 | The Broad Institute Inc. | Type vi-b crispr enzymes and systems |
US9677090B2 (en) | 2015-10-23 | 2017-06-13 | Caribou Biosciences, Inc. | Engineered nucleic-acid targeting nucleic acids |
SG11201803593QA (en) | 2015-12-04 | 2018-06-28 | Caribou Biosciences Inc | Engineered nucleic-acid targeting nucleic acids |
US20190233814A1 (en) | 2015-12-18 | 2019-08-01 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2017106569A1 (en) | 2015-12-18 | 2017-06-22 | The Regents Of The University Of California | Modified site-directed modifying polypeptides and methods of use thereof |
WO2017184768A1 (en) | 2016-04-19 | 2017-10-26 | The Broad Institute Inc. | Novel crispr enzymes and systems |
EP3445856A1 (en) | 2016-04-19 | 2019-02-27 | The Broad Institute Inc. | Novel crispr enzymes and systems |
US11788083B2 (en) | 2016-06-17 | 2023-10-17 | The Broad Institute, Inc. | Type VI CRISPR orthologs and systems |
CN110114461A (zh) | 2016-08-17 | 2019-08-09 | 博德研究所 | 新型crispr酶和系统 |
US20200283743A1 (en) | 2016-08-17 | 2020-09-10 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
US11371062B2 (en) | 2016-09-30 | 2022-06-28 | The Regents Of The University Of California | RNA-guided nucleic acid modifying enzymes and methods of use thereof |
CA3038960A1 (en) | 2016-09-30 | 2018-04-05 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
EP3526326A4 (en) | 2016-10-12 | 2020-07-29 | The Regents of The University of Colorado, A Body Corporate | NEW MODIFIED AND CHEMERICAL NUCLEASES |
EP3538561A4 (en) | 2016-11-11 | 2020-10-21 | The Regents of The University of California | RNA-GUIDED POLYPEPTIDE VARIANTS AND METHOD OF USING |
US9816093B1 (en) | 2016-12-06 | 2017-11-14 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
KR102185464B1 (ko) | 2017-03-15 | 2020-12-03 | 매사추세츠 인스티튜트 오브 테크놀로지 | 신규 cas13b 오르소로그 crispr 효소 및 시스템 |
EP3985113A1 (en) | 2017-03-28 | 2022-04-20 | Locanabio, Inc. | Crispr-associated (cas) protein |
CA3059757A1 (en) | 2017-04-12 | 2018-10-18 | The Broad Institute, Inc. | Novel type vi crispr orthologs and systems |
WO2018213351A1 (en) | 2017-05-16 | 2018-11-22 | The Regents Of The University Of California | Thermostable rna-guided endonucleases and methods of use thereof |
US20200140835A1 (en) | 2017-06-06 | 2020-05-07 | The General Hospital Corporation | Engineered CRISPR-Cas9 Nucleases |
MX2019015047A (es) | 2017-06-23 | 2020-08-03 | Inscripta Inc | Nucleasas guiadas por acidos nucleicos. |
EP3645728A4 (en) | 2017-06-26 | 2021-03-24 | The Broad Institute, Inc. | NEW CRISPR TYPE VI ORTHOLOGISTS AND RELATED SYSTEMS |
US10392616B2 (en) | 2017-06-30 | 2019-08-27 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
EP3655530A4 (en) | 2017-07-17 | 2021-07-28 | The Broad Institute, Inc. | NEW TYPE VI CRISPR ORTHOLOGIST AND SYSTEMS |
US20200115688A1 (en) | 2017-08-15 | 2020-04-16 | The Regents Of The University Of California | Compositions and methods for enhancing genome editing |
WO2019071048A1 (en) | 2017-10-04 | 2019-04-11 | The Broad Institute, Inc. | SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION |
EP3704254A4 (en) | 2017-11-01 | 2021-09-01 | The Regents of The University of California | CAS12C COMPOSITIONS AND METHOD OF USE |
WO2019089820A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Casz compositions and methods of use |
WO2019089804A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Casy compositions and methods of use |
WO2019089808A1 (en) | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Class 2 crispr/cas compositions and methods of use |
US10253365B1 (en) | 2017-11-22 | 2019-04-09 | The Regents Of The University Of California | Type V CRISPR/Cas effector proteins for cleaving ssDNAs and detecting target DNAs |
US20210079366A1 (en) | 2017-12-22 | 2021-03-18 | The Broad Institute, Inc. | Cas12a systems, methods, and compositions for targeted rna base editing |
US20200392473A1 (en) | 2017-12-22 | 2020-12-17 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2019173248A1 (en) | 2018-03-07 | 2019-09-12 | Caribou Biosciences, Inc. | Engineered nucleic acid-targeting nucleic acids |
AU2019236210A1 (en) * | 2018-03-14 | 2020-09-10 | Arbor Biotechnologies, Inc. | Novel CRISPR DNA targeting enzymes and systems |
US20230242891A1 (en) | 2018-03-14 | 2023-08-03 | Arbor Biotechnologies, Inc. | Novel crispr dna and rna targeting enzymes and systems |
WO2019222555A1 (en) | 2018-05-16 | 2019-11-21 | Arbor Biotechnologies, Inc. | Novel crispr-associated systems and components |
EP4219720A3 (en) | 2018-06-13 | 2023-08-30 | Caribou Biosciences, Inc. | Engineered cascade components and cascade complexes |
WO2020005980A1 (en) | 2018-06-26 | 2020-01-02 | The Regents Of The University Of California | Rna-guided effector proteins and methods of use thereof |
US20210301288A1 (en) | 2018-07-16 | 2021-09-30 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
WO2020023529A1 (en) | 2018-07-24 | 2020-01-30 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
SG11202102068TA (en) | 2018-07-31 | 2021-03-30 | Broad Inst Inc | Novel crispr enzymes and systems |
WO2020028729A1 (en) | 2018-08-01 | 2020-02-06 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
WO2020033601A1 (en) | 2018-08-07 | 2020-02-13 | The Broad Institute, Inc. | Novel cas12b enzymes and systems |
WO2020041456A1 (en) | 2018-08-22 | 2020-02-27 | The Regents Of The University Of California | Variant type v crispr/cas effector polypeptides and methods of use thereof |
AU2019368215B2 (en) | 2018-10-22 | 2023-05-18 | Inscripta, Inc. | Engineered enzymes |
WO2020142754A2 (en) | 2019-01-04 | 2020-07-09 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
WO2020180699A1 (en) | 2019-03-01 | 2020-09-10 | Arbor Biotechnologies, Inc. | Novel crispr dna targeting enzymes and systems |
JP2022522650A (ja) | 2019-03-07 | 2022-04-20 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | Crispr-casエフェクターポリペプチド及びその使用方法 |
WO2020181101A1 (en) | 2019-03-07 | 2020-09-10 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
US20220154222A1 (en) | 2019-03-14 | 2022-05-19 | The Broad Institute, Inc. | Novel nucleic acid modifiers |
WO2020191102A1 (en) | 2019-03-18 | 2020-09-24 | The Broad Institute, Inc. | Type vii crispr proteins and systems |
WO2020191249A1 (en) * | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
CN113891893A (zh) | 2019-03-22 | 2022-01-04 | 加利福尼亚大学董事会 | 用于修饰靶分子的组合物和方法 |
US20220162649A1 (en) | 2019-04-01 | 2022-05-26 | The Broad Institute, Inc. | Novel nucleic acid modifiers |
AU2020265256A1 (en) | 2019-05-01 | 2021-12-23 | Mammoth Biosciences, Inc. | Programmable nucleases and methods of use |
PE20220256A1 (es) | 2019-06-07 | 2022-02-21 | Scribe Therapeutics Inc | Sistemas de casx artificiales |
WO2020247883A2 (en) | 2019-06-07 | 2020-12-10 | Scribe Therapeutics Inc. | Deep mutational evolution of biomolecules |
AU2020291467A1 (en) | 2019-06-14 | 2021-12-23 | Arbor Biotechnologies, Inc. | Novel crispr DNA targeting enzymes and systems |
US20220315914A1 (en) | 2019-07-08 | 2022-10-06 | The Regents Of The University Of California | Variant type v crispr/cas effector polypeptides and methods of use thereof |
EP3996738A4 (en) | 2019-07-11 | 2023-07-26 | Arbor Biotechnologies, Inc. | NOVEL ENZYMES AND SYSTEMS TARGETING CRISPR DNA |
AU2020340353A1 (en) | 2019-08-27 | 2022-03-24 | Arbor Biotechnologies, Inc. | Novel CRISPR DNA targeting enzymes and systems |
EP4025588A4 (en) | 2019-09-05 | 2023-09-06 | Arbor Biotechnologies, Inc. | NOVEL CRISPR DNA TARGETING ENZYMES AND SYSTEMS |
KR20220054434A (ko) | 2019-09-09 | 2022-05-02 | 아버 바이오테크놀로지스, 인크. | 신규한 crispr dna 표적화 효소 및 시스템 |
CA3151563A1 (en) | 2019-09-20 | 2021-03-25 | Feng Zhang | Novel type vi crispr enzymes and systems |
WO2021092130A1 (en) * | 2019-11-05 | 2021-05-14 | Pairwise Plants Services, Inc. | Compositions and methods for rna-encoded dna-replacement of alleles |
EP4069850A4 (en) | 2019-12-04 | 2024-03-27 | Arbor Biotechnologies, Inc. | COMPOSITIONS COMPRISING A NUCLEASE AND THEIR USES |
US10883095B1 (en) | 2019-12-10 | 2021-01-05 | Inscripta, Inc. | Mad nucleases |
US10704033B1 (en) | 2019-12-13 | 2020-07-07 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US20230028178A1 (en) | 2019-12-23 | 2023-01-26 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
MX2022012189A (es) * | 2020-03-31 | 2023-01-05 | Arbor Biotechnologies Inc | Composiciones que comprenden una variante del polipéptido cas12i2 y usos de las mismas. |
-
2022
- 2022-06-01 BR BR112023024985A patent/BR112023024985A2/pt unknown
- 2022-06-01 US US18/565,148 patent/US20240102007A1/en active Pending
- 2022-06-01 KR KR1020237044997A patent/KR20240031238A/ko unknown
- 2022-06-01 WO PCT/US2022/031821 patent/WO2022256440A2/en active Application Filing
- 2022-06-01 AU AU2022284804A patent/AU2022284804A1/en active Pending
- 2022-06-01 IL IL308806A patent/IL308806A/en unknown
- 2022-06-01 TW TW111120437A patent/TW202313971A/zh unknown
- 2022-06-01 JP JP2023573350A patent/JP2024520528A/ja active Pending
- 2022-06-01 US US17/830,212 patent/US20230023791A1/en active Pending
- 2022-06-01 CA CA3222023A patent/CA3222023A1/en active Pending
- 2022-06-01 EP EP22741037.0A patent/EP4347818A2/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022284804A9 (en) | 2023-12-14 |
WO2022256440A2 (en) | 2022-12-08 |
US20240102007A1 (en) | 2024-03-28 |
AU2022284804A1 (en) | 2023-12-07 |
KR20240031238A (ko) | 2024-03-07 |
IL308806A (en) | 2024-01-01 |
US20230023791A1 (en) | 2023-01-26 |
BR112023024985A2 (pt) | 2024-02-20 |
WO2022256440A3 (en) | 2023-02-09 |
EP4347818A2 (en) | 2024-04-10 |
CA3222023A1 (en) | 2022-12-08 |
JP2024520528A (ja) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115698278A (zh) | 包含Cas12i2变体多肽的组合物及其用途 | |
US20230083383A1 (en) | Compositions and methods for targeting, editing or modifying human genes | |
TW202313971A (zh) | 包含crispr核酸酶的基因編輯系統及其用途 | |
KR20240052763A (ko) | 스타스민 2 (stmn2)를 표적화하는 rna 가이드를 포함하는 유전자 편집 시스템 및 이의 용도 | |
US20230287456A1 (en) | Compositions comprising a cas12i polypeptide and uses thereof | |
JP2024531607A (ja) | Crisprヌクレアーゼを含む組成物及びその使用 | |
JP2023549084A (ja) | Pdcd1を標的とするrnaガイドを含む組成物及びその使用 | |
JP2023543108A (ja) | Rna足場 | |
WO2024163585A1 (en) | Gene editing systems comprising type v crispr nuclease and engineered guide rna | |
CN117813379A (zh) | 包括crispr核酸酶的基因编辑系统和其用途 | |
US20230399639A1 (en) | Compositions comprising an rna guide targeting b2m and uses thereof | |
US20230193243A1 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof | |
JP2023548588A (ja) | Tracを標的とするrnaガイドを含む組成物及びその使用 | |
JP2023549080A (ja) | Bcl11aを標的とするrnaガイドを含む組成物及びその使用 | |
WO2023081377A2 (en) | Compositions comprising an rna guide targeting ciita and uses thereof | |
JP2024520691A (ja) | ヒドロキシ酸オキシダーゼ1(hao1)を標的とするrnaガイドを含む遺伝子編集システム及びそれらの使用 | |
WO2024118747A1 (en) | Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
WO2023137451A1 (en) | Compositions comprising an rna guide targeting cd38 and uses thereof | |
CN118019846A (zh) | 包含crispr核酸酶的组合物及其用途 | |
WO2022266538A2 (en) | Compositions and methods for targeting, editing or modifying human genes | |
WO2024081383A2 (en) | Compositions and methods for targeting, editing, or modifying genes | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 | |
CN117940153A (zh) | 用于基于细胞的疗法的程序性细胞死亡蛋白1(pd1)组合物和方法 |