CN118019846A - 包含crispr核酸酶的组合物及其用途 - Google Patents
包含crispr核酸酶的组合物及其用途 Download PDFInfo
- Publication number
- CN118019846A CN118019846A CN202280061213.8A CN202280061213A CN118019846A CN 118019846 A CN118019846 A CN 118019846A CN 202280061213 A CN202280061213 A CN 202280061213A CN 118019846 A CN118019846 A CN 118019846A
- Authority
- CN
- China
- Prior art keywords
- change comprises
- variant polypeptide
- nucleic acid
- variant
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 53
- 101710163270 Nuclease Proteins 0.000 title claims description 38
- 108091033409 CRISPR Proteins 0.000 title 1
- 238000010354 CRISPR gene editing Methods 0.000 title 1
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 907
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 900
- 229920001184 polypeptide Polymers 0.000 claims abstract description 893
- 238000000034 method Methods 0.000 claims abstract description 88
- 230000008859 change Effects 0.000 claims description 1212
- 150000007523 nucleic acids Chemical class 0.000 claims description 431
- 102000039446 nucleic acids Human genes 0.000 claims description 391
- 108020004707 nucleic acids Proteins 0.000 claims description 391
- 230000027455 binding Effects 0.000 claims description 235
- 238000006467 substitution reaction Methods 0.000 claims description 193
- 230000004075 alteration Effects 0.000 claims description 159
- 125000003729 nucleotide group Chemical group 0.000 claims description 135
- 239000002773 nucleotide Substances 0.000 claims description 130
- 210000004027 cell Anatomy 0.000 claims description 125
- 230000002255 enzymatic effect Effects 0.000 claims description 99
- 230000002829 reductive effect Effects 0.000 claims description 73
- 102000053602 DNA Human genes 0.000 claims description 65
- 108020004414 DNA Proteins 0.000 claims description 65
- 239000013598 vector Substances 0.000 claims description 59
- 230000000694 effects Effects 0.000 claims description 56
- 150000001413 amino acids Chemical group 0.000 claims description 51
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 42
- 108090000623 proteins and genes Proteins 0.000 claims description 39
- 230000000295 complement effect Effects 0.000 claims description 35
- 230000004048 modification Effects 0.000 claims description 35
- 238000012986 modification Methods 0.000 claims description 35
- 125000006850 spacer group Chemical group 0.000 claims description 32
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 21
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 239000013603 viral vector Substances 0.000 claims description 16
- 238000012217 deletion Methods 0.000 claims description 14
- 230000037430 deletion Effects 0.000 claims description 14
- 108020004999 messenger RNA Proteins 0.000 claims description 14
- 230000002746 orthostatic effect Effects 0.000 claims description 13
- 239000002502 liposome Substances 0.000 claims description 12
- 210000001808 exosome Anatomy 0.000 claims description 11
- 239000002105 nanoparticle Substances 0.000 claims description 11
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 10
- 108020004705 Codon Proteins 0.000 claims description 7
- 230000003197 catalytic effect Effects 0.000 claims description 7
- 238000004520 electroporation Methods 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 7
- 210000004962 mammalian cell Anatomy 0.000 claims description 7
- 125000000539 amino acid group Chemical group 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 238000002347 injection Methods 0.000 claims description 6
- 239000007924 injection Substances 0.000 claims description 6
- 230000002463 transducing effect Effects 0.000 claims description 6
- 108010077544 Chromatin Proteins 0.000 claims description 4
- 210000003483 chromatin Anatomy 0.000 claims description 4
- 108091006047 fluorescent proteins Proteins 0.000 claims description 4
- 102000034287 fluorescent proteins Human genes 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 230000007067 DNA methylation Effects 0.000 claims description 3
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 3
- 208000009889 Herpes Simplex Diseases 0.000 claims description 3
- 108010033040 Histones Proteins 0.000 claims description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 3
- 235000003704 aspartic acid Nutrition 0.000 claims description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 3
- 235000013922 glutamic acid Nutrition 0.000 claims description 3
- 239000004220 glutamic acid Substances 0.000 claims description 3
- 230000004807 localization Effects 0.000 claims description 3
- 230000001177 retroviral effect Effects 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 108020005004 Guide RNA Proteins 0.000 claims description 2
- 210000004899 c-terminal region Anatomy 0.000 claims 1
- 229920002477 rna polymer Polymers 0.000 description 261
- 235000001014 amino acid Nutrition 0.000 description 121
- 125000003275 alpha amino acid group Chemical group 0.000 description 99
- 230000009918 complex formation Effects 0.000 description 77
- 238000010494 dissociation reaction Methods 0.000 description 76
- 230000005593 dissociations Effects 0.000 description 76
- 230000001965 increasing effect Effects 0.000 description 49
- 229940024606 amino acid Drugs 0.000 description 47
- 230000003993 interaction Effects 0.000 description 47
- 239000000872 buffer Substances 0.000 description 39
- 230000035772 mutation Effects 0.000 description 29
- 102000040430 polynucleotide Human genes 0.000 description 29
- 108091033319 polynucleotide Proteins 0.000 description 29
- 239000002157 polynucleotide Substances 0.000 description 26
- 230000001747 exhibiting effect Effects 0.000 description 25
- 230000008685 targeting Effects 0.000 description 22
- 238000011534 incubation Methods 0.000 description 19
- 102000004169 proteins and genes Human genes 0.000 description 15
- 235000018102 proteins Nutrition 0.000 description 13
- 230000000717 retained effect Effects 0.000 description 13
- 102000004389 Ribonucleoproteins Human genes 0.000 description 12
- 108010081734 Ribonucleoproteins Proteins 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 11
- -1 system Proteins 0.000 description 10
- 239000002777 nucleoside Substances 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 230000026279 RNA modification Effects 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 235000021317 phosphate Nutrition 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 210000001236 prokaryotic cell Anatomy 0.000 description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Chemical group NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Chemical group 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 5
- 230000000536 complexating effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical group OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- 108091079001 CRISPR RNA Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical group NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 239000004471 Glycine Chemical group 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical group NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical group OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Chemical group OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Chemical group OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 229940096913 pseudoisocytidine Drugs 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012384 transportation and delivery Methods 0.000 description 3
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical group C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical group OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 238000002983 circular dichroism Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000000111 isothermal titration calorimetry Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 150000008298 phosphoramidates Chemical class 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000013615 primer Substances 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- UHLXKKURVBBPRP-IOSLPCCCSA-N (2R,3R,4S,5R)-2-(6-amino-7-methylpurin-9-ium-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound Cn1c[n+]([C@@H]2O[C@H](CO)[C@@H](O)[C@H]2O)c2ncnc(N)c12 UHLXKKURVBBPRP-IOSLPCCCSA-N 0.000 description 1
- ZLVITLNPCSHOGL-CKTDUXNWSA-N (2s,3r)-2-amino-n-[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]-3-hydroxybutanamide Chemical compound C1=NC=2C(NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZLVITLNPCSHOGL-CKTDUXNWSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- HQHQCEKUGWOYPS-URBBEOKESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(octadecylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 HQHQCEKUGWOYPS-URBBEOKESA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- LCKIHCRZXREOJU-KYXWUPHJSA-N 2-[[5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]methylamino]ethanesulfonic acid Chemical compound C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O LCKIHCRZXREOJU-KYXWUPHJSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- PULHLIOPJXPGJN-BWVDBABLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)-3-methylideneoxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C)[C@H](O)[C@@H](CO)O1 PULHLIOPJXPGJN-BWVDBABLSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- XUNBIDXYAUXNKD-DBRKOABJSA-N 5-aza-2-thio-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)N=CN=C1 XUNBIDXYAUXNKD-DBRKOABJSA-N 0.000 description 1
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- RPQQZHJQUBDHHG-FNCVBFRFSA-N 5-methyl-zebularine Chemical compound C1=C(C)C=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RPQQZHJQUBDHHG-FNCVBFRFSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- XMIFBEZRFMTGRL-TURQNECASA-N OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S XMIFBEZRFMTGRL-TURQNECASA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102220466922 Podocalyxin_T60R_mutation Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 102220573260 Ras-related protein Ral-A_E38R_mutation Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102220494750 Somatostatin receptor type 2_D89R_mutation Human genes 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 102220512310 Vitamin K-dependent protein C_S223R_mutation Human genes 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 150000008209 arabinosides Chemical class 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 238000003271 compound fluorescence assay Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000000113 differential scanning calorimetry Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000009088 enzymatic function Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 238000011330 nucleic acid test Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000010512 thermal transition Effects 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 1
- RXRGZNYSEHTMHC-BQBZGAKWSA-N troxacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)OC1 RXRGZNYSEHTMHC-BQBZGAKWSA-N 0.000 description 1
- 229950010147 troxacitabine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本披露涉及变体多肽、制备这些变体多肽的方法、用于表征这些变体多肽的工艺、包含这些变体多肽的组合物和细胞以及使用这些变体多肽的方法。本披露进一步涉及包含这些变体多肽的复合物、产生这些复合物的方法、用于表征这些复合物的工艺、包含这些复合物的细胞以及使用这些复合物的方法。
Description
相关申请的交叉引用
本申请要求于2021年9月8日提交的美国临时申请号63/241,821以及于2022年1月5日提交的美国临时申请号63/296,741的权益。前述申请的内容通过引用以其全文特此并入。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
发明内容
正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。
尽管本文披露的本发明不限于特定的优点或功能,但本发明提供了变体多肽和/或包含变体多肽的组合物,其中相对于亲本多肽,该变体多肽包含改变,其中该亲本多肽包含SEQ ID NO:3,其中该变体多肽能够与RNA指导物和靶核酸结合,并且其中相对于亲本多肽或包含亲本多肽的复合物,该变体多肽或包含变体多肽的复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
在一些实施例中,本发明的变体多肽包含与SEQ ID NO:3具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%但非100%同一性的多肽序列。
在一方面,本披露提供了变体多肽,其中相对于SEQ ID NO:3的氨基酸序列,该变体多肽包含改变,其中该改变包含D509R、S511R、I521R、D535G、Q514G、L516R、L516G、E198R、S527R、D509K、D509G、L580G、V359R、D535K、Y381R、R354G、M380K、M380R、V383R、L580R、E367R、I521K、E367G、E507R、I521G、W350R、D535R、R528K、S527K、L385G、W350G、L516K、Y381G、H532R、D129R、P615R、G578R、M380G、V595G、R531G、D129G、R531K、D158G、N476G、G578K、A512R、P618R、V595R、V595K、V383G、A597G、Y381K、P618G、E198K、T288R、E507K、L385R、C538G、P615G、D386R、S511K、C371G、K136G、N220R、S78K、K141G、K240R、D277R、T165R、或K374R,其中该变体多肽与SEQ ID NO:3的氨基酸序列具有至少90%同一性。
在一方面,本披露提供了变体多肽,其中相对于SEQ ID NO:3的氨基酸序列,该变体多肽包含改变,其中该改变包含D509R、S511R、I521R、D535G、Q514G、L516R、L516G、E198R、S527R、D509K、D509G、L580G、V359R、D535K、Y381R、R354G、M380K、M380R、V383R、L580R、E367R、I521K、E367G、E507R、I521G、W350R、D535R、R528K、S527K、L385G、W350G、L516K、Y381G、H532R、D129R、P615R、G578R、M380G、V595G、R531G、D129G、R531K、D158G、N476G、G578K、A512R、P618R、V595R、V595K、V383G、A597G、Y381K、P618G、E198K、T288R、E507K、L385R、C538G、P615G、D386R、S511K、或C371G、K136G、N220R、S78K、K141G、K240R、D277R、T165R、或K374R,并且其中该变体多肽与SEQ ID NO:3的氨基酸序列相差1-20个氨基酸残基。
在一些实施例中,变体多肽与SEQ ID NO:3的氨基酸序列相差1至50个氨基酸残基(例如,1至45、1至35、1至25、1至15和10、以及1至5、5至50、5至40、5至30、5至20、5至10、10至50、10至40、10至30、10至20、10至15、15至50、15至40、15至30、15至20、20至50、20至40、20至30、20至35、25至50、25至40、25至30、30至50、30至40、30至35、或40至50个氨基酸残基)。在一些实施例中,变体多肽与SEQ ID NO:3的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1个氨基酸残基。
在一些实施例中,相对于SEQ ID NO:3的氨基酸序列,变体多肽进一步包含第二改变。在某些实施例中,
i)改变包含L580G并且第二改变包含L385G
ii)改变包含D509R并且第二改变包含M380R;
iii)改变包含L580G并且第二改变包含A512R;
iv)改变包含S527R并且第二改变包含C538G;
v)改变包含D129R并且第二改变包含P618R;或
vi)改变包含Q514G并且第二改变包含A512R。
在一些实施例中,相对于SEQ ID NO:3的氨基酸序列,变体多肽进一步包含第三改变。在一些实施例中,
i)改变包含D535G,第二改变包含L516R,并且第三改变包含I521R;
ii)改变包含L516R,第二改变包含Q514G,并且第三改变包含I521R;
iii)改变包含D509R,第二改变包含L516R,并且第三改变包含I521R;
iv)改变包含D535G,第二改变包含L516R,并且第三改变包含Q514G;
v)改变包含D535G,第二改变包含Q514G,并且第三改变包含I521R;
vi)改变包含K136G,第二改变包含N220R,并且第三改变包含M380R
vii)改变包含S78K,第二改变包含E198R,并且第三改变包含R354G;
viii)改变包含K141G,第二改变包含N220R,并且第三改变包含M380R;
ix)改变包含K141G,第二改变包含K240R,并且第三改变包含M380R;以及
x)改变包含K141G,第二改变包含D277R,并且第三改变包含M380R。
在一些实施例中,改变包含D535G,第二改变包含L516R,并且第三改变包含I521R。在一些实施例中,改变包含L516R,第二改变包含Q514G,并且第三改变包含I521R。在一些实施例中,改变包含D509R,第二改变包含L516R,并且第三改变包含I521R。在一些实施例中,改变包含D535G,第二改变包含L516R,并且第三改变包含Q514G。在一些实施例中,改变包含D535G,第二改变包含Q514G,并且第三改变包含I521R。在一些实施例中,改变包含D509R,第二改变包含D535G,并且第三改变包含L516R。在一些实施例中,改变包含D509R,第二改变包含L516R,并且第三改变包含Q514G。在一些实施例中,改变包含D509R,第二改变包含Q514G,并且第三改变包含I521R。在一些实施例中,改变包含D509R,第二改变包含D535G,并且第三改变包含I521R。在一些实施例中,改变包含D509R,第二改变包含D535G,并且第三改变包含Q514G。在一些实施例中,改变包含K136G,第二改变包含N220R,并且第三改变包含M380R。在一些实施例中,改变包含S78K,第二改变包含E198R,并且第三改变包含R354G。在一些实施例中,改变包含K141G,第二改变包含N220R,并且第三改变包含M380R。在一些实施例中,改变包含K141G,第二改变包含K240R,并且第三改变包含M380R。在一些实施例中,改变包含K141G,第二改变包含D277R,并且第三改变包含M380R。在一些实施例中,改变包含K136G,第二改变包含D277R,并且第三改变包含M380R。在一些实施例中,改变包含S78K,第二改变包含E198R,并且第三改变包含L385R。在一些实施例中,改变包含S78K,第二改变包含E198R,并且第三改变包含M380R。在一些实施例中,改变包含K136G,第二改变包含K240R,并且第三改变包含M380R。在一些实施例中,改变包含T165R,第二改变包含N220R,并且第三改变包含M380R。在一些实施例中,改变包含S78K,第二改变包含E198R,并且第三改变包含K374R。在一些实施例中,改变包含T165R,第二改变包含D277R,并且第三改变包含M380R。在一些实施例中,改变包含T165R,第二改变包含K240R,并且第三改变包含M380R。在一些实施例中,改变包含K141G,第二改变包含K240R,并且第三改变包含L385R。在一些实施例中,改变包含K136G,第二改变包含N220R,并且第三改变包含L385R。在一些实施例中,改变包含K141G,第二改变包含N220R,并且第三改变包含L385R。在一些实施例中,改变包含K141G,第二改变包含D277R,并且第三改变包含L385R。在一些实施例中,改变包含K136G,第二改变包含N220R,并且第三改变包含K374R。在一些实施例中,改变包含K136G,第二改变包含D277R,并且第三改变包含L385R。在一些实施例中,改变包含K136G,第二改变包含K240R,并且第三改变包含L385R。在一些实施例中,改变包含T165R,第二改变包含K240R,并且第三改变包含L385R。
在某些实施例中,相对于SEQ ID NO:3的氨基酸,变体多肽进一步包含第四改变。在一些实施例中,改变包含Q514G,第二改变包含I521R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含Q514G,第三改变包含I521R,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含L516R,第三改变包含Q514G,并且第四改变包含I521R。在一些实施例中,改变包含Q514G,第二改变包含I521R,第三改变包含S527R,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含L516R,第三改变包含I521R,并且第四改变包含S527R。在一些实施例中,改变包含D535G,第二改变包含I521R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含I521R,第二改变包含S527R,第三改变包含E198R,并且第四改变包含M380R。在一些实施例中,改变包含D535G,第二改变包含L516R,第三改变包含Q514G,并且第四改变包含S511R。在一些实施例中,改变包含D535G,第二改变包含L516R,第三改变包含Q514G,并且第四改变包含S527R。在一些实施例中,改变包含I521R,第二改变包含S527R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含L516R,第三改变包含S527R,并且第四改变包含M380R。在一些实施例中,改变包含Q514G,第二改变包含S527R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含L516R,第二改变包含Q514G,第三改变包含I521R,并且第四改变包含M380R。在一些实施例中,改变包含D509R,第二改变包含L516R,第三改变包含Q514G,并且第四改变包含S527R。在一些实施例中,改变包含D509R,第二改变包含I521R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含S527R,第二改变包含L580G,第三改变包含E198R,并且第四改变包含M380R。在一些实施例中,改变包含L516R,第二改变包含S527R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含D509R,第二改变包含Q514G,第三改变包含I521R,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含Q514G,第三改变包含I521R,并且第四改变包含S527R。在一些实施例中,改变包含Q514G,第二改变包含L580G,第三改变包含E198R,并且第四改变包含M380R。在一些实施例中,改变包含D509R,第二改变包含L516R,第三改变包含I521R,并且第四改变包含E198R。在一些实施例中,改变包含L516R,第二改变包含Q514G,第三改变包含I521R,并且第四改变包含L580G。在一些实施例中,改变包含D509R,第二改变包含D535G,第三改变包含Q514G,并且第四改变包含E198R。在一些实施例中,改变包含L516R,第二改变包含I521R,第三改变包含S527R,并且第四改变包含L580G。在一些实施例中,改变包含D535G,第二改变包含I521R,第三改变包含S527R,并且第四改变包含M380R。在一些实施例中,改变包含L516R,第二改变包含I521R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含D535G,第二改变包含S527R,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含S527R,第二改变包含L580G,第三改变包含E198R,并且第四改变包含R354G。在一些实施例中,改变包含Q514G,第二改变包含I521R,第三改变包含S527R,并且第四改变包含L580G。在一些实施例中,改变包含D535G,第二改变包含Q514G,第三改变包含E198R,并且第四改变包含M380R。在一些实施例中,改变包含L516R,第二改变包含Q514G,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含I521R,第二改变包含S527R,第三改变包含E198R,并且第四改变包含R354G。在一些实施例中,改变包含I521R,第二改变包含S527R,第三改变包含R354G,并且第四改变包含M380R。在一些实施例中,改变包含I521R,第二改变包含L580G,第三改变包含E198R,并且第四改变包含M380R。在一些实施例中,改变包含L516R,第二改变包含Q514G,第三改变包含S527R,并且第四改变包含L580G。在一些实施例中,改变包含D535G,第二改变包含Q514G,第三改变包含S527R,并且第四改变包含E198R。在一些实施例中,改变包含D509R,第二改变包含Q514G,第三改变包含L580G,并且第四改变包含E198R。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含S511R,并且第四改变包含A512R。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含Q514G,并且第四改变包含A512R。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含S511R,并且第四改变包含A512R。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含G578R,并且第四改变包含D158G。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含R354G,并且第四改变包含A512R。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含Q514G,并且第四改变包含A512R。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含S527R,并且第四改变包含L385G。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含Q514G,并且第四改变包含N476G。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含A512R,并且第四改变包含P618R。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含D158G,并且第四改变包含A512R。在一些实施例中,改变包含L580G,第二改变包含L385G,第三改变包含S527R,并且第四改变包含C538G。在一些实施例中,改变包含D129R,第二改变包含P618R,第三改变包含V359R,并且第四改变包含A512R。
在某些实施例中,相对于SEQ ID NO:3的氨基酸,变体多肽进一步包含第五改变。在一些实施例中,改变包含D509R,第二改变包含D535G,第三改变包含L516R,第四改变包含Q514G,并且第五改变包含I521R。
在某些实施例中,变体多肽进一步包含第六改变,并且任选地进一步包含第七、第八、第九和第十改变。
在一些实施例中,第二改变包含取代、插入或缺失。
在一些实施例中,第三改变包含取代、插入或缺失。
在一些实施例中,第四改变包含取代、插入或缺失。
在一些实施例中,第五改变包含取代、插入或缺失。
在一些实施例中,第六、任选地第七、任选地第八、任选地第九或任选地第十改变各自独立地包含取代、插入或缺失。
在一些实施例中,变体多肽包含表6的改变。在一些实施例中,变体多肽包含表7的改变。在一些实施例中,变体多肽包含表8的改变。在一些实施例中,变体多肽包含表9的改变。在一些实施例中,变体多肽包含表7的任何细胞的两种改变。在一些实施例中,变体多肽包含表8的任何细胞的多种改变。在一些实施例中,变体多肽包含表9的任何细胞的多种改变。
在一些实施例中,相对于SEQ ID NO 3的多肽,变体多肽或包含变体多肽的复合物表现出增强的酶活性和/或增强的稳定性。
在一些实施例中,变体多肽或包含变体多肽的复合物包含相对于SEQ ID NO:3的多肽至少1.5倍、2倍、2.5倍或3倍的增强的酶活性,例如通过插入缺失活性测量,例如,如实例9和10中所述。
在一些实施例中,增强的酶活性是增强的核酸酶活性。
在一些实施例中,相对于亲本多肽,变体多肽表现出增强的与RNA指导物的结合活性。
在一些实施例中,相对于亲本多肽,变体多肽表现出增强的与RNA指导物的结合特异性。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且变体二元复合物表现出以下特征中的一项或多项:
(i)相对于亲本二元复合物,增强的与靶核酸的结合活性(例如,中靶结合活性);
(ii)相对于亲本二元复合物,增强的与靶核酸的结合特异性(例如,中靶结合特异性);
(iii)相对于亲本二元复合物,增强的稳定性;和/或
(iv)相对于亲本二元复合物,降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的与靶核酸的结合活性(例如,中靶结合活性)。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的与靶核酸的结合特异性(例如,中靶结合特异性)。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的稳定性。
在一些实施例中,变体二元复合物和靶核酸形成变体三元复合物,并且相对于亲本三元复合物,变体三元复合物表现出增加的稳定性。
在一些实施例中,相对于亲本多肽,变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-RNA相互作用、和/或降低的与RNA指导物的解离。
在一些实施例中,相对于亲本二元复合物,变体二元复合物进一步表现出降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃的温度范围内。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6范围内的pH的缓冲液中。
在一些实施例中,当变体多肽、变体二元复合物、或变体三元复合物的Tm值比亲本多肽、亲本二元复合物、或亲本三元复合物的Tm值大至少8℃时,发生增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
在其他实施例中,改变包含相对于具有SEQ ID NO:3中所示的序列的亲本多肽的氨基酸序列改变,其中该改变包含与具有SEQ ID NO:3中所示的序列的亲本多肽相比的一个或多个(例如,一个、两个、三个、四个、五个或更多个)取代、插入、缺失、和/或添加。
在一些实施例中,改变包含相对于SEQ ID NO:3中所示的亲本多肽序列的氨基酸序列改变,其中该改变包含表2中列出的一个或多个氨基酸取代。
在一些实施例中,改变包含精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸、或甘氨酸取代。
在一些实施例中,变体多肽包含RuvC结构域或拆分型RuvC结构域。
在一些实施例中,变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。在一些实施例中,一个或多个催化残基包含D345、E506和D594。
在一些实施例中,变体多肽具有降低的核酸酶活性,或者是核酸酶失活型(nuclease dead)多肽。
在某些实施例中,第二改变包含多肽结构域的插入,其中任选地该插入位于SEQID NO:3的序列的N末端、C末端或内部。
在一些实施例中,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
在一方面,本披露提供了系统,该系统包含本文所述的变体多肽或编码变体多肽的第一核酸,和RNA指导物或编码RNA指导物的第二核酸,其中该RNA指导物包含同向重复序列和间隔子序列。
在一些实施例中,包含变体多肽的组合物或复合物进一步包含RNA指导物,并且RNA指导物包含同向重复序列和间隔子序列。
在一些实施例中,同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少90%序列同一性的核苷酸序列。
在一些实施例中,同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少95%序列同一性的核苷酸序列。
在一些实施例中,同向重复序列包含SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的核苷酸序列。
在一些实施例中,间隔子序列的长度为15至35个核苷酸。
在某些实施例中,第一核酸位于第一载体中,并且编码RNA指导物的第二核酸位于载体(例如,第一载体或第二载体)中,任选地其中该第一载体和/或该第二载体是病毒载体。
在一些实施例中,RNA指导物包含SEQ ID NO:9、11、13、15、17、19、21、和23中任一个。
在一些实施例中,靶核酸包含与间隔子序列中的核苷酸序列互补的序列。
在一些实施例中,靶核酸与原型间隔子相邻基序(PAM)序列相邻,其中该PAM序列包含如5’-NTN-3’、5’-HTN-3’、或5’-TNA-3’所示的核苷酸序列,其中N是任何核苷酸并且H是A或C或T。在一些实施例中,PAM序列包含如5’-CTG-3’或5’-CTC-3’所示的核苷酸序列。
在一些实施例中,靶核酸是单链DNA或双链DNA。在一些实施例中,靶核酸是双链DNA。
在一方面,本披露提供了编码本文所述的变体多肽的核酸。
在一些实施例中,编码变体多肽的核酸经密码子优化以用于在细胞中表达。
在某些实施例中,核酸进一步包含编码指导RNA的序列。
在一些实施例中,编码变体多肽的核酸可操作地连接至启动子。
在某些实施例中,核酸包含RNA(例如,mRNA)。
在一些实施例中,编码变体多肽的核酸位于载体中。
在一些实施例中,载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
在某些实施例中,病毒载体是腺相关病毒(AAV)载体。
在一方面,本披露提供了包含本文所述的变体多肽、系统、核酸或载体的组合物。在一些实施例中,组合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外泌体、微泡或基因枪。
在一方面,本披露提供了包含本文所述的变体多肽、系统、核酸或载体的细胞。
在一些实施例中,细胞包含本文披露的变体多肽和/或组合物。
在一些实施例中,细胞是真核细胞或原核细胞。在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是哺乳动物细胞或植物细胞。在一些实施例中,细胞是人细胞。
本披露进一步提供了制备本文披露的变体多肽的方法,该方法包括(i)将一个或多个核苷酸取代引入包含SEQ ID NO:1或SEQ ID NO:2的核酸中以产生编码变体多肽的变体核酸,以及(ii)从变体核酸表达变体多肽。
本披露进一步提供了形成本文披露的变体二元复合物的方法,该方法包括使本文披露的变体多肽与本文披露的RNA指导物接触。
在一方面,本披露提供了产生变体多肽的方法,该方法包括(i)产生编码变体多肽的核酸序列,和(ii)将核酸序列引入能够表达核酸序列的适当宿主细胞中,以及(iii)允许宿主细胞表达变体多肽。
在一方面,本披露提供了产生变体多肽的方法,该方法包括(i)将一个或多个核苷酸取代引入包含SEQ ID NO:1或SEQ ID NO:2的核酸中以产生编码变体多肽的变体核酸,以及(ii)从变体核酸表达变体多肽。
本披露进一步提供了形成变体三元复合物的方法,该方法包括使本文披露的变体多肽与本文披露的RNA指导物以及本文披露的靶核酸接触。
在一方面,本披露提供了将变体多肽递送至细胞的方法,该方法包括将本文所述的变体多肽或编码变体多肽的核酸引入细胞中,以及任选地,引入RNA指导物或编码RNA指导物的核酸,其中该引入任选地包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。
在一方面,本披露提供了用于修饰细胞中的靶DNA分子的方法,该方法包括将本文所述的变体多肽或编码变体多肽的核酸引入细胞中,以及引入RNA指导物或编码RNA指导物的核酸,其中该引入任选地包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在某些实施例中,引入细胞中的步骤包括使用电穿孔、注射、基因枪或其任何组合。在一些实施例中,编码变体多肽的核酸包含RNA(例如,mRNA)。
在一方面,本披露提供了用于修饰靶DNA分子的方法,该方法包括使靶DNA分子与变体多肽和RNA指导物接触。在一些实施例中,靶DNA分子是体外的或在细胞中。在某些实施例中,细胞是体外、离体、或体内的。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。
本披露进一步提供了递送本文披露的变体多肽或组合物或变体二元复合物的方法,该方法包括将变体多肽或编码变体多肽的核酸引入细胞中,以及任选地,引入本文所述的RNA指导物或编码RNA指导物的核酸,或引入本文所述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在一些实施例中,引入的步骤包括使用电穿孔、注射、基因枪或其任何组合。
本披露还进一步提供了组合物,该组合物包含变体多肽、或包含变体多肽和RNA指导物的复合物,其中相对于亲本多肽,该变体多肽包含改变,其中该亲本多肽包含SEQ IDNO:3,其中该变体多肽能够与RNA指导物和靶核酸结合,并且其中相对于亲本多肽或包含亲本多肽和RNA指导物的复合物,该变体多肽或复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
在一些实施例中,增强的酶活性是增强的核酸酶活性。
在一些实施例中,相对于亲本多肽,变体多肽表现出增强的与RNA指导物的结合活性。
在一些实施例中,相对于亲本多肽,变体多肽表现出增强的与RNA指导物的结合特异性。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的与靶核酸的结合活性(例如,中靶结合活性)。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的与靶核酸的结合特异性(例如,中靶结合特异性)。
在一些实施例中,变体多肽和RNA指导物形成变体二元复合物,并且相对于亲本二元复合物,变体二元复合物表现出增强的稳定性。
在一些实施例中,变体二元复合物和靶核酸形成变体三元复合物,并且相对于亲本三元复合物,变体三元复合物表现出增加的稳定性。
在一些实施例中,相对于亲本多肽,变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-RNA相互作用、和/或降低的与RNA指导物的解离。
在一些实施例中,相对于亲本二元复合物,变体二元复合物进一步表现出降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃的温度范围内。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。
在一些实施例中,增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6范围内的pH的缓冲液中。
在一些实施例中,当变体多肽、变体二元复合物、或变体三元复合物的Tm值比亲本多肽、亲本二元复合物、或亲本三元复合物的Tm值大至少8℃时,发生增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
在其他实施例中,改变包含相对于具有SEQ ID NO:3中所示的序列的亲本多肽的氨基酸序列改变,其中该改变包含与具有SEQ ID NO:3中所示的序列的亲本多肽相比的一个或多个(例如,一个、两个、三个、四个、五个或更多个)取代、插入、缺失、和/或添加。
在一些实施例中,改变包含相对于SEQ ID NO:3中所示的亲本多肽序列的氨基酸序列改变,其中该改变包含表2中列出的一个或多个氨基酸取代。
在一些实施例中,改变包含精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸、或甘氨酸取代。
在一些实施例中,改变包含E38R、T60R、D89R、S223R、P353G、L354G、L360G、K368G、E566R、和/或D730R取代。
在一些实施例中,变体多肽包含RuvC结构域或拆分型RuvC结构域。
在一些实施例中,变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。在一些实施例中,一个或多个催化残基包含D345、E506和D594。
在一些实施例中,RNA指导物包含同向重复序列和间隔子序列。
在一些实施例中,同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少90%序列同一性的核苷酸序列。
在一些实施例中,同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少95%序列同一性的核苷酸序列。
在一些实施例中,同向重复序列包含SEQ ID NO:4、SEQ ID NO:5或SEQ ID NO:6的核苷酸序列。
在一些实施例中,间隔子序列的长度为15至35个核苷酸。
在一些实施例中,靶核酸包含与间隔子序列中的核苷酸序列互补的序列。
在一些实施例中,靶核酸与PAM序列相邻,其中该PAM序列包含如5’-NTN-3’、5’-HTN-3’、或5’-TNA-3’所示的核苷酸序列,其中N是任何核苷酸并且H是A或C或T。在一些实施例中,PAM序列包含如5’-CTG-3’或5’-CTC-3’所示的核苷酸序列。
在一些实施例中,靶核酸是单链DNA或双链DNA。
在一些实施例中,变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
在一些实施例中,编码变体多肽的核酸经密码子优化以用于在细胞中表达。
在一些实施例中,编码变体多肽的核酸可操作地连接至启动子。
在一些实施例中,编码变体多肽的核酸位于载体中。
在一些实施例中,载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
在一些实施例中,组合物或复合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外泌体、微泡或基因枪。
本披露进一步提供了RNA指导物或编码RNA指导物的核酸,其包含与SEQ ID NO:4、5或6中任一个具有至少90%同一性的同向重复序列。在一些实施例中,RNA指导物或编码RNA指导物的核酸包含与5’-CTG-3’或5’-CTC-3’原型间隔子相邻基序相邻结合的间隔子序列。在一些实施例中,包含与SEQ ID NO:4-6中任一个具有至少90%序列同一性的核苷酸序列的RNA指导物结合CRISPR核酸酶,例如根据SEQ ID NO:3的CRISPR核酸酶。
本披露进一步提供了包含RNA指导物的组合物,其中该组合物进一步包含CRISPR核酸酶。在一些实施例中,CRISPR核酸酶与SEQ ID NO:3具有至少80%同一性(例如,至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性)。在一些实施例中,CRISPR核酸酶与SEQ IDNO:3具有至少95%同一性(例如,至少95%、96%、97%、98%、99%、或100%同一性)。在一些实施例中,CRISPR核酸酶包含SEQ ID NO:3。
本披露进一步提供了细胞,该细胞包含本文披露的变体多肽和/或复合物。在一些实施例中,细胞是真核细胞或原核细胞。在一些实施例中,细胞是哺乳动物细胞或植物细胞。在一些实施例中,细胞是人细胞。
本披露进一步提供了制备本文披露的变体多肽的方法,该方法包括(i)将一个或多个核苷酸取代引入包含SEQ ID NO:1或SEQ ID NO:2的核酸中以产生编码变体多肽的变体核酸,以及(ii)从变体核酸表达变体多肽。
本披露进一步提供了形成变体二元复合物的方法,该方法包括使本文披露的变体多肽与本文披露的RNA指导物接触。
本披露进一步提供了形成变体三元复合物的方法,该方法包括使本文披露的变体多肽与本文披露的RNA指导物以及本文披露的靶核酸接触。
本披露进一步提供了将本文披露的变体多肽或组合物或变体二元复合物递送至细胞的方法,该方法包括将本文披露的变体多肽或编码变体多肽的核酸引入细胞中,以及任选地,引入本文所述的RNA指导物或编码RNA指导物的核酸,或引入本文所述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在一些实施例中,引入的步骤包括使用电穿孔、注射、基因枪或其任何组合。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。在一些实施例中,细胞是体外、离体、或体内的。
本披露进一步提供了用于修饰细胞中的靶DNA分子的方法,该方法包括将本文披露的变体多肽或编码变体多肽的核酸引入细胞中,以及引入本文所述的RNA指导物或编码RNA指导物的核酸,或引入本文所述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在一些实施例中,引入的步骤包括使用电穿孔、注射、基因枪或其任何组合。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。在一些实施例中,细胞是体外、离体、或体内的。
本披露进一步提供了用于修饰靶DNA分子的方法,该方法包括使靶DNA分子与本文披露的变体多肽和本文披露的RNA指导物接触。在一些实施例中,靶DNA分子是体外的或在细胞中。在一些实施例中,细胞是体外、离体、或体内的。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。
在一些方面,本披露提供了修饰细胞中的靶核酸的方法,其中该方法包括(i)将包含根据SEQ ID NO:3的氨基酸序列或与其具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的序列的多肽,或编码多肽的核酸引入细胞中,以及(ii)将RNA指导物(例如,如本文所述)或编码RNA指导物的核酸引入细胞中,其中靶核酸与原型间隔子相邻基序(PAM)序列相邻,其中该PAM序列包含如5’-CTG-3’或5’-CTC-3’所示的核苷酸序列。在一些实施例中,多肽包含根据SEQ ID NO:3-7中任一个的氨基酸序列。引入任选地包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在某些实施例中,引入细胞中的步骤包括使用电穿孔、注射、基因枪或其任何组合。在一些实施例中,编码多肽的核酸包含RNA(例如,mRNA)。在一些实施例中,该方法在与5’-CTG-3’或5’-CTC-3’原型间隔子相邻基序相邻的位置处修饰靶DNA。在一些实施例中,修饰包括断裂或切割靶核酸。
在一些方面,本披露提供了RNA指导物或编码RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列包含SEQ ID NO:4-6中任一个的核苷酸序列,或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的序列,其中紧邻同向重复序列3’的核苷酸选自C、T或G。在一些方面,本披露提供了RNA指导物或编码RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列包含SEQ ID NO:4-6中任一个的核苷酸序列,或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的序列,其中紧邻同向重复序列3’的核苷酸不是A。在一些方面,本披露提供了RNA指导物或编码RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列包含SEQID NO:5或6的核苷酸序列,或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的序列。在一些方面,本披露提供了RNA指导物或编码RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列由SEQ IDNO:4-6中任一个的核苷酸序列或其具有1、2、3或4个取代的序列组成。在一些实施例中,间隔子与同向重复序列异源。
附图说明
图1示出了与5’-CTG-3’PAM序列相邻的八个靶位点的插入缺失活性(原始插入缺失%)。靶位点和crRNA的序列示于表4中。
具体实施方式
定义
本发明将相对于特定实施例并参考某些附图进行描述,但本发明不限于此,而仅由权利要求来限定。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。
除非另外定义,本文所用的科学术语和技术术语具有本领域普通技术人员普遍理解的含义。在任何潜在的歧义情况下,本文提供的定义优先于任何字典或外部定义。除非上下文另有要求,否则单数术语应包括复数形式,并且复数术语应包括单数形式。除非另有说明,否则“或”的使用意指“和/或”。术语“包括(including)”以及其他形式(如“包括(includes和included)”)的使用没有限制性。
通常,本文所述的结合细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及蛋白质和核酸化学和杂交使用的命名是本领域中熟知并且普遍使用的那些。除非另外指明,否则本文提供的方法及技术可根据本领域中熟知的常规方法且如贯穿本说明书所引用及论述的各种通用及更特定参考文献中所描述来进行。酶促反应和纯化方法是根据制造商说明书来进行,如本领域中普遍完成的或如本文所述。结合本文所述的分析化学、合成有机化学、以及医学和药物化学使用的命名,它们的实验室程序和技术是本领域中熟知并且普遍使用的那些。使用标准技术进行化学合成、化学分析、药物制备、配制、递送以及患者的治疗。
为了使本披露可以容易地理解,下面定义了选定的术语。
本文中使用的冠词“一个/种(a/an)”是指一个/种或多于一个/种(即,至少一个/种)该冠词的语法宾语。举例来说,“一个元素”意指一个元素或多于一个元素。
当指可测量的值如量、时距等时,如本文所用,“约”意指涵盖自指定值±20%或±10%,更优选±5%,甚至更优选±1%,以及还更优选±0.1%的变化,因为这样的变化适于进行所披露的方法。
如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。
如本文所用,术语“二元复合物”是指两个分子(例如,多肽和核酸分子)的群化。在一些实施例中,二元复合物是指多肽和靶向部分(例如,RNA指导物)的群化。在一些实施例中,二元复合物是指核糖核蛋白(RNP)。如本文所用,术语“变体二元复合物”是指变体多肽和RNA指导物的群化。如本文所用,术语“亲本二元复合物”是指亲本多肽和RNA指导物或参考多肽和RNA指导物的群化。
如本文所用,术语“三元复合物”是指三个分子(例如,一个多肽和两个核酸分子)的群化。在一些实施例中,“三元复合物”是指多肽、RNA分子和DNA分子的群化。在一些实施例中,三元复合物是指多肽、靶向部分(例如,RNA指导物)和靶核酸(例如,靶DNA分子)的群化。在一些实施例中,“三元复合物”是指二元复合物(例如,核糖核蛋白)和第三分子(例如,靶核酸)的群化。
如本文所用,术语“结构域”是指多肽的不同功能和/或结构单元。在一些实施例中,结构域可包含保守氨基酸序列。
如本文所用,术语“亲本”、“亲本多肽”和“亲本序列”是指对其进行改变以产生本发明的变体多肽的原始多肽(例如,参考多肽或起始多肽)。
如本文所用,术语“原型间隔子相邻基序”或“PAM”是指与包含效应子(例如,CRISPR核酸酶)和RNA指导物的复合物所结合的靶序列相邻的DNA序列。在一些实施例中,PAM是酶活性所需的。如本文所用,术语“相邻”包括复合物的RNA指导物与紧邻PAM的靶序列特异性结合、相互作用或缔合的情况。在这样的情况下,在靶序列与PAM之间没有核苷酸。术语“相邻”还包括在与RNA指导物结合的靶序列与PAM之间存在少数(例如,1、2、3、4或5个)核苷酸的情况。在双链DNA分子中,含有PAM基序的链称为“PAM链”,并且互补链称为“非PAM链”。RNA指导物与非PAM链中与本文披露的靶序列互补的位点结合。在一些实施例中,PAM链是编码(例如,正义)链。在其他实施例中,PAM链是非编码(例如,反义链)的。由于RNA指导物经由碱基配对与非PAM链结合,因此非PAM链也称为靶链(TS),而PAM链也称为非靶链(NTS)。
如本文所用,术语“参考组合物”、“参考分子”、“参考序列”和“参考”是指对照,如阴性对照或亲本(例如,亲本序列、亲本蛋白质或野生型蛋白质)。例如,参考分子是指与变体多肽进行比较的多肽。同样,参考RNA指导物是指与经修饰的RNA指导物进行比较的靶向部分。变体或经修饰的分子可基于序列(例如,变体或经修饰的分子可与参考分子具有X%序列同一性或同源性)、热稳定性或活性(例如,变体或经修饰的分子可具有参考分子的X%的活性)与参考分子进行比较。例如,变体或经修饰的分子可表征为具有参考多肽的不超过10%的活性,或可表征为具有比参考多肽高至少10%的活性。参考多肽的实例包括天然存在的未经修饰的多肽,例如来自古细菌或细菌物种的天然存在的多肽。在某些实施例中,参考多肽是天然存在的多肽,该多肽与所比较的变体多肽具有最接近的序列同一性或同源性。在某些实施例中,参考多肽是具有天然存在或已知序列的亲本分子,已经在该序列上进行突变以获得变体多肽。
如本文所用,术语“RNA指导物”或“RNA指导物序列”是指促进本文所述的多肽靶向靶核酸的任何RNA分子。例如,RNA指导物可以是识别靶核酸(例如,与其结合)的分子。RNA指导物可被设计成与特定核酸序列互补。RNA指导物包含DNA靶向序列(本文也称为间隔子序列)和促进RNA指导物与本发明的多肽结合的同向重复(DR)序列。术语CRISPR RNA(crRNA)、前crRNA和成熟crRNA在本文中也用于指RNA指导物。在一些情况下,RNA指导物可以是经修饰的RNA分子,该经修饰的RNA分子例如在包含在RNA指导物中的DNA结合序列(其结合靶核酸的非PAM链)中包含一个或多个脱氧核糖核苷酸。在一些实例中,DNA结合序列可以含有DNA序列或DNA/RNA杂交序列。
如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列、多核苷酸或多肽。
如本文所用,术语“靶核酸”、“靶序列”和“靶底物”是指与RNA指导物特异性结合的核酸。在一些实施例中,RNA指导物的DNA靶向序列(即,间隔子序列)与靶核酸结合。在一些实施例中,靶序列是与PAM基序相邻的DNA区段(在PAM链上)。靶序列的互补区在非PAM链上。靶序列可以紧邻PAM基序。可替代地,靶序列和PAM可以由小的序列区段(例如,最多5个核苷酸,例如最多4、3、2或1个核苷酸)分隔。靶序列可以位于PAM基序的3’端或PAM基序的5’端,这取决于识别PAM基序的CRISPR核酸酶,这是本领域已知的。例如,针对Cas12i多肽(例如,Cas12i2多肽,如本文披露的那些),靶序列位于PAM基序的3'端。当然,DNA通常是双链,并且RNA指导物将与两条链中的一条链结合(与其互补)。DNA中RNA指导物结合的位置可以通过提供RNA指导物结合的链(非PAM链)的序列或RNA指导物不结合的链(PAM链)的序列来方便地描述。因此,从整个申请的上下文可以清楚地看出,靶核酸序列可以通过提供由本文所述的RNA指导物靶向的双链DNA的任一链的核酸序列来描述。
如本文所用,术语“变体多肽”、“变体效应子多肽”和“变体CRISPR核酸酶多肽”是指与亲本多肽相比在一个或多个残基位置处包含改变(例如但不限于,取代、插入、缺失、添加和/或融合)的多肽。除非另外说明,本文提供的鉴定的改变的位置是相对于SEQ ID NO:3编号的。例如,即使变体多肽在N末端、C末端或内部包含融合或截短,例如,使得改变不位于相对于融合多肽或截短多肽中N末端的位置509处,D509R的改变仍表示相对于SEQ ID NO:3的第509个氨基酸的改变。SEQ ID NO:3的氨基酸位置进一步描述于表2中。如本文所用,术语“变体多肽”、“变体效应子多肽”和“变体CRISPR核酸酶多肽”是指与SEQ ID NO:3的多肽相比包含改变的多肽。
组合物
在一些方面,本发明提供了SEQ ID NO:3的效应子(例如,CRISPR核酸酶)的新型变体、包含这些变体的组合物、及其制备方法和用途。在其他方面,本发明进一步提供了包含SEQ ID NO:3的效应子(例如,CRISPR核酸酶)的变体的复合物、和组合物、及其制备方法和用途。在一些方面,本文描述了包含具有一个或多个特性的复合物的组合物。在一些方面,描述了递送包含复合物的组合物的方法。
在一些实施例中,本披露的组合物包括相对于亲本多肽,表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性的变体多肽。在一些实施例中,本披露的组合物包括复合物,其包含相对于亲本复合物,表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性的变体多肽。在一些实施例中,变体多肽相对于亲本多肽包含改变,其中该亲本多肽包含SEQ ID NO:3,并且其中该变体多肽能够与RNA指导物和靶核酸结合。
在一些实施例中,本披露的组合物包括变体多肽和RNA指导物。在一些实施例中,本披露的组合物包括包含变体多肽和RNA指导物的变体二元复合物。
在组合物的一些实施例中,与亲本多肽相比,变体多肽具有增加的与RNA指导物的复合物形成(例如,增加的二元复合物形成)。在组合物的一些实施例中,与亲本多肽和RNA指导物相比,变体多肽和RNA指导物具有更大的结合亲和力。在组合物的一些实施例中,与亲本多肽和RNA指导物相比,变体多肽和RNA指导物具有更强的蛋白质-RNA相互作用(例如离子相互作用)。在组合物的一些实施例中,变体二元复合物比亲本二元复合物更稳定。
在一些实施例中,本披露的组合物包括变体多肽、RNA指导物和靶核酸。在一些实施例中,本披露的组合物包括变体三元复合物,其包含变体多肽、RNA指导物和靶核酸。
在组合物的一些实施例中,与亲本多肽相比,变体多肽具有增加的与RNA指导物和靶核酸的复合物形成(例如,增加的三元复合物形成)。在组合物的一些实施例中,与亲本多肽和RNA指导物(例如,亲本二元复合物)相比,变体多肽和RNA指导物(例如,变体二元复合物)具有更大的对靶核酸的结合亲和力。在组合物的一些实施例中,变体三元复合物比亲本三元复合物更稳定。
在一些实施例中,本披露的组合物包括本文所述的变体多肽。
变体多肽
在一个实施例中,变体多肽(例如,变体CRISPR核酸酶多肽)是分离的或纯化的多肽。
在一些实施例中,本披露的变体多肽是亲本多肽(例如,亲本CRISPR核酸酶)的变体,其中该亲本由包含核苷酸序列如SEQ ID NO:1或SEQ ID NO:2的多核苷酸编码,或包含氨基酸序列如SEQ ID NO:3。参见表1。
表1.对应于SEQ ID NO:1-3的序列。
/>
/>
编码本文所述的亲本多肽的核酸序列可与参考核酸序列(例如,SEQ ID NO:1或SEQ ID NO:2)基本上相同。在一些实施例中,变体多肽由包含以下序列的核酸编码,该序列与参考核酸序列(例如,编码亲本多肽的核酸序列,例如SEQ ID NO:1或SEQ ID NO:2)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个这样的核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在严格条件下(例如,在中等至高度严格的范围内)与另一个核酸分子的互补序列杂交。
在一些实施例中,变体多肽由以下核酸序列编码,该核酸序列与参考核酸序列(例如,编码亲本多肽的核酸序列,例如SEQ ID NO:1或SEQ ID NO:2)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高序列同一性,但非100%序列同一性。
在一些实施例中,本披露的变体多肽包含与SEQ ID NO:3具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%但非100%同一性的多肽序列。在一些实施例中,本披露的变体多肽包含与SEQ ID NO:3具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%但非100%同一性的多肽序列。
在一些实施例中,本披露描述了变体多肽,该变体多肽与一个或多个参考多肽(例如,亲本多肽)具有指定程度的氨基酸序列同一性,例如与SEQ ID NO:3的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%但非100%序列同一性。同源性或同一性可以例如使用如本文所述的程序(如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本披露的变体多肽,该变体多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且包含当使用前述比对方法中的任一种进行比对时与亲本多肽和SEQ ID NO:3中的任一个的氨基酸序列相差50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个氨基酸残基的氨基酸序列。
在一些实施例中,变体多肽包含在亲本多肽的一个或多个(例如,几个)氨基酸处的改变,其中至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多个氨基酸被改变。
改变可以包含肽或多肽中的一个或多个氨基酸或一个或多个核苷酸中的一个或多个核苷酸相对于参考序列的取代、插入、缺失、添加或融合。在如何制备包含改变的序列中没有暗指特定的过程。例如,可以从单个核苷酸直接合成包含改变的序列。在其他实施例中,通过提供参考序列然后改变参考序列来产生改变。
取代可以包含相对于参考序列用不同的一个或多个氨基酸替代一个或多个氨基酸,或用不同的一个或多个核苷酸替代一个或多个核苷酸。在如何制备包含取代的序列中没有暗指特定的过程。例如,可以从单个氨基酸或核苷酸直接合成包含取代的序列。在其他实施例中,通过提供参考序列然后改变参考序列来产生取代。核酸序列可以在生物体的基因组中。核酸序列可以在细胞中。核酸序列可以是DNA序列。本文所述的核苷酸的取代是指取代多达几千碱基。
在一些实施例中,变体多肽包含表2中列出的氨基酸取代中的一个或多个。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
本文所述的一些有益改变落入位于SEQ ID NO:3的核酸酶多肽的大约500-580个残基处的热点内,其靠近分隔TS-间隔子螺旋和ssDNA NTS的RuvC‘盖’。不希望受理论束缚,在一些实施例中,本文所述的取代对酶功能具有一种或多种以下益处:稳定ssDNA NTS进入活性位点凹槽;消除H键与TS间隔子螺旋的相互作用;添加与TS间隔子螺旋的有利电荷相互作用;以及用ssDNA TS从间隔子螺旋开始消除电荷排斥。
在一些实施例中,变体多肽包含D509R氨基酸取代。在一些实施例中,变体多肽包含S511R氨基酸取代。在一些实施例中,变体多肽包含I521R氨基酸取代。在一些实施例中,变体多肽包含D535G氨基酸取代。在一些实施例中,变体多肽包含Q514G氨基酸取代。在一些实施例中,变体多肽包含L516R氨基酸取代。在一些实施例中,变体多肽包含L516G氨基酸取代。在一些实施例中,变体多肽包含E198R氨基酸取代。在一些实施例中,变体多肽包含S527R氨基酸取代。在一些实施例中,变体多肽包含D509K氨基酸取代。在一些实施例中,变体多肽包含D509G氨基酸取代。在一些实施例中,变体多肽包含L580G氨基酸取代。在一些实施例中,变体多肽包含V359R氨基酸取代。在一些实施例中,变体多肽包含D535K氨基酸取代。在一些实施例中,变体多肽包含Y381R氨基酸取代。在一些实施例中,变体多肽包含R354G氨基酸取代。在一些实施例中,变体多肽包含M380K氨基酸取代。在一些实施例中,变体多肽包含M380R氨基酸取代。在一些实施例中,变体多肽包含V383R氨基酸取代。在一些实施例中,变体多肽包含L580R氨基酸取代。在一些实施例中,变体多肽包含E367R氨基酸取代。在一些实施例中,变体多肽包含I521K氨基酸取代。在一些实施例中,变体多肽包含E367G氨基酸取代。在一些实施例中,变体多肽包含E507R氨基酸取代。在一些实施例中,变体多肽包含I521G氨基酸取代。在一些实施例中,变体多肽包含W350R氨基酸取代。在一些实施例中,变体多肽包含D535R氨基酸取代。在一些实施例中,变体多肽包含R528K氨基酸取代。在一些实施例中,变体多肽包含S527K氨基酸取代。在一些实施例中,变体多肽包含L385G氨基酸取代。在一些实施例中,变体多肽包含W350G氨基酸取代。在一些实施例中,变体多肽包含L516K氨基酸取代。在一些实施例中,变体多肽包含Y381G氨基酸取代。在一些实施例中,变体多肽包含H532R氨基酸取代。在一些实施例中,变体多肽包含D129R氨基酸取代。在一些实施例中,变体多肽包含P615R氨基酸取代。在一些实施例中,变体多肽包含G578R氨基酸取代。在一些实施例中,变体多肽包含M380G氨基酸取代。在一些实施例中,变体多肽包含V595G氨基酸取代。在一些实施例中,变体多肽包含R531G氨基酸取代。在一些实施例中,变体多肽包含D129G氨基酸取代。在一些实施例中,变体多肽包含R531K氨基酸取代。在一些实施例中,变体多肽包含D158G氨基酸取代。在一些实施例中,变体多肽包含N476G氨基酸取代。在一些实施例中,变体多肽包含G578K氨基酸取代。在一些实施例中,变体多肽包含A512R氨基酸取代。在一些实施例中,变体多肽包含P618R氨基酸取代。在一些实施例中,变体多肽包含V595R氨基酸取代。在一些实施例中,变体多肽包含V595K氨基酸取代。在一些实施例中,变体多肽包含V383G氨基酸取代。在一些实施例中,变体多肽包含A597G氨基酸取代。在一些实施例中,变体多肽包含Y381K氨基酸取代。在一些实施例中,变体多肽包含P618G氨基酸取代。在一些实施例中,变体多肽包含E198K氨基酸取代。在一些实施例中,变体多肽包含T288R氨基酸取代。在一些实施例中,变体多肽包含E507K氨基酸取代。在一些实施例中,变体多肽包含L385R氨基酸取代。在一些实施例中,变体多肽包含C538G氨基酸取代。在一些实施例中,变体多肽包含P615G氨基酸取代。在一些实施例中,变体多肽包含D386R氨基酸取代。在一些实施例中,变体多肽包含S511K氨基酸取代。在一些实施例中,变体多肽包含C371G氨基酸取代。在一些实施例中,变体多肽包含K136G氨基酸取代。在一些实施例中,变体多肽包含N220R氨基酸取代。在一些实施例中,变体多肽包含S78K氨基酸取代。在一些实施例中,变体多肽包含K141G氨基酸取代。在一些实施例中,变体多肽包含K240R氨基酸取代。在一些实施例中,变体多肽包含D277R氨基酸取代。在一些实施例中,变体多肽包含T165R氨基酸取代。在一些实施例中,变体多肽包含K374R氨基酸取代。
在一些实施例中,相对于SEQ ID NO:3的氨基酸序列,变体多肽进一步包含第二改变。在一些实施例中,改变包含L580G并且第二改变包含L385G。在一些实施例中,改变包含L580G并且第二改变包含A512R。在一些实施例中,改变包含S527R并且第二改变包含C538G。在一些实施例中,改变包含D129R并且第二改变包含P618R。在一些实施例中,改变包含Q514G并且第二改变包含A512R。在一些实施例中,改变包含S527R并且第二改变包含L385G。在一些实施例中,改变包含G578R并且第二改变包含D158G。在一些实施例中,改变包含S511R并且第二改变包含P618R。在一些实施例中,改变包含D158G并且第二改变包含A512R。在一些实施例中,改变包含R354G并且第二改变包含A512R。在一些实施例中,改变包含A512R并且第二改变包含P618R。在一些实施例中,改变包含V359R并且第二改变包含A512R。在一些实施例中,改变包含E367R并且第二改变包含A512R。在一些实施例中,改变包含Q514G并且第二改变包含N476G。在一些实施例中,改变包含S511R并且第二改变包含A512R。在一些实施例中,改变包含E198R并且第二改变包含R354G。在一些实施例中,改变包含Q514G并且第二改变包含C538G。在一些实施例中,改变包含S527R并且第二改变包含T288R。在一些实施例中,改变包含R354G并且第二改变包含D158G。在一些实施例中,改变包含R354G并且第二改变包含L385G。在一些实施例中,改变包含G578R并且第二改变包含A512R。在一些实施例中,改变包含R354G并且第二改变包含E507R。在一些实施例中,改变包含S527R并且第二改变包含G578R。在一些实施例中,改变包含S511R并且第二改变包含C538G。在一些实施例中,改变包含I521R并且第二改变包含V383R。在一些实施例中,改变包含S511R并且第二改变包含I521R。在一些实施例中,改变包含L385G并且第二改变包含G578R。在一些实施例中,改变包含L580G并且第二改变包含N476G。在一些实施例中,改变包含Q514G并且第二改变包含T288R。在一些实施例中,改变包含D535G并且第二改变包含A512R。在一些实施例中,改变包含D509R并且第二改变包含M380R。在一些实施例中,改变包含S527R并且第二改变包含C371G。在一些实施例中,改变包含Q514G并且第二改变包含D158G。在一些实施例中,改变包含E198R并且第二改变包含C538G。在一些实施例中,改变包含S511R并且第二改变包含L385G。在一些实施例中,改变包含S527R并且第二改变包含N476G。在一些实施例中,改变包含L516R并且第二改变包含A512R。在一些实施例中,改变包含S511R并且第二改变包含C371G。在一些实施例中,改变包含L516R并且第二改变包含C538G。在一些实施例中,改变包含E198R并且第二改变包含C371G。在一些实施例中,改变包含Q514G并且第二改变包含V383R。在一些实施例中,改变包含L516R并且第二改变包含N476G。在一些实施例中,改变包含D509R并且第二改变包含T288R。在一些实施例中,改变包含D509R并且第二改变包含G578R。在一些实施例中,改变包含D158G并且第二改变包含C371G。在一些实施例中,改变包含I521R并且第二改变包含N476G。在一些实施例中,改变包含E198R并且第二改变包含M380R。在一些实施例中,改变包含D129R并且第二改变包含N476G。在一些实施例中,改变包含M380R并且第二改变包含A512R。在一些实施例中,改变包含R354G并且第二改变包含D129R。在一些实施例中,改变包含S527R并且第二改变包含L580G。在一些实施例中,改变包含R354G并且第二改变包含N476G。在一些实施例中,改变包含Q514G并且第二改变包含P618R。在一些实施例中,改变包含V383R并且第二改变包含L385G。在一些实施例中,改变包含E198R并且第二改变包含V359R。在一些实施例中,改变包含D535G并且第二改变包含N476G。在一些实施例中,改变包含Q514G并且第二改变包含L385G。在一些实施例中,改变包含S511R并且第二改变包含N476G。在一些实施例中,改变包含D158G并且第二改变包含A597G。在一些实施例中,改变包含L516R并且第二改变包含G578R。在一些实施例中,改变包含E198R并且第二改变包含L580G。在一些实施例中,改变包含E198R并且第二改变包含L385G。在一些实施例中,改变包含L580G并且第二改变包含V383R。在一些实施例中,改变包含I521R并且第二改变包含C371G。在一些实施例中,改变包含V359R并且第二改变包含R354G。在一些实施例中,改变包含Y381R并且第二改变包含G578R。在一些实施例中,改变包含E198R并且第二改变包含V383R。在一些实施例中,改变包含L580G并且第二改变包含D386R。在一些实施例中,改变包含L385G并且第二改变包含P615R。在一些实施例中,改变包含V383R并且第二改变包含G578R。在一些实施例中,改变包含D535G并且第二改变包含T288R。在一些实施例中,改变包含Y381R并且第二改变包含P618R。在一些实施例中,改变包含A512R并且第二改变包含A597G。在一些实施例中,改变包含Q514G并且第二改变包含L580G。在一些实施例中,改变包含S527R并且第二改变包含P615R。在一些实施例中,改变包含E198R并且第二改变包含P615R。在一些实施例中,改变包含I521R并且第二改变包含T288R。在一些实施例中,改变包含Y381R并且第二改变包含C538G。在一些实施例中,改变包含S527R并且第二改变包含A512R。在一些实施例中,改变包含Y381R并且第二改变包含C371G。在一些实施例中,改变包含I521R并且第二改变包含L385G。在一些实施例中,改变包含L516R并且第二改变包含T288R。在一些实施例中,改变包含L516R并且第二改变包含D158G。在一些实施例中,改变包含S527R并且第二改变包含P618R。在一些实施例中,改变包含S527R并且第二改变包含R354G。在一些实施例中,改变包含Y381R并且第二改变包含V383R。在一些实施例中,改变包含A512R并且第二改变包含C371G。在一些实施例中,改变包含S511R并且第二改变包含T288R。在一些实施例中,改变包含S511R并且第二改变包含Q514G。在一些实施例中,改变包含L516R并且第二改变包含V383R。在一些实施例中,改变包含A512R并且第二改变包含C538G。在一些实施例中,改变包含I521R并且第二改变包含M380R。在一些实施例中,改变包含D535G并且第二改变包含C538G。在一些实施例中,改变包含E198R并且第二改变包含T288R。在一些实施例中,改变包含Q514G并且第二改变包含M380R。在一些实施例中,改变包含S527R并且第二改变包含V383R。在一些实施例中,改变包含L580G并且第二改变包含Y381R。在一些实施例中,改变包含S511R并且第二改变包含G578R。在一些实施例中,改变包含Y381R并且第二改变包含R354G。在一些实施例中,改变包含L516R并且第二改变包含L385G。在一些实施例中,改变包含D535G并且第二改变包含E198R。在一些实施例中,改变包含S527R并且第二改变包含M380R。在一些实施例中,改变包含L580G并且第二改变包含M380R。在一些实施例中,改变包含N476G并且第二改变包含A597G。在一些实施例中,改变包含I521R并且第二改变包含C538G。在一些实施例中,改变包含R354G并且第二改变包含G578R。在一些实施例中,改变包含S511R并且第二改变包含D386R。在一些实施例中,改变包含P615R并且第二改变包含C538G。在一些实施例中,改变包含L580G并且第二改变包含T288R。在一些实施例中,改变包含E507R并且第二改变包含C538G。在一些实施例中,改变包含E198R并且第二改变包含A597G。在一些实施例中,改变包含P615R并且第二改变包含G578R。在一些实施例中,改变包含S511R并且第二改变包含R354G。在一些实施例中,改变包含D509R并且第二改变包含D386R。在一些实施例中,改变包含S511R并且第二改变包含L580G。在一些实施例中,改变包含E198R并且第二改变包含S527R。在一些实施例中,改变包含V359R并且第二改变包含G578R。在一些实施例中,改变包含I521R并且第二改变包含A512R。在一些实施例中,改变包含D509R并且第二改变包含C538G。在一些实施例中,改变包含L385G并且第二改变包含P618R。在一些实施例中,改变包含P615R并且第二改变包含A512R。在一些实施例中,改变包含V383R并且第二改变包含A512R。在一些实施例中,改变包含L580G并且第二改变包含C538G。在一些实施例中,改变包含G578R并且第二改变包含C538G。在一些实施例中,改变包含D535G并且第二改变包含L385G。在一些实施例中,改变包含L516R并且第二改变包含D386R。在一些实施例中,改变包含L516R并且第二改变包含E507R。在一些实施例中,改变包含S511R并且第二改变包含Y381R。在一些实施例中,改变包含G578R并且第二改变包含N476G。在一些实施例中,改变包含E507R并且第二改变包含C371G。在一些实施例中,改变包含G578R并且第二改变包含T288R。在一些实施例中,改变包含L385G并且第二改变包含A597G。在一些实施例中,改变包含I521R并且第二改变包含D535G。在一些实施例中,改变包含S527R并且第二改变包含A597G。在一些实施例中,改变包含I521R并且第二改变包含E198R。在一些实施例中,改变包含S511R并且第二改变包含E198R。在一些实施例中,改变包含S511R并且第二改变包含M380R。在一些实施例中,改变包含S511R并且第二改变包含E507R。在一些实施例中,改变包含D129R并且第二改变包含A512R。在一些实施例中,改变包含G578R并且第二改变包含C371G。在一些实施例中,改变包含D509R并且第二改变包含L385G。在一些实施例中,改变包含I521R并且第二改变包含P618R。在一些实施例中,改变包含S511R并且第二改变包含V383R。在一些实施例中,改变包含L385G并且第二改变包含A512R。在一些实施例中,改变包含D509R并且第二改变包含P618R。在一些实施例中,改变包含Y381R并且第二改变包含L385G。在一些实施例中,改变包含E367R并且第二改变包含L385G。在一些实施例中,改变包含Q514G并且第二改变包含D129R。在一些实施例中,改变包含E198R并且第二改变包含E367R。在一些实施例中,改变包含D129R并且第二改变包含C371G。在一些实施例中,改变包含S527R并且第二改变包含D386R。在一些实施例中,改变包含Q514G并且第二改变包含E507R。在一些实施例中,改变包含V359R并且第二改变包含L385G。在一些实施例中,改变包含M380R并且第二改变包含L385G。在一些实施例中,改变包含Q514G并且第二改变包含R354G。在一些实施例中,改变包含E198R并且第二改变包含Y381R。在一些实施例中,改变包含M380R并且第二改变包含D129R。在一些实施例中,改变包含L580G并且第二改变包含D129R。在一些实施例中,改变包含D129R并且第二改变包含G578R。在一些实施例中,改变包含S511R并且第二改变包含A597G。在一些实施例中,改变包含D535G并且第二改变包含D158G。在一些实施例中,改变包含N476G并且第二改变包含A512R。在一些实施例中,改变包含Q514G并且第二改变包含L516R。在一些实施例中,改变包含E507R并且第二改变包含P618R。在一些实施例中,改变包含V383R并且第二改变包含D129R。在一些实施例中,改变包含L385G并且第二改变包含C538G。在一些实施例中,改变包含I521R并且第二改变包含D158G。在一些实施例中,改变包含L516R并且第二改变包含L580G。在一些实施例中,改变包含S527R并且第二改变包含D158G。在一些实施例中,改变包含H532R并且第二改变包含A512R。在一些实施例中,改变包含I521R并且第二改变包含R354G。在一些实施例中,改变包含I521R并且第二改变包含Y381R。在一些实施例中,改变包含D129R并且第二改变包含P615R。在一些实施例中,改变包含V359R并且第二改变包含E507R。在一些实施例中,改变包含E507R并且第二改变包含G578R。在一些实施例中,改变包含L516R并且第二改变包含P618R。在一些实施例中,改变包含R354G并且第二改变包含M380R。在一些实施例中,改变包含R354G并且第二改变包含D386R。在一些实施例中,改变包含I521R并且第二改变包含G578R。在一些实施例中,改变包含Y381R并且第二改变包含A512R。在一些实施例中,改变包含A512R并且第二改变包含D386R。在一些实施例中,改变包含M380R并且第二改变包含G578R。在一些实施例中,改变包含Y381R并且第二改变包含E507R。在一些实施例中,改变包含L580G并且第二改变包含E507R。在一些实施例中,改变包含V359R并且第二改变包含Y381R。在一些实施例中,改变包含P615R并且第二改变包含N476G。在一些实施例中,改变包含D158G并且第二改变包含N476G。在一些实施例中,改变包含Y381R并且第二改变包含P615R。在一些实施例中,改变包含V595G并且第二改变包含A512R。在一些实施例中,改变包含V383R并且第二改变包含D158G。在一些实施例中,改变包含E507R并且第二改变包含D158G。在一些实施例中,改变包含V383R并且第二改变包含C538G。在一些实施例中,改变包含V383R并且第二改变包含E507R。在一些实施例中,改变包含E198R并且第二改变包含D386R。在一些实施例中,改变包含D129R并且第二改变包含D386R。在一些实施例中,改变包含M380R并且第二改变包含D158G。在一些实施例中,改变包含E198R并且第二改变包含P618R。在一些实施例中,改变包含Q514G并且第二改变包含E198R。在一些实施例中,改变包含I521R并且第二改变包含S527R。在一些实施例中,改变包含E198R并且第二改变包含A512R。在一些实施例中,改变包含L385G并且第二改变包含C371G。在一些实施例中,改变包含H532R并且第二改变包含C538G。在一些实施例中,改变包含N476G并且第二改变包含C371G。在一些实施例中,改变包含Y381R并且第二改变包含N476G。在一些实施例中,改变包含M380R并且第二改变包含V383R。在一些实施例中,改变包含H532R并且第二改变包含T288R。在一些实施例中,改变包含Q514G并且第二改变包含D386R。在一些实施例中,改变包含R354G并且第二改变包含T288R。在一些实施例中,改变包含Y381R并且第二改变包含D158G。在一些实施例中,改变包含M380R并且第二改变包含E507R。在一些实施例中,改变包含P615R并且第二改变包含C371G。在一些实施例中,改变包含S527R并且第二改变包含D129R。在一些实施例中,改变包含M380R并且第二改变包含C538G。在一些实施例中,改变包含L580G并且第二改变包含R354G。在一些实施例中,改变包含L385G并且第二改变包含T288R。在一些实施例中,改变包含L580G并且第二改变包含G578R。在一些实施例中,改变包含E507R并且第二改变包含L385G。在一些实施例中,改变包含E507R并且第二改变包含P615R。在一些实施例中,改变包含E198R并且第二改变包含E507R。在一些实施例中,改变包含S511R并且第二改变包含D158G。在一些实施例中,改变包含G578R并且第二改变包含P618R。在一些实施例中,改变包含D509R并且第二改变包含P615R。在一些实施例中,改变包含D158G并且第二改变包含D386R。在一些实施例中,改变包含I521R并且第二改变包含Q514G。在一些实施例中,改变包含D535G并且第二改变包含D386R。在一些实施例中,改变包含P615R并且第二改变包含D386R。在一些实施例中,改变包含D535G并且第二改变包含G578R。在一些实施例中,改变包含D535G并且第二改变包含S527R。在一些实施例中,改变包含Y381R并且第二改变包含D386R。在一些实施例中,改变包含D129R并且第二改变包含D158G。在一些实施例中,改变包含Q514G并且第二改变包含G578R。在一些实施例中,改变包含L516R并且第二改变包含D129R。在一些实施例中,改变包含L385G并且第二改变包含D129R。在一些实施例中,改变包含L385G并且第二改变包含D158G。在一些实施例中,改变包含E198R并且第二改变包含H532R。在一些实施例中,改变包含Q514G并且第二改变包含C371G。在一些实施例中,改变包含G578R并且第二改变包含D386R。在一些实施例中,改变包含R354G并且第二改变包含A597G。在一些实施例中,改变包含Q514G并且第二改变包含A597G。在一些实施例中,改变包含E367R并且第二改变包含E507R。在一些实施例中,改变包含L580G并且第二改变包含C371G。在一些实施例中,改变包含E367R并且第二改变包含G578R。在一些实施例中,改变包含L516R并且第二改变包含M380R。在一些实施例中,改变包含H532R并且第二改变包含N476G。在一些实施例中,改变包含V359R并且第二改变包含D129R。在一些实施例中,改变包含S511R并且第二改变包含P615R。在一些实施例中,改变包含Q514G并且第二改变包含Y381R。在一些实施例中,改变包含M380R并且第二改变包含N476G。在一些实施例中,改变包含Q514G并且第二改变包含P615R。在一些实施例中,改变包含D158G并且第二改变包含C538G。在一些实施例中,改变包含Y381R并且第二改变包含E367R。在一些实施例中,改变包含I521R并且第二改变包含E507R。在一些实施例中,改变包含I521R并且第二改变包含L516R。在一些实施例中,改变包含L385G并且第二改变包含N476G。在一些实施例中,改变包含E198R并且第二改变包含N476G。在一些实施例中,改变包含R531G并且第二改变包含T288R。在一些实施例中,改变包含Y381R并且第二改变包含T288R。在一些实施例中,改变包含Y381R并且第二改变包含V595G。在一些实施例中,改变包含P615R并且第二改变包含D158G。在一些实施例中,改变包含D509R并且第二改变包含E198R。在一些实施例中,改变包含E507R并且第二改变包含V595G。在一些实施例中,改变包含L580G并且第二改变包含P615R。在一些实施例中,改变包含D509R并且第二改变包含L580G。在一些实施例中,改变包含V359R并且第二改变包含D158G。在一些实施例中,改变包含S527R并且第二改变包含Y381R。在一些实施例中,改变包含D509R并且第二改变包含C371G。在一些实施例中,改变包含E198R并且第二改变包含G578R。在一些实施例中,改变包含D535G并且第二改变包含D129R。在一些实施例中,改变包含L516R并且第二改变包含P615R。在一些实施例中,改变包含D129R并且第二改变包含T288R。在一些实施例中,改变包含R354G并且第二改变包含V383R。在一些实施例中,改变包含E507R并且第二改变包含D129R。在一些实施例中,改变包含E507R并且第二改变包含A512R。在一些实施例中,改变包含N476G并且第二改变包含C538G。在一些实施例中,改变包含I521R并且第二改变包含L580G。在一些实施例中,改变包含L516R并且第二改变包含C371G。在一些实施例中,改变包含D535G并且第二改变包含L580G。在一些实施例中,改变包含D535G并且第二改变包含E507R。在一些实施例中,改变包含D129R并且第二改变包含C538G。在一些实施例中,改变包含R354G并且第二改变包含C538G。在一些实施例中,改变包含I521R并且第二改变包含D386R。在一些实施例中,改变包含Y381R并且第二改变包含D129R。在一些实施例中,改变包含V383R并且第二改变包含N476G。在一些实施例中,改变包含M380R并且第二改变包含P615R。在一些实施例中,改变包含E507R并且第二改变包含A597G。在一些实施例中,改变包含S527R并且第二改变包含E507R。在一些实施例中,改变包含I521R并且第二改变包含D129R。在一些实施例中,改变包含Q514G并且第二改变包含V359R。在一些实施例中,改变包含Y381R并且第二改变包含A597G。在一些实施例中,改变包含S511R并且第二改变包含D535G。在一些实施例中,改变包含L580G并且第二改变包含D158G。在一些实施例中,改变包含D509R并且第二改变包含D158G。在一些实施例中,改变包含E198R并且第二改变包含D129R。在一些实施例中,改变包含L385G并且第二改变包含V595G。在一些实施例中,改变包含P615R并且第二改变包含T288R。在一些实施例中,改变包含M380R并且第二改变包含P618R。在一些实施例中,改变包含V383R并且第二改变包含C371G。在一些实施例中,改变包含D509R并且第二改变包含N476G。在一些实施例中,改变包含M380R并且第二改变包含T288R。在一些实施例中,改变包含S511R并且第二改变包含S527R。在一些实施例中,改变包含D158G并且第二改变包含T288R。在一些实施例中,改变包含Q514G并且第二改变包含S527R。在一些实施例中,改变包含L516R并且第二改变包含Y381R。在一些实施例中,改变包含R354G并且第二改变包含E367R。在一些实施例中,改变包含A512R并且第二改变包含T288R。在一些实施例中,改变包含V359R并且第二改变包含D386R。在一些实施例中,改变包含S527R并且第二改变包含V595G。在一些实施例中,改变包含D509R并且第二改变包含A512R。在一些实施例中,改变包含D535G并且第二改变包含Q514G。在一些实施例中,改变包含W350R并且第二改变包含N476G。在一些实施例中,改变包含S511R并且第二改变包含D129R。在一些实施例中,改变包含V359R并且第二改变包含P615R。在一些实施例中,改变包含I521R并且第二改变包含P615R。在一些实施例中,改变包含M380R并且第二改变包含A597G。在一些实施例中,改变包含E367R并且第二改变包含D386R。在一些实施例中,改变包含M380R并且第二改变包含D386R。在一些实施例中,改变包含L516R并且第二改变包含S527R。在一些实施例中,改变包含L385G并且第二改变包含D386R。在一些实施例中,改变包含V383R并且第二改变包含T288R。在一些实施例中,改变包含V359R并且第二改变包含M380R。在一些实施例中,改变包含L385G并且第二改变包含H532R。在一些实施例中,改变包含S511R并且第二改变包含V359R。在一些实施例中,改变包含R354G并且第二改变包含P615R。在一些实施例中,改变包含L516R并且第二改变包含A597G。在一些实施例中,改变包含E507R并且第二改变包含D386R。在一些实施例中,改变包含I521R并且第二改变包含A597G。在一些实施例中,改变包含V595G并且第二改变包含D386R。在一些实施例中,改变包含N476G并且第二改变包含P618R。在一些实施例中,改变包含E367R并且第二改变包含D129R。在一些实施例中,改变包含D535G并且第二改变包含M380R。在一些实施例中,改变包含S527R并且第二改变包含H532R。在一些实施例中,改变包含D509R并且第二改变包含I521R。在一些实施例中,改变包含E198R并且第二改变包含V595G。在一些实施例中,改变包含E198R并且第二改变包含D158G。在一些实施例中,改变包含D509R并且第二改变包含A597G。在一些实施例中,改变包含A597G并且第二改变包含T288R。在一些实施例中,改变包含D509R并且第二改变包含D129R。在一些实施例中,改变包含P615R并且第二改变包含A597G。在一些实施例中,改变包含S511R并且第二改变包含E367R。在一些实施例中,改变包含L516R并且第二改变包含E198R。在一些实施例中,改变包含D535G并且第二改变包含A597G。在一些实施例中,改变包含H532R并且第二改变包含D158G。在一些实施例中,改变包含H532R并且第二改变包含D129R。在一些实施例中,改变包含D535G并且第二改变包含Y381R。在一些实施例中,改变包含E507R并且第二改变包含T288R。在一些实施例中,改变包含H532R并且第二改变包含G578R。在一些实施例中,改变包含D509R并且第二改变包含L516R。在一些实施例中,改变包含G578R并且第二改变包含A597G。在一些实施例中,改变包含L580G并且第二改变包含A597G。在一些实施例中,改变包含R531G并且第二改变包含C371G。在一些实施例中,改变包含D535G并且第二改变包含C371G。在一些实施例中,改变包含E507R并且第二改变包含N476G。在一些实施例中,改变包含L516R并且第二改变包含H532R。在一些实施例中,改变包含V383R并且第二改变包含A597G。在一些实施例中,改变包含G578R并且第二改变包含V595G。在一些实施例中,改变包含D509R并且第二改变包含Y381R。在一些实施例中,改变包含D158G并且第二改变包含P618R。在一些实施例中,改变包含P618R并且第二改变包含C538G。在一些实施例中,改变包含P618R并且第二改变包含C371G。在一些实施例中,改变包含N476G并且第二改变包含D386R。在一些实施例中,改变包含V359R并且第二改变包含P618R。在一些实施例中,改变包含D509R并且第二改变包含Q514G。在一些实施例中,改变包含H532R并且第二改变包含D386R。在一些实施例中,改变包含L580G并且第二改变包含W350R。在一些实施例中,改变包含S527R并且第二改变包含V359R。在一些实施例中,改变包含T288R并且第二改变包含C371G。在一些实施例中,改变包含I521R并且第二改变包含H532R。在一些实施例中,改变包含W350R并且第二改变包含A512R。在一些实施例中,改变包含V595G并且第二改变包含D158G。在一些实施例中,改变包含Y381R并且第二改变包含M380R。在一些实施例中,改变包含M380R并且第二改变包含R531G。在一些实施例中,改变包含D535G并且第二改变包含L516R。在一些实施例中,改变包含M380R并且第二改变包含C371G。在一些实施例中,改变包含V595G并且第二改变包含C538G。在一些实施例中,改变包含L516R并且第二改变包含R354G。在一些实施例中,改变包含D129R并且第二改变包含V595G。在一些实施例中,改变包含D509R并且第二改变包含S527R。在一些实施例中,改变包含V383R并且第二改变包含P615R。在一些实施例中,改变包含Y381R并且第二改变包含H532R。在一些实施例中,改变包含D129R并且第二改变包含A597G。在一些实施例中,改变包含L516R并且第二改变包含R531G。在一些实施例中,改变包含D386R并且第二改变包含C371G。在一些实施例中,改变包含H532R并且第二改变包含C371G。在一些实施例中,改变包含W350R并且第二改变包含C538G。在一些实施例中,改变包含V383R并且第二改变包含W350R。在一些实施例中,改变包含P615R并且第二改变包含P618R。在一些实施例中,改变包含S511R并且第二改变包含H532R。在一些实施例中,改变包含R354G并且第二改变包含P618R。在一些实施例中,改变包含G578R并且第二改变包含R531G。在一些实施例中,改变包含E367R并且第二改变包含D158G。在一些实施例中,改变包含V359R并且第二改变包含A597G。在一些实施例中,改变包含L580G并且第二改变包含P618R。在一些实施例中,改变包含I521R并且第二改变包含W350R。在一些实施例中,改变包含W350R并且第二改变包含G578R。在一些实施例中,改变包含Q514G并且第二改变包含E367R。在一些实施例中,改变包含S511R并且第二改变包含V595G。在一些实施例中,改变包含C538G并且第二改变包含D386R。在一些实施例中,改变包含A597G并且第二改变包含D386R。在一些实施例中,改变包含H532R并且第二改变包含P615R。在一些实施例中,改变包含V359R并且第二改变包含V595G。在一些实施例中,改变包含M380R并且第二改变包含H532R。在一些实施例中,改变包含W350R并且第二改变包含P618R。在一些实施例中,改变包含H532R并且第二改变包含P618R。在一些实施例中,改变包含Q514G并且第二改变包含H532R。在一些实施例中,改变包含L580G并且第二改变包含H532R。在一些实施例中,改变包含W350R并且第二改变包含T288R。在一些实施例中,改变包含D509R并且第二改变包含E507R。在一些实施例中,改变包含P618R并且第二改变包含D386R。在一些实施例中,改变包含E507R并且第二改变包含W350R。在一些实施例中,改变包含A597G并且第二改变包含C538G。在一些实施例中,改变包含S511R并且第二改变包含L516R。在一些实施例中,改变包含W350R并且第二改变包含L385G。在一些实施例中,改变包含W350R并且第二改变包含D158G。在一些实施例中,改变包含P618R并且第二改变包含A597G。在一些实施例中,改变包含Q514G并且第二改变包含V595G。在一些实施例中,改变包含E198R并且第二改变包含W350R。在一些实施例中,改变包含D509R并且第二改变包含V383R。在一些实施例中,改变包含D509R并且第二改变包含R354G。
在一些实施例中,变体多肽包含D535G、L516R、和I521R取代。在一些实施例中,变体多肽包含D509R、L516R、和I521R取代。在一些实施例中,变体多肽包含D535G、L516R、和Q514G取代。在一些实施例中,变体多肽包含D535G、Q514G、和I521R取代。在一些实施例中,变体多肽包含Q514G、I521R、L580G、和E198R取代。在一些实施例中,变体多肽包含D535G、Q514G、I521R、和E198R取代。在一些实施例中,变体多肽包含D535G、L516R、Q514G、和I521R取代。在一些实施例中,变体多肽包含Q514G、I521R、S527R、和E198R取代。在一些实施例中,变体多肽包含D509R、D535G、L516R、Q514G、和I521R取代。在一些实施例中,变体多肽包含D535G、L516R、I521R、和S527R取代。在一些实施例中,变体多肽包含D535G、I521R、L580G、和E198R取代。在一些实施例中,变体多肽包含D509R、D535G、和L516R取代。在一些实施例中,变体多肽包含I521R、S527R、E198R、和M380R取代。在一些实施例中,变体多肽包含D509R、L516R、和Q514G取代。在一些实施例中,变体多肽包含D509R、Q514G、和I521R取代。在一些实施例中,变体多肽包含D535G、L516R、Q514G、和S511R取代。在一些实施例中,变体多肽包含D535G、L516R、Q514G、和S527R取代。在一些实施例中,变体多肽包含I521R、S527R、L580G、和E198R取代。在一些实施例中,变体多肽包含D535G、L516R、S527R、和M380R取代。在一些实施例中,变体多肽包含Q514G、S527R、L580G、和E198R取代。在一些实施例中,变体多肽包含L516R、Q514G、I521R、和M380R取代。在一些实施例中,变体多肽包含D509R、L516R、Q514G、和S527R取代。在一些实施例中,变体多肽包含D509R、I521R、L580G、和E198R取代。在一些实施例中,变体多肽包含S527R、L580G、E198R、和M380R取代。在一些实施例中,变体多肽包含L516R、S527R、L580G、和E198R取代。在一些实施例中,变体多肽包含D509R、Q514G、I521R、和E198R取代。在一些实施例中,变体多肽包含D535G、Q514G、I521R、和S527R取代。在一些实施例中,变体多肽包含Q514G、L580G、E198R、和M380R取代。在一些实施例中,变体多肽包含D509R、L516R、I521R、和E198R取代。在一些实施例中,变体多肽包含L516R、Q514G、I521R、和L580G取代。在一些实施例中,变体多肽包含D509R、D535G、Q514G、和E198R取代。在一些实施例中,变体多肽包含L516R、I521R、S527R、和L580G取代。在一些实施例中,变体多肽包含D535G、I521R、S527R、和M380R取代。在一些实施例中,变体多肽包含L516R、I521R、L580G、和E198R取代。在一些实施例中,变体多肽包含D509R、D535G、和I521R取代。在一些实施例中,变体多肽包含D535G、S527R、L580G、和E198R取代。在一些实施例中,变体多肽包含D509R、D535G、和Q514G取代。在一些实施例中,变体多肽包含S527R、L580G、E198R、和R354G取代。在一些实施例中,变体多肽包含Q514G、I521R、S527R、和L580G取代。在一些实施例中,变体多肽包含D535G、Q514G、E198R、和M380R取代。在一些实施例中,变体多肽包含L516R、Q514G、L580G、和E198R取代。在一些实施例中,变体多肽包含I521R、S527R、E198R、和R354G取代。在一些实施例中,变体多肽包含I521R、S527R、R354G、和M380R取代。在一些实施例中,变体多肽包含I521R、L580G、E198R、和M380R取代。在一些实施例中,变体多肽包含L516R、Q514G、S527R、和L580G取代。在一些实施例中,变体多肽包含D535G、Q514G、S527R、和E198R取代。在一些实施例中,变体多肽包含D509R、Q514G、L580G、和E198R取代。在一些实施例中,变体多肽包含K136G、N220R、和M380R取代。在一些实施例中,变体多肽包含S78K、E198R、和R354G取代。在一些实施例中,变体多肽包含K141G、N220R、和M380R取代。在一些实施例中,变体多肽包含K141G、K240R、和M380R取代。在一些实施例中,变体多肽包含K141G、D277R、和M380R取代。在一些实施例中,变体多肽包含K136G、D277R、和M380R取代。在一些实施例中,变体多肽包含S78K、E198R、和L385R取代。在一些实施例中,变体多肽包含L580G、L385G、S511R、和A512R取代。在一些实施例中,变体多肽包含S78K、E198R、和M380R取代。在一些实施例中,变体多肽包含K136G、K240R、和M380R取代。在一些实施例中,变体多肽包含T165R、N220R、和M380R取代。在一些实施例中,变体多肽包含L580G、L385G、Q514G、和A512R取代。在一些实施例中,变体多肽包含D129R、P618R、S511R、和A512R取代。在一些实施例中,变体多肽包含S78K、E198R、和K374R取代。在一些实施例中,变体多肽包含T165R、D277R、和M380R取代。在一些实施例中,变体多肽包含L580G、L385G、G578R、和D158G取代。在一些实施例中,变体多肽包含D129R、P618R、R354G、和A512R取代。在一些实施例中,变体多肽包含T165R、K240R、和M380R取代。在一些实施例中,变体多肽包含K141G、K240R、和L385R取代。在一些实施例中,变体多肽包含K136G、N220R、和L385R取代。在一些实施例中,变体多肽包含D129R、P618R、Q514G、和A512R取代。在一些实施例中,变体多肽包含D129R、P618R、S527R、和L385G取代。在一些实施例中,变体多肽包含K141G、N220R、和L385R取代。在一些实施例中,变体多肽包含L580G、L385G、Q514G、和N476G取代。在一些实施例中,变体多肽包含L580G、L385G、A512R、和P618R取代。在一些实施例中,变体多肽包含K141G、D277R、和L385R取代。在一些实施例中,变体多肽包含D129R、P618R、D158G、和A512R取代。在一些实施例中,变体多肽包含K136G、N220R、和K374R取代。在一些实施例中,变体多肽包含K136G、D277R、和L385R取代。在一些实施例中,变体多肽包含K136G、K240R、和L385R取代。在一些实施例中,变体多肽包含L580G、L385G、S527R、和C538G取代。在一些实施例中,变体多肽包含T165R、K240R、和L385R取代。在一些实施例中,变体多肽包含D129R、P618R、V359R、和A512R取代。
在一些实施例中,变体多肽包含增加变体多肽与RNA指导物的相互作用的改变。在一些实施例中,增加与RNA指导物的相互作用的改变是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、或组氨酸取代。在一些实施例中,变体多肽包含增加变体多肽与靶核酸的相互作用的改变。在一些实施例中,增加与靶核酸的相互作用的改变是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、或组氨酸取代。在一些实施例中,变体多肽包含丙氨酸取代。在一些实施例中,丙氨酸取代不影响变体多肽主链的几何形状。在一些实施例中,变体多肽包含甘氨酸取代。在一些实施例中,甘氨酸取代改变了变体多肽主链的Ramachandran键角。
在一些实施例中,变体多肽包含至少一个RuvC基序或RuvC结构域。如本文所用,“生物活性部分”是保留亲本多肽(例如,“最小”或“核心”结构域)的至少一种功能(例如,完全地、部分地、最低限度地)的部分。在一些实施例中,变体多肽保留至少与亲本多肽一样活性的酶活性。因此,在一些实施例中,变体多肽具有比亲本多肽更大的酶活性。
在一些实施例中,变体多肽具有降低的核酸酶活性,或者是核酸酶失活型多肽。如本文所用,本文披露的多肽的催化残基包含D345、E506、和D594。在一些实施例中,相对于亲本多肽,在D345和/或E506和/或D594处包含取代(例如,D345A和/或E506A和/或D594A)的变体多肽表现出降低的核酸酶活性或没有表现出核酸酶活性。在一些实施例中,残基R593有助于核酸酶活性。在一些实施例中,R593处的取代改变核酸酶活性,例如导致核酸酶活性降低。
在一些实施例中,本披露的变体多肽具有相当于或大于亲本多肽的酶活性。在一些实施例中,本披露的变体多肽在从约20℃至约90℃的温度范围下具有酶活性。在一些实施例中,本披露的变体多肽在约20℃至约25℃的温度下或在约37℃的温度下具有酶活性。
在一些实施例中,与亲本多肽相比,变体多肽包含增强对RNA的亲和力(例如RNA亲和力)的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的RNA亲和力。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的RNA亲和力。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的RNA亲和力。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的RNA亲和力。
在一些实施例中,与亲本多肽相比,变体多肽包含增强与RNA指导物的复合物形成(例如,二元复合物形成)的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的二元复合物形成。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的二元复合物形成。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的二元复合物形成。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的二元复合物形成。
在一些实施例中,与亲本多肽相比,变体多肽包含增强与RNA指导物的结合活性的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的RNA指导物结合活性。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的RNA指导物结合活性。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的RNA指导物结合活性。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的RNA指导物结合活性。
在一些实施例中,与亲本多肽相比,变体多肽包含增强与RNA指导物的结合特异性的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的RNA指导物结合特异性。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的RNA指导物结合特异性。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的RNA指导物结合特异性。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的RNA指导物结合特异性。
在一些实施例中,与亲本多肽相比,变体多肽包含增强蛋白质-RNA相互作用的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的蛋白质-RNA相互作用。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的蛋白质-RNA相互作用。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的蛋白质-RNA相互作用。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的蛋白质-RNA相互作用。
在一些实施例中,与亲本多肽相比,变体多肽包含增强蛋白质稳定性的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的蛋白质稳定性。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的蛋白质稳定性。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的蛋白质稳定性。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的蛋白质稳定性。
在一些实施例中,与亲本多肽相比,变体多肽包含降低与RNA指导物的解离(例如,二元复合物解离)的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出降低的与RNA指导物的解离。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出降低的与RNA指导物的解离。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出降低的与RNA指导物的解离。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出降低的与RNA指导物的解离。在一些实施例中,与亲本多肽相比,变体多肽在至少约10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的任一个的孵育期内表现出降低的与RNA指导物的解离。在一些实施例中,变体CRISPR核酸酶核糖核蛋白(RNP)复合物不与不同的RNA交换RNA指导物。
在一些实施例中,与亲本多肽相比,变体多肽包含增强与RNA指导物和靶核酸的三元复合物形成的至少一个改变。在一些实施例中,与亲本多肽相比,变体多肽在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的三元复合物形成。在一些实施例中,与亲本多肽相比,变体多肽在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的三元复合物形成。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本多肽相比,变体多肽表现出增强的三元复合物形成。在一个实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少8℃时,变体多肽表现出增强的三元复合物形成。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本二元复合物相比,包含变体多肽的二元复合物(例如,变体二元复合物)表现出增强的对靶核酸的结合亲和力。在一些实施例中,与亲本二元复合物相比,变体二元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的对靶核酸的结合亲和力。在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的对靶核酸的结合亲和力。在一些实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本二元复合物相比,变体二元复合物表现出增强的对靶核酸的结合亲和力。在一个实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少8℃时,变体二元复合物表现出增强的对靶核酸的结合亲和力。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本二元复合物相比,包含变体多肽的二元复合物(例如,变体二元复合物)表现出增强的中靶结合活性。在一些实施例中,与亲本二元复合物相比,变体二元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的中靶结合活性。在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的中靶结合活性。在一些实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本二元复合物相比,变体二元复合物表现出增强的中靶结合活性。在一个实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少8℃时,变体二元复合物表现出增强的中靶结合活性。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本二元复合物相比,包含变体多肽的二元复合物(例如,变体二元复合物)表现出增强的中靶结合特异性。在一些实施例中,与亲本二元复合物相比,变体二元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的中靶结合特异性。在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的中靶结合特异性。在一些实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本二元复合物相比,变体二元复合物表现出增强的中靶结合特异性。在一个实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少8℃时,变体二元复合物表现出增强的中靶结合特异性。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本二元复合物相比,包含变体多肽的二元复合物(例如,变体二元复合物)表现出降低的与非靶核酸的脱靶结合。在一些实施例中,与亲本二元复合物相比,变体二元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出降低的与非靶核酸的脱靶结合。在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出降低的与非靶核酸的脱靶结合。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本二元复合物相比,变体二元复合物表现出降低的与非靶核酸的脱靶结合。在一个实施例中,当变体二元复合物的Tm值比亲本多肽的Tm值大至少8℃时,变体二元复合物表现出降低的与非靶核酸的脱靶结合。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本二元复合物相比,包含变体多肽的二元复合物(例如,变体二元复合物)表现出降低的与靶核酸的解离。在一些实施例中,与亲本二元复合物相比,变体二元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出降低的与靶核酸的解离。在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出降低的与靶核酸的解离。在一些实施例中,当变体多肽的Tm值比亲本多肽的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本二元复合物相比,变体二元复合物表现出降低的与靶核酸的解离。在一个实施例中,当变体二元复合物的Tm值比亲本多肽的Tm值大至少8℃时,变体二元复合物表现出降低的与靶核酸的解离。
在一些实施例中,变体多肽包含至少一个改变,使得与亲本三元复合物相比,包含变体多肽的三元复合物(例如,变体三元复合物)表现出增强的稳定性。在一些实施例中,与亲本三元复合物相比,变体三元复合物在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中任一个低的温度下表现出增强的稳定性。在一些实施例中,与亲本三元复合物相比,变体三元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出增强的稳定性。在一些实施例中,当变体三元复合物的Tm值比亲本三元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、或20℃时,与亲本三元复合物相比,变体三元复合物表现出增强的稳定性。在一个实施例中,当变体三元复合物的Tm值比亲本三元复合物的Tm值大至少8℃时,变体三元复合物表现出增强的稳定性。
尽管本文所述的变化可以是一个或多个氨基酸的变化,但变体多肽的变化也可以是实质性的,例如作为氨基和/或羧基末端延伸的多肽融合。例如,变体多肽可含有另外的肽,例如一种或多种肽。另外的肽的实例可包括用于标记的表位肽,如多组氨酸标签(His标签)、Myc和FLAG。在一些实施例中,本文所述的变体多肽可以融合到可检测部分,如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。
在一些实施例中,变体多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,变体多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,变体多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,本文所述的变体多肽可以是自灭活的。参见Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自灭活的CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50,将其通过引用以其全文并入。
在一些实施例中,编码本文所述的变体多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物体。例如,核酸可以经密码子优化以用于任何非人真核生物,包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按多种方式进行改编。参见Nakamura等人Nucl.Acids Res.[核酸研究]28:292(2000),将其通过引用以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,如Gene Forge(Aptagen公司;雅各布斯,宾夕法尼亚州)。
RNA指导物
在一些实施例中,如本文所述的组合物或复合物包含结合靶核酸并且与变体多肽相互作用的靶向部分(例如,RNA指导物、反义寡核苷酸、肽寡核苷酸缀合物)。靶向部分可结合靶核酸(例如,利用对靶核酸的特异性结合亲和力)。
在一些实施例中,靶向部分包含或是RNA指导物。在一些实施例中,RNA指导物将本文所述的变体多肽导向特定核酸序列。阅读特定种类的RNA指导物的以下实例的本领域技术人员将理解,在一些实施例中,RNA指导物具有位点特异性。即,在一些实施例中,RNA指导物与一个或多个靶核酸序列(例如,特异性DNA或基因组DNA序列)特异性缔合,而不与非靶核酸序列(例如,非特异性DNA或随机序列)特异性缔合。
在一些实施例中,如本文所述的组合物包含与本文所述的变体多肽缔合并且将变体多肽导向靶核酸序列(例如,DNA)的RNA指导物。在一些实施例中,RNA指导物可以与本文所述的多肽(例如,具有SEQ ID NO:3的氨基酸序列的多肽或其变体)缔合。在一些实施例中,RNA指导物将多肽导向至靶核酸序列(例如,DNA)。
RNA指导物可靶向(例如,缔合、导向、接触或结合)靶序列(例如,位点特异性序列或位点特异性靶)的一个或多个核苷酸。在一些实施例中,变体核糖核蛋白(例如,变体CRISPR核酸酶多肽加RNA指导物)在结合到与RNA指导物中的DNA靶向序列互补的靶核酸(例如,序列特异性底物或靶核酸)时被活化。
在一些实施例中,间隔子或间隔子序列是RNA指导物中的一部分,其是靶序列(DNA序列)的RNA等同物。典型地,间隔子含有能够经由碱基配对在与靶序列互补的位点处(在PAM链中)与非PAM链结合的序列。在一些情况下,当出于该比较的目的考虑T等于U时,间隔子可以与靶序列具有至少75%同一性(例如,至少80%、至少85%、至少90%、至少95%、至少98%或至少99%)。在一些情况下,出于该比较的目的,当考虑T等于U时,间隔子可以与靶序列100%相同。
在一些情况下,当第一多核苷酸(例如,RNA指导物的间隔子序列)与第二多核苷酸(例如,靶序列的互补序列)具有一定水平的互补性,使得该第一多核苷酸和该第二多核苷酸可以经由碱基配对形成双链复合物,以允许与该第一多核苷酸复合的效应子多肽作用于(例如,切割)该第二多核苷酸时,多核苷酸与另一多核苷酸互补。在一些实施例中,第一多核苷酸可以与第二多核苷酸基本上互补。在一些实施例中,第一多核苷酸与第二多核苷酸具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的互补性。在一些实施例中,第一多核苷酸与第二多核苷酸完全互补,即,与该第二多核苷酸具有100%的互补性。
在一些实施例中,RNA指导物包含具有约11个核苷酸至约100个核苷酸的长度的间隔子。例如,DNA靶向区段可以具有约11个核苷酸至约80个核苷酸、约11个核苷酸至约50个核苷酸、约11个核苷酸至约40个核苷酸、约11个核苷酸至约30个核苷酸、约11个核苷酸至约25个核苷酸、约11个核苷酸至约20个核苷酸或约11个核苷酸至约19个核苷酸的长度。例如,间隔子可以具有约19个核苷酸至约20个核苷酸、约19个核苷酸至约25个核苷酸、约19个核苷酸至约30个核苷酸、约19个核苷酸至约35个核苷酸、约19个核苷酸至约40个核苷酸、约19个核苷酸至约45个核苷酸、约19个核苷酸至约50个核苷酸、约19个核苷酸至约60个核苷酸、约19个核苷酸至约70个核苷酸、约19个核苷酸至约80个核苷酸、约19个核苷酸至约90个核苷酸、约19个核苷酸至约100个核苷酸、约20个核苷酸至约25个核苷酸、约20个核苷酸至约30个核苷酸、约20个核苷酸至约35个核苷酸、约20个核苷酸至约40个核苷酸、约20个核苷酸至约45个核苷酸、约20个核苷酸至约50个核苷酸、约20个核苷酸至约60个核苷酸、约20个核苷酸至约70个核苷酸、约20个核苷酸至约80个核苷酸、约20个核苷酸至约90个核苷酸或约20个核苷酸至约100个核苷酸的长度。
在一些实施例中,RNA指导物的间隔子通常可被设计成具有介于11个与50个核苷酸之间(例如,11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸)的长度并且与特定靶核酸序列互补。在一些特定的实施例中,RNA指导物可被设计成与例如基因组基因座的特定DNA链互补。在一些实施例中,DNA靶向序列被设计成与例如基因组基因座的特定DNA链互补。
RNA指导物可与参考核酸序列的互补链基本上相同。在一些实施例中,RNA指导物包含与参考核酸序列(例如,靶核酸)的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个这样的核酸之间的同一性百分比。
在一些实施例中,RNA指导物与靶核酸的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性。
在一些实施例中,RNA指导物包含长度介于11个与50个核苷酸(例如,11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35个核苷酸)之间并且与靶核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的间隔子。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含长度为至多50并且与靶核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列(例如,RNA序列)。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。
在某些实施例中,RNA指导物包括与DNA靶向序列连接的同向重复序列、基本上由该序列组成或包含该序列。在一些实施例中,RNA指导物包括同向重复序列和DNA靶向序列或同向重复-DNA靶向序列-同向重复序列。在一些实施例中,RNA指导物包括截短的同向重复序列和DNA靶向序列,这些序列是加工的或成熟的crRNA的典型特征。在一些实施例中,本文所述的变体多肽与RNA指导物形成复合物,并且RNA指导物指导复合物与和RNA指导物的至少一部分互补的位点特异性靶核酸缔合。
在一些实施例中,同向重复序列与表3中所示的序列或表3中所示的序列的一部分具有至少90%同一性。在一些实施例中,同向重复序列与表3中所示的序列或表3中所示的序列的一部分具有至少95%(例如,至少97%、至少99%、或至少100%)同一性。在一些实施例中,同向重复序列与表3中所示的序列或表3中所示的序列的一部分是相同的。在一些实施例中,同向重复序列包含SEQ ID NO:4-6中任一个所示的核苷酸序列。
表3.同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:4 | CUCGCGGUCCCAUCGGAACGGGUUGUGGUUCCGAC |
SEQ ID NO:5 | CUCGCGGUCCCAUCGGAACGGGUUUGUGGUUCCGAC |
SEQ ID NO:6 | GGUCCCAUCGGAACGGGUUGUGGUUCCGAC |
在一些实施例中,同向重复序列包含与UGUGGUUCCGAC(SEQ ID NO:7)具有至少90%同一性的序列。在一些实施例中,同向重复序列包含SEQ ID NO:7中所示的序列。
在一些实施例中,对应于本披露的变体多肽的PAM包括5’-NTN-3’、5’-HTN-3’或5’-TNA-3’。如本文所用,N可以各自是任何核苷酸(例如,A、G、T或C)或其子集(例如,R(A或G)、Y(C或T)、K(G或T)、B(G、T或C)、H(A、C或T))。在一些实施例中,PAM包含5’-CTG-3’。在一些实施例中,PAM包含5’-CTC-3’。在一些实施例中,包含本披露的变体多肽的二元复合物结合与5’-NTN-3’、5’-HTN-3’、或5’-TNA-3’序列相邻的靶核酸。在一些实施例中,包含本披露的变体多肽的二元复合物结合与5’-CTG-3’或5’-CTC-3’序列相邻的靶核酸。
在一些实施例中,本文所述的组合物或复合物包括一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)RNA指导物,例如多个RNA指导物。
在一些实施例中,RNA指导物具有类似于例如国际公布号WO2014/093622和WO2015/070083的RNA指导物的结构,将每篇文献的全部内容通过引用并入本文。
除非另有说明,否则本文提供的所有组合物和复合物和多肽都是参考该组合物或复合物或多肽的活性水平而制成的,并且不包括杂质,例如可能存在于市售来源中的残留溶剂或副产物。酶组分重量基于总活性蛋白质。除非另外指明,否则所有百分比和比率均按重量进行计算。除非另外指明,否则所有百分比和比率均基于总组合物计算。在示例性组合物中,酶水平以总组合物的重量计按纯酶表示,除非另有说明,否则成分以总组合物的重量表示。
修饰
RNA指导物或编码变体多肽的任何核酸序列可包括关于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰,这些共价修饰包括在本披露的范围内。
示例性修饰可以包括对糖、核碱基、核苷间键(例如,对连接性磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。
RNA指导物或编码变体多肽的组分的任何核酸序列可包括任何有用的修饰,如对糖、核碱基或核苷间键(例如,对连接性磷酸盐/磷酸二酯键/磷酸二酯主链)的修饰。嘧啶核碱基的一个或多个原子可被任选经取代的氨基、任选经取代的硫醇、任选经取代的烷基(例如,甲基或乙基)或卤基(例如,氯或氟)替代或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(RNA)到脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或它们的杂交体的修饰。本文描述了另外的修饰。
在一些实施例中,修饰可包括化学或细胞诱导的修饰。例如,细胞内RNA修饰的一些非限制性实例由Lewis和Pan在“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论:分子细胞生物学],2017,18:202-210中所描述。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解,核苷酸类似物或一个或多个其他修饰可位于序列的任何一个或多个位置处,使得序列的功能基本上不降低。序列可包括约1%至约100%的经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何介于中间的百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,糖修饰(例如,2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间键(例如核苷间修饰,包括磷酸二酯键的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中,序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和具有正常3'-5'连接的硼烷磷酸酯、这些酯的2'-5'连接的类似物,以及具有相反极性的那些,其中相邻的核苷单元对3'-5'连接至5'-3'或2'-5'连接至5'-2'。也包括各种盐、混合盐和游离酸形式。在一些实施例中,序列可带负电荷或带正电荷。
可掺入序列中的经修饰的核苷酸可以在核苷间键(例如,磷酸酯主链)上被修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换地使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外,经修饰的核苷和核苷酸可以包括用如本文所述的另一核苷间键对未经修饰的磷酸酯部分进行整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼烷磷酸酯(boranophosphate)、硼烷磷酸酯(boranophosphate ester)、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。
提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链连接赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性,并因此在细胞环境中具有更长的半衰期。
在特定实施例中,经修饰的核苷包括α-硫代-核苷(例如5'-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5'-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根据本披露采用的其他核苷间键,包括不含有磷原子的核苷间键。
在一些实施例中,序列可包括一个或多个细胞毒性核苷。例如,可将细胞毒性核苷掺入序列中,如双功能修饰。细胞毒性核苷可包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-反油酸酯)。
在一些实施例中,序列包括一种或多种转录后修饰(例如,加帽、切割、多聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰,如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P,和McCloskey,J.(1999).The RNA Modification Database:1999update[RNA修饰数据库:1999年更新].Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中,第一分离的核酸包含信使RNA(mRNA)。在一些实施例中,mRNA包含选自由以下组成的组的至少一种核苷:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包含选自由以下组成的组的至少一种核苷:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包含选自由以下组成的组的至少一种核苷:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mRNA包含选自由以下组成的组的至少一种核苷:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸嘌呤或嘧啶,或者A、G、U、C、I、pU中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,该肌苷可以帮助免疫系统将序列相对于病毒RNA表征为内源性。肌苷的掺入还可以介导改善的RNA稳定性/减少降解。参见例如,Yu,Z.等人(2015)RNA editing by ADAR1 marks dsRNA as“self”[ADAR1进行的RNA编辑将dsRNA标记为“自我”].Cell Res.[细胞研究]25,1283-1284,将其通过引用以其全文并入。
靶核酸
本文披露的方法适用于多种靶核酸。在一些实施例中,靶核酸是DNA,如DNA基因座。在一些实施例中,靶核酸是RNA,如RNA基因座或mRNA。在一些实施例中,靶核酸是单链的(例如,单链DNA)。在一些实施例中,靶核酸是双链的(例如,双链DNA)。在一些实施例中,靶核酸包含单链区和双链区两者。在一些实施例中,靶核酸是线性的。在一些实施例中,靶核酸是环状的。在一些实施例中,靶核酸包含一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损核苷酸或核苷酸类似物。在一些实施例中,靶核酸是未经修饰的。
靶核酸可以具有任何长度,例如约至少100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1Mb之一或更长。靶核酸也可包含任何序列。在一些实施例中,靶核酸是富含GC的,如具有至少约40%、45%、50%、55%、60%、65%或更高GC含量中的任一种。在一些实施例中,靶核酸具有至少约70%、80%或更高的GC含量。在一些实施例中,靶核酸是非富含GC的靶核酸中的富含GC的片段。在一些实施例中,靶核酸不是富含GC的。在一些实施例中,靶核酸具有一个或多个二级结构或更高级结构。在一些实施例中,靶核酸不处于凝聚状态,如在染色质中,以使变体多肽/RNA指导物复合物不能接近靶核酸。
在一些实施例中,靶核酸存在于细胞中。在一些实施例中,靶核酸存在于细胞核中。在一些实施例中,靶核酸对细胞是内源的。在一些实施例中,靶核酸是基因组DNA。在一些实施例中,靶核酸是染色体DNA。在一个实施例中,靶核酸是染色体外核酸。在一些实施例中,靶核酸是蛋白质编码基因或其功能区(如编码区)或调节元件(如启动子、增强子、5'或3'非翻译区等)。在一些实施例中,靶核酸是非编码基因,如转座子、miRNA、tRNA、核糖体RNA、核酶或lincRNA。在一些实施例中,靶核酸是质粒。
在一些实施例中,靶核酸对细胞是外源的。在一些实施例中,靶核酸是病毒核酸,如病毒DNA或病毒RNA。在一些实施例中,靶核酸是水平转移的质粒。在一些实施例中,靶核酸整合在细胞的基因组中。在一些实施例中,靶核酸不整合在细胞的基因组中。在一些实施例中,靶核酸是细胞中的质粒。在一些实施例中,靶核酸存在于染色体外阵列中。
在一些实施例中,靶核酸是分离的核酸,如分离的DNA或分离的RNA。在一些实施例中,靶核酸存在于无细胞环境中。在一些实施例中,靶核酸是分离的载体,如质粒。在一些实施例中,靶核酸是超纯质粒。
靶核酸是与RNA指导物杂交的靶核酸区段。在一些实施例中,靶核酸仅具有靶核酸的一个拷贝。在一些实施例中,靶核酸具有多于一个拷贝,如至少约2、3、4、5、10、100个或更多个拷贝的靶核酸中的任一种。例如,病毒核酸或细菌的基因组中包含重复序列的靶核酸可以由变体核糖核蛋白靶向。
在一些实施例中,靶核酸存在于靶核酸的易接近区域中。在一些实施例中,靶核酸在靶基因的外显子中。在一些实施例中,靶核酸跨越靶基因的外显子-内含子连接部。在一些实施例中,靶核酸存在于非编码区(如基因的调节区)中。在一些实施例中,其中靶核酸对细胞是外源的,靶核酸包含在细胞的基因组中未发现的序列。
合适的DNA/RNA结合条件包括通常存在于细胞中的生理条件。其他合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的;参见例如Sambrook,同上。靶核酸的与RNA指导物互补并与之杂交的链被称为“互补链”,并且靶核酸的与“互补链”互补(因此不与RNA指导物互补)的链被称为“非互补链(noncomplementary strand/non-complementary strand)”。
在一些实施例中,靶核酸包含SEQ ID NO:8、10、12、14、16、18、20、和22中任一个的核苷酸序列。
二元复合物
在一些实施例中,本文所述的二元复合物包含与至少一个RNA指导物缔合的变体多肽,其中每个RNA指导物靶向靶核酸,如DNA。在一些实施例中,变体多肽/RNA指导物复合物(例如,变体二元复合物)包含酶活性,如可断裂或切割靶核酸的核酸酶活性。变体多肽和RNA指导物(单独或一起)不会天然存在。与亲本多肽和RNA指导物相比,变体多肽与RNA指导物之间的复合物形成可以增强两者之间的稳定性和/或蛋白质-RNA相互作用。
通常,变体多肽和靶向部分(例如,RNA指导物)以约1:1的摩尔比彼此结合以形成变体二元复合物。变体多肽和靶向部分(例如,RNA指导物)结合以形成变体二元复合物被称为将RNA指导物加载到多肽上。
在一些实施例中,二元复合物遵循单指导物规则,即变体多肽不与复合物中结合的RNA指导物解离或用游离的未结合RNA交换RNA指导物。在一些实施例中,三元复合物遵循单二元复合物规则,即变体二元复合物不从结合的靶核酸(例如,靶DNA底物)解离或用游离的未结合核酸交换靶核酸。
二元复合物的官能度
在一些方面,变体二元复合物包含具有至少一个改变或突变的变体多肽,该改变或突变增强酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些方面,变体二元复合物包含具有至少一个改变或突变的变体多肽,并且变体二元复合物具有降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离、与靶核酸的解离中的至少一种。
在一些方面,变体多肽和靶向部分(例如,RNA指导物)形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,变体二元复合物包含具有至少一个改变或突变的变体多肽,该改变或突变使变体二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种比亲本二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性增加至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的pH的缓冲液中表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本二元复合物相比,变体二元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。在一个实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少8℃时,变体二元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约37℃下在至少约10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的任一个的孵育期内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。在一些实施例中,与亲本二元复合物相比,变体二元复合物在一定孵育时间范围内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些方面,变体多肽和靶向部分(例如,RNA指导物)形成变体二元复合物,并且与亲本二元复合物相比,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。在一些实施例中,与亲本二元复合物的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离相比,变体二元复合物表现出的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种可能低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
在一些实施例中,与亲本二元复合物的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离相比,变体二元复合物表现出的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的pH的缓冲液中表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
在一些实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本二元复合物相比,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。在一个实施例中,当变体二元复合物的Tm值比亲本二元复合物的Tm值大至少8℃时,变体二元复合物表现出降低的与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性、二元复合物解离和/或与靶核酸的解离中的至少一种。
在一些实施例中,与由亲本多肽和RNA指导物形成的复合物相比,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。在一些实施例中,与由亲本多肽和RNA指导物形成的复合物相比,变体二元复合物在一定孵育时间范围内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。
在一些实施例中,与亲本二元复合物相比,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。在一些实施例中,与亲本二元复合物相比,变体二元复合物在一定孵育时间范围内表现出降低的复合物(变体二元复合物或变体三元复合物)解离和/或与靶基因座的解离中的至少一种。
三元复合物
在一些实施例中,本文所述的三元复合物包含与至少一个RNA指导物缔合(即,形成变体二元复合物)的变体多肽,其中每个RNA指导物靶向靶核酸(如DNA)并与其缔合(即,形成变体三元复合物)。在一些实施例中,变体多肽/RNA指导物复合物(例如,变体二元复合物)包含酶活性,如可断裂或切割变体三元复合物的靶核酸的核酸酶活性。在一些实施例中,变体三元复合物包含酶活性,如核酸酶活性。变体多肽、RNA指导物和靶核酸(单独或一起)不会天然存在。
通常,变体二元复合物(例如,变体多肽和靶向部分)以约1:1的摩尔比与靶核酸结合以形成变体三元复合物。变体二元复合物与靶核酸(例如,靶DNA底物)结合以形成变体三元复合物被称为将变体二元复合物加载到靶核酸上。
通常,变体多肽、靶向部分(例如,RNA指导物)和靶核酸以约1:1:1的摩尔比彼此缔合以形成变体三元复合物。
在一些实施例中,靶核酸包括变体二元复合物或多个变体二元复合物的一个或多个靶基因座。在一些实施例中,靶核酸包括变体二元复合物或多个变体二元复合物的一个或多个非靶基因座。
三元复合物的官能度
在一些方面,变体三元复合物包含具有至少一个改变或突变的变体多肽,并且变体三元复合物具有增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些方面,变体三元复合物包含具有至少一个改变或突变的变体多肽,并且变体三元复合物具有降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些方面,变体二元复合物和靶核酸(例如,DNA)形成变体三元复合物,并且与亲本二元复合物相比,变体三元复合物表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,变体三元复合物表现出比亲本二元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性大至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的变体三元复合物的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃至约65℃范围内的温度下(例如,约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个)表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在具有约7.3至约8.6范围内(例如,7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5、8.6或这些值的任何组合之间的范围内的任何值)的pH的缓冲液中表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,当变体三元复合物的Tm值比亲本三元复合物的Tm值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,与亲本三元复合物相比,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。在一个实施例中,当变体三元复合物的Tm值比亲本三元复合物的Tm值大至少8℃时,变体三元复合物表现出增强的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在至少约10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的任一个的孵育期内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出增加的酶活性、靶核酸复合物形成、靶核酸结合活性、靶核酸亲和力、靶核酸结合特异性、蛋白质-核酸相互作用、三元复合物形成、中靶结合活性、中靶结合特异性和/或稳定性中的至少一种。
在一些方面,变体二元复合物和靶核酸(例如,DNA)形成变体三元复合物,并且与亲本二元复合物相比,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些实施例中,与亲本二元复合物的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离相比,变体三元复合物表现出的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中的任一个的温度下表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约20℃至约65℃的温度范围内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在具有约7.3至约8.6范围内的pH的缓冲液中表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一个实施例中,与亲本三元复合物相比,变体三元复合物在约7.3、7.4、7.5、7.6、7.7、7.8、7.9、8.0、8.1、8.2、8.3、8.4、8.5或8.6的pH下表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些实施例中,当变体三元复合物的Tm值比参考分子的Tm值或参考值的Tm(例如,亲本三元复合物的Tm)大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃时,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。在一个实施例中,当变体三元复合物的Tm值比参考分子的Tm值或参考值的Tm(例如,亲本三元复合物的Tm)大至少8℃时,变体三元复合物表现出降低的与靶基因座的解离、与非靶核酸的脱靶结合、靶核酸的非靶基因座处的活性和/或三元复合物解离中的至少一种。
在一些实施例中,与亲本三元复合物相比,变体三元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内表现出增加的稳定性。在一些实施例中,与亲本三元复合物相比,变体三元复合物在一定孵育时间范围内表现出增加的稳定性。
在一些方面,与亲本二元复合物相比,变体二元复合物表现出降低的靶核酸的非靶基因座处的活性。在一些实施例中,在距中靶基因座序列特定莱文斯坦距离(例如,1、2、3或4的编辑距离)的PAM相邻序列处评估非靶活性。在一些实施例中,变体二元复合物在非靶基因座处的活性可比亲本二元复合物在非靶基因座处的活性低至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。
制备
在一些实施例中,本披露的变体多肽可以通过以下制备:(a)培养产生本披露的变体多肽的细菌,分离变体多肽,任选地,纯化变体多肽,以及使变体多肽与RNA指导物复合。变体多肽也可以通过(b)已知的基因工程技术制备,特别地,通过以下制备:从细菌中分离编码本披露的变体多肽的基因,构建重组表达载体,然后将载体转移到适当的宿主细胞中,该宿主细胞表达RNA指导物,以用于在宿主细胞中表达与RNA指导物复合的重组蛋白。可替代地,变体多肽可以通过(c)体外偶联的转录-翻译系统制备,然后与RNA指导物复合。可以用于制备本披露的变体多肽的细菌没有特别限制,只要它们可以产生本披露的变体多肽。细菌的一些非限制性实例包括本文所述的大肠杆菌(E.coli)细胞。
载体
本披露提供了用于表达本文所述的变体多肽的载体或可将编码本文所述的变体多肽的核酸掺入载体中。在一些实施例中,本披露的载体包括编码变体多肽的核苷酸序列。
本披露还提供了可用于制备如本文所述的变体多肽或包含变体多肽的组合物的载体。在一些实施例中,本披露包括细胞中的本文所述的组合物或载体。在一些实施例中,本披露包括在细胞中表达包含变体多肽的组合物或者编码变体多肽的载体或核酸的方法。该方法可包括提供组合物(例如,载体或核酸)以及将组合物递送至细胞的步骤。
天然或合成多核苷酸的表达典型地通过将编码目的基因的多核苷酸(例如,编码变体多肽的核苷酸序列)可操作地连接到启动子并将构建体掺入表达载体中来实现。表达载体没有特别限制,只要它包括编码本披露的变体多肽的多核苷酸并且可以适合于在真核细胞中复制和整合。
典型的表达载体可以包括可用于表达所希望多核苷酸的转录和翻译终止子、起始序列和启动子。例如,可使用携带RNA聚合酶识别序列的质粒载体(pSP64、pBluescript等)。包括来源于逆转录病毒如慢病毒的那些载体是实现长期基因转移的合适工具,因为它们允许转基因的长期稳定整合及其在子细胞中的繁殖。载体的实例包括表达载体、复制载体、探针产生载体、和测序载体。可以按病毒载体的形式,将表达载体提供给细胞。
病毒载体技术是本领域众所周知的,并且描述于多种病理学和分子生物学手册。可用作载体的病毒包括但不限于噬菌体病毒、逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有复制功能的起点、启动子序列、方便的限制性内切核酸酶位点、和一种或多种选择性标志物。
载体的种类没有特别限制,可以适当地选择可以在宿主细胞中表达的载体。更特别地,取决于宿主细胞的种类,适当地选择启动子序列以确保从多核苷酸表达变体多肽,并且将该启动子序列和多核苷酸插入各种质粒等中的任一种中以制备表达载体。
另外的启动子元件(例如,增强序列)调节转录起始的频率。典型地,这些元件位于起始位点上游30-110bp的区域中,尽管最近已经显示许多启动子也含有起始位点下游的功能元件。取决于启动子,似乎单个元件可以共同地或独立地发挥功能,以激活转录。
此外,本披露不应限于使用组成型启动子。诱导型启动子也被考虑作为本披露的一部分。诱导型启动子的使用提供了分子开关,该分子开关能够当需要该启动子可操作地连接的多核苷酸序列的表达时启动这样的表达,或者当不希望表达时关闭表达。诱导型启动子的实例包括但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子、和四环素启动子。
待引入的表达载体还可以含有选择性标志物基因或报告基因或选择性标志物基因和报告基因二者,从而便于从寻求通过病毒载体转染或感染的细胞的群体中,鉴定和选择表达性细胞。在其他方面,选择性标志物可以在一段单独的DNA上进行,并且用于共转染程序。选择性标志物和报告基因二者侧翼可以是适当的转录控制序列,以使得能够在宿主细胞中表达。这样的标志物的实例包括用于真核细胞培养的二氢叶酸还原酶基因和新霉素抗性基因;以及用于大肠杆菌和其他细菌培养的四环素抗性基因和氨苄青霉素抗性基因。通过使用这样的选择标志物,可以确认编码本披露的变体多肽的多核苷酸是否已被转移到宿主细胞中,然后被成功表达。
重组表达载体的制备方法没有特别限制,其实例包括使用质粒、噬菌体或粘粒的方法。
表达方法
本披露包括用于蛋白质表达的方法,该方法包括翻译本文所述的变体多肽。
在一些实施例中,本文所述的宿主细胞用于表达变体多肽。宿主细胞没有特别限制,并且可以优选地使用各种已知的细胞。宿主细胞的特定实例包括细菌,如大肠杆菌、酵母(芽殖酵母酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾(Xenopus laevis)卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制,并且可以使用已知的方法,如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。
在用表达载体转化宿主后,可培养、培育或繁殖宿主细胞以产生变体多肽。在表达变体多肽后,可以根据常规方法(例如,过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并且从培养物中纯化变体多肽等。
在一些实施例中,用于变体多肽表达的方法包括翻译变体多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译变体多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多氨基酸。
多种方法可以用于确定宿主细胞中成熟变体多肽的产生水平。这样的方法包括但不限于例如利用对变体多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。
本披露提供了在细胞中体内表达变体多肽的方法,这些方法包括向宿主细胞提供编码变体多肽的多核糖核苷酸,其中该多核糖核苷酸编码变体多肽;在细胞中表达变体多肽;以及从细胞获得变体多肽。
改变或突变的引入
可通过本领域已知的合成方法来产生编码一种或多种变体多肽的核酸序列。使用编码亲本多肽本身的核酸序列作为框架,可以一次插入一个或多个改变或突变以改变编码亲本多肽的核酸序列。沿着同样的思路,可通过在以合成方式合成时将变化引入多肽序列中来改变或突变亲本多肽。这可通过本领域熟知的方法来完成。
产生改变或突变并将它们引入亲本多肽序列中可以使用本领域技术人员已知的任何方法来完成。特别地,在一些实施例中,用于PCR的寡核苷酸引物可用于DNA模板(包括编码变体多肽的核酸序列中的一个或多个改变或突变)的快速合成。位点特异性诱变也可用作通过对基础DNA进行特异性诱变来制备单个肽或者生物学功能等价蛋白或肽的有用技术。该技术进一步提供了结合一个或多个前述考虑通过将一个或多个核苷酸序列变化引入DNA中来制备和测试变体的现有能力。位点特异性诱变允许通过使用编码所希望突变的DNA序列的特异性寡核苷酸序列以及足够数量的相邻核苷酸来产生变体,以提供足够大小和序列复杂性的引物序列,从而在所穿过的缺失连接部的两侧形成稳定的双链体。典型地,长度为约17至25个核苷酸的引物是优选的,序列的连接部的两侧上约5至10个残基被改变。
引入结构变异(如作为氨基和/或羧基末端延伸的多肽融合)可以以与将改变或突变引入亲本多肽中类似的方式来完成。可通过将编码另外的肽的适当核酸序列包括到编码亲本多肽或变体多肽的核酸序列中来将另外的肽添加到亲本多肽或变体多肽上。任选地,可通过合成多肽产生来将另外的肽直接附加到变体多肽上。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生变体多肽的方法,与亲本多肽相比,该变体多肽具有增加的与靶核酸的两个或更多个基因座(例如,2、3、4、5、6、7、8、9个或更多个)的中靶结合。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体多肽(例如,具有相同氨基酸序列的单独的变体多肽)的方法,与多个亲本多肽和RNA指导物相比,多个变体多肽在与多个不同的RNA指导物单独复合时具有增加的与靶核酸的两个或更多个基因座的中靶结合。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生变体多肽的方法,与亲本多肽相比,该变体多肽具有增加的与靶核酸的两个或更多个靶基因座的中靶三元复合物形成。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体多肽(例如,具有相同氨基酸序列的单独的变体多肽)的方法,与多个亲本多肽和RNA指导物相比,多个变体多肽在与多个不同的RNA指导物单独复合时具有增加的与靶核酸的两个或更多个基因座的三元复合物形成。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生变体多肽的方法,与亲本多肽相比,该变体多肽表现出对数量增加的靶核酸或靶基因座的靶向。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以产生多个变体多肽(例如,具有相同氨基酸序列的单独的变体多肽)的方法,与多个亲本多肽和RNA指导物相比,多个变体多肽在与多个不同的RNA指导物单独复合时表现出靶向数量增加的靶核酸或靶基因座。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以增强变体多肽的稳定性的方法。变体多肽的稳定性可以通过以下技术测定或可包括但不限于以下技术:热变性测定、热转变测定、差示扫描量热法(DSC)、差示扫描荧光测定法(DSF)、等温滴定量热法(ITC)、脉冲追踪法、漂白追踪法、放线菌酮追踪法、圆二色性(CD)光谱法、结晶和基于荧光的活性测定。
功能性的变体选择
在一个方面,本披露提供了用于将改变或突变引入亲本多肽序列中以增强二元复合物形成、RNA指导物结合活性和/或RNA指导物结合特异性的方法。
在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以增强三元复合物形成、中靶结合亲和力、中靶结合活性、中靶结合和/或中靶结合特异性的方法。在一个方面,本披露还提供了用于将改变或突变引入亲本多肽序列中以增强二元复合物(例如,核糖核蛋白)的中靶结合亲和力(例如,与靶相互作用的亲和力或时间)、中靶结合活性(例如,与靶相互作用时的核酸酶活性)、中靶结合(例如,与靶相互作用的强度)和/或中靶结合特异性(例如,对特定靶的偏好)的方法。
在一些实施例中,将改变或突变引入亲本多肽序列中以产生具有增加的中靶结合和/或活性的变体多肽。而且,在这样的实施例中,与亲本多肽相比,变体多肽中的脱靶结合和/或活性可以降低。此外,有关中靶结合与脱靶结合的特异性可以增加或降低。
在一些实施例中,将改变或突变引入亲本多肽序列以产生变体多肽,该变体多肽在与RNA指导物复合时具有增加的中靶结合。而且,在这样的实施例中,包含变体多肽和RNA指导物的复合物中的脱靶结合可以降低。此外,有关中靶结合/活性与脱靶结合/活性的特异性可以增加或降低。
在某些实施例中,将改变或突变引入亲本多肽序列以产生增强稳定性和/或蛋白质-RNA相互作用的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的稳定性和/或RNA相互作用以及酶活性的至少一种改变。
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保持增强的稳定性和/或蛋白质-RNA相互作用的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的稳定性和/或RNA相互作用但不促进酶活性的至少一种改变。
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)增强酶活性并(b)增强二元复合物形成、RNA指导物结合活性和/或RNA指导物结合特异性的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的RNA指导物复合物形成、RNA指导物结合活性和/或RNA指导物结合特异性以及酶活性的至少一种改变。
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保留增强的二元复合物形成、RNA指导物结合活性和/或RNA指导物结合特异性的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的二元复合物形成、RNA指导物结合活性和/或RNA指导物结合特异性但不促进酶活性的至少一种改变。
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)增强酶活性并(b)增强中靶三元复合物形成、中靶结合亲和力、中靶结合活性和/或中靶结合特异性的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的中靶三元复合物形成、中靶结合亲和力、中靶结合活性和/或中靶结合特异性以及酶活性的至少一种改变。
在某些实施例中,将改变或突变引入亲本多肽序列以产生(a)缺乏酶活性但(b)保留增强的中靶三元复合物形成、中靶结合亲和力、中靶结合活性和/或中靶结合特异性的变体多肽。在某些实施例中,与亲本多肽相比,变体多肽包括促进变体多肽的中靶三元复合物形成、中靶结合亲和力、中靶结合活性和/或中靶结合特异性但不促进酶活性的至少一种改变。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的RNA亲和力的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的RNA亲和力的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的RNA亲和力的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的二元复合物形成的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的二元复合物形成的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的二元复合物形成的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的RNA指导物结合活性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQID NO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的RNA指导物结合活性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的RNA指导物结合活性的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的RNA指导物结合特异性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的RNA指导物结合特异性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的RNA指导物结合特异性的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的蛋白质-RNA相互作用的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQID NO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的蛋白质-RNA相互作用的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的蛋白质-RNA相互作用的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的蛋白质稳定性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的蛋白质稳定性的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的蛋白质稳定性的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)降低的与RNA指导物的解离的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQID NO:3的亲本多肽表现出(a)增加的酶活性和(b)降低的与RNA指导物的解离的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)保留的酶活性和(b)降低的与RNA指导物的解离的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)降低的酶活性和(b)增强的三元复合物形成的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ IDNO:3的亲本多肽表现出(a)增加的酶活性和(b)增强的三元复合物形成的变体多肽。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生相对于SEQ ID NO:3的亲本多肽表现出(a)保留的酶活性和(b)增强的三元复合物形成的变体多肽。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的对靶核酸的结合亲和力。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的对靶核酸的结合亲和力。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQID NO:3的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的对靶核酸的结合亲和力。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的中靶结合活性。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的中靶结合活性。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的中靶结合活性。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)增强的中靶结合特异性。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)增强的中靶结合特异性。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)增强的中靶结合特异性。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)降低的与非靶核酸的脱靶结合。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)降低的与非靶核酸的脱靶结合。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQID NO:3的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)降低的与非靶核酸的脱靶结合。
在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)降低的酶活性和(b)降低的与靶核酸的解离。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)增加的酶活性和(b)降低的与靶核酸的解离。在一些实施例中,将至少一种改变引入SEQ ID NO:3的亲本多肽中以产生形成变体二元复合物的变体多肽,该变体二元复合物相对于包含SEQ ID NO:3的多肽的亲本二元复合物表现出(a)保留的酶活性和(b)降低的与靶核酸的解离。
变体二元复合
通常,变体多肽和RNA指导物以约1:1的摩尔比彼此结合以形成变体二元复合物。变体多肽和RNA指导物(单独或一起)不会天然存在。
在一些实施例中,变体多肽可以在宿主细胞中过表达并如本文所述对其进行纯化,然后使其与RNA指导物复合(例如,在试管中)以形成变体核糖核蛋白(RNP)(例如,变体二元复合物)。
在一些实施例中,变体二元复合物在一定孵育时间范围内表现出增加的对靶核酸的结合亲和力、增加的中靶结合活性、增加的中靶结合特异性、增加的与靶核酸的三元复合物形成和/或增加的稳定性。在一些实施例中,变体二元复合物在一定孵育时间范围内表现出降低的与非靶核酸的脱靶结合和/或降低的与靶核酸的解离。在一些实施例中,变体二元复合物在一定孵育时间范围内表现出增加的靶核酸复合物形成、靶核酸活性和/或靶核酸特异性。
在一些实施例中,二元复合物的复合在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中任一个低的温度下发生。在一些实施例中,变体多肽在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内不从RNA指导物解离或与游离RNA结合。在一些实施例中,在二元复合物形成后,变体核糖核蛋白复合物不与不同的RNA交换RNA指导物。
在一些实施例中,使变体多肽和RNA指导物在二元复合缓冲液中复合。在一些实施例中,将变体多肽储存在被二元复合缓冲液替代的缓冲液中以与RNA指导物形成复合物。在一些实施例中,变体多肽储存在二元复合缓冲液中。
在一些实施例中,二元复合缓冲液具有约7.3至8.6范围内的pH。在一个实施例中,二元复合缓冲液的pH为约7.3。在一个实施例中,二元复合缓冲液的pH为约7.4。在一个实施例中,二元复合缓冲液的pH为约7.5。在一个实施例中,二元复合缓冲液的pH为约7.6。在一个实施例中,二元复合缓冲液的pH为约7.7。在一个实施例中,二元复合缓冲液的pH为约7.8。在一个实施例中,二元复合缓冲液的pH为约7.9。在一个实施例中,二元复合缓冲液的pH为约8.0。在一个实施例中,二元复合缓冲液的pH为约8.1。在一个实施例中,二元复合缓冲液的pH为约8.2。在一个实施例中,二元复合缓冲液的pH为约8.3。在一个实施例中,二元复合缓冲液的pH为约8.4。在一个实施例中,二元复合缓冲液的pH为约8.5。在一个实施例中,二元复合缓冲液的pH为约8.6。
变体多肽的热稳定性可以在有利条件下(如添加RNA指导物,例如结合RNA指导物)增加。
在一些实施例中,在如本文所述的纯化之前,变体多肽可以在宿主细胞中过表达并与RNA指导物复合。在一些实施例中,将编码变体多肽的mRNA或DNA引入细胞中,使得变体多肽在细胞中表达。还将RNA指导物(其将变体多肽引导到所希望靶核酸)与单个mRNA或DNA构建体同时、分开或依次引入细胞中,使得在细胞中形成必需的核糖核蛋白复合物。
评估变体二元复合物稳定性和功能性
本文在某些实施例中提供了用于鉴定最佳变体多肽/RNA指导物复合物(本文称为变体二元复合物)的方法,这些方法包括(a)组合样品中的变体多肽和RNA指导物以形成变体二元复合物;(b)测量变体二元复合物的值;以及(c)如果变体二元复合物的值大于参考分子的值,则确定变体二元复合物相对于参考分子是最佳的。在一些实施例中,该值可包括但不限于稳定性测量结果(例如,Tm值、热稳定性)、二元复合物形成速率、RNA指导物结合特异性和/或复合物活性。
在一些实施例中,通过以下步骤鉴定最佳变体多肽/RNA指导物复合物(即变体二元复合物):(a)组合样品中的变体多肽和RNA指导物以形成变体二元复合物;(b)检测变体二元复合物的Tm值;以及(c)如果变体二元复合物的Tm值比参考分子的Tm值或Tm参考值大至少8℃,则确定变体二元复合物是稳定的。
涉及测量变体多肽/RNA指导物复合物(即变体二元复合物)的热稳定性的步骤的方法可包括但不限于确定变体二元复合物的稳定性的方法、确定促进稳定的变体二元复合物的条件的方法、筛选稳定的变体二元复合物的方法以及用于鉴定最佳RNA指导物以形成稳定的变体二元复合物的方法。在某些实施例中,可测量变体二元复合物的热稳定性值。
另外,在某些实施例中,还可测量参考分子的热稳定性值。在某些实施例中,如果变体二元复合物的测量的热稳定性值大于参考分子的测量的热稳定性值或在相同实验条件下测量的热稳定性参考值,如本文所述,则可将变体二元复合物确定为稳定的。在某些实施例中,参考分子可以是缺少RNA指导物的变体多肽。
在某些实施例中,测量的热稳定性值可以是变性温度值。在这些实施例中,热稳定性参考值是变性温度参考值。在某些实施例中,测量的热稳定性值可以是Tm值。在这些实施例中,热稳定性参考值可以是Tm参考值。在某些实施例中,可使用热转变测定来测量热稳定性值。在某些实施例中,用于测量热稳定性的测定可涉及本文所述的技术,包括但不限于热变性测定、热转变测定、差示扫描量热法(DSC)、差示扫描荧光测定法(DSF)、等温滴定量热法(ITC)、脉冲追踪法、漂白追踪法、放线菌酮追踪法、圆二色性(CD)光谱法、结晶和基于荧光的活性测定。
在某些实施例中,如果变体二元复合物的变体多肽/RNA指导物复合物形成速率、RNA指导物结合特异性和/或复合物活性大于参考分子的值或参考值(例如,亲本多肽/RNA指导物复合物(本文称为亲本二元复合物)的值),则可鉴定变体二元复合物。例如,在某些实施例中,如果变体二元复合物的变体多肽/RNA指导物复合物形成速率、RNA指导物结合特异性和/或复合物活性的值比参考分子的值或参考值(例如,亲本二元复合物的值)大至少X%,则可鉴定变体二元复合物。在某些实施例中,本文所述的方法可进一步包括多个步骤,这些步骤包括测量如本文所述的变体二元复合物的活性。
变体三元复合
在一些实施例中,如本文所述的变体多肽、RNA指导物和靶核酸形成变体三元复合物(例如,在试管或细胞中)。通常,变体多肽、RNA指导物和靶核酸以约1:1:1的摩尔比彼此缔合以形成变体三元复合物。变体多肽、RNA指导物和靶核酸(单独或一起)不会天然存在。
在一些实施例中,如本文所述的变体二元复合物(例如,变体多肽和RNA指导物的复合物)进一步与靶核酸复合(例如,在试管或细胞中)以形成变体三元复合物。
在一些实施例中,三元复合物的复合在比约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中任一个低的温度下发生。在一些实施例中,变体二元复合物在约37℃下在10分钟、15分钟、20分钟、25分钟、30分钟、35分钟、40分钟、45分钟、50分钟、55分钟、1小时、2小时、3小时、4小时或更长时间中的至少任一个的孵育期内不从靶核酸解离或与游离核酸(例如,游离DNA)结合。在一些实施例中,在三元复合物形成后,变体二元复合物不与不同的核酸交换靶核酸。
在一些实施例中,变体多肽、RNA指导物和靶核酸在三元复合缓冲液中复合。在一些实施例中,将变体多肽储存在用三元复合缓冲液替代的缓冲液中以与RNA指导物和靶核酸形成复合物。在一些实施例中,将变体多肽储存在三元复合缓冲液中。
在一些实施例中,变体二元复合物和靶核酸在三元复合缓冲液中复合。在一些实施例中,将变体二元复合物储存在用三元复合缓冲液替代的缓冲液中以与靶核酸形成复合物。在一些实施例中,将变体二元复合物储存在三元复合缓冲液中。
在一些实施例中,三元复合缓冲液具有约7.3至8.6范围内的pH。在一个实施例中,三元复合缓冲液的pH为约7.3。在一个实施例中,三元复合缓冲液的pH为约7.4。在一个实施例中,三元复合缓冲液的pH为约7.5。在一个实施例中,三元复合缓冲液的pH为约7.6。在一个实施例中,三元复合缓冲液的pH为约7.7。在一个实施例中,三元复合缓冲液的pH为约7.8。在一个实施例中,三元复合缓冲液的pH为约7.9。在一个实施例中,三元复合缓冲液的pH为约8.0。在一个实施例中,三元复合缓冲液的pH为约8.1。在一个实施例中,三元复合缓冲液的pH为约8.2。在一个实施例中,三元复合缓冲液的pH为约8.3。在一个实施例中,三元复合缓冲液的pH为约8.4。在一个实施例中,三元复合缓冲液的pH为约8.5。在一个实施例中,三元复合缓冲液的pH为约8.6。
变体多肽的热稳定性可以在有利条件下(如添加RNA指导物和靶核酸)增加。
评估变体三元复合物稳定性和功能性
本文在某些实施例中提供了用于鉴定最佳变体三元复合物的方法,这些方法包括(a)组合样品中的变体多肽、RNA指导物和靶核酸以形成变体三元复合物;(b)测量变体三元复合物的值;以及(c)如果变体三元复合物的值大于参考分子的值,则确定变体三元复合物相对于参考分子是最佳的。在一些实施例中,该值可包括但不限于稳定性测量结果(例如,Tm值、热稳定性)、三元复合物形成速率、DNA结合亲和力测量结果、DNA结合特异性测量结果和/或复合物活性测量结果(例如,核酸酶活性测量结果)。
在一些实施例中,通过以下步骤鉴定最佳变体三元复合物:(a)组合样品中的变体多肽、RNA指导物和靶核酸以形成变体三元复合物;(b)检测变体三元复合物的Tm值;以及(c)如果变体三元复合物的Tm值比参考分子的Tm值或Tm参考值大至少8℃,则确定变体三元复合物是稳定的。
涉及测量变体三元复合物的热稳定性的步骤的方法可包括但不限于确定变体三元复合物的稳定性的方法、确定促进稳定的变体三元复合物的条件的方法、筛选稳定的变体三元复合物的方法以及用于鉴定最佳二元复合物以形成稳定的变体三元复合物的方法。在某些实施例中,可测量变体三元复合物的热稳定性值。
另外,在某些实施例中,还可测量参考分子的热稳定性值。在某些实施例中,如果测量的变体三元复合物的热稳定性值大于测量的参考分子的热稳定性值或热稳定性参考值(在相同实验条件下测量),如本文所述,则可将变体三元复合物确定为稳定的。在某些实施例中,参考分子可以是缺少RNA指导物和/或靶核酸的变体多肽。
在某些实施例中,测量的热稳定性值可以是变性温度值。在这些实施例中,热稳定性参考值是变性温度参考值。在某些实施例中,测量的热稳定性值可以是Tm值。在这些实施例中,热稳定性参考值可以是Tm参考值。在某些实施例中,可使用热转变测定来测量热稳定性值。在某些实施例中,用于测量热稳定性的测定可涉及本文所述的技术,包括但不限于差示扫描荧光测定法(DSF)、差示扫描量热法(DSC)或等温滴定量热法(ITC)。
在某些实施例中,如果变体三元复合物的三元复合物形成速率、DNA结合亲和力、DNA结合特异性和/或复合物活性(例如,核酸酶活性)大于参考分子的值或参考值(例如,亲本三元复合物的值),则可鉴定变体三元复合物。例如,在某些实施例中,如果变体三元复合物的三元复合物形成速率、DNA结合亲和力、DNA结合特异性和/或复合物活性的值比参考分子的值或参考值(例如,亲本三元复合物的值)大至少X%,则可鉴定变体三元复合物。在某些实施例中,本文所述的方法可进一步包括多个步骤,这些步骤包括测量如本文所述的变体三元复合物的活性。
在一方面,提供了用于修饰靶DNA分子的方法,该方法包括使靶DNA分子与本文披露的变体多肽和本文披露的RNA指导物接触。在一些实施例中,靶DNA分子是体外的。在一些实施例中,靶DNA分子在细胞中。在某些实施例中,细胞是体外、离体、或体内的。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。
递送
可将本文所述的组合物或复合物配制成例如包括载剂(如载剂和/或聚合物载剂,例如脂质体),并且通过已知方法递送到细胞(例如,原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。这样的方法包括但不限于转染(例如,脂质介导、阳离子聚合物、磷酸钙、树状高分子);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外泌体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。
在一些实施例中,该方法包括将一种或多种核酸(例如,编码变体多肽的核酸、RNA指导物、供体DNA等)、其一种或多种转录物、和/或预形成的变体多肽/RNA指导物复合物(即,变体二元复合物)递送至细胞。示例性细胞内递送方法包括但不限于:病毒或病毒样药剂;基于化学的转染方法,如使用磷酸钙、树状高分子、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送;基于颗粒的方法,如使用基因枪、磁转染或磁辅助转染、粒子轰击;以及混合方法,如核转染。在一些实施例中,本申请进一步提供了通过这样的方法产生的细胞,以及包含这样的细胞的或由这样的细胞产生的生物体(例如,动物、植物或真菌)。
细胞
可将本文所述的多肽、组合物或复合物递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞在细胞培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞从活生物体获得并且维持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或来源于细菌细胞。在一些实施例中,细菌细胞与亲本多肽所来源的细菌物种无关。在一些实施例中,细胞是古细菌细胞或来源于古细菌细胞。在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或来源于植物细胞。在一些实施例中,细胞是真菌细胞或来源于真菌细胞。在一些实施例中,细胞是动物细胞或来源于动物细胞。在一些实施例中,细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成制成的,有时称为人工细胞。
在一些实施例中,细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293T、MF7、K562、HeLa以及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中,将用本文所述的一种或多种核酸(如Ago编码载体和gDNA)或Ago-gDNA复合物转染的细胞用于建立包含一种或多种载体来源的序列的新细胞系,以建立包含对靶核酸的修饰的新细胞系。在一些实施例中,将用本文所述的一种或多种核酸(如变体多肽编码载体和RNA指导物)或变体多肽/RNA指导物复合物(即变体二元复合物)瞬时或非瞬时转染的细胞或者来源于这样的细胞的细胞系用于评估一种或多种测试化合物。
在一些实施例中,该方法包括向宿主细胞中引入一种或多种核酸,该核酸包含编码靶向DNA的RNA(例如,RNA指导物)和/或变体多肽的核苷酸序列。在一个实施例中,包含靶DNA的细胞是体外、体内或离体的。在其他实施例中,包含编码靶向DNA的RNA(例如,RNA指导物)和/或变体多肽的核苷酸序列的核酸包括重组表达载体,例如但不限于腺相关病毒构建体、重组腺病毒构建体、重组慢病毒构建体、重组逆转录病毒构建体等。
在一些实施例中,细胞是原代细胞。例如,可以将原代细胞的培养物传代0次、1次、2次、4次、5次、10次、15次或更多次。在一些实施例中,通过任何已知方法从个体收获原代细胞。例如,可通过单采、白细胞单采、密度梯度分离等收获白细胞。可以通过活检收获组织(如皮肤、肌肉、骨髓、脾、肝、胰腺、肺、肠、胃等)的细胞。可使用适当的溶液来分散或悬浮收获的细胞。这样的溶液通常可以是平衡盐溶液(例如,生理盐水、磷酸盐缓冲盐水(PBS)、汉克平衡盐溶液等),方便地补充有胎牛血清或其他天然存在的因子,连同低浓度的可接受的缓冲液。缓冲液可以包括HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。可立即使用细胞,或者可将它们储存起来(例如,通过冷冻)。冷冻细胞可以解冻并且能够重复使用。可以将细胞冷冻在DMSO、血清、培养基缓冲液(例如,10% DMSO、50%血清、40%缓冲培养基)和/或用于在冷冻温度下保存细胞的一些其他这样的常用溶液中。
在一些实施例中,变体多肽具有诱导靶核酸(例如,基因组DNA)中的双链断裂或单链断裂的核酸酶活性。双链断裂可以刺激细胞内源DNA修复途径,包括同源定向重组(HDR)、非同源末端连接(NHEJ)或替代性非同源末端连接(A-NHEJ)。NHEJ可以修复切割的靶核酸,而无需同源模板。这可以导致一个或多个核苷酸缺失或插入靶核酸中。HDR可以与同源模板(如供体DNA)一起发生。同源模板可以包含与靶核酸切割位点两侧的序列同源的序列。在一些情况下,HDR可以将外源多核苷酸序列插入切割的靶核酸中。由于NHEJ和/或HDR引起的对靶DNA的修饰可以导致例如突变、缺失、改变、整合、基因矫正、基因替代、基因标记、转基因敲入、基因破坏和/或基因敲除。
在一些实施例中,使细胞培养同步以提高这些方法的效率。在一些实施例中,将处于S和G2期的细胞用于HDR介导的基因编辑。在一些实施例中,可以使细胞在任何细胞周期经受该方法。在一些实施例中,细胞过度铺板显著降低了该方法的功效。在一些实施例中,该方法以不超过约40%、45%、50%、55%、60%、65%或70%汇合度中的任一个应用于细胞培养物。
在一些实施例中,变体多肽/RNA指导物复合物(即变体二元复合物)在细胞中与靶核酸的结合募集除DNA修复途径之外的一种或多种内源性细胞分子或途径以修饰靶核酸。在一些实施例中,变体二元复合物的结合阻断一种或多种内源性细胞分子或途径接近靶核酸,从而修饰靶核酸。例如,变体二元复合物的结合可阻断内源性转录或翻译机器以降低靶核酸的表达。
在一些实施例中,提供了用于修饰细胞中的靶DNA分子的方法。该方法包括使细胞内的靶DNA分子与以下接触:本文所述的变体多肽和单分子靶向DNA的RNA,该RNA以5'至3'顺序包含与靶DNA分子的靶序列杂交的第一核苷酸区段;核苷酸接头;以及与第一核苷酸区段杂交以形成双链RNA双链体的第二核苷酸区段。变体多肽与细胞内的单分子靶向DNA的RNA形成复合物,靶DNA分子得以修饰。
在一方面,提供了用于修饰细胞中的靶DNA分子的方法。该方法包括将本文披露的变体多肽或编码变体多肽的核酸引入细胞中,以及引入本文所述的RNA指导物或编码RNA指导物的核酸,或引入本文所述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。在一些实施例中,引入细胞中的步骤包括转染或转导细胞。在一些实施例中,引入的步骤包括使用电穿孔、注射、基因枪或其任何组合。在一些实施例中,细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。在一些实施例中,细胞是体外、离体、或体内的。
试剂盒
本披露还提供了可以用于例如实施本文所述的方法的试剂盒。在一些实施例中,试剂盒包括本披露的变体多肽,例如包含表2的至少一个氨基酸取代的变体。在一些实施例中,试剂盒包括编码这样的变体多肽的多核苷酸,并且任选地多核苷酸包含在例如如本文所述的载体内。试剂盒还可以任选地包括例如如本文所述的RNA指导物。本披露的试剂盒的RNA指导物可以被设计成靶向目的序列,如本领域已知的。可以将CRISPR核酸酶变体和RNA指导物包装在试剂盒内的同一小瓶或其他容器内,或者可以包装在单独的小瓶或其他容器中,可以在使用前混合它们的内容物。试剂盒可以另外任选地包括缓冲液和/或CRISPR核酸酶变体和/或RNA指导物的使用说明书。
本文引用的所有参考文献和出版物特此通过引用并入。
实例
提供了以下实例,以进一步说明本披露的一些实施例,但并非旨在限制本披露的范围;通过它们的示例性性质将理解,可替代地使用本领域技术人员已知的其他程序、方法或技术。
实例1-变体构建体的工程化
在本实例中,产生了变体构建体。
使用从IDT订购的诱变正向引物和诱变反向引物,经由两个PCR步骤构建包含单突变的DNA模板。在第一步骤中,在384孔板中进行两组PCR反应以产生两个片段。两个PCR片段的重叠区域含有所希望的单突变并允许经由第二PCR装配整个DNA模板。在第二步骤中,将来自第一步骤的纯化片段用作重叠PCR(OL PCR)的模板,并将与载体主链退火的Fw和Rv寡核苷酸用作OL PCR引物。所得的线性DNA模板含有T7启动子、T7终止子和CRISPR核酸酶的开放阅读框。
将这些线性DNA模板直接用于无细胞转录和翻译系统以表达含有单突变的CRISPR核酸酶变体。将变体构建体进一步单独转移到瞬时转染载体中。另外,通过PCR制备包含组合突变的DNA模板,随后将其转移到瞬时转染载体中。
实例2-用于变体二元复合物检测的荧光偏振测定
在本实例中,通过荧光偏振测定来评估CRISPR核酸酶多肽和RNA指导物形成二元复合物的能力。
通过IDT合成线性ssDNA片段,这些片段包含同向重复序列上游的T7 RNA聚合酶启动子序列的反向互补序列和所希望的20bp RNA指导物靶标。然后通过将通用T7正向寡核苷酸(95℃-4℃,以5℃/分钟)与反向互补序列ssDNA退火来产生线性dsDNA体外转录(IVT)模板并将其在25℃下用Klenow片段(New England)填充15分钟。然后使用HiScribe T7 High Yield RNA合成试剂盒(New England/>)在37℃下将所得IVT模板转录成RNA指导物,持续4小时。转录后,使用RNA清洁和浓缩试剂盒(兹莫公司(Zymo))纯化每个RNA指导物并将其储存在-20℃下直至使用。
然后用6-羧基荧光素(6-FAM)(IDT)标记RNA指导物。用增加浓度的标记RNA指导物(7.5-250nM)滴定1X测定缓冲液(20mM Tris-HCl(pH 7.5)、150mM KCl、5mM MgCl2、1mMDTT)中的25nM CRISPR核酸酶多肽(野生型或变体多肽)。将复合物在37℃下孵育30分钟,然后使用酶标仪(Infinite 200Pro,帝肯公司(Tecan))进行荧光偏振测量。
还研究了不同温度下的二元复合物形成。如上所述的进一步结合实验在25℃、50℃、60℃和70℃下等温进行。
在用增加浓度的RNA指导物滴定CRISPR核酸酶多肽(野生型或变体多肽)时形成二元复合物(或在用增加浓度的CRISPR核酸酶多肽滴定RNA指导物时形成二元复合物)导致荧光偏振信号(以毫偏振(mP)为单位)发生变化。通过绘制荧光偏振信号在RNA指导物浓度范围内的变化来产生结合曲线。
本实例指示可以如何测定和比较CRISPR核酸酶多肽(野生型或变体多肽)与RNA指导物的结合亲和力。
实例3-用于变体二元复合物检测的RNA电泳迁移率变动测定
本实例描述了使用RNA电泳迁移率变动分析(EMSA)来测定CRISPR核酸酶多肽(野生型或变体)与RNA指导物结合的能力。
使用5'EndTag Labeling试剂盒(实验室公司(/>Labs))和800CW Maleimide(/>生物科学公司(/>Biosciences))用5’800CW标记来自IDTTM的合成RNA指导物,如先前在Yan等人,2018中详述的。标记后,清洗RNA指导物并经由苯酚氯仿提取对其进行浓缩。通过NanodropTM定量浓度。
对于RNA结合测定,将CRISPR核酸酶多肽(野生型或变体多肽)在1X结合缓冲液(50mM NaCl、10mM Tris-HCl、10mM MgCl2、1mM DTT,pH 7.9)中稀释至2.5μM。然后将多肽在1X结合缓冲液中从2.5μM连续稀释至37.5μM。将多肽再次在1X结合缓冲液加50nM IR800标记的RNA指导物中以1:10稀释并充分混合。这些反应可以进一步包括0.5-5μg tRNA,其用作竞争性抑制剂以降低多肽与RNA的非特异性结合,从而促进精确的特异性结合测定。将反应在37℃下孵育1小时。将1μL 100X溴酚蓝添加到反应中以实现染料前沿可视化,然后将整个反应加载到6% DNA阻滞凝胶上,使其在80V下运行90分钟。在CLx上对凝胶进行成像。
该测定依赖于RNA迁移通过凝胶的速率由其大小决定这一原理。只有RNA的样品能够迁移特定距离。然而,如果RNA与多肽结合,则会出现代表更大、移动性更低的RNA复合物的条带,该条带在凝胶上“上移”。
因此,测量两个条带的强度:1)只有RNA的条带和2)结合多肽的“上移”RNA条带。如果所有RNA都与多肽结合,则仅观察到上移条带。随着多肽的浓度降低,上移条带的强度降低,而只有RNA的条带的强度增加。在比较CRISPR核酸酶多肽(野生型或变体多肽)的RNA结合亲和力时,较高的多肽/RNA亲和力以在较低浓度的多肽下更特异性的结合为特征。
本实例指示可以如何测定和比较野生型CRISPR核酸酶多肽与RNA指导物的结合亲和力以及变体多肽与RNA指导物的结合亲和力。
实例4-变体二元复合物的体外切割测定
本实例描述了用于制备CRISPR核酸酶RNP和用于确定CRISPR核酸酶(野生型或变体)RNP的体外生物化学活性的方法。
将CRISPR核酸酶转化到大肠杆菌BL21(DE3)(New England)中,并使其在T7启动子下表达。使转化的细胞最初在5mL Luria Broth(泰克诺瓦公司(Teknova))+50μg/mL卡那霉素中生长过夜,然后将其接种到1L超级肉汤培养基(Terrific Broth media)(泰克诺瓦公司)+50μg/mL卡那霉素中。使细胞在37℃下生长直至OD600为0.6-0.8,然后用0.5mM IPTG诱导蛋白质表达。然后使培养物在18℃下再生长14-18小时。收获培养物并经由离心沉淀,然后将每5g细胞沉淀重悬于1mL提取缓冲液(50mM HEPES,pH 7.5,500mM NaCl,5%甘油,0.5mM TCEP)中。经由细胞破裂器(恒定系统有限公司(Constant SystemLimited))裂解细胞,然后在4℃下以20,000x g离心20分钟以澄清裂解物。将0.2%聚乙烯亚胺(PEI)添加到澄清的裂解物中,并在4℃下以恒定的端对端旋转孵育20分钟。然后将裂解物以20,000x g再次离心10分钟。经由离子交换色谱纯化裂解物。纯化后,使级分在SDS-PAGE凝胶上运行,合并含有适当大小蛋白质的级分并使用30kD Amicon Ultra15离心装置浓缩。将蛋白质缓冲液交换到12.5mM HEPES pH 7.0、120mM NaCl、0.5mM TCEP和50%甘油中。然后使用NanodropTM/>测量浓度,并将蛋白质储存在-20℃下。
使用2:1比率的合成crRNA(综合DNA技术公司(Integrated DNA Technologies))与蛋白质来制备RNP。使RNP在37℃下在1X NEB2缓冲液(50mM NaCl、10mM Tris-HCl、10mMMgCl2、1mM DTT,pH7.9)中复合30分钟。复合后,使用1X NEB2作为稀释缓冲液稀释RNP。以相同的方式制备apo反应(无RNA指导物的蛋白质),用H2O补足crRNA的体积。
将靶dsDNA底物(综合DNA技术公司)以20nM添加到RNP和apo样品中。将反应充分混合,然后在37℃下孵育1小时,然后用1μL20mg/mL蛋白酶K淬灭。将反应在50℃下再孵育15分钟,然后使整个反应在2%琼脂糖E-凝胶/>上运行。在Gel Doc EZ凝胶成像仪/>上通过溴化乙锭使凝胶可视化。
测量两种类型的条带的强度:1)全长(未切割)DNA条带和2)一个或多个下移的切割DNA条带。无活性RNP以全长DNA条带为特征。活性RNP产生一个或多个下移的切割DNA条带。随着活性RNP的浓度降低,全长条带的强度增加,并且该一个或多个切割条带的强度降低。在比较多个RNP的活性时,具有比另一个更高活性的RNP的特征在于在较低RNP浓度下更强的切割条带。
本实例的方法允许比较野生型或变体CRISPR核酸酶RNP(二元复合物)对靶DNA的体外切割活性。
实例5-变体多肽和变体二元复合物的体外稳定性测定
在本实例中,评估了变体RNP的稳定性。
对于加速稳定性研究,以与实例4中所述相同的方式产生RNP(5μM),随后将样品在25℃下储存48小时。
对RNP样品进行体外切割测定(如实例4中所述)。将这些结果与实例4的结果进行比较以确定在25℃下储存48小时的变体RNP保持生物化学活性的程度。
也将apo多肽(无RNA指导物)在25℃下孵育48小时。使用实例3中所述的方法对apo样品进行RNA EMSA测定。将这些结果与实例3的结果进行比较以确定变体CRISPR核酸酶能够与RNA指导物形成二元复合物的程度。
使用实例4中所述的方法,使在25℃下孵育48小时的apo样品也与RNA指导物复合以形成RNP。然后根据实例4的方法进行体外切割测定。将测定结果与实例4的测定结果进行比较以评估在25℃下孵育的与蛋白质形成的变体RNP的活性水平。
本实例的方法允许比较野生型和变体多肽以及野生型和变体RNP(二元复合物)的稳定性。证明与RNA指导物的特异性结合比另一种CRISPR核酸酶多肽与RNA指导物的特异性结合更大的CRISPR核酸酶多肽指示更稳定的多肽。证明靶DNA的体外切割比另一种CRISPR核酸酶多肽的切割更稳健的CRISPR核酸酶RNP指示更稳定的二元复合物。
实例6-用于变体三元复合物检测的DNA电泳迁移率变动测定
本实例描述了使用DNA EMSA来测定RNA指导物、CRISPR核酸酶多肽(野生型或变体多肽)和靶DNA底物形成三元复合物的能力。
将CRISPR核酸酶转化到大肠杆菌BL21(DE3)(New England)中,并使其在T7启动子下表达。使转化的细胞最初在5mL Luria Broth(泰克诺瓦公司)+50μg/mL卡那霉素中生长过夜,然后将其接种到1L超级肉汤培养基(泰克诺瓦公司)+50μg/mL卡那霉素中。使细胞在37℃下生长直至OD600为0.6-0.8,然后用0.5mM IPTG诱导蛋白质表达。然后使培养物在18℃下再生长14-18小时。收获培养物并经由离心沉淀,然后将每5g细胞沉淀重悬于1mL提取缓冲液(50mM HEPES,pH 7.5,500mM NaCl,5%甘油,0.5mM TCEP)中。经由细胞破裂器(恒定系统有限公司)裂解细胞,然后在4℃下以20,000x g离心20分钟以澄清裂解物。将0.2%聚乙烯亚胺(PEI)添加到澄清的裂解物中,并在4℃下以恒定的端对端旋转孵育20分钟。然后将裂解物以20,000x g再次离心10分钟。经由离子交换色谱纯化裂解物。纯化后,使级分在SDS-PAGE凝胶上运行,合并含有适当大小蛋白质的级分并使用30kD AmiconUltra15离心装置浓缩。将蛋白质缓冲液交换到12.5mM HEPES pH 7.0、120mM NaCl、0.5mMTCEP和50%甘油中。然后使用NanodropTM/>测量浓度,并将蛋白质储存在-20℃下。
使用2:1比率的合成RNA指导物(综合DNA技术公司)与多肽来制备RNP。选择本文披露的与PAM序列相邻的靶序列,并使用如本文所述的同向重复序列设计RNA指导物。使RNP在37℃下在1X NEB2缓冲液(50mM NaCl、10mM Tris-HCl、10mM MgCl2、1mM DTT,pH7.9)中复合30分钟。复合后,使用1X NEB2作为稀释缓冲液进行从5μM到37.5μM的5点1:2连续稀释。以相同的方式制备apo反应(无RNA指导物的多肽),用H2O补足RNA指导物的体积。
通过PCR从寡核苷酸(综合DNA技术公司)产生dsDNA靶底物。在PCR之前,将正向引物的5'末端标记IR800染料,如Yan等人,2018中所述。使用Amplitaq Gold然后用IR800标记的正向引物和未标记的反向引物扩增dsDNA底物。将所得dsDNA用DNA清洁和/>试剂盒(兹莫研究公司(Zymo Research))纯化,并通过NanodropTM/>定量。
将RNP样品和Apo(对照)样品以1:10稀释到1X结合缓冲液(50mM NaCl、10mM Tris-HCl、1mM TCEP、10%甘油、2mM EDTA,pH8.0)加20nM IR800标记的靶DNA底物中并充分混合。将反应在37℃下孵育1小时。将溴酚蓝添加到反应中以实现染料前沿可视化,然后将整个反应加载到6% DNA阻滞凝胶上,使其在80V下运行90分钟。在CLx上对凝胶进行成像。
在该测定中,DNA迁移通过凝胶的速率由其大小决定。只有DNA的样品能够迁移特定距离。然而,如果RNP与DNA结合,则会出现代表更大、移动性更低的DNA复合物的条带,该条带在凝胶上“上移”。
本实例表明了如何可以将变体RNP(变体二元复合物)与DNA靶标的亲和力(以产生三元复合物)和野生型RNP(野生型二元复合物)与DNA靶的亲和力相比较。
实例7-使用5’-CTG-3’PAM序列的哺乳动物靶标的编辑
本实例描述了对与5’-CTG-3’PAM序列相邻的多个靶序列的插入缺失评估。
将SEQ ID NO:3的CRISPR核酸酶克隆至pcda3.1主链(InvitrogenTM)中。将各自包含SEQ ID NO:6的同向重复序列的RNA指导物克隆到U6启动子下的pUC19主链(New England)中。然后将质粒大量制备并且稀释。RNA指导物(即SEQ ID NO:9、11、13、15、17、19、21、和23的crRNA序列)和靶序列(即SEQ ID NO:8、10、12、14、16、18、20、和22)示于表4中。
表4.哺乳动物靶序列和相应的crRNA。
在转染前大约16小时,将在DMEM/10%FBS+青霉素/链霉素中的25,000个HEK293T细胞铺板至96孔板的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备转染试剂(密理博西格玛公司(Millipore Sigma))和OptiMEMTM 的混合物,并且然后在室温下孵育5分钟(溶液1)。孵育后,将/>OptiMEMTM混合物添加到包含在OptiMEMTM中稀释的CRISPR核酸酶质粒和指导物质粒的单独溶液中(溶液2)。在阴性对照的情况下,在溶液2中不包含crRNA。将溶液1和溶液2混合物通过向上和向下吸移进行混合,且然后在室温下孵育5分钟。孵育后,将溶液1和溶液2逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加TrypLETM/>对细胞进行胰蛋白酶化并孵育大约5分钟。然后将D10培养基添加至每个孔并且混合以重悬细胞。将细胞转移到96孔PCR板中并离心10分钟。离心后,弃去上清液,并将沉淀重悬于20uL QuickExtractTM提取试剂(BiosearchTM技术公司(BiosearchTMTechnologies))中。将重悬的细胞溶液在热循环仪中在65℃下孵育15分钟、在68℃下孵育15分钟以及在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序(NGS)的样品。使用第一轮(PCR1)来扩增根据靶的特定基因组区域。通过柱纯化对PCR1产物进行纯化。进行第2轮PCR(PCR2)以添加因美纳公司(Illumina)衔接子和标签(index)。然后将反应液合并并且通过柱纯化进行纯化。用150次循环NextSeqTMv2.5中等或高输出试剂盒进行测序运行。编辑的靶被定义为显示出背景以上的插入缺失水平(在本测定中>0.5%)的靶。
图1显示包含插入缺失的NGS读段的百分比(原始插入缺失%)。八个不同靶标的平均插入缺失百分比为10.6%。本实例证明SEQ ID NO:3的CRISPR核酸酶和包含SEQ ID NO:6的同向重复序列的RNA指导物在与5'-CTG-3'PAM序列相邻的靶序列中产生插入缺失。
实例8-通过CRISPR核酸酶变体对哺乳动物基因的靶向
本实例描述了使用通过瞬时转染引入哺乳动物细胞中的野生型和变体效应子(例如,CRISPR核酸酶变体)对多个靶序列的插入缺失评估。
将CRISPR核酸酶克隆至pcda3.1主链(InvitrogenTM)中。然后将质粒大量制备并且稀释至1μg/μL。选择本文披露的与PAM序列相邻的靶序列,并使用如本文所述的同向重复序列设计RNA指导物。对于RNA指导物制备,通过含有靶序列支架的超聚体(ultramer)和U6启动子衍生编码crRNA的dsDNA片段。将超聚体重悬于pH 7.5的10mM Tris·HCl中至最终储备液浓度为100μM。随后再次使用10mM Tris·HCl将工作储备液稀释至10μM以充当用于PCR反应的模板。将crRNA的扩增在具有以下组分的50μL反应物中进行:0.02μl前面提及的模板、2.5μl正向引物、2.5μl反向引物、25μL HiFi聚合酶(New England)和20μl水。循环条件是:1x(98℃下30s)、30x(98℃下10s,67℃下15s)、1x(72℃下2min)。将PCR产物用1.8X SPRI处理净化并且归一化至25ng/μL。
在转染前大约16小时,将100μl在DMEM/10%FBS+青霉素/链霉素中的25,000个HEK293T细胞铺板至96孔板中的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备0.5μlLipofectamineTM2000和9.5μl OptiMEMTM的混合物,并且然后将其在室温下孵育5-20分钟(溶液1)。在孵育之后,将lipofectamineTM:OptiMEMTM混合物添加至最多至10μL的含有182ng CRISPR核酸酶质粒和14ng crRNA以及水的单独混合物(溶液2)中。将溶液1和溶液2混合物通过向上和向下吸移进行混合,且然后在室温下孵育25分钟。在孵育后,将20μL溶液1和溶液2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后72小时,通过以下方式使细胞胰蛋白酶化:向每个孔的中心添加10μL TrypLETM并且孵育大约5分钟。然后将100μL D10培养基添加至每个孔并且混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将QuickExtractTM缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来扩增根据靶标的特定基因组区域。通过柱纯化对PCR1产物进行纯化。进行第2轮PCR(PCR2)以添加因美纳公司衔接子和标签。然后将反应物池化并且通过柱纯化进行纯化。用150次循环NextSeqTMv2.5中等或高输出试剂盒进行测序运行。
编辑的靶被定义为显示出背景以上的插入缺失水平(在本测定中>0.5%)的靶。在相同的靶标组中,比较由野生型CRISPR核酸酶和变体CRISPR核酸酶诱导的插入缺失,以鉴定比野生型CRISPR核酸酶具有更高核酸酶活性的变体CRISPR核酸酶。
实例9-通过变体多肽对哺乳动物基因的靶向
本实例描述了使用通过瞬时转染引入至哺乳动物细胞中的变体对多个靶标进行的插入缺失评估。
将SEQ ID NO:3的变体(表6-8)克隆至pcDNA3.1主链中。将RNA指导物克隆至pUC19主链(New England/>)中。然后将质粒大量制备并且稀释。crRNA、靶标、和PAM序列列于表5中。
表5.哺乳动物靶序列和相应的crRNA。
在转染前大约16小时,将在DMEM/10%FBS+青霉素/链霉素(D10培养基)中的25,000个HEK293T细胞铺板至96孔板中的每个孔中。在转染的当天,细胞的汇合度为70%-90%。对于待转染的每个孔,制备LipofectamineTM2000和Opti-MEMTM(GibcoTM)的混合物,并在室温下孵育5分钟(溶液1)。在孵育之后,将Lipofectamine2000TM:Opti-MEMTM混合物添加至含有核酸酶质粒、RNA指导物质粒和Opti-MEMTM的单独混合物中(溶液2)。在阴性对照的情况下,溶液2中不包含RNA指导物质粒。将溶液1和2通过向上和向下吸移进行混合,且然后在室温下孵育25分钟。在孵育后,将溶液1和2混合物逐滴添加至含有细胞的96孔板的每个孔。在转染后大约72小时,通过以下方式使细胞胰蛋白酶化:向每个孔的中心添加TrypLETM(GibcoTM)并且在37℃下孵育大约5分钟。然后将D10培养基添加至每个孔并且混合以重悬细胞。将重悬的细胞以500g离心10分钟以获得沉淀,并弃去上清液。然后将细胞沉淀重悬于QuickExtractTM缓冲液/>中,并将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来扩增根据靶的特定基因组区域。进行第2轮PCR(PCR2)以添加因美纳公司衔接子和标签。然后将反应液合并并且通过柱纯化进行纯化。使用150Cycle NextSeq 500/550中或高输出v2.5试剂盒进行测序运行。
表6.相对于WT,示例性单一改变增加插入缺失(3个靶标的平均值)
/>
表7.相对于WT,示例性双重改变增加插入缺失(3个靶标的平均值)
/>
/>
/>
/>
/>
/>
/>
/>
/>
表8.相对于WT,示例性改变增加插入缺失(3个靶标的平均值)
/>
如表6-8中所示,包含单个氨基酸取代(如D509R)或二至五个氨基酸取代(如L580G和L385G)的多个变体导致插入缺失活性增加至少2倍。
实例10-通过变体多肽对哺乳动物基因的靶向
本实例描述了使用通过瞬时转染引入至哺乳动物细胞中的变体多肽对多个靶标进行的插入缺失评估。
使用实例9中描述的测定法和三个靶标,分析了SEQ ID NO:3的另外的组合变体。导致插入缺失活性至少增加2倍的组合突变(如K136G、N220R和M380R)示于表9中。
表9.相对于WT,示例性改变增加插入缺失(3个靶标的平均值)
/>
列举的实施例
提供了以下列举的实施例,其编号不应被解释为指定重要性水平。
实施例1提供了一种变体多肽或一种包含变体多肽的组合物,其中相对于亲本多肽,该变体多肽包含改变,其中该亲本多肽包含SEQ ID NO:3,其中该变体多肽能够与RNA指导物和靶核酸结合,并且其中相对于该亲本多肽或包含该亲本多肽的复合物,该变体多肽或包含该变体多肽的复合物表现出增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
实施例2提供了如实施例1所述的变体多肽或组合物,其中该增强的酶活性是增强的核酸酶活性。
实施例3提供了如任一项前述实施例所述的变体多肽或组合物,其中相对于该亲本多肽,该变体多肽表现出增强的与该RNA指导物的结合活性。
实施例4提供了如任一项前述实施例所述的变体多肽或组合物,其中相对于该亲本多肽,该变体多肽表现出增强的与该RNA指导物的结合特异性。
实施例5提供了如任一项前述实施例所述的变体多肽或组合物,其中该变体多肽和该RNA指导物形成变体二元复合物,并且该变体二元复合物表现出以下特征中的一项或多项:
(i)相对于亲本二元复合物,增强的与靶核酸的结合活性(例如,中靶结合活性);
(ii)相对于亲本二元复合物,增强的与靶核酸的结合特异性(例如,中靶结合特异性);
(iii)相对于亲本二元复合物,增强的稳定性;和/或
(iv)相对于亲本二元复合物,降低的与靶核酸的解离、和/或降低的与非靶核酸的脱靶结合。
实施例6提供了如任一项前述实施例所述的变体多肽或组合物,其中该变体二元复合物和该靶核酸形成变体三元复合物,并且相对于亲本三元复合物,该变体三元复合物表现出增加的稳定性。
实施例7提供了如任一项前述实施例所述的变体多肽或组合物,其中相对于该亲本多肽,该变体多肽进一步表现出增强的二元复合物形成、增强的蛋白质-RNA相互作用、和/或降低的与RNA指导物的解离。
实施例8提供了如任一项前述实施例所述的变体多肽或组合物,其中该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在例如20℃至65℃的温度范围内。
实施例9提供了如任一项前述实施例所述的变体多肽或组合物,其中该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在一定孵育时间范围内。
实施例10提供了如任一项前述实施例所述的变体多肽或组合物,其中该增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性发生在具有约7.3至约8.6范围内的pH的缓冲液中。
实施例11提供了如任一项前述实施例所述的变体多肽或组合物,其中当该变体多肽、变体二元复合物、或变体三元复合物的Tm值比该亲本多肽、亲本二元复合物、或亲本三元复合物的Tm值大至少8℃时,发生增强的酶活性、增强的结合活性、增强的结合特异性、和/或增强的稳定性。
实施例12提供了如任一项前述实施例所述的变体多肽或组合物,其中该改变是表2中列出的至少一个氨基酸取代。
实施例13提供了如任一项前述实施例所述的变体多肽或组合物,其中该改变是精氨酸、赖氨酸、谷氨酰胺、天冬酰胺、组氨酸、丙氨酸或甘氨酸取代。
实施例14提供了如任一项前述实施例所述的变体多肽或组合物,其中该变体多肽包含RuvC结构域或拆分型RuvC结构域。
实施例15提供了如任一项前述实施例所述的变体多肽或组合物,其中该变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。
实施例16提供了如任一项前述实施例所述的变体多肽或组合物,其中该一个或多个催化残基包含D345和E506。
实施例17提供了如任一项前述实施例所述的变体多肽或组合物,其中该RNA指导物包含同向重复序列和间隔子序列。
实施例18提供了如任一项前述实施例所述的变体多肽或组合物,其中该同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少90%序列同一性的核苷酸序列。
实施例19提供了如任一项前述实施例所述的变体多肽或组合物,其中该同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少95%序列同一性的核苷酸序列。
实施例20提供了如任一项前述实施例所述的变体多肽或组合物,其中该同向重复序列包含SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6。
实施例21提供了如任一项前述实施例所述的变体多肽或组合物,其中该间隔子序列的长度为15至35个核苷酸。
实施例22提供了如任一项前述实施例所述的变体多肽或组合物,其中该RNA指导物包含SEQ ID NO:9、11、13、15、17、19、21、和23中的任一个。
实施例23提供了如任一项前述实施例所述的变体多肽或组合物,其中该靶核酸包含与该间隔子序列中的核苷酸序列互补的序列。
实施例24提供了如任一项前述实施例所述的变体多肽或组合物,其中该靶核酸与原型间隔子相邻基序(PAM)序列相邻,其中该PAM序列包含如5’-NTN-3’、5’-HTN-3’、或5’-TNA-3’所示的核苷酸序列,其中N是任何核苷酸并且H是A或C或T。
实施例25提供了如实施例24所述的变体多肽或组合物,其中该PAM序列包含如5’-CTG-3’所示的核苷酸序列。
实施例26提供了如任一项前述实施例所述的变体多肽或组合物,其中该靶核酸是单链DNA或双链DNA。
实施例27提供了如任一项前述实施例所述的变体多肽或组合物,其中该变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
实施例28提供了如任一项前述实施例所述的变体多肽或组合物,其中编码该变体多肽的核酸经密码子优化以用于在细胞中表达。
实施例29提供了如实施例28所述的变体多肽或组合物,其中该编码变体多肽的核酸可操作地连接至启动子。
实施例30提供了如任一项前述实施例所述的变体多肽或组合物,其中该编码变体多肽的核酸位于载体中。
实施例31提供了如实施例31所述的变体多肽或组合物,其中该载体包含逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
实施例32提供了如任一项前述实施例所述的变体多肽或组合物,其中该组合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外泌体、微泡或基因枪。
实施例33提供了一种包含如任一项前述实施例所述的变体多肽或组合物的细胞。
实施例34提供了如实施例33所述的细胞,其中该细胞是真核细胞或原核细胞。
实施例35提供了如任一项前述实施例所述的细胞,其中该细胞是哺乳动物细胞或植物细胞。
实施例36提供了如任一项前述实施例所述的细胞,其中该细胞是人细胞。
实施例37提供了一种RNA指导物或一种编码该RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列包含与SEQ ID NO:4-6中任一个具有至少90%同一性的核苷酸序列。
实施例38提供了如实施例42所述的RNA指导物或编码该RNA指导物的核酸,其中该同向重复序列选自由SEQ ID NO:4-6组成的组。
实施例39提供了如实施例40或41中任一项所述的RNA指导物或编码该RNA指导物的核酸,其中该间隔子序列与5’-CTG-3’原型间隔子相邻基序相邻结合。
实施例40提供了如实施例40-42中任一项所述的RNA指导物或编码该RNA指导物的核酸,其中该RNA指导物包含SEQ ID NO:9、11、13、15、17、19、21、和23中任一个的核苷酸序列。
实施例41提供了一种组合物,其包含如实施例37-40中任一项所述的RNA指导物或编码该RNA指导物的核酸。
实施例42提供了如实施例41所述的组合物,其中该组合物进一步包含CRISPR核酸酶或编码该CRISPR核酸酶的核酸。
实施例43提供了如实施例42所述的组合物,其中该CRISPR核酸酶包含与SEQ IDNO:3具有至少80%同一性的氨基酸序列。
实施例44提供了如实施例43所述的组合物,其中该CRISPR核酸酶包含与SEQ IDNO:3具有至少95%同一性的氨基酸序列。
实施例45提供了如实施例41-44中任一项所述的组合物,其中该CRISPR核酸酶是如实施例1-32中任一项所述的变体多肽。
实施例46提供了一种制备如任一项前述实施例所述的变体多肽的方法,该方法包括(i)将一个或多个核苷酸取代引入包含SEQ ID NO:1或SEQ ID NO:2的核酸中以产生编码该变体多肽的变体核酸,以及(ii)从该变体核酸表达该变体多肽。
实施例47提供了一种变体二元复合物,其包含如任一项前述实施例所述的变体多肽和RNA指导物。
实施例48提供了一种变体三元复合物,其包含如任一项前述实施例所述的变体多肽、RNA指导物、和靶核酸。
实施例49提供了一种形成变体二元复合物的方法,该方法包括使如任一项前述实施例所述的变体多肽与如任一项前述实施例所述的RNA指导物接触。
实施例50提供了一种形成变体三元复合物的方法,该方法包括使如任一项前述实施例所述的变体多肽与如任一项前述实施例所述的RNA指导物以及如任一项前述实施例所述的靶核酸接触。
实施例51提供了一种将如任一项前述实施例所述的变体多肽或组合物或变体二元复合物递送至细胞的方法,该方法包括将如实施例1-32中任一项所述的变体多肽或编码该变体多肽的核酸引入该细胞中,以及任选地,引入如任一项前述实施例所述的RNA指导物或编码该RNA指导物的核酸,或引入如实施例5述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。
实施例52提供了一种用于修饰细胞中的靶DNA分子的方法,该方法包括将如实施例1-32中任一项所述的变体多肽或编码该变体多肽的核酸引入该细胞中,以及引入如任一项前述实施例所述的RNA指导物或编码该RNA指导物的核酸,或引入如实施例47述的变体二元复合物,其中该引入包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。
实施例53提供了如实施例51或52所述的方法,其中引入该细胞中的步骤包括转染或转导该细胞。
实施例54提供了如实施例51-53中任一项所述的方法,其中该引入细胞中的步骤包括使用电穿孔、注射、基因枪或其任何组合。
实施例55提供了一种用于修饰靶DNA分子的方法,该方法包括使该靶DNA分子与如实施例1-32中任一项所述的变体多肽和如任一项前述实施例所述的RNA指导物接触。
实施例56提供了如实施例55所述的方法,其中该靶DNA分子是体外的或在细胞中。
实施例57提供了如实施例51-54和56中任一项所述的方法,其中该细胞是体外、离体、或体内的。
实施例58提供了如实施例57所述的方法,其中该细胞选自原核细胞、真核细胞、植物细胞、哺乳动物细胞和人细胞。
其他实施例
本文引用的每一个专利、专利申请和出版物的披露内容据此通过引用以其全文特此并入。虽然已经参照特定实施例描述了本披露内容,但是本领域其他技术人员可以在不偏离本发明的真实精神以及范围的情况下设想本披露的其他实施例以及变化。所附权利要求旨在理解为包括所有这样的实施例以及等同变化。
Claims (59)
1.一种变体多肽,其中相对于SEQ ID NO:3的氨基酸序列,该变体多肽包含改变,其中该改变包含D509R、S511R、I521R、D535G、Q514G、L516R、L516G、E198R、S527R、D509K、D509G、L580G、V359R、D535K、Y381R、R354G、M380K、M380R、V383R、L580R、E367R、I521K、E367G、E507R、I521G、W350R、D535R、R528K、S527K、L385G、W350G、L516K、Y381G、H532R、D129R、P615R、G578R、M380G、V595G、R531G、D129G、R531K、D158G、N476G、G578K、A512R、P618R、V595R、V595K、V383G、A597G、Y381K、P618G、E198K、T288R、E507K、L385R、C538G、P615G、D386R、S511K、C371G、K136G、N220R、S78K、K141G、K240R、D277R、T165R、或K374R,其中该变体多肽与该SEQ ID NO:3的氨基酸序列具有至少90%同一性。
2.一种变体多肽,其中相对于SEQ ID NO:3的氨基酸序列,该变体多肽包含改变,其中该改变包含D509R、S511R、I521R、D535G、Q514G、L516R、L516G、E198R、S527R、D509K、D509G、L580G、V359R、D535K、Y381R、R354G、M380K、M380R、V383R、L580R、E367R、I521K、E367G、E507R、I521G、W350R、D535R、R528K、S527K、L385G、W350G、L516K、Y381G、H532R、D129R、P615R、G578R、M380G、V595G、R531G、D129G、R531K、D158G、N476G、G578K、A512R、P618R、V595R、V595K、V383G、A597G、Y381K、P618G、E198K、T288R、E507K、L385R、C538G、P615G、D386R、S511K、或C371G、K136G、N220R、S78K、K141G、K240R、D277R、T165R、或K374R,并且其中该变体多肽与该SEQ ID NO:3的氨基酸序列相差1-20个氨基酸残基。
3.如权利要求1或2所述的变体多肽,其中该改变选自包含以下的组:
i)D509R;
ii)S511R;
iii)I521R;
iv)D535G;和
v)Q514G。
4.如权利要求1-3中任一项所述的变体多肽,其中相对于该SEQ ID NO:3的氨基酸序列,该变体多肽进一步包含第二改变。
5.如权利要求4所述的变体多肽,其中
i)该改变包含L580G并且第二改变包含L385G
ii)该改变包含D509R并且该第二改变包含M380R;
iii)该改变包含L580G并且该第二改变包含A512R;
iv)该改变包含S527R并且该第二改变包含C538G;
v)该改变包含D129R并且该第二改变包含P618R;或
vi)该改变包含Q514G并且该第二改变包含A512R。
6.如权利要求4所述的变体多肽,其中相对于该SEQ ID NO:3的氨基酸序列,该变体多肽进一步包含第三改变。
7.如权利要求6所述的变体多肽,其中
i)该改变包含D535G,该第二改变包含L516R,并且该第三改变包含I521R;
ii)该改变包含L516R,该第二改变包含Q514G,并且该第三改变包含I521R;
iii)该改变包含D509R,该第二改变包含L516R,并且该第三改变包含I521R;
iv)该改变包含D535G,该第二改变包含L516R,并且该第三改变包含Q514G;
v)该改变包含D535G,该第二改变包含Q514G,并且该第三改变包含I521R;
vi)该改变包含K136G,该第二改变包含N220R,并且该第三改变包含M380R;
vii)该改变包含S78K,该第二改变包含E198R,并且该第三改变包含R354G;
viii)该改变包含K141G,该第二改变包含N220R,并且该第三改变包含M380R;
ix)该改变包含K141G,该第二改变包含K240R,并且该第三改变包含M380R;并且
x)该改变包含K141G,该第二改变包含D277R,并且该第三改变包含M380R。
8.如权利要求6所述的变体多肽,其中该变体多肽进一步包含第四改变。
9.如权利要求8所述的变体多肽,其中该改变包含Q514G,该第二改变包含I521R,该第三改变包含L580G,并且该第四改变包含E198R。
10.如权利要求8所述的变体多肽,其中该变体多肽进一步包含第五改变。
11.如权利要求10所述的变体多肽,其中该改变包含D509R,该第二改变包含D535G,该第三改变包含L516R,该第四改变包含Q514G,并且该第五改变包含I521R。
12.如权利要求10所述的变体多肽,其中该变体多肽进一步包含第六改变,并且任选地进一步包含第七、第八、第九和第十改变。
13.如权利要求4所述的变体多肽,其中该第二改变包含取代、插入或缺失。
14.如权利要求6所述的变体多肽,其中该第三改变包含取代、插入或缺失。
15.如权利要求8所述的变体多肽,其中该第四改变包含取代、插入或缺失。
16.如权利要求10所述的变体多肽,其中该第五改变包含取代、插入或缺失。
17.如前述权利要求中任一项所述的变体多肽,其中该变体多肽能够与RNA指导物结合。
18.如前述权利要求中任一项所述的变体多肽,其中相对于SEQ ID NO 3的多肽,该变体多肽或包含该变体多肽的复合物表现出增强的酶活性和/或增强的稳定性。
19.如权利要求18所述的变体多肽,其中该增强的酶活性是增强的核酸酶活性。
20.如任一项前述权利要求所述的变体多肽,其中该变体多肽或包含该变体多肽的复合物包含相对于SEQ ID NO:3的多肽至少1.5倍、2倍、2.5倍或3倍的增强的酶活性,例如通过插入缺失活性测量的,例如,如实例9和10中所述。
21.如任一项前述权利要求所述的变体多肽,其中相对于亲本多肽,该变体多肽表现出增强的与该RNA指导物的结合活性。
22.如任一项前述权利要求所述的变体多肽,其中相对于该亲本多肽,该变体多肽表现出增强的与该RNA指导物的结合特异性。
23.如任一项前述权利要求所述的变体多肽,其中该变体多肽包含RuvC结构域或拆分型RuvC结构域。
24.如任一项前述权利要求所述的变体多肽,其中该变体多肽包含一个或多个催化残基(例如,天冬氨酸或谷氨酸)。
25.如任一项前述权利要求所述的变体多肽,其中该一个或多个催化残基包含D345和E506。
26.如权利要求1-23中任一项所述的变体多肽,其具有降低的核酸酶活性或是核酸酶失活型多肽。
27.如任一项前述权利要求所述的变体多肽或系统,其中该第二改变包含多肽结构域的插入,其中任选地该插入位于该SEQ ID NO:3的序列的N末端、C末端或内部。
28.如任一项前述权利要求所述的变体多肽,其中该变体多肽进一步包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
29.一种RNA指导物或一种编码该RNA指导物的核酸,其中该RNA指导物包含同向重复序列和间隔子序列,并且其中该同向重复序列包含SEQ ID NO:4-6中任一个的核苷酸序列,或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的序列,其中紧邻该同向重复序列3’的核苷酸选自C、T、或G。
30.一种系统,其包含如任一项前述权利要求所述的变体多肽或编码该变体多肽的第一核酸,以及RNA指导物或编码该RNA指导物的第二核酸,其中该RNA指导物包含同向重复序列和间隔子序列,任选地其中该RNA指导物是如权利要求29所述的RNA指导物。
31.如权利要求30所述的系统,其中该同向重复序列包含与SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少90%序列同一性的核苷酸序列。
32.如权利要求30或31所述的系统,其中该同向重复序列包含与SEQ ID NO:4、SEQ IDNO:5、或SEQ ID NO:6具有至少95%序列同一性的核苷酸序列。
33.如权利要求30-32中任一项所述的系统,其中该同向重复序列包含SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6。
34.如权利要求30-33中任一项所述的系统,其中该间隔子序列的长度为15至35个核苷酸。
35.如权利要求30-34中任一项所述的系统,其中该第一核酸位于第一载体中,并且该编码RNA指导物的第二核酸位于载体(例如,该第一载体或第二载体)中,任选地其中该第一载体和/或该第二载体是病毒载体。
36.如权利要求30-35中任一项所述的系统,其中靶核酸包含与该间隔子序列中的核苷酸序列互补的序列。
37.如权利要求30-36中任一项所述的系统,其中该靶核酸与原型间隔子相邻基序(PAM)序列相邻,其中该PAM序列包含如5’-NTN-3’、5’-HTN-3’、或5’-TNA-3’所示的核苷酸序列,其中N是任何核苷酸并且H是A或C或T。
38.如权利要求37所述的系统,其中该PAM序列包含如5’-CTG-3’或5’-CTC-3’所示的核苷酸序列。
39.如权利要求30-38中任一项所述的系统,其中该靶核酸是双链DNA。
40.一种核酸,其编码如权利要求1-28中任一项所述的变体多肽。
41.如权利要求40所述的核酸,其经密码子优化以用于在细胞中表达。
42.如权利要求40或41所述的核酸,其中该核酸进一步包含编码指导RNA的序列。
43.如权利要求40-42中任一项所述的核酸,其中该核酸可操作地连接至启动子。
44.如权利要求40-42中任一项所述的核酸,其中该核酸包含RNA(例如,mRNA)。
45.如权利要求40-44中任一项所述的核酸,其中该核酸位于载体中。
46.如权利要求45所述的载体,其中该载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
47.如权利要求46所述的病毒载体,其中该病毒载体是腺相关病毒(AAV)载体。
48.一种组合物,其包含如权利要求1-29中任一项所述的变体多肽、如权利要求30-39中任一项所述的系统、如权利要求40-45中任一项所述的核酸、或如权利要求46或47所述的载体,其中该组合物存在于纳米颗粒、脂质体、外泌体、微泡或基因枪中。
49.一种细胞,其包含如权利要求1-29中任一项所述的变体多肽、如权利要求30-39中任一项所述的系统、如权利要求40-45中任一项所述的核酸、或如权利要求46或47所述的载体。
50.如权利要求49所述的细胞,其中该细胞是真核细胞。
51.如权利要求50所述的细胞,其中该细胞是哺乳动物细胞或植物细胞。
52.如权利要求51所述的细胞,其中该细胞是人细胞。
53.一种产生如权利要求1-29中任一项所述的变体多肽的方法,该方法包括:(i)产生编码该变体多肽的核酸序列,和(ii)将该核酸序列引入能够表达该核酸序列的适当宿主细胞中,以及(iii)允许该宿主细胞表达该变体多肽。
54.一种产生如权利要求1-29中任一项所述的变体多肽的方法,该方法包括:(i)将一个或多个核苷酸取代引入包含SEQ ID NO:1或SEQ ID NO:2的核酸中以产生编码该变体多肽的变体核酸,以及(ii)从该变体核酸表达该变体多肽。
55.一种将如任一项前述权利要求所述的变体多肽递送至细胞的方法,该方法包括:将如权利要求1-29中任一项所述的变体多肽或编码该变体多肽的核酸引入该细胞中,以及任选地引入RNA指导物或编码该RNA指导物的核酸,其中该引入任选地包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。
56.一种用于修饰细胞中的靶DNA分子的方法,该方法包括将如权利要求1-29中任一项所述的变体多肽或编码该变体多肽的核酸引入该细胞中,以及引入RNA指导物或编码该RNA指导物的核酸,其中该引入任选地包括引入纳米颗粒、脂质体、外泌体、微泡、病毒载体或其任何组合。
57.如权利要求55或56所述的方法,其中引入该细胞中的步骤包括转染或转导该细胞。
58.如权利要求55-57中任一项所述的方法,其中该引入细胞中的步骤包括使用电穿孔、注射、基因枪或其任何组合。
59.如权利要求55-57中任一项所述的方法,其中该编码变体多肽的核酸包含RNA(例如,mRNA)。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/241,821 | 2021-09-08 | ||
US202263296741P | 2022-01-05 | 2022-01-05 | |
US63/296,741 | 2022-01-05 | ||
PCT/US2022/076112 WO2023039472A2 (en) | 2021-09-08 | 2022-09-08 | Compositions comprising a crispr nuclease and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118019846A true CN118019846A (zh) | 2024-05-10 |
Family
ID=90952808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280061213.8A Pending CN118019846A (zh) | 2021-09-08 | 2022-09-08 | 包含crispr核酸酶的组合物及其用途 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118019846A (zh) |
-
2022
- 2022-09-08 CN CN202280061213.8A patent/CN118019846A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230332119A1 (en) | Compositions comprising a cas12i2 variant polypeptide and uses thereof | |
US20240174997A1 (en) | Compositions comprising a variant polypeptide and uses thereof | |
US11866746B2 (en) | Compositions comprising a variant Cas12i4 polypeptide and uses thereof | |
WO2022150608A1 (en) | Compositions comprising a variant crispr nuclease polypeptide and uses thereof | |
CN118019846A (zh) | 包含crispr核酸酶的组合物及其用途 | |
US20230235304A1 (en) | Compositions comprising a crispr nuclease and uses thereof | |
US11946045B2 (en) | Compositions comprising a variant polypeptide and uses thereof | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
WO2023019243A1 (en) | Compositions comprising a variant cas12i3 polypeptide and uses thereof | |
US20240035010A1 (en) | Compositions comprising a variant polypeptide and uses thereof | |
CN117043326A (zh) | 包含变体多肽的组合物及其用途 | |
CN117295816A (zh) | 包含变体多肽的组合物及其用途 | |
WO2024020557A1 (en) | Compositions comprising a variant nuclease and uses thereof | |
EP4158020A2 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |