TW202300507A - 包含變異多肽之組合物及其用途 - Google Patents
包含變異多肽之組合物及其用途 Download PDFInfo
- Publication number
- TW202300507A TW202300507A TW111108605A TW111108605A TW202300507A TW 202300507 A TW202300507 A TW 202300507A TW 111108605 A TW111108605 A TW 111108605A TW 111108605 A TW111108605 A TW 111108605A TW 202300507 A TW202300507 A TW 202300507A
- Authority
- TW
- Taiwan
- Prior art keywords
- substitution
- seq
- variant polypeptide
- variant
- sequence
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 868
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 861
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 849
- 239000000203 mixture Substances 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 claims abstract description 54
- 238000006467 substitution reaction Methods 0.000 claims description 1187
- 150000007523 nucleic acids Chemical class 0.000 claims description 227
- 102000039446 nucleic acids Human genes 0.000 claims description 200
- 108020004707 nucleic acids Proteins 0.000 claims description 200
- 230000027455 binding Effects 0.000 claims description 141
- 102220492647 Integrin alpha-3_E311R_mutation Human genes 0.000 claims description 136
- 125000003729 nucleotide group Chemical group 0.000 claims description 113
- 102220010920 rs397507455 Human genes 0.000 claims description 109
- 239000002773 nucleotide Substances 0.000 claims description 105
- 210000004027 cell Anatomy 0.000 claims description 86
- 102200108041 rs755799430 Human genes 0.000 claims description 86
- 102200005731 rs863225469 Human genes 0.000 claims description 79
- 239000013598 vector Substances 0.000 claims description 69
- 230000002255 enzymatic effect Effects 0.000 claims description 53
- 239000000574 octyl gallate Substances 0.000 claims description 47
- 108090000623 proteins and genes Proteins 0.000 claims description 47
- 230000002829 reductive effect Effects 0.000 claims description 47
- 102220586367 Ventral anterior homeobox 1_D145G_mutation Human genes 0.000 claims description 38
- 102200107823 c.338T>G Human genes 0.000 claims description 38
- 102220104084 rs376128040 Human genes 0.000 claims description 38
- 102220040213 rs587778234 Human genes 0.000 claims description 38
- 230000000694 effects Effects 0.000 claims description 36
- 102220641676 Iodotyrosine deiodinase 1_P14G_mutation Human genes 0.000 claims description 33
- 230000004048 modification Effects 0.000 claims description 32
- 238000012986 modification Methods 0.000 claims description 32
- 125000006850 spacer group Chemical group 0.000 claims description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 28
- 230000001965 increasing effect Effects 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 25
- 238000010494 dissociation reaction Methods 0.000 claims description 25
- 230000005593 dissociations Effects 0.000 claims description 25
- 102000004190 Enzymes Human genes 0.000 claims description 24
- 108090000790 Enzymes Proteins 0.000 claims description 24
- 239000004109 brown FK Substances 0.000 claims description 22
- 230000009918 complex formation Effects 0.000 claims description 21
- 101710163270 Nuclease Proteins 0.000 claims description 19
- 230000003993 interaction Effects 0.000 claims description 19
- 239000000872 buffer Substances 0.000 claims description 18
- 239000002105 nanoparticle Substances 0.000 claims description 10
- 108010077544 Chromatin Proteins 0.000 claims description 7
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 7
- 210000003483 chromatin Anatomy 0.000 claims description 7
- 108091006047 fluorescent proteins Proteins 0.000 claims description 7
- 102000034287 fluorescent proteins Human genes 0.000 claims description 7
- 239000002502 liposome Substances 0.000 claims description 7
- 238000012384 transportation and delivery Methods 0.000 claims description 7
- 230000007067 DNA methylation Effects 0.000 claims description 6
- 208000009889 Herpes Simplex Diseases 0.000 claims description 6
- 108010033040 Histones Proteins 0.000 claims description 6
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 6
- 210000005260 human cell Anatomy 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 230000001177 retroviral effect Effects 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 238000012800 visualization Methods 0.000 claims description 6
- 238000011534 incubation Methods 0.000 claims description 5
- 150000002632 lipids Chemical class 0.000 claims description 4
- 239000003607 modifier Substances 0.000 claims description 4
- 239000000411 inducer Substances 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 4
- 239000003795 chemical substances by application Substances 0.000 claims 1
- 230000007935 neutral effect Effects 0.000 claims 1
- 229910052757 nitrogen Inorganic materials 0.000 description 658
- 229910052739 hydrogen Inorganic materials 0.000 description 594
- 150000001413 amino acids Chemical group 0.000 description 235
- 102220470558 Proteasome subunit beta type-3_D32R_mutation Human genes 0.000 description 107
- 235000001014 amino acid Nutrition 0.000 description 98
- 230000004075 alteration Effects 0.000 description 55
- 229940024606 amino acid Drugs 0.000 description 46
- 238000003780 insertion Methods 0.000 description 45
- 230000037431 insertion Effects 0.000 description 45
- 238000012217 deletion Methods 0.000 description 44
- 230000037430 deletion Effects 0.000 description 44
- 102000053602 DNA Human genes 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 35
- 230000000295 complement effect Effects 0.000 description 29
- 229910052700 potassium Inorganic materials 0.000 description 23
- 230000001747 exhibiting effect Effects 0.000 description 20
- 235000018102 proteins Nutrition 0.000 description 20
- 102000004169 proteins and genes Human genes 0.000 description 20
- 230000008685 targeting Effects 0.000 description 18
- 229910052799 carbon Inorganic materials 0.000 description 17
- 102000040430 polynucleotide Human genes 0.000 description 15
- 108091033319 polynucleotide Proteins 0.000 description 15
- 230000035772 mutation Effects 0.000 description 12
- 239000002777 nucleoside Substances 0.000 description 12
- 239000002157 polynucleotide Substances 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 11
- 108091079001 CRISPR RNA Proteins 0.000 description 10
- 239000002253 acid Substances 0.000 description 9
- -1 RNA molecules Proteins 0.000 description 8
- 102000004389 Ribonucleoproteins Human genes 0.000 description 8
- 108010081734 Ribonucleoproteins Proteins 0.000 description 8
- 125000003835 nucleoside group Chemical group 0.000 description 8
- 230000000717 retained effect Effects 0.000 description 8
- 229910019142 PO4 Inorganic materials 0.000 description 7
- 230000003197 catalytic effect Effects 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 150000004713 phosphodiesters Chemical class 0.000 description 7
- 210000002706 plastid Anatomy 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 239000010452 phosphate Substances 0.000 description 6
- 235000000346 sugar Nutrition 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Chemical group NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Chemical group 0.000 description 5
- 239000012636 effector Substances 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 4
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical group OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 4
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical group NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical group OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 230000026279 RNA modification Effects 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 235000009582 asparagine Nutrition 0.000 description 4
- 229960001230 asparagine Drugs 0.000 description 4
- 230000000536 complexating effect Effects 0.000 description 4
- 210000001808 exosome Anatomy 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Chemical group OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Chemical group OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 239000000395 magnesium oxide Substances 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 229960003080 taurine Drugs 0.000 description 4
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical group NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Chemical group 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 125000000217 alkyl group Chemical group 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 229940096913 pseudoisocytidine Drugs 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- WBVPJIKOWUQTSD-ZOQUXTDFSA-N 2-methoxyuridine Chemical compound COC1=NC(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WBVPJIKOWUQTSD-ZOQUXTDFSA-N 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical group C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical group OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- DLRVVLDZNNYCBX-UHFFFAOYSA-N Polydextrose Polymers OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(O)O1 DLRVVLDZNNYCBX-UHFFFAOYSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- UORVGPXVDQYIDP-UHFFFAOYSA-N borane Chemical compound B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 2
- 150000008298 phosphoramidates Chemical class 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000013615 primer Substances 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- OPPXXSJNEJKHJA-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C1=NC=2C(NC(=O)NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OPPXXSJNEJKHJA-CKTDUXNWSA-N 0.000 description 1
- OYTVCAGSWWRUII-DWJKKKFUSA-N 1-Methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=O)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O OYTVCAGSWWRUII-DWJKKKFUSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- YLCCMFLPRRFRJT-VPCXQMTMSA-N 1-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-4-sulfanylidenepyrimidin-2-one Chemical compound C[C@@]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=O)NC(=S)C=C1 YLCCMFLPRRFRJT-VPCXQMTMSA-N 0.000 description 1
- NOLVLJWEGBKCIN-VPCXQMTMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-2-sulfanylidenepyrimidin-4-one Chemical compound C1=CC(=O)NC(=S)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O NOLVLJWEGBKCIN-VPCXQMTMSA-N 0.000 description 1
- ODDDVFDZBGTKDX-VPCXQMTMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidine-2,4-dione Chemical compound C1=CC(=O)NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O ODDDVFDZBGTKDX-VPCXQMTMSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- JCNGYIGHEUKAHK-DWJKKKFUSA-N 2-Thio-1-methyl-1-deazapseudouridine Chemical compound CC1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O JCNGYIGHEUKAHK-DWJKKKFUSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- CWXIOHYALLRNSZ-JWMKEVCDSA-N 2-Thiodihydropseudouridine Chemical compound C1C(C(=O)NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O CWXIOHYALLRNSZ-JWMKEVCDSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical compound C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- JUMHLCXWYQVTLL-KVTDHHQDSA-N 2-thio-5-aza-uridine Chemical compound [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C(=S)NC(=O)N=C1 JUMHLCXWYQVTLL-KVTDHHQDSA-N 0.000 description 1
- VRVXMIJPUBNPGH-XVFCMESISA-N 2-thio-dihydrouridine Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)N1CCC(=O)NC1=S VRVXMIJPUBNPGH-XVFCMESISA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- ZSIINYPBPQCZKU-BQNZPOLKSA-O 4-Methoxy-1-methylpseudoisocytidine Chemical compound C[N+](CC1[C@H]([C@H]2O)O[C@@H](CO)[C@@H]2O)=C(N)N=C1OC ZSIINYPBPQCZKU-BQNZPOLKSA-O 0.000 description 1
- FGFVODMBKZRMMW-XUTVFYLZSA-N 4-Methoxy-2-thiopseudouridine Chemical compound COC1=C(C=NC(=S)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O FGFVODMBKZRMMW-XUTVFYLZSA-N 0.000 description 1
- HOCJTJWYMOSXMU-XUTVFYLZSA-N 4-Methoxypseudouridine Chemical compound COC1=C(C=NC(=O)N1)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O HOCJTJWYMOSXMU-XUTVFYLZSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- MMUBPEFMCTVKTR-IBNKKVAHSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-1h-pyrimidine-2,4-dione Chemical compound C=1NC(=O)NC(=O)C=1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MMUBPEFMCTVKTR-IBNKKVAHSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- OSLBPVOJTCDNEF-DBRKOABJSA-N 5-aza-zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CN=C1 OSLBPVOJTCDNEF-DBRKOABJSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- CBNRZZNSRJQZNT-IOSLPCCCSA-O 6-thio-7-deaza-guanosine Chemical compound CC1=C[NH+]([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C(NC(N)=N2)=C1C2=S CBNRZZNSRJQZNT-IOSLPCCCSA-O 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- DCYBPMFXJCWXNB-JWIUVKOKSA-N CNDAC Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](C#N)[C@H](O)[C@@H](CO)O1 DCYBPMFXJCWXNB-JWIUVKOKSA-N 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- YKWUPFSEFXSGRT-JWMKEVCDSA-N Dihydropseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1C(=O)NC(=O)NC1 YKWUPFSEFXSGRT-JWMKEVCDSA-N 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 1
- FLFGNMFWNBOBGE-FNNZEKJRSA-N Elacytarabine Chemical compound O[C@H]1[C@H](O)[C@@H](COC(=O)CCCCCCC/C=C/CCCCCCCC)O[C@H]1N1C(=O)N=C(N)C=C1 FLFGNMFWNBOBGE-FNNZEKJRSA-N 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 229920001100 Polydextrose Polymers 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- OIRDTQYFTABQOQ-UHTZMRCNSA-N Vidarabine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1O OIRDTQYFTABQOQ-UHTZMRCNSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 150000004985 diamines Chemical class 0.000 description 1
- AAOVKJBEBIDNHE-UHFFFAOYSA-N diazepam Chemical compound N=1CC(=O)N(C)C2=CC=C(Cl)C=C2C=1C1=CC=CC=C1 AAOVKJBEBIDNHE-UHFFFAOYSA-N 0.000 description 1
- 229960003529 diazepam Drugs 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- ODKNJVUHOIMIIZ-RRKCRQDMSA-N floxuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 ODKNJVUHOIMIIZ-RRKCRQDMSA-N 0.000 description 1
- 229960000961 floxuridine Drugs 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 230000003370 grooming effect Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-N phosphoramidic acid Chemical compound NP(O)(O)=O PTMHPRAIXMAOOB-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000001259 polydextrose Substances 0.000 description 1
- 229940035035 polydextrose Drugs 0.000 description 1
- 235000013856 polydextrose Nutrition 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-K selenophosphate Chemical compound [O-]P([O-])([O-])=[Se] JRPHGDYSKGJTKZ-UHFFFAOYSA-K 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-N sulfonic acid Chemical compound OS(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-N 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- GFFXZLZWLOBBLO-ASKVSEFXSA-N tezacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C/F)/[C@H](O)[C@@H](CO)O1 GFFXZLZWLOBBLO-ASKVSEFXSA-N 0.000 description 1
- 229950006410 tezacitabine Drugs 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- VSQQQLOSPVPRAZ-RRKCRQDMSA-N trifluridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C(F)(F)F)=C1 VSQQQLOSPVPRAZ-RRKCRQDMSA-N 0.000 description 1
- RXRGZNYSEHTMHC-BQBZGAKWSA-N troxacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)OC1 RXRGZNYSEHTMHC-BQBZGAKWSA-N 0.000 description 1
- 229950010147 troxacitabine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960003636 vidarabine Drugs 0.000 description 1
- QAOHCFGKCWTBGC-QHOAOGIMSA-N wybutosine Chemical compound C1=NC=2C(=O)N3C(CC[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QAOHCFGKCWTBGC-QHOAOGIMSA-N 0.000 description 1
- QAOHCFGKCWTBGC-UHFFFAOYSA-N wybutosine Natural products C1=NC=2C(=O)N3C(CCC(NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1C1OC(CO)C(O)C1O QAOHCFGKCWTBGC-UHFFFAOYSA-N 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Abstract
本發明係關於變異多肽、製備該等變異多肽之方法、用於表徵該等變異多肽之方法、包含該等變異多肽之組合物及細胞以及使用該等變異多肽之方法。本發明進一步關於包含該等變異多肽之複合物、產生該等複合物之方法、用於表徵該等複合物之方法、包含該等複合物之細胞及使用該等複合物之方法。
Description
成簇規律間隔短回文重複序列(CRISPR)及CRISPR相關(Cas)基因統稱為CRISPR-Cas或CRISPR/Cas系統,係古菌(archaea)及細菌中保護特定物種抵禦外來基因元件之適應性免疫系統。
在上述背景下,本發明提供優於先前技術之某些優點及進展。
雖然本文揭示之本發明不限於特定優點或功能性,但本發明提供一種變異多肽,其相對於SEQ ID NO: 3之親本多肽包含改變,且其中該改變為表2之取代。在一些實施例中,取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
在某些實施例中,變異多肽包含a) P14R取代、E311R取代及D32R取代;b) P14R取代、E311R取代及G223R取代;c) P14R取代、E311R取代、D32R取代及I61R取代;或d) D32R取代、N109R取代、E311R取代及D719R取代。在一些實施例中,變異多肽包含c) P14R取代、E311R取代、D32R取代及I61R取代。
在一些實施例中,變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一個態樣中,本發明提供一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置P14、E311、D32、I61、G223、N109及D719中之一或多處之取代的胺基酸序列。
在一個態樣中,本發明提供一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列:P14R、E311R、D32R、I61R、G223R、N109R及D719R。
在一個態樣中,本發明提供一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置K208、D302、D590、E154、D567、L38、D145、C13、T338、P14、D55、K221、K35及E736中之一或多處之取代的胺基酸序列。
在一個態樣中,本發明提供一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列:K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。
在一些實施例中,變異多肽包含P14處之取代(例如,P14R取代)。在某些實施例中,變異多肽包含E311處之取代(例如,E311R取代)。在一些實施例中,變異多肽包含D32處之取代(例如,D32R取代)。在某些實施例中,變異多肽包含I61處之取代(例如,I61R取代)。在一些實施例中,變異多肽包含G223處之取代(例如,G223取代)。在某些實施例中,變異多肽包含N109處之取代(例如,N109R取代)。在一些實施例中,變異多肽包含D719處之取代(例如,D719R取代)。
在某些實施例中,變異多肽包含以下位置處之取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223取代)、N109 (例如,N109R取代)、D719 (例如,D719R取代)或其任何組合。
在一些實施例中,變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及D32 (例如,D32R取代)處之取代(例如,P14R、E311R、D32R變異多肽)。
在一些實施例中,變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及G223 (例如,G223R取代)處之取代(例如,P14R、E311R、G223R變異多肽)。
在某些實施例中,變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)、D32 (例如,D32R取代)及I61 (例如,I61R取代)處之取代(例如,P14R、E311R、D32R及I61R變異多肽)。
在一些實施例中,變異多肽相對於SEQ ID NO: 3包含位置D32R (例如,D32R取代)、N109 (例如,N109R)、E311 (例如,E311R取代)及D719 (例如,D719R取代)處之取代(例如,D32R、N109R、E311R及D719R變異多肽)。
在某些實施例中,變異多肽包含以下各處之取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)或其任何組合。
在特定實施例中,相對於親本多肽,變異多肽展現增加之與RNA引導之二元複合物形成。在某些實施例中,相對於親本二元複合物,包含變異多肽之二元複合物展現增加之穩定性。
在一些實施例中,相對於親本多肽,變異多肽展現增加之核酸酶活性。
在一個態樣中,本發明提供一種組合物,其包含本文所述之變異多肽,其中該組合物進一步包含RNA引導或編碼該RNA引導之核酸,其中該RNA引導包含正向重複序列及間隔子序列。在某些實施例中,正向重複序列與SEQ ID NO: 4-13中之任一者至少90% (例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90% (例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致性的序列。在一些實施例中,正向重複序列與SEQ ID NO: 4-13中之任一者至少95% (例如,95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95% (例如,95%、96%、97%、98%、99%或100%)一致性之序列。在一些實施例中,正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
在一些實施例中,間隔子序列之長度包含約15個核苷酸至約35個核苷酸。
在某些實施例中,間隔子序列結合於目標核酸之目標股序列,且其中目標核酸序列之非目標股序列與原間隔子相鄰模體(PAM)序列相鄰。在一些實施例中,PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3',其中N為任何核苷酸,Y為C或T,且R為A或G。在某些實施例中,PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
在某些實施例中,變異多肽進一步包含核定位信號(NLS)。
在一些實施例中,變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
在一個態樣中,本發明提供一種組合物,其包含編碼本文任何地方所述之變異多肽及/或RNA引導之核酸。在一些實施例中,核酸經密碼子優化以在細胞中表現。在某些實施例中,核酸可操作地連接於啟動子。在一些實施例中,核酸在載體中。在某些實施例中,載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
在一些實施例中,變異多肽存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送系統中。
在一個態樣中,本發明提供一種細胞,其包含任何前述態樣或實施例之變異多肽或組合物。
在一些實施例中,細胞為真核細胞。在某些實施例中,細胞為哺乳動物細胞或植物細胞。在某些實施例中,細胞為人類細胞。
在一個態樣中,本發明提供一種組合物,其包含變異多肽或包含有變異多肽之複合物,其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變,且其中相對於親本多肽或包含親本多肽之複合物,該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在一些實施例中,改變為表2之取代。
在某些實施例中,取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
在一些實施例中,變異多肽包含a) P14R取代、E311R取代及D32R取代;b) P14R取代、E311R取代及G223R取代;c) P14R取代、E311R取代、D32R取代及I61R取代;或d) D32R取代、N109R取代、E311R取代及D719R取代。
在某些實施例中,變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,增強之酶活性為增強之核酸酶活性。
在某些實施例中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合活性。
在一些實施例中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合特異性。
在一些實施例中,包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。
在另一實施例中,包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。
在一些實施例中,包含變異多肽之複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之穩定性。
在某些實施例中,變異二元複合物與目標核酸形成變異三元複合物,且相對於親本三元複合物,變異三元複合物展現增加之穩定性。
在一些實施例中,相對於親本多肽,變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。
在某些實施例中,相對於親本二元複合物,變異二元複合物進一步展現減少之自目標核酸之解離,及/或減少之與非目標核酸之偏離目標結合。
在一些實施例中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃(例如20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃或60℃至65℃)之溫度範圍內發生。
在某些實施例中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。
在一些實施例中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中發生。
在某些實施例中,當變異多肽、變異二元複合物或變異三元複合物之T
m值比親本多肽、親本二元複合物或親本三元複合物之T
m值大至少8℃時,發生增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在一些實施例中,變異多肽包含RuvC域或分開RuvC域。
在某些實施例中,親本多肽包含SEQ ID NO: 3之序列。
在一些實施例中,RNA引導包含正向重複序列及間隔子序列。
在一些實施例中,正向重複序列與SEQ ID NO: 4-13中之任一者至少90% (例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90% (例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)一致性之序列。
在一些實施例中,正向重複序列與SEQ ID NO: 4-13中之任一者至少95% (例如,95%、96%、97%、98%、99%或100%)一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95% (例如,95%、96%、97%、98%、99%或100%)一致性之序列。在一些實施例中,正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
在某些實施例中,間隔子序列之長度包含15至35個核苷酸。
在某些實施例中,間隔子序列與目標核酸之目標股序列包含互補性。
在一些實施例中,目標核酸包含與原間隔子相鄰模體(PAM)序列相鄰之非目標股序列。在某些實施例中,PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3',其中N為任何核苷酸,Y為C或T,且R為A或G。在一些實施例中,PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
在某些實施例中,變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
在一個態樣中,本發明提供一種組合物,其包含編碼前述態樣或其實施例之變異多肽的核酸,其中視情況核酸經密碼子優化以在細胞中表現。
在一些實施例中,細胞為真核細胞。
在一些實施例中,細胞為哺乳動物細胞或植物細胞。在某些實施例中,細胞為人類細胞。
在一些實施例中,編碼變異多肽之核酸可操作地連接於啟動子。
在某些實施例中,編碼變異多肽之核酸在載體中。
在一些實施例中,載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
在某些實施例中,組合物存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。
在一個態樣中,本發明提供一種用於在細胞中編輯基因之方法,該方法包含使該細胞與任一前述態樣或實施例之變異多肽或組合物接觸。
在一個態樣中,本發明提供一種核酸分子,其編碼任一前述態樣或實施例之變異多肽。
在某些實施例中,核酸分子之序列與選自由SEQ ID NO: 1、2或21-27組成之群的序列95%一致。在一些實施例中,核酸分子之序列包含選自由SEQ ID NO: 1、2或21-27組成之群的序列。在某些實施例中,核酸分子之序列與選自由SEQ ID NO: 22、23或25組成之群的序列95%一致。
雖然本文揭示之本發明不限於特定優點或功能性,但本發明提供一種變異多肽及/或包含變異多肽之組合物,其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變,且其中相對於親本多肽或包含親本多肽之複合物,該變異多肽或包含該變異多肽之複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在一些態樣中,增強之酶活性為增強之核酸酶活性。
在一些態樣中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合活性。
在一些態樣中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合特異性。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之穩定性。
在一些態樣中,變異二元複合物與目標核酸形成變異三元複合物,且相對於親本三元複合物,變異三元複合物展現增加之穩定性。
在一些態樣中,相對於親本多肽,變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。
在一些態樣中,相對於親本二元複合物,變異二元複合物進一步展現減少之自目標核酸之解離,及/或減少之與非目標核酸之偏離目標結合。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃(例如20℃至30℃、30℃至40℃、40℃至50℃、50℃至60℃或60℃至65℃)之溫度範圍內發生。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中發生。
在一些態樣中,當變異多肽、變異二元複合物或變異三元複合物之T
m值比親本多肽、親本二元複合物或親本三元複合物之T
m值大至少8℃時,發生增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在其他態樣中,改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變,其中與具有SEQ ID NO: 3中所示之序列之親本多肽相比,該改變包含一或多個(例如一個、兩個、三個、四個、五個或更多個)取代、插入、缺失及/或添加。
在一些態樣中,改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變,其中該改變包含表2中所列之一或多個胺基酸取代。
在一些態樣中,改變包含精胺酸、離胺酸、麩醯胺酸、天冬醯胺、組胺酸、丙胺酸或甘胺酸取代。
在一些態樣中,改變為選自P14R、E311R、D32R、I61R、G223R、N109R及/或D719R之胺基酸取代。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如,P14R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如,P14R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E311處之取代(例如,E311R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E311處之取代(例如,E311R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32處之取代(例如,D32R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D32處之取代(例如,D32R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置I61處之取代(例如,I61R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置I61處之取代(例如,I61R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置G223處之取代(例如,G223R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置G223處之取代(例如,G223R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置N109處之取代(例如,N109R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置N109處之取代(例如,N109R取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D719處之取代(例如,D719R取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D719處之取代(例如,D719R取代)。
在一些態樣中,改變為表3中所列之胺基酸取代之組合。
在一些態樣中,胺基酸取代之組合包含以下闡述之取代:a) P14R、E311R、D32R;b) P14R、E311R、G223R;c) P14R、E311R、D32R、I61R;或d) D32R、N109R、E311R、D719R。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及D32 (例如,D32R取代)處之取代的胺基酸(例如,P14R、E311R、D32R變異多肽)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及G223 (例如,G223R取代)處之取代的胺基酸(例如,P14R、E311R、G223R變異多肽)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)、D32 (例如,D32R取代)及I61 (例如,I61R取代)處之取代的胺基酸(例如,P14R、E311R、D32R及I61R變異多肽)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32R (例如,D32R取代)、N109 (例如,N109R)、E311 (例如,E311R取代)及D719 (例如,D719R取代)處之取代的胺基酸(例如,D32R、N109R、E311R及D719R變異多肽)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K208處之取代(例如,K208G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K208處之取代(例如,K208G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D302處之取代(例如,D302G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D302處之取代(例如,D302G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D590處之取代(例如,D590G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D590處之取代(例如,D590G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E154處之取代(例如,E154G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E154處之取代(例如,E154G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D567處之取代(例如,D567G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D567處之取代(例如,D567G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置L38處之取代(例如,L38G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置L38處之取代(例如,L38G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D145處之取代(例如,D145G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D145處之取代(例如,D145G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置C13處之取代(例如,C13G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置C13處之取代(例如,C13G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置T338處之取代(例如,T338G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置T338處之取代(例如,T338G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如,P14G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如,P14G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D55處之取代(例如,D55G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D55處之取代(例如,D55G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K221處之取代(例如,K221G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K221處之取代(例如,K221G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K35處之取代(例如,K35G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K35處之取代(例如,K35G取代)。
在一些態樣中,本發明提供一種多肽,其包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E736處之取代(例如,E736G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E736處之取代(例如,E736G取代)。
在一些態樣中,變異多肽包含RuvC域或分開RuvC域。
在一些態樣中,變異多肽包含一或多個催化殘基(例如天冬胺酸或麩胺酸)。在一些態樣中,一或多個催化殘基包含D328及E530。在一些態樣中,一或多個催化殘基進一步包含D684、D646或D621。
在一些態樣中,包含變異多肽之組合物或複合物進一步包含RNA引導,且該RNA引導包含正向重複序列及間隔子序列。
在一些態樣中,RNA引導包含正向重複序列及間隔子序列。
在一些態樣中,正向重複序列包含與SEQ ID NO: 4-13中之任一者具有至少95%序列一致性之核苷酸序列。
在一些態樣中,正向重複序列包含SEQ ID NO: 4-13中之任一者之核苷酸序列。
在一些態樣中,間隔子序列之長度包含15至35個核苷酸。
在一些態樣中,目標核酸包含與間隔子序列中之核苷酸序列互補之序列。
在一些態樣中,目標核酸與原間隔子相鄰模體(PAM)序列相鄰,其中該PAM序列包含闡述為5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'之核苷酸序列,其中N為任何核苷酸且R為A或G。在一些態樣中,PAM序列包含闡述為5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'之核苷酸序列。
在一些態樣中,目標核酸為單股DNA或雙股DNA。
在一些態樣中,變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
在一些態樣中,編碼變異多肽之核酸經密碼子優化以在細胞中表現。
在一些態樣中,編碼變異多肽之核酸可操作地連接於啟動子。
在一些態樣中,編碼變異多肽之核酸在載體中。
在一些態樣中,載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
在一些態樣中,組合物存在於包含奈米粒子、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。
本發明進一步提供一種細胞,其包含本文揭示之變異多肽及/或組合物。在一些態樣中,細胞為真核細胞或原核細胞。在一些態樣中,細胞為哺乳動物細胞或植物細胞。在一些態樣中,細胞為人類細胞。
本發明進一步提供一種製備本文揭示之變異多肽及/或組合物之方法。
本發明進一步提供一種使本文揭示之變異多肽與RNA引導複合之方法。
本發明進一步提供一種使本文揭示之變異二元複合物與目標核酸複合之方法。
本發明進一步提供一種遞送本文揭示之變異多肽及/或組合物之方法。
本發明進一步提供一種組合物,其包含變異多肽或包含有變異多肽及RNA引導之複合物,其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變,且其中相對於親本多肽或包含親本多肽及RNA引導之複合物,該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在一些態樣中,增強之酶活性為增強之核酸酶活性。
在一些態樣中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合活性。
在一些態樣中,相對於親本多肽,變異多肽展現增強之與RNA引導之結合特異性。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。
在一些態樣中,變異多肽與RNA引導形成變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之穩定性。
在一些態樣中,變異二元複合物與目標核酸形成變異三元複合物,且相對於親本三元複合物,變異三元複合物展現增加之穩定性。
在一些態樣中,相對於親本多肽,變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。
在一些態樣中,相對於親本二元複合物,變異二元複合物進一步展現減少之自目標核酸之解離,及/或減少之與非目標核酸之偏離目標結合。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃之溫度範圍內發生。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。
在一些態樣中,增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中發生。
在一些態樣中,當變異多肽、變異二元複合物或變異三元複合物之T
m值比親本多肽、親本二元複合物或親本三元複合物之T
m值大至少8℃時,發生增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在其他態樣中,改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變,其中與具有SEQ ID NO: 3中所示之序列之親本多肽相比,該改變包含一或多個(例如一個、兩個、三個、四個、五個或更多個)取代、插入、缺失及/或添加。
在一些態樣中,改變包含相對於具有SEQ ID NO: 3中所示之序列之親本多肽的胺基酸序列改變,其中該改變包含表2中所列之一或多個胺基酸取代。
在一些態樣中,改變包含精胺酸、離胺酸、麩醯胺酸、天冬醯胺、組胺酸、丙胺酸或甘胺酸取代。
在一些態樣中,變異多肽包含RuvC域或分開RuvC域。
在一些態樣中,變異多肽包含一或多個催化殘基(例如天冬胺酸或麩胺酸)。在一些態樣中,一或多個催化殘基包含D328及E530。在一些態樣中,一或多個催化殘基進一步包含D684、D646或D621。
在一些態樣中,RNA引導包含正向重複序列及間隔子序列。
在一些態樣中,正向重複序列包含與SEQ ID NO: 4-13中之任一者具有至少95%序列一致性之核苷酸序列。
在一些態樣中,正向重複序列包含SEQ ID NO: 4-13中之任一者之核苷酸序列。
在一些態樣中,間隔子序列之長度包含15至35個核苷酸。
在一些態樣中,目標核酸包含與間隔子序列中之核苷酸序列互補之序列。
在一些態樣中,目標核酸與PAM序列相鄰,其中該PAM序列包含闡述為5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'之核苷酸序列,其中N為任何核苷酸且R為A或G。在一些態樣中,PAM序列包含闡述為5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'之核苷酸序列。
在一些態樣中,目標核酸為單股DNA或雙股DNA。
在一些態樣中,變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
在一些態樣中,編碼變異多肽之核酸經密碼子優化以在細胞中表現。
在一些態樣中,編碼變異多肽之核酸可操作地連接於啟動子。
在一些態樣中,編碼變異多肽之核酸在載體中。
在一些態樣中,載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
在一些態樣中,組合物或複合物存在於包含奈米粒子、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。
本發明進一步提供一種細胞,其包含本文揭示之變異多肽及/或複合物。在一些態樣中,細胞為真核細胞或原核細胞。在一些態樣中,細胞為哺乳動物細胞或植物細胞。在一些態樣中,細胞為人類細胞。
本發明進一步提供一種製備本文揭示之變異多肽及/或複合物之方法。
本發明進一步提供一種使本文揭示之變異多肽與RNA引導複合之方法。
本發明進一步提供一種使本文揭示之變異二元複合物與目標核酸複合之方法。
本發明進一步提供一種遞送本文揭示之變異多肽及/或複合物之方法。
定義 將關於特定實施例及參考某些圖式描述本發明,但本發明不限於此,而僅受申請專利範圍限制。除非另外指明,否則如下文所闡述之術語一般應按其常識來理解。
除非另外定義,否則本文所使用之科學及技術術語具有一般技術者通常所瞭解之含義。在存在任何潛在歧義的情況下,本文提供之定義優先於任何字典或外部定義。除非上下文另外需要,否則單數術語應包括複數且複數術語應包括單數。除非另外說明,否則本文中使用「或」意謂「及/或」。使用術語「包括(including)」以及其他形式(諸如「包括(includes)」及「包括(included)」)不具限制性。
通常,本文所述之與細胞及組織培養、分子生物學、免疫學、微生物學、遺傳學以及蛋白質及核酸化學及雜交結合使用之命名法為此項技術中熟知及常用的。除非另外指明,否則本文所提供之方法及技術一般根據此項技術中熟知之習知方法且如本說明書通篇引用及論述之各種一般及更特定參考文獻中所描述來進行。酶促反應及純化技術根據製造商之說明書,如通常在此項技術中所實現或如本文所述來進行。本文所述之與分析化學、合成有機化學以及藥物及醫藥化學結合使用的命名法及其實驗室程序與技術為此項技術中熟知及常用之命名法及實驗室程序與技術。標準技術用於化學合成、化學分析、醫藥製備、調配及遞送以及患者治療。
下文定義選擇術語以使得本發明可更容易得到理解。
冠詞「一(a及an)」在本文中用以指一個或超過一個(亦即,至少一個)的該冠詞之文法對象。藉助於實例,「一要素」意謂一個要素或超過一個要素。
如本文所用,當提及諸如量、時距及其類似者之可量測值時,術語「約」意謂涵蓋指定值±20%或±10%、更佳±5%、更佳±1%,且更佳±0.1%之變化,因為此類變化適於進行所揭示之方法。
如本文所用,術語「複合物」係指兩種或更多種分子成組。一些實施例中,複合物包含彼此相互作用(例如結合、接觸、黏附)之多肽及核酸分子。
如本文所用,術語「二元複合物」係指兩種分子(例如多肽及核酸分子)成組。在一些實施例中,二元複合物係指多肽及靶向部分(例如RNA引導)成組。在一些實施例中,二元複合物係指核糖核蛋白(RNP)。如本文所用,術語「變異二元複合物」係指變異多肽及RNA引導成組。如本文所用,術語「親本二元複合物」係指親本多肽及RNA引導或參考多肽及RNA引導成組。
如本文所用,術語「三元複合物」係指三種分子(例如多肽及兩種核酸分子)成組。在一些實施例中,「三元複合物」係指多肽、RNA分子及DNA分子成組。在一些實施例中,三元複合物係指多肽、靶向部分(例如RNA引導)及目標核酸(例如目標DNA分子)成組。在一些實施例中,「三元複合物」係指二元複合物(例如核糖核蛋白)及第三分子(例如目標核酸)成組。
如本文所用,術語「域」係指多肽之獨特功能及/或結構單元。在一些實施例中,域可包含保守胺基酸序列。
如本文所用,術語「親本」、「親本多肽」及「親本序列」係指發生改變而產生本發明之變異多肽的原始多肽(例如參考或起始多肽)。
如本文所用,術語「原間隔子相鄰模體」或「PAM」係指與包含效應子(例如核酸酶)及RNA引導之複合物所結合之目標序列相鄰的DNA序列。在一些實施例中,PAM係酶活性所需的。「目標核酸」為雙股分子:一股包含與PAM相鄰之目標序列且稱為「PAM股」(例如非目標股或非間隔子互補股),且另一互補股稱為「非PAM股」(例如目標股或間隔子互補股)。如本文所用,術語「相鄰」包括複合物之RNA引導與緊鄰PAM之目標序列特異性結合、相互作用或締合的情況。在此類情況下,目標序列與PAM之間無核苷酸。術語「相鄰」亦包括靶向部分所結合之目標序列與PAM之間存在少數(例如1、2、3、4或5個)核苷酸的情況。
如本文所用,術語「參考組合物」、「參考分子」、「參考序列」及「參考」係指對照,諸如陰性對照或親本(例如親本序列、親本蛋白質或野生型蛋白質)。舉例而言,參考分子係指變異多肽進行比較之多肽。同樣,參考RNA引導係指經修飾之RNA引導進行比較之靶向部分。變異或經修飾之分子可基於序列(例如變異或經修飾之分子可與參考分子具有X%序列一致性或同源性)、熱穩定性或活性(例如變異或經修飾之分子可具有參考分子之活性之X%)與參考分子進行比較。例如,變異或經修飾之分子可表徵為具有參考多肽之活性之不超過10%,或可表徵為比參考多肽之活性大至少10%。參考多肽之實例包括天然存在之未修飾之多肽,例如來自古菌或細菌物種之天然存在之多肽。在某些實施例中,參考多肽為與進行比較之變異多肽具有最接近序列一致性或同源性的天然存在之多肽。在某些實施例中,參考多肽為發生突變而得到變異多肽的具有天然存在或已知序列之親本分子。
如本文所用,術語「RNA引導」或「RNA引導序列」係指有助於本文所述之多肽靶向目標核酸之任何RNA分子。例如,RNA引導可為識別(例如結合於)目標核酸之分子。RNA引導可經設計以與目標核酸序列之目標股(例如非PAM股)互補。RNA引導包含DNA靶向序列及正向重複(DR)序列。術語CRISPR RNA (crRNA)、前crRNA、成熟crRNA及gRNA在本文中亦用以指RNA引導。如本文所用,術語「前crRNA」係指包含DR-間隔子-DR序列之未加工RNA分子。如本文所用,術語「成熟crRNA」係指前crRNA之經加工形式;成熟crRNA可包含DR-間隔子序列,其中該DR為前crRNA之DR的截短形式及/或間隔子為前crRNA之間隔子之截短形式。如本文所用,術語「實質上一致」係指與參考序列具有一定程度一致性之序列、聚核苷酸或多肽。
如本文所用,術語「實質上一致」係指與參考序列具有一定程度一致性之序列、聚核苷酸或多肽。
如本文所用,術語「目標核酸」、「目標序列」及「目標受質」係指RNA引導特異性結合之核酸。在一些實施例中,RNA引導之DNA靶向序列結合於目標核酸。
如本文所用,術語「變異多肽」、「變異效應多肽」及「變異CRISPR核酸酶多肽」係指與親本多肽相比在一或多個殘基位置處包含改變,例如但不限於取代、插入、缺失、添加及/或融合的多肽。如本文所用,術語「變異多肽」、「變異效應多肽」及「變異CRISPR核酸酶多肽」係指與SEQ ID NO: 3之多肽相比包含改變的多肽。
相關申請案本申請案主張2021年3月9日申請之美國臨時申請案63/158741、2021年12月28日申請之美國臨時申請案63/294224之優先權,各臨時申請案之全部內容以引用的方式併入本文中。
序列表本申請案含有序列表,其已呈ASCII格式以電子方式提交且以全文引用的方式併入本文中。該ASCII複本創建於2022年3月7日,名為A2186-7046WO_SL.txt且大小為38,750位元組。
在一些態樣中,本發明提供SEQ ID NO: 3之效應子(例如CRISPR核酸酶)之新穎變異體、包含該等變異體之組合物及其製備及使用方法。在其他態樣中,本發明進一步提供包含SEQ ID NO: 3之效應子(例如CRISPR核酸酶)之變異體的複合物及組合物、其製備方法及使用。在一些態樣中,本文中描述包含具有一或多種特性之複合物的組合物。在一些態樣中,描述一種遞送包含複合物之組合物之方法。
組合物在一些實施例中,本發明之組合物包括相對於親本多肽展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性的變異多肽。在一些實施例中,本發明之組合物包括一種包含變異多肽之複合物,其相對於親本複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
在一些實施例中,本發明之組合物包括變異多肽及RNA引導。在一些實施例中,本發明之組合物包括一種包含變異多肽及RNA引導之變異二元複合物。
在組合物之一些態樣中,與親本多肽相比,變異多肽具有增加的與RNA引導之複合物形成(例如增加之二元複合物形成)。在組合物之一些態樣中,與親本多肽及RNA引導相比,變異多肽及RNA引導具有更大結合親和力。在組合物之一些態樣中,與親本多肽及RNA引導相比,變異多肽及RNA引導具有更強之蛋白質-RNA相互作用(例如離子相互作用)。在組合物之一些態樣中,變異二元複合物比親本二元複合物更穩定。
在一些實施例中,本發明之組合物包括變異多肽、RNA引導及目標核酸。在一些實施例中,本發明之組合物包括一種包含變異多肽、RNA引導及目標核酸之變異三元複合物。
在組合物之一些態樣中,與親本多肽相比,變異多肽具有增加之與RNA引導及目標核酸之複合物形成(例如增加之三元複合物形成)。在組合物之一些態樣中,與親本多肽及RNA引導(例如親本二元複合物)相比,變異多肽及RNA引導(例如變異二元複合物)對目標核酸具有更大結合親和力。在組合物之一些態樣中,變異三元複合物比親本三元複合物更穩定。
在一些實施例中,本發明之組合物包括本文所述之變異多肽。
變異多肽在一個實施例中,變異多肽為經分離或經純化之多肽。
在一些實施例中,本發明之變異多肽(例如,變異CRISPR核酸酶多肽)為親本多肽(例如,親本CRISPR核酸酶)之變異體,其中該親本由包含諸如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27之核苷酸序列的聚核苷酸編碼或包含諸如SEQ ID NO: 3之胺基酸序列。參見表1。
表1. 對應於SEQ ID NO: 1-3及21-27之序列.
SEQ ID NO: 1 ATGATCAAGTCTATTCAGCTGAAGGTCAAGGGGGAGTGTCCGATCACGAAGGATGTAATCAACGAATACAAAGAATACTATAACAATTGCAGTGATTGGATTAAAAACAATCTGACGTCCATTACCATCGGGGAGATGGCAAAATTTCTGCAATCGTTGAGCGATAAAGAAGTGGCCTATATCTCAATGGGCCTGTCCGATGAGTGGAAAGACAAACCGTTATATCATCTGTTTACCAAAAAATATCACACCAAAAATGCGGATAACTTATTATACTACTACATTAAAGAAAAAAATCTGGACGGCTACAAAGGCAATACGCTTAATATCTCCAATACATCTTTCCGCCAGTTCGGTTATTTCAAACTCGTGGTGAGCAACTACCGCACTAAAATCCGTACGCTGAATTGTAAAATCAAGCGTAAGAAAATCGATGCCGATTCCACGTCTGAGGATATCGAAATGCAGGTGATGTACGAAATTATTAAATACAGTTTAAATAAAAAGTCTGATTGGGATAACTTCATTAGCTATATCGAAAACGTTGAAAATCCTAATATTGACAACATCAACCGCTACAAACTGCTGCGCGAATGCTTTTGCGAAAACGAAAACATGATTAAGAACAAACTTGAATTGCTGTCTGTGGAACAATTGAAAAAATTTGGCGGTTGCATCATGAAACCTCACATTAATAGCATGACCATTAACATTCAAGATTTTAAAATTGAGGAAAAAGAAAACTCTCTGGGGTTCATCCTCCACCTCCCACTGAACAAAAAACAGTATCAAATTGAACTCCTGGGCAATCGTCAGATTAAAAAAGGCACCAAAGAAATTCACGAAACGTTAGTTGACATTACTAACACCCATGGCGAAAACATTGTGTTTACTATTAAAAATGATAATCTGTATATCGTGTTCTCTTATGAGTCCGAATTTGAAAAAGAAGAAGTTAACTTCGCTAAAACGGTTGGCCTGGACGTAAACTTCAAACATGCCTTCTTTGTGACCTCTGAGAAAGATAACTGTCATCTCGACGGTTATATTAATCTCTACAAATACTTATTGGAGCACGACGAGTTTACTAACCTTCTCACCGAAGATGAACGTAAAGATTATGAGGAGCTGAGTAAAGTCGTTACTTTCTGCCCGTTTGAAAATCAGTTACTGTTTGCGCGTTACAACAAGATGAGCAAATTCTGCAAGAAAGAACAGGTCCTGAGCAAACTTCTCTATGCGCTGCAGAAAAAACTCAAAGACGAGAACCGCACGAAAGAATATATTTATGTCTCGTGCGTGAACAAATTACGTGCCAAATATGTGTCATATTTTATTCTGAAAGAAAAGTACTACGAGAAGCAGAAAGAATATGACATCGAAATGGGCTTTGTGGACGACTCAACGGAAAGCAAAGAATCAATGGATAAACGCCGTACTGAATATCCGTTTCGCAACACGCCGGTAGCCAACGAACTGTTGTCCAAACTGAATAACGTACAGCAGGACATCAACGGGTGCCTGAAGAACATCATCAACTACATTTATAAAATTTTCGAGCAGAACGGTTATAAAGTTGTCGCCCTCGAAAACCTGGAAAATTCTAATTTTGAAAAAAAACAGGTGTTGCCGACGATTAAAAGTCTGCTGAAATATCACAAACTGGAGAACCAGAACGTGAATGATATCAAGGCCTCTGACAAAGTTAAAGAATATATTGAAAACGGTTATTATGAACTCATGACCAACGAGAATAACGAAATCGTTGATGCAAAATATACAGAAAAGGGCGCAATGAAGGTGAAGAACGCCAATTTTTTTAACCTCATGATGAAAAGTTTGCATTTTGCCAGTGTGAAAGATGAGTTTGTGCTGCTGTCCAATAATGGCAAGACGCAGATTGCATTAGTGCCATCCGAGTTTACATCTCAGATGGACAGCACCGATCACTGTCTGTACATGAAGAAGAACGACAAAGGTAAACTGGTGAAAGCGGATAAAAAGGAAGTTCGTACAAAACAGGAACGTCACATCAACGGCCTCAACGCCGATTTCAACGCAGCGAATAATATTAAATATATCGTGGAAAATGAAGTGTGGCGTGGTATTTTTTGCACTCGCCCGAAGAAAACAGAATATAACGTACCCAGTCTGGATACCACGAAAAAAGGTCCGTCTGCGATTCTCAACATGCTGAAGAAAATTGAAGCCATCAAGGTCCTGGAAACGGAAAAA |
SEQ ID NO: 2 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGTTCTGATTGGATCAAGAACAATCTGACCAGCATCACAATCGGCGAGATGGCCAAGTTTCTGCAGAGCCTGTCCGACAAGGAGGTGGCCTACATCTCTATGGGCCTGAGCGACGAGTGGAAGGATAAGCCTCTGTATCACCTGTTCACCAAGAAGTACCACACAAAGAATGCCGACAACCTGCTGTACTATTACATCAAGGAGAAGAACCTGGATGGCTACAAGGGCAATACCCTGAACATCTCCAATACATCTTTCAGGCAGTTTGGCTATTTCAAGCTGGTGGTGTCCAATTACAGGACCAAGATCCGCACACTGAACTGCAAGATCAAGCGCAAGAAGATCGACGCCGATTCTACCAGCGAGGACATCGAGATGCAGGTCATGTATGAGATCATCAAGTACTCCCTGAACAAGAAGTCTGATTGGGATAATTTCATCTCTTATATCGAGAACGTGGAGAACCCCAATATCGATAACATCAATCGGTACAAGCTGCTGAGAGAGTGCTTTTGTGAGAACGAGAATATGATCAAGAACAAGCTGGAGCTGCTGAGCGTGGAGCAGCTGAAGAAGTTCGGCGGCTGTATCATGAAGCCTCACATCAACAGCATGACCATCAATATCCAGGACTTTAAGATCGAGGAGAAGGAGAATTCCCTGGGCTTCATCCTGCACCTGCCACTGAACAAGAAGCAGTACCAGATCGAGCTGCTGGGCAATCGGCAGATCAAGAAGGGCACCAAGGAGATCCACGAGACACTGGTGGACATCACCAACACACACGGCGAGAACATCGTGTTTACAATCAAGAACGATAATCTGTACATCGTGTTTAGCTACGAGTCCGAGTTCGAGAAGGAGGAAGTGAATTTTGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTTGTGACATCCGAGAAGGACAATTGCCACCTGGATGGCTATATCAACCTGTATAAGTACCTGCTGGAGCACGATGAGTTCACCAACCTGCTGACAGAGGACGAGCGGAAGGATTACGAGGAGCTGTCTAAGGTGGTGACCTTTTGCCCTTTCGAGAATCAGCTGCTGTTTGCCAGATATAACAAGATGAGCAAGTTCTGTAAGAAGGAGCAGGTGCTGTCCAAGCTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGGACAAAGGAGTATATCTACGTGTCTTGCGTGAATAAGCTGCGCGCCAAGTATGTGAGCTACTTTATCCTGAAGGAGAAGTATTACGAGAAGCAGAAGGAGTATGACATCGAGATGGGCTTCGTGGACGATTCTACCGAGAGCAAGGAGTCCATGGATAAGCGGAGAACCGAGTACCCCTTTAGGAACACACCTGTGGCCAATGAGCTGCTGAGCAAGCTGAACAATGTGCAGCAGGATATCAACGGCTGTCTGAAGAACATCATCAATTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTGGCCCTGGAGAACCTGGAGAACTCCAATTTCGAGAAGAAGCAGGTGCTGCCAACAATCAAGTCTCTGCTGAAGTATCACAAGCTGGAGAACCAGAATGTGAACGACATCAAGGCCAGCGATAAGGTGAAGGAGTACATCGAGAATGGCTATTACGAGCTGATGACCAACGAGAACAATGAGATCGTGGACGCCAAGTATACAGAGAAGGGCGCCATGAAGGTGAAGAATGCCAACTTCTTTAACCTGATGATGAAGAGCCTGCACTTTGCCTCCGTGAAGGATGAGTTCGTGCTGCTGTCCAACAATGGCAAGACCCAGATCGCCCTGGTGCCATCCGAGTTCACCTCTCAGATGGACAGCACAGATCACTGCCTGTACATGAAGAAGAATGACAAGGGCAAGCTGGTGAAGGCCGATAAGAAGGAGGTGAGGACAAAGCAGGAGCGCCACATCAACGGCCTGAATGCCGACTTTAACGCCGCCAACAATATCAAGTATATCGTGGAGAATGAAGTGTGGCGGGGCATCTTCTGTACCAGACCAAAGAAGACAGAGTACAACGTGCCCTCCCTGGATACCACAAAGAAGGGCCCCTCTGCCATCCTGAATATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG |
SEQ ID NO: 3 MIKSIQLKVKGECPITKDVINEYKEYYNNCSDWIKNNLTSITIGEMAKFLQSLSDKEVAYISMGLSDEWKDKPLYHLFTKKYHTKNADNLLYYYIKEKNLDGYKGNTLNISNTSFRQFGYFKLVVSNYRTKIRTLNCKIKRKKIDADSTSEDIEMQVMYEIIKYSLNKKSDWDNFISYIENVENPNIDNINRYKLLRECFCENENMIKNKLELLSVEQLKKFGGCIMKPHINSMTINIQDFKIEEKENSLGFILHLPLNKKQYQIELLGNRQIKKGTKEIHETLVDITNTHGENIVFTIKNDNLYIVFSYESEFEKEEVNFAKTVGLDVNFKHAFFVTSEKDNCHLDGYINLYKYLLEHDEFTNLLTEDERKDYEELSKVVTFCPFENQLLFARYNKMSKFCKKEQVLSKLLYALQKKLKDENRTKEYIYVSCVNKLRAKYVSYFILKEKYYEKQKEYDIEMGFVDDSTESKESMDKRRTEYPFRNTPVANELLSKLNNVQQDINGCLKNIINYIYKIFEQNGYKVVALENLENSNFEKKQVLPTIKSLLKYHKLENQNVNDIKASDKVKEYIENGYYELMTNENNEIVDAKYTEKGAMKVKNANFFNLMMKSLHFASVKDEFVLLSNNGKTQIALVPSEFTSQMDSTDHCLYMKKNDKGKLVKADKKEVRTKQERHINGLNADFNAANNIKYIVENEVWRGIFCTRPKKTEYNVPSLDTTKKGPSAILNMLKKIEAIKVLETEK |
SEQ ID NO: 21 ATGATTAAATCCATCCAGCTTAAAGTGAAAGGCGAATGCCCCATCACCAAAGATGTTATTAACGAGTACAAGGAATACTATAATAACTGCAGCGATTGGATAAAAAACAATCTTACCTCGATCACTATTGGCGAGATGGCCAAGTTCCTGCAGAGCCTGTCTGATAAGGAGGTTGCTTACATTTCCATGGGCCTGAGCGACGAGTGGAAAGACAAGCCCTTGTACCACCTGTTCACTAAGAAATACCACACTAAGAATGCTGACAATCTGCTCTACTACTACATCAAGGAGAAAAACTTGGATGGCTACAAGGGGAACACGCTTAACATTTCTAACACCTCATTTCGTCAGTTCGGGTATTTCAAGCTCGTGGTGTCCAACTATCGCACTAAGATTCGGACACTCAACTGCAAGATTAAACGAAAGAAGATCGACGCAGATTCTACGAGCGAGGATATTGAAATGCAGGTCATGTATGAAATCATCAAGTACTCTCTGAATAAGAAGTCTGACTGGGACAATTTTATCAGCTACATCGAAAACGTAGAGAACCCTAACATAGACAATATCAACAGGTACAAACTGCTTAGGGAATGCTTCTGTGAAAACGAGAATATGATAAAAAACAAGCTGGAGCTGCTGAGCGTGGAGCAATTAAAGAAGTTTGGAGGGTGTATCATGAAACCCCACATTAACTCGATGACAATTAATATTCAAGACTTCAAGATAGAGGAGAAAGAAAACAGCTTGGGCTTTATTCTCCATCTCCCTCTGAATAAAAAACAGTACCAGATCGAGCTATTGGGAAATAGACAGATTAAGAAAGGGACCAAGGAAATTCACGAAACTCTCGTCGATATCACAAACACCCATGGAGAGAACATCGTGTTCACAATCAAGAACGATAATCTGTACATAGTGTTTAGTTATGAGAGCGAGTTCGAGAAGGAAGAGGTCAACTTTGCCAAGACTGTTGGGCTTGACGTCAATTTCAAACACGCGTTCTTCGTGACAAGCGAAAAGGACAACTGCCATCTCGATGGCTACATTAACCTATATAAGTATTTGCTCGAACACGACGAGTTTACAAACCTGCTGACAGAAGATGAGAGAAAGGACTACGAAGAACTCAGTAAGGTCGTTACGTTCTGTCCATTTGAAAATCAGCTGCTATTCGCCCGGTACAATAAAATGTCCAAATTCTGTAAGAAGGAACAGGTATTGTCTAAACTGCTGTATGCCCTGCAGAAAAAGTTGAAAGATGAGAATCGGACCAAAGAGTATATCTATGTCTCATGCGTGAACAAGCTAAGAGCTAAGTATGTTTCCTATTTCATACTGAAGGAGAAGTACTATGAGAAGCAAAAGGAGTACGACATTGAGATGGGCTTCGTCGATGACTCAACCGAATCTAAAGAATCCATGGACAAAAGGCGCACAGAGTATCCATTTAGAAATACACCGGTGGCTAACGAACTCCTGAGTAAACTCAACAATGTTCAACAAGATATCAACGGTTGTCTGAAGAATATAATTAATTATATCTATAAGATTTTTGAACAGAATGGCTACAAGGTGGTCGCACTGGAAAACTTAGAGAATTCCAACTTTGAGAAAAAGCAGGTGCTTCCTACAATCAAATCACTTCTGAAGTACCACAAACTTGAGAATCAGAACGTAAATGATATCAAAGCCAGTGATAAAGTCAAAGAATACATCGAGAATGGTTATTATGAACTGATGACTAATGAAAATAATGAAATAGTGGACGCAAAATATACGGAAAAGGGTGCCATGAAGGTAAAGAACGCAAACTTTTTTAATTTGATGATGAAGTCACTGCACTTTGCTTCTGTGAAGGATGAGTTTGTCCTGCTGAGCAACAACGGAAAGACACAGATTGCGCTAGTGCCTTCAGAGTTCACTAGTCAGATGGACAGTACCGACCATTGCCTCTACATGAAAAAAAATGACAAAGGGAAACTCGTGAAGGCTGACAAGAAAGAGGTGCGGACCAAGCAAGAGCGCCATATCAATGGATTAAACGCCGATTTTAACGCGGCAAATAACATCAAATACATCGTTGAAAATGAGGTGTGGAGGGGTATCTTCTGTACCCGACCAAAGAAGACTGAGTACAACGTACCATCCTTAGACACCACCAAAAAAGGACCCTCCGCCATTCTGAATATGTTAAAGAAAATCGAGGCCATAAAAGTGTTGGAGACCGAGAAG |
SEQ ID NO: 22 ATGATCAAGAGCATTCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGACTGGATTAAAAACAATCTCACAAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAAGAGGTGGCCTACATCAGCATGGGCCTGAGCGACGAGTGGAAGGACAAGCCCCTGTACCACCTGTTCACCAAGAAGTACCACACCAAGAACGCCGACAACCTGCTGTACTACTACATCAAGGAGAAGAATCTGGATGGCTACAAGGGCAATACCCTGAACATCAGCAACACCAGCTTCAGACAGTTCGGCTACTTCAAGCTGGTGGTGAGCAACTACAGAACCAAGATCAGAACCCTGAACTGCAAGATCAAGAGAAAGAAGATCGACGCCGACAGCACAAGCGAGGACATAGAGATGCAAGTTATGTACGAGATCATCAAGTACAGCCTTAATAAAAAGAGCGACTGGGACAACTTCATCAGCTACATAGAAAACGTGGAGAACCCCAACATCGACAACATCAACAGATACAAGCTGCTGAGAGAGTGCTTCTGCGAGAACGAGAACATGATCAAAAACAAACTCGAACTGCTGAGTGTAGAACAGCTGAAGAAGTTCGGCGGCTGCATCATGAAGCCCCACATCAACAGCATGACCATCAACATCCAAGACTTCAAGATCGAGGAGAAGGAGAACAGCCTGGGCTTCATCCTGCACCTGCCCTTAAACAAGAAGCAGTATCAGATCGAGCTGCTGGGCAACAGACAGATCAAGAAGGGCACCAAGGAGATCCACGAGACCCTGGTGGACATCACCAACACCCACGGCGAGAATATCGTTTTCACTATCAAGAACGACAACCTGTACATCGTGTTTAGCTATGAGAGCGAGTTCGAGAAGGAAGAGGTGAACTTCGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACAAGCGAGAAGGACAACTGCCACCTGGACGGCTACATCAATCTGTACAAGTACCTGCTGGAGCACGACGAGTTCACCAACCTGCTGACCGAGGACGAGAGAAAGGACTACGAGGAGCTGAGCAAGGTGGTGACCTTCTGCCCCTTCGAGAATCAGCTGCTGTTCGCTAGATACAACAAGATGAGCAAGTTCTGCAAGAAGGAGCAAGTGCTGAGCAAACTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGAACCAAGGAGTATATCTACGTGAGCTGCGTGAACAAGCTGAGAGCCAAGTACGTGAGCTACTTCATCCTGAAGGAGAAGTACTACGAGAAGCAGAAGGAGTACGACATCGAGATGGGTTTTGTGGACGACAGCACCGAGAGCAAGGAGAGCATGGACAAGAGAAGAACCGAGTACCCCTTCAGAAACACCCCCGTGGCCAACGAATTACTGTCTAAACTGAATAACGTGCAGCAAGACATCAACGGCTGCCTGAAGAACATAATCAACTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTAGCCCTGGAGAACCTGGAGAACAGCAACTTCGAGAAGAAGCAAGTGCTGCCCACCATCAAGAGCCTGCTGAAGTACCACAAGCTGGAGAATCAGAACGTGAACGACATCAAGGCTAGCGACAAGGTGAAGGAGTACATCGAGAACGGATACTACGAGCTGATGACCAACGAGAACAACGAGATCGTGGACGCCAAGTACACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTCAACCTGATGATGAAGAGCCTGCACTTCGCTAGCGTGAAGGACGAGTTCGTGCTGCTGTCGAACAACGGCAAGACACAGATCGCCCTGGTGCCTAGCGAGTTCACATCTCAGATGGACAGCACCGACCACTGCCTGTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAAGAGGTGAGAACCAAGCAAGAGAGACACATCAACGGCCTGAACGCCGACTTCAACGCCGCCAACAACATCAAGTACATCGTGGAGAACGAGGTGTGGAGAGGCATCTTCTGCACAAGACCCAAGAAGACCGAGTACAACGTGCCTAGCCTGGACACCACCAAGAAGGGCCCTAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG |
SEQ ID NO: 23 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGCGAGTGCCCCATCACCAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGACTGGATCAAGAACAACCTGACCAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAGGAGGTGGCCTACATCAGCATGGGCCTGAGCGACGAGTGGAAGGACAAGCCCCTGTACCACCTGTTCACCAAGAAGTACCACACCAAGAACGCCGACAACCTGCTGTACTACTACATCAAGGAGAAGAACCTGGACGGCTACAAGGGCAACACCCTGAACATCAGCAACACCAGCTTCCGGCAGTTCGGCTACTTCAAGCTGGTGGTGAGCAACTACCGGACCAAGATCCGGACCCTGAACTGCAAGATCAAGCGGAAGAAGATCGACGCCGACAGCACCAGCGAGGACATCGAGATGCAGGTGATGTACGAGATCATCAAGTACAGCCTGAACAAGAAGAGCGACTGGGACAACTTCATCAGCTACATCGAGAACGTGGAGAACCCCAACATCGACAACATCAACCGGTACAAGCTGCTGCGGGAGTGCTTCTGCGAGAACGAGAACATGATCAAGAACAAGCTGGAGCTGCTGAGCGTGGAGCAGCTGAAGAAGTTCGGCGGCTGCATCATGAAGCCCCACATCAACAGCATGACCATCAACATCCAGGACTTCAAGATCGAGGAGAAGGAGAACAGCCTGGGCTTCATCCTGCACCTGCCCCTGAACAAGAAGCAGTACCAGATCGAGCTGCTGGGCAACCGGCAGATCAAGAAGGGCACCAAGGAGATCCACGAGACCCTGGTGGACATCACCAACACCCACGGCGAGAACATCGTGTTCACCATCAAGAACGACAACCTGTACATCGTGTTCAGCTACGAGAGCGAGTTCGAGAAGGAGGAGGTGAACTTCGCCAAGACCGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACCAGCGAGAAGGACAACTGCCACCTGGACGGCTACATCAACCTGTACAAGTACCTGCTGGAGCACGACGAGTTCACCAACCTGCTGACCGAGGACGAGCGGAAGGACTACGAGGAGCTGAGCAAGGTGGTGACCTTCTGCCCCTTCGAGAACCAGCTGCTGTTCGCCCGGTACAACAAGATGAGCAAGTTCTGCAAGAAGGAGCAGGTGCTGAGCAAGCTGCTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACCGGACCAAGGAGTACATCTACGTGAGCTGCGTGAACAAGCTGCGGGCCAAGTACGTGAGCTACTTCATCCTGAAGGAGAAGTACTACGAGAAGCAGAAGGAGTACGACATCGAGATGGGCTTCGTGGACGACAGCACCGAGAGCAAGGAGAGCATGGACAAGCGGCGGACCGAGTACCCCTTCCGGAACACCCCCGTGGCCAACGAGCTGCTGAGCAAGCTGAACAACGTGCAGCAGGACATCAACGGCTGCCTGAAGAACATCATCAACTACATCTACAAGATCTTCGAGCAGAACGGCTACAAGGTGGTGGCCCTGGAGAACCTGGAGAACAGCAACTTCGAGAAGAAGCAGGTGCTGCCCACCATCAAGAGCCTGCTGAAGTACCACAAGCTGGAGAACCAGAACGTGAACGACATCAAGGCCAGCGACAAGGTGAAGGAGTACATCGAGAACGGCTACTACGAGCTGATGACCAACGAGAACAACGAGATCGTGGACGCCAAGTACACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTCAACCTGATGATGAAGAGCCTGCACTTCGCCAGCGTGAAGGACGAGTTCGTGCTGCTGAGCAACAACGGCAAGACCCAGATCGCCCTGGTGCCCAGCGAGTTCACCAGCCAGATGGACAGCACCGACCACTGCCTGTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAGGAGGTGCGGACCAAGCAGGAGCGGCACATCAACGGCCTGAACGCCGACTTCAACGCCGCCAACAACATCAAGTACATCGTGGAGAACGAGGTGTGGCGGGGCATCTTCTGCACCCGGCCCAAGAAGACCGAGTACAACGTGCCCAGCCTGGACACCACCAAGAAGGGCCCCAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTGCTGGAGACCGAGAAG |
SEQ ID NO: 24 ATGATTAAAAGTATACAGCTTAAGGTCAAGGGCGAGTGCCCGATTACCAAAGATGTAATTAACGAGTACAAGGAGTATTACAATAACTGTTCTGACTGGATCAAGAACAATCTGACTTCAATTACGATCGGTGAAATGGCCAAATTTCTCCAGTCCTTGAGTGATAAGGAGGTCGCATATATATCCATGGGACTCAGTGACGAGTGGAAGGACAAACCCCTGTACCATCTTTTTACTAAAAAATACCATACGAAAAACGCAGACAACCTGCTGTACTACTATATAAAAGAAAAAAACCTGGACGGTTACAAGGGCAACACCCTCAATATTAGCAACACTAGTTTCCGACAATTCGGGTACTTCAAGCTGGTCGTGAGCAACTATCGGACCAAAATCAGGACTTTGAATTGTAAGATAAAGAGAAAGAAGATAGACGCAGATTCTACTAGTGAGGATATCGAGATGCAGGTAATGTACGAGATCATTAAGTATTCACTGAACAAGAAGAGCGATTGGGATAACTTCATATCATACATCGAAAACGTTGAAAATCCAAACATCGACAATATTAATAGATACAAACTGTTGAGAGAATGCTTCTGCGAAAACGAAAATATGATAAAAAACAAACTCGAATTGTTGTCAGTTGAACAGCTGAAGAAATTCGGAGGGTGCATAATGAAGCCTCACATAAACTCAATGACAATAAACATCCAAGACTTCAAGATAGAAGAGAAGGAGAACAGTTTGGGTTTTATTCTTCACCTGCCTTTGAACAAGAAGCAATACCAAATCGAGCTGCTCGGAAATAGGCAGATAAAAAAGGGGACAAAAGAAATACACGAAACCCTTGTTGACATTACGAACACACACGGGGAAAATATCGTGTTCACAATTAAAAATGACAACCTTTACATTGTATTTTCTTATGAATCAGAGTTCGAAAAGGAAGAAGTGAACTTTGCCAAGACCGTTGGTTTGGACGTCAACTTTAAACACGCCTTCTTCGTTACATCAGAAAAGGATAACTGTCATCTTGATGGATACATAAACCTCTACAAGTATCTTCTTGAACACGACGAATTCACAAACCTGCTTACTGAAGACGAGCGAAAGGATTACGAGGAGTTGTCAAAGGTAGTCACATTCTGTCCATTCGAAAATCAGCTGTTGTTTGCCAGGTACAATAAGATGTCTAAATTCTGTAAAAAAGAACAAGTCCTCAGCAAACTGCTGTATGCACTGCAAAAGAAACTTAAGGACGAAAATAGGACTAAGGAGTATATATACGTTTCATGCGTTAATAAACTCCGGGCGAAATATGTGAGTTATTTTATTCTGAAGGAGAAGTATTATGAGAAGCAGAAAGAGTACGACATAGAAATGGGATTTGTGGATGACAGTACGGAGAGCAAAGAAAGCATGGACAAAAGAAGGACCGAATATCCATTTCGAAATACTCCAGTCGCGAATGAGCTGCTGAGCAAACTTAACAATGTCCAGCAGGACATTAACGGTTGCCTGAAGAACATAATCAACTACATATATAAGATATTTGAGCAAAACGGATACAAAGTGGTTGCACTTGAAAACCTCGAGAATTCAAATTTCGAAAAGAAGCAAGTTTTGCCCACGATTAAAAGTCTCTTGAAATACCATAAGCTCGAAAATCAGAATGTGAACGATATCAAGGCCTCAGATAAGGTCAAGGAGTACATCGAAAATGGATATTACGAGCTGATGACGAACGAGAATAACGAAATCGTCGATGCGAAGTACACAGAAAAGGGGGCTATGAAGGTGAAAAACGCCAATTTTTTTAATTTGATGATGAAGTCCTTGCATTTCGCCTCAGTCAAAGATGAGTTTGTTCTCCTGAGTAATAATGGGAAAACACAGATAGCCTTGGTTCCTTCAGAGTTCACGTCTCAGATGGACTCAACTGATCATTGTCTTTATATGAAGAAAAATGATAAAGGGAAACTGGTCAAGGCCGATAAGAAAGAGGTGCGCACGAAACAAGAAAGACACATCAACGGCCTCAACGCCGATTTTAACGCAGCTAACAATATTAAATATATCGTAGAGAATGAGGTCTGGAGGGGCATTTTTTGCACCCGACCCAAGAAGACTGAATACAATGTCCCTAGTCTCGATACGACCAAAAAGGGGCCATCAGCTATACTGAATATGTTGAAAAAGATTGAGGCGATTAAAGTCCTGGAAACCGAGAAA |
SEQ ID NO: 25 ATGATCAAGAGCATCCAGCTGAAGGTGAAGGGAGAATGTCCTATCACAAAGGACGTGATCAACGAGTACAAGGAGTACTACAACAACTGCAGCGATTGGATCAAGAACAACCTGACCAGCATCACCATCGGCGAGATGGCCAAGTTCCTGCAGTCTCTGTCCGATAAGGAAGTCGCCTACATCAGCATGGGCTTGAGCGACGAATGGAAGGACAAACCCCTGTACCATCTGTTCACTAAGAAGTACCACACCAAGAACGCCGATAACCTGCTGTACTACTACATCAAGGAAAAGAACCTGGACGGCTACAAGGGCAATACCCTGAACATCAGTAACACCAGCTTCCGGCAGTTTGGCTATTTTAAACTGGTGGTCAGCAACTACAGAACCAAGATCAGAACACTGAACTGCAAGATCAAGAGGAAGAAAATCGACGCCGACTCCACCAGCGAAGATATAGAGATGCAGGTGATGTACGAGATCATTAAGTACTCCCTGAATAAGAAGTCTGACTGGGACAACTTCATCAGCTACATCGAGAACGTGGAAAACCCCAACATTGACAATATCAACAGATACAAGCTGCTGCGGGAATGCTTCTGCGAGAATGAAAACATGATCAAGAACAAGCTGGAGCTTCTGAGCGTGGAGCAGCTGAAGAAATTCGGCGGATGTATCATGAAGCCACACATCAATAGCATGACCATCAACATCCAGGACTTCAAAATTGAAGAAAAGGAGAATAGCCTAGGCTTCATCCTGCACCTGCCTCTGAACAAGAAACAGTACCAGATCGAGCTGCTGGGCAACCGGCAAATCAAGAAGGGCACCAAGGAGATCCACGAGACACTGGTCGACATCACAAACACACACGGCGAAAACATCGTGTTCACCATCAAGAACGACAACCTGTACATCGTGTTCAGCTACGAGTCTGAATTCGAGAAGGAAGAGGTCAACTTCGCTAAGACAGTGGGCCTGGACGTGAACTTCAAGCACGCCTTCTTCGTGACCAGCGAGAAAGACAACTGTCACCTGGACGGGTACATCAACCTGTACAAGTACCTGCTGGAACACGACGAGTTCACCAACCTCCTGACCGAAGATGAACGGAAGGATTACGAGGAGCTGTCTAAGGTGGTGACATTCTGCCCTTTCGAGAACCAGCTGCTCTTCGCCAGATATAACAAGATGAGCAAGTTTTGTAAAAAGGAGCAGGTGCTCAGCAAGCTACTGTACGCCCTGCAGAAGAAGCTGAAGGACGAGAACAGAACCAAGGAATACATCTACGTGAGCTGCGTGAACAAGCTGAGAGCCAAGTACGTGTCCTATTTCATCCTGAAGGAAAAATACTACGAGAAACAGAAAGAGTACGACATCGAGATGGGATTTGTGGACGACAGCACCGAAAGCAAGGAATCTATGGACAAGCGCAGAACCGAGTATCCATTTAGAAACACCCCTGTGGCCAATGAGCTGCTGTCCAAACTGAACAACGTGCAGCAGGATATCAATGGCTGCCTGAAAAACATCATCAACTACATTTACAAGATCTTTGAGCAAAACGGCTACAAAGTGGTGGCCCTGGAGAACCTGGAAAACTCCAACTTCGAGAAGAAGCAAGTGCTGCCCACAATCAAGAGCCTGCTGAAGTACCATAAGCTGGAAAATCAGAATGTGAACGACATAAAGGCCTCTGATAAGGTGAAGGAATACATCGAAAATGGCTATTACGAGCTGATGACCAACGAAAATAACGAGATTGTGGACGCTAAATACACCGAGAAGGGCGCTATGAAAGTGAAAAACGCTAACTTTTTTAACCTGATGATGAAGAGCCTGCACTTCGCCAGCGTGAAGGACGAGTTCGTGCTGCTGAGCAACAACGGCAAGACACAGATCGCCCTGGTGCCCAGCGAGTTCACCAGTCAGATGGATTCTACAGATCACTGCCTGTACATGAAAAAGAATGATAAGGGAAAGTTAGTGAAAGCCGATAAGAAGGAGGTGCGGACCAAACAGGAGAGACACATCAACGGCCTGAACGCTGACTTCAACGCCGCCAACAACATCAAATACATCGTTGAGAATGAGGTGTGGCGGGGCATCTTCTGCACCAGACCTAAGAAAACAGAGTATAATGTGCCTAGCCTGGACACCACCAAGAAGGGTCCTAGCGCCATCCTGAACATGCTGAAGAAGATCGAGGCCATCAAGGTTCTGGAAACCGAGAAG |
SEQ ID NO: 26 ATGATCAAATCAATTCAGCTTAAGGTGAAGGGCGAGTGTCCCATTACTAAAGACGTCATTAACGAATACAAGGAGTATTACAATAACTGTAGCGACTGGATCAAGAACAATTTGACATCTATCACAATTGGGGAGATGGCCAAATTTTTGCAGAGCCTTAGCGACAAAGAGGTCGCCTACATCTCTATGGGGCTCTCCGACGAGTGGAAGGACAAGCCGTTGTACCACCTGTTCACAAAAAAGTATCACACAAAGAATGCAGACAATTTGCTGTACTACTACATTAAGGAGAAAAACCTTGATGGCTATAAAGGAAACACCCTCAACATCTCTAACACCTCTTTTAGACAGTTCGGCTACTTTAAGCTGGTGGTGAGCAACTATAGAACCAAGATTAGGACTCTGAATTGTAAGATCAAAAGGAAGAAAATCGACGCTGATTCTACCTCTGAAGATATTGAGATGCAAGTCATGTATGAGATCATCAAGTATTCACTGAACAAGAAGAGTGATTGGGACAACTTTATTTCCTACATAGAGAACGTGGAGAATCCCAATATCGATAATATAAACCGATATAAGTTGCTGCGGGAGTGCTTTTGTGAAAATGAGAACATGATTAAAAACAAGTTGGAACTCTTGTCAGTAGAACAGCTTAAAAAGTTCGGCGGCTGCATCATGAAGCCTCATATCAACAGCATGACAATTAATATCCAAGATTTTAAGATCGAGGAGAAGGAAAACAGTTTGGGGTTTATTTTGCACCTTCCACTCAATAAGAAACAGTACCAGATCGAGCTTCTGGGGAATCGGCAGATTAAGAAAGGGACCAAAGAGATACATGAAACTCTGGTTGATATCACAAATACCCATGGCGAAAATATTGTCTTTACCATCAAGAATGACAACCTGTATATCGTGTTTTCTTATGAGTCCGAATTCGAGAAGGAAGAGGTGAACTTTGCCAAGACAGTGGGGTTGGATGTCAATTTTAAGCATGCCTTCTTTGTTACCTCTGAAAAAGATAACTGCCATCTGGATGGATACATCAATCTCTATAAGTATCTGCTTGAGCACGATGAGTTCACAAATCTGCTGACCGAGGACGAGAGAAAGGACTACGAAGAATTGTCCAAGGTGGTTACTTTCTGCCCATTCGAAAATCAGCTGCTGTTCGCAAGATACAACAAAATGTCTAAATTCTGTAAAAAAGAGCAGGTCCTGTCTAAACTTCTGTATGCTCTGCAGAAAAAACTCAAAGACGAAAACCGCACAAAAGAGTACATTTACGTAAGCTGCGTCAATAAATTGAGGGCCAAGTATGTTTCTTATTTCATCCTTAAAGAGAAATACTACGAGAAGCAGAAGGAGTACGACATAGAGATGGGGTTTGTAGACGATTCTACGGAGTCTAAGGAATCTATGGACAAACGGCGCACAGAGTACCCCTTTAGGAATACCCCTGTCGCTAATGAGTTGCTCTCTAAGCTGAACAATGTCCAACAGGATATTAATGGCTGCTTGAAGAACATAATAAATTATATTTATAAAATCTTTGAGCAGAACGGCTACAAAGTTGTTGCTCTGGAGAACCTTGAGAACAGCAACTTTGAAAAGAAGCAGGTACTGCCTACTATTAAGTCTCTGCTGAAATATCATAAGCTGGAAAACCAAAATGTCAACGACATCAAGGCCTCCGACAAAGTGAAAGAGTACATCGAGAACGGATACTACGAGCTGATGACTAATGAGAATAACGAGATTGTCGACGCGAAATATACCGAAAAGGGCGCTATGAAGGTGAAGAATGCTAATTTCTTCAACTTGATGATGAAGAGCCTCCATTTTGCTTCTGTGAAGGATGAGTTTGTGCTGTTGAGTAACAACGGGAAGACCCAGATCGCACTGGTCCCGTCCGAGTTTACCTCCCAGATGGACTCTACAGATCACTGCTTGTACATGAAGAAAAACGATAAAGGTAAGTTGGTGAAAGCAGATAAGAAAGAGGTGCGAACAAAGCAGGAGAGACATATCAACGGACTGAACGCAGATTTTAACGCTGCTAATAATATTAAATATATTGTTGAGAACGAAGTGTGGCGGGGAATTTTCTGCACCAGACCGAAAAAAACAGAATATAATGTCCCGTCCCTCGACACTACTAAAAAAGGCCCTTCTGCGATCCTGAACATGCTTAAAAAGATTGAAGCGATCAAGGTGTTGGAGACTGAGAAG |
SEQ ID NO: 27 ATGATCAAGAGCATTCAGCTGAAAGTGAAGGGCGAGTGTCCCATCACTAAGGACGTTATCAACGAGTACAAGGAGTACTATAACAACTGCTCTGACTGGATTAAGAATAACCTGACCAGTATCACCATCGGCGAGATGGCCAAGTTCCTGCAGAGCCTGAGCGACAAGGAGGTGGCCTACATCAGTATGGGGCTGTCCGATGAGTGGAAAGACAAGCCACTGTATCATCTGTTCACCAAAAAGTACCACACCAAAAATGCCGATAACCTGCTGTACTATTATATCAAAGAAAAAAACCTGGACGGGTACAAAGGCAACACCCTGAACATCAGCAATACAAGTTTCCGCCAGTTTGGATACTTCAAGCTGGTCGTGTCAAATTACAGAACCAAAATCAGAACCCTGAACTGCAAGATCAAAAGGAAGAAGATCGACGCTGACAGCACCAGCGAGGACATTGAGATGCAGGTGATGTACGAGATTATTAAATACTCCCTGAACAAGAAGAGTGATTGGGACAATTTCATTTCCTACATCGAGAATGTGGAGAACCCTAACATCGATAACATAAATCGGTACAAACTGCTGAGAGAGTGCTTTTGCGAGAACGAAAATATGATAAAGAACAAGCTGGAGCTGCTCAGCGTGGAACAGCTGAAAAAATTTGGAGGCTGCATTATGAAGCCCCACATCAACTCAATGACTATCAATATCCAGGACTTCAAGATCGAAGAGAAGGAGAACTCCCTGGGCTTCATTCTGCATCTGCCACTGAATAAGAAGCAGTATCAGATCGAACTGCTGGGAAATAGGCAGATCAAGAAGGGGACCAAAGAGATCCACGAAACTCTGGTGGACATTACTAATACTCACGGGGAGAACATTGTGTTCACCATTAAGAACGATAATCTGTACATCGTGTTCAGCTATGAAAGCGAGTTTGAGAAGGAAGAGGTGAACTTCGCCAAGACCGTCGGGCTGGATGTGAATTTTAAGCACGCCTTCTTTGTGACCAGCGAAAAGGATAACTGCCACCTGGACGGATACATCAATCTGTACAAGTATCTGCTGGAGCACGACGAATTTACCAATCTGCTGACCGAGGACGAGAGGAAGGACTACGAAGAGCTCTCCAAGGTGGTGACATTTTGTCCATTCGAGAACCAGCTGCTGTTCGCCAGATACAACAAGATGTCTAAATTTTGCAAAAAAGAACAGGTCCTGAGCAAGCTGCTGTACGCCCTGCAGAAGAAACTGAAGGACGAGAACAGAACTAAGGAGTACATCTATGTGAGCTGTGTGAATAAACTGAGAGCAAAATACGTGTCTTACTTTATTCTGAAGGAGAAGTATTACGAGAAGCAGAAGGAATACGACATCGAGATGGGCTTCGTGGACGATTCCACAGAGAGCAAGGAAAGCATGGATAAAAGGCGCACTGAATACCCCTTCAGAAACACACCTGTGGCCAATGAGCTGCTGTCCAAGCTGAACAACGTGCAGCAGGACATCAACGGCTGCCTGAAGAACATCATCAACTACATTTATAAGATCTTCGAGCAGAATGGCTACAAAGTGGTGGCACTGGAGAACCTGGAGAACTCCAATTTTGAAAAGAAACAGGTGCTGCCCACCATTAAGAGCCTGCTTAAATACCATAAGCTGGAGAACCAGAACGTGAATGATATCAAAGCCAGCGATAAGGTCAAAGAGTACATCGAGAACGGATATTATGAGCTGATGACCAACGAGAACAATGAGATCGTGGACGCCAAATATACCGAGAAGGGCGCCATGAAGGTGAAGAACGCCAACTTCTTTAACCTGATGATGAAGTCCCTTCACTTTGCCTCCGTGAAGGATGAGTTCGTGCTGCTGAGCAACAACGGCAAGACCCAGATCGCCCTGGTGCCCTCTGAATTCACCAGCCAGATGGATTCAACCGACCACTGTCTCTACATGAAGAAGAACGACAAGGGCAAGCTGGTGAAGGCCGACAAGAAAGAGGTGCGCACAAAGCAGGAGCGGCACATCAATGGCCTGAACGCTGATTTCAACGCCGCAAACAACATTAAGTACATCGTGGAGAATGAGGTGTGGAGAGGTATTTTCTGCACCCGCCCCAAGAAGACCGAGTATAATGTGCCCTCTCTGGACACCACCAAAAAAGGCCCAAGCGCTATCCTGAATATGTTGAAGAAAATCGAGGCCATCAAGGTGCTGGAAACCGAGAAG |
編碼本文所述之親本多肽之核酸序列可與參考核酸序列,例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27實質上一致。在一些實施例中,變異多肽由包含與參考核酸序列,例如編碼親本多肽之核酸序列,例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性之序列的核酸編碼。兩個此類核酸之間的一致性百分比可藉由檢查兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。兩個核酸序列實質上一致之一個指示為該等核酸分子在嚴格條件(例如在中等至高嚴格度之範圍內)下與另一者之互補序列雜交。
在一些實施例中,變異多肽由與參考核酸序列,例如編碼親本多肽之核酸序列,例如SEQ ID NO: 1、SEQ ID NO: 2、SEQ ID NO: 21、SEQ ID NO: 22、SEQ ID NO: 23、SEQ ID NO: 24、SEQ ID NO: 25、SEQ ID NO: 26或SEQ ID NO: 27具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或更大序列一致性,但非100%序列一致性之核酸序列編碼。
在一些實施例中,本發明之變異多肽包含與SEQ ID NO: 3具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,但非100%一致性之多肽序列。在一些實施例中,本發明之變異多肽包含與SEQ ID NO: 3具有大於50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,但非100%一致性之多肽序列。
在一些實施例中,本發明描述一種變異多肽,其與一或多種參考多肽,例如親本多肽具有指定程度之胺基酸序列一致性,例如與SEQ ID NO: 3之胺基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%,但非100%序列一致性。同源性或一致性可如本文所述,藉由胺基酸序列比對,例如使用諸如BLAST、ALIGN或CLUSTAL之程式來確定。在一些實施例中,變異多肽維持區分該多肽與其相應親本/參考序列之胺基酸變化(或至少1、2、3、4、5個等此等變化)。
在一些實施例中,變異多肽包含親本多肽之一或多個(例如,若干)胺基酸處的改變,其中改變至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200個或更多個。
在一些實施例中,變異多肽包含表2中所列之一或多個胺基酸取代。
表2. SEQ ID NO: 3之變異體中之單個胺基酸取代.
表 2 | ||
位置 | 野生型殘基 | 取代 |
1 | M | |
2 | I | R、G、A、K、Q、N、H |
3 | K | R、G、A、Q、N、H |
4 | S | R、G、A、K、Q、N、H |
5 | I | R、G、A、K、Q、N、H |
6 | Q | R、G、A、K、N、H |
7 | L | R、G、A、K、Q、N、H |
8 | K | R、G、A、Q、N、H |
9 | V | R、G、A、K、Q、N、H |
10 | K | R、G、A、Q、N、H |
11 | G | R、A、K、Q、N、H |
12 | E | R、G、A、K、Q、N、H |
13 | C | R、G、A、K、Q、N、H |
14 | P | R、G、A、K、Q、N、H |
15 | I | R、G、A、K、Q、N、H |
16 | T | R、G、A、K、Q、N、H |
17 | K | R、G、A、Q、N、H |
18 | D | R、G、A、K、Q、N、H |
19 | V | R、G、A、K、Q、N、H |
20 | I | R、G、A、K、Q、N、H |
21 | N | R、G、A、K、Q、H |
22 | E | R、G、A、K、Q、N、H |
23 | Y | R、G、A、K、Q、N、H |
24 | K | R、G、A、Q、N、H |
25 | E | R、G、A、K、Q、N、H |
26 | Y | R、G、A、K、Q、N、H |
27 | Y | R、G、A、K、Q、N、H |
28 | N | R、G、A、K、Q、H |
29 | N | R、G、A、K、Q、H |
30 | C | R、G、A、K、Q、N、H |
31 | S | R、G、A、K、Q、N、H |
32 | D | R、G、A、K、Q、N、H |
33 | W | R、G、A、K、Q、N、H |
34 | I | R、G、A、K、Q、N、H |
35 | K | R、G、A、Q、N、H |
36 | N | R、G、A、K、Q、H |
37 | N | R、G、A、K、Q、H |
38 | L | R、G、A、K、Q、N、H |
39 | T | R、G、A、K、Q、N、H |
40 | S | R、G、A、K、Q、N、H |
41 | I | R、G、A、K、Q、N、H |
42 | T | R、G、A、K、Q、N、H |
43 | I | R、G、A、K、Q、N、H |
44 | G | R、A、K、Q、N、H |
45 | E | R、G、A、K、Q、N、H |
46 | M | R、G、A、K、Q、N、H |
47 | A | R、G、K、Q、N、H |
48 | K | R、G、A、Q、N、H |
49 | F | R、G、A、K、Q、N、H |
50 | L | R、G、A、K、Q、N、H |
51 | Q | R、G、A、K、N、H |
52 | S | R、G、A、K、Q、N、H |
53 | L | R、G、A、K、Q、N、H |
54 | S | R、G、A、K、Q、N、H |
55 | D | R、G、A、K、Q、N、H |
56 | K | R、G、A、Q、N、H |
57 | E | R、G、A、K、Q、N、H |
58 | V | R、G、A、K、Q、N、H |
59 | A | R、G、K、Q、N、H |
60 | Y | R、G、A、K、Q、N、H |
61 | I | R、G、A、K、Q、N、H |
62 | S | R、G、A、K、Q、N、H |
63 | M | R、G、A、K、Q、N、H |
64 | G | R、A、K、Q、N、H |
65 | L | R、G、A、K、Q、N、H |
66 | S | R、G、A、K、Q、N、H |
67 | D | R、G、A、K、Q、N、H |
68 | E | R、G、A、K、Q、N、H |
69 | W | R、G、A、K、Q、N、H |
70 | K | R、G、A、Q、N、H |
71 | D | R、G、A、K、Q、N、H |
72 | K | R、G、A、Q、N、H |
73 | P | R、G、A、K、Q、N、H |
74 | L | R、G、A、K、Q、N、H |
75 | Y | R、G、A、K、Q、N、H |
76 | H | R、G、A、K、Q、N |
77 | L | R、G、A、K、Q、N、H |
78 | F | R、G、A、K、Q、N、H |
79 | T | R、G、A、K、Q、N、H |
80 | K | R、G、A、Q、N、H |
81 | K | R、G、A、Q、N、H |
82 | Y | R、G、A、K、Q、N、H |
83 | H | R、G、A、K、Q、N |
84 | T | R、G、A、K、Q、N、H |
85 | K | R、G、A、Q、N、H |
86 | N | R、G、A、K、Q、H |
87 | A | R、G、K、Q、N、H |
88 | D | R、G、A、K、Q、N、H |
89 | N | R、G、A、K、Q、H |
90 | L | R、G、A、K、Q、N、H |
91 | L | R、G、A、K、Q、N、H |
92 | Y | R、G、A、K、Q、N、H |
93 | Y | R、G、A、K、Q、N、H |
94 | Y | R、G、A、K、Q、N、H |
95 | I | R、G、A、K、Q、N、H |
96 | K | R、G、A、Q、N、H |
97 | E | R、G、A、K、Q、N、H |
98 | K | R、G、A、Q、N、H |
99 | N | R、G、A、K、Q、H |
100 | L | R、G、A、K、Q、N、H |
101 | D | R、G、A、K、Q、N、H |
102 | G | R、A、K、Q、N、H |
103 | Y | R、G、A、K、Q、N、H |
104 | K | R、G、A、Q、N、H |
105 | G | R、A、K、Q、N、H |
106 | N | R、G、A、K、Q、H |
107 | T | R、G、A、K、Q、N、H |
108 | L | R、G、A、K、Q、N、H |
109 | N | R、G、A、K、Q、H |
110 | I | R、G、A、K、Q、N、H |
111 | S | R、G、A、K、Q、N、H |
112 | N | R、G、A、K、Q、H |
113 | T | R、G、A、K、Q、N、H |
114 | S | R、G、A、K、Q、N、H |
115 | F | R、G、A、K、Q、N、H |
116 | R | G、A、K、Q、N、H |
117 | Q | R、G、A、K、N、H |
118 | F | R、G、A、K、Q、N、H |
119 | G | R、A、K、Q、N、H |
120 | Y | R、G、A、K、Q、N、H |
121 | F | R、G、A、K、Q、N、H |
122 | K | R、G、A、Q、N、H |
123 | L | R、G、A、K、Q、N、H |
124 | V | R、G、A、K、Q、N、H |
125 | V | R、G、A、K、Q、N、H |
126 | S | R、G、A、K、Q、N、H |
127 | N | R、G、A、K、Q、H |
128 | Y | R、G、A、K、Q、N、H |
129 | R | G、A、K、Q、N、H |
130 | T | R、G、A、K、Q、N、H |
131 | K | R、G、A、Q、N、H |
132 | I | R、G、A、K、Q、N、H |
133 | R | G、A、K、Q、N、H |
134 | T | R、G、A、K、Q、N、H |
135 | L | R、G、A、K、Q、N、H |
136 | N | R、G、A、K、Q、H |
137 | C | R、G、A、K、Q、N、H |
138 | K | R、G、A、Q、N、H |
139 | I | R、G、A、K、Q、N、H |
140 | K | R、G、A、Q、N、H |
141 | R | G、A、K、Q、N、H |
142 | K | R、G、A、Q、N、H |
143 | K | R、G、A、Q、N、H |
144 | I | R、G、A、K、Q、N、H |
145 | D | R、G、A、K、Q、N、H |
146 | A | R、G、K、Q、N、H |
147 | D | R、G、A、K、Q、N、H |
148 | S | R、G、A、K、Q、N、H |
149 | T | R、G、A、K、Q、N、H |
150 | S | R、G、A、K、Q、N、H |
151 | E | R、G、A、K、Q、N、H |
152 | D | R、G、A、K、Q、N、H |
153 | I | R、G、A、K、Q、N、H |
154 | E | R、G、A、K、Q、N、H |
155 | M | R、G、A、K、Q、N、H |
156 | Q | R、G、A、K、N、H |
157 | V | R、G、A、K、Q、N、H |
158 | M | R、G、A、K、Q、N、H |
159 | Y | R、G、A、K、Q、N、H |
160 | E | R、G、A、K、Q、N、H |
161 | I | R、G、A、K、Q、N、H |
162 | I | R、G、A、K、Q、N、H |
163 | K | R、G、A、Q、N、H |
164 | Y | R、G、A、K、Q、N、H |
165 | S | R、G、A、K、Q、N、H |
166 | L | R、G、A、K、Q、N、H |
167 | N | R、G、A、K、Q、H |
168 | K | R、G、A、Q、N、H |
169 | K | R、G、A、Q、N、H |
170 | S | R、G、A、K、Q、N、H |
171 | D | R、G、A、K、Q、N、H |
172 | W | R、G、A、K、Q、N、H |
173 | D | R、G、A、K、Q、N、H |
174 | N | R、G、A、K、Q、H |
175 | F | R、G、A、K、Q、N、H |
176 | I | R、G、A、K、Q、N、H |
177 | S | R、G、A、K、Q、N、H |
178 | Y | R、G、A、K、Q、N、H |
179 | I | R、G、A、K、Q、N、H |
180 | E | R、G、A、K、Q、N、H |
181 | N | R、G、A、K、Q、H |
182 | V | R、G、A、K、Q、N、H |
183 | E | R、G、A、K、Q、N、H |
184 | N | R、G、A、K、Q、H |
185 | P | R、G、A、K、Q、N、H |
186 | N | R、G、A、K、Q、H |
187 | I | R、G、A、K、Q、N、H |
188 | D | R、G、A、K、Q、N、H |
189 | N | R、G、A、K、Q、H |
190 | I | R、G、A、K、Q、N、H |
191 | N | R、G、A、K、Q、H |
192 | R | G、A、K、Q、N、H |
193 | Y | R、G、A、K、Q、N、H |
194 | K | R、G、A、Q、N、H |
195 | L | R、G、A、K、Q、N、H |
196 | L | R、G、A、K、Q、N、H |
197 | R | G、A、K、Q、N、H |
198 | E | R、G、A、K、Q、N、H |
199 | C | R、G、A、K、Q、N、H |
200 | F | R、G、A、K、Q、N、H |
201 | C | R、G、A、K、Q、N、H |
202 | E | R、G、A、K、Q、N、H |
203 | N | R、G、A、K、Q、H |
204 | E | R、G、A、K、Q、N、H |
205 | N | R、G、A、K、Q、H |
206 | M | R、G、A、K、Q、N、H |
207 | I | R、G、A、K、Q、N、H |
208 | K | R、G、A、Q、N、H |
209 | N | R、G、A、K、Q、H |
210 | K | R、G、A、Q、N、H |
211 | L | R、G、A、K、Q、N、H |
212 | E | R、G、A、K、Q、N、H |
213 | L | R、G、A、K、Q、N、H |
214 | L | R、G、A、K、Q、N、H |
215 | S | R、G、A、K、Q、N、H |
216 | V | R、G、A、K、Q、N、H |
217 | E | R、G、A、K、Q、N、H |
218 | Q | R、G、A、K、N、H |
219 | L | R、G、A、K、Q、N、H |
220 | K | R、G、A、Q、N、H |
221 | K | R、G、A、Q、N、H |
222 | F | R、G、A、K、Q、N、H |
223 | G | R、A、K、Q、N、H |
224 | G | R、A、K、Q、N、H |
225 | C | R、G、A、K、Q、N、H |
226 | I | R、G、A、K、Q、N、H |
227 | M | R、G、A、K、Q、N、H |
228 | K | R、G、A、Q、N、H |
229 | P | R、G、A、K、Q、N、H |
230 | H | R、G、A、K、Q、N |
231 | I | R、G、A、K、Q、N、H |
232 | N | R、G、A、K、Q、H |
233 | S | R、G、A、K、Q、N、H |
234 | M | R、G、A、K、Q、N、H |
235 | T | R、G、A、K、Q、N、H |
236 | I | R、G、A、K、Q、N、H |
237 | N | R、G、A、K、Q、H |
238 | I | R、G、A、K、Q、N、H |
239 | Q | R、G、A、K、N、H |
240 | D | R、G、A、K、Q、N、H |
241 | F | R、G、A、K、Q、N、H |
242 | K | R、G、A、Q、N、H |
243 | I | R、G、A、K、Q、N、H |
244 | E | R、G、A、K、Q、N、H |
245 | E | R、G、A、K、Q、N、H |
246 | K | R、G、A、Q、N、H |
247 | E | R、G、A、K、Q、N、H |
248 | N | R、G、A、K、Q、H |
249 | S | R、G、A、K、Q、N、H |
250 | L | R、G、A、K、Q、N、H |
251 | G | R、A、K、Q、N、H |
252 | F | R、G、A、K、Q、N、H |
253 | I | R、G、A、K、Q、N、H |
254 | L | R、G、A、K、Q、N、H |
255 | H | R、G、A、K、Q、N |
256 | L | R、G、A、K、Q、N、H |
257 | P | R、G、A、K、Q、N、H |
258 | L | R、G、A、K、Q、N、H |
259 | N | R、G、A、K、Q、H |
260 | K | R、G、A、Q、N、H |
261 | K | R、G、A、Q、N、H |
262 | Q | R、G、A、K、N、H |
263 | Y | R、G、A、K、Q、N、H |
264 | Q | R、G、A、K、N、H |
265 | I | R、G、A、K、Q、N、H |
266 | E | R、G、A、K、Q、N、H |
267 | L | R、G、A、K、Q、N、H |
268 | L | R、G、A、K、Q、N、H |
269 | G | R、A、K、Q、N、H |
270 | N | R、G、A、K、Q、H |
271 | R | G、A、K、Q、N、H |
272 | Q | R、G、A、K、N、H |
273 | I | R、G、A、K、Q、N、H |
274 | K | R、G、A、Q、N、H |
275 | K | R、G、A、Q、N、H |
276 | G | R、A、K、Q、N、H |
277 | T | R、G、A、K、Q、N、H |
278 | K | R、G、A、Q、N、H |
279 | E | R、G、A、K、Q、N、H |
280 | I | R、G、A、K、Q、N、H |
281 | H | R、G、A、K、Q、N |
282 | E | R、G、A、K、Q、N、H |
283 | T | R、G、A、K、Q、N、H |
284 | L | R、G、A、K、Q、N、H |
285 | V | R、G、A、K、Q、N、H |
286 | D | R、G、A、K、Q、N、H |
287 | I | R、G、A、K、Q、N、H |
288 | T | R、G、A、K、Q、N、H |
289 | N | R、G、A、K、Q、H |
290 | T | R、G、A、K、Q、N、H |
291 | H | R、G、A、K、Q、N, |
292 | G | R、A、K、Q、N、H |
293 | E | R、G、A、K、Q、N、H |
294 | N | R、G、A、K、Q、H |
295 | I | R、G、A、K、Q、N、H |
296 | V | R、G、A、K、Q、N、H |
297 | F | R、G、A、K、Q、N、H |
298 | T | R、G、A、K、Q、N、H |
299 | I | R、G、A、K、Q、N、H |
300 | K | R、G、A、Q、N、H |
301 | N | R、G、A、K、Q、H |
302 | D | R、G、A、K、Q、N、H |
303 | N | R、G、A、K、Q、H |
304 | L | R、G、A、K、Q、N、H |
305 | Y | R、G、A、K、Q、N、H |
306 | I | R、G、A、K、Q、N、H |
307 | V | R、G、A、K、Q、N、H |
308 | F | R、G、A、K、Q、N、H |
309 | S | R、G、A、K、Q、N、H |
310 | Y | R、G、A、K、Q、N、H |
311 | E | R、G、A、K、Q、N、H |
312 | S | R、G、A、K、Q、N、H |
313 | E | R、G、A、K、Q、N、H |
314 | F | R、G、A、K、Q、N、H |
315 | E | R、G、A、K、Q、N、H |
316 | K | R、G、A、Q、N、H |
317 | E | R、G、A、K、Q、N、H |
318 | E | R、G、A、K、Q、N、H |
319 | V | R、G、A、K、Q、N、H |
320 | N | R、G、A、K、Q、H |
321 | F | R、G、A、K、Q、N、H |
322 | A | R、G、K、Q、N、H |
323 | K | R、G、A、Q、N、H |
324 | T | R、G、A、K、Q、N、H |
325 | V | R、G、A、K、Q、N、H |
326 | G | R、A、K、Q、N、H |
327 | L | R、G、A、K、Q、N、H |
328 | D | A、C、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y |
329 | V | R、G、A、K、Q、N、H |
330 | N | R、G、A、K、Q、H |
331 | F | R、G、A、K、Q、N、H |
332 | K | R、G、A、Q、N、H |
333 | H | R、G、A、K、Q、N |
334 | A | R、G、K、Q、N、H |
335 | F | R、G、A、K、Q、N、H |
336 | F | R、G、A、K、Q、N、H |
337 | V | R、G、A、K、Q、N、H |
338 | T | R、G、A、K、Q、N、H |
339 | S | R、G、A、K、Q、N、H |
340 | E | R、G、A、K、Q、N、H |
341 | K | R、G、A、Q、N、H |
342 | D | R、G、A、K、Q、N、H |
343 | N | R、G、A、K、Q、H |
344 | C | R、G、A、K、Q、N、H |
345 | H | R、G、A、K、Q、N |
346 | L | R、G、A、K、Q、N、H |
347 | D | R、G、A、K、Q、N、H |
348 | G | R、A、K、Q、N、H |
349 | Y | R、G、A、K、Q、N、H |
350 | I | R、G、A、K、Q、N、H |
351 | N | R、G、A、K、Q、H |
352 | L | R、G、A、K、Q、N、H |
353 | Y | R、G、A、K、Q、N、H |
354 | K | R、G、A、Q、N、H |
355 | Y | R、G、A、K、Q、N、H |
356 | L | R、G、A、K、Q、N、H |
357 | L | R、G、A、K、Q、N、H |
358 | E | R、G、A、K、Q、N、H |
359 | H | R、G、A、K、Q、N |
360 | D | R、G、A、K、Q、N、H |
361 | E | R、G、A、K、Q、N、H |
362 | F | R、G、A、K、Q、N、H |
363 | T | R、G、A、K、Q、N、H |
364 | N | R、G、A、K、Q、H |
365 | L | R、G、A、K、Q、N、H |
366 | L | R、G、A、K、Q、N、H |
367 | T | R、G、A、K、Q、N、H |
368 | E | R、G、A、K、Q、N、H |
369 | D | R、G、A、K、Q、N、H |
370 | E | R、G、A、K、Q、N、H |
371 | R | G、A、K、Q、N、H |
372 | K | R、G、A、Q、N、H |
373 | D | R、G、A、K、Q、N、H |
374 | Y | R、G、A、K、Q、N、H |
375 | E | R、G、A、K、Q、N、H |
376 | E | R、G、A、K、Q、N、H |
377 | L | R、G、A、K、Q、N、H |
378 | S | R、G、A、K、Q、N、H |
379 | K | R、G、A、Q、N、H |
380 | V | R、G、A、K、Q、N、H |
381 | V | R、G、A、K、Q、N、H |
382 | T | R、G、A、K、Q、N、H |
383 | F | R、G、A、K、Q、N、H |
384 | C | R、G、A、K、Q、N、H |
385 | P | R、G、A、K、Q、N、H |
386 | F | R、G、A、K、Q、N、H |
387 | E | R、G、A、K、Q、N、H |
388 | N | R、G、A、K、Q、H |
389 | Q | R、G、A、K、N、H |
390 | L | R、G、A、K、Q、N、H |
391 | L | R、G、A、K、Q、N、H |
392 | F | R、G、A、K、Q、N、H |
393 | A | R、G、K、Q、N、H |
394 | R | G、A、K、Q、N、H |
395 | Y | R、G、A、K、Q、N、H |
396 | N | R、G、A、K、Q、H |
397 | K | R、G、A、Q、N、H |
398 | M | R、G、A、K、Q、N、H |
399 | S | R、G、A、K、Q、N、H |
400 | K | R、G、A、Q、N、H |
401 | F | R、G、A、K、Q、N、H |
402 | C | R、G、A、K、Q、N、H |
403 | K | R、G、A、Q、N、H |
404 | K | R、G、A、Q、N、H |
405 | E | R、G、A、K、Q、N、H |
406 | Q | R、G、A、K、N、H |
407 | V | R、G、A、K、Q、N、H |
408 | L | R、G、A、K、Q、N、H |
409 | S | R、G、A、K、Q、N、H |
410 | K | R、G、A、Q、N、H |
411 | L | R、G、A、K、Q、N、H |
412 | L | R、G、A、K、Q、N、H |
413 | Y | R、G、A、K、Q、N、H |
414 | A | R、G、K、Q、N、H |
415 | L | R、G、A、K、Q、N、H |
416 | Q | R、G、A、K、N、H |
417 | K | R、G、A、Q、N、H |
418 | K | R、G、A、Q、N、H |
419 | L | R、G、A、K、Q、N、H |
420 | K | R、G、A、Q、N、H |
421 | D | R、G、A、K、Q、N、H |
422 | E | R、G、A、K、Q、N、H |
423 | N | R、G、A、K、Q、H |
424 | T | R、G、A、K、Q、N、H |
425 | R | G、A、K、Q、N、H |
426 | K | R、G、A、Q、N、H |
427 | E | R、G、A、K、Q、N、H |
428 | Y | R、G、A、K、Q、N、H |
429 | I | R、G、A、K、Q、N、H |
430 | Y | R、G、A、K、Q、N、H |
431 | V | R、G、A、K、Q、N、H |
432 | S | R、G、A、K、Q、N、H |
433 | C | R、G、A、K、Q、N、H |
434 | V | R、G、A、K、Q、N、H |
435 | N | R、G、A、K、Q、H |
436 | K | R、G、A、Q、N、H |
437 | L | R、G、A、K、Q、N、H |
438 | R | G、A、K、Q、N、H |
439 | A | R、G、K、Q、N、H |
440 | K | R、G、A、Q、N、H |
441 | Y | R、G、A、K、Q、N、H |
442 | V | R、G、A、K、Q、N、H |
443 | S | R、G、A、K、Q、N、H |
444 | Y | R、G、A、K、Q、N、H |
445 | F | R、G、A、K、Q、N、H |
446 | I | R、G、A、K、Q、N、H |
447 | L | R、G、A、K、Q、N、H |
448 | K | R、G、A、Q、N、H |
449 | E | R、G、A、K、Q、N、H |
450 | K | R、G、A、Q、N、H |
451 | Y | R、G、A、K、Q、N、H |
452 | Y | R、G、A、K、Q、N、H |
453 | E | R、G、A、K、Q、N、H |
454 | K | R、G、A、Q、N、H |
455 | Q | R、G、A、K、N、H |
456 | K | R、G、A、Q、N、H |
457 | E | R、G、A、K、Q、N、H |
458 | Y | R、G、A、K、Q、N、H |
459 | D | R、G、A、K、Q、N、H |
460 | I | R、G、A、K、Q、N、H |
461 | E | R、G、A、K、Q、N、H |
462 | M | R、G、A、K、Q、N、H |
463 | G | R、A、K、Q、N、H |
464 | F | R、G、A、K、Q、N、H |
465 | V | R、G、A、K、Q、N、H |
466 | D | R、G、A、K、Q、N、H |
467 | D | R、G、A、K、Q、N、H |
468 | S | R、G、A、K、Q、N、H |
469 | T | R、G、A、K、Q、N、H |
470 | E | R、G、A、K、Q、N、H |
471 | S | R、G、A、K、Q、N、H |
472 | K | R、G、A、Q、N、H |
473 | E | R、G、A、K、Q、N、H |
474 | S | R、G、A、K、Q、N、H |
475 | M | R、G、A、K、Q、N、H |
476 | D | R、G、A、K、Q、N、H |
477 | K | R、G、A、Q、N、H |
478 | R | G、A、K、Q、N、H |
479 | R | G、A、K、Q、N、H |
480 | T | R、G、A、K、Q、N、H |
481 | E | R、G、A、K、Q、N、H |
482 | Y | R、G、A、K、Q、N、H |
483 | P | R、G、A、K、Q、N、H |
484 | F | R、G、A、K、Q、N、H |
485 | R | G、A、K、Q、N、H |
486 | N | R、G、A、K、Q、H |
487 | T | R、G、A、K、Q、N、H |
488 | P | R、G、A、K、Q、N、H |
489 | V | R、G、A、K、Q、N、H |
490 | A | R、G、K、Q、N、H |
491 | N | R、G、A、K、Q、H |
492 | E | R、G、A、K、Q、N、H |
493 | L | R、G、A、K、Q、N、H |
494 | L | R、G、A、K、Q、N、H |
495 | S | R、G、A、K、Q、N、H |
496 | K | R、G、A、Q、N、H |
497 | L | R、G、A、K、Q、N、H |
498 | N | R、G、A、K、Q、H |
499 | N | R、G、A、K、Q、H |
500 | V | R、G、A、K、Q、N、H |
501 | Q | R、G、A、K、N、H |
502 | Q | R、G、A、K、N、H |
503 | D | R、G、A、K、Q、N、H |
504 | I | R、G、A、K、Q、N、H |
505 | N | R、G、A、K、Q、H |
506 | G | R、A、K、Q、N、H |
507 | C | R、G、A、K、Q、N、H |
508 | L | R、G、A、K、Q、N、H |
509 | K | R、G、A、Q、N、H |
510 | N | R、G、A、K、Q、H |
511 | I | R、G、A、K、Q、N、H |
512 | I | R、G、A、K、Q、N、H |
513 | N | R、G、A、K、Q、H |
514 | Y | R、G、A、K、Q、N、H |
515 | I | R、G、A、K、Q、N、H |
516 | Y | R、G、A、K、Q、N、H |
517 | K | R、G、A、Q、N、H |
518 | I | R、G、A、K、Q、N、H |
519 | F | R、G、A、K、Q、N、H |
520 | E | R、G、A、K、Q、N、H |
521 | Q | R、G、A、K、N、H |
522 | N | R、G、A、K、Q、H |
523 | G | R、A、K、Q、N、H |
524 | Y | R、G、A、K、Q、N、H |
525 | K | R、G、A、Q、N、H |
526 | V | R、G、A、K、Q、N、H |
527 | V | R、G、A、K、Q、N、H |
528 | A | R、G、K、Q、N、H |
529 | L | R、G、A、K、Q、N、H |
530 | E | A、C、D、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W、Y |
531 | N | R、G、A、K、Q、H |
532 | L | R、G、A、K、Q、N、H |
533 | E | R、G、A、K、Q、N、H |
534 | N | R、G、A、K、Q、H |
535 | S | R、G、A、K、Q、N、H |
536 | N | R、G、A、K、Q、H |
537 | F | R、G、A、K、Q、N、H |
538 | E | R、G、A、K、Q、N、H |
539 | K | R、G、A、Q、N、H |
540 | K | R、G、A、Q、N、H |
541 | Q | R、G、A、K、N、H |
542 | V | R、G、A、K、Q、N、H |
543 | L | R、G、A、K、Q、N、H |
544 | P | R、G、A、K、Q、N、H |
545 | T | R、G、A、K、Q、N、H |
546 | I | R、G、A、K、Q、N、H |
547 | K | R、G、A、Q、N、H |
548 | S | R、G、A、K、Q、N、H |
549 | L | R、G、A、K、Q、N、H |
550 | L | R、G、A、K、Q、N、H |
551 | K | R、G、A、Q、N、H |
552 | Y | R、G、A、K、Q、N、H |
553 | H | R、G、A、K、Q、N |
554 | K | R、G、A、Q、N、H |
555 | L | R、G、A、K、Q、N、H |
556 | E | R、G、A、K、Q、N、H |
557 | N | R、G、A、K、Q、H |
558 | Q | R、G、A、K、N、H |
559 | N | R、G、A、K、Q、H |
560 | V | R、G、A、K、Q、N、H |
561 | N | R、G、A、K、Q、H |
562 | D | R、G、A、K、Q、N、H |
563 | I | R、G、A、K、Q、N、H |
564 | K | R、G、A、Q、N、H |
565 | A | R、G、K、Q、N、H |
566 | S | R、G、A、K、Q、N、H |
567 | D | R、G、A、K、Q、N、H |
568 | K | R、G、A、Q、N、H |
569 | V | R、G、A、K、Q、N、H |
570 | K | R、G、A、Q、N、H |
571 | E | R、G、A、K、Q、N、H |
572 | Y | R、G、A、K、Q、N、H |
573 | I | R、G、A、K、Q、N、H |
574 | E | R、G、A、K、Q、N、H |
575 | N | R、G、A、K、Q、H |
576 | G | R、A、K、Q、N、H |
577 | Y | R、G、A、K、Q、N、H |
578 | Y | R、G、A、K、Q、N、H |
579 | E | R、G、A、K、Q、N、H |
580 | L | R、G、A、K、Q、N、H |
581 | M | R、G、A、K、Q、N、H |
582 | T | R、G、A、K、Q、N、H |
583 | N | R、G、A、K、Q、H |
584 | E | R、G、A、K、Q、N、H |
585 | N | R、G、A、K、Q、H |
586 | N | R、G、A、K、Q、H |
587 | E | R、G、A、K、Q、N、H |
588 | I | R、G、A、K、Q、N、H |
589 | V | R、G、A、K、Q、N、H |
590 | D | R、G、A、K、Q、N、H |
591 | A | R、G、K、Q、N、H |
592 | K | R、G、A、Q、N、H |
593 | Y | R、G、A、K、Q、N、H |
594 | T | R、G、A、K、Q、N、H |
595 | E | R、G、A、K、Q、N、H |
596 | K | R、G、A、Q、N、H |
597 | G | R、A、K、Q、N、H |
598 | A | R、G、K、Q、N、H |
599 | M | R、G、A、K、Q、N、H |
600 | K | R、G、A、Q、N、H |
601 | V | R、G、A、K、Q、N、H |
602 | K | R、G、A、Q、N、H |
603 | N | R、G、A、K、Q、H |
604 | A | R、G、K、Q、N、H |
605 | N | R、G、A、K、Q、H |
606 | F | R、G、A、K、Q、N、H |
607 | F | R、G、A、K、Q、N、H |
608 | N | R、G、A、K、Q、H |
609 | L | R、G、A、K、Q、N、H |
610 | M | R、G、A、K、Q、N、H |
611 | M | R、G、A、K、Q、N、H |
612 | K | R、G、A、Q、N、H |
613 | S | R、G、A、K、Q、N、H |
614 | L | R、G、A、K、Q、N、H |
615 | H | R、G、A、K、Q、N |
616 | F | R、G、A、K、Q、N、H |
617 | A | R、G、K、Q、N、H |
618 | S | R、G、A、K、Q、N、H |
619 | V | R、G、A、K、Q、N、H |
620 | K | R、G、A、Q、N、H |
621 | D | R、G、A、K、Q、N、H |
622 | E | R、G、A、K、Q、N、H |
623 | F | R、G、A、K、Q、N、H |
624 | V | R、G、A、K、Q、N、H |
625 | L | R、G、A、K、Q、N、H |
626 | L | R、G、A、K、Q、N、H |
627 | S | R、G、A、K、Q、N、H |
628 | N | R、G、A、K、Q、H |
629 | N | R、G、A、K、Q、H |
630 | G | R、A、K、Q、N、H |
631 | K | R、G、A、Q、N、H |
632 | T | R、G、A、K、Q、N、H |
633 | Q | R、G、A、K、N、H |
634 | I | R、G、A、K、Q、N、H |
635 | A | R、G、K、Q、N、H |
636 | L | R、G、A、K、Q、N、H |
637 | V | R、G、A、K、Q、N、H |
638 | P | R、G、A、K、Q、N、H |
639 | S | R、G、A、K、Q、N、H |
640 | E | R、G、A、K、Q、N、H |
641 | F | R、G、A、K、Q、N、H |
642 | T | R、G、A、K、Q、N、H |
643 | S | R、G、A、K、Q、N、H |
644 | Q | R、G、A、K、N、H |
645 | M | R、G、A、K、Q、N、H |
646 | D | R、G、A、K、Q、N、H |
647 | S | R、G、A、K、Q、N、H |
648 | T | R、G、A、K、Q、N、H |
649 | D | R、G、A、K、Q、N、H |
650 | H | R、G、A、K、Q、N |
651 | C | R、G、A、K、Q、N、H |
652 | L | R、G、A、K、Q、N、H |
653 | Y | R、G、A、K、Q、N、H |
654 | M | R、G、A、K、Q、N、H |
655 | K | R、G、A、Q、N、H |
656 | K | R、G、A、Q、N、H |
657 | N | R、G、A、K、Q、H |
658 | D | R、G、A、K、Q、N、H |
659 | K | R、G、A、Q、N、H |
660 | G | R、A、K、Q、N、H |
661 | K | R、G、A、Q、N、H |
662 | L | R、G、A、K、Q、N、H |
663 | V | R、G、A、K、Q、N、H |
664 | K | R、G、A、Q、N、H |
665 | A | R、G、K、Q、N、H |
666 | D | R、G、A、K、Q、N、H |
667 | K | R、G、A、Q、N、H |
668 | K | R、G、A、Q、N、H |
669 | E | R、G、A、K、Q、N、H |
670 | V | R、G、A、K、Q、N、H |
671 | R | G、A、K、Q、N、H |
672 | T | R、G、A、K、Q、N、H |
673 | K | R、G、A、Q、N、H |
674 | Q | R、G、A、K、N、H |
675 | E | R、G、A、K、Q、N、H |
676 | R | G、A、K、Q、N、H |
677 | H | R、G、A、K、Q、N |
678 | I | R、G、A、K、Q、N、H |
679 | N | R、G、A、K、Q、N、H |
680 | G | R、A、K、Q、N、H |
681 | L | R、G、A、K、Q、N、H |
682 | N | R、G、A、K、Q、H |
683 | A | R、G、K、Q、N、H |
684 | D | R、G、A、K、Q、N、H |
685 | F | R、G、A、K、Q、N、H |
686 | N | R、G、A、K、Q、H |
687 | A | R、G、K、Q、N、H |
688 | A | R、G、K、Q、N、H |
689 | N | R、G、A、K、Q、H |
690 | N | R、G、A、K、Q、H |
691 | I | R、G、A、K、Q、N、H |
692 | K | R、G、A、Q、N、H |
693 | Y | R、G、A、K、Q、N、H |
694 | I | R、G、A、K、Q、N、H |
695 | V | R、G、A、K、Q、N、H |
696 | E | R、G、A、K、Q、N、H |
697 | N | R、G、A、K、Q、H |
698 | E | R、G、A、K、Q、N、H |
699 | V | R、G、A、K、Q、N、H |
700 | W | R、G、A、K、Q、N、H |
701 | R | G、A、K、Q、N、H |
702 | G | R、A、K、Q、N、H |
703 | I | R、G、A、K、Q、N、H |
704 | F | R、G、A、K、Q、N、H |
705 | C | R、G、A、K、Q、N、H |
706 | T | R、G、A、K、Q、N、H |
707 | R | G、A、K、Q、N、H |
708 | P | R、G、A、K、Q、N、H |
709 | K | R、G、A、Q、N、H |
710 | K | R、G、A、Q、N、H |
711 | T | R、G、A、K、Q、N、H |
712 | E | R、G、A、K、Q、N、H |
713 | Y | R、G、A、K、Q、N、H |
714 | N | R、G、A、K、Q、H |
715 | V | R、G、A、K、Q、N、H |
716 | P | R、G、A、K、Q、N、H |
717 | S | R、G、A、K、Q、N、H |
718 | L | R、G、A、K、Q、N、H |
719 | D | R、G、A、K、Q、N、H |
720 | T | R、G、A、K、Q、N、H |
721 | T | R、G、A、K、Q、N、H |
722 | K | R、G、A、Q、N、H |
723 | K | R、G、A、Q、N、H |
724 | G | R、A、K、Q、N、H |
725 | P | R、G、A、K、Q、N、H |
726 | S | R、G、A、K、Q、N、H |
727 | A | R、G、K、Q、N、H |
728 | I | R、G、A、K、Q、N、H |
729 | L | R、G、A、K、Q、N、H |
730 | N | R、G、A、K、Q、H |
731 | M | R、G、A、K、Q、N、H |
732 | L | R、G、A、K、Q、N、H |
733 | K | R、G、A、Q、N、H |
734 | K | R、G、A、Q、N、H |
735 | I | R、G、A、K、Q、N、H |
736 | E | R、G、A、K、Q、N、H |
737 | A | R、G、K、Q、N、H |
738 | I | R、G、A、K、Q、N、H |
739 | K | R、G、A、Q、N、H |
740 | V | R、G、A、K、Q、N、H |
741 | L | R、G、A、K、Q、N、H |
742 | E | R、G、A、K、Q、N、H |
743 | T | R、G、A、K、Q、N、H |
744 | E | R、G、A、K、Q、N、H |
745 | K | R、G、A、Q、N、H |
在一些實施例中,變異多肽包含增加變異多肽與RNA引導之相互作用的改變。在一些實施例中,增加與RNA引導之相互作用的改變為精胺酸、離胺酸、麩醯胺酸、天冬醯胺或組胺酸取代。在一些實施例中,變異多肽包含增加變異多肽與目標核酸之相互作用的改變。在一些實施例中,增加與目標核酸之相互作用的改變為精胺酸、離胺酸、麩醯胺酸、天冬醯胺或組胺酸取代。在一些實施例中,變異多肽包含丙胺酸取代。在一些實施例中,變異多肽包含甘胺酸取代。
在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含在P14、E311、D32、I61、G223、N109及/或D719處之取代。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如,P14R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如,P14R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E311處之取代(例如,E311R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E311處之取代(例如,E311R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32處之取代(例如,D32R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D32處之取代(例如,D32R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置I61處之取代(例如,I61R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置I61處之取代(例如,I61R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置G223處之取代(例如,G223R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置G223處之取代(例如,G223R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置N109處之取代(例如,N109R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置N109處之取代(例如,N109R取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D719處之取代(例如,D719R取代)的胺基酸序列。在一些實施例中,變異多肽包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D719處之取代(例如,D719R取代)。
在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代P14R、E311R、D32R、I61R、G223R、N109R及/或D719R。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代P14R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代E311R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代D32R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代I61R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代G223R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代N109R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含取代D719R及一個、兩個、三個或四個額外取代。在一些實施例中,變異多肽相對於SEQ ID NO: 3之親本多肽包含如表3中所示之胺基酸取代。
表3. 具有多個胺基酸取代之SEQ ID NO: 3之變異體.
取代數目 | 胺基酸取代 |
2 | P14R、E311R |
2 | P14R、D32R |
2 | P14R、I61R |
2 | P14R、G223R |
2 | E311R、D32R |
2 | E311R、I61R |
2 | E311R、G223R |
2 | D32R、I61R |
2 | D32R、G223R |
2 | I61R、G223R |
3 | P14R、E311R、D32R |
3 | P14R、E311R、I61R |
3 | P14R、E311R、G223R |
3 | P14R、D32R、I61R |
3 | P14R、D32R、G223R |
3 | P14R、I61R、G223R |
3 | E311R、D32R、I61R |
3 | E311R、D32R、G223R |
3 | E311R、I61R、G223R |
3 | D32R、I61R、G223R |
4 | P14R、E311R、D32R、I61R |
4 | P14R、E311R、D32R、G223R |
4 | P14R、E311R、I61R、G223R |
4 | P14R、D32R、I61R、G223R |
4 | E311R、D32R、I61R、G223R |
5 | P14R、E311R、D32R、I61R、G223R |
2 | D32R、N109R |
2 | N109R、G223R |
2 | N109R、E311R |
3 | D32R、N109R、G223R |
3 | D32R、N109R、E311R |
3 | N109R、G223R、E311R |
2 | D32R、D719R |
2 | N109R、D719R |
2 | G223R、D719R |
2 | E311R、D719R |
3 | D32R、N109R、D719R |
3 | D32R、G223R、D719R |
3 | D32R、E311R、D719R |
3 | N109R、G223R、D719R |
3 | N109R、E311R、D719R |
3 | G223R、E311R、D719R |
4 | D32R、N109R、G223R、E311R |
4 | D32R、N109R、G223R、D719R |
4 | D32R、N109R、E311R、D719R |
4 | D32R、G223R、E311R、D719R |
4 | N109R、G223R、E311R、D719R |
5 | D32R、N109R、G223R、E311R、D719R |
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及D32 (例如,D32R取代)處之取代的胺基酸(例如,P14R、E311R、D32R變異多肽)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及G223 (例如,G223R取代)處之取代的胺基酸(例如,P14R、E311R、G223R變異多肽)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)、D32 (例如,D32R取代)及I61 (例如,I61R取代)處之取代的胺基酸(例如,P14R、E311R、D32R及I61R變異多肽)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D32R (例如,D32R取代)、N109 (例如,N109R)、E311 (例如,E311R取代)及D719 (例如,D719R取代)處之取代的胺基酸(例如,D32R、N109R、E311R及D719R變異多肽)。
在一些實施例中,在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K208處之取代(例如,K208G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K208處之取代(例如,K208G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D302處之取代(例如,D302G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D302處之取代(例如,D302G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D590處之取代(例如,D590G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D590處之取代(例如,D590G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E154處之取代(例如,E154G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E154處之取代(例如,E154G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D567處之取代(例如,D567G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D567處之取代(例如,D567G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置L38處之取代(例如,L38G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置L38處之取代(例如,L38G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D145處之取代(例如,D145G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D145處之取代(例如,D145G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置C13處之取代(例如,C13G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置C13處之取代(例如,C13G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置T338處之取代(例如,T338G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置T338處之取代(例如,T338G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置P14處之取代(例如,P14G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置P14處之取代(例如,P14G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置D55處之取代(例如,D55G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置D55處之取代(例如,D55G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K221處之取代(例如,K221G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K221處之取代(例如,K221G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置K35處之取代(例如,K35G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置K35處之取代(例如,K35G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性且相對於SEQ ID NO: 3包含位置E736處之取代(例如,E736G取代)的胺基酸序列。在一些態樣中,本發明提供一種多肽,其包含在SEQ ID NO: 3之多達1、2、3、4、5、10、15、20、25、30或35個胺基酸位置處具有一或多個序列改變(例如取代、插入或缺失或其任何組合)的胺基酸序列,其中該等序列改變中之一者包含相對於SEQ ID NO: 3在位置E736處之取代(例如,E736G取代)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且相對於SEQ ID NO: 3包含以下位置處之取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)、E736 (例如,E736G取代)或其任何組合(例如,包含K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G、E736G中之2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部的變異多肽)。
在一些實施例中,變異多肽包含與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含:
i)選自位置P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)處之取代中之一或多者(例如,1個、2個、3個、4個、5個、6個或全部)的取代;及
ii)選自位置K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)處之取代中之一或多者(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12或全部)的取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含P14處之取代(例如,P14R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含P14R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E311處之取代(例如,E311R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含E311R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D32處之取代(例如,D32R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含D32R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置I61處之取代(例如,I61R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含I61R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置G223處之取代(例如,G223R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含G223R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置N109處之取代(例如,N109R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含N109R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置D719處之取代(例如,D719R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含D719R取代及以下中之一或多者:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如,P14R取代)、位置E311處之取代(例如,E311R取代)、位置D32處之取代(例如,D32R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代:位置K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含P14R取代、E311R取代、D32R取代及選自以下中之一或多者(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如,P14R取代)、位置E311處之取代(例如,E311R取代)、位置G223處之取代(例如,G223R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含P14R取代、E311R取代、G223R取代及選自以下中之一或多者(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置P14處之取代(例如,P14R取代)、位置E311處之取代(例如,E311R取代)、位置D32處之取代(例如,D32R取代)、I61處之取代(例如,I61R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含P14R取代、E311R取代、D32R取代、I61R取代及選自以下中之一或多者(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含位置D32處之取代(例如,D32R取代)、位置N109處之取代(例如,N109R取代)、位置E311處之取代(例如,E311R取代)、D719處之取代(例如,D719R取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)。舉例而言,在一些實施例中,變異多肽包含D32R取代、N109R取代、E311R取代、D719R取代及選自以下中之一或多者(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、D55G取代、K221G取代、K35G取代及E736G取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K208處之取代(例如,K208G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D302處之取代(例如,D302G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D590處之取代(例如,D590G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E154處之取代(例如,E154G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D567處之取代(例如,D567G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含L38處之取代(例如,L38G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D145處之取代(例如,D145G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含C13處之取代(例如,C13G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含T338處之取代(例如,T338G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含P14處之取代(例如,P14G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含D55處之取代(例如,D55G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K221處之取代(例如,K221G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含K35處之取代(例如,K35G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含及與SEQ ID NO: 3具有至少95%、96%、97%、98%或99%一致性之胺基酸序列且包含E736處之取代(例如,E736G取代)及選自以下位置處之取代中之一或多個(例如,1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個或全部)的取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223R取代)、N109 (例如,N109R取代)及D719 (例如,D719R取代)。舉例而言,在一些實施例中,變異多肽包含K208G取代及以下中之一或多者:P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及D719R取代。
在一些實施例中,變異多肽包含至少一個RuvC模體或RuvC域。
雖然本文所述之變化可為一或多個胺基酸變化,但變異多肽之變化亦可為實質性的,諸如作為胺基及/或羧基端延伸之多肽融合。舉例而言,變異多肽可含有額外肽,例如一或多種肽。額外肽之實例可包括用於進行標記之抗原決定基肽,諸如聚組胺酸標籤(His標籤)、Myc及FLAG。在一些實施例中,本文所述之變異多肽可與諸如螢光蛋白(例如綠色螢光蛋白(GFP)或黃色螢光蛋白(YFP))之可偵測部分融合。
在一些實施例中,變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核定位信號(NLS)。在一些實施例中,變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種)核輸出信號(NES)。在一些實施例中,變異多肽包含至少一種(例如兩種、三種、四種、五種、六種或更多種) NLS及至少一種(例如兩種、三種、四種、五種、六種或更多種) NES。
在一些實施例中,本文所述之變異多肽可自失活。參見Epstein等人, 「Engineering a Self-Inactivating CRISPR System for AAV Vectors」, Mol. Ther., 24 (2016): S50,其以全文引用的方式併入本文中。
在一些實施例中,編碼本文所述之變異多肽之核苷酸序列可經密碼子優化以用於特定宿主細胞或生物體。例如,核酸可經密碼子優化以用於任何非人類真核生物,包括小鼠、大鼠、兔、狗、家畜或非人類靈長類動物。密碼子使用表可容易獲得,例如可在www.kazusa.orjp/codon/獲得的「密碼子使用資料庫」,且此等表可以多種方式改寫。參見Nakamura等人
Nucl. Acids Res.28:292 (2000),其以全文引用的方式併入本文中。亦可利用電腦演算法(諸如Gene Forge (Aptagen; Jacobus, PA)),對特定序列進行密碼子優化,以在特定宿主細胞中表現。
變異多肽之功能性如本文所用,「生物活性部分」為保留親本多肽之至少一種功能(例如完全、部分、最小)之部分(例如「最小」或「核心」域)。在一些實施例中,變異多肽保留至少與親本多肽一樣之活性的酶活性。因此,在一些實施例中,變異多肽具有大於親本多肽之酶活性。
在一些實施例中,變異多肽具有減少之核酸酶活性或為核酸酶死亡多肽。如本文所用,本文揭示之多肽之催化殘基包含D328及E530。在一些實施例中,包含D328及E530處之取代(例如D328A及E530A)之變異多肽相對於親本多肽展現減少之核酸酶活性或無核酸酶活性。在一些實施例中,包含D684、D646或D621處之取代(例如D684A、D646A或D621A)之變異多肽相對於親本多肽展現減少之核酸酶活性或無核酸酶活性。
在一態樣中,本發明提供用於將改變或突變引入至親本多肽序列中以增強二元複合物形成、RNA引導結合活性及/或RNA引導結合特異性之方法。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中以增強三元複合物形成、正中目標結合親和力、正中目標結合活性、正中目標結合及/或正中目標結合特異性之方法。在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中以增強二元複合物(例如核糖核蛋白)之正中目標結合親和力(例如與目標相互作用之親和力或所花費之時間)、正中目標結合活性、正中目標結合(例如與目標之相互作用之強度)及/或正中目標結合特異性(例如對特定目標之偏好)之方法。在一些實施例中,將改變或突變引入至親本多肽序列中以產生具有增加之正中目標結合及/或活性之變異多肽。此外,在此類實施例中,與親本多肽相比,變異多肽中之偏離目標結合及/或活性可減少。此外,對比偏離目標結合關於正中目標結合之特異性可增加或減少。在一些實施例中,將改變或突變引入至親本多肽序列中以產生當與RNA引導複合時具有增加之正中目標結合之變異多肽。此外,在此類實施例中,在包含變異多肽及RNA引導之複合物中偏離目標結合可減少。此外,對比偏離目標結合/活性關於正中目標結合/活性之特異性可增加或減少。在某些實施例中,將改變或突變引入至親本多肽序列中以產生增強穩定性及/或蛋白質-RNA相互作用之變異多肽。在某些實施例中,與親本多肽相比,變異多肽包括至少一個促進變異多肽之穩定性及/或RNA相互作用以及酶活性的改變。
在一些實施例中,本發明之變異多肽具有相當於或超過親本多肽之酶活性。在一些實施例中,本發明之變異多肽在約20℃至約90℃之溫度範圍內具有酶活性。在一些實施例中,本發明之變異多肽在約20℃至約25℃之溫度下或在約37℃之溫度下具有酶活性。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強對RNA之親和力(例如RNA親和力)之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之RNA親和力。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之RNA親和力。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之RNA親和力。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之RNA親和力。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強與RNA引導之複合物形成(例如二元複合物形成)之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之二元複合物形成。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之二元複合物形成。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之二元複合物形成。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之二元複合物形成。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強對RNA引導之結合活性之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之RNA引導結合活性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之RNA引導結合活性。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之RNA引導結合活性。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之RNA引導結合活性。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強對RNA引導之結合特異性之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之RNA引導結合特異性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之RNA引導結合特異性。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之RNA引導結合特異性。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之RNA引導結合特異性。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強蛋白質-RNA相互作用之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之蛋白質-RNA相互作用。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之蛋白質-RNA相互作用。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之蛋白質-RNA相互作用。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之蛋白質-RNA相互作用。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強蛋白質穩定性之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之蛋白質穩定性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之蛋白質穩定性。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之蛋白質穩定性。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之蛋白質穩定性。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個減少自RNA引導之解離(例如,二元複合物解離)之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現減少之自RNA引導之解離。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現減少之自RNA引導之解離。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現減少之自RNA引導之解離。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現減少之自RNA引導之解離。在一些實施例中,在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者之培育時期內,與親本多肽相比,變異多肽展現減少之自RNA引導之解離。在一些實施例中,變異核糖核蛋白(RNP)複合物不將RNA引導交換成不同RNA。
在一些實施例中,與親本多肽相比,變異多肽包含至少一個增強與RNA引導及目標核酸之三元複合物形成之改變。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本多肽相比,變異多肽展現增強之三元複合物形成。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本多肽相比,變異多肽展現增強之三元複合物形成。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本多肽相比,變異多肽展現增強之三元複合物形成。在一個實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少8℃時,變異多肽展現增強之三元複合物形成。
在一些實施例中,變異多肽包含至少一個改變,使得與親本二元複合物相比,包含變異多肽之二元複合物(例如,變異二元複合物)展現增強之對目標核酸之結合親和力。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本二元複合物相比,變異二元複合物展現增強之對目標核酸之結合親和力。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本二元複合物相比,變異二元複合物展現增強之對目標核酸之結合親和力。在一些實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,與親本二元複合物相比,變異二元複合物展現增強之對目標核酸之結合親和力。在一個實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少8℃時,變異二元複合物展現增強之對目標核酸之結合親和力。
在一些實施例中,變異多肽包含至少一個改變,使得與親本二元複合物相比,包含變異多肽之二元複合物(例如,變異二元複合物)展現增強之正中目標結合活性。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合活性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合活性。在一些實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合活性。在一個實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少8℃時,變異二元複合物展現增強之正中目標結合活性。
在一些實施例中,變異多肽包含至少一個改變,使得與親本二元複合物相比,包含變異多肽之二元複合物(例如,變異二元複合物)展現增強之正中目標結合特異性。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合特異性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合特異性。在一些實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃,與親本二元複合物相比,變異二元複合物展現增強之正中目標結合特異性。在一個實施例中,當變異二元複合物之T
m值比親本二元複合物之T
m值大至少8℃時,變異二元複合物展現增強之正中目標結合特異性。
在一些實施例中,變異多肽包含至少一個改變,使得與親本二元複合物相比,包含變異多肽之二元複合物(例如,變異二元複合物)展現減少之與非目標核酸之偏離目標結合。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本二元複合物相比,變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本二元複合物相比,變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本二元複合物相比,變異二元複合物展現減少之與非目標核酸之偏離目標結合。在一個實施例中,當變異二元複合物之T
m值比親本多肽之T
m值大至少8℃時,變異二元複合物展現減少之與非目標核酸之偏離目標結合。
在一些實施例中,變異多肽包含至少一個改變,使得與親本二元複合物相比,包含變異多肽之二元複合物(例如,變異二元複合物)展現減少之自目標核酸之解離。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本二元複合物相比,變異二元複合物展現減少之自目標核酸之解離。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本二元複合物相比,變異二元複合物展現減少之自目標核酸之解離。在一些實施例中,當變異多肽之T
m值比親本多肽之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本二元複合物相比,變異二元複合物展現減少之自目標核酸之解離。在一個實施例中,當變異二元複合物之T
m值比親本多肽之T
m值大至少8℃時,變異二元複合物展現減少之自目標核酸之解離。
在一些實施例中,變異多肽包含至少一個改變,使得與親本三元複合物相比,包含變異多肽之三元複合物(例如,變異三元複合物)展現增強之穩定性。在一些實施例中,在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃或65℃中之任一者的溫度下,與親本三元複合物相比,變異三元複合物展現增強之穩定性。在一些實施例中,在具有在約7.3至約8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值的緩衝液中,與親本三元複合物相比,變異三元複合物展現增強之穩定性。在一些實施例中,當變異三元複合物之T
m值比親本三元複合物之T
m值大至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃或20℃時,與親本三元複合物相比,變異三元複合物展現增強之穩定性。在一個實施例中,當變異三元複合物之T
m值比親本三元複合物之T
m值大至少8℃時,變異三元複合物展現增強之穩定性。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA親和力的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之二元複合物形成的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA引導結合活性的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之RNA引導結合特異性的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之蛋白質-RNA相互作用的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之蛋白質穩定性的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)減少之自RNA引導之解離的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)減少之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)增加之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於SEQ ID NO: 3之親本多肽展現(a)保留之酶活性及(b)增強之三元複合物形成的變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)減少之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)增加之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)保留之酶活性及(b)增強之對目標核酸之結合親和力的變異二元複合物之變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)減少之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)增加之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)保留之酶活性及(b)增強之正中目標結合活性的變異二元複合物之變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)減少之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)增加之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)保留之酶活性及(b)增強之正中目標結合特異性的變異二元複合物之變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)減少之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)增加之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)保留之酶活性及(b)減少之與非目標核酸之偏離目標結合的變異二元複合物之變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)減少之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)增加之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中,將至少一個改變引入至SEQ ID NO: 3之親本多肽中以產生相對於包含SEQ ID NO: 3之多肽之親本二元複合物,形成展現(a)保留之酶活性及(b)減少之自目標核酸之解離的變異二元複合物之變異多肽。在一些實施例中,具有如本文所述之特徵之變異多肽包含與包含表2之取代及/或表3之取代之多肽具有至少約60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致性的胺基酸序列。
RNA 引導在一些實施例中,如本文所述之組合物或複合物包含結合目標核酸且與變異多肽相互作用之靶向部分(例如RNA引導、反義、寡核苷酸、肽寡核苷酸結合物)。靶向部分可結合目標核酸(例如以特異性結合親和力結合目標核酸)。
在一些實施例中,靶向部分包含或為RNA引導。在一些實施例中,RNA引導將本文所述之變異多肽導引至特定核酸序列。熟習此項技術者閱讀RNA引導之特定種類之以下實例,將瞭解在一些實施例中,RNA引導為位點特異性的。亦即,在一些實施例中,RNA引導與一或多種目標核酸序列(例如特定DNA或基因體DNA序列)特異性締合,且不與非目標核酸序列(例如非特定DNA或隨機序列)締合。
在一些實施例中,如本文所述之組合物包含與本文所述之變異多肽締合且將變異多肽導引至目標核酸序列(例如DNA)的RNA引導。
RNA引導可靶向(例如締合、針對、接觸或結合)目標序列之一或多個核苷酸,例如位點特異性序列或位點特異性目標。在一些實施例中,在結合於與RNA引導中之DNA靶向序列互補之目標核酸(例如序列特異性受質或目標核酸)之後,活化變異核糖核蛋白(例如變異CRISPR核酸酶多肽加RNA引導)。
在一些實施例中,RNA引導包含具有約11個核苷酸至約100個核苷酸之長度的間隔子。例如,DNA靶向區段之長度可為約11個核苷酸至約80個核苷酸、約11個核苷酸至約50個核苷酸、約11個核苷酸至約40個核苷酸、約11個核苷酸至約30個核苷酸、約11個核苷酸至約25個核苷酸、約11個核苷酸至約20個核苷酸或約11個核苷酸至約19個核苷酸。例如,間隔子之長度可為約19個核苷酸至約20個核苷酸、約19個核苷酸至約25個核苷酸、約19個核苷酸至約30個核苷酸、約19個核苷酸至約35個核苷酸、約19個核苷酸至約40個核苷酸、約19個核苷酸至約45個核苷酸、約19個核苷酸至約50個核苷酸、約19個核苷酸至約60個核苷酸、約19個核苷酸至約70個核苷酸、約19個核苷酸至約80個核苷酸、約19個核苷酸至約90個核苷酸、約19個核苷酸至約100個核苷酸、約20個核苷酸至約25個核苷酸、約20個核苷酸至約30個核苷酸、約20個核苷酸至約35個核苷酸、約20個核苷酸至約40個核苷酸、約20個核苷酸至約45個核苷酸、約20個核苷酸至約50個核苷酸、約20個核苷酸至約60個核苷酸、約20個核苷酸至約70個核苷酸、約20個核苷酸至約80個核苷酸、約20個核苷酸至約90個核苷酸或約20個核苷酸至約100個核苷酸。
在一些實施例中,RNA引導之間隔子通常可經設計以具有11個至50個核苷酸(例如,11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個核苷酸)之長度且與特定目標核酸序列互補。在一些特定實施例中,RNA引導可經設計以與例如基因體之基因座的特定DNA股互補。在一些實施例中,DNA靶向序列經設計以與例如基因體之基因座的特定DNA股互補。
RNA引導可與參考核酸序列之互補股實質上一致。在一些實施例中,RNA引導包含與參考核酸序列,例如目標核酸之互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性的序列。兩個此類核酸之間的一致性百分比可藉由檢查兩個最佳比對之核酸序列或藉由使用軟體程式或演算法(例如BLAST、ALIGN、CLUSTAL)使用標準參數手動確定。
在一些實施例中,RNA引導與目標核酸之互補股具有至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約91%、至少約92%、至少約93%、至少約94%、至少約95%、至少約96%、至少約97%、至少約98%、至少約99%或至少約99.5%序列一致性。
在一些實施例中,RNA引導包含長度為11至50個核苷酸(例如,11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個核苷酸)且與目標核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的間隔子。在一些實施例中,RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含長度為至多50且與目標核酸至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補的序列,例如RNA序列。在一些實施例中,RNA引導包含與目標DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。在一些實施例中,RNA引導包含與目標基因體序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互補之序列。
在某些實施例中,RNA引導包括連接於DNA靶向序列之正向重複序列、基本上由其組成或包含其。在一些實施例中,RNA引導包括正向重複序列及DNA靶向序列或正向重複-DNA靶向序列-正向重複序列。在一些實施例中,RNA引導包括截短之正向重複序列及DNA靶向序列,此為經加工或成熟crRNA典型的。在一些實施例中,本文所述之變異多肽與RNA引導形成複合物,且RNA引導導引複合物與位點特異性目標核酸締合,該位點特異性目標核酸與RNA引導之至少一部分互補。
在一些實施例中,正向重複序列與表4中所示之序列或表4中所示之序列之一部分至少90%一致。在一些實施例中,正向重複序列與表4中所示之序列或表4中所示之序列之一部分至少95%一致。在一些實施例中,正向重複序列與表4中所示之序列或表4中所示之序列之一部分一致。
表4.正向重複序列
序列識別符 | 正向重複序列 |
SEQ ID NO: 4 | CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAAC |
SEQ ID NO: 5 | CUUGUUGUAUAUACGCUUUUAUAGGUAUUAAACAAC |
SEQ ID NO: 6 | CUUGUUGUAUAUACGCUUUUAUAGGUAUUGAACAAC |
SEQ ID NO: 7 | CUUGUUGUAUAUAUCCUUUUAUAGAUAUUAAACAGC |
SEQ ID NO: 8 | CUUGUUGUAUAUAUCCUUUUAUAGAUGUUGAACAAC |
SEQ ID NO: 9 | CUUGUUGUAUAUAUCCUUUUAUAGGUGUUGAACAAC |
SEQ ID NO: 10 | CUUGUUGUAUAUAUCCUUUUAUGGGUGUAUAACAAC |
SEQ ID NO: 11 | CUUGUUGUAUAUGUCCUUUUAUAGGUAUUUGAACAAC |
SEQ ID NO: 12 | CUUGUUGUAUAUGUCUUUUUAUAGGUAUUGAACAAC |
SEQ ID NO: 13 | CUUGUUGUGUAUAUCCUUUUAUAGGUAUUGAACAAC |
在一些實施例中,正向重複序列包含闡述為CUUGUUGUN
1UAU之序列(SEQ ID NO: 14),其中N
1為A或G。在一些實施例中,正向重複序列包含闡述為UUUUAUN
1GN
2UN
3U之序列(SEQ ID NO: 15),其中N
1為A或G,N
2為A或G,且N
3為A或G。
在一些實施例中,本文所述之組合物或複合物包括一或多種(例如兩種、三種、四種、五種、六種、七種、八種或更多種) RNA引導,例如複數種RNA引導。
在一些實施例中,RNA引導具有類似於例如國際公開案第WO 2014/093622號及第WO 2015/070083號(各者之全部內容以引用的方式併入本文中)之結構。
除非另外指出,否則本文提供之所有組合物及複合物及多肽均參考組合物或複合物或多肽之活性劑含量製得,且不包括可存在於市售來源中之雜質,例如殘餘溶劑或副產物。酶組分重量係基於總活性蛋白質。除非另有指示,否則所有百分比及比率係以重量計。除非另有指示,否則所有百分比及比率係基於總組合物計算。在例示組合物中,按總組合物之重量計,酶含量由純酶表示,且除非另外說明,否則成分按總組合物之重量計來表示。
修飾 RNA引導或編碼變異多肽之任一核酸序列可包括對參考序列,尤其親本聚核糖核苷酸之一或多種共價修飾,包括於本發明之範疇內。
示例性修飾可包括對糖、核鹼基、核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)及其任何組合之任何修飾。以下詳細描述本文提供之一些示例性修飾。
RNA引導或編碼變異多肽之組分的任一核酸序列可包括諸如對糖、核鹼基或核苷間鍵聯(例如連接磷酸酯/磷酸二酯鍵聯/磷酸二酯主鏈)之任何適用修飾。嘧啶核鹼基之一或多個原子可經視情況經取代之胺基、視情況經取代之硫醇、視情況經取代之烷基(例如甲基或乙基)或鹵基(例如氯或氟)置換或取代。在某些實施例中,修飾(例如一或多個修飾)存在於糖及核苷間鍵聯中之每一者中。修飾可為核糖核酸(RNA)修飾成去氧核糖核酸(DNA)、蘇糖核酸(TNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)或其混雜物。本文描述額外修飾。
在一些實施例中,修飾可包括化學或細胞誘導之修飾。舉例而言,細胞內RNA修飾之一些非限制性實例由Lewis及Pan在「RNA modifications and structures cooperate to guide RNA-protein interactions」, Nat Reviews Mol Cell Biol, 2017, 18:202-210中描述。
不同糖修飾、核苷酸修飾及/或核苷間鍵聯(例如主鏈結構)可存在於序列中之多個位置。一般技術者將瞭解,核苷酸類似物或其他修飾可位於序列之任何位置,使得實質上不減少序列之功能。序列可包括約1%至約100%經修飾之核苷酸(相對於總核苷酸含量,或相對於一或多種類型之核苷酸,亦即A、G、U或C中之任一者或多者)或任何中間百分比(例如,1%至20%>、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%及95%至100%)。
在一些實施例中,序列之一或多個核糖核苷酸的糖修飾(例如在2'位置或4'位置)或糖置換以及主鏈修飾可包括磷酸二酯鍵聯之修飾或置換。序列之特定實例包括但不限於包括經修飾之主鏈或無天然核苷間鍵聯(諸如核苷間修飾),包括磷酸二酯鍵聯之修飾或置換的序列。具有經修飾主鏈之序列尤其包括主鏈中不具有磷原子者。出於本申請案之目的,且如此項技術中有時提及,在核苷間主鏈中不具有磷原子之經修飾之RNA亦可視為寡核苷。在特定實施例中,序列將包括在核苷間主鏈中具有磷原子之核糖核苷酸。
經修飾之序列主鏈可包括例如硫代磷酸酯;對掌性硫代磷酸酯;二硫代磷酸酯;磷酸三酯;胺基烷基磷酸三酯;甲基及其他烷基膦酸酯,諸如3'-伸烷基膦酸酯及對掌性膦酸酯;亞膦酸酯;胺基磷酸酯,諸如具有正常3'-5'鍵聯之3'-胺基胺基磷酸酯及胺基烷基胺基磷酸酯、硫代胺基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯及硼烷磷酸酯、其2'-5'連接之類似物及具有反向極性之胺基磷酸酯,其中相鄰的核苷單元對以3'-5'至5'-3'或2'-5'至5'-2'連接。亦包括各種鹽、混合鹽及游離酸形式。在一些實施例中,該序列可帶負電荷或帶正電荷。
可併入序列中之經修飾之核苷酸可在核苷間鍵聯(例如磷酸酯主鏈)上進行修飾。在本文中,在聚核苷酸主鏈之上下文中,片語「磷酸酯」及「磷酸二酯」可互換使用。主鏈磷酸基可藉由用不同取代基置換一或多個氧原子來修飾。此外,經修飾之核苷及核苷酸可包括用如本文所述之另一核苷間鍵聯大規模置換未經修飾之磷酸酯部分。經修飾之磷酸基之實例包括但不限於硫代磷酸酯、硒代磷酸酯、硼烷磷酸酯(boranophosphate)、硼烷磷酸酯(boranophosphate ester)、氫膦酸酯、胺基磷酸酯、二胺基磷酸酯、烷基或芳基膦酸酯及磷酸三酯。二硫代磷酸酯之兩個非連接氧均經硫置換。磷酸酯連接子亦可藉由用氮(橋接胺基磷酸酯)、硫(橋接硫代磷酸酯)及碳(橋接亞甲基-膦酸酯)置換連接氧而修飾。
提供經α-硫基取代之磷酸酯部分以經由非天然硫代磷酸酯主鏈鍵聯賦予RNA及DNA聚合物穩定性。硫代磷酸酯DNA及RNA具有增加之核酸酶抗性,且隨後在細胞環境中之半衰期更長。
在特定實施例中,經修飾之核苷包括α-硫基-核苷(例如5'-
O-(1-硫代磷酸酯)-腺苷、5'-
O-(1-硫代磷酸酯)-胞苷(a-硫基-胞苷)、5'-
O-(1-硫代磷酸酯)-鳥苷、5'-
O-(1-硫代磷酸酯)-尿苷或5'-
O-(1-硫代磷酸酯)-假尿苷)。
本文描述可根據本發明採用之其他核苷間鍵聯,包括不含磷原子之核苷間鍵聯。
在一些實施例中,序列可包括一或多種細胞毒性核苷。例如,細胞毒性核苷可併入至序列中,諸如雙官能修飾。細胞毒性核苷可包括(但不限於)阿糖腺苷、5-氮雜胞苷、4'-硫基-阿糖胞苷、環戊烯基胞嘧啶、克拉屈濱(cladribine)、氯法拉濱(clofarabine)、阿糖胞苷(cytarabine)、阿拉伯糖苷胞嘧啶、1-(2-C-氰基-2-去氧-β-D-阿拉伯-呋喃戊醣基)-胞嘧啶、地西他濱(decitabine)、5-氟尿嘧啶(5-fluorouracil)、氟達拉賓(fludarabine)、氟尿苷(floxuridine)、吉西他濱(gemcitabine)、喃氟啶(tegafur)與尿嘧啶之組合、喃氟啶((RS)-5-氟-1-(四氫呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他濱(troxacitabine)、替紮他濱(tezacitabine)、2'-去氧-2'-亞甲基胞嘧啶核苷(DMDC)及6-巰基嘌呤(6-mercaptopurine)。額外實例包括磷酸氟達拉濱(fludarabine phosphate)、N4-二十二烷醯基-1-β-D-阿糖呋喃胞嘧啶、N4-十八烷基-1-β-D-阿糖呋喃胞嘧啶、N4-棕櫚醯基-1-(2-C-氰基-2-去氧-β-D-阿拉伯-呋喃戊醣基)胞嘧啶及P-4055 (阿糖胞苷5'-反油酸酯)。
在一些實施例中,序列包括一或多種轉錄後修飾(例如加帽、裂解、多腺苷酸化、剪接、多腺苷酸序列、甲基化、醯化、磷酸化、離胺酸及精胺酸殘基之甲基化、乙醯化及硫醇基及酪胺酸殘基之亞硝基化等)。一或多個轉錄後修飾可為任何轉錄後修飾,諸如已在RNA中鑑別之超過一百個不同核苷修飾中之任一者(Rozenski, J, Crain, P, 及McCloskey, J. (1999). The RNA Modification Database: 1999更新. Nucl Acids Res 27: 196-197)。在一些實施例中,第一分離之核酸包含信使RNA (mRNA)。在一些實施例中,mRNA包含至少一種選自由以下組成之群的核苷:吡啶-4-酮核苷、5-氮雜-尿苷、2-硫基-5-氮雜-尿苷、2-硫代尿苷、4-硫基-假尿苷、2-硫基-假尿苷、5-羥基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基尿苷、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫基-尿苷、1-牛磺酸甲基-4-硫基-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫基-1-甲基-假尿苷、2-硫基-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫基-1-甲基-1-去氮-假尿苷、二氫尿苷、二氫假尿苷、2-硫基-二氫尿苷、2-硫基-二氫假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫基-尿苷、4-甲氧基-假尿苷及4-甲氧基-2-硫基-假尿苷。在一些實施例中,mRNA包含至少一種選自由以下組成之群的核苷:5-氮雜-胞苷、假異胞苷、3-甲基-胞苷、N4-乙醯基胞苷、5-甲醯基胞苷、N4-甲基胞啶、5-羥甲基胞苷、1-甲基-假異胞苷、吡咯并-胞苷、吡咯并-假異胞苷、2-硫基-胞苷、2-硫基-5-甲基-胞苷、4-硫基-假異胞苷、4-硫基-1-甲基-假異胞苷、4-硫基-1-甲基-1-去氮-假異胞苷、1-甲基-1-去氮-假異胞苷、澤布拉恩(zebularine)、5-氮雜-澤布拉恩、5-甲基-澤布拉恩、5-氮雜-2-硫基-澤布拉恩、2-硫基-澤布拉恩、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假異胞苷及4-甲氧基-1-甲基-假異胞苷。在一些實施例中,mRNA包含至少一種選自由以下組成之群的核苷:2-胺基嘌呤、2,6-二胺基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮雜-腺嘌呤、7-去氮-2-胺基嘌呤、7-去氮-8-氮雜-2-胺基嘌呤、7-去氮-2,6-二胺基嘌呤、7-去氮-8-氮雜-2,6-二胺基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-異戊烯基腺苷、N6-(順式-羥基異戊烯基)腺苷、2-甲硫基-N6-(順式-羥基異戊烯基)腺苷、N6-甘胺醯基胺甲醯基腺苷、N6-蘇胺醯基胺甲醯基腺苷、2-甲硫基-N6-蘇胺醯基胺甲醯基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤及2-甲氧基-腺嘌呤。在一些實施例中,mRNA包含至少一種選自由以下組成之群的核苷:肌苷、1-甲基-肌苷、懷俄苷(wyosine)、懷俄丁苷(wybutosine)、7-去氮-鳥苷、7-去氮-8-氮雜-鳥苷、6-硫基-鳥苷、6-硫基-7-去氮-鳥苷、6-硫基-7-去氮-8-氮雜-鳥苷、7-甲基-鳥苷、6-硫基-7-甲基-鳥苷、7-甲基肌苷、6-甲氧基-鳥苷、1-甲基鳥苷、N2-甲基鳥苷、N2,N2-二甲基鳥苷、8-側氧基-鳥苷、7-甲基-8-側氧基-鳥苷、1-甲基-6-硫基-鳥苷、N2-甲基-6-硫基-鳥苷及N2,N2-二甲基-6-硫基-鳥苷。
序列可沿分子之整個長度統一修飾或可不統一修飾。例如,一或多種或所有類型之核苷酸(例如天然存在之核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中之任一或多個或所有)可在序列中或在其給定預定序列區中統一修飾或可不統一修飾。在一些實施例中,序列包括假尿苷。在一些實施例中,序列包括肌苷,其可幫助免疫系統將序列表徵為內源性RNA與病毒RNA。肌苷之併入亦可介導改善之RNA穩定性/減少之降解。參見例如Yu, Z.等人(2015) RNA editing by ADAR1 marks dsRNA as 「self」. Cell Res. 25, 1283-1284,其以全文引用的方式併入本文中。
目標核酸本文揭示之方法適用於多種目標核酸。在一些實施例中,目標核酸為DNA,諸如DNA基因座。在一些實施例中,目標核酸為RNA,諸如RNA基因座或mRNA。在一些實施例中,目標核酸為單股(例如單股DNA)。在一些實施例中,目標核酸為雙股(例如雙股DNA)。在一些實施例中,目標核酸包含單股與雙股區域。在一些實施例中,目標核酸為線性的。在一些實施例中,目標核酸為環狀的。在一些實施例中,目標核酸包含一或多種經修飾之核苷酸,諸如甲基化核苷酸、受損核苷酸或核苷酸類似物。在一些實施例中,目標核酸未經修飾。
目標核酸可具有任何長度,諸如約以下中之至少任一者:100 bp、200 bp、500 bp、1000 bp、2000 bp、5000 bp、10 kb、20 kb、50 kb、100 kb、200 kb、500 kb、1 Mb或更長。目標核酸亦可包含任何序列。在一些實施例中,目標核酸富含GC,諸如具有至少約40%、45%、50%、55%、60%、65%或更高中之任一者的GC含量。在一些實施例中,目標核酸具有至少約70%、80%或更多之GC含量。在一些實施例中,目標核酸為非富含GC之目標核酸中的富含GC片段。在一些實施例中,目標核酸不富含GC。在一些實施例中,目標核酸具有一或多種二級結構或更高階結構。在一些實施例中,目標核酸不呈縮合狀態,諸如染色質,致使變異多肽/RNA引導複合物無法接近目標核酸。
在一些實施例中,目標核酸存在於細胞中。在一些實施例中,目標核酸存在於細胞之細胞核中。在一些實施例中,目標核酸為細胞內源性的。在一些實施例中,目標核酸為基因體DNA。在一些實施例中,目標核酸為染色體DNA。在一個實施例中,目標核酸為染色體外核酸。在一些實施例中,目標核酸為蛋白質編碼基因或其功能區域,諸如編碼區,或調控元件,諸如啟動子、強化子、5'或3'未轉譯區等。在一些實施例中,目標核酸為非編碼基因,諸如轉座子、miRNA、tRNA、核糖體RNA、核糖核酸酶或lincRNA。在一些實施例中,目標核酸為質體。
在一些實施例中,目標核酸為細胞外源性的。在一些實施例中,目標核酸為病毒核酸,諸如病毒DNA或病毒RNA。在一些實施例中,目標核酸為水平轉移質體。在一些實施例中,目標核酸整合於細胞之基因體中。在一些實施例中,目標核酸不整合於細胞之基因體中。在一些實施例中,目標核酸為細胞中之質體。在一些實施例中,目標核酸存在於染色體外陣列中。
在一些實施例中,目標核酸為經分離之核酸,諸如經分離之DNA或經分離之RNA。在一些實施例中,目標核酸存在於無細胞環境中。在一些實施例中,目標核酸為經分離之載體,諸如質體。在一些實施例中,目標核酸為超純質體。
目標核酸為與RNA引導雜交之目標核酸之區段。在一些實施例中,目標核酸僅具有目標核酸之一個複本。在一些實施例中,目標核酸具有目標核酸之超過一個複本,諸如至少約2、3、4、5、10、100或更多個複本中之任一者。例如,變異核糖核蛋白可靶向在病毒核酸或細菌之基因體中包含重複序列之目標核酸。
目標序列與如本文所述之本發明之原間隔子相鄰模體或PAM相鄰。PAM可緊鄰目標序列或例如在目標序列之少數(例如1、2、3、4或5個)核苷酸內。在雙股目標之情況下,靶向部分(例如RNA引導)結合於目標之第一股且如本文所述之PAM序列存在於第二互補股中。在此類情況下,PAM序列緊鄰(或在少數,例如1、2、3、4或5個核苷酸內)第二股中與結合部分結合之第一股中之序列互補的序列。
在一些實施例中,序列特異性要求RNA引導中之間隔子序列與目標核酸之非PAM股完整匹配。在其他實施例中,序列特異性要求RNA引導中之間隔子序列與目標核酸之非PAM股部分(相連或不相連)匹配。
在一些實施例中,RNA引導或包含RNA引導及本文所述之變異多肽之複合物在由RNA引導與目標核酸之間的互補區界定之序列結合於目標核酸。在一些實施例中,本文所述之PAM序列正好位於目標核酸之目標序列上游(例如正好目標序列之5')。在一些實施例中,本文所述之PAM序列正好位於目標核酸之非間隔子互補股(例如非目標股)上的目標序列之5'。
在一些實施例中,與本發明之變異多肽相對應之PAM包括5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'。如本文所用,N可各自為任何核苷酸(例如,A、G、T或C)或其子集(例如,R (A或G)、Y (C或T)、K (G或T)、B (G、T或C)、H (A、C或T)。在一些實施例中,PAM包含5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'。在一些實施例中,包含本發明之變異多肽的二元複合物結合於與5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3'序列相鄰之目標核酸。在一些實施例中,包含本發明之變異多肽的二元複合物結合於與5'-GTTA-3'、5'-TTTG-3'、5'-CTTG-3'、5'-GTTG-3'、5'-TTTA-3'、5'-CTTA-3'、5'-ATTG-3'、5'-ATTA-3'、5'-ACTG-3'、5'-CATA-3'、5'-TTGA-3'或5'-TATA-3'序列相鄰之目標核酸。
在一些實施例中,目標核酸存在於目標核酸之容易接近區域中。在一些實施例中,目標核酸在目標基因之外顯子中。在一些實施例中,目標核酸跨越目標基因之外顯子-內含子接合處。在一些實施例中,目標核酸存在於非編碼區域,諸如基因之調控區域中。在目標核酸為細胞外源性之一些實施例中,目標核酸包含在細胞之基因體中未發現的序列。
適合DNA/RNA結合條件包括細胞中通常存在之生理條件。其他適合DNA/RNA結合條件(例如無細胞系統中之條件)係此項技術中已知的;參見例如Sambrook, 見上文。與RNA引導互補及雜交的目標核酸之股稱為「互補股」,且與「互補股」互補(且因此不與RNA引導互補)之目標核酸之股稱為「非互補股(noncomplementary strand)」或「非互補股(non-complementary strand)」。
製備在一些實施例中,本發明之變異多肽可藉由以下來製備:(a)培養細菌,產生本發明之變異多肽,分離變異多肽,視情況,純化變異多肽,且將變異多肽與RNA引導複合。變異多肽亦可藉由(b)已知之基因工程改造技術來製備,具體而言,自細菌分離編碼本發明之變異多肽之基因,構築重組表現載體,且接著將載體轉移至表現RNA引導之適當宿主細胞中以在宿主細胞中表現與RNA引導形成複合物之重組蛋白。或者,變異多肽可藉由(c)活體外偶合轉錄-轉譯系統製備且接著與RNA引導形成複合物。可用於製備本發明之變異多肽的細菌不受特別限制,只要其可產生本發明之變異多肽即可。細菌之一些非限制性實例包括本文所述之大腸桿菌細胞。
載體本發明提供用於表現本文所述之變異多肽的載體或編碼本文所述之變異體之核酸可併入至載體中。在一些實施例中,本發明之載體包括編碼變異多肽之核苷酸序列。在一些實施例中,本發明之載體包括編碼變異多肽之核苷酸序列。
本發明亦提供一種可用於製備如本文所述之變異多肽或包含變異多肽之組合物的載體。在一些實施例中,本發明包括細胞中之本文所述之組合物或載體。在一些實施例中,本發明包括一種在細胞中表現包含變異多肽之組合物或編碼變異多肽之載體或核酸的方法。該方法可包含提供組合物,例如載體或核酸且遞送組合物至細胞之步驟。
天然或合成聚核苷酸之表現通常藉由將編碼所關注之基因之聚核苷酸,例如編碼變異多肽之核苷酸序列可操作地連接於啟動子且將構築體併入至表現載體中來實現。表現載體不受特別限制,只要其包括編碼本發明之變異多肽之聚核苷酸且可適合於在真核細胞中複製及整合即可。
典型表現載體包括可用於所需聚核苷酸表現之轉錄及轉譯終止子、起始序列及啟動子。例如,可使用攜帶RNA聚合酶之識別序列的質體載體(pSP64、pBluescript等)。包括來源於反轉錄病毒(諸如慢病毒)之載體的載體為適於實現長期基因轉移之工具,此係因為其允許長期穩定地整合轉殖基因及其在子細胞中之傳播。載體之實例包括表現載體、複製載體、探針產生載體及定序載體。表現載體可呈病毒載體形式提供至細胞。
病毒載體技術係此項技術中熟知的且描述於多個病毒學及分子生物學手冊中。適用作載體之病毒包括但不限於噬菌體病毒、反轉錄病毒、腺病毒、腺相關病毒、疱疹病毒及慢病毒。一般而言,適合載體含有在至少一種生物體中發揮功能之複製起點、啟動子序列、適宜限制性核酸內切酶位點及一或多種可選擇標記物。
載體種類不受特別限制,且宜選擇可在宿主細胞中表現之載體。更特定而言,視宿主細胞之種類而定,宜選擇確保變異多肽自聚核苷酸表現之啟動子序列,且將此啟動子序列及聚核苷酸插入至各種質體等中之任一者中以製備表現載體。
額外啟動子元件(例如,強化序列)調控轉錄起始頻率。通常,此等元件位於起始位點上游30-110 bp區中,不過多個啟動子最近已展示含有亦位於起始位點下游之功能元件。視啟動子而定,個別元件似乎可合作地或獨立地起活化轉錄之功能。
此外,本發明不應限於使用組成性啟動子。亦考慮誘導性啟動子作為本發明之一部分。誘導性啟動子之使用提供分子開關,其能夠在需要此類表現時打開其可操作地連接之聚核苷酸序列之表現或在不需要表現時關閉表現。誘導性啟動子之實例包括(但不限於)金屬硫蛋白啟動子、糖皮質激素啟動子、孕酮啟動子及四環素啟動子。
待引入之表現載體亦可含有可選標記基因或報導基因或兩者以有助於自設法經由病毒載體轉染或感染之細胞群體鑑別及選擇表現細胞。在其他態樣中,可選標記物可攜載於單獨的DNA段上且用於共轉染程序。可選標記基因及報導基因皆可側接適當轉錄控制序列以使得能夠在宿主細胞中表現。此類標記物之實例包括用於真核細胞培養之二氫葉酸還原酶基因及新黴素抗性基因;及用於大腸桿菌及其他細菌培養之四環素抗性基因及安比西林(ampicillin)抗性基因。藉由使用此類選擇標記物,可證實編碼本發明之變異多肽之聚核苷酸是否已轉移至宿主細胞中且接著無故障地表現。
用於重組表現載體之製備方法不受特別限制,且其實例包括使用質體、噬菌體或黏質體之方法。
表現方法本發明包括一種用於表現蛋白質之方法,其包含將本文所述之變異多肽轉譯。
在一些實施例中,本文所述之宿主細胞用於表現變異多肽。宿主細胞不受特別限制,且較佳可使用各種已知細胞。宿主細胞之特定實例包括細菌,諸如大腸桿菌、酵母(出芽酵母、釀酒酵母(
Saccharomyces cerevisiae)及裂變酵母、粟酒裂殖酵母(
Schizosaccharomyces pombe))、線蟲(秀麗隱桿線蟲(
Caenorhabditis elegans))、非洲爪蟾(
Xenopus laevis)卵母細胞及動物細胞(例如CHO細胞、COS細胞及HEK293細胞)。用於將上述表現載體轉移至宿主細胞中之方法,亦即轉形方法,不受特別限制,且可使用諸如電穿孔、磷酸鈣法、脂質體法及DEAE聚葡萄糖法之已知方法。
在用表現載體轉形宿主之後,可培養、培植或培育宿主細胞以產生變異多肽。在表現變異多肽之後,可收集宿主細胞且根據習知方法(例如過濾、離心、細胞破壞、凝膠過濾層析、離子交換層析等)自培養物純化變異多肽等。
在一些實施例中,用於表現變異多肽之方法包含轉譯變異多肽之至少5個胺基酸、至少10個胺基酸、至少15個胺基酸、至少20個胺基酸、至少50個胺基酸、至少100個胺基酸、至少150個胺基酸、至少200個胺基酸、至少250個胺基酸、至少300個胺基酸、至少400個胺基酸、至少500個胺基酸、至少600個胺基酸、至少700個胺基酸、至少800個胺基酸、至少900個胺基酸或至少1000個胺基酸。在一些實施例中,用於表現蛋白質之方法包含轉譯變異多肽之約5個胺基酸、約10個胺基酸、約15個胺基酸、約20個胺基酸、約50個胺基酸、約100個胺基酸、約150個胺基酸、約200個胺基酸、約250個胺基酸、約300個胺基酸、約400個胺基酸、約500個胺基酸、約600個胺基酸、約700個胺基酸、約800個胺基酸、約900個胺基酸、約1000個胺基酸或更多。
可使用多種方法測定宿主細胞中成熟變異多肽之產生含量。此類方法包括(但不限於)例如利用對變異多肽具有特異性之多株或單株抗體或如本文別處所述之標記標籤的方法。示例性方法包括(但不限於)酶聯免疫吸附分析(ELISA)、放射免疫分析(MA)、螢光免疫分析(FIA)及螢光活化細胞分選(FACS)。此類及其他分析為此項技術中熟知(參見例如Maddox等人, J. Exp. Med. 158:1211 [1983])。
本發明提供在細胞中活體內表現變異多肽之方法,其包含將編碼變異多肽之聚核糖核苷酸提供至其中聚核糖核苷酸編碼變異多肽之宿主細胞,在細胞中表現變異多肽,且自細胞獲得變異多肽。
改變或突變之引入可藉由此項技術中已知之合成方法來產生編碼變異多肽之核酸序列或變異多肽。使用編碼親本多肽之核酸序列本身作為構架,可一次插入改變或突變一或多個以改變編碼親本多肽之核酸序列。同樣道理,可藉由在親本多肽以合成方式合成時將變化引入至多肽序列中來改變或突變親本多肽。此可藉由此項技術中熟知之方法實現。
可使用熟習此項技術者已知之任何方法產生親本多肽序列及將改變或突變引入至親本多肽序列中。詳言之,在一些實施例中,用於PCR之寡核苷酸引子可用於快速合成在編碼變異多肽之核酸序列中包括一或多個改變或突變之DNA模板。位點特異性突變誘發亦可用作經由潛在DNA之特定突變誘發,可用於製備個別肽或生物學上功能等效蛋白質或肽的技術。該技術藉由引入一或多種核苷酸序列變化至DNA中,併入前述考慮因素中之一或多者,進一步提供製備及測試變異體之預備能力。位點特異性突變誘發允許經由使用編碼所需突變之DNA序列的特定寡核苷酸序列以及足夠數目之相鄰核苷酸產生變異體,以提供具有足夠尺寸及序列複雜性之引子序列,從而在所穿過之缺失接合處之兩側上形成穩定雙鏈體。通常,長度為約17至25個核苷酸之引子為較佳,其中序列之接合處之兩側上的約5至10個殘基改變。
可以與改變或突變引入至親本多肽中類似之方式來引入結構變化,諸如多肽融合為及/或羧基端延伸。額外肽可藉由編碼額外肽之適當核酸序列包括至編碼親本多肽或變異多肽之核酸序列而添加至親本多肽或變異多肽。視情況,額外肽可經由合成多肽產生而直接附加至變異多肽。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生與親本多肽相比,具有增加的與目標核酸之兩個或更多個基因座(例如2、3、4、5、6、7、8、9個或更多個)之正中目標結合的變異多肽。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生當與複數個獨特RNA引導個別複合時,與複數個親本多肽及RNA引導相比,具有增加的與目標核酸之兩個或更多個基因座之正中目標結合的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生與親本多肽相比,具有增加的與目標核酸之兩個或更多個目標基因座之正中目標三元複合物形成的變異多肽。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生當與複數個獨特RNA引導個別複合時,與複數個親本多肽及RNA引導相比,具有增加的與目標核酸之兩個或更多個基因座之三元複合物形成的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生與親本多肽相比,展現靶向增加數目之目標核酸或目標基因座的變異多肽。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以產生當與複數個獨特RNA引導個別複合時,與複數個親本多肽及RNA引導相比,展現靶向增加數目之目標核酸或目標基因座的複數個變異多肽(例如具有相同胺基酸序列之獨立變異多肽)。
在一態樣中,本發明亦提供用於將改變或突變引入至親本多肽序列中之方法,以增強變異多肽之穩定性。變異多肽之穩定性可藉由以下技術測定或可包括不限於以下技術:熱變性分析、熱漂移分析、差示掃描熱量測定法(DSC)、差示掃描螢光測定法(DSF)、等溫滴定量熱法(ITC)、脈衝追蹤法、漂白追蹤法、環己醯亞胺追蹤法、圓二色譜(CD)光譜法、結晶及基於螢光之活性分析。
變異二元複合一般而言,變異多肽及RNA引導以約1:1之莫耳比彼此結合以形成變異二元複合物。變異多肽及RNA引導單獨或一起不會天然存在。
在一些實施例中,變異多肽可在宿主細胞中過度表現且如本文所述進行純化,隨後與RNA引導複合(例如在試管中)以形成變異核糖核蛋白(RNP) (例如變異二元複合物)。
在一些實施例中,變異二元複合物展現在一定培育時間範圍內增加之與目標核酸之結合親和力、增加之正中目標結合活性、增加之正中目標結合特異性、增加之與目標核酸之三元複合物形成及/或增加之穩定性。在一些實施例中,變異二元複合物展現在一定培育時間範圍內減少之與非目標核酸之偏離目標結合及/或減少之自目標核酸之解離。在一些實施例中,變異二元複合物展現在一定培育時間範圍內增加之目標核酸複合物形成、目標核酸活性及/或目標核酸特異性。
在一些實施例中,二元複合物之複合在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中之任一者的溫度下發生。在一些實施例中,在約37℃下在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者的培育時期內變異多肽不自RNA引導解離或結合於游離RNA。在一些實施例中,在二元複合物形成之後,變異核糖核蛋白複合物不將RNA引導交換成不同RNA。
在一些實施例中,變異多肽及RNA引導在二元複合緩衝液中複合。在一些實施例中,變異多肽儲存於替換為二元複合緩衝液之緩衝液中以與RNA引導形成複合物。在一些實施例中,變異多肽儲存於二元複合緩衝液中。
在一些實施例中,二元複合緩衝液具有在約7.3至8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值。在一個實施例中,二元複合緩衝液之pH值為約7.3。在一個實施例中,二元複合緩衝液之pH值為約7.4。在一個實施例中,二元複合緩衝液之pH值為約7.5。在一個實施例中,二元複合緩衝液之pH值為約7.6。在一個實施例中,二元複合緩衝液之pH值為約7.7。在一個實施例中,二元複合緩衝液之pH值為約7.8。在一個實施例中,二元複合緩衝液之pH值為約7.9。在一個實施例中,二元複合緩衝液之pH值為約8.0。在一個實施例中,二元複合緩衝液之pH值為約8.1。在一個實施例中,二元複合緩衝液之pH值為約8.2。在一個實施例中,二元複合緩衝液之pH值為約8.3。在一個實施例中,二元複合緩衝液之pH值為約8.4。在一個實施例中,二元複合緩衝液之pH值為約8.5。在一個實施例中,二元複合緩衝液之pH值為約8.6。
變異多肽之熱穩定性可在諸如添加RNA引導,例如結合RNA引導之有利條件下增加。
在一些實施例中,變異多肽可在如本文所述進行純化之前在宿主細胞中過度表現且與RNA引導複合。在一些實施例中,將編碼變異多肽之mRNA或DNA引入至細胞中,使得變異多肽在細胞中表現。亦將引導變異多肽至期望目標核酸之RNA引導引入至細胞中,無論與單個mRNA或DNA構築體同時、分開或依次,使得在細胞中形成所需核糖核蛋白複合物。
評估變異二元複合物穩定性及功能性在某些實施例中,本文提供用於鑑別最佳變異多肽/RNA引導複合物(在本文中稱為變異二元複合物)之方法,其包括(a)將變異多肽及RNA引導組合在樣品中以形成變異二元複合物;(b)量測變異二元複合物之值;及(c)若變異二元複合物之值大於參考分子之值,則確定變異二元複合物優於參考分子。在一些實施例中,該值可包括但不限於穩定性量測值(例如T
m值、熱穩定性)、二元複合物形成速率、RNA引導結合特異性及/或複合物活性。
在一些實施例中,最佳變異多肽/RNA引導複合物(亦即,變異二元複合物)藉由以下步驟來鑑別:(a)將變異多肽及RNA引導組合在樣品中以形成變異二元複合物;(b)偵測變異二元複合物之T
m值;及(c)若變異二元複合物之T
m值比參考分子之T
m值或T
m參考值大至少8℃,則確定變異二元複合物為穩定的。
涉及量測變異多肽/RNA引導複合物(亦即,變異二元複合物)之熱穩定性之步驟的方法可包括不限於測定變異二元複合物之穩定性之方法、測定促進穩定變異二元複合物之條件之方法、篩選穩定變異二元複合物之方法及用於鑑別最佳gRNA以形成穩定變異二元複合物之方法。在某些實施例中,可量測變異二元複合物之熱穩定性值。
此外,在某些實施例中,亦可量測參考分子之熱穩定性值。在某些實施例中,如本文所述,若所量測之變異二元複合物之熱穩定性值大於所量測之參考分子之熱穩定性值或熱穩定性參考值(在相同實驗條件下量測),則可確定變異二元複合物為穩定的。在某些實施例中,參考分子可為缺乏RNA引導之變異多肽。
在某些實施例中,量測之熱穩定性值可為變性溫度值。在此等實施例中,熱穩定性參考值為變性溫度參考值。在某些實施例中,量測之熱穩定性值可為T
m值。在此等實施例中,熱穩定性參考值可為T
m參考值。在某些實施例中,熱穩定性值可使用熱漂移分析來量測。在某些實施例中,用於量測熱穩定性之分析可涉及本文所述之技術,包括(但不限於):熱變性分析、熱漂移分析、差示掃描熱量測定法(DSC)、差示掃描螢光測定法(DSF)、等溫滴定量熱法(ITC)、脈衝追蹤法、漂白追蹤法、環己醯亞胺追蹤法、圓二色譜(CD)光譜法、結晶及基於螢光之活性分析。
在某些實施例中,若變異多肽/RNA引導複合物形成之速率、RNA引導結合特異性及/或變異二元複合物之複合物活性大於參考分子之值或參考值(例如親本多肽/RNA引導複合物(在本文中稱為親本二元複合物)之值),則可鑑別變異二元複合物。舉例而言,在某些實施例中,若變異多肽/RNA引導複合物形成之速率、RNA引導結合特異性及/或變異二元複合物之複合物活性的值比參考分子之值或參考值(例如親本二元複合物之值)大至少X%,則可鑑別變異二元複合物。在某些實施例中,本文所述之方法可進一步包含包括量測如本文所述之變異二元複合物之活性的步驟。
變異三元複合在一些實施例中,如本文所述,變異多肽、RNA引導及目標核酸形成變異三元複合物(例如在試管或細胞中)。一般而言,變異多肽、RNA引導及目標核酸以約1:1:1之莫耳比彼此締合以形成變異三元複合物。變異多肽、RNA引導及目標核酸單獨或一起不會天然存在。
在一些實施例中,如本文所述之變異二元複合物(例如變異多肽與RNA引導之複合物)進一步與目標核酸複合(例如在試管或細胞中)以形成變異三元複合物。
在一些實施例中,三元複合物之複合在低於約20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃或55℃中之任一者的溫度下發生。在一些實施例中,在約37℃下在至少約10分鐘、15分鐘、20分鐘、25分鐘、30分鐘、35分鐘、40分鐘、45分鐘、50分鐘、55分鐘、1小時、2小時、3小時、4小時或更多小時中之任一者的培育時期內變異二元複合物不自目標核酸解離或結合於游離核酸(例如游離DNA)。在一些實施例中,在三元複合物形成之後,變異二元複合物不將目標核酸交換成不同核酸。
在一些實施例中,變異多肽、RNA引導及目標核酸在三元複合緩衝液中複合。在一些實施例中,變異多肽儲存於替換為三元複合緩衝液之緩衝液中以與RNA引導及目標核酸形成複合物。在一些實施例中,變異多肽儲存於三元複合緩衝液中。
在一些實施例中,變異二元複合物及目標核酸在三元複合緩衝液中複合。在一些實施例中,變異二元複合物儲存於替換為三元複合緩衝液之緩衝液中以與目標核酸形成複合物。在一些實施例中,變異二元複合物儲存於三元複合緩衝液中。
在一些實施例中,三元複合緩衝液具有在約7.3至8.6 (例如約7.5至約8.0、約7.8至8.3或約8.0至8.6)範圍內之pH值。在一個實施例中,三元複合緩衝液之pH值為約7.3。在一個實施例中,三元複合緩衝液之pH值為約7.4。在一個實施例中,三元複合緩衝液之pH值為約7.5。在一個實施例中,三元複合緩衝液之pH值為約7.6。在一個實施例中,三元複合緩衝液之pH值為約7.7。在一個實施例中,三元複合緩衝液之pH值為約7.8。在一個實施例中,三元複合緩衝液之pH值為約7.9。在一個實施例中,三元複合緩衝液之pH值為約8.0。在一個實施例中,三元複合緩衝液之pH值為約8.1。在一個實施例中,三元複合緩衝液之pH值為約8.2。在一個實施例中,三元複合緩衝液之pH值為約8.3。在一個實施例中,三元複合緩衝液之pH值為約8.4。在一個實施例中,三元複合緩衝液之pH值為約8.5。在一個實施例中,三元複合緩衝液之pH值為約8.6。
變異多肽之熱穩定性可在諸如添加RNA引導及目標核酸之有利條件下增加。
評估變異三元複合物穩定性及功能性在某些實施例中,本文提供用於鑑別最佳變異三元複合物之方法,其包括(a)將變異多肽、RNA引導及目標核酸組合在樣品中以形成變異三元複合物;(b)量測變異三元複合物之值;及(c)若變異三元複合物之值大於參考分子之值,則確定變異三元複合物優於參考分子。在一些實施例中,該值可包括但不限於穩定性量測值(例如T
m值、熱穩定性)、三元複合物形成速率、DNA結合親和力量測值、DNA結合特異性量測值及/或複合物活性量測值(例如核酸酶活性量測值)。
在一些實施例中,最佳變異三元複合物藉由以下步驟來鑑別:(a)將變異多肽、RNA引導及目標核酸組合在樣品中以形成變異三元複合物;(b)偵測變異三元複合物之T
m值;及(c)若變異三元複合物之T
m值比參考分子之T
m值或T
m參考值大至少8℃,則確定變異三元複合物為穩定的。
涉及量測變異三元複合物之熱穩定性之步驟的方法可包括不限於測定變異三元複合物之穩定性之方法、測定促進穩定變異三元複合物之條件之方法、篩選穩定變異三元複合物之方法及用於鑑別最佳二元複合物以形成穩定變異三元複合物之方法。在某些實施例中,可量測變異三元複合物之熱穩定性值。
此外,在某些實施例中,亦可量測參考分子之熱穩定性值。在某些實施例中,如本文所述,若所量測之變異三元複合物之熱穩定性值大於所量測之參考分子之熱穩定性值或熱穩定性參考值(在相同實驗條件下量測),則可確定變異三元複合物為穩定的。在某些實施例中,參考分子可為缺乏RNA引導及/或目標核酸之變異多肽。
在某些實施例中,量測之熱穩定性值可為變性溫度值。在此等實施例中,熱穩定性參考值為變性溫度參考值。在某些實施例中,量測之熱穩定性值可為T
m值。在此等實施例中,熱穩定性參考值可為T
m參考值。在某些實施例中,熱穩定性值可使用熱漂移分析來量測。在某些實施例中,用於量測熱穩定性之分析可涉及本文所述之技術,包括(但不限於)差示掃描螢光測定法(DSF)、差示掃描熱量測定法(DSC)或等溫滴定量熱法(ITC)。
在某些實施例中,若三元複合物形成之速率、DNA結合親和力、DNA結合特異性及/或變異三元複合物之複合物活性(例如核酸酶活性)大於參考分子之值或參考值(例如親本三元複合物之值),則可鑑別變異三元複合物。舉例而言,在某些實施例中,若三元複合物形成之速率、DNA結合親和力、DNA結合特異性及/或變異三元複合物之複合物活性之值比參考分子之值或參考值(例如親本三元複合物之值)大至少X%,則可鑑別變異三元複合物。在某些實施例中,本文所述之方法可進一步包含包括量測如本文所述之變異三元複合物之活性的步驟。
遞送可調配本文所述之組合物或複合物,例如包括載劑,諸如載劑及/或聚合物載劑,例如脂質體,且藉由已知方法遞送至細胞(例如原核、真核、植物、哺乳動物等)。此類方法包括但不限於轉染(例如脂質介導、陽離子聚合物、磷酸鈣、樹枝狀聚合物);電穿孔或破壞膜之其他方法(例如核轉染)、病毒遞送(例如慢病毒、反轉錄病毒、腺病毒、AAV)、顯微注射、微彈轟擊(「基因槍」)、fugene、直接音波裝載、細胞擠壓、光學轉染、原生質體融合、刺穿感染、磁轉染、胞外體介導之輸送、脂質奈米粒子介導之輸送及其任何組合。
在一些實施例中,方法包含遞送一或多種核酸(例如編碼變異多肽、RNA引導、供體DNA之核酸等)、其一或多種轉錄物及/或預先形成之變異多肽/RNA引導複合物(亦即,變異二元複合物)至細胞。示例性細胞內遞送方法包括(但不限於):病毒或病毒樣試劑;基於化學物質之轉染方法,諸如使用磷酸鈣、樹枝狀聚合物、脂質體或陽離子聚合物(例如DEAE-聚葡萄糖或聚乙烯亞胺)之彼等轉染方法;非化學方法,諸如顯微注射、電穿孔、細胞擠壓、聲致穿孔、光學轉染、刺穿感染、原生質體融合、細菌結合、遞送質體或轉座子;基於粒子之方法,諸如使用基因槍、磁轉染或磁體輔助之轉染、粒子轟擊;及雜交法,諸如核轉染。在一些實施例中,本申請案進一步提供藉由此類方法產生之細胞,及包含此類細胞或由此類細胞產生之生物體(諸如動物、植物或真菌)。
細胞本文所述之多肽、組合物或複合物可遞送至多種細胞。在一些實施例中,細胞為分離之細胞。在一些實施例中,細胞在細胞培養物中。在一些實施例中,細胞為離體細胞。在一些實施例中,細胞自活生物體獲得,且維持在細胞培養物中。在一些實施例中,細胞為單細胞生物體。
在一些實施例中,細胞為原核細胞。在一些實施例中,細胞為細菌細胞或來源於細菌細胞。在一些實施例中,細菌細胞與親本多肽所源自之細菌物種無關。在一些實施例中,細胞為古菌細胞或來源於古菌細胞。在一些實施例中,細胞為真核細胞。在一些實施例中,細胞為植物細胞或來源於植物細胞。在一些實施例中,細胞為真菌細胞或來源於真菌細胞。在一些實施例中,細胞為動物細胞或來源於動物細胞。在一些實施例中,細胞為無脊椎細胞或來源於無脊椎細胞。在一些實施例中,細胞為脊椎動物細胞或來源於脊椎動物細胞。在一些實施例中,細胞為哺乳動物細胞或來源於哺乳動物細胞。在一些實施例中,細胞為人類細胞。在一些實施例中,細胞為斑馬魚細胞。在一些實施例中,細胞為嚙齒類動物細胞。在一些實施例中,細胞以合成方式製得,有時稱為人工細胞。
在一些實施例中,細胞來源於細胞株。用於組織培養之各種細胞株係此項技術中已知的。細胞株之實例包括(但不限於) 293T、MF7、K562、HeLa及其轉殖基因種類。細胞株可自熟習此項技術者已知之多種來源(參見例如美國菌種保存中心(American Type Culture Collection,ATCC) (Manassas, Va.))獲得。在一些實施例中,用本文所述之一或多種核酸(諸如編碼Ago之載體及gDNA)或Ago-gDNA複合物轉染的細胞用於建立包含一或多種載體來源之序列的新細胞株以建立包含對目標核酸之修飾的新細胞株。在一些實施例中,經或未經本文所述之一或多種核酸(諸如編碼變異多肽之載體及RNA引導)或變異多肽/RNA引導複合物(亦即,變異二元複合物)短暫轉染之細胞或來源於此類細胞之細胞株用於評估一或多種測試化合物。
在一些實施例中,方法包含將包含編碼靶向DNA之RNA (例如RNA引導)及/或變異多肽之核苷酸序列的一或多種核酸引入至宿主細胞中。在一個實施例中,包含目標DNA之細胞為活體外、活體內或離體的。在其他實施例中,包含編碼靶向DNA之RNA (例如RNA引導)及/或變異多肽之核苷酸序列的核酸包括重組表現載體,例如包括但不限於腺相關病毒構築體、重組腺病毒構築體、重組慢病毒構築體、重組反轉錄病毒構築體及其類似物。
在一些實施例中,細胞為初級細胞。例如,初級細胞之培養物可繼代0次、1次、2次、4次、5次、10次、15次或更多次。在一些實施例中,藉由任何已知方法自個體收穫初級細胞。舉例而言,可藉由血球分離術、白血球分離術、密度梯度分離等收穫白血球。可藉由生檢收穫來自諸如皮膚、肌肉、骨髓、脾臟、肝臟、胰臟、肺、腸、胃等組織之細胞。適當溶液可用於分散或懸浮所收穫之細胞。此類溶液通常可為平衡鹽溶液(例如生理食鹽水、磷酸鹽緩衝鹽水(PBS)、漢克氏平衡鹽溶液(Hank's balanced salt solution)等),宜補充胎牛血清或其他天然存在之因子,以及低濃度的可接受之緩衝液。緩衝液可包括HEPES、磷酸鹽緩衝液、乳酸鹽緩衝液等。細胞可立即使用,或其可儲存(例如藉由冷凍)。冷凍細胞可融化且能夠再使用。細胞可冷凍在DMSO、血清、培養基緩衝液(例如10% DMSO、50%血清、40%緩衝培養基)及/或用於在冷凍溫度下保存細胞之一些其他此類常用溶液中。
在一些實施例中,變異多肽具有誘導目標核酸(例如基因體DNA)中之雙股斷裂或單股斷裂的核酸酶活性。雙股斷裂可刺激細胞內源性DNA修復路徑,包括同源定向重組(HDR)、非同源末端接合(NHEJ)或替代非同源末端接合(A-NHEJ)。NHEJ可修復裂解之目標核酸而不需要同源模板。此可引起一或多種核苷酸缺失或插入至目標核酸中。HDR可在同源模板(諸如供體DNA)下發生。同源模板可包含與側接目標核酸裂解位點之序列同源的序列。在一些情況下,HDR可將外源性聚核苷酸序列插入至裂解之目標核酸中。由NHEJ及/或HDR進行之對目標DNA之修飾可引起例如突變、缺失、改變、整合、基因校正、基因替代、基因標記、轉殖基因嵌入、基因破壞及/或基因剔除。
在一些實施例中,使細胞培養同步以增強方法之效率。在一些實施例中,S及G2期之細胞用於HDR介導之基因編輯。在一些實施例中,細胞可在任何細胞週期進行該方法。在一些實施例中,細胞過度塗鋪顯著降低該方法之功效。在一些實施例中,該方法在不超過約40%、45%、50%、55%、60%、65%或70%匯合中之任一者下施加至細胞培養物。
在一些實施例中,細胞中變異多肽/RNA引導複合物(亦即,變異二元複合物)與目標核酸之結合募集除DNA修復路徑外之一或多種內源性細胞分子或路徑以調節目標核酸。在一些實施例中,變異二元複合物之結合阻斷一或多種內源性細胞分子或路徑接近目標核酸,藉此修飾目標核酸。舉例而言,變異二元複合物之結合可阻斷內源性轉錄或轉譯機制,從而減少目標核酸之表現。
在一些實施例中,提供一種用於修飾細胞中之目標DNA分子之方法。該方法包含使細胞內部之目標DNA分子與以下接觸:本文所述之變異多肽;及單分子靶向DNA之RNA,其以5'至3'順序包含與目標DNA分子之目標序列雜交的第一核苷酸區段;核苷酸連接子;及與第一核苷酸區段雜交以形成雙股RNA雙鏈體之第二核苷酸區段。在細胞內部變異多肽與單分子靶向DNA之RNA形成複合物且修飾目標DNA分子。
套組本發明亦提供可用於例如進行本文所述之方法的套組。在一些實施例中,套組包括本發明之變異多肽,例如表2之變異體。在一些實施例中,套組包括編碼此類變異多肽之聚核苷酸,且視情況聚核苷酸包含在例如如本文所述之載體內。套組亦可視情況包括例如如本文所述之RNA引導。本發明之套組之RNA引導可經設計以靶向所關注之序列,如此項技術中已知。CRISPR核酸酶變異體及RNA引導可包裝在套組內之相同小瓶或其他容器內,或可包裝在獨立小瓶或其他容器中,其內含物可在使用之前混合。套組可另外包括視情況選用之緩衝液及/或關於使用CRISPR核酸酶變異體及/或RNA引導之說明書。
本文中引用之所有參考文獻及公開案均以引用之方式併入本文中。
實例提供以下實例以進一步說明本發明之一些實施例,但不意欲限制本發明之範疇;藉由其示例性之性質,應瞭解,可替代地使用熟習此項技術者已知之其他程序、方法或技術。
實例 1- 變異構築體之工程改造在此實例中,產生變異構築體。
經由兩個PCR步驟,使用自IDT™ (Integrated DNA Technologies, Inc.)訂購之突變誘發正向引子及突變誘發反向引子構築包含單個突變之DNA模板。在第一步驟中,在384盤中進行兩組PCR反應以產生兩個片段。兩個PCR片段之重疊區域含有所需單個突變且允許經由第二PCR組裝整個DNA模板。在第二步驟中,來自第一步驟之經純化之片段用作重疊PCR (OL PCR)之模板且退火至載體主鏈之Fw及Rv寡核苷酸用作OL PCR引子。所得到之線性DNA模板含有T7啟動子、T7終止子及多肽之開放閱讀框架。
此等線性DNA模板直接用於無細胞轉錄及轉譯系統以表現含有單個突變之多肽變異體。變異構築體進一步個別轉移至短暫轉染載體中。另外,包含組合突變之DNA模板藉由PCR製備且隨後轉移至短暫轉染載體中。
實例2-用於偵測變異二元複合物之螢光偏振分析
在此實例中,經由螢光偏振分析評估野生型或變異核酸酶多肽及RNA引導形成二元複合物之能力。
藉由IDT™合成線性ssDNA片段,其包含正向重複序列上游之T7 RNA聚合酶啟動子序列之反向互補序列及期望之20 bp RNA引導目標。接著藉由將通用T7正向寡核苷酸退火(以5℃/分鐘95-4℃)至反向互補ssDNA來產生線性dsDNA活體外轉錄(IVT)模板,且在25℃下用克列諾片段(Klenow fragment) (New England Biolabs®)填充15分鐘。接著在37℃下使用HiScribe T7高產率RNA合成套組(New England Biolabs®)將所得到之IVT模板轉錄至RNA引導中,歷時4小時。在轉錄之後,使用RNA清潔及濃縮套組(Zymo)純化各RNA引導且儲存在-20℃下直至使用。
接著用6-羧基螢光素(6-FAM) (IDT™)標記RNA引導。將1X分析緩衝液(20 mM Tris-HCl (pH 7.5)、150 mM KCl、5 mM MgCl
2、1 mM DTT)中25 nM核酸酶多肽(野生型或變異多肽)用遞增濃度之標記RNA引導(7.5-250 nM)滴定。將複合物在37℃下培育30分鐘,隨後使用微定量盤式讀取器(Infinite® 200 Pro,Tecan)量測螢光偏振。
亦研究在不同溫度下之二元複合物形成。如上所述之進一步結合實驗在25℃、50℃、60℃及70℃下等溫進行。
在滴定核酸酶多肽(野生型或變異多肽)之後與遞增濃度之RNA引導的二元複合物之形成(或在滴定RNA引導之後與遞增濃度之核酸酶多肽的二元複合物之形成)引起螢光偏振信號之變化,以微偏振(mP)單位為單位。藉由在一定RNA引導濃度範圍內繪製螢光偏振信號之變化來產生結合曲線。
此實例指示如何確定及比較核酸酶多肽(野生型或變異多肽)與RNA引導之結合親和力。
實例3-用於偵測變異二元複合物之RNA電泳遷移率變化分析
此實例描述使用RNA EMSA確定核酸酶多肽(野生型或變異體)結合RNA引導之能力。
將來自IDT™之合成RNA引導用5' IRDye® 800CW (亦稱為IR800染料或IR800)使用5' EndTag標記套組(Vector® Laboratories)及IRDye® 800CW順丁烯二醯亞胺(LI-COR® Biosciences)標記,如先前在Yan等人, 2018中所詳述。在標記之後,清潔RNA引導且經由苯酚氯仿萃取進行濃縮。藉由Nanodrop™定量濃度。
對於RNA結合分析,將核酸酶多肽(野生型或變異多肽)在1X結合緩衝液(50 mM NaCl、10 mM Tris-HCl、10 mM MgCl
2、1 mM DTT,pH 7.9)中稀釋至2.5 μM。接著將多肽在1X結合緩衝液中自2.5 μM連續稀釋至37.5 μM。再次將多肽在1X結合緩衝液加50 nM IR800標記之RNA引導中1:10稀釋且充分混合。此等反應可進一步包括0.5-5 μg tRNA,其充當競爭性抑制劑以減少多肽與RNA之非特異性結合且藉此有助於準確的特異性結合測定。將反應在37℃下培育1小時。將1 μL 100X溴酚藍添加至反應中以目測染料前沿,接著將整個反應裝載至6% DNA阻滯凝膠(ThermoFisher Scientific™)上,在80V下操作90分鐘。凝膠在Licor® Odyssey® CLx上成像。
此分析依賴於RNA遷移穿過凝膠之速率由其尺寸決定的原理。僅RNA之樣品能夠遷移特定距離。然而,若RNA結合於多肽,則出現代表較大之移動較少之RNA複合物的條帶,其在凝膠上「上移」。
因此,量測兩個條帶之強度:1)僅RNA之條帶及2)結合多肽之「上移」RNA條帶。若所有RNA均結合於多肽,則僅觀測到上移條帶。隨著多肽之濃度降低,上移條帶之強度降低,而僅RNA之條帶之強度增加。在比較RNA與核酸酶多肽(野生型或變異多肽)之結合親和力時,較高多肽/RNA親和力之特徵在於在較低濃度之多肽下的更特異性結合。
此實例指示可如何確定及比較野生型核酸酶多肽與RNA引導之結合親和力及變異多肽與RNA引導之結合親和力。
實例4-變異二元複合物之活體外裂解分析
此實例描述用於製備RNP及測定RNP之活體外生化活性的方法。
將編碼野生型或變異多肽之載體轉形至大腸桿菌BL21 (DE3) (New England Biolabs®)中且在T7啟動子下表現。經轉形細胞最初在5 mL Luria Broth (TEKNOVA™) + 50 μg/mL卡那黴素(kanamycin)中生長隔夜,接著接種至1 L Terrific Broth培養基(TEKNOVA™) + 50 μg/mL卡那黴素中。細胞在37℃下生長直至OD
600為0.6-0.8,接著用0.5 mM IPTG誘導蛋白質表現。隨後培養物在18℃下再生長14-18小時。收穫培養物且經由離心粒化,隨後再懸浮於每5 g細胞集結粒1 mL提取緩衝液(50 mM HEPES pH 7.5、500 mM NaCl、5%甘油、0.5 mM TCEP)中。細胞經由細胞破碎機(Constant System Limited)溶解,接著在4℃下在20,000×g下離心20分鐘以使溶解產物澄清。將0.2%聚乙烯亞胺(PEI)添加至澄清溶解產物且在4℃下在恆定底蓋翻轉下培育20分鐘。溶解產物隨後再在20,000×g下離心10分鐘。經由離子交換層析法純化溶解產物。在純化之後,溶離份在SDS-PAGE凝膠上操作,且彙集含有適當尺寸之蛋白質的溶離份且使用30 kD Amicon Ultra15離心單元濃縮。蛋白質緩衝液更換成12.5 mM HEPES pH 7.0、120 mM NaCl、0.5 mM TCEP及50%甘油。隨後使用Nanodrop (ThermoFisher Scientific™)來量測濃度,且蛋白質儲存於-20℃下。
使用2:1比率之合成crRNA (Integrated DNA Technologies)與蛋白質製備RNP。使RNP在37℃下在1X NEBuffer™ 2 (NEB2;New England Biolabs®;50 mM NaCl、10 mM Tris-HCl、10 mM MgCl
2、1 mM DTT,pH 7.9)中複合30分鐘。在複合之後,使用1X NEB2作為稀釋緩衝液稀釋RNP。Apo反應(無RNA引導之蛋白質)以相同方式製備,用H
2O補足crRNA體積。
將目標dsDNA受質(Integrated DNA Technologies)以20 nM添加至RNP及apo樣品。將反應充分混合,接著在37℃下培育1小時,接著用1 μL 20 mg/mL蛋白酶K (ThermoFisher Scientific™)淬滅。反應在50℃下再培育15分鐘,接著整個反應在2%瓊脂糖E-凝膠(ThermoFisher Scientific™)上操作。藉由溴化乙錠,在Gel Doc™ EZ凝膠成像器(BioRad®)上目測凝膠。
量測兩種類型條帶之強度:1)全長(未裂解) DNA條帶及2)一或多個下移之裂解DNA條帶。非活性RNP之特徵在於全長DNA條帶。活性RNP產生一或多個下移之裂解DNA帶。隨著活性RNP之濃度降低,全長條帶之強度增加,且裂解條帶之強度降低。在比較多個RNP之活性時,活性比另一者高之RNP之特徵在於在更低RNP濃度下更密集之裂解條帶。
此實例之方法允許比較野生型或變異RNP (二元複合物)對目標DNA之活體外裂解活性。
實例5-變異多肽及變異二元複合物之活體外穩定性分析
在此實例中,評估變異RNP之穩定性。
對於加速穩定性研究,以與實例4中所描述相同之方式產生RNP (5 μM),且隨後將樣品儲存在25℃下48小時。
對RNP樣品進行活體外裂解分析(如實例4中所描述)。此等結果與實例4之結果相比較,以確定儲存在25℃下48小時之變異RNP保留生化活性的程度。
Apo多肽(無RNA引導)亦在25℃下培育48小時。使用實例3中所描述之方法對apo樣品進行RNA EMSA分析。此等結果與實例3之結果相比較,以確定變異多肽能夠與RNA引導形成二元複合物之程度。
使用實例4中所描述之方法,在25℃下培育48小時之Apo樣品亦與RNA引導複合形成RNP。接著根據實例4之方法進行活體外裂解分析。將分析結果與實例4之結果相比較以評估用在25℃下培育之蛋白質形成之變異RNP的活性程度。
此實例之方法允許比較野生型及變異多肽以及野生型及變異RNP (二元複合物)之穩定性。展現與RNA引導之特異性結合大於另一核酸酶多肽與RNA引導之特異性結合的核酸酶多肽表明多肽更穩定。展現目標DNA之活體外裂解比另一RNP引起之裂解更穩固的RNP表明二元複合物更穩定。
實例6-用於偵測變異三元複合物之DNA電泳遷移率變化分析
此實例描述使用DNA EMSA確定RNA引導、核酸酶多肽(野生型或變異多肽)及目標DNA受質形成三元複合物之能力。
將編碼野生型或變異多肽之載體轉形至大腸桿菌BL21 (DE3) (New England Biolabs®)及BL21(DE3)pLySS (Novagen®)中。經轉形細胞最初在5 mL Luria Broth (TEKNOVA™) + 50 μg/mL卡那黴素中生長隔夜,接著接種至1 L Terrific Broth培養基(TEKNOVA™) + 50 μg/mL卡那黴素中。細胞在37℃下生長直至OD
600為0.6-0.8,接著用0.5 mM IPTG誘導蛋白質表現。隨後培養物在18℃下再生長14-18小時。收穫培養物且經由離心粒化,隨後再懸浮於每5 g細胞集結粒1 mL提取緩衝液(50 mM HEPES pH 7.5、500 mM NaCl、5%甘油、0.5 mM TCEP)中。細胞經由細胞破碎機(Constant System Limited)溶解,接著在4℃下在20,000×g下離心20分鐘以使溶解產物澄清。將0.2%聚乙烯亞胺(PEI)添加至澄清溶解產物且在4℃下在恆定底蓋翻轉下培育20分鐘。溶解產物隨後再在20,000×g下離心10分鐘。經由離子交換層析法純化溶解產物。在純化之後,溶離份在SDS-PAGE凝膠上操作,且彙集含有適當尺寸之蛋白質的溶離份且使用30 kD Amicon® Ultra15離心單元濃縮。蛋白質緩衝液更換成12.5 mM HEPES pH 7.0、120 mM NaCl、0.5 mM TCEP及50%甘油。隨後使用Nanodrop™ (ThermoFisher Scientific™)來量測濃度,且蛋白質儲存於-20℃下。
使用2:1比率之合成RNA引導(Integrated DNA Technologies, IDT™)與多肽製備RNP。選擇與本文揭示之PAM序列相鄰之目標,且使用如本文所述之正向重複序列設計RNA引導。使RNP在37℃下在1X NEBuffer™ (NEB2;New England Biolabs®;50 mM NaCl、10 mM Tris-HCl、10 mM MgCl
2、1 mM DTT,pH 7.9)中複合30分鐘。在複合之後,使用1X NEB2作為稀釋緩衝液,自5 μM至37.5 μM進行5點1:2連續稀釋。Apo反應(無RNA引導之多肽)以相同方式製備,用H
2O補足RNA引導體積。
藉由PCR自寡核苷酸(Integrated DNA Technologies)來產生dsDNA目標受質。在PCR之前,正向引子之5'末端用IR800染料標記,如Yan等人, 2018中所述。使用Amplitaq Gold® (ThermoFisher Scientific™),接著將dsDNA受質用IR800標記之正向引子及未經標記之反向引子擴增。所得到之dsDNA經DNA清潔及濃縮套組(Zymo)純化且藉由Nanodrop™ (ThermoFisher Scientific™)定量。
將RNP樣品及Apo (對照)樣品在1X結合緩衝液(50 mM NaCl、10 mM Tris-HCl、1 mM TCEP、10%甘油、2 mM EDTA,pH 8.0)加20 nM IR800標記之目標DNA受質中1:10稀釋且充分混合。將反應在37℃下培育1小時。將溴酚藍添加至反應中以目測染料前沿,接著將整個反應裝載至6% DNA阻滯凝膠(ThermoFisher Scientific™)上,在80V下操作90分鐘。凝膠在Licor® Odyssey® CLx上成像。
在此分析中,DNA遷移穿過凝膠之速率由其尺寸決定。僅DNA之樣品能夠遷移特定距離。然而,若RNP結合於DNA,則出現代表較大之移動較少之DNA複合物的條帶,其在凝膠上「上移」。
此實例展示變異RNP (變異二元複合物)對DNA目標之親和力(以產生三元複合物)如何與野生型RNP (野生型二元複合物)對DNA目標之親和力相比較。
實例7-藉由組合變異多肽靶向哺乳動物基因
此實例描述使用藉由短暫轉染引入至哺乳動物細胞中之野生型及變異效應子(例如CRISPR核酸酶變異體)對在多個目標上之插入/缺失評估。
將SEQ ID NO: 3之野生型效應子(WT)及SEQ ID NO: 3之CRISPR核酸酶變異體個別選殖至pcda3.1主鏈(Invitrogen)中。接著最大製備質體且稀釋。選擇與本文揭示之PAM序列相鄰之目標,且使用如本文所述之正向重複序列設計RNA引導。RNA引導及目標序列展示於表5中。將RNA引導選殖至pUC19主鏈(New England Biolabs®)中。接著最大製備質體且稀釋。
表5. 哺乳動物目標及對應crRNA.
目標標識符 | PAM序列 | 目標序列 | crRNA序列 |
EMX1 | 5'-ATTG-3' | CCGCCGCTTCCTGAGCCATC (SEQ ID NO: 16) | CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACCCGCCGCUUCCUGAGCCAUC (SEQ ID NO: 17) |
VEGFA | 5'-TTTA-3' | TCCAGACCACCAATGGGCAC (SEQ ID NO: 18) | CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACUCCAGACCACCAAUGGGCAC (SEQ ID NO: 19) |
AAVS1 | 5'-TTTG-3' | TGAGAATGGTGCGTCCTAGG (SEQ ID NO: 20) | CUUGUUGUAUAUGUCCUUUUAUAGGUAUUAAACAACUGAGAAUGGUGCGUCCUAGG (SEQ ID NO: 28) |
在轉染之前大約16小時,將DMEM/10% FBS+Pen/Strep (D10培養基)中之25,000個HEK293T細胞塗鋪至96孔盤之各孔中。在轉染當天,細胞70-90%匯合。對於待轉染之各孔,製備脂染胺2000™及Opti-MEM™之混合物且在室溫下培育5分鐘(溶液1)。在培育之後,添加脂染胺2000™:Opti-MEM™混合物至含有核酸酶質體、RNA引導質體及Opti-MEM™之獨立混合物(溶液2)中。在陰性對照之情況下,RNA引導質體不包括於溶液2中。藉由上下吸液混合溶液1及2,隨後在室溫下培育25分鐘。在培育之後,將溶液1及2混合物逐滴添加至含有細胞之96孔盤之各孔中。轉染後大約72小時,藉由將TrypLE™添加至各孔之中心且在37℃下培育大約5分鐘對細胞進行胰蛋白酶處理。隨後將D10培養基添加至各孔且混合以使細胞再懸浮。將再懸浮之細胞在500 g下離心10分鐘以獲得集結粒,且棄去上清液。接著使細胞集結粒再懸浮於QuickExtract™緩衝液(Lucigen®)中,且將細胞在65℃下培育15分鐘,在68℃下培育15分鐘,且在98℃下培育10分鐘。
藉由兩輪PCR製備用於下一代定序之樣品。第一輪(PCR1)用於擴增特定基因體區域,視目標而定。進行第2輪PCR (PCR2)以添加Illumina銜接子及索引。隨後彙集反應物且藉由管柱純化來純化。使用15循環NextSeq 500/550中或高輸出v2.5套組進行定序操作。
在相對於SEQ ID NO: 3之親本多肽各由單個精胺酸取代組成之經工程改造之首批三十一種變異體中,二十六種變異體展現與親本多肽相比增加之插入/缺失活性。遵循上文所描述之相同方法,以兩者、三者、四者及五者之組合進一步篩選七種效能最佳之點突變體。圖1-3中之結果展示與SEQ ID NO: 3之親本多肽相比取代P14R、E311R、D32R、I61R、G223R、N109R及/或D719R提高核酸酶活性。
進一步測試以下變異多肽在額外三種AAVS1、三種VEGFA及三種EMX1目標之插入/缺失活性:包含P14R、E311R及D32R取代之變異多肽;包含P14R、E311R及G223R取代之變異多肽;包含P14R、E311R、D32R及I61R取代之變異多肽;及包含D32R、N109R、E311R及D719R取代之變異多肽。跨越十二種目標平均之每種變異多肽之插入/缺失活性與親本多肽之插入/缺失活性相比高大約6至7倍。包含P14R、E311R、D32R及I61R取代之變異體使四種測試變異體對十二目標集之插入/缺失活性獲得最大增加。
實例8-藉由點變異多肽靶向哺乳動物基因
此實例描述使用藉由短暫轉染引入至哺乳動物細胞中之野生型及變異效應子對在多個目標上之插入/缺失評估。如實例7中所描述,將相對於SEQ ID NO: 3各包含單個甘胺酸取代之79種變異體個別選殖至pcDNA3.1主鏈(Invitrogen)中。RNA引導及細胞轉染方案如實例7中所述。
以下十四種變異體展現與SEQ ID NO: 3之親本多肽相比在所有目標上增加之插入/缺失活性:K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。變異多肽之插入/缺失活性展示於
圖 4中。跨越三種測試目標平均之每種變異體之插入/缺失活性與親本多肽之插入/缺失活性相比高大約1.2至2.1倍。除D590G之外,十四種變異體中之每一種展現三種目標之插入/缺失活性增加,其效能類似於親本多肽在VEGFA目標處。E736G使所有測試變異體之插入/缺失活性獲得最大增加。
圖 1A展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18),與野生型CRISPR核酸酶(WT;SEQ ID NO: 3)相比包含兩個或三個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。
圖 1B展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18),與野生型CRISPR核酸酶(WT;SEQ ID NO: 3)相比包含兩個、三個或四個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。
圖 1C展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18),與野生型CRISPR核酸酶(WT;SEQ ID NO: 3)相比包含兩個、三個或四個精胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。
圖 2展示跨越EMX1目標序列(SEQ ID NO: 16)、AAVS1目標序列(SEQ ID NO: 20)及VEGFA目標序列(SEQ ID NO: 18),與野生型CRISPR核酸酶(WT;SEQ ID NO: 3)相比包含單個甘胺酸取代之CRISPR核酸酶變異體的插入/缺失活性(原始插入/缺失%)。點線描繪在三個目標每一者下SEQ ID NO: 3之親本多肽之平均插入/缺失活性。所示資料為兩種技術重複各自之兩個生物重複實驗的平均值。
<![CDATA[<110> 美商阿伯生物技術公司(ARBOR BIOTECHNOLOGIES, INC.)]]> <![CDATA[<120> 包含變異多肽之組合物及其用途]]> <![CDATA[<130> A2186-7046TW]]> <![CDATA[<140> TW 111108605]]> <![CDATA[<141> 2022-03-09]]> <![CDATA[<150> 63/294,224]]> <![CDATA[<151> 2021-12-28]]> <![CDATA[<150> 63/158,741]]> <![CDATA[<151> 2021-03-09]]> <![CDATA[<160> 28 ]]> <![CDATA[<170> PatentIn version 3.5]]> <![CDATA[<210> 1]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 1]]> atgatcaagt ctattcagct gaaggtcaag ggggagtgtc cgatcacgaa ggatgtaatc 60 aacgaataca aagaatacta taacaattgc agtgattgga ttaaaaacaa tctgacgtcc 120 attaccatcg gggagatggc aaaatttctg caatcgttga gcgataaaga agtggcctat 180 atctcaatgg gcctgtccga tgagtggaaa gacaaaccgt tatatcatct gtttaccaaa 240 aaatatcaca ccaaaaatgc ggataactta ttatactact acattaaaga aaaaaatctg 300 gacggctaca aaggcaatac gcttaatatc tccaatacat ctttccgcca gttcggttat 360 ttcaaactcg tggtgagcaa ctaccgcact aaaatccgta cgctgaattg taaaatcaag 420 cgtaagaaaa tcgatgccga ttccacgtct gaggatatcg aaatgcaggt gatgtacgaa 480 attattaaat acagtttaaa taaaaagtct gattgggata acttcattag ctatatcgaa 540 aacgttgaaa atcctaatat tgacaacatc aaccgctaca aactgctgcg cgaatgcttt 600 tgcgaaaacg aaaacatgat taagaacaaa cttgaattgc tgtctgtgga acaattgaaa 660 aaatttggcg gttgcatcat gaaacctcac attaatagca tgaccattaa cattcaagat 720 tttaaaattg aggaaaaaga aaactctctg gggttcatcc tccacctccc actgaacaaa 780 aaacagtatc aaattgaact cctgggcaat cgtcagatta aaaaaggcac caaagaaatt 840 cacgaaacgt tagttgacat tactaacacc catggcgaaa acattgtgtt tactattaaa 900 aatgataatc tgtatatcgt gttctcttat gagtccgaat ttgaaaaaga agaagttaac 960 ttcgctaaaa cggttggcct ggacgtaaac ttcaaacatg ccttctttgt gacctctgag 1020 aaagataact gtcatctcga cggttatatt aatctctaca aatacttatt ggagcacgac 1080 gagtttacta accttctcac cgaagatgaa cgtaaagatt atgaggagct gagtaaagtc 1140 gttactttct gcccgtttga aaatcagtta ctgtttgcgc gttacaacaa gatgagcaaa 1200 ttctgcaaga aagaacaggt cctgagcaaa cttctctatg cgctgcagaa aaaactcaaa 1260 gacgagaacc gcacgaaaga atatatttat gtctcgtgcg tgaacaaatt acgtgccaaa 1320 tatgtgtcat attttattct gaaagaaaag tactacgaga agcagaaaga atatgacatc 1380 gaaatgggct ttgtggacga ctcaacggaa agcaaagaat caatggataa acgccgtact 1440 gaatatccgt ttcgcaacac gccggtagcc aacgaactgt tgtccaaact gaataacgta 1500 cagcaggaca tcaacgggtg cctgaagaac atcatcaact acatttataa aattttcgag 1560 cagaacggtt ataaagttgt cgccctcgaa aacctggaaa attctaattt tgaaaaaaaa 1620 caggtgttgc cgacgattaa aagtctgctg aaatatcaca aactggagaa ccagaacgtg 1680 aatgatatca aggcctctga caaagttaaa gaatatattg aaaacggtta ttatgaactc 1740 atgaccaacg agaataacga aatcgttgat gcaaaatata cagaaaaggg cgcaatgaag 1800 gtgaagaacg ccaatttttt taacctcatg atgaaaagtt tgcattttgc cagtgtgaaa 1860 gatgagtttg tgctgctgtc caataatggc aagacgcaga ttgcattagt gccatccgag 1920 tttacatctc agatggacag caccgatcac tgtctgtaca tgaagaagaa cgacaaaggt 1980 aaactggtga aagcggataa aaaggaagtt cgtacaaaac aggaacgtca catcaacggc 2040 ctcaacgccg atttcaacgc agcgaataat attaaatata tcgtggaaaa tgaagtgtgg 2100 cgtggtattt tttgcactcg cccgaagaaa acagaatata acgtacccag tctggatacc 2160 acgaaaaaag gtccgtctgc gattctcaac atgctgaaga aaattgaagc catcaaggtc 2220 ctggaaacgg aaaaa 2235 <![CDATA[<210> 2]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 2]]> atgatcaaga gcatccagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc 60 aacgagtaca aggagtacta caacaactgt tctgattgga tcaagaacaa tctgaccagc 120 atcacaatcg gcgagatggc caagtttctg cagagcctgt ccgacaagga ggtggcctac 180 atctctatgg gcctgagcga cgagtggaag gataagcctc tgtatcacct gttcaccaag 240 aagtaccaca caaagaatgc cgacaacctg ctgtactatt acatcaagga gaagaacctg 300 gatggctaca agggcaatac cctgaacatc tccaatacat ctttcaggca gtttggctat 360 ttcaagctgg tggtgtccaa ttacaggacc aagatccgca cactgaactg caagatcaag 420 cgcaagaaga tcgacgccga ttctaccagc gaggacatcg agatgcaggt catgtatgag 480 atcatcaagt actccctgaa caagaagtct gattgggata atttcatctc ttatatcgag 540 aacgtggaga accccaatat cgataacatc aatcggtaca agctgctgag agagtgcttt 600 tgtgagaacg agaatatgat caagaacaag ctggagctgc tgagcgtgga gcagctgaag 660 aagttcggcg gctgtatcat gaagcctcac atcaacagca tgaccatcaa tatccaggac 720 tttaagatcg aggagaagga gaattccctg ggcttcatcc tgcacctgcc actgaacaag 780 aagcagtacc agatcgagct gctgggcaat cggcagatca agaagggcac caaggagatc 840 cacgagacac tggtggacat caccaacaca cacggcgaga acatcgtgtt tacaatcaag 900 aacgataatc tgtacatcgt gtttagctac gagtccgagt tcgagaagga ggaagtgaat 960 tttgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttctttgt gacatccgag 1020 aaggacaatt gccacctgga tggctatatc aacctgtata agtacctgct ggagcacgat 1080 gagttcacca acctgctgac agaggacgag cggaaggatt acgaggagct gtctaaggtg 1140 gtgacctttt gccctttcga gaatcagctg ctgtttgcca gatataacaa gatgagcaag 1200 ttctgtaaga aggagcaggt gctgtccaag ctgctgtacg ccctgcagaa gaagctgaag 1260 gacgagaaca ggacaaagga gtatatctac gtgtcttgcg tgaataagct gcgcgccaag 1320 tatgtgagct actttatcct gaaggagaag tattacgaga agcagaagga gtatgacatc 1380 gagatgggct tcgtggacga ttctaccgag agcaaggagt ccatggataa gcggagaacc 1440 gagtacccct ttaggaacac acctgtggcc aatgagctgc tgagcaagct gaacaatgtg 1500 cagcaggata tcaacggctg tctgaagaac atcatcaatt acatctacaa gatcttcgag 1560 cagaacggct acaaggtggt ggccctggag aacctggaga actccaattt cgagaagaag 1620 caggtgctgc caacaatcaa gtctctgctg aagtatcaca agctggagaa ccagaatgtg 1680 aacgacatca aggccagcga taaggtgaag gagtacatcg agaatggcta ttacgagctg 1740 atgaccaacg agaacaatga gatcgtggac gccaagtata cagagaaggg cgccatgaag 1800 gtgaagaatg ccaacttctt taacctgatg atgaagagcc tgcactttgc ctccgtgaag 1860 gatgagttcg tgctgctgtc caacaatggc aagacccaga tcgccctggt gccatccgag 1920 ttcacctctc agatggacag cacagatcac tgcctgtaca tgaagaagaa tgacaagggc 1980 aagctggtga aggccgataa gaaggaggtg aggacaaagc aggagcgcca catcaacggc 2040 ctgaatgccg actttaacgc cgccaacaat atcaagtata tcgtggagaa tgaagtgtgg 2100 cggggcatct tctgtaccag accaaagaag acagagtaca acgtgccctc cctggatacc 2160 acaaagaagg gcccctctgc catcctgaat atgctgaaga agatcgaggc catcaaggtg 2220 ctggagaccg agaag 2235 <![CDATA[<210> 3]]> <![CDATA[<211> 745]]> <![CDATA[<212> PRT]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 3]]> Met Ile Lys Ser Ile Gln Leu Lys Val Lys Gly Glu Cys Pro Ile Thr 1 5 10 15 Lys Asp Val Ile Asn Glu Tyr Lys Glu Tyr Tyr Asn Asn Cys Ser Asp 20 25 30 Trp Ile Lys Asn Asn Leu Thr Ser Ile Thr Ile Gly Glu Met Ala Lys 35 40 45 Phe Leu Gln Ser Leu Ser Asp Lys Glu Val Ala Tyr Ile Ser Met Gly 50 55 60 Leu Ser Asp Glu Trp Lys Asp Lys Pro Leu Tyr His Leu Phe Thr Lys 65 70 75 80 Lys Tyr His Thr Lys Asn Ala Asp Asn Leu Leu Tyr Tyr Tyr Ile Lys 85 90 95 Glu Lys Asn Leu Asp Gly Tyr Lys Gly Asn Thr Leu Asn Ile Ser Asn 100 105 110 Thr Ser Phe Arg Gln Phe Gly Tyr Phe Lys Leu Val Val Ser Asn Tyr 115 120 125 Arg Thr Lys Ile Arg Thr Leu Asn Cys Lys Ile Lys Arg Lys Lys Ile 130 135 140 Asp Ala Asp Ser Thr Ser Glu Asp Ile Glu Met Gln Val Met Tyr Glu 145 150 155 160 Ile Ile Lys Tyr Ser Leu Asn Lys Lys Ser Asp Trp Asp Asn Phe Ile 165 170 175 Ser Tyr Ile Glu Asn Val Glu Asn Pro Asn Ile Asp Asn Ile Asn Arg 180 185 190 Tyr Lys Leu Leu Arg Glu Cys Phe Cys Glu Asn Glu Asn Met Ile Lys 195 200 205 Asn Lys Leu Glu Leu Leu Ser Val Glu Gln Leu Lys Lys Phe Gly Gly 210 215 220 Cys Ile Met Lys Pro His Ile Asn Ser Met Thr Ile Asn Ile Gln Asp 225 230 235 240 Phe Lys Ile Glu Glu Lys Glu Asn Ser Leu Gly Phe Ile Leu His Leu 245 250 255 Pro Leu Asn Lys Lys Gln Tyr Gln Ile Glu Leu Leu Gly Asn Arg Gln 260 265 270 Ile Lys Lys Gly Thr Lys Glu Ile His Glu Thr Leu Val Asp Ile Thr 275 280 285 Asn Thr His Gly Glu Asn Ile Val Phe Thr Ile Lys Asn Asp Asn Leu 290 295 300 Tyr Ile Val Phe Ser Tyr Glu Ser Glu Phe Glu Lys Glu Glu Val Asn 305 310 315 320 Phe Ala Lys Thr Val Gly Leu Asp Val Asn Phe Lys His Ala Phe Phe 325 330 335 Val Thr Ser Glu Lys Asp Asn Cys His Leu Asp Gly Tyr Ile Asn Leu 340 345 350 Tyr Lys Tyr Leu Leu Glu His Asp Glu Phe Thr Asn Leu Leu Thr Glu 355 360 365 Asp Glu Arg Lys Asp Tyr Glu Glu Leu Ser Lys Val Val Thr Phe Cys 370 375 380 Pro Phe Glu Asn Gln Leu Leu Phe Ala Arg Tyr Asn Lys Met Ser Lys 385 390 395 400 Phe Cys Lys Lys Glu Gln Val Leu Ser Lys Leu Leu Tyr Ala Leu Gln 405 410 415 Lys Lys Leu Lys Asp Glu Asn Arg Thr Lys Glu Tyr Ile Tyr Val Ser 420 425 430 Cys Val Asn Lys Leu Arg Ala Lys Tyr Val Ser Tyr Phe Ile Leu Lys 435 440 445 Glu Lys Tyr Tyr Glu Lys Gln Lys Glu Tyr Asp Ile Glu Met Gly Phe 450 455 460 Val Asp Asp Ser Thr Glu Ser Lys Glu Ser Met Asp Lys Arg Arg Thr 465 470 475 480 Glu Tyr Pro Phe Arg Asn Thr Pro Val Ala Asn Glu Leu Leu Ser Lys 485 490 495 Leu Asn Asn Val Gln Gln Asp Ile Asn Gly Cys Leu Lys Asn Ile Ile 500 505 510 Asn Tyr Ile Tyr Lys Ile Phe Glu Gln Asn Gly Tyr Lys Val Val Ala 515 520 525 Leu Glu Asn Leu Glu Asn Ser Asn Phe Glu Lys Lys Gln Val Leu Pro 530 535 540 Thr Ile Lys Ser Leu Leu Lys Tyr His Lys Leu Glu Asn Gln Asn Val 545 550 555 560 Asn Asp Ile Lys Ala Ser Asp Lys Val Lys Glu Tyr Ile Glu Asn Gly 565 570 575 Tyr Tyr Glu Leu Met Thr Asn Glu Asn Asn Glu Ile Val Asp Ala Lys 580 585 590 Tyr Thr Glu Lys Gly Ala Met Lys Val Lys Asn Ala Asn Phe Phe Asn 595 600 605 Leu Met Met Lys Ser Leu His Phe Ala Ser Val Lys Asp Glu Phe Val 610 615 620 Leu Leu Ser Asn Asn Gly Lys Thr Gln Ile Ala Leu Val Pro Ser Glu 625 630 635 640 Phe Thr Ser Gln Met Asp Ser Thr Asp His Cys Leu Tyr Met Lys Lys 645 650 655 Asn Asp Lys Gly Lys Leu Val Lys Ala Asp Lys Lys Glu Val Arg Thr 660 665 670 Lys Gln Glu Arg His Ile Asn Gly Leu Asn Ala Asp Phe Asn Ala Ala 675 680 685 Asn Asn Ile Lys Tyr Ile Val Glu Asn Glu Val Trp Arg Gly Ile Phe 690 695 700 Cys Thr Arg Pro Lys Lys Thr Glu Tyr Asn Val Pro Ser Leu Asp Thr 705 710 715 720 Thr Lys Lys Gly Pro Ser Ala Ile Leu Asn Met Leu Lys Lys Ile Glu 725 730 735 Ala Ile Lys Val Leu Glu Thr Glu Lys 740 745 <![CDATA[<210> 4]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 4]]> cuuguuguau auguccuuuu auagguauua aacaac 36 <![CDATA[<210> 5]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 5]]> cuuguuguau auacgcuuuu auagguauua aacaac 36 <![CDATA[<210> 6]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 6]]> cuuguuguau auacgcuuuu auagguauug aacaac 36 <![CDATA[<210> 7]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 7]]> cuuguuguau auauccuuuu auagauauua aacagc 36 <![CDATA[<210> 8]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 8]]> cuuguuguau auauccuuuu auagauguug aacaac 36 <![CDATA[<210> 9]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 9]]> cuuguuguau auauccuuuu auagguguug aacaac 36 <![CDATA[<210> 10]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 10]]> cuuguuguau auauccuuuu auggguguau aacaac 36 <![CDATA[<210> 11]]> <![CDATA[<211> 37]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 11]]> cuuguuguau auguccuuuu auagguauuu gaacaac 37 <![CDATA[<210> 12]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 12]]> cuuguuguau augucuuuuu auagguauug aacaac 36 <![CDATA[<210> 13]]> <![CDATA[<211> 36]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 13]]> cuuguugugu auauccuuuu auagguauug aacaac 36 <![CDATA[<210> 14]]> <![CDATA[<211> 12]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 14]]> cuuguuguru au 12 <![CDATA[<210> 15]]> <![CDATA[<211> 12]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 15]]> uuuuaurgru ru 12 <![CDATA[<210> 16]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:EMX1哺乳動物目標序列]]> <![CDATA[<400> 16]]> ccgccgcttc ctgagccatc 20 <![CDATA[<210> 17]]> <![CDATA[<211> 56]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 17]]> cuuguuguau auguccuuuu auagguauua aacaacccgc cgcuuccuga gccauc 56 <![CDATA[<210> 18]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:VEGFA哺乳動物目標序列]]> <![CDATA[<400> 18]]> tccagaccac caatgggcac 20 <![CDATA[<210> 19]]> <![CDATA[<211> 56]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 19]]> cuuguuguau auguccuuuu auagguauua aacaacucca gaccaccaau gggcac 56 <![CDATA[<210> 20]]> <![CDATA[<211> 20]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:AAVS1哺乳動物目標序列]]> <![CDATA[<400> 20]]> tgagaatggt gcgtcctagg 20 <![CDATA[<210> 21]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 21]]> atgattaaat ccatccagct taaagtgaaa ggcgaatgcc ccatcaccaa agatgttatt 60 aacgagtaca aggaatacta taataactgc agcgattgga taaaaaacaa tcttacctcg 120 atcactattg gcgagatggc caagttcctg cagagcctgt ctgataagga ggttgcttac 180 atttccatgg gcctgagcga cgagtggaaa gacaagccct tgtaccacct gttcactaag 240 aaataccaca ctaagaatgc tgacaatctg ctctactact acatcaagga gaaaaacttg 300 gatggctaca aggggaacac gcttaacatt tctaacacct catttcgtca gttcgggtat 360 ttcaagctcg tggtgtccaa ctatcgcact aagattcgga cactcaactg caagattaaa 420 cgaaagaaga tcgacgcaga ttctacgagc gaggatattg aaatgcaggt catgtatgaa 480 atcatcaagt actctctgaa taagaagtct gactgggaca attttatcag ctacatcgaa 540 aacgtagaga accctaacat agacaatatc aacaggtaca aactgcttag ggaatgcttc 600 tgtgaaaacg agaatatgat aaaaaacaag ctggagctgc tgagcgtgga gcaattaaag 660 aagtttggag ggtgtatcat gaaaccccac attaactcga tgacaattaa tattcaagac 720 ttcaagatag aggagaaaga aaacagcttg ggctttattc tccatctccc tctgaataaa 780 aaacagtacc agatcgagct attgggaaat agacagatta agaaagggac caaggaaatt 840 cacgaaactc tcgtcgatat cacaaacacc catggagaga acatcgtgtt cacaatcaag 900 aacgataatc tgtacatagt gtttagttat gagagcgagt tcgagaagga agaggtcaac 960 tttgccaaga ctgttgggct tgacgtcaat ttcaaacacg cgttcttcgt gacaagcgaa 1020 aaggacaact gccatctcga tggctacatt aacctatata agtatttgct cgaacacgac 1080 gagtttacaa acctgctgac agaagatgag agaaaggact acgaagaact cagtaaggtc 1140 gttacgttct gtccatttga aaatcagctg ctattcgccc ggtacaataa aatgtccaaa 1200 ttctgtaaga aggaacaggt attgtctaaa ctgctgtatg ccctgcagaa aaagttgaaa 1260 gatgagaatc ggaccaaaga gtatatctat gtctcatgcg tgaacaagct aagagctaag 1320 tatgtttcct atttcatact gaaggagaag tactatgaga agcaaaagga gtacgacatt 1380 gagatgggct tcgtcgatga ctcaaccgaa tctaaagaat ccatggacaa aaggcgcaca 1440 gagtatccat ttagaaatac accggtggct aacgaactcc tgagtaaact caacaatgtt 1500 caacaagata tcaacggttg tctgaagaat ataattaatt atatctataa gatttttgaa 1560 cagaatggct acaaggtggt cgcactggaa aacttagaga attccaactt tgagaaaaag 1620 caggtgcttc ctacaatcaa atcacttctg aagtaccaca aacttgagaa tcagaacgta 1680 aatgatatca aagccagtga taaagtcaaa gaatacatcg agaatggtta ttatgaactg 1740 atgactaatg aaaataatga aatagtggac gcaaaatata cggaaaaggg tgccatgaag 1800 gtaaagaacg caaacttttt taatttgatg atgaagtcac tgcactttgc ttctgtgaag 1860 gatgagtttg tcctgctgag caacaacgga aagacacaga ttgcgctagt gccttcagag 1920 ttcactagtc agatggacag taccgaccat tgcctctaca tgaaaaaaaa tgacaaaggg 1980 aaactcgtga aggctgacaa gaaagaggtg cggaccaagc aagagcgcca tatcaatgga 2040 ttaaacgccg attttaacgc ggcaaataac atcaaataca tcgttgaaaa tgaggtgtgg 2100 aggggtatct tctgtacccg accaaagaag actgagtaca acgtaccatc cttagacacc 2160 accaaaaaag gaccctccgc cattctgaat atgttaaaga aaatcgaggc cataaaagtg 2220 ttggagaccg agaag 2235 <![CDATA[<210> 22]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 22]]> atgatcaaga gcattcagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc 60 aacgagtaca aggagtacta caacaactgc agcgactgga ttaaaaacaa tctcacaagc 120 atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaaaga ggtggcctac 180 atcagcatgg gcctgagcga cgagtggaag gacaagcccc tgtaccacct gttcaccaag 240 aagtaccaca ccaagaacgc cgacaacctg ctgtactact acatcaagga gaagaatctg 300 gatggctaca agggcaatac cctgaacatc agcaacacca gcttcagaca gttcggctac 360 ttcaagctgg tggtgagcaa ctacagaacc aagatcagaa ccctgaactg caagatcaag 420 agaaagaaga tcgacgccga cagcacaagc gaggacatag agatgcaagt tatgtacgag 480 atcatcaagt acagccttaa taaaaagagc gactgggaca acttcatcag ctacatagaa 540 aacgtggaga accccaacat cgacaacatc aacagataca agctgctgag agagtgcttc 600 tgcgagaacg agaacatgat caaaaacaaa ctcgaactgc tgagtgtaga acagctgaag 660 aagttcggcg gctgcatcat gaagccccac atcaacagca tgaccatcaa catccaagac 720 ttcaagatcg aggagaagga gaacagcctg ggcttcatcc tgcacctgcc cttaaacaag 780 aagcagtatc agatcgagct gctgggcaac agacagatca agaagggcac caaggagatc 840 cacgagaccc tggtggacat caccaacacc cacggcgaga atatcgtttt cactatcaag 900 aacgacaacc tgtacatcgt gtttagctat gagagcgagt tcgagaagga agaggtgaac 960 ttcgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gacaagcgag 1020 aaggacaact gccacctgga cggctacatc aatctgtaca agtacctgct ggagcacgac 1080 gagttcacca acctgctgac cgaggacgag agaaaggact acgaggagct gagcaaggtg 1140 gtgaccttct gccccttcga gaatcagctg ctgttcgcta gatacaacaa gatgagcaag 1200 ttctgcaaga aggagcaagt gctgagcaaa ctgctgtacg ccctgcagaa gaagctgaag 1260 gacgagaaca gaaccaagga gtatatctac gtgagctgcg tgaacaagct gagagccaag 1320 tacgtgagct acttcatcct gaaggagaag tactacgaga agcagaagga gtacgacatc 1380 gagatgggtt ttgtggacga cagcaccgag agcaaggaga gcatggacaa gagaagaacc 1440 gagtacccct tcagaaacac ccccgtggcc aacgaattac tgtctaaact gaataacgtg 1500 cagcaagaca tcaacggctg cctgaagaac ataatcaact acatctacaa gatcttcgag 1560 cagaacggct acaaggtggt agccctggag aacctggaga acagcaactt cgagaagaag 1620 caagtgctgc ccaccatcaa gagcctgctg aagtaccaca agctggagaa tcagaacgtg 1680 aacgacatca aggctagcga caaggtgaag gagtacatcg agaacggata ctacgagctg 1740 atgaccaacg agaacaacga gatcgtggac gccaagtaca ccgagaaggg cgccatgaag 1800 gtgaagaacg ccaacttctt caacctgatg atgaagagcc tgcacttcgc tagcgtgaag 1860 gacgagttcg tgctgctgtc gaacaacggc aagacacaga tcgccctggt gcctagcgag 1920 ttcacatctc agatggacag caccgaccac tgcctgtaca tgaagaagaa cgacaagggc 1980 aagctggtga aggccgacaa gaaagaggtg agaaccaagc aagagagaca catcaacggc 2040 ctgaacgccg acttcaacgc cgccaacaac atcaagtaca tcgtggagaa cgaggtgtgg 2100 agaggcatct tctgcacaag acccaagaag accgagtaca acgtgcctag cctggacacc 2160 accaagaagg gccctagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtg 2220 ctggagaccg agaag 2235 <![CDATA[<210> 23]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 23]]> atgatcaaga gcatccagct gaaggtgaag ggcgagtgcc ccatcaccaa ggacgtgatc 60 aacgagtaca aggagtacta caacaactgc agcgactgga tcaagaacaa cctgaccagc 120 atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaagga ggtggcctac 180 atcagcatgg gcctgagcga cgagtggaag gacaagcccc tgtaccacct gttcaccaag 240 aagtaccaca ccaagaacgc cgacaacctg ctgtactact acatcaagga gaagaacctg 300 gacggctaca agggcaacac cctgaacatc agcaacacca gcttccggca gttcggctac 360 ttcaagctgg tggtgagcaa ctaccggacc aagatccgga ccctgaactg caagatcaag 420 cggaagaaga tcgacgccga cagcaccagc gaggacatcg agatgcaggt gatgtacgag 480 atcatcaagt acagcctgaa caagaagagc gactgggaca acttcatcag ctacatcgag 540 aacgtggaga accccaacat cgacaacatc aaccggtaca agctgctgcg ggagtgcttc 600 tgcgagaacg agaacatgat caagaacaag ctggagctgc tgagcgtgga gcagctgaag 660 aagttcggcg gctgcatcat gaagccccac atcaacagca tgaccatcaa catccaggac 720 ttcaagatcg aggagaagga gaacagcctg ggcttcatcc tgcacctgcc cctgaacaag 780 aagcagtacc agatcgagct gctgggcaac cggcagatca agaagggcac caaggagatc 840 cacgagaccc tggtggacat caccaacacc cacggcgaga acatcgtgtt caccatcaag 900 aacgacaacc tgtacatcgt gttcagctac gagagcgagt tcgagaagga ggaggtgaac 960 ttcgccaaga ccgtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gaccagcgag 1020 aaggacaact gccacctgga cggctacatc aacctgtaca agtacctgct ggagcacgac 1080 gagttcacca acctgctgac cgaggacgag cggaaggact acgaggagct gagcaaggtg 1140 gtgaccttct gccccttcga gaaccagctg ctgttcgccc ggtacaacaa gatgagcaag 1200 ttctgcaaga aggagcaggt gctgagcaag ctgctgtacg ccctgcagaa gaagctgaag 1260 gacgagaacc ggaccaagga gtacatctac gtgagctgcg tgaacaagct gcgggccaag 1320 tacgtgagct acttcatcct gaaggagaag tactacgaga agcagaagga gtacgacatc 1380 gagatgggct tcgtggacga cagcaccgag agcaaggaga gcatggacaa gcggcggacc 1440 gagtacccct tccggaacac ccccgtggcc aacgagctgc tgagcaagct gaacaacgtg 1500 cagcaggaca tcaacggctg cctgaagaac atcatcaact acatctacaa gatcttcgag 1560 cagaacggct acaaggtggt ggccctggag aacctggaga acagcaactt cgagaagaag 1620 caggtgctgc ccaccatcaa gagcctgctg aagtaccaca agctggagaa ccagaacgtg 1680 aacgacatca aggccagcga caaggtgaag gagtacatcg agaacggcta ctacgagctg 1740 atgaccaacg agaacaacga gatcgtggac gccaagtaca ccgagaaggg cgccatgaag 1800 gtgaagaacg ccaacttctt caacctgatg atgaagagcc tgcacttcgc cagcgtgaag 1860 gacgagttcg tgctgctgag caacaacggc aagacccaga tcgccctggt gcccagcgag 1920 ttcaccagcc agatggacag caccgaccac tgcctgtaca tgaagaagaa cgacaagggc 1980 aagctggtga aggccgacaa gaaggaggtg cggaccaagc aggagcggca catcaacggc 2040 ctgaacgccg acttcaacgc cgccaacaac atcaagtaca tcgtggagaa cgaggtgtgg 2100 cggggcatct tctgcacccg gcccaagaag accgagtaca acgtgcccag cctggacacc 2160 accaagaagg gccccagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtg 2220 ctggagaccg agaag 2235 <![CDATA[<210]]>> 24]]> <br/><![CDATA[<211> 2235]]> <br/><![CDATA[<212> DNA]]> <br/><![CDATA[<213> 未知物]]> <br/> <br/><![CDATA[<220>]]> <br/><![CDATA[<223> 未知物之描述:親本序列]]> <br/> <br/><![CDATA[<400> 24]]> <br/><![CDATA[atgattaaaa gtatacagct taaggtcaag ggcgagtgcc cgattaccaa agatgtaatt 60 aacgagtaca aggagtatta caataactgt tctgactgga tcaagaacaa tctgacttca 120 attacgatcg gtgaaatggc caaatttctc cagtccttga gtgataagga ggtcgcatat 180 atatccatgg gactcagtga cgagtggaag gacaaacccc tgtaccatct ttttactaaa 240 aaataccata cgaaaaacgc agacaacctg ctgtactact atataaaaga aaaaaacctg 300 gacggttaca agggcaacac cctcaatatt agcaacacta gtttccgaca attcgggtac 360 ttcaagctgg tcgtgagcaa ctatcggacc aaaatcagga ctttgaattg taagataaag 420 agaaagaaga tagacgcaga ttctactagt gaggatatcg agatgcaggt aatgtacgag 480 atcattaagt attcactgaa caagaagagc gattgggata acttcatatc atacatcgaa 540 aacgttgaaa atccaaacat cgacaatatt aatagataca aactgttgag agaatgcttc 600 tgcgaaaacg aaaatatgat aaaaaacaaa ctcgaattgt tgtcagttga acagctgaag 660 aaattcggag ggtgcataat gaagcctcac ataaactcaa tgacaataaa catccaagac 720 ttcaagatag aagagaagga gaacagtttg ggttttattc ttcacctgcc tttgaacaag 780 aagcaatacc aaatcgagct gctcggaaat aggcagataa aaaaggggac aaaagaaata 840 cacgaaaccc ttgttgacat tacgaacaca cacggggaaa atatcgtgtt cacaattaaa 900 aatgacaacc tttacattgt attttcttat gaatcagagt tcgaaaagga agaagtgaac 960 tttgccaaga ccgttggttt ggacgtcaac tttaaacacg ccttcttcgt tacatcagaa 1020 aaggataact gtcatcttga tggatacata aacctctaca agtatcttct tgaacacgac 1080 gaattcacaa acctgcttac tgaagacgag cgaaaggatt acgaggagtt gtcaaaggta 1140 gtcacattct gtccattcga aaatcagctg ttgtttgcca ggtacaataa gatgtctaaa 1200 ttctgtaaaa aagaacaagt cctcagcaaa ctgctgtatg cactgcaaaa gaaacttaag 1260 gacgaaaata ggactaagga gtatatatac gtttcatgcg ttaataaact ccgggcgaaa 1320 tatgtgagtt attttattct gaaggagaag tattatgaga agcagaaaga gtacgacata 1380 gaaatgggat ttgtggatga cagtacggag agcaaagaaa gcatggacaa aagaaggacc 1440 gaatatccat ttcgaaatac tccagtcgcg aatgagctgc tgagcaaact taacaatgtc 1500 cagcaggaca ttaacggttg cctgaagaac ataatcaact acatatataa gatatttgag 1560 caaaacggat acaaagtggt tgcacttgaa aacctcgaga attcaaattt cgaaaagaag 1620 caagttttgc ccacgattaa aagtctcttg aaataccata agctcgaaaa tcagaatgtg 1680 aacgatatca aggcctcaga taaggtcaag gagtacatcg aaaatggata ttacgagctg 1740 atgacgaacg agaataacga aatcgtcgat gcgaagtaca cagaaaaggg ggctatgaag 1800 gtgaaaaacg ccaatttttt taatttgatg atgaagtcct tgcatttcgc ctcagtcaaa 1860 gatgagtttg ttctcctgag taataatggg aaaacacaga tagccttggt tccttcagag 1920 ttcacgtctc agatggactc aactgatcat tgtctttata tgaagaaaaa tgataaaggg 1980 aaactggtca aggccgataa gaaagaggtg cgcacgaaac aagaaagaca catcaacggc 2040 ctcaacgccg attttaacgc agctaacaat attaaatata tcgtagagaa tgaggtctgg 2100 aggggcattt tttgcacccg acccaagaag actgaataca atgtccctag tctcgatacg 2160 accaaaaagg ggccatcagc tatactgaat atgttgaaaa agattgaggc gattaaagtc 2220 ctggaaaccg agaaa 2235 <![CDATA[<210> 25]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 25]]> atgatcaaga gcatccagct gaaggtgaag ggagaatgtc ctatcacaaa ggacgtgatc 60 aacgagtaca aggagtacta caacaactgc agcgattgga tcaagaacaa cctgaccagc 120 atcaccatcg gcgagatggc caagttcctg cagtctctgt ccgataagga agtcgcctac 180 atcagcatgg gcttgagcga cgaatggaag gacaaacccc tgtaccatct gttcactaag 240 aagtaccaca ccaagaacgc cgataacctg ctgtactact acatcaagga aaagaacctg 300 gacggctaca agggcaatac cctgaacatc agtaacacca gcttccggca gtttggctat 360 tttaaactgg tggtcagcaa ctacagaacc aagatcagaa cactgaactg caagatcaag 420 aggaagaaaa tcgacgccga ctccaccagc gaagatatag agatgcaggt gatgtacgag 480 atcattaagt actccctgaa taagaagtct gactgggaca acttcatcag ctacatcgag 540 aacgtggaaa accccaacat tgacaatatc aacagataca agctgctgcg ggaatgcttc 600 tgcgagaatg aaaacatgat caagaacaag ctggagcttc tgagcgtgga gcagctgaag 660 aaattcggcg gatgtatcat gaagccacac atcaatagca tgaccatcaa catccaggac 720 ttcaaaattg aagaaaagga gaatagccta ggcttcatcc tgcacctgcc tctgaacaag 780 aaacagtacc agatcgagct gctgggcaac cggcaaatca agaagggcac caaggagatc 840 cacgagacac tggtcgacat cacaaacaca cacggcgaaa acatcgtgtt caccatcaag 900 aacgacaacc tgtacatcgt gttcagctac gagtctgaat tcgagaagga agaggtcaac 960 ttcgctaaga cagtgggcct ggacgtgaac ttcaagcacg ccttcttcgt gaccagcgag 1020 aaagacaact gtcacctgga cgggtacatc aacctgtaca agtacctgct ggaacacgac 1080 gagttcacca acctcctgac cgaagatgaa cggaaggatt acgaggagct gtctaaggtg 1140 gtgacattct gccctttcga gaaccagctg ctcttcgcca gatataacaa gatgagcaag 1200 ttttgtaaaa aggagcaggt gctcagcaag ctactgtacg ccctgcagaa gaagctgaag 1260 gacgagaaca gaaccaagga atacatctac gtgagctgcg tgaacaagct gagagccaag 1320 tacgtgtcct atttcatcct gaaggaaaaa tactacgaga aacagaaaga gtacgacatc 1380 gagatgggat ttgtggacga cagcaccgaa agcaaggaat ctatggacaa gcgcagaacc 1440 gagtatccat ttagaaacac ccctgtggcc aatgagctgc tgtccaaact gaacaacgtg 1500 cagcaggata tcaatggctg cctgaaaaac atcatcaact acatttacaa gatctttgag 1560 caaaacggct acaaagtggt ggccctggag aacctggaaa actccaactt cgagaagaag 1620 caagtgctgc ccacaatcaa gagcctgctg aagtaccata agctggaaaa tcagaatgtg 1680 aacgacataa aggcctctga taaggtgaag gaatacatcg aaaatggcta ttacgagctg 1740 atgaccaacg aaaataacga gattgtggac gctaaataca ccgagaaggg cgctatgaaa 1800 gtgaaaaacg ctaacttttt taacctgatg atgaagagcc tgcacttcgc cagcgtgaag 1860 gacgagttcg tgctgctgag caacaacggc aagacacaga tcgccctggt gcccagcgag 1920 ttcaccagtc agatggattc tacagatcac tgcctgtaca tgaaaaagaa tgataaggga 1980 aagttagtga aagccgataa gaaggaggtg cggaccaaac aggagagaca catcaacggc 2040 ctgaacgctg acttcaacgc cgccaacaac atcaaataca tcgttgagaa tgaggtgtgg 2100 cggggcatct tctgcaccag acctaagaaa acagagtata atgtgcctag cctggacacc 2160 accaagaagg gtcctagcgc catcctgaac atgctgaaga agatcgaggc catcaaggtt 2220 ctggaaaccg agaag 2235 <![CDATA[<210> 26]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 26]]> atgatcaaat caattcagct taaggtgaag ggcgagtgtc ccattactaa agacgtcatt 60 aacgaataca aggagtatta caataactgt agcgactgga tcaagaacaa tttgacatct 120 atcacaattg gggagatggc caaatttttg cagagcctta gcgacaaaga ggtcgcctac 180 atctctatgg ggctctccga cgagtggaag gacaagccgt tgtaccacct gttcacaaaa 240 aagtatcaca caaagaatgc agacaatttg ctgtactact acattaagga gaaaaacctt 300 gatggctata aaggaaacac cctcaacatc tctaacacct cttttagaca gttcggctac 360 tttaagctgg tggtgagcaa ctatagaacc aagattagga ctctgaattg taagatcaaa 420 aggaagaaaa tcgacgctga ttctacctct gaagatattg agatgcaagt catgtatgag 480 atcatcaagt attcactgaa caagaagagt gattgggaca actttatttc ctacatagag 540 aacgtggaga atcccaatat cgataatata aaccgatata agttgctgcg ggagtgcttt 600 tgtgaaaatg agaacatgat taaaaacaag ttggaactct tgtcagtaga acagcttaaa 660 aagttcggcg gctgcatcat gaagcctcat atcaacagca tgacaattaa tatccaagat 720 tttaagatcg aggagaagga aaacagtttg gggtttattt tgcaccttcc actcaataag 780 aaacagtacc agatcgagct tctggggaat cggcagatta agaaagggac caaagagata 840 catgaaactc tggttgatat cacaaatacc catggcgaaa atattgtctt taccatcaag 900 aatgacaacc tgtatatcgt gttttcttat gagtccgaat tcgagaagga agaggtgaac 960 tttgccaaga cagtggggtt ggatgtcaat tttaagcatg ccttctttgt tacctctgaa 1020 aaagataact gccatctgga tggatacatc aatctctata agtatctgct tgagcacgat 1080 gagttcacaa atctgctgac cgaggacgag agaaaggact acgaagaatt gtccaaggtg 1140 gttactttct gcccattcga aaatcagctg ctgttcgcaa gatacaacaa aatgtctaaa 1200 ttctgtaaaa aagagcaggt cctgtctaaa cttctgtatg ctctgcagaa aaaactcaaa 1260 gacgaaaacc gcacaaaaga gtacatttac gtaagctgcg tcaataaatt gagggccaag 1320 tatgtttctt atttcatcct taaagagaaa tactacgaga agcagaagga gtacgacata 1380 gagatggggt ttgtagacga ttctacggag tctaaggaat ctatggacaa acggcgcaca 1440 gagtacccct ttaggaatac ccctgtcgct aatgagttgc tctctaagct gaacaatgtc 1500 caacaggata ttaatggctg cttgaagaac ataataaatt atatttataa aatctttgag 1560 cagaacggct acaaagttgt tgctctggag aaccttgaga acagcaactt tgaaaagaag 1620 caggtactgc ctactattaa gtctctgctg aaatatcata agctggaaaa ccaaaatgtc 1680 aacgacatca aggcctccga caaagtgaaa gagtacatcg agaacggata ctacgagctg 1740 atgactaatg agaataacga gattgtcgac gcgaaatata ccgaaaaggg cgctatgaag 1800 gtgaagaatg ctaatttctt caacttgatg atgaagagcc tccattttgc ttctgtgaag 1860 gatgagtttg tgctgttgag taacaacggg aagacccaga tcgcactggt cccgtccgag 1920 tttacctccc agatggactc tacagatcac tgcttgtaca tgaagaaaaa cgataaaggt 1980 aagttggtga aagcagataa gaaagaggtg cgaacaaagc aggagagaca tatcaacgga 2040 ctgaacgcag attttaacgc tgctaataat attaaatata ttgttgagaa cgaagtgtgg 2100 cggggaattt tctgcaccag accgaaaaaa acagaatata atgtcccgtc cctcgacact 2160 actaaaaaag gcccttctgc gatcctgaac atgcttaaaa agattgaagc gatcaaggtg 2220 ttggagactg agaag 2235 <![CDATA[<210> 27]]> <![CDATA[<211> 2235]]> <![CDATA[<212> DNA]]> <![CDATA[<213> 未知物]]> <![CDATA[<220>]]> <![CDATA[<223> 未知物之描述:親本序列]]> <![CDATA[<400> 27]]> atgatcaaga gcattcagct gaaagtgaag ggcgagtgtc ccatcactaa ggacgttatc 60 aacgagtaca aggagtacta taacaactgc tctgactgga ttaagaataa cctgaccagt 120 atcaccatcg gcgagatggc caagttcctg cagagcctga gcgacaagga ggtggcctac 180 atcagtatgg ggctgtccga tgagtggaaa gacaagccac tgtatcatct gttcaccaaa 240 aagtaccaca ccaaaaatgc cgataacctg ctgtactatt atatcaaaga aaaaaacctg 300 gacgggtaca aaggcaacac cctgaacatc agcaatacaa gtttccgcca gtttggatac 360 ttcaagctgg tcgtgtcaaa ttacagaacc aaaatcagaa ccctgaactg caagatcaaa 420 aggaagaaga tcgacgctga cagcaccagc gaggacattg agatgcaggt gatgtacgag 480 attattaaat actccctgaa caagaagagt gattgggaca atttcatttc ctacatcgag 540 aatgtggaga accctaacat cgataacata aatcggtaca aactgctgag agagtgcttt 600 tgcgagaacg aaaatatgat aaagaacaag ctggagctgc tcagcgtgga acagctgaaa 660 aaatttggag gctgcattat gaagccccac atcaactcaa tgactatcaa tatccaggac 720 ttcaagatcg aagagaagga gaactccctg ggcttcattc tgcatctgcc actgaataag 780 aagcagtatc agatcgaact gctgggaaat aggcagatca agaaggggac caaagagatc 840 cacgaaactc tggtggacat tactaatact cacggggaga acattgtgtt caccattaag 900 aacgataatc tgtacatcgt gttcagctat gaaagcgagt ttgagaagga agaggtgaac 960 ttcgccaaga ccgtcgggct ggatgtgaat tttaagcacg ccttctttgt gaccagcgaa 1020 aaggataact gccacctgga cggatacatc aatctgtaca agtatctgct ggagcacgac 1080 gaatttacca atctgctgac cgaggacgag aggaaggact acgaagagct ctccaaggtg 1140 gtgacatttt gtccattcga gaaccagctg ctgttcgcca gatacaacaa gatgtctaaa 1200 ttttgcaaaa aagaacaggt cctgagcaag ctgctgtacg ccctgcagaa gaaactgaag 1260 gacgagaaca gaactaagga gtacatctat gtgagctgtg tgaataaact gagagcaaaa 1320 tacgtgtctt actttattct gaaggagaag tattacgaga agcagaagga atacgacatc 1380 gagatgggct tcgtggacga ttccacagag agcaaggaaa gcatggataa aaggcgcact 1440 gaatacccct tcagaaacac acctgtggcc aatgagctgc tgtccaagct gaacaacgtg 1500 cagcaggaca tcaacggctg cctgaagaac atcatcaact acatttataa gatcttcgag 1560 cagaatggct acaaagtggt ggcactggag aacctggaga actccaattt tgaaaagaaa 1620 caggtgctgc ccaccattaa gagcctgctt aaataccata agctggagaa ccagaacgtg 1680 aatgatatca aagccagcga taaggtcaaa gagtacatcg agaacggata ttatgagctg 1740 atgaccaacg agaacaatga gatcgtggac gccaaatata ccgagaaggg cgccatgaag 1800 gtgaagaacg ccaacttctt taacctgatg atgaagtccc ttcactttgc ctccgtgaag 1860 gatgagttcg tgctgctgag caacaacggc aagacccaga tcgccctggt gccctctgaa 1920 ttcaccagcc agatggattc aaccgaccac tgtctctaca tgaagaagaa cgacaagggc 1980 aagctggtga aggccgacaa gaaagaggtg cgcacaaagc aggagcggca catcaatggc 2040 ctgaacgctg atttcaacgc cgcaaacaac attaagtaca tcgtggagaa tgaggtgtgg 2100 agaggtattt tctgcacccg ccccaagaag accgagtata atgtgccctc tctggacacc 2160 accaaaaaag gcccaagcgc tatcctgaat atgttgaaga aaatcgaggc catcaaggtg 2220 ctggaaaccg agaag 2235 <![CDATA[<210> 28]]> <![CDATA[<211> 56]]> <![CDATA[<212> RNA]]> <![CDATA[<213> 人工序列]]> <![CDATA[<220>]]> <![CDATA[<223> 人工序列之描述:合成寡核苷酸]]> <![CDATA[<400> 28]]> cuuguuguau auguccuuuu auagguauua aacaacugag aauggugcgu ccuagg 56
Claims (87)
- 一種變異多肽,其相對於SEQ ID NO: 3之親本多肽包含改變,且其中該改變為表2之取代。
- 如請求項1之變異多肽,其中該取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
- 如請求項1或2之變異多肽,其中該變異多肽包含a) P14R取代、E311R取代及D32R取代;b) P14R取代、E311R取代及G223R取代;c) P14R取代、E311R取代、D32R取代及I61R取代;或d) D32R取代、N109R取代、E311R取代及D719R取代。
- 如請求項1至3中任一項之變異多肽,其中該變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
- 一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置P14、E311、D32、I61、G223、N109及D719中之一或多處之取代的胺基酸序列。
- 一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列:P14R、E311R、D32R、I61R、G223R、N109R及D719R。
- 一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且相對於SEQ ID NO: 3包含位置K208、D302、D590、E154、D567、L38、D145、C13、T338、P14、D55、K221、K35及E736中之一或多處之取代的胺基酸序列。
- 一種變異多肽,其包含與SEQ ID NO: 3具有至少95%一致性且包含以下取代中之一或多者的胺基酸序列:K208G、D302G、D590G、E154G、D567G、L38G、D145G、C13G、T338G、P14G、D55G、K221G、K35G及E736G。
- 如請求項1至8中任一項之變異多肽,其中該變異多肽包含P14處之取代(例如,P14R取代)。
- 如請求項1至9中任一項之變異多肽,其中該變異多肽包含E311處之取代(例如,E311R取代)。
- 如請求項1至10中任一項之變異多肽,其中該變異多肽包含D32處之取代(例如,D32R取代)。
- 如請求項1至11中任一項之變異多肽,其中該變異多肽包含I61處之取代(例如,I61R取代)。
- 如請求項1至12中任一項之變異多肽,其中該變異多肽包含G223處之取代(例如,G223取代)。
- 如請求項1至13中任一項之變異多肽,其中該變異多肽包含N109處之取代(例如,N109R取代)。
- 如請求項1至14中任一項之變異多肽,其中該變異多肽包含D719處之取代(例如,D719R取代)。
- 如請求項5之變異多肽,其中該變異多肽包含以下位置處之取代:P14 (例如,P14R取代)、E311 (例如,E311R取代)、D32 (例如,D32R取代)、I61 (例如,I61R取代)、G223 (例如,G223取代)、N109 (例如,N109R取代)、D719 (例如,D719R取代)或其任何組合。
- 如請求項16之變異多肽,其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及D32 (例如,D32R取代)處之取代(例如,P14R、E311R、D32R變異多肽)。
- 如請求項16之變異多肽,其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)及G223 (例如,G223R取代)處之取代(例如,P14R、E311R、G223R變異多肽)。
- 如請求項16之變異多肽,其中該變異多肽相對於SEQ ID NO: 3包含位置P14 (例如,P14R取代)、E311 (例如,E311R)、D32 (例如,D32R取代)及I61 (例如,I61R取代)處之取代(例如,P14R、E311R、D32R及I61R變異多肽)。
- 如請求項16之變異多肽,其中該變異多肽相對於SEQ ID NO: 3包含位置D32R (例如,D32R取代)、N109 (例如,N109R)、E311 (例如,E311R取代)及D719 (例如,D719R取代)處之取代(例如,D32R、N109R、E311R及D719R變異多肽)。
- 如請求項5至20中任一項之變異多肽,其中該變異多肽包含以下各處之取代:K208 (例如,K208G取代)、D302 (例如,D302G取代)、D590 (例如,D590G取代)、E154 (例如,E154G取代)、D567 (例如,D567G取代)、L38 (例如,L38G取代)、D145 (例如,D145G取代)、C13 (例如,C13G取代)、T338 (例如,T338G取代)、P14 (例如,P14G取代)、D55 (例如,D55G取代)、K221 (例如,K221G取代)、K35 (例如,K35G取代)及E736 (例如,E736G取代)或其任何組合。
- 如請求項1至21中任一項之變異多肽,其中相對於親本多肽,該變異多肽展現增加之與RNA引導之二元複合物形成。
- 如請求項1至22中任一項之變異多肽,其中相對於親本二元複合物,包含該變異多肽之二元複合物展現增加之穩定性。
- 如請求項1至23中任一項之變異多肽,其中相對於親本多肽,該變異多肽展現增加之核酸酶活性。
- 一種組合物,其包含如請求項1至24中任一項之變異多肽,其中該組合物進一步包含RNA引導或編碼該RNA引導之核酸,其中該RNA引導包含正向重複序列及間隔子序列。
- 如請求項25之組合物,其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少90%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90%一致性之序列。
- 如請求項25之組合物,其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少95%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95%一致性之序列。
- 如請求項25之組合物,其中該正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
- 如請求項25至28中任一項之組合物,其中該間隔子序列之長度包含約15個核苷酸至約35個核苷酸。
- 如請求項25至29中任一項之組合物,其中該間隔子序列結合於目標核酸之目標股序列,且其中該目標核酸序列之非目標股序列與原間隔子相鄰模體(PAM)序列相鄰。
- 如請求項30之組合物,其中該PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3',其中N為任何核苷酸,Y為C或T,且R為A或G。
- 如請求項31之組合物,其中該PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
- 如前述請求項中任一項之變異多肽或組合物,其中該變異多肽進一步包含核定位信號(NLS)。
- 如前述請求項中任一項之變異多肽或組合物,其中該變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
- 一種組合物,其包含編碼如前述請求項中任一項之變異多肽及/或RNA引導之核酸。
- 如請求項35之組合物,其中該核酸經密碼子優化以在細胞中表現。
- 如請求項35或36之組合物,其中該核酸可操作地連接於啟動子。
- 如請求項35至37中任一項之組合物,其中該核酸在載體中。
- 如請求項38之組合物,其中該載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
- 如前述請求項中任一項之變異多肽或組合物,其中該變異多肽存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送系統中。
- 一種細胞,其包含如前述請求項中任一項之變異多肽或組合物。
- 如請求項41之細胞,其中該細胞為真核細胞。
- 如請求項41或42之細胞,其中該細胞為哺乳動物細胞或植物細胞。
- 如請求項41至43中任一項之細胞,其中該細胞為人類細胞。
- 一種組合物,其包含變異多肽或包含有該變異多肽之複合物,其中該變異多肽相對於SEQ ID NO: 3之親本多肽包含改變,且其中相對於親本多肽或包含該親本多肽之複合物,該變異多肽或該複合物展現增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
- 如請求項45之組合物,其中該改變為表2之取代。
- 如請求項46之組合物,其中該取代為P14R取代、E311R取代、D32R取代、I61R取代、G223R取代、N109R取代及/或D719R取代。
- 如請求項46或47之組合物,其中該變異多肽包含a) P14R取代、E311R取代及D32R取代;b) P14R取代、E311R取代及G223R取代;c) P14R取代、E311R取代、D32R取代及I61R取代;或d) D32R取代、N109R取代、E311R取代及D719R取代。
- 如請求項47或48之組合物,其中該變異多肽進一步包含K208G取代、D302G取代、D590G取代、E154G取代、D567G取代、L38G取代、D145G取代、C13G取代、T338G取代、P14G取代、D55G取代、K221G取代、K35G取代及E736G取代。
- 如請求項45至49中任一項之組合物,其中該增強之酶活性為增強之核酸酶活性。
- 如請求項45至50中任一項之組合物,其中相對於該親本多肽,該變異多肽展現增強之與RNA引導之結合活性。
- 如請求項45至51中任一項之組合物,其中相對於該親本多肽,該變異多肽展現增強之與RNA引導之結合特異性。
- 如請求項45至52中任一項之組合物,其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合活性(例如正中目標結合活性)。
- 如請求項45至53中任一項之組合物,其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之與目標核酸之結合特異性(例如正中目標結合特異性)。
- 如請求項45至54中任一項之組合物,其中包含該變異多肽之該複合物為進一步包含RNA引導之變異二元複合物,且相對於親本二元複合物,該變異二元複合物展現增強之穩定性。
- 如請求項45至55中任一項之組合物,其中該變異二元複合物與目標核酸形成變異三元複合物,且相對於親本三元複合物,該變異三元複合物展現增加之穩定性。
- 如請求項45至56中任一項之組合物,其中相對於該親本多肽,該變異多肽進一步展現增強之二元複合物形成、增強之蛋白質-RNA相互作用及/或減少之自RNA引導之解離。
- 如請求項45至57中任一項之組合物,其中相對於該親本二元複合物,該變異二元複合物進一步展現減少之自目標核酸之解離,及/或減少之與非目標核酸之偏離目標結合。
- 如請求項45至58中任一項之組合物,其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在例如20℃至65℃之溫度範圍內發生。
- 如請求項45至59中任一項之組合物,其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在一定培育時間範圍內發生。
- 如請求項45至60中任一項之組合物,其中該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性在具有在約7.3至約8.6範圍內之pH值的緩衝液中發生。
- 如請求項45至61中任一項之組合物,其中當該變異多肽、變異二元複合物或變異三元複合物之T m值比該親本多肽、親本二元複合物或親本三元複合物之T m值大至少8℃時,發生該增強之酶活性、增強之結合活性、增強之結合特異性及/或增強之穩定性。
- 如請求項45至62中任一項之組合物,其中該變異多肽包含RuvC域或分開RuvC域。
- 如請求項45至63中任一項之組合物,其中該親本多肽包含SEQ ID NO: 3之序列。
- 如請求項45至64中任一項之組合物,其中該RNA引導包含正向重複序列及間隔子序列。
- 如請求項65之組合物,其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少90%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少90%一致性之序列。
- 如請求項65之組合物,其中該正向重複序列與SEQ ID NO: 4-13中之任一者至少95%一致或包含與SEQ ID NO: 14或SEQ ID NO: 15具有至少95%一致性之序列。
- 如請求項65之組合物,其中該正向重複序列為SEQ ID NO: 4-13中之任一者或包含SEQ ID NO: 14或SEQ ID NO: 15之序列。
- 如請求項65至68中任一項之組合物,其中該間隔子序列之長度包含15至35個核苷酸。
- 如請求項65至69中任一項之組合物,其中該間隔子序列與目標核酸之目標股序列包含互補性。
- 如請求項70之組合物,其中該目標核酸包含與原間隔子相鄰模體(PAM)序列相鄰之非目標股序列。
- 如請求項71之組合物,其中該PAM序列為5'-TTR-3'、5'-NTTR-3'、5'-NTTN-3'、5'-RTTR-3'、5'-ATTR-3'或5'-RTTG-3',其中N為任何核苷酸,Y為C或T,且R為A或G。
- 如請求項72之組合物,其中該PAM序列為5'-TTG-3'、5'-TTA-3'、5'-ATTG-3'、5'-TTTA-3'或5'-TTTG-3'。
- 如請求項45至73中任一項之組合物,其中該變異多肽進一步包含肽標籤、螢光蛋白、鹼基編輯域、DNA甲基化域、組蛋白殘基修飾域、定位因子、轉錄修飾因子、光閘控控制因子、化學誘導因子或染色質目測因子。
- 一種組合物,其包含編碼如請求項45至74中任一項之變異多肽的核酸,其中視情況該核酸經密碼子優化以在細胞中表現。
- 如請求項75之組合物,其中該細胞為真核細胞。
- 如請求項75或76之組合物,其中該細胞為哺乳動物細胞或植物細胞。
- 如請求項75至77中任一項之組合物,其中該細胞為人類細胞。
- 如請求項75至78中任一項之組合物,其中編碼該變異多肽之該核酸可操作地連接於啟動子。
- 如請求項75至79中任一項之組合物,其中編碼該變異多肽之該核酸在載體中。
- 如請求項80之組合物,其中該載體包含反轉錄病毒載體、慢病毒載體、噬菌體載體、腺病毒載體、腺相關載體或單純疱疹載體。
- 如請求項45至81中任一項之組合物,其中該組合物存在於包含奈米粒子(例如脂質奈米粒子)、脂質體、胞外體、微囊泡或基因槍之遞送組合物中。
- 一種用於在細胞中編輯基因之方法,該方法包含使該細胞與如前述請求項中任一項之變異多肽或組合物接觸。
- 一種核酸分子,其編碼如請求項1至83中任一項之變異多肽。
- 如請求項84之核酸分子,其中該核酸分子之序列與選自由SEQ ID NO: 1、2或21-27組成之群的序列95%一致。
- 如請求項84之核酸分子,其中該核酸分子之序列包含選自由SEQ ID NO: 1、2或21-27組成之群的序列。
- 如請求項84之核酸分子,其中該核酸分子之序列與選自由SEQ ID NO: 22、23或25組成之群的序列95%一致。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163158741P | 2021-03-09 | 2021-03-09 | |
US63/158,741 | 2021-03-09 | ||
US202163294224P | 2021-12-28 | 2021-12-28 | |
US63/294,224 | 2021-12-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202300507A true TW202300507A (zh) | 2023-01-01 |
Family
ID=83227069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111108605A TW202300507A (zh) | 2021-03-09 | 2022-03-09 | 包含變異多肽之組合物及其用途 |
Country Status (10)
Country | Link |
---|---|
EP (1) | EP4305159A1 (zh) |
JP (1) | JP2024509928A (zh) |
KR (1) | KR20230154064A (zh) |
AU (1) | AU2022234325A1 (zh) |
BR (1) | BR112023018165A2 (zh) |
CA (1) | CA3211223A1 (zh) |
CO (1) | CO2023013171A2 (zh) |
IL (1) | IL305747A (zh) |
TW (1) | TW202300507A (zh) |
WO (1) | WO2022192391A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024020557A1 (en) * | 2022-07-22 | 2024-01-25 | Arbor Biotechnologies, Inc. | Compositions comprising a variant nuclease and uses thereof |
WO2024020567A1 (en) * | 2022-07-22 | 2024-01-25 | Arbor Biotechnologies, Inc. | Compositions comprising a variant polypeptide and uses thereof |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9790490B2 (en) * | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
-
2022
- 2022-03-09 WO PCT/US2022/019536 patent/WO2022192391A1/en active Application Filing
- 2022-03-09 KR KR1020237033996A patent/KR20230154064A/ko unknown
- 2022-03-09 TW TW111108605A patent/TW202300507A/zh unknown
- 2022-03-09 EP EP22767892.7A patent/EP4305159A1/en active Pending
- 2022-03-09 BR BR112023018165A patent/BR112023018165A2/pt unknown
- 2022-03-09 JP JP2023555271A patent/JP2024509928A/ja active Pending
- 2022-03-09 IL IL305747A patent/IL305747A/en unknown
- 2022-03-09 CA CA3211223A patent/CA3211223A1/en active Pending
- 2022-03-09 AU AU2022234325A patent/AU2022234325A1/en active Pending
-
2023
- 2023-10-02 CO CONC2023/0013171A patent/CO2023013171A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
AU2022234325A1 (en) | 2023-09-14 |
CO2023013171A2 (es) | 2023-10-19 |
CA3211223A1 (en) | 2022-09-15 |
EP4305159A1 (en) | 2024-01-17 |
KR20230154064A (ko) | 2023-11-07 |
IL305747A (en) | 2023-11-01 |
BR112023018165A2 (pt) | 2024-01-16 |
WO2022192391A1 (en) | 2022-09-15 |
JP2024509928A (ja) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230332119A1 (en) | Compositions comprising a cas12i2 variant polypeptide and uses thereof | |
TW202300507A (zh) | 包含變異多肽之組合物及其用途 | |
US11946045B2 (en) | Compositions comprising a variant polypeptide and uses thereof | |
US20230235304A1 (en) | Compositions comprising a crispr nuclease and uses thereof | |
US20240035010A1 (en) | Compositions comprising a variant polypeptide and uses thereof | |
US20230295589A1 (en) | Compositions comprising a variant cas12i4 polypeptide and uses thereof | |
CN117295816A (zh) | 包含变体多肽的组合物及其用途 | |
CN115052986A (zh) | 包含核酸酶的组合物及其用途 | |
CN117043326A (zh) | 包含变体多肽的组合物及其用途 | |
WO2024020557A1 (en) | Compositions comprising a variant nuclease and uses thereof | |
WO2023019243A1 (en) | Compositions comprising a variant cas12i3 polypeptide and uses thereof | |
US20240011004A1 (en) | Compositions comprising a variant crispr nuclease polypeptide and uses thereof | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
CN118019846A (zh) | 包含crispr核酸酶的组合物及其用途 | |
KR20230117116A (ko) | Trac를 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도 | |
EP4158020A2 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof |