CN108351350B - 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 - Google Patents
使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 Download PDFInfo
- Publication number
- CN108351350B CN108351350B CN201680061639.8A CN201680061639A CN108351350B CN 108351350 B CN108351350 B CN 108351350B CN 201680061639 A CN201680061639 A CN 201680061639A CN 108351350 B CN108351350 B CN 108351350B
- Authority
- CN
- China
- Prior art keywords
- grna
- target
- dna
- protospacer
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 241
- 238000010362 genome editing Methods 0.000 title claims description 36
- 239000000203 mixture Substances 0.000 title description 48
- 108010042407 Endonucleases Proteins 0.000 title description 15
- 102000004533 Endonucleases Human genes 0.000 title description 15
- 230000027455 binding Effects 0.000 claims abstract description 206
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 128
- 230000001965 increasing effect Effects 0.000 claims abstract description 31
- 108020005004 Guide RNA Proteins 0.000 claims description 557
- 108091033409 CRISPR Proteins 0.000 claims description 418
- 108090000623 proteins and genes Proteins 0.000 claims description 358
- 210000004027 cell Anatomy 0.000 claims description 233
- 239000002773 nucleotide Substances 0.000 claims description 228
- 125000003729 nucleotide group Chemical group 0.000 claims description 213
- 230000000694 effects Effects 0.000 claims description 178
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 124
- 230000009545 invasion Effects 0.000 claims description 110
- 102000040430 polynucleotide Human genes 0.000 claims description 100
- 108091033319 polynucleotide Proteins 0.000 claims description 100
- 239000002157 polynucleotide Substances 0.000 claims description 100
- 238000003776 cleavage reaction Methods 0.000 claims description 94
- 230000007017 scission Effects 0.000 claims description 94
- 239000013598 vector Substances 0.000 claims description 93
- 150000007523 nucleic acids Chemical class 0.000 claims description 88
- 230000000295 complement effect Effects 0.000 claims description 80
- 230000014509 gene expression Effects 0.000 claims description 79
- 125000006850 spacer group Chemical group 0.000 claims description 77
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 73
- 230000008685 targeting Effects 0.000 claims description 72
- 102000039446 nucleic acids Human genes 0.000 claims description 70
- 108020004707 nucleic acids Proteins 0.000 claims description 70
- 101710163270 Nuclease Proteins 0.000 claims description 69
- 108020001507 fusion proteins Proteins 0.000 claims description 57
- 102000037865 fusion proteins Human genes 0.000 claims description 57
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 38
- 108020004414 DNA Proteins 0.000 claims description 37
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 35
- 229920001184 polypeptide Polymers 0.000 claims description 33
- 102000053602 DNA Human genes 0.000 claims description 32
- 230000035772 mutation Effects 0.000 claims description 32
- 108010033040 Histones Proteins 0.000 claims description 31
- 230000006780 non-homologous end joining Effects 0.000 claims description 31
- 238000013461 design Methods 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 102100024108 Dystrophin Human genes 0.000 claims description 21
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 20
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 20
- 230000004048 modification Effects 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 20
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 230000007018 DNA scission Effects 0.000 claims description 17
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 17
- 230000002103 transcriptional effect Effects 0.000 claims description 17
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 16
- 238000003556 assay Methods 0.000 claims description 16
- 230000001404 mediated effect Effects 0.000 claims description 16
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 14
- 230000037426 transcriptional repression Effects 0.000 claims description 13
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 claims description 12
- 230000002950 deficient Effects 0.000 claims description 12
- 230000004568 DNA-binding Effects 0.000 claims description 11
- 102100023823 Homeobox protein EMX1 Human genes 0.000 claims description 10
- 101001053946 Homo sapiens Dystrophin Proteins 0.000 claims description 10
- 101001053942 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) Diphosphomevalonate decarboxylase Proteins 0.000 claims description 10
- 238000000137 annealing Methods 0.000 claims description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 10
- 210000004962 mammalian cell Anatomy 0.000 claims description 10
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 claims description 9
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 claims description 9
- 201000010099 disease Diseases 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 9
- 108700019146 Transgenes Proteins 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 101150030763 Vegfa gene Proteins 0.000 claims description 5
- 230000015556 catabolic process Effects 0.000 claims description 5
- 238000006731 degradation reaction Methods 0.000 claims description 5
- 238000007481 next generation sequencing Methods 0.000 claims description 4
- 102100025169 Max-binding protein MNT Human genes 0.000 claims description 3
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 108091006106 transcriptional activators Proteins 0.000 claims description 3
- 108091006107 transcriptional repressors Proteins 0.000 claims description 3
- 238000010354 CRISPR gene editing Methods 0.000 claims 2
- 230000002829 reductive effect Effects 0.000 abstract description 19
- 102000040650 (ribonucleotides)n+m Human genes 0.000 abstract description 5
- 102000004169 proteins and genes Human genes 0.000 description 127
- 235000018102 proteins Nutrition 0.000 description 114
- 239000000758 substrate Substances 0.000 description 56
- 239000003623 enhancer Substances 0.000 description 53
- 241000282414 Homo sapiens Species 0.000 description 39
- 230000002068 genetic effect Effects 0.000 description 37
- 238000002474 experimental method Methods 0.000 description 36
- 230000001105 regulatory effect Effects 0.000 description 35
- 238000001727 in vivo Methods 0.000 description 30
- 108091028113 Trans-activating crRNA Proteins 0.000 description 29
- 239000013612 plasmid Substances 0.000 description 27
- 108091026890 Coding region Proteins 0.000 description 26
- 230000008439 repair process Effects 0.000 description 23
- 238000010494 dissociation reaction Methods 0.000 description 22
- 230000005593 dissociations Effects 0.000 description 22
- 230000007246 mechanism Effects 0.000 description 22
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 21
- 238000009826 distribution Methods 0.000 description 21
- 108010069091 Dystrophin Proteins 0.000 description 20
- 108010090804 Streptavidin Proteins 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 20
- 230000008488 polyadenylation Effects 0.000 description 20
- 238000013518 transcription Methods 0.000 description 20
- 230000035897 transcription Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 18
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 17
- 108020004485 Nonsense Codon Proteins 0.000 description 17
- 101000978776 Mus musculus Neurogenic locus notch homolog protein 1 Proteins 0.000 description 16
- 108020005067 RNA Splice Sites Proteins 0.000 description 15
- 230000001594 aberrant effect Effects 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 239000012636 effector Substances 0.000 description 15
- 230000009437 off-target effect Effects 0.000 description 15
- 238000012360 testing method Methods 0.000 description 15
- 239000013607 AAV vector Substances 0.000 description 14
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 14
- 102000006947 Histones Human genes 0.000 description 14
- 241000193996 Streptococcus pyogenes Species 0.000 description 14
- 230000001419 dependent effect Effects 0.000 description 14
- 238000001890 transfection Methods 0.000 description 14
- 108020004705 Codon Proteins 0.000 description 13
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 13
- 244000025221 Humulus lupulus Species 0.000 description 13
- 235000008694 Humulus lupulus Nutrition 0.000 description 13
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 13
- 239000012212 insulator Substances 0.000 description 13
- 108010077544 Chromatin Proteins 0.000 description 12
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 12
- 102000003893 Histone acetyltransferases Human genes 0.000 description 12
- 108090000246 Histone acetyltransferases Proteins 0.000 description 12
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 230000004913 activation Effects 0.000 description 12
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 210000003483 chromatin Anatomy 0.000 description 12
- 238000012350 deep sequencing Methods 0.000 description 12
- 208000026350 Inborn Genetic disease Diseases 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 108010092854 aspartyllysine Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 208000016361 genetic disease Diseases 0.000 description 11
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 11
- 239000005090 green fluorescent protein Substances 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 210000003205 muscle Anatomy 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000011144 upstream manufacturing Methods 0.000 description 11
- 241000701022 Cytomegalovirus Species 0.000 description 10
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 10
- 238000012937 correction Methods 0.000 description 10
- 230000002596 correlated effect Effects 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 238000003384 imaging method Methods 0.000 description 10
- 230000009438 off-target cleavage Effects 0.000 description 10
- 230000036961 partial effect Effects 0.000 description 10
- 238000004088 simulation Methods 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 241000702421 Dependoparvovirus Species 0.000 description 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 9
- 241000124008 Mammalia Species 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 230000037433 frameshift Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 210000002027 skeletal muscle Anatomy 0.000 description 9
- 238000012384 transportation and delivery Methods 0.000 description 9
- 108020004635 Complementary DNA Proteins 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 230000001580 bacterial effect Effects 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 description 8
- 230000005782 double-strand break Effects 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 239000002502 liposome Substances 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 239000008194 pharmaceutical composition Substances 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 7
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 102000040945 Transcription factor Human genes 0.000 description 7
- 108091023040 Transcription factor Proteins 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 238000010804 cDNA synthesis Methods 0.000 description 7
- 201000006815 congenital muscular dystrophy Diseases 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 238000010369 molecular cloning Methods 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- -1 silencers Substances 0.000 description 7
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 6
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 6
- 241000714474 Rous sarcoma virus Species 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 210000005260 human cell Anatomy 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- 108010054155 lysyllysine Proteins 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 210000004165 myocardium Anatomy 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 5
- 241000588650 Neisseria meningitidis Species 0.000 description 5
- 108091092724 Noncoding DNA Proteins 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 230000004071 biological effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000012236 epigenome editing Methods 0.000 description 5
- 231100000221 frame shift mutation induction Toxicity 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 229920002401 polyacrylamide Polymers 0.000 description 5
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000029058 respiratory gaseous exchange Effects 0.000 description 5
- 230000003584 silencer Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 4
- 102000007469 Actins Human genes 0.000 description 4
- 108010085238 Actins Proteins 0.000 description 4
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 4
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 4
- 241000714230 Avian leukemia virus Species 0.000 description 4
- 241000713704 Bovine immunodeficiency virus Species 0.000 description 4
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 102100030826 Hemoglobin subunit epsilon Human genes 0.000 description 4
- 108010054147 Hemoglobins Proteins 0.000 description 4
- 102000001554 Hemoglobins Human genes 0.000 description 4
- 102000008157 Histone Demethylases Human genes 0.000 description 4
- 108010074870 Histone Demethylases Proteins 0.000 description 4
- 108010000521 Human Growth Hormone Proteins 0.000 description 4
- 102000002265 Human Growth Hormone Human genes 0.000 description 4
- 239000000854 Human Growth Hormone Substances 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 4
- 241000713666 Lentivirus Species 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 4
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102000003505 Myosin Human genes 0.000 description 4
- 108060008487 Myosin Proteins 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 108091005461 Nucleic proteins Proteins 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 230000021736 acetylation Effects 0.000 description 4
- 238000006640 acetylation reaction Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000004630 atomic force microscopy Methods 0.000 description 4
- 108010006025 bovine growth hormone Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 210000000234 capsid Anatomy 0.000 description 4
- 230000008876 conformational transition Effects 0.000 description 4
- 229960003624 creatine Drugs 0.000 description 4
- 239000006046 creatine Substances 0.000 description 4
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 4
- 102000044787 human EP300 Human genes 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 210000000663 muscle cell Anatomy 0.000 description 4
- 230000037434 nonsense mutation Effects 0.000 description 4
- 230000009871 nonspecific binding Effects 0.000 description 4
- 229920000447 polyanionic polymer Polymers 0.000 description 4
- 229920002643 polyglutamic acid Polymers 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- 229940031439 squalene Drugs 0.000 description 4
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 3
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 3
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 3
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 3
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 208000016831 Congenital muscular dystrophy with hyperlaxity Diseases 0.000 description 3
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 3
- 230000007067 DNA methylation Effects 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 241000589601 Francisella Species 0.000 description 3
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 3
- 108010034791 Heterochromatin Proteins 0.000 description 3
- 102000003964 Histone deacetylase Human genes 0.000 description 3
- 108090000353 Histone deacetylase Proteins 0.000 description 3
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 3
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 3
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 3
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 3
- 101100290485 Medicago sativa CMDH gene Proteins 0.000 description 3
- 206010028289 Muscle atrophy Diseases 0.000 description 3
- 108010047562 NGR peptide Proteins 0.000 description 3
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 3
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 3
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 3
- 241000605861 Prevotella Species 0.000 description 3
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 210000005006 adaptive immune system Anatomy 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 108010038633 aspartylglutamate Proteins 0.000 description 3
- 238000000089 atomic force micrograph Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000001185 bone marrow Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 230000001973 epigenetic effect Effects 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 210000004458 heterochromatin Anatomy 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 210000003917 human chromosome Anatomy 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000002101 lytic effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000001087 myotubule Anatomy 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 239000002953 phosphate buffered saline Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000007634 remodeling Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 2
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 2
- 102000007471 Adenosine A2A receptor Human genes 0.000 description 2
- 108010085277 Adenosine A2A receptor Proteins 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 2
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 2
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 2
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 2
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 2
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 2
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 2
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 2
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 2
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 2
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 241000282817 Bovidae Species 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 229940045513 CTLA4 antagonist Drugs 0.000 description 2
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 238000001353 Chip-sequencing Methods 0.000 description 2
- 108091062157 Cis-regulatory element Proteins 0.000 description 2
- 238000011238 DNA vaccination Methods 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 101150068427 EP300 gene Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 102000003971 Fibroblast Growth Factor 1 Human genes 0.000 description 2
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 2
- 101710113436 GTPase KRas Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 2
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 2
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 2
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 2
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 2
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 2
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 2
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 2
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 2
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 2
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 2
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 2
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 2
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 2
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 2
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 2
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 2
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 2
- 108010036115 Histone Methyltransferases Proteins 0.000 description 2
- 102000011787 Histone Methyltransferases Human genes 0.000 description 2
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 2
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 2
- 101001137987 Homo sapiens Lymphocyte activation gene 3 protein Proteins 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 2
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 2
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 2
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 2
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 108010043610 KIR Receptors Proteins 0.000 description 2
- 102000002698 KIR Receptors Human genes 0.000 description 2
- 241001112693 Lachnospiraceae Species 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- 208000009625 Lesch-Nyhan syndrome Diseases 0.000 description 2
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- 102100020862 Lymphocyte activation gene 3 protein Human genes 0.000 description 2
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 2
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 2
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 2
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 2
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241000713333 Mouse mammary tumor virus Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 2
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 2
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 2
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 2
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 2
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 2
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 2
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 2
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 2
- 208000035317 Total hypoxanthine-guanine phosphoribosyl transferase deficiency Diseases 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 2
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 102100038929 V-set domain-containing T-cell activation inhibitor 1 Human genes 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 2
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 2
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 2
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 239000000370 acceptor Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 238000001369 bisulfite sequencing Methods 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 229910001424 calcium ion Inorganic materials 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 241001493065 dsRNA viruses Species 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000004049 epigenetic modification Effects 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 229940029303 fibroblast growth factor-1 Drugs 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 210000002816 gill Anatomy 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 229920002674 hyaluronan Polymers 0.000 description 2
- 229960003160 hyaluronic acid Drugs 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 102000006639 indoleamine 2,3-dioxygenase Human genes 0.000 description 2
- 108020004201 indoleamine 2,3-dioxygenase Proteins 0.000 description 2
- 238000002743 insertional mutagenesis Methods 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 2
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- XIBUKSQTWSKJMQ-QTNFYWBSSA-M potassium;(4s)-4-amino-5-hydroxy-5-oxopentanoate;hydrate Chemical compound O.[K+].[O-]C(=O)[C@@H](N)CCC(O)=O XIBUKSQTWSKJMQ-QTNFYWBSSA-M 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 150000004053 quinones Chemical class 0.000 description 2
- 239000000376 reactant Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 230000029663 wound healing Effects 0.000 description 2
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102100036601 Aggrecan core protein Human genes 0.000 description 1
- 108010067219 Aggrecans Proteins 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- HCIUUZGFTDTEGM-NAKRPEOUSA-N Arg-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HCIUUZGFTDTEGM-NAKRPEOUSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- 206010003594 Ataxia telangiectasia Diseases 0.000 description 1
- 101710144268 B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 241000283726 Bison Species 0.000 description 1
- 208000005692 Bloom Syndrome Diseases 0.000 description 1
- 101001042337 Burkholderia plantarii Lipase-specific foldase Proteins 0.000 description 1
- 102000016897 CCCTC-Binding Factor Human genes 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 108010040163 CREB-Binding Protein Proteins 0.000 description 1
- 102100021975 CREB-binding protein Human genes 0.000 description 1
- 238000010454 CRISPR gRNA design Methods 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 101150023376 Cebpd gene Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102220605872 Cytosolic arginine sensor for mTORC1 subunit 2_D16A_mutation Human genes 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101150007297 Dnmt1 gene Proteins 0.000 description 1
- SNRUBQQJIBEYMU-UHFFFAOYSA-N Dodecane Natural products CCCCCCCCCCCC SNRUBQQJIBEYMU-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 101150070878 Ereg gene Proteins 0.000 description 1
- 108010022894 Euchromatin Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 101150033270 Gadd45a gene Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 102100027490 H2.0-like homeobox protein Human genes 0.000 description 1
- 101150086355 HBG gene Proteins 0.000 description 1
- 108050008753 HNH endonucleases Proteins 0.000 description 1
- 102000000310 HNH endonucleases Human genes 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 102100039894 Hemoglobin subunit delta Human genes 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 208000009292 Hemophilia A Diseases 0.000 description 1
- 208000021177 Hepatic metabolic disease Diseases 0.000 description 1
- 102100034458 Hepatitis A virus cellular receptor 2 Human genes 0.000 description 1
- 101710083479 Hepatitis A virus cellular receptor 2 homolog Proteins 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 101710160287 Heterochromatin protein 1 Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 108010016918 Histone-Lysine N-Methyltransferase Proteins 0.000 description 1
- 102100027770 Histone-lysine N-methyltransferase KMT5B Human genes 0.000 description 1
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101100389547 Homo sapiens EP300 gene Proteins 0.000 description 1
- 101001081101 Homo sapiens H2.0-like homeobox protein Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101001035503 Homo sapiens Hemoglobin subunit delta Proteins 0.000 description 1
- 101001083591 Homo sapiens Hemoglobin subunit epsilon Proteins 0.000 description 1
- 101001046967 Homo sapiens Histone acetyltransferase KAT2A Proteins 0.000 description 1
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101001076407 Homo sapiens Interleukin-1 receptor antagonist protein Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101001030625 Homo sapiens Mucin-like protein 1 Proteins 0.000 description 1
- 101001023043 Homo sapiens Myoblast determination protein 1 Proteins 0.000 description 1
- 101000586000 Homo sapiens Myocardin Proteins 0.000 description 1
- 101000601661 Homo sapiens Paired box protein Pax-7 Proteins 0.000 description 1
- 101000955999 Homo sapiens V-set domain-containing T-cell activation inhibitor 1 Proteins 0.000 description 1
- 101000666896 Homo sapiens V-type immunoglobulin domain-containing suppressor of T-cell activation Proteins 0.000 description 1
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100026018 Interleukin-1 receptor antagonist protein Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150026829 JUNB gene Proteins 0.000 description 1
- 101150092727 KLF10 gene Proteins 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 241000406668 Loxodonta cyclotis Species 0.000 description 1
- 241001424413 Lucia Species 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- 102000007077 Lysine Acetyltransferases Human genes 0.000 description 1
- 108010033293 Lysine Acetyltransferases Proteins 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 102100027248 Melanoma-associated antigen C3 Human genes 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100038565 Mucin-like protein 1 Human genes 0.000 description 1
- 108010063954 Mucins Proteins 0.000 description 1
- 101100445099 Mus musculus Emx1 gene Proteins 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 101100233098 Mus musculus Ifngr1 gene Proteins 0.000 description 1
- 101100396696 Mus musculus Nfkbie gene Proteins 0.000 description 1
- 101100351033 Mus musculus Pax7 gene Proteins 0.000 description 1
- 101100519207 Mus musculus Pdcd1 gene Proteins 0.000 description 1
- 101100369238 Mus musculus Tgtp2 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 102000008934 Muscle Proteins Human genes 0.000 description 1
- 108010074084 Muscle Proteins Proteins 0.000 description 1
- 208000010428 Muscle Weakness Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 102100035077 Myoblast determination protein 1 Human genes 0.000 description 1
- 102100030217 Myocardin Human genes 0.000 description 1
- DTERQYGMUDWYAZ-ZETCQYMHSA-N N(6)-acetyl-L-lysine Chemical compound CC(=O)NCCCC[C@H]([NH3+])C([O-])=O DTERQYGMUDWYAZ-ZETCQYMHSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 101100058191 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) bcp-1 gene Proteins 0.000 description 1
- 101150091206 Nfkbia gene Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 1
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 102100037503 Paired box protein Pax-7 Human genes 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 230000018199 S phase Effects 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100404659 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ngg1 gene Proteins 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 101100174184 Serratia marcescens fosA gene Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 229940126547 T-cell immunoglobulin mucin-3 Drugs 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 101150018223 Tmem140 gene Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 108010079206 V-Set Domain-Containing T-Cell Activation Inhibitor 1 Proteins 0.000 description 1
- 102100038282 V-type immunoglobulin domain-containing suppressor of T-cell activation Human genes 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 201000006083 Xeroderma Pigmentosum Diseases 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 1
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 1
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 201000010275 acute porphyria Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 101150015424 dmd gene Proteins 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000007608 epigenetic mechanism Effects 0.000 description 1
- 210000000267 erythroid cell Anatomy 0.000 description 1
- 229950005470 eteplirsen Drugs 0.000 description 1
- 210000000632 euchromatin Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- IJJVMEJXYNJXOJ-UHFFFAOYSA-N fluquinconazole Chemical compound C=1C=C(Cl)C=C(Cl)C=1N1C(=O)C2=CC(F)=CC=C2N=C1N1C=NC=N1 IJJVMEJXYNJXOJ-UHFFFAOYSA-N 0.000 description 1
- 101150078861 fos gene Proteins 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 231100000722 genetic damage Toxicity 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 208000033552 hepatic porphyria Diseases 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000006197 histone deacetylation Effects 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 239000000644 isotonic solution Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 230000036244 malformation Effects 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 239000010445 mica Substances 0.000 description 1
- 229910052618 mica group Inorganic materials 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 235000013919 monopotassium glutamate Nutrition 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000005088 multinucleated cell Anatomy 0.000 description 1
- 201000000585 muscular atrophy Diseases 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 210000003098 myoblast Anatomy 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 229940021222 peritoneal dialysis isotonic solution Drugs 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000009894 physiological stress Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000004621 scanning probe microscopy Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 230000022379 skeletal muscle tissue development Effects 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 210000003699 striated muscle Anatomy 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000017423 tissue regeneration Effects 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000005526 vasoconstrictor agent Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/10—Nucleic acid folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/15011—Lentivirus, not HIV, e.g. FIV, SIV
- C12N2740/15041—Use of virus, viral particle or viral elements as a vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Virology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文披露了优化指导RNA(gRNA)以及设计和使用具有增加的靶结合特异性和减小的脱靶结合的所述优化gRNA的方法。
Description
相关申请的交叉引用
本申请要求2015年8月25日提交的美国临时申请号62/209,466的优先权,该临时申请通过援引以其全文并入本文。
政府利益的声明
本发明是根据由美国国家科学基金会(National Science Foundation)授予的联邦批准号MCB1244297和CBET1151035以及由美国国立卫生研究院(National Institutesof Health)授予的F32GM11250201、R01DA036865和DP2OD008586在政府支持下进行。政府对本发明具有某些权利。
技术领域
本披露内容涉及优化指导RNA(gRNA)以及设计和使用具有增加的靶结合特异性和减小的脱靶结合的所述gRNA的方法。
背景技术
RNA指导型内切核酸酶、尤其是蛋白Cas9已经被誉为潜在的“完美基因组工程工具”,因为它们可以由单‘指导RNA’分子指导来切割具有几乎任何序列的DNA。这种能力最近已被用于许多新兴的生物和医学应用,为其未来使用产生了巨大刺激和希望。然而,实际的基因组工程对选择性靶向并切割精确DNA序列的能力需要非常精确地控制,以免脱靶DNA无意中被损坏和突变。
Cas9是原核II型CRISPR(成簇的、规律间隔的、短回文重复序列)的内切核酸酶-对入侵性外源DNA具有CRISPR相关(Cas)应答。在此应答过程中,Cas9首先被CRISPR RNA(crRNA):反式激活crRNA(tracrRNA)双链体结合,然后指导裂解含有20个碱基对(bp)‘原型间隔子’位点的DNA,该原型间隔子互补于crRNA的可变20bp区段(图1A)。在具有结合的单指导RNA(sgRNA)后,Cas9-sgRNA复合体与靶DNA中的20bp‘原型间隔子’序列结合,前提条件是原型间隔子后面直接跟着原型间隔子邻近基元(PAM,此处为‘TGG’)。结合之后,Cas9内切核酸酶在原型间隔子内产生双链断裂(三角形)。本质上,对Cas9可以靶向的序列的唯一限制是短的原型间隔子邻近基序(PAM),诸如在化脓链球菌(S.pyogenes)Cas9的情况下的‘NGG’,必须紧跟在外来DNA分子中的原型间隔子位点之后。结晶学和生物化学实验的分析表明,通过以下方式来赋予对原型间隔子结合和裂解的特异性:首先通过由Cas9蛋白本身识别PAM位点,然后通过结合的RNA复合体进行链入侵并且与原型间隔子直接进行沃森-克里克(Watson-Crick)碱基配对(图1A)。
在CRISPR-Cas9系统被重新指定用于许多异源生物技术应用之后,最近Cas9的被单一RNA发夹模块化‘编程’以靶向几乎任何DNA的能力产生了巨大的刺激。值得注意的是,设计了单指导RNA(single-guide RNA,sgRNA)发夹,其将crRNA:tracrRNA双链体的基本组分组合成单一功能分子。在具有这种sgRNA的情况下,Cas9可以被引入到各种生物体内以在体内产生靶向双链断裂,用于明显简便的基因组工程。也已经使用无核酸酶的Cas9(D10A/H840A,称为‘dCas9’)和嵌合dCas9衍生物来经由在启动子位点处或附近处的靶向结合来改变体内的基因表达以及引入靶向表观遗传修饰。
由Cas9进行的脱靶结合和裂解是为人所关心的,因为它可以不利地影响其在实践中的潜在用途。已经作出重大努力来改善Cas9/dCas9活性的特异性。首先,最广泛的努力主要是通过智能选择靶序列而不选择基因组中类似的其他序列来完成,但是最近调查发现,这些方法在预测脱靶裂解的能力方面表现不佳。此外,还努力通过引入发现调节或增加PAM或原型间隔子结合特异性的点突变来直接工程化蛋白质本身。也成对使用仅切口DNA单链而不进行双链DNA裂解的Cas9衍生物(‘成对切口酶’),假设是在多个位点处的脱靶切口彼此足够接近地产生双链断裂的可能性将是非常低的。最后,在制备指导RNA变体本身方面进行了一些工作以尝试实现更高的特异性。添加指导RNA的5’延伸区以互补于超出原型间隔子的额外核苷酸的早期努力没有显示出体内增加的Cas9裂解特异性。而是,它们在活细胞中被消化回至大约其标准长度(图1A)。对于基因组工程中的应用、特别是对于治疗应用,需要基因靶向的极端特异性,以免脱靶DNA被破坏并发生未经授权的突变。然而,对由Cas9进行的脱靶结合和裂解已经有若干次报道,这可不利地影响其在实践中的潜在用途。
仍然需要在使用CRISPR/Cas9系统的情况下减少脱靶结合并增加核酸酶特异性。
发明内容
本发明涉及一种产生优化指导RNA(gRNA)的方法。该方法包括:a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;c)确定该全长gRNA的至少一个或多个脱靶位点;d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的该多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的该多核苷酸序列的5’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的5’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;e)计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;f)将该第一gRNA在该原型间隔子和/或脱靶位点的该估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的该估计寿命进行比较;g)将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);h)基于满足设计标准的gRNA序列鉴定优化gRNA(optimized gRNA);并且i)在体内测试该优化gRNA以确定结合特异性。
本发明涉及一种产生优化指导RNA(gRNA)的方法。该方法包括:a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;c)确定该全长gRNA的至少一个或多个脱靶位点;d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的该多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的该多核苷酸序列的3’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的3’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;e)计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;f)将该第一gRNA在该原型间隔子和/或脱靶位点的该估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的该估计寿命进行比较;g)将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);h)基于满足设计标准的gRNA序列鉴定优化gRNA;并且i)在体内测试该优化gRNA以确定结合特异性。
本发明涉及一种由上述方法产生的优化gRNA。
本发明涉及一种编码上述优化gRNA的分离的多核苷酸。
本发明涉及一种包含上述分离的多核苷酸的载体。
本发明涉及一种包含上述分离的多核苷酸或上述载体的细胞。
本发明涉及一种包含上述分离的多核苷酸、上述载体或上述细胞的试剂盒。
本发明涉及一种在靶细胞或受试者中进行表观基因组(epigenomic)编辑的方法。该方法包括使细胞或受试者与有效量的上述优化gRNA分子和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
本发明涉及一种在靶细胞或受试者中进行位点特异性DNA裂解的方法。该方法包括使细胞或受试者与有效量的上述优化gRNA分子和融合蛋白或Cas9蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
本发明涉及一种在细胞中进行基因组编辑的方法。该方法包括向该细胞给予有效量的上述优化gRNA分子和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
本发明涉及一种在细胞中调节基因表达的方法。该方法包括使该细胞与有效量的上述优化gRNA和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
附图简要说明
图1A示出了Cas9活性的示意图。
图1B示出了在来源于人AAVS1基因座的单个链霉亲和素标记DNA分子内的原型间隔子序列处结合的dCas9-sgRNA的原子力显微镜(AFM)图像。
图1C-1D示出了沿着被设计成具有一系列完全互补和部分互补原型间隔子序列的AAVS1来源的DNA底物(图1C)或工程化DNA底物(图1D)由Cas9/dCas9-sgRNA占用的结合DNA分数。垂直线代表每个显著特征位于对应底物上的(23bp)区段。
图2A-2D示出了对指导RNA变体的结合亲和力和特异性的调节。图2A示出了dCas9与其5’端具有两个核苷酸截短的单指导RNA(tru-gRNA,紫色)结合的示意图。图2B示出了dCas9与单指导RNA(具有与其靶向区的PAM远端结合区段形成发夹(hp-gRNA,蓝色)的5’端延伸区)结合的示意图和提议机制。图2C示出了沿着工程化DNA底物具有tru-gRNA(紫色,n=257)的dCas9的单位点结合亲和力(KA)(参见图1D)。虚线示出了dCas9-sgRNA的单位点亲和力以用于比较。图2D示出了具有指导RNA的dCas9的单位点结合亲和力(KA),这些指导RNA具有5’-发夹,这些5’-发夹与互补于原型间隔子的最后六个(hp6-gRNA,蓝色)或十个(hp10-gRNA,绿色)PAM远端核苷酸的核苷酸重叠。
图3A-3D显示随着与越来越匹配原型间隔子序列的位点结合,Cas9经历渐进性构象转换。图3A示出了沿着DNA底物由Cas9/dCas9占用的结合DNA分数,其中颜色代表根据其结构(通过比对之后的均方差,参见正文)聚类的Cas9/dCas9群体。DNA上的用于对Cas9/Cas9结构特性进行位点特异性分析的不同特征标记为:非特异性序列(α;‘20MM’)、原型间隔子内含有10个PAM远端错配的位点(β,‘10MM’)、原型间隔子内含有5个PAM远端错配的位点(γ,‘5MM’),或完全原型间隔子位点(对于dCas9或Cas9分别为δ或ε;‘0MM’)。主要聚簇的总体平均值显示在图3C中并且根据其代表的聚类结构进行颜色编码。图3B示出了观察的Cas9/dCas9的体积与高度,根据每个蛋白质所分配至的聚簇进行颜色编码。虚线划定了很可能由吸附在DNA附近的聚集体(右上)或链霉亲和素标记(左下)构成的区域。对于比较,链霉亲和素端标记的平均高度:0.92nm±0.006nm(SEM);链霉亲和素端标记的平均体积:0.110x104nm3±0.002x104nm3(SEM);n=1941。图3D示出了在底物的每个特征处结合有sgRNA(红色圆圈,针对Cas9具有红色标记和针对dCas9具有蓝色标记)或tru-gRNA(紫色圆圈)的Cas9/dCas9的平均体积和高度。应注意,仅预期具有tru-gRNA的dCas9与5MM和10MM位点的前3个或8个(本文分别标记为“3MM”和“8MM”)PAM远端错配相互作用。对于平均体积和高度的标准误差,参见表2。对于具有sgRNA的Cas9/dCas9,其在每个特征处的结构特性在统计学上是不同的(δ-ε,α-ε:p<0.05;α-β:p<0.005;β-γ,γ-δ:p<<0.0005。霍特林(Hotelling’s)T2检验)。
图4A-4D示出了动力学蒙特卡洛(Kinetic Monte Carlo)(KMC)实验,这些实验揭示了对于不同的指导RNA变体,在稳定结合的Cas9内,R环或由原型间隔子双链体与入侵指导RNA形成的结构的稳定性差异。图4A示出了对于KMC实验,指导RNA(红色)对原型间隔子(绿色)的链入侵的示意图。R环突出显示。入侵的转换速率(对于m→m+1的速率vf,其中m是链入侵的程度或相当于R环的长度)或双链体重新退火的转换速率(对于m→m-1的速率vr)是最邻近DNA:DNA和RNA:DNA杂交能量的函数。详见正文和补充方法。图4B示出了对于来源于‘平衡下’KMC实验的sg-RNA(红色)或tru-gRNA(紫色),R环具有m大小的分数时间(模拟分别起始于m=20或18)。运行模拟,直到t≥10,000(任意单位)。图4C示出了在完全入侵后sgRNA(红色)和tru-gRNA(紫色)的‘R环呼吸(breathing)’的动态蒙特卡洛时程(模拟分别起始于m=20或18)。星号突出显示了模拟的起始位置。(插图)R环具有≥16bp长的对应寿命的直方图。图4D示出了基于AFM成像和动力学蒙特卡罗(KMC)实验的结果(参见正文),用于控制Cas9/dCas9特异性的机制的提议模型。Cas9/dCas9与PAM结合,并且指导RNA入侵PAM邻近原型间隔子双链体中。在该链入侵过程中,指导RNA必须置换原型间隔子的互补链。对双链体的入侵与重新退火之间的竞争导致动态(‘呼吸’)R环结构。原型间隔子-指导RNA相互作用的第14-17位点的稳定性通过在第19和第20位点处的结合而显著地增加,促进Cas9/dCas9的构象变化,从而授权Cas9的DNA裂解。
图5A-5C显示动力学蒙特卡洛(KMC)实验揭示穿过错配(MM)并入侵原型间隔子的能力差异取决于指导RNA结构。图5A-5B示出了来源于KMC实验的入侵过程中(起始于m=10,由星号突出显示)sgRNA(图5A)或tru-gRNA(图5B)的R环长度m随时间的分数占用率。白色X指示错配的位置。运行模拟,直到t≥10,000(任意单位)并且经100次试验的结果求平均值。图5C示出了链入侵的代表性KMC时程(在m=10处起始),其中对于sgRNA(红色)和tru-gRNA(紫色)错配位点在m=14处(箭头)。虽然sgRNA在绕过错配后大量稳定地入侵,但由于其R环的固有波动性,tru-gRNA在错配之后被重复地重新捕获(参见图4)。
图6A-6B显示在PAM远端区(≥第10原型间隔子位点)含有单一rG·dG、rC·dC、rAdA和rU·dT错配的靶位点处的实验性切割频率(Hsu等人(2013)Nature biotechnology[自然生物技术],31,827-832)与从动力学蒙特卡罗实验确定的R环稳定性相关。图6A示出了起始于位点m的链入侵过程中,位点m处的Cas9切割频率与R环稳定性(指导RNA在位点m处与原型间隔子保持结合的时间分数,参见正文)之间的相关性的log10(p值)。(i)位点m=10至m=14处的稳定性与指导RNA在穿过错配之前从原型间隔子脱落的可能性高度反相关(图15B),而(ii)位点m=14至m=17与诱导裂解活性的构象变化相关联(来自AFM图像)。颜色对应于相关系数。图6B显示实验性切割频率不与估计的指导RNA-原型间隔子平衡结合自由能(ΔG°37)(左)显著相关,而它与链入侵过程中位点m=14的稳定性(右)相关。误差条是位点m=14处平均占用时间的标准误差。对于这些动力学蒙特卡罗实验,max(t)=100(任意单位)。彩色条用于显示错配(MM)位点的位置。
图7A-7C示出了指导RNA的结构影响Cas9/dCas9特异性的提议机制的概述。图7A显示,对于单指导RNA(sgRNA),RNA的前几个核苷酸(其结合原型间隔子的第18-20位点)稳定了R环呼吸和在原型间隔子的第14-17位点处的结合,实现向活性状态的高效构象转换以允许裂解。然而,由这些碱基赋予的这种稳定性增加允许在错配位点处的瞬态稳定性和允许裂解的构象变化。在许多情况下,如果穿过了错配,R环会保持稳定地完全入侵。图7B显示,对于截短前几个(在此为2个)核苷酸的指导RNA(tru-gRNA),R环的稳定性降低(以显著的波动性为特征)减小了维持活性构象的可能性。当原型间隔子中存在错配位点时,R环的波动性确保了它将在错配之后被快速且重复地“重新捕获”,并且在这些位点处受到极大的阻碍。图7C显示,虽然发现用于靶向原型间隔子和超出原型间隔子的邻接位点的指导RNA的5’端“简单”延伸区在体内被消化回至大约sgRNA长度(图7A),但是预期具有与“PAM远端”靶向区段互补的5’-发夹的指导RNA(hp-gRNA)在入侵之前仍被保护在Cas9/dCas9的结构内。在通过hp-gRNA结合PAM位点并起始链入侵后,在结合完全原型间隔子后,发夹打开并可发生完全的链入侵。如果在靶位点处存在PAM远端错配,那么它在能量学上更有利于发夹保持闭合并且使链入侵受到阻碍。Cas9-hp-gRNA裂解RNA的能力仍有待验证。
图8A-8B示出了经纯化的Cas9(图8A)和dCas9(图8B)产物(标称分子量:160kDa)的SDS凝胶中表达的Cas9和dCas9的纯度。洗脱带显示产品纯度约为95%。
图9A-9C示出了与DNA结合的Cas9/dCas9的另外图像。A)dCas9与不与AAVs1原型间隔子序列具有同源性的底物的结合分布(与图1比较)(n=443)。重叠的是PAM位点的累积性分布(CDF)(CDFPAM,黑色)和由dCas9结合的碱基的CDF(红色,CDFCas9)。比较在每端的100个碱基处开始以避免因与链霉亲和素标签重叠(DNA选择标准)并与DNA的暴露平端结合(导致预期的非特异性结合增加)而引入的伪影。B)蛋白质结合CDF与PAM位点CDF之间的绝对差Dn。虚线是用于两种分布的拟合优度的科-斯二氏准则(Kolmogorov-Smirnov criterion)。C)使用MATLAB比较来自具有相同概率G、A、T和C的100,000个随机生成的序列的结合CDF与PAM分布CDF。垂直红线是实验性Sup(Dn),表明实验性dCas9结合相比于其与生成序列71.20%的匹配更接近地匹配实验性PAM分布。
图10A-10C示出了与原型间隔子序列不具有同源性(>3bp)的“无义”底物的结合。(A)单独的dCas9图像。(B)单独成像的dCas9的体积(左侧)和高度(右侧)的直方图(n=423),对原始峰使用高斯拟合。从高斯拟合看出:平均高度是1.746nm(95%置信:1.689nm-1.802nm),具有标准差0.441nm,并且平均体积是1302nm3(95%置信:1266nm3-1337nm3),具有标准差259.1nm3(应注意,因为此处的dCas9在其结合通道内没有DNA,所以它们的记录体积可能会由于对AFM探针的机械阻力降低而出现人为降低)。相对于每个蛋白质周围的10个像素区域的中值测量高度,并且将体积记录为比局部背景高度的标准差大两倍的连续特征。(C)与DNA结合的dCas9的其他代表性图像,该DNA在一端已用单价链霉亲和素标记。
图11A-11D示出了与RNA结合的dCas9-sgRNA的代表性图和蛋白质结构特性加工的实例。图11A示出了与工程化DNA结合的dCas9的代表性广视野图像。图11B示出了框起来的区的特写。白色箭头是单价链霉亲和素,并且红色箭头是dCas9蛋白。图11C-11D示出了从原始图像提取的实例(图11C)和Cas9/dCas9结构的分离的实例(图11D)。对与DNA结合的每种分离蛋白质重复进行该提取,然后通过迭代平移、旋转和反射成对地比对以最小化它们的均方差拓扑差异。根据这些最小化的均方差,构建距离矩阵,根据Laio和Rodriguez(2014)Science[科学](纽约,N.Y.),344,1492-1496的方法将每个蛋白质聚类,然后按照聚簇将结构群体映射回其在DNA上的位点(图2A,图10A-10C)。
图12A-12B示出了映射到对应结合位点的Cas9/dCas9-sgRNA的特性。上面:对于所有实验条件,比对(右侧,参见正文)后的体积(左侧)、最大高度(中间)和结构(通过均方差聚类)的堆积直方图。如下面的散点图中那样,根据分组的(binned)体积、高度或结构聚簇来对群体进行着色。提取的Cas9/dCas9分子的结合分布(图10A-10C)与整个数据集(图1C-1D,图8A-8B)的结合分布接近匹配,这表明选择程序是无偏的,并且选择的蛋白质代表整个数据集。下面:所有Cas9/dCas9的体积对最大高度的散点图,所有Cas9/dCas9根据分组的(左侧)体积、(中间)最大高度和(右侧)结构聚簇进行颜色编码。
图13示出了在对应结合位点处具有tru-gRNA和hp-gRNA的Cas9/dCas9的结构特性。沿着工程化DNA底物由Cas9/dCas9占用的结合DNA分数,其中颜色代表根据其结构聚类的Cas9/dCas9群体(参见图3C)。将蛋白质结构根据其最接近类似(通过比对后的均方差,参见正文)的具有sgRNA的dCas9/Cas9进行分类。对于参考,在工程化DNA底物上,完全原型间隔子位点的位置:144-167bp;10MM(8MM)位点的位置:452-465bp;5MM(3MM)位点的位置:592-610bp。如与具有sgRNA的dCas9/Cas9观察到的趋势类似:随着dCas9与越来越匹配错配的位点结合,与最大(黄色)组聚类的群体分数增加,虽然这种效应在tru-gRNA中受到抑制,但甚至在完全原型间隔子位点处也有相当一部分群体与较小的(绿色和蓝色)群体聚类在一起。对hp10-gRNA的影响特别明显,这强调它对脱靶位点的亲和力差。
图14A-14C示出了指导RNA对DNA原型间隔子的链入侵模型,和RNA入侵到具有PAM远端错配的原型间隔子中的估计结合稳定性。图14A示出了指导RNA对DNA原型间隔子的链入侵的示意性模型。也参见图4A。假定指导RNA在m=1时解离。图14B示出了针对具有不同连续PAM远端错配数目的原型间隔子初始入侵至m=5的指导RNA的解离时间的计算概率分布。这些解离时间的长度可以看作是这些位点处dCas9结合倾向的近似值。星号突出显示了在初始入侵至m=5后初始未完全入侵的指导RNA群体的解离时间。入侵的RNA在具有15个PAM远端错配(15MM)的原型间隔子位点处高度不稳定,并且在实验上我们很少观察到在这些位点处结合的Cas9/dCas9(图1D)。在具有10个或5个PAM远端错配(10MM和5MM)的原型间隔子位点处入侵的RNA(在解离之前)被计算出比在15MM位点处入侵的RNA保持显著更长时间,但是在彼此的数量级内;在AFM实验中我们发现它们的结合倾向大约相等并低于完全原型间隔子位点(0MM)。使用如前所述的Q-矩阵方法(Sakmann等人(1995)Single-channelrecording[单通道记录],Springer[施普林格];第2版)利用m个状态之间的序列特异性转换速率(vf和vr,参见补充方法)计算概率密度函数。图14C显示,对具有不同PAM远端错配数目的原型间隔子处的RNA-原型间隔子结合的估计半衰期的检查表明大致存在三种方案,其中入侵RNA的稳定性是类似的:具有>11个PAM远端错配的那些(低稳定性);具有3至11个PAM远端错配的那些(中等稳定性);以及具有<3个PAM远端错配的那些(高稳定性)。结果在性质上类似于经由AFM观察到的工程化底物上的dCas9分布(图1D)。
图15示出了sgRNA和tru-gRNA在链入侵过程中穿过错配位点的模拟的平均首次通过时间。针对错配位点的不同位置模拟(动力学蒙特卡罗法)sgRNA(蓝色)和tru-gRNA(红色)在链入侵过程中穿过错配位点的平均首次通过时间。误差条是记录的首次通过时间的标准差。框中的是原型间隔子(AAVS1位点)的序列。
图16A-16B示出了Cas9裂解频率之间的相关性(Hsu等人(2013)自然生物技术,31,827-832)和来源于动力学蒙特卡罗法的R环稳定性的测量值。图16A示出了R环位点稳定性(来自动力学蒙特卡罗法,参见正文)与来自Hsu等人(2013)自然科学技术,31,827-832的实验性裂解频率之间的相关性的统计检力和强度随着模拟长度的增加而减小(max(t)=100至max(t)=1000,任意单位)。这个结果表明,链入侵的动力学可能是脱靶裂解率的重要预测因子。图16B示出了R环具有m大小的时间分数与动力学蒙特卡罗试验预测入侵链在穿过错配前解离的可能性之间的相关性。在位点10到14-15处的结合与在穿过错配前解离的可能性具有非常强的反相关(约0.5-0.85),而从AFM成像实验中我们发现位点约≥16处的结合与Cas9/dCas9的构象改变相关联。
图17示出了深度测序(Deep-Seq)数据的概述,比较了在靶(ontarget)活性。
图18示出了深度测序数据的概述,比较了特异性增加。
图19示出了原型间隔子1,肌营养不良蛋白;泳道1示出了GFP对照;泳道2示出了完全gRNA;泳道3示出了Tru-gRNA 19nt;泳道4示出了Tru-gRNA 18nt;泳道5示出了Tru-gRNA17nt;泳道6示出了Tru-gRNA 16nt;泳道7示出了Hp-gRNA 4bp;泳道8示出了Hp-gRNA 5bp;泳道9示出了Hp-gRNA 6bp;泳道10示出了Hp-gRNA 7bp;泳道11示出了Hp-gRNA8bp;并且泳道12示出了Hp-gRNA 9bp,发夹1(泳道12,9nt hp)-其中斜体化的是发夹的一部分并且加下划线的是发夹环。
图20示出了原型间隔子1,肌营养不良蛋白,内部环
图21示出了用于深度测序实验(使用NuPack软件套件)的hp-gRNA的原型间隔子靶向区段的5’端的计算二级结构。颜色是在平衡下该二级结构中存在的每个核苷酸的概率。
图22示出了肌营养不良蛋白,插入缺失(indel)率,所有位点。
图23示出了肌营养不良蛋白,在靶/总和(脱靶)。
图24示出了原型间隔子2,EMX1;泳道1示出了GFP对照;泳道2示出了完全gRNA;泳道3示出了Tru-gRNA;泳道4示出了10-bp hp-gRNA;并且泳道5示出了6-bp hp-gRNA,发夹1。转换-Surv_OT1=DS_OT2;Surv_OT53=DS_OT3。
图25A和25B示出了原型间隔子2,EMX1,tru-hp,内部环。
图26A-26C示出了发夹结构。图26A示出了发夹1,该发夹1是6bp 5’发夹。图26B示出了发夹2,该发夹2是18nt(截短型)gRNA上的5bp 5’发夹。图26C示出了发夹3,该发夹3是3bp 5’发夹。
图27示出了EMX1,插入缺失率,所有位点。
图28示出了EMX1,插入缺失率,低脱靶率。
图29示出了EMX1,在靶/总和(脱靶)。
图30示出了原型间隔子3,VEGFA1。泳道1示出了GFP对照;泳道2示出了完全gRNA;泳道3示出了Tru-gRNA;泳道4示出了10-bp hp-gRNA;并且泳道5示出了6-bp hp-gRNA。
图31示出了原型间隔子3,VEGFA1:pam近端发夹。泳道1示出了GFP对照;泳道2示出了完全gRNA;泳道3示出了hp-gRNA1;泳道4示出了hp-gRNA2;泳道5示出了hp-gRNA3;泳道6示出了hp-gRNA4;泳道7示出了hp-gRNA5;并且泳道8示出了hp-gRNA6。
图32示出了原型间隔子3,VEGFA1:pam近端发夹。
图33示出了原型间隔子3,VEGF1,内部环。泳道1示出了对照;泳道2示出了全长;泳道3示出了2nt hp;泳道4示出了3nt hp,发夹5;并且泳道5示出了4nt hp。
图34A和34B显示发夹1、2和3的深度测序实验失败。图25A示出了发夹4-计算推导出的发夹,该发夹被设计用于在维持在靶活性的同时辨别脱靶位点2。图25B示出了发夹5-4bp 5’-发夹(gRNA正常具有明显的3’二级结构)。
图35示出了VEGF1,插入缺失率,所有位点。
图36示出了VEGF1,插入缺失率,低脱靶率。
图37示出了VEGF1,在靶/总和(脱靶)。
图38示出了原型间隔子4,VEGFA3。泳道1示出了GFP对照;泳道2示出了完全gRNA,泳道3示出了Tru-gRNA;泳道4示出了3-bp hp-gRNA;泳道5示出了4-bp hp-gRNA;泳道6示出了5-bp hp-gRNA;泳道7示出了6-bp hp-gRNA;并且泳道8示出了10-bp hp-gRNA。
图39示出了gRNA4,VEGFA13:pam近端发夹。泳道1示出了GFP对照;泳道2示出了完全gRNA;泳道3示出了hp-gRNA1;泳道4示出了hp-gRNA2;泳道5示出了hp-gRNA3;泳道6示出了hp-gRNA4;泳道7示出了hp-gRNA5;并且泳道8示出了hp-gRNA6。
图40A示出了发夹1-靶向3’-区的4bp发夹。
图40B示出了发夹2-具有G-U摆动碱基对、靶向3’-区的4bp发夹。
图40示出了发夹3-具有G-U摆动碱基对、靶向3’-区的4bp发夹(变体设计)。
图41示出了VEGF3,插入缺失率,所有位点。
图42示出了VEGF3,插入缺失率,低脱靶率。
图43示出了VEGF3,在靶/总和(脱靶)。
图44A示出了被设计来靶向EMX1基因的发夹。
图44B示出了图44A的发夹的EMX1-sg1序列。
图44C示出了降低原型间隔子长度和增加发夹长度对特异性的影响。
图45A-45D示出了DNA/RNA序列。
图46示出了描述Surveyor测定的图。
图47示出了AsCpf1和LbCpf1对错配或截短的crRNA的耐受性以及使用含有单个错配碱基的crRNA对AsCpf1和LbCpf1的内源性基因修饰。通过T7E1测定确定活性;误差条,s.e.m.;n=3(取自Kleinstiver等人,自然生物技术34:869-875)。
图48示出了与V型CRISPR系统一起使用的hp-gRNA的surveyor测定结果,其中将发夹添加到全长gRNA的3’端以消除脱靶活性。
具体实施方式
本文披露了用于位点特异性DNA靶向和表观基因组基因编辑和/或转录调控,诸如DNA裂解和基因激活或阻遏的组合物和方法。本发明涉及一种用于设计和使用具有发夹结构的优化指导RNA(hpgRNA)的模块化方法,这些优化指导RNA可以容易地掺入到现有生物技术基础结构中,并且导致脱靶活性的受控降低,始终同时保持特异性靶向正确的DNA序列的能力。本文描述的方法提供了一种比其他可用方法表现显著更佳的用于工程化优化gRNA的新颖方法,并且可以与改善特异性增加的其他蛋白质特异性手段结合使用以高度改善性能。
所披露的方法和优化gRNA具有易于适于当前方法和已经就位的基础结构来进行RNA指导型基因组工程的巨大优势。在一些实施例中,使用病毒载体以及编码优化gRNA在细胞中的转录的载体将Cas9、dCas9或Cpf1递送至细胞中。本发明对编码优化gRNA的载体仅需要几个额外的核苷酸,这可以容易地通过当前实践和标准实践来调节。与截短指导RNA(tru-gRNA)类似,优化gRNA或hpgRNA可以与例如成对切口酶,或者内切核酸酶本身的其他修饰组合使用以进一步改善特异性。体外进行一系列实验,这些实验显示使用本文所述方法产生的优化gRNA相对于最佳可用gRNA选项增加了DNA结合的特异性(参见图2)。优化gRNA的使用消除或显著削弱仅包含少量错配DNA序列的靶标处的活性,这些序列往往是由RNA指导型内切核酸酶的脱靶活性发生的位点。优化gRNA也在哺乳动物细胞中在已知诱导脱靶活性的位点处提供裂解活性的特异性,即使在对指导RNA的最佳已知改善中。本发明是一种通过工程改变指导RNA的结构设计来降低RNA指导型内切核酸酶、特别是Cas9的脱靶活性的通用方法。
1.定义
如本文所用,术语“包括(comprise/include)”、“具有(having/has)”、“可以”、“含有(contain)”意指不排除附加作用或结构的可能性的开放式过渡性短语、术语或字词。单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物,除非上下文中另外明确指明。本披露内容还考虑“包括本文呈现的实施例或元素”,“由本文呈现的实施例或元素组成”和“基本上由本文呈现的实施例或元素组成”的其他实施例,无论是否明确阐述。
对于此处数值范围的叙述,明确考虑了具有相同程度的精度的介于两者之间的每个数字。例如,对于范围6-9,除了6和9之外还考虑了数字7和8,并且对于范围6.0-7.0,明确考虑了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
除非另外定义,否则本文使用的所有技术性和科学性的术语具有与本领域普通技术人员所普遍理解的相同含义。在矛盾的情况下,将以本文件(包括定义)为准。虽然类似或者等效于本文描述的那些的方法和材料可以用于本披露的实践或者测试中,但是以下描述优选的方法和材料。本文提交的所有出版物、专利申请、专利和其他参考文献通过援引以其全文并入。本文披露的这些材料、方法以及实例仅是说明性的并且不旨在是限制性的。
如本文可互换使用的“腺相关病毒”或“AAV”是指感染人及其他一些灵长类物种的属于细小病毒科(Parvoviridae)依赖病毒属(Dependovirus)的小病毒。当前尚不知AAV引起疾病并且因此该病毒引起非常轻微的免疫应答。
如本文所用,“结合区”是指在核酸靶区内被核酸酶,诸如Cas9识别并结合的区。
如本文所用,“染色质”是指与组蛋白相关联的染色体DNA的组织化复合体。
如本文可互换使用的“顺式调控元件”或“CRE”是指调控附近基因的转录的非编码DNA区。CRE存在于它们调控的一个或多个基因的附近。CRE典型地通过作为转录因子的结合位点来调控基因转录。CRE的实例包括启动子、增强子、超级增强子、沉默子、绝缘子和基因座控制区。
如本文可互换使用的“成簇规律间隔短回文重复序列”和“CRISPR”是指含有多个短的正向重复序列的基因座,这些重复序列存在于大约40%的测序细菌和90%的测序古细菌的基因组中。
如本文所用,“编码序列”或“编码核酸”意指包含编码蛋白质的核苷酸序列的核酸(RNA或DNA分子)。编码序列可进一步包含可操作地连接至调控元件的起始信号和终止信号,这些调控元件包括能够在向其给予核酸的个体或哺乳动物的细胞中指导核酸的表达的启动子和聚腺苷酸化信号。编码序列可以是密码子优化的。
如本文所用,意指核酸的“互补”或“互补的”可以意指核酸分子的核苷酸或核苷酸类似物之间的沃森-克里克(例如,AT/U和C-G)或胡斯坦(Hoogsteen)碱基配对。“互补性”是指两个核酸序列之间共有的特性,以使得当它们彼此反平行比对时,每个位置上的核苷酸碱基将是互补的。
如本文所用,“纠正”、“基因组编辑”和“恢复”是指改变编码截短蛋白或根本不编码蛋白的突变基因,以使得获得全长功能性或部分全长功能性蛋白质的表达。纠正或恢复突变基因可包括利用修复机制诸如同源定向修复(HDR)用不具有突变的基因拷贝替代具有突变的基因区或替代整个突变基因。纠正或恢复突变基因还可以包括通过以下方式修复引起提前终止密码子、异常剪接受体位点或异常剪接供体位点的移码突变:在基因中产生双链断裂,然后使用非同源末端连接(NHEJ)进行修复。NHEJ可以在修复过程中添加或缺失至少一个碱基对,从而可以恢复正确的阅读框并消除提前终止密码子。纠正或恢复突变基因还可以包括破坏异常剪接受体位点或剪接供体序列。纠正或恢复突变基因还可以包括通过两种核酸酶在同一DNA链上的同时作用来缺失非必需基因区段,以便通过去除两个核酸酶靶位点之间的DNA并修复由NHEJ产生的DNA断裂来恢复正确的阅读框。
如本文所用,“脱甲基化酶”是指从核酸、蛋白(特别是组蛋白)和其他分子中去除甲基(CH3-)基团的酶。脱甲基化酶在表观遗传修饰机制中很重要。脱甲基化酶蛋白通过控制DNA和组蛋白上发生的甲基化水平来改变基因组的转录调控,并且进而调控生物体内特定基因座处的染色质状态。“组蛋白脱甲基化酶”是指从组蛋白中去除甲基基团的甲基化酶。存在若干种家族的组蛋白脱甲基化酶,它们作用于不同的底物并在细胞功能中起不同的作用。Fe(II)依赖性赖氨酸脱甲基化酶可以是JMJC脱甲基化酶。JMJC脱甲基化酶是含有JumonjiC(JmjC)结构域的组蛋白脱甲基化酶。JMJC脱甲基化酶可以是组蛋白脱甲基化酶的KDM3、KDM4、KDM5或KDM6家族的成员。
如本文可互换使用的“DNA酶I高敏位点”或“DHS”是指用于转录因子和染色质修饰因子(包括协调远端靶基因表达的p300)的停泊位点。
如本文可互换使用的“供体DNA”、“供体模板”和“修复模板”是指包含感兴趣的基因的至少一部分的双链DNA片段或分子。供体DNA可编码全功能性蛋白或部分功能性蛋白。
如本文所用,“内源性基因”是指来源于生物体、组织或细胞内的基因。内源性基因对于细胞是天然的,在正常的基因组和染色质环境中,并且对细胞而言不是异源的。此类细胞基因包括例如动物基因、植物基因、细菌基因、原生动物基因、真菌基因、线粒体基因和叶绿体基因。如本文所用,“内源性靶基因”是指由优化gRNA和基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统所靶向的内源性基因。
如本文所用,“增强子”是指含有多个激活结合位点和阻遏结合位点的非编码DNA序列。增强子的长度在从50bp到1500bp的范围内,并且增强子可以在近端,在启动子的5’上游、在调控基因的任何内含子内,或在远端,在相邻基因的内含子或远离基因座的基因间区中,或在不同染色体上的区上。多于一个的增强子可以与启动子相互作用。类似地,增强子可以调控多于一个基因而没有连接限制,并且可以“跳跃”相邻基因以调控更远的基因。转录调控可以涉及位于与启动子所在染色体不同的染色体上的元件。相邻基因的近端增强子或启动子可以充当募集更多远端元件的平台。
如本文可互换使用的“杜氏肌营养不良”或“DMD”是指一种隐性遗传的、致命的、X连锁病症,其导致肌肉变性和最终的死亡。DMD是一种常见的遗传性单基因疾病,并且在3500名男性中发生1例。DMD的致因是在肌营养不良蛋白基因中引起无义或移码突变的遗传或自发突变。引起DMD的大多数肌营养不良蛋白突变是破坏阅读框并且引起肌营养不良蛋白基因的提前翻译终止的外显子缺失。DMD患者典型地在童年期间失去了自我身体支撑的能力,在青少年时期逐渐变得更弱,并且在二十多岁时死亡。
如本文所用,“肌营养不良蛋白”是指棒状胞质蛋白,其是通过细胞膜将肌纤维细胞骨架连接到周围的细胞外基质的蛋白复合体的一部分。肌营养不良蛋白提供负责调控肌细胞完整性和功能的细胞膜肌营养不良蛋白聚糖复合体的结构稳定性。如本文可互换使用的肌营养不良蛋白基因或“DMD基因”是在基因座Xp21处的2.2兆碱基。初级转录测量了约2,400kb,其中成熟mRNA是约14kb。79个外显子编码超过3500个氨基酸的蛋白质。
如本文所用,“外显子51”是指肌营养不良蛋白基因的第51个外显子。在DMD患者中,外显子51常常邻近破坏框的缺失并且已在临床试验中被靶向用于基于寡核苷酸的外显子跳跃。对于外显子51跳跃化合物依替利森(eteplirsen)的临床试验,最近报道了跨48周的显著功能益处,与基线相比具平均47%的肌营养不良蛋白阳性纤维。外显子51中的突变理想地适合于通过基于NHEJ的基因组编辑进行永久性校正。
如本文可互换使用的“移码”或“移码突变”是指基因突变的一种类型,其中一个或多个核苷酸的添加或缺失引起mRNA中密码子的读码框移位。阅读框的移位可能导致蛋白质翻译时氨基酸序列改变,诸如错义突变或提前终止密码子。
如本文可互换使用的“全长gRNA”或“标准gRNA”是指一种gRNA,其包含“骨架”和原型间隔子靶向序列或区段,典型地长度为20个核苷酸。
如本文所用,“功能性”和“全功能性”描述了具有生物活性的蛋白质。“功能性基因“是指转录成mRNA的基因,该mRNA被翻译成功能性蛋白质。
如本文所用,“融合蛋白“是指通过最初编码单独蛋白质的两个或更多个基因的连接产生的嵌合蛋白。融合基因的翻译产生具有来源于每种原始蛋白质的功能特性的单一多肽。
如本文所用,“基因构建体”是指包含编码蛋白质的核苷酸序列的DNA或RNA分子。编码序列包含可操作地连接至调控元件的起始信号和终止信号,这些调控元件包括能够在向其给予核酸分子的个体的细胞中指导核酸的表达的启动子和聚腺苷酸化信号。如本文所用,术语“可表达形式”是指这样的基因构建体,该基因构建体含有可操作连接至编码蛋白质的编码序列的必需调控元件,使得当存在于个体的细胞中时,编码序列将被表达。
如本文所用,“遗传性疾病”是指部分或完全、直接或间接地由基因组中的一个或多个异常引起的疾病,特别是从出生就存在的病状。异常可以是突变、插入或缺失。异常可以影响基因或其调控序列的编码序列。遗传性疾病可以是,但不限于,DMD、血友病、囊性纤维化、亨廷顿氏舞蹈病、家族性高胆固醇血症(LDL受体缺陷)、肝母细胞瘤、威尔逊氏病、先天性肝性卟啉症、遗传性肝性代谢病症、莱施-尼汉综合征(Lesch Nyhan syndrome)、镰状细胞性贫血、地中海贫血、着色性干皮病、范可尼氏贫血(Fanconi's anemia)、色素性视网膜炎、共济失调毛细血管扩张、布卢姆综合征(Bloom's syndrome)、成视网膜细胞瘤以及泰-萨二氏病(Tay-Sachs disease)。
如本文所用,“基因组”是指存在于细胞或生物体中的整套基因或遗传物质。基因组包括RNA病毒中的DNA或RNA。基因组包括基因(编码区)、非编码DNA以及线粒体和叶绿体的基因组。
如本文可互换使用的“指导RNA”、“gRNA”、“单链gRNA”和“sgRNA”是指由为Cas9结合或Cpf1结合所需的“骨架”序列和限定待修饰的基因组靶标的用户定义的“间隔子”或“靶向序列”(本文也称为原型间隔子靶向序列或区段)。如本文可互换使用的“hpgRNA”、“hp-gRNA”和“优化gRNA”是指在5’端或3’端具有附加核苷酸的gRNA,该gRNA可以与全部或部分原型间隔子靶向序列或区段形成二级结构。
如本文可互换使用的“组蛋白乙酰转移酶”或“HAT”是指通过从乙酰辅酶A转移乙酰基基团来乙酰化组蛋白上的保守赖氨酸氨基酸以形成ε-N-乙酰基赖氨酸的酶。DNA缠绕在组蛋白的周围,并且通过将乙酰基基团转移到组蛋白,可以打开和关闭基因。一般来说,组蛋白乙酰化增加了基因表达,因为它与转录激活有联系并与常染色质相关。组蛋白乙酰转移酶也可以乙酰化非组蛋白,诸如核受体和其他转录因子以促进基因表达。
如本文可互换使用的“组蛋白脱乙酰酶”或“HDAC”是指这样的一类酶,这些酶从组蛋白上的ε-N-乙酰赖氨酸氨基酸去除乙酰基基团(O=C-CH3),从而允许组蛋白更紧密地缠绕DNA。HDAC也被称为赖氨酸脱乙酰酶(KDAC),以描述其功能而不是其靶标,其还包括非组蛋白。
如本文可互换使用的“组蛋白甲基转移酶”或“HMT”是指催化一个、两个或三个甲基基团转移到组蛋白的赖氨酸和精氨酸残基上的组蛋白修饰酶(例如,组蛋白-赖氨酸N-甲基转移酶和组蛋白-精氨酸N-甲基转移酶)。甲基基团的连接主要发生在组蛋白H3和H4上的特定赖氨酸或精氨酸残基上。
如本文可互换使用的“同源定向修复”或“HDR”是指在细胞中当DNA的同样片段存在于细胞核时(主要在细胞周期的G2和S期)修复双链DNA损伤的机理。HDR使用供体DNA模板来指导修复,并且可用于产生基因组的特定序列变化,包括整个基因的靶向添加。如果供体模板与位点特异性核酸酶,诸如与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统一起提供,则细胞机构将通过同源重组修复断裂,在存在DNA裂解的情况下该修复增强几个数量级。当不存在同源DNA片段时,可以作为替代发生非同源末端连接。
如本文所用,“基因组”是指存在于细胞或生物体中的整套基因或遗传物质。基因组包括RNA病毒中的DNA或RNA。基因组包括基因(编码区)、非编码DNA以及线粒体和叶绿体的基因组。
如本文所用,“基因组编辑”是指改变基因。基因组编辑可以包括纠正或恢复突变基因。基因组编辑可以包括敲除基因,诸如突变基因或正常基因。基因组编辑可以通过改变感兴趣的基因用于治疗疾病或增强肌肉修复。
如本文所用,“相同”或“同一性”在两个或更多个核酸或多肽序列的背景下意指序列在指定区上具有指定百分比的相同残基。百分比可以通过以下方式计算:最佳比对两个序列、在指定区上比较两个序列、确定两个序列中出现相同残基的位置数以产生匹配位置的数、将匹配位置数除以指定区中的位置总数,并且将结果乘以100而得出序列同一性百分比。在两个序列具有不同长度或者比对产生一个或多个交错末端并且比较的指定区仅包含单个序列的情况下,单个序列的残基包含在计算的分母中,而不包含在计算的分子中。当比较DNA和RNA时,可以认为胸腺嘧啶(T)和尿嘧啶(U)是等同的。可以手动或通过使用计算机序列算法诸如BLAST或BLAST 2.0来获得同一性。
如本文所用,“绝缘子”是指阻断增强子与启动子之间的相互作用的遗传边界元件。通过存在于增强子与启动子之间,绝缘子可以抑制它们的后续相互作用。绝缘子可以确定增强子可以影响的一组基因。当染色体上的两个邻近基因具有非常不同的转录模式并且一者的诱导或阻遏机制不干扰相邻基因时,需要绝缘子。绝缘子还被发现聚簇在拓扑关联结构域(TAD)的边界处,并且可以在将基因组划分到“染色体邻域”(在其中发生调控的基因组区)中起作用。认为绝缘子活性主要通过由包括CTCF的蛋白质介导的DNA 3D结构发生。绝缘子很可能通过多种机制发挥作用。许多增强子形成DNA环,这些DNA环使增强子在转录激活过程中非常物理接近于启动子区。绝缘子可以促进阻止启动子-增强子环形成的DNA环的形成。阻隔性绝缘子可阻止异染色质从沉默基因扩散到有转录活性的基因。
如本文所用,“入侵”是指对靶基因的靶区中的原型间隔子区处的DNA双链体的破坏,诸如通过结合与原型间隔子互补的DNA序列的gRNA。
如本文所用,“入侵动力学”是指入侵行进的速率。入侵动力学可以指的是指导RNA入侵双链体至“完全入侵”以使得原型间隔子被完全入侵的速率,或者结合指导RNA的原型间隔子DNA的区段在从其互补链移位并从其PAM近端区至完全入侵逐个核苷酸地结合指导RNA时的扩增速率。
如本文所用,“寿命”是指gRNA保持入侵在靶基因的靶区中的该区中的时间段。
如本文所用“基因座控制区”是指增强远端染色质位点处的连锁基因的表达的顺式调控元件。它以拷贝数依赖性方式起作用并且是组织特异性的,如β-珠蛋白基因在红系细胞中的选择性表达中所见的。基因的表达水平可以通过LCR和基因近端元件,诸如启动子、增强子和沉默子来改变。LCR通过募集染色质修饰、共激活因子和转录复合体起作用。它的序列在许多脊椎动物中是保守的,并且特定位点的保守可以表明功能上的重要性。
如本文可互换使用的“错配的”或“MM”是指包括G/T或A/C配对的错配碱基。错配通常是由于G2期间碱基的结构互变造成的。损伤通过以下方式修复:识别由错配引起的畸形、确定模板和非模板链,并且切除错误掺入的碱基并用正确的核苷酸替代它。
如本文所用,“调节”可意指活性的任何改变,诸如调控、下调、上调、降低、抑制、增加、减少、减活或激活。
如本文可互换使用的“突变基因”或“突变的基因”是指已经经历可检测的突变的基因。突变基因经历了改变,诸如遗传物质的丢失、获得或交换,该改变影响基因的正常传递和表达。如本文所用,“破坏的基因”是指具有引起提前终止密码子的突变的突变基因。破坏的基因产物相对于全长未破坏的基因产物是截短的。
如本文所用,“非同源末端连接(NHEJ)途径”是指通过在不需要同源模板的情况下直接连接断裂末端来修复双链断裂的途径。NHEJ对DNA末端的不依赖模板的重新连接是随机的、易错的修复过程,该过程在DNA断点处引入随机微插入和微缺失(插入缺失)。该方法可用于有意地破坏、缺失或改变靶基因序列的阅读框。NHEJ通常使用短同源DNA序列(称为微同源物)指导修复。这些微同源物常常存在于双链断裂末端上的单链突出端中。当突出端完全相容时,NHEJ通常准确地修复断裂,然而导致核苷酸丢失的不精确修复也可能发生,但是当突出端不相容时不精确修复更普遍得多。
如本文所用,“正常基因”是指未经历改变,诸如,遗传物质的丢失、获得或交换的基因。正常基因经历正常的基因传递和基因表达。
如本文所用,“核酸酶介导的NHEJ”是指核酸酶诸如cas9切割双链DNA后开始的NHEJ。
如本文所用,“核酸”或“寡核苷酸”或“多核苷酸”意指至少两个核苷酸共价连接在一起。单链的描绘也定义了互补链的序列。因此,核酸也涵盖所描绘的单链的互补链。核酸的许多变体可用于与给定核酸相同的目的。因此,核酸也涵盖基本相同的核酸及其互补序列。单链提供可以在严格杂交条件下与靶序列杂交的探针。因此,核酸还涵盖在严格杂交条件下杂交的探针。
核酸可以是单链或双链的,或者可以含有双链和单链序列的部分。核酸可以是基因组和cDNA的DNA、RNA或杂交体,其中核酸可以含有脱氧核糖核苷酸和核糖核苷酸的组合,以及碱基的组合,这些碱基包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤。核酸可以通过化学合成方法或通过重组方法来获得。
如本文所用,“在靶位点”是指基因组中gRNA旨在靶向的靶区或序列。理想地,在靶位点与靶DNA序列具有完全同源性(100%同一性或同源性),而在基因组中的其他地方没有同源性。
如本文所用,“脱靶位点”是指基因组中与gRNA的在靶位点或靶区具有部分同源性或部分同一性的区,但该区不是gRNA旨在或设计为靶向的。
如本文所用,“可操作地连接”意指基因的表达在与之在空间上连接的启动子的控制下。启动子可位于在其控制下的基因的5’(上游)或3’(下游)。启动子与基因之间的距离可与该启动子与它控制的基因(在启动子来源于的基因中)之间的距离大致相同。正如本领域已知,可调节该距离的变化而不丧失启动子功能。
如本文可互换使用的“p300蛋白”、“EP300”或“E1A结合蛋白p300”是指由EP300基因编码的腺病毒E1A-相关的细胞p300转录共激活因子蛋白。p300是一种高度保守的乙酰转移酶,其涉及广泛的细胞过程。p300起着组蛋白乙酰转移酶的作用,它经由染色质重建调控转录,并且涉及细胞增殖和细胞分化过程。
如本文所用,“部分功能性”描述由突变基因编码并具有比功能性蛋白质低但比非功能性蛋白质高的生物活性的蛋白质。
如本文可互换使用的“提前终止密码子”或“框外终止密码子”是指DNA序列的无义突变,其导致通常不存在于野生型基因中的位置处的终止密码子。提前终止密码子可能引起蛋白质被截短或短于蛋白质的全长型式。
如本文所用,“原代细胞”是指直接取自活组织(例如活检材料)的细胞。可以建立原代细胞用于体外生长。这些细胞经历了非常少的群体倍增并且因此与连续(肿瘤或人工永生化)细胞系相比,更能代表它们来源于的组织的主要功能组分,因此代表了更具代表性的体内状态模型。原代细胞可以来自不同的物种,诸如小鼠或人。
如本文可互换使用的“原型间隔子序列”或“原型间隔子区段”是指由在CRISPR细菌适应性免疫系统中的Cas9核酸酶或Cpf1核酸酶靶向的DNA序列。在CRISPR/Cas9系统中,原型间隔子序列通常后面跟着原型间隔子邻近基序(PAM);PAM在5’端处。在CRISPR/Cpf1系统中,PAM后面跟着原型间隔子序列;PAM在3’端处。
如本文可互换使用的“原型间隔子靶向序列”或“原型间隔子靶向区段”是指gRNA中对应于原型间隔子序列并且促进基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统对原型间隔子序列的靶向的核苷酸序列。
如本文所用,“启动子”是指合成的或天然来源的分子,其能够赋予、激活或增强细胞中核酸的表达。启动子可以包含一个或多个特异性转录调控序列以进一步增强表达和/或改变该序列的空间表达和/或时间表达。启动子还可包含远端增强子或阻遏物元件,其可定位于距转录起始位点多达几千碱基对,或基因组中的任何地方。启动子可来源于以下来源:包括病毒、细菌、真菌、植物、昆虫和动物。就其中发生表达的细胞、组织或器官而言,或者就发生表达时的发育阶段而言,或者在响应于外部刺激诸如生理应激、激素类、毒素、药物、病原体、金属离子或诱导剂时,启动子可组成型地或差异性地调控基因组分的表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、乳糖操纵基因启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV40晚期启动子和CMV IE启动子。
如本文所用,“原型间隔子邻近基序”或“PAM”是指紧跟在由CRISPR细菌适应性免疫系统中的Cas9靶向的DNA序列的DNA序列之后或紧接在由CRISPR细菌适应性免疫系统中的Cpf1核酸酶靶向的DNA序列之前。PAM是入侵病毒或质粒的组分,但不是细菌CRISPR基因座的组分。Cas9和Cpf1将不能成功地结合或裂解靶DNA序列,如果它们分别之前或之后不是PAM序列的话。PAM是细菌区分自身DNA与非自身DNA的基本靶向组分(在细菌基因组中不存在),从而防止CRISPR基因座被核酸酶靶向和破坏。
术语“重组”当用于指例如一种细胞、核酸、蛋白或载体时表明该细胞、核酸、蛋白或载体已经通过导入异源核酸或蛋白或者改变天然的核酸或蛋白进行修饰,或者表明该细胞衍生自这样修饰的细胞。因此,例如,这些重组细胞表达在细胞的天然(天然存在的)形式中未发现的基因或表达以其他方式正常或异常表达的、低表达的或根本不表达的天然基因的第二拷贝。
如本文可互换使用的“沉默子”或“阻遏物”是指能够结合转录调控因子并防止基因被表达为蛋白质的DNA序列。沉默子是诱导对特定基因的转录的负面影响的序列特异性元件。沉默子元件可以位于DNA中的许多位置。发现最常见的位置是在靶基因的上游,在此处其可以帮助阻遏基因的转录。该距离可以在基因上游的大约-20bp至-2000bp之间很大地变化。某些沉默子可以在位于基因自身的内含子或外显子内的启动子下游发现。在mRNA的3’端非翻译区(3’UTR)内也发现了沉默子。DNA存在两种主要类型的沉默子,即是经典的沉默子元件和非经典的负调控元件(NRE)。在经典的沉默子中,基因被沉默子元件主动阻遏,主要是通过干扰通用转录因子(GTF)组装。NRE通常通过抑制基因上游的其他元件来被动阻遏基因。
如本文所用,“骨骼肌”是指横纹肌的类型,其在躯体神经系统的控制下,并通过称为肌腱的胶原纤维束与骨连接。骨骼肌由称为肌细胞或“肌肉细胞”(有时通称为“肌纤维”)的各组分组成。肌细胞在称为肌生成的过程中由发育的成肌细胞(产生肌肉细胞的胚胎祖细胞的一种类型)融合形成。这些长的圆柱形多核细胞也称为肌纤维。
如本文所用,“骨骼肌病状”是指与骨骼肌有关的病状,诸如肌营养不良、老化、肌肉变性、伤口愈合和肌无力或萎缩。
如本文可互换使用的“受试者”和“患者”是指任何脊椎动物,包括但不限于哺乳动物(例如牛、猪、骆驼、美洲驼、马、山羊、兔、绵羊、仓鼠、豚鼠、猫、狗、大鼠和小鼠、非人灵长类动物(例如猴,诸如食蟹猴(cynomolgous)或猕猴、黑猩猩等)和人)。在一些实施例中,受试者可以是人或非人。受试者或患者可能正在接受其他形式的治疗。
如本文所用,“超级增强子”是指哺乳动物基因组中包含共同地由转录因子蛋白的阵列结合以驱动涉及细胞身份的基因转录的多个增强子的区。超级增强子常常在靠近对于控制和定义细胞身份重要的基因附近被鉴定出,并且可以用于快速鉴定调控细胞身份的关键节点。增强子具有几个可量化性状,这些性状具有一系列的值,并且这些性状通常在超级增强子处是升高的。超级增强子由更高水平的转录调控蛋白的结合,并且与更高度表达的基因相关。与超级增强子相关的基因的表达对微扰特别敏感,这可以促进细胞状态转换或解释超级增强子相关基因对靶向转录的小分子的敏感性。
如本文所用,“靶增强子”是指由gRNA和基于CRISPR/Cas9的系统靶向的增强子。靶增强子可以在靶区内。
如本文所用,“靶基因”是指编码已知或推定的基因产物的任何核苷酸序列。靶基因可以是涉及遗传性疾病的突变的基因。
如本文可互换使用的“靶区”、“靶序列”、“原型间隔子”或“原型间隔子序列”是指靶基因的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统靶向的区。
如本文所用,“转录区”是指被转录为单链RNA分子(被称为信使RNA),导致遗传信息从DNA分子转移到信使RNA的DNA区。在转录过程中,RNA聚合酶以3’至5’的方向读取模板链并从5’至3’合成RNA。mRNA序列与DNA链互补。
如本文所用,“靶调控元件”是指由gRNA和基于CRISPR/Cas9的系统靶向的调控元件。靶调控元件可以在靶区内。
如本文所用,“转录区”是指被转录为单链RNA分子(被称为信使RNA),导致遗传信息从DNA分子转移到信使RNA的DNA区。在转录过程中,RNA聚合酶以3’至5’的方向读取模板链并从5’至3’合成RNA。mRNA序列与DNA链互补。
如本文可互换使用的“转录起始位点”或“TSS”是指转录DNA序列的第一核苷酸,在此处RNA聚合酶开始合成RNA转录物。
如本文所用,“转基因”是指含有从一种生物体分离并引入导不同生物体中的基因序列的基因或遗传物质。DNA的这种非天然区段可保留在转基因生物体中产生RNA或蛋白质的能力,或可以改变转基因生物体的遗传密码的正常功能。转基因的引入具有改变生物体的表型的潜力。
如本文所用,“tru gRNA”是指核苷酸从其5’端截短,典型地截短2个核苷酸的全长指导RNA。
如本文所用,“反式调控元件”是指非编码DNA中调控远离转录出它们的基因的基因的转录的区。转录调控元件可以位于与靶基因相同或不同的染色体上。反式调控元件的实例包括增强子、超级增强子、沉默子、绝缘子和基因座控制区。
本文关于核酸使用的“变体”意指(i)参比核苷酸序列的一部分或片段(包括与参比核苷酸序列相比具有插入或缺失的核苷酸序列);(ii)参比核苷酸序列的互补序列或其部分;(iii)与参比核酸基本上相同的核酸或其互补序列;或(iv)在严格条件下与参比核酸、其互补序列或与其基本上相同的序列杂交的核酸。
有关肽或多肽的“变体”因氨基酸的插入、缺失或保守取代而在氨基酸序列上不同但保留至少一种生物活性。变体还可意指具有这样的氨基酸序列的蛋白质,该氨基酸序列与具有保留至少一种生物活性的氨基酸序列的参比蛋白质基本相同。氨基酸的保守取代,即将氨基酸用具有相似特性(例如亲水性、带电荷区的程度和分布)的不同氨基酸替代在本领域中被视为典型涉及微小变化。正如本领域所了解的,在某种程度上,通过考虑氨基酸的亲水指数,可鉴定这些微小变化。Kyte等人,J.Mol.Biol.[分子生物学杂志]157:105-132(1982)。氨基酸的亲水指数是基于其疏水性和电荷的考量。本领域已知,具有类似亲水指数的氨基酸可被取代并仍保留蛋白质功能。在一方面,具有±2的亲水指数的氨基酸是取代的。氨基酸的亲水性还可用于揭示可产生保留生物功能的蛋白质的取代。在肽的背景下考虑氨基酸的亲水性允许计算该肽的最大局部平均亲水性。取代可用彼此亲水性值在±2内的氨基酸进行。氨基酸的疏水性指数和亲水性值两者受氨基酸的特定侧链影响。应了解,与该观察结果一致,与生物功能相容的氨基酸取代取决于如通过疏水性、亲水性、电荷、大小和其他性质揭示的氨基酸、并且特别是那些氨基酸的侧链的相对相似性。
如本文所用,“载体”意指含有复制起点的核酸序列。载体可以是病毒载体、噬菌体、细菌人工染色体或酵母人工染色体。载体可以是DNA或RNA载体。载体可以是自我复制的染色体外载体,并且优选地是DNA质粒。例如,载体可编码Cas9和SEQ ID NO:149-315、321-323和326-329中任一个的至少一个优化的gRNA核苷酸序列。
除非本文另外定义,否则结合本披露内容使用的科技术语应具有本领域的普通技术人员通常所了解的意义。例如,与本文所描述的细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及蛋白质和核酸化学及杂交学结合使用的任何命名法是本领域中众所周知并且常用的那些。术语的含义和范围应是清楚的;然而在任何潜在歧义的情况下,本文提供的定义优先于任何字典或外在定义。此外,除非上下文另外要求,单数术语应该包括复数含义并且复数术语应该包括单数含义。
2.CRISPR系统
CRISPR系统是微生物核酸酶系统,其参与防御提供获得性免疫形式的入侵噬菌体和质粒。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够编程CRISPR介导的核酸裂解特异性的非编码RNA元件的组合。将短的外来DNA区段(称为间隔子)在CRISPR重复序列之间整合到基因组中,并用作暴露后的“记忆”。Cas9与单指导RNA(sgRNA)的3’端形成复合体,该蛋白质-RNA对通过sgRNA序列的5’端与预先确定的20bp DNA序列(称为原型间隔子)之间的互补碱基配对识别其基因组靶标。该复合体经由CRISPR RNA(“crRNA”)内编码的区(即原型间隔子)和病原体基因组内的原型间隔子邻近基序(PAM)指导至病原体DNA的同源基因座。同向重复序列内的非编码CRISPR阵列被转录并裂解成含有单独间隔子序列的短的crRNA,该crRNA将Cas核酸酶指导至靶位点(原型间隔子)。通过简单交换表达的嵌合sgRNA的20bp识别序列,Cas9核酸酶可被指导至新的基因组靶标。使用CRISPR间隔子以类似于真核生物的RNAi的方式识别外源性遗传元件并使其沉默。
已知CRISPR系统的3个类别(I、II和III型效应器系统)。II型效应器系统使用单一效应酶Cas9以四个相继步骤进行靶向DNA双链断裂以裂解dsDNA。与需要多个不同的效应器起复合体作用的I型和III型效应器系统相比,II型效应器系统可在替代性情况(诸如真核细胞)中起作用。Π型效应器系统由长的前crRNA(其自含有间隔子的CRISPR基因座转录)、Cas9蛋白和参与前crRNA加工的tracrRNA组成。tracrRNA与分隔前crRNA的间隔子的重复区杂交,因此通过内源性RNA酶III开始dsRNA裂解。该裂解之后是通过Cas9在各间隔子内的第二裂解事件,产生保留与tracrRNA和Cas9缔合的成熟crRNA,从而形成Cas9:crRNA-tracrRNA复合体。
II型效应器系统的一种工程化形式显示在人细胞中作用于基因组工程。在该系统中,通过合成再造的“指导RNA”(“gRNA”,在本文也可互换用作嵌合sgRNA,其是一般避免RNA酶III和crRNA加工的需要的crRNA-tracrRNA融合物)将Cas9蛋白指导至基因组靶位点。
Cas9:crRNA-tracrRNA复合体解开DNA双链体,并搜寻匹配crRNA的序列以裂解。靶标识别在检测靶DNA中的“原型间隔子”序列与crRNA中的其余间隔子序列之间的互补性时发生。如果纠正原型间隔子邻近基序(PAM)也存在于原型间隔子的3’端,则Cas9介导靶DNA的裂解。对于原型间隔子靶向,序列必须紧接原型间隔子邻近基序(PAM),即一种被是DNA裂解所必需的Cas9核酸酶识别的短序列之后。不同的II型系统具有不同的PAM要求。化脓链球菌CRISPR系统可具有作为5’-NRG-3’的这种Cas9(SpCas9)的PAM序列,其中R为A或G,并以该系统在人细胞中的特异性为特征。基于CRISPR/Cas9系统的独特能力是通过共表达单一Cas9蛋白与两个或更多个sgRNA同时靶向多个不同基因座的直接能力。例如,化脓链球菌II型系统天然更喜欢使用“NGG”序列,其中“N”可以是任何核苷酸,但在工程化系统中还可接受其他PAM序列,诸如“NAG”(Hsu等人(2013)自然生物技术,31,827-832)。类似地,来源于脑膜炎奈瑟球菌(Neisseria meningitidis)的Cas9(NmCas9)通常具有NNNNGATT的天然PAM,但具有多种PAM间的活性,包括高度简并的NNNNGNNN PAM(Esvelt等人NatureMethods[自然方法](2013)doi:10.1038/nmeth.2681)。
3.基于CRISPR/Cas9的系统
.本文提供了包含优化gRNA,诸如发夹gRNA(本文也称为“hpgRNA”或“hp-gRNA”)的CRISPR/Cas9系统,这些系统允许改进的DNA靶向用于表观基因组编辑和转录调控,例如特异性裂解感兴趣的靶区,诸如靶基因,或者激活或阻遏靶基因的基因表达。优化gRNA通过调节脱靶位置处的寿命以降低在那些脱靶位点处的活性来提供增加的靶结合特异性,同时具有降低的基于CRISPR/Cas9的系统和基于CRISPR/Cpf1的系统的脱靶结合和脱靶活性。
.优化gRNA可以通过调节这些位置处的Cas9寿命并调节整体入侵动力学而不考虑第二结构域活性来调节Cas9融合蛋白的活性。此外,在原型间隔子靶向区段的5’端与原型间隔子结合的gRNA也可以参与Cas9裂解。减少与脱靶位点的结合将限制在这些脱靶位点处完全入侵/裂解的可能性。II型效应器系统的一种工程化形式显示在人细胞中作用于基因组工程。在该系统中,通过合成再造的“指导RNA”(“gRNA”,在本文也可互换用作嵌合单指导RNA(“sgRNA”))(对于Cas9该指导RNA是一般避免RNA酶III和crRNA加工的需要的crRNA-tracrRNA融合物)将Cas9蛋白指导至基因组靶位点。本文提供了用于基因组编辑和治疗遗传性疾病的基于CRISPR/Cas9的工程化系统。基于CRISPR/Cas9的工程化系统可被设计以靶向任何基因,包括涉及遗传性疾病、老化、组织再生或伤口愈合的基因。基于CRISPR/Cas9的系统可包括Cas9蛋白或Cas9融合蛋白和至少一个优化gRNA,如下文所述。Cas9融合蛋白可包括例如具有不同活性、对Cas9是内源性的结构域,诸如反式激活域。
靶基因可具有突变诸如移码突变或无义突变。如果靶基因具有引起提前终止密码子、异常剪接受体位点或异常剪接供体位点的突变,则基于CRISPR/Cas9的系统可被设计以识别并结合提前终止密码子、异常剪接受体位点或异常剪接供体位点的上游或下游的核苷酸序列。基于CRISPR-Cas9的系统也可用来通过靶向剪接受体和供体破坏正常基因剪接以诱导提前终止密码子跳跃或恢复被破坏的阅读框。基于CRISPR/Cas9的系统可以介导或可以不介导脱靶改变成为基因组的蛋白质编码区。
i.Cas9
基于CRISPR/Cas9的系统可包括Cas9蛋白或Cas9融合蛋白。Cas9蛋白是裂解核酸的内切核酸酶,并且由CRISPR基因座编码并参与II型CRISPR系统。Cas9蛋白可来自任何细菌或古细菌物种,诸如化脓链球菌。可使Cas9蛋白突变,使得核酸酶活性失活。没有内切核酸酶活性的来自化脓链球菌的失活Cas9蛋白(iCas9,也称为“dCas9”)最近通过gRNA靶向细菌、酵母和人细胞中的基因以通过位阻使基因表达沉默。如本文所用,“iCas9”和“dCas9”两者是指具有氨基酸取代D10A和H840A且其核酸酶活性失活的Cas9蛋白。在一些实施例中,可以使用来自脑膜炎奈瑟球菌的失活Cas9蛋白,诸如NmCas9。例如,基于CRISPR/Cas9的系统可包括SEQ ID NO:1的iCas9。
ii.Cas9融合蛋白
.基于CRISPR/Cas9的系统可包括不具有核酸酶活性的Cas9蛋白诸如dCas9和第二结构域的融合蛋白。第二结构域可包括转录激活结构域(诸如VP64结构域或p300结构域)、转录阻遏结构域(诸如KRAB结构域)、核酸酶结构域、转录释放因子结构域、组蛋白修饰结构域、核酸缔合结构域、乙酰化酶结构域、脱乙酰酶结构域、甲基化酶结构域(诸如DNA甲基化酶结构域)、脱甲基化酶结构域、磷酸化结构域、泛素化结构域或苏素化结构域。第二结构域可以是DNA甲基化或染色质成环的修饰因子。
在一些实施例中,融合蛋白可以包含dCas9结构域和转录激活因子。例如,融合蛋白可以包含SEQ ID NO:2的氨基酸序列。在其他实施例中,融合蛋白可以包含dCas9结构域和转录阻遏物。例如,融合蛋白包含SEQ ID NO:3的氨基酸序列。在另外的方面,融合蛋白可以包含dCas9结构域和不同于Cas9核酸酶活性的位点特异性核酸酶。
融合蛋白可以包含两种异源多肽结构域,其中第一多肽结构域包括Cas蛋白并且第二多肽结构域不具有核酸酶活性。如上所述,融合蛋白可以包含与具有核酸酶活性的第二多肽结构域融合的Cas9蛋白或突变的Cas9蛋白。第二多肽结构域可具有不同于Cas9蛋白的核酸酶活性的核酸酶活性。核酸酶或具有核酸酶活性的蛋白质是能够裂解核酸的核苷酸亚单位之间的磷酸二酯键的酶。核酸酶通常进一步分为内切核酸酶和外切核酸酶,但是一些酶可落入两个类别内。众所周知的核酸酶是脱氧核糖核酸酶和核糖核酸酶。
(1)基于CRISPR/Cas9的基因激活系统
基于CRISPR/Cas9的系统可以是基于CRISPR/Cas9的基因激活系统,该系统可以激活调控元件功能并具有对表观基因组编辑的例外特异性。基于CRISPR/Cas9的基因激活系统可用于筛选可以被靶向以增加或减少靶基因表达的增强子、绝缘子、沉默子和基因座控制区。该技术可用于将功能分配给通过基因组研究(诸如ENCODE和表观基因组学路线图计划(Roadmap Epigenomics project))鉴定的推定调控元件。
基于CRISPR/Cas9的基因激活系统可以通过以下方式来激活基因表达:修饰DNA甲基化、染色质成环或在其靶位点催化组蛋白H3赖氨酸27的乙酰化,从而导致从启动子以及近端和远端增强子稳健转录激活靶基因。基于CRISPR/Cas9的基因激活系统具有高度特异性,并且可以使用少至一个指导RNA将其指导至靶基因。基于CRISPR/Cas9的基因激活系统可以通过靶向基因组中远端位置处的增强子来激活一个基因或基因家族的表达。
(a)组蛋白乙酰转移酶(HAT)蛋白
基于CRISPR/Cas9的基因激活系统可包括组蛋白乙酰转移酶蛋白,诸如p300蛋白、CREB结合蛋白(CBP;和p300的类似物)、GCN5或PCAF或其片段。使用可编程的基于CRISPR/Cas9的融合蛋白将调控元件中的组蛋白乙酰化是增加靶基因表达的有效策略。可以靶向基因组中的任何位点的基于CRISPR/Cas9的组蛋白乙酰转移酶能够独特地激活远端调控元件。组蛋白乙酰转移酶蛋白可以包括人p300蛋白或其片段。组蛋白乙酰转移酶蛋白可以包括野生型人p300蛋白或突变型人p300蛋白或其片段。组蛋白乙酰转移酶蛋白可以包括人p300蛋白的核心赖氨酸-乙酰转移酶结构域,即p300HAT核心(也称为“p300核心”)。
(b)CRISPR/dCas9p300核心激活系统
p300蛋白调控整个身体组织中许多基因的活性。p300蛋白在调控细胞生长和分裂中起作用,促使细胞成熟并承担专门功能(分化)并防止癌性肿瘤的生长。p300蛋白可以通过将转录因子与在细胞核中进行转录的蛋白质复合体连接来激活转录。p300蛋白还可起着组蛋白乙酰转移酶的作用,它经由染色质重建调控转录。
dCas9p300核心融合蛋白是一种用于合成操纵靶向内源性基因座处的乙酰化,从而导致对近端和远端增强子调控型基因的调控的有效且易于编程的工具。p300核心乙酰化组蛋白H3上的赖氨酸27(H3K27ac)并可以提供H3K27ac富集。尽管蛋白质表达稳健,但是与全长p300蛋白的直接融合相比,p300的催化核心结构域与dCas9的融合可导致下游基因的反式激活明显更高。dCas9p300核心融合蛋白也可以相对于dCas9VP64展现出增加的反式激活能力,包括在Nm-dCas9骨架的背景下,特别是在远端增强子区处,在该区处dCas9VP64显示出很小(如果有的话)可测量的下游转录活性。另外,dCas9p300核心显示出精确而稳健的全基因组转录特异性。dCas9p300核心可以能够在由表观遗传修饰的增强子靶向的启动子处有效转录激活和共富集乙酰化。
dCas9p300核心可以通过靶向并结合启动子和/或特征化增强子的单链gRNA激活基因表达。该技术还提供了从推定的和已知的调控区合成反式激活远端基因的能力,并且经由应用单一可编程效应器和单一靶位点简化反式激活。这些能力允许多路复用同时靶向多个启动子和/或增强子。p300的哺乳动物来源可通过最小化潜在的免疫原性而为体内应用提供优于病毒来源的效应器结构域的优点。
dCas9p300核心的基因激活对靶基因具有高度特异性。在一些实施例中,p300核心包括SEQ ID NO:2的氨基酸1048-1664(即,SEQ ID NO:4)。在一些实施例中,基于CRISPR/Cas9的基因激活系统包括SEQ ID NO:2的dCas9p300核心融合蛋白或SEQ ID NO:5的Nm-dCas9p300核心融合蛋白。
(2)基于CRISPR/Cas9的基因阻遏系统
基于CRISPR/Cas9的系统可以是基于CRISPR/Cas9的基因阻遏系统,该系统可以抑制调控元件功能并具有对表观基因组编辑的例外特异性。在一些实施例中,基于CRISPR/Cas9的基因阻遏系统(诸如包含dCas9KRAB的基因阻遏系统)可通过靶向遗传基因座的表观遗传状态的高度特异性重建来干扰远端增强子活性。
(a)CRISPR/dCas9KRAB基因阻遏系统
dCas9KRAB阻遏物是一种高度特异性表观基因组编辑工具,可用于功能缺失筛选中以研究基因功能并发现用于药物开发的靶标。dCas9KRAB对靶向特定增强子具有例外特异性,只沉默该增强子的靶基因,并在该位点产生阻遏性异染色质环境。dCas9-KRAB可用于通过沉默近端或远端调控元件和相应的基因靶标来筛选内源性基因组环境内的新颖调控元件。dCas9-KRAB阻遏物的特异性允许其用于对沉默内源性基因的全基因组特异性。在靶基因座处破坏的表观遗传机制,诸如组蛋白甲基化。
KRAB结构域,即天然存在的锌指转录因子中的常见异染色质形成基序,已经与dCas9遗传连锁以产生RNA指导型合成阻遏物dCas9KRAB。Kruppel相关盒(“KRAB”)募集异染色质形成因子:Kap1、HP1、SETDB1、NuRD。它诱导H3K0三甲基化、组蛋白脱乙酰化。基于KRAB的合成阻遏物可以有效地沉默单个基因的表达,并且已被用于阻遏癌基因、抑制病毒复制并治疗显性阴性疾病。
4.基于CRISPR/Cpf1的系统
所披露的优化gRNA可以与来自普雷沃菌属(Prevotella)和弗朗西丝氏菌属(Francisella)1的成簇规律间隔短回文重复序列或(“CRISPR/Cpf1”)系统一起使用。CRISPR/Cpf1系统,即类似于CRISPR/Cas9系统的DNA编辑技术,存在于在普雷沃菌属和弗朗西丝氏菌属细菌中并且防止来自病毒的遗传损伤。Cpf1是含有1,300个氨基酸蛋白质的II类CRISPR/Cas系统的RNA指导型内切核酸酶。Cpf1基因与CRISPR基因座相关联,编码使用指导RNA来发现和裂解病毒DNA的内切核酸酶。Cpf1是比Cas9更小且更简单的内切核酸酶,并且具有更小的sgRNA分子(核苷酸大约是Cas9的一半),因为功能性Cpf1不需要tracrRNA并且仅需要crRNA。可与优化gRNA一起使用的Cpf1的实例包括来自氨基酸球菌属(Acidaminococcus)和毛螺旋菌科(Lachnospiraceae)细菌的Cpf1。
Cpf1基因座编码Cas1、Cas2和Cas4蛋白质,与来自II型系统的相比更类似于I型和III型系统。Cpf1基因座含有混合的α/β结构域、RuvC-I、然后是螺旋区、RuvC-II和锌指状结构域。Cpf1蛋白具有类似于Cas9的RuvC结构域的RuvC样内切核酸酶结构域。Cpf1不具有HNH内切核酸酶结构域,并且Cpf1的N末端不具有Cas9的α螺旋识别叶。Cpf1CRISPR-Cas结构域体系结构显示Cpf1在功能上是独特的,被归类为2类V型CRISPR系统。
该CRISPR/Cpf1系统由Cpf1酶和指导RNA组成,该指导RNA发现双链体上的正确位置并将该复合体定位在该正确位置处以裂解靶DNA。CRISPR/Cpf1系统活性有三个阶段:适应、crRNA的形成和干扰。在适应阶段过程中,Cas1和Cas2蛋白促进DNA的小片段适应到CRISPR阵列中。crRNA阶段的形成涉及加工前cr-RNA,产生成熟crRNA以指导Cas蛋白。在干扰阶段,Cpf1与crRNA结合形成二元复合体以鉴定并裂解靶DNA序列。
Cpf1-crRNA复合体通过鉴定出原型间隔子邻近基序5’-YTN-3’(其中“Y”是嘧啶并且“N”是任何核碱基)或5’-TTN-3’(这与Cas9靶向的富含G的PAM不同)来裂解靶DNA或RNA。与Cas9靶向的PAM位于指导RNA的3’侧不同,Cpf1靶向的PAM位于指导RNA的5’侧。鉴定PAM后,与Cas9的平端切割不同,Cpf1引入4或5个核苷酸突出端的粘端样DNA双链断裂,从而增强NHEJ或HDR过程中的基因插入效率和特异性。TTN PAM位点比GGN PAM位点对人类基因组工程更有用,因为人类基因组富含的T多于富含的G。对于Cpf1,gRNA的原型间隔子靶向区段处于其3’端,而Cas9gRNA处于其5’端。
5.gRNA
基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可包括靶向核酸序列的至少一种gRNA,诸如本文所述的优化gRNA。gRNA提供基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统对靶区或靶基因的特异性靶向。对于基于CRISPR/Cas9的系统,gRNA是两个非编码RNA即crRNA和tracrRNA的融合物。gRNA或sgRNA可通过交换编码20bp原型间隔子的序列(该序列通过与所需DNA靶标的互补碱基配对赋予靶向特异性)而靶向任何所需的DNA序列。gRNA模拟参与II型效应器系统的天然存在的crRNA:tracrRNA双链体。可包括例如42个核苷酸crRNA和75个核苷酸tracrRNA的这种双链体起指导Cas9裂解靶核酸的作用。gRNA可以靶向并结合靶基因的靶区。对于基于CRISPR/Cpf1的系统,gRNA是crRNA。
基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可包括至少一种gRNA,诸如本文所述的优化gRNA,其中gRNA靶向不同的DNA序列。靶DNA序列可以是重叠的。靶序列或原型间隔子后面是在原型间隔子3’端处的PAM序列。不同的II型系统具有不同的PAM要求。例如,化脓链球菌II型系统使用“NGG”序列,其中“N”可以是任何核苷酸。
6.产生优化指导RNA(gRNA)的方法
本披露内容涉及生成优化gRNA,诸如发夹gRNA(本文中也称为“hpgRNA”和“hp-gRNA”)的方法。优化gRNA包含全长gRNA的核苷酸序列和添加到全长gRNA的5’端或3’端的核苷酸。在一些实施例中,全长gRNA可以使用诸如SgRNA designer、CRISPR MultiTargeter或SSFinder的程序来设计。添加到全长gRNA的CRISPR/Cas9系统的5’端或CRISPR/Cpf1系统的3’端的核苷酸可以通过与全长gRNA的原型间隔子靶向序列中的核苷酸杂交或部分杂交至而形成二级结构。二级结构通过破坏gRNA对DNA双链体的入侵来调节DNA结合或裂解。二级结构影响gRNA的入侵动力学,而不是gRNA与互补DNA链的结合能。如以下实例中所述,II型CRISPR-Cas系统的指导RNA通过称为“链入侵”的Cas9促进过程与原型间隔子结合,其中Cas9蛋白本身首先通过直接相互作用结合并解链(melt)原型间隔子邻近基序(PAM),之后gRNA的3’端与PAM邻近核苷酸(“种子”区)碱基配对,然后从gRNA的3’逐个核苷酸地行进至与原型间隔子的碱基配对的5’端。类似的机制用于CRISPR/Cpf1系统。
添加至全长gRNA的5’端或3’端的核苷酸不仅仅是添加来与指导RNA(发夹)的原型间隔子靶向区段杂交以在热力学平衡下阻断对原型间隔子的接近。如实施例中所述,平衡热力学二级结构特性(诸如gRNA二级结构的解链温度)与指导RNA的特异性完全不相关。相反,在裂解的情况下并且在对Cas9结合的后续计算工作中(如通过细胞中的ChIP-Seq测量(参见doi:10.1038/nbt.2916;doi:10.1038/nbt.2889)),这些和估计的链入侵动力学之间与调节到原型间隔子中的链入侵的指导RNA的结构、设计和功能存在显著且实质性的相关性,这些指导RNA必然不同于被设计为在平衡下热力学竞争与靶位点和脱靶位点的结合的发夹。例如,被设计为在平衡下稳定的二级结构元件(例如形成在茎内含有内部rG-rU摆动碱基对的发夹样结构的RNA)可以在链入侵过程中快速失稳(例如,因为在邻近核苷酸入侵原型间隔子时rG-rU摆动碱基对成为茎的末端碱基对),对RNA二级结构产生显著的能量损失,通过完全独立的机制而不仅是通过在热力学平衡下阻断对原型间隔子的接近调节链入侵和结合动力学。在平衡下稳定但在链入侵过程中迅速失稳的二级结构可以使用本文所述的方法设计,该设计方式使得在位点之间具有极小热力学能量差(例如单个内部错配的结果)的情况下区分在靶位点和脱靶位点,而这些位点实际上不能通过顺式阻断或热力学竞争进行区分。对在靶位点的入侵使含有G-U摆动碱基对的发夹失稳,并且这些位点通过入侵动力学来区分。例如,分别与标准或全长指导RNA或截短指导RNA相比,使用计算设计的负责链入侵的二级结构能够使下面实例中描述的VEGFA1位点(靶位点是GGGTGGGGGGAGTTTGCTCC,并且脱靶位点2是GGATGGAGGGAGTTTGCTCC;下划线为错配)的脱靶裂解减小93%和98%。
另外,核苷酸可被添加到全长gRNA的5’端或3’端以破坏“种子”区中gRNA的原型间隔子靶向区段上的“天然存在的”二级结构以增强指导RNA对链入侵的起始。因此,添加通过杂交、部分杂交原型间隔子靶向序列中的核苷酸而形成改变链入侵以调节DNA结合或切裂解的二级结构的这些核苷酸代表了一种不同类别的指导RNA修饰。
优化gRNA被设计以最小化在脱靶位点处的结合并以允许结合原型间隔子序列。在一些实施例中,脱靶位点是已知的或预测的脱靶位点。在一些实施例中,该方法包括:鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;确定靶向感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;确定全长gRNA的至少一个或多个脱靶位点;产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的该多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的该多核苷酸序列的5’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的5’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与将该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;将该第一gRNA在该原型间隔子和/或脱靶位点的估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的估计寿命进行比较;将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);基于满足设计标准的gRNA序列鉴定优化gRNA;并且在体内测试优化gRNA以确定结合特异性。
在一些实施例中,该方法包括:鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;确定靶向感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;确定全长gRNA的至少一个或多个脱靶位点;产生第一gRNA的多核苷酸序列,该第一gRNA包含全长gRNA的多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于全长gRNA的多核苷酸序列的3’端,该第一gRNA任选地包含在全长gRNA的多核苷酸序列的3’端与RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵原型间隔子序列,并且结合与原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且第一gRNA能够入侵脱靶位点并结合与脱靶位点互补的DNA序列并形成脱靶双链体;计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与将该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;将该第一gRNA在该原型间隔子和/或脱靶位点的估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的估计寿命进行比较;将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);基于满足设计标准的gRNA序列鉴定优化gRNA;并且在体内测试优化gRNA以确定结合特异性。
在一些实施例中,不同gRNA的进一步入侵的能量学通过测定以下项中的至少一项的能量学来测定:(I)破坏DNA-DNA碱基配对,(II)形成RNA-DNA碱基对,(III)由破坏或形成未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏与原型间隔子互补的置换DNA链与不参与二级结构的任何不成对指导RNA核苷酸之间的相互作用。在一些实施例中,第一gRNA重新退火至与原型间隔子序列互补的DNA序列的能量学通过测定以下项中的至少一项的能量学来测定:(I)形成DNA-DNA碱基配对,(II)破坏RNA-DNA碱基对,(III)由破坏或形成新近未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏与原型间隔子互补的置换DNA链与不参与二级结构的任何不成对指导RNA核苷酸之间的相互作用。在一些实施例中,该方法进一步包括根据以下项中的至少一项确定能量考虑因素:(V)跨越错配的碱基配对,(VI)与Cas9蛋白的相互作用,和/或(VII)另外的启发法,其中另外的启发法涉及结合寿命、入侵程度、入侵指导RNA的稳定性或gRNA入侵至Cas9裂解活性的其他计算/模拟特性。
基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可使用序列和长度变化的gRNA,诸如本文所述的优化gRNA。在一些实施例中,全长gRNA可包含对应于靶DNA序列(即原型间隔子)的多核苷酸序列的原型间隔子靶向区段。在一些实施例中,原型间隔子靶向区段可具有至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸、至少30个核苷酸或至少35个核苷酸。gRNA可以靶向以下项中的至少一项:启动子区、增强子区、阻遏物区、绝缘子区、沉默子区、涉及与启动子区DNA成环的区、基因剪接区或靶基因的转录区。在一些实施例中,全长gRNA包含具有约15至20个核苷酸的原型间隔子靶向区段。
在一些实施例中,RNA区段包含2至20个核苷酸、3至10个核苷酸或5至8个核苷酸。在一些实施例中,RNA区段包含互补于原型间隔子靶向序列的2至20个核苷酸、3至10个核苷酸或5至8个核苷酸。在一些实施例中,M在1与20之间、1与19之间、1与18之间、1与17之间、1与16之间、1与15之间、1与14之间、1与13之间、1与12之间、1与11之间、1与10之间、1与9之间、1与8之间、1与7之间、1与6之间、1与5之间、2与20之间、2与19之间、2与18、2与17之间、2与16之间、2与15之间、2与14之间、2与13之间、2与12之间、2与11之间、2与10之间、2与9之间、2与8之间、2与7之间、2与6之间、2与5之间、3与20之间、3与19之间、3与18之间、3与17之间、3与16之间、3与15之间、3与14之间、3与13之间、3与12之间、3与11之间、3与10之间、3与9之间、3与8之间、3与7之间、3与6之间、3与5之间、4与20之间、4与19之间、4与18之间、4与17之间、4与16之间、4与15之间、4与14之间、4与13之间、4与12之间、4与11之间、4与10之间、4与9之间、4与8之间、4与7之间、4与6之间、4与5之间、5与20之间、5与19之间、5与18之间、5与17之间、5与16之间、5与15之间、5与14之间、5与13之间、5与12之间、5与11之间、5与10之间、5与9之间、5与8之间、5与7之间、5与6之间、6与20之间、6与19之间、6与18之间、6与17之间、6与16之间、6与15之间、6与14之间、6与13之间、6与12之间、6与11之间、6与10之间、6与9之间、6与8之间、6与7之间、7与20之间、7与19之间、7与18之间、7与17之间、7与16之间、7与15之间、7与14之间、7与13之间、7与12之间、7与11之间、7与10之间、7与9之间、7与8之间、8与20之间、8与19之间、8与18之间、8与17之间、8与16之间、8与14之间、8与13之间、8与13之间、8与12之间、8与11之间、8与10之间、8与9之间、9与20之间、9与19之间、9与18之间、9与17之间、9与16之间、9与15之间、9与14之间、9与13之间、9与12之间、9与11之间、或9与10之间。例如,M可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一些实施例中,RNA区段可以具有1至20个、1至19个、1至18个、1至17个、1至16个、1至15个、1至14个、1至13个、1至12个、1至11个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、2至20个、2至19个、2至18个、2至17个、2至16个、2至15个、2至14个、2至13个、2至12个、2至11个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、3至20个、3至19个、3至18个、3至17个、3至16个、3至15个、3至14个、3至13个、3至12个、3至11个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、4至20个、4至19个、4至18个、4至17个、4至16个、4至15个、4至14个、4至13个、4至12个、4至11个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至19个、5至18个、5至17个、5至16个、5至15个、5至14个、5至13个、5至12个、5至11个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至19个、6至18个、6至17个、6至16个、6至15个、6至14个、6至13个、6至12个、6至11个、6至10个、6至9个、6至8个、6至7个、7至20个、7至19个、7至18个、7至17个、7至16个、7至15个、7至14个、7至13个、7至12个、7至11个、7至10个、7至9个、7至8个、8至20个、8至19个、8至18个、8至17个、8至16个、8至15个、8至14个、8至13个、8至12个、8至11个、8至10个、8至9个、9至20个、9至19个、9至18个、9至17个、9至16个、9至15个、9至14个、9至13个、9至12个、9至11、或9至10个核苷酸,这些核苷酸中的一些或全部互补于原型间隔子靶向序列。在一些实施例中,RNA区段可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。
在一些实施例中,N在1与20之间、1与19之间、1与18之间、1与17之间、1与16之间、1与15之间、1与14之间、1与13之间、1与12之间、1与11之间、1与10之间、1与9之间、1与8之间、1与7之间、1与6之间、1与5之间、2与20之间、2与19之间、2与18、2与17之间、2与16之间、2与15之间、2与14之间、2与13之间、2与12之间、2与11之间、2与10之间、2与9之间、2与8之间、2与7之间、2与6之间、2与5之间、3与20之间、3与19之间、3与18之间、3与17之间、3与16之间、3与15之间、3与14之间、3与13之间、3与12之间、3与11之间、3与10之间、3与9之间、3与8之间、3与7之间、3与6之间、3与5之间、4与20之间、4与19之间、4与18之间、4与17之间、4与16之间、4与15之间、4与14之间、4与13之间、4与12之间、4与11之间、4与10之间、4与9之间、4与8之间、4与7之间、4与6之间、4与5之间、5与20之间、5与19之间、5与18之间、5与17之间、5与16之间、5与15之间、5与14之间、5与13之间、5与12之间、5与11之间、5与10之间、5与9之间、5与8之间、5与7之间、5与6之间、6与20之间、6与19之间、6与18之间、6与17之间、6与16之间、6与15之间、6与14之间、6与13之间、6与12之间、6与11之间、6与10之间、6与9之间、6与8之间、6与7之间、7与20之间、7与19之间、7与18之间、7与17之间、7与16之间、7与15之间、7与14之间、7与13之间、7与12之间、7与11之间、7与10之间、7与9之间、7与8之间、8与20之间、8与19之间、8与18之间、8与17之间、8与16之间、8与14之间、8与13之间、8与13之间、8与12之间、8与11之间、8与10之间、8与9之间、9与20之间、9与19之间、9与18之间、9与17之间、9与16之间、9与15之间、9与14之间、9与13之间、9与12之间、9与11之间、或9与10之间。例如,N可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一些实施例中,接头包含1至20个核苷酸、3至10个核苷酸或5至8个核苷酸。例如,接头可以具有1至20个、1至19个、1至18个、1至17个、1至16个、1至15个、1至14个、1至13个、1至12个、1至11个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、2至20个、2至19个、2至18个、2至17个、2至16个、2至15个、2至14个、2至13个、2至12个、2至11个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、3至20个、3至19个、3至18个、3至17个、3至16个、3至15个、3至14个、3至13个、3至12个、3至11个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、4至20个、4至19个、4至18个、4至17个、4至16个、4至15个、4至14个、4至13个、4至12个、4至11个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至19个、5至18个、5至17个、5至16个、5至15个、5至14个、5至13个、5至12个、5至11个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至19个、6至18个、6至17个、6至16个、6至15个、6至14个、6至13个、6至12个、6至11个、6至10个、6至9个、6至8个、6至7个、7至20个、7至19个、7至18个、7至17个、7至16个、7至15个、7至14个、7至13个、7至12个、7至11个、7至10个、7至9个、7至8个、8至20个、8至19个、8至18个、8至17个、8至16个、8至15个、8至14个、8至13个、8至12个、8至11个、8至10个、8至9个、9至20个、9至19个、9至18个、9至17个、9至16个、9至15个、9至14个、9至13个、9至12个、9至11、或9至10个核苷酸,这些核苷酸中的一些或全部互补于原型间隔子靶向序列。在一些实施例中,接头可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,接头可以包括稳定接头,诸如四核苷酸环(tetraloop)。四核苷酸环的实例包括但不限于ANYA、CUYG、GNRA、UMAC和UNCG。
在一些实施例中,RNA区段和/或原型间隔子靶向序列提供二级结构。在一些实施例中,二级结构通过使原型间隔子靶向序列与RNA区段部分杂交而形成。在一些实施例中,二级结构通过破坏优化gRNA对原型间隔子双链体或脱靶双链体的入侵而调节DNA结合或Cas9裂解。在一些实施例中,二级结构使gRNA的5’端稳定保持在蛋白质内并将优化gRNA保护在Cas9内以防止降解。
在一些实施例中,二级结构通过以下方式形成:使RNA区段的全部或部分与原型间隔子靶向序列或区段的5’端中核苷酸、在原型间隔子靶向序列或区段的中间的核苷酸,和/或在原型间隔子靶向序列或区段的3’端的核苷酸杂交。在一些实施例中,RNA区段的连续区段与原型间隔子靶向序列或区段杂交。在一些实施例中,RNA区段的非连续区段与原型间隔子靶向序列或区段杂交。在一些实施例中,二级结构是发夹。
在一些实施例中,二级结构在室温或37℃下是稳定的。在一些实施例中,二级结构的总平衡自由能在约4℃与约50℃之间的温度诸如室温或37℃下小于约2kcal/mol。例如,二级结构的总平衡自由能可以在以下温度下小于约10kcal/mol、小于约5kcal/mol、小于约4kcal/mol、小于约3kcal/mol、小于约2kcal/mol、小于约1kcal/mol、或小于约0.5kcal/mol:在约4℃与约50℃之间、约4℃与约40℃之间、约4℃与约37℃之间、约4℃与约30℃之间、约4℃与约25℃之间、约4℃与约20℃之间、约4℃与约10℃之间、约5℃与约50℃之间、约5℃与约40℃之间、约5℃与约37℃之间、约5℃与约30℃之间、约5℃与约25℃之间、约5℃与约20℃之间、约5℃与约10℃之间、约10℃与约50℃之间、约10℃与约40℃之间、约10℃与约37℃之间、约10℃与约30℃之间、约10℃与约25℃之间、约10℃与约20℃之间、约20℃与约50℃之间、约20℃与约40℃之间、约20℃与约37℃之间、约20℃与约30℃之间、约25℃与约50℃之间、约25℃与约40℃之间、约25℃与约37℃之间、或约25℃与约30℃之间。在一些实施例中,RNA区段与原型间隔子靶向序列或区段的至少两个核苷酸杂交或形成非规范碱基对。在一些实施例中,非规范碱基对是rU-rG。
在一些实施例中,1至20个核苷酸被随机化在接头中。例如,1至20个、1至15个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、1至4个、1至3个、1至2个、2至20个、2至15个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、2至4个、3至20个、3至15个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、3至4个、4至20个、4至15个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至15个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至15个、6至10个、6至9个、6至8个、6至7个、7至20个、7至15个、7至10个、7至9个、7至8个、8至20个、8至15个、8至10个、8至9个、9至20个、9至15、或9至10个、10至20个、10至15、或15至20个核苷酸可以随机化在接头中。
在一些实施例中,1至20个核苷酸被随机化在RNA区段中。例如,1至20个、1至15个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、1至4个、1至3个、1至2个、2至20个、2至15个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、2至4个、3至20个、3至15个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、3至4个、4至20个、4至15个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至15个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至15个、6至10个、6至9个、6至8个、6至7个、7至20个、7至15个、7至10个、7至9个、7至8个、8至20个、8至15个、8至10个、8至9个、9至20个、9至15、或9至10个、10至20个、10至15、或15至20个核苷酸可以随机化在RNA区段中。
在一些实施例中,将步骤(g)重复X次,从而产生X数目的gRNA,并对每个X数目的gRNA重复步骤(e),其中X在0至20之间。在一些实施例中,X可以在1与20之间、1与19之间、1与18之间、1与17之间、1与16之间、1与15之间、1与14之间、1与13之间、1与12之间、1与11之间、1与10之间、1与9之间、1与8之间、1与7之间、1与6之间、1与5之间、2与20之间、2与19之间、2与18、2与17之间、2与16之间、2与15之间、2与14之间、2与13之间、2与12之间、2与11之间、2与10之间、2与9之间、2与8之间、2与7之间、2与6之间、2与5之间、3与20之间、3与19之间、3与18之间、3与17之间、3与16之间、3与15之间、3与14之间、3与13之间、3与12之间、3与11之间、3与10之间、3与9之间、3与8之间、3与7之间、3与6之间、3与5之间、4与20之间、4与19之间、4与18之间、4与17之间、4与16之间、4与15之间、4与14之间、4与13之间、4与12之间、4与11之间、4与10之间、4与9之间、4与8之间、4与7之间、4与6之间、4与5之间、5与20之间、5与19之间、5与18之间、5与17之间、5与16之间、5与15之间、5与14之间、5与13之间、5与12之间、5与11之间、5与10之间、5与9之间、5与8之间、5与7之间、5与6之间、6与20之间、6与19之间、6与18之间、6与17之间、6与16之间、6与15之间、6与14之间、6与13之间、6与12之间、6与11之间、6与10之间、6与9之间、6与8之间、6与7之间、7与20之间、7与19之间、7与18之间、7与17之间、7与16之间、7与15之间、7与14之间、7与13之间、7与12之间、7与11之间、7与10之间、7与9之间、7与8之间、8与20之间、8与19之间、8与18之间、8与17之间、8与16之间、8与14之间、8与13之间、8与13之间、8与12之间、8与11之间、8与10之间、8与9之间、9与20之间、9与19之间、9与18之间、9与17之间、9与16之间、9与15之间、9与14之间、9与13之间、9与12之间、9与11之间、或9与10之间。例如,X可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
在一些实施例中,入侵动力学和寿命使用动力学蒙特卡罗法(kinetic MonteCarlo method)或吉莱斯皮算法(Gillespie algorithm)计算。在一些实施例中,侵入动力学和寿命可以使用本领域技术人员已知的“确定性”方法,诸如对链入侵建模的微分方程测定。动力学蒙特卡罗(KMC)法是旨在模拟自然发生的某些过程的时间演变的蒙特卡罗法计算机模拟。这些过程通常是在已知各状态之间的转换速率下发生的过程。这些已知的转换速率是KMC算法的输入值。吉莱斯皮算法(也称为杜布-吉莱斯皮算法(Doob-Gillespiealgorithm))生成随机方程的统计正确的轨迹(可能的解)。吉莱斯皮算法可用于模拟日益复杂的系统。该算法特别可用于模拟细胞内的反应,其中反应物的数目通常是数十个分子(或更少)。在数学上,它是一种动态蒙特卡洛方法,并且与动力学蒙特卡罗法类似。吉莱斯皮算法允许用少量反应物对系统进行离散和随机模拟,因为每个反应都被明确模拟。对应于单一Gillespie模拟的轨迹表示来自概率质量函数的精确样本,其是主方程的解。
在一些实施例中,设计标准可以是特异性、结合寿命调节和/或估计的裂解特异性。例如,优化gRNA可以被设计成具有大于或等于完全gRNA于在靶位点处的结合寿命的结合寿命,和/或小于或等于全长gRNA在脱靶位点处的结合寿命的结合寿命。在一些实施例中,优化gRNA被选择为具有小于或等于全长gRNA对至少三个脱靶位点的结合寿命的结合寿命,其中脱靶位点被预测为最靠近的脱靶位点或被预测为与在靶位点具有最高同一性。在一些实施例中,设计标准包括在脱靶位点处的寿命或裂解率小于或等于全长gRNA或截短gRNA在脱靶位点处的寿命或裂解率和/或预测在靶活性率大于全长gRNA或截短gRNA的预测在靶活性率的10%。
在一些实施例中,在步骤i)中使用错配敏感性核酸酶对优化gRNA进行测试以确定CRISPR活性,诸如使用surveyor测定或T7内切核酸酶I(T7E1)测定,或下一代测序技术,诸如Illumina MiSeq或GUIDE-Seq。在一些实施例中,在步骤i)中使用报告子测定对优化gRNA进行测试,其中Cas9-融合蛋白活性改变报告蛋白诸如GFP的表达。GUIDE-Seq是设计用于测定脱靶裂解的测定。
在一些实施例中,可以使用程序,诸如CRISPR设计(Ran等人Nature Protocols[自然实验手册](2013)8:2281-2308)和CCTop(Stemmer,PLoS One[公共科学图书馆综合](2015)10:e0124633)工具基于与PAM序列邻近的序列确定靶区。在一些实施例中,靶位点可以包括启动子、DNA酶I高敏位点、转座酶可接近性染色质位点、DNA甲基化位点、转录因子结合位点、表观遗传标记、表达数量性状基因座和/或遗传相关性研究中与人类性状或表型相关的区。可通过以下方式确定靶位点:DNA酶测序(DNase-seq)、具有高通量测序的转座酶可接近性染色质测定(ATAC-seq)、ChIP测序、自转录活性调控区测序(STARR-Seq)、单分子实时测序(SMRT)、调控元件测序的甲醛辅助分离(FAIRE-seq)、微球菌核酸酶测序(MNase-seq)、简化代表性亚硫酸氢盐测序(RRBS-seq)、全基因组亚硫酸氢盐测序、甲基结合DNA免疫沉淀(MEDIP-seq)或遗传相关性研究。在一些实施例中,可以使用以下项确定脱靶位点:CasOT(PKU斑马鱼功能基因组学组(PKU Zebrafish Functional Genomics group),北京大学)、CHOPCHOP(哈佛大学)、CRISPR设计(麻省理工学院)、CRISPR设计工具(哈佛大学-麻省理工学院博德研究所(The Broad Institute of Harvard and MIT))、CRISPR/Cas9gRNAfinder(科罗拉多大学)、CRISPRfinder(巴黎南大学(UniversitéParis-Sud))、E-CRISP(DKFZ德国癌症研究中心)、CRISPR gRNA设计工具(DNA 2.0)、PROGNOS(埃默里大学/佐治亚理工学院)、ZiFiT(麻省总医院)。国际专利申请号WO 2016109255中描述了可用于确定靶区和脱靶位点的工具的实例,该专利申请通过援引以其全文并入本文。
7.靶基因
如本文所披露的,基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可以被设计为靶向和裂解任何靶基因。例如,gRNA,诸如本文所述的优化gRNA,可以靶向并结合靶基因中的靶区。靶基因可以是细胞系中的内源性基因、转基因或病毒基因。在一些实施例中,靶基因可以是已知基因。在一些实施例中,靶基因是未知基因。gRNA可以靶向任何核酸序列。核酸序列靶标可以是DNA。DNA可以是任何基因。例如,gRNA可以靶向诸如DMD、EMX1或VEGFA等的基因。
在一些方面中,靶基因是疾病相关基因。在一些实施例中,靶细胞是哺乳动物细胞。在一些实施例中,基因组包括人类基因组。在一些实施例中,靶基因可以是原核基因或真核基因,诸如哺乳动物基因。例如,基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可以靶向哺乳动物基因,诸如DMD(肌营养不良蛋白基因)、EMX1、VEGFA、IL1RN、MYOD1、OCT4、HBE、HBG、HBD、HBB、MYOCD(心肌蛋白)、PAX7(配对框蛋白Pax-7)、FGF1(成纤维细胞生长因子-1)基因,诸如FGF1A、FGF1B和FGF1C。其他靶基因包括但不限于Atf3、Axud1、Btg2、c-Fos、c-Jun、Cxcl1、Cxcl2、Edn1、Ereg、Fos、Gadd45b、Ier2、Ier3、Ifrd1、Il1b、Il6、Irf1、Junb、Lif、Nfkbia、Nfkbiz、Ptgs2、Slc25a25、Sqstm1、Tieg、Tnf、Tnfaip3、Zfp36、Birc2、Ccl2、Ccl20、Ccl7、Cebpd、Ch25h、CSF1、Cx3cl1、Cxcl10、Cxcl5、Gch、Icam1、Ifi47、Ifngr2、Mmp10、Nfkbie、Npal1、p21、Relb、Ripk2、Rnd1、S1pr3、Stx11、Tgtp、Tlr2、Tmem140、Tnfaip2、Tnfrsf6、Vcam1、1110004C05Rik(GenBank登录号BC010291)、Abca1、AI561871(GenBank登录号BI143915)、AI882074(GenBank登录号BB730912)、Arts1、AW049765(GenBank登录号BC026642.1)、C3、Casp4、Ccl5、Ccl9、Cdsn、Enpp2、Gbp2、H2-D1、H2-K、H2-L、Ifit1、Ii、Il13ra1、Il1rl1、Lcn2、Lhfpl2、LOC677168(GenBank登录号AK019325)、Mmp13、Mmp3、Mt2、Naf1、Ppicap、Prnd、Psmb10、Saa3、Serpina3g、Serpinf1、Sod3、Stat1、Tapbp、U90926(GenBank登录号NM_020562)、Ubd、A2AR(腺苷A2A受体)、B7-H3(也称为CD276)、B7-H4(也称为VTCN1)、BTLA(B和T淋巴细胞弱化子;也称为CD272)、CTLA-4(细胞毒性T淋巴细胞相关蛋白4;也称为CD152)、IDO(吲哚胺2,3双加氧酶)、KIR(杀伤细胞免疫球蛋白样受体)、LAG3(淋巴细胞活化基因-3)、PD-1(程序性死亡1(PD-1)受体)、TIM-3(T细胞免疫球蛋白结构域和粘蛋白结构域3)和VISTA(T细胞活化的V结构域Ig抑制因子。在一些实施例中,靶基因是DMD(肌营养不良蛋白)、EMX1或VEGFA基因。
8.用于基因组编辑的组合物
本发明涉及用于基因组编辑、基因组改变或改变靶基因的基因表达的组合物。组合物包含通过披露的方法产生的优化gRNA以及基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。在一些实施例中,gRNA可以在位点之间具有极小热力学能量差的情况下区分在靶位点和脱靶位点,并提供增加的特异性。在一些实施例中,优化gRNA调节到原型间隔子中的链侵入。
特异性的增加是通过以下方式实现:向全长或标准gRNA的5’端或3’端添加延伸区,使得它形成“发夹”结构,该结构与全长或标准gRNA的靶向原型间隔子的区段(例如原型靶向序列)自身互补。参见图1B和图2B。发夹充当对原型间隔子链入侵的动力学屏障,但发夹在整个靶位点的链入侵过程中是移位的,因此可发生完全侵入。
如图2D所示,通过dCas9与完全原型间隔子的结合优先发生,这强有力地表明发夹在入侵过程中实际上是移位的。所披露的为发夹结构的优化gRNA被设计成通过在靶标与指导RNA的PAM远端靶向区之间存在错配时抑制入侵而增加与靶向位点结合的特异性。在这些情况下,它在能量学上更有利于发夹保持闭合,并且发夹的存在很可能促进Cas9/dCas9从这些位点解链和脱离。
与标准指导RNA和最佳指导RNA变体(参见实施例)相比,具有5’-发夹或3’-发夹的优化gRNA(hpgRNA)在结合特异性方面显著增强,并且消除或显著减弱含有错配的原型间隔子位点处的结合。增加发夹长度增加了dCas9结合的特异性。优化的gRNA和hpgRNA可用于调整Cas9/dCas9或Cpf1结合亲和力和特异性。基于发夹的大小和结构,hpgRNA的发夹可以容纳在Cas9/dCas9分子的DNA结合通道内并且保护其免于降解。在一些实施例中,可以改变发夹长度、环长度和环组成以允许更精细地控制这些特性。在一些实施例中,发夹长度可以是约1至约20个核苷酸,或约3至约10个核苷酸。例如,发夹长度可以为1至20个、1至19个、1至18个、1至17个、1至16个、1至15个、1至14个、1至13个、1至12个、1至11个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、2至20个、2至19个、2至18个、2至17个、2至16个、2至15个、2至14个、2至13个、2至12个、2至11个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、3至20个、3至19个、3至18个、3至17个、3至16个、3至15个、3至14个、3至13个、3至12个、3至11个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、4至20个、4至19个、4至18个、4至17个、4至16个、4至15个、4至14个、4至13个、4至12个、4至11个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至19个、5至18个、5至17个、5至16个、5至15个、5至14个、5至13个、5至12个、5至11个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至19个、6至18个、6至17个、6至16个、6至15个、6至14个、6至13个、6至12个、6至11个、6至10个、6至9个、6至8个、6至7个、7至20个、7至19个、7至18个、7至17个、7至16个、7至15个、7至14个、7至13个、7至12个、7至11个、7至10个、7至9个、7至8个、8至20个、8至19个、8至18个、8至17个、8至16个、8至15个、8至14个、8至13个、8至12个、8至11个、8至10个、8至9个、9至20个、9至19个、9至18个、9至17个、9至16个、9至15个、9至14个、9至13个、9至12个、9至11、或9至10个。例如,发夹长度可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个、或约5至约8个核苷酸。
在一些实施例中,环长度可以是约1至约20个核苷酸、约3至约10个核苷酸、或约5至约8个核苷酸。例如,环长度可以为1至20个、1至19个、1至18个、1至17个、1至16个、1至15个、1至14个、1至13个、1至12个、1至11个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、2至20个、2至19个、2至18个、2至17个、2至16个、2至15个、2至14个、2至13个、2至12个、2至11个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、3至20个、3至19个、3至18个、3至17个、3至16个、3至15个、3至14个、3至13个、3至12个、3至11个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、4至20个、4至19个、4至18个、4至17个、4至16个、4至15个、4至14个、4至13个、4至12个、4至11个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至19个、5至18个、5至17个、5至16个、5至15个、5至14个、5至13个、5至12个、5至11个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至19个、6至18个、6至17个、6至16个、6至15个、6至14个、6至13个、6至12个、6至11个、6至10个、6至9个、6至8个、6至7个、7至20个、7至19个、7至18个、7至17个、7至16个、7至15个、7至14个、7至13个、7至12个、7至11个、7至10个、7至9个、7至8个、8至20个、8至19个、8至18个、8至17个、8至16个、8至15个、8至14个、8至13个、8至12个、8至11个、8至10个、8至9个、9至20个、9至19个、9至18个、9至17个、9至16个、9至15个、9至14个、9至13个、9至12个、9至11、或9至10个。在一些实施例中,环长度可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个、或约5至约8个核苷酸。
在一些实施例中,环组成可以是约1至约20个核苷酸、约3至约10个核苷酸、或约5至约8个核苷酸。例如,环组成可以为1至20个、1至19个、1至18个、1至17个、1至16个、1至15个、1至14个、1至13个、1至12个、1至11个、1至10个、1至9个、1至8个、1至7个、1至6个、1至5个、2至20个、2至19个、2至18个、2至17个、2至16个、2至15个、2至14个、2至13个、2至12个、2至11个、2至10个、2至9个、2至8个、2至7个、2至6个、2至5个、3至20个、3至19个、3至18个、3至17个、3至16个、3至15个、3至14个、3至13个、3至12个、3至11个、3至10个、3至9个、3至8个、3至7个、3至6个、3至5个、4至20个、4至19个、4至18个、4至17个、4至16个、4至15个、4至14个、4至13个、4至12个、4至11个、4至10个、4至9个、4至8个、4至7个、4至6个、4至5个、5至20个、5至19个、5至18个、5至17个、5至16个、5至15个、5至14个、5至13个、5至12个、5至11个、5至10个、5至9个、5至8个、5至7个、5至6个、6至20个、6至19个、6至18个、6至17个、6至16个、6至15个、6至14个、6至13个、6至12个、6至11个、6至10个、6至9个、6至8个、6至7个、7至20个、7至19个、7至18个、7至17个、7至16个、7至15个、7至14个、7至13个、7至12个、7至11个、7至10个、7至9个、7至8个、8至20个、8至19个、8至18个、8至17个、8至16个、8至15个、8至14个、8至13个、8至12个、8至11个、8至10个、8至9个、9至20个、9至19个、9至18个、9至17个、9至16个、9至15个、9至14个、9至13个、9至12个、9至11、或9至10个。在一些实施例中,环组成可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个、或约5至约8个核苷酸。
组合物可以包括病毒载体和具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。在一些实施例中,组合物包含修饰的AAV载体和编码具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统的核苷酸序列。组合物可以进一步包含供体DNA或转基因。这些组合物可用于基因组编辑、基因组工程以及纠正或减小遗传疾病中涉及的基因突变的影响。
靶基因可参与细胞的分化或其中可能需要激活、阻遏或破坏基因的任何其他过程,或可具有突变诸如缺失、移码突变或无义突变。如果靶基因具有引起提前终止密码子、异常剪接受体位点或异常剪接供体位点的突变,则具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可被设计以识别并结合提前终止密码子、异常剪接受体位点或异常剪接供体位点的上游或下游的核苷酸序列。具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统也可用来通过靶向剪接受体和供体破坏正常基因剪接以诱导提前终止密码子跳跃或恢复被破坏的阅读框。具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可以或可以不介导针对基因组的蛋白质编码区的脱靶改变。
在一些实施例中,与基因表达的对照水平相比,基于CRISPR/Cas9的系统将靶基因的基因表达诱导或阻遏至少约1倍、至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、至少约110倍、至少120倍、至少130倍、至少140倍、至少150倍、至少160倍、至少170倍、至少180倍、至少190倍、至少200倍、至少约300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少1500倍、至少2000倍、至少2500倍、至少3000倍、至少3500倍、至少4000倍、至少4500倍、至少5000倍、至少600倍、至少7000倍、至少8000倍、至少9000倍、至少10000倍、至少100000倍。靶基因的基因表达的对照水平可以是未用任何基于CRISPR/Cas9的系统处理的细胞中靶基因的基因表达水平。
a.修饰的慢病毒载体
用于基因组编辑、基因组改变或改变靶基因的基因表达的组合物可以包含修饰的慢病毒载体。修饰的慢病毒载体包括编码DNA靶向系统的第一多核苷酸序列和编码至少一个sgRNA的第二多核苷酸序列。第一多核苷酸序列可以可操作地连接至启动子。启动子可以是组成型启动子、诱导型启动子、阻抑型启动子或调控型启动子。
第二多核苷酸序列编码至少1种gRNA,诸如本文所述的优化gRNA。例如,第二多核苷酸序列可以编码至少1种gRNA、至少2种gRNA、至少3种gRNA、至少4种gRNA、至少5种gRNA、至少6种gRNA、至少7种gRNA、至少8种gRNA、至少9种gRNA、至少10种gRNA、至少11种gRNA、至少12种gRNA、至少13种gRNA、至少14种gRNA、至少15种gRNA、至少16种gRNA、至少17种gRNA、至少18种gRNA、至少19种gRNA、至少20种gRNA、至少25种gRNA、至少30种gRNA、至少35种gRNA、至少40种gRNA、至少45种gRNA或至少50种gRNA。第二多核苷酸序列可以编码1种gRNA至50种gRNA、1gRNA至45种gRNA、1gRNA至40种gRNA、1gRNA至35种gRNA、1gRNA至30种gRNA、1gRNA至25种不同的gRNA、1gRNA至20种gRNA、1gRNA至16种gRNA、1gRNA至8种不同的gRNA、4种不同的gRNA至50种不同的gRNA、4种不同的gRNA至45种不同的gRNA、4种不同的gRNA至40种不同的gRNA、4种不同的gRNA至35种不同的gRNA、4种不同的gRNA至30种不同的gRNA、4种不同的gRNA至25种不同的gRNA、4种不同的gRNA至20种不同的gRNA、4种不同的gRNA至16种不同的gRNA、4种不同的gRNA至8种不同的gRNA、8种不同的gRNA至50种不同的gRNA、8种不同的gRNA至45种不同的gRNA、8种不同的gRNA至40种不同的gRNA、8种不同的gRNA至35种不同的gRNA、8种不同的gRNA至30种不同的gRNA、8种不同的gRNA至25种不同的gRNA、8种不同的gRNA至20种不同的gRNA、8种不同的gRNA至16种不同的gRNA、16种不同的gRNA至50种不同的gRNA、16种不同的gRNA至45种不同的gRNA、16种不同的gRNA至40种不同的gRNA、16种不同的gRNA至35种不同的gRNA、16种不同的gRNA至30种不同的gRNA、16种不同的gRNA至25种不同的gRNA、16种不同的gRNA至20种不同的gRNA。编码不同gRNA的每种多核苷酸序列可以可操作地连接至启动子。可操作地连接至不同gRNA的启动子可以是相同的启动子。可操作地连接至不同gRNA的启动子可以是不同的启动子。启动子可以是组成型启动子、诱导型启动子、阻抑型启动子或调控型启动子。至少一种gRNA可以与靶基因或基因座结合。如果包含多于一种gRNA,则每种gRNA结合一个靶基因座内的不同靶区,或者每种gRNA结合不同基因座内的不同靶区。
b.腺相关病毒载体
AAV可被用于使用各种构建体构型将组合物递送至细胞。例如,AAV可以在分开的载体上递送基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和gRNA表达盒。可替代地,如果使用来源于诸如金黄色葡萄球菌或脑膜炎奈瑟球菌等物种的小Cas9蛋白质,则Cas9和最多两种gRNA的表达盒可以组合在4.7kb包装限制内的单一AAV载体中。
如上所述,组合物包含修饰的腺相关病毒(AAV)载体。修饰的AAV载体可以能够将基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统递送在哺乳动物的细胞中并且使该系统在该细胞中表达。例如,修饰的AAV载体可以是AAV-SASTG载体(Piacentino等人(2012)Human Gene Therapy[人类基因治疗]23:635-646)。修饰的AAV载体可以基于若干种衣壳类型中的一种或多种,这些衣壳类型包括AAV1、AAV2、AAV5、AAV6、AAV8和AAV9。修饰的AAV载体可以基于具有替代性肌肉向性AAV衣壳的AAV2假型,诸如AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5和AAV/SASTG载体,这些载体通过全身性和局部递送高效转导骨骼肌或心肌(Seto等人当今基因治疗(2012)12:139-151)。
9.靶细胞
如本文所披露的,gRNA,诸如本文所述的优化gRNA,可以用任何类型的细胞与CRISPR/Cas9系统一起使用。在一些实施例中,细胞是细菌细胞、真菌细胞、古细菌细胞、植物细胞或动物细胞,诸如哺乳动物细胞。在一些实施例中,这可以是器官或动物生物体。在一些实施例中,细胞可以任何细胞类型或细胞系,包括但不限于293-T细胞、3T3细胞、721细胞、9L细胞、A2780细胞、A2780ADR细胞、A2780cis细胞、A172细胞、A20细胞、A253细胞、A431细胞、A-549细胞、ALC细胞、B16细胞、B35细胞、BCP-1细胞、BEAS-2B细胞、bEnd.3细胞、BHK-21细胞、BR 293细胞、BxPC3细胞、C2C12细胞、C3H-10T1/2细胞、C6/36细胞、Cal-27细胞、CHO细胞、COR-L23细胞、COR-L23/CPR细胞、COR-L23/5010细胞、COR-L23/R23细胞、COS-7细胞、COV-434细胞、CML T1细胞、CMT细胞、CT26细胞、D17细胞、DH82细胞、DU145细胞、DuCaP细胞、EL4细胞、EM2细胞、EM3细胞、EMT6/AR1细胞、EMT6/AR10.0细胞、FM3细胞、H1299细胞、H69细胞、HB54细胞、HB55细胞、HCA2细胞、HEK-293细胞、HeLa细胞、Hepa1c1c7细胞、HL-60细胞、HMEC细胞、HT-29细胞、Jurkat细胞、J558L细胞、JY细胞、K562细胞、Ku812细胞、KCL22细胞、KG1细胞、KYO1细胞、LNCap细胞、Ma-MeI 1,2,3...48细胞、MC-38细胞、MCF-7细胞、MCF-10A细胞、MDA-MB-231细胞、MDA-MB-468细胞、MDA-MB-435细胞、MDCK II细胞、MDCK II细胞、MG63细胞、MOR/0.2R细胞、MONO-MAC 6细胞、MRC5细胞、MTD-1A细胞、MyEnd细胞、NCI-H69/CPR细胞、NCI-H69/LX10细胞、NCI-H69/LX20细胞、NCI-H69/LX4细胞、NIH-3T3细胞、NALM-1细胞、NW-145细胞、OPCN/OPCT细胞、Peer细胞、PNT-1A/PNT 2细胞、Raji细胞、RBL细胞、RenCa细胞、RIN-5F细胞、RMA/RMAS细胞、Saos-2细胞、Sf-9细胞、SiHa细胞、SkBr3细胞、T2细胞、T-47D细胞、T84细胞、THP1细胞、U373细胞、U87细胞、U937细胞、VCaP细胞、Vero细胞、WM39细胞、WT-49细胞、X63细胞、YAC-1细胞、YAR细胞、GM12878、K562、H1人胚胎干细胞、HeLa-S3、HepG2、HUVEC、SK-N-SH、IMR90、A549、MCF7、HMEC或LHCM、CD14+、CD20+、原发性心脏或肝细胞、分化的H1细胞、8988T、Adult_CD4_naive、Adult_CD4_Th0、Adult_CD4_Th1、AG04449、AG04450、AG09309、AG09319、AG10803、AoAF、AoSMC、BC_Adipose_UHN00001、BC_Adrenal_Gland_H12803N、BC_Bladder_01-11002、BC_Brain_H11058N、BC_Breast_02-03015、BC_Colon_01-11002、BC_Colon_H12817N、BC_Esophagus_01-11002、BC_Esophagus_H12817N、BC_Jejunum_H12817N、BC_Kidney_01-11002、BC_Kidney_H12817N、BC_Left_Ventricle_N41、BC_Leukocyte_UHN00204、BC_Liver_01-11002、BC_Lung_01-11002、BC_Lung_H12817N、BC_Pancreas_H12817N、BC_Penis_H12817N、BC_Pericardium_H12529N、BC_Placenta_UHN00189、BC_Prostate_Gland_H12817N、BC_Rectum_N29、BC_Skeletal_Muscle_01-11002、BC_Skeletal_Muscle_H12817N、BC_Skin_01-11002、BC_Small_Intestine_01-11002、BC_Spleen_H12817N、BC_Stomach_01-11002、BC_Stomach_H12817N、BC_Testis_N30、BC_Uterus_BN0765、BE2_C、BG02ES、BG02ES-EBD、BJ、bone_marrow_HS27a、bone_marrow_HS5、bone_marrow_MSC、Breast_OC、Caco-2、CD20+_RO01778、CD20+_RO01794、CD34+_Mobilized、CD4+_Naive_Wb11970640、CD4+_Naive_Wb78495824、Cerebellum_OC、Cerebrum_frontal_OC、Chorion、CLL、CMK、Colo829、Colon_BC、Colon_OC、Cord_CD4_naive、Cord_CD4_Th0、Cord_CD4_Th1、Decidua、Dnd41、ECC-1、Endometrium_OC、Esophagus_BC、Fibrobl、Fibrobl_GM03348、FibroP、FibroP_AG08395、FibroP_AG08396、FibroP_AG20443、Frontal_cortex_OC、GC_B_cell、Gliobla、GM04503、GM04504、GM06990、GM08714、GM10248、GM10266、GM10847、GM12801、GM12812、GM12813、GM12864、GM12865、GM12866、GM12867、GM12868、GM12869、GM12870、GM12871、GM12872、GM12873、GM12874、GM12875、GM12878-XiMat、GM12891、GM12892、GM13976、GM13977、GM15510、GM18505、GM18507、GM18526、GM18951、GM19099、GM19193、GM19238、GM19239、GM19240、GM20000、H0287、H1-neurons、H7-hESC、H9ES、H9ES-AFP-、H9ES-AFP+、H9ES-CM、H9ES-E、H9ES-EB、H9ES-EBD、HAc、HAEpiC、HA-h、HAL、HAoAF、HAoAF_6090101.11、HAoAF_6111301.9、HAoEC、HAoEC_7071706.1、HAoEC_8061102.1、HA-sp、HBMEC、HBVP、HBVSMC、HCF、HCFaa、HCH、HCH_0011308.2P、HCH_8100808.2、HCM、HConF、HCPEpiC、HCT-116、Heart_OC、Heart_STL003、HEEpiC、HEK293、HEK293T、HEK293-T-REx、Hepatocytes、HFDPC、HFDPC_0100503.2、HFDPC_0102703.3、HFF、HFF-Myc、HFL11W、HFL24W、HGF、HHSEC、HIPEpiC、HL-60、HMEpC、HMEpC_6022801.3、HMF、hMNC-CB、hMNC-CB_8072802.6、hMNC-CB_9111701.6、hMNC-PB、hMNC-PB_0022330.9、hMNC-PB_0082430.9、hMSC-AT、hMSC-AT_0102604.12、hMSC-AT_9061601.12、hMSC-BM、hMSC-BM_0050602.11、hMSC-BM_0051105.11、hMSC-UC、hMSC-UC_0052501.7、hMSC-UC_0081101.7、HMVEC-dAd、HMVEC-dBl-Ad、HMVEC-dBl-Neo、HMVEC-dLy-Ad、HMVEC-dLy-Neo、HMVEC-dNeo、HMVEC-LBl、HMVEC-LLy、HNPCEpiC、HOB、HOB_0090202.1、HOB_0091301、HPAEC、HPAEpiC、HPAF、HPC-PL、HPC-PL_0032601.13、HPC-PL_0101504.13、HPDE6-E6E7、HPdLF、HPF、HPIEpC、HPIEpC_9012801.2、HPIEpC_9041503.2、HRCEpiC、HRE、HRGEC、HRPEpiC、HSaVEC、HSaVEC_0022202.16、HSaVEC_9100101.15、HSMM、HSMM_emb、HSMM_FSHD、HSMMtube、HSMMtube_emb、HSMMtube_FSHD、HT-1080、HTR8svn、Huh-7、Huh-7.5、HVMF、HVMF_6091203.3、HVMF_6100401.3、HWP、HWP_0092205、HWP_8120201.5、iPS、iPS_CWRU1、iPS_hFib2_iPS4、iPS_hFib2_iPS5、iPS_NIHi11、iPS_NIHi7、Ishikawa、Jurkat、Kidney_BC、Kidney_OC、LHCN-M2、LHSR、Liver_OC、Liver_STL004、Liver_STL011、LNCaP、Loucy、Lung_BC、Lung_OC、Lymphoblastoid_cell_line、M059J、MCF10A-Er-Src、MCF-7、MDA-MB-231、Medullo、Medullo_D341、Mel_2183、Melano、Monocytes-CD14+、Monocytes-CD14+_RO01746、Monocytes-CD14+_RO01826、MRT_A204、MRT_G401、MRT_TTC549、Myometr、Naive_B_cell、NB4、NH-A、NHBE、NHBE_RA、NHDF、NHDF_0060801.3、NHDF_7071701.2、NHDF-Ad、NHDF-neo、NHEK、NHEM.f_M2、NHEM.f_M2_5071302.2、NHEM.f_M2_6022001、NHEM_M2、NHEM_M2_7011001.2、NHEM_M2_7012303、NHLF、NT2-D1、Olf_neurosphere、Osteobl、ovcar-3、PANC-1、Pancreas_OC、PanIsletD、PanIslets、PBDE、PBDEFetal、PBMC、PFSK-1、pHTE、Pons_OC、PrEC、ProgFib、Prostate、Prostate_OC、Psoas_muscle_OC、Raji、RCC_7860、RPMI-7951、RPTEC、RWPE1、SAEC、SH-SY5Y、Skeletal_Muscle_BC、SkMC、SKMC、SkMC_8121902.17、SkMC_9011302、SK-N-MC、SK-N-SH_RA、Small_intestine_OC、Spleen_OC、Stellate、Stomach_BC、T_cells_CD4+、T-47D、T98G、TBEC、Th1、Th1_Wb33676984、Th1_Wb54553204、Th17、Th2、Th2_Wb33676984、Th2_Wb54553204、Treg_Wb78495824、Treg_Wb83319432、U2OS、U87、UCH-1、Urothelia、WERI-Rb-1和WI-38。在一些实施例中,靶细胞可以是任何细胞,诸如原代细胞、HEK293细胞、293Ts细胞,SKBR3细胞、A431细胞、K562细胞、HCT116细胞、HepG2细胞或K-Ras依赖性和K-Ras独立性细胞群。
10.表观基因组编辑的方法
本披露内容涉及用基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统在靶细胞或受试者中进行表观基因组编辑的方法。该方法可用于激活或阻遏靶基因。该方法包括使细胞或受试者接触有效量的如本文所述的优化gRNA分子和基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。在一些实施例中,优化gRNA由多核苷酸序列编码并包装到慢病毒载体中。在一些实施例中,慢病毒载体包含表达盒,该表达盒包含与编码sgRNA的多核苷酸序列可操作地连接的启动子。在一些实施例中,可操作地连接至编码优化gRNA的多核苷酸的启动子是诱导型的。
11.位点特异性DNA裂解的方法
本披露内容涉及用基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统在靶细胞或受试者中进行位点特异性DNA裂解的方法。该方法包括使细胞或受试者接触有效量的如本文所述的优化gRNA分子和基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。在一些实施例中,优化gRNA由多核苷酸序列编码并包装到慢病毒载体中。在一些实施例中,慢病毒载体包含表达盒,该表达盒包含与编码sgRNA的多核苷酸序列可操作地连接的启动子。在一些实施例中,可操作地连接至编码优化gRNA的多核苷酸的启动子是诱导型的。
给予至细胞或样品的gRNA数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少11种不同的gRNA、至少12种不同的gRNA、至少13种不同的gRNA、至少14种不同的gRNA、至少15种不同的gRNA、至少16种不同的gRNA、至少17种不同的gRNA、至少18种不同的gRNA、至少18种不同的gRNA、至少20种不同的gRNA、至少25种不同的gRNA、至少30种不同的gRNA、至少35种不同的gRNA、至少40种不同的gRNA、至少45种不同的gRNA或至少50种不同的gRNA。给予至细胞的gRNA数目可以是至少1种gRNA至至少50种不同的gRNA、至少1种gRNA至至少45种不同的gRNA、至少1种gRNA至至少40种不同的gRNA、至少1种gRNA至至少35种不同的gRNA、至少1种gRNA至至少30种不同的gRNA、至少1种gRNA至至少25种不同的gRNA、至少1种gRNA至至少20种不同的gRNA、至少1种gRNA至至少16种不同的gRNA、至少1种gRNA至至少12种不同的gRNA、至少1种gRNA至至少8种不同的gRNA、至少1种gRNA至至少4种不同的gRNA、至少4种gRNA至至少50种不同的gRNA、至少4种不同的gRNA至至少45种不同的gRNA、至少4种不同的gRNA至至少40种不同的gRNA、至少4种不同的gRNA至至少35种不同的gRNA、至少4种不同的gRNA至至少30种不同的gRNA、至少4种不同的gRNA至至少25种不同的gRNA、至少4种不同的gRNA至至少20种不同的gRNA、至少4种不同的gRNA至至少16种不同的gRNA、至少4种不同的gRNA至至少12种不同的gRNA、至少4种不同的gRNA至至少8种不同的gRNA、至少8种不同的gRNA至至少50种不同的gRNA、至少8种不同的gRNA至至少45种不同的gRNA、至少8种不同的gRNA至至少40种不同的gRNA、至少8种不同的gRNA至至少35种不同的gRNA、8种不同的gRNA至至少30种不同的gRNA、至少8种不同的gRNA至至少25种不同的gRNA、8种不同的gRNA至至少20种不同的gRNA、至少8种不同的gRNA至至少16种不同的gRNA、或8种不同的gRNA至至少12种不同的gRNA。
gRNA可以包含后跟PAM序列的靶DNA序列的互补多核苷酸序列。gRNA可以在互补多核苷酸序列的5’端包含“G”。gRNA可以包含后跟PAM序列的靶DNA序列的至少10个碱基对、至少11个碱基对、至少12个碱基对、至少13个碱基对、至少14个碱基对、至少15个碱基对、至少16个碱基对、至少17个碱基对、至少18个碱基对、至少19个碱基对、至少20个碱基对、至少21个碱基对、至少22个碱基对、至少23个碱基对、至少24个碱基对、至少25个碱基对、至少30个碱基对或至少35个碱基对互补核苷酸序列。PAM序列可以是“NGG”,其中“N”可以是任何核苷酸。gRNA可靶向靶基因的启动子区、增强子区或转录区中的至少一个。在一些实施例中,gRNA靶向具有SEQ ID NO:13-148、316、317或320中的至少一个的多核苷酸序列的核酸序列。gRNA可以包含SEQ ID NO:149-315、321-323或326-329中的至少一个的核酸序列。
12.纠正突变基因和治疗受试者的方法
本披露内容还涉及一种纠正受试者中的突变基因的方法。该方法包括将如上所述的组合物给予至受试者的细胞。组合物将具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统递送至细胞的用途可用修复模板或供体DNA恢复全功能性或部分功能性蛋白的表达,从而可替代整个基因或含有突变的区。具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可用于在靶向基因座处引入位点特异性双链断裂。当具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统结合靶DNA序列时,产生位点特异性双链断裂,从而允许裂解靶DNA。这种DNA裂解可刺激天然DNA修复机构,导致两种可能的修复途径之一:同源定向修复(HDR)或非同源末端连接(NHEJ)途径。
本披露内容涉及在没有修复模板的情况下用具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统进行基因组编辑,这可高效地纠正阅读框并恢复涉及遗传性疾病的功能性蛋白的表达。所披露的具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可涉及使用同源定向修复或核酸酶介导的非同源末端连接(NHEJ)纠正方法,其使得在可能不适于同源重组或基于选择的基因纠正的增殖受限制的原代细胞系中的高效纠正成为可能。该策略将活性的具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的快速且稳健的组织与高效的基因编辑方法整合用于治疗由引起移码、提前终止密码子、异常剪接供体位点或异常剪接受体位点的非必需编码区中的突变所引起的遗传性疾病。
a.核酸酶介导的非同源末端连接
从内源性突变基因恢复蛋白质表达可以通过无模板NHEJ介导的DNA修复。与靶向靶基因RNA的瞬时方法相对比,通过瞬时表达具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统纠正基因组中的靶基因阅读框可导致各个修饰细胞及其所有子代永久性地恢复靶基因表达。
核酸酶介导的NHEJ基因纠正可纠正突变的靶基因,并提供优于HDR途径的若干潜在优势。例如,NHEJ不需要可能引起非特异性插入诱变的供体模板。与HDR相对比,NHEJ在细胞周期的所有阶段都高效地操作,因此可有效用于周期中的细胞和有丝分裂后细胞(诸如肌纤维)两者中。相对于基于寡核苷酸的外显子跳跃或终止密码子的药理学强制通读,这提供了替代性的稳健的永久性基因恢复,并且在理论上可将需要少至一种药物治疗。除本文所述质粒电穿孔方法以外,使用基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统以及包括大范围核酸酶和锌指核酸酶的其他工程化核酸酶的基于NHEJ的基因纠正可与用于基于细胞和基因的疗法的其他现有离体和体内平台联合。例如,基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统通过基于mRNA的基因转移或作为纯化的细胞可渗透蛋白质的递送可使不含DNA的基因组编辑方法成为可能,该方法将克服插入诱变的任何可能性。
b.同源定向修复
从内源性突变基因恢复蛋白质表达可涉及同源定向修复。上述方法进一步包括将供体模板给予至细胞。供体模板可包括编码全功能性蛋白或部分功能性蛋白的核苷酸序列。例如,供体模板可包括小型化肌养蛋白构建体,称为微小肌养蛋白(“minidys”),即一种用于恢复突变型肌养蛋白基因或肌养蛋白基因的片段的全功能性肌养蛋白构建体,其在同源定向修复后导致突变型肌养蛋白基因的恢复。
13.基因组编辑的方法
本披露内容还涉及用上述的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统进行基因组编辑以用修复模板或供体DNA恢复全功能性或部分功能性蛋白的表达,从而可替代整个基因或含有突变的区。基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可用于在靶向基因座处引入位点特异性双链断裂。当使用gRNA使基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统结合靶DNA序列时,产生位点特异性双链断裂,从而允许裂解靶DNA。基于CRISPR/Cas9的系统和基于CRISPR/Cpf1的系统由于其高速率的成功且高效的遗传修饰而具有高级基因组编辑的优势。这种DNA裂解可刺激天然DNA修复机构,导致两种可能的修复途径之一:同源定向修复(HDR)或非同源末端连接(NHEJ)途径。
本披露内容涉及在没有修复模板的情况下用基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统进行基因组编辑,这可高效地纠正阅读框并恢复涉及遗传性疾病的功能性蛋白的表达。所披露的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和方法可涉及使用同源定向修复或核酸酶介导的非同源末端连接(NHEJ)纠正方法,其使得在可能不适于同源重组或基于选择的基因纠正的增殖受限制的原代细胞系中的高效纠正成为可能。该策略将活性的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的快速且稳健的组织与高效的基因编辑方法整合用于治疗由引起移码、提前终止密码子、异常剪接供体位点或异常剪接受体位点的非必需编码区中的突变所引起的遗传性疾病。
本披露内容提供在细胞中纠正突变基因和治疗罹患遗传性疾病,诸如DMD的受试者的方法。该方法可以包括向细胞或受试者给予如上所述的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统、编码所述基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的多核苷酸或载体,或所述基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。该方法可以包括给予基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统,诸如给予Cas9蛋白、Cpf1蛋白、含有第二结构域的Cas9融合蛋白、编码所述Cas9蛋白、Cpf1蛋白或Cas9融合蛋白的核苷酸序列,和/或至少一种gRNA,其中所gRNA靶向不同的DNA序列。靶DNA序列可以是重叠的。如上所述,给予至细胞的gRNA的数目可以是至少1种gRNA、至少2种不同的gRNA、至少3种不同的gRNA、至少4种不同的gRNA、至少5种不同的gRNA、至少6种不同的gRNA、至少7种不同的gRNA、至少8种不同的gRNA、至少9种不同的gRNA、至少10种不同的gRNA、至少15种不同的gRNA、至少20种不同的gRNA、至少30种不同的gRNA或至少50种不同的gRNA。gRNA可以包含SEQ IDNO:149-315、321-323或326-329中的至少一个的核酸序列。该方法可涉及同源定向修复或非同源末端连接。
14.构建体和质粒
如上所述的组合物可包含编码如本文披露的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的基因构建体。基因构建体(诸如质粒)可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统诸如Cas9蛋白、Cpf1蛋白和Cas9融合蛋白和/或至少一种如在此所述的优化gRNA的核酸。如上所述的组合物可包含编码修饰的AAV载体的基因构建体和编码具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸序列。基因构建体(诸如质粒)可包含编码具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸。如上所述的组合物可包含编码如本文披露的修饰慢病毒载体的基因构建体。基因构建体(诸如质粒)可包含编码Cas9-融合蛋白和至少一种sgRNA的核酸。基因构建体可存在于细胞中作为起作用的染色体外分子。基因构建体可以是线性微染色体,包括着丝粒、端粒或质粒或粘粒。
基因构建体还可以是重组病毒载体的基因组的一部分,该重组病毒载体包括重组慢病毒、重组腺病毒和重组腺病毒相关病毒。基因构建体可以是生活在细胞中的活的减毒微生物或重组微生物载体中的遗传物质中的一部分。基因构建体可包含核酸编码序列的基因表达的调控元件。调控元件可以是启动子、增强子、起始密码子、终止密码子或聚腺苷酸化信号。
核酸序列可构成可以是载体的基因构建体。载体可以能够在哺乳动物的细胞中表达融合蛋白,诸如Cas9融合蛋白。载体可以是重组体。载体可包含编码Cas9融合蛋白的异源核酸。载体可以是质粒。载体可用于用编码Cas9融合蛋白的核酸转染细胞,在其中发生Cas9融合蛋白系统表达的条件下培养并维持转化的宿主细胞。
针对表达的稳定性和高水平,可使编码序列优化。在一些情况下,选择密码子以减少RNA的二级结构形成,诸如因分子内键合形成的二级结构。
载体可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的异源核酸,并且可进一步包含起始密码子(其可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列的上游)和终止密码子(其可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列的下游)。起始密码子和终止密码子可与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列一起在阅读框中。载体还可包含与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列可操作地连接的启动子。与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列可操作地连接的启动子可以是来自以下项的启动子:猿猴病毒40(SV40)、小鼠乳腺瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子诸如牛免疫缺陷病毒(BIV)长末端重复序列(LTR)启动子、莫洛尼病毒启动子、禽类白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子诸如CMV即时早期启动子、EB病毒(EBV)启动子或劳斯肉瘤病毒(RSV)启动子。启动子还可以是来自以下项的启动子:人基因诸如人泛素C(hUbC)、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或人金属硫蛋白。启动子还可以是天然或合成的组织特异性启动子,诸如肌肉或皮肤特异性启动子。此类启动子的实例描述于美国专利申请公布号US 20040175727,该申请公布的内容通过引用以其全文结合在此。
载体还可包含聚腺苷酸化信号,该聚腺苷酸化信号可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-珠蛋白聚腺苷酸化信号。SV40聚腺苷酸化信号可以是来自pCEP4载体的聚腺苷酸化信号(加利福尼亚州圣迭哥Invitrogen公司)。
载体还可包含在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统(即Cas9蛋白、Cpf1蛋白或Cas9融合蛋白编码序列或sgRNA(诸如本文所述的优化gRNA))上游的增强子。增强子可能是DNA表达必需的。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,诸如来自CMV、HA、RSV或EBV的增强子。多核苷酸功能增强子描述于美国专利号5,593,972、5,962,428和WO 94/016737,这些专利的内容通过援引完全并入。载体还可包含哺乳动物复制起点以在染色体外保持载体,并在细胞中产生多拷贝的载体。载体还可包含调控序列,该调控序列非常适于在其中给予载体的哺乳动物或人细胞中的基因表达。载体还可包含报告基因,诸如绿色荧光蛋白(“GFP”)和/或选择性标记,诸如潮霉素(“Hygro”)。
载体可以是表达载体或通过常规技术和容易获得的起始原料产生蛋白质的系统,包括Sambrook等人,Molecular Cloning and Laboratory Manual[分子克隆和实验手册],第2版,Cold Spring Harbor[冷泉港出版社](1989),该文献通过援引完全并入。在一些实施例中,载体可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸序列,包括编码Cas9蛋白、Cpf1蛋白或Cas9融合蛋白的核酸序列和编码至少一种gRNA的核酸序列,该至少一种gRNA包含SEQ ID NO:149-315、321-323或326-329中的至少一个的核酸序列。
15.药物组合物
组合物可呈药物组合物的形式。药物组合物可包含约1ng至约10mg编码基于CRISPR/Cas9的系统、基于CRISPR/Cpf1的系统或基于CRISPR/Cas9的系统蛋白质成分(即Cas9蛋白、Cpf1蛋白或Cas9融合蛋白)的DNA。药物组合物可包含约1ng至约10mg的修饰AAV载体和编码具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统的核苷酸序列的DNA。药物组合物可包含约1ng至约10mg修饰的慢病毒载体的DNA。根据本发明的药物组合物根据有待使用的给药方式进行配制。在其中药物组合物是注射用药物组合物的情况下,它们是灭菌、无致热原和无颗粒的。优选使用等渗配制品。一般而言,用于等渗性的添加剂可包括氯化钠、右旋糖、甘露糖醇、山梨糖醇和乳糖。在一些情况下,优选等渗溶液,诸如磷酸缓冲盐水。稳定剂包括明胶和白蛋白。在一些实施例中,将血管收缩剂添加到配制品中。
组合物可进一步包含药学上可接受的赋形剂。药学上可接受的赋形剂可为作为媒介物、辅助剂、载体或稀释剂的功能性分子。药学上可接受的赋形剂可以是转染促进剂,该转染促进剂可包括表面活性剂(诸如免疫刺激复合体(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物、囊泡(诸如角鲨烯和角鲨烯)、透明质酸、脂质、脂质体、钙离子、病毒蛋白质、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。
转染促进剂为聚阴离子、聚阳离子,包括聚-L-谷氨酸(LGS)或脂质。转染促进剂为聚-L-谷氨酸,并且更优选聚-L-谷氨酸以小于6mg/ml的浓度存在于用于基因组编辑的组合物中。转染促进剂还可包括表面活性剂(诸如免疫刺激复合体(ISCOMS))、弗氏不完全佐剂、LPS类似物(包括单磷酰脂质A)、胞壁酰肽、醌类似物和囊泡(诸如角鲨烯和角鲨烯),而且透明质酸还可用来与基因构建体联合给予。在一些实施例中,编码组合物的DNA载体还可包括转染促进剂诸如脂质、脂质体(包括卵磷脂脂质体或本领域已知的其他脂质体,像DNA-脂质体混合物(参见例如W09324640))、钙离子、病毒蛋白质、聚阴离子、聚阳离子或纳米粒子或其他已知的转染促进剂。优选地,转染促进剂为聚阴离子、聚阳离子,包括聚-L-谷氨酸(LGS)或脂质。
16.构建体和质粒
如上所述的组合物可包含编码如本文披露的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的基因构建体。基因构建体(诸如质粒或表达载体)可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和/或至少一种gRNA(诸如本文所述的优化gRNA)的核酸。如上所述的组合物可包含编码修饰的慢病毒载体的基因构建体和编码如本文所披露的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸序列。基因构建体(诸如质粒)可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸。如上所述的组合物可包含编码修饰慢病毒载体的基因构建体。基因构建体(诸如质粒)可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和至少一种sgRNA(诸如本文所述的优化gRNA)的核酸。基因构建体可存在于细胞中作为起作用的染色体外分子。基因构建体可以是线性微染色体,包括着丝粒、端粒或质粒或粘粒。
基因构建体还可以是重组病毒载体的基因组的一部分,该重组病毒载体包括重组慢病毒、重组腺病毒和重组腺病毒相关病毒。基因构建体可以是生活在细胞中的活的减毒微生物或重组微生物载体中的遗传物质中的一部分。基因构建体可包含核酸编码序列的基因表达的调控元件。调控元件可以是启动子、增强子、起始密码子、终止密码子或聚腺苷酸化信号。
核酸序列可构成可以是载体的基因构建体。载体将能够在哺乳动物的细胞中表达融合蛋白,诸如基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。载体可以是重组体。载体可以包含编码融合蛋白,诸如基于CRISPR/Cas9的系统的异源核酸。载体可以是质粒。载体可用于用编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸转染细胞,在其中发生基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统表达的条件下培养并维持转化的宿主细胞。
针对表达的稳定性和高水平,可使编码序列优化。在一些情况下,选择密码子以减少RNA的二级结构形成,诸如因分子内键合形成的二级结构。
载体可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的异源核酸,并且可进一步包含起始密码子(其可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列的上游)和终止密码子(其可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列的下游)。起始密码子和终止密码子可与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列一起处于阅读框中。载体还可包含与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列可操作地连接的启动子。基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统可以在光可诱导或化学可诱导控制下以能够实现对时空的动态控制。与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统编码序列可操作地连接的启动子可以是来自以下项的启动子:猿猴病毒40(SV40)、小鼠乳腺瘤病毒(MMTV)启动子、人免疫缺陷病毒(HIV)启动子诸如牛免疫缺陷病毒(BIV)长末端重复序列(LTR)启动子、莫洛尼病毒启动子、禽类白血病病毒(ALV)启动子、巨细胞病毒(CMV)启动子诸如CMV即时早期启动子、EB病毒(EBV)启动子或劳斯肉瘤病毒(RSV)启动子。启动子还可以是来自以下项的启动子:人基因诸如人泛素C(hUbC)、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或人金属硫蛋白。启动子还可以是天然或合成的组织特异性启动子,诸如肌肉或皮肤特异性启动子。此类启动子的实例描述于美国专利申请公布号US 20040175727,该申请公布的内容通过引用以其全文结合在此。
载体还可包含聚腺苷酸化信号,该聚腺苷酸化信号可以是在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统下游。聚腺苷酸化信号可以是SV40聚腺苷酸化信号、LTR聚腺苷酸化信号、牛生长激素(bGH)聚腺苷酸化信号、人生长激素(hGH)聚腺苷酸化信号或人β-珠蛋白聚腺苷酸化信号。SV40聚腺苷酸化信号可以是来自pCEP4载体的聚腺苷酸化信号(加利福尼亚州圣迭哥Invitrogen公司)。
载体还可包含在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和/或sgRNA(诸如本文所述的优化gRNA))上游的增强子。增强子可能是DNA表达必需的。增强子可以是人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸或病毒增强子,诸如来自CMV、HA、RSV或EBV的增强子。多核苷酸功能增强子描述于美国专利号5,593,972、5,962,428和WO94/016737,这些专利的内容通过援引完全并入。载体还可包含哺乳动物复制起点以在染色体外保持载体,并在细胞中产生多拷贝的载体。载体还可包含调控序列,该调控序列非常适于在其中给予载体的哺乳动物或人细胞中的基因表达。载体还可包含报告基因,诸如绿色荧光蛋白(“GFP”)和/或选择性标记,诸如潮霉素(“Hygro”)。
载体可以是表达载体或通过常规技术和容易获得的起始原料产生蛋白质的系统,包括Sambrook等人,Molecular Cloning and Laboratory Manual[分子克隆和实验手册],第2版,Cold Spring Harbor[冷泉港出版社](1989),该文献通过援引完全并入。在一些实施例中,载体可包含编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的核酸序列和编码至少一种gRNA(诸如本文所述的优化gRNA)的核酸序列。
在一些实施例中,gRNA(诸如本文所述的优化gRNA)由多核苷酸序列编码并被包装到慢病毒载体中。在一些实施例中,慢病毒载体包含表达盒。表达盒可包含可操作地连接至编码gRNA(诸如本文所述的优化gRNA)的多核苷酸序列的启动子。在一些实施例中,可操作地连接至编码gRNA的多核苷酸的启动子是诱导型的。
i.腺相关病毒载体
如上所述,组合物包含修饰的腺相关病毒(AAV)载体。修饰的AAV载体可以具有增强的心肌和骨骼肌组织嗜性。修饰的AAV载体能够将具有至少一种gRNA(诸如本文所述的优化gRNA)的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统递送到哺乳动物的细胞中并且使所述系统在该细胞中表达。例如,修饰的AAV载体可以是AAV-SASTG载体(Piacentino等人(2012)人类基因治疗23:635-646)。修饰的AAV载体可在体内将核酸酶递送至骨骼肌和心肌。修饰的AAV载体可以基于若干种衣壳类型中的一种或多种,这些衣壳类型包括AAV1、AAV2、AAV5、AAV6、AAV8和AAV9。修饰的AAV载体可以基于具有替代性肌肉向性AAV衣壳的AAV2假型,诸如AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5和AAV/SASTG载体,这些载体通过全身性和局部递送高效转导骨骼肌或心肌(Seto等人当今基因治疗(2012)12:139-151)。
17.递送方法
本文提供了用于递送基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和本文所述的优化gRNA以便提供基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的基因构建体和/或蛋白质的方法。基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和本文所述的优化gRNA的递送可以是将作为在细胞中表达的一个或多个核酸分子的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统和本文所述的优化gRNA转染或电穿孔并递送至细胞表面。可以将基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统蛋白质递送至细胞。可以使用BioRad Gene Pulser Xcell或Amaxa Nucleofector IIb装置或其他电穿孔装置将核酸分子电穿孔。可使用几种不同的缓冲液,包括BioRad电穿孔溶液、Sigma磷酸缓冲盐水制品#D8537(PBS),Invitrogen OptiMEM I(OM)或Amaxa Nucleofector溶液V(N.V.)。转染可包括转染试剂,诸如Lipofectamine 2000。
可在有或没有体内电穿孔、脂质体介导、纳米粒子促进和/或重组载体的情况下,通过DNA注射(也称之为DNA接种)将编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统蛋白质的载体递送至组织或受试者中的修饰靶细胞。重组载体可通过任何病毒方式递送。病毒方式可以是重组慢病毒、重组腺病毒和/或重组腺相关病毒。
可将编码基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统蛋白质的核苷酸引入到细胞中以诱导靶基因的基因表达。例如,可将编码导向靶基因的基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统的一种或多种核苷酸序列引入到哺乳动物细胞中。在基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统递送至细胞时,载体因此进入哺乳动物细胞中,转染的细胞将表达基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统。可将基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统给予至哺乳动物以诱导或调节哺乳动物中靶基因的基因表达。哺乳动物可以是人、非人灵长类动物、牛、猪、绵羊、山羊、羚羊、野牛、水牛、牛科动物、鹿、刺猜、大象、美洲驼、羊驼、小鼠、大鼠或鸡,并且优选人、牛、猪或鸡。
将核酸引入到宿主细胞中的方法是本领域已知的,并且任何已知的方法可以用于引入核酸(例如,表达构建体)到细胞中。合适的方法包括例如病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接微量注射、纳米粒子介导的核酸递送等。在一些实施例中,组合物可以通过mRNA递送和核糖核蛋白(RNP)复合体递送来递送。
18.给予途径
可通过不同的途径将组合物给予至受试者,这些不同途径包括口服、胃肠外、舌下、经皮、直肠、经粘膜、局部、经由吸入、经颊给药、胸膜内、静脉内、动脉内、腹膜内、皮下、肌内、鼻内、鞘内和关节内或其组合。对于兽用,按照正常的兽医实践,将组合物作为合适的可接受的配制品给予。兽医可容易地确定最适合于具体动物的剂量方案和给药途径。可通过传统注射器、无针注射装置、“微弹轰击基因枪”或其他物理方法诸如电穿孔(“EP”)、“流体动力学方法”或超声给予组合物。
可在有或没有体内电穿孔、脂质体介导、纳米粒子促进、重组载体诸如重组慢病毒、重组腺病毒和重组腺病毒相关病毒的情况下,通过若干种技术包括DNA注射(也称之为DNA接种)将组合物递送至哺乳动物。可将组合物注射到骨骼肌或心肌中。例如,可将组合物注射到胫骨前肌中。
19.试剂盒
本文提供了试剂盒,该试剂盒可用于位点特异性DNA结合。试剂盒包括如上所述的组合物和所述组合物的使用说明书。试剂盒中包含的说明书可以贴在包装材料上,或者可以作为包装插入物而被包含。虽然说明书通常是书面材料或印刷材料,但它们不限于此。任何能够存储此类说明书并将其传送给最终使用者的介质都被本披露内容所涵盖。这样的介质包括,但不限于电子存储介质(例如,磁盘、磁带、柱体、芯片)、光学介质(例如,CD ROM)等。如本文使用的,术语“说明书”可以包括提供说明书的互联网网站的地址。
如上所述,组合物可以包含修饰的慢病毒载体和编码基于CRISPR/Cas9的系统和优化gRNA的核苷酸序列。如上所述的基于CRISPR/Cas9的系统可包含在试剂盒中以特异性结合和靶向靶基因的特定调控区。
20.实例
前述可以通过参考以下实例得到更好的理解,这些实例出于说明的目的而呈现,而不是旨在限制本发明的范围。
实例1
材料与方法
材料。Tris-HCl(pH 7.6)缓冲液获自康宁生命科学有限公司(Corning LifeSciences)。L-谷氨酸单钾盐一水合物、二硫苏糖醇(DTT)和氯化镁获自西格玛奥德里奇公司(Sigma Aldrich Co.,LLC)。
Cas9、dCas9和sgRNA表达质粒的克隆;使用标准技术将编码靶向人19号染色体的AAVS1基因座的Cas9、dCas9和sgRNA的质粒克隆、表达并纯化。也使用标准技术产生了用于成像的DNA底物-(i)来源于人19号染色体的AAVS1基因座区段的1198bp底物;(ii)含有一系列六个完全的、部分的或错配的靶位点的“工程化”989bp DNA底物;以及(iii)不与原型间隔子具有同源性(>3bp)的1078bp“无义”底物。编码野生型Cas9和dCas9的质粒获自Addgene(质粒39312和质粒47106)。使用Gateway克隆(生命技术公司(Life Technologies))克隆用于在细菌中表达Cas9和dCas9的质粒。简而言之,使用PCR来扩增Cas9和dCas9基因并添加侧翼attL1和attL2位点。进行BP重组以将这些基因转移到穿梭载体中,之后进行LP重组以将这些基因转移到pDest17,该pDest17添加了N末端六-组氨酸标签(生命技术公司)。编码嵌合sgRNA和sgRNA变体(在下面描述)的质粒如先前所述那样克隆(Perez-Pinera等人,(2013)自然方法,10,973-976)。
Cas9、dCas9的表达和纯化。根据标准技术将编码Cas9或dCas9的质粒转化到SoluBL21感受态细胞(Genlantis)中(Sambrook,J.,Fritsch,E.F.和Maniatis,T.(1989)Molecular cloning[分子克隆].冷泉港实验室出版社纽约)。使用单菌落接种25mL起子培养物。将25mL起子培养物生长过夜并用于接种1L培养物。将接种的1L培养物在25℃下生长5小时,之后将温度降至16℃,并且通过添加0.1mM IPTG诱导蛋白质表达。将诱导的培养物在16℃下再生长12小时。通过4000x g下的离心收获细胞并且将其储存在-80℃下以进行长期储存。
将细胞沉淀重悬于30mL裂解缓冲液(50mM Tris-HCl,500mM NaCl,10mM MgCl2,10%v/v甘油,0.2%Triton-1000和1mM PMSF)中。通过在30%占空比下超声5分钟使细胞悬液裂解。然后将悬液以12,000xg离心30分钟。然后取上清液并在温和搅拌下与Ni-NTA树脂(Qiagen)一起温育30分钟。然后将树脂加载到柱上,用洗涤缓冲液(35mM咪唑,50mM Tris-HCl,500mM NaCl,10mM MgCl2,10%v/v甘油)洗涤,并用洗脱缓冲液(120mM咪唑,50mMTris-HCl,500mM NaCl,10mM MgCl2,10%v/v甘油)洗脱。然后使用Ultracel-30k离心过滤器来将溶剂交换到储存缓冲液(50mM Tris-HCl,500mM NaCl,10mM MgCl2,10%v/v甘油)。然后将样品等分并冷冻在-80℃下。经纯化的Cas9和dCas9的代表性聚丙烯酰胺SDS凝胶呈现在图S1中,指示了大约>95%的纯度。
sgRNA和指导RNA变体的表达和纯化。使用MEGAshortscript T7转录试剂盒(生命技术公司)体外转录指导RNA。经由PCR从指导RNA质粒产生具有T7启动子的DNA模板并且按照制造商的说明书建立反应。通过PCR从标准gRNA质粒中产生用于从其5’端截短2个核苷酸的指导RNA(tru-gRNA)和具有形成发夹的5’延伸区的指导RNA(hp-gRNA)的T7模板。然后使用标准技术利用苯酚-氯仿提取纯化RNA(Sambrook等人(1989)分子克隆.冷泉港实验室出版社纽约)。
DNA底物的产生。使用DNeasy试剂盒(Qiagen)根据制造商的方案HEK293T细胞系中提取并纯化基因组DNA。然后使用PCR扩增AAVS1基因座。从基因组DNA经由直接PCR使用来自集成DNA技术公司(Integrated DNA Technologies)(IDT)的下述引物构建了1198bp AAVS1来源的底物:5’-\Bt\-CCAGGATCAGTGAAACGCAC-3’和5’-GAGCTCTACTGGCTTCTGCG-3’,其中\Bt\代表在5’端对引物进行生物素化。将含有一系列PAM和完全或部分原型间隔子位点的“工程化”DNA底物排序为两个gBlock片段,每个gBlock片段在一端含有EcoRI限制性位点。将底物消化、连接在一起,并且然后经由PCR使用下述引物(集成DNA技术公司,IDT)富集:5’-\Bt\-CATGACGTGCAGCAAGC-3’和5’-CGACGATGCGCTGAATC-3’。为了构建不含展现出与原型间隔子具有同源性(大于3bp)的位点的“无义”底物:合成了含有一系列限制性位点的690bp DNA构建体(金斯瑞公司(GeneScript,Inc.)),并将来自λDNA(新英格兰生物实验室(New England Biolabs))的附加DNA长度亚克隆到构建体中;然后使用下述引物(IDT)对1078bp底物进行PCR扩增:5’-\Bt\-GACCTGCAGGCATGCAAGCTTGG-3’和5’-CAGCGTCCCCGGTTGTGAATCT-3’。将所有DNA进行凝胶纯化,在工作缓冲液(20mM Tris-HCl(pH7.6),100mM谷氨酸钾,5mM MgCl2和0.4mM DTT)中稀释至25nM,并且与40x过量的单体链霉亲和素(Howarth等人,(2006)自然方法,3,267-273)一起温育10分钟,之后与Cas9/dCas9一起温育。
经纯化的Cas9和dCas9的十二烷基硫酸钠-聚丙烯酰胺凝胶呈现在图8A-8B中,这指示了大约>95%的纯度。
原子力显微术。使用具有RTSEP(布鲁克公司(Bruker))探针(标称弹簧常数40N/m,共振频率,300kHz)的布鲁克(née Veeco)Nanoscope V Multimode在空气中进行原子力显微术(AFM)。在实验之前,将蛋白质和指导RNA以1:1.5的比例混合10分钟。将蛋白质和DNA在室温下在工作缓冲液溶液中混合至少10分钟(最多35分钟),在已用3-氨基丙基硅氧烷(如前所述制备的(24))处理的新鲜切割的云母(泰德佩拉公司(Ted Pella,Inc.))上沉积8秒,用超纯(>17MΩ)水冲洗,并在空气中干燥。在与DNA一起温育之前短暂离心蛋白质。当使用标准sgRNA时,对于每种实验条件对至少4种制剂进行成像,并且对于使用其他指导RNA变体的实验对至少2种制剂进行成像。一般来说,对于每个样品,以1024×1024的像素分辨率在2.75微米的正方形区域上或者以2048×2048在5.5微米的正方形区域上以1-1.5行/s获取图像。对每种实验条件,数千(约2500-6000)个DNA分子的图像进行解析。
使用子像素分辨率的DNA描迹和细化。使用用于扫描探针显微镜Gwyddion的开源图像分析软件(http://gwyddion.net/)将获取的AFM图像平滑化并进行调平(平面态,逐行并且通过3阶多项式调平),然后输出到MATLAB(Mathworks公司)。针对明显可识别的链霉亲和素标记、至少一个结合的Cas9/dCas9分子的存在和确保未与其他DNA分子的聚集或重叠的清晰端至端路径通过检查对含有每个DNA分子的151×151个像素(405nm×405nm)区域进行分选。手动描迹DNA的轮廓,并且标记链霉亲和素和Cas9/dCas9的估计边界。然后使用基于Wiggins等人(2006)Nature nanotechnology[自然纳米科技],1,137-141)的方法对轨迹进行算法细化。从链霉亲和素的加权质心(x1)开始,骨架的下一个元素的位置(x2)通过向在链霉亲和素的估计边界之外的最近手动描迹点步进2.5nm来估计。在x2处以垂直于(x1-x2)线段的DNA图像的两倍线性内插绘制11像素行。x2被重新定位到法线上的具有最大形貌高度的位置,然后在新的(x1-x2)行上从x1调节到2.5nm。然后使用最近的手动描迹点迭代地估计x3…xn的位置,以产生对于下一个骨架位置的初始猜测,然后如之前那样进行校正,并且校正过程继续进行,直到点xn离描迹的DNA分子的末端小于2.5nm。当细化轨迹在xi处进入Cas9/dCas9分子的估计边界时,DNA的位置被替代地估计为三次厄米样条(cubic Hermitespline)(使用点xi-1、xi、xj和xj+1,其中xj是在估计的Cas9/dCas9边界之外的手绘轨迹的第一点)上位于离xi 2.5nm处的点。
一旦描迹完成后,提取出DNA的沿轮廓的高度(相对于局部区域的中值像素高度)。将链霉亲和素和Cas9/dCas9的估计边界围绕原始估计值迭代地扩展或缩进,直到它们扩展到大于(μd+σd)的连续区域,其中,μd和σd是在结合蛋白的估计位置之外的描迹DNA的高度的平均值和标准差,并且估计值收敛。
为了考虑可能扭曲DNA的表观长度的任何仪器滞后作用,将DNA的长度归一化,并且仅使用最初测量为其预期长度(给定的已知碱基对数,0.33nm/个碱基对)的20%的DNA分子用于进一步分析(对于AAVS1底物号-描迹数:804;标称长度:1198bp,记录的平均长度:1283bp,标准偏差:154bp;对于工程化底物-描迹数:1520,标称长度:986bp,记录的平均长度:1071bp,标准偏差:124bp;对于“无义”底物-描迹数:616,标称长度:1078bp,记录的平均长度:1217bp,标准偏差:135bp)。这一步防止了我们不当地分析例如,出现共线的两个DNA分子、可能已经片段化的DNA或可能已被Cas9裂解并分离的DNA(这很罕见,参见正文)。
图1C-1D、图2C-2D和图9的结合直方图是通过以下方式产生:将每种结合蛋白的相对位置映射到蛋白质重叠(最近邻内插)的碱基并且将与每个位点结合的蛋白质总数相加(如果单个Cas9/dCas9可被解释为与多个(k)位点接触,则每个接触区在结合直方图中以1/k进行加权)。使用MATLAB将结合直方图中的峰值拟合至经验高斯exp(-((x-μ)/w)2),其中μ是平均峰位,并且w是峰宽参数(w=√2σ,其中σ是标准差)。
dCas9表观解离常数的确定。如先前所述那样确定具有不同指导RNA变体的dCas9的表观解离常数(Yang等人(2005)Nucleic Acids Res.[核酸研究],33,4322-4334)。简而言之,在dCas9-指导RNA([dCas9]0)和DNA分子([DNA]0)的已知溶液浓度下,计数具有或不具有结合蛋白质的“工程化”DNA分子的对应数目(蛋白质结合的DNA分数ΘdCas9)。在描迹具有结合蛋白质的DNA(见上文)之后,确定每个DNA分子结合的蛋白质的平均数目(ndCas9)。总解离常数计算为Kd,DNA=[DNA][dCas9]/[DNA·dCas9]=(1-ΘdCas9)([dCas9]0-ndCas9[DNA]0)/(ΘdCas9)
替代性地使用在其对应结合直方图的高斯拟合的一个峰宽内具有结合dCas9的DNA分数ΘdCas9,原型间隔子类似地计算原型间隔子特异性解离常数Kd,原型间隔子(即,参见表1),如使用具有结合dCas9的DNA上的每个位点分数ΘdCas9,ss计算位点特异性解离常数Ka,ss=Kd,ss -1一样。
蛋白质比对和聚类。提取了Cas9和dCas9蛋白的图像,这些Cas9和dCas9是分离的,并且似乎仅在单一位置处与DNA接触。这些特征被选择为具有完全位于134nm×134nm边界框之内的大于(μd+2σd)的特征的那些,其中μd和σd是结合蛋白质的DNA高度的平均值和标准差;这一步实质上具有从集合中除去大部分聚集/密集的Cas9/dCas9以及来自具有较大外在噪声的图像的那些蛋白质的作用。在四倍最近邻内插之后,通过相对于彼此反复平移、旋转和反射来各自比对具有大于(μd+σd)的形貌高度的蛋白质的特征,以最小化其形貌高度之间的均方差。距离矩阵由这些最小化的均方差组成,然后使用Rodriguez和Laio(27)的方法根据此标准对具有标准sgRNA的蛋白质进行聚类;根据具有标准sgRNA的最靠近的Cas9/dCas9结构对具有指导RNA变体的蛋白质进行聚类。按照Penczek、Radermacher和Frank(28)的方法,通过在各个聚簇的每个成员之间进行无参考的比对来提取整体平均结构。使用在拟合成结合直方图的高斯分布的一个峰宽内结合的蛋白质(即,参见表1)确定DNA上每个特征(例如原型间隔子位点)处的Cas9/dCas9群体的特性。
指导RNA链入侵的动力学蒙特卡罗(KMC)和R环“呼吸”。使用在MATLAB中实施的Gillespie型(连续时间,离散状态)((Gillespie(1976)Journal of computationalphysics[计算物理学杂志],22,403-434)进行模拟指导RNA在原型间隔子位点处的链入侵的动力学蒙特卡罗(KMC)实验。链入侵被建模为一维随机游动,处于由相对最近邻依赖性DNA:DNA和RNA:DNA结合自由能确定的位置依赖性势能中。参见,例如,图4A。也就是说,指导RNA与原型间隔子碱基配对多达m个原型间隔子位点(对于sgRNA11≥m≥20并且对于截短sgRNA(tru-gRNA)1≥m≥18,并且,对于一阶,正向速率(附加指导RNA入侵速率)vf使用exp(-(ΔG°(m+1)RNA:DNA-ΔG°(m+1)DNA:DNA)/2RT)的对侧近似值进行估计,其中R是玻尔兹曼常数,T是温度(在此为37℃以对应于使用的参数设置),ΔG°(m+1)RNA:DNA是位点m+1处RNA与原型间隔子之间的碱基配对自由能,并且ΔG°(m+1)DNA:DNA是原型间隔子及其互补DNA链之间的碱基配对自由能(包括1/2修正项以满足细致平衡)。对于sgRNA或tru-gRNA,状态m=20或18下的vf设置为0。反向速率(原型间隔子与其互补DNA链之间重新杂交的速率)vr以正比于exp(-(ΔG°(m)DNA:DNA-ΔG°(m)RNA:DNA)/2RT)的类似方式进行计算;如果状态m=1,则模拟停止(表示指导RNA-原型间隔子解离)。从时间t=0(以任意时间单位)开始,对于算法的每次迭代,确定m依赖性速率并且两个随机数r1和r2是从0与1之间的均匀分布生成的。t以Δt=log(r1)/(vf+vr)进行递增。如果r2≥vf/(vf+vr),则状态m增加至m+1,否则减小至m-1。对于R环呼吸的“平衡”的测量,m起始于m=20(或18,在tru-gRNA情况下)并且对算法进行迭代,直到t≥10,000。为了测量“入侵”动力学动态(例如在存在错配碱基对下),m起始于m=10(最多t=1000)。
自由能参数是从在37℃下、在1M NaCl下的实验文献得到的。序列依赖性DNA:DNA杂交自由能ΔG°(x)DNA:DNA获自SantaLucia等人(1996)Biochemistry[生物化学],35,3555-3562;序列依赖性RNA:DNA杂交自由能ΔG°(x)RNA:DNA获自Sugimoto等人(1995)生物化学,34,11211-11216;并且在引入点错配rG·dG、rC·dC、rA·dA和rU·dT的情况下ΔG°(x)RNA:DNA值获自Watkins等人(2011)核酸研究,39,1894-1902(在稍微较高的盐条件下)。使用的原型间隔子的序列是“ATCCTGTCCCTAGTGGCCCC’(SEQ ID NO:336),如AFM实验中的AAVS1靶位点;原型间隔子互补DNA的序列是“GGGGCCACTAGGGACAGGAT”(SEQ ID NO:337),并且指导RNA的序列是对于sgRNA的“GGGGCCACUAGGGACAGGAU”(SEQ ID NO:338)或对于截短RNA的“GGCCACUAGGGACAGGAU”(SEQ ID NO:339)。
从KMC推导出的R环稳定性与实验性Cas9裂解率之间的相关性。为了分析体内指导RNA-原型间隔子相互作用与Cas9裂解率之间的相关性,提取了来自Hsu等人(2013)自然生物技术,31,827-832的指导RNA和靶向DNA的序列以及其实验确定的最大似然估计(MLE)Cas9裂解频率。将来自Hsu等人(2013)自然生物技术,31,827-832的具有单核苷酸PAM远端(远离PAM位点≥10bp)错配(rG·dG、rC·dC、rA·dA和rU·dT类型)的指导RNA和靶向DNA的序列以及在这些位点处的实验确定的最大似然估计(MLE)Cas9裂解频率输入(n=136)到KMC脚本中。对于每种序列,将起始于m=10处的链入侵模拟重复1000次(最多t=100),以获得m≥16的平均时间分数,并且与经验裂解率相关联。显著性是通过以下方式确定的:用MLE切割频率经由排列100,000次来引导平均占有率分数,然后重新计算相关系数和p-值。指导RNA-原型间隔子结合自由能通过使用上面列出的参数集对最近邻能量进行求和来估计,并用-3.1kcal mol-1起始因子校正。
用于与dCas9-sgRNA结构特性进行比较的dCas9-tru-gRNA和dCas9-hp-gRNA数据。当比较实验间的蛋白质的高度和体积测量值时,AFM成像条件应保持大致一致,以免引入伪影。例如,当比较与工程化DNA分子上不同位点结合的dCas9的高度和体积时,这通常不存在问题,但当使用不同的指导RNA或DNA底物比较dCas9/Cas9的结构特性时,这提出了挑战。作为对照,使用了用于标记所追踪的DNA分子末端的链霉亲和素的高度和体积用于不同的实验,这些高度和体积在所有实验条件下都应当保持不变。对于用sgRNA进行的实验,链霉亲和素的平均高度的差异小于0.1nm(平均差异:0.087nm;差异的标准差:0.052nm)并且它们的平均体积(1098nm3)的差异小于15nm3(平均差异:14.461nm3;差异的标准差:10.419nm3)。然而,用tru-gRNA和hp-gRNA进行的实验之间的平均高度和体积与用sgRNA进行的实验之间的平均高度和体积不同,分别相差高达0.14nm和225nm3。为了直接比较这些实验的结果,工程化DNA上的具有tru-gRNA和hp-gRNA的dCas9的高度根据相对于具有sgRNA的dCas9的高度的平均高度差异来改变并且体积根据平均体积的百分比差异来缩放。
实例2
原子力显微镜以高分辨率捕获沿工程化DNA底物特异性和非特异性结合的Cas9/dCas9
结晶学和生物化学实验的分析表明,通过以下方式来赋予对原型间隔子结合和裂解的特异性:首先通过由Cas9本身识别PAM位点,然后通过结合的RNA复合体进行链入侵并且与原型间隔子直接进行沃森-克里克碱基配对(图1A),但是完整的机理性图片尚未出现。为了直接探测以单分子分辨率结合原型间隔子和脱靶位点的相对倾向性,靶向人19号染色体的AAVS1基因座的50nM Cas9-sgRNA或dCas9-sgRNA复合体在与三种DNA底物(2.5nM)中的一种一起温育之后在空气中通过AFM进行成像:
(i)AAVS1基因座的含有跟在PAM(hre“TGG”)之后的完整靶位点的1198bp区段(图1C);
(ii)含有一系列的六个完整的、部分的或错配的靶位点的989bp工程化DNA工程底物,每个靶位点相隔大约150bp(图1D)。这些位点处的错配可能跨越原型间隔子的“种子”(PAM近端,大约12bp)和“非种子”(PAM远端)区。在这种工程化底物中仅有的PAM位点是在这些明确设计的位置处;并且
(iii)与靶序列无同源性(超出3bp序列)的1078bp“无义”DNA(图9A-9C)。
图1C显示dCas9和Cas9在AAVS1底物上展现出几乎相同的结合分布(分别为n=404和n=250)。图1D显示在工程化底物(n=536)上,dCas9以最高倾向结合没有错配(MM)位点的完整原型间隔子(峰1,后面称为完全或“0MM”位点),并且还结合位于PAM位点远端的具有5或10个错配碱基的位点(来自链霉亲和素标记的第三和第四特征,后面分别称为“5MM”或“10MM”位点),尽管亲和力降低。含有大量错配(第二和第五特征)或具有两个PAM近端错配核苷酸(第六个特征)的位点以显著较低的速率结合。(下面)每个底物中PAM(“TGG”)位点的分布。
在结构上,化脓链球菌Cas9是大约10nm×10nm×5nm(来自晶体结构)的160kDa单体蛋白质,大致分为各自含有核酸酶结构域的两个叶状半部。与x线结构一致,经由AFM成像的dCas9-sgRNA表现为大的卵状结构(图10A-10C),在将Cas9或dCas9与DNA一起温育之后,观察结合DNA的这些结构并且分别指定为Cas9或dCas9(图1B、图10A-10C和图11A-11D)。为了明确确定由Cas9和dCas9结合的位点的序列,在AFM成像之前,将生物素化的DNA分子在一端用单价链霉亲和素标签标记。选择观察到具有结合Cas9或dCas9蛋白的DNA分子用于进一步的分析,并且根据从Wiggins等人(25)改编的改进方案用子像素分辨率描迹,并且提取了由Cas9/dCas9结合的位点(详见补充方法)。
该方法被证明非常稳健(表1):在由Cas9或dCas9结合的DNA上,观察到恰好集中在具有相邻PAM(在预期的23bp内,图1C-D)的原型间隔子位点位置处的明显蛋白质富集为观察到并表现为尖峰。在不含靶位点的DNA底物中没有观察到此类明显的峰(图9A-9C)。峰宽的标准差在36-60bp范围内,与导致峰宽标准差σ大约为1000bp的使用单分子荧光的结合实验相比,这具有显著的改善。DNA上的平均表观Cas9/dCas9“足迹”覆盖了78.1bp±37.9bp;表观足迹相对于通过生物化学和晶体学方法确定的DNA上约20bp的Cas9足迹的扩大是用AFM尖端宽度进行成像卷积的公知结果。先前,在体外观察到,Cas9在作为单周转内切核酸酶进行推定DNA裂解后仍保持与靶DNA的长时段(>10min)结合,并且在没有苛刻的化学处理的情况下不能从裂解链移位。观察到结合Cas9的大部分DNA分子表现为全长AAVS1来源的底物,只有很少(约5%)百分比的底物已被裂解和分离。在描迹这些DNA分子后,观察到Cas9以与dCas9几乎相同的分布结合这些“全长”底物(双侧科-斯二氏检验,显著性水平5%)(图1C)。
表1针对Cas9/dCas9-sgRNA的图1C-D结合直方图中以及针对具有在5’端有2nt截短的sgRNA(tru-gRNA)的dCas9的图2C结合直方图中记录的峰值,基于与高斯∝exp(-((x-μ)/w)2)的经验拟合
a标准单指导RNA(sgRNA)
b从5’端缩短2nt的单指导RNA(tru-gRNA)
c随后描迹的观察到有单价链霉亲和素标记和结合蛋白的DNA分子数(详见支持方法)。
d具有10个PAM远端错配核苷酸的靶位点
e具有5个PAM远端错配核苷酸的靶位点
f在工程化DNA底物上,预期tru-gRNA仅与10MM位点处的10个PAM远端错配核苷酸的前8个相互作用。
g在工程化DNA底物上,预期tru-gRNA仅与5MM位点处的5个PAM远端错配核苷酸的前3个相互作用。
h来自链霉亲和素标记端的bp(从PAM至位点末端)
i结合直方图中的峰值最大值(来自高斯拟合)
j峰宽是√2σ,其中σ为标准差
k结合位点的1个峰宽(√2σ)内观察到的dCas9分子数。如果Cas9/dCas9表现为在n个位点处接触DNA,则该分子以1/n进行加权。如果分子重叠10MM和5MM位点,则#再以1/2进行加权。
通过沿着工程化底物检查结合不同位置的dCas9的占有率,dCas9与各种错配和部分的靶位点的相对结合倾向可被确定(图1D,表1)。dCas9与整个DNA底物之间的总解离常数估计为2.70nM(±1.58nM,95%置信度,表2)。特别地,在位于底物处完全(完全匹配)的原型间隔子(在结合直方图的一个峰宽内)位点处的dCas9解离常数为44.67nM(±1.04nM,95%置信度)。早期的电泳迁移率变动分析(EMSA)估计dCas9-sgRNA与短DNA分子(约50bp)上的原型间隔子位点的结合在0.5nM与2nM之间。虽然观察到的原型间隔子位点处的解离常数增加可能与工程化DNA底物上多个脱靶位点的存在有关,但典型的是由AFM确定的解离常数比传统测定所确定的解离常数高出近一个数量级(26)。这种差异通常归因于蛋白质与短链DNA的平端之间的非特异性相互作用,这在EMSA中没有考虑。
表2具有不同指导RNA变体的dCas9与含有一系列完全和部分互补的原型间隔子位点的989bp“工程化”DNA底物(例如,图1D、2C和2D)的表观解离常数
a全长单一指导RNA单指导RNA(sgRNA)
b截短sgRNA(截短5’处的前两个nt)
c具有另外的5’-发夹的sgRNA,该5’-发夹重叠六个PAM远端靶向nt(参见正文)
d具有另外的5’-发夹的sgRNA,该5’-发夹重叠十个PAM远端靶向nt(参见正文)
在工程化底物上,dCas9是相对较耐受远端错配的(相对于完整靶位点展现出50%-60%倾向,图1D和表1)并且具有相同的对含有5和10个远端错配(MM)的靶位点的表观亲和力(在表观置信度内)。然而,与仅含有两个PAM邻近错配的原型间隔子位点发生结合的倾向与具有15或甚至20个(仅PAM位点)远端错配的位点的结合倾向(相对于完全靶标大约5%-10%的结合倾向,近似于背景结合信号)类似,这一发现与先前的生化研究一致。虽然在工程化底物上不存在除了与原型间隔子位点邻近之外的PAM位点,但是在AAVS1来源的底物上,在AAVS1靶标附近存在增强的Cas9和dCas9结合的明显“肩峰”,该肩峰尤其富集在PAM位点中。在“无义”底物和AAVS1来源的底物中远离靶位点的区段上,dCas9的细微富集密切反映了PAM位点的分布(双侧科-斯二氏检验,显著性水平5%),并且相比于dCas9与具有相同dA、dT、dC和dG分布的100,000个随机生成的序列的71.20%匹配,“无义”底物上的dCas9分布更密切反映了实验性PAM分布(图9A-9C)。由于沿着“无义”底物的dCas9结合(在1079bp中具有879个PAM位点)与PAM位点分布对应的非常好,因此这被理解为真实的dCas9-PAM相互作用的量度。沿着“非特异性”底物的dCas9结合的平均单位点解离常数被估计为大约867nM(标准差±209nM)。这可以理解为不具有原型间隔子同源性的DNA上的dCas9结合解离常数的估计值。
实例3
在5’端具有两个核苷酸截短的sgRNA(tru-gRNA)在体外不增加dCas9的结合特异性
发现即使sgRNA或crRNA的指导(原型间隔子靶向)区段从其5’端截短多达四个核苷酸,Cas9仍然展示出裂解活性,并且Fu等人(21)最近表明,使用具有这些5’-截短(最佳地截短2-3个核苷酸)的sgRNA实际上可以导致体内Cas9裂解保真度的数量级增加。已提出使用这些截短的sgRNA(称为“tru-gRNA”,图2A)增加了对错配位点(MM)的敏感性是由于其在指导RNA与原位间隔子位点之间的结合能降低的结果。这暗示由sgRNA上额外的5’-核苷酸赋予的结合能可以补偿任何错配的核苷酸并且在不正确的位点处稳定Cas9,而如果存在错配,tru-gRNA在DNA上会相对不太稳定。
作为该提议机制的测试,在相对于先前使用的sgRNA截短两个核苷酸5’的tru-gRNA存在下对dCas9进行成像。将dCas9-tru-gRNA复合体与包含一系列完全和部分的原型间隔子位点的工程化底物一起温育。同样,恰恰在完全原型间隔子位点(图2C和表1)处也发现了峰,尽管在该位点的表观结合常数相对于具有完全sgRNA的dCas9显著降低(即,解离常数增加,参见表2)。然而,相对于完全原型间隔子位点处的结合,具有在原型间隔子位点具有PAM远端错配的tru-gRNA的dCas9的脱靶结合相比于具有sgRNA的dCas9时实际上增加(图2C和表1)。与具有sgRNA的dCas9相似,具有tru-gRNA的dCas9以大约相等倾向结合具有10或5个PAM远端错配位点的原型间隔子(注意:仅预期tru-gRNA分别地与那些位点处的前8个和前3个错配相互作用)。这些结果表明,使用tru-gRNA的裂解保真度增加不一定由在错配存在下脱靶位点处结合倾向的相对降低或相对稳定性的降低所赋予。而是,虽然存在一些“阈值”效应,其中结合常数降低至约4-5×106M有效地消除了体内的裂解活性,但是下面呈现的这些和另外的结果表明由tru-gRNA展现出的特异性增加可能受到裂解机制本身的区别的影响。此外,这些发现表明虽然tru-gRNA可以改善活性Cas9的裂解特异性,但它们可能不会改善涉及dCas9(或嵌合衍生物)的体内应用的结合活性的特异性。
另外,先前报道已经表明在其原型间隔子靶向片段中具有5’-截短(最佳截短2-3个核苷酸)的tru-gRNA可以导致体内Cas9裂解保真性的数量级增加(图2A),实施例中示出的结果表明截短的gRNA未改善dCas9结合的特异性(图2C)。图2C示出了在含有完全原型间隔子(位点i)和具有5个和10个PAM远端错配的原型间隔子位点(分别为位点ii和iii)的DNA分子上具有标准gRNA(虚线)的dCas9结合亲和力与具有tru-gRNA(trugRNA,紫色线)的dCas9的结合亲和力的比较。图2C显示标准指导RNA保留与这些脱靶位点(含有错配)结合的显著能力,并且trugRNA在于原型间隔子PAM远端的510个核苷酸处含有错配位点处的结合特异性方面没有展现出相对增强。具有tru-gRNA的dCas9的结合分布恰好在具有10个PAM远端错配和5个PAM远端错配的原型间隔子位点处表现出亲和力的明显峰,这证明tru-gRNA相对于完全sgRNA未增加结合特异性(参见表1)。结合直方图中的“峰”指示这些脱靶位点处的特异性、稳定结合。实际上,与标准指导RNA相比,dCas9-trugRNA在脱靶位点处的结合实际上相对于与原型间隔子的结合增加。这种混杂的结合可能会限制它们对dCas9和嵌合dCas9衍生物的效用。它也可能反映了该系统报告的脱靶裂解,虽然相对于标准指导RNA有所改进,但在一些脱靶位点仍然是显著的。为了比较,我们未发现hpgRNA在具有错配的这些位点处的特异性结合(图2D)。hpgRNA以大约与它们非特异性结合与原型间隔子不具有同源性的DNA相同的亲和力结合在这些位点处,其中观察到的脱靶结合亲和力相对于截短gRNA最大降低约22%。另外,基于Cas9DNA结合通道的狭窄几何形状,我们预期未打开发夹在错配原型间隔子中的存在可能抑制进行裂解所必需的Cas9构象变化(图1B)。
已经进行大量工作以表征这种脱靶活性-并且通过以下方式来改善Cas9/dCas9的特异性:智能选择原型间隔子靶序列;例如,通过截短sgRNA中的前两个5’-核苷酸来优化sgRNA结构;以及使用“双切口”Cas9酶-但是清楚地了解RNA指导裂解的确切机制(因为它与Cas9的结构生物学有关)对于开发Cas9衍生物和具有增加的保真度指导RNA以便用于其新型的医学和生物学应用是必要的。
根据这个目标,在此我们使用原子力显微镜(AFM)来解析个别化脓性链球菌Cas9和dCas9蛋白,因为它们在与不同的sgRNA变体一起温育之后沿着工程化DNA底物结合靶标。该技术使我们能够同时直接解析单个Cas9/dCas9蛋白的结合位点和结构,从而以单分子分辨率提供关于Cas9/dCas9特异性的大量机理信息。与传统的生物化学研究一致,我们发现在靶序列中含有多达10个错配碱基对的位点处发生具有sgRNA的Cas9/dCas9的显著结合。然而,虽然先前已显示使用从其5’端截短两个核苷酸的指导RNA(tru-gRNA)导致Cas9在体内的脱靶诱变减少高达5000倍,但是我们在体外发现具有tru-gRNA的dCas9与错配靶标的体外结合特异性与标准sgRNA类似。发现向sgRNA的5’端添加部分重叠指导RNA的靶结合区的发夹增加了dCas9特异性,但代价是总体降低了对DNA的结合倾向。我们的结果表明,当错配位于远离PAM的10bp处时,指导性RNA-DNA结合的总体稳定性不一定控制Cas9裂解特异性。
实例4
在体外具有与“PAM远端”靶向区段互补的5’-发夹的指导RNA(hp-gRNA)调节dCas9与具有错配原型间隔子的DNA结合的绝对结合倾向和分布图
dCas9特异性可以通过延伸sgRNA的5’端,使得其形成重叠gRNA的“PAM远端”靶向(或“非种子”)区段的发夹结构来增加(图2B)。在PAM位点结合并且已经起始指导RNA对DNA的链入侵后,发夹在与完全原型间隔子结合后打开并且可发生完全链入侵。如果在靶位点存在PAM远端错配,那么它在能量学上更有利于发夹保持闭合并且链入侵受到阻碍。类似的拓扑结构近来已被用于由链入侵驱动的“动态DNA回路”。在这些系统中,发夹充当入侵的动力学屏障,在试图入侵具有错配的靶的情况下寡核苷酸入侵速率减慢几个数量级。这里的发夹可以在侵入完全靶位点过程中移位,但是如果在靶标与指导RNA的非种子靶向区之间存在错配时,则抑制入侵(图2B)。在那些情况下,它在能量学上更有利于发夹保持闭合。虽然先前工作向sgRNA上添加了5’-延伸区以便互补超出原型间隔子的额外核苷酸,但是这些指导RNA在体内没有显示增加的Cas9裂解特异性。而是,它们在活细胞中被消化回至大约其标准长度。基于发夹的大小和结构,发夹可以容纳在Cas9/dCas9分子的DNA结合通道内并且保护其免于降解。
产生了具有5’-发夹的sgRNA(hp-gRNA),该5’-发夹重叠与原型间隔子的最后六个(hp6-gRNA)或十个(hp10-gRNA)PAM远端位点互补的核苷酸。通过将观察到的dCas9-hp-gRNA的结合位置映射在工程化DNA底物上(图2D),恰恰在原型间隔子位点(位于位点144-167处的PAM和原型间隔子,对于dCas9-hp6-gRNA结合峰在位点154.0处(95%置信度:153.3-154.8)并且对于dCas9-hp10-gRNA在158.3处(95%置信度:157.6-158.9)观察到尖峰。具有5个和10个远端错配的位点处的特异性峰显著变平,dCas9和hp10-gRNA展现出显著降低的脱靶位点亲和力(相对于具有tru-gRNA的dCas9下降22%)。完全原型间隔子位点处的亲和力峰暗示着发夹在完全入侵后确实打开。对于hp6-gRNA n=243并且对于hp10-gRNAn=212。具有hp-gRNA的dCas9显示出与具有tru-gRNA的dCas9类似的靶位点亲和力下降,然而,与具有tru-gRNA的dCas9相对比,具有hp-RNA的dCas9在脱靶位点处未呈现任何尖锐的结合峰,这些结合峰原本表明强烈的特异性结合。对于hp6-gRNA,在具有5个或10个错配的PAM远端位点的原型间隔子位点周围存在结合富集。因为它们缺乏在sgRNA和tru-gRNA情况下观察到的尖锐结合峰,所以这些富集不太可能指示特异性结合,而是可能表明dCas9在吸附到表面后从这些位点解离。这将表明在hp6-gRNA的情况下这些脱靶位点处的结合非常弱。
在hp10-gRNA的情况下,对这些错配位点的结合大致位于在基底别处上的非特异性结合的水平下,这表示相对于tru-gRNA观察到的脱靶结合亲和力最大降低22%(观察到缔合常数从3.18×106M至2.48×106M的最大降低,图2D)。hp10-gRNA特异性的这种增加也通过对原型间隔子位点的结合解离常数与hp6-gRNA类似,但对整个(特异性+非特异性)工程化底物的总解离常数显著增加来反映(表2)。
恰恰在完全原型间隔子位点处的明显富集表明,在入侵完全原型间隔子位点后在hp-gRNA中的发夹实际上是打开的,因为结合原型间隔子的PAM远端位点的核苷酸原本捕获于发夹内。改善结合特异性的可能机制是,当在具有PAM远端错配的原型间隔子位点未打开时,发夹的存在促进指导RNA从这些脱离靶位点的解链。结果表明,hp-gRNA可用于调节Cas9/dCas9结合亲和力和特异性,并且发夹长度、环长度和环组成的进一步操纵可以允许更好地控制这些特性。
实例5
随着与越来越匹配靶原型间隔子序列的DNA位点结合,Cas9和dCas9经历渐进性结构转换
使用负染透射电子显微镜(TEM)观察到,在结合sgRNA后,使dCas9结构紧密并旋转以打开其两个叶之间的假定DNA结合通道。在与含有PAM和原型间隔子序列的DNA结合之后,dCas9经历第二次结构再取向变为展开构象。提出这种第二次转换的作用是与sgRNA链入侵有关,或者将两个主要的Cas9核酸酶位点与两条分开的DNA链进行比对。然而,这些研究仅在含有完全匹配的原型间隔子序列的DNA的存在或不存在下进行,并且检查在部分匹配的原型间隔子位点处这些构象之间的转换可以提供对脱靶结合和裂解机制的见解。因此,除了确定相对结合倾向之外,AFM成像用于捕获由Cas9和dCas9进行的这些推定构象转换,因为它们在与原型间隔子互补的各个位点处结合DNA。我们提取了似乎在DNA(n=839)上是分离的、具有sgRNA的Cas9和dCas9蛋白的体积和最大形貌高度,并且将这些值映射到其在DNA上的对应结合位点(图3、图11A-11D和图12A-12B)。结合位点分布与完整数据集的分布几乎相同,表明这种选择是无偏的并且是代表性的。提取这些蛋白质中的每一个的记录图像(图11C-11D)并通过迭代旋转、反射和平移成对地比对。根据它们的成对平均方差形貌差异将蛋白质结构聚类(图12A-12B和表3)。这种技术的显著优势在于,它自然地使任何单价链霉亲和素或任何聚集的Cas9/dCas9蛋白聚类,这些Cas9/dCas9蛋白独立于指定为单个Cas9/dCas9分子的那些Cas9/dCas9蛋白与DNA共定位在表面上,从而允许无偏分析这些蛋白质在DNA上的结构特性。通过推定链霉亲和素分子或聚集蛋白质对结合位点分布的分析揭示它们都是稀有的且沿DNA均匀分布的,并且因此不干扰对结合位点分布的分析(图12A-12B)。
在与靶标不具有同源性的位点处,诸如在“无义”DNA底物上,具有sgRNA的dCas9分子大多数较小且为卵形(图3C(iii)和表3)。但是随着dCas9蛋白与越来越互补的靶序列结合(图3(α-δ)),它们的高度和体积相对于非特异性结合显著增加(图3D和图12A-12B,表2),在原型间隔子序列处达到最大尺寸。这种增加同样伴随着dCas9群体(图3A和图12A-12B,表2)从以较扁平和卵形构象(图3C(ii)和C3(iii),蓝色和绿色)聚类的结构移动为越来越聚类成具稍微较圆结构的那些,这些稍微较圆结构具有大的中央隆起(图3C(i),黄色)。这种后者观察到的构象很可能是先前经由TEM并且最近通过尺寸排阻色谱法观察到的展开构象,并且可能是活性状态,其中Cas9的核酸酶结构域正确定位在DNA周围,使得裂解可以最高效地发生。
催化活性Cas9经历显著的尺寸增加,因为它同样与原型间隔子序列结合(图3(ε));然而,相对于dCas9,在尺寸上存在小,但统计学上显著的降低,并且完全原型间隔子位点处Cas9的构象倾向于以较扁平(绿色)结构聚类。因为我们未同时监测DNA是否在成像时被裂解,因此不清楚这是否表示DNA裂解后的另一种构象变化或者是Cas9与dCas9之间突变差异的结果;然而,因为先前已经确定结合和链入侵为限速步骤,所以在这些测量过程中Cas9内的DNA很可能被裂解。
表3具有不同指导RNA变体的dCas9/Cas9在完全-和部分-以及非互补原型间隔子位点处的特性
a在这些位点的两个标准差内观察到的总分子。下面:如正文中图2着色的主要三个结构聚簇中的群体分数(±95%二项式置信度)(Y=黄色聚簇,G=绿色聚簇,B=浅蓝色聚簇)。图12A-12B中按照聚簇的完全分布特性。
b标准平均误差
c标准平均误差
d拒绝的高度-体积分布零假设是不同的(p>0.05;霍特林T2检验)
e在工程化DNA底物上,预期tru-gRNA仅与10MM位点处的10个PAM远端错配核苷酸的前8个(在图3D中标记的“8MM”)相互作用。
f在工程化DNA底物上,预期tru-gRNA仅与5MM位点处的5个PAM远端错配核苷酸的前3个相互作用(在图3D中标记的“3MM”)。
g参见关于校正具有tru-gRNA和hp-gRNA的蛋白质高度和体积的支持信息中的补充注释1,以便可将它们与具有sgRNA的蛋白质进行比较。
实例6
在第16原型间隔子位点处或附近指导RNA与靶DNA之间的相互作用稳定了Cas9/dCas9构象变化
AFM成像直接揭示,虽然dCas9/Cas9保留了结合具有多达十个远端错配的原型间隔子位点的显著倾向,但是与越来越互补于原型间隔子的DNA位点结合驱动dCas9/Cas9蛋白群体朝表现为活性构象的移动增加。值得注意的是,对于具有hp-gRNA的dCas9,我们也看到类似的脱靶位点与完全匹配位点之间的结构移动(表2和图13)。已知互补的PAM远端序列的存在与Cas9在DNA上的稳定性增加相关。最近还发现Cas9与单链DNA结合并且增加与原型间隔子的PAM远端互补性(从10至20个位点)导致蛋白质大小的改变增加。然后这也与Cas9活性从切口行为到完全裂解的转换相关。在此,我们可以直接确定结合到双链DNA位点上的Cas9/dCas9的体积。对单个Cas9/dCas9蛋白在双链DNA上的结构特性的分析揭示了具有越来越匹配的靶序列的稳定构象转换,这与“构象门控”机制一致,其中与这些远端位点碱基配对的sgRNA也稳定了活性构象,使得可以发生高效的裂解,而与具有多个远端错配的位点的结合使平衡远离活性结构移动(即参见图4D)。
据此,我们发现这种效应对于具有tru-gRNA的dCas9是大幅度减弱的(图3D和表3),蛋白质聚簇其内的结构群体之间具有较小的移动(图13)。另外,虽然我们发现非特异性结合的dCas9-tru-gRNA与结合在完全或部分原型间隔子位点处的那些dCas9-tru-gRNA的高度-体积特性之间存在统计差异(p<0.05;霍特林T2检验),但是在越来越匹配原型间隔子的位点(10MM、5MM和完全原型间隔子位点)处,它们的结构特性在统计学上是无区别的(图3D和表3)。最近推测,虽然入侵原型间隔子的前10bp引发Cas9的构象变化,但是指导RNA对原型间隔子的完全入侵有助于驱动进一步移动而变为完全活性状态。因此,我们假设,对于具有tru-gRNA的dCas9(相对于具有sgRNA的那些)观察到的越来越匹配的原型间隔子位点处的构象变化受到压制是这些指导RNA在PAM远端位点处的稳定性降低的结果。
为了研究sgRNA和tru-gRNA在这些位点的相对稳定性,我们进行了在链入侵过程中和之后R环的动态结构的动力学蒙特卡罗(KMC)研究,R环即为通过结合至连续DNA的区段的入侵指导RNA形成的结构,暴露了该区段的互补DNA的单链环(图4A)。关于更多详情参见补充方法。简而言之,使用Gillespie型算法,我们对结合的指导RNA对多达m个原型间隔子位点的链入侵进行建模,该链入侵为入侵(破坏原型间隔子与其互补DNA链之间碱基配对,然后用原型间隔子-指导RNA碱基对替代)与重新退火(相反)之间的逐个核苷酸依序竞争形式,分别用入侵序列依赖性速率vf和重新退火序列依赖性速率vr(图4A)。对于一阶,我们将从状态m至m+1的转换速率vf近似为与exp(-(ΔG°(m+1)RNA:DNA–ΔG°(m+1)DNA:DNA)/2RT)成正比,其中ΔG°(m+1)RNA:DNA是在位点m+1处RNA与原型间隔子之间碱基配对的自由能,并且ΔG°(m+1)DNA:DNA是在m+1处原型间隔子与其互补DNA链之间的碱基配对的自由能(R是理想气体常数,T是温度,并且添加1/2项以满足细致平衡)。vr类似地以与exp(-(ΔG°(m)DNA:DNA-ΔG°(m)RNA:DNA)/2RT)成正比的方式进行估计。这种类型的转换速率先前已用于核苷酸碱基配对和稳定性的计算研究,并且在此它们允许我们以序列依赖的方式捕获R环的一般动态学。
一般而言,RNA:DNA碱基对在能量学上比DNA:DNA碱基对更强,并且正如所料,在平衡时,我们从KMC轨迹看出指导RNA稳定地结合原型间隔子(图4C)。然而,虽然sgRNA是相当稳定的并且几乎保持完全入侵-在模拟时程的95%过程中,股仍然入侵至第19原型间隔子位点(图4B)-但是tru-gRNA在PAM远端位点处展现出原型间隔子重新退火的显著波动(图4B和4C)。因为dCas9-sgRNA与dCas9-tru-gRNA之间的唯一区别在于从指导RNA中仅截短两个5’-核苷酸,并且因为我们发现dCas9-sgRNA在含有5个PAM远端错配的位点处构象变化受到抑制,所以这些结果表明至完全活性状态的构象变化是通过在原型间隔子的第16位点附近指导RNA与原型间隔子之间的相互作用而稳定,而该稳定因tru-gRNA在该区中的不稳定性而破坏。实际上,KMC实验显示,当用tru-gRNA替代sgRNA时,对DNA的完全侵入与重新退火至第16位点之间的平均寿命降低两个数量级(图4C插图)。这一结果与先前的发现一致:在根据序列背景用具有2或3个核苷酸(nt)截短的tru-gRNA变体调节Cas9活性的情况下,而所有测试案例中的裂解性因通过4nt截短而显著减少约90%-100%,并且在5nt截短后消除。至蛋白质激活状态的构象变化是通过原型间隔子的第16位点处或附近的这些相互作用而稳定。这一发现受第14-第17原型间隔子位置处的gRNA稳定性的支持,该gRNA稳定性通过下文描述的附加KMC实验进行估计,并且与体内实验性脱靶裂解相关(见下文),而在原型间隔子位点18-20处指导RNA的稳定性并非如此。
实例7
指导RNA-原型间隔子R环的波动表明了Cas9/dCas9的错配耐受性机制和tru-gRNA导致的裂解特异性增加的机制
为了研究Cas9或dCas9可以耐受原型间隔子中的错配或变得对这些错配敏感的机制,我们使用AAVS1原型间隔子位点进行了一系列KMC实验,在AAVS1原型间隔子位点中引入了一个或两个PAM远端(离PAM≥10bp)错配(图5)。与PAM近端错配相比,Cas9通常更耐受PAM远端错配。然而,Hsu等人(2013)自然生物技术,31,827-832根据序列背景、错配类型和错配位点鉴定了在含有PAM远端错配的原型间隔子处估计的Cas9裂解率的显著且变化的差异。基于我们的AFM和早期的KMC实验,我们假设裂解率的差异可能类似地是指导RNA在原型间隔子的第16位点附近的稳定性不同的结果。对于这些模拟,我们仅检查了具有将导致分离的rG·dG、rC·dC、rA·dA和rU·dT错配的原型间隔子-指导RNA对的序列,针对这些序列的序列背景依赖性热力学数据是最完整的并适用于我们的KMC模型。预期这些错配碱基对的效应不会显著降低sgRNA与原型间隔子之间的总体结合能(表4);例如,单个rG·dG、rC·dC、rA·dA和rU·dT错配将RNA:DNA解链温度平均降低1.7℃。而是,预期它们的效应通过阻碍错配处的链置换而是动力学性质的而非热力学性质的。因此,我们从第10原型间隔子位点(初始R环长度m=10)(诸如在链入侵过程中将要发生的)起始动力学蒙特卡罗实验。
表4用于相关性分析的来自Hsu等人(2013)自然生物技术,31,827-832的序列和最大似然估计(MLE)切割频率(靶序列中的错配位点加粗)。
然后进行KMC实验以研究在PAM远端错配存在下链入侵的动力学。在所有情况下(每种情况1000次试验),即使当存在错配时指导RNA仍保持相当稳定地结合(即未观察到完全解链),并且常常能够快速绕过这些位点以完成完全入侵(图5C和图14A-14C),但是总体链入侵的平均第一次通过时间变化显著,这取决于错配位点的位置(图14A-14C)。R环在入侵过程中相当稳定(图5A),因为即使在多个错配存在下sgRNA常常也能够保持完全入侵。定性地看,结果与之前对dCas9/Cas9对错配靶标的结合和裂解的体外研究的那些结果类似。然而,在tru-gRNA的情况下(图5B),R环常常在错配位点后面被捕获。跨越错配的平均首次通过时间对于sgRNA和tru-gRNA是类似的(图14A-14C),但是对KMC的时程的检查揭示出,由于tru-gRNA的R环的固有波动性,tru-gRNA常常在错配之后很快被“重新捕获”(图5C)。对于sgRNA,这种重新捕获的频率要低得多。因此,结合AFM成像,KMC实验的结果表明tru-gRNA增加的特异性的起源不在于结合过程中的区别,而是其R环的波动性(图4D),使得它甚至在最初绕过错配后在错配之后被重复地捕获,使得Cas9不太可能呈现活性构象。对于sgRNA,一旦绕过错配,它可以相对较小的扰动保持完全侵入,这表明了错配耐受性的机制。
实例8
指导RNA与原型间隔子的第14-17位的相互作用的稳定性与实验性脱靶Cas9裂解率相关,而总体指导RNA-原型间隔子结合能并非如此
为了验证在体内R环在原型间隔子的第16位处或附近的稳定性(由AFM研究暗示该稳定性与Cas9的构象变化有联系)是否与Cas9活性相关联,我们进行了R环稳定性对由Hsu等人(2013)自然生物技术,31,827-832使用的序列的动力学蒙特卡罗(KMC)分析。Hsu等人(2013)自然生物技术,31,827-832的数据集合由在含有各种点突变的15种不同原型间隔子靶标处的裂解频率相对于为了研究Cas9的裂解特异性而执行的指导RNA的测量值组成。该数据集合含有在PAM远端区中具有rG·dG、rC·dC、rA·dA和rU·dT类型的单一分离错配的136种原型间隔子-指导RNA对(表4),我们使用KMC法、在R环大小m=10处起始来研究原型间隔子-指导RNA对以模拟入侵。包含来自这个集合的单一错配位点使它们的总体指导RNA-原型间隔子结合自由能的量值相对于完全匹配的靶标平均减少了约6%,但是如上所述,对于起源并不明显的这些指导RNA原型间隔子对观察到广泛分布的Cas9裂解频率。
对于每种指导RNA经1000次试验确定将RNA稳定结合原型间隔子的每个位点的时间平均分数,然后将其与Cas9的最大似然估计的裂解活性相关联(表4,图6和图15)。发现第16原型间隔子位置处的指导RNA稳定性与报告的脱靶裂解活性之间有中等(0.433)但统计学上显著(p<1×10-6)相关性。值得注意的是,未发现裂解率与预测的单独DNA:RNA结合能之间有统计学上显著的相关性(0.0786;p=0.3631)(图6A和6B)。除了第16位处的R环稳定性之外,发现第17原型间隔子位点的稳定性与报告的裂解也有显著相关性(表5),但是对于≥第18位点的位点,情况并非如此(图6)。虽然在此提出的动力学蒙特卡罗模型是基于一个相对简单的链入侵模型,但这些结果进一步表明,原型间隔子的第16-17位点的稳定性,并且因此我们观察到的伴随构象变化与Cas9体内裂解活性相关联(图4D)。
表5在PAM远端区(≥第10原型间隔子位点)a含有单一rG·dG、rC·dC、rA dA和rU·dT错配的靶位点处的实验性切割频率(Hsu等人(2013)自然生物技术,31,827-832)与指导RNA-原型间隔子稳定性的测量值之间的相关性
an=136。
b详见表4。
c详见正文。Max(t)=100。
由于观察到dCas9与tru-gRNA和sgRNA之间的结构差异,我们将大多数分析局限于与原型间隔子的第16-第18核苷酸的相互作用。然而,我们也观察到裂解与第14和第15原型间隔子位点的稳定性之间的相关性强度和统计学显著性增加(图6),其中第14位点处的相关性最显著。因为R环是动态结构(图4D),所以可能与这些位点的相互作用是那些被认为造成DNA裂解的关键相互作用。将指导RNA截短4个或5个核苷酸可以通过以tru-gRNA使R环在第16-第17位点处失稳的大致相同方式使R环在第14或第15位置处充分地失稳来消除裂解活性。然而,因为在我们的模型中无论第16位点何时由sgRNA结合,第14和第15位点必然被入侵,所以很可能这些位置具有额外的信息,因为在绕过错配位点之前它们与sgRNA从双链体解离的概率更强烈地反相关(图6Ai和图16B),这是裂解将不能发生的另一机制。目前,没有晶体学证据将链入侵与观察到的被认为授权裂解的构象变化直接关联起来。然而,基于由在此呈现的AFM实验提供的证据和动力学蒙特卡罗模拟的结果,我们得出结论,在入侵过程中指导RNA在原型间隔子的第14-第17位点的稳定性对于此构象变化以及最终Cas9裂解的特异性至关重要。
此外,R环作为处于链侵入与DNA重新退火之间的竞争中的动态结构可用于理解脱靶裂解和错配耐受性的机制。未发现裂解率与预测的单独DNA-RNA结合能之间有统计学上显著的相关性(图6B),这表明当尝试确定脱离位点处的Cas9活性时可以考虑链入侵的动力学。虽然当从指导RNA截短4个或5个核苷酸时,裂解消除,但Cas9仍能够裂解具有多达6个远端错配位点的DNA。在这些PAM远端位点处的瞬时非特异性相互作用可以充分稳定裂解所需的构象移动。因为我们看到了少部分的dCas9-sgRNA群体在与完全原型间隔子处的那些群体具有类似结构的部分原型间隔子位点处(黄色,图3C(i)),所以该群体可以代表处于瞬时稳定的活性构象的Cas9分数。因此,该群体可能是造成脱靶裂解的原因。
虽然Cas9/dCas9结合特异性主要是由与PAM近端区域的相互作用来确定,但是DNA裂解特异性很可能是由至活化结构的构象变化控制的,该活化结构通过指导RNA在原型间隔子的第14-第17bp区处的相互作用而稳定(图4D)。动力学蒙特卡洛实验揭示,即使当指导RNA保持稳定结合时,在指导RNA的链入侵过程中形成的R环也可以是相当动态的结构,这表明了tru-gRNA特异性改善的机制,以及经由指导RNA-原型间隔子在错配位点周围的关键区处的瞬时稳定性进行的脱靶裂解的起源。对每种sgRNA变体对Cas9/dCas9特异性的影响的提议机制总结于图7中。
使用AFM,发现HP-gRNA显著减弱或消除在同源靶标处的特异性结合。hp-gRNA可能对于在潜在的生物学和医学应用中调节dCas9结合亲和力和特异性有价值。具体地,基于Cas9结合通道的狭窄几何形状,未打开发夹在错配原型间隔子中的存在可能抑制Cas9发生构象变化至活性状态。在结合后hp-gRNA中发夹的打开也可用作体内结合依赖性信号,例如仅在结合特异性位点后使动态DNA/RNA结构成核。
先前的指导RNA截短研究提出,当仅需要16个核苷酸的指导序列用于裂解并且附加核苷酸(>18)未改善体内裂解特异性时为什么天然Cas9系统采用靶向20bp原型间隔子位点的crRNA的问题。这些结果表明,结合第19和第20原型间隔子位点的“额外”5’核苷酸的存在缓冲了原型间隔子的关键第14-第17位点处的瞬时重新退火,从而允许至活性状态的高效构象变化和随后的裂解发生。AFM和KMC实验的结果表明,在完全入侵后指导RNA在这些位点处的稳定性使Cas9的平衡结构向活性构象移动(图4A),而“截短的”指导RNA的R环的波动性降低了使平衡向活性状态移动的压力。具有sgRNA的Cas9相比于具有tru-gRNA的混杂活性也可能在其作为原核生物中的适应性免疫药剂针对入侵性DNA的作用方面具有进化优势,因为入侵噬菌体的DNA在Cas9靶向的位点处经历快速点突变,以便避免裂解。
指导RNA序列用于体内Cas9/dCas9应用的设计主要集中在避免基因组中含有具有类似序列的多个位点的靶标。然而,最近的探索脱靶裂解的研究发现目前用于预测脱靶活性的方法在很大程度上是无效的。入侵过程中R环的稳定性与脱靶裂解率的相关性明显好于单独指导RNA-原型间隔子结合能或错配的位置(指导RNA设计中使用的另一个重要标准,表3)。入侵起始后的较短时间的R环的稳定性与实验性裂解率的相关性远好于KMC实验中的长期稳定性(图16A),这表明链入侵的动力学是脱靶活性预测的一个因素。
实例9
体内测试
将优化gRNA活性在活细胞进行测试以研究dCas9结合特异性。针对人类基因组中的四个靶位置(原型间隔子)中的每一个设计了若干种发夹gRNA(hp-gRNA)(图17和图18)。一个靶标是在肌营养不良蛋白基因中(图19-23),另一个靶标是在EMX1基因中(图24-29和图44),并且两个靶标是在VEGFA基因中,标记为VEGFA1(图30-37)和VEGFA3(图38-43)。所有实验均在HEK293T细胞中完成。
将附加核苷酸(nt)添加到完全指导RNA(gRNA,全长20nt)的5’端,并设计成通过与5’-原型间隔子靶向核苷酸或原型间隔子靶向区的中间或3’端的核苷酸杂交来形成发夹和二级结构,以调节Cas9对原型间隔子的结合和裂解活性。
VEGFA1靶向hp-gRNA的一种二级结构使用本文所述的方法通过计算设计,以防止在已知脱靶位点处结合,同时允许结合到完全原型间隔子(图44A-44C)。将hp-gRNA选择为具有大于或等于完全gRNA于在靶位点处的结合寿命的结合寿命,和小于或等于全长gRNA在前3个脱靶位点处的结合寿命的结合寿命。其他5’结构被设计成包含dG-rU摆动碱基对以调节hp-gRNA的二级结构的能量学,或添加到截短gRNA(tru-gRNA,<20nt)的末端,这些截短gRNA本身已经显示促进Cas9活性的更高特异性。
细胞工作。对于深度测序分析,用表达Cas9和感兴趣的gRNA的质粒转染293T细胞。将细胞温育4天,使Cas9和gRNA发挥其最大活性。然后收获细胞并纯化其基因组DNA。使用在文献中已得到非常好的表征的gRNA(即它们的在靶位点和脱靶位点是已知的)。
Surveyor测定。与深度测序相比,surveyor测定的通过量较低并且灵敏度较低。然而,surveyor测定在数据分析上更快并且技术更少,提供凝胶图像。因此,进行surveyor以作为第一道,并且将最佳条件使用深度测序一式三份地进行分析。深度测序和Surveyor均是量化由Cas9+gRNA引起的突变事件的方法。
用于Surveyor的细胞工作与上文所述的相同。将基因组DNA纯化后,设计引物以扩增靶位点。在这个实验中使用了200k细胞池,并且因为DNA修复是随机的,它们中的每一个都具有不同的突变。将200k个细胞上的位点扩增以产生异源PCR产物:由于每个细胞随机(即随机地,易错的)修复Cas9切割位点,所以一些扩增子具有缺失,一些扩增子具有插入,并且一些扩增子是野生型和未修饰的。
将异源PCR池加热和修复,并且在一些情况下不同链彼此退火:野生型DNA链可能结合具有插入的DNA,或者插入物可能结合缺失物。当这种情况发生时,形成少量“气泡”,并且该结构被称为DNA异源双链体(参见图46)。
使用surveyor核酸酶以通过消化并裂解它们来检测这些异源双链。然后DNA裂解是Cas9突变活性的代用指标(proxy)。将PCR池在凝胶上分离,并且使用这些消化带的强度来量化Cas9活性的速率。
深度测序。将引物设计用于扩增这些已知的靶/脱靶。在该PCR中使用高保真聚合酶。Illumina衔接子也出现在这些引物上,使得它们可以被条码化并装载到Illumina Mi-Seq平台上。在附图和附图简述中描述了发夹数、靶标数、脱靶数、测序覆盖率等。在用于分析中的样品上获得了良好覆盖率。平均读取数/样本数为20,000。具有最少读取数的样本为1,700。非常少数的靶标没有产生足够的比对读取,并且未包括在分析中。
使用CRISPResso软件分析所得测序数据(Pinello等人自然生物技术(2016)34(7):695-697)),该软件将深度测序读取与已知脱靶或在靶位置的特异性位点比对。该软件的结果与内部脚本进行了比较,其中将深度测序读取与人类基因组进行了全局比对,并且相关性很好。使用CRISPResso对突变率进行量化,并且将所得数据展现在针对每个靶基因展示的直方图中。
首先使用Surveyor测定测试设计,以使用标准gRNA测试在HEK细胞中表达Cas9和hp-gRNA之后在靶向的已知靶位点和脱靶位点处的插入缺失(参见表6)。与标准gRNA和截短gRNA(tru-gRNA)比较这些位点处的活性。在下面将这些示出为示出了Surveyor核酸酶对经PCR的基因组DNA的裂解的凝胶,其中裂解指示Cas9的诱变。
表6
选择最有前景的hp-gRNA设计以用于使用下一代测序进行其他定量分析以在HEK细胞中评价在靶位点和脱靶位点处的Cas9活性。特异性被定义为在靶命中数/总和(脱靶命中数)。
虽然当使用hp-gRNA时Cas9活性通常相等或稍微下降,但是选择用于深度测序实验的每种hp-gRNA相比于完全gRNA显示出增强的特异性,并且就特异性而言在大多数情况下等于或大于tru-gRNA。
在一种情况下,靶向EMX1的hp-gRNA发夹相比于完全gRNA展现出>6000倍的特异性改善(与之相对,tru-gRNA相比于gRNA具有≈100改善)。具有使用内部算法计算设计的二级结构的VEGFA1靶向hp-gRNA就特异性而言大大优于tru-gRNA活性(相比于gRNA的18倍相对于3倍改善)。这些hp-gRNA与化脓性链球菌Cas9联合测试。图44A-44C示出了使用来自化脓性链球菌的Cas9的EMX1靶向hp-gRNA的Surveyor测定,该测定展现出在靶活性并且没有展现出可测的脱靶活性,这与显示出显著的脱靶活性的tru-gRNA形成对比。
实例10
用于CRISPR/Cpf1系统的hp-gRNA
设计实验以再现Kleinstiver等人,自然生物技术(2016)34:869-874的结果。Kleinstiver等人使用全长gRNA显示毛螺旋菌科Cpf1易于切割具有除PAM远端位点之外的8-9个核苷酸处的错配的脱靶位点,通过使用在不同位置于靶位点具有错配的gRNA(图47)。在该实例中,使用本发明的方法如上所述那样设计并测试与V型CRISPR-Cas系统CRISPR-Cpf1一起使用的发夹指导RNA。
为了测试Cpf1在具有和不具有额外二级结构元件的情况下的脱靶活性,将DNMT1基因(TTTC CTGATGGGTCCATGTCTGTTACTC(SEQ ID NO:330))是靶向用于Cpf1裂解。通过以下方式测试“脱靶活性”:使用在位置9具有错配核苷酸的指导RNA,例如CTGATGGTgCATGTCTGTTA(SEQ ID NO:331),使用20个核苷酸长的全长指导RNA或17个核苷酸长的截短gRNA,CTGATGGTgCATGTCTG(SEQ ID NO:332)。将9个核苷酸长的二级结构元件添加到Cpf1指导RNA的3’端以与错配核苷酸周围的指导RNA的区段杂交,其中在这种情况下,“接头”元件包括原型间隔子靶向区段的43'nt,即CTGATGGTgCATGTCT GTTA AGACATGcACCA(SEQID NO:333)和CTGATGGTgCATG TCTG CATGcACCA(SEQ ID NO:334)。Surveyor测定显示,包含这些额外的3’元件减小或消除了由完全或截短gRNA展现出的DNMT1位点处的脱靶活性。
将HP-gRNA设计成具有“内部”发夹设计,其中PAM远端的4核苷酸充当环。将发夹添加到gRNA的3’端。表7示出了hp-gRNA的序列,在该序列中具有分离该区的空间。错配以小写字母显示。
这些HP-gRNA的Surveyor结果示于图48中并且显示向3’端添加发夹消除了脱靶活性。泳道1示出了对照;泳道2示出了含有在位置9处的错配核苷酸的全长gRNA;泳道3示出了含有在位置9处的错配核苷酸和额外的3’发夹结构的全长gRNA;泳道4示出了含有在位置9处的错配核苷酸的截短gRNA;并且泳道5示出了含有在位置9处的错配核苷酸和额外的3’发夹结构的截短gRNA。表7中也示出了所使用的Surveyor引物。
当使用正常指导RNA时Cpf1耐受8-10个核苷酸处的错配,并且在这些脱靶位点处裂解DNA(图47)。如图48所示,Cpf1hp-gRNA能够消除Kleinstiver中显示的脱靶活性,而截短gRNA不能。
表7
应当理解,前面的详细描述和所附实例仅仅是说明性的,而不应看作是对本发明范围的限制,本发明的范围仅由随附权利要求及其等同物来限定。
对这些披露的实例的各种改变和修改将对本领域技术人员是清楚的。可以在不脱离本发明的精神和范围的情况下做出此类改变和修改,包括但不限于与本发明的化学结构、取代基、衍生物、中间体、合成、组合物、配制品或使用方法有关的那些。
出于完整性的原因,本发明的各个方面将在以下编号的条项中阐述:
条项1.一种产生优化指导RNA(gRNA)的方法,该方法包括:a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;c)确定该全长gRNA的至少一个或多个脱靶位点;d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的该多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的该多核苷酸序列的5’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的5’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;e)计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;f)将该第一gRNA在该原型间隔子和/或脱靶位点的该估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的该估计寿命进行比较;g)将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);h)基于满足设计标准的gRNA序列鉴定优化gRNA;并且i)在体内测试该优化gRNA以确定结合特异性。
条项2.一种产生优化指导RNA(gRNA)的方法,该方法包括:a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;c)确定该全长gRNA的至少一个或多个脱靶位点;d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的该多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的该多核苷酸序列的3’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的3’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;e)计算入侵动力学和该第一gRNA保持入侵在该原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟这些入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列之间的能量差来逐个核苷酸地估计入侵动态;f)将该第一gRNA在该原型间隔子和/或脱靶位点的该估计寿命与该全长gRNA或截短gRNA(tru-gRNA)在该原型间隔子和/或脱靶位点处的该估计寿命进行比较;g)将该接头中的0至N个核苷酸和第一gRNA中的0至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);h)基于满足设计标准的gRNA序列鉴定优化gRNA;并且i)在体内测试该优化gRNA以确定结合特异性。
条项3.如条项1或2所述的方法,其中不同gRNA的进一步入侵的能量学通过测定以下项中的至少一项的能量学来测定:(I)破坏DNA-DNA碱基配对,(II)形成RNA-DNA碱基对,(III)由破坏或形成未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏与该原型间隔子互补的置换DNA链与不参与二级结构的任何不成对指导RNA核苷酸之间的相互作用。
条项4.如条项1-3中任一项所述的方法,其中该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列的能量学通过测定以下项中的至少一项的能量学来测定:(I)形成DNA-DNA碱基配对,(II)破坏RNA-DNA碱基对,(III)由破坏或形成新近未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏与该原型间隔子互补的置换DNA链与不参与二级结构的任何不成对指导RNA核苷酸之间的相互作用。
条项5.如条项3或4所述的方法,该方法进一步包括根据以下项中的至少一项确定能量考虑因素:(V)跨越错配的碱基配对,(VI)与Cas9蛋白的相互作用,和/或(VII)另外的启发法,其中这些另外的启发法涉及结合寿命、入侵程度、入侵指导RNA的稳定性或gRNA入侵至Cas9裂解活性的其他计算/模拟特性。
条项6.如条项1-5中任一项所述的方法,其中该全长gRNA包含约15至20个核苷酸。
条项7.如条项1-5中任一项所述的方法,其中M在1与20之间。
条项8.如条项7所述的方法,其中M在4与10之间。
条项9.如条项1-8中任一项所述的方法,其中该RNA区段包含互补于该原型间隔子靶向区段的2至15个核苷酸。
条项10.如条项1-9中任一项所述的方法,其中N在1与20之间。
条项11.如条项10所述的方法,其中N在3与10之间。
条项12.如条项1-11中任一项所述的方法,其中该RNA区段和/或原型间隔子靶向序列提供二级结构。
条项13.如条项12所述的方法,其中该二级结构通过使该原型间隔子靶向序列与该RNA区段部分杂交而形成。
条项14.如条项13所述的方法,其中该二级结构通过破坏该优化gRNA对该原型间隔子双链体或该脱靶双链体的入侵而调节DNA结合或Cas9裂解。
条项15.如条项12-14中任一项所述的方法,其中该二级结构通过以下方式形成:使该RNA区段的全部或部分与该原型间隔子靶向序列或区段的5’端中核苷酸、在该原型间隔子靶向序列或区段的中间的核苷酸,和/或在该原型间隔子靶向序列或区段的3’端的核苷酸杂交。
条项16.如条项12-15中任一项所述的方法,其中该二级结构是发夹。
条项17.如条项12-16中任一项所述的方法,其中该二级结构在室温或37℃下是稳定的。
条项18.如条项12-17中任一项所述的方法,其中该二级结构的总平衡自由能在室温或37℃下小于约2kcal/mol。
条项19.如条项1-18中任一项所述的方法,其中该RNA区段与该原型间隔子靶向序列或区段的至少两个核苷酸杂交或形成非规范碱基对。
条项20.如条项19所述的方法,其中该非规范碱基对是rU-rG。
条项21.如条项1-20中任一项所述的方法,其中该优化gRNA与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统一起用于细胞中。
条项22.如条项1-21中任一项所述的方法,其中该二级结构将该优化gRNA保护在该基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统内以防止在该细胞中降解。
条项23.如条项1-22中任一项所述的方法,其中1-20个核苷酸被随机化在该接头中。
条项24.如条项1-23中任一项所述的方法,其中1-20个核苷酸被随机化在该RNA区段中。
条项25.如条项1-24中任一项所述的方法,其中将步骤(g)重复X次,从而产生X数目的gRNA,并对每个X数目的gRNA重复步骤(e),其中X在0至20之间。
条项26.如条项1-25中任一项所述的方法,其中该入侵动力学和该寿命使用动力学蒙特卡罗法或吉莱斯皮算法计算。
条项27.如条项1-26中任一项所述的方法,其中该入侵动力学是该指导RNA入侵该原型间隔子双链体至完全入侵以使得该原型间隔子被完全入侵的速率,或者结合该gRNA的原型间隔子DNA的区段在从其互补链移位并从其PAM近端区至完全入侵逐个核苷酸地结合该指导RNA时的扩增速率。
条项28.如条项1-27中任一项所述的方法,其中该设计标准包括特异性、结合寿命调节和/或估计的裂解特异性。
条项29.如条项28所述的方法,其中该设计标准包括优化gRNA具有大于或等于全长gRNA对在靶位点的结合寿命的结合寿命、或者小于或等于全长gRNA对脱靶位点的结合寿命的结合寿命。
条项30.如条项29所述的方法,其中该设计标准包括优化gRNA具有小于或等于全长gRNA对至少三个脱靶位点的结合寿命的结合寿命,其中这些脱靶位点被预测为最靠近的脱靶位点或被预测为与这些在靶位点具有最高同一性。
条项31.如条项28所述的方法,其中该设计标准包括在脱靶位点处的寿命或裂解率小于或等于全长gRNA或截短gRNA在这些脱靶位点处的寿命或裂解率和/或预测在靶活性率大于全长gRNA或截短gRNA的该预测在靶活性率的10%。
条项32.如条项1-31中任一项所述的方法,其中该优化gRNA在步骤i)中使用surveyor测定、下一代测序技术或GUIDE-Seq进行测试。
条项33.如条项1-32中任一项所述的方法,其中该优化gRNA被设计以最小化在脱靶位点处的结合并以允许结合原型间隔子序列。
条项34.如条项1-33中任一项所述的方法,其中该脱靶位点是已知或预测的脱靶位点。
条项35.如条项1-34中任一项所述的方法,其中该全长gRNA靶向哺乳动物基因。
条项36.如条项1-35中任一项所述的方法,其中该靶基因包括内源性靶基因或转基因。
条项37.如条项1-36中任一项所述的方法,其中该靶基因包括疾病相关基因。
条项38.如条项1-37中任一项所述的方法,其中该靶基因是DMD、EMX1或VEGFA基因。
条项39.如条项38所述的方法,其中该VEGFA基因是VEGFA1或VEGFA3。
条项40.一种优化gRNA,该优化gRNA是通过如条项1-39中任一项所述的方法产生的。
条项41.如条项40所述的优化gRNA,其中该gRNA可以在这些位点之间具有极小热力学能量差的情况下区分在靶位点和脱靶位点。
条项42.如条项40或41所述的优化gRNA,其中该优化gRNA调节到该原型间隔子中的链入侵。
条项43.如条项40-42中任一项所述的优化gRNA,其中该优化gRNA包含SEQ ID NO:149-315、321-323和326-329中至少一个的核苷酸序列。
条项44.一种分离的多核苷酸,该多核苷酸编码如条项40-43中任一项所述的优化gRNA。
条项45.一种载体,该载体包含如条项44所述的分离的多核苷酸。
条项46.一种细胞,该细胞包含如条项44所述的分离的多核苷酸或如条项45所述的载体。
条项47.一种试剂盒,该试剂盒包含如条项44所述的分离的多核苷酸、如条项45所述的载体、或如条项46所述的细胞。
条项48.一种在靶细胞或受试者中进行表观基因组编辑的方法,该方法包括使细胞或受试者与有效量的如条项40-43中任一项所述的优化gRNA分子或如条项44所述的分离的多核苷酸和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
条项49.一种在靶细胞或受试者中进行位点特异性DNA裂解的方法,该方法包括使细胞或受试者与有效量的如条项40-43中任一项所述的优化gRNA分子或如条项44所述的分离的多核苷酸和融合蛋白或Cas9蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
条项50.一种在细胞中进行基因组编辑的方法,该方法包括向该细胞给予有效量的如条项40-43中任一项所述的优化gRNA分子或如条项44所述的分离的多核苷酸和融合蛋白,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
条项51.如条项50所述的方法,其中该基因组编辑包括纠正突变基因或插入转基因。
条项52.如条项51所述的方法,其中纠正突变基因包括缺失、重排或替代该突变基因。
条项53.如条项51或52中任一项所述的方法,其中纠正该突变基因包括核酸酶介导的非同源末端连接或同源定向修复。
条项54.一种在细胞中调节基因表达的方法,该方法包括使该细胞与有效量的如条项40-43中任一项所述的优化gRNA分子或如条项44所述的分离的多核苷酸和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性。
条项55.如条项54所述的方法,其中当该至少一个靶基因的基因表达相比于该至少一个靶基因的正常基因表达水平是增加或减少的时,该至少一个靶基因的该基因表达得以调节。
条项56.如条项54或55所述的方法,其中该融合蛋白包含dCas9结构域和转录激活因子。
条项57.如条项56所述的方法,其中该融合蛋白包含SEQ ID NO:2的氨基酸序列。
条项58.如条项54或55所述的方法,其中该融合蛋白包含dCas9结构域和转录阻遏物。
条项59.如条项58所述的方法,其中该融合蛋白包含SEQ ID NO:3的氨基酸序列。
条项60.如条项54或55所述的方法,其中该融合蛋白包含dCas9结构域和位点特异性核酸酶。
条项61.如条项48-60中任一项所述的方法,其中该优化gRNA由多核苷酸序列编码并包装到慢病毒载体中。
条项62.如条项61所述的方法,其中该慢病毒载体包含表达盒,该表达盒包含与编码该gRNA的多核苷酸序列可操作地连接的启动子。
条项63.如条项62所述的方法,其中可操作地连接至编码该优化gRNA的多核苷酸的该启动子是诱导型的。
条项64.如条项61-63中任一项所述的方法,其中该慢病毒载体进一步包含编码该Cas9蛋白或融合蛋白的多核苷酸序列。
条项65.如条项48-64中任一项所述的方法,其中该至少一个靶基因是疾病相关基因。
条项66.如条项48-65中任一项所述的方法,其中该靶细胞是真核细胞。
条项67.如条项48-66中任一项所述的方法,其中该靶细胞是哺乳动物细胞。
如条项48-67中任一项所述的方法,其中该靶细胞是HEK293T细胞。
附录-序列
化脓链球菌Cas 9(具有D10A、H840A)(SEQ ID NO:1)
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
dCas9p300核心:(Addgene质粒61357)氨基酸序列;3X“Flag”表位,核内定位序列,化脓链球菌Cas9(D10A、H840A),p300核心效应器,“HA”表位(SEQ ID NO:2)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGRGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDPIAGSKASPKKKRKVGRAIFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDYPYDVPDYAS
dCas9KRAB(SEQIDNO:3)
MDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGRGMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVASDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQILYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPWLVEREIHQETHPDSETAFEIKSSVPKKKRKVAS
Nm-dCas9p300核心:(Addgene质粒61365)氨基酸序列;脑膜炎奈瑟菌Cas9(D16A、D587A、H588A、N611A),核内定位序列,p300核心效应器,“HA”表位(SEQ ID NO:5)
MAAFKPNPINYILGLAIGIASVGWAMVEIDEDENPICLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRARRLLKREGVLQAADFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVADNAHALQTGDFRTPAELALNKFEKESGHIRNQRGDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIAAALPFSRTWDDSFNNKVLVLGSEAQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTPEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVRSRADPKKKRKVEASGRAIFKPEELRQALMPTLEALYRQDPESLPFRQPVDPQLLGIPDYFDIVKSPMDLSTIKRKLDTGQYQEPWQYVDDIWLMFNNAWLYNRKTSRVYKYCSKLSEVFEQEIDPVMQSLGYCCGRKLEFSPQTLCCYGKQLCTIPRDATYYSYQNRYHFCEKCFNEIQGESVSLGDDPSQPQTTINKEQFSKRKNDTLDPELFVECTECGRKMHQICVLHHEIIWPAGFVCDGCLKKSARTRKENKFSAKRLPSTRLGTFLENRVNDFLRRQNHPESGEVTVRVVHASDKTVEVKPGMKARFVDSGEMAESFPYRTKALFAFEEIDGVDLCFFGMHVQEYGSDCPPPNQRRVYISYLDSVHFFRPKCLRTAVYHEILIGYLEYVKKLGYTTGHIWACPPSEGDDYIFHCHPPDQKIPKPKRLQEWYKKMLDKAVSERIVHDYKDIFKQATEDRLTSAKELPYFEGDFWPNVLEESIKELEQEEEERKREENTSNESTDVTKGDSKNAKKKNNKKTSKNKSSLSRGNKKKPGMPNVSNDLSQKLYATMEKHKEVFFVIRLIAGPAANSLPPIVDPDPLIPCDLMDGRDAFLTLARDKHLEFSSLRRAQWSTMCMLVELHTQSQDYPYDVPDYAS。
序列表
<110> 杜克大学(DUKE UNIVERSITY)
<120> 使用RNA指导型内切核酸酶改善基因组工程特异性的组合物和方法
<130> 028193-9240-WO00
<140> PCT/US2016/048798
<141> 2016-08-25
<150> 62/209,466
<151> 2015-08-25
<160> 348
<170> PatentIn 3.5版
<210> 1
<211> 1368
<212> PRT
<213> 化脓链球菌
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 2048
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 2
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Arg Gly Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr
35 40 45
Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser
50 55 60
Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
65 70 75 80
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
85 90 95
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
100 105 110
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
115 120 125
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
130 135 140
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
145 150 155 160
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
165 170 175
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
180 185 190
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
195 200 205
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
210 215 220
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
225 230 235 240
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
245 250 255
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
260 265 270
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
275 280 285
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
290 295 300
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
305 310 315 320
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
325 330 335
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
340 345 350
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
355 360 365
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
370 375 380
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
385 390 395 400
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
405 410 415
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
420 425 430
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
435 440 445
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
450 455 460
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
465 470 475 480
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
485 490 495
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
500 505 510
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
515 520 525
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
530 535 540
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
545 550 555 560
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
565 570 575
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
580 585 590
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
595 600 605
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
610 615 620
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
625 630 635 640
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
645 650 655
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
660 665 670
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
675 680 685
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
690 695 700
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
705 710 715 720
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
725 730 735
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
740 745 750
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
755 760 765
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
770 775 780
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
785 790 795 800
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met
805 810 815
Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
820 825 830
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
835 840 845
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
850 855 860
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
865 870 875 880
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
885 890 895
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
900 905 910
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
915 920 925
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
930 935 940
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
945 950 955 960
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
965 970 975
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
980 985 990
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
995 1000 1005
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1010 1015 1020
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1025 1030 1035
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1040 1045 1050
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1055 1060 1065
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1070 1075 1080
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1085 1090 1095
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1100 1105 1110
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1115 1120 1125
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1130 1135 1140
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1145 1150 1155
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1160 1165 1170
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1175 1180 1185
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1190 1195 1200
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1205 1210 1215
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1220 1225 1230
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1235 1240 1245
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1250 1255 1260
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1265 1270 1275
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1280 1285 1290
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1295 1300 1305
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1310 1315 1320
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1325 1330 1335
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1340 1345 1350
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1355 1360 1365
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1370 1375 1380
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1385 1390 1395
Gln Leu Gly Gly Asp Pro Ile Ala Gly Ser Lys Ala Ser Pro Lys
1400 1405 1410
Lys Lys Arg Lys Val Gly Arg Ala Ile Phe Lys Pro Glu Glu Leu
1415 1420 1425
Arg Gln Ala Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp
1430 1435 1440
Pro Glu Ser Leu Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu
1445 1450 1455
Gly Ile Pro Asp Tyr Phe Asp Ile Val Lys Ser Pro Met Asp Leu
1460 1465 1470
Ser Thr Ile Lys Arg Lys Leu Asp Thr Gly Gln Tyr Gln Glu Pro
1475 1480 1485
Trp Gln Tyr Val Asp Asp Ile Trp Leu Met Phe Asn Asn Ala Trp
1490 1495 1500
Leu Tyr Asn Arg Lys Thr Ser Arg Val Tyr Lys Tyr Cys Ser Lys
1505 1510 1515
Leu Ser Glu Val Phe Glu Gln Glu Ile Asp Pro Val Met Gln Ser
1520 1525 1530
Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu Phe Ser Pro Gln Thr
1535 1540 1545
Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile Pro Arg Asp Ala
1550 1555 1560
Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys Glu Lys Cys
1565 1570 1575
Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp Asp Pro
1580 1585 1590
Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys Arg
1595 1600 1605
Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr Glu
1610 1615 1620
Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu Ile
1625 1630 1635
Ile Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys Ser
1640 1645 1650
Ala Arg Thr Arg Lys Glu Asn Lys Phe Ser Ala Lys Arg Leu Pro
1655 1660 1665
Ser Thr Arg Leu Gly Thr Phe Leu Glu Asn Arg Val Asn Asp Phe
1670 1675 1680
Leu Arg Arg Gln Asn His Pro Glu Ser Gly Glu Val Thr Val Arg
1685 1690 1695
Val Val His Ala Ser Asp Lys Thr Val Glu Val Lys Pro Gly Met
1700 1705 1710
Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala Glu Ser Phe Pro
1715 1720 1725
Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile Asp Gly Val
1730 1735 1740
Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly Ser Asp
1745 1750 1755
Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu Asp
1760 1765 1770
Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val Tyr
1775 1780 1785
His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly
1790 1795 1800
Tyr Thr Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp
1805 1810 1815
Asp Tyr Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys
1820 1825 1830
Pro Lys Arg Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala
1835 1840 1845
Val Ser Glu Arg Ile Val His Asp Tyr Lys Asp Ile Phe Lys Gln
1850 1855 1860
Ala Thr Glu Asp Arg Leu Thr Ser Ala Lys Glu Leu Pro Tyr Phe
1865 1870 1875
Glu Gly Asp Phe Trp Pro Asn Val Leu Glu Glu Ser Ile Lys Glu
1880 1885 1890
Leu Glu Gln Glu Glu Glu Glu Arg Lys Arg Glu Glu Asn Thr Ser
1895 1900 1905
Asn Glu Ser Thr Asp Val Thr Lys Gly Asp Ser Lys Asn Ala Lys
1910 1915 1920
Lys Lys Asn Asn Lys Lys Thr Ser Lys Asn Lys Ser Ser Leu Ser
1925 1930 1935
Arg Gly Asn Lys Lys Lys Pro Gly Met Pro Asn Val Ser Asn Asp
1940 1945 1950
Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys His Lys Glu Val
1955 1960 1965
Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala Asn Ser Leu
1970 1975 1980
Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp Leu Met
1985 1990 1995
Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His Leu
2000 2005 2010
Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys Met
2015 2020 2025
Leu Val Glu Leu His Thr Gln Ser Gln Asp Tyr Pro Tyr Asp Val
2030 2035 2040
Pro Asp Tyr Ala Ser
2045
<210> 3
<211> 1521
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 3
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Arg Gly Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr
35 40 45
Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser
50 55 60
Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys
65 70 75 80
Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala
85 90 95
Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn
100 105 110
Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val
115 120 125
Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu
130 135 140
Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu
145 150 155 160
Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys
165 170 175
Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala
180 185 190
Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp
195 200 205
Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val
210 215 220
Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly
225 230 235 240
Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg
245 250 255
Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu
260 265 270
Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys
275 280 285
Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp
290 295 300
Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln
305 310 315 320
Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu
325 330 335
Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu
340 345 350
Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr
355 360 365
Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
370 375 380
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly
385 390 395 400
Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu
405 410 415
Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp
420 425 430
Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln
435 440 445
Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe
450 455 460
Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
465 470 475 480
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg
485 490 495
Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn
500 505 510
Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu
515 520 525
Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro
530 535 540
Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr
545 550 555 560
Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser
565 570 575
Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg
580 585 590
Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu
595 600 605
Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
610 615 620
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp
625 630 635 640
Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu
645 650 655
Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys
660 665 670
Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
675 680 685
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
690 695 700
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
705 710 715 720
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser
725 730 735
Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly
740 745 750
Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
755 760 765
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys
770 775 780
Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg
785 790 795 800
Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met
805 810 815
Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
820 825 830
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu
835 840 845
Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
850 855 860
Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser
865 870 875 880
Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp
885 890 895
Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys
900 905 910
Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
915 920 925
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
930 935 940
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
945 950 955 960
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr
965 970 975
Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr
980 985 990
Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
995 1000 1005
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1010 1015 1020
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1025 1030 1035
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1040 1045 1050
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1055 1060 1065
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1070 1075 1080
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1085 1090 1095
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1100 1105 1110
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1115 1120 1125
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1130 1135 1140
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1145 1150 1155
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1160 1165 1170
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1175 1180 1185
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1190 1195 1200
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1205 1210 1215
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1220 1225 1230
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1235 1240 1245
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1250 1255 1260
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1265 1270 1275
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1280 1285 1290
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1295 1300 1305
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1310 1315 1320
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1325 1330 1335
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1340 1345 1350
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1355 1360 1365
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1370 1375 1380
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1385 1390 1395
Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys
1400 1405 1410
Val Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu
1415 1420 1425
Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp
1430 1435 1440
Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met
1445 1450 1455
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
1460 1465 1470
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp
1475 1480 1485
Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
1490 1495 1500
Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Lys Lys Lys Arg Lys
1505 1510 1515
Val Ala Ser
1520
<210> 4
<211> 617
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 4
Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1 5 10 15
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
20 25 30
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
35 40 45
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
50 55 60
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val
65 70 75 80
Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
85 90 95
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys
100 105 110
Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
115 120 125
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys
130 135 140
Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
145 150 155 160
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
165 170 175
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
180 185 190
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu
195 200 205
Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
210 215 220
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn
225 230 235 240
Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
245 250 255
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
260 265 270
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
275 280 285
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
290 295 300
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp
305 310 315 320
Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
325 330 335
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln
340 345 350
Leu Gly Gly Asp Pro Ile Ala Gly Ser Lys Ala Ser Pro Lys Lys Lys
355 360 365
Arg Lys Val Gly Arg Ala Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala
370 375 380
Leu Met Pro Thr Leu Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu
385 390 395 400
Pro Phe Arg Gln Pro Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr
405 410 415
Phe Asp Ile Val Lys Ser Pro Met Asp Leu Ser Thr Ile Lys Arg Lys
420 425 430
Leu Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile
435 440 445
Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser Arg
450 455 460
Val Tyr Lys Tyr Cys Ser Lys Leu Ser Glu Val Phe Glu Gln Glu Ile
465 470 475 480
Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg Lys Leu Glu
485 490 495
Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln Leu Cys Thr Ile
500 505 510
Pro Arg Asp Ala Thr Tyr Tyr Ser Tyr Gln Asn Arg Tyr His Phe Cys
515 520 525
Glu Lys Cys Phe Asn Glu Ile Gln Gly Glu Ser Val Ser Leu Gly Asp
530 535 540
Asp Pro Ser Gln Pro Gln Thr Thr Ile Asn Lys Glu Gln Phe Ser Lys
545 550 555 560
Arg Lys Asn Asp Thr Leu Asp Pro Glu Leu Phe Val Glu Cys Thr Glu
565 570 575
Cys Gly Arg Lys Met His Gln Ile Cys Val Leu His His Glu Ile Ile
580 585 590
Trp Pro Ala Gly Phe Val Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg
595 600 605
Thr Arg Lys Glu Asn Lys Phe Ser Ala
610 615
<210> 5
<211> 1726
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 5
Met Ala Ala Phe Lys Pro Asn Pro Ile Asn Tyr Ile Leu Gly Leu Ala
1 5 10 15
Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Asp
20 25 30
Glu Asn Pro Ile Cys Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45
Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60
Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80
Arg Ala Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asp
85 90 95
Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110
Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125
Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140
Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160
Gly Val Ala Asp Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175
Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190
Arg Asn Gln Arg Gly Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205
Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220
Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240
Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255
His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270
Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285
Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300
Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320
Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335
Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350
Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365
Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380
Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400
Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415
Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430
Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445
Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460
Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480
Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495
Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510
Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525
Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540
Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560
Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575
Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Ala Ala Ala Leu Pro Phe
580 585 590
Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605
Ser Glu Ala Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620
Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640
Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655
Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670
Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685
Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700
Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720
Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735
Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750
Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765
Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780
Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800
Asp Thr Pro Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815
Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830
Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845
Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860
Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880
Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895
Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910
Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925
Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940
Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960
Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975
Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990
Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005
Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020
His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035
His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050
Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065
Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg Ser
1070 1075 1080
Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Arg
1085 1090 1095
Ala Ile Phe Lys Pro Glu Glu Leu Arg Gln Ala Leu Met Pro Thr
1100 1105 1110
Leu Glu Ala Leu Tyr Arg Gln Asp Pro Glu Ser Leu Pro Phe Arg
1115 1120 1125
Gln Pro Val Asp Pro Gln Leu Leu Gly Ile Pro Asp Tyr Phe Asp
1130 1135 1140
Ile Val Lys Ser Pro Met Asp Leu Ser Thr Ile Lys Arg Lys Leu
1145 1150 1155
Asp Thr Gly Gln Tyr Gln Glu Pro Trp Gln Tyr Val Asp Asp Ile
1160 1165 1170
Trp Leu Met Phe Asn Asn Ala Trp Leu Tyr Asn Arg Lys Thr Ser
1175 1180 1185
Arg Val Tyr Lys Tyr Cys Ser Lys Leu Ser Glu Val Phe Glu Gln
1190 1195 1200
Glu Ile Asp Pro Val Met Gln Ser Leu Gly Tyr Cys Cys Gly Arg
1205 1210 1215
Lys Leu Glu Phe Ser Pro Gln Thr Leu Cys Cys Tyr Gly Lys Gln
1220 1225 1230
Leu Cys Thr Ile Pro Arg Asp Ala Thr Tyr Tyr Ser Tyr Gln Asn
1235 1240 1245
Arg Tyr His Phe Cys Glu Lys Cys Phe Asn Glu Ile Gln Gly Glu
1250 1255 1260
Ser Val Ser Leu Gly Asp Asp Pro Ser Gln Pro Gln Thr Thr Ile
1265 1270 1275
Asn Lys Glu Gln Phe Ser Lys Arg Lys Asn Asp Thr Leu Asp Pro
1280 1285 1290
Glu Leu Phe Val Glu Cys Thr Glu Cys Gly Arg Lys Met His Gln
1295 1300 1305
Ile Cys Val Leu His His Glu Ile Ile Trp Pro Ala Gly Phe Val
1310 1315 1320
Cys Asp Gly Cys Leu Lys Lys Ser Ala Arg Thr Arg Lys Glu Asn
1325 1330 1335
Lys Phe Ser Ala Lys Arg Leu Pro Ser Thr Arg Leu Gly Thr Phe
1340 1345 1350
Leu Glu Asn Arg Val Asn Asp Phe Leu Arg Arg Gln Asn His Pro
1355 1360 1365
Glu Ser Gly Glu Val Thr Val Arg Val Val His Ala Ser Asp Lys
1370 1375 1380
Thr Val Glu Val Lys Pro Gly Met Lys Ala Arg Phe Val Asp Ser
1385 1390 1395
Gly Glu Met Ala Glu Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe
1400 1405 1410
Ala Phe Glu Glu Ile Asp Gly Val Asp Leu Cys Phe Phe Gly Met
1415 1420 1425
His Val Gln Glu Tyr Gly Ser Asp Cys Pro Pro Pro Asn Gln Arg
1430 1435 1440
Arg Val Tyr Ile Ser Tyr Leu Asp Ser Val His Phe Phe Arg Pro
1445 1450 1455
Lys Cys Leu Arg Thr Ala Val Tyr His Glu Ile Leu Ile Gly Tyr
1460 1465 1470
Leu Glu Tyr Val Lys Lys Leu Gly Tyr Thr Thr Gly His Ile Trp
1475 1480 1485
Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr Ile Phe His Cys His
1490 1495 1500
Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg Leu Gln Glu Trp
1505 1510 1515
Tyr Lys Lys Met Leu Asp Lys Ala Val Ser Glu Arg Ile Val His
1520 1525 1530
Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg Leu Thr
1535 1540 1545
Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro Asn
1550 1555 1560
Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu
1565 1570 1575
Arg Lys Arg Glu Glu Asn Thr Ser Asn Glu Ser Thr Asp Val Thr
1580 1585 1590
Lys Gly Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr
1595 1600 1605
Ser Lys Asn Lys Ser Ser Leu Ser Arg Gly Asn Lys Lys Lys Pro
1610 1615 1620
Gly Met Pro Asn Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala
1625 1630 1635
Thr Met Glu Lys His Lys Glu Val Phe Phe Val Ile Arg Leu Ile
1640 1645 1650
Ala Gly Pro Ala Ala Asn Ser Leu Pro Pro Ile Val Asp Pro Asp
1655 1660 1665
Pro Leu Ile Pro Cys Asp Leu Met Asp Gly Arg Asp Ala Phe Leu
1670 1675 1680
Thr Leu Ala Arg Asp Lys His Leu Glu Phe Ser Ser Leu Arg Arg
1685 1690 1695
Ala Gln Trp Ser Thr Met Cys Met Leu Val Glu Leu His Thr Gln
1700 1705 1710
Ser Gln Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1715 1720 1725
<210> 6
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 6
ggggccacua gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 7
<211> 98
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 7
ggccacuagg gacaggaugu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60
uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 98
<210> 8
<211> 112
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 8
ggggccccuu cgggggccac uagggacagg auguuuuaga gcuagaaaua gcaaguuaaa 60
auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uu 112
<210> 9
<211> 116
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 9
gguaguggcc ccuucggggg ccacuaggga caggauguuu uagagcuaga aauagcaagu 60
uaaaauaagg cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcuuuu 116
<210> 10
<211> 1198
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 10
ccaggatcag tgaaacgcac cagacagccg cgtcagagca gctcaggttc tgggagaggg 60
tagcgcaggg tggccactga gaaccgggca ggtcacgcat cccccccttc cctcccaccc 120
cctgccaagc tctccctccc aggatcctct ctggctccat cgtaagcaaa ccttagaggt 180
tctggcaagg agagagatgg ctccaggaaa tgggggtgtg tcaccagata aggaatctgc 240
ctaacaggag gtgggggtta gacccaatat caggagacta ggaaggagga ggcctaagga 300
tggggctttt ctgtcaccaa tcctgtccct agtggcccca ctgtggggtg gaggggacag 360
ataaaagtac ccagaaccag agccacatta accggccctg ggaatataag gtggtcccag 420
ctcggggaca caggatccct ggaggcagca aacatgctgt cctgaagtgg acataggggc 480
ccgggttgga ggaagaagac tagctgagct ctcggacccc tggaagatgc catgacaggg 540
ggctggaaga gctagcacag actagagagg taaggggggt aggggagctg cccaaatgaa 600
aggagtgaga ggtgacccgg aatccacagg agaacggggt gtccaggcaa agaaagcaag 660
aggatggaga ggtggctaaa gccagggaga cggggtactt tggggttgtc cagaaaaacg 720
gtgatgatgc aggcctacaa gaaggggagg cgggacgcaa gggagacatc cgtcggagaa 780
ggccatccta agaaacgaga gatggcacag gccccagaag gagaaggaaa agggaaccca 840
gcgagtgaag acggcatggg gttgggtgag ggaggagaga tgcccggaga ggacccagac 900
acggggagga tccgctcaga ggacatcacg tggtgcagcg ccgagaagga agtgctccgg 960
aaagagcatc cttgggcagc aacacagcag agagcaaggg gaagagggag tggaggaaga 1020
cggaacctga aggaggcggc agggaaggat ctgggccagc cgtagaggtg acccaggcca 1080
caagctgcag acagaaagcg gcacaggccc aggggagaga atgcaggtca gagaaagcag 1140
gacctgcctg ggaaggggaa acagtgggcc agaggcggcg cagaagccag tagagctc 1198
<210> 11
<211> 986
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 11
catgacgtgc agcaagcgcg ctgacgcagc taattttatc tatgtgcttc gtcatacgtg 60
atgcatatac tctctgctag ctgactcatt cagctgtact cactcgctgt tgagtctcat 120
acagcgcgag atcaaatgag tcatccaatc ctgtccctag tggcccctat cgtgacactg 180
cactgcagcg tacgcgacag agctagactt cgtttcaata cagactagct actgcgtctg 240
cagagcgctc tcttgtcact tacatcgaag tcaacgcgct cgcgttcaga gatcttctcc 300
aatcctactt tcgacaattt tcgctctcag cgtttgtgtc tgtgcgcgca cacagtctgt 360
gcttcgcttg caactaacgt agcgcttcag cgcatcgtca aagagcgaaa gagtcacagt 420
gtctgtgttc acgtctctat ctttctagtt ctccaatcct gtcccaaaat tgtcgaagac 480
agagtttcgc gaattcgcag cagcgcgatc tctgctcact gcaatctctg actgctgctt 540
ttaagcaatt ctcgcagctc agcatgagta cttgcgatta cagcagtgct cgccaatcct 600
gtccctagtg attttgcagc gtcagcagag ctgatgagat gcagttcagc atcgcagacg 660
agcagcacga agcgagcatc tgtagaaaat cgatcgacgc gcacttgcag agacaccaaa 720
aattgtcgaa agtgaagcct tgtctctcgt tcgcatcaag acacgctatt tctgtctctt 780
aaatgtttca aaaacacatc atgtcttctt cgtgcgagtt cgatgcgcgt gtgcgagacc 840
acgcctgtcc ctagtggccc ctgactctct gtgcattttg agctgcgaaa gtaaagatat 900
cgttcattgc agagacagag ctagtactag tctcagttct tgcactatgc tctcgatgtc 960
tctcttagtg attcagcgca tcgtcg 986
<210> 12
<211> 1078
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成多核苷酸
<400> 12
gacctgcagg catgcaagct tgggctagcg gagagtcagt tcgcggtact ggaggaggcg 60
gcgcaacgtc gccagctgtc tgcacaggag aaatccctgc tggcgcataa agatgagacg 120
ctggagtaca aacgccagct ggctgcactt ggcgacaagg ttacgtatca ggagcgcctg 180
aacgcgctgg cgcagcaggc ggataaattc gcacagcagc aacgggcaaa acgggccgcc 240
attgatgcga aaagccgggg gctgactgac cggcaggcag aacgggaagc cacggaacag 300
cgcctgaagg aacagtatgg cgataatccg ctggcgctga ataacgtcat gtcagagcag 360
aaaaagacct gggcggctga agaccagctt cgcgggaact ggatggcagg cctgaagtcc 420
ggctggccat gggctgaggc cagctgaggt accgctgagg attgctgagg tgtacagacg 480
ctcaagtcag aggtggcgag agctcccgga gtggctcaca gtcggtggtc cggcagtaca 540
atggattacc gtaagacgga aatcactccc gggtatatga aagagacgac cactgccagg 600
gacgaaagtg caatgcggca tacctcagtg gcgtggagtg caggtataca gattaatccg 660
gcagcgtccg tcgttgttga tattgcttat gaaggctccg gcagtggcga ctggcgtact 720
gacggattca tcgttggggt cggttataaa ttctgattag ccaggtaaca cagtgttatg 780
acagcccgcc ggaaccggtg ggcttttttg tggggtgaat atggcagtaa agatttcagg 840
agtcctgaaa gacggcacag gaaaaccggt acagaactgc accattcagc tgaaagccag 900
acgtaacagc accacggtgg tggtgaacac ggtgggctca gagaatccgg atgaagccgg 960
gcgttacagc atggatgtgg agtacggtca gtacagtgtc atcctgcagg ttgacggttt 1020
tccaccatcg cacgccggga ccatcaccgt gtatgaagat tcacaaccgg ggacgctg 1078
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 13
ttcttcttct gctcggactc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 14
ttcttcttct gctcggactc 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 15
ttcttcttct gctcggactc 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 16
ttcttcttct gctcggactc 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 17
ttcttcttct gctcggactc 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 18
ttcttcttct gctcggactc 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 19
ttcttcttct gctcggactc 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 20
ttcttcttct gctcggactc 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 21
ttcttcttct gctcggactc 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 22
ttcttcttct gctcggactc 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 23
ttcttcttct gctcggactc 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 24
ttcttcttct gctcggactc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 25
ttcttcttct gctcggactc 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 26
ttcttcttct gctcggactc 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 27
ttcttcttct gctcggactc 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 28
ttcttcttct gctcggactc 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 29
ttcttcttct gctcggactc 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 30
ttcttcttct gctcggactc 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 31
ttcttcttct gctcggactc 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 32
ttcttcttct gctcggactc 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 33
ccctagtcat tggaggtgac 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 34
ccctagtcat tggaggtgac 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 35
ccctagtcat tggaggtgac 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 36
ccctagtcat tggaggtgac 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 37
ccctagtcat tggaggtgac 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 38
ccctagtcat tggaggtgac 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 39
ccctagtcat tggaggtgac 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 40
ccctagtcat tggaggtgac 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 41
ccctagtcat tggaggtgac 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 42
ccctagtcat tggaggtgac 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 43
atggggagga catcgatgtc 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 44
atggggagga catcgatgtc 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 45
atggggagga catcgatgtc 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 46
atggggagga catcgatgtc 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 47
atggggagga catcgatgtc 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 48
atggggagga catcgatgtc 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 49
atggggagga catcgatgtc 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 50
atggggagga catcgatgtc 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 51
atggggagga catcgatgtc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 52
atggggagga catcgatgtc 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 53
atcacatcaa ccggtggcgc 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 54
atcacatcaa ccggtggcgc 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 55
atcacatcaa ccggtggcgc 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 56
atcacatcaa ccggtggcgc 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 57
atcacatcaa ccggtggcgc 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 58
atcacatcaa ccggtggcgc 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 59
atcacatcaa ccggtggcgc 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 60
atcacatcaa ccggtggcgc 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 61
atcacatcaa ccggtggcgc 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 62
atcacatcaa ccggtggcgc 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 63
gagtttctca tctgtgcccc 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 64
ccagcttctg ccgtttgtac 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 65
ccagcttctg ccgtttgtac 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 66
ccagcttctg ccgtttgtac 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 67
ttcctcctcc agcttctgcc 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 68
ttcctcctcc agcttctgcc 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 69
ttcctcctcc agcttctgcc 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 70
ttcctcctcc agcttctgcc 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 71
ttcctcctcc agcttctgcc 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 72
ccggttgatg tgatgggagc 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 73
ccggttgatg tgatgggagc 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 74
ccggttgatg tgatgggagc 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 75
ccggttgatg tgatgggagc 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 76
gcagcaagca gcactctgcc 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 77
gcagcaagca gcactctgcc 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 78
gcttgggccc acgcaggggc 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 79
gcttgggccc acgcaggggc 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 80
gcttcgtggc aatgcgccac 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 81
gcttgggccc acgcaggggc 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 82
aagctggact ctggccactc 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 83
ttcttcttct gctcggactc 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 84
ttcttcttct gctcggactc 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 85
ttcttcttct gctcggactc 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 86
gagtttctca tctgtgcccc 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 87
ttcctcctcc agcttctgcc 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 88
ttcctcctcc agcttctgcc 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 89
agcagaagaa gaagggctcc 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 90
aagctggact ctggccactc 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 91
ccctagtcat tggaggtgac 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 92
ccctagtcat tggaggtgac 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 93
ccctagtcat tggaggtgac 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 94
ccctagtcat tggaggtgac 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 95
ccctagtcat tggaggtgac 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 96
ccctagtcat tggaggtgac 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 97
ccctagtcat tggaggtgac 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 98
ccctagtcat tggaggtgac 20
<210> 99
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 99
ccctagtcat tggaggtgac 20
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 100
ccctagtcat tggaggtgac 20
<210> 101
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 101
atggggagga catcgatgtc 20
<210> 102
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 102
atggggagga catcgatgtc 20
<210> 103
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 103
atggggagga catcgatgtc 20
<210> 104
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 104
atggggagga catcgatgtc 20
<210> 105
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 105
atggggagga catcgatgtc 20
<210> 106
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 106
atggggagga catcgatgtc 20
<210> 107
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 107
atggggagga catcgatgtc 20
<210> 108
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 108
atggggagga catcgatgtc 20
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 109
atggggagga catcgatgtc 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 110
atggggagga catcgatgtc 20
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 111
atcacatcaa ccggtggcgc 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 112
atcacatcaa ccggtggcgc 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 113
atcacatcaa ccggtggcgc 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 114
atcacatcaa ccggtggcgc 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 115
atcacatcaa ccggtggcgc 20
<210> 116
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 116
atcacatcaa ccggtggcgc 20
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 117
atcacatcaa ccggtggcgc 20
<210> 118
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 118
atcacatcaa ccggtggcgc 20
<210> 119
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 119
atcacatcaa ccggtggcgc 20
<210> 120
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 120
atcacatcaa ccggtggcgc 20
<210> 121
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 121
gagtttctca tctgtgcccc 20
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 122
ccagcttctg ccgtttgtac 20
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 123
ccagcttctg ccgtttgtac 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 124
ccagcttctg ccgtttgtac 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 125
ttcctcctcc agcttctgcc 20
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 126
ttcctcctcc agcttctgcc 20
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 127
ttcctcctcc agcttctgcc 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 128
ttcctcctcc agcttctgcc 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 129
ttcctcctcc agcttctgcc 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 130
ccggttgatg tgatgggagc 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 131
ccggttgatg tgatgggagc 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 132
ccggttgatg tgatgggagc 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 133
ccggttgatg tgatgggagc 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 134
gcagcaagca gcactctgcc 20
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 135
gcagcaagca gcactctgcc 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 136
gcttgggccc acgcaggggc 20
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 137
gcttgggccc acgcaggggc 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 138
gcttcgtggc aatgcgccac 20
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 139
gcttgggccc acgcaggggc 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 140
aagctggact ctggccactc 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 141
ttcttcttct gctcggactc 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 142
ttcttcttct gctcggactc 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 143
ttcttcttct gctcggactc 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 144
gagtttctca tctgtgcccc 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 145
ttcctcctcc agcttctgcc 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 146
ttcctcctcc agcttctgcc 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 147
agcagaagaa gaagggctcc 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 148
aagctggact ctggccactc 20
<210> 149
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 149
guguccgagc agaagaagaa 20
<210> 150
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 150
gacuccgagc agaagaagaa 20
<210> 151
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 151
gagaccgagc agaagaagaa 20
<210> 152
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 152
gagugcgagc agaagaagaa 20
<210> 153
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 153
gagucggagc agaagaagaa 20
<210> 154
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 154
gagucccagc agaagaagaa 20
<210> 155
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 155
gaguccgugc agaagaagaa 20
<210> 156
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 156
gaguccgacc agaagaagaa 20
<210> 157
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 157
gaguccgagg agaagaagaa 20
<210> 158
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 158
gaguccgagc ugaagaagaa 20
<210> 159
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 159
guguccgagc agaagaagaa 20
<210> 160
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 160
gacuccgagc agaagaagaa 20
<210> 161
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 161
gagaccgagc agaagaagaa 20
<210> 162
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 162
gagugcgagc agaagaagaa 20
<210> 163
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 163
gagucggagc agaagaagaa 20
<210> 164
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 164
gagucccagc agaagaagaa 20
<210> 165
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 165
gaguccgugc agaagaagaa 20
<210> 166
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 166
gaguccgacc agaagaagaa 20
<210> 167
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 167
gaguccgagg agaagaagaa 20
<210> 168
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 168
gaguccgagc ugaagaagaa 20
<210> 169
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 169
gacaccucca augacuaggg 20
<210> 170
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 170
gugaccucca augacuaggg 20
<210> 171
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 171
gucuccucca augacuaggg 20
<210> 172
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 172
gucagcucca augacuaggg 20
<210> 173
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 173
gucacgucca augacuaggg 20
<210> 174
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 174
gucaccacca augacuaggg 20
<210> 175
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 175
gucaccugca augacuaggg 20
<210> 176
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 176
gucaccucga augacuaggg 20
<210> 177
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 177
gucaccuccu augacuaggg 20
<210> 178
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 178
gucaccucca uugacuaggg 20
<210> 179
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 179
gucaucgaug uccuccccau 20
<210> 180
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 180
gagaucgaug uccuccccau 20
<210> 181
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 181
gacuucgaug uccuccccau 20
<210> 182
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 182
gacaacgaug uccuccccau 20
<210> 183
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 183
gacauggaug uccuccccau 20
<210> 184
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 184
gacauccaug uccuccccau 20
<210> 185
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 185
gacaucguug uccuccccau 20
<210> 186
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 186
gacaucgaag uccuccccau 20
<210> 187
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 187
gacaucgauc uccuccccau 20
<210> 188
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 188
gacaucgaug accuccccau 20
<210> 189
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 189
gggccaccgg uugaugugau 20
<210> 190
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 190
gccccaccgg uugaugugau 20
<210> 191
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 191
gcggcaccgg uugaugugau 20
<210> 192
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 192
gcgcgaccgg uugaugugau 20
<210> 193
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 193
gcgccuccgg uugaugugau 20
<210> 194
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 194
gcgccagcgg uugaugugau 20
<210> 195
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 195
gcgccacggg uugaugugau 20
<210> 196
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 196
gcgccacccg uugaugugau 20
<210> 197
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 197
gcgccaccgc uugaugugau 20
<210> 198
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 198
gcgccaccgg augaugugau 20
<210> 199
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 199
gggccacaga ugagaaacuc 20
<210> 200
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 200
guucaaacgg cagaagcugg 20
<210> 201
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 201
guacuaacgg cagaagcugg 20
<210> 202
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 202
guacaaacgg gagaagcugg 20
<210> 203
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 203
gccagaagcu ggaggaggaa 20
<210> 204
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 204
ggcacaagcu ggaggaggaa 20
<210> 205
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 205
ggcagaaccu ggaggaggaa 20
<210> 206
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 206
ggcagaagca ggaggaggaa 20
<210> 207
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 207
ggcagaagcu cgaggaggaa 20
<210> 208
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 208
gcacccauca caucaaccgg 20
<210> 209
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 209
gcucccuuca caucaaccgg 20
<210> 210
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 210
gcucccaaca caucaaccgg 20
<210> 211
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 211
gcucccauca gaucaaccgg 20
<210> 212
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 212
ggcagugugc ugcuugcugc 20
<210> 213
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 213
ggcagagugc agcuugcugc 20
<210> 214
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 214
gccccagcgu gggcccaagc 20
<210> 215
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 215
gccccugccu gggcccaagc 20
<210> 216
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 216
guggcccauu gccacgaagc 20
<210> 217
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 217
gccccugcgu cggcccaagc 20
<210> 218
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 218
gaguggccug aguccagcuu 20
<210> 219
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 219
gagaccgagc agaagaagaa 20
<210> 220
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 220
gaguccgagg agaagaagaa 20
<210> 221
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 221
gaguccgagc ugaagaagaa 20
<210> 222
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 222
ggggcacagu ugagaaacuc 20
<210> 223
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 223
ggcagaaggu ggaggaggaa 20
<210> 224
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 224
ggcagaagca ggaggaggaa 20
<210> 225
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 225
ggagcccuug uucuucugcu 20
<210> 226
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 226
gaguggccug aguccagcuu 20
<210> 227
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 227
gacaccucca augacuaggg 20
<210> 228
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 228
gugaccucca augacuaggg 20
<210> 229
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 229
gucuccucca augacuaggg 20
<210> 230
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 230
gucagcucca augacuaggg 20
<210> 231
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 231
gucacgucca augacuaggg 20
<210> 232
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 232
gucaccacca augacuaggg 20
<210> 233
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 233
gucaccugca augacuaggg 20
<210> 234
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 234
gucaccucga augacuaggg 20
<210> 235
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 235
gucaccuccu augacuaggg 20
<210> 236
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 236
gucaccucca uugacuaggg 20
<210> 237
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 237
gucaucgaug uccuccccau 20
<210> 238
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 238
gagaucgaug uccuccccau 20
<210> 239
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 239
gacuucgaug uccuccccau 20
<210> 240
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 240
gacaacgaug uccuccccau 20
<210> 241
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 241
gacauggaug uccuccccau 20
<210> 242
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 242
gacauccaug uccuccccau 20
<210> 243
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 243
gacaucguug uccuccccau 20
<210> 244
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 244
gacaucgaag uccuccccau 20
<210> 245
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 245
gacaucgauc uccuccccau 20
<210> 246
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 246
gacaucgaug accuccccau 20
<210> 247
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 247
gggccaccgg uugaugugau 20
<210> 248
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 248
gccccaccgg uugaugugau 20
<210> 249
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 249
gcggcaccgg uugaugugau 20
<210> 250
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 250
gcgcgaccgg uugaugugau 20
<210> 251
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 251
gcgccuccgg uugaugugau 20
<210> 252
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 252
gcgccagcgg uugaugugau 20
<210> 253
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 253
gcgccacggg uugaugugau 20
<210> 254
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 254
gcgccacccg uugaugugau 20
<210> 255
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 255
gcgccaccgc uugaugugau 20
<210> 256
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 256
gcgccaccgg augaugugau 20
<210> 257
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 257
gggccacaga ugagaaacuc 20
<210> 258
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 258
guucaaacgg cagaagcugg 20
<210> 259
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 259
guacuaacgg cagaagcugg 20
<210> 260
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 260
guacaaacgg gagaagcugg 20
<210> 261
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 261
gccagaagcu ggaggaggaa 20
<210> 262
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 262
ggcacaagcu ggaggaggaa 20
<210> 263
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 263
ggcagaaccu ggaggaggaa 20
<210> 264
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 264
ggcagaagca ggaggaggaa 20
<210> 265
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 265
ggcagaagcu cgaggaggaa 20
<210> 266
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 266
gcacccauca caucaaccgg 20
<210> 267
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 267
gcucccuuca caucaaccgg 20
<210> 268
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 268
gcucccaaca caucaaccgg 20
<210> 269
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 269
gcucccauca gaucaaccgg 20
<210> 270
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 270
ggcagugugc ugcuugcugc 20
<210> 271
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 271
ggcagagugc agcuugcugc 20
<210> 272
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 272
gccccagcgu gggcccaagc 20
<210> 273
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 273
gccccugccu gggcccaagc 20
<210> 274
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 274
guggcccauu gccacgaagc 20
<210> 275
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 275
gccccugcgu cggcccaagc 20
<210> 276
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 276
gaguggccug aguccagcuu 20
<210> 277
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 277
gagaccgagc agaagaagaa 20
<210> 278
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 278
gaguccgagg agaagaagaa 20
<210> 279
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 279
gaguccgagc ugaagaagaa 20
<210> 280
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 280
ggggcacagu ugagaaacuc 20
<210> 281
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 281
ggcagaaggu ggaggaggaa 20
<210> 282
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 282
ggcagaagca ggaggaggaa 20
<210> 283
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 283
ggagcccuug uucuucugcu 20
<210> 284
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 284
gaguggccug aguccagcuu 20
<210> 285
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 285
gagttcctac tcagactgtt actc 24
<210> 286
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 286
gtgagttcct actcagactg ttactc 26
<210> 287
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 287
gtctgagttc ctactcagac tgttactc 28
<210> 288
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 288
gtattcgtac tcagactgtt actc 24
<210> 289
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 289
gagtattcgt actcagactg ttactc 26
<210> 290
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 290
gacttcggtc cgagcagaag aagaa 25
<210> 291
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 291
ggacttcggt ccgagcagaa gaagaa 26
<210> 292
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 292
gcggacttcg gtccgagcag aagaagaa 28
<210> 293
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 293
gcgggagtcc gagcagaaga agaa 24
<210> 294
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 294
gtcgggagtc cgagcagaag aagaa 25
<210> 295
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 295
gctcgggagt ccgagcagaa gaagaa 26
<210> 296
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 296
gttcacttcg gggtgggggg agtttgctcc 30
<210> 297
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 297
gttcattcgg ggtgggggga gtttgctcc 29
<210> 298
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 298
gtccttcggg gtggggggag tttgctcc 28
<210> 299
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 299
gcttccttcg gggtgggggg agtttgctcc 30
<210> 300
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 300
gtttccttcg gggtgggggg agtttgctcc 30
<210> 301
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 301
gctccttcgg ggtgggggga gtttgctcc 29
<210> 302
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 302
gcccacttcg gggtgggggg agtttgctcc 30
<210> 303
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 303
gcccattcgg ggtgggggga gtttgctcc 29
<210> 304
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 304
gccccttcgg ggtgggggga gtttgctcc 29
<210> 305
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 305
gcatccttcg gtgtgggggg agtttgctcc 30
<210> 306
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 306
gccccgggtg gggggagttt gctcc 25
<210> 307
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 307
gcccgggtgg ggggagtttg ctcc 24
<210> 308
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 308
gccgggtggg gggagtttgc tcc 23
<210> 309
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 309
gcacgttcgg gtgagtgagt gtgtgcgtg 29
<210> 310
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 310
gtacgttcgg gtgagtgagt gtgtgcgtg 29
<210> 311
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 311
gcatgttcgg gtgagtgagt gtgtgcgtg 29
<210> 312
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 312
gtatgttcgg gtgagtgagt gtgtgcgtg 29
<210> 313
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 313
gcgcgttcgg gtgagtgagt gtgtgcgtg 29
<210> 314
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 314
gcgtgttcgg gtgagtgagt gtgtgcgtg 29
<210> 315
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 315
gtaggttcgc ctactcagac tgttactc 28
<210> 316
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 316
ggcctcccca aagcctggcc a 21
<210> 317
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 317
gacctcccca tagcctggcc a 21
<210> 318
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 318
gggagt 6
<210> 319
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 319
gggagg 6
<210> 320
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 320
tttcctgatg gtccatgtct gttactc 27
<210> 321
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 321
tttcgtgatg gtccatgtct gttactc 27
<210> 322
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 322
tttccagttg gtccatgtct gttactc 27
<210> 323
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 323
tttcctgatg gtccatgtct gttactg 27
<210> 324
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 324
ctgggactca ggcgggtcac 20
<210> 325
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 325
cctcacacaa cagcttcatg tcagc 25
<210> 326
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 326
ctgatggtgc atgtctgtta 20
<210> 327
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 327
ctgatggtgc atgtctg 17
<210> 328
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 328
ctgatggtgc atgtctgtta agacatgcac ca 32
<210> 329
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 329
ctgatggtgc atgtctgcat gcacca 26
<210> 330
<211> 28
<212> DNA
<213> 未知物
<220>
<223> 未知物的描述:DNMT1寡核苷酸
<400> 330
tttcctgatg ggtccatgtc tgttactc 28
<210> 331
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 331
ctgatggtgc atgtctgtta 20
<210> 332
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 332
ctgatggtgc atgtctg 17
<210> 333
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 333
ctgatggtgc atgtctgtta agacatgcac ca 32
<210> 334
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 334
ctgatggtgc atgtctgcat gcacca 26
<210> 335
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 335
gtgagtaggt tcgcctactc agactgttac tc 32
<210> 336
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 336
atcctgtccc tagtggcccc 20
<210> 337
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 337
ggggccacta gggacaggat 20
<210> 338
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 338
ggggccacua gggacaggau 20
<210> 339
<211> 18
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 339
ggccacuagg gacaggau 18
<210> 340
<211> 20
<212> DNA
<213> 未知物
<220>
<223> 未知物的描述:VEGFA1靶位点寡核苷酸
<400> 340
gggtgggggg agtttgctcc 20
<210> 341
<211> 20
<212> DNA
<213> 未知物
<220>
<223> 未知物的描述:VEGFA1脱靶位点寡核苷酸
<400> 341
ggatggaggg agtttgctcc 20
<210> 342
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成6xHis标签
<400> 342
His His His His His His
1 5
<210> 343
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<223> 5'-生物素酰化
<400> 343
ccaggatcag tgaaacgcac 20
<210> 344
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 344
gagctctact ggcttctgcg 20
<210> 345
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<223> 5'-生物素酰化
<400> 345
catgacgtgc agcaagc 17
<210> 346
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 346
cgacgatgcg ctgaatc 17
<210> 347
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<220>
<223> 5'-生物素酰化
<400> 347
gacctgcagg catgcaagct tgg 23
<210> 348
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成引物
<400> 348
cagcgtcccc ggttgtgaat ct 22
Claims (59)
1.一种产生优化指导RNA(gRNA)的方法,该方法包括:
a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;
b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;
c)确定该全长gRNA的至少一个或多个脱靶位点;
d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的多核苷酸序列的5’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的5’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;
e)计算入侵动力学和该第一gRNA保持入侵在原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟所述入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与将该第一gRNA重新退火至与该原型间隔子序列互补的DNA序列之间的能量差来逐个核苷酸地估计入侵动态;
f)将所述第一gRNA在原型间隔子和/或脱靶位点的估计寿命与所述全长gRNA或截短gRNA(tru-gRNA)在原型间隔子和/或脱靶位点处的估计寿命进行比较;
g)将该接头中的1至N个核苷酸和第一gRNA的RNA区段中的1至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);
h)基于满足设计标准的gRNA序列鉴定优化gRNA,所述设计标准选自结合原型间隔子和/或脱靶位点的特异性、与原型间隔子和/或脱靶位点的结合寿命调节、Cas9蛋白在该感兴趣的靶区处估计的裂解特异性、或其组合;并且
i)在细胞内测试该优化gRNA以确定结合特异性。
2.一种产生优化指导RNA(gRNA)的方法,该方法包括:
a)鉴定感兴趣的靶区,该感兴趣的靶区包含原型间隔子序列;
b)确定靶向该感兴趣的靶区的全长gRNA的多核苷酸序列,该全长gRNA包含原型间隔子靶向序列或区段;
c)确定该全长gRNA的至少一个或多个脱靶位点;
d)产生第一gRNA的多核苷酸序列,该第一gRNA包含该全长gRNA的多核苷酸序列和RNA区段,该RNA区段包含具有M个核苷酸长度的多核苷酸序列,该多核苷酸序列与该原型间隔子靶向序列或区段的核苷酸区段互补,该RNA区段位于该全长gRNA的多核苷酸序列的3’端,该第一gRNA任选地包含在该全长gRNA的多核苷酸序列的3’端与该RNA区段之间的接头,该接头包含具有N个核苷酸长度的多核苷酸序列,该第一gRNA能够入侵该原型间隔子序列,并且结合与该原型间隔子序列互补的DNA序列并形成原型间隔子-双链体,并且该第一gRNA能够入侵脱靶位点并结合与该脱靶位点互补的DNA序列并形成脱靶双链体;
e)计算入侵动力学和该第一gRNA保持入侵在原型间隔子和脱靶位点双链体中的寿命的估计值或计算模拟所述入侵动力学和寿命,其中通过确定不同gRNA的进一步入侵与将该第一gRNA重新退火至与该原型间隔子序列互补的DNA序列之间的能量差来逐个核苷酸地估计入侵动态;
f)将所述第一gRNA在原型间隔子和/或脱靶位点的估计寿命与所述全长gRNA或截短gRNA(tru-gRNA)在原型间隔子和/或脱靶位点处的估计寿命进行比较;
g)将该接头中的1至N个核苷酸和第一gRNA的RNA区段中的1至M个核苷酸随机化并产生第二gRNA,并且用该第二gRNA重复步骤(e);
h)基于满足设计标准的gRNA序列鉴定优化gRNA,所述设计标准选自结合原型间隔子和/或脱靶位点的特异性、与原型间隔子和/或脱靶位点的结合寿命调节、Cas9蛋白在该感兴趣的靶区处估计的裂解特异性、或其组合;并且
i)在细胞内测试该优化gRNA以确定结合特异性。
3.如权利要求1或2所述的方法,其中不同gRNA的进一步入侵的能量学通过测定以下项中的至少一项的能量学来测定:(I)破坏DNA-DNA碱基配对,(II)形成RNA-DNA碱基对,(III)由破坏或形成未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏置换DNA链与任何不成对指导RNA核苷酸之间的相互作用,所述置换DNA链与原型间隔子互补,且所述不成对指导RNA核苷酸不参与二级结构。
4.如权利要求3所述的方法,其中该第一gRNA重新退火至与该原型间隔子序列互补的该DNA序列的能量学通过测定以下项中的至少一项的能量学来测定:(I)形成DNA-DNA碱基配对,(II)破坏RNA-DNA碱基对,(III)由破坏或形成新近未入侵的指导RNA内的不同二级结构导致的能量差,以及(IV)形成或破坏置换DNA链与任何不成对指导RNA核苷酸之间的相互作用,所述置换DNA链与原型间隔子互补,且所述不成对指导RNA核苷酸不参与二级结构。
5.如权利要求4所述的方法,该方法进一步包括从以下项中的至少一项确定能量考虑因素:(V)跨越错配的碱基配对,(VI)与Cas9蛋白的相互作用,和/或(VII)另外的启发法,其中这些另外的启发法涉及结合寿命、入侵程度或入侵指导RNA的稳定性。
6.如权利要求1或2所述的方法,其中该全长gRNA包含约15至20个之间的核苷酸。
7.如权利要求1或2所述的方法,其中M在1与20之间。
8.如权利要求7所述的方法,其中M在4与10之间。
9.如权利要求1或2所述的方法,其中该RNA区段包含互补于该原型间隔子靶向序列的2至15个之间的核苷酸。
10.如权利要求1或2所述的方法,其中N在1与20之间。
11.如权利要求10所述的方法,其中N在3与10之间。
12.如权利要求1或2所述的方法,其中该RNA区段和/或原型间隔子靶向序列提供二级结构。
13.如权利要求12所述的方法,其中该二级结构通过使该原型间隔子靶向序列与该RNA区段部分杂交而形成。
14.如权利要求13所述的方法,其中该二级结构通过破坏该优化gRNA对该原型间隔子双链体或该脱靶双链体的入侵而调节DNA结合或Cas9裂解。
15.如权利要求12所述的方法,其中该二级结构通过以下方式形成:使该RNA区段的全部或部分,与该原型间隔子靶向序列或区段的5’端的核苷酸、在该原型间隔子靶向序列或区段的中间的核苷酸、和/或在该原型间隔子靶向序列或区段的3’端的核苷酸杂交。
16.如权利要求12所述的方法,其中该二级结构是发夹。
17.如权利要求12所述的方法,其中该二级结构在室温或37℃下是稳定的。
18.如权利要求12所述的方法,其中该二级结构的总平衡自由能在室温或37℃下小于2kcal/mol。
19.如权利要求12所述的方法,其中该RNA区段与该原型间隔子靶向序列或区段的至少两个核苷酸杂交或形成非规范碱基对。
20.如权利要求19所述的方法,其中该非规范碱基对是rU-rG。
21.如权利要求12所述的方法,其中该优化gRNA与基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统一起用于细胞中。
22.如权利要求21所述的方法,其中该二级结构将该优化gRNA保护在该基于CRISPR/Cas9的系统或基于CRISPR/Cpf1的系统内以防止在该细胞中降解。
23.如权利要求1或2所述的方法,其中在该接头中将1-20个核苷酸随机化。
24.如权利要求1或2所述的方法,其中在该RNA区段中将1-20个核苷酸随机化。
25.如权利要求1或2所述的方法,其中将步骤(g)重复X次,从而产生X数目的gRNA,并对每个X数目的gRNA重复步骤(e),其中X在0至20之间。
26.如权利要求1或2所述的方法,其中该入侵动力学和该寿命使用动力学蒙特卡罗法(kineticMonteCarlomethod)或吉莱斯皮算法(Gillespie algorithm)计算。
27.如权利要求1或2所述的方法,其中该入侵动力学是该指导RNA入侵该原型间隔子双链体至完全入侵以使得该原型间隔子被完全入侵的速率,和/或结合该gRNA的原型间隔子DNA的区段在从其互补链移位并从其PAM近端区至完全入侵逐个核苷酸地结合该gRNA时的扩增速率。
28.如权利要求1或2所述的方法,其中该设计标准包括优化gRNA具有大于或等于全长gRNA对在靶位点的结合寿命的结合寿命、和/或小于或等于全长gRNA对脱靶位点的结合寿命的结合寿命。
29.如权利要求28所述的方法,其中该设计标准包括优化gRNA具有小于或等于全长gRNA对至少三个脱靶位点的结合寿命的结合寿命,其中所述脱靶位点被预测为最靠近的脱靶位点,或被预测为与所述在靶位点具有最高同一性。
30.如权利要求1或2所述的方法,其中该设计标准包括:在脱靶位点处的寿命或裂解率小于或等于全长gRNA或截短gRNA在所述脱靶位点处的寿命或裂解率,和/或预测的在靶活性率大于全长gRNA或截短gRNA的预测的在靶活性率的10%。
31.如权利要求1或2所述的方法,其中该优化gRNA在步骤i)中使用surveyor测定、下一代测序技术或GUIDE-Seq进行测试。
32.如权利要求1或2所述的方法,其中该优化gRNA被设计以最小化在脱靶位点处的结合并允许结合原型间隔子序列。
33.如权利要求1或2所述的方法,其中该脱靶位点是已知或预测的脱靶位点。
34.如权利要求1或2所述的方法,其中该全长gRNA靶向哺乳动物基因。
35.如权利要求1或2所述的方法,其中所述该感兴趣的靶区包括内源性靶基因或转基因。
36.如权利要求1或2所述的方法,其中所述该感兴趣的靶区包括疾病相关基因。
37.如权利要求1或2所述的方法,其中所述该感兴趣的靶区包括DMD、EMX1或VEGFA基因。
38.如权利要求37所述的方法,其中该VEGFA基因是VEGFA1或VEGFA3。
39.通过如权利要求1或2所述的方法产生的优化gRNA分子在制备用于一种在靶细胞或受试者中进行表观基因组编辑靶基因的方法的试剂盒中的用途,该方法包括使细胞或受试者与有效量的所述优化gRNA分子和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性,其中该感兴趣的靶区包括靶基因。
40.通过如权利要求1或2所述的方法产生的优化gRNA分子在制备用于一种在靶细胞或受试者中进行靶基因的位点特异性DNA裂解的方法的试剂盒中的用途,该方法包括使细胞或受试者与有效量的所述优化gRNA分子和融合蛋白或Cas9蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性,其中该感兴趣的靶区包括靶基因。
41.一种在细胞中进行基因组编辑的方法,该方法包括向该细胞给予有效量的通过如权利要求1或2所述的方法产生的优化gRNA分子和融合蛋白,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性,其中该感兴趣的靶区包括靶基因。
42.如权利要求41所述的方法,其中该基因组编辑包括纠正靶基因中的突变或插入转基因。
43.如权利要求42所述的方法,其中纠正靶基因中的突变包括缺失、重排或替代该突变。
44.如权利要求42所述的方法,其中纠正靶基因中的突变包括核酸酶介导的非同源末端连接或同源定向修复。
45.一种在细胞中调节基因表达的方法,该方法包括使该细胞与有效量的通过如权利要求1或2所述的方法产生的优化gRNA分子和融合蛋白接触,该融合蛋白包含含有核酸酶缺陷型Cas9的第一多肽结构域和具有选自下组的活性的第二多肽结构域,该组由以下组成:转录激活活性、转录阻遏活性、核酸酶活性、转录释放因子活性、组蛋白修饰活性、核酸缔合活性、DNA甲基化酶活性以及直接或间接DNA脱甲基化酶活性,其中该感兴趣的靶区包括靶基因。
46.如权利要求45所述的方法,其中当靶基因的基因表达水平相比于该靶基因的正常基因表达水平增加或减少时,所述靶基因的基因表达得以调节。
47.如权利要求45所述的方法,其中该融合蛋白包含dCas9结构域和转录激活因子。
48.如权利要求47所述的方法,其中该融合蛋白包含SEQ ID NO:2的氨基酸序列。
49.如权利要求45所述的方法,其中该融合蛋白包含dCas9结构域和转录阻遏物。
50.如权利要求49所述的方法,其中该融合蛋白包含SEQ ID NO:3的氨基酸序列。
51.如权利要求45所述的方法,其中该融合蛋白包含dCas9结构域和位点特异性核酸酶。
52.如权利要求39-51中任一项所述的方法,其中该优化gRNA由多核苷酸序列编码并被包装到慢病毒载体中。
53.如权利要求52所述的方法,其中该慢病毒载体包含表达盒,该表达盒包含与编码该gRNA的多核苷酸序列可操作地连接的启动子。
54.如权利要求53所述的方法,其中可操作地连接至编码该优化gRNA的多核苷酸的启动子是诱导型的。
55.如权利要求52所述的方法,其中该慢病毒载体进一步包含编码该Cas9蛋白或融合蛋白的多核苷酸序列。
56.如权利要求39-51和53-55中任一项所述的方法,其中该靶基因是疾病相关基因。
57.如权利要求39-51和53-55中任一项所述的方法,其中该靶细胞是真核细胞。
58.如权利要求39-51和53-55中任一项所述的方法,其中该靶细胞是哺乳动物细胞。
59.如权利要求39-51和53-55中任一项所述的方法,其中该靶细胞是HEK293T细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210083840.3A CN114634930A (zh) | 2015-08-25 | 2016-08-25 | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562209466P | 2015-08-25 | 2015-08-25 | |
US62/209466 | 2015-08-25 | ||
PCT/US2016/048798 WO2017035416A2 (en) | 2015-08-25 | 2016-08-25 | Compositions and methods of improving specificity in genomic engineering using rna-guided endonucleases |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210083840.3A Division CN114634930A (zh) | 2015-08-25 | 2016-08-25 | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108351350A CN108351350A (zh) | 2018-07-31 |
CN108351350B true CN108351350B (zh) | 2022-02-18 |
Family
ID=58101224
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680061639.8A Active CN108351350B (zh) | 2015-08-25 | 2016-08-25 | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 |
CN202210083840.3A Pending CN114634930A (zh) | 2015-08-25 | 2016-08-25 | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210083840.3A Pending CN114634930A (zh) | 2015-08-25 | 2016-08-25 | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 |
Country Status (13)
Country | Link |
---|---|
US (3) | US11427817B2 (zh) |
EP (4) | EP3341727B1 (zh) |
JP (3) | JP6905755B2 (zh) |
KR (2) | KR20240132120A (zh) |
CN (2) | CN108351350B (zh) |
AU (2) | AU2016311454C1 (zh) |
BR (1) | BR112018003625A2 (zh) |
CA (1) | CA2996001A1 (zh) |
EA (1) | EA201890565A1 (zh) |
ES (1) | ES2929110T3 (zh) |
IL (2) | IL288662B2 (zh) |
MX (1) | MX2018002339A (zh) |
WO (1) | WO2017035416A2 (zh) |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP3114227B1 (en) | 2014-03-05 | 2021-07-21 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa |
WO2015138510A1 (en) | 2014-03-10 | 2015-09-17 | Editas Medicine., Inc. | Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10) |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
EP3981876A1 (en) | 2014-03-26 | 2022-04-13 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating sickle cell disease |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
JP6929791B2 (ja) | 2015-02-09 | 2021-09-01 | デューク ユニバーシティ | エピゲノム編集のための組成物および方法 |
JP2018522249A (ja) | 2015-04-24 | 2018-08-09 | エディタス・メディシン、インコーポレイテッド | Cas9分子/ガイドrna分子複合体の評価 |
WO2017066497A2 (en) | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
EP3433364A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency |
BR112019001887A2 (pt) | 2016-08-02 | 2019-07-09 | Editas Medicine Inc | composições e métodos para o tratamento de doença associada a cep290 |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
JP2019536782A (ja) * | 2016-11-28 | 2019-12-19 | ザ ボード オブ リージェンツ オブ ザ ユニバーシティー オブ テキサス システム | CRISPR/Cpf1媒介性遺伝子編集による筋ジストロフィーの予防 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
EP4095263A1 (en) | 2017-01-06 | 2022-11-30 | Editas Medicine, Inc. | Methods of assessing nuclease cleavage |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
EP3596217A1 (en) | 2017-03-14 | 2020-01-22 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
US11572574B2 (en) | 2017-09-28 | 2023-02-07 | Toolgen Incorporated | Artificial genome manipulation for gene expression regulation |
RU2767201C2 (ru) * | 2017-09-28 | 2022-03-16 | Тулджен Инкорпорейтед | Искусственная модификация генома для регуляции экспрессии гена |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
US11760984B2 (en) | 2017-10-31 | 2023-09-19 | The Broad Institute, Inc. | CRISPR protein inhibitors |
KR20200119239A (ko) | 2018-02-08 | 2020-10-19 | 지머젠 인코포레이티드 | 코리네박테리움에서 crispr을 사용하는 게놈 편집 |
SG11202008956XA (en) | 2018-03-14 | 2020-10-29 | Editas Medicine Inc | Systems and methods for the treatment of hemoglobinopathies |
US11380420B1 (en) * | 2018-05-07 | 2022-07-05 | X Development Llc | Data structure, compilation service, and graphical user interface for rapid simulation generation |
KR20210045360A (ko) | 2018-05-16 | 2021-04-26 | 신테고 코포레이션 | 가이드 rna 설계 및 사용을 위한 방법 및 시스템 |
US10839937B1 (en) * | 2018-07-19 | 2020-11-17 | X Development Llc | Whole cell circular delta viewer and navigator |
KR20210116531A (ko) * | 2019-01-18 | 2021-09-27 | 고꾸리쯔 다이가꾸 호우징 오사까 다이가꾸 | 영양 장애형 표피 수포증 치료약 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
US20220177879A1 (en) * | 2019-04-12 | 2022-06-09 | Duke University | Crispr/cas-based base editing composition for restoring dystrophin function |
US20220220468A1 (en) * | 2019-05-17 | 2022-07-14 | Beth Israel Deaconess Medical Center, Inc. | Compositions and methods for homology directed repair |
CA3150230A1 (en) * | 2019-09-04 | 2021-03-11 | Pengfei YUAN | METHOD FOR EVALUATING GENE EDITING THERAPY BASED ON OFF-TARGET EVALUATION |
CN110777159B (zh) * | 2019-12-03 | 2023-05-05 | 苏州缔因安生物科技有限公司 | 一种基于CRISPR-Cas9的核酸检测系统及其应用 |
CN111172164B (zh) * | 2020-03-09 | 2022-11-15 | 中国药科大学 | 一种用于任意核酸编辑的组合物及方法 |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
CN111781343B (zh) * | 2020-07-17 | 2023-03-21 | 北京林业大学 | 一种检测dna甲基化修饰影响转录因子与dna序列结合的方法 |
EP4204557A2 (en) * | 2020-08-31 | 2023-07-05 | Etalon Diagnostics | Systems and methods for producing or identifying non-human animals with a predetermined phenotype or genotype |
CN112233730B (zh) * | 2020-10-16 | 2023-11-28 | 南京大学 | 一种区分PBDEs衍生物对烯酰-ACP还原酶活性效应模型的构建方法 |
CN112662674B (zh) * | 2021-01-12 | 2023-04-11 | 广州瑞风生物科技有限公司 | 靶向编辑VEGFA基因外显子区域的gRNA及其应用 |
EP4433598A1 (en) * | 2021-11-17 | 2024-09-25 | Cornell University | Modulation of the crispr roadblock |
CN114231596B (zh) * | 2021-12-12 | 2023-11-21 | 徐州医科大学 | 基于CRISPR/dcas9和磁纳米材料的基因检测方法及应用 |
WO2023225349A2 (en) * | 2022-05-20 | 2023-11-23 | Helex Inc. | Tissue specific methods and compositions for gene editing |
WO2023250511A2 (en) | 2022-06-24 | 2023-12-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression |
CN118291415A (zh) * | 2024-03-14 | 2024-07-05 | 内蒙古大学 | 一种CRISPR::Cr-P300M巴豆酰化修饰编辑工具及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140068797A1 (en) * | 2012-05-25 | 2014-03-06 | University Of Vienna | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
WO2014093709A1 (en) * | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
US20140295557A1 (en) * | 2013-03-15 | 2014-10-02 | The General Hospital Corporation | Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing |
WO2014197748A2 (en) * | 2013-06-05 | 2014-12-11 | Duke University | Rna-guided gene editing and gene regulation |
Family Cites Families (117)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US5436146A (en) | 1989-09-07 | 1995-07-25 | The Trustees Of Princeton University | Helper-free stocks of recombinant adeno-associated virus vectors |
GB9206016D0 (en) | 1992-03-19 | 1992-04-29 | Sandoz Ltd | Improvements in or relating to organic compounds |
US6268213B1 (en) | 1992-06-03 | 2001-07-31 | Richard Jude Samulski | Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy |
EP0646178A1 (en) | 1992-06-04 | 1995-04-05 | The Regents Of The University Of California | expression cassette with regularoty regions functional in the mammmlian host |
US5869305A (en) | 1992-12-04 | 1999-02-09 | The University Of Pittsburgh | Recombinant viral vector system |
NZ262582A (en) | 1993-01-26 | 1997-10-24 | David B Weiner | Compositions and methods for delivery of genetic material |
US5593972A (en) | 1993-01-26 | 1997-01-14 | The Wistar Institute | Genetic immunization |
US5658784A (en) | 1994-04-14 | 1997-08-19 | Dana-Farber Cancer Institute, Inc. | Nucleic acid encoding transcription factor p300 and uses of p300 |
US6204059B1 (en) | 1994-06-30 | 2001-03-20 | University Of Pittsburgh | AAV capsid vehicles for molecular transfer |
US5962428A (en) | 1995-03-30 | 1999-10-05 | Apollon, Inc. | Compositions and methods for delivery of genetic material |
US5741683A (en) | 1995-06-07 | 1998-04-21 | The Research Foundation Of State University Of New York | In vitro packaging of adeno-associated virus DNA |
US6093570A (en) | 1995-06-07 | 2000-07-25 | The University Of North Carolina At Chapel Hill | Helper virus-free AAV production |
CA2287478C (en) | 1997-04-14 | 2007-06-19 | Richard J. Samulski | Methods for increasing the efficiency of recombinant aav product |
WO1999061643A1 (en) | 1998-05-27 | 1999-12-02 | University Of Florida | Method of preparing recombinant adeno-associated virus compositions by using an iodixananol gradient |
ES2340230T3 (es) | 1998-11-10 | 2010-05-31 | University Of North Carolina At Chapel Hill | Vectores viricos y sus procedimientos de preparacion y administracion. |
ES2308989T3 (es) | 1999-08-09 | 2008-12-16 | Targeted Genetics Corporation | Aumento de la expresion de una secuencia nucleotidica heterologa a partir de vectores viricos recombinantes que contienen una secuencia que forman pares de bases intracatenarios. |
US20020006397A1 (en) | 2000-04-28 | 2002-01-17 | Roberts Bruce L. | In VIVO loading of MHC |
US7201898B2 (en) | 2000-06-01 | 2007-04-10 | The University Of North Carolina At Chapel Hill | Methods and compounds for controlled release of recombinant parvovirus vectors |
NZ578982A (en) | 2001-11-13 | 2011-03-31 | Univ Pennsylvania | A method of detecting and/or identifying adeno-associated virus (AAV) sequences and isolating novel sequences identified thereby |
ES2975413T3 (es) | 2001-12-17 | 2024-07-05 | Univ Pennsylvania | Secuencias de serotipo 8 de virus adenoasociado (AAV), vectores que las contienen y usos de las mismas |
US20070015238A1 (en) | 2002-06-05 | 2007-01-18 | Snyder Richard O | Production of pseudotyped recombinant AAV virions |
US20040175727A1 (en) | 2002-11-04 | 2004-09-09 | Advisys, Inc. | Synthetic muscle promoters with activities exceeding naturally occurring regulatory sequences in cardiac cells |
ES2648241T3 (es) | 2003-09-30 | 2017-12-29 | The Trustees Of The University Of Pennsylvania | Clados de virus adenoasociados (AAV), secuencias, vectores que contienen el mismo, y usos de los mismos |
EP2206781B1 (en) | 2004-06-28 | 2015-12-02 | The University Of Western Australia | Antisense oligonucleotides for inducing exon skipping and methods of use thereof |
US8999678B2 (en) | 2005-04-07 | 2015-04-07 | The Trustees Of The University Of Pennsylvania | Method of increasing the function of an AAV vector |
US7456683B2 (en) | 2005-06-09 | 2008-11-25 | Panasonic Corporation | Amplitude error compensating device and quadrature skew error compensating device |
US7588772B2 (en) | 2006-03-30 | 2009-09-15 | Board Of Trustees Of The Leland Stamford Junior University | AAV capsid library and AAV capsid proteins |
CA2667974A1 (en) | 2006-07-05 | 2008-01-10 | The Scripps Research Institute | Chimeric zinc finger recombinases optimized for catalysis by directed evolution |
CN101896186A (zh) | 2007-10-26 | 2010-11-24 | 莱顿教学医院 | 对抗肌肉病症的方式和方法 |
WO2009140427A2 (en) | 2008-05-13 | 2009-11-19 | University Of Washington | Diblock copolymers and polynucleotide complexes thereof for delivery into cells |
CN103725717A (zh) | 2008-10-17 | 2014-04-16 | 焦耳无限科技公司 | 微生物的乙醇生产 |
KR20110095292A (ko) | 2008-11-06 | 2011-08-24 | 유니버시티 오브 워싱톤 | 다중블록 공중합체 |
AU2009311667B2 (en) | 2008-11-07 | 2016-04-14 | Massachusetts Institute Of Technology | Aminoalcohol lipidoids and uses thereof |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
EP2281579A1 (en) | 2009-08-05 | 2011-02-09 | BioNTech AG | Vaccine composition comprising 5'-Cap modified RNA |
US8802437B2 (en) | 2009-09-24 | 2014-08-12 | Cellectis | Meganuclease reagents of uses thereof for treating genetic diseases caused by frame shift/non sense mutations |
EP2533629B1 (en) | 2010-02-11 | 2018-11-28 | Recombinetics, Inc. | Methods and materials for producing transgenic artiodactyls |
CA2793633A1 (en) | 2010-03-29 | 2011-10-13 | The Trustees Of The University Of Pennsylvania | Pharmacologically induced transgene ablation system |
US9315825B2 (en) | 2010-03-29 | 2016-04-19 | The Trustees Of The University Of Pennsylvania | Pharmacologically induced transgene ablation system |
EP2569424A1 (en) | 2010-05-12 | 2013-03-20 | Cellectis | Meganuclease variants cleaving a dna target sequence from the dystrophin gene and uses thereof |
EP3156062A1 (en) | 2010-05-17 | 2017-04-19 | Sangamo BioSciences, Inc. | Novel dna-binding proteins and uses thereof |
IT1400425B1 (it) | 2010-06-08 | 2013-05-31 | Amsterdam Molecular Therapeutics Bv | Modified snrnas for use in therapy. |
US9181675B2 (en) | 2011-05-12 | 2015-11-10 | Hitachi Construction Machinery Co., Ltd. | Construction machine |
AU2012267531B2 (en) | 2011-06-08 | 2017-06-22 | Translate Bio, Inc. | Lipid nanoparticle compositions and methods for mRNA delivery |
WO2013009525A1 (en) | 2011-07-08 | 2013-01-17 | Cellectis S.A. | Method for increasing the efficiency of double-strand break-induced mutagenssis |
EP4043039A1 (en) | 2012-01-27 | 2022-08-17 | BioMarin Technologies B.V. | Rna modulating oligonucleotides with improved characteristics for the treatment of duchenne and becker muscular dystrophy |
WO2013143555A1 (en) | 2012-03-26 | 2013-10-03 | Biontech Ag | Rna formulation for immunotherapy |
WO2013152220A2 (en) | 2012-04-04 | 2013-10-10 | Life Technologies Corporation | Tal-effector assembly platform, customized services, kits and assays |
US9738879B2 (en) | 2012-04-27 | 2017-08-22 | Duke University | Genetic correction of mutated genes |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
EP3800254A1 (en) | 2012-06-08 | 2021-04-07 | Ethris GmbH | Pulmonary delivery of messenger rna |
JP2015527889A (ja) * | 2012-07-25 | 2015-09-24 | ザ ブロード インスティテュート, インコーポレイテッド | 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用 |
SG11201503059XA (en) | 2012-10-23 | 2015-06-29 | Toolgen Inc | Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof |
RU2019143431A (ru) | 2012-11-01 | 2020-04-28 | Фэктор Байосайенс Инк. | Способы и продукты для экспрессии белков в клетках |
WO2014081855A1 (en) | 2012-11-20 | 2014-05-30 | Universite De Montreal | Methods and compositions for muscular dystrophies |
KR102243092B1 (ko) | 2012-12-06 | 2021-04-22 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
SG11201504523UA (en) * | 2012-12-12 | 2015-07-30 | Broad Inst Inc | Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications |
KR20150105633A (ko) * | 2012-12-12 | 2015-09-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작 |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
WO2014093655A2 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
EP4286402A3 (en) | 2012-12-12 | 2024-02-14 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
CA3159715A1 (en) | 2013-03-15 | 2014-09-18 | Edward J. Britt | Energy conversion device and method for making and using same |
US9828582B2 (en) | 2013-03-19 | 2017-11-28 | Duke University | Compositions and methods for the induction and tuning of gene expression |
US20160186208A1 (en) | 2013-04-16 | 2016-06-30 | Whitehead Institute For Biomedical Research | Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal |
CN116083487A (zh) | 2013-05-15 | 2023-05-09 | 桑格摩生物治疗股份有限公司 | 用于治疗遗传病状的方法和组合物 |
EP3004337B1 (en) | 2013-05-29 | 2017-08-02 | Cellectis | Methods for engineering t cells for immunotherapy by using rna-guided cas nuclease system |
US20140356956A1 (en) | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
CA2915842C (en) * | 2013-06-17 | 2022-11-29 | The Broad Institute, Inc. | Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy |
CA2915845A1 (en) * | 2013-06-17 | 2014-12-24 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
US10421957B2 (en) | 2013-07-29 | 2019-09-24 | Agilent Technologies, Inc. | DNA assembly using an RNA-programmable nickase |
CA2919828C (en) | 2013-07-30 | 2022-07-19 | Phaserx, Inc. | Block copolymers and their conjugates or complexes with oligonucleotides |
US9228207B2 (en) * | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
WO2015048690A1 (en) * | 2013-09-27 | 2015-04-02 | The Regents Of The University Of California | Optimized small guide rnas and methods of use |
CA2930015A1 (en) | 2013-11-07 | 2015-05-14 | Editas Medicine, Inc. | Crispr-related methods and compositions with governing grnas |
JP6793547B2 (ja) | 2013-12-12 | 2020-12-02 | ザ・ブロード・インスティテュート・インコーポレイテッド | 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物 |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
WO2015089462A1 (en) * | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing |
AU2014361784A1 (en) | 2013-12-12 | 2016-06-23 | Massachusetts Institute Of Technology | Delivery, use and therapeutic applications of the CRISPR-Cas systems and compositions for HBV and viral diseases and disorders |
CN106536729A (zh) * | 2013-12-12 | 2017-03-22 | 布罗德研究所有限公司 | 使用粒子递送组分靶向障碍和疾病的crispr‑cas系统和组合物的递送、用途和治疗应用 |
BR112016019068A2 (pt) | 2014-02-18 | 2017-10-10 | Univ Duke | construto, vetor recombinante, composição farmacêutica, método de inibição de replicação viral ou expressão de uma sequência alvo em uma célula infectada com um vírus, polipeptídeo de sau cas9 recombinante, construto de sau cas9 recombinante, construto recombinante para expressão de um rna guia individual e kit |
WO2016022866A1 (en) | 2014-08-07 | 2016-02-11 | Agilent Technologies, Inc. | Cis-blocked guide rna |
WO2016094880A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs) |
WO2016094867A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Protected guide rnas (pgrnas) |
US10190106B2 (en) | 2014-12-22 | 2019-01-29 | Univesity Of Massachusetts | Cas9-DNA targeting unit chimeras |
WO2016109255A1 (en) | 2014-12-30 | 2016-07-07 | University Of South Florida | Methods and compositions for cloning into large vectors |
JP6929791B2 (ja) | 2015-02-09 | 2021-09-01 | デューク ユニバーシティ | エピゲノム編集のための組成物および方法 |
WO2016141224A1 (en) | 2015-03-03 | 2016-09-09 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
EP3325018A4 (en) | 2015-07-22 | 2019-04-24 | Duke University | HIGH EFFICIENCY SCREENING OF REGULATORY ELEMENT FUNCTION USING EPIGENOUS EDITING TECHNOLOGIES |
WO2017066497A2 (en) | 2015-10-13 | 2017-04-20 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
KR20180081618A (ko) | 2015-11-30 | 2018-07-16 | 듀크 유니버시티 | 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법 |
US20190127713A1 (en) | 2016-04-13 | 2019-05-02 | Duke University | Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use |
EP3452498B1 (en) | 2016-05-05 | 2023-07-05 | Duke University | Crispr/cas-related compositions for treating duchenne muscular dystrophy |
JP7490211B2 (ja) | 2016-07-19 | 2024-05-27 | デューク ユニバーシティ | Cpf1に基づくゲノム編集の治療適用 |
EP3497221A4 (en) | 2016-08-10 | 2020-02-05 | Duke University | COMPOSITIONS, SYSTEMS AND METHODS FOR PROGRAMMING THE IMMUNCELL FUNCTION BY TARGETED GENERAL REGULATION |
EP3500675A4 (en) | 2016-08-19 | 2020-01-29 | Whitehead Institute for Biomedical Research | METHOD FOR EDITING DNA METHYLATION |
WO2018148256A1 (en) | 2017-02-07 | 2018-08-16 | The Regents Of The University Of California | Gene therapy for haploinsufficiency |
EP3728604A2 (en) | 2017-12-22 | 2020-10-28 | KWS SAAT SE & Co. KGaA | Targeted transcriptional regulation using synthetic transcription factors |
EP3740580A4 (en) | 2018-01-19 | 2021-10-20 | Duke University | GENOME ENGINEERING WITH CRISPR-CAS SYSTEMS IN EUKARYONTS |
EP3861130A4 (en) | 2018-10-02 | 2022-08-03 | Sangamo Therapeutics, Inc. | GENETIC MODULATORS |
US20220177879A1 (en) | 2019-04-12 | 2022-06-09 | Duke University | Crispr/cas-based base editing composition for restoring dystrophin function |
EA202192815A1 (ru) | 2019-04-14 | 2022-01-24 | Дьюк Юниверсити | Опосредуемая aav-вектором делеция крупной мутационной "горячей точки" для лечения мышечной дистрофии дюшенна |
EP3930766A4 (en) | 2019-04-14 | 2023-02-22 | Duke University | CRISPR/CAS-BASED GENE EDITING COMPOSITION TO RESTORE DYSTROPHIN FUNCTION |
EP4010485A4 (en) | 2019-08-08 | 2023-08-23 | Duke University | HIGH-THROUGHPUT SCREENING PLATFORM FOR NEXT-GENERATION GENE THERAPY VECTOR ENGINEERING |
WO2021034984A2 (en) | 2019-08-19 | 2021-02-25 | Duke University | Skeletal myoblast progenitor cell lineage specification by crispr/cas9-based transcriptional activators |
EP4017971A4 (en) | 2019-08-19 | 2023-09-13 | Duke University | COMPOSITIONS AND METHODS FOR IDENTIFYING CELL-TYPE FATE SPECIFICATION REGULATORS |
US20220364124A1 (en) | 2019-10-02 | 2022-11-17 | Duke University | Epigenetic modulation of genomic targets to control expression of pws-associated genes |
EP4069314A4 (en) | 2019-12-03 | 2024-06-26 | Duke University | SYSTEMS AND METHODS FOR LIPID NANOPARTICLE DELIVERY OF GENE EDITING MACHINERY |
US20230201375A1 (en) | 2020-04-27 | 2023-06-29 | Duke University | Targeted genomic integration to restore neurofibromin coding sequence in neurofibromatosis type 1 (nf1) |
US20230257723A1 (en) | 2020-04-27 | 2023-08-17 | Duke University | Crispr/cas9 therapies for correcting duchenne muscular dystrophy by targeted genomic integration |
WO2021222314A1 (en) | 2020-04-27 | 2021-11-04 | Duke University | Gene editing of satellite cells in vivo using aav vectors encoding muscle-specific promoters |
WO2021222327A1 (en) | 2020-04-27 | 2021-11-04 | Duke University | A high-throughput screening method to discover optimal grna pairs for crispr-mediated exon deletion |
US20230159927A1 (en) | 2020-05-08 | 2023-05-25 | Duke University | Chromatin remodelers to enhance targeted gene activation |
-
2016
- 2016-08-25 EP EP16840171.9A patent/EP3341727B1/en active Active
- 2016-08-25 CA CA2996001A patent/CA2996001A1/en active Pending
- 2016-08-25 WO PCT/US2016/048798 patent/WO2017035416A2/en active Application Filing
- 2016-08-25 EP EP24154247.1A patent/EP4345454A3/en active Pending
- 2016-08-25 EA EA201890565A patent/EA201890565A1/ru unknown
- 2016-08-25 KR KR1020247028353A patent/KR20240132120A/ko active Application Filing
- 2016-08-25 MX MX2018002339A patent/MX2018002339A/es unknown
- 2016-08-25 AU AU2016311454A patent/AU2016311454C1/en active Active
- 2016-08-25 EP EP24154252.1A patent/EP4345455A3/en active Pending
- 2016-08-25 CN CN201680061639.8A patent/CN108351350B/zh active Active
- 2016-08-25 US US15/754,861 patent/US11427817B2/en active Active
- 2016-08-25 EP EP22181872.7A patent/EP4177346A3/en not_active Withdrawn
- 2016-08-25 CN CN202210083840.3A patent/CN114634930A/zh active Pending
- 2016-08-25 ES ES16840171T patent/ES2929110T3/es active Active
- 2016-08-25 IL IL288662A patent/IL288662B2/en unknown
- 2016-08-25 KR KR1020187008282A patent/KR102699944B1/ko active Application Filing
- 2016-08-25 BR BR112018003625A patent/BR112018003625A2/pt active Search and Examination
- 2016-08-25 JP JP2018510820A patent/JP6905755B2/ja active Active
-
2018
- 2018-02-22 IL IL257677A patent/IL257677B/en unknown
-
2021
- 2021-06-21 JP JP2021102505A patent/JP2021166523A/ja active Pending
-
2022
- 2022-08-02 US US17/879,506 patent/US20230047669A1/en active Pending
- 2022-08-26 US US17/897,033 patent/US20230304000A1/en active Pending
-
2023
- 2023-09-20 JP JP2023151951A patent/JP2023179511A/ja active Pending
- 2023-10-05 AU AU2023241327A patent/AU2023241327A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140068797A1 (en) * | 2012-05-25 | 2014-03-06 | University Of Vienna | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription |
WO2014093709A1 (en) * | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
US20140295557A1 (en) * | 2013-03-15 | 2014-10-02 | The General Hospital Corporation | Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing |
WO2014197748A2 (en) * | 2013-06-05 | 2014-12-11 | Duke University | Rna-guided gene editing and gene regulation |
Non-Patent Citations (4)
Title |
---|
CRISPR MultiTargeter: A Web Tool to Find Common and Unique CRISPR Single Guide RNA Targets in a Set of Similar Sequences;SergeyV.Prykhozhij,et al;《PLOS ONE》;20150305;第1-18页 * |
Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA;HiroshiNishimasu et al;《Cell》;20140227;第156卷;第935-949页 * |
DNA interrogation by the CRISPR RNA-guided endonuclease Cas9;SamuelH.Sternberg et al;《nature》;20140306;第507卷;第62-67页 * |
Landscape of target:guide homology effects on Cas9-mediated cleavage;Becky Xu Hua Fu,et al;《Nucleic Acids Research》;20141115;第42卷(第22期);第13778-13787页 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108351350B (zh) | 使用rna指导型内切核酸酶改善基因组工程特异性的组合物和方法 | |
US20210395710A1 (en) | Cas9-cas9 fusion proteins | |
Wang et al. | CRISPR/Cas9 in genome editing and beyond | |
JP6700788B2 (ja) | Rna誘導性ヒトゲノム改変 | |
CA3058584A1 (en) | Method for inducing exon skipping by genome editing | |
CA2989830A1 (en) | Crispr enzyme mutations reducing off-target effects | |
US11396664B2 (en) | Replicative transposon system | |
CA3026110A1 (en) | Novel crispr enzymes and systems | |
WO2017015637A9 (en) | High-throughput screening of regulatory element function with epigenome editing technologies | |
EP4349979A1 (en) | Engineered cas12i nuclease, effector protein and use thereof | |
JP7210028B2 (ja) | 遺伝子変異導入方法 | |
KR20220096861A (ko) | 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 | |
Doyon | A marker-free co-selection strategy for high efficiency human genome engineering | |
Agudelo et al. | A marker-free co-selection strategy for high efficiency human genome engineering | |
EA046214B1 (ru) | Композиции и способы улучшения специфичности в геномной инженерии с применением рнк-направляемых эндонуклеаз | |
Activators | CRISPR Reagents and Services from GenScript |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |