EA046542B1 - Рнк-управляемые нуклеазы и активные фрагменты, и их варианты и способы применения - Google Patents
Рнк-управляемые нуклеазы и активные фрагменты, и их варианты и способы применения Download PDFInfo
- Publication number
- EA046542B1 EA046542B1 EA202092929 EA046542B1 EA 046542 B1 EA046542 B1 EA 046542B1 EA 202092929 EA202092929 EA 202092929 EA 046542 B1 EA046542 B1 EA 046542B1
- Authority
- EA
- Eurasian Patent Office
- Prior art keywords
- sequence
- rgn
- rna
- polypeptide
- target dna
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 157
- 239000012634 fragment Substances 0.000 title description 43
- 210000004027 cell Anatomy 0.000 claims description 250
- 108020005004 Guide RNA Proteins 0.000 claims description 249
- 239000002773 nucleotide Substances 0.000 claims description 205
- 125000003729 nucleotide group Chemical group 0.000 claims description 204
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 198
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 194
- 229920001184 polypeptide Polymers 0.000 claims description 193
- 102000040430 polynucleotide Human genes 0.000 claims description 173
- 108091033319 polynucleotide Proteins 0.000 claims description 173
- 239000002157 polynucleotide Substances 0.000 claims description 173
- 101710163270 Nuclease Proteins 0.000 claims description 138
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 110
- 239000013598 vector Substances 0.000 claims description 94
- 108091079001 CRISPR RNA Proteins 0.000 claims description 72
- 150000007523 nucleic acids Chemical class 0.000 claims description 64
- 108020004414 DNA Proteins 0.000 claims description 61
- 230000035772 mutation Effects 0.000 claims description 61
- 102000039446 nucleic acids Human genes 0.000 claims description 61
- 108020004707 nucleic acids Proteins 0.000 claims description 61
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 48
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 46
- 238000003776 cleavage reaction Methods 0.000 claims description 40
- 230000027455 binding Effects 0.000 claims description 39
- 230000007017 scission Effects 0.000 claims description 38
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 22
- 230000008685 targeting Effects 0.000 claims description 22
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 20
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 20
- 230000004048 modification Effects 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 12
- 108091033409 CRISPR Proteins 0.000 claims description 10
- 208000028782 Hereditary disease Diseases 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000012258 culturing Methods 0.000 claims description 5
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 3
- 238000010354 CRISPR gene editing Methods 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 description 129
- 108090000623 proteins and genes Proteins 0.000 description 128
- 241000196324 Embryophyta Species 0.000 description 72
- 238000012217 deletion Methods 0.000 description 67
- 230000037430 deletion Effects 0.000 description 67
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 61
- 201000010099 disease Diseases 0.000 description 51
- 102000004169 proteins and genes Human genes 0.000 description 51
- 235000018102 proteins Nutrition 0.000 description 45
- 230000000694 effects Effects 0.000 description 42
- 238000003752 polymerase chain reaction Methods 0.000 description 39
- 108020001507 fusion proteins Proteins 0.000 description 38
- 102000037865 fusion proteins Human genes 0.000 description 38
- 238000003780 insertion Methods 0.000 description 38
- 230000037431 insertion Effects 0.000 description 38
- 239000000047 product Substances 0.000 description 36
- 125000006850 spacer group Chemical group 0.000 description 35
- 238000007726 management method Methods 0.000 description 34
- 210000001519 tissue Anatomy 0.000 description 33
- 102000004389 Ribonucleoproteins Human genes 0.000 description 32
- 108010081734 Ribonucleoproteins Proteins 0.000 description 32
- 238000013459 approach Methods 0.000 description 31
- 238000000338 in vitro Methods 0.000 description 31
- 239000013612 plasmid Substances 0.000 description 28
- 108091026890 Coding region Proteins 0.000 description 27
- 241000282414 Homo sapiens Species 0.000 description 27
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 27
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 26
- 239000003623 enhancer Substances 0.000 description 25
- 238000013518 transcription Methods 0.000 description 23
- 230000035897 transcription Effects 0.000 description 23
- 208000011580 syndromic disease Diseases 0.000 description 22
- 210000001161 mammalian embryo Anatomy 0.000 description 21
- 210000003463 organelle Anatomy 0.000 description 21
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 20
- 208000024412 Friedreich ataxia Diseases 0.000 description 20
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 20
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 20
- 206010006187 Breast cancer Diseases 0.000 description 19
- 208000026310 Breast neoplasm Diseases 0.000 description 19
- 208000035150 Hypercholesterolemia Diseases 0.000 description 19
- 206010028980 Neoplasm Diseases 0.000 description 19
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 19
- 206010033128 Ovarian cancer Diseases 0.000 description 19
- 206010061535 Ovarian neoplasm Diseases 0.000 description 19
- 210000000481 breast Anatomy 0.000 description 19
- 201000011510 cancer Diseases 0.000 description 19
- 238000010362 genome editing Methods 0.000 description 19
- 230000001105 regulatory effect Effects 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 17
- 108090000790 Enzymes Proteins 0.000 description 17
- 210000004962 mammalian cell Anatomy 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 238000004519 manufacturing process Methods 0.000 description 16
- 238000011282 treatment Methods 0.000 description 16
- 108020004705 Codon Proteins 0.000 description 15
- 125000000539 amino acid group Chemical group 0.000 description 15
- 150000001413 amino acids Chemical class 0.000 description 15
- 230000002526 effect on cardiovascular system Effects 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 15
- 230000006780 non-homologous end joining Effects 0.000 description 15
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 14
- 238000003556 assay Methods 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 239000000523 sample Substances 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 230000005782 double-strand break Effects 0.000 description 13
- 210000003743 erythrocyte Anatomy 0.000 description 13
- 230000002068 genetic effect Effects 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 230000001404 mediated effect Effects 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 238000004806 packaging method and process Methods 0.000 description 13
- 229920002401 polyacrylamide Polymers 0.000 description 13
- 230000003612 virological effect Effects 0.000 description 13
- 239000013607 AAV vector Substances 0.000 description 12
- 101150034941 AURKB gene Proteins 0.000 description 12
- 101000896557 Homo sapiens Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 12
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 12
- 208000015178 Hurler syndrome Diseases 0.000 description 12
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 12
- 208000026350 Inborn Genetic disease Diseases 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 230000002759 chromosomal effect Effects 0.000 description 12
- 239000000499 gel Substances 0.000 description 12
- 208000016361 genetic disease Diseases 0.000 description 12
- 108700028369 Alleles Proteins 0.000 description 11
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 108700020462 BRCA2 Proteins 0.000 description 10
- 102000052609 BRCA2 Human genes 0.000 description 10
- 101150008921 Brca2 gene Proteins 0.000 description 10
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 10
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 10
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 10
- 108010054147 Hemoglobins Proteins 0.000 description 10
- 102000001554 Hemoglobins Human genes 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 102100035028 Alpha-L-iduronidase Human genes 0.000 description 9
- 108700020463 BRCA1 Proteins 0.000 description 9
- 102000036365 BRCA1 Human genes 0.000 description 9
- 101150072950 BRCA1 gene Proteins 0.000 description 9
- 101001019502 Homo sapiens Alpha-L-iduronidase Proteins 0.000 description 9
- 101000982032 Homo sapiens Myosin-binding protein C, cardiac-type Proteins 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 9
- 102100026771 Myosin-binding protein C, cardiac-type Human genes 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000008439 repair process Effects 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 241000701161 unidentified adenovirus Species 0.000 description 9
- 239000013603 viral vector Substances 0.000 description 9
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 8
- 102000055025 Adenosine deaminases Human genes 0.000 description 8
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 8
- 206010010356 Congenital anomaly Diseases 0.000 description 8
- 102100026846 Cytidine deaminase Human genes 0.000 description 8
- 108010031325 Cytidine deaminase Proteins 0.000 description 8
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 238000010172 mouse model Methods 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 7
- 241000702421 Dependoparvovirus Species 0.000 description 7
- 241000238631 Hexapoda Species 0.000 description 7
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 230000000149 penetrating effect Effects 0.000 description 7
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 7
- 208000007056 sickle cell anemia Diseases 0.000 description 7
- 230000009261 transgenic effect Effects 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 102100032539 Calpain-3 Human genes 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 102100031690 Erythroid transcription factor Human genes 0.000 description 6
- 102100031509 Fibrillin-1 Human genes 0.000 description 6
- 102100037156 Gap junction beta-2 protein Human genes 0.000 description 6
- 101000867715 Homo sapiens Calpain-3 Proteins 0.000 description 6
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 6
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 description 6
- 101000954092 Homo sapiens Gap junction beta-2 protein Proteins 0.000 description 6
- 101000694017 Homo sapiens Sodium channel protein type 5 subunit alpha Proteins 0.000 description 6
- 208000031309 Hypertrophic Familial Cardiomyopathy Diseases 0.000 description 6
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 6
- 102000004913 RYR1 Human genes 0.000 description 6
- 108060007240 RYR1 Proteins 0.000 description 6
- 108091028664 Ribonucleotide Proteins 0.000 description 6
- 102100027198 Sodium channel protein type 5 subunit alpha Human genes 0.000 description 6
- 241000193996 Streptococcus pyogenes Species 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000012350 deep sequencing Methods 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 6
- 201000006692 familial hypertrophic cardiomyopathy Diseases 0.000 description 6
- 210000002950 fibroblast Anatomy 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 239000002336 ribonucleotide Substances 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 230000005783 single-strand break Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 5
- 206010059027 Brugada syndrome Diseases 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108010044495 Fetal Hemoglobin Proteins 0.000 description 5
- 208000024556 Mendelian disease Diseases 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 210000003995 blood forming stem cell Anatomy 0.000 description 5
- 239000013592 cell lysate Substances 0.000 description 5
- 230000009615 deamination Effects 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 230000004049 epigenetic modification Effects 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 102000018146 globin Human genes 0.000 description 5
- 108060003196 globin Proteins 0.000 description 5
- -1 glufosinatammonia Chemical class 0.000 description 5
- 230000002779 inactivation Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 230000009870 specific binding Effects 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 206010003594 Ataxia telangiectasia Diseases 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 206010062759 Congenital dyskeratosis Diseases 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 208000033640 Hereditary breast cancer Diseases 0.000 description 4
- 101001030243 Homo sapiens Myosin-7 Proteins 0.000 description 4
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 description 4
- 101000899806 Homo sapiens Retinal guanylyl cyclase 1 Proteins 0.000 description 4
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 4
- 102100038934 Myosin-7 Human genes 0.000 description 4
- 108020004485 Nonsense Codon Proteins 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 102100026531 Prelamin-A/C Human genes 0.000 description 4
- 102000014450 RNA Polymerase III Human genes 0.000 description 4
- 108010078067 RNA Polymerase III Proteins 0.000 description 4
- 102100022663 Retinal guanylyl cyclase 1 Human genes 0.000 description 4
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000009418 agronomic effect Effects 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 208000015700 familial long QT syndrome Diseases 0.000 description 4
- 208000034737 hemoglobinopathy Diseases 0.000 description 4
- 208000025581 hereditary breast carcinoma Diseases 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000037434 nonsense mutation Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 201000003508 omphalocele Diseases 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 238000010206 sensitivity analysis Methods 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 201000010866 very long chain acyl-CoA dehydrogenase deficiency Diseases 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 102100022681 40S ribosomal protein S27 Human genes 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 3
- 102100025683 Alkaline phosphatase, tissue-nonspecific isozyme Human genes 0.000 description 3
- 102100022146 Arylsulfatase A Human genes 0.000 description 3
- 208000014644 Brain disease Diseases 0.000 description 3
- 208000037148 Calpain-3-related limb-girdle muscular dystrophy R1 Diseases 0.000 description 3
- 102100027591 Copper-transporting ATPase 2 Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 208000032274 Encephalopathy Diseases 0.000 description 3
- 102000003869 Frataxin Human genes 0.000 description 3
- 108090000217 Frataxin Proteins 0.000 description 3
- 101150103820 Fxn gene Proteins 0.000 description 3
- 208000031448 Genomic Instability Diseases 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 102000007513 Hemoglobin A Human genes 0.000 description 3
- 108010085682 Hemoglobin A Proteins 0.000 description 3
- 108091027305 Heteroduplex Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000678466 Homo sapiens 40S ribosomal protein S27 Proteins 0.000 description 3
- 101000574445 Homo sapiens Alkaline phosphatase, tissue-nonspecific isozyme Proteins 0.000 description 3
- 101000936280 Homo sapiens Copper-transporting ATPase 2 Proteins 0.000 description 3
- 101000764260 Homo sapiens Troponin T, cardiac muscle Proteins 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- 206010020844 Hyperthermia malignant Diseases 0.000 description 3
- 101150022680 IDUA gene Proteins 0.000 description 3
- 108010011185 KCNQ1 Potassium Channel Proteins 0.000 description 3
- 108010006746 KCNQ2 Potassium Channel Proteins 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 208000015439 Lysosomal storage disease Diseases 0.000 description 3
- 208000018717 Malignant hyperthermia of anesthesia Diseases 0.000 description 3
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 102100025169 Max-binding protein MNT Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 208000021642 Muscular disease Diseases 0.000 description 3
- 201000009623 Myopathy Diseases 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 201000011252 Phenylketonuria Diseases 0.000 description 3
- 102100037444 Potassium voltage-gated channel subfamily KQT member 1 Human genes 0.000 description 3
- 102100034354 Potassium voltage-gated channel subfamily KQT member 2 Human genes 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 102100036924 Solute carrier family 22 member 5 Human genes 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- 102000003567 TRPV4 Human genes 0.000 description 3
- 101150098315 TRPV4 gene Proteins 0.000 description 3
- 208000002903 Thalassemia Diseases 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102100026893 Troponin T, cardiac muscle Human genes 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 3
- 201000008101 adult hypophosphatasia Diseases 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 201000009564 autosomal recessive limb-girdle muscular dystrophy type 2A Diseases 0.000 description 3
- 230000009287 biochemical signal transduction Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 238000002716 delivery method Methods 0.000 description 3
- 208000037765 diseases and disorders Diseases 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 230000001037 epileptic effect Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000011577 humanized mouse model Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 208000018337 inherited hemoglobinopathy Diseases 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 201000007004 malignant hyperthermia Diseases 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 201000006938 muscular dystrophy Diseases 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 108091006107 transcriptional repressors Proteins 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 208000006044 2-methylbutyryl-CoA dehydrogenase deficiency Diseases 0.000 description 2
- 102100036512 7-dehydrocholesterol reductase Human genes 0.000 description 2
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- 102100036664 Adenosine deaminase Human genes 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 208000026669 Baraitser-Winter syndrome 1 Diseases 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 208000031229 Cardiomyopathies Diseases 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 102100033601 Collagen alpha-1(I) chain Human genes 0.000 description 2
- 206010010099 Combined immunodeficiency Diseases 0.000 description 2
- 208000014567 Congenital Disorders of Glycosylation Diseases 0.000 description 2
- 201000002200 Congenital disorder of glycosylation Diseases 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 2
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 2
- 229920000045 Dermatan sulfate Polymers 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241001495410 Enterococcus sp. Species 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000283074 Equus asinus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 2
- 208000002893 Floating-Harbor syndrome Diseases 0.000 description 2
- 208000006517 Fumaric aciduria Diseases 0.000 description 2
- 108700036912 Fumaric aciduria Proteins 0.000 description 2
- 208000013135 GNE myopathy Diseases 0.000 description 2
- 208000036893 GUCY2D-related dominant retinopathy Diseases 0.000 description 2
- 208000036357 GUCY2D-related recessive retinopathy Diseases 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 206010051066 Gastrointestinal stromal tumour Diseases 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 102100029880 Glycodelin Human genes 0.000 description 2
- 244000299507 Gossypium hirsutum Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 2
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 2
- 229920002971 Heparan sulfate Polymers 0.000 description 2
- 102100039869 Histone H2B type F-S Human genes 0.000 description 2
- 101000928720 Homo sapiens 7-dehydrocholesterol reductase Proteins 0.000 description 2
- 101100493741 Homo sapiens BCL11A gene Proteins 0.000 description 2
- 101000980898 Homo sapiens Cell division cycle-associated protein 4 Proteins 0.000 description 2
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 2
- 101100072069 Homo sapiens IDUA gene Proteins 0.000 description 2
- 101001018717 Homo sapiens Mitofusin-2 Proteins 0.000 description 2
- 101000629029 Homo sapiens Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Proteins 0.000 description 2
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 2
- 101001045218 Homo sapiens Peroxisomal multifunctional enzyme type 2 Proteins 0.000 description 2
- 101001094831 Homo sapiens Phosphomannomutase 2 Proteins 0.000 description 2
- 101001123963 Homo sapiens Protein O-mannosyl-transferase 1 Proteins 0.000 description 2
- 101001091536 Homo sapiens Pyruvate kinase PKLR Proteins 0.000 description 2
- 101000639763 Homo sapiens Regulator of telomere elongation helicase 1 Proteins 0.000 description 2
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 2
- 101000760716 Homo sapiens Short-chain specific acyl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 2
- 101000851892 Homo sapiens Tropomyosin beta chain Proteins 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- VSNHCAURESNICA-UHFFFAOYSA-N Hydroxyurea Chemical compound NC(=O)NO VSNHCAURESNICA-UHFFFAOYSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 208000033868 Lysosomal disease Diseases 0.000 description 2
- 102100033703 Mitofusin-2 Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000282339 Mustela Species 0.000 description 2
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 2
- 108010009047 Myosin VIIa Proteins 0.000 description 2
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 2
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102100022587 Peroxisomal multifunctional enzyme type 2 Human genes 0.000 description 2
- 102100035362 Phosphomannomutase 2 Human genes 0.000 description 2
- 102100028120 Protein O-mannosyl-transferase 1 Human genes 0.000 description 2
- 108700014121 Pyruvate Kinase Deficiency of Red Cells Proteins 0.000 description 2
- 102100034909 Pyruvate kinase PKLR Human genes 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 102100034469 Regulator of telomere elongation helicase 1 Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 201000004224 Schnyder corneal dystrophy Diseases 0.000 description 2
- 241000270295 Serpentes Species 0.000 description 2
- 208000009642 Severe combined immunodeficiency due to adenosine deaminase deficiency Diseases 0.000 description 2
- 102100024639 Short-chain specific acyl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 201000007410 Smith-Lemli-Opitz syndrome Diseases 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 2
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 102100036471 Tropomyosin beta chain Human genes 0.000 description 2
- 102100031835 Unconventional myosin-VIIa Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 208000001489 acromicric dysplasia Diseases 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 2
- 108010029483 alpha 1 Chain Collagen Type I Proteins 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 208000036556 autosomal recessive T cell-negative B cell-negative NK cell-negative due to adenosine deaminase deficiency severe combined immunodeficiency Diseases 0.000 description 2
- 201000011390 autosomal recessive nonsyndromic deafness 2 Diseases 0.000 description 2
- 208000036531 autosomal recessive nonsyndromic hearing loss 2 Diseases 0.000 description 2
- 208000005980 beta thalassemia Diseases 0.000 description 2
- 230000001588 bifunctional effect Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000010322 bone marrow transplantation Methods 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 239000012707 chemical precursor Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 230000001684 chronic effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 201000000440 cone-rod dystrophy 6 Diseases 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 description 2
- 229940051593 dermatan sulfate Drugs 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 201000011247 dilated cardiomyopathy 1DD Diseases 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 208000019595 distal arthrogryposis type 1A Diseases 0.000 description 2
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical compound [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000002641 enzyme replacement therapy Methods 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 208000014346 fumarase deficiency Diseases 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 208000015362 glutaric aciduria Diseases 0.000 description 2
- 208000007345 glycogen storage disease Diseases 0.000 description 2
- 230000003394 haemopoietic effect Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 102000044493 human CDCA4 Human genes 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 229960001330 hydroxycarbamide Drugs 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000001597 immobilized metal affinity chromatography Methods 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000025608 mitochondrion localization Effects 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 230000000926 neurological effect Effects 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 201000007909 oculocutaneous albinism Diseases 0.000 description 2
- 201000010464 osteogenesis imperfecta type 1 Diseases 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000000858 peroxisomal effect Effects 0.000 description 2
- 230000025540 plastid localization Effects 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 201000005825 prostate adenocarcinoma Diseases 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008844 regulatory mechanism Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 208000016505 systemic primary carnitine deficiency disease Diseases 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229910021642 ultra pure water Inorganic materials 0.000 description 2
- 239000012498 ultrapure water Substances 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 210000005167 vascular cell Anatomy 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical class O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 102100033875 3-oxo-5-alpha-steroid 4-dehydrogenase 2 Human genes 0.000 description 1
- PSGQCCSGKGJLRL-UHFFFAOYSA-N 4-methyl-2h-chromen-2-one Chemical group C1=CC=CC2=C1OC(=O)C=C2C PSGQCCSGKGJLRL-UHFFFAOYSA-N 0.000 description 1
- 208000030209 46,XY disorder of sex development due to 5-alpha-reductase 2 deficiency Diseases 0.000 description 1
- 102100024626 5'-AMP-activated protein kinase subunit gamma-2 Human genes 0.000 description 1
- SNSZJFZKAOZQQC-OLVFGWLSSA-N 5'-GAGACCC-3' RNA fragment Chemical compound Nc1ccn([C@@H]2O[C@H](COP(O)(=O)O[C@@H]3[C@@H](COP(O)(=O)O[C@@H]4[C@@H](COP(O)(=O)O[C@@H]5[C@@H](COP(O)(=O)O[C@@H]6[C@@H](COP(O)(=O)O[C@@H]7[C@@H](COP(O)(=O)O[C@@H]8[C@@H](CO)O[C@H]([C@@H]8O)n8cnc9c8[nH]c(N)nc9=O)O[C@H]([C@@H]7O)n7cnc8c(N)ncnc78)O[C@H]([C@@H]6O)n6cnc7c6[nH]c(N)nc7=O)O[C@H]([C@@H]5O)n5cnc6c(N)ncnc56)O[C@H]([C@@H]4O)n4ccc(N)nc4=O)O[C@H]([C@@H]3O)n3ccc(N)nc3=O)[C@@H](O)[C@H]2O)c(=O)n1 SNSZJFZKAOZQQC-OLVFGWLSSA-N 0.000 description 1
- 102100024645 ATP-binding cassette sub-family C member 8 Human genes 0.000 description 1
- 102100036732 Actin, aortic smooth muscle Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 102100035886 Adenine DNA glycosylase Human genes 0.000 description 1
- 102100032157 Adenylate cyclase type 10 Human genes 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 1
- 208000024985 Alport syndrome Diseases 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 241000208223 Anacardiaceae Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 206010002329 Aneurysm Diseases 0.000 description 1
- 208000031782 Anoctamin-5-related limb-girdle muscular dystrophy R12 Diseases 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000008882 Benign Neonatal Epilepsy Diseases 0.000 description 1
- 208000020749 Benign familial neonatal-infantile seizures Diseases 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 241000220243 Brassica sp. Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 244000045232 Canavalia ensiformis Species 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 229920000049 Carbon (fiber) Polymers 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241000701459 Caulimovirus Species 0.000 description 1
- 102100032212 Caveolin-3 Human genes 0.000 description 1
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 1
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 1
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 1
- 102100023457 Chloride channel protein 1 Human genes 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 102100033775 Collagen alpha-5(IV) chain Human genes 0.000 description 1
- 206010010582 Congenital osteodystrophy Diseases 0.000 description 1
- 206010010774 Constipation Diseases 0.000 description 1
- 206010066946 Craniofacial dysostosis Diseases 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 201000006526 Crouzon syndrome Diseases 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 102100023381 Cyanocobalamin reductase / alkylcobalamin dealkylase Human genes 0.000 description 1
- 101710164985 Cyanocobalamin reductase / alkylcobalamin dealkylase Proteins 0.000 description 1
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 1
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102100027417 Cytochrome P450 1B1 Human genes 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 238000012287 DNA Binding Assay Methods 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 102100036951 DNA polymerase subunit gamma-1 Human genes 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 206010011878 Deafness Diseases 0.000 description 1
- 206010011891 Deafness neurosensory Diseases 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 208000002251 Dissecting Aneurysm Diseases 0.000 description 1
- 102100033156 Dopamine beta-hydroxylase Human genes 0.000 description 1
- 208000007652 Dysostoses Diseases 0.000 description 1
- 201000001324 Dysostosis Diseases 0.000 description 1
- 241001370739 Empedobacter sp. Species 0.000 description 1
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 240000002395 Euphorbia pulcherrima Species 0.000 description 1
- 102100039111 FAD-linked sulfhydryl oxidase ALR Human genes 0.000 description 1
- 208000034846 Familial Amyloid Neuropathies Diseases 0.000 description 1
- 206010016207 Familial Mediterranean fever Diseases 0.000 description 1
- 108700010192 Familial Thoracic 6 Aortic Aneurysm Proteins 0.000 description 1
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 1
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 1
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 1
- 102100028875 Formylglycine-generating enzyme Human genes 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100021792 Gamma-sarcoglycan Human genes 0.000 description 1
- 208000015872 Gaucher disease Diseases 0.000 description 1
- 208000037310 Gaucher disease type 2 Diseases 0.000 description 1
- 208000020916 Gaucher disease type II Diseases 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102100028603 Glutaryl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 208000012473 Goldmann-Favre syndrome Diseases 0.000 description 1
- 102100033851 Gonadotropin-releasing hormone receptor Human genes 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 101150013707 HBB gene Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 102100031880 Helicase SRCAP Human genes 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241000224421 Heterolobosea Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000043851 Histone deacetylase domains Human genes 0.000 description 1
- 108700038236 Histone deacetylase domains Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000640851 Homo sapiens 3-oxo-5-alpha-steroid 4-dehydrogenase 2 Proteins 0.000 description 1
- 101000760987 Homo sapiens 5'-AMP-activated protein kinase subunit gamma-2 Proteins 0.000 description 1
- 101000760570 Homo sapiens ATP-binding cassette sub-family C member 8 Proteins 0.000 description 1
- 101000929319 Homo sapiens Actin, aortic smooth muscle Proteins 0.000 description 1
- 101001000351 Homo sapiens Adenine DNA glycosylase Proteins 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 1
- 101000869042 Homo sapiens Caveolin-3 Proteins 0.000 description 1
- 101000906651 Homo sapiens Chloride channel protein 1 Proteins 0.000 description 1
- 101000710886 Homo sapiens Collagen alpha-5(IV) chain Proteins 0.000 description 1
- 101000725164 Homo sapiens Cytochrome P450 1B1 Proteins 0.000 description 1
- 101000804964 Homo sapiens DNA polymerase subunit gamma-1 Proteins 0.000 description 1
- 101000959079 Homo sapiens FAD-linked sulfhydryl oxidase ALR Proteins 0.000 description 1
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 1
- 101000648611 Homo sapiens Formylglycine-generating enzyme Proteins 0.000 description 1
- 101000616435 Homo sapiens Gamma-sarcoglycan Proteins 0.000 description 1
- 101001058943 Homo sapiens Glutaryl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101000996727 Homo sapiens Gonadotropin-releasing hormone receptor Proteins 0.000 description 1
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101000944277 Homo sapiens Inward rectifier potassium channel 2 Proteins 0.000 description 1
- 101000994149 Homo sapiens Iron-sulfur cluster assembly 2 homolog, mitochondrial Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000697649 Homo sapiens Mitochondrial chaperone BCS1 Proteins 0.000 description 1
- 101000996052 Homo sapiens Nicotinamide/nicotinic acid mononucleotide adenylyltransferase 1 Proteins 0.000 description 1
- 101000595929 Homo sapiens POLG alternative reading frame Proteins 0.000 description 1
- 101001000631 Homo sapiens Peripheral myelin protein 22 Proteins 0.000 description 1
- 101001082860 Homo sapiens Peroxisomal membrane protein 2 Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101000633511 Homo sapiens Photoreceptor-specific nuclear receptor Proteins 0.000 description 1
- 101001098982 Homo sapiens Propionyl-CoA carboxylase beta chain, mitochondrial Proteins 0.000 description 1
- 101000740825 Homo sapiens Protein C10 Proteins 0.000 description 1
- 101000880790 Homo sapiens Protein SSUH2 homolog Proteins 0.000 description 1
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 1
- 101001062129 Homo sapiens RNA-binding protein 20 Proteins 0.000 description 1
- 101000729271 Homo sapiens Retinoid isomerohydrolase Proteins 0.000 description 1
- 101000683839 Homo sapiens Selenoprotein N Proteins 0.000 description 1
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 1
- 101000799194 Homo sapiens Serine/threonine-protein kinase receptor R3 Proteins 0.000 description 1
- 101000684826 Homo sapiens Sodium channel protein type 2 subunit alpha Proteins 0.000 description 1
- 101000693993 Homo sapiens Sodium channel protein type 4 subunit alpha Proteins 0.000 description 1
- 101000934888 Homo sapiens Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Proteins 0.000 description 1
- 101000801040 Homo sapiens Transmembrane channel-like protein 1 Proteins 0.000 description 1
- 101000801701 Homo sapiens Tropomyosin alpha-1 chain Proteins 0.000 description 1
- 101000667110 Homo sapiens Vacuolar protein sorting-associated protein 13B Proteins 0.000 description 1
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 1
- 241001091442 Hydrangeaceae Species 0.000 description 1
- 241000282620 Hylobates sp. Species 0.000 description 1
- 208000007599 Hyperkalemic periodic paralysis Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 206010058359 Hypogonadism Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 102100033114 Inward rectifier potassium channel 2 Human genes 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 206010022971 Iron Deficiencies Diseases 0.000 description 1
- 102100031428 Iron-sulfur cluster assembly 2 homolog, mitochondrial Human genes 0.000 description 1
- 102100025392 Isovaleryl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 241000588754 Klebsiella sp. Species 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 241000186610 Lactobacillus sp. Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 102100022745 Laminin subunit alpha-2 Human genes 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 201000002542 Leber congenital amaurosis 2 Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 201000005978 Loeys-Dietz syndrome Diseases 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 208000001826 Marfan syndrome Diseases 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 102100030550 Menin Human genes 0.000 description 1
- 101100409013 Mesembryanthemum crystallinum PPD gene Proteins 0.000 description 1
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 206010051403 Mitochondrial DNA deletion Diseases 0.000 description 1
- 102100027891 Mitochondrial chaperone BCS1 Human genes 0.000 description 1
- 208000000149 Multiple Sulfatase Deficiency Disease Diseases 0.000 description 1
- 208000035032 Multiple sulfatase deficiency Diseases 0.000 description 1
- 101100113998 Mus musculus Cnbd2 gene Proteins 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 208000029578 Muscle disease Diseases 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 241000202944 Mycoplasma sp. Species 0.000 description 1
- 208000010316 Myotonia congenita Diseases 0.000 description 1
- 102100022691 NACHT, LRR and PYD domains-containing protein 3 Human genes 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 244000230712 Narcissus tazetta Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 241000207746 Nicotiana benthamiana Species 0.000 description 1
- 102100034451 Nicotinamide/nicotinic acid mononucleotide adenylyltransferase 1 Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 208000021527 Ocular cystinosis Diseases 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710113020 Ornithine transcarbamylase, mitochondrial Proteins 0.000 description 1
- 101150108119 PDS gene Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100035278 Pendrin Human genes 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 102100030564 Peroxisomal membrane protein 2 Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100029533 Photoreceptor-specific nuclear receptor Human genes 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 208000008601 Polycythemia Diseases 0.000 description 1
- 102100039025 Propionyl-CoA carboxylase beta chain, mitochondrial Human genes 0.000 description 1
- 102100038957 Protein C10 Human genes 0.000 description 1
- 102100037719 Protein SSUH2 homolog Human genes 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 1
- 102100039233 Pyrin Human genes 0.000 description 1
- 108010059278 Pyrin Proteins 0.000 description 1
- 108010001946 Pyrin Domain-Containing 3 Protein NLR Family Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102100029248 RNA-binding protein 20 Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 102100031176 Retinoid isomerohydrolase Human genes 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 241000208422 Rhododendron Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 108091006736 SLC22A5 Proteins 0.000 description 1
- 108091006507 SLC26A4 Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100170553 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DLD2 gene Proteins 0.000 description 1
- 241000607149 Salmonella sp. Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 102100023781 Selenoprotein N Human genes 0.000 description 1
- 208000009966 Sensorineural Hearing Loss Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 1
- 102100034136 Serine/threonine-protein kinase receptor R3 Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 241000607758 Shigella sp. Species 0.000 description 1
- 108010016797 Sickle Hemoglobin Proteins 0.000 description 1
- 206010040642 Sickle cell anaemia with crisis Diseases 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 102100023150 Sodium channel protein type 2 subunit alpha Human genes 0.000 description 1
- 102100027195 Sodium channel protein type 4 subunit alpha Human genes 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 208000027073 Stargardt disease Diseases 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- 102100025393 Succinate dehydrogenase cytochrome b560 subunit, mitochondrial Human genes 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 208000034677 Tateyama type distal myopathy Diseases 0.000 description 1
- 206010043189 Telangiectasia Diseases 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 208000035954 Thomsen and Becker disease Diseases 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102100033690 Transmembrane channel-like protein 1 Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102100033632 Tropomyosin alpha-1 chain Human genes 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102100039113 Vacuolar protein sorting-associated protein 13B Human genes 0.000 description 1
- 241000607284 Vibrio sp. Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 101000649206 Xanthomonas campestris pv. campestris (strain 8004) Uridine 5'-monophosphate transferase Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000131891 Yersinia sp. Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 210000003001 amoeba Anatomy 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 208000025355 anterior segment dysgenesis 6 Diseases 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 208000012892 autosomal dominant progressive external ophthalmoplegia Diseases 0.000 description 1
- 201000011409 autosomal recessive nonsyndromic deafness 1A Diseases 0.000 description 1
- 201000006174 autosomal recessive nonsyndromic deafness 7 Diseases 0.000 description 1
- 208000031514 autosomal recessive nonsyndromic hearing loss 1A Diseases 0.000 description 1
- 208000032347 autosomal recessive nonsyndromic hearing loss 4 Diseases 0.000 description 1
- 208000032445 autosomal recessive nonsyndromic hearing loss 7 Diseases 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 208000032212 benign familial infantile 3 seizures Diseases 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 239000004917 carbon fiber Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 101150062912 cct3 gene Proteins 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000009920 chelation Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 230000035606 childbirth Effects 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 230000005757 colony formation Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 208000003904 cone-rod dystrophy 3 Diseases 0.000 description 1
- 201000006815 congenital muscular dystrophy Diseases 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 208000035250 cutaneous malignant susceptibility to 1 melanoma Diseases 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 201000011290 dilated cardiomyopathy 1G Diseases 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- 108700006189 dopamine beta hydroxylase deficiency Proteins 0.000 description 1
- 208000009308 dopamine beta-hydroxylase deficiency Diseases 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 244000013123 dwarf bean Species 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 201000003441 enhanced S-cone syndrome Diseases 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 201000011458 enlarged vestibular aqueduct Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000007608 epigenetic mechanism Effects 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 210000000267 erythroid cell Anatomy 0.000 description 1
- 210000003013 erythroid precursor cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 230000002008 hemorrhagic effect Effects 0.000 description 1
- 208000003215 hereditary nephritis Diseases 0.000 description 1
- 102000052096 human BCL11A Human genes 0.000 description 1
- 210000005119 human aortic smooth muscle cell Anatomy 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 206010020871 hypertrophic cardiomyopathy Diseases 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000002580 nephropathic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000004792 oxidative damage Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- YIQPUIGJQJDJOS-UHFFFAOYSA-N plerixafor Chemical compound C=1C=C(CN2CCNCCCNCCNCCC2)C=CC=1CN1CCCNCCNCCCNCC1 YIQPUIGJQJDJOS-UHFFFAOYSA-N 0.000 description 1
- 229960002169 plerixafor Drugs 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 101150063097 ppdK gene Proteins 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 201000004012 propionic acidemia Diseases 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 102200044417 rs28931612 Human genes 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 231100000879 sensorineural hearing loss Toxicity 0.000 description 1
- 208000023573 sensorineural hearing loss disease Diseases 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000012868 site-directed mutagenesis technique Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 208000009056 telangiectasis Diseases 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000000115 thoracic cavity Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 230000005760 tumorsuppression Effects 0.000 description 1
- 238000001419 two-dimensional polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Description
Область техники, к которой относится изобретение
Настоящее изобретение относится к области молекулярной биологии и редактирования генов.
Предпосылки создания изобретения
Целевое редактирование или модификация генома быстро становится важным инструментом фундаментальных и прикладных исследований. Первоначальные методы включали конструирование нуклеаз, таких как мегануклеазы, слитые белки с цинковыми пальцами или TALEN, что требовало создания химерных нуклеаз с сконструированными, программируемыми, специфичными для последовательности ДНК-связывающими доменами, специфичными для каждой конкретной целевой последовательности. РНК-управляемые нуклеазы, такие как Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-ассоциированные (cas) белки бактериальной системы CRISPR-cas, позволяют нацеливаться на определенные последовательности путем образования комплекса нуклеаз с управляющей РНК, которая специфически гибридизуется с конкретной последовательностью-мишенью. Производство специфичных для мишени управляющих РНК менее затратно и более эффективно, чем создание химерных нуклеаз для каждой целевой последовательности. Такие РНК-управляемые нуклеазы можно использовать для редактирования геномов путем введения специфичного для последовательности двух-цепочечного разрыва, который восстанавливается с помощью подверженного ошибкам негомологичного соединения концов (NHEJ), чтобы ввести мутацию в конкретное место генома. Кроме того, гетерологичная ДНК может быть введена в геномный сайт посредством гомологически направленной репарации.
Краткое изложение сущности изобретения
Предлагаются композиции и способы связывания представляющей интерес целевой последовательности. Такие композиции находят применение при расщеплении или модификации представляющей интерес целевой последовательности, для обнаружения представляющей интерес целевой последовательности и модификации экспрессии представляющей интерес последовательности. Композиции включают полипептиды РНК-управляемой нуклеазы (RGN), CRISPR-PHK (crPHK), трансактивирующие CRISPRPHK (tracrPHK), управляющие РНК (gPHK), молекулы нуклеиновых кислот, кодирующие их, а также векторы и клетки-хозяева, содержащие молекулы нуклеиновых кислот. Также предусмотрены системы CRISPR для связывания представляющей интерес целевой последовательности, при этом система CRISPR включает РНК-управляемый полипептид нуклеазы и одну или несколько управляющих РНК. Таким образом, предложенные в настоящем изобретении способы предназначены для связывания представляющей интерес целевой последовательности и, в некоторых вариантах осуществления изобретения, для расщепления или модификации представляющей интерес последовательности-мишени. Представляющая интерес целевая последовательность может быть модифицирована, например, в результате негомологичного соединения концов или гомологически направленной репарации с введенной донорской последовательностью.
Подробное описание
Специалисты в данной области, к которой относятся эти изобретения, имея возможность ознакомиться с приведенными ниже в данном документе описанием и соответствующими рисунками, сможет представить много модификаций и другие варианты осуществления изобретений, описанных в данном изобретении. Следовательно, следует понимать, что осуществления изобретения не должны ограничиваться конкретными представленными вариантами осуществления изобретения и, что модификации и другие варианты осуществления изобретения предназначены для включения в объем прилагаемых вариантов осуществления изобретения. Хотя здесь используются специфические термины, они используются только в общем и описательном смысле, а не в целях ограничения.
I. Обзор.
РНК-управляемые нуклеазы (RGN) позволяют целенаправленно манипулировать одним сайтом в геноме и полезны в контексте применения генного нацеливания для терапевтических и исследовательских целей. У множества организмов, включая млекопитающих, РНК-управляемые нуклеазы использовались для геномной инженерии, например, путем стимуляции негомологичного соединения концов и гомологичной рекомбинации. Композиции и способы, описанные в данном документе, применимы для создания одно- или двух-цепочечных разрывов в полинуклеотидах, модификации полинуклеотидов, обнаружения конкретного сайта в полинуклеотиде или модификации экспрессии конкретного гена.
Описанные здесь РНК-управляемые нуклеазы могут изменять экспрессию гена путем модификации целевой последовательности. В конкретных вариантах осуществления изобретения РНК-управляемые нуклеазы направляются в целевую последовательность с помощью управляющей РНК (gPHK), как части кластерной системы РНК-управляемых нуклеаз с регулярными интервалами коротких палиндромных повторов (CRISPR). Управляющие РНК образуют комплекс с РНК-управляемыми нуклеазами, чтобы направлять РНК-управляемую нуклеазу на связывание с целевой последовательностью и в некоторых вариантах осуществления изобретения на то чтобы вносить одно- или двух-цепочечный разрыв в целевую последовательность. После того, как целевая последовательность была расщеплена, разрыв может быть восстановлен таким образом, что последовательность ДНК целевой последовательности будет изменена в процессе восстановления. Таким образом, в настоящем документе представлены способы использования РНК-управляемых нуклеаз для модификации целевой последовательности в ДНК клеток
- 1 046542 хозяев. Например, РНК-управляемые нуклеазы могут использоваться для модификации целевой последовательности в геномном локусе эукариотических или прокариотических клеток.
II. РНК-управляемые нуклеазы.
В предлагаемом изобретении представлены РНК-управляемые нуклеазы. Термин РНКуправляемая нуклеаза (RGN) относится к полипептиду, который связывает конкретную целевую нуклеотидную последовательность специфическим для последовательности образом, и направляется к целевой нуклеотидной последовательности с помощью молекулы управляющей РНК, которая образует комплекс с полипептидом и гибридизуется с целевой последовательностью. Хотя РНК-управляемая нуклеаза способна расщеплять целевую последовательность при связывании, термин РНК-управляемая нуклеаза также включает РНК-управляемые нуклеазы с неактивной нуклеазой, которые способны связываться с целевой последовательностью, но не расщеплять ее. Расщепление целевой последовательности РНКуправляемой нуклеазой может привести к одно- или двух-цепочечному разрыву. РНК-управляемые нуклеазы, способные расщеплять только одну цепь двух-цепочечной молекулы нуклеиновой кислоты, называются здесь никазами.
Представленные в предлагаемом изобретении РНК-управляемые нуклеазы включают APG05083.1, APG07433.1, APG07513.1, APG08290.1, APG05459.1, APG04583.1 и APG1688.1, РНК-управляемые нуклеазы, аминокислотные последовательности которых представлены далее в SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, соответственно, и их активные фрагменты или варианты, которые сохраняют способность связываться с целевой нуклеотидной последовательностью РНК-управляемым специфическим для последовательности образом. В некоторых вариантах осуществления изобретения активный вариант RGN APG05083.1, APG07433.1, APG07513.1, APG08290.1, APG05459.1, APG04583.1 и APG1688.1 способен расщеплять одно- или двух-цепочечную целевую последовательность. В некоторых вариантах осуществления изобретения активный фрагмент или вариант RGN APG05083.1, APG07433.1, APG07513.1, APG08290.1, APG05459.1, APG04583.1 или APG1688.1 включает аминокислотную последовательность, по меньшей мере на 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичную последовательности с аминокислотной последовательностью, представленной в SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54. В некоторых вариантах осуществления изобретения активный фрагмент APG05083.1, APG07433.1, APG07513.1, APG08290.1, APG05459.1, APG04583.1 или APG1688.1 RGN состоит по меньшей мере из 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050 или более смежных аминокислотных остатков аминокислотной последовательности, представленной в SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54. РНКуправляемые нуклеазы, представленные в предлагаемом изобретении, могут содержать по меньшей мере один домен нуклеазы (например, ДНКазы, домен РНКазы) и по меньшей мере один распознавания РНК и/или РНК-связывающий домен для взаимодействия с управляющими РНК. Дополнительные домены, которые могут быть обнаружены в РНК-управляемых нуклеазах, представленных в настоящем документе, включают ДНК-связывающие домены, домены геликазы, домены межбелкового взаимодействия и домены димеризации, но не ограничиваются ими. В определенных вариантах осуществления изобретения нуклеазы, управляемые РНК, представленные в настоящем документе, могут состоять по меньшей мере на 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% из одного или нескольких из ДНК-связывающих доменов, доменов геликазы, доменов межбелкового взаимодействия и доменов димеризации.
Целевая нуклеотидная последовательность связывается с РНК-управляемой нуклеазой, представленной в предлагаемом изобретении, и гибридизуется с управляющей РНК, связанной с РНКуправляемой нуклеазой. Затем целевая последовательность может быть впоследствии расщеплена РНКуправляемой нуклеазой, если полипептид обладает нуклеазной активностью. Термины расщеплять или расщепление относятся к гидролизу по меньшей мере одной фосфодиэфирной связи в основной цепи целевой нуклеотидной последовательности, что может приводить к одно-цепочечным или двухцепочечным разрывам в целевой последовательности. Описанные здесь RGN могут расщеплять нуклеотиды внутри полинуклеотида, функционируя как эндонуклеаза, или могут быть экзонуклеазой, удаляя последовательные нуклеотиды с конца (5'- и/или 3'-конца) полинуклеотида. В других вариантах осуществления изобретения представленные RGN могут расщеплять нуклеотиды целевой последовательности в любом положении полинуклеотида и, таким образом, функционировать как эндонуклеаза, так и как экзонуклеаза. Расщепление целевого полинуклеотида описанной в данном изобретении RGN, может приводить к ступенчатым разрывам или тупым концам.
Описанные в данном изобретении РНК-управляемые нуклеазы могут быть последовательностями дикого типа, происходящими от видов бактерий или архей. Кроме того, РНК-управляемые нуклеазы могут быть вариантами или фрагментами полипептидов дикого типа. RGN дикого типа можно модифицировать, например, для изменения нуклеазной активности или специфичности РАМ (мотив, примыкающий к протоспейсеру). В некоторых вариантах осуществления изобретения РНК-управляемые нуклеаза не встречается в природе.
В некоторых вариантах осуществления изобретения РНК-управляемая нуклеаза действует как никаза, расщепляя только одну цепь целевой нуклеотидной последовательности. Такие РНК-управляемые
- 2 046542 нуклеазы имеют один функционирующий нуклеазный домен. В некоторых вариантах осуществления изобретения были изменены дополнительные нуклеазные домены, так что нуклеазная активность была снижена или устранена.
В других вариантах осуществления изобретения РНК-управляемая нуклеаза полностью лишена нуклеазной активности или демонстрирует пониженную нуклеазную активность и упоминается в данном описании изобретения как неактивная нуклеаза. Любой способ известный в данной области для введения мутаций в аминокислотную последовательность, такой как PCR-опосредованный мутагенез и сайтнаправленный мутагенез, может быть использован для создания никаз или RGN с неактивной нуклеазой. Смотри, например, U.S. Publ. № 2014/0068797 и патент США. № 9,790,490, каждый из которых полностью включен в описание заявленного изобретения в качестве ссылки.
РНК-управляемые нуклеазы, лишенные нуклеазной активности, можно использовать для доставки слитого полипептида, полинуклеотида или небольшой молекулы в определенное место генома. В некоторых из вариантов осуществления изобретения полипептид RGN или управляющая РНК могут быть слиты с детектируемой меткой, чтобы сделать возможным обнаружение конкретной последовательности. В качестве неограничивающего примера RGN с неактивной нуклеазой может быть слита с детектируемой меткой (например, флуоресцентным белком) и нацелена на конкретную последовательность, ассоциированную с заболеванием, чтобы сделать возможным обнаружение ассоциированной с заболеванием последовательности.
Кроме того, RGN с неактивной нуклеазой могут быть нацелены на определенные участки генома, чтобы изменить экспрессию желаемой последовательности. В некоторых вариантах осуществления изобретения связывание РНК-управляемой не активной нуклеазы с целевой последовательностью приводит к подавлению экспрессии целевой последовательности или гена под транскрипционным контролем целевой последовательности путем вмешательства в связывание РНК-полимеразы или факторов транскрипции в целевой области генома. В других вариантах осуществления изобретения RGN (например, RGN с неактивной нуклеазой) или ее комплексная управляющая РНК дополнительно содержит модулятор экспрессии, который после связывания с целевой последовательностью служит либо для подавления, либо для активации экспрессии целевой последовательности или гена под транскрипционным контролем с помощью целевой последовательности. В некоторых вариантах осуществления изобретения модулятор экспрессии модулирует экспрессию целевой последовательности или регулируемого гена посредством эпигенетических механизмов.
В других вариантах осуществления изобретения RGN с неактивной нуклеазой или RGN, обладающие только никазной активностью, могут быть нацелены на определенные участки генома для модификации последовательности целевого полинуклеотида посредством слияния с полипептидом, редактирующим основания, например, с полипептидом дезаминазы или активным вариантом или фрагментом, которые дезаминируют нуклеотидное основание, что приводит к превращению одного нуклеотидного основания в другое. Полипептид, редактирующий основание, может быть слит с RGN на ее N-конце или С-конце. Кроме того, редактирующий основания полипептид может быть слит с RGN через пептидный линкер. Неограничивающий пример полипептида дезаминазы, который можно использовать для таких композиций и способов, включает цитидиндезаминазу или редактор оснований - аденозиндезаминазу, описанный у Gaudelli и др. (2017) Nature № 551: 464-471, U.S. Publ. №№ 2017/0121693 и 2018/0073012 и IntePHKtional Publ. № WO/2018/027078, каждый из этих источников полностью включен в описание предлагаемого изобретения в качестве ссылки.
РНК-управляемые нуклеазы, слитые с полипептидом или доменом, могут быть разделены или соединены линкером. Используемый здесь термин линкер относится к химической группе или молекуле, связывающей две молекулы или части, например, связывающий домен и домен расщепления нуклеазы. В некоторых вариантах осуществления изобретения линкер соединяет домен связывания gPHK РНК управляемой нуклеазы и редактирующий основания полипептид, такой как дезаминаза. В некоторых вариантах осуществления изобретения линкер соединяет RGN с неактивной нуклеазой и дезаминазой. Обычно линкер располагается между двумя группами, молекулами или другими фрагментами, или фланкируется ими и соединяется с каждой из них ковалентной связью, соединяя их таким образом. В некоторых вариантах осуществления изобретения линкер представляет собой аминокислоту или множество аминокислот (например, пептид или белок). В некоторых вариантах осуществления изобретения линкер представляет собой органическую молекулу, группу, полимер или химический фрагмент. В некоторых вариантах осуществления изобретения линкер имеет длину 5-100 аминокислот, например 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 80- 90, 90-100, 100-150 или 150-200 аминокислот. Также рассматриваются более длинные или более короткие линкеры.
Описанные в данном изобретении РНК-управляемые нуклеазы могут содержать по меньшей мере один сигнал ядерной локализации (NLS) для усиления доставки RGN к ядру клетки. Сигналы ядерной локализации известны в данной области и обычно содержат ряд основных аминокислот (см., например, Lange и др., J. Biol. Chem. (2007) № 282: cc. 5101-5105). В определенных вариантах осуществления изобретения RGN содержит 2, 3, 4, 5, 6 или более сигналов ядерной локализации. Сигнал ядерной локализа
- 3 046542 ции может быть гетерологичным NLS. Неограничивающими примерами сигналов ядерной локализации, пригодных для приведенных здесь RGN, являются сигналы ядерной локализации большого Т-антигена SV40, нуклеоплазмина и с-Мус (см., например, Ray и др. (2015) Bioconjug Chem № 26 (6): cc.1004-7). В определенных вариантах осуществления изобретения RGN содержит последовательность NLS, представленную в SEQ ID NO: 67. RGN может содержать одну или несколько последовательностей NLS на своем N-конце, С-конце или как на N-конце, так и на С-конце. Например, RGN может содержать две последовательности NLS в N-концевой области и четыре последовательности NLS в С-концевой области.
Другие сигнальные последовательности локализации, известные в данной области, которые сосредотачивают полипептиды в конкретном субклеточном местоположении(ях), также могут быть использованы для нацеливания RGN, включая, помимо прочего, последовательности пластидной локализации, последовательности митохондриальной локализациии последовательности сигналов двойного нацеливания, которые нацелены как на пластиду, так и на митохондрии (см., например, Nassoury and Morse (2005) Biochim Biophys Acta № 1743: cc. 5-19; Kunze and Berger (2015) Front Physiol dx.doi.org/10.3389/fphys.2015.00259; Herrmann and Neupert (2003) IUBMB Life № 55: cc. 219-225; Soil (2002) Curr Opin Plant Biol № 5: cc. 529-535; Carrie and Small (2013) Biochim Biophys Acta № 1833: cc. 253259; Carrie и др. (2009) FEBS J № 276: cc. 1187-1195; Silva-Filho (2003) Curr Opin Plant Biol № 6: cc. 589595; Peeters and Small (2001) Biochim Biophys Acta № 1541: cc. 54-63; Murcha и др. (2014) J Exp Bot № 65: cc. 6301-6335; Mackenzie (2005) Trends Cell Biol № 15: cc. 548-554; Glaser и др. (1998) Plant Mol Biol № 38: cc. 311-338).
В определенных вариантах осуществления изобретения описанные РНК-управляемые нуклеазы содержат по меньшей мере один проникающий в клетку домен, который способствует клеточному поглощению RGN. Проникающие в клетки домены известны в данной области и обычно включают участки положительно заряженных аминокислотных остатков (т.е. поликатионные проникающие в клетки домены), чередующиеся полярные аминокислотные остатки и неполярные аминокислотные остатки (т.е. амфипатические проникающие в клетки домены) или гидрофобные аминокислотные остатки (т.е. гидрофобные проникающие в клетки домены) (см., например, Milletti F. (2012) Drug Discov Today № 17:cc. 850-860). Неограничивающим примером домена, проникающего в клетки, является трансактивирующий активатор транскрипции (ТАТ) из вируса иммунодефицита человека 1.
Сигнал ядерной локализации, сигнал пластидной локализации, сигнал митохондриальной локализации, сигнал двойного нацеливания и/или проникающий в клетку домен могут располагаться на аминоконце (N-конце), карбоксильном конце (С-конце) или во внутреннем положении РНК-управляемой нуклеазы.
Представленные в данном изобретении RGN могут быть слиты с эффекторным доменом, таким как домен расщепления, домен дезаминазы или домен модулятора экспрессии, прямо или косвенно через линкерный пептид. Такой домен может располагаться на N-конце, С-конце или во внутреннем местоположении нуклеазы, управляемой РНК. В некоторых вариантах осуществления изобретения компонент RGN слитого белка представляет собой RGN с неактивной нуклеазой.
В некоторых вариантах осуществления изобретения слитый белок RGN содержит домен расщепления, который представляет собой любой домен, который способен расщеплять полинуклеотид (т.е. РНК, ДНК или гибрид РНК/ДНК), и включает эндонуклеазы рестрикции и самоуправляемые эндонуклеазы, такие как эндонуклеазы типа IIS (например, Fokl), но не ограничиваются ими (см., например, Belfort и др. (1997) Nucleic Acids Res. № 25: cc. 3379-3388; Linn и др. (под редакцией) Nucasess, Издательство Cold Spring Harbor Laboratory Press, 1993).
В других вариантах осуществления изобретения слитый белок RGN содержит домен дезаминазы, который дезаминирует нуклеотидное основание, что приводит к превращению одного нуклеотидного основания в другое, и включает цитидиндезаминазу или редактор оснований аденозиндезаминазы, но не ограничивается ими (см., например, Gaudelli и др. (2017) Nature № 551: cc. 464-471, U.S. Publ. Nos. 2017/0121693 и 2018/0073012, патент США № 9840699 и IntePHKtional Publ. No. WO/2018/027078).
В других вариантах осуществления изобретения эффекторный домен слитого белка RGN может быть доменом модулятора экспрессии, который является доменом, служащим либо для усиления, либо для подавления транскрипции. Домен модулятора экспрессии может быть доменом эпигенетической модификации, доменом-репрессором транскрипции или доменом активации транскрипции.
В некоторых вариантах осуществления изобретения модулятор экспрессии слитого белка RGN содержит домен эпигенетической модификации, который ковалентно модифицирует ДНК или гистоновые белки для изменения структуры гистонов и/или хромосомной структуры без изменения последовательности ДНК, что приводит к изменениям в экспрессии генов (т.е. повышающая или понижающая регуляция). Неограничивающие примеры эпигенетических модификаций включают ацетилирование или метилирование остатков лизина, метилирование аргинина, фосфорилирование серина и треонина, и убиквитинирование лизина и сумоилирование гистоновых белков, а также метилирование и гидроксиметилирование остатков цитозина в ДНК. Неограничивающие примеры доменов эпигенетической модификации включают домены гистонацетилтрансферазы, домены гистондеацетилазы, домены гистонметилтрансферазы, домены гистон-деметилазы, домены ДНК-метилтрансферазы и домены ДНК
- 4 046542 деметилазы.
В некоторых вариантах осуществления изобретения модулятор экспрессии слитого белка содержит домен репрессора транскрипции, который взаимодействует с элементами контроля транскрипции и/или белками, регулирующими транскрипцию, такими как РНК-полимеразы и факторы транскрипции, для уменьшения или прекращения транскрипции по меньшей мере одного гена. Домены-репрессоры транскрипции известны в данной области и включают Sp1-подобные репрессоры, IkB и домены-боксы, связанные с Kruppel (KRAB), но не ограничиваются ими.
В еще одних вариантах осуществления изобретения модулятор экспрессии слитого белка содержит домен активации транскрипции, который взаимодействует с элементами контроля транскрипции и/или белками, регулирующими транскрипцию, такими как РНК-полимеразы и факторы транскрипции, для увеличения или активации транскрипции по меньшей мере одного гена. Домены активации транскрипции известны в данной области и включают, помимо прочего, домен активации VP16 вируса простого герпеса и домен активации NFAT.
Описанные в настоящем изобретении полипептиды RGN могут содержать детектируемую метку или метку очистки. Детектируемая метка или метка очистки может быть присоединена на N-конце, Сконце или во внутреннем положении РНК-управляемой нуклеазы, прямо или с помощью линкерного пептида. В некоторых вариантах осуществления изобретения компонент RGN слитого белка представляет собой RGN с неактивной нуклеазой. В других вариантах осуществления изобретения компонент RGN слитого белка представляет собой RGN с никазной активностью.
Детектируемая метка - это молекула, которую можно визуализировать или наблюдать любым образом. Детектируемая метка может быть слита с RGN как слитый белок (например, флуоресцентный белок) или может представлять собой небольшую молекулу, конъюгированную с полипептидом RGN, которая может быть обнаружена визуально или другими способами. Детектируемые метки, которые могут быть слиты с описанными в данном изобретении RGN в качестве слитого белка, включают любой обнаруживаемый белковый домен, включая флуоресцентный белок или белковый домен, который может быть обнаружен с помощью специфического антитела, но не ограничиваются ими. Неограничивающие примеры флуоресцентных белков включают зеленые флуоресцентные белки (например, GFP, EGFP, ZsGreenl) и желтые флуоресцентные белки (например, YFP, EYFP, ZsYellowl). Неограничивающие примеры детектируемых меток малых молекул включают радиоактивные метки, такие как 3Н и 35S.
Полипептиды RGN могут также содержать метку очистки, которая представляет собой любую молекулу, которая может использоваться для выделения белка или слитого белка из смеси (например, биологического образца, культуральной среды). Неограничивающие примеры меток очистки включают биотин, myc, белок, связывающий мальтозу (MBP) и глутатион^-трансферазу (GST).
II. Управляющая РНК.
В настоящем изобретении представлены управляющие РНК и полинуклеотиды, кодирующие их. Термин управляющая РНК относится к нуклеотидной последовательности, имеющей достаточную комплементарность с целевой нуклеотидной последовательностью для гибридизации с целевой последовательностью и прямого специфичного для последовательности связывания ассоциированной РНКуправляемой нуклеазы с целевой нуклеотидной последовательностью. Таким образом, соответствующая управляющая РНК RGN представляет собой одну или несколько молекул РНК (обычно одна или две), которые могут связываться с RGN и управлять RGN для связывания с конкретной целевой нуклеотидной последовательностью, и в тех случаях, когда RGN содержит никазу или нуклеазную активность, также расщеплять целевую нуклеотидную последовательность. Обычно управляющая РНК включает CRISPRPHK (crPHK) и трансактивирующую CRISPR-PHK (tracrPHK). Нативные управляющие РНК, которые включают как crPHK, так и tracrPHK, обычно содержат две отдельные молекулы РНК, которые гибридизуются друг с другом через повторяющуюся последовательность crPHK и антиповторную последовательность tracrPHK.
Нативные последовательности прямых повторов в матрице CRISPR обычно имеют длину от 28 до 37 пар оснований, хотя длина может варьироваться примерно от 23 до 55 пар оснований. Последовательности спейсеров в матрице CRISPR обычно имеют длину примерно от 32 до 38 п.о., хотя длина может составлять примерно от 21 п.о. до 72 п.о. Каждая матрица CRISPR обычно содержит менее 50 единиц спейсерной последовательности CRISPR повторов. CRISPR транскрибируются как часть длинного транскрипта, называемого первичным транскриптом CRISPR, который составляет большую часть матрицы CRISPR. Первичный транскрипт CRISPR расщепляется белками Cas с образованием crPHK или, в некоторых случаях, с образованием pre-crPHK, которые далее процессируются дополнительными белками Cas в зрелые crPHK. Зрелые crPHK содержат спейсерную последовательность и повторяющуюся последовательность CRISPR. В некоторых вариантах осуществления изобретения, в которых pre-crPHK процессируются в зрелые (или процессированные) crPHK, созревание включает удаление примерно от одного до шести или более 5', 3' или 5'и 3' нуклеотидов. В целях редактирования генома или нацеливания на конкретную представляющую интерес нуклеотидную целевую последовательность нуклеотиды, которые удаляются во время созревания молекулы pre-crPHK, не являются необходимыми для создания или конструирования управляющей РНК.
- 5 046542
РНК CRISPR (crPHK) содержит последовательность спейсера и последовательность CRISPR повторов. Спейсерная последовательность представляет собой нуклеотидную последовательность, которая непосредственно гибридизуется с представляющей интерес целевой нуклеотидной последовательностью. Спейсерная последовательность сконструирована так, чтобы быть полностью или частично комплементарной с представляющей интерес целевой последовательностью. В различных вариантах осуществления изобретения спейсерная последовательность может содержать примерно от 8 нуклеотидов до 30 нуклеотидов или более. Например, спейсерная последовательность может быть примерно 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более нуклеотидов в длину. В некоторых вариантах осуществления изобретения спейсерная последовательность составляет от 10 до 26 нуклеотидов в длину или от 12 до 30 неклеотидов в длину. В конкретных вариантах осуществления изобретения спейсерная последовательность составляет около 30 нуклеотидов в длину. В некоторых вариантах осуществления изобретения степень комплементарности между спейсерной последовательностью и соответствующей ей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет примерно или более чем 50%, 60%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более. В определенных вариантах осуществления изобретения спейсерная последовательность не имеет вторичной структуры, которую можно предсказать, используя любой подходящий алгоритм укладки полинуклеотидов, известный в данной области, включая, mFold, но, не ограничиваясь им (см., например, Zuker and Stiegler (1981) Nucleic Acids Res. № 9: cc. 133-148) и PHKfold (см., например, Gruber и др. (2008) Cell № 106 (1): cc.23-24).
Белки RGN могут иметь различную чувствительность к несовпадениям между спейсерной последовательностью в gPHK и ее целевой последовательностью, что влияет на эффективность расщепления. Как обсуждалось в примере 5, RGN APG05459.1 имеет необычную чувствительность к несоответствиям между последовательностью спейсера и целевой последовательностью, расширяясь по меньшей мере на 15 5'-концевых нуклеотидов сайта РАМ. Таким образом, APG05459.1 может более точно (т.е. конкретно) нацеливаться на определенные последовательности с большей точностью, чем другие RGN, с меньшей чувствительностью к несоответствиям между последовательностью спейсера и целевой последовательностью.
Последовательность РНК CRISPR повторов состоит из нуклеотидной последовательности, которая включает область с достаточной комплементарностью для гибридизации с tracrPHK. В различных вариантах осуществления изобретения последовательность РНК CRISPR повторов может содержать примерно от 8 до примерно 30 нуклеотидов или более. Например, последовательность CRISPR повторов может составлять примерно 8, примерно 9, примерно 10, примерно 11, примерно 12, примерно 13, примерно 14, примерно 15, примерно 16, примерно 17, примерно 18, примерно 19, примерно 20, примерно 21, примерно 22, примерно 23, примерно 24, примерно 25, примерно 26, примерно 27, примерно 28, примерно 29, примерно 30 или более нуклеотидов в длину. В некоторых вариантах осуществления изобретения последовательность CRISPR повторов составляет примерно 21 нуклеотид. В некоторых вариантах осуществления изобретения степень комплементарности между последовательностью CRISPR повторов и соответствующей ей последовательностью tracrPHK при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет примерно или более примерно 50%, примерно 60%, примерно 70%, примерно 75%, примерно 80%, примерно 81%, примерно 82%, примерно 83%, примерно 84%, примерно 85%, примерно 86%, примерно 87%, примерно 88%, примерно 89%, примерно 90%, примерно 91%, примерно 92%, примерно 93%, примерно 94%, примерно 95%, примерно 96%, примерно 97%, примерно 98%, примерно 99% или более идентичности нуклеотидной последовательности, представленной в SEQ ID NOs: 2, 12, 20, 28, 37, 46, или 55. В некоторых вариантах осуществления изобретения активный фрагмент последовательности CRISPR повторов дикого типа содержит по меньшей мере 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, или 20 смежных нуклеотидов нуклеотидной последовательности, представленной в SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55.
В некоторых вариантах осуществления изобретения crPHK не встречается в природе. В некоторых вариантах осуществления изобретения конкретная последовательность CRISPR повторов не связана со сконструированной в природе спейсерной последовательностью и последовательность CRISPR повторов считается гетерологичной спейсерной последовательности. В некоторых вариантах осуществления изобретения спейсерная последовательность представляет собой сконструированную последовательность, которая не встречается в природе.
Трансактивирующая молекула РНК CRISPR или tracrPHK содержит нуклеотидную последовательность, имеющую область с достаточной комплементарностью для гибридизации с последовательностью CRISPR повторов crPHK, которая упоминается здесь как антиповторная область. В некоторых вариантах осуществления изобретения молекула tracrPHK дополнительно содержит область с вторичной структурой (например, стебель-петля) или образует вторичную структуру при гибридизации с соответствующей crPHK. В определенных вариантах осуществления изобретения область tracrPHK, которая полностью или частично комплементарна последовательности повторов CRISPR, находится на 5'-конце молекулы, а 3'конец tracrPHK содержит вторичную структуру. Эта область вторичной структуры обычно состоит из
- 6 046542 нескольких шпилечных структур, включая шпильку нексуса, которая находится рядом с антиповторной последовательностью. Шпилька нексуса часто имеет консервативную нуклеотидную последовательность в основании стержня шпильки с мотивом UNANNG, UNANNU или UNANNA (SEQ ID NO: 68, 557 и 558, соответственно), обнаруженным во многих шпильках нексуса в tracrPHK. Часто терминальные шпильки находятся на 3'-конце tracrPHK, которые могут различаться по структуре и количеству, но часто содержат GC-обогащенную Rho независимую транскрипционную шпильку терминатор, за которой следует цепочка из U на 3'-конце. См., например, Briner и др. (2014) Molecular Cell № 56:cc. 333-339, Briner and Barrangou (2016) Cold Spring Harb Protoc; doi: 10.1101/pdb.top090902 и U.S. Publication No. № 2017/0275648, которые полностью включены в настоящее изобретение в качестве ссылки.
В различных вариантах осуществления изобретения антиповторный участок tracrPHK, который полностью или частично комплементарен последовательности CRISPR повторов, содержит примерно от примерно 8 нуклеотидов до примерно 30 нуклеотидов или более. Например, область сопряжения оснований между антиповторной последовательностью tracrPHK и последовательностью CRISPR повторов может составлять примерно 8, примерно 9, примерно 10, примерно 11, примерно 12, примерно 13, примерно 14, примерно 15, примерно 16, примерно 17, примерно 18, примерно 19, примерно 20, примерно 21, примерно 22, примерно 23, примерно 24, примерно 25, примерно 26, примерно 27, примерно 28, примерно 29, примерно 30 или более нуклеотидов в длину. В определенных вариантах осуществления изобретения антиповторный участок tracrPHK, который полностью или частично комплементарен последовательности CRISPR повторов, имеет длину около 20 нуклеотидов. В некоторых вариантах осуществления изобретения степень комплементарности между повторяющейся последовательностью CRISPR и соответствующей ей антиповторной последовательностью tracrPHK при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет примерно или более чем примерно 50%, примерно 60%, примерно 70%, примерно 75%, примерно 80%, примерно 81%, примерно 82%, примерно 83%, примерно 84%, примерно 85%, примерно 86%, примерно 87%, примерно 88%, примерно 89%, примерно 90%, примерно 91%, примерно 92%, примерно 93%, примерно 94%, примерно 95%, примерно 96%, примерно 97%, примерно 98%, примерно 99% или более.
В различных вариантах осуществления изобретения целая tracrPHK может содержать от примерно 60 до примерно 140 нуклеотидов. Например, tracrPHK может быть примерно 60, примерно 65, примерно 70, примерно 75, примерно 80, примерно 85, примерно 90, примерно 95, примерно 100, примерно 105, примерно 110, примерно 115, примерно 120, примерно 125, примерно 130, примерно 135, примерно 140 или более нуклеотидов в длину. В определенных вариантах осуществления изобретения tracrPHK имеет длину примерно 80, примерно 81, примерно 82, примерно 83, примерно 84, примерно 85, примерно 86, примерно 87, примерно 88, примерно 89 и примерно 90 нуклеотидов. В некоторых вариантах осуществления изобретения tracrPHK имеет длину около 85 нуклеотидов.
В отдельных вариантах осуществления изобретения tracrPHK содержит нуклеотидную последовательность SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, или ее активный вариант или фрагмент, которая при включении в управляющую РНК способна управлять последовательно-специфическим связыванием ассоциированной РНК-управляемой нуклеазы, представленной в предлагаемом изобретении, с представляющей интерес целевой последовательностью. В некоторых вариантах осуществления изобретения активный вариант последовательности tracrPHK дикого типа содержит нуклеотидную последовательность по меньшей мере на 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичную последовательности с нуклеотидной последовательностью, представленной в SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56. В некоторых вариантах осуществления изобретения активный фрагмент последовательности tracrPHK дикого типа содержит по меньшей мере 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 или более смежных нуклеотидов нуклеотидной последовательности, представленной в SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
Две полинуклеотидные последовательности можно рассматривать по существу как комплементарные, если две последовательности гибридизуются друг с другом в строгих условиях. Аналогичным образом, считается, что RGN связывается с конкретной целевой последовательностью в рамках специфичного для последовательности способа, если управляющая РНК, связанная с RGN, связывается с целевой последовательностью в строгих условиях. Под строгими условиями или строгими условиями гибридизации подразумеваются условия, при которых две полинуклеотидные последовательности будут гибридизоваться друг с другом в значительно большей степени, чем с другими последовательностями (например, по меньшей мере в 2 раза выше, чем фоновая). Строгие условия зависят от последовательности и будут разными в разных обстоятельствах. Как правило, строгими условиями будут те, в которых концентрация соли составляет примерно менее 1,5 М иона Na, обычно от 0,01 до 1,0 М концентрации иона Na (или других солей) при рН от 7,0 до 8,3, и температура примерно 30°С для коротких последовательностей (например, от 10 до 50 нуклеотидов) и по меньшей мере около 60°С для длинных последовательностей (например, более 50 нуклеотидов). Строгие условия также могут быть достигнуты путем добавления дестабилизирующих агентов, таких как формамид. Примеры условий низкой строгости включают гибридизацию с буферным раствором, содержащим от 30 до 35% формамида, 1 М NaCl, 1% SDS (додецилсульфат натрия) при 37°С и отмывку 1-2xSSC (20xSSC=3,0 М NaCl/0,3 М тринатрийцитрат) при 50- 7 046542
55°С. Примеры условий умеренной строгости включают гибридизацию в 40-45% формамиде, 1,0 М NaCl, 1% SDS при 37°С и отмывку в 0,5-1xSSC при 55-60°С. Примеры условий высокой строгости включают гибридизацию в 50% формамиде, 1 М NaCl, 1% SDS при 37°С и отмывку в 0,1xSSC при 60-65°С. Опционно промывочные буферы могут содержать примерно от 0,1% до 1% SDS. Продолжительность гибридизации обычно составляет менее 24 ч, обычно примерно от 4 до примерно 12 ч. Продолжительность отмывания должна составлять по крайней мере время, достаточное для достижения равновесия.
Tm - это температура (при определенной ионной силе и pH), при которой 50% комплементарной целевой последовательности гибридизуются с идеально подобранной последовательностью. Для гибридов ДНК-ДНК Tm может быть аппроксимирована уравнением Meinkoth and Wahl (1984) Anal. Biochem. № 138: cc. 267-284: Tm=81,5°G+16,6(log M)+0,41(% GC)-0,61(% форм.)-500/л; где M - молярность одновалентных катионов, % GC - процентное содержание гуанозиновых и цитозиновых нуклеотидов в ДНК, % форм. - Процентное содержание формамида в растворе для гибридизации, a L - длина гибрида в парах оснований. Обычно строгие условия выбираются так, чтобы температура была примерно на 5°С ниже, чем температура плавления (Tm) для конкретной последовательности и ее дополнения при определенной ионной силе и pH. Однако в чрезвычайно строгих условиях можно использовать гибридизацию и/или отмывку при температуре на 1, 2, 3 или 4°С ниже, чем температура плавления (Tm); при умеренно строгих условиях можно использовать гибридизацию и/или отмывку при температуре на 6, 7, 8, 9 или 10°С ниже, чем температура плавления (Tm); в условиях низкой строгости можно использовать гибридизацию и/или отмывку при температуре на 11, 12, 13, 14, 15 или 20°С ниже, чем температура плавления (Tm). Используя уравнение, композиции для гибридизации и промывки, а также желаемую Tm, рядовые специалисты поймут, что, по сути, описаны вариации в строгости гибридизации и/или растворов промывки. Подробное руководство по гибридизации нуклеиновых кислот можно найти у Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes, Часть I, Глава 2 (Издательство Elsevier, Нью-Йорк); и Ausubel и др., ред. (1995) Current Protocols in Molecular Biology, Глава 2 (Издательство Greene Publishing and Wiley-Interscience, Нью-Йорк). См. Sambrook и др. (1989) Molecular Cloning: A Laboratory Manual (2-е изд., Издательство Cold Spring Harbor Laboratory Press, Plainview, Нью-Йорк).
Управляющая РНК может быть отельной управляющей РНК или системой двойной управляющей РНК. Отдельная управляющая РНК содержит crPHK и tracrPHK на одной молекуле РНК, тогда как система двойной управляющей РНК включает crPHK и tracrPHK, присутствующие на двух разных молекулах РНК, гибридизованных друг с другом через по крайней мере часть последовательности CRISPR повторов crPHK и по крайней мере часть tracrPHK, которая может быть полностью или частично комплементарной последовательности CRISPR повторов crPHK. В некоторых вариантах осуществления изобретения, где управляющая РНК представляет собой отдельную управляющую РНК, crPHK и tracrPHK разделены линкерной нуклеотидной последовательностью. В общем, линкерная нуклеотидная последовательность - это последовательность, которая не включает комплементарные основания, чтобы избежать образования вторичной структуры внутри или содержащей нуклеотиды линкерной нуклеотидной последовательности. В некоторых вариантах осуществления изобретения линкерная нуклеотидная последовательность между crPHK и tracrPHK составляет в длину по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 11, по меньшей мере 12 или более нуклеотидов. В конкретных вариантах осуществления изобретения линкерная нуклеотидная последовательность одиночной управляющей РНК имеет длину, по меньшей мере, 4 нуклеотида. В некоторых вариантах осуществления изобретения линкерная нуклеотидная последовательность представляет собой нуклеотидную последовательность, представленную в SEQ ID NO: 63, 64 или 65. В других вариантах осуществления изобретения линкерная нуклеотидная последовательность имеет длину по меньшей мере 6 нуклеотидов. В некоторых вариантах осуществления изобретения линкерная нуклеотидная последовательность представляет собой нуклеотидную последовательность, представленную в SEQ ID NO: 65.
Отдельная управляющая РНК или двойная управляющая РНК могут быть синтезированы химическим путем или посредством транскрипции in vitro. Исследования определения специфического связывания последовательностей между RGN и управляющей РНК известны в данной области и включают, помимо прочего, анализы связывания in vitro между экспрессируемым RGN и управляющей РНК, которые могут быть помечены детектируемой меткой (например, биотином) и используются в анализе обнаружения преципитации (pull-down), в котором комплекс управляющая РНК: RGN захватывается с помощью детектируемой метки (например, с помощью гранул стрептавидина). Контрольная управляющая РНК с неродственной последовательностью или структурой управляющей РНК может использоваться в качестве отрицательного контроля для неспецифического связывания RGN с РНК. В некоторых вариантах осуществления изобретения управляющая РНК представляет собой SEQ ID NO: 10, 18, 26, 35, 44, 53 или 62, где спейсерная последовательность может быть любой последовательностью и обозначена, как полиN последовательность.
Как описано в примере 8, некоторые RGN в настоящем изобретении могут совместно использовать
- 8 046542 определенные управляющие РНК. Каждая APG05083.1, APG07433.1, APG07513.1 и APG08290.1 могут функционировать с использованием управляющих РНК, содержащих crPHK, которая включает нуклеотидную последовательность SEQ ID NO: 2, 12, 20 или 28, с соответствующей tracrPHK, содержащей нуклеотидную последовательность SEQ ID NO: 3, 13, 21 или 29, соответственно. Кроме того, каждая из APG04583.1 и APG01688.1 может функционировать с использованием управляющих РНК, содержащих crPHK, которая включает нуклеотидную последовательность SEQ ID NO: 46 или 55, с соответствующей tracrPHK, содержащей нуклеотидную последовательность SEQ 47 или 56, соответственно.
В некоторых вариантах осуществления изобретения управляющая РНК может быть введена в клетку-мишень, органеллу или эмбрион в виде молекулы РНК. Управляющая РНК может быть транскрибирована in vitro или синтезирована химическим путем. В других вариантах осуществления изобретения нуклеотидная последовательность, кодирующая управляющую РНК, вводится в клетку, органеллу или эмбрион. В некоторых из этих вариантов осуществления изобретения нуклеотидная последовательность, кодирующая управляющую РНК, функционально связана с промотором (например, промотором РНКполимеразы III). Промотор может быть нативным или гетерологичным нуклеотидной последовательности, кодирующей управляющую РНК.
В различных вариантах осуществления изобретения управляющая РНК может быть введена в клетку-мишень, органеллу или эмбрион в виде рибонуклеопротеинового комплекса, как описано в данном изобретении, где управляющая РНК связана с полипептидом РНК-управляющей нуклеазы.
Управляющая РНК направляет связанную РНК-управляемую нуклеазу к конкретной представляющей интерес целевой нуклеотидной последовательности посредством гибридизации управляющей РНК с целевой нуклеотидной последовательностью. Целевая нуклеотидная последовательность может содержать ДНК, РНК или их комбинацию и может быть одно-цепочечной или двух-цепочечной. Целевая нуклеотидная последовательность может представлять собой геномную ДНК (т.е. хромосомную ДНК), плазмидную ДНК или молекулу РНК (например, информационную РНК, рибосомную РНК, транспортную РНК, микро РНК, малую интерферирующую РНК). Целевая нуклеотидная последовательность может быть связана с (и в некоторых вариантах осуществления изобретения расщеплена) нуклеазой, управляемой РНК, in vitro или в клетке. Хромосомная последовательность, на которую нацелена RGN, может быть ядерной, пластидной или митохондриальной хромосомной последовательностью. В некоторых вариантах осуществления изобретения целевая нуклеотидная последовательность уникальна для целевого генома.
Целевая нуклеотидная последовательность находится рядом с мотивом, примыкающим к протоспейсеру (РАМ). Мотив, прилегающий к протоспейсеру, обычно находится в пределах примерно от 1 до примерно 10 нуклеотидов от целевой нуклеотидной последовательности, включая примерно 1, примерно 2, примерно 3, примерно 4, примерно 5, примерно 6, примерно 7, примерно 8, примерно 9 или примерно 10 нуклеотидов из нуклеотидной последовательности-мишени. РАМ может быть 5' или 3' целевой последовательности. В некоторых вариантах осуществления изобретения РАМ представляет собой 3' последовательности для представленных здесь RGN. Обычно РАМ представляет собой консенсусную последовательность примерно из 3-4 нуклеотидов, но в конкретных вариантах осуществления изобретения может иметь длину 2, 3, 4, 5, 6, 7, 8, 9 или более нуклеотидов. В различных вариантах осуществления изобретения последовательность PAM, распознаваемая представленными здесь RGN, включает консенсусную последовательность, представленную как SEQ ID NO: 6, 32, 41, 50 или 59. Неограничивающие иллюстративные последовательности РАМ представляют собой нуклеотидные последовательности, представленные как SEQ ID NO: 7, 69, 70, 71 и 72.
В определенных вариантах осуществления изобретения РНК-управляемая нуклеаза, имеющая SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или ее активный вариант или фрагмент, связывает, соответственно, целевую нуклеотидную последовательность, соседнюю с последовательностью PAM, обозначенную как SEQ ID NO: 6, 32, 41, 50, 59 или 7. В некоторых вариантах осуществления изобретения RGN связывается с управляющей последовательностью, содержащей повторяющуюся последовательность CRISPR, представленную как SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, соответственно, или их активный вариант или фрагмент, и последовательность tracrPHK, указанная в SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, соответственно, или активный вариант или фрагмент из них. Системы RGN дополнительно описаны в примере 1 и таблице 1 настоящего описания.
В данной области хорошо известно, что на специфичность последовательности РАМ для данного фермента нуклеазы влияет концентрация фермента (см., например, Karvelis и др. (2015) Genome Biol № 16: cc. 253), которая может быть изменена путем изменения промотора, используемого для экспрессии RGN, или количества рибонуклеопротеинового комплекса, доставленного в клетку, органеллу или эмбрион.
После распознавания соответствующей последовательности PAM, RGN может расщеплять целевую нуклеотидную последовательность в конкретном сайте расщепления. В контексте настоящего описания сайт расщепления состоит из двух конкретных нуклеотидов в целевой нуклеотидной последовательности, между которыми нуклеотидная последовательность расщепляется RGN. Сайт расщепления может содержать 1-й и 2-й, 2-й и 3-й, 3-й и 4-й, 4-й и 5-й, 5-й и 6-й, 7-й и 8-й или 8-й и 9-й нуклеотиды РАМ в 5'
- 9 046542 или 3' направлениях. В некоторых вариантах осуществления изобретения сайт расщепления может составлять более 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов от РАМ в 5' или 3' направлениях. В некоторых вариантах осуществления изобретения сайт расщепления находится на расстоянии 4 нуклеотидов от РАМ. В других вариантах осуществления изобретения сайт расщепления находится на расстоянии по меньшей мере 15 нуклеотидов от РАМ. Поскольку RGN могут расщеплять целевую нуклеотидную последовательность, приводя к расположению концов в шахматном порядке, в некоторых вариантах осуществления изобретения сайт расщепления определяется на основе расстояния двух нуклеотидов от РАМ на положительной (+) цепи полинуклеотида и расстояния двух нуклеотидов от РАМ на отрицательной (-) цепи полинуклеотида.
III. Нуклеотиды, кодирующие РНК-управляемые нуклеазы, CRISPR РНК и/или tracrPHK.
В настоящем описании представлены полинуклеотиды, описанные в настоящем изобретении РНК CRISPR, tracrPHK и/или sgPHK и полинуклеотиды, содержащие нуклеотидную последовательность, кодирующую в настоящем изобретении РНК-управляемые нуклеазы, CRISPR-PHK, tracrPHK и/или sgPHK. Описанные в предлагаемом изобретении полинуклеотиды включают те, которые содержат или кодируют повторяющуюся последовательность CRISPR, содержащую нуклеотидную последовательность SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или ее активный вариант или фрагмент, который, когда он содержится в управляющей РНК, способен управлять специфичным для последовательности связыванием соответствующей РНК-управляемой нуклеазой с представляющей интерес целевой последовательностью. Также описаны полинуклеотиды, включающие в себя или кодирующие tracrPHK, содержащую нуклеотидную последовательность SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, или ее активный вариант или фрагмент, который при включении в управляющую РНК способен направлять специфичное для последовательности связывание соответствующей РНК-управляемой нуклеазы с представляющей интерес целевой последовательностью. Также предлагаются полинуклеотиды, которые кодируют РНК-управляемую нуклеазу, содержащую аминокислотную последовательность, обозначенную как SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, и ее активные фрагменты или варианты, которые сохраняют способность связываться с целевой нуклеотидной последовательностью специфичным для последовательности способом, управляемым РНК.
Использование термина полинуклеотид не предназначено для ограничения настоящего описания изобретения полинуклеотидами, содержащими ДНК. Специалисты в данной области поймут, что полинуклеотиды могут включать рибонуклеотиды (РНК) и комбинации рибонуклеотидов и дезоксирибонуклеотидов. Такие дезоксирибонуклеотиды и рибонуклеотиды включают как встречающиеся в природе молекулы, так и синтетические аналоги. К ним относятся пептидные нуклеиновые кислоты (ПНК), химеры ПНК-ДНК, заблокированные нуклеиновые кислоты (LNA) и последовательности, связанные фосфотиоратом. Описанные в настоящем изобретении полинуклеотиды также охватывают все формы последовательностей, включая, но, не ограничиваясь ими, одно-цепочечные формы, двух-цепочечные формы, гибриды ДНК-РНК, триплексные структуры, структуры типа стержень и петля и т.п.
Молекулы нуклеиновых кислот, кодирующие RGN, могут быть оптимизированы по кодоновому составу для экспрессии в представляющем интерес организме. Оптимизированная по кодоновому составу кодирующая последовательность представляет собой полинуклеотидную кодирующую последовательность, частота использования кодонов которой разработана таким образом, чтобы имитировать частоту предпочтительного использования кодонов или условия транскрипции определенной клетки-хозяина. Экспрессия в определенной клетке-хозяине или организме усиливается в результате изменения одного или нескольких кодонов на уровне нуклеиновой кислоты таким образом, что транслируемая аминокислотная последовательность не изменяется. Молекулы нуклеиновой кислоты могут быть оптимизированы по кодоновому составу полностью или частично. Таблицы кодонов и другие ссылки, содержащие информацию о предпочтениях для широкого диапазона организмов доступны в данной области техники (см., например, Campbell and Gowri (1990) Plant Physiol. № 92: cc. 1-11 для обсуждения использования предпочтительных для растений кодонов). В данной области доступны способы синтеза предпочтительных для растений генов. См., например, патенты США №№ 5380831 и 5436391, а также Murray и др. (1989) Nucleic Acids Res. №17: cc. 477-498, включенные в данное описание изобретения в качестве ссылки.
Полинуклеотиды, кодирующие RGN, crPHK, tracrPHK и/или sgPHK, представленные в настоящем документе, могут быть входить в кассеты экспрессии для экспрессии in vitro или экспрессии в представляющей интерес клетке, органелле, эмбрионе или организме. Кассета будет включать 5'- и 3'регуляторные последовательности, функционально связанные с полинуклеотидом, кодирующим RGN, crPHK, tracrPHK и/или sgPHK, представленными в данном изобретении, которые обеспечивают экспрессию полинуклеотида. Кассета может дополнительно содержать по меньшей мере один дополнительный ген или генетический элемент, ко-трансформируемый в организм. Если включены дополнительные гены или элементы, компоненты функционально связаны. Термин функционально связанный предназначен для обозначения функциональной связи между двумя или более элементами. Например, функциональная связь между промотором и интересующей кодирующей областью (например, областью, кодирующей RGN, crPHK, tracrPHK и/или sgPHK) является функциональной связью, которая обеспечивает экспрес
- 10 046542 сию интересующей кодирующей области. Функционально связанные элементы могут быть смежными или несмежными. При использовании для обозначения соединения двух областей, кодирующих белок, термин функционально связанный означает, что кодирующие области находятся в одной и той же рамке считывания. Кроме того, дополнительный ген(ы) или элемент(ы) могут быть предоставлены на нескольких кассетах экспрессии. Например, нуклеотидная последовательность, кодирующая описанную здесь RGN, может присутствовать на одной кассете экспрессии, тогда как нуклеотидная последовательность, кодирующая crPHK, tracrPHK или полную управляющую РНК, может находиться на отдельной кассете экспрессии. Такая кассета экспрессии снабжена множеством сайтов рестрикции и/или сайтов рекомбинации для вставки полинуклеотидов, находящихся под регуляцией транскрипции регуляторных областей. Кассета экспрессии может дополнительно содержать ген селективного маркера.
Кассета экспрессии будет включать в 5'-3'направлении транскрипции: область инициации транскрипции (и, в некоторых вариантах осуществления изобретения, трансляции) (т.е. промотор), RGN, crPHK, tracrPHK и/или sgPHK-кодирующий полинуклеотид, представленный в изобретении, и область терминации транскрипции (а в некоторых вариантах осуществления изобретения, область терминации трансляции), функциональную в представляющем интерес организме. Промоторы, описанные в изобретении, способны направлять или управлять экспрессией кодирующей последовательности в клеткехозяине.
Регуляторные области (например, промоторы, регуляторные области транскрипции и области терминации трансляции) могут быть эндогенными или гетерологичными по отношению к клетке-хозяину или друг к другу. Используемый здесь термин гетерологичный по отношению к последовательности представляет собой последовательность, которая происходит от чужеродного вида или, если от того же вида, существенно модифицирована по сравнению с ее природной формой по составу и/или геномному локусу в результате преднамеренного вмешательства человека. В данном контексте химерный ген содержит кодирующую последовательность, функционально связанную с областью инициации транскрипции, которая является гетерологичной кодирующей последовательности.
Подходящие области терминации доступны из Ti-плазмиды A. tumefaciens, такие как области терминации октопинсинтазы и нопалинсинтазы. См. также Guerineau и др. (1991) Мол. Genet Genet. № 262: cc. 141-144; Proudfoot (1991) Cell № 64: cc. 671-674; Sanfacon и др. (1991) Genes Dev. № 5: cc. 141-149; Mogen и др. (1990) Plant Cell № 2: cc. 1261-1272; Munroe и др. (1990) Gene № 91: cc. 151-158; Ballas и др. (1989) Nucleic Acids Res. № 17: cc. 7891-7903; и Joshi и др. (1987) Nucleic Acids Res. № 15: cc. 9627-9639.
Дополнительные регуляторные сигналы включают, но не ограничиваются ими, сайты начала инициации транскрипции, операторы, активаторы, энхансеры, другие регуляторные элементы, сайты связывания рибосом, кодон инициации, сигналы терминации и тому подобное. См., например, патент США No. №№ 5039523 и 4853331; EPO 0480762А2; Sambrook и др. (1992) Molecular Cloning: A Laboratory Manual, под ред. Maniatis и др. (Издательство Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Нью-Йорк), далее Sambrook 11; Davis и др., ред. (1980) Advanced Bacterial Genetics (Издательство Cold Spring Harbor Laboratory Press), Издательство Cold Spring Harbor, Нью-Йорк, и цитируемые здесь ссылки.
При получении кассеты экспрессии можно манипулировать различными фрагментами ДНК, чтобы обеспечить последовательности ДНК в правильной ориентации и, при необходимости, в надлежащей рамке считывания. С этой целью для соединения фрагментов ДНК могут использоваться адаптеры или линкеры, или могут быть задействованы другие манипуляции для обеспечения удобных сайтов рестрикции, удаления избыточной ДНК, удаления сайтов рестрикции и т.п. Для этой цели могут быть задействованы мутагенез in vitro, репарация праймеров, рестрикция, отжиг, повторные замены, например, транзиции и трансверсии.
В практике изобретения можно использовать ряд промоторов. Промоторы могут быть выбраны в зависимости от желаемого результата. Нуклеиновые кислоты могут быть объединены с конститутивными, индуцибельными, специфическими для стадии роста, специфическими для клеточного типа, предпочтительными для ткани, тканеспецифическими или другими промоторами для экспрессии в интересующем организме. См., например, промоторы, изложенные в WO 99/43838 и в патентах США № 8,575,425; 7,790,846; 8 147 856; 8,586832; 7,772,369; 7,534,939; 6072050; 5,659,026; 5,608,149; 5,608,144; 5,604,121; 5,569,597; 5,466,785; 5,399,680; 5 268 463; 5,608,142; и 6 177 611, в данном документе включенные в качестве ссылки.
Для экспрессии в растениях конститутивные промоторы также включают промотор 35S CaMV (Odell и др. (1985) Nature № 313: cc. 810-812); актина риса (McElroy и др. (1990) Plant Cell № 2: cc. 163171); убиквитина (Christensen и др. (1989) Plant Mol. Biol. № 12: cc. 619-632 и Christensen и др. (1992) Plant Mol. Biol. № 18: cc. 675-689); pEMU (Last и др. (1991) Theor. Appl. Genet. № 81: cc. 581-588); и MAS (Velten и др. (1984) EMBO J. № 3: cc. 2723-2730).
Примерами индуцибельных промоторов являются промотор Adh1, который индуцируется гипоксией или Холодовым стрессом, промотор Hsp70, который индуцируется тепловым стрессом, промотор PPDK и промотор пепкарбоксилазы, которые индуцируются светом. Также полезны промоторы, которые являются химически индуцируемыми, такие как промотор In2-2, индуцируемый антидотом (патент США № 5364780), промотор Axig1, который индуцируется ауксином и специфичен для тапетума, но также
- 11 046542 активен в каллусе (PCT US01 /22169 который), стероид-чувствительные промоторы (см., например, промотор ERE, который индуцируется эстрогеном, и промотор, индуцируемый глюкокортикоидами, описанные у Schena и др. (1991) Proc. Nail. Acad. Sci. USA № 88: 10421-10425 и McNellis и др. (1998) Plant J. №14 (2): cc. 247-257)), а так же промоторы, индуцируемые и репрессируемые тетрациклином (см., например, Gatz и др. (1991) Mol. Gen. Genet. № 227: cc. 229-237 и патенты США №№ 5814618 и 5789156, которые включены в описание изобретения в качестве ссылки).
Тканеспецифические или предпочтительные для тканей промоторы можно использовать для нацеливания на экспрессию экспрессирующей конструкции в конкретной ткани. В некоторых вариантах осуществления изобретения тканеспецифические или предпочтительные для тканей промоторы активны в растительной ткани. Примеры промоторов, находящихся под контролем развития растений, включают промоторы, которые инициируют транскрипцию преимущественно в определенных тканях, таких как листья, корни, плоды, семена или цветы. Тканеспецифический промотор - это промотор, который инициирует транскрипцию только в определенных тканях. В отличие от конститутивной экспрессии генов, тканеспецифическая экспрессия является результатом нескольких взаимодействующих уровней генной регуляции. По существу, промоторы из гомологичных или близкородственных видов растений могут быть предпочтительны при использовании для достижения эффективной и надежной экспрессии трансгенов в конкретных тканях. В некоторых вариантах осуществления изобретения экспрессия включает предпочтительный для ткани промотор. Предпочтительный для ткани промотор представляет собой промотор, который предпочтительно инициирует транскрипцию, но не обязательно полностью или только в определенных тканях.
В некоторых вариантах осуществления изобретения молекулы нуклеиновой кислоты, кодирующие RGN, crPHK и/или tracrPHK, содержат промотор, специфичный для определенного типа клеток. Промотор специфичный для определенного типа клетки представляет собой промотор, который в первую очередь управляет экспрессией в определенных типах клеток в одном или нескольких органах. Некоторые примеры растительных клеток, в которых в первую очередь могут быть активными промоторы, специфичные для определенного типа клеток, функциональные в растениях, включают, например, клетки BETL, сосудистые клетки в корнях, листьях, клетки стебля и стволовые клетки. Молекулы нуклеиновой кислоты могут также включать промоторы, предпочтительные для определенного типа клеток. Промотор, предпочтительный для определенного типа клеток, представляет собой промотор, который в первую очередь управляет экспрессией в основном, но не обязательно полностью или только в определенных типах клеток в одном или нескольких органах. Некоторые примеры растительных клеток, в которых промоторы, предпочтительные для определенного типа клеток, функциональные в растениях, могут быть преимущественно активными, включают, например, клетки BETL, сосудистые клетки в корнях, листьях, клетки стебля и стволовые клетки.
Последовательности нуклеиновых кислот, кодирующие RGN, crPHK, tracrPHK и/или sgPHK, могут быть функционально связаны с промоторной последовательностью, которая распознается фаговой РНКполимеразой, например, для синтеза мРНК in vitro. В таких вариантах осуществления РНК, транскрибируемая in vitro, может быть очищена для использования в описанных в данном документе способах. Например, промоторная последовательность может быть промоторной последовательностью Т7, Т3 или SP6 или вариантом промоторной последовательности Т7, Т3 или SP6. В таких вариантах осуществления изобретения экспрессированный белок и/или РНК могут быть очищены для использования в способах модификации генома, описанных в предлагаемом изобретении.
В некоторых вариантах осуществления изобретения полинуклеотид, кодирующий RGN, crPHK, tracrPHK и/или sgPHK, также может быть связан с сигналом полиаденилирования (например, сигналом полиА SV40 и другими сигналами, функциональными в растениях) и/или по меньшей мере с одной последовательностью терминации транскрипции. Кроме того, последовательность, кодирующая RGN, также может быть связана с последовательностью(ями), кодирующей по меньшей мере один сигнал ядерной локализации, по меньшей мере один проникающий в клетки домен и/или по меньшей мере один сигнальный пептид, способный доставлять белки в определенные субклеточные местоположения, как описано в другом месте описания.
Полинуклеотид, кодирующий RGN, crPHK, tracrPHK и/или sgPHK, может присутствовать в векторе или нескольких векторах. Вектор относится к полинуклеотидной композиции для переноса, доставки или введения нуклеиновой кислоты в клетку-хозяина. Подходящие векторы включают плазмидные векторы, фагмиды, космиды, искусственные/мини-хромосомы, транспозоны и вирусные векторы (например, лентивирусные векторы, аденоассоциированные вирусные векторы, бакуловирусный вектор). Вектор может содержать дополнительные последовательности контроля экспрессии (например, энхансерные последовательности, последовательности Козака, последовательности полиаденилирования, последовательности терминации транскрипции), селектируемые маркерные последовательности (например, гены устойчивости к антибиотикам), точки начала репликации и т.п. Дополнительную информацию можно найти в Current Protocols in Molecular Biology Ausubel и др., Издательство John Wiley & Sons, НьюЙорк, 2003 или Molecular Cloning: A Laboratory Manual Издательство Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, Нью Йорк, 3-е издание, 2001.
- 12 046542
Вектор также может содержать ген селектируемого маркера для отбора трансформированных клеток. Гены селектируемых маркеров используются для отбора трансформированных клеток или тканей. Г ены-маркеры включают гены, кодирующие устойчивость к антибиотикам, такие как гены, кодирующие неомицинфосфотрансферазу II (NEO) и гигромицинфосфотрансферазу (HPT), a также гены, придающие устойчивость к гербицидным соединениям, таким как глюфосинатаммоний, бромоксинил, имидазолиноны и 2,4-оксидихлорфенат. (2,4-Д).
В некоторых вариантах осуществления изобретения кассета экспрессии или вектор, содержащий последовательность, кодирующую полипептид RGN, может дополнительно содержать последовательность, кодирующую crPHK и/или tracrPHK, или crPHK и tracrPHK, объединенные для создания управляющей РНК. Последовательность(и), кодирующая crPHK и/или tracrPHK, может быть функционально связана по меньшей мере с одной последовательностью контроля транскрипции для экспрессии crPHK и/или tracrPHK в интересующем организме или клетке-хозяине. Например, полинуклеотид, кодирующий crPHK и/или tracrPHK, может быть функционально связан с промоторной последовательностью, которая распознается РНК-полимеразой III (Pol III). Примеры подходящих промоторов Pol III включают, но не ограничиваются ими, промоторы РНК U6, U3, H1 и 7SL млекопитающих и промоторы U6 и U3 риса.
Как указано, экспрессионные конструкции, содержащие нуклеотидные последовательности, кодирующие RGN, crPHK, tracrPHK и/или sgPHK, могут использоваться для трансформации представляющих интерес организмов. Способы трансформации включают введение нуклеотидной конструкции в интересующий организм. Под введением подразумевается введение нуклеотидной конструкции в клеткухозяина таким образом, чтобы конструкция получила доступ внутрь клетки-хозяина. Способы изобретения не требуют особого способа введения нуклеотидной конструкции в организм-хозяина, кроме такого, при котором нуклеотидная конструкция получает доступ внутрь по меньшей мере одной клетки организма-хозяина. Клетка-хозяин может быть эукариотической или прокариотической клеткой. В конкретных вариантах осуществления изобретения эукариотическая клетка-хозяин представляет собой растительную клетку, клетку млекопитающего или клетку насекомого. Способы введения нуклеотидных конструкций в растения и другие клетки-хозяева известны в данной области техники и включают методы стабильной трансформации, методы временной трансформации и методы, опосредованные вирусами, но не ограничиваются ими.
В результате этих методов получают трансформированный организм, такой как растение, включая целое растение, а также органы растения (например, листья, стебли, корни и т.д.), семена, клетки растений, ростки, зародыши и их потомство. Клетки растений могут быть дифференцированными или недифференцированными (например, каллус, клетки суспензионной культуры, протопласты, клетки листа, клетки корня, клетки флоэмы, пыльца).
Трансгенные организмы, или трансформированные организмы, или стабильно трансформированные организмы, или клетки, или ткани относятся к организмам, которые включили или интегрировали полинуклеотид, кодирующий RGN, crPHK и/или tracrPHK, описанные в предлагаемом изобретении. Признано, что другие экзогенные или эндогенные последовательности нуклеиновых кислот или фрагменты ДНК также могут быть включены в клетку-хозяина. Агробактериальная-и-биолистически опосредованная трансформации остаются двумя преимущественно используемыми подходами для трансформации растительных клеток. Однако трансформация клетки-хозяина может быть осуществлена путем инфицирования, трансфекции, микроинъекции, электропорации, микропроекции, биолистики или бомбардировки частицами, электропорации, осуществлена с помощью диоксида кремния/углеродных волокон, она может быть опосредована ультразвуком, опосредована ПЭГ, осуществлена ко-осаждением с фосфатом кальция, осуществлена поликатион-DMSO, DEAE декстрановой процедурой, а также может быть опосредованной вирусами, опосредованной липосомами и т.п. Опосредованное вирусами введение полинуклеотида, кодирующего RGN, crPHK и/или tracrPHK, включает опосредованное ретровирусом, лентивирусом, аденовирусом и аденоассоциированным вирусом введение и экспрессию, а также использование Колимовирусов (Caulimoviruses), Герминивирусов (Geminiviruses) и РНК вирусов растений.
Протоколы трансформации, а также протоколы введения полипептидов или полинуклеотидных последовательностей в растения могут варьироваться в зависимости от типа клетки-хозяина (например, клетка однодольного или двудольного растения), на которую нацелена трансформация. Способы трансформации известны в данной области и включают те, которые изложены в патентах США №№ 8,575,425; 7,692,068; 8,802,934; 7,541,517, каждый из которых включен в данное изобретение в качестве ссылки. См. также: Rakoczy-Trojanowska, M. (2002) Cell Mol Biol Lett. № 7: 849-858; Jones и др. (2005) Plant Methods № 1: c. 5; Rivera и др. (2012) Physics of Life Reviews № 9: cc. 308-345; Bartlett и др. (2008) Plant Methods № 4: cc. 1-12; Bates, G.W. (1999) Methods in Molecular Biology № 111: cc. 359-366; Binns and Thomashow (1988) Annual Reviews in Microbiology № 42: cc. 575-606; Christou, P. (1992) The Plant JouPHKl № 2: cc. 275-281; Christou, P. (1995) Euphytica № 85: cc. 13-27; Tzfira и др. (2004) TRENDS in Genetics № 20: cc. 375-383; Yao и др. (2006) JouPHKl of Experimental Botany № 57: cc. 3737-3746; Zupan and Zambryski (1995) Plant Physiology № 107: cc. 1041-1047; Jones и др. (2005) Plant Methods № 1: c. 5.
Трансформация может привести к стабильному или временному включению нуклеиновой кислоты в клетку. Стабильная трансформация означает, что нуклеотидная конструкция, введенная в хозяйскую
- 13 046542 клетку, интегрируется в геном хозяйской клетки и способна наследоваться ее потомками. Временная трансформация означает, что полинуклеотид вводится в клетку-хозяина и не интегрируется в геном клетки-хозяина.
Способы трансформации хлоропластов известны в данной области техники. См., например, Svab и др. (1990) Proc. Nail. Acad. Sci. uSa № 87: cc. 8526-8530; Svab and Maliga (1993) Proc. Natl. Acad. Sci. USA № 90: cc. 913-917; Svab and Maliga (1993) EMBO J. № 12: cc. 601-606. Этот метод основан на доставке ДНК, содержащей селектируемый маркер, и нацеливании ДНК на пластидный геном посредством гомологичной рекомбинации. Кроме того, трансформация пластид может быть осуществлена путем трансактивации молчащего трансгена, переносимого пластидами, с помощью экспрессии предпочтительной для ткани кодируемой ядром и направленной на пластиду РНК-полимеразы. О такой системе сообщалось у McBride и др. (1994) Proc. Natl. Акад. Sci. США № 91: cc. 7301-7305.
Трансформированные клетки можно вырастить в трансгенный организм, такой как растение, обычными способами. См., например, McCormick и др. (1986) Plant Cell Reports № 5: cc. 81-84. Затем эти растения можно выращивать и опылять одним и тем же трансформированным штаммом или разными штаммами, и идентифицировать полученный гибрид, имеющий конститутивную экспрессию желаемой фенотипической характеристики. Можно выращивать два или более поколений, чтобы гарантировать, что экспрессия желаемой фенотипической характеристики стабильно сохраняется и наследуется, а затем собирать семена, чтобы гарантировать проявление желаемой фенотипической характеристики. Таким образом, настоящее изобретение обеспечивает трансформированные семена (также называемые трансгенные семена), содержащие нуклеотидную конструкцию, описанную в данном изобретении, например кассету экспрессии, описанную в данном изобретении, стабильно встроенную в их геном.
Кроме того, трансформированные клетки могут быть введены в организм. Эти клетки могли бы происходить из организма, в котором клетки трансформируются методом ex vivo.
Приведенные в данном изобретении последовательности можно использовать для трансформации любых видов растений, включая, помимо прочего, однодольные и двудольные. Примеры представляющих интерес растений включают, но не ограничиваются ими, кукурузу (маис), сорго, пшеницу, подсолнечник, помидоры, крестоцветные, перец, картофель, хлопок, рис, сою, сахарную свеклу, сахарный тростник, табак, ячмень и масличный рапс, Brassica sp., люцерна, рожь, просо, сафлор, арахис, сладкий картофель, кассая, кофе, кокос, ананас, цитрусовые деревья, какао, чай, банан, авокадо, инжир, гуава, манго, оливки, папайя, кешью, макадамия, миндаль, овес, овощи, декоративные растения и хвойные деревья.
Овощи включают, помимо прочего, помидоры, салат, стручковую фасоль, фасоль лима, горох и представителей рода Curcumis, такие как огурец, дыня и мускусная дыня. Декоративные растения включают, помимо прочего, азалию, гортензию, гибискус, розы, тюльпаны, нарциссы, петунии, гвоздики, пуансеттию и хризантемы. Предпочтительно, растения по настоящему изобретению представляют собой культурные растения (например, кукурузу, сорго, пшеницу, подсолнечник, томат, крестоцветные, перец, картофель, хлопок, рис, сою, сахарную свеклу, сахарный тростник, табак, ячмень, масличный рапс и т.д.).
Используемый в данном изобретении термин растение включает растительные клетки, протопласты растений, культуры тканей растительных клеток, из которых можно регенерировать растения, каллусы растений, сгустки растений и растительные клетки, которые не повреждены в растениях или частях растений, таких как зародыши, пыльца, семяпочки, семена, листья, цветы, ветви, плоды, ядра, колосья, початки, шелуха, стебли, корни, кончики корней, пыльники и т.п. Под зерном подразумеваются зрелые семена, произведенные коммерческими производителями для целей, не связанных с выращиванием или воспроизводством вида. Потомство, варианты и мутанты регенерированных растений также включены в объем изобретения при условии, что эти части содержат введенные полинуклеотиды. Кроме того, предоставляется обработанный растительный продукт или побочный продукт, который сохраняет последовательности, описанные в данном изобретении, включая, например, соевые продукты.
Полинуклеотиды, кодирующие RGN, crPHK и/или tracrPHK, также можно использовать для трансформации любых прокариотических видов, включая, археи и бактерии (например, Bacillus sp., Klebsiella sp. Streptomyces sp., Rhizobium sp., Escherichia). sp., Pseudomonas sp., Salmonella sp., Shigella sp., Vibrio sp., Yersinia sp., Mycoplasma sp., Agrobacterium, Lactobacillus sp.), но не ограничиваясь ими.
Полинуклеотиды, кодирующие RGN, crPHK и/или tracrPHK, можно использовать для трансформации любых эукариотических видов, включая, помимо прочего, животных (например, млекопитающих, насекомых, рыб, птиц и рептилий), грибы, амебы, водоросли и дрожжи.
Для введения нуклеиновых кислот в клетки млекопитающих или целевые ткани можно использовать обычные методы переноса генов на вирусной и невирусной основе. Такие методы можно использовать для введения нуклеиновых кислот, кодирующих компоненты системы CRISPR, в клетки в культуре или в организме-хозяине. Системы доставки невирусных векторов включают плазмиды ДНК, РНК (например, транскрипт вектора, описанного в данном документе), голую нуклеиновую кислоту и нуклеиновую кислоту в комплексе с носителем для доставки, таким как липосома. Системы доставки вирусных векторов включают ДНК и РНК вирусы, которые после доставки в клетку имеют либо эписомальный, либо интегрированный геномы. Для обзора процедур генной терапии см. Anderson, Science № 256: cc.
- 14 046542
808-813 (1992); Nabel и Feigner, TIBTECH 11: 211-217 (1993); Mitani и Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature № 357: cc. 455-460 (1992); Van Brunt, Biotechnology № 6 (10): cc. 1149-1154 (1988); Vigne, Восстановительная неврология и неврология, № 8: cc. 35-36 (1995); Kremer и Perricaudet, British Medical Bulletin № 51 (1): cc. 31-44 (1995); Haddada и др., в Current Topics in Microbiology and Immunology, под ред. Doerfler and Bohm (1995); и Yu и др., Gene Therapy № 1: cc. 13-26 (1994).
Способы невирусной доставки нуклеиновых кислот включают липофекцию, нуклеофекцию, микроинъекцию, биолистику, виросомы, липосомы, иммунолипосомы, поликатион или липид: конъюгаты нуклеиновой кислоты, голую ДНК, искусственные вирионы и усиленный агентом захват ДНК. Липофекция описана, например, в патентах США No. №№ 5049386, 4946787; и 4897355), а реагенты для липофекции продаются коммерчески (например, Transfectam™ и Lipofectin™). Катионные и нейтральные липиды, которые подходят для эффективной липофекции полинуклеотидов с распознаванием рецепторов, включают липиды Feigner, WO 91/17424; WO 91/16024. Доставка может осуществляться в клетки (например, введение in vitro или ex vivo) или в целевые ткани (например, введение in vivo). Получение комплексов липид: нуклеиновая кислота, включая целевые липосомы, такие как иммунолипидные комплексы, хорошо известно специалисту в данной области (см., например, Crystal, Science № 270: cc. 404-410 (1995); Blaese и др., Cancer Gene Ther. № 2: cc. 291-297 (1995); Behr и др., Bioconjugate Chem. № 5: cc. 382-389 (1994); Remy и др., Bioconjugate Chem. № 5: cc. 647-654 (1994); Gao и др., Gene Therapy № 2: cc. 710-722 (1995); Ahmad и др., Cancer Res. № 52: cc. 4817-4820 (1992); патенты США 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, и 4,946,787).
Использование систем РНК или ДНК на основе вирусов для доставки нуклеиновых кислот пользуется преимуществом перед высокоразвитыми процессами для нацеливания вируса на определенные клетки в организме и доставки вирусной полезной нагрузки к ядру. Вирусные векторы можно вводить непосредственно пациентам (in vivo) или их можно использовать для обработки клеток in vitro, а модифицированные клетки могут опционно вводиться пациентам (ex vivo). Обычные вирусные системы могут включать ретровирусные, лентивирусные, аденовирусные, аденоассоциированные векторы и векторы вируса простого герпеса. Интеграция в геном хозяина возможна с помощью методов переноса генов ретровируса, лентивируса и аденоассоциированного вируса, что часто приводит к долговременной экспрессии встроенного трансгена. Кроме того, высокая эффективность трансдукции наблюдалась во многих различных типах клеток и целевых тканях.
Тропизм ретровируса можно изменить путем включения белков чужой оболочки, увеличивая потенциальную целевую популяцию целевых клеток. Лентивирусные векторы - это ретровирусные векторы, которые способны трансдуктировать или инфицировать неделящиеся клетки и обычно продуцируют высокие титры вируса. Следовательно, выбор системы переноса ретровирусного гена будет зависеть от целевой ткани. Ретровирусные векторы состоят из цис-действующих длинных концевых повторов с упаковочной способностью до 6-10 т.п.н. чужеродной последовательности. Минимальных цис-действующих LTR достаточно для репликации и упаковки векторов, которые затем используются для интеграции терапевтического гена в целевую клетку для обеспечения постоянной экспрессии трансгена. Широко используемые ретровирусные векторы включают векторы на основе вируса лейкемии мышей (MuLV), вируса лейкемии обезьян гиббонов (GaLV), вируса иммунодефицита обезьян (SIV), вируса иммунодефицита человека (ВИЧ) и их комбинаций (см., например, Buchscher и др., J. Viral. № 66: cc. -2739 (1992); Johann и др., J. Viral. № 66: cc. 1635-1640 (1992); Sommnerfelt и др., Viral. №176: cc. 58-59 (1990); Wilson и др., J. Viral. №63: cc. 2374-2378 (1989); Miller и др., 1. Viral. № 65: сс. 2220-2224 (1991); PCT/US94/05700).
В прикладных задачах, где предпочтительна временная экспрессия, можно использовать системы на основе аденовирусов. Векторы на основе аденовирусов обладают очень высокой эффективностью трансдукции во многих типах клеток и не требуют деления клеток. С такими векторами были получены высокие титр и уровни экспрессии. Этот вектор может быть произведен в больших количествах в относительно простой системе. Векторы аденоассоциированного вируса (AAV) также могут быть использованы для трансдукции клеток целевыми нуклеиновыми кислотами, например, при производстве нуклеиновых кислот и пептидов in vitro, а также для процедур генной терапии in vivo и ex vivo (см., например, West и др., Virology № 160: cc. 38-47 (1987); патент США № 4797368; WO 93/24641; Katin, Human Gene Therapy № 5: cc. 793-801 (1994); Muzyczka, 1. Clin. Invest. № 94: cc. 1351 (1994). Конструирование рекомбинантных векторов AAV описано в ряде публикаций, включая патент США №5 173 414; Tratschin и др., Mol. Cell. Biol. № 5: cc. 3251-3260 (1985); Tratschin и др., Mol. Cell. Biol. № 4: cc. 2072-2081 (1984); Hermonat и Muzyczka, PNAS № 81: cc. 6466-6470 (1984); и Samulski и др., 1. Viral. № 63: cc. 03822-3828 (1989) Упаковочные клетки обычно используются для образования вирусных частиц, способных инфицировать клетку-хозяина. Такие клетки включают клетки 293, которые упаковывают аденовирус, и клетки ψJ2 или клетки PA317, которые упаковывают ретровирус.
Вирусные векторы, используемые в генной терапии, обычно получают путем получения линии клеток, которая упаковывает вектор на основе нуклеиновой кислоты в вирусную частицу. Векторы обычно содержат минимальные вирусные последовательности, необходимые для упаковки и последующей инте- 15 046542 грации в хозяина, другие вирусные последовательности заменяются кассетой экспрессии для экспрессируемого(ых) полинуклеотида(ов). Утраченные вирусные функции обычно передаются упаковочной транс-клеточной линии. Например, векторы AAV, используемые в генной терапии, обычно содержат только последовательности ITR из генома AAV, которые необходимы для упаковки и интеграции в геном хозяина. Вирусная ДНК помещена в клеточную линию, которая содержит вспомогательную плазмиду, кодирующую другие гены AAV, а именно rep и cap, но без последовательностей ITR.
Клеточная линия также может быть инфицирована аденовирусом в качестве помощника. Хелперные вирусные промоторы способствуют репликации вектора AAV и экспрессии генов AAV из хелперной плазмиды. Хелперная плазмида не упакована в значительных количествах из-за отсутствия последовательностей ITR. Загрязнение аденовирусом можно снизить, например, с помощью тепловой обработки, к которой аденовирус более чувствителен, чем AAV. Дополнительные методы доставки нуклеиновых кислот в клетки известны специалистам в данной области. См., например, US20030087817, включенный в данном документе в качестве ссылки.
В некоторых вариантах осуществления изобретения клетка-хозяин временно или непременно трансфицируется одним или несколькими описанными здесь векторами. В некоторых вариантах осуществления изобретения клетка трансфицируется, как это обычно происходит у субъекта. В некоторых вариантах осуществления изобретения трансфецированная клетка берется у субъекта. В некоторых вариантах осуществления изобретения клетка получена из клеток, взятых у субъекта, таких как клеточная линия. В данной области известно большое количество клеточных линий для тканевых культур. Примеры клеточных линий включают, но не ограничиваются,
С8161, CCRF-CEM, MOLT, mIMCD-3, NHDF, HeLaS3, Huhl, Huh4, Huh7, HUVEC, HASMC, HEKn, HEKa, MiaPaCell, Panel, PC-3, TF1, CTLL-2, CIR, Rat6, CVI, RPTE, АЮ, T24, 182, A375, ARH-77, Calul, SW480, SW620, SKOV3, SK-UT, CaCo2, P388D1, SEM-K2, WEHI231, HB56, TIB55, lurkat, 145.01, LRMB, Bcl-1, ВС-3, IC21, DLD2, Raw264.7, NRK, NRK-52E, MRC5, MEF, Hep G2, HeLa B, HeLa T4. COS, COS-1, COS-6, COS-M6A, BS-C-1 эпителиальный почечный эпителий обезьяны, фибробласт эмбриона мыши BALB/3T3, фибробласты плода человека 3T3, 3T3-L1, 132-d5; 10.1 фибробласты мыши,
293-Т, ЗТЗ, 721, 9L, А2780, A2780ADR, A2780cis, А172, А20, А253, А431, А-549, ALC, В16, В35, клетки BCP-I, BEAS-2B, bEnd.3 , ВНК21, BR 293, ВхРСЗ, СЗН-10Т1 / 2, С6 / 36, Cal-27, СНО, СНО-7, CHO-IR, СНО-К1, СНО-К2, СНО-Т, CHO Dhfr- / -, COR-L23, COR-L23 / CPR, COR-L235010, CORL23 / R23, COS-7, COV-434, CML Tl, CMT, СТ26, D17, DH82, DU145, DuCaP, EL4, ЕМ2, ЕМЗ, ЕМТ6 / ARI, ЕМТ6 / AR10.0, FM3, H1299, H69, HB54, HB55, HCA2, HEK-293, HeLa, Hepalclc7, HL-60, HMEC, HT-29, lurkat, клетки 1Y, клетки K562, Ku812, KCL22 , KG1, KYO1, LNCap, Ma-Mel 1-48, MC-38, MCF-7, MCF-10A, MDA-MB-231, MDA-MB-468, MDA-MB-435, MDCKII, MDCKII, MOR / 0.2R, MONO-MAC 6, MTD-1A, MyEnd, NCI-H69 / CPR, NCI-H69 / LX10, NCI-H69 / LX20, NCI-H69 / LX4, NIH-3T3, NALM-1, NW-145, линии клеток OPCN / OPCT, Peer, PNT-1A / PNT 2, RenCa, RIN-5F, RMA / RMAS, клетки Saos-2, Sf-9, SkBr3, T2, T-47D, T84, линия клеток THP1, U373, U87, U937, VCaP, клетки Vero, WM39, WT-49, X63, YAC-1, YAR и их трансгенные разновидности. Клеточные линии доступны из множества источников, известных специалистам в данной области (см., например, Американскую коллекцию типовых культур (ATCC), Манассас, Вирджиния).
В некоторых вариантах осуществления изобретения клетка, трансфицированная одним или несколькими описанными здесь векторами, используется для создания новой линии клеток, содержащей одну или несколько последовательностей, полученных из вектора. В некоторых вариантах осуществления изобретения клетка, временно трансфицированная компонентами системы CRISPR, как описано в настоящем изобретении (например, временной трансфекцией одного или нескольких векторов или трансфекцией РНК), и модифицированная посредством активности комплекса CRISPR, используется для
- 16 046542 создания новой клеточной линии, включающей клетки, содержащие модификацию, но не имеющие какой-либо другой экзогенной последовательности. В некоторых вариантах осуществления изобретения клетки, временно или непременно трансфецированные одним или несколькими векторами, описанными в предлагаемом изобретении, или клеточные линии, полученные из таких клеток, используются для оценки одного или нескольких тестируемых соединений.
В некоторых вариантах осуществления изобретения один или несколько описанных здесь векторов используются для получения трансгенного растения или трансгенного животного, не являющегося человеком. В некоторых вариантах реализации трансгенное животное представляет собой млекопитающее, такое как мышь, крыса или кролик.
IV. Варианты и фрагменты полипептидов и полинуклеотидов.
В настоящем описании изобретения представлены активные варианты и фрагменты природной (т.е. дикого типа) РНК-управляемой нуклеазы, аминокислотная последовательность которой представлена в SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, а также активные варианты и фрагменты встречающихся в природе повторов CRISPR, такие как последовательность, обозначенная как SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, и активный вариант и фрагменты встречающейся в природе tracrPHK, такие как последовательность, обозначенная как SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, и полинуклеотиды, кодирующие их.
Хотя активность варианта или фрагмента может быть изменена по сравнению с интересующим полинуклеотидом или полипептидом, вариант и фрагмент должны сохранять функциональность интересующего полинуклеотида или полипептида. Например, вариант или фрагмент может иметь повышенную активность, пониженную активность, другой спектр активности или любое другое изменение активности по сравнению с интересующим полинуклеотидом или полипептидом.
Фрагменты и варианты встречающихся в природе полипептидов RGN, таких как полипептиды, описываемые в предлагаемом изобретении, будут сохранять специфичную для последовательности управляемую РНК ДНК-связывающую активность. В конкретных вариантах осуществления изобретения фрагменты и варианты встречающихся в природе полипептидов RGN (одно-цепочечные или двухцепочечные), таких как описанные в данном документе, будут сохранять нуклеазную активность.
Фрагменты и варианты встречающихся в природе повторов CRISPR, таких как описанные в настоящем документе, сохранят свою способность, как часть управляющей РНК (включающей tracrPHK), связывать с и направлять РНК-управляемую нуклеазу (в комплексе с управляющей РНК) к целевой нуклеотидной последовательности специфичным для последовательности образом.
Фрагменты и варианты встречающихся в природе tracrPHK, таких как описаны в предлагаемом изобретении, сохраняют способность, как часть управляющей РНК (включая CRISPR-PHK), направлять РНК-управляемую нуклеазу (в комплексе с управляющей РНК) к целевой нуклеотидной последовательности специфическим для последовательности образом.
Термин фрагмент относится к части полинуклеотидной или полипептидной последовательности, представленной в изобретении. Фрагменты или биологически активные части включают полинуклеотиды, содержащие достаточное количество смежных нуклеотидов для сохранения биологической активности (т.е. связывание и направление RGN специфическим для последовательности образом к целевой нуклеотидной последовательности, если она включена в управляющую РНК). Фрагменты или биологически активные части включают полипептиды, содержащие достаточное количество смежных аминокислотных остатков для сохранения биологической активности (т.е. связывания с целевой нуклеотидной последовательностью специфическим для последовательности образом при образовании комплекса с управляющей РНК). Фрагменты белков RGN включают те, которые короче полноразмерных последовательностей из-за использования расположенного ниже альтернативного стартового сайта. Биологически активная часть белка RGN может быть полипептидом, который включает, например, 10, 25, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050 или более смежных аминокислотных остатков SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54. Такие биологически активные части могут быть получены рекомбинантными методами и оцениваются в отношении специфичной для последовательности РНК управляемой ДНК-связывающей активности. Биологически активный фрагмент последовательности CRISPR повторов может содержать по меньшей мере 8 смежных аминокислот SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55. Биологически активная часть последовательности CRISPR повторов может быть полинуклеотидом, который включает, например, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 смежных нуклеотидов SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55. Биологически активная часть tracrPHK может быть полинуклеотидом, который включает, например, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 или более смежных нуклеотидов SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
В общем, варианты предназначены для обозначения практически одинаковых последовательностей. Для полинуклеотидов вариант включает делецию и/или вставку одного или нескольких нуклеотидов в одном или нескольких внутренних сайтах нативного полинуклеотида и/или замену одного или нескольких нуклеотидов в одном или нескольких сайтах в нативном полинуклеотиде. Используемый здесь термин нативный или дикого типа полинуклеотид или полипептид включает встречающуюся в природе нуклеотидную последовательность или аминокислотную последовательность, соответственно. Для
- 17 046542 полинуклеотидов консервативные варианты включают те последовательности, которые из-за вырожденности генетического кода кодируют нативную аминокислотную последовательность интересующего гена. Встречающиеся в природе аллельные варианты, такие как эти, могут быть идентифицированы с использованием хорошо известных методов молекулярной биологии, таких как, например, полимеразная цепная реакция (ПЦР) и методы гибридизации, как описано ниже. Варианты полинуклеотидов также включают полинуклеотиды синтетического происхождения, такие как полинуклеотиды, полученные, например, с использованием сайт-направленного мутагенеза, но которые все еще кодируют представляющий интерес полипептид или полинуклеотид. Как правило, варианты конкретного полинуклеотида, описанные в предлагаемом изобретении, будут иметь по меньшей мере около 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичности последовательности с этим конкретным полинуклеотидом, как определено программами выравнивания последовательностей и параметрами, описанными в другом месте предлагаемого изобретения.
Варианты конкретного полинуклеотида, описанного в данном изобретении (то есть эталонного полинуклеотида), также можно оценивать путем сравнения процентной идентичности последовательностей между полипептидом, кодируемым вариантом полинуклеотида, и полипептидом, кодируемым эталонным полинуклеотидом. Процент идентичности последовательностей между любыми двумя полипептидами можно рассчитать с использованием программ выравнивания последовательностей и параметров, описанных в другом месте в настоящем документе. Если любую данную пару полинуклеотидов, описанных в предлагаемом изобретении, оценивают путем сравнения процентной идентичности последовательностей, разделяемой двумя полипептидами, которые они кодируют, процент идентичности последовательностей между двумя кодируемыми полипептидами составляет по меньшей мере примерно 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичности последовательностей.
В конкретных вариантах осуществления изобретения описанные в настоящем документе полинуклеотиды кодируют РНК-управляемый нуклеазный полипептид, содержащий аминокислотную последовательность, имеющую по меньшей мере 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% 98%, 99% или более идентичности с аминокислотной последовательностью SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54.
Биологически активный вариант полипептида RGN по изобретению может отличаться всего лишь примерно на 1-15, всего лишь примерно на 1-10, всего лишь на 6-10, всего лишь на 5, всего лишь на 4, всего лишь на 3, всего лишь на 2 аминокислотных остатка или всего лишь на 1 аминокислотный остаток. В конкретных вариантах осуществления изобретения полипептиды могут содержать усечение на Nконце или на С-конце, которое может иметь, по меньшей мере, делецию 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050 аминокислотных остатков или более с N- или С-конца полипептида.
В некоторых вариантах осуществления изобретения полинуклеотиды содержат или кодируют повтор CRISPR, содержащий нуклеотидную последовательность, имеющую по меньшей мере 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичности с нуклеотидной последовательностью, представленной в SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55.
Описанные в настоящем изобретении полинуклеотиды могут содержать или кодировать tracrPHK, содержащую нуклеотидную последовательность, имеющую по меньшей мере 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, или более идентичности нуклеотидной последовательности, представленной в SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
Биологически активные варианты повтора CRISPR или tracrPHK по изобретению могут отличаться всего лишь на 1-15 нуклеотидов, всего лишь на 1-10, всего лишь на 6-10, всего лишь на 5, всего лишь на 4, всего лишь на 3, всего лишь на 2 или всего лишь на 1 нуклеотид. В конкретных вариантах осуществления изобретения полинуклеотиды могут содержать 5' или 3' усечение, которое может включать по меньшей мере делецию 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80 нуклеотидов или более от 5' или 3' конца полинуклеотида.
Признано, что в полипептиды RGN, CRISPR повторы и tracrPHK, представленные в предлагаемом изобретении, могут быть внесены модификации, создавая варианты белков и полинуклеотидов. Изменения, разработанные человеком, могут быть внесены путем применения методов сайт-направленного мутагенеза. Кроме того, также могут быть идентифицированы нативные, пока неизвестные или еще не идентифицированные полинуклеотиды и/или полипептиды, структурно и/или функционально связанные с последовательностями, представленными в данном документе, которые входят в рамки настоящего изобретения. Консервативные аминокислотные замены могут быть осуществлены в неконсервативных областях, которые не изменяют функцию белков RGN. В качестве альтернативы могут быть внесены модификации, улучшающие активность RGN.
Варианты полинуклеотидов и белков также включают последовательности и белки, полученные в результате мутагенной и рекомбиногенной процедуры, такой как перетасовка ДНК. С помощью такой
- 18 046542 процедуры одним или несколькими различными белками RGN, описанными в данном документе (например, SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54), манипулируют для создания нового белка RGN, обладающего желаемыми свойствами. Таким образом, библиотеки рекомбинантных полинуклеотидов генерируются из популяции полинуклеотидов с родственными последовательностями, содержащими участки последовательностей, которые имеют существенную идентичность последовательностей и могут быть гомологично рекомбинированы in vitro или in vivo. Например, используя этот подход, мотивы последовательностей, кодирующие представляющий интерес домен, могут быть перетасованы между последовательностями RGN, представленными в предлагаемом изобретении, и другими известными генами RGN для получения нового гена, кодирующего белок с улучшенным представляющим интерес свойством, таким как увеличенный Km в случае фермента. Стратегии такой перетасовки ДНК известны в данной области техники. См., например, Stemmer (1994) Proc. Natl. Acad. Sci. USA 91: 10747-10751; Stemmer (1994) Nature 370: 389-391; Crameri и др. (1997) Nature Biotech. 15: 436-438; Myp и др. (1997) J. Mol. Биол. 272: 336-347; Zhang и др. (1997) Proc. Natl. Acad. Sci. USA 94: 4504-4509; Crameri и др. (1998) Nature 391:288291; и патенты США №№ 5,605,793 и 5,837,458. Перетасованная нуклеиновая кислота представляет собой нуклеиновую кислоту, полученную с помощью процедуры перетасовки, такой как любая процедура перетасовки, изложенная в предлагаемом изобретении. Перетасованные нуклеиновые кислоты получают путем рекомбинации (физически или виртуально) двух или более нуклеиновых кислот (или строки символов), например, искусственным и опционно рекурсивным образом. Обычно в процессах перетасовки используются одна или несколько стадий скрининга для идентификации представляющих интерес нуклеиновых кислот; этот этап скрининга можно проводить до или после любого этапа рекомбинации. В некоторых (но не во всех) вариантах осуществления изобретения перетасовки желательно выполнить в несколько циклов рекомбинации перед выбором, чтобы увеличить разнообразие пула, подлежащего скринингу. Общий процесс рекомбинации и отбора необязательно повторяется рекурсивно. В зависимости от контекста перетасовка может относиться к общему процессу рекомбинации и отбора или, альтернативно, может просто относиться к рекомбинационным частям всего процесса.
Используемые в предлагаемом изобретении термины идентичность последовательностей или идентичность в контексте двух полинуклеотидных или полипептидных последовательностей относятся к остаткам в двух последовательностях, которые являются одинаковыми при выравнивании для максимального соответствия в указанном окне сравнения. Когда процент идентичности последовательностей используется по отношению к белкам, признается, что положения остатков, которые не идентичны, часто отличаются консервативными аминокислотными заменами, когда аминокислотные остатки заменены другими аминокислотными остатками с аналогичными химическими свойствами (например, заряд или гидрофобность) и, следовательно, не меняют функциональных свойств молекулы. Когда последовательности различаются консервативными заменами, процент идентичности последовательностей может быть увеличен для корректировки консервативного характера замены. Считается, что последовательности, которые отличаются такими консервативными заменами, имеют подобные последовательности или подобие. Способы выполнения этой регулировки хорошо известны специалистам в данной области. Обычно это включает оценку консервативной замены как частичного, а не полного несоответствия, тем самым увеличивая процентную идентичность последовательностей. Таким образом, например, когда идентичной аминокислоте присваивается оценка 1, а неконсервативной замене присваивается оценка ноль, консервативной замене присваивается оценка от нуля до 1. Вычисляется оценка консервативных замен, например, по реализованной программе PC/GENE (Intelligenetics, Mountain View, California).
Используемый в предлагаемом изобретении термин процент идентичности последовательностей означает значение, определенное путем сравнения двух оптимально выровненных последовательностей в окне сравнения, при этом часть полинуклеотидной последовательности в окне сравнения может содержать вставки или делеции (т.е. пробелы) по сравнению с эталонной последовательностью (которая не содержит вставок или делеций) для оптимального выравнивания двух последовательностей. Процент рассчитывается путем определения количества положении, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток встречается в обеих последовательностях, чтобы получить количество совпадающих положений, путем деления количества совпадающих положений на общее количество положений в окне сравнения и умножения результата на 100, чтобы получить процент идентичности последовательностей.
Если не указано иное, значения идентичности/подобия последовательностей, представленные в настоящем изобретении, относятся к значению, полученному с использованием GAP Версия 10 с использованием следующих параметров: % идентичности и % подобия для нуклеотидной последовательности с использованием GAP Weight 50 и Length Weight 3 и nwsgapdna.cmp скоринговой матрицы;% идентичности и % подобия для аминокислотной последовательности с использованием GAP Weight 8 и Length Weight 2 и скоринговой матрицы BLOSUM 62 или любой эквивалентной программы. Под эквивалентной программой подразумевается любая программа сравнения последовательностей, которая для любых двух рассматриваемых последовательностей генерирует выравнивание, имеющее идентичные совпадения нуклеотидных или аминокислотных остатков и идентичный процент идентичности последовательностей по сравнению с соответствующим выравниванием, созданным GAP Версией 10.
- 19 046542
Две последовательности оптимально выровнены, когда они выровнены для оценки сходства с использованием определенной матрицы аминокислотных замен (например, BLOSUM 62), штрафа за существование пробела и штрафа за удлинение пробела, чтобы достичь наивысшего возможного результата для этой пары последовательностей. Матрицы аминокислотных замен и их использование для количественной оценки сходства между двумя последовательностями хорошо известны в данной области техники и описаны, например, у Dayhoff и др. (1978) Модель эволюционного изменения белков. В Атласе последовательности и структуры белков Том 5, Прил. 3 (под ред. М. О. Дэйхоффа), cc. 345-352. Nail. Biomed. Res. Found., Вашингтон, округ Колумбия, и Henikoff и др. (1992) Proc. Natl. Acad. Sci. США № 89: cc. 10915-10919. Матрица BLOSUM 62 часто используется в качестве скоринговой матрицы замен по умолчанию в протоколах выравнивания последовательностей. Штраф за существование пробела накладывается за введение одного аминокислотного пробела в одну из выровненных последовательностей, а штраф за удлинение пробела накладывается за каждую дополнительную пустую аминокислотную позицию, вставленную в уже открытый пробел. Выравнивание определяется положениями аминокислот каждой последовательности, в которых выравнивание начинается и заканчивается, и, необязательно, вставкой пробела или множества пробелов в одну или обе последовательности, чтобы получить максимально возможную оценку. Хотя оптимальное выравнивание и подсчет очков можно выполнить вручную, этот процесс облегчается использованием алгоритма выравнивания, реализованного на компьютере, например BLAST 2.0 с промежутками, описанного Altschul и др. (1997) Nucleic Acids Res. № 25: cc. 3389-3402 и доступен для общественности на веб-сайте Национального центра биотехнологической информации (www.ncbi.nlm.nih.gov). Оптимальные сопоставления, включая множественные сопоставления, могут быть получены с использованием, например, PSI-BLAST, доступного на www.ncbi.nlm.nih.gov и описанного Altschul и др. (1997) Nucleic Acids Res. № 25: cc. 3389-3402.
Что касается аминокислотной последовательности, которая оптимально выровнена с эталонной последовательностью, в ней аминокислотный остаток соответствует положению в эталонной последовательности, с которой этот остаток спарен при выравнивании. Положение обозначается числом, которое последовательно идентифицирует каждую аминокислоту в эталонной последовательности на основании ее положения относительно N-конца. Из-за делеций, вставок, усечений, слияний и т.д., которые необходимо учитывать при определении оптимального выравнивания, в целом количество аминокислотных остатков в тестируемой последовательности, определяемое простым подсчетом от N-конца, не обязательно будет то же, что и номер соответствующей позиции в эталонной последовательности. Например, в случае, когда есть делеция в выровненной тестируемой последовательности, то в ней не будет аминокислоты, которая соответствует положению в эталонной последовательности на сайте делеций. Если имеется вставка в выровненной эталонной последовательности, эта вставка не будет соответствовать какому-либо положению аминокислоты в эталонной последовательности. В случае усечения или слияния могут быть отрезки аминокислот либо в эталонной, либо в выровненной последовательности, которые не соответствуют какой-либо аминокислоте в соответствующей последовательности.
V. Антитела.
Антитела к полипептидам RGN или рибонуклеопротеинам, содержащим полипептиды RGN, описанные в предлагаемом изобретении, включая те, которые имеют аминокислотную последовательность, указанную как SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или их активные варианты или фрагменты, также включены. Способы получения антител хорошо известны в данной области см., например, Harlow и Lane (1988) Antibodies: A Laboratory Manual, Издательство Cold Spring Harbor Laboratory, Издательство Cold Spring Harbor, Нью-Йорк и патент США № 4 196265). Эти антитела можно использовать в наборах для обнаружения и выделения полипептидов или рибонуклеопротеинов RGN. Таким образом, в данном описании представлены наборы, содержащие антитела, которые специфически связываются с полипептидами или рибонуклеопротеинами, описанными в данном документе, включая, например, полипептиды, имеющие последовательность SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54.
VI. Системы и комплексы рибонуклеопротеинов для связывания целевой представляющей интерес последовательности и способы их создания.
В предлагаемом описании изобретения представлена система для связывания целевой представляющей интерес последовательности-мишени, где система содержит по меньшей мере одну управляющую РНК или нуклеотидную последовательность, кодирующую ее, и по меньшей мере одну РНКуправляемую нуклеазу или нуклеотидную последовательность, кодирующую ее. Управляющая РНК гибридизуется с целевой представляющей интерес последовательностью, а также образует комплекс с полипептидом RGN, тем самым направляя полипептид RGN на связывание с целевой последовательностью. В некоторых вариантах осуществления изобретения RGN содержит аминокислотную последовательность SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54 или ее активный вариант или фрагмент. В различных вариантах осуществления изобретения управляющая РНК содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или ее активный вариант или фрагмент. В конкретных вариантах осуществления изобретения управляющая РНК включает tracrPHK, содержащую нуклеотидную последовательность SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, или ее активный вариант или фрагмент. Управляющая РНК системы может быть одиночной управляющей РНК
- 20 046542 или двойной управляющей РНК. В конкретных вариантах осуществления изобретения система содержит РНК-управляемую нуклеазу, которая является гетерологичной по отношению к управляющей РНК, при этом RGN и gPHK не образуют комплексов в природе.
Система связывания целевой представляющей интерес последовательности, представленная в настоящем изобретении, может представлять собой комплекс рибонуклеопротеина, который состоит по меньшей мере из одной молекулы РНК, связанной по меньшей мере с одним белком. Комплексы рибонуклеопротеидов, представленные в настоящем документе, содержат по меньшей мере одну управляющую РНК в качестве компонента РНК и управляемую РНК нуклеазу, в качестве белкового компонента. Такие рибонуклеопротеиновые комплексы могут быть выделены из клетки или организма, которые естественным образом экспрессируют полипептид RGN, и были сконструированы для экспрессии конкретной управляющей РНК, которая специфична для целевой представляющей интерес последовательности. Кроме того, рибонуклеопротеиновый комплекс можно выделить путем очистки из клетки или организма, трансформированного полинуклеотидами, кодирующими полипептид RGN и управляющую РНК, и культивировать в условиях, допускающих экспрессию полипептида RGN и управляющей РНК. Таким образом, предложены способы получения полипептида RGN или комплекса рибонуклеопротеина RGN. Такие способы включают культивирование клетки, содержащей нуклеотидную последовательность, кодирующую полипептид RGN, и в некоторых вариантах осуществления изобретения нуклеотидную последовательность, кодирующую управляющую РНК, в условиях, в которых экспрессируется полипептид RGN (и в некоторых вариантах осуществления изобретения управляющую РНК). Затем полипептид RGN или рибонуклеопротеин RGN можно очистить из лизата культивируемых клеток.
Способы очистки полипептида RGN или комплекса рибонуклеопротеина RGN из лизата биологического образца известны в данной области (например, вытеснительная и/или аффинная хроматография, 2D-PAGE, HPLC, обращенно-фазовая хроматография, иммунопреципитация). В конкретных способах полипептид RGN получают рекомбинантно, и он содержит метку очистки, чтобы способствовать его очистке, включая, помимо прочего, глутатион^-трансферазу (GST), хитинсвязывающий белок (СВР), мальтозосвязывающий белок, тиоредоксин (TRX ), поли (NANP), тег тандемной аффинной очистки (TAP), myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis, 10xHis, белок-носитель карбоксила биотина (ВССР) и кальмодулин. Обычно меченый полипептид RGN или комплекс рибонуклеопротеина RGN очищают с использованием аффинной хроматографии с иммобилизованным металлом. Следует понимать, что можно использовать другие аналогичные методы, известные в данной области, включая другие формы хроматографии или, например, иммунопреципитацию, либо по отдельности, либо в комбинации.
Выделенный или очищенный полипептид или его биологически активная часть по существу не содержат компонентов, которые обычно сопровождают полипептид или взаимодействуют с ним, как это обнаруживается в его естественной среде. Таким образом, выделенный или очищенный полипептид практически не содержит другого клеточного материала или культуральной среды при получении рекомбинантными методами или практически не содержит химических предшественников или других химических веществ при химическом синтезе. Белок, который практически не содержит клеточного материала, включает препараты белка, содержащие менее примерно 30%, 20%, 10%, 5% или 1% (на сухой вес) загрязняющего белка. Когда белок, описанный в настоящем изобретении, или его биологически активная часть продуцируется рекомбинантно, оптимально культуральная среда представляет примерно менее, чем 30%, 20%, 10%, 5% или 1% (на сухой вес) химических предшественников или небелковых веществ, или представляющих интерес химических веществ.
Конкретные способы, представленные в данном документе для связывания и/или расщепления представляющей интерес целевой последовательности, включают использование собранного in vitro комплекса рибонуклеопротеина RGN. Сборка рибонуклеопротеинового комплекса RGN in vitro может быть осуществлена с использованием любого метода, известного в данной области, в котором полипептид RGN контактирует с управляющей РНК в условиях, позволяющих полипептиду RGN связываться с управляющей РНК. Используемые здесь термины контактировать, контактирующие, контактированные относятся к размещению компонентов желаемой реакции вместе в условиях, подходящих для проведения желаемой реакции. Полипептид RGN может быть очищен из биологического образца, клеточного лизата или культуральной среды, полученной путем трансляции in vitro или синтезированной химическим путем. Управляющая РНК может быть очищена из биологического образца, клеточного лизата или культуральной среды, транскрибирована in vitro или химически синтезирована. Полипептид RGN и управляющая РНК могут быть приведены в контакт в растворе (например, забуференном физиологическом растворе), чтобы обеспечить сборку RGN рибонуклеопротеинового комплекса in vitro.
VII. Способы связывания, расщепления или изменения целевой последовательности.
В предлагаемом описании изобретения представлены способы связывания, расщепления и/или модификации представляющей интерес целевой нуклеотидной последовательности. Способы включают доставку системы, содержащей по меньшей мере одну управляющую РНК или полинуклеотид, кодирующий ее, и по меньшей мере один полипептид RGN или полинуклеотид, кодирующий то же самое в целевой последовательности или клетке, органелле или эмбрионе, содержащих целевую последователь
- 21 046542 ность. В некоторых вариантах осуществления изобретения RGN содержит аминокислотную последовательность SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54 или ее активный вариант, или фрагмент. В различных вариантах осуществления изобретения управляющая РНК содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или ее активный вариант, или фрагмент. В конкретных вариантах осуществления изобретения управляющая РНК содержит tracrPHK, содержащую нуклеотидную последовательность SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, или ее активный вариант, или фрагмент. Управляющая РНК системы может быть одиночной или двойной. RGN система может содержать неактивную нуклеазу, обладать никазной активностью или может быть гибридным полипептидом. В некоторых вариантах осуществления изобретения слитый полипептид содержит редактирующий основание полипептид, например цитидиндезаминазу или аденозиндезаминазу. В конкретных вариантах осуществления изобретения RGN и/или управляющая РНК является гетерологичной клетке, органелле или эмбриону, в которые введены RGN и/или управляющая РНК (или полинуклеотид(ы), кодирующие по меньшей мере одну из RGN и управляющей РНК).
В тех вариантах осуществления изобретения, в которых способ включает доставку полинуклеотида, кодирующего управляющую РНК и/или полипептид RGN, в клетку или эмбрион затем можно культивировать в условиях, в которых экспрессируется управляющая РНК и/или полипептид RGN. В различных вариантах осуществления изобретения способ включает контактирование целевой последовательности с рибонуклеопротеидным комплексом RGN. Рибонуклеопротеиновый комплекс RGN может включать RGN с неактивной нуклеазой или обладает никазной активностью. В некоторых вариантах осуществления изобретения RGN рибонуклеопротеинового комплекса представляет собой слитый полипептид, содержащий полипептид, редактирующий основание. В некоторых вариантах осуществления изобретения способ включает введение в клетку, органеллу или эмбрион комплекса рибонуклеопротеина RGN, содержащего целевую последовательность. Рибонуклеопротеидный комплекс RGN может быть очищен из биологического образца, получен рекомбинантно и впоследствии очищен или собран in vitro, как описано в данном изобретении. В тех вариантах осуществления изобретения, где рибонуклеопротеиновый комплекс RGN, который контактирует с целевой последовательностью или клеточной органеллой, или эмбрионом, был собран in vitro, способ может дополнительно включать сборку комплекса in vitro перед контактом с целевой последовательностью, клеткой, органелла, или эмбрионом.
Очищенный или собранный in vitro рибонуклеопротеидный комплекс RGN может быть введен в клетку, органеллу или эмбрион с использованием любого метода, известного в данной области, включая электропорацию, но, не ограничиваясь ею. Кроме того, полипептид и/или полинуклеотид RGN, кодирующий или содержащий управляющую РНК, может быть введен в клетку, органеллу или эмбрион с использованием любого метода, известного в данной области (например, методом электропорации).
При доставке или контакте с целевой последовательностью или клеткой, органеллой или эмбрионом, содержащими целевую последовательность, управляющая РНК направляет RGN на связывание с целевой последовательностью специфическим для последовательности образом. В тех вариантах осуществления изобретения, где RGN обладает нуклеазной активностью, полипептид RGN расщепляет интересующую целевую последовательность при связывании. Целевая последовательность впоследствии может быть модифицирована с помощью механизмов эндогенной репарации, таких как негомологичное соединение концов или гомологично направленная репарация предоставленным донорным полинуклеотидом.
Способы измерения связывания полипептида RGN с целевой последовательностью известны в данной области и включают анализы иммунопреципитации хроматина, анализы сдвига подвижности геля, анализы тесты на связывание ДНК, анализы репортеров, анализы захвата и обнаружения на микропланшетах. Аналогичным образом, способы измерения расщепления или модификации целевой последовательности известны в данной области и включают анализы расщепления in vitro или in vivo, в которых расщепление подтверждается с помощью ПЦР, секвенирования или гель-электрофорезом с или без присоединения соответствующей метки (например, радиоизотопа, флуоресцентного вещества) к целевой последовательности для облегчения обнаружения продуктов разложения. В качестве альтернативы может быть использован анализ реакции экспоненциальной амплификации, инициируемой рассечением (NTEXPAR) (см., например, Zhang и др. (2016) Chem. Sci. № 7: cc. 4951-4957). Расщепление in vivo можно оценить с помощью анализа Surveyor (Guschin и др. (2010) Methods Mol Biol № 649: cc. 247-256).
В некоторых вариантах осуществления изобретения способы включают использование одного типа RGN в комплексе с более чем одной управляющей РНК. Более чем одна управляющая РНК может быть нацелена на разные области одного гена или на несколько генов.
В тех вариантах осуществления изобретения, в которых донорный полинуклеотид не предусмотрен, двухцепочечный разрыв, введенный полипептидом RGN, может быть восстановлен с помощью процесса репарации негомологичным концевым соединением (NHEJ). Из-за склонности к ошибкам NHEJ восстановление двухцепочечного разрыва может привести к модификации целевой последовательности. В данном контексте модификация в отношении молекулы нуклеиновой кислоты относится к изменению нуклеотидной последовательности молекулы нуклеиновой кислоты, которое может представлять собой делецию, вставку или замену одного или нескольких нуклеотидов или их комбинацию. Модификация целевой последовательности может привести к экспрессии измененного белкового продукта или инакти
- 22 046542 вации кодирующей последовательности.
В тех вариантах осуществления изобретения, где присутствует донорный полинуклеотид, донорная последовательность в донорном полинуклеотиде может быть интегрирована в целевую нуклеотидную последовательность или заменена ей в ходе репарации введенного двухцепочечного разрыва, что приводит к введению экзогенной донорной последовательности. Таким образом, донорный полинуклеотид содержит донорную последовательность, которую желательно ввести в интересующую целевую последовательность. В некоторых вариантах осуществления изобретения донорная последовательность изменяет исходную целевую нуклеотидную последовательность так, что новая интегрированная донорная последовательность не будет распознаваться и расщепляться RGN. Интеграция донорной последовательности может быть усилена включением в донорный полинуклеотид фланкирующих последовательностей, которые в значительной степени идентичны последовательностям, фланкирующим целевую нуклеотидную последовательность, что делает возможным процесс восстановления, гомологично направленным. В тех вариантах осуществления изобретения, в которых полипептид RGN вводит двухцепочечные разрывы в шахматном порядке, донорный полинуклеотид может содержать донорскую последовательность, фланкированную совместимыми выступами, что делает возможным прямое лигирование донорной последовательности с расщепленной целевой нуклеотидной последовательностью, содержащей выступы, в процессе негомологичного восстановления при репарации двухцепочечного разрыва.
В тех вариантах осуществления изобретения, в которых способ включает использование RGN, которая представляет собой никазу (т.е. она способна расщеплять только одну цепь двухцепочечного полинуклеотида), способ может включать введение двух никаз RGN, которые нацелены на идентичные или перекрывающиеся целевые последовательности и расщепляют разные цепи полинуклеотида. Например, никаза RGN, которая расщепляет только положительную (+) цепь двухцепочечного полинуклеотида, может быть введена вместе со второй никазой RGN, которая расщепляет только отрицательную (-) цепь двухцепочечного полинуклеотида.
В различных вариантах осуществления изобретения предложен способ связывания целевой нуклеотидной последовательности и обнаружения целевой последовательности, при этом способ включает введение в клетку, органеллу или эмбрион по меньшей мере одной управляющей РНК или полинуклеотида, кодирующего ее, и по меньшей мере одной RGN, полипептида или полинуклеотида, кодирующего ее, экспрессируя управляющую РНК и/или полипептид RGN (если введены кодирующие последовательности), где полипептид RGN представляет собой RGN с неактивной нуклеазой и дополнительно содержит детектируемую метку, а способ дополнительно включает обнаружение детектируемой метки. Обнаруживаемая метка может быть слита с RGN в виде слитого белка (например, флуоресцентного белка) или может представлять собой небольшую молекулу, конъюгированную или включенную в полипептид RGN, которую можно обнаружить визуально или другими способами.
В настоящем описании изобретения также представлены способы модуляции экспрессии целевой последовательности или интересующего гена при регуляции целевой последовательности. Способы включают введение в клетку, органеллу или эмбрион по меньшей мере одной управляющей РНК или полинуклеотида, кодирующего ее, и по меньшей мере одного полипептида RGN или полинуклеотида, кодирующего ее, экспрессируя управляющую РНК и/или полипептид RGN, описанные в предлагаемом изобретении, (если введены кодирующие последовательности), где полипептид RGN представляет собой RGN с неактивной нуклеазой. В некоторых из этих вариантов осуществления изобретения RGN с неактивной нуклеазой представляет собой слитый белок, содержащий домен модулятора экспрессии (т.е. домен эпигенетической модификации, домен активации транскрипции или домен репрессора транскрипции), как описано в предлагаемом изобретении.
В предлагаемом описании изобретения также представлены способы связывания и/или модификации интересующей целевой нуклеотидной последовательности. Способы включают доставку системы, содержащей по меньшей мере одну управляющую РНК или полинуклеотид, кодирующий ее, и по меньшей мере один слитый полипептид, который содержит RGN, предлагаемую в настоящем изобретении, и полипептид, редактирующий основание, например цитидиндезаминазу или аденозиндезаминазу, или полинуклеотид, кодирующий слитый полипептид с целевой последовательностью или клеткой, органеллой или эмбрионом, содержащим целевую последовательность.
Обычный специалист в данной области поймет, что любой из описанных здесь способов может быть использован для нацеливания на единственную целевую последовательность или множественные целевые последовательности. Таким образом, способы включают использование одного полипептида RGN в комбинации с множеством отдельных управляющих РНК, которые могут нацеливаться на множество различных последовательностей в пределах одного гена и/или нескольких генов. В настоящее изобретение также включены способы, в которых несколько отдельных управляющих РНК вводятся в комбинации с несколькими отдельными полипептидами RGN. Эти управляющие РНК и управляющие полипептидные системы РНК/RGN могут нацеливаться на несколько различных последовательностей в пределах одного гена и/или нескольких генов.
В одном аспекте изобретение предоставляет наборы, содержащие любой один или несколько элементов, описанных в приведенных выше способах и композициях. В некоторых вариантах осуществле
- 23 046542 ния изобретения набор включает векторную систему и инструкции по использованию набора. В некоторых вариантах осуществления изобретения векторная система содержит (а) первый регуляторный элемент, функционально связанный с последовательностью tracr, и один или несколько сайтов вставки для вставки управляющей последовательности перед последовательностью tracr, причем при экспрессии управляющая последовательность направляет специфическое для последовательности связывание комплекса CRISPR с целевой последовательностью в эукариотической клетке, при этом комплекс CRISPR включает фермент CRIS PR в комплексе с (1) управляющей последовательностью, которая гибридизуется с целевой последовательностью и (2) последовательностью tracr, которая гибридизована с tracr последовательностью; и/или (б) второй регуляторный элемент, функционально связанный с последовательностью кодирующей фермент, которая кодирует указанный фермент CRISPR, содержащий последовательность ядерной локализации. Элементы могут быть предоставлены индивидуально или в комбинациях в любом подходящем контейнере, таком как пузырек, флакон или пробирка.
В некоторых вариантах осуществления изобретения набор включает инструкции на одном или нескольких языках. В некоторых вариантах осуществления изобретения набор включает один или несколько реагентов для применения в способе с использованием одного или нескольких элементов, описанных в данном документе. Реагенты могут быть предоставлены в любом подходящем контейнере. Например, набор может включать один или несколько буферов для реакции или хранения. Реагенты могут быть предоставлены в форме, пригодной для использования в конкретном анализе, или в форме, которая требует добавления одного или нескольких других компонентов перед использованием (например, в виде концентрата или в лиофилизированной форме). Буфер может быть любым буфером, включая, помимо прочего, буфер карбоната натрия, буфер бикарбоната натрия, боратный буфер, буфер Tris, буфер MOPS, буфер HEPES и их комбинации. В некоторых вариантах осуществления изобретения буфер является щелочным. В некоторых вариантах осуществления изобретения буфер имеет pH примерно от 7 до 10.
В некоторых вариантах осуществления изобретения набор содержит один или несколько олигонуклеотидов, соответствующих управляющей последовательности для вставки в вектор, для того чтобы функционально связать управляющую последовательность и регуляторный элемент. В некоторых вариантах осуществления изобретения набор включает полинуклеотид-матрицу для гомологичной рекомбинации. В одном аспекте изобретение предоставляет способы использования одного или нескольких элементов системы CRISPR. Комплекс CRISPR, предлагаемый в настоящем изобретении, обеспечивает эффективное средство модификации целевого полинуклеотида. Комплекс CRISPR согласно в настоящему изобретению имеет широкое применение, включая модификацию (например, удаление, вставку, транслокацию, инактивацию, активацию) целевого полинуклеотида во множестве типов клеток. Как таковой комплекс CRISPR, предлагаемый в настоящем изобретении, имеет широкий спектр применения, например, в генной терапии, скрининге лекарственных средств, диагностике заболеваний и прогнозировании. Типичный комплекс CRISPR включает фермент CRISPR в комплексе с управляющей последовательностью, гибридизированной с целевой последовательностью в целевой полинуклеотиде.
VIII. Целевые полинуклеотиды.
В одном аспекте изобретение относится к способам модификации целевого полинуклеотида в эукариотической клетке, которая может быть in vivo, ex vivo или in vitro. В некоторых вариантах осуществления изобретения способ предполагает взятие образцов клетки или популяции клеток человека или животного, не являющегося человеком, или растения (включая микроводоросли), и модификацию клетки или клеток. Культивирование может происходить на любой стадии ex vivo. Клетку или клетки можно даже повторно ввести в растение (включая микроводоросли) или животное, не являющееся человеком.
Используя естественную изменчивость, селекционеры комбинируют наиболее полезные гены нужных качеств, таких как урожайность, качество, однородность, выносливость и устойчивость к вредителям. Эти нужные качества также включают рост, предпочтительную длину светового дня, требования к температуре, дату начала цветения или репродуктивного развития, содержание жирных кислот, устойчивость к насекомым, устойчивость к болезням, устойчивость к нематодам, устойчивость к грибам, устойчивость к гербицидам, устойчивость к различным факторам окружающей среды, включая засуху, жару, влажность, холод, ветер и неблагоприятные почвенные условия, включая высокую засоленность. Источники этих полезных генов включают местные или чужеродные сорта, наследственные сорта, диких родственников растений и индуцированные мутации, например, обработку растительного материала мутагенными агентами. С помощью предлагаемого изобретения селекционерам растений предоставляется новый инструмент для индукции мутаций. Соответственно, специалист в данной области может анализировать геном на предмет источников полезных генов, а в сортах, имеющих нужные характеристики или признаки, использовать настоящее изобретение для индукции количества полезных генов с большей точностью, чем предыдущие мутагенные агенты, и, следовательно, ускорять и улучшать программы селекции растений.
Целевой полинуклеотид системы RGN может быть любым полинуклеотидом, эндогенным или экзогенным по отношению к эукариотической клетке. Например, целевой полинуклеотид может быть полинуклеотидом, находящимся в ядре эукариотической клетки. Целевой полинуклеотид может представлять собой последовательность, кодирующую продукт гена (например, белок), или не кодирующую последо
- 24 046542 вательность (например, регуляторный полинуклеотид или избыточную ДНК). Не ограничиваясь теорией, полагают, что целевая последовательность должна быть связана с PAM (мотив, примыкающий к протоспейсеру), то есть короткой последовательностью, распознаваемой комплексом CRISPR. Требования к точной последовательности и длине для PAM различаются в зависимости от используемого фермента CRISPR, но PAM обычно представляет собой последовательности из 2-5 пар оснований, смежные с протоспейсером (то есть с целевой последовательностью).
Целевой полинуклеотид комплекса CRISPR может включать ряд связанных с заболеванием генов и полинуклеотидов, а также гены и полинуклеотиды, связанные с биохимическим путем передачи сигналов. Примеры целевых полинуклеотидов включают последовательность, связанную с сигнальным биохимическим путем, например, ген или полинуклеотид, связанный с сигнальным биохимическим путем. Примеры целевых полинуклеотидов включают ген или полинуклеотид, связанный с заболеванием. Связанный с заболеванием ген или полинуклеотид относится к любому гену или полинуклеотиду, который дает продукты транскрипции или трансляции на аномальном уровне или в аномальной форме в клетках, полученных из пораженных болезнью тканей, по сравнению со здоровыми контрольными тканями или клетками. Это может быть ген, который экспрессируется на аномально высоком уровне; это может быть ген, который экспрессирован на аномально низком уровне, где измененная экспрессия коррелирует с возникновением и/или прогрессированием заболевания. Связанный с заболеванием ген также относится к гену, обладающему мутацией(-ями) или генетической вариацией, которые непосредственно ответственны или находятся в неравновесном сцеплении с геном(-ами), который ответственен за этиологию заболевания (например, причинную мутацию). Транскрибированные или транслированные продукты могут быть известными или неизвестными, а также могут находиться на нормальном или ненормальном уровне. Примеры связанных с заболеванием генов и полинуклеотидов доступны в Институте генетической медицины МакКьюзика-Натанса Университета Джона Хопкинса (Балтимор, штат Мэриленд) и в Национальном центре биотехнологической информации Национальной медицинской библиотеки (Бетесда, штат Мэриленд), а также доступны в World Wide Web.
Хотя системы CRISPR особенно полезны из-за их относительной простоты нацеливания на представляющие интерес геномные последовательности, все еще остается вопрос о том, что RGN может сделать для устранения причинной мутации. Один из подходов заключается в создании слитого белка между RGN (предпочтительно неактивным или никазным вариантом RGN) и ферментом, редактирующим основание, или активным доменом фермента, редактирующего основание, например, цитидиндезаминазы или редактора оснований аденозиндезаминазы (патент США № 9840699, включенный в данный документ в качестве ссылки). В некоторых вариантах осуществления изобретения способы включают молекулу ДНК, контактирующую с (а) гибридным белком, содержащим RGN, предлагаемую в настоящем изобретении, и полипептид, редактирующий основание, такой как дезаминаза; и (б) gPHK, нацеленную на слитый белок (а) на целевую нуклеотидную последовательность цепи ДНК, где молекула ДНК контактирует со слитым белком и gPHK в эффективном количестве и в условиях, подходящих для дезаминирования нуклеотидного основания. В некоторых вариантах осуществления изобретения целевая последовательность ДНК включает последовательность, связанную с заболеванием или нарушением, и где дезаминирование нуклеотидного основания приводит к последовательности, которая не связана с заболеванием или нарушением. В некоторых вариантах осуществления изобретения целевая последовательность ДНК находится в аллеле культурного растения, где конкретная аллель интересующего признака приводит к получению растения меньшей агрономической ценности. В результате дезаминирования нуклеотидного основания образуется аллель, улучшающий признак и повышающий агрономическую ценность растения.
В некоторых вариантах осуществления изобретения последовательность ДНК включает точечную мутацию T^C или A^G. связанную с заболеванием или нарушением, и при этом дезаминирование мутантного основания С или G приводит к последовательности, которая не связана с заболеванием или нарушением. В некоторых вариантах осуществления изобретения дезаминирование исправляет точечную мутацию в последовательности, связанной с заболеванием или нарушением.
В некоторых вариантах осуществления изобретения последовательность, связанная с заболеванием или нарушением, кодирует белок, и при этом дезаминирование вводит стоп-кодон в последовательность, связанную с заболеванием или нарушением, что приводит к усечению кодируемого белка. В некоторых вариантах осуществления изобретения контактирование осуществляется in vivo у субъекта, подверженного заболеванию или расстройству, имеющего это заболевание, или у субъекта, у которого оно диагностировано. В некоторых вариантах реализации изобретения заболевание или нарушение представляет собой заболевание, связанное с точечной мутацией или одноосновной мутацией в геноме. В некоторых вариантах осуществления изобретения заболевание представляет собой генетическое заболевание, рак, нарушение обмена веществ или лизосомную болезнь.
Дополнительные примеры локусов, которые являются причиной определенных генетических заболеваний, в частности локусов, на которые можно легко нацелится с помощью RGN или слитых белков редактор оснований-RGN, предлагаемых в настоящем изобретении, можно найти в примере 9 и соответствующей табл. 12.
- 25 046542
Синдром Гурлера.
Примером генетически наследуемого заболевания, которое может быть исправлено с использованием подхода, основанного на использовании слитого белка RGN-редактор оснований, предлагаемого в настоящем изобретении, является синдром Гурлера. Синдром Гурлера, также известный как MPS-1, является результатом дефицита a-L-идуронидазы (IDUA), что приводит к лизосомной болезни, характеризующейся на молекулярном уровне накоплением дерматансульфата и гепарансульфата в лизосомах. Это заболевание обычно является наследственным генетическим заболеванием, вызванным мутациями гена IDUA, кодирующего a-L-идуронидазу. Распространенными мутациями IDUA являются W402X и Q70X, обе нонсенс-мутации, приводящие к преждевременному прекращению трансляции. Такие мутации хорошо поддаются лечению с помощью подходов точного редактирования генома (PGE), поскольку реверсия одного нуклеотида, например, с помощью подхода редактирования оснований, восстановит кодирующую последовательность дикого типа и приведет к экспрессии белка, контролируемой эндогенными регуляторными механизмами генетического локуса. Кроме того, поскольку известно, что гетерозиготы бессимптомны, терапия PGE, направленная на одну из этих мутаций, будет полезна для значительной части пациентов с этим заболеванием, так как необходимо исправить только одну из мутировавших аллелей (Bunge и др. (1994), Hum. Mol. Genet. № 3 (6): cc. 861-866), включенная в данный документ в качестве ссылки).
Современные методы лечения синдрома Гурлера включают заместительную ферментную терапию и трансплантацию костного мозга (Vellodi и др. (1997) Arch. Dis. Child. № 76 (2): cc. 92-99; Peters и др. (1998) Blood № 91 (7): cc. 2601-2608, включенные в данный документ в качестве ссылки). Хотя заместительная ферментативная терапия оказала сильное влияние на выживаемость и качество жизни пациентов с синдромом Гурлера, этот подход требует дорогостоящих и длительных еженедельных инфузий. Дополнительные подходы включают доставку гена IDUA в вектор экспрессии или встраивание гена в локус высокой экспрессией, такой как локус сывороточного альбумина (патент США № 9956247, включенный в настоящее описание изобретения в качестве ссылки). Однако эти подходы не восстанавливают исходный локус IDUA до правильной кодирующей последовательности. Стратегия редактирования генома будет иметь ряд преимуществ, в первую очередь то, что регуляция экспрессии генов будет контролироваться естественными механизмами, присутствующими у здоровых людей. Кроме того, использование базового редактирования не требует разрыва двухцепочечной ДНК, что может привести к большим хромосомным перестройкам, гибели клеток или онкогенности из-за нарушения механизмов подавления опухоли. Возможное описание способа исправления причинной мутации этого заболевания представлено в примере 10. Описанные способы являются примером общей стратегии, направленной на использование слитых белков RGN-редактор основания, предложенной в настоящем изобретении, для нацеливания и коррекции определенных вызывающих заболевание мутаций в геноме человека. Следует принять во внимание, что аналогичные подходы к целевым заболеваниям, таких как описаны в табл. 12, также могут быть применены. Также будет понятно, что аналогичные подходы к нацеливанию на вызывающие заболевание мутации у других видов, особенно обычных домашних животных или домашнего скота, также могут быть применены с использованием RGN, предлагаемой в настоящем изобретении. Обычные домашние животные и домашний скот включают собак, кошек, лошадей, свиней, коров, овец, кур, ослов, змей, хорьков, рыбу, включая лосося, и креветок.
Атаксия Фридрейха.
RGN, предлагаемая в настоящем изобретении, также может быть полезной в терапевтических подходах для лечения заболеваний человека, где причинная мутация более сложная. Например, некоторые заболевания, такие как атаксия Фридрейха и болезнь Хантингтона, являются результатом значительного увеличения количества повторов трех нуклеотидного мотива в определенной области гена, что влияет на способность экспрессируемого белка функционировать или экспрессироваться. Атаксия Фридрейха (FRDA) - это аутосомно-рецессивное заболевание, приводящее к прогрессирующей дегенерации нервной ткани в спинном мозге. Снижение уровня белка фратаксина (FXN) в митохондриях вызывает окислительные повреждения и дефицит железа на клеточном уровне. Снижение экспрессии FXN было связано с экспансией триплета GAA в интроне 1 соматического и зародышевого гена FXN. У пациентов с FRDA повторение GAA часто состоит из более чем 70, иногда даже из более чем 1000 (чаще всего 600-900) триплетов, тогда как у здоровых людей имеется около 40 повторов или меньше (Pandolfo и др. (2012) Handbook of Clinical Neurology № 103: cc. 275-294; Campuzano и др. (1996) Science № 271: cc. 1423-1427; Pandolfo (2002) Adv. Exp. Med. Biol. № 516: cc. 99-118; все включены в предлагаемое описание изобретения в качестве ссылки).
Экспансия последовательности тринуклеотидного повтора, вызывающая атаксию Фридрейха (FRDA), происходит в определенном генетическом локусе внутри гена FXN, который называется областью нестабильности FRDA. РНК-управляемые нуклеазы (RGN) могут использоваться для удаления области нестабильности в клетках пациентов с FRDA. Этот подход требует использования 1) последовательности RGN и управляющей РНК, которая может быть запрограммирована для нацеливания на аллель в геноме человека; и 2) способа доставки RGN и управляющей последовательности. Многие нуклеазы,
- 26 046542 используемые для редактирования генома, такие как обычно используемая нуклеаза Cas9 из S. pyogenes (SpCas9), слишком велики, чтобы их можно было упаковывать в аденоассоциированные вирусные (AAV) векторы, особенно с учетом длины гена SpCas9 и управляющей РНК в дополнение к другим генетическим элементам, необходимым для функциональных кассет экспрессии. Это затрудняет подход с использованием SpCas9.
Компактные РНК-управляемые нуклеазы, предлагаемые в настоящем изобретении, в частности APG07433.1 и APG08290.1, уникально хорошо подходят для удаления области нестабильности FRDA. Каждая RGN имеет, как необходимое условие PAM, которая находится в непосредственной близости от области нестабильности FRDA. Кроме того, каждая из этих RGN может быть упакована в вектор AAV вместе с управляющей РНК. Упаковка двух управляющих РНК, вероятно, потребует второго вектора, но этот подход все же выгодно отличается от того, который требует более крупной нуклеазы, такой как SpCas9, которая может потребовать разделения последовательности белка между двумя векторами. Возможное описание способа исправления причинной мутации этого заболевания представлено в примере 11. Описанные способы охватывают стратегию с использованием RGN, предлагаемой в настоящем изобретении, в которой удаляется область геномной нестабильности. Такая стратегия применима к другим заболеваниям и расстройствам, имеющим аналогичную генетическую основу, таким как болезнь Хантингтона. Аналогичные стратегии с использованием RGN, предлагаемой в настоящем изобретении, также могут быть применимы к аналогичным заболеваниям и расстройствам у животных, не относящихся к человеку, имеющих агрономическое или экономическое значение, включая собак, кошек, лошадей, свиней, коров, овец, кур, ослов, змей, хорьков, рыб, включая лосось и креветки.
Г емоглобинопатии.
RGN, раскрытые в настоящем описании, также могут вводить разрушающие мутации, которые могут привести к положительному эффекту. Генетические дефекты в генах, кодирующих гемоглобин, особенно в цепи бета-глобина (ген HBB), могут быть причиной ряда заболеваний, известных как гемоглобинопатии, включая серповидно-клеточную анемию и талассемии.
У взрослых людей гемоглобин представляет собой гетеротетрамер, содержащий две альфа (α)подобные цепи глобина и две бета (в)-подобные цепи глобина и 4 гемовые группы. У взрослых тетрамер α2β2 называется гемоглобином А (HbA) или взрослым гемоглобином. Обычно альфа- и бета-глобиновые цепи синтезируются в соотношении приблизительно 1:1, и это соотношение кажется критическим с точки зрения стабилизации гемоглобина и эритроцитов (RBC). У развивающегося плода образуется другая форма гемоглобина, гемоглобин плода (HbF), который имеет более высокое сродство связывания с кислородом, чем гемоглобин А, так что кислород может доставляться в систему ребенка через кровоток матери. Гемоглобин плода также содержит две цепи α-глобина, но вместо цепей β-глобина взрослого человека он имеет две цепи гамма (/(-глобина плода (т.е. гемоглобин плода α2γ2). Регулирование перехода от продукции гамма-глобина к бета-глобину является довольно сложным и в первую очередь включает подавление транскрипции гамма-глобина с одновременным усилением транскрипции бета-глобина. Примерно на 30 неделе беременности синтез гамма-глобина у плода начинает падать, а производство бета-глобина увеличивается. Примерно к 10-месячному возрасту гемоглобин новорожденного почти полностью состоит из α2β2, хотя некоторое количество HbF сохраняется и во взрослом возрасте (примерно 1-3% от общего гемоглобина). У большинства пациентов с гемоглобинопатией гены, кодирующие гамма-глобин, остаются, но экспрессия относительно низкая из-за нормальной репрессии генов, происходящей во время родов, как описано выше.
Серповидно-клеточная анемия вызывается мутацией V6E в гене β-глобина (НВВ) (GAG в GTG на уровне ДНК), где образующийся гемоглобин обозначается как гемоглобин S или HbS. В условиях пониженного содержания кислорода молекулы HbS агрегируют и образуют волокнистые осадки. Эти агрегаты вызывают аномалию или серповидность эритроцитов, что приводит к потере гибкости клеток. Серповидные эритроциты больше не могут протискиваться в капиллярные русла и могут вызывать вазоокклюзионный криз у пациентов с серповидными клетками. Кроме того, серповидные эритроциты более хрупкие, чем нормальные эритроциты, и имеют тенденцию к гемолизу, что в конечном итоге приводит к анемии у пациента.
Лечение и ведение пациентов с серповидно-клеточной анемией - это пожизненная проблема, включающая лечение антибиотиками, обезболивание и переливание крови во время острых приступов. Один из подходов - использование гидроксимочевины, которая частично оказывает свое действие за счет увеличения производства гамма-глобина. Однако долгосрочные побочные эффекты хронической терапии гидроксимочевиной все еще неизвестны, и лечение дает нежелательные побочные эффекты и может иметь различную эффективность у разных пациентов. Несмотря на повышение эффективности лечения серповидными клетками, ожидаемая продолжительность жизни пациентов все еще находится в диапазоне от середины до конца 50-ти лет, и связанные с этим заболевания оказывают сильное влияние на качество жизни пациента.
Талассемии (альфа-талассемия и бета-талассемия) также являются заболеваниями, связанными с гемоглобином, и обычно являются причиной снижения экспрессии цепей глобина. Это может происхо
- 27 046542 дить из-за мутаций в регуляторных областях генов или из-за мутации в последовательности, кодирующей глобин, которая приводит к снижению экспрессии или снижению уровней функционального белка глобина. Лечение талассемии обычно включает переливание крови и хелатирование железа. Трансплантация костного мозга также используется для лечения людей с тяжелой формой талассемии, если можно найти подходящего донора, но эта процедура может иметь значительные риски.
Один из подходов, который был предложен для лечения как SCD, так и бета-талассемии, заключается в увеличении экспрессии гамма-глобина так, чтобы HbF функционально замещал аберрантный гемоглобин взрослого человека. Как упоминалось выше, лечение пациентов с SCD гидроксимочевиной считается успешным отчасти из-за ее влияния на увеличение экспрессии гамма-глобина (DeSimone (1982) Proc Nat'l Acad Sci USA № 79 (14): cc. 4428-31; Ley и др. (1982) N. Engl. J. Medicine, № 307: cc. 1469- 1475; Ley и др. (1983) Blood № 62: cc. 370-380; Constantoulakis и др. (1988) Blood № 72 (6): cc. 19611967, все включены в предлагаемое описание изобретения в качестве ссылки). Увеличение экспрессии HbF включает идентификацию генов, продукты которых играют роль в регуляции экспрессии гаммаглобина. Один из таких генов - BCL11A. BCL11A кодирует белок цинкового пальца, который экспрессируется во взрослых клетках-предшественниках эритроидов, и подавление его экспрессии приводит к увеличению экспрессии гамма-глобина (Sankaran и др. (2008) Science № 322: с. 1839, включено в предлагаемое описание изобретения в качестве ссылки). Было предложено использование ингибирующей РНК, нацеленной на ген BCL11A (например, патент США 2011/0182867, включенный в настоящее описание в качестве ссылки), но эта технология имеет несколько потенциальных недостатков, в том числе невозможность полного нокдауна и доставки таких РНК может быть проблематичным, а РНК должны присутствовать постоянно, что требует многократного лечения в течение всей жизни.
RGN, предлагаемые в настоящем изобретении, можно использовать для нацеливания на область энхансера BCL11A, чтобы нарушить экспрессию BCL11A, тем самым увеличивая экспрессию гаммаглобина. Это целевое нарушение может быть достигнуто за счет негомологичного соединения концов (NHEJ), при котором RGN, предлагаемая в настоящем изобретении, нацеливается на конкретную последовательность в области энхансера BCL11A, делает двух-цепочечный разрыв, и аппарат клетки восстанавливает разрыв, обычно одновременно внося вредные мутации. Подобно тому, что описано для других мишеней заболевания, RGN, предлагаемые в настоящем изобретении, имеет преимущества перед другими известными RGN из-за их относительно небольшого размера, что позволяет упаковывать кассеты экспрессии для RGN и ее управляющей РНК в один вектор AAV для доставки in vivo. Возможное описание этого способа представлено в примере 12. Подобные стратегии с использованием RGN, предлагаемой в настоящем изобретении, также могут быть применимы к аналогичным заболеваниям и расстройствам, как у людей, так и у животных, не относящихся к человеку, которые имеют агрономическое или экономическое значение.
IX. Клетки, содержащие генетическую модификацию полинуклеотидов.
В настоящем изобретении представлены клетки и организмы, содержащие представляющую интерес целевую последовательность, которая была модифицирована с использованием процесса, опосредованного RGN, crPHK и/или tracrPHK, как описано в предлагаемом изобретении. В некоторых из вариантов осуществления изобретения RGN содержит аминокислотную последовательность SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54 или ее активный вариант или фрагмент. В других вариантах осуществления изобретения управляющая РНК содержит последовательность CRISPR повторов, включающую в себя нуклеотидную последовательность SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или ее активный вариант или фрагмент. В конкретных вариантах осуществления изобретения управляющая РНК содержит tracrPHK, содержащую нуклеотидную последовательность SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56, или ее активный вариант или фрагмент. Управляющая РНК системы может быть одиночной управляющей РНК или двойной управляющей РНК.
Модифицированные клетки могут быть эукариотическими (например, клетками млекопитающих, растений, насекомых) или прокариотическими. Также предусмотрены органеллы и эмбрионы, содержащие по меньшей мере одну нуклеотидную последовательность, которая была модифицирована с помощью способа с использованием RGN, crPHK и/или tracrPHK, как описано в данном изобретении. Г енетически модифицированные клетки, организмы, органеллы и эмбрионы могут быть гетерозиготными или гомозиготными по модифицированной нуклеотидной последовательности.
Хромосомная модификация клетки, организма, органеллы или эмбриона может приводить к измененной экспрессии (повышающая или понижающая регуляция), инактивации или экспрессии измененного белкового продукта или интегрированной последовательности. В тех случаях, когда хромосомная модификация приводит либо к инактивации гена, либо к экспрессии нефункционального белкового продукта, генетически модифицированная клетка, организм, органелла или эмбрион называется нокаутом. Фенотип нокаута может быть результатом делеционной мутации (т.е. делеции по меньшей мере одного нуклеотида), инсерционной мутации (т.е. вставки по меньшей мере одного нуклеотида) или нонсенсмутации (т.е. замены по меньшей мере одного нуклеотида так, что вводится стоп-кодон).
Кроме того, хромосомная модификация клетки, организма, органеллы или эмбриона может привести к нокауту, который является результатом хромосомной интеграции нуклеотидной последовательно
- 28 046542 сти, кодирующей белок. В некоторых из приведенных вариантов осуществления изобретения кодирующая последовательность интегрирована в хромосому таким образом, что хромосомная последовательность, кодирующая белок дикого типа, инактивирована, но экзогенно введенный белок экспрессируется.
В других вариантах осуществления изобретения хромосомная модификация приводит к продукции вариантного белкового продукта. Экспрессированный вариантный белковый продукт может иметь по меньшей мере одну аминокислотную замену и/или вставку, или делецию по меньшей мере, одной аминокислоты. Вариант белкового продукта, кодируемый измененной хромосомной последовательностью, может проявлять измененные характеристики или активности по сравнению с белком дикого типа, включая, помимо прочего, измененную ферментативную активность или специфичность к субстрату.
В ряде других вариантов осуществления изобретения хромосомная модификация может приводить к измененной схеме экспрессии белка. В качестве неограничивающего примера, хромосомные изменения в регуляторных областях, контролирующих экспрессию белкового продукта, могут привести к сверхэкспрессии или подавлению белкового продукта или к измененной тканевой или временной схеме экспрессии.
Артикль a и an используются в данном документе для обозначения одного или нескольких (то есть по меньшей мере одного) грамматического объекта статьи. Например, полипептид означает один или несколько полипептидов.
Все публикации и заявки на патенты, упомянутые в описании, указывают на уровень специалистов в области, к которой относится это изобретение. Все публикации и заявки на патенты включены сюда посредством ссылки в той же степени, как если бы каждая отдельная публикация или патентная заявка была специально и индивидуально приведена в нем для включения посредством ссылки.
Хотя вышеизложенное изобретение было описано довольно подробно с помощью иллюстраций и примеров с целью ясности понимания, будет очевидно, что определенные изменения и модификации могут быть применены на практике в пределах объема прилагаемых вариантов осуществления изобретения.
Неограничивающие варианты осуществления изобретения включают:
1. Молекулу нуклеиновой кислоты, содержащую полинуклеотид, кодирующий полипептид РНКуправляемой нуклеазы (RGN), где указанный полинуклеотид содержит нуклеотидную последовательность, кодирующую полипептид RGN, содержащий аминокислотную последовательность, имеющую по меньшей мере 95% идентичность с последовательностью SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, где указанный полипептид RGN связывает последовательность целевой ДНК специфическим для РНК-управляемой последовательности образом при связывании с управляющей РНК (gPHK), способной гибридизоваться с указанной последовательностью целевой ДНК, и где указанный полинуклеотид, кодирующий полипептид RGN, функционально связан с промотором, гетерологичным указанному полинуклеотиду.
2. Молекулу нуклеиновой кислоты, описанную в варианте осуществления изобретения 1, где указанный полипептид RGN способен расщеплять указанную последовательность Целевой ДНК при связывании.
3. Молекулу нуклеиновой кислоты по п.2, где расщепление указанным полипептидом RGN приводит к образованию двухцепочечного разрыва.
4. Молекулу нуклеиновой кислоты по п.2, в которой расщепление указанным полипептидом RGN приводит к одноцепочечному разрыву.
5. Молекулу нуклеиновой кислоты по любому из пп.1-4, где полипептид RGN функционально слит с полипептидом, редактирующим основание.
6. Молекулу нуклеиновой кислоты по любому из пп.1-5, где полипептид RGN содержит один или несколько сигналов ядерной локализации.
7. Молекулу нуклеиновой кислоты по любому из пп.1-6, где полипептид RGN имеет кодон, оптимизированный для экспрессии в эукариотической клетке.
8. Молекулу нуклеиновой кислоты по любому из пп.1-7, в которой указанная последовательность целевая ДНК расположена рядом с мотивом, примыкающим к протоспейсеру (РАМ).
9. Вектор, содержащий молекулу нуклеиновой кислоты по любому из пп.1-8.
10. Вектор по п.9, дополнительно содержащий по меньшей мере одну нуклеотидную последовательность, кодирующую указанную gPHK, способную гибридизоваться с указанной последовательностью целевой ДНК.
11. Вектор по п.10, где указанная gPHK представляет собой единственную управляющую РНК.
12. Вектор по п.10, где указанная gPHK представляет собой двойную управляющую РНК.
13. Вектор по любому из пп.10-12, в котором управляющая РНК содержит CRISPR РНК, содержащую повторяющуюся последовательность CRISPR, имеющую по меньшей мере 95% идентичность с последовательностью SEQ ID NO: 2, 12, 20, 28, 37, 46, или 55.
14. Вектор по любому из пп.10-13, где управляющая РНК включает tracrPHK, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
15. Клетку, содержащую молекулу нуклеиновой кислоты по любому из пп.1-8 или вектор по пп.9-14.
16. Способ получения полипептида RGN, включающий культивирование клетки по п.15 в условиях, в которых полипептид RGN экспрессируется.
- 29 046542
17. Способ получения полипептида RGN, включающий введение в клетку молекулы гетерологичной нуклеиновой кислоты, содержащей нуклеотидную последовательность, кодирующую полипептид РНК-управляемой нуклеазы (RGN), содержащий аминокислотную последовательность по меньшей мере на 95% идентичную с последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, где указанный полипептид RGN связывает последовательность целевой ДНК специфически для РНК-управляемой последовательности образом, при связывании с управляющей РНК (gPHK), способной гибридизоваться с указанной последовательностью целевой ДНК и культивирование указанной клетки в условиях, в которых экспрессируется полипептид RGN.
18. Способ п.16 или 17, дополнительно включающий очистку указанного полипептида RGN.
19. Способ по п.16 или 17, где указанная клетка дополнительно экспрессирует одну или несколько управляющих РНК, которые связываются с указанным полипептидом RGN с образованием комплекса рибонуклеопротеина RGN.
20. Способ по п.19, дополнительно включающий очистку указанного комплекса рибонуклеопротеина RGN.
21. Молекулу нуклеиновой кислоты, содержащую полинуклеотид, кодирующий CRISPR РНК (crPHK), где указанная crPHK содержит спейсерную последовательность и последовательность CRISPR повторов, причем указанная последовательность CRISPR повторов включает нуклеотидную последовательность, имеющую по меньшей мере 95% идентичность последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, где управляющая РНК, содержащая:
а) указанную crPHK; и
б) трансактивирующую РНК CRISPR (tracrPHK), гибридизованную с указанной повторяющейся последовательностью CRISPR указанной crPHK; которая способна гибридизоваться с последовательностью целевой ДНК специфическим для последовательности образом через спейсерную последовательность указанной crPHK, когда указанная управляющая РНК связана с полипептидом РНК-управляемой нуклеазы (RGN), и где указанный полинуклеотид, кодирующий crPHK, функционально связан с промотором, гетерологичным указанному полинуклеотиду.
22. Вектор, содержащий молекулу нуклеиновой кислоты по п.21.
23. Вектор по п.22, где указанный вектор дополнительно содержит полинуклеотид, кодирующий указанную tracrPHK.
24. Вектор по п.23, где указанная tracrPHK содержит нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
25. Вектор по п.23 или 24, где указанный полинуклеотид, кодирующий указанную crPHK, и указанный полинуклеотид, кодирующий указанную tracrPHK, функционально связаны с одним и тем же промотором и кодируются, как единственная управляющая РНК.
26. Вектор по п.23 или 24, где указанный полинуклеотид, кодирующий указанную crPHK, и указанный полинуклеотид, кодирующий указанную tracrPHK, функционально связаны с отдельными промоторами.
27. Вектор по любому из пп.22-26, где указанный вектор дополнительно содержит полинуклеотид, кодирующий указанный полипептид RGN, где указанный полипептид RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54.
28. Молекулу нуклеиновой кислоты, содержащую полинуклеотид, кодирующий трансактивирующую РНК CRISPR (tracrPHK), содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности с SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56;
где управляющая РНК, содержащая:
а) указанную tracrPHK; и
б) crPHK, содержащая спейсерную последовательность и последовательность CRISPR повторов, где указанная tracrPHK гибридизуется с указанной последовательностью CRISPR повторов указанной crPHK;
которая способна гибридизоваться с последовательностью целевой ДНК специфическим для последовательности образом через спейсерную последовательность указанной crPHK, когда указанная управляющая РНК связана с полипептидом РНК-управляемой нуклеазы (RGN), и где указанный полинуклеотид, кодирующий tracrPHK, функционально связан с промотором, гетерологичным указанному полинуклеотиду.
29. Вектор, содержащий молекулу нуклеиновой кислоты по п.28.
30. Вектор по п.29, где указанный вектор дополнительно содержит полинуклеотид, кодирующий указанную crPHK.
31. Вектор по п.30, где последовательность CRISPR повторов указанной crPHK включает нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55.
- 30 046542
32. Вектор по п.30 или 31, где указанный полинуклеотид, кодирующий указанную crPHK, и указанный полинуклеотид, кодирующий указанную tracrPHK, функционально связаны с одним и тем же промотором и кодируются как единственная управляющая РНК.
33. Вектор по п.30 или 31, где указанный полинуклеотид, кодирующий указанную crPHK, и указанный полинуклеотид, кодирующий указанную tracrPHK, функционально связаны с отдельными промоторами.
34. Вектор по любому из пп.29-33, где указанный вектор дополнительно содержит полинуклеотид, кодирующий указанный полипептид RGN, где указанный полипептид RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности с SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54.
35. Систему связывания целевой последовательности ДНК, где указанная система включает:
а) одну или несколько управляющих РНК, способных гибридизоваться с указанной последовательностью целевой ДНК или одну или несколько нуклеотидных последовательностей, кодирующих одну или несколько направляющих РНК (gPHK); и
б) полипептид РНК-управляемой нуклеазы (RGN), содержащий аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или нуклеотидную последовательность, кодирующую полипептид RGN, где каждая указанная нуклеотидная последовательность, кодирующая одну или несколько управляющих РНК и кодирующая полипептид RGN, функционально связаны с промотором, гетерологичным указанной нуклеотидной последовательности, где одна или несколько управляющих РНК гибридизуются с последовательностью целевой ДНК и где одна или несколько управляющих РНК образуют комплекс с полипептидом RGN, тем самым заставляя указанный полипептид RGN связываться с указанной последовательностью целевой ДНК.
36. Систему п.35, в которой указанная gPHK представляет собой единственную управляющую РНК (sgPHK).
37. Систему по п.35, в которой указанная gPHK представляет собой двойную управляющую РНК.
38. Систему по любому из пп.35-37, где указанная gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55.
39. Систему по любому из пп.35-38, в которой указанная gPHK включает tracrPHK, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности с SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
40. Систему по любому из пп.35-39, в которой указанная последовательность целевой ДНК расположена рядом с мотивом, примыкающим к протоспейсеру (РАМ).
41. Систему по любому из пп.35-40, в которой целевая последовательность ДНК находится внутри клетки.
42. Систему по п.41, в которой клетка является эукариотической клеткой.
43. Систему по п.42, где эукариотическая клетка представляет собой растительную клетку.
44. Систему по п.42, в которой эукариотическая клетка представляет собой клетку млекопитающего.
45. Систему по п.42, в которой эукариотическая клетка представляет собой клетку насекомого.
46. Систему по п.41, в которой клетка представляет собой прокариотическую клетку.
47. Систему по любому из пп.35-46, где при транскрибировании одна или несколько управляющих РНК гибридизуются с последовательностью целевой ДНК, а управляющая РНК образует комплекс с полипептидом RGN, который вызывает расщепление последовательности целевой ДНК.
48. Систему по п.47, в которой расщепление приводит к двухцепочечному разрыву.
49. Систему по п.47, в которой расщепление указанным полипептидом RGN приводит к одноцепочечному разрыву.
50. Систему по любому из пп.35-49, в которой полипептид RGN функционально связан с полипептидом, редактирующим основание.
51. Систему по любому из пп.35-50, где полипептид RGN содержит один или несколько сигналов ядерной локализации.
52. Систему по любому из пп.35-51, где полипептид RGN имеет кодон, оптимизированный для экспрессии в эукариотической клетке.
53. Систему по любому из пп.35-52, в которой нуклеотидные последовательности, кодирующие одну или несколько управляющих РНК, и нуклеотидная последовательность, кодирующая полипептид RGN, расположены в одном векторе.
54. Систему по любому из пп.35-53, где указанная система дополнительно содержит один или несколько донорных полинуклеотидов или одну или несколько нуклеотидных последовательностей, кодирующих один или несколько донорных полинуклеотидов.
55. Способ связывания последовательности целевой ДНК, включающий доставку системы по любому из пп.35-54 к указанной последовательности Целевой ДНК или к клетке, содержащей последовательность Целевой ДНК.
- 31 046542
56. Способ по п.55, где указанный полипептид RGN или указанная управляющая РНК дополнительно содержит детектируемую метку, что позволяет обнаруживать указанную последовательность целевой ДНК.
57. Способ по п.55, где указанная управляющая РНК или указанный полипептид RGN дополнительно содержат модулятор экспрессии, тем самым модулируя экспрессию указанной целевой последовательности ДНК или гена, находящегося под транскрипционным контролем указанной последовательности целевой ДНК.
58. Способ расщепления или модификации последовательности целевой ДНК, включающий доставку системы по любому из пп.35-54 в указанную последовательность целевой ДНК или клетку, содержащую последовательность целевой ДНК.
59. Способ по п.58, где указанная модифицированная последовательность целевой ДНК включает вставку гетерологичной ДНК в последовательность целевой ДНК.
60. Способ по п.58, где указанная модифицированная последовательность целевой ДНК включает делецию по меньшей одного нуклеотида из последовательности Целевой ДНК.
61. Способ п.58, где указанная модифицированная последовательность целевой ДНК содержит мутацию по меньшей мере одного нуклеотида в последовательности целевой ДНК.
62. Способ связывания целевой последовательности ДНК, включающий:
а) сборку рибонуклеотидного комплекса с РНК-управляемой нуклеазой (RGN) in vitro путем комбинирования:
I) одной или нескольких управляющих РНК, способных гибридизоваться с последовательностью целевой ДНК; и
II) полипептида RGN, содержащего аминокислотную последовательность, по меньшей мере на 95% идентичного последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54 в условиях, подходящих для образования рибонуклеотидного комплекса RGN и
б) контактирование указанной последовательности целевой ДНК или клетки, содержащей указанную последовательность целевой ДНК, с рибонуклеотидным комплексом RGN, собранным in vitro, где одна или несколько управляющих РНК гибридизуются с целевой последовательностью ДНК, тем самым направляя указанный полипептид RGN на связывание с указанной целевой последовательностью ДНК.
63. Способ по п.62, где указанный полипептид RGN или указанная управляющая РНК дополнительно содержит детектируемую метку, что позволяет обнаруживать указанную последовательность целевую ДНК.
64. Способ по п.62, где указанная управляющая РНК или указанный полипептид RGN дополнительно содержит модулятор экспрессии, что позволяет модулировать экспрессию указанной последовательности целевой ДНК.
65. Способ расщепления и/или модификации целевой последовательности ДНК, включающий приведение молекулы ДНК в контакт с:
а) полипептидом РНК-управляемой нуклеазы (RGN), где указанная RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54; и
б) одной или несколькими управляющими РНК, способными нацеливать RGN из (а) на последовательность целевой ДНК, где одна или несколько управляющих РНК гибридизуются с целевой последовательностью ДНК, тем самым направляя указанный полипептид RGN на связывание с указанной целевой последовательностью ДНК, и происходит расщепление и/или модификация указанной целевой последовательности ДНК.
66. Способ по п.65, где указанная модифицированная последовательность целевой ДНК включает вставку гетерологичной ДНК в последовательность целевой ДНК.
67. Способ по п.65, где указанная модифицированная последовательность целевой ДНК включает делецию по меньшей мере одного нуклеотида из последовательности целевой ДНК.
68. Способ по п.65, где указанная модифицированная последовательность целевой ДНК включает мутацию по меньшей мере одного нуклеотида в последовательности целевой ДНК.
69. Способ по любому из пп.62-68, где указанная gPHK представляет собой единичную управляющую РНК (sgPHK).
70. Способ по любому из пп.62-68, где указанная gPHK представляет собой двойную управляющую РНК.
71. Способ по любому из пп.62-70, где указанная gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55.
72. Способ по любому из пп.62-71, где указанная gPHK включает tracrPHK, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 3, 13, 21, 29, 38, 47 или 56.
73. Способ по любому из пп.62-72, в котором указанная последовательность целевой ДНК распо
- 32 046542 ложена рядом с мотивом, примыкающим к протоспейсеру (РАМ).
74. Способ по любому из пп.55-73, где целевая последовательность ДНК находится внутри клетки.
75. Способ по п.74, где клетка является эукариотической клеткой.
76. Способ по п.75, где эукариотическая клетка представляет собой растительную клетку.
77. Способ по п.75, где эукариотическая клетка представляет собой клетку млекопитающего.
78. Способ по п.75, в котором эукариотическая клетка представляет собой клетку насекомого.
79. Способ по п.74, где клетка является прокариотической клеткой.
80. Способ по любому из пп.74-79, дополнительно включающий культивирование клетки в условиях, в которых полипептид RGN экспрессируется и расщепляет последовательность целевой ДНК с получением модифицированной последовательности ДНК; и выбор клетки, содержащей указанную модифицированную последовательность ДНК.
81. Клетку, содержащую модифицированную последовательность целевой ДНК по п.80.
82. Клетку по п.81, где клетка является эукариотической клеткой.
83. Клетку по п.82, где эукариотическая клетка представляет собой растительную клетку.
84. Растение, содержащее клетку по п.83.
85. Семя, содержащее клетку по п.83.
86. Клетку по п.82, где эукариотическая клетка представляет собой клетку млекопитающего.
87. Клетку по п.82, где эукариотическая клетка представляет собой клетку насекомого.
88. Клетку по п.81, где клетка представляет собой прокариотическую клетку.
89. Способ получения генетически модифицированной клетки с коррекцией причинной мутации генетически наследуемого заболевания, включающий введение в клетку:
а) полипептида РНК-управляемой нуклеазы (RGN), где полипептид RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или полинуклеотид, кодирующий указанный полипептид RGN, при этом указанный полинуклеотид, кодирующий полипептид RGN, функционально связан с промотором для обеспечения экспрессии полипептида RGN в клетке; и
б) управляющую РНК (gPHK), где gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или полинуклеотид, кодирующий указанную gPHK, при этом указанный полинуклеотид, кодирующий gPHK, функционально связан с промотором для обеспечения экспрессии gPHK в клетке посредством чего RGN и gPHK нацелены на геномное местоположение причинной мутации и модифицируют геномную последовательность для удаления причинной мутации.
90. Способ по п.89, где RGN слита с полипептидом, который обладает активностью редактирования оснований.
91. Способ по п.90, где полипептид с активностью редактирования оснований представляет собой цитидиндезаминазу или аденозиндезаминазу.
92. Способ по п.89, где клетка представляет собой клетку животного.
93. Способ по п.89, где клетка представляет собой клетку млекопитающего.
94. Способ по п.92, где клетка получена от собаки, кошки, мыши, крысы, кролика, лошади, коровы, свиньи или человека.
95. Способ по п.92, где генетически наследуемое заболевание представляет собой заболевание, указанное в табл. 12.
96. Способ по п.92, где генетически наследуемое заболевание представляет собой синдром Гурлера.
97. Способ по п.96, где gPHK дополнительно содержит спейсерную последовательность, которая нацелена на SEQ ID NO: 453, 454 или 455.
98. Способ получения генетически модифицированной клетки с делецией в вызывающей заболевание геномной области нестабильности, включающий введение в клетку:
а) полипептида РНК-управляемой нуклеазы (RGN), где полипептид RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или полинуклеотид, кодирующий указанный полипептид RGN, при этом указанный полинуклеотид, кодирующий полипептид RGN, функционально связан с промотором для обеспечения экспрессии полипептида RGN в клетке и
б) управляющую РНК (gPHK), где эта gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или полинуклеотид, кодирующий указанную gPHK, причем указанный полинуклеотид, кодирующий gPHK, функционально связан с промотором, обеспечивающим экспрессию gPHK в клетке, и, кроме того, где gPHK содержит спейсерную последовательность, которая нацелена на 5'-фланг геномной области нестабильности и
в) вторую направляющую РНК (gPHK), где gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или полинуклеотид, кодирующий указанную gPHK, при этом указанный полинуклеотид, кодирующий gPHK, функционально связан с промотором для обеспече
- 33 046542 ния экспрессии gPHK в клетке, и, кроме того, указанная вторая gPHK содержит спейсерную последовательность, нацеленную на 3'-конец геномной области нестабильности, посредством чего RGN и две gPHK нацелены на нестабильную область генома и по меньшей мере часть нестабильной области генома удаляется.
99. Способ по п.98, где клетка представляет собой клетку животного.
100. Способ по п.98, где клетка представляет собой клетку млекопитающего.
101. Способ по п.100, где клетка получена от собаки, кошки, мыши, крысы, кролика, лошади, коровы, свиньи или человека.
102. Способ по п.99, где генетически наследуемым заболеванием является атаксия Фридриха или болезнь Хантингтона.
103. Способ по п.102, где первая gPHK дополнительно содержит спейсерную последовательность, которая нацелена на SEQ ID NO: 468, 469 или 470.
104. Способ по п.103, где вторая gPHK дополнительно содержит спейсерную последовательность, нацеленную на SEQ ID NO: 471.
105. Способ получения генетически модифицированной гематопоэтической клеткипредшественника млекопитающего, имеющей пониженную экспрессию gPHK и белка BCL11A, при этом способ включает введение в выделенную гематопоэтическую клетку-предшественницу человека:
а) полипептида РНК-управляемой нуклеазы (RGN), где полипептид RGN содержит аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, или полинуклеотид, кодирующий указанный полипептид RGN, при этом указанный полинуклеотид, кодирующий полипептид RGN, функционально связан с промотором для обеспечения экспрессии полипептида RGN в клетке и
б) управляющей РНК (gPHK), где gPHK содержит последовательность CRISPR повторов, содержащую нуклеотидную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 2, 12, 20, 28, 37, 46 или 55, или полинуклеотид, кодирующий указанную gPHK, при этом указанный полинуклеотид, кодирующий gPHK, функционально связан с промотором для обеспечения экспрессии gPHK в клетке, посредством чего RGN и gPHK экспрессируются в клетке и расщепляются в области энхансера BCL11A, что приводит к генетической модификации гематопоэтической клеткипредшественника человека и снижению экспрессии мРНК и/или белка BCL11A.
106. Способ по п.105, где gPHK дополнительно содержит спейсерную последовательность, которая нацелена на SEQ ID NO: 473, 474, 475, 476, 477 или 478.
107. Систему связывания последовательности целевой ДНК; указанная система включает:
а) одну или несколько управляющих РНК, способных гибридизоваться с указанной последовательностью целевой ДНК или одну, или несколько нуклеотидных последовательностей, кодирующих одну или несколько управляющих РНК (gPHK), и
б) полипептид РНК-управляемой нуклеазы (RGN), содержащий аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 1, 11, 19, 27, 36, 45 или 54, где одна или несколько управляющих РНК гибридизуются с последовательностью целевой ДНК и где одна или несколько управляющих РНК образуют комплекс с полипептидом RGN, тем самым направляя указанный полипептид RGN на связывание с указанной последовательностью целевой ДНК.
108. Систему по п.107, в которой указанный полипептид RGN имеет мертвую нуклеазу или функционирует как никаза.
109. Систему по п.107 или п.108, в которой указанный полипептид RGN функционально слит с полипептидом, редактирующим основание.
110. Систему по п.109, в которой полипептид, редактирующий основание, представляет собой дезаминазу.
111. Систему по п.110, в которой дезаминаза представляет собой цитидиндезаминазу или аденозиндезаминазу.
Следующие ниже примеры предлагаются в качестве иллюстрации, а не в качестве ограничения.
Экспериментальная часть.
Пример 1. Идентификация РНК-управляемой нуклеазы.
Было идентифицировано семь различных CRISPR-связанных РНК-управляемых нуклеаз (RGN), которые описаны ниже в табл. 1. В табл. 1 представлены названия каждой RGN, ее аминокислотная последовательность, источник, из которого она была получена, а также процессированные последовательности crPHK и tracrPHK. В табл. 1 также представлена общая последовательность единой управляющей РНК (sgPHK), где поли-N указывает расположение спейсерной последовательности, которая определяет последовательность-мишень нуклеиновой кислоты sgPHK. Системы RGN APG систем APG05083.1, APG07433.1, APG08290.1 и APG08290.1 имели консервативную последовательность в основании стержня шпильки tracrPHK, UNANNG (SEQ ID NO: 68). Для системы АР05459.1 последовательность в том же месте - UNANNU (SEQ ID NO: 557). Для систем APG04583.1 и APG01688.1 последовательность представляет собой UNANNA (SEQ ID NO: 558).
- 34 046542
Таблица 1
Сводка SEQ ID и систем, связанных с CRISPR
RGN ID | SEQ ID NO. | Источник | crPHK повтор seq (SEQ ID NO.) | tracrPHK (SEQ ID NO.) | sgPHK (SEQ ID NO) |
APG05083.1 | 1 | Bacillus sp. | 2 | 3 | 10 |
APG07433.1 | И | Bacillus sp. | 12 | 13 | 18 |
APG07513.1 | 19 | Bacillus sp. | 20 | 21 | 26 |
APG08290.1 | 27 | Bacillus sp. | 28 | 29 | 35 |
APG05459.1 | 36 | Enterococcus sp. | 37 | 38 | 44 |
APG04583.1 | 45 | Enterococcus sp. | 46 | 47 | 53 |
APG01688.1 | 54 | Empedobacter sp. | 55 | 56 | 62 |
Пример 2: Идентификация управляющей РНК и конструирование sgPHK.
Культуры бактерий, которые изначально экспрессируют исследуемую систему нуклеаз, управляемую РНК, выращивали до средней логарифмической фазы (OD600~0,600), осаждали и быстро замораживали. РНК выделяли из осадка с использованием набора для выделения miPHK mirVANA (Life Technologies, Карлсбад, Калифорния), и библиотеки секвенирования получали из выделенной РНК с использованием набора для подготовки библиотеки малых NEBNext РНК (NEB, Беверли, Массачусетс). Препарат библиотеки фракционировали на 6%-ном полиакриламидном геле на фракции 2 размеров, соответствующие видам РНК 18-65nt (нуклеотидов) и 90-200nt (нуклеотидов), для обнаружения crPHKs и tracrPHKs, соответственно. Глубокое секвенирование (40 п.о. с парным концом для меньшей фракции и 80 п.о. с парным концом для большей фракции) было выполнено на приборе Next Seq 500 (High Output kit) поставщиком услуг (MoGene, Сент-Луис, Миссури). Чтения были качественно обрезаны с помощью Cutadapt и сопоставлены с эталонными геномами с помощью Bowtie2. Пользовательская программа PHKseq была написан на языке python для обнаружения транскриптов crPHK и tracrPHK. Границы обработанной crPHK определяли по охвату последовательностей массива спейсеров нативных повторов. Антиповторную часть tracrPHK идентифицировали с использованием разрешающих параметров BLASTn. Глубина секвенирования РНК подтвердила границы обработанной tracrPHK путем идентификации транскрипта, содержащего антиповтор. Ручная настройка РНК была выполнена с использованием предсказания вторичной структуры NUPACK, программного обеспечения для сворачивания РНК. Кассеты sgPHK получали путем синтеза ДНК и обычно конструировали следующим образом (5А3'): спейсерная последовательность 20-30 п.о. - обработанная повторяющаяся часть crPHK - некомплементарный линкер 4 п.о. (AAAG; SEQ ID NO: 63) - процессированная tracrPHK. Также можно использовать другие некомплементарные линкеры длиной 4 п.о., например GAAA (SEQ ID NO: 64) или ACUU (SEQ ID NO: 65). В некоторых случаях может использоваться нуклеотидный линкер длиной 6 п.о., например CAAAGG (SEQ ID NO: 66). Для анализов in vitro sgPHK синтезировали транскрипцией in vitro кассеты sgPHK с помощью набора GeneArt™ Precision gPHK Synthesis Kit (ThermoFisher). Обработанные последовательности crPHK и tracrPHK для каждого из полипептидов RGN идентифицированы и представлены в табл. 1. См. ниже sgPHKs, сконструированные для PAM библиотек 1 и 2.
Пример 3: Определение требований PAM для каждой RGN.
Требования PAM для каждого RGN определяли с использованием анализа истощения PAM, по существу адаптированного из Kleinstiver и др. (2015) Nature 523: cc. 481-485 и Zetsche и др. (2015) Cell 163: cc. 759-771. Вкратце, в основной цепи pUC18 (ampR) были созданы две библиотеки плазмид (L1 и L2), каждая из которых содержала отдельную последовательность протоспейсера (мишень) размером 30 п.о., фланкированную 8 случайными нуклеотидами (т.е. область РАМ). Целевая последовательность и фланкирующая область PAM библиотеки 1 и библиотеки 2 для каждой RGN представлены в табл. 2.
Библиотеки были отдельно электропорированы в клетки Е. coli BL21 (DE3), несущие векторы экспрессии pRSF-1b, содержащие RGN, предлагаемую в данном изобретении (кодоны оптимизированы для Е. coli) вместе с родственной sgPHK, содержащей спейсерную последовательность, соответствующую протоспейсеру в L1 или L2. Достаточное количество библиотечной плазмиды использовали в реакции трансформации для получения >106 КОЕ. Как RGN, так и sgPHK в скелете pRSF-1b находились под контролем промоторов Т7. Реакционной смеси давали возможность восстановиться в течение 1 ч, после чего ее разбавляли средой LB, содержащей карбенициллин и канамицин, и выращивали в течение ночи. На следующий день смесь разводили в самоиндуцирующейся среде Overnight Express™ Instant ТВ (Millipore Sigma), чтобы обеспечить экспрессию RGN и sgPHK, и выращивали в течение дополнительных 4 или 20 ч, после чего клетки раскручивали и выделяли плазмидную ДНК с помощью набора Mini-prep (Qiagen, Джермантаун, Мэриленд). В присутствии соответствующей sgPHK плазмиды, содержащие PAM, которая распознается RGN, будут расщепляться, что приведет к их удалению из популяции. Плазмиды, содержащие PAM, которые не распознаются RGN или которые трансформируются в бактерии, не содержащие
- 35 046542 подходящей sgPHK, будут выживать и реплицироваться. Области PAM и протоспейсеров нерасщепленных плазмид были амплифицированы с помощью ПЦР и подготовлены для секвенирования в соответствии с опубликованными протоколами (руководство по подготовке 16s-метагеномной библиотеки 15044223В, Illumina, Сан Диего, Калифорния). Глубокое секвенирование (чтение с одного конца 80 пар оснований) было выполнено на MiSeq (Illumina) поставщиком услуг (MoGene, Сент-Луис, Миссури). Как правило, на ампликон получали 1-4 млн считываний. Области PAM были извлечены, подсчитаны и нормализованы к общему количеству считываний для каждого образца. PAM, которые приводят к расщеплению плазмиды, были идентифицированы по тому, что они недостаточно представлены по сравнению с контролями (т.е. когда библиотека трансформируется в Е. coli, содержащую RGN, но не имеющую подходящей sgPHK). Чтобы представить требования PAM для нового RGN, коэффициенты истощения (частота в выборке/частота в контроле) для всех последовательностей в рассматриваемой области были преобразованы в значения обогащения с преобразованием -log по основанию 2. Достаточные PAM были определены, как PAM со значениями обогащения >2,3 (что соответствует коэффициентам истощения <~0,2). PAM, превышающие этот порог, в обеих библиотеках были собраны и использованы для создания веб-логотипов, которые, например, могут быть созданы с помощью веб-службы в Интернете, известной как weblogo. Последовательности PAM были идентифицированы и запротоколированы, когда имелась согласованная картина у основных обогащенных РАМ. PAM (имеющая коэффициент обогащения (EF)>2,3) для каждой RGN представлен в табл. 2. Для некоторых RGN также были идентифицированы неограничивающие примерные PAM (имеющие EF>3,3). Для APG005083.1 примерная PAM представляет собой NNRNCC (SEQ ID NO: 69). Для APG007433.1 примерная PAM представляет собой NNNNCCR (SEQ ID NO: 70). Для APG007513.1 примерная PAM представляет собой NNRNCC (SEQ ID NO: 71). Для APG001688.1 примерная PAM представляет собой NNRANC (SEQ ID NO: 72).
Таблица 2
Определение РАМ
RGN ID | sgPHK LI (SEQ ID NO.) | sgPHK L2 (SEQ ID NO.) | PAM (SEQ ID NO.) | Целевая последовательность и область РАМ библиотеки плазмид 1 (SEQ ID NO.) | Целевая последовательность и область РАМ библиотеки плазмид 2 (SEQ ID NO.) |
APG05083.1 | 4 | 5 | 6 | 8 | 9 |
APG07433.1 | 13 | 14 | 6 | 16 | 17 |
APG07513.1 | 21 | 22 | 6 | 24 | 25 |
APG08290.1 | 29 | 30 | 32 | 33 | 34 |
APG05459.1 | 37 | 38 | 41 | 42 | 43 |
APG04583.1 | 45 | 46 | 50 | 51 | 52 |
APG01688.1 | 53 | 54 | 59 | 60 | 61 |
Пример 4. Определение расщепления.
Сайты расщепления определяли по реакциям расщепления in vitro с использованием RNP (рибонуклеопротеинов). Плазмиды экспрессии, содержащие RGN, слитую с меткой His6 или His10, были сконструированы и трансформированы в штаммы BL21 (DE3) E. coli. Экспрессию проводили с использованием самоиндуцирующей среды или среды с индукцией IPTG. После лизиса и осветления белки очищали аффинной хроматографией с иммобилизованным металлом.
Рибонуклеопротеиновые комплексы (содержащие нуклеазу и sgPHK или дуплекс crPHK и tracrPHK) были сформированы путем инкубации нуклеазы и РНК в буферном растворе в течение 20 мин при комнатной температуре. Комплекс переносили в пробирку, содержащую буфер для расщепления и амплифицированную мишень ПЦР, называемую Последовательность 1. Последовательность 1 включает нуклеотидную последовательность (SEQ ID NO: 73), непосредственно связанную своим 3'-концом с соответствующей последовательностью PAM для каждой RGN. Каждую RGN в виде рибонуклеопротеидного комплекса инкубировали с ее соответствующим целевым полинуклеотидом при 25°С (APG04583.1) или 37°С (все остальные) в течение 30 или 60 мин (только для APG05459.1 и APG01688.1). Реакцию расщепления инактивировали нагреванием и проводили на агарозном геле. Полосы продукта расщепления вырезали из геля и секвенировали с использованием секвенирования по Сэнгеру. Сайты расщепления идентифицировали путем сопоставления результатов секвенирования с ожидаемой последовательностью продукта ПЦР. Результаты показаны в табл. 3. Как показано в табл. 3, RGN APG007433.1 также может давать тупой разрез с другой целевой последовательностью.
Сайт расщепления для последовательности 2 (SEQ ID NO: 559, функционально слитый на своем 3'конце с последовательностью PAM для RGN APG0733.1) определяли с помощью следующего подхода для нуклеазы APG07433.1. После расщепления очищенные в геле продукты ДНК обрабатывали набором для восстановления концов ДНК (Thermo Scientific K0771), лигировали в линеаризованный вектор с тупыми концами, и полученную кольцевую ДНК трансформировали в компетентные клетки E. coli. Сту
- 36 046542 пенчатый разрез с выступом 5' может привести к обнаружению перекрывающихся последовательностей в клонах от обоих продуктов расщепления. 3' выступ приведет к отсутствию последовательности, а тупой разрез приведет к обнаружению всей исходной последовательности без перекрытия. Этот эксперимент также подтвердил результаты описанного выше метода для последовательности 1 - большинство клонов были обнаружены, как происходящие из разреза с 5' перекрытием, поэтому не считается, что обнаружение тупого разреза является артефактом при использовании этого способа.
Таблица 3
Сайты расщепления RGN
Последовательность 1 | Последовательность 2 | |||||
Расстояние от РАМ | Выступ | Расстояние от РАМ | Выступ | |||
Нуклеаза | NTS вырезанный сайт | TS вырезанный сайт | NTS вырезанный сайт | TS вырезанный сайт | ||
APG07433.1 | 4 | 3 | 1 nt, 5’ | 3 | 3 | Нет |
APG08290.1 | 4 | 3 | 1 nt, 5’ | Не определено | ||
APG05459.1 | 3 | 3 | None | Не определено | ||
APG04583.1 | 3 | 3 | None | Не определено | ||
APG01688.1 | 3 | 3 | None | Не определено |
NTS=нецелевая нить;
TS=целевая нить.
Пример 5. Анализ чувствительности к несоответствию.
Плазмиды были сконструированы и получены с последовательностью-мишенью (SEQ ID NO: 73), находящейся сразу за 5'-концом от подходящего мотива PAM для оцениваемой нуклеазы. Также были созданы одиночные несовпадающие последовательности с измененной последовательностью в указанном положении (табл. 4). Комплексы РНП очищенной нуклеазы (APG08290.1 или APG05459.1) и управляющей РНК были сформированы и инкубированы с ПЦР-амплифицированной линейной ДНК из сконструированных плазмид. После инкубации в течение определенного периода времени и инактивации нуклеазами, образцы анализировали электрофорезом в агарозном геле для определения оставшейся фракции линейного продукта ПЦР. Процент отщепленной интактной полосы показан в табл. 5 для несоответствий в каждом положении.
Таблица 4
Последовательности, протестированные для анализа чувствительности к несоответствию для
APG08290.1 и APG05459.1
Последовательность протоспейсера | SEQ ID NO. | Несоответствие |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 73 | Нет |
GAGCGGACAGCAGCTTCCTATATCTCGTAG | 74 | 1 |
GAGCGGACAGCAGCTTCCTATATCTCGTTC | 75 | 2 |
GAGCGGACAGCAGCTTCCTATATCTCGAAC | 76 | 3 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 77 | 4 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 78 | 5 |
GAGCGGACAGCAGCTTCCTATATCACGTAC | 79 | 6 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 80 | 7 |
GAGCGGACAGCAGCTTCCTATAACTCGTAC | 81 | 8 |
GAGCGGACAGCAGCTTCCTATTTCTCGTAC | 82 | 9 |
GAGCGGACAGCAGCTTCCTAAATCTCGTAC | 83 | 10 |
GAGCGGACAGCAGCTTCCTTTATCTCGTAC | 84 | 11 |
GAGCGGACAGCAGCTTCCAATATCTCGTAC | 85 | 12 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 86 | 13 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 87 | 14 |
GAGCGGACAGCAGCTACCTATATCTCGTAC | 88 | 15 |
GAGCGGACAGCAGCATCCTATATCTCGTAC | 89 | 16 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 90 | 17 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 91 | 18 |
GAGCGGACAGCTGCTTCCTATATCTCGTAC | 92 | 19 |
GAGCGGACAGGAGCTTCCTATATCTCGTAC | 93 | 20 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 94 | 21 |
GAGCGGACTGCAGCTTCCTATATCTCGTAC | 95 | 22 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 96 | 23 |
GAGCGGTCAGCAGCTTCCTATATCTCGTAC | 97 | 24 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 98 | 25 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 99 | 26 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 100 | 27 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 101 | 28 |
GTGCGGACAGCAGCTTCCTATATCTCGTAC | 102 | 29 |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 103 | 30 |
- 37 046542
Таблица 5
Чувствительность к несоответствию для RGN APG08290.1 и RGN APG05459.1
Положение несоответствия | % расщепления | |
APG08290.1 | APG05459.1 | |
Несовместимая РАМ, несоответствия нет | 0 | 0 |
95 | 67 | |
1 | 0 | 0 |
2 | 0 | 74 |
3 | 73 | 3 |
4 | 0 | 0 |
5 | 0 | 0 |
6 | 31 | 30 |
7 | 0 | 12 |
8 9 10 И 12 13 14 15 16 17 18 19 20 21 22 23 | 0 0 75 77 79 28 8 90 85 81 100 100 100 100 100 100 | 51 0 52 5 62 18 5 6 5 4 0 0 2 30 48 40 |
24 | 100 | 45 |
25 | 100 | 29 |
26 | 100 | 33 |
27 | 100 | 73 |
28 | 100 | 46 |
29 | 100 | 59 |
30 | 100 | 57 |
Аналогичный эксперимент по чувствительности к несоответствию был проведен для RGN APG07433.1. Этот эксперимент был аналогичен описанному выше, за исключением того, что альтернативное основание было введено в управляющую РНК, а не в целевую ДНК. Последовательности ДНК для синтеза несовпадающей sgPHK показаны в табл. 6. Результаты анализа чувствительности к несоответствию показаны в табл. 7.
Таблица 6
Последовательности, протестированные для анализа чувствительности к несоответствию для RGN APG07433.1
ДНК-матрица для синтеза sgPHK | SEQ ID NO. | Положение несоответствия |
GAGCGGACAGCAGCTTCCTATATCTCGTAC | 73 | Нет |
GAGCGGACAGCAGCTTCCTATATCTCGTAT | 104 | 1 |
GAGCGGACAGCAGCTTCCTATATCTCGTGC | 105 | 2 |
GAGCGGACAGCAGCTTCCTATATCTCGCAC | 106 | 3 |
GAGCGGACAGCAGCTTCCTATATCTCATAC | 107 | 4 |
GAGCGGACAGCAGCTTCCTATATCTTGTAC | 108 | 5 |
GAGCGGACAGCAGCTTCCTATATCCCGTAC | 109 | 6 |
- 38 046542
GAGCGGACAGCAGCTTCCTATATTTCGTAC | ПО | 7 |
GAGCGGACAGCAGCTTCCTATACCTCGTAC | 111 | 8 |
GAGCGGACAGCAGCTTCCTATGTCTCGTAC | 112 | 9 |
GAGCGGACAGCAGCTTCCTACATCTCGTAC | 113 | 10 |
GAGCGGACAGCAGCTTCCTGTATCTCGTAC | 114 | 11 |
GAGCGGACAGCAGCTTCCCATATCTCGTAC | 115 | 12 |
GAGCGGACAGCAGCTTCTTATATCTCGTAC | 116 | 13 |
GAGCGGACAGCAGCTTTCTATATCTCGTAC | 117 | 14 |
GAGCGGACAGCAGCTCCCTATATCTCGTAC | 118 | 15 |
GAGCGGACAGCAGCCTCCTATATCTCGTAC | 119 | 16 |
GAGCGGACAGCAGTTTCCTATATCTCGTAC | 120 | 17 |
GAGCGGACAGCAACTTCCTATATCTCGTAC | 121 | 18 |
GAGCGGACAGCGGCTTCCTATATCTCGTAC | 122 | 19 |
GAGCGGACAGTAGCTTCCTATATCTCGTAC | 123 | 20 |
GAGCGGACAACAGCTTCCTATATCTCGTAC | 124 | 21 |
GAGCGGACGGCAGCTTCCTATATCTCGTAC | 125 | 22 |
GAGCGGATAGCAGCTTCCTATATCTCGTAC | 126 | 23 |
Таблица 7
Чувствительность к несоответствию для RGN APG07433.1
Положение несоответствия | % расщепления |
APG07433.1 | |
Нет несоответствия | 86 |
1 | 6 |
2 | 21 |
3 | -2 |
4 | 1 |
5 | -1 |
6 | 0 |
7 | 7 |
8 | 24 |
9 | 14 |
10 | -1 |
И | 72 |
12 | 44 |
13 | 54 |
14 | 60 |
16 | 65 |
17 | 76 |
18 | 84 |
19 | 86 |
20 | 83 |
21 | 83 |
22 | 93 |
23 | 80 |
RGN APG07433.1 и APG08290.1 проявляют значительную чувствительность к несоответствию в положениях 1-10 5' от PAM за некоторыми исключениями (табл. 5 и табл. 7). RGN APG05459.1 также чувствительна к несоответствиям в этой области, но ее способность расщеплять днДНК также в значительной степени отменяется из-за несоответствий, удаленных от сайта PAM (табл. 5). Общее количество сайтов со значительным влиянием на то, происходит ли расщепление, составляет по меньшей мере 15 положений в спейсерной последовательности. Это выгодно отличается от других инструментов редактирования генома, таких как хорошо изученная нуклеаза Cas9 из S. pyogenes, которая обычно чувствительна к 10-13 п.о. (Hsu и др., Nat Biotechnol (2013) № 31 (9): cc. 827-832). Кроме того, многие из критических сайтов, отменяющих опосредованное RGN APG05459.1 расщепление, очень далеки от последовательности PAM, особенно в диапазоне 13-20 п.о., где многие другие нуклеазы проявляют небольшую чувствительность к ошибочным спариваниям. Это свойство может быть чрезвычайно полезным для нацеливания на генетические локусы, которые имеют близкое сходство последовательностей с другими сайтами в интересующем организме.
- 39 046542
Пример 6: Демонстрация активности редактирования генов в клетках млекопитающих.
Кассеты экспрессии RGN были получены и введены в векторы для экспрессии млекопитающих. Каждая RGN была оптимизирована по кодонам для экспрессии в человеке (SEQ ID NO: 127-133) и функционально слита на 5'-конце с последовательностью ядерной локализации SV40 (NLS; SEQ ID NO 134) и с тегами 3xFLAG (SEQ ID NO: 135) и функционально слита на 3'-конце с последовательностями NLS нуклеоплазмина (SEQ ID NO: 136). Каждая кассета экспрессии находилась под контролем промотора цитомегаловируса (CMV) (SEQ ID NO: 137). В данной области техники известно, что энхансер транскрипции CMV (SEQ ID NO: 138) также может быть включен в конструкции, содержащие промотор CMV. Были получены конструкции экспрессии управляющей РНК, кодирующие одиночную gPHK, каждая под контролем промотора U6 человеческой РНК-полимеразы III (SEQ ID NO. 139), которые были введены в вектор pTwist High Copy Amp. Последовательности целевых последовательностей для каждой ориентации приведены в табл. 9.
Описанные выше конструкции вводили в клетки млекопитающих. За день до трансфекции 1x105 клеток НЕК293Т/лунку (Sigma) высевали в 24-луночные чашки в среде Игла, модифицированной Дульбекко (DMEM) плюс 10% (по объему) фетальной телячьей сыворотки (Gibco) и 1% пенициллинстрептомицин (Gibco). На следующий день, когда конфлюэнтность клеток составляла 50-60%, 500 нг плазмиды экспрессии RGN плюс 500 нг плазмиды экспрессии одиночной gPHK были котрансфицированы с использованием 1,5 мкл липофектамина 3000 (Thermo Scientific) на лунку в соответствии с инструкциями производителя. После 48 ч выращивания общую геномную ДНК собирали с использованием набора для выделения геномной ДНК (Machery-Nagel) в соответствии с инструкциями производителя.
Затем анализировали общую геномную ДНК, чтобы определить скорость редактирования для каждой RGN для каждой целевой геномной. Сначала были получены олигонуклеотиды для использования в ПЦР-амплификации и последующего анализа амплифицированного целевого сайта генома. Используемые олигонуклеотидные последовательности перечислены в табл. 8.1-8.5.
Все реакции ПЦР проводили с использованием 10 мкл ДНК-полимеразы 2Х Master Mix Phusion High-Fidelity (Thermo Scientific) в 20 мкл реакционной смеси, включая 0,5 мкМ каждого праймера. Большие области генома, охватывающие каждый целевой ген, сначала амплифицировали с использованием праймеров PCR # 1, используя программу: 98°С, 1 мин; 30 циклов [98°С, 10 с; 62°С, 15 с; 72°С, 5 мин]; 72°С, 5 мин; 12°С, постоянно. Затем один микролитр этой реакции ПЦР был дополнительно амплифицирован с использованием праймеров, специфичных для каждой ориентации а (праймеры ПЦР №2), с использованием программы: 98°С, 1 мин; 35 циклов [98°С, 10 с; 67°С, 15 с; 72°С, 30 с]; 72°С, 5 мин; 12°С, постоянно. Праймеры для ПЦР №2 включают выступающие последовательности транспозазного адаптера Nextera Read 1 и Read 2 для секвенирования Illumina.
Таблица 8.1 Олигонуклеотиды для определения активности редактирования генов в клетках млекопитающих, ПЦР №1
Описание | Последовательность | SEQ ID NO |
RelA FWD | 5'-CTT AGT TTC ACC GCA GGT TCT A-3' | 479 |
RelA REV | 5'-CTG TGC ACT CAA CAC TGA TCT A-3' | 480 |
AurkB FWD | 5'-CCC AGC CCT AGG TTG TTT ATT-3' | 481 |
AurkB REV | 5'-CTG GCT АСА TCT TCC TTG ACT AC-3' | 482 |
HPRT1 FWD | 5'-GTG GCA GAA GCA GTG AGT AA-3' | 483 |
HPRT1 REV | 5'-TCC CAT СТА GGC ACT AGG TAA A-3' | 484 |
- 40 046542
Таблица 8.2
Олигонуклеотиды для обнаружения активности редактирования генов в клетках млекопитающих, ПЦР ________№ 2 для APG05083.1, APG07433.1. APG07513.1 и APG08290.1________
Описание | SEQ ID NO. |
FWD_yправление 134, Управление 135, Управление 136, Управление 137 | 485 |
REV_yправление 134, Управление 135, Управление 136, Управление 137 | 486 |
FWD_yправление 138, Управление 139, Управление 140, Управление 141 | 487 |
REV_yправление 138, Управление 139, Управление 140, Управление 141 | 488 |
REV_yправление 142, Управление 143, Управление 144, Управление 145 | 489 |
FWD_yправление 142, Управление 143, Управление 144, Управление 145 | 490 |
REV_yправление 164, Управление 165, Управление 166, Управление 167 | 491 |
FWD_yправление 164, Управление 165, Управление 166, Управление 167 | 492 |
REV_yправление 168, Управление 169, Управление 170, Управление 171 | 493 |
FWD_yправление 168, Управление 169, Управление 170, Управление 171 | 494 |
REV_yправление 172, Управление 173, Управление 174, Управление 175 | 495 |
FWD_yправление 172, Управление 173, Управление 174, Управление 175 | 496 |
REV_yправление 185, Управление 186, Управление 187, Управление 188 | 497 |
FWD_yправление 185, Управление 186, Управление 187, Управление 188 | 498 |
REV_yправление 189, Управление 190, Управление 191, Управление 192 | 499 |
FWD_yправление 189, Управление 190, Управление 191, Управление 192 | 500 |
REV_yправление 193, Управление 194, Управление 195, Управление 196 | 501 |
FWD_yправление 193, Управление 194, Управление 195, Управление 196 | 502 |
Таблица 8.3
Олигонуклеотиды для обнаружения активности редактирования генов в клетках млекопитающих, ПЦР _______№2 для APG005459.1_______
Описание | SEQ ID NO. |
FWD_V правление 146 | 503 |
REV_y правление 146 | 504 |
FWD_y правление 147 | 505 |
REV_y правление 147 | 506 |
REV_y правление 148 | 507 |
FWD_y правление 148 | 508 |
REV_y правление 176 | 509 |
FWD_y правление 176 | 510 |
REV_y правление 177 | 511 |
FWD_y правление 177 | 512 |
REV_yправление 209 | 513 |
FWD_yправление 209 | 514 |
REV_y правление 197 | 515 |
FWD_y правление 197 | 516 |
REV_y правление 198 | 517 |
FWD_y правление 198 | 518 |
REV_y правление 199 | 519 |
FWD_y правление 199 | 520 |
- 41 046542
Таблица 8.3
Олигонуклеотиды для обнаружения активности редактирования генов в клетках млекопитающих, ПЦР _________№2 для APG005459.1_________
Описание | SEQ ID NO. |
FWDYnpaBneHne 146 | 503 |
КЕУУправление 146 | 504 |
Р\¥П_Управление 147 | 505 |
КЕУУправление 147 | 506 |
КЕУУправление 148 | 507 |
Е\¥Т)_Управление 148 | 508 |
КЕУУправление 176 | 509 |
Е\¥Т)_Управление 176 | 510 |
КЕУУправление 177 | 511 |
Е\¥Т)_Управление 177 | 512 |
КЕУУправление 209 | 513 |
Е\¥Т)_Управление 209 | 514 |
КЕУУправление 197 | 515 |
Е\¥Т)_Управление 197 | 516 |
КЕУУправление 198 | 517 |
Е\¥Т)_Управление 198 | 518 |
КЕУУправление 199 | 519 |
FWDYnpaBneHHe 199 | 520 |
Таблица 8.4
Олигонуклеотиды для обнаружения активности редактирования генов в клетках млекопитающих, ПЦР №2 для APG004583.1
Описание | SEQ ID NO. |
ЕХУПУправление 149 | 521 |
КЕУ_Управление 149 | 522 |
Е\¥П_Управление 150 | 523 |
КЕУ_Управление 150 | 524 |
КЕУ_Управление 151 | 525 |
Е\¥П_Управление 151 | 526 |
КЕУ_Управление 179 | 527 |
FWDYnpaBneHHe 179 | 528 |
КЕУУправление 180 | 529 |
Е\¥П_Управление 180 | 530 |
КЕУУправление 181 | 531 |
Е\¥П_Управление 181 | 532 |
КЕУ_Управление 200 | 533 |
Е\¥П_Управление 200 | 534 |
КЕУ_Управление 201 | 535 |
Е\¥П_Управление 201 | 536 |
КЕУ_Управление 202 | 537 |
Е\¥П_Управление 202 | 538 |
- 42 046542
Таблица 8.5
Олигонуклеотиды для обнаружения активности редактирования генов в клетках млекопитающих. ПЦР №2 для APG01988.1
Описание | SEQ ID NO. |
Р\¥Т)_Управление 152 | 539 |
REV_Уπpaвлeниe 152 | 540 |
Е\¥Е)_Управление 153 | 541 |
ЕЕУУправление 153 | 542 |
Е\¥Е)_Управление 154 | 543 |
ЕЕУУправление 154 | 544 |
Е\¥Е)_Управление 182 | 545 |
ЕЕУУправление 182 | 546 |
Е\¥Е)_Управление 183 | 547 |
ЕЕУУправление 183 | 548 |
Е\¥Е)_Управление 184 | 549 |
REV_ynpaBneHne 184 | 550 |
Е\¥Е)_Управление 203 | 551 |
ЕЕУУправление 203 | 552 |
Е\¥Е)_Управление 204 | 553 |
REV_Уπpaвлeниe 204 | 554 |
Е\УЕ)_Управление 205 | 555 |
ЕЕУ_Управление 205 | 556 |
Очищенную геномную ДНК подвергали ПЦР № 1 и ПЦР № 2, как указано выше. После второй амплификации ПЦР ДНК очищали с использованием набора для очистки ПЦР (Zymo) в соответствии с инструкциями производителя и элюировали водой. 200-500 нг очищенного продукта ПЦР №2 объединяли с 2 мкл 10х буфера NEB 2 и водой в 20 мкл реакции и отжигали с образованием гетеродуплексной ДНК с использованием программы: 95°С, 5 мин; 95-85°С, охлаждение со скоростью 2°С/с; 85-25°С, охлаждение со скоростью 0,1°С/с; 12°С, постоянно. После отжига 5 мкл ДНК удаляли в качестве контроля без фермента, добавляли 1 мкл эндонуклеазы I T7 (NEB) и реакционную смесь инкубировали при 37°С в течение 1 ч. После инкубации добавляли загрузочный краситель 5х FlashGel (Lonza) и по 5 мкл каждой реакции и контроли анализировали с помощью 2,2% агарозного FlashGel (Lonza) с использованием гельэлектрофореза. После визуализации геля процент негомологичных концевых соединений (NHEJ) определяли с использованием следующего уравнения: % событий NHEJ=100х[1-(1-расщепленная фракция)л(1/2)], где (расщепленная фракция) определяется как: (плотность расщепленных продуктов)/(плотность расщепленных продуктов+нерасщепленная родительская полоса).
Для некоторых образцов SURVEYOR® использовался для анализа результатов после экспрессии в клетках млекопитающих. Клетки инкубировали при 37°С в течение 72 ч после трансфекции перед экстракцией геномной ДНК. Геномную ДНК экстрагировали с помощью раствора для экстракции ДНК QuickExtract (Epicenter) в соответствии с протоколом производителя. Г еномную область, фланкирующую сайт-мишень RGN, амплифицировали с помощью ПЦР, и продукты очищали с использованием колонки QiaQuick Spin (Qiagen) в соответствии с протоколом производителя. Всего 200-500 нг очищенных продуктов ПЦР смешивали с 1 мкл 10xTaq ДНК-полимеразного ПЦР-буфера (Enzymatics) и сверхчистой воды до конечного объема 10 мкл и подвергали процессу повторного отжига для образования гетеродуплекса: 95°С в течение 10 мин, от 95°С до 85°С с линейным изменением со скоростью -2°С/с, от 85°С до 25°С со скоростью -0,25°С/с и выдержкой 25°С в течение 1 мин.
После повторного отжига продукты обрабатывали нуклеазой SURVEYOR® и энхансером SURVEYOR® S (Integrated DNA Technologies) в соответствии с протоколом, рекомендованным производителем, и анализировали на 4-20% полиакриламидных гелях Novex TBE (Life Technologies). Гели окрашивали ДНК-красителем SYBR Gold (Life Technologies) в течение 10 мин и отображали с помощью системы визуализации гелей Gel Doc (Bio-rad). Количественная оценка была основана на относительной интенсивности полос. Процент INDEL определяли по формуле: 100х(1-(1-(Ь+е)/(а+Ь+с))л1/2), где a - интегрированная интенсивность нерасщепленного продукта ПЦР, a b и с представляют собой интегрированные интенсивности каждого продукта расщепления.
Кроме того, продукты из ПЦР № 2, содержащие выступающие последовательности Illumina, преобразовали в препарат, представляющий собой библиотеку, с последующим протоколом метагеномного секвенирования библиотеки Illumina 16S. Глубокое секвенирование было выполнено на платформе Illumina Mi-Seq поставщиком услуг (MOGene). Обычно на ампликон генерируется 200 000 из 250 п.о. спаренных концевых считываний (2x100000 считываний). Считывания были проанализированы с помощью
- 43 046542
CRISPResso (Pinello и др., 2016 Nature Biotech, № 34: cc. 695-697) для расчета скорости редактирования. Выходные выравнивания были подобраны вручную для подтверждения сайтов вставки и делеции, а также для идентификации сайтов микрогомологии в сайтах рекомбинации. Скорость редактирования показана в табл. 9. Все эксперименты проводились на клетках человека. Целевая последовательность - это целевая последовательность в пределах целевого гена. Для каждой целевой последовательности управляющая РНК включала комплементарную целевую последовательность РНК и соответствующую sgPHK в зависимости от используемой RGN. Выбранная разбивка экспериментов по управляющей РНК показана в табл. 10.1-10.9.
Таблица 9
Общие показатели редактирования
RGN | Управление РНК ID | Последовательностьмишень (SEQ ID NO.) | Генмишень | Общая скорость редактирования в образце | Скорость делеции в образце | Скорость вставки в образце |
APG05083.1 | 189 | 140 | RelA | 6.9% | 100% | |
APG05083.1 | 185 | 141 | RelA | 8.2% | 79.9% | 20.1% |
APG05083.1 | 168 | 142 | HPRT1 | 11.3% | 36.3% | 72.4% |
APG07433.1 | 135 | 143 | AurkB | 1.7% | 88.3% | 11.7% |
APG07433.1 | 139 | 144 | AurkB | 3.32% | 84.3% | 15.6% |
APG07433.1 | 143 | 145 | AurkB | 2.2% | 35.1% | 64.9% |
APG07433.1 | 190 | 146 | RelA | 60.5% | 94.8% | 5.2% |
APG07433.1 | 194 | 147 | RelA | 6.2% | 100% | |
APG07433.1 | 165 | 148 | HPRT1 | 3.5% | 68.0% | 32.0% |
APG07433.1 | 169 | 149 | HPRT1 | 18.1% | 30.3% | 69.7% |
APG07433.1 | 173 | 150 | HPRT1 | 26.6% | 91.9% | 10.0% |
APG07513.1 | 144 | 151 | AurkB | 2.4% | 59.1% | 40.9% |
APG07513.1 | 136 | 152 | AurkB | 0.9% | 80.5% | 19.5% |
APG08290.1 | 145 | 153 | AurkB | 14.18% | 75.85% | 24.15% |
APG08290.1 | 188 | 154 | RelA | 21.40% | 99.05% | 50.05% |
APG08290.1 | 192 | 155 | RelA | 28.98% | 42.05% | 57.95% |
APG08290.1 | 196 | 156 | RelA | 13.27% | 91.80% | 8.20% |
APG08290.1 | 167 | 157 | HPRT1 | 14.14% | 65.98% | 34.02% |
APG08290.1 | 171 | 158 | HPRT1 | 48.23% | 58.26% | 41.74% |
APG08290.1 | 175 | 159 | HPRT1 | 13.60% | 74.18% | 25.82% |
APG05459.1 | 197 | 160 | RelA | 12.95% | 92.16% | 7.84% |
APG05459.1 | 199 | 161 | RelA | 5.19% | 100% | |
APG05459.1 | 146 | 162 | AurkB | 1.12% | 61.50% | 38.50% |
APG05459.1 | 148 | 163 | AurkB | 0.78% | 49.47% | 50.53% |
APG05459.1 | 176 | 164 | HPRT1 | 6.20% | 48.91% | 51.09% |
APG05459.1 | 177 | 165 | HPRT1 | 9.00% | 9.33% | 90.67% |
APG05459.1 | 209 | 166 | HPRT1 | 2.50% | 100% | |
APG04583.1 | 151 | 167 | AurkB | 0.0% | ||
APG01688.1 | 152 | 168 | AurkB | 0.0% |
Особые вставки и делеции для соответствующих управляющих показаны в табл. 10.1-10.7. В этих таблицах целевая последовательность обозначена жирными заглавными буквами. 8-членные области PAM подчеркнуты двойным подчеркиванием, а основные распознаваемые нуклеотиды выделены жирным шрифтом. Вставки обозначаются строчными буквами. Удаления обозначаются тире (—). Местоположение INDEL вычисляется от проксимального края PAM целевой последовательности, причем край является местоположением 0. Местоположение является положительным (+), если местоположение находится на целевой стороне края; расположение отрицательное (-), если расположение находится на стороне PAM ребра.
- 44 046542
Таблица 10.1
Специальные вставки и делеции для управления 139 с использованием RGN APG07433.1
Управление139 (SEQ ID NO: 144) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
CCTGGGTGTGAGGCTGGGCCATTAAAACCTCTC С | 82540 | 95.562 | ||||
CCTG...................ААААССТСТСС | 170 | 0.199 | 23.16 | Делеция | -6 | 19 |
CCTGGGTGTGA- GCTGGGCCATTААААССТСТСС | 132 | 0.155 | 17.98 | Делеция | +1 | 1 |
С............CTGGGCCATTААААССТСТСС | 107 | 0.125 | 14.57 | Делеция | -9 | 12 |
CCTGG.......................СТСТСС | 101 | 0.118 | 13.76 | Делеция | -5 | 23 |
С......... GGGCCATTAAAACCTCTCC | 61 | 0.071 | 8.31 | Делеция | -9 | 14 |
CCTGGGTGTGAGGccagacCTGGGCCATTAAAAC СТСТСС | 49 | 0.057 | 6.67 | Вставка | +3 | 6 |
CCTGGGTGTGAGgggaagctgacgtcctttccatggctgctc gc ctgtgttgccaccGCTGGGCCATTAAAACCTCTCC | 44 | 0.051 | 5.99 | Вставка | +2 | 45 |
CCTGGGTGTGA-cCTGGGCCATT ААААССТСТСС | 39 | 0.045 | 5.31 | Делеция & Мутация | +1 | 1 |
CCTGGGTGTGAGGaCTGGGCCATTAAAACCTCT CC | 31 | 0.036 | 4.22 | Вставка | +3 | 1 |
Таблица 10.2
Особые вставки и делеции для управления 143 с использованием RGN APG07433.1
Управление 143 (SEQ ID NO: 145) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
AGTTGGCAGATGCTCTAATGTACTGCCATGGG АА | 84043 | 99.646 | ||||
AGTTGGCAGATGC— AATGTACTGCCATGGGAA | 126 | 0.149 | 42.281 | Делеция | +3 | 3 |
AGTTGGCAGATGC—-ATGTACTGCCATGGGAA | 81 | 0.096 | 27.181 | Делеция | +3 | 4 |
AGTTGGCAGATGCT—ATGTACTGCCATGGGAA | 42 | 0.049 | 14.093 | Делеция | +4 | 3 |
AGTTGGCAGATGC- TAATGTACTGCCATGGGAA | 34 | 0.040 | 11.409 | Делеция | +3 | 2 |
AGTTGGCAGATGCT—ATGTAaTGCCATGGGAA | 8 | 0.009 | 2.684 | Делеция & Мутация | +4 | 3 |
AGTTGGCAGATGCTCT- ATGTACTGCCATGGGAA | 7 | 0.008 | 2.348 | Делеция | +6 | 1 |
Таблица 10.3
Особые вставки и делеции для управления 190 с использованием RGN APG07433.1
Управление 190 (SEQ ID NO: 146) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
CGACCTGAATGCTGTGC............................... | 64040 | 55.46 | 91.70 | Делеция | -164 | 170 |
...........GGCGCTCTGGCTTCATTCAATC | ||||||
CGACCTGAATGCTGTGCGGCTCTGCTTCCAGGT GA | 45619 | 39.51 | WT | |||
CGACCTGAATGCTGTGCGGCaTCTGCTTCCAGGT GA | 3620 | 3.13 | 5.18 | Insertion | +3 | 1 |
CGACCTGAATG..........CTGCTTCCAGGTGA | 1110 | 0.96 | 1.58 | Делеция | +2 | 10 |
CGACCTGAATGCT.......TCTGCTTCCAGGTGA | 858 | 0.74 | 1.22 | Делеция | +3 | 7 |
CGACCTGAA.............TGCTTCCAGGTGA | 206 | 0.17 | 0.29 | Делеция | + 1 | 13 |
- 45 046542
Таблица 10.4
Особые вставки и делеции для управления 194 с использованием RGN APG07433.1
Управление 194 (SEQ ID NO: 147) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
GCGTGGGGACTACGACCTGAATGCTGTGCGGCTC Т | 96635 | 97.318 | ||||
GCG—........ACCTGAATGCTGTGCGGCTCT | 1194 | 1.202 | 44.836 | Делеция | -9 | 11 |
GCGTGGGGACTACGA.......GCTGTGCGGCTCT | 547 | 0.550 | 20.540 | Деления | +3 | 7 |
GCGTGGGGA.......CTGAATGCTGTGCGGCTCT | 473 | 0.476 | 17.761 | Деления | -3 | 7 |
GCGTGGGGACT-—CCTGAATGCTGTGCGGCTCT | 270 | 0.271 | 10.138 | Деления | -1 | 4 |
GCGTGGGGACTACGAaCCTGAaTGCTGTGCGGCTC T | 88 | 0.088 | 3.304 | Вставка | +3 | 1 |
GCGTGGGGACTACGA.....ATGCTGTGCGGCTCT | 41 | 0.041 | 1.539 | Деления | +3 | 5 |
GCGTGGGGACTAC—CTGAATGCTGTGCGGCTCT | 31 | 0.031 | 1.164 | Деления | +2 | 3 |
GCG—...........TGAATGCTGTGCGGCTCT | 9 | 0.009 | 0.337 | Деления | -9 | 14 |
GCG—........ACCTGAcTGCTGTGCGGCTCT | 5 | 0.005 | 0.187 | Деления & Мутация | -9 | 11 |
GCGTGGGGACTACG-CCTGAATGCTGTGCGGCTCT | 5 | 0.005 | 0.187 | Деления | +2 | 1 |
Таблица 10.5
Специальные вставки и делеции для управления 145 с использованием RGN APG08290.1
Управление 145 (SESQ ID NO: 153) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
ATGGAGGAGTTGGCAGATGCTCTAATGTACTGC CATGGGAAG | 62618 | 95.889 | ||||
ATGGAGGAGTTGGCAGATGC— TAATGTACTGCC ATGGGAAG | 976 | 1.494 | 36.363 | Деления | +3 | 2 |
ATGGAGGAGTTGGCAGATG........TACTGC CATGGGAAG | 319 | 0.488 | 11.885 | Деления | +2 | 8 |
ATG.............. TACTGC CATGGGAAG | 168 | 0.257 | 6.259 | Деления | -14 | 24 |
- 46 046542
ATGGAGGAGTTGG-—........TGTACTGC CATGGGAAG | 157 | 0.240 | 5.849 | Делеция | -4 | 12 |
ATGGAGGAGTTGGCAGATGCTCTaAATGTACTG CCATGGGAAG | 147 | 0.225 | 5.476 | Вставка | +6 | 1 |
ATGGAGGAGTTGGCAGATGCtctTCTAATGTAC TGCCATGGGAAG | 123 | 0.188 | 4.582 | Вставка | +2 | 3 |
ATGGAGGAGTTGGCAGATGccCTCTAATGTACT GCCATGGGAAG | 110 | 0.168 | 4.098 | Вставка | +2 | 2 |
ATGGAGGAGTTGGCAGAT.....AATGTACTGC CATGGGAAGAAG | 103 | 0.157 | 3.837 | Делеция | +1 | 5 |
ATGG............. cGTACTGC CATGGGAAGAAG | 96 | 0.147 | 3.57 | Делеция & Мутация | -7 | 21 |
ATGGAGGAGTTGGCAGATGCtTCTAATGTACTG CCATGGGAAGAAG | 85 | 0.130 | 3.166 | Вставка | +3 | 1 |
ATGGAGGAGTTGGCA—...........TCTGC CATGGGAAGAAG | 84 | 0.128 | 3.129 | Делеция | -2 | 13 |
ATGGAGGAGTTGGCAGATGC—AATGTACTGC CATGGGAAGAAG | 79 | 0.120 | 2.943 | Делеция | +3 | 3 |
ATGGAGGAGTTGGCAGATGCcaaactgaaaaac aaatcaaagcactcttattgagtgctggcgatc cccgacgccacgggccgaaacccttatcataga aaCTCTAATGTACTGCCATGGGAAG | 58 | 0.0884 | 2.160 | Вставка | +3 | 81 |
ATGGAGGAGTTGGCAGATGCtgcttatatagac ctcccaccgtacacgcctaccgcccatttTCTA ATGTACTGCCATGGGAAG | 53 | 0.081 | 1.974 | Вставка | +3 | 42 |
ATGGAGGAGTTG........TCTAATGTACTGC CATGGGAAG | 47 | 0.071 | 1.751 | Делеция | -5 | 8 |
......... CTGC CATGGGAAGAAG | 26 | 0.039 | 0.968 | Делеция | ||
ATGGAGGAGTTGGCAGATGCgcggctgttcctg tacagaaccgtgggcgagatgtggatcaaggat gcTCTAATGTACTGCCATGGGAAG | 21 | 0.032 | 0.782 | Вставка | +3 | 48 |
ATGGAGGAGTTGGCAGATGC-CTAATGTACTGC CATGGGAAG | 14 | 0.021 | 0.521 | Делеция | +3 | 1 |
ATGGAGGAGTTGGCAGATGCtgtcatgatcttt ttcc gctcgtc gtgggacttgctc agttctctg gccagctcgTCTAATGTACTGCCATGGGAAG | 10 | 0.015 | 0.372 | Вставка | +3 | 55 |
ATGGAGGAGTTGGCAGATGCTCT-ATGTACTGC CATGGGAAG | 8 | 0.012 | 0.29 | Делеция | +6 | 1 |
Таблица 10.6
Специальные вставки и делеции для управления 188 с использованием RGN APG08290.1
Управление 188 (SEQ ID NO: 154) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
CAGGGACAGTGCGCATCTCCCTGGTCACCAAG | 59686 | 97.000 | ||||
CAGGGACA-..............GTCACCAAG | 1286 | 2.089 | 69.664 | Делеция | 0 | 15 |
CAGGGACAGTGCGCATCTC-CTGGTCACCAAG | 473 | 0.768 | 25.622 | Делеция | +3 | 1 |
CAGGGACAGTGCGCATCT—CTGGTCACCAAG | 57 | 0.092 | 3.087 | Делеция | +3 | 2 |
CAGGGACAGTGCGCATCTCCtCTGGTCACCAAG | 11 | 0.017 | 0.595 | Делеция | +3 | 1 |
CAGGGACAGTGCGCATC—CTGGTCACCAAG | 7 | 0.011 | 0.379 | Делеция | +3 | 3 |
CAGGGAC—............GGTCACCAAG | 7 | 0.011 | 0.379 | Делеция | +2 | 15 |
CGGGGACAGgGCGCATCTC-CTGGTCACCAAG | 5 | 0.008 | 0.270 | Делеция & Мутация | +3 | 1 |
- 47 046542
Таблица 10.7
Специальные вставки и делеции для управления 192 с использованием RGN APG08290.1
Управление 192 (SEQ ID NO: 155) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
CGACCTGAATGCTGTGCGGCTCTGCTTCCAGG | 62352 | 95.658 | ||||
CGACCTGAATGCTGTGCGGCaTCTGCTTCCAGG | 1262 | 1.936 | 44.593 | Вставка | +3 | 1 |
CGACCTGAATGCTGTGCGGCtTCTGCTTCCAGG | 842 | 1.291 | 29.752 | Вставка | +3 | 1 |
CGACCTGAATGCTGTG——TCTGCTTCCAGG | 686 | 1.052 | 24.240 | Делеция | +3 | 4 |
CGACCTGcATGCTGTGCGGCaTCTGCTTCCAGG | 18 | 0.027 | 0.636 | Вставка & Мутация | +3 | 1 |
CGACCTGcATGCTGTGCGGCtTCTGCTTCCAGG | 11 | 0.016 | 0.388 | Вставка & Мутация | +3 | 1 |
CGACCTGcATGCTGTG—-TCTGCTTCCAGG | 6 | 0.009 | 0.212 | Вставка & Мутация | +3 | 4 |
CGACCTGAATGCTGTGCGaCaTCTGCTTCCAGG | 5 | 0.007 | 0.176 | Вставка & Мутация | +3 | 2 |
Таблица 10.8
Конкретные вставки и делеции для управления 196 с использованием RGN APG08290.1_____
Управление 196 (SEQ ID NO: 156) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
TGGGGACTACGACCTGAATGCTGTGCGGCTCT | 37206 | 93.073 | ||||
TGGGGACTACGA.....ATGCTGTGCGGCTCT | 1288 | 3.222 | 46.514 | Деления | +3 | 5 |
TGGGGACIACGAgcaggcagaagtatgcaaagc atgcatctcaattCCTGAATGCTGTGCGGCTCT | 881 | 2.203 | 31.816 | Вставка | +3 | 34 |
TGGGGACIACGAagaaggcgatagaaggccatg cgctgcgaatcgggagcggCCTGAATGCTGTGC GGCTCT | 302 | 0.755 | 10.906 | Вставка | +3 | 40 |
TGGGGACIACGAtgactcgctgcgctcggtcgt tcggctgcggcgagcggtatcagctcactcaaa ggcggtaatacggCCTGAATGCTGTGCGGCTCT | 272 | 0.680 | 9.823 | Вставка | +3 | 67 |
TGGG..................GTGCGGCTCT | 13 | 0.032 | 0.4694 | Деления | -5 | 18 |
TGGGGACTACGAC.....TGCTGTGCGGCTCT | 13 | 0.032 | 0.469 | Деления | +4 | 5 |
Таблица 10.9
Конкретные вставки и делеции для управления 190 с использованием RGN APG07433.1______
Управление 190 (SEQ ID NO: 146) | № Считывания | % Считывания | % INDEL | Тип | Положение INDEL | Размер |
CGACCTGAATGCTGTGC---------------------------- | 64040 | 55.46 | 91.70 | Деления | -164 | 170 |
GGCGCTCTGGCTTCATTCAATC | ||||||
CGACCTGAATGCTGTGCGGCTCTGCTTCCAGG TGA | 45619 | 39.51 | WT | |||
CGACCTGAATGCTGTGCGGCaTCTGCTTCCAG GTGA | 3620 | 3.13 | 5.18 | Вставка | +3 | 1 |
CGACCTGAATG..........CTGCTTCCAGGTGA | 1110 | 0.96 | 1.58 | Деления | +2 | 10 |
CGACCTGAATGCT-------TCTGCTTCCAGGTGA | 858 | 0.74 | 1.22 | Деления | +3 | 7 |
CGACCTGAA-------------TGCTTCCAGGTGA | 206 | 0.17 | 0.29 | Деления | +1 | 13 |
Пример 7: Демонстрация активности редактирования генов в растительных клетках.
РНК-управляемая нуклеазная активность RGN, представленная в данном изобретении, демонстрируется в растительных клетках с использованием протоколов, адаптированных по Li, и др. (2013) Nat. Biotech. № 31: сс. 688-691. Вкратце, оптимизированные версии кодонов растений каждой RGN (SEQ ID NO: 169-182), содержащей N-концевой сигнал ядерной локализации SV40, клонируются за сильным конститутивным промотором 35S в векторе временной трансформации. sgPHK, нацеленные на один или несколько сайтов в гене PDS растения, фланкирующего подходящую последовательность PAM, клонируются за промотором U6 растения во втором векторе временной экспрессии. Экспрессионные векторы
- 48 046542 вводят в протопласты мезофилла Nicotiana benthamiana с использованием ПЭГ-опосредованной трансформации. Трансформированные протопласты инкубируют в темноте до 36 ч. Геномную ДНК выделяют из протопластов с помощью набора DNeasy Plant Mini (Qiagen). Геномную область, фланкирующую сайт-мишень RGN, амплифицируют с помощью ПЦР, и продукты очищают с использованием колонки QiaQuick Spin (Qiagen) в соответствии с протоколом производителя. Всего 200-500 нг очищенных продуктов ПЦР смешивают с 1 мкл 10xTaq ДНК-полимеразного ПЦР-буфера (Enzymatics) и сверхчистой воды до конечного объема 10 мкл и подвергают процессу повторного отжига для образования гетеродуплекса: 95°С в течение 10 мин, от 95°С до 85°С с линейным изменением со скоростью -2°С/с, от 85°С до 25°С со скоростью -0,25°С/с и выдержкой 25°С в течение 1 мин. После повторного отжига продукты обрабатывают нуклеазой SURVEYOR и энхансером SURVEYOR S (Integrated DNA Technologies) в соответствии с протоколом, рекомендованным производителем, и анализируют на 4-20% полиакриламидных гелях Novex TBE (Life Technologies). Гели окрашивают красителем ДНК SYBR Gold (Life Technologies) в течение 10 мин и визуализируют с помощью системы визуализации геля Gel Doc (Bio-rad). Количественная оценка основана на относительной интенсивности полос. Процент Indel определяется по формуле 100x(1-(1-(b+с)/(а+b+с))1/2), где a - интегрированная интенсивность непереваренного продукта ПЦР, a b и с - интегрированные интенсивности каждого продукта расщепления.
Кроме того, продукты ПЦР, полученные из целевой геномной последовательности, могут быть подвергнуты ПЦР, аналогичной описанной в примере 6, так что продукты ПЦР содержат выступающие последовательности Illumina и могут быть преобразованы в библиотеки и подвергнуты глубокому секвенированию. Этот метод позволяет определять скорость редактирования, как показано в табл. 9.
Пример 8: Перекрестная совместимость управления.
Для определения перекрестной совместимости управляющих РНК между RGN был проведен эксперимент по интерференции двух плазмид (Esvelt и др. (2013), Nat. Methods № 10 (11): cc. 1116-21). Первая плазмида содержала RGN с несколькими мишенями, содержащими определенные PAM на скелете устойчивом к канамицину. Эти плазмиды были трансформированы в E.coli BL21, и трансформированные штаммы были сделаны химически компетентными. Затем вводили вторую плазмиду, содержащую управляющую РНК на скелете устойчивости к ампициллину. Клетки высевали на среду, содержащую оба антибиотика. Если RGN может использовать указатель на второй плазмиде, плазмида устойчивости к канамицину расщепляется и линеаризуется, что приводит к небольшому образованию колоний или их отсутствию. Если RGN не может использовать управление на второй плазмиде, плазмида устойчивости к канамицину не расщепляется, что приводит к образованию большому количесву колонии. Управляющие РНК для Streptococcus pyogenes Cas9 (SpyCas9) и Staphylococcus aureus Cas9 (SauCas9) также использовались для определения перекрестной совместимости с этими управляющими РНК.
Для расчета процента истощения, количество колоний для каждой управляющей трансформации сравнивается с эффективностью трансформации с использованием положительного контроля. Основываясь на этом сравнении, если RGN может использовать управляющую, процент истощения должен быть равен О, поскольку никакие колонии не могут выжить. Если RGN не может использовать управляющую, процент истощения должен быть равен 1, поскольку все плазмиды остаются нетронутыми. Результаты показаны в табл. 11 ниже, sg означает управляющую РНК для перечисленных RGN.
Таблица 11
Анализ перекрестной совместимости
APG05083.1 | APG07513.1 | APG08290.1 | APG05459.1 | APG04583.1 | APG01688.1 | |
sgAPG05083.1 | 0 | 0 | 0 | 0.21 | 1 | 0.74 |
sgAPG07433.1 | 0 | 0 | 0 | 0.16 | 0.78 | 0.33 |
sgAPG07513.1 | 0 | 0.01 | 0 | 0.32 | 0.97 | 0.64 |
sgAPG05459.1 | 0.24 | 0.53 | 0.26 | 0.09 | 1 | 0.49 |
sgAPG04583.1 | 0.74 | 0.8 | 0.36 | 0.21 | 0 | 0 |
sgAPG01688.1 | 0.12 | 0.26 | 0.18 | 0.43 | 0 | 0 |
sgSauCas9 | 1 | 0.23 | 0.27 | 0.53 | 0.51 | 0.92 |
sg Spy | 0.16 | 0.27 | 0.32 | 0.06 | 1 | 1 |
Как показано в табл. 11, существует четыре группы ортогональных систем. RGN могут распознавать управляющие из других систем в своих группах, но не могут использовать управляющие из других групп. Первая группа содержит APG05083.1, APG07433.1, APG07513.1 и APG08290.1. Вторая группа - это SpyCas9 и APG05459.1. Третья группа содержит APG04583.1 и APG01688.1. Четвертая группа содержит SauCas9.
Пример 9: Идентификация целевого заболевания.
База данных клинических вариантов была получена из базы данных NCBI ClinVar, которая доступна в Интернете на веб-сайте NCBI ClinVar. Патогенные одиночные нуклеотидные полиморфизмы (SNP)
- 49 046542 были идентифицированы из этого списка. Используя информацию о геномном локусе, были идентифицированы CRISPR мишени в области, перекрывающейся и окружающей каждый SNP. Выбор SNP, которые могут быть скорректированы с использованием базового редактирования в комбинации с RGN в рамках настоящего изобретения для нацеливания на причинную мутацию, приведен в табл. 12. В табл. 12 приведен только одно альтернативное название каждого заболевания. RS # соответствует номеру доступа RS в базе данных SNP на веб-сайте NCBI. AlleleID соответствует регистрационному номеру причинного аллеля, а регистрационный номер хромосомы также предоставляет справочную информацию о доступе, которую можно найти на веб-сайте NCBI. В табл. 12 также представлена информация о последовательности геномных мишеней, подходящая для RGN, перечисленных для каждого заболевания. Информация о целевой последовательности также содержит последовательность протоспейсера для продукции необходимой sgPHK для соответствующей RGN, представленной в данном изобретении.
Таблица 12
Мишени заболевания для RGN, представленные в предложенном изобретении
Заболевание | RS# (dbSNP) | RGN | Причинная мутация | Аллель ID | Присоединение хромосомы | Символ гена | ПоследовательностьMHineHb(SEQ ID NO) |
Синдром атаксиителеангиэктазии | 1137887 | APG04583.1 | G>A | 18083 | NC 000011.10,NC 000011.9 | ATM | 197 |
Дефицит ацил-КоАдегидрогеназы с очень длинной цепью | 2309689 | APG05459.1 | G>A | 33868 | NC 000017.10,NC 000017.11 | ACADVL | 198 |
Нарушение физиологии Тклеток | 3218716 | APG01688.1 | G>A | 52071 | NC 000014.8,NC 000014.9 | MYH7 | 199 |
Сердечно-сосудистый фенотип | 5742905 | APG05083, APG07433.1, APG07513.1, APG08290.1 | Т>С | 15159 | NC 000021.8,NC 000021.9 | CBS | 200 |
Дефицит З-оксо-5-альфастероид-дельта-4дегидрогеназы | 9332964 | APG04583.1 | G>A | 18390 | NC 000002.11,NC 000002.12 | SRD5A2 | 201 |
Острый миелоидный лейкоз | 11540652 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 27395 | NC 000017.10,NC 000017.11 | TP53 | 202 |
Острый миелоидный лейкоз | 11540652 | APG05459.1 | G>A | 27395 | NC 000017.10,NC 000017.11 | TP53 | 203 |
Кожная злокачественная меланома 3 | 11547328 | APG05459.1 | C>T | 31967 | NC 000012.11,NC 000012.12 | CDK4 | 204 |
Дефицит альфа-1антитрипсина | 28929474 | APG05459.1 | G>A | 33006 | NC 000014.8,NC 000014.9 | SERPINA1 | 205 |
Болезнь Шарко-Мари-Тута, тип 2 | 28933093 | APG05459.1 | G>A | 29543 | NC 000001.10,NC 000001.11 | LMNA | 206 |
Наследственный предрасполагающий к раку синдром | 28934578 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 27413 | NC 000017.10,NC 000017.11 | TP53 | 207 |
Наследственный предрасполагающий к раку синдром | 28934578 | APG01688.1 | G>A | 27413 | NC 000017.10,NC 000017.11 | TP53 | 208 |
Наследственный предрасполагающий к раку синдром | 28934872 | APG05459.1 | G>A | 27436 | NC 000016.9,NC 000016.10 | TSC2 | 209 |
Синдром Бругада | 28937316 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 24408 | NC 000003.11,NC 000003.12 | SCN5A | 210 |
Синдром Бругада | 28937318 | APG05459.1 | G>A | 24429 | NC 000003.11,NC 000003.12 | SCN5A | 211 |
ГР АЦИЛЬНЫЙ синдром | 28937590 | APG05459.1 | A>G | 21206 | NC 000002.11,NC 000002.12 | BCS1L | 212 |
Синдром усиленного s-конуса | 28937873 | APG05459.1 | G>A | 20571 | NC 000015.9,NC 000015.10 | NR2E3 | 213 |
Болезнь Шарко-Мари-Тута, тип 2 | 28940293 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 17309 | NC 000001.10,NC 000001.11 | MFN2 | 214 |
Болезнь Шарко-Мари-Тута, тип 2 | 28940293 | APG05459.1 | T>C | 17309 | NC 000001.10,NC 000001.11 | MFN2 | 215 |
Арилсульфатаза а, аллель а | 28940893 | APG05459.1 | C>T | 18091 | NC 000022.10,NC 000022.11 | ARSA | 216 |
Наследственная гиперхолестеринемия | 28942078 | APG05459.1 | G>A | 18733 | NC 000019.9,NC 000019.10 | LDLR | 217 |
Семейная гиперхолестеринемия | 28942079 | APG05459.1 | G>A | 18734 | NC 000019.9,NC 000019.10 | LDLR | 218 |
ПАРК ГЕМОГЛОБИН АРЛИНГТОН | 33930165 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 30165 | NC 000011.9,NC 000011.10 | HBB | 219 |
Семейная гипертрофическая кардиомиопатия 1 | 36211715 | APG05459.1 | G>A | 29159 | NC 000014.8,NC 000014.9 | MYH7 | 220 |
Сердечно-сосудистый фенотип | 36211723 | APG05459.1 | G>A | 45266 | NC 000011.9,NC 000011.10 | MYBPC3 | 221 |
Сердечно-сосудистый фенотип | 36211723 | APG01688.1 | G>A | 45266 | NC 000011.9,NC 000011.10 | MYBPC3 | 222 |
Синдром Бругада | 45546039 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 48043 | NC 000003.11,NC 000003.12 | SCN5A | 223 |
Синдром Бругада | 45546039 | APG01688.1 | G>A | 48043 | NC 000003.11,NC 000003.12 | SCN5A | 224 |
Наследственный предрасполагающий к раку синдром | 55863639 | APG05459.1 | G>A | 176641 | NC 000017.10,NC 000017.11 | TP53 | 225 |
- 50 046542
Дефицит бутирил-КоА дегидрогеназы | 57443665 | APG05459.1 | Т>С | 18867 | NC 000012.11,NC 000012.12 | ACADS | 226 |
Дефицит бутирил-КоА дегидрогеназы | 57443665 | APG01688.1 | Т>С | 18867 | NC 000012.11,NC 000012.12 | ACADS | 227 |
Доброкачественная лопаточноперинеальная мышечная дистрофия с кардиомиопатией | 59332535 | APG05459.1 | G>A | 77828 | NC 000001.10,NC 000001.11 | LMNA | 228 |
Доброкачественная лопаточноперинеальная мышечная дистрофия с кардиомиопатией | 60458016 | APG05459.1 | G>A | 29564 | NC 000001.10,NC 000001.11 | LMNA | 229 |
Конусно-стержневая дистрофия 6 | 61750173 | APG05459.1 | G>A | 24396 | NC 000017.10,NC 000017.11 | GUCY2D | 230 |
Конусно-стержневая дистрофия 6 | 61750173 | APG01688.1 | G>A | 24396 | NC 000017.10,NC 000017.11 | GUCY2D | 231 |
Болезнь Штаргардта 1 | 61750641 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 105317 | NC 000001.10,NC 000001.11 | ABCA4 | 232 |
Врожденный амавроз Лебера 2 | 61751276 | APG05459.1 | G>A | 104715 | NC 000001.10,NC 000001.11 | RPE65 | 233 |
Конусно-стержневая дистрофия 3 | 61751407 | APG05459.1 | G>A | 105292 | NC 000001.10,NC 000001.11 | ABCA4 | 234 |
Несиндромный окулокожный альбинизм | 61754375 | APG05459.1 | G>A | 18835 | NC 000011.9,NC 000011.10 | TYR | 235 |
Фенилкетонурия | 62508646 | APG05459.1 | T>C | 15654 | NC 000012.11,NC 000012.12 | PAH | 236 |
Фенилкетонурия | 62516101 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 15658 | NC 000012.11,NC 000012.12 | PAH | 237 |
Рак груди и яичников, семейный 1 | 62625303 | APG05459.1 | C>T | 68931 | NC 000017.10,NC 000017.11 | BRCA1 | 238 |
Г иперфенилаланинемия, неприкосновенная | 62644499 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 15656 | NC 000012.11,NC 000012.12 | PAH | 239 |
Г иперфенилаланинемия, неприкосновенная | 62644499 | APG05459.1 | G>A | 15656 | NC 000012.11,NC 000012.12 | PAH | 240 |
Наследственный | 63750217 | APG05459.1 | G>A | 32138 | NC 000003.11,NC 000003.12 | MLH1 | 241 |
предрасполагающий к раку синдром | |||||||
Наследственный предрасполагающий к раку синдром | 63750741 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 94663 | NC 000002.11,NC 000002.12 | MSH6 | 242 |
Наследственный предрасполагающий к раку синдром | 63750809 | APG05459.1 | T>C | 95480 | NC 000003.11,NC 000003.12 | MLH1 | 243 |
Наследственный предрасполагающий к раку синдром | 63751657 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 95331 | NC 000003.11,NC 000003.12 | MLH1 | 244 |
Наследственный предрасполагающий к раку синдром | 63751711 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 95792 | NC 000003.11,NC 000003.12 | MLH1 | 245 |
Наследственный предрасполагающий к раку синдром | 63751711 | APG01688.1 | G>A | 95792 | NC 000003.11,NC 000003.12 | MLH1 | 246 |
Дисгенезия переднего сегмента 6 | 72549387 | APG05459.1 | G>A | 22776 | NC 000002.11,NC 000002.12 | CYP1B1 | 247 |
Синдром Бругада | 72549410 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 78547 | NC 000003.11,NC 000003.12 | SCN5A | 248 |
Синдром Бругада | 72549410 | APG05459.1 | G>A | 78547 | NC 000003.11,NC 000003.12 | SCN5A | 249 |
Дефицит орнитинкарбамоилтрансферазы | 72554308 | APG01688.1 | G>A | 26053 | NC 000023.10,NC 000023.11 | OTC | 250 |
Несовершенный остеогенез I типа | 72645321 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 414022 | NC 000017.10,NC 000017.11 | COL1A1 | 251 |
Несовершенный остеогенез I типа | 72645321 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 414022 | NC 000017.10,NC 000017.11 | COL1A1 | 252 |
- 51 046542
Запор | 74799832 | APG05083, APG07433.1, APG07513.1, APG08290.1 | Т>С | 28958 | NC 000010.10,NC 000010.11 | RET | 253 |
Дефицит дофамин-бетагидроксилазы | 74853476 | APG05083, APG07433.1, APG07513.1, APG08290.1 | Т>С | 16789 | NC 000009.11,NC 000009.12 | DBH | 254 |
Муковисцидоз | 75096551 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 33858 | NC 000007.13,NC 000007.14 | CFTR | 255 |
Фенилкетонурия | 75193786 | APG01688.1 | Т>С | 15675 | NC 000012.11,NC 000012.12 | PAH | 256 |
Дефицит УДФ-глюкозогексозо-1фосфатуридиллилтрансферазы | 75391579 | APG05459.1 | A>G | 18653 | NC 000009.11,NC 000009.12 | GALT | 257 |
Амилоидная кардиомиопатия, связанная с транстиретином | 76992529 | APG05459.1 | G>A | 28465 | NC 000018.9,NC 000018.10 | TTR | 258 |
Синдром дефицитных углеводов гликопротеинов типа I | 80338707 | APG01688.1 | G>A | 22758 | NC 000016.9,NC 000016.10 | PMM2 | 259 |
Метахроматическая лейкодистрофия | 80338815 | APG01688.1 | G>A | 18090 | NC 000022.10,NC 000022.11 | ARSA | 260 |
Синдром Смита-Лемли-Опица | 80338857 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 34128 | NC 000011.9,NC 000011.10 | DHCR7 | 261 |
Глухота аутосомнорецессивная 1А | 80338940 | APG05459.1 | G>A | 32068 | NC 000013.10,NC 000013.11 | GJB2 | 262 |
Врожденное омфалоцеле | 80338945 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 32055 | NC 000013.10,NC 000013.11 | GJB2 | 263 |
Врожденное омфалоцеле | 80338945 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 32055 | NC 000013.10,NC 000013.11 | GJB2 | 264 |
Врожденное омфалоцеле | 80338945 | APG05459.1 | T>C | 32055 | NC 000013.10,NC 000013.11 | GJB2 | 265 |
Врожденное омфалоцеле | 80338945 | APG05459.1 | T>C | 32055 | NC 000013.10,NC 000013.11 | GJB2 | 266 |
Врожденная миотония, аутосомно-доминантная форма | 80356701 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 33902 | NC 000007.13,NC 000007.14 | CLCN1 | 267 |
Рак груди и яичников, семейный 1 | 80356914 | APG05459.1 | G>A | 70276 | NC 000017.10,NC 000017.11 | BRCA1 | 268 |
Рак груди и / или яичников | 80356962 | APG05459.1 | G>A | 70247 | NC 000017.10,NC 000017.11 | BRCA1 | 269 |
Рак груди и яичников, семейный 1 | 80357212 | APG05459.1 | G>A | 70255 | NC 000017.10,NC 000017.11 | BRCA1 | 270 |
Рак груди и яичников, семейный 1 | 80357281 | APG05459.1 | T>C | 70177 | NC 000017.10,NC 000017.11 | BRCA1 | 271 |
Рак груди и яичников, семейный 1 | 80357307 | APG05459.1 | G>A | 70275 | NC 000017.10,NC 000017.11 | BRCA1 | 272 |
Рак груди и яичников, семейный 1 | 80357352 | APG05459.1 | C>T | 69958 | NC 000017.10,NC 000017.11 | BRCA1 | 273 |
Рак груди и яичников, семейный 1 | 80358145 | APG05459.1 | G>A | 46229 | NC 000017.10,NC 000017.11 | BRCA1 | 274 |
Врожденные генетические заболевания | 80358259 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 18006 | NC 000018.9,NC 000018.10 | NPC1 | 275 |
Рак груди и яичников, семейный 2 | 80358543 | APG05459.1 | G>A | 131539 | NC 000013.10,NC 000013.11 | BRCA2 | 276 |
Рак груди и яичников, семейный 2 | 80358544 | APG05459.1 | G>A | 46368 | NC 000013.10,NC 000013.11 | BRCA2 | 277 |
Рак груди и яичников, семейный 2 | 80358997 | APG05459.1 | G>A | 67062 | NC 000013.10,NC 000013.11 | BRCA2 | 278 |
Рак груди и / или яичников | 80359003 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 67069 | NC 000013.10,NC 000013.11 | BRCA2 | 279 |
Рак груди и яичников, семейный 2 | 80359004 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 46672 | NC 000013.10,NC 000013.11 | BRCA2 | 280 |
Рак груди и яичников, | 80359071 | APG05459.1 | G>A | 67203 | NC 000013.10,NC 000013.11 | BRCA2 | 281 |
- 52 046542
семейный 2 | |||||||
Рак груди и яичников, семейный 2 | 80359112 | APG05459.1 | С>Т | 67292 | NC 000013.10,NC 000013.11 | BRCA2 | 282 |
Рак груди и яичников, семейный 2 | 80359115 | APG05459.1 | С>Т | 67294 | NC 000013.10,NC 000013.11 | BRCA2 | 283 |
Синдром Смита-Лемли-Опица | 104886033 | APG05459.1 | A>G | 21833 | NC 000011.9,NC 000011.10 | DHCR7 | 284 |
Синдром Альпорта 1, Xсцепленный рецессивный | 104886142 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 35796 | NC 000023.10,NC 000023.11 | COL4A5 | 285 |
Острая нейронопатическая болезнь Гоше | 104886460 | APG05459.1 | G>A | 99352 | NC 000001.10,NC 000001.11 | GBA | 286 |
Дефицит гонадотропина | 104893836 | APG05459.1 | A>G | 31062 | NC 000004.11,NC 000004.12 | GNRHR | 287 |
Дистальный артрогрипоз типа 1А | 104894129 | APG05459.1 | G>A | 27501 | NC 000009.11,NC 000009.12 | TPM2 | 288 |
Дистальный артрогрипоз типа 1А | 104894129 | APG05459.1 | G>A | 27501 | NC 000009.11,NC 000009.12 | TPM2 | 289 |
Наследственный предрасполагающий к раку синдром | 104894261 | APG05459.1 | C>T | 31727 | NC 000011.9,NC 000011.10 | MEN1 | 290 |
Врожденные генетические заболевания | 104894313 | APG05459.1 | C>T | 18816 | NC 000011.9,NC 000011.10 | TYR | 291 |
Смерть в раннем взрослом возрасте | 104894368 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 29104 | NC 000012.11,NC 000012.12 | MYL2 | 292 |
Смерть в раннем взрослом возрасте | 104894368 | APG05459.1 | G>A | 29104 | NC 000012.11,NC 000012.12 | MYL2 | 293 |
Тяжелая аутосомнорецессивная мышечная дистрофия детского возраста североафриканский тип | 104894423 | APG05459.1 | G>A | 17048 | NC 000013.10,NC 000013.11,NC 000013.9 | SGCG | 294 |
Сердечно-сосудистый фенотип | 104894503 | APG05459.1 | G>A | 27495 | NC 000015.9,NC 000015.10 | TPM1 | 295 |
Синдром дефицитных углеводов гликопротеинов типа I | 104894525 | APG01688.1 | G>A | 22747 | NC 000016.9,NC 000016.10 | PMM2 | 296 |
Болезнь Шарко-Мари-Тута, тип I | 104894621 | APG05459.1 | C>T | 23472 | NC 000017.10,NC 000017.11 | PMP22 | 297 |
Врожденные генетические заболевания | 104894635 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 20146 | NC 000017.10,NC 000017.11 | SGSH | 298 |
Врожденные генетические заболевания | 104894635 | APG05459.1 | G>A | 20146 | NC 000017.10,NC 000017.11 | SGSH | 299 |
Семейная средиземноморская лихорадка | 104895097 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 17588 | NC 000016.9,NC 000016.10 | MEFV | 300 |
Глухота аутосомнорецессивная 2 | 111033178 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 52388 | NC 000011.9,NC 000011.10 | MYO7A | 301 |
Глухота аутосомнорецессивная 2 | 111033178 | APG01688.1 | G>A | 52388 | NC 000011.9,NC 000011.10 | MYO7A | 302 |
Глухота, Х-сцепленная 2 | 111033299 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 53902 | NC 000013.10,NC 000013.11 | GJB2 | 303 |
Увеличенный вестибулярный акведук | 111033305 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 52666 | NC 000007.13,NC 000007.14 | SLC26A4 | 304 |
Врожденное сенсоневральное нарушение слуха | 111033364 | APG05459.1, APG01688.1 | G>A | 17396 | NC 000001.10,NC 000001.11 | USH2A | 305 |
Дефицит УДФ-глюкозогексозо-1- фосфатуридиллилтрансферазы | 111033728 | APG05459.1 | T>C | 36556 | NC 000009.11,NC 000009.12 | GALT | 306 |
Дефицит ацил-КоАдегидрогеназы с очень длинной цепью | 112406105 | APG05459.1 | G>A | 200333 | NC 000017.10,NC 000017.11 | ACADVL | 307 |
Сердечно-сосудистый фенотип | 112645512 | APG05459.1 | C>T | 178700 | NC 000015.10,NC 000015.9 | FBN1 | 308 |
Дефицит пируваткиназы эритроцитов | 113403872 | APG05459.1 | G>A | 16550 | NC 000001.10,NC 000001.11 | PKLR | 309 |
- 53 046542
Аутосомно-доминантная прогрессирующая наружная офтальмоплегия с делециями митохондриальной ДНК 1 | 113994095 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 28535 | NC 000015.9,NC 000015.10 | POLG | 310 |
Дефицит ацил-КоАдегидрогеназы с очень длинной цепью | 113994167 | APG05459.1 | Т>С | 33877 | NC 000017.10,NC 000017.11 | ACADVL | 311 |
Цистиноз глазной нефропатический | 113994205 | APG05459.1 | G>A | 19482 | NC 000017.10,NC 000017.11 | CTNS | 312 |
Дефицит пируваткиназы эритроцитов | 116100695 | APG05459.1 | С>Т | 16552 | NC 000001.10,NC 000001.11 | PKLR | 313 |
Дистальная миопатия по типу Татеямы | 116840778 | APG01688.1 | G>A | 23322 | NC 000003.11,NC 000003.12 | CAV3;SSUH2 | 314 |
Злокачественная гипертермия, восприимчивость к, 1 | 118192122 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 76888 | NC 000019.9,NC 000019.10 | RYR1 | 315 |
Злокачественная гипертермия, восприимчивость к, 1 | 118192122 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 76888 | NC 000019.9,NC 000019.10 | RYR1 | 316 |
Миопатия, центральное ядро | 118192158 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 76835 | NC 000019.9,NC 000019.10 | RYR1 | 317 |
Миопатия, центральное ядро | 118192158 | APG05459.1 | G>A | 76835 | NC 000019.9,NC 000019.10 | RYR1 | 318 |
Миопатия, центральное ядро | 118192158 | APG01688.1 | G>A | 76835 | NC 000019.9,NC 000019.10 | RYR1 | 319 |
Злокачественная гипертермия, восприимчивость к, 1 | 118192170 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 28014 | NC 000019.9,NC 000019.10 | RYR1 | 320 |
Цероидный липофусциноз нейрональный 2 | 119455954 | APG05459.1 | G>A | 17681 | NC 000011.9,NC 000011.10 | TPP1 | 321 |
Цероидный липофусциноз нейрональный 2 | 119455954 | APG01688.1 | G>A | 17681 | NC 000011.9,NC 000011.10 | TPP1 | 322 |
Глутаровая ацидурия, тип 1 | 120074135 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 18010 | NC 000018.9,NC 000018.10 | NPC1 | 323 |
Заболевания, связанные с CAPN3 | 121434372 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 17127 | NC 000019.9,NC 000019.10 | GCDH | 324 |
Заболевания, связанные с CAPN3 | 121434548 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 32661 | NC 000015.9,NC 000015.10 | CAPN3;POMT1 | 325 |
Болезнь накопления гликогена, тип II | 121434548 | APG05459.1 | G>A | 32661 | NC 000015.9,NC 000015.10 | CAPN3;POMT1 | 326 |
Несиндромный окулокожный альбинизм | 121907943 | APG05459.1 | C>T | 19073 | NC 000017.10,NC 000017.11 | GAA | 327 |
Семейная гиперхолестеринемия | 121908011 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 18814 | NC 000011.9,NC 000011.10 | TYR | 328 |
Семейная гиперхолестеринемия | 121908033 | APG05459.1 | G>A | 18765 | NC 000019.9,NC 000019.10 | LDLR | 329 |
Глухота аутосомнорецессивная 7 | 121908039 | APG05459.1 | G>A | 18778 | NC 000019.9,NC 000019.10 | LDLR | 330 |
Хронический детский неврологический, кожный и суставной синдром | 121908073 | APG05459.1 | C>T | 19142 | NC 000009.11,NC 000009.12 | TMC1 | 331 |
Врожденная мышечная дистрофия по типу Эйхсфельда | 121908153 | APG05459.1 | G>A | 19416 | NC 000001.10,NC 000001.11 | NLRP3 | 332 |
Врожденные генетические заболевания | 121908185 | APG05459.1 | G>A | 19531 | NC 000001.10,NC 000001.11 | SELENON | 333 |
Г иперкалиемический периодический паралич 1 типа | 121908192 | APG05459.1 | G>A | 23730 | NC 000016.9,NC 000016.10 | GFER | 334 |
Миопатия с тельцами включения 2 | 121908557 | APG05459.1 | G>A | 20958 | NC 000017.10,NC 000017.11 | SCN4A | 335 |
Тяжелый иммунодефицит APG05083.1, APG07433.1, | 121908627 | APG05459.1 | G>A | 21067 | NC 000009.11,NC 000009.12 | GNE | 336 |
- 54 046542
APG07513.1, APG08290.1 из-за дефицита ADA | |||||||
Тяжелый иммунодефицит APG05083.1, APG07433.1, APG07513.1, APG08290.1 из-за дефицита ADA | 121908716 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 16996 | NC 000020.10,NC 000020.11 | ADA | 337 |
Глутаровая ацидурия, тип 1 | 121908739 | APG05083, APG07433.1, APG07513.1, APG08290.1 | Т>С | 17004 | NC 000020.10,NC 000020.11 | ADA | 338 |
Адренокортикальная карцинома в педиатрии | 121908987 | APG05459.1 | G>A | 21885 | NC 000007.13,NC 000007.14 | PRKAG2 | 339 |
Дефицит фумаразы | 121909019 | APG05459.1 | G>A | 22197 | NC 000007.13,NC 000007.14 | CFTR | 340 |
Аденокарцинома простаты | 121909036 | APG05459.1 | Т>С | 22247 | NC 000007.13,NC 000007.14 | CFTR | 341 |
Семейная гипертрофическая кардиомиопатия 1 | 121912664 | APG01688.1 | G>A | 27418 | NC 000017.10,NC 000017.11 | TP53 | 342 |
Гипофосфатазия взрослых | 121913123 | APG05459.1 | G>A | 31275 | NC 000001.10,NC 000001.11 | FH | 343 |
Гипофосфатазия взрослых | 121913272 | APG05459.1 | Т>С | 40610 | NC 000003.11,NC 000003.12 | PIK3CA | 344 |
Гипофосфатазия взрослых | 121913638 | APG05459.1 | G>A | 29144 | NC 000014.8,NC 000014.9 | MYH7 | 345 |
Врожденные генетические заболевания | 121918007 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 28709 | NC 000001.10,NC 000001.11 | ALPL | 346 |
Врожденные генетические заболевания | 121918007 | APG01688.1 | G>A | 28709 | NC 000001.10,NC 000001.11 | ALPL | 347 |
Синдром Крузона | 121918007 | APG01688.1 | G>A | 28709 | NC 000001.10,NC 000001.11 | ALPL | 348 |
Дефицит пропионил-КоА карбоксилазы | 121918166 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 15994 | NC 000015.9,NC 000015.10 | OCA2 | 349 |
Сердечно-сосудистый фенотип | 121918243 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 16464 | NC 000001.10,NC 000001.11 | MMACHC | 350 |
Мультиплексный дизостоз | 121918505 | APG05459.1 | T>C | 28329 | NC 000010.10,NC 000010.11 | FGFR2 | 351 |
Множественный дефицит сульфатазы | 121964961 | APG05459.1 | A>G | 27057 | NC 000003.11,NC 000003.12 | PCCB | 352 |
Бифункциональная недостаточность пероксисомальных ферментов | 121964962 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 15156 | NC 000021.8,NC 000021.9 | CBS | 353 |
Бифункциональная недостаточность пероксисомальных ферментов | 121965019 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 26947 | NC 000004.11,NC 000004.12 | IDUA | 354 |
Наследственный предрасполагающий к раку синдром | 137852850 | APG05459.1 | T>C | 17711 | NC 000003.11,NC 000003.12 | SUMF1 | 355 |
Сердечно-сосудистый фенотип | 137853096 | APG05459.1 | G>A | 22694 | NC 000005.9,NC 000005.10 | HSD17B4 | 356 |
Сердечно-сосудистый фенотип | 137853096 | APG01688.1 | G>A | 22694 | NC 000005.9,NC 000005.10 | HSD17B4 | 357 |
Конечностно-поясная мышечная дистрофия 2L типа | 137853293 | APG05459.1 | C>T | 28112 | NC 000013.10,NC 000013.11 | RBI | 358 |
Адренокортикальная карцинома в педиатрии | 137854478 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 31496 | NC 000015.9,NC 000015.10 | FBN1 | 359 |
Дефицит фумаразы | 137854478 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 31496 | NC 000015.9,NC 000015.10 | FBN1 | 360 |
Аденокарцинома простаты | 137854529 | APG05459.1 | C>T | 17205 | NC 000011.9,NC 000011.10 | ANO 5 | 361 |
Семейная гиперхолестеринемия | 137929307 | APG01688.1 | G>A | 171217 | NC 000019.9,NC 000019.10 | LDLR | 362 |
Синдром плавучей гавани | 141659620 | APG05459.1 | G>A | 21858 | NC 000016.9,NC 000016.10 | SPG7 | 363 |
Врожденный синдром удлиненного интервала QT | 142761835 | APG05459.1 | G>A | 177782 | NC 000015.9,NC 000015.10 | IVD | 364 |
Врожденный синдром удлиненного интервала QT | 145787161 | APG05459.1 | G>A | 18783 | NC 000019.10,NC 000019.9 | LDLR | 365 |
Синдром Андерсена Тавила | 146015592 | APG05459.1 | G>A | 46845 | NC 000003.11,NC 000003.12 | BTD | 366 |
Сердечно-сосудистый фенотип | 146015592 | APG05459.1 | G>A | 46845 | NC 000003.11,NC 000003.12 | BTD | 367 |
- 55 046542
Семейная гиперхолестеринемия | 150726175 | APG01688.1 | G>A | 45795 | NC 000001.10,NC 000001.11 | NMNAT1 | 368 | |
Сердечно-сосудистый фенотип | 151344623 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 24127 | NC | 000011.9,NC 000011.10 | ABCC8 | 369 |
Опухоль стромы желудочнокишечного тракта | 180177122 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 132185 | NC | 000016.10,NC 000016.9 | PALB2 | 370 |
Врожденный дискератоз | 180177366 | APG05459.1 | G>A | 71322 | NC | 000008.10,NC 000008.11 | VPS13B | 371 |
Врожденный дискератоз | 187830361 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 45267 | NC | 000011.9,NC 000011.10 | MYBPC3 | 372 |
Болезнь накопления гликогена Ша | 193922103 | APG05459.1 | A>G | 44370 | NC | 000013.10,NC 000013.11 | ATP7B | 373 |
Дилатационная кардиомиопатия 1DD | 193922110 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 44393 | NC | 000013.10,NC 000013.11 | ATP7B | 374 |
Почечный дефект транспорта карнитина | 193922110 | APG05459.1 | G>A | 44393 | NC | 000013.10,NC 000013.11 | ATP7B | 375 |
Синдром Барайцера-Винтера 1 | 193922566 | APG05459.1 | G>A | 45113 | NC | 000019.9,NC 000019.10 | LDLR | 376 |
Дефицит ацил-КоАдегидрогеназы с очень длинной цепью | 193922566 | APG05459.1 | G>A | 45113 | NC | 000019.9,NC 000019.10 | LDLR | 377 |
Семейная гиперхолестеринемия | 199469464 | APG05459.1 | C>T | 39865 | NC | 000016.9,NC 000016.10 | SRCAP | 378 |
Конечностно-поясная мышечная дистрофия 2А типа | 199472712 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 67758 | NC | 000011.9,NC 000011.10 | KCNQ1 | 379 |
Семейная гиперхолестеринемия | 199472712 | APG05459.1 | G>A | 67758 | NC | 000011.9,NC 000011.10 | KCNQ1 | 380 |
Аневризма аорты семейная грудная 6 | 199473384 | APG01688.1 | G>A | 78481 | NC | 000017.10,NC 000017.11 | KCNJ2 | 381 |
Семейная гиперхолестеринемия | 199473460 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 67776 | NC | 000011.9,NC 000011.10 | KCNQ1 | 382 |
Синдром плавучей гавани | 200238879 | APG05459.1 | T>C | 18777 | NC | 000019.9,NC 000019.10 | LDLR | 383 |
Врожденный синдром удлиненного интервала QT | 200411226 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 174776 | NC | 000011.9,NC 000011.10 | MYBPC3 | 384 |
Врожденный синдром удлиненного интервала QT | 201286421 | APG05459.1 | C>T | 50215 | NC | 000001.10,NC 000001.11 | SDHC | 385 |
Синдром Андерсена Тавила | 201540674 | APG05459.1 | G>A | 51186 | NC | 000020.10,NC 000020.11 | RTEL1 | 386 |
Сердечно-сосудистый фенотип | 201540674 | APG01688.1 | G>A | 51186 | NC | 000020.10,NC 000020.11 | RTEL1 | 387 |
Семейная гиперхолестеринемия | 267606640 | APG04583.1 | G>A | 16147 | NC | 000001.10,NC 000001.11 | AGL | 388 |
Сердечно-сосудистый фенотип | 267607004 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 15310 | NC | 000010.10,NC 000010.11 | RBM20 | 389 |
Опухоль стромы желудочнокишечного тракта | 267607054 | APG05459.1 | C>T | 21466 | NC | 000005.9,NC 000005.10 | SLC22A5 | 390 |
Врожденный дискератоз | 281875334 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 38553 | NC | 000007.13,NC 000007.14 | ACTB | 391 |
Врожденный дискератоз | 369560930 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 98197 | NC | 000017.10,NC 000017.11 | ACADVL | 392 |
Болезнь накопления гликогена Ша | 373822756 | APG05459.1 | A>G | 181233 | NC | 000019.9,NC 000019.10 | LDLR | 393 |
Дилатационная кардиомиопатия 1DD | 376107921 | APG05459.1 | G>A | 213634 | NC | 000015.9,NC 000015.10 | CAPN3 | 394 |
Почечный дефект транспорта карнитина | 376459828 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 198012 | NC | 000019.10,NC 000019.9 | LDLR | 395 |
- 56 046542
Синдром Барайцера-Винтера 1 | 387906592 | APG05459.1 | G>A | 38552 | NC 000010.10,NC 000010.11 | ACTA2 | 396 |
Акромикрическая дисплазия | 387906623 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 38652 | NC 000015.9,NC 000015.10 | FBN1 | 397 |
Болезнь Шарко-Мари-Тута 2С типа | 387906905 | APG01688.1 | G>A | 39430 | NC 000012.11,NC 000012.12 | TRPV4 | 398 |
Рак груди и яичников, семейный 2 | 397507389 | APG01688.1 | G>A | 46666 | NC 000013.10,NC 000013.11 | BRCA2 | 399 |
Рак груди и яичников, семейный 1 | 397509284 | APG05459.1 | G>A | 70248 | NC 000017.10,NC 000017.11 | BRCA1 | 400 |
Болезнь Шарко-Мари-Тута тип 2С | 397514494 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 48018 | NC 000012.11,NC 000012.12 | TRPV4 | 401 |
Болезнь Шарко-Мари-Тута тип 2С | 397514494 | APG01688.1 | G>A | 48018 | NC 000012.11,NC 000012.12 | TRPV4 | 402 |
Наследственный предрасполагающий к раку синдром | 397514495 | APG05459.1 | G>A | 152034 | NC 000017.10,NC 000017.11 | TP53 | 403 |
Ранняя детская эпилептическая энцефалопатия | 397514581 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 48359 | NC 000020.10,NC 000020.11 | KCNQ2 | 404 |
Ранняя детская эпилептическая энцефалопатия | 397514581 | APG05459.1 | G>A | 48359 | NC 000020.10,NC 000020.11 | KCNQ2 | 405 |
Ранняя детская эпилептическая энцефалопатия | 397514581 | APG01688.1 | G>A | 48359 | NC 000020.10,NC 000020.11 | KCNQ2 | 406 |
Акромикрическая дисплазия | 397515757 | APG05459.1 | G>A | 51454 | NC 000015.9,NC 000015.10 | FBN1 | 407 |
Гипертрофическая кардиомиопатия | 397515982 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 51820 | NC 000011.9,NC 000011.10 | MYBPC3 | 408 |
Сердечно-сосудистый фенотип | 397516031 | APG04583.1 | G>A | 51898 | NC 000011.9,NC 000011.10 | MYBPC3 | 409 |
Сердечно-сосудистый фенотип | 397516074 | APG05083, APG07433.1, APG07513.1, | G>A | 51962 | NC 000011.9,NC 000011.10 | MYBPC3 | 410 |
APG08290.1 | |||||||
Сердечно-сосудистый фенотип | 397516083 | APG01688.1 | G>A | 51977 | NC 000011.9,NC 000011.10 | MYBPC3 | 411 |
Семейная гипертрофическая кардиомиопатия 1 | 397516269 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 52276 | NC 000014.8,NC 000014.9 | MYH7 | 412 |
Синдром атаксиителеангиэктазии | 397517889 | APG05459.1 | C>T | 57195 | NC 000001.10,NC 000001.11 | LMNA | 413 |
Семейный рак груди | 398123172 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 415590 | NC 000017.10,NC 000017.11 | GAA | 414 |
Конечностно-поясная мышечная дистрофия 2А типа | 587776576 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 18532 | NC 000011.10,NC 000011.9 | WT1 | 415 |
Наследственный предрасполагающий к раку синдром | 587776954 | APG05459.1 | A>G | 51108 | NC 000012.11,NC 000012.12 | C12orf57 | 416 |
Асимметричная гипертрофия перегородки | 587779826 | APG05459.1 | T>C | 132814 | NC 000011.10,NC 000011.9 | ATM | 417 |
Наследственный предрасполагающий к раку синдром | 587780226 | APG05459.1 | C>T | 133611 | NC 000017.10,NC 000017.11 | BRIP1 | 418 |
Семейная гипертрофическая кардиомиопатия 2 | 587780290 | APG01688.1 | G>A | 134019 | NC 000015.9,NC 000015.10 | CAPN3 | 419 |
Семейная гипертрофическая кардиомиопатия 2 | 587781462 | APG05459.1 | C>T | 150772 | NC 000002.11,NC 000002.12 | MSH6 | 420 |
Семейная гипертрофическая кардиомиопатия 2 | 587782958 | APG01688.1 | G>A | 165560 | NC 000011.10,NC 000011.9 | MYBPC3 | 421 |
Эритроцитоз, семейный, 2 | 587783050 | APG05459.1 | G>A | 166264 | NC 000016.10,NC 000016.9 | CDH1 | 422 |
Смерть в младенчестве | 727504247 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 172354 | NC 000001.10,NC 000001.11 | TNNT2 | 423 |
- 57 046542
Мышечные заболевания | 727504247 | APG01688.1 | G>A | 172354 | NC 000001.10,NC 000001.11 | TNNT2 | 424 |
Семейная гиперхолестеринемия | 727504247 | APG01688.1 | G>A | 172354 | NC 000001.10,NC 000001.11 | TNNT2 | 425 |
Семейный рак груди | 730882035 | APG01688.1 | G>A | 180121 | NC 000003.12,NC 000003.11 | VHL | 426 |
Наследственный предрасполагающий к раку синдром | 730882246 | APG05083, APG07433.1, APG07513.1. APG08290.1 | G>A | 181441 | NC 000014.9,NC 000014.8 | ISCA2 | 427 |
Семейная гиперхолестеринемия | 751995154 | APG05459.1 | G>A | 200340 | NC 000017.10,NC 000017.11 | ACADVL | 428 |
Семейная гиперхолестеринемия | 756039188 | APG04583.1 | G>A | 243266 | NC 000019.9,NC 000019.10 | LDLR | 429 |
Семейная гиперхолестеринемия | 761494650 | APG05459.1 | C>T | 185659 | NC 000022.10,NC 000022.11 | CHEK2 | 430 |
Миопатия с тельцами включения 2 | 762307622 | APG01688.1 | G>A | 232266 | NC 000001.10,NC 000001.11 | MUTYH | 431 |
Синдром атаксиителеангиэктазии | 769370816 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 228176 | NC 000019.10,NC 000019.9 | LDLR | 432 |
Синдром атаксиителеангиэктазии | 775092314 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 228197 | NC 000019.9,NC 000019.10 | LDLR | 433 |
Семейный рак груди | 775924858 | APG05083, APG07433.1, APG07513.1, APG08290.1 | G>A | 246116 | NC 000019.9,NC 000019.10 | LDLR | 434 |
Конечностно-поясная мышечная дистрофия 2А типа | 779694939 | APG04583.1 | T>C | 214934 | NC 000009.12,NC 000009.11 | GNE | 435 |
Наследственный предрасполагающий к раку синдром | 780619951 | APG05459.1 | C>T | 212851 | NC 000011.10,NC 000011.9 | ATM | 436 |
Доброкачественные семейные неонатально-младенческие судороги | 794727152 | APG04583.1 | G>A | 191718 | NC 000002.11,NC 000002.12 | SCN2A | 437 |
Синдром Марфана / Синдром Лойса-Дитца / Семейные аневризмы и расслоения грудной аорты | 794728228 | APG05459.1 | C>T | 197690 | NC 000015.10,NC 000015.9 | FBN1 | 438 |
Дилатационная кардиомиопатия1G | 869320740 | APG01688.1 | T>C | 136355 | NC 000002.11,NC 000002.12 | TTN | 439 |
Семейная гиперхолестеринемия | 875989911 | APG05459.1 | G>A | 228151 | NC 000019.9,NC 000019.10 | LDLR | 440 |
Рак груди и яичников, семейный 2 | 876657678 | APG05459.1 | C>T | 230443 | NC 000013.10,NC 000013.11 | BRCA2 | 441 |
Семейная гиперхолестеринемия | 879254600 | APG05459.1 | G>A | 245669 | NC 000019.10,NC 000019.9 | LDLR | 442 |
Семейная гиперхолестеринемия | 879254803 | APG05083, APG07433.1, APG07513.1, APG08290.1 | T>C | 246008 | NC 000019.10,NC 000019.9 | LDLR | 443 |
Семейная гиперхолестеринемия | 879254803 | APG01688.1 | T>C | 246008 | NC 000019.10,NC 000019.9 | LDLR | 444 |
Семейная гиперхолестеринемия | 879254849 | APG01688.1 | T>C | 246074 | NC 000019.10,NC 000019.9 | LDLR | 445 |
Семейный рак груди | 1057517585 | APG01688.1 | G>A | 358911 | NC 000016.10,NC 000016.9 | PALB2 | 446 |
Наследственная геморрагическая телеангиэктазия 2 типа | 1057517944 | APG05459.1 | C>T | 360048 | NC 000012.11,NC 000012.12 | ACVRL1 | 447 |
Пример 10: Целевые мутации, ответственные за синдром Гурлера.
Далее описывается потенциальное лечение синдрома Гурлера, также называемого MPS-1, с использованием системы редактирования оснований, направленной на РНК, которая исправляет мутацию, ответственную за синдром Гурлера, у значительной части пациентов с этим заболеванием. В этом подходе используется базовый слитый белок для редактирования, который управляется РНК и который может быть упакован в один вектор AAV для доставки в широкий спектр типов тканей. В зависимости от точных регуляторных элементов и используемого домена редактора базового блока также можно сконструировать единый вектор, который кодирует как базовый слитый белок редактирования, так и единственную управляющую РНК для нацеливания на пораженный локус. Пример 10.1: Определение RGN с идеальной PAM Генетическое заболевание MPS-1 представляет собой нарушение лизосомального хранения, характеризующуюся на молекулярном уровне накоплением дерматансульфата и гепарансульфата в лизосомах. Это заболевание обычно является наследственным генетическим заболеванием, вызванным мутациями в гене IDUA (эталонная последовательность NCBI NG_008103.1), который кодирует a-Lидуронидазу. Заболевание является результатом дефицита a-L-идуронидазы. Наиболее частыми мутациями IDUA, обнаруженными в исследованиях на лицах североевропейского происхождения, являются W402X и Q70X, обе нонсенс мутации, приводящие к преждевременному прекращению трансляции (Bunge и др. (1994), Hum. Mol. Genet, 3 (6): cc. 861- 866, включено здесь в качестве ссылки). Реверсирование одного нуклеотида может восстановить кодирующую последовательность дикого типа и привести к экспрессии белка, контролируемой эндогенными регуляторными механизмами генетического локуса.
Мутация W402X гена Idua человека является причиной высокой доли случаев MPS-1H. Базовые редакторы могут нацеливаться на узкое окно последовательности по отношению к сайту связывания компонента протоспейсера управляющей РНК, и, таким образом, наличие последовательности PAM на определенном расстоянии от целевого локуса является важным для успеха стратегии. Учитывая ограничения, что целевая мутация должна находиться на открытой нецелевой цепи (NTS) во время взаимодействия с базовым редактирующим белком и что след домена RGN будет блокировать доступ к области рядом с PAM, доступный локус может составлять 10-30 п.н. РАМ. Чтобы избежать редактирования и мута
- 58 046542 генеза других близлежащих оснований аденозина в этом окне, проверяются различные линкеры. Идеальное окно составляет 12-16 п.о. РАМ.
Последовательность PAM, совместимая с APG07433.1 и APG08290.1, легко обнаруживается в генетическом локусе и в пределах идеального окна редактирования основания, как определено выше. Эти нуклеазы имеют РАМ-последовательность NNNNCC (SEQ ID NO: 6) и NNRNCC (SEQ ID NO: 32), соответственно, и компактны по размеру, что потенциально обеспечивает доставку с помощью одного вектора AAV. Такой подход к доставке дает множество преимуществ по сравнению с другими, например доступ к широкому спектру тканей (печень, мышцы, ЦНС), а также хорошо зарекомендовавший себя профиль безопасности и технологии производства.
Cas9 из S. pyogenes (SpyCas9) требует РАМ-последовательности NGG (SEQ ID NO: 448), которая присутствует рядом с локусом W402X, но размер SpyCas9 предотвращает упаковку гена, кодирующего гибридный белок базового редактирующего домена и нуклеазу SpyCas9, в единый вектор AAV и, таким образом, лишает этот подход вышеупомянутых преимуществ. Включение последовательности, кодирующей управляющую РНК, в этот вектор было бы еще менее осуществимо, даже если потребуются значительные технологические усовершенствования, которые уменьшат размер регуляторных элементов гена или увеличат пределы упаковки векторов AAV. Хотя может использоваться стратегия двойной доставки (например, Ryu и др., (2018), Nat. Biotechnol., 36 (6): cc. 536-539, включенная здесь в качестве ссылки), что значительно усложняет производство и увеличивает стоимость. Кроме того, двойная доставка вирусного вектора значительно снижает эффективность генной коррекции, поскольку для успешного редактирования в данной клетке требуется инфицирование обоими векторами и сборка гибридного белка в клетке.
Обычно используемый ортолог Cas9 из S. aureus (SauCas9) значительно меньше по размеру по сравнению с SpyCas9, но имеет более сложную потребность в PAM - NGRRT (SEQ ID NO: 449). Эта последовательность, однако, находится за пределами диапазона, который, как ожидается, будет полезен для базового редактирования каузативного локуса.
Пример 10.2. Конструкции слияния RGN и последовательностей sgPHK.
Последовательность ДНК, кодирующая слитый белок со следующими доменами, получают с использованием стандартных методов молекулярной биологии: 1) домен RGN с мутациями, которые инактивируют активность расщепления ДНК (мертвый или никаза); 2) аденозиндезаминаза, полезная для редактирования базы. Все конструкции, описанные в таблице ниже, содержат слитый белок с активным доменом редактирования основания, в этом примере ADAT (SEQ ID NO: 450), функционально слитый с N-терминальным концом RGN APG08290.1. В данной области известно, что слитый белок также может быть получен с ферментом, редактирующим основание, на С-конце RGN. Кроме того, RGN и редактор оснований слитого белка обычно разделены аминокислотной последовательностью линкера. В данной области известно, что длина стандартных линкеров находится в диапазоне 15-30 аминокислот. Кроме того, в данной области известно, что определенные слитые белки между RGN и ферментом, редактирующим основание, например цитидиндезаминазой, также могут содержать по меньшей мере один домен ингибитора урацилгликозилазы (UGI), который может повысить эффективность редактирования оснований (США Патент № 10167457, включенный здесь в качестве ссылки). Следовательно, слитый белок может содержать APG08290.1, фермент, модифицирующий основание, и по меньшей мере один UGI.
Таблица 13
Конструкции для редактирования РНК-нацеленных оснований
Seq ID No. | Конструкция | RGN | Мертвая (D) или Никазная (N) | Редактор оснований | Линкер |
451 | Nuc - AD АТ -линкер dAPG08290.1-линкер-S V40 | APG08290.1 | D | ADAT | ΧΤΕΝΙ |
452 | Nuc-ADAT-XTENlnAPG08290.1- линкер SV40 | APG08290.1 | N | ADAT | ΧΤΕΝΙ |
Доступные сайты редактирования RGN определяются последовательностью РАМ. При объединении RGN с базовым редактирующим доменом целевой остаток для редактирования должен находиться на нецелевой цепи (NTS), поскольку NTS является одноцепочечным, в то время как RGN связана с локусом. Оценка количества нуклеаз и соответствующих управляющих РНК позволяет выбрать наиболее подходящий инструмент редактирования генов для этого конкретного локуса. Несколько потенциальных последовательностей PAM, на которые могут быть нацелены описанные выше конструкции в гене Idua человека, находятся в непосредственной близости от мутантного нуклеотида, ответственного за мутацию W402X. Последовательность, кодирующая транскрипт управляющей РНК, содержащий 1) спейсер, комплементарный некодирующей цепи ДНК в локусе заболевания, а 2) также производится последовательность РНК, необходимая для ассоциации управляющей РНК с RGN. Полезные управляющие последовательности РНК (sgPHK) показаны в табл. 14 ниже. Эти управляющие последовательности РНК можно оценить по их эффективности в направлении указанных выше редакторов оснований к интересующе
- 59 046542 му локусу.
Таблица 14
Последовательность управляющих РНК
Последовательность целевой геномной последовательности | SEQ ID NO. | Кодирующая последовательность sgPHK (SEQ ID NO.) |
5’-GGAGCAGCTCTAGGCCGAAGTGTCG-3’ | 453 | 456 |
5’-TAGGCCGAAGTGTCGCAGGCCGGGA-3 ’ | 454 | 457 |
5-GCTCTAGGCCGAAGTGTCGCAGGCC-3’ | 455 | 458 |
Пример 10.3. Анализ активности в клетках пациентов с болезнью Гурлера.
Для проверки стратегии генотипа и оценки описанных выше конструкций используются фибробласты от пациентов с болезнью Гурлера. Конструируют вектор, содержащий соответствующие промоторы перед кодирующей последовательностью слитого белка и кодирующей последовательностью sgPHK для их экспрессии в клетках человека, аналогично векторам, описанным в примере 5. Известно, что промоторы и другие элементы ДНК (например, энхансеры или терминаторы) либо обладают высокими уровнями экспрессии в клетках человека, либо могут специфически хорошо экспрессироваться в клетках фибробластов. Вектор трансфицируется в фибробласты с использованием стандартных методик, например трансфекции, подобно тому, это описано в примере 6. Кроме того, можно использовать электропорацию. Клетки культивируют 1-3 дня. Геномную ДНК (g ДНК) выделяют стандартными методами. Эффективность редактирования определяется путем проведения анализа генотипирования кПЦР и/или секвенирования следующего поколения очищенной g ДНК, как описано ниже.
В анализе qPCR Taqman™ используются зонды, специфичные для аллелей дикого типа и мутантных аллелей. Эти зонды содержат флуорофоры, которые определяются по их спектральным свойствам возбуждения и/или излучения с использованием прибора qPCR. Набор для генотипирования, содержащий праймеры и зонды для ПЦР, может быть получен коммерчески (т.е. с помощью анализа генотипирования SNP Thermo Fisher Taqman™, ID С_2786275310 для SNP ID rs121965019) или может быть разработан. Пример разработанного набора праймеров и зондов показан в табл. 15.
Таблица 15
Праймеры и зонды RT-PCR
Описание | Последовательность | SEQ ID NO. |
Праймер для прямой амплификации | 5’-GACTCCTTCACCAAG-3 ’ | 459 |
Праймер для обратной амплификации | 5’-GTAGATCAGCACCG-3 ’ | 460 |
Зонд дикого типа | 5’-CTCTGGGCCGAAGT-3’ | 461 |
Зонд W402X | 5’-CTCTAGGCCGAAGT-3’ | 462 |
После эксперимента по редактированию g ДНК подвергают анализу qPCR с использованием стандартных методов и праймеров и зондов, описанных выше. Ожидаемые результаты показаны в табл. 16. Эта система in vitro может быть использована для целесообразной оценки конструкций и выбора одной конструкции с высокой эффективностью редактирования для дальнейших исследований. Системы будут оцениваться в сравнении с клетками с мутацией W402X и без нее, и предпочтительно с некоторыми мутациями, которые являются гетерозиготными по этой мутации. Значения Ct будут сравниваться либо с эталонным геном, либо с общей амплификацией локуса с использованием красителя, такого как Sybr green.
Таблица 16
Ожидаемые результаты qPCR
Генотип | Трансфекция редактором оснований | Ожидаемые результаты ПЦР |
Iduawl/wl | Нет | Гомозиготный WT |
Iduawl/W4U2X | Нет | Гетерозиготный: 50% WT, 50% W402X |
IduaW4U2X/W4U2X | Нет | Гомозиготный W402X |
IdUaW4UiWW4UiX | Да | Вариабельный |
Ткани также можно анализировать с помощью секвенирования следующего поколения. Могут быть использованы сайты связывания праймеров, такие как показаны ниже (табл. 17), или другие подходящие сайты связывания праймеров, которые может идентифицировать специалист в данной области. После ПЦР-амплификации продукты, содержащие выступающие последовательности Illumina Nextera XT, проходят подготовку библиотеки в соответствии с протоколом метагеномного секвенирования библиотеки Illumina 16S. Глубокое секвенирование выполняется на платформе Illumina Mi-Seq. Обычно для каждого ампликона генерируется 200000 из 250 пар оснований считываний (2x100000 считываний). Считывания анализируются с помощью CRISPResso (Pinello и др., 2016) для расчета скорости редактирования. Выходные выравнивания подбираются вручную для подтверждения сайтов вставки и делеции, а также для идентификации сайтов микрогомологии в сайтах рекомбинации.
- 60 046542
Таблица 17
Сайты связывания праймеров NGS
Направление | Последовательность | SEQ ID NO. |
Вперед | 5 ’-ACTTCCTCCAGCC-3 ’ | 463 |
Назад | 5’-GAACCCCGGCTTA-3’ | 464 |
Вестерн-блоттинг клеточного лизата трансфицированных клеток и контрольных клеток с использованием антитела против IDUA выполняется для проверки экспрессии полноразмерного белка, а анализ активности фермента на клеточном лизате с использованием субстрата 4-метилумбеллиферил-альидуронида подтверждает, что фермент является каталитически активный (Hopwood и др., Clin.Chim. ACta (1979), 92 (2): cc. 257-265, включено в описание изобретения в качестве ссылки). Эти эксперименты проводят по сравнению с исходной линией клеток IduaW402X/W402X (без трансфекции), линией клеток IduaW402X/W402X, трансфицированной конструкцией для редактирования оснований и случайной направляющей последовательностью и линией клеток, экспрессирующей IDUA дикого типа.
Пример 10.4: Подтверждение лечения заболевания на мышиной модели.
Чтобы проверить эффективность этого терапевтического подхода, используется модель мыши с нонсенс-мутацией аналогичной аминокислоты. Линия мышей несет мутацию W392X в своем гене Idua (Gene ID: 15932), которая соответствует гомологичной мутации у пациентов с синдромом Гурлера (Bunge и др., (1994), Hum. Mol. Genet. 3 (6): cc. 861- 866, включено в описание изобретения в качестве ссылки). Этот локус содержит отдельную нуклеотидную последовательность по сравнению с таковой у человека, в которой отсутствует последовательность PAM, необходимая для коррекции с помощью редакторов оснований, описанных в предыдущих примерах, и, таким образом, требует разработки отдельного слитого белка для выполнения нуклеотидной коррекции. Облегчение заболевания у этого животного может подтвердить терапевтический подход к исправлению мутации в тканях, доступных для вектора доставки генов.
Мыши, гомозиготные по этой мутации, обладают рядом фенотипических характеристик, аналогичных тем, которые находят у пациентов с синдромом Гурлера. Слитый белок, редактирующий основание и RGN, как описано выше (табл. 13), вместе с управляющей РНК последовательностью включается в вектор экспрессии, который обеспечивает экспрессию белка и транскрипцию РНК у мышей. План исследования показан ниже в табл. 18. Исследование включает группы, которым вводили высокую дозу вектора экспрессии, включающего слитый белок, редактирующий основание, и РНК управляющую последовательность, низкую дозу того же вектора экспрессии - контроль, который является мышиной моделью, обработанной вектором экспрессии, который не содержит слитого белка для редактирования основания или управляющей РНК, и второй контроль, который представляет собой мышь дикого типа, обработанную тем же пустым вектором.
Таблица 18
Эксперимент по редактированию генома на мышиной модели
Группа | Линия мышей | N | Лечение |
1 | Idua-W392X‘ | > 5 | Низкие дозы вектора |
2 | Idua-W392X | > 5 | Высокие дозы вектора |
3 | Idua-W392X | > 5 | Способ доставки |
4 | 129/Sv (WT) | 5 | Способ доставки |
Конечные точки для оценки включают массу тела, экскрецию GAG с мочой, ферментативную активность IDUA в сыворотке, активность IDUA в представляющих интерес тканях, патологию тканей, генотипирование интересующих тканей для проверки коррекции SNP, а также поведенческую и неврологическую оценку. Поскольку некоторые конечные точки являются терминальными, могут быть добавлены дополнительные группы для оценки, например, тканевой патологии и активности тканевых IDUA до окончания исследования. Дополнительные примеры конечных точек можно найти в опубликованных статьях, раскрывающих модели животных с синдромом Гурлера (Shull и др. (1994), Proc. Natl. Acad. Sci. USA, № 91 (26): cc. 12937-12941; Wang и др. (2010), Mol. Genet. Metab., № 99 (1): cc. 62-71; Hartung и др. (2004), Mol. Ther., № 9 (6): cc. 866-875; Liu и др. (2005), Mol. Ther., № 11 (1): cc. 35-47; Clarke и др. (1997), Hum. Mol. Genet. № 6 (4): cc. 503-511; все они включены в настоящее описание изобретения в качестве ссылки).
Один из возможных векторов доставки использует аденоассоциированный вирус (AAV). Создан вектор, содержащий последовательность, кодирующую слитый белок редактор оснований dRGN (например, SEQ ID NO: 452), которой предшествует энхансер CMV (SEQ ID NO: 138) и промотор (SEQ ID NO: 137) или другая подходящая комбинация энхансера и промотора), необязательно последовательность Козака, и которая функционально слитая на 3'-конце с последовательностью терминатора и последовательностью полиаденлилирования, такой как минимальная последовательность, описанная у Levitt, N.;
- 61 046542
Briggs, D.; Gil, A.; Proudfoot, N. J. Определение эффективного синтетического поли (А) сайта. Genes Dev. 1989, 3 (7), cc. 1019-1025. Вектор может дополнительно содержать кассету экспрессии, кодирующую единственную управляющую РНК, функционально связанную своим 5'-концом с промотором U6 человека (SEQ ID NO: 139), или другой промотор, подходящий для продукции малых некодирующих РНК, и дополнительно содержащий последовательности инвертированных концевых повторов (ITR), необходимые и хорошо известные в данной области для упаковки в капсид AAV. Производство и упаковка вирусов осуществляется стандартными методами, такими как те, что описаны в патенте США № 9,587,250, включенном в настоящее описание изобретения в качестве ссылки.
Другие возможные вирусные векторы включают аденовирусные и лентивирусные векторы, которые обычно используются и могут содержать аналогичные элементы с различными возможностями упаковки и требованиями. Также можно использовать невирусные методы доставки, такие как мРНК и crPHK, инкапсулированные липидными наночастицами (Cullis, PR и Allen, TM (2013), Adv. Drug Deliv. Rev. 65 (1): cc. 36-48; Finn и др. (2018), Cell Rep. 22 (9): cc. 2227-2235, оба включены в качестве ссылки) гидродинамическая инъекция плазмидной ДНК (Suda T and Liu D,) 2007) Mol. Ther. 15 (12): cc. 2063-2069, включена сюда в качестве ссылки), или рибонуклеопротеиновые комплексы sgPHK и связанные с наночастицами золота (Lee, K.; Conboy, M.; Park, HM; Jiang, F.; Kim, HJ; Dewitt, MA; Mackley, VA; Chang, K.; Rao, A.; Skinner, С; и др. Доставка наночастиц рибонуклеопротеина Cas9 и донорской ДНК in vivo индуцирует гомологически направленную репарацию ДНК. Nat. Biomed. Eng. 2017, 1 (11), cc. 889-90).
Пример 10.5: Коррекция заболевания на мышиной модели с гуманизированным локусом.
Чтобы оценить эффективность идентичной конструкции редактора оснований, которая будет использоваться для терапии человека, необходима модель мыши, в которой нуклеотиды рядом с W392 изменены, чтобы соответствовать последовательности у человека вокруг W402. Это может быть достигнуто с помощью различных методов, включая использование шаблона RGN и HDR для вырезания и замены локуса в эмбрионах мыши.
Из-за высокой степени консервативности аминокислот большинство нуклеотидов в локусе мыши могут быть изменены на нуклеотиды последовательности человека с молчащими мутациями, как показано в табл. 19. Происходят только изменения оснований, приводящие к измененной кодирующей последовательности в конечном сконструированном геноме мыши после введенного стоп-кодона.
Таблица 19
Нуклеотидные мутации для создания локуса гуманизированной мыши
Человек (W402X) | Мышь (W392X) | Гуманизированная мышь | ||||
Характеристика | Нуклеотид (SEQ ID NO: 465) | Закодировано AA | Нуклеотид (SEQ ID NO: 466) | Закодировано AA | Нуклеоид (SEQ ID NO: 467) | Закодировано AA |
Протоспейсер | G | E | A | G | G | G |
G | E | G | E | G | E | |
A | A | A | ||||
G | A | G | ||||
C | Q | C | Q | C | Q | |
A | A | A | ||||
G | A | G | ||||
C | L | C | L | C | L | |
T | T | T | ||||
c | c | c | ||||
T | СТОП | T | СТОП | T | СТОП | |
A | A | A | ||||
G | G | G | ||||
G | A | G | A | G | A | |
C | C | C | ||||
C | A | C | ||||
G | E | G | E | G | E | |
A | A | A | ||||
A | G | A | ||||
G | V | G | V | G | V | |
T | T | T | ||||
G | c | G | ||||
T | S | T | S | T | S | |
c | c | c | ||||
G | A | G | ||||
РАМ, не критично | C | Q | A | К | C | Q |
A | A | A | ||||
G | G | G | ||||
G | A | G | A | G | A | |
РАМ, критично | C | C | C | |||
C | T | C |
- 62 046542
После конструирования этой линии мышей будут проведены аналогичные эксперименты, как описано в примере 10.4.
Пример 11. Целевые мутации, ответственные за атаксию Фридрейха.
Экспансия последовательности тринуклеотидного повтора, вызывающая атаксию Фридрейха (FRDA), происходит в определенном генетическом локусе внутри гена FXN, который называется областью нестабильности FRDA. РНК-управляемые нуклеазы (RGN) могут использоваться для удаления области нестабильности в клетках пациентов с FRDA. Этот подход требует 1) последовательности RGN и управляющей РНК, которая может быть запрограммирована для нацеливания на аллель в геноме человека; и 2) подход к доставке RGN и управляющей последовательности. Многие нуклеазы, используемые для редактирования генома, такие как обычно используемая нуклеаза Cas9 из S. pyogenes (SpCas9), слишком велики, чтобы их можно было упаковывать в аденоассоциированные вирусные (AAV) векторы, особенно с учетом длины гена SpCas9 и управляющей РНК в дополнение к другим генетическим элементам, необходимым для функциональных кассет экспрессии. Это делает маловероятным жизнеспособность подхода с использованием SpCas9.
Компактные РНК-управляемые нуклеазы, описанные в изобретении, в частности APG07433.1 и APG08290.1, уникально хорошо подходят для удаления области нестабильности FRDA. Каждая RGN имеет нужную PAM, которая находится в непосредственной близости от области нестабильности FRDA. Кроме того, каждая из этих RGN может быть упакована в вектор AAV вместе с управляющей РНК. Упаковка двух управляющих РНК, вероятно, потребует второго вектора, но этот подход все же выгодно отличается от того, что потребовалось бы от более крупной нуклеазы, такой как SpCas9, которая потребовала бы расщепления последовательности белка между двумя векторами.
В табл. 20 показано расположение геномных последовательностей-мишеней, подходящих для нацеливания APG07433.1 или APG08290.1 на 5' и 3' фланги области нестабильности FRDA. Оказавшись в локусе, RGN будет вырезать область нестабильности FA. Иссечение области можно проверить с помощью секвенирования локуса Illumina.
Таблица 20
Геномные последовательности-мишени для систем RGN
Управление No. | Расположение относительно области нестабильности FRDA | Целевая последовательность генома | SEQ ID NO. |
1 | 5’ | ATCACCTGAGGTCCGGAGTTCAAGA | 468 |
2 | 5’ | GTCTTGAACTCCGGACCTCAGGTGA | 469 |
3 | 5’ | TGAACTCCGGACCTCAGGTGATCCA | 470 |
4 | 3’ | GAAAAGTTAGCCGGGCGTGGTGTCG | 471 |
Пример 12. Целевые мутации, ответственные за заболевания серповидных клеток.
Целевые последовательности в области энхансера BCL11A (SEQ ID NO: 472) могут обеспечивать механизм увеличения количества гемоглобулина плода (HbF) для лечения или облегчения симптомов заболеваний серповидных клеток. Например, полногеномные исследования ассоциации выявили набор генетических вариаций BCL11A, которые связаны с повышенными уровнями HbF. Эти вариации представляют собой набор SNP, обнаруженных в некодирующих областях BCL11A, которые функционируют как специфичные для определенных стадий, ограниченные клонами энхансерные области. Дальнейшее исследование показало, что этот энхансер BCL11A необходим в эритроидных клетках для экспрессии BCL11A (Bauer и др., (2013) Science № 343: cc. 253-257, включена в описание изобретения в качестве ссылки). Область энхансера была обнаружена в интроне 2 гена BCL11A, и были идентифицированы три области гиперчувствительности к ДНКазе I (часто указывающие на состояние хроматина, связанное с регуляторным потенциалом) в интроне 2. Эти три области были идентифицированы как +62, +58 и +55 в соответствии с расстоянием в килобазах от сайта начала транскрипции BCL11A. Эти энхансерные области составляют примерно 350 (+55); 550 (+58); и 350 (+62) нуклеотидов в длину (Bauer и др., 2013).
Пример 12.1. Определение предпочтительных систем RGN.
Здесь мы описываем возможное лечение бета-гемоглобинопатий с использованием системы RGN, которая нарушает связывание BCL11A с его сайтом связывания в локусе HBB, который является геном, ответственным за образование бета-глобина в гемоглобине взрослых. Этот подход использует NHEJ, который более эффективен в клетках млекопитающих. Кроме того, этот подход использует нуклеазу достаточно маленького размера, которая может быть упакована в один вектор AAV для доставки in vivo.
Мотив энхансера GATA1 в области энхансера BCL11A человека (SEQ ID NO: 472) является идеальной мишенью для разрушения с использованием нуклеаз, управляемых РНК (RGN), для снижения экспрессии BCL11A с одновременной повторной экспрессией HbF в эритроцитах взрослого человека (Wu и др. (2019) Nat Med 387: с. 2554). Несколько последовательностей PAM, совместимых с APG07433.1 и APG08290.1, легко обнаруживаются в генетическом локусе, окружающем этот сайт GATA1. Эти нуклеазы имеют последовательность PAM 5'-NNNNCC-3 '(SEQ ID NO: 6) и компактны по размеру, что потенциально позволяет их доставку вместе с соответствующей управляющей РНК в один AAV или аденовирусный вектор. Этот подход к доставке дает множество преимуществ по сравнению с другими, таких как доступ к гемопоэтическим стволовым клеткам и хорошо установленный профиль
- 63 046542 безопасности и способы получения.
Обычно используемая нуклеаза Cas9 из S. pyogenes (SpyCas9) требует последовательностей PAM 5'-NGG-3' (SEQ ID NO: 448), некоторые из которых присутствуют рядом с мотивом GATA1. Однако размер SpyCas9 не позволяет упаковку в один AAV или аденовирусный вектор и, таким образом, лишает этот подход вышеупомянутых преимуществ. Хотя можно использовать стратегию двойной доставки, это значительно усложнит производство и повысит стоимость. Кроме того, двойная доставка вирусного вектора значительно снижает эффективность коррекции генов, поскольку для успешного редактирования данной клетки требуется инфицирование обоими векторами.
Получают кассету экспрессии, кодирующую оптимизированный по кодонам человека APG07433.1 (SEQ ID NO: 128) или APG08290.1 (SEQ ID NO: 130), аналогично способу, описанному в примере 6. Кассеты экспрессии, которые экспрессируют управляющие РНК для RGN APG07433. 1 и APG08290.1 также производятся. Эти управляющие РНК включают 1) последовательность протоспейсера, которая комплементарна не кодирующей или кодирующей цепи ДНК в локусе энхансера BCL11A (целевая последовательность), и 2) последовательность РНК, необходимую для ассоциации направляющей РНК с RGN (SEQ ID NO: 18 для APG07433.1 и SEQ ID NO: 35 для APG08290.1). Поскольку несколько потенциальных последовательностей PAM для нацеливания с помощью APG07433.1 или APG08290.1 окружают мотив энхансера BCL11A GATA1, создается несколько потенциальных направляющих РНК-конструкций для определения наилучшей последовательности протоспейсера, которая обеспечивает надежное расщепление и опосредованное NHEJ нарушение последовательности энхансера BCL11A GATA1. Целевые геномные последовательности в таблице, представленной ниже (табл. 21) оцениваются для направления RGN в этот локус.
Таблица 21
L | елевые последовательности для локуса энхансера BCL11A GATA1 | ||
Управление | Нуклеааза | Целевая последовательность генома | Целевая SEQ ID NO. |
1 | APG07433.1 | GCACTAGACTAGCTTCAAAGTTGTAG | 473 |
2 | APG07433.1 | CCTAATCAGAGGCCAAACCCTTCCTG | 474 |
3 | APG07433.1 | CAAGCTAACAGTTGCTTTTATCACAG | 475 |
4 | APG08290.1 | GCACTAGACTAGCTTCAAAGTTGTAG | 476 |
5 | APG08290.1 | CCTAATCAGAGGCCAAACCCTTCCTG | 477 |
6 | APG08290.1 | CAAGCTAACAGTTGCTTTTATCACAG | 478 |
Для оценки эффективности, с которой APG07433.1 или APG08290.1 генерирует вставки или делеции, которые нарушают область энхансера BCL11A, используются линии клеток человека, такие как клетки эмбриональной почки человека (клетки НЕК). Получают ДНК-вектор, включающий в себя кассету экспрессии RGN (например, как описано в примере 6). Также получают отдельный вектор, содержащий кассету экспрессии с кодирующей последовательностью для последовательности управляющей РНК из табл. 21. Такая кассета экспрессии может дополнительно содержать промотор U6 РНК-полимеразы III человека (SEQ ID NO: 139), как описано в примере 6. Кроме того, можно использовать один вектор, содержащий кассеты экспрессии как RGN, так и управляющей РНК. Вектор вводят в клетки НЕК с использованием стандартных методик, таких как описанные в примере 6, и клетки культивируют в течение 1 -3 дней. После этого периода культивирования выделяют геномную ДНК и определяют частоту вставок или делеций с использованием расщепления эндонуклеазой I T7 и/или прямого секвенирования ДНК, как описано в примере 6.
Область ДНК, охватывающую целевой участок BCL11A, амплифицируют с помощью ПЦР с праймерами, содержащими выступающие последовательности Illumina Nextera XT. Эти ПЦР-ампликоны либо исследуют на образование NHEJ с использованием расщепления эндонуклеазой I Т7, либо подвергают подготовке библиотеки в соответствии с протоколом метагеномного секвенирования библиотеки Illumina 16S или аналогичной подготовкой библиотеки секвенирования следующего поколения (NGS). После глубокого секвенирования генерированные чтения анализируются CRISPResso для расчета скорости редактирования. Выходные выравнивания подбираются вручную для подтверждения сайтов вставки и делеции. Этот анализ определяет предпочтительную RGN и соответствующую предпочтительную управляющую РНК (sgPHK). Анализ может привести к тому, что как APG07433.1, так и APG08290.1 будут в равной степени предпочтительны. Кроме того, анализ может определить, что существует более одной предпочтительной управляющей РНК или что все целевые геномные последовательности в табл. 21 являются одинаково предпочтительными.
Пример 12.2. Анализ экспрессии гемоглобина плода.
В этом примере генерированные APG07433.1 или APG08290.1 вставки или делеции, нарушающие область энхансера BCL11A, анализируются на экспрессию гемоглобина плода. Используют CD34+гемопоэтические стволовые клетки (HSC) здорового донора человека. Эти HSC культивируют, и вектор (ы), содержащий кассеты экспрессии с кодирующими областями предпочтительной RGN и предпочтительной sgPHK, вводят с использованием способов, аналогичных тем, которые описаны в примере
- 64 046542
11.1. После электропорации эти клетки дифференцируются in vitro в эритроциты с использованием установленных протоколов (например, Giarratana et al. (2004) Nat Biotechnology 23: 69-74, включенный в настоящее описание в качестве ссылки). Затем измеряют экспрессию HbF с помощью вестерн-блоттинга с антителом против HbF человека или количественно определяют с помощью высокоэффективной жидкостной хроматографии (ВЭЖХ). Ожидается, что успешное разрушение локуса энхансера BCL11A приведет к увеличению продукции HbF по сравнению с HSC, электропорированными только с RGN, но без проводника.
Пример 12.3: Анализ уменьшения образования серповидных клеток.
В этом примере генерированные APG07433.1 или APG08290.1 вставки или делеции, нарушающие область энхансера BCL11A, анализируются с точки зрения снижения образования серповидных клеток. Используются донорские CD34+гемопоэтические стволовые клетки (HSC) от пациентов, страдающих серповидно-клеточной анемией. Эти HSC культивируют, и вектор(ы), содержащий кассеты экспрессии с кодирующими областями предпочтительной RGN и предпочтительной sgPHK, вводят с использованием способов, аналогичных тем, которые описаны в примере 11.1. После электропорации эти клетки дифференцируются in vitro в эритроциты с использованием установленных протоколов (Giarratana и др. (2004) Nat Biotechnology № 23: cc. 69-74). Затем измеряют экспрессию HbF с помощью вестерн-блоттинга с антителом против HbF человека или количественно определяют с помощью высокоэффективной жидкостной хроматографии (ВЭЖХ). Ожидается, что успешное разрушение локуса энхансера BCLIIA приведет к увеличению продукции HbF по сравнению с HSC, электропорированными только с RGN, но без проводника.
В этих дифференцированных эритроцитах образование серповидных клеток индуцируется добавлением метабисульфита. Количество серповидных и нормальных эритроцитов подсчитывают с помощью микроскопа. Ожидается, что количество серповидных клеток меньше в клетках, обработанных APG07433.1 или APG08290.1 плюс sgPHK, чем в клетках, необработанных или обработанных только RGN.
Пример 12.4. Подтверждение лечения заболевания на мышиной модели.
Для оценки эффективности использования APG07433.1 или APG08290.1, разрушающих локус BCL11A, используются подходящие гуманизированные мышиные модели с серповидно-клеточной анемией. Кассеты экспрессии, кодирующие предпочтительную RGN и предпочтительную sgPHK, упаковывают в векторы AAV или аденовирусные векторы. В частности, аденовирус типа Ad5/35 эффективен в отношении HSC. Выбрана подходящая модель мыши, содержащая гуманизированный локус НВВ с аллелями серповидных клеток, такая как В6; FVB-Tg (LCR-HBA2, LCR-HBB * E26K) 53Hhb/J или B6.CgHbatm1Paz Hbbtm1Tow Tg (HBA-HBBs) 41Paz/HhbJ. Этим мышам вводят гранулоцитарный колониестимулирующий фактор отдельно или в комбинации с плериксафором для мобилизации HSC в кровоток. Затем внутривенно вводят AAV или аденовирусы, несущие RGN и управляющую плазмиду, и мышам дают возможность восстановиться в течение недели. Кровь, полученная от этих мышей, тестируется в тесте серпинга на серповидные клетки in vitro с использованием метабисульфита, и за мышами наблюдают в долгосрочном плане для отслеживания показателей смертности и кроветворной функции. Ожидается, что лечение AAV или аденовирусами, несущими RGN и управляющую РНК, снизит серповидность, смертность и улучшит гематопоэтическую функцию по сравнению с мышами, получавшими лечение вирусами, не имеющими обеих кассет экспрессии, или вирусами, несущими только кассету экспрессии RGN.
Claims (26)
1. Молекула нуклеиновой кислоты, содержащая полинуклеотид, кодирующий полипептид РНКуправляемой нуклеазы (RGN), где указанный полинуклеотид содержит нуклеотидную последовательность, кодирующую полипептид RGN, содержащую аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 11 или 27;
где указанный полипептид RGN связывает последовательность целевой ДНК специфическим для РНК-управляемой последовательности образом при связывании с управляющей РНК (gPHK), способной гибридизоваться с указанной последовательностью целевой ДНК.
2. Молекула нуклеиновой кислоты, содержащая полинуклеотид, кодирующий полипептид РНКуправляемой нуклеазы (RGN), где указанный полинуклеотид содержит нуклеотидную последовательность, кодирующую полипептид RGN, содержащую аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 11 или 27.
3. Молекула нуклеиновой кислоты по п.1 или 2, где указанный полинуклеотид, кодирующий полипептид RGN, функционально связан с гетерологичным промотором.
4. Молекула нуклеиновой кислоты по любому из пп.1-3, где указанный полипептид RGN не является активной нуклеазой или функционирует как никаза.
5. Молекула нуклеиновой кислоты по п.4, где полипептид RGN функционально слит с полипептидом, редактирующим основание.
6. Вектор, содержащий молекулу нуклеиновой кислоты по любому из пп.1-5.
7. Вектор по п.6, в котором указанный вектор дополнительно содержит по меньшей мере одну нуклеотидную последовательность, кодирующую указанную управляющую РНК, и где управляющая РНК
- 65 046542 содержит РНК CRISPR, содержащую повторяющуюся последовательность CRISPR, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 12 или 28.
8. Вектор по п.6 или 7, отличающийся тем, что управляющая РНК содержит tracrPHK по меньшей мере на 95% идентичную последовательности SEQ ID NO: 13 или 29.
9. Клетка, содержащая молекулу нуклеиновой кислоты по любому из пп.1-5 или вектор по любому из пп.6-8.
10. Полипептид РНК-управляемой нуклеазы (RGN), содержащий аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 11 или 27.
11. Полипептид RGN по п.10, где указанный RGN полипептид содержит аминокислотные последовательности SEQ ID NO: 11 или 27.
12. Система связывания последовательности целевой ДНК, которая включает в себя:
а) одну или несколько управляющих РНК, способных гибридизоваться с указанной последовательностью целевой ДНК или с одной или несколькими нуклеотидными последовательностями, кодирующими одну или несколько управляющих РНК (gPHK) и
б) полипептид РНК-управляемой нуклеазы (RGN), содержащий аминокислотную последовательность, по меньшей мере на 95% идентичную последовательности SEQ ID NO: 11 или 27, или нуклеотидную последовательность, кодирующую полипептид RGN, где одна или несколько управляющих РНК гибридизуются с последовательностью целевой ДНК и где одна или несколько управляющих РНК образуют комплекс с полипептидом RGN, тем самым заставляя указанный полипептид RGN связываться с указанной последовательностью целевой ДНК.
13. Система по п.12, где по меньшей мере одна указанная нуклеотидная последовательность, кодирующая одну или более управляющих РНК, и указанная нуклеотидная последовательность, кодирующая полипептид RGN, каждая функционально связана с промотором, гетерологичным к указанной нуклеотидной последовательности.
14. Система по п.12 или 13, в которой целевая последовательность ДНК находится внутри эукариотической клетки.
15. Система по любому из пп.12-14, в которой указанный полипептид RGN является не активной нуклеазой или функционирует как никаза, и где полипептид RGN функционально связан с полипептидом, редактирующим основание.
16. Система по любому из пп.12-15, отличающаяся тем, что указанная система дополнительно включает один или несколько донорных полинуклеотидов или одну или несколько нуклеотидных последовательностей, кодирующих один или несколько донорных полинуклеотидов, причем каждая из указанных нуклеотидных последовательностей, кодирующих один или несколько донорных полинуклеотидов, функционально связана с промотором, гетерологичным для каждой указанной нуклеотидной последовательности.
17. Применение системы по любому из пп.12-16 в качестве лекарственного средства.
18. Применение системы по любому из пп.12-16 в способе лечения генетически наследуемых болезней, где указанный способ содержит доставку системы к указанной последовательности целевой ДНК или клетке, содержащей последовательность целевой ДНК.
19. Способ связывания последовательности целевой ДНК, включающий доставку системы согласно любому из вариантов осуществления изобретения по пп.12-16 к указанной последовательности целевой ДНК или к клетке, содержащей последовательность целевой ДНК.
20. Способ расщепления и/или модификации последовательности целевой ДНК, включающий приведение последовательности целевой ДНК в контакт с:
а) полипептидом РНК-управляемой нуклеазы (RGN), где указанная RGN содержит аминокислотную последовательность по меньшей мере на 95% идентичную последовательности SEQ ID NO: 11 или 27; и
б) одной или несколькими управляющими РНК, способными нацеливать RGN (а) на последовательность целевой ДНК, где одна или несколько управляющих РНК гибридизуются с целевой последовательностью ДНК, тем самым направляя указанный полипептид RGN на связывание с указанной целевой последовательностью ДНК, и таким образом происходит расщепление и/или модификация указанной целевой последовательности ДНК.
21. Способ по п.20, в котором указанная модифицированная последовательность целевой ДНК включает вставку гетерологичной ДНК в последовательность целевой ДНК.
22. Способ по п.20, где указанная модифицированная последовательность целевой ДНК включает делецию по меньшей мере одного нуклеотида из последовательности целевой ДНК.
23. Способ по п.20, где указанная модифицированная последовательность целевой ДНК содержит мутацию по меньшей мере одного нуклеотида в последовательности целевой ДНК.
24. Способ по любому из пп.20-23, отличающийся тем, что последовательность целевая ДНК находится внутри клетки.
25. Способ по п.24, в котором клетка является эукариотической клеткой.
26. Способ по п.24 или 25, дополнительно включающий культивирование клетки в условиях, в ко
- 66 046542 торых полипептид RGN экспрессируется и расщепляет последовательность целевой ДНК с получением модифицированной последовательности ДНК и отбор клетки, содержащей указанную модифицированную последовательность ДНК.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/680,859 | 2018-06-05 | ||
US62/680,862 | 2018-06-05 | ||
US62/680,846 | 2018-06-05 | ||
US62/680,863 | 2018-06-05 | ||
US62/680,845 | 2018-06-05 | ||
US62/680,853 | 2018-06-05 | ||
US62/686,901 | 2018-06-19 | ||
US62/805,041 | 2019-02-13 | ||
US62/805,045 | 2019-02-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
EA046542B1 true EA046542B1 (ru) | 2024-03-26 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11926843B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
EP3902911B1 (en) | Polypeptides useful for gene editing and methods of use | |
US11859181B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
US20220364074A1 (en) | Rna-guided nucleases and active fragments and variants thereof and methods of use | |
WO2023139557A1 (en) | Rna-guided nucleases and active fragments and variants thereof and methods of use | |
CA3125175A1 (en) | Polypeptides useful for gene editing and methods of use | |
EA046542B1 (ru) | Рнк-управляемые нуклеазы и активные фрагменты, и их варианты и способы применения | |
JP7572360B2 (ja) | 遺伝子編集に有用なポリペプチドと利用方法 | |
EA047491B1 (ru) | Рнк-направляемые нуклеазы, их активные фрагменты и варианты, а также способы применения | |
CN118813654A (zh) | Rna指导的核酸酶及其活性片段及变体以及使用方法 |