CN117925585A - 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 - Google Patents
腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 Download PDFInfo
- Publication number
- CN117925585A CN117925585A CN202410261107.5A CN202410261107A CN117925585A CN 117925585 A CN117925585 A CN 117925585A CN 202410261107 A CN202410261107 A CN 202410261107A CN 117925585 A CN117925585 A CN 117925585A
- Authority
- CN
- China
- Prior art keywords
- seq
- amino acid
- acid sequence
- base editor
- adenosine deaminase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 title claims abstract description 129
- 102000055025 Adenosine deaminases Human genes 0.000 title claims abstract description 128
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 59
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 59
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 137
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 31
- 201000010099 disease Diseases 0.000 claims abstract description 25
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 19
- 102000040430 polynucleotide Human genes 0.000 claims description 92
- 108091033319 polynucleotide Proteins 0.000 claims description 92
- 239000002157 polynucleotide Substances 0.000 claims description 92
- 125000003729 nucleotide group Chemical group 0.000 claims description 88
- 239000002773 nucleotide Substances 0.000 claims description 87
- 150000007523 nucleic acids Chemical class 0.000 claims description 83
- 102000039446 nucleic acids Human genes 0.000 claims description 76
- 108020004707 nucleic acids Proteins 0.000 claims description 76
- 108090000623 proteins and genes Proteins 0.000 claims description 63
- 230000000694 effects Effects 0.000 claims description 57
- 102000004169 proteins and genes Human genes 0.000 claims description 52
- 230000027455 binding Effects 0.000 claims description 48
- 238000006467 substitution reaction Methods 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 33
- 238000006481 deamination reaction Methods 0.000 claims description 26
- 230000035772 mutation Effects 0.000 claims description 26
- 230000009615 deamination Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 21
- 239000008194 pharmaceutical composition Substances 0.000 claims description 10
- 108010088141 Argonaute Proteins Proteins 0.000 claims description 9
- 102000008682 Argonaute Proteins Human genes 0.000 claims description 9
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 8
- 239000003937 drug carrier Substances 0.000 claims description 8
- 102220539911 Alkaline phosphatase, placental type_I89L_mutation Human genes 0.000 claims description 7
- 102220558104 Galectin-8_F19Y_mutation Human genes 0.000 claims description 7
- 102220538483 Methionine-tRNA ligase, cytoplasmic_L81N_mutation Human genes 0.000 claims description 7
- 102220559160 NADH dehydrogenase [ubiquinone] 1 alpha subcomplex subunit 9, mitochondrial_S15T_mutation Human genes 0.000 claims description 7
- 102220580583 NEDD4-binding protein 2-like 1_K33R_mutation Human genes 0.000 claims description 7
- 102220210869 rs1057524586 Human genes 0.000 claims description 7
- 102220038239 rs145529594 Human genes 0.000 claims description 7
- 102220276589 rs1553130284 Human genes 0.000 claims description 7
- 102220101260 rs536357058 Human genes 0.000 claims description 7
- 102220036871 rs587780095 Human genes 0.000 claims description 7
- 102220046159 rs587782693 Human genes 0.000 claims description 7
- 102200037607 rs771019366 Human genes 0.000 claims description 7
- 102220290157 rs771847879 Human genes 0.000 claims description 7
- 102220486288 Mannose-1-phosphate guanyltransferase beta_N20Q_mutation Human genes 0.000 claims description 6
- 102220509950 Olfactory receptor 4D2_L29I_mutation Human genes 0.000 claims description 6
- 102220470514 Proteasome subunit beta type-3_V82A_mutation Human genes 0.000 claims description 6
- 102220579503 SUN domain-containing protein 5_T92D_mutation Human genes 0.000 claims description 6
- 102220545633 Xylulose kinase_W24Y_mutation Human genes 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 102200141619 rs1051266 Human genes 0.000 claims description 6
- 102220209838 rs1057520382 Human genes 0.000 claims description 6
- 102220250971 rs1554716504 Human genes 0.000 claims description 6
- 102220074645 rs796053245 Human genes 0.000 claims description 6
- 239000004215 Carbon black (E152) Substances 0.000 claims description 3
- 239000003814 drug Substances 0.000 claims description 3
- 108091033409 CRISPR Proteins 0.000 description 54
- 210000004027 cell Anatomy 0.000 description 41
- 150000001413 amino acids Chemical class 0.000 description 38
- 229930024421 Adenine Natural products 0.000 description 28
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 28
- 108020005004 Guide RNA Proteins 0.000 description 28
- 229960000643 adenine Drugs 0.000 description 28
- 239000013612 plasmid Substances 0.000 description 27
- 102000053602 DNA Human genes 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 23
- 101710163270 Nuclease Proteins 0.000 description 22
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 19
- 238000001890 transfection Methods 0.000 description 19
- 108090000765 processed proteins & peptides Proteins 0.000 description 17
- 239000013604 expression vector Substances 0.000 description 15
- 239000002609 medium Substances 0.000 description 15
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 13
- 208000011580 syndromic disease Diseases 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 10
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 10
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 10
- 108091028113 Trans-activating crRNA Proteins 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 10
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 description 9
- 101150038500 cas9 gene Proteins 0.000 description 9
- 125000006850 spacer group Chemical group 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 7
- 229960005305 adenosine Drugs 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- -1 rRNA Proteins 0.000 description 7
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000030648 nucleus localization Effects 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 108010028554 LDL Cholesterol Proteins 0.000 description 4
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 4
- 206010029260 Neuroblastoma Diseases 0.000 description 4
- 208000006289 Rett Syndrome Diseases 0.000 description 4
- 201000006783 Seckel syndrome Diseases 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003301 hydrolyzing effect Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000000415 inactivating effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010010234 HDL Lipoproteins Proteins 0.000 description 3
- 102000015779 HDL Lipoproteins Human genes 0.000 description 3
- 208000035150 Hypercholesterolemia Diseases 0.000 description 3
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- 108010007622 LDL Lipoproteins Proteins 0.000 description 3
- 102000007330 LDL Lipoproteins Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108010044159 Proprotein Convertases Proteins 0.000 description 3
- 102000006437 Proprotein Convertases Human genes 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000000051 modifying effect Effects 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 239000000546 pharmaceutical excipient Substances 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 102000014461 Ataxins Human genes 0.000 description 2
- 108010078286 Ataxins Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 206010008025 Cerebellar ataxia Diseases 0.000 description 2
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 208000037571 Ear-patella-short stature syndrome Diseases 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 2
- 101150106478 GPS1 gene Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 201000008645 Joubert syndrome Diseases 0.000 description 2
- 201000007493 Kallmann syndrome Diseases 0.000 description 2
- 108010001831 LDL receptors Proteins 0.000 description 2
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 2
- 201000011062 Li-Fraumeni syndrome Diseases 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 208000007794 Meier-Gorlin syndrome Diseases 0.000 description 2
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 206010053142 Olfacto genital dysplasia Diseases 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102100036007 Ribonuclease 3 Human genes 0.000 description 2
- 101710192197 Ribonuclease 3 Proteins 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- 208000010641 Tooth disease Diseases 0.000 description 2
- 208000014769 Usher Syndromes Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 201000002779 amyotrophic lateral sclerosis type 10 Diseases 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 201000004562 autosomal dominant cerebellar ataxia Diseases 0.000 description 2
- 230000008512 biological response Effects 0.000 description 2
- 108700023293 biotin carboxyl carrier Proteins 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000004067 bulking agent Substances 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012136 culture method Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 235000019359 magnesium stearate Nutrition 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 239000000454 talc Substances 0.000 description 2
- 229910052623 talc Inorganic materials 0.000 description 2
- 235000012222 talc Nutrition 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- JEPVUMTVFPQKQE-AAKCMJRZSA-N 2-[(1s,2s,3r,4s)-1,2,3,4,5-pentahydroxypentyl]-1,3-thiazolidine-4-carboxylic acid Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C1NC(C(O)=O)CS1 JEPVUMTVFPQKQE-AAKCMJRZSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 210000003771 C cell Anatomy 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 101100273274 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) cas8b gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 241000711408 Murine respirovirus Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 101150044917 Prl3b1 gene Proteins 0.000 description 1
- 101150113550 Prl3d1 gene Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100168469 Rattus norvegicus Capns1 gene Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 101100082060 Xenopus laevis pou5f1.1 gene Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 239000012867 bioactive agent Substances 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 235000001465 calcium Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150102600 cas5a gene Proteins 0.000 description 1
- 101150084354 cas5d gene Proteins 0.000 description 1
- 101150106467 cas6 gene Proteins 0.000 description 1
- 101150044165 cas7 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 101150037603 cst-1 gene Proteins 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 230000007711 cytoplasmic localization Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 208000004731 long QT syndrome Diseases 0.000 description 1
- 201000006905 long QT syndrome 2 Diseases 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000006082 mold release agent Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000003836 peripheral circulation Effects 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 235000016804 zinc Nutrition 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/06—Antihyperlipidemics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Diabetes (AREA)
- Hematology (AREA)
- Obesity (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明公开了一种腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途。本发明提供了一种腺苷脱氨酶,其包含以下序列中的一种或多种:(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列;(ii)与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少80%同一性的氨基酸序列;(iii)在SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列等。本发明提供的腺苷脱氨酶,在构成碱基编辑器及用于碱基编辑器系统时,具有优异的编辑效率以及极窄的编辑窗口,促进了疾病的靶向治疗、以及在精准治疗中的应用。
Description
本申请是申请日为2022年4月7日,申请号为202210363757.1,发明名称为“腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途”的中国专利申请的分案申请。
技术领域
本发明属于生物技术领域,更具体地,本发明涉及腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途。
背景技术
如何精准、高效地对基因组进行修饰是生命科学领域研究的重要目标,而CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9介导的基因编辑技术成为实现该目标的最强工具。传统的CRISPR/Cas9技术通过在靶点处产生DNA双链断裂(Double Strand Breaks,DSB),从而诱发细胞内的同源重组(HomologousRecombination,HR)和非同源末端连接(Non-Homologous End Joining,NHEJ)修复途径,进而实现对基因组DNA的定点敲除、替换、插入等修饰。然而,DSB引发的DNA修复很难实现高效稳定的单碱基突变。
单核苷酸变异会导致大约2/3人类遗传病的发生,也是许多动植物重要性状变异的遗传基础,因此开发一种精准且能够高效实现单碱基替换的技术尤为重要,David R.Liu实验室开发的碱基编辑器就是为此而生的。David R.Liu实验室开发了三种不同的碱基编辑器,分别是胞嘧啶碱基编辑器(Cytosine Base Editor,CBE)、腺嘌呤碱基编辑器(Adenine Base Editor,ABE)和先导编辑器(Prime Editor),这些碱基编辑器在工作时不依赖DSB的产生,也不需要供体DNA的参与。
以腺苷脱氨酶为基础的腺嘌呤碱基编辑技术主要是利用由切口酶Cas9n(D10A)或dCas9结合腺苷脱氨酶组成融合蛋白,在sgRNA的引导下,将位于碱基编辑活性窗口内的靶碱基腺嘌呤A脱氨形成次黄嘌呤I,再经DNA修复和复制后逐渐被替换为G,最终形成A向G的定向替换(A至G)。
但是目前的碱基编辑器存在位点依赖性的编辑效率的差异,并且编辑窗口较宽导致非必要的编辑,因此对现有碱基编辑器的改造十分必要。
发明内容
发明要解决的问题
本发明的目的在于克服上述缺点,提供了一种新的腺苷脱氨酶,以及包含该腺苷脱氨酶的碱基编辑器融合蛋白、碱基编辑器系统,以提高A·T到G·C的编辑效率并提高碱基编辑的精确性(缩小编辑窗口)。
用于解决问题的方案
在本发明的一些方面,提供了一种腺苷脱氨酶,其包含以下序列中的一种或多种:
(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列;
(ii)与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ IDNO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性;
(iii)在SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
在一些实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:
S15、D16、H17、F19、N20、D21、E22、Y23、W24、R26、H27、L29、K33、R34、A35、V41、V43、L47、L49、N59、A61、I62、A69、E72、G80、L81、V82、L83、Q84、N85、Y86、I89、D90、A91、T92、V95、F97、I112、S113、R114、L115、F117、V119、R120、N121、K123、R124、N132、V133、L134、N135、P137、G138和M139。
在另一些实施方案中,所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代:
K19、A20、R21、E22、V33、L34、D35、D36、A46、I47、T48、L49、V80、T81、F82、E83、P84、I97、K98、R99、G103、V104、S105、N106、S107、K108、R109、G110、L116、N117、V118、L119、N120、Y121、P122、G123、C144、Q145、F146、Y147、Q148、Q149、P150、R151、E152、V153、F154、N155。
在一些具体的实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L。
在一些更具体的实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代:
(1)S15T、D16E、H17K、F19Y、N20Q;
(2)E22D、Y23F、W24F、R26K、H27R、L29I;
(3)K33R、R34K、A35S;
(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W;
(5)I89L、D90G、A91T、T92D;
(6)I112L、S113K、R114K;
(7)N132K、V133I、L134F、N135H;和/或
(8)P137F、G138A、M139L。
在本发明的一些方面,提供了一种碱基编辑器融合蛋白,其包含上述的腺苷脱氨酶,以及核酸可编程核苷酸结合结构域。
在一些实施方案中,所述核酸可编程核苷酸结合结构域为Cas蛋白或AGO蛋白。
在一些实施方案中,所述碱基编辑器融合蛋白中还包括至少一条核定位信号序列。
在一些可选的实施方案中,所述碱基编辑器融合蛋白中还包括接头。在一些任选的实施方案中,所述接头包含如SEQ ID NO:3~12所示的序列中的一种或多种。
在一些具体的实施方案中,所述碱基编辑器融合蛋白包含以下序列中的一种或多种:
(i)如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列;
(ii)与SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;
(iii)在SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
在一些更具体的实施方案中,所述的碱基编辑器融合蛋白包含SEQ ID NO:46~53所示序列中的任一种。
在本发明的一些方面,提供了一种多核苷酸,其编码上述的腺苷脱氨酶或者编码上述的碱基编辑器融合蛋白。
在本发明的一些方面,提供了一种载体,其包含上述的多核苷酸。
在本发明的一些方面,提供了一种细胞,其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸和上述的载体中的一种或多种。
在本发明的一些方面,提供了一种碱基编辑器系统,其包含上述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸;或者,其包含上述的碱基编辑器融合蛋白,以及引导多核苷酸。
在本发明的一些方面,提供了一种药物组合物,其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种,以及药学上可接受的载体。
在本发明的一些方面,提供了一种试剂盒,其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种。
在本发明的一些方面,提供了一种递送系统,其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种,以及递送介质。
在本发明的一些方面,提供了一种核酸的碱基编辑方法,其包括将待被编辑碱基的核酸与上述的碱基编辑器系统相接触的步骤。
在本发明的一些方面,提供了上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞、上述的碱基编辑器系统、上述的药物组合物或上述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。
发明的效果
本发明提供的新的腺苷脱氨酶,在构成碱基编辑器及用于碱基编辑器系统时,具有优异的编辑效率以及极窄的编辑窗口,促进了疾病的靶向治疗,并且促进了碱基编辑器在精准治疗中的应用。
附图说明
图1A和图1B分别为PHK09质粒图谱(图1A)以及p004V1-nCas9结构图(图1B)。
图2为p004V1-nCas9在位点1处A·T到G·C的编辑效率,其包括A~C,图2中的A为p004V1-nCas9和ABE8e在位点1的编辑效率的比较,编辑位置为sgRNA 5’端起+3,+5,+7,+8的腺嘌呤脱氧核苷酸,误差线表示平均值±SEM,每组样品3个生物学重复;图2中的B为碱基编辑器p004V1-nCas9转染后在位点1的测序结果;图2中的C为碱基编辑器ABE8e转染后在位点1的测序结果。
图3为p004V1-nCas9在位点17处A·T到G·C的编辑效率,其包括A~C,图3中的A为p004V1-nCas9和ABE8e在位点17的编辑效率的比较,编辑位置为sgRNA 5’端起+3,+4,+5,+7的腺嘌呤脱氧核苷酸,误差线表示平均值±SEM,每组样品3个生物学重复;图3中的B为碱基编辑器p004V1-nCas9转染后在位点17的测序结果;图3中的C为碱基编辑器ABE8e转染后在位点17的测序结果。
图4为p004V1-nCas9在位点18处A·T到G·C的编辑效率,其包括A~C,图4中的A为p004V1-nCas9和ABE8e在位点18的编辑效率的比较,编辑位置为sgRNA 5’端起+3,+5,+7,+9的腺嘌呤脱氧核苷酸,误差线表示平均值±SEM,每组样品3个生物学重复;图4中的B为碱基编辑器p004V1-nCas9转染后在位点18的测序结果;图4中的C为碱基编辑器ABE8e转染后在位点18的测序结果。
图5为p004V1-nCas9在PCSK9位点处A·T到G·C的编辑效率,其包括A~C,图5中的A为p004V1-nCas9和ABE8e在PCSK9位点的编辑效率的比较,编辑位置为sgRNA5’端起+6的腺嘌呤脱氧核苷酸,误差线表示平均值±SEM,每组样品3个生物学重复;图5中的B为碱基编辑器p004V1-nCas9转染后在PCSK9位点的测序结果;图5中的C为碱基编辑器ABE8e转染后在PCSK9位点的测序结果。
图6为004V1各个突变体-nCas9在不同位点的编辑效率。
图7为p005V1-nCas9质粒图谱。
图8为p005V1-nCas9在位点1处A·T到G·C的编辑效率,其包括A~C,图8中的A为p005V1-nCas9和ABE8e在位点1的编辑效率的比较,编辑位置为sgRNA 5’端起+3,+5,+7,+8的腺嘌呤脱氧核苷酸,误差线表示平均值±SEM,每组样品3个生物学重复;图8中的B为碱基编辑器p005V1-nCas9转染后在位点1的测序结果;图8中的C为碱基编辑器ABE8e转染后在位点1的测序结果。
具体实施方式
为了更容易理解本发明,以下具体定义了某些技术和科学术语。除非在本文中另有明确定义,本文使用的所有其它技术和科学术语都具有本发明所属领域的一般技术人员通常理解的含义。
本说明书中,使用“数值A~数值B”表示的数值范围是指包含端点数值A、B的范围。
本说明书中,使用“基本上”或“实质上”表示与理论模型或理论数据的标准偏差在5%、优选为3%、更优选为1%范围以内。
本说明书中,使用“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。
本说明书中,“任选的”或“任选地”是指接下来描述的事件或情况可发生或可不发生,并且该描述包括该事件发生的情况和该事件不发生的情况。
本说明书中,所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如,特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中,并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外,应理解,所述要素可以任何合适的方式组合在各种实施方案中。
如本公开所使用的,术语“核酸”和“核酸分子”是指包含核碱基和酸性部分的化合物,例如核苷、核苷酸或核苷酸的聚合物。通常,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻核苷酸通过磷酸二酯键相互连接。在一些实施方案中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如,至少三个核苷酸的串)。在一些实施方案中,“核酸”包括RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的上下文中。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA、人工染色体、工程基因组或其片段,或合成的DNA、RNA、DNA/RNA杂交体、或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物,例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下,例如在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰碱基的类似物或糖和骨架修饰。
如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。
如本公开所使用的,“融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂化多肽。一种蛋白质可位于融合蛋白的氨基-末端(N-末端,N端)部分或羧基-末端(C-末端,C端)蛋白处,因此分别形成“氨基-末端融合蛋白”或“羧基-末端融合蛋白”。本文提供的任何蛋白质可通过本领域已知的任何方法产生。例如,本文提供的蛋白质可经由重组蛋白质表达和纯化来产生,这尤其适合于包含肽接头的融合蛋白。用于重组蛋白质表达和纯化的方法是公知的,并且包括以下中所述的那些:Green and Sambrook,MolecularCloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.(2012)),其全部内容通过引用并入本文。
如本公开所使用的,术语“CRISPR”是指成簇、规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats),其来自微生物的免疫系统。
如本公开所使用的,术语“Cas蛋白”是指CRISPR-associated蛋白,Cas蛋白与CRISPR序列共同构成CRISPR/Cas系统,Cas蛋白具有与核酸酶相关的功能结构域,通过识别PAM(protospacer adjacent motif)在特定位置切割靶序列。
如本公开所使用的,术语“crRNA”包含重复序列(repeat)和间隔序列(spacer),CRISPR转录形成长链的pre-CRISPR RNA(pre-crRNA),pre-crRNA加工后得到包含一段重复区序列和一段间隔区序列的短的crRNA。在一些CRISPR/Cas系统中,crRNA由Cas蛋白作用于pre-crRNA得到。在另外一些CRISPR/Cas系统中,crRNA由Cas蛋白与tracrRNA(trans-activating crRNA)共同作用于pre-crRNA得到。
在不同的CRISPR/Cas系统中,crRNA可以单独作为引导RNA(guide RNA,gRNA)引导Cas蛋白定位到位于PAM序列附近的靶序列,或者crRNA与tracrRNA合并成为单一引导RNA(single guide RNA,sgRNA)引导Cas蛋白定位到位于PAM序列附近的靶序列。
如本公开所使用的,“crRNA的引导序列”是指crRNA中与目标核酸的靶序列杂交的序列,其对应由crRNA的间隔序列(spacer)形成。
如本公开所使用的,术语“靶序列”是指目标核酸中与crRNA互补或至少部分互补的核苷酸序列,Cas蛋白、crRNA与靶序列形成三元复合物后,Cas蛋白发挥对目标核酸中靶核酸链和/或非核苷酸链的特异性切割活性。在本公开中,“靶序列”与“靶核酸”、“靶多核苷酸”、“目标序列”、“目标核酸序列”可以互换地使用。
如本公开所使用的,术语“靶标链”(target strand)是指目标核酸中与crRNA杂交的核苷酸链;术语“非靶标链”(non-target strand)是指目标核酸中与crRNA不发生杂交配对的核苷酸链。
术语“Cas9”或“Cas9结构域”是指RNA引导的核酸酶,其包含Cas9蛋白或其片段(例如,包含Cas9的活性、无活性或部分活性的DNA切割结构域的蛋白,和/或gRNA Cas9的结合结构域)。Cas9核酸酶有时也称为CRISPR相关核酸酶9。如前所述,CRISPR是一种适应性免疫系统,可针对移动遗传元件(病毒、转座元件和接合质粒)提供保护。CRISPR簇包含众多短而保守的重复序列区(repeat)和间隔区(spacer)。CRISPR簇被转录并加工成pre-crRNA。在第II型CRISPR/cas9系统中,正确处理pre-crRNA需要转编码的小RNA(tracrRNA)、内源性核糖核酸酶3(RNase III)和Cas9蛋白。tracrRNA作为核糖核酸酶3辅助处理pre-crRNA的引导。随后,Cas9/crRNA/tracrRNA核酸内切切割与间隔序列互补的线性或环状dsDNA靶标。与crRNA不互补的靶标链通过核酸内切方式切割。在自然界中,DNA结合和切割通常需要蛋白质和两种RNA。然而,可以对单一引导RNA(single guide RNA,sgRNA)进行工程改造,以便将crRNA和tracrRNA的各个方面整合到单个RNA种类中。参见,如,Jinek M.等人,Science337:816-821(2012),其全部内容以引用方式并入本文。Cas9识别CRISPR重复序列(PAM或原间隔序列临近基序)中的一个短基序,以帮助区分自我与非自我。Cas9核酸酶序列和结构是本领域技术人员众所周知的(参见,如“Complete genome sequence of an M1 strain ofStreptococcus pyogenes.”Ferretti等,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPR RNA maturation by trans-encoded small RNA and host factorRNase III.”Deltcheva E.等,Nature471:602-607(2011);和“Aprogrammabledual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.等,Science337:816-821(2012))。Cas9直向同源物已在各种物种中得到描述,包括但不限于化脓链球菌和嗜热链球菌。基于本公开内容,其他合适的Cas9核酸酶和序列对本领域技术人员来说是显而易见的,并且此类Cas9核酸酶和序列包括来自Chylinski,Rhun和Charpentier,“ThetracrRNA and Cas9 families of type IICRISPR-Cas immunity systems”(2013)RNABiology10:5,726-737中公开的生物体和基因座的Cas9序列;其全部内容在此引入作为参考。
核酸酶灭活的Cas9蛋白可互换地称为“dCas9”蛋白(核酸酶-“死的”Cas9或无核酸酶活性的Cas9)或催化灭活的Cas9。用于产生具有无活性DNA切割结构域的Cas9蛋白(或其片段)是已知的(参见,如Jinek等,Science.337:816-821(2012);Qi等人“RepurposingCRISPR as an RNA-Guided Platform for Sequence-Specific Control of GeneExpression”(2013)Cell.28;152(5):1173-83)。例如,已知Cas9的DNA切割结构域包括两个子结构域,HNH核酸酶子结构域和RuvC子结构域。HNH子结构域切割与gRNA互补的链,而RuvC子结构域切割非互补链。这些子结构域内的突变可以使Cas9的核酸酶活性沉默。例如,突变D10A和H840A使化脓性链球菌Cas9的核酸酶活性完全灭活(Jinek等人,Science.337:816-821(2012);Qi等人,Cell.28:152(5):1173-83(2013))。基于本领域的知识,另外的合适的无核酸酶活性的Cas9结构域对于本领域技术人员而言将是显而易见的。此类另外的示例性合适的无核酸酶活性的Cas9结构域包括但不限于D10A/H840A、D10A/D839A/H840A和D10A/D839A/H840A/N863A突变体结构域(参见例如Prashant等,Nature Biotechnology.2013;31(9):833-838)。
Cas9切口酶能够切割双链DNA的一条链。可以通过将失活的突变引入到HNH子结构域或RuvC子结构域中来生成Cas9切口酶。例如,可以在酿脓链球菌Cas9的RuvC结构域中引入失活的突变(D10A),而HNH结构域保持有活性,即位置840处的残基保持为组氨酸。此类Cas9变体能够基于gRNA确定的靶序列在特定位置处生成单链DNA断裂(切口)。本领域技术人员能够鉴定任何已知Cas9蛋白的RuvC和HNH结构域中的催化残基并引入失活的突变以生成相应的dCas9或nCas9。
同样地,对于其他Cas蛋白,本领域技术人员可以通过同样的方式获得相应的无核酸酶活性的Cas蛋白和切割双链DNA的一条链的切口酶。
如本公开所使用的,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤水解脱氨为次黄嘌呤。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(A)水解脱氨为肌苷(I)。在一些实施方案中,脱氨酶或脱氨酶结构域是分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(DNA)中腺苷的水解脱氨。
如本公开所使用的,术语“核酸可编程核苷酸结合结构域”、“核酸可编程DNA结合蛋白(Nucleic acid programmable DNA-binding protein,napDNAbp)”是指与核酸(例如,DNA或RNA),例如引导多核苷酸(例如,gRNA)结合的蛋白质,所述核酸例如通过与靶核酸序列杂交将napDNAbp引导至特定核酸序列。例如,Cas9蛋白可以与引导RNA结合,该引导RNA将Cas9蛋白引导至与引导RNA互补的特定DNA序列。在一些实施方案中,napDNAbp是Cas9结构域,例如,核酸酶活性Cas9,Cas9切口酶(nCas9)或无核酸酶活性Cas9(dCas9)。核酸可编程DNA结合蛋白的实例包括但不限于Cas9(例如,dCas9和nCas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2c3和Argonaute蛋白(AGO)。然而,应当理解,核酸可编程DNA结合蛋白也包括结合RNA的核酸可编程蛋白。例如,napDNAbp可以与将napDNAbp引导至RNA的核酸结合。其他核酸可编程DNA结合蛋白也在本公开内容的范围内,尽管它们可能未在本公开内容中具体描述。
如本公开所使用的,“碱基编辑器(Base Editor,BE)”或“核碱基编辑器”是指结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中,碱基编辑器包含核碱基修饰多肽(例如,脱氨酶)和与引导多核苷酸(例如,引导RNA)结合的核酸可编程核苷酸结合结构域(例如,核酸可编程DNA结合蛋白)。在各种实施方案中,所述试剂是包含具有碱基编辑活性的蛋白质结构域的生物分子复合物,即能够修饰核酸分子(例如,DNA、RNA)内的碱基(例如,A、T、C、G或U)。在一些实施方案中,所述多核苷酸可编程DNA结合结构域与脱氨酶结构域融合或连接。在一个实施方案中,所述试剂是包含具有碱基编辑活性的结构域的融合蛋白。在一些实施方案中,具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施方案中,所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施方案中,所述碱基编辑器是腺苷碱基编辑器(ABE)。
如本公开所使用的,“碱基编辑活性”是指用于化学改变多核苷酸内的碱基。在一个实施方案中,第一个碱基被转化为第二个碱基。在一个实施方案中,所述碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如将靶标A·T转化为C·G。
在一些实施例中,碱基编辑活性通过编辑效率来评估。碱基编辑效率可以通过任何合适的方式来测量,例如,通过sanger测序或二代测序。在一些实施方案中,碱基编辑效率通过具有受碱基编辑器影响的核碱基转化的总测序读数的百分比来测量,例如,具有转化为A·T碱基对的目标C·G碱基对的总测序读数的百分比。在一些实施方案中,当在细胞群中进行碱基编辑时,碱基编辑效率通过具有受碱基编辑器影响的核碱基转化的总细胞的百分比来测量。
如本公开所使用的,术语“碱基编辑器系统”是指用于编辑目标核苷酸序列的核碱基的系统。在各种实施方案中,所述碱基编辑器系统包含(1)核酸可编程核苷酸结合结构域(例如Cas9);(2)用于使所述核碱基脱氨基的脱氨酶结构域(例如腺苷脱氨酶);(3)一种或多种引导多核苷酸(例如引导RNA)。
“引导多核苷酸”、“引导RNA”或“gRNA”是指可以特异性靶向目标序列并且可以与核酸可编程核苷酸结合结构域蛋白(例如Cas9)形成复合物的多核苷酸。在一个实施方案中,引导多核苷酸是引导RNA(gRNA)。gRNA可以作为两个或多个RNA的复合物存在,也可以作为单个RNA分子存在。以单个RNA分子形式存在的gRNA可称为单一引导RNA(sgRNA),但“gRNA”可互换使用以指以单个分子或两个或更多个分子的复合物形式存在的引导RNA。通常,作为单个RNA种类存在的gRNA包括两个结构域:(1)与目标核酸具有同源性的结构域(例如,引导Cas9复合物与目标核酸的结合);(2)结合Cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于称为tracrRNA的序列,并且包括茎环结构。例如,在一些实施方案中,结构域(2)与Jinek et al.,Science 337:816-821(2012)中提供的tracrRNA相同或同源。gRNA的其他实例可以为在2013年9月6日提交的美国临时专利申请U.S.S.N.61/874,682(发明名称为“可切换的Cas9核酸酶及其用途(Switchable Cas9 Nucleases and Uses Thereof)”)和在2013年9月6日提交的美国临时专利申请U.S.S.N.61/874,746发明名称为“功能性核酸酶递送系统(Delivery System For Functional Nucleases)”中公开的。在一些实施方案中,gRNA包括结构域(1)和(2)中的两个或更多个,并且可以被称为“延伸的gRNA”。延伸的gRNA将结合两个或更多个Cas9蛋白并在两个或更多个不同区域结合目标核酸。gRNA包括与目标位点互补的核苷酸序列,其介导核酸酶/RNA复合物与所述目标位点的结合,提供核酸酶:RNA复合物的序列特异性。
根据本发明,所用氨基酸三字母代码和单字母代码如J.biol.chem,243,p3558(1968)中所述。
根据本发明,氨基酸“添加”指在氨基酸序列的C端或N端添加氨基酸。根据本发明,氨基酸“缺失”指可以从氨基酸序列中删除1、2或3个以上氨基酸。根据本发明,氨基酸“插入”指在氨基酸序列中的适当位置插入氨基酸残基,插入的氨基酸残基也可以全部或部分彼此相邻,或插入的氨基酸之间都不彼此相邻。
根据本发明,氨基酸“取代”指在氨基酸序列中的某个位置的某个氨基酸残基被其他氨基酸残基替代;其中,“取代”可以是保守氨基酸取代。
根据本发明,“保守修饰”、“保守取代”或“保守置换”是指具有类似特征(例如电荷、侧链大小、疏水性/亲水性、主链构象和刚性等)的其它氨基酸置换蛋白中的氨基酸,使得可频繁进行改变而不改变蛋白的生物学活性。本领域技术人员知晓,一般而言,多肽的非必需区域中的单个氨基酸置换基本上不改变生物学活性(参见Watson等(1987),MolecularBiology of the Gene,The Benjamin/Cummings Pub.Co.,第224页,(第4版))。另外,结构或功能类似的氨基酸的置换不大可能破环生物学活性。示例性保守取代于下表“示例性氨基酸保守取代”中陈述。
示例性氨基酸保守取代
原始残基 | 保守取代 |
Ala(A) | Gly(G);Ser(S) |
Arg(R) | Lys(K);His(H) |
Asn(N) | Gln(Q);His(H);Asp(D) |
Asp(D) | Glu(E);Asn(N) |
Cys(C) | Ser(S);Ala(A);Val(V) |
Gln(Q) | Asn(N);Glu(E) |
Glu(E) | Asp(D);Gln(Q) |
Gly(G) | Ala(A) |
His(H) | Asn(N);Gln(Q) |
Ile(I) | Leu(L);Val(V) |
Leu(L) | Ile(I);Val(V) |
Lys(K) | Arg(R);His(H) |
Met(M) | Leu(L);Ile(I);Tyr(Y) |
Phe(F) | Tyr(Y);Met(M);Leu(L) |
Pro(P) | Ala(A) |
Ser(S) | Thr(T) |
Thr(T) | Ser(S) |
Trp(W) | Tyr(Y);Phe(F) |
Tyr(Y) | Trp(W);Phe(F) |
Val(V) | Ile(I);Leu(L) |
又如,具有类似特征的氨基酸如下所示:
酸性残基 | Asp(D)和Glu(E) |
碱性残基 | Lys(K)、Arg(R)和His(H) |
亲水性不带电荷的残基 | Ser(S)、Thr(T)、Asn(N)和Gln(Q) |
脂肪族不带电荷的残基 | Gly(G)、Ala(A)、Val(V)、Leu(L)和Ile(I) |
非极性不带电荷的残基 | Cys(C)、Met(M)和Pro(P) |
芳香族残基 | Phe(F)、Tyr(Y)和Trp(W) |
如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸片段。该区域或序列在靠近5'端的地方有一个起始密码子,在靠近3'端的地方有一个终止密码子。编码序列也可称为开放阅读框。
术语“核定位序列”、“核定位信号(Nuclear Localization Signal,NLS)”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的并且描述于例如Plank等人的国际PCT申请,PCT/EP2000/011690,2000年11月23日提交,2001年5月31日作为WO/2001/038547公布,其内容以引用方式并入本文以用于它们对示例性核定位序列的公开。在一些实施方案中,所述NLS是优化的NLS,例如由Koblan等人,Nature Biotech.2018doi:10.1038/nbt.4172所描述。
如本文所用,术语“接头”可指共价接头(例如,共价键)、非共价接头、化学基团或连接两个分子或部分(例如,蛋白质复合物或核糖核复合体的两个组分)的分子,例如,融合蛋白的两个结构域,如多核苷酸可编程DNA结合结构域(例如,dCas9)和脱氨酶结构域(例如,腺苷脱氨酶)。接头可以连接碱基编辑器系统的不同组分或组分的不同部分。例如,在一些实施方案中,接头可以连接多核苷酸可编程核苷酸结合结构域的引导多核苷酸结合结构域和脱氨酶的催化结构域。接头可以位于两个基团、分子或其他部分之间或两侧,并通过共价键或非共价相互作用连接到每一个,从而连接这两者。在一些实施方案中,所述接头可以是多核苷酸。在一些实施方案中,所述接头可以是DNA接头。在一些实施方案中,所述接头可以是RNA接头。
在一些实施方案中,接头可以是一个氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,所述接头的长度可为约5至100个氨基酸,例如约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20至30、30至40、40至50、50至60、60至70、70至80、80至90或90至100个氨基酸的长度。在一些实施例中,接头的长度可为约100至150、150至200、200至250、250至300、300至350、350至400、400至450或450至500个氨基酸。也可以考虑更长或更短的接头。
如本公开所使用的,术语“切割”可以是指使核苷酸链中磷酸二酯键断裂。对于断裂的类型可以是单链断裂或双链断裂。
如本公开所使用的,术语“互补的”或“杂交的”用于指与碱基配对规则相关的“多核苷酸”和“寡核苷酸”(它们是可互换的术语,指的是核苷酸序列)。例如,序列“CAGT”与序列“GTCA”互补。互补可以是“部分的”或“全部的”。“部分”互补是指一个或多个核酸碱基根据碱基配对规则错配,核酸之间的“全部”或“完全”互补是指每个核酸碱基在碱基配对下均与另一个碱基匹配规则。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有重要影响。这在扩增反应以及取决于核酸之间结合的检测方法中特别重要。
如本文所用,术语“杂交”是指使用核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程来配对互补核酸。
如本公开所使用的,术语“核酸序列”和“核苷酸序列”是指寡核苷酸或多核苷酸及其片段或部分,并且是指可以是单链或双链的基因组或合成来源的DNA或RNA,和代表有义或反义链。
如本公开所使用的,术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定:将多核苷酸或多肽的核苷酸或氨基酸序列对准且经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分,将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言,可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。
示例性的,当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时,两个或多个序列或子序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(例如,多核苷酸)的整个长度上基本相同。
术语“载体”是指将核酸序列引入细胞中从而产生转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可以包括额外的核酸序列以促进和/或促进引入序列的表达,例如起始、终止、增强子、启动子和分泌序列。
如本公开所使用的,术语“个体”和“受试者”可互换地使用,是指哺乳动物。哺乳动物包括但不限于驯化动物(例如,奶牛、绵羊、猫、犬和马)、灵长类(例如,人和非人灵长类如猴)、兔和啮齿类(例如,小鼠和大鼠)。特别地,个体是人。
本文公开的方法可以在体外、离体、或体内进行,或者产品可以以体外、离体、或体内形式存在。术语“体外”是指在实验室条件或培养液中使用材料、生物物质、细胞和/或组织的实验;而术语“体内”是指使用完整多细胞有机体的实验和工序。在一些实施方案中,体内进行的方法可以在非人动物上进行。“离体”是指存在于有机体外或发生在有机体外,例如在人或动物体外的事件,例如可以在取自有机体的组织(例如整个器官)或细胞上存在或发生的事件。
如本公开所使用的,术语“药学上可接受的载体”是指药学上可接受的材料、组合物或媒介物,例如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如,润滑剂、滑石粉、硬脂酸镁、钙或锌或硬脂酸)或溶剂包封材料,涉及将化合物从身体的一个部位(例如,递送部位)运送或运输到另一个部位(例如,器官、组织或身体的一部分)。药学上可接受的载体是“可接受的”,意思是与制剂的其他成分相容并且对受试者的组织无害(例如,生理学相容的、无菌的、生理学的pH等)。可以充当药学上可接受的载体的材料的一些实例包括:(1)糖,例如乳糖、葡萄糖和蔗糖;(2)淀粉,如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素;(4)粉末黄蓍胶;(5)麦芽;(6)明胶;(7)润滑剂,如硬脂酸镁、十二烷基硫酸钠和滑石粉;(8)赋形剂,如可可脂和栓剂蜡;(9)油,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油;(10)二醇,如丙二醇;(11)多元醇,如甘油、山梨糖醇、甘露醇和聚乙二醇(PEG);(12)酯类,如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格氏液;(19)乙醇;(20)pH缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酸酐;(22)增量剂(bulking agent),如多肽和氨基酸(23)血清成分,如血清白蛋白、高密度脂蛋白(high density lipoprotein,HDL)和低密度脂蛋白(low density lipoprotein,LDL);(22)C2-C12醇,如乙醇;和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。诸如“赋形剂”、“药学上可接受的载体”等术语在本文中可互换使用。
如本文所用,术语“有效量”是指足以引起期望的生物学反应的生物活性剂的量。例如,在一些实施方案中,碱基编辑器的有效量可以指足以诱导由碱基编辑器突变的特异性结合的靶位点的突变的碱基编辑器的量。如本领域技术人员将理解的,试剂,例如碱基编辑器融合蛋白、脱氨酶、多核苷酸等的有效量可以随各种因素而变化,例如随期望的生物学反应,例如随待编辑的特定等位基因、基因组或靶位点,随靶定的细胞或组织和使用的试剂而变化。
术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。如本文所用,术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。在一些实施方案中,可以在一种或多种症状已经得以形成之后和/或疾病已经得到诊断之后施用治疗。在其他实施方案中,可以在没有症状的情况下施用治疗,例如用于预防或延迟症状的发作或抑制疾病的发作或进展。例如,可以在症状发作之前(例如,鉴于症状的历史和/或鉴于遗传或其他易感性因素)施用治疗于易感个体。治疗也可以在症状消退后继续进行,例如以预防或延迟其复发。
<腺苷脱氨酶>
在本发明的第一方面的一些实施方案中,提供了一种腺苷脱氨酶,其包含以下序列中的一种或多种:
(i)如下SEQ ID NO:1所示的氨基酸序列;
MYNAPRFFCRSAAVSDHEFNDEYWMRHALTLAKRAREEGEVPVGAVLV
LNNQVIGEGWNRAIGLHDPTAHAEIMALRQGGLVLQNYRLIDATLYVTFE
PCVMCAGAMVHSRISRLVFGVRNSKRGAAGSLINVLNYPGMNHRVEITEGILAESCSAMLCDFYRWPREVFNALKKARQEEG(腺苷脱氨酶004V1)
(ii)与SEQ ID NO:1所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性;
(iii)在SEQ ID NO:1所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:1所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ IDNO:1所示的氨基酸序列的脱氨活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
在一些实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:
S15、D16、H17、F19、N20、D21、E22、Y23、W24、R26、H27、L29、K33、R34、A35、V41、V43、L47、L49、N59、A61、I62、A69、E72、G80、L81、V82、L83、Q84、N85、Y86、I89、D90、A91、T92、V95、F97、I112、S113、R114、L115、F117、V119、R120、N121、K123、R124、N132、V133、L134、N135、P137、G138和M139。
进一步地,在一些实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:
S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L。
在一些具体的实施方案中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代:
(1)S15T、D16E、H17K、F19Y、N20Q(腺苷脱氨酶004V2);
(2)E22D、Y23F、W24F、R26K、H27R、L29I(腺苷脱氨酶004V3);
(3)K33R、R34K、A35S(腺苷脱氨酶004V4);
(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W(腺苷脱氨酶004V7);
(5)I89L、D90G、A91T、T92D(腺苷脱氨酶004V8);
(6)I112L、S113K、R114K(腺苷脱氨酶004V10);
(7)N132K、V133I、L134F、N135H(腺苷脱氨酶004V12);和/或
(8)P137F、G138A、M139L(腺苷脱氨酶004V13)。
本发明的第一方面的另一些实施方案中,提供了一种腺苷脱氨酶,其包含以下序列中的一种或多种:
(i)如下SEQ ID NO:2所示的氨基酸序列;
MSELNDAYWMKQALALAQKAREQGEVPVGAILVLDDEVIGQGWNRAITLHDPTAHAEIMALQQGGQIVQNYRLLNATLYVTFEPCVMCAGAMVHSRIKRLVYGVSNSKRGAAGSLLNVLNYPGMNHQIEITAGVMANECSEMLCQFYQQPREVFNAEREARRLNQPDRAD(腺苷脱氨酶005V1)
(ii)与SEQ ID NO:2所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性;
(iii)在SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ IDNO:2所示的氨基酸序列的脱氨活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
在一些实施方案中,所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代:
K19、A20、R21、E22、V33、L34、D35、D36、A46、I47、T48、L49、V80、T81、F82、E83、P84、I97、K98、R99、G103、V104、S105、N106、S107、K108、R109、G110、L116、N117、V118、L119、N120、Y121、P122、G123、C144、Q145、F146、Y147、Q148、Q149、P150、R151、E152、V153、F154、N155。
在本发明中,“保留脱氨活性”的表述,例如“保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性”、“保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性”,可以是完全保留原始序列的腺苷脱氨酶的脱氨活性,也可以是部分保留原始序列的腺苷脱氨酶的脱氨活性,例如保留30%、40%、50%、60%、70%、80%、90%、95%、99%的脱氨活性。在另一些实施方案中,具有修改后的序列的腺苷脱氨酶,例如具有经氨基酸取代的序列的腺苷脱氨酶也可能具有高于原始序列的腺苷脱氨酶的脱氨活性。
本发明提供的腺苷脱氨酶可作用于任何多核苷酸,包括DNA、RNA和DNA-RNA杂交体。在某些实施方案中,腺苷脱氨酶可以使包含DNA的多核苷酸的靶标腺嘌呤(A)脱氨基。在某些实施方案中,腺苷脱氨酶可以使包含RNA的多核苷酸的靶标腺嘌呤(A)脱氨基。
在一些实施方案中,所述的取代为保守取代。
在本发明中,“中等严格条件”,“中-高严格条件”,“高严格条件”或“非常高严格条件”描述了核酸杂交和洗涤的条件。进行杂交反应的指导参见Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6,其通过引用并入本文。在该文献中描述了含水的和非含水的方法,且可以使用任一种。例如,具体的杂交条件如下:(1)低严格性杂交条件在6×氯化钠/柠檬酸钠(SSC)中,在约45℃,然后在至少50℃,在0.2×SSC,0.1%SDS中洗涤2次(对于低严格性条件,可以将洗涤温度升高到55℃);(2)中等严格性杂交条件在6×SSC,在约45℃,然后在60℃,在0.2×SSC,0.1%SDS中洗涤1次或多次;(3)高严格性杂交条件在6×SSC,在约45℃,然后在65℃,在0.2×SSC,0.1%SDS中洗涤1次或多次且优选;(4)非常高的严格性杂交条件是0.5M磷酸钠,7%SDS,在65℃,然后在65℃,在0.2×SSC,1%SDS中洗涤1次或多次。
<碱基编辑器融合蛋白>
本发明的第二方面提供了一种碱基编辑器融合蛋白,其包含本发明第一方面所述腺苷脱氨酶,以及核酸可编程核苷酸结合结构域。
在本发明中,核酸可编程核苷酸结合结构域当与结合的引导多核苷酸(例如,gRNA)结合时,可以特异性结合靶多核苷酸序列(即,通过结合的引导核酸的碱基和靶多核苷酸的碱基之间的互补碱基配对序列),从而将碱基编辑器定位到需要编辑的目标核酸序列。在一些实施方案中,靶多核苷酸序列包含单链DNA或双链DNA。在一些实施方案中,所述靶多核苷酸序列包含RNA。在一些实施方案中,靶标多核苷酸序列包含DNA-RNA杂交体。应当理解,核酸可编程核苷酸结合结构域还可以包括结合RNA的核酸可编程蛋白。
在本发明的一些实施方案中,碱基编辑器中的核酸可编程核苷酸结合结构域是Cas蛋白或者AGO蛋白。所述Cas蛋白或AGO蛋白包括天然存在的Cas蛋白或AGO蛋白,以及其同源物或其修饰或工程化版本。例如,在一些实施方案中,Cas蛋白或AGO蛋白可以是包括与天然存在的Cas蛋白或AGO蛋白的氨基酸序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%同一性的氨基酸序列的蛋白。在另一些实施方案中,Cas蛋白还包括其切口酶或无核酸酶活性形式的蛋白。
在一些实施方案中,可以作为核酸可编程核苷酸结合结构域的Cas蛋白的非限制实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也已知为Csn1或Csx12)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12f(C2c10/Cas14)、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k/C2c5、Cas12l、Cas12m、Cas12n、Cas13a(C2c2)、cas13b、Cas13c、Cas13d、Csy1、Csy2、Csy3、Csy4、Css1、Css2、Cse5e、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr2、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II类Cas效应蛋白、V型Cas效应蛋白、VI类蛋白质、CARF、DinG、其同源物或其修饰或工程化版本。其他核酸可编程核苷酸结合结构域也在本公开的范围内,尽管它们可能未在本公开中具体列出。
在本发明的一些具体的实施方案中,Cas蛋白选自Cas9家族、Cas12家族和Cas13家族,例如但不限于Cas9、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12f(C2c10/Cas14)、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k(C2c5)、Cas12l、Cas12m、Cas12n、Cas13a(C2c2)、Cas13b、Cas13c、Cas13d、其同源物或其修饰或工程化版本。在本发明的一些具体的实施方案中,Cas蛋白包括上述Cas蛋白的无核酸酶活性形式,例如dCas9、dCas12a、dCas12b、dCas12c、dCas12d、dCas12e、dCas12f、dCas12g、dCas12h、dCas12i、dCas12j、dCas12k、dCas12l、dCas12m、dCas12n、dCas13a、dcas13b、dCas13c和dCas13d。在本发明的一些具体的实施方案中,Cas蛋白还包括上述蛋白的切口酶形式,例如但不限于nCas9。
在本发明的一些优选的实施方案中,核酸可编程核苷酸结合结构域为Cas9。在本发明的一些具体的实施方案中,Cas9是来自化脓性链球菌的Cas9(SpCas9)、金黄色葡萄球菌的Cas9(SaCas9)、嗜热链球菌1的Cas9(St1Cas9)。在本发明的一些优选的实施方案中,Cas9是来自化脓性链球菌的Cas9(SpCas9)。
在本发明的一些更优选的实施方案中Cas9可以是核酸酶活性Cas9、Cas9切口酶(nCas9)或无核酸酶活性Cas9(dCas9)。
在本发明的一些进一步优选的实施方案中,核酸可编程核苷酸结合结构域为Cas9切口酶(nCas9)。在本发明的另一些进一步优选的实施方案中,核酸可编程核苷酸结合结构域包含与本文提供的Cas9切口酶(nCas9)的氨基酸序列具有至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%同一性的氨基酸序列。
在本发明的一些实施方案中,腺苷脱氨酶与核酸可编程核苷酸结合结构域直接融合/连接形成融合蛋白,或者通过接头融合/连接形成融合蛋白。腺苷脱氨酶与核酸可编程核苷酸的融合/连接顺序没有特别的限制,例如腺苷脱氨酶可以在碱基编辑器的N端,或者核酸可编程核苷酸结合结构域位于碱基编辑器的N端。
在腺苷脱氨酶与核酸可编程核苷酸结合结构域直接融合的实施方案中,示例性的碱基编辑器融合蛋白具有如下的结构:
NH2-[腺苷脱氨酶]-[napDNAbp]-COOH;或
NH2-[napDNAbp]-[腺苷脱氨酶]-COOH。
在腺苷脱氨酶与核酸可编程核苷酸结合结构域通过接头融合的实施方案中,示例性的碱基编辑器融合蛋白具有如下的结构:
NH2-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-COOH;或
NH2-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-COOH。
在一些实施方案中,核碱基编辑器的结构域通过包含以下氨基酸序列的接头融合:
在本发明的一些实施方案中,碱基编辑器中还包括至少一条核定位信号序列(NLS序列),NLS序列的氨基酸序列选自:
KRTADGSEFESPKKKRKV(SEQ ID NO:13)、
KRPAATKKAGQAKKKK(SEQ ID NO:14)、
KKTELQTTNAENKTKKL(SEQ ID NO:15)、
KRGINDRNFWRGENGRKTR(SEQ ID NO:16)、
RKSGKIAAIVVKRPRK(SEQ ID NO:17)、
PKKKRKV(SEQ ID NO:18)、
MDSLLMNRRKFLYQFKNVRWAKGRRETY(SEQ ID NO:19)、
MKRTADGSEFESPKKKRKV(SEQ ID NO:20)、或
SGGSKRTADGSEFEPKKKRKV(SEQ ID NO:21)。
在本发明的一些实施方案中,核定位信号序列可以位于碱基编辑器的N端、C端、两端,或者位于腺苷脱氨酶与核酸可编程核苷酸结合结构域之间。在本发明的一些实施方案中,核定位信号序列可以直接融合于碱基编辑器中,或者通过接头融合在碱基编辑器中。包含核定位信号序列的碱基编辑器的示例性结构如下:
NH2-[NLS]-[腺苷脱氨酶]-[napDNAbp]-COOH;
NH2-[腺苷脱氨酶]-[NLS]-[napDNAbp]-COOH;
NH2-[腺苷脱氨酶]-[napDNAbp]-[NLS]-COOH;
NH2-[NLS]-[napDNAbp]-[腺苷脱氨酶]-COOH;
NH2-[napDNAbp]-[NLS]-[腺苷脱氨酶]-COOH;
NH2-[napDNAbp]-[腺苷脱氨酶]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-COOH;
NH2-[腺苷脱氨酶]-[任选的接头]-[NLS]-[任选的接头]-[napDNAbp]-COOH;
NH2-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH;
NH2-[NLS]-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-COOH;
NH2-[napDNAbp]-[任选的接头]-[NLS]-[任选的接头]-[腺苷脱氨酶]-COOH;
NH2-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH。
在本发明的一些优选的实施方案中,碱基编辑器具有如下的结构:
NH2-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH。
在本发明的一些进一步优选的实施方案中,所述碱基编辑器包含以下序列中的一种或多种:
(i)如SEQ ID NO:22所示的氨基酸序列;
(ii)与SEQ ID NO:22所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性;
(iii)在SEQ ID NO:22所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:22所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ IDNO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
004V1-nCas9的氨基酸序列(SEQ ID NO:22):
在本发明中,基于腺苷脱氨酶004V1进行氨基酸取代获得腺苷脱氨酶004V2、腺苷脱氨酶004V3、腺苷脱氨酶004V4、腺苷脱氨酶004V7、腺苷脱氨酶004V8、腺苷脱氨酶004V10、腺苷脱氨酶004V12、腺苷脱氨酶004V13,具体如下:
名称 | 基于腺苷脱氨酶004V1(SEQ ID NO:1)存在的取代 |
腺苷脱氨酶004V2 | S15T、D16E、H17K、F19Y、N20Q |
腺苷脱氨酶004V3 | E22D、Y23F、W24F、R26K、H27R、L29I |
腺苷脱氨酶004V4 | K33R、R34K、A35S |
腺苷脱氨酶004V7 | G80A、L81N、V82A、L83I、Q84N、N85S、Y86W |
腺苷脱氨酶004V8 | I89L、D90G、A91T、T92D |
腺苷脱氨酶004V10 | I112L、S113K、R114K |
腺苷脱氨酶004V12 | N132K、V133I、L134F、N135H |
腺苷脱氨酶004V13 | P137F、G138A、M139L |
上述腺苷脱氨酶各自所构成的碱基编辑器序列如下:
004V2-nCas9的氨基酸序列如下所示(SEQ ID NO:46):
004V3-nCas9的氨基酸序列如下所示(SEQ ID NO:47):
004V4-nCas9的氨基酸序列如下所示(SEQ ID NO:48):
004V7-nCas9的氨基酸序列如下所示(SEQ ID NO:49):
/>
004V8-nCas9的氨基酸序列如下所示(SEQ ID NO:50):
/>
004V10-nCas9的氨基酸序列如下所示(SEQ ID NO:51):
004V12-nCas9的氨基酸序列如下所示(SEQ ID NO:52):
/>
004V13-nCas9的氨基酸序列如下所示(SEQ ID NO:53):
/>
其中,粗体序列表示源自nCas9的序列;斜体表示接头序列;双下划线序列表示核定位序列;单下划线序列是004V1-004V4、004V7-004V8、004V10、004V12或004V13脱氨酶序列;C端的星号代表终止密码子位置。
在本发明的一些进一步优选的实施方案中,所述碱基编辑器包含以下序列中的一种或多种:
(i)如下SEQ ID NO:23所示的氨基酸序列;
(ii)与SEQ ID NO:23所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;
(iii)在SEQ ID NO:23所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ IDNO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
005V1-nCas9的氨基酸序列(SEQ ID NO:23):
/>
其中,粗体序列表示源自nCas9的序列;斜体表示接头序列;双下划线序列表示核定位序列;单下划线序列是005V1脱氨酶序列;C端的星号代表终止密码子位置。
在本发明中,“保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性”、“保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性”可以是完全保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的碱基编辑器的结合多核苷酸和碱基编辑活性,也可以是部分保留其活性。在另一些实施方案中,具有修改序列的碱基编辑器也可以具有高于如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的碱基编辑器的结合多核苷酸和碱基编辑活性。
应当理解,本公开的碱基编辑器融合蛋白可以包含一个或多个附加特征。例如,在一些实施方案中,融合蛋白可包含抑制剂、细胞质定位序列、输出序列,例如核输出序列或其他定位序列,以及可用于溶解、纯化或检测融合的标签。本文提供的合适的标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签,也称为组氨酸标签或His-标签、麦芽糖结合蛋白(MBP)-标签、nus-标签、谷胱甘肽-S-转移酶(GST)-标签、绿色荧光蛋白(GFP)-标签、硫氧还蛋白-标签、S-标签、Softags(例如,Softag 1、Softag 3)、链标签、生物素连接酶标签、Flash标签、V5标签和SBP标签。其他合适的序列对本领域技术人员来说是显而易见的。在一些实施方案中,融合蛋白包含一个或多个His标签。
<多核苷酸>
本发明的第三方面提供了一种多核苷酸,其编码本发明第一方面所述的腺苷脱氨酶或者编码本发明第二方面所述的碱基编辑器融合蛋白。
<表达载体>
本发明的第四方面提供了一种载体,其包含本发明第三方面所述的多核苷酸。在本发明的一些实施方案中,所述载体是哺乳动物表达载体。在一些实施方案中,所述表达载体选自腺相关病毒、逆转录病毒载体、腺病毒载体、慢病毒载体、仙台病毒载体和疱疹病毒载体中的一种或多种。在一些实施方案中,所述载体包含启动子。
<细胞>
本发明的第五方面提供了一种细胞,其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸和本发明第四方面所述的载体中的一种或多种。在本发明的一些实施方案中,所述细胞是原核细胞、真核细胞,进一步地,可以是细菌细胞、植物细胞、昆虫细胞、人类细胞或哺乳动物细胞。
<碱基编辑器系统>
本发明的第六方面提供了一种碱基编辑器系统。在一些实施方案中,碱基编辑器系统包含本发明第一方面所述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸。
在另一些实施方案中,碱基编辑器系统包含本发明第二方面所述的碱基编辑器融合蛋白,以及引导多核苷酸。
在本发明的一些实施方案中,引导多核苷酸为引导RNA(gRNA),其是一种短的合成RNA,由Cas结合所需的骨架序列和用户定义的约20个核苷酸间隔序列组成,该间隔序列定义了要修改的基因组靶标。因此,技术人员可以改变Cas蛋白的基因组靶标特异性部分取决于gRNA靶向序列与基因组其余部分相比对基因组靶标的特异性。
在本发明的更具体的一些实施方案中,引导多核苷酸为sgRNA,其由Cas结合所需的骨架序列和用户定义的约20个核苷酸间隔序列组成。
针对不同来源或种类的Cas蛋白,可以选择不同的骨架序列。在本发明的一些更具体的具体实施方案中,其中,结合Cas9蛋白的结构域(SpCas9),即sgRNA的骨架序列为(SEQID NO:24):
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC
<药物组合物、试剂盒、递送系统、用途及方法>
本发明第七方面提供了一种药物组合物,其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞和本发明第六方面所述的碱基编辑器系统中的一种或多种,以及药学上可接受的载体。
在一些实施方案中,所述的药学上可接受的载体可以是递送载体,例如脂质、阳离子脂质或其他具有药物递送功能的聚合物。
本发明第八方面提供了一种试剂盒,具体为一种疾病治疗试剂盒,其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞、本发明第六方面所述的碱基编辑器系统和本发明第七方面所述的药物组合物中的一种或多种。
本发明的第九方面提供了一种递送系统,其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞和本发明第六方面所述的碱基编辑器系统中的一种或多种,以及递送介质。
在一些实施方案中,所述递送介质可以为纳米颗粒、脂质体、外泌体、微囊泡或基因枪、细胞穿膜肽等。
本发明第十方面提供了本发明第一方面所述的腺苷脱氨酶在制备碱基编辑器或剪辑编辑器系统中的用途。
本发明第十一方面提供了本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞、本发明第六方面所述的碱基编辑器系统或本发明第七方面所述的药物组合物、本发明第九方面所述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。
在一些实施方案中,所述药物可以将所述点突变进行校正。在一些实施方案中,所述点突变为G至A和/或C至T。
在一些实施方案中,与点突变相关或由点突变引起的疾病包括高胆固醇血症。在另一些实施方案中,所述疾病非限制性的实例包括梅尔-戈林综合征(Meier-Gorlinsyndrome);塞克尔综合征(Seckel syndrome);乔伯特综合征(Joubert syndrome);莱伯氏先天性黑蒙症(Leber congenital amaurosis);夏科-马里-图思病(Charcot-Marie-Toothdisease),2型;夏科-马里-图思病,2型;乌谢尔综合征(Usher syndrome),2C型;脊髓小脑性共济失调;长QT综合征2;西奥格林-拉尔逊氏综合征(-Larsson syndrome);遗传性果糖尿病;遗传性果糖尿病;神经母细胞瘤;神经母细胞瘤;卡尔曼综合征(Kallmannsyndrome)1;卡尔曼综合征;异染性脑白质营养不良;雷特综合征(Rettsyndrome);肌萎缩性侧索硬化症10型;李-佛美尼综合征(Li-Fraumeni syndrome)。
本发明第十二方面提供了核酸的碱基编辑方法,其包括将核酸与本发明第六方面所述的碱基编辑器系统相接触的步骤。
在一些实施方案中,核酸是DNA。进一步地,核酸是双链DNA。
在一些实施方案中,所述核酸包含与疾病相关的靶序列。
在一些实施方案中,所述靶序列包含与疾病相关的点突变。
在一些具体的实施方案中,所述靶序列包含G至A或C至T的与疾病或病症相关的点突变,并且其中突变A碱基的脱氨化导致与疾病或病症不相关的序列。
在一些实施方案中,所述靶序列编码蛋白质,并且其中所述点突变在密码子中,并且导致与野生型密码子相比由该突变密码子编码的氨基酸变化。
在一些实施方案中,所述靶序列位于剪接位点处,并且其中所述点突变导致与野生型转录物相比mRNA转录物的剪接变化。
在一些实施方案中,所述靶序列位于基因的启动子处,并且其中所述点突变导致基因表达增加。
在一些实施方案中,所述靶序列位于基因的启动子处,并且其中所述点突变导致基因表达减少。
在一些实施方案中,核酸位于生物体的基因组内。
在一些实施方案中,所述生物体为原核生物或真核生物或脊椎动物或哺乳动物。
在一些实施方案中,所述突变A碱基的脱氨化导致该突变密码子所编码的氨基酸变化,或导致编码野生型氨基酸的密码子,或导致mRNA转录物变化,或导致野生型mRNA转录物,或导致基因表达增加,或导致基因表达减少。
在一些实施方案中,所述接触在体外实施。
在一些实施方案中,所述接触在受试者体内实施。
在一些实施方案中,所述受试者已被诊断患有疾病或病症。
在一些实施方案中,所述疾病或病症与前蛋白转化酶枯草溶菌素9(PCSK9)基因的点突变相关。
在一些实施方案中,所述疾病包括高胆固醇血症。在另一些实施方案中,所述疾病包括非限制性的实例包括梅尔-戈林综合征(Meier-Gorlin syndrome);塞克尔综合征(Seckel syndrome);乔伯特综合征(Joubert syndrome);莱伯氏先天性黑蒙症(Lebercongenital amaurosis);夏科-马里-图思病(Charcot-Marie-Tooth disease),2型;夏科-马里-图思病,2型;乌谢尔综合征(Usher syndrome),2C型;脊髓小脑性共济失调;长QT综合征;西奥格林-拉尔逊氏综合征(-Larsson syndrome);遗传性果糖尿病;遗传性果糖尿病;神经母细胞瘤;神经母细胞瘤;卡尔曼综合征(Kallmannsyndrome);异染性脑白质营养不良;雷特综合征(Rettsyndrome);肌萎缩性侧索硬化症10型;李-佛美尼综合征(Li-Fraumeni syndrome)。
本发明第十三方面提供了用于治疗患有与点突变相关或由点突变引起的疾病的方法,在一些实施方案中,提供的方法包括向患有此类疾病的受试者施用有效量的校正点突变或将失活性突变引入到疾病相关基因中的本发明第二方面所述的碱基编辑器融合蛋白、本发明第六方面所述的碱基编辑器系统、本发明第七方面所述的药物组合物、本发明第八方面所述的试剂盒、本发明第九方面所述的递送系统。
以下结合附图,通过实施例进一步说明本发明,但不作为对本发明的限制。以下提供了本发明实施方案中所使用的具体材料及其来源。但是,应当理解的是,这些仅仅是示例性的,并不意图限制本发明,与如下试剂和仪器的类型、型号、品质、性质或功能相同或相似的材料均可以用于实施本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
在以下实施例中,使用David R.Liu团队所进化出的高效碱基编辑器ABE8e(Richter MF,Zhao KT,Eton E,Lapinaite A,Newby GA,Thuronyi BW,Wilson C,KoblanLW,Zeng J,Bauer DE,Doudna JA,Liu DR.Phage-assisted evolution of an adeninebase editor with improved Cas domain compatibility and activity.NatBiotechnol.2020 Jul;38(7):883-891.doi:10.1038/s41587-020-0453-z.Epub 2020 Mar16.Erratum in:Nat Biotechnol.2020 May 20;:PMID:32433547;PMCID:PMC7357821.)作为对比,与包含本发明提供的腺苷脱氨酶的碱基编辑器进行比较,ABE8e是基于对ABE7.10(Gaudelli NM,Komor AC,Rees HA,Packer MS,Badran AH,Bryson DI,LiuDR.Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage.Nature.2017 Nov 23;551(7681):464-471.doi:10.1038/nature24644.Epub2017 Oct 25.Erratum in:Nature.2018 May 2;:PMID:29160308;PMCID:PMC5726555.)的脱氨酶成分进行优化后得到的;根据前述团队所得出的实验结果,相对于ABE7.10的活性(以一级脱氨常数(first-order kinetics.deamination rate constants,kapp)表示)提高590倍。
具体地,在以下实施例中,ABE8e的氨基酸序列如下(SEQ ID NO:25):
其中,粗体序列表示源自nCas9的序列;斜体表示接头序列;双下划线序列表示核定位序列;单下划线序列是ecTadA*脱氨酶序列;C端末尾*表示终止密码子位置。
相应地,ABE8e核苷酸序列如下(SEQ ID NO:26):
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgggatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaactcaaaaagaggcgccgcaggctccctgatgaacgtgctgaactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgcgatttctatcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccatcaactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaa
在以下实施例中,ABE8e以及包含本发明提供的腺苷脱氨酶的碱基编辑器中所使用的napDNAbp均为nCas9,其氨基酸序列如下(SEQ ID NO:27):
DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
nCas9核苷酸序列如下(SEQ ID NO:28):
gacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac
在以下实施例中,包含本发明提供的包含腺苷脱氨酶和nCas9的碱基编辑器结构如下:
NH2-[NLS]-[腺苷脱氨酶]-接头-[napDNAbp]-[NLS]-COOH。
在以下实施例中,所使用的其他序列见下表:
序号 | 名称 | 序列 |
SEQ ID NO:29 | 位点1-sgRNA | gaacacaaagcatagactgc |
SEQ ID NO:30 | 位点17-sgRNA | acaaagaggaagagagacg |
SEQ ID NO:31 | 位点18-sgRNA | acacacacacttagaatctg |
SEQ ID NO:32 | PCSK9-sgRNA | cccgcaccttggcgcagcgg |
SEQ ID NO:33 | 位点1-正向引物 | cctcagcattcagccactaa |
SEQ ID NO:34 | 位点1-反向引物 | agaggcccattaacgtttgg |
SEQ ID NO:35 | 位点17-正向引物 | ctggctgaccaagagtgaag |
SEQ ID NO:36 | 位点17-反向引物 | aatgagcctctggtggagat |
SEQ ID NO:37 | 位点18-正向引物 | gagaggctgccaagctaaat |
SEQ ID NO:38 | 位点18-反向引物 | tggagctcaagatcacgttg |
SEQ ID NO:39 | PCSK9-正向引物 | gctagccttgcgttccg |
SEQ ID NO:40 | PCSK9-反向引物 | gtccccaagatcgtgccaa |
实施例
实施例1
本实施例采用腺苷脱氨酶004V1,将其与nCas9融合表达构成一种新的编辑窗口更窄的腺嘌呤碱基编辑器004V1-nCas9。
在本实施例中,腺嘌呤碱基编辑器004V1-nCas9构建策略为:将ABE8e中的腺苷脱氨酶替换为004V1,从而得到一种新的腺苷碱基编辑器004V1-nCas9。sgRNA及碱基编辑器的具体构建如下。
1、sgRNA表达载体(sgRNA质粒)构建
根据目标序列设计sgRNA并合成寡核苷酸(oligos),所用到的sgRNA序列如SEQ IDNO:29~31所示。在每个sgRNA的上游序列5’端加CACC序列,下游序列的5’端加AAAC序列,因此用于合成的每个sgRNA上游序列形式为:5’-CACCXXXXXXXXXXXXXXXXXXXX(20nt)-3’,下游序列形式为:5’-AAACXXXXXXXXXXXXXXXXXXXX(20nt)-3’。经合成后,上、下游序列通过预设程序(95℃,5min;95℃-85℃以-2℃/s;85℃-25℃以-0.1℃/s;保持在4℃)进行退火,将退火产物连接到经过BsmBI(NEB:R0739L)线性化的PHK09载体(质粒图谱如图1A所示,实验室自有,其已包含sgRNA的骨架序列)上,PHK09载体的序列如下所示(SEQ ID NO:41)
TGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCGCGCAATTAACCCTCACTAAAGGGAACAAAAGCTGGAGCTGCAAGCTTAATGTAGTCTTATGCAATACTCTTGTAGTCTTGCAACATGGTAACGATGAGTTAGCAACATGCCTTACAAGGAGAGAAAAAGCACCGTGCATGCCGATTGGTGGAAGTAAGGTGGTACGATCGTGCCTTATTAGGAAGGCAACAGACGGGTCTGACATGGATTGGACGAACCACTGAATTGCCGCATTGCAGAGATATTGTATTTAAGTGCCTAGCTCGATACATAAACGGGTCTCTCTGGTTAGACCAGATCTGAGCCTGGGAGCTCTCTGGCTAACTAGGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCTTCAAGTAGTGTGTGCCCGTCTGTTGTGTGACTCTGGTAACTAGAGATCCCTCAGACCCTTTTAGTCAGTGTGGAAAATCTCTAGCAGTGGCGCCCGAACAGGGACTTGAAAGCGAAAGGGAAACCAGAGGAGCTCTCTCGACGCAGGACTCGGCTTGCTGAAGCGCGCACGGCAAGAGGCGAGGGGCGGCGACTGGTGAGTACGCCAAAAATTTTGACTAGCGGAGGCTAGAAGGAGAGAGATGGGTGCGAGAGCGTCAGTATTAAGCGGGGGAGAATTAGATCGCGATGGGAAAAAATTCGGTTAAGGCCAGGGGGAAAGAAAAAATATAAATTAAAACATATAGTATGGGCAAGCAGGGAGCTAGAACGATTCGCAGTTAATCCTGGCCTGTTAGAAACATCAGAAGGCTGTAGACAAATACTGGGACAGCTACAACCATCCCTTCAGACAGGATCAGAAGAACTTAGATCATTATATAATACAGTAGCAACCCTCTATTGTGTGCATCAAAGGATAGAGATAAAAGACACCAAGGAAGCTTTAGACAAGATAGAGGAAGAGCAAAACAAAAGTAAGACCACCGCACAGCAAGCGGCCGCTGATCTTCAGACCTGGAGGAGGAGATATGAGGGACAATTGGAGAAGTGAATTATATAAATATAAAGTAGTAAAAATTGAACCATTAGGAGTAGCACCCACCAAGGCAAAGAGAAGAGTGGTGCAGAGAGAAAAAAGAGCAGTGGGAATAGGAGCTTTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCAGCGTCAATGACGCTGACGGTACAGGCCAGACAATTATTGTCTGGTATAGTGCAGCAGCAGAACAATTTGCTGAGGGCTATTGAGGCGCAACAGCATCTGTTGCAACTCACAGTCTGGGGCATCAAGCAGCTCCAGGCAAGAATCCTGGCTGTGGAAAGATACCTAAAGGATCAACAGCTCCTGGGGATTTGGGGTTGCTCTGGAAAACTCATTTGCACCACTGCTGTGCCTTGGAATGCTAGTTGGAGTAATAAATCTCTGGAACAGATTTGGAATCACACGACCTGGATGGAGTGGGACAGAGAAATTAACAATTACACAAGCTTAATACACTCCTTAATTGAAGAATCGCAAAACCAGCAAGAAAAGAATGAACAAGAATTATTGGAATTAGATAAATGGGCAAGTTTGTGGAATTGGTTTAACATAACAAATTGGCTGTGGTATATAAAATTATTCATAATGATAGTAGGAGGCTTGGTAGGTTTAAGAATAGTTTTTGCTGTACTTTCTATAGTGAATAGAGTTAGGCAGGGATATTCACCATTATCGTTTCAGACCCACCTCCCAACCCCGAGGGGACCCAGAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGAGACGGACGTCTCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTAAGCTTGGCGTAACTAGATCTTGAGACAAATGGCAGTATTCATCCACAATTTTAAAAGAAAAGGGGGGATTGGGGGGTACAGTGCAGGGGAAAGAATAGTAGACATAATAGCAACAGACATACAAACTAAAGAATTACAAAAACAAATTACAAAAATTCAAAATTTTCGGGTTTATTACAGGGACAGCAGAGATCCACTTTGGCGCCGGCTCGAGGGGGCCCGGGTGCAAAGATGGATAAAGTTTTAAACAGAGAGGAATCTTTGCAGCTAATGGACCTTCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGACGTACGGCCACCATGACCGAGTACAAGCCCACGGTGCGCCTCGCCACCCGCGACGACGTCCCCAGGGCCGTACGCACCCTCGCCGCCGCGTTCGCCGACTACCCCGCCACGCGCCACACCGTCGATCCGGACCGCCACATCGAGCGGGTCACCGAGCTGCAAGAACTCTTCCTCACGCGCGTCGGGCTCGACATCGGCAAGGTGTGGGTCGCGGACGACGGCGCCGCCGTGGCGGTCTGGACCACGCCGGAGAGCGTCGAAGCGGGGGCGGTGTTCGCCGAGATCGGCCCGCGCATGGCCGAGTTGAGCGGTTCCCGGCTGGCCGCGCAGCAACAGATGGAAGGCCTCCTGGCGCCGCACCGGCCCAAGGAGCCCGCGTGGTTCCTGGCCACCGTCGGAGTCTCGCCCGACCACCAGGGCAAGGGTCTGGGCAGCGCCGTCGTGCTCCCCGGAGTGGAGGCGGCCGAGCGCGCCGGGGTGCCCGCCTTCCTGGAGACCTCCGCGCCCCGCAACCTCCCCTTCTACGAGCGGCTCGGCTTCACCGTCACCGCCGACGTCGAGGTGCCCGAAGGACCGCGCACCTGGTGCATGACCCGCAAGCCCGGTGCCTGAACGCGTTAAGTCGACAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCGTCGACTTTAAGACCAATGACTTACAAGGCAGCTGTAGATCTTAGCCACTTTTTAAAAGAAAAGGGGGGACTGGAAGGGCTAATTCACTCCCAACGAAGACAAGATCTGCTTTTTGCTTGTACTGGGTCTCTCTGGTTAGACCAGATCTGAGCCTGGGAGCTCTCTGGCTAACTAGGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCTTCAAGTAGTGTGTGCCCGTCTGTTGTGTGACTCTGGTAACTAGAGATCCCTCAGACCCTTTTAGTCAGTGTGGAAAATCTCTAGCAGTACGTATAGTAGTTCATGTCATCTTATTATTCAGTATTTATAACTTGCAAAGAAATGAATATCAGAGAGTGAGAGGAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTCTAGCTATCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGGACGTACCCAATTCGCCCTATAGTGAGTCGTATTACGCGCGCTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAG
其中,sgRNA质粒构建中所使用的体系如下:
PHK09载体的线性化体系如下:PHK09载体3μg;缓冲液(NEB:R0539L)6μL;BsmBI 2μL;ddH2O补齐到60μL,37℃酶切过夜。
sgRNA退火产物与线性化载体连接体系如下:T4连接酶缓冲液(NEB:M0202L)1μL,线性化载体20ng,经退火的oligo片段(10μM)5μL,T4连接酶(NEB:M0202L)0.5μL,ddH2O补齐到10μL,16℃连接过夜。
将连接的载体转化大肠杆菌DH5a感受态细胞(唯地生物,DL1001)。具体流程如下:DH5α感受态细胞从-80℃拿出,迅速插入冰中,5分钟后待菌块融化,加入连接产物并用手拨打离心管底轻轻混匀,冰中静置25分钟。42℃水浴热激45秒,迅速放回冰中并静置2分钟。向离心管中加入700μl不含抗生素的无菌LB培养基,混匀后37℃,200rpm复苏60分钟。5000rpm离心一分钟收菌,留取100μl左右上清轻轻吹打重悬菌块并涂布到Amp抗生素的LB培养基上。将平板倒置放于37℃培养箱过夜培养。挑取单菌落,经过测序确认后对阳性克隆摇菌并提取质粒(TIANGEN:DP120-01)后测定浓度,-20℃冰箱中保存备用。
2、腺嘌呤碱基编辑器004V1-nCas9表达载体(p004V1-nCas9质粒)的构建
本实施例制备了腺嘌呤碱基编辑器表达载体p004V1-nCas9。004V1的核苷酸序列如SEQ ID NO:42所示。
004V1的核苷酸序列(SEQ ID NO:42):
atgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggct
cgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccacc
gcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtga
tgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaa
ctaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtg
ttcaatgccctgaagaaggccagacaggaggagggc
上述004V1脱氨酶的核苷酸序列已根据人密码子使用的偏好性进行密码子优化,委托生工生物工程(上海)股份有限公司完成540bp的004V1基因人工合成工作并将合成的基因替换ABE8e序列的第63-560位核苷酸。
p004V1-nCas9质粒图谱如图1B所示。
其中,004V1-nCas9的氨基酸序列如SEQ ID NO:22所示。
004V1-nCas9的核苷酸序列如下所示(SEQ ID NO:43):
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
3、细胞培养与转染
将HEK293T细胞(购自ATCC)接种于添加了10%FBS(v/v)的DMEM培养基中(Gibco,11965092),其中含1%Penicillin Streptomycin(v/v)(Gibco,15140122),在含有5%CO2的37℃细胞培养箱中进行培养。用于转染的细胞,前一天接种于24孔细胞培养板中进行培养,第二天观察细胞,当细胞生长到细胞密度为80%左右时进行转染。24孔板每孔转染的质粒用量分别是p004V1-nCas9质粒0.4μg,sgRNA质粒0.4μg。将质粒混合后用25μl的减血清培养基(源培生物,L530KJ)培养基稀释,再加入2μl p3000试剂,吹打混匀作为试剂A,静置5分钟。同时,将2μl的Lipofectamine 3000转染试剂(Thermo,11668019)用25μl的减血清培养基稀释并混匀,作为试剂B,静置5分钟。将上述试剂A与试剂B混合并吹打均匀,静置20分钟。静置结束后将混合试剂逐滴加入待转染的24孔板细胞中,放回37℃培养箱培养。转染6小时后将培养基换为含有10%FBS的DMEM培养基。转染48小时后收集细胞进行编辑效率的检测。
4、本实施例的腺嘌呤碱基编辑器004V1-nCas9在内源基因位点编辑效率检测
将“3、细胞培养与转染”中所述细胞进行基因组抽提(TIANGEN,DP304-03)。根据实验需求设计引物,所用到的鉴定引物序列如SEQ ID NO:33~38所示。以基因组为模板,对靶点附近序列进行PCR扩增,扩增的PCR产物用于高通量深度测序(金唯智生物科技有限公司)或Sanger测序(铂尚生物技术(上海)有限公司)进行编辑效率的鉴定。用于目标位点序列扩增的体系如下:2×Taq Master Mix(Vazyme,P112-03)25μL;Primer-F(10pmol/μL)1μL;Primer-R(10pmol/μL)1μL;模板1μL;ddH2O补齐到50μL。
基因编辑效果试验过程如下:
将p004V1-nCas9质粒分别与不同位点的sgRNA质粒共转到HEK293T细胞(ATCC购买)中,相比于将ABE8e质粒(addgene,Plasmid#138489),发现在位点1和位点17处,p004V1-nCas9质粒的编辑效率与ABE8e相似(图2,图3),而在位点18处p004V1-nCas9质粒的编辑效率明显优于ABE8e(图4)。
至于编辑窗口,位点1、位点17、位点18处p004V1-nCas9质粒的编辑窗口都小于ABE8e(参见图2~图4)。
基因编辑效率计算方法参见Kluesner MG,Nedveck DA,Lahr WS,Garbe JR,Abrahante JE,Webber BR,Moriarity BS.EditR:A Method to Quantify Base Editingfrom Sanger Sequencing.CRISPR J.2018Jun;1(3):239-250.doi:10.1089/crispr.2018.0014.PMID:31021262;PMCID:PMC6694769。本实施例相关结果如图2-4所示。
实施例2
本实施例中,将实施例1中获得的腺嘌呤碱基编辑器表达载体p004V1-nCas9应用到疾病治疗中。
前蛋白转化酶枯草溶菌素9(PCSK9)是kexin样前蛋白转化酶枯草溶菌素家族的第9个成员,由692个氨基酸残基组成。作为低密度脂蛋白受体(Low-Density LipoproteinReceptor,LDLR)的负调节剂,过量PCSK9与肝细胞表面LDLR结合后可加速其降解,导致肝细胞对低密度脂蛋白-胆固醇(Low-Density Lipoprotein Cholesterol,LDL-C)的摄取下降,进而增加外周循环的LDL-C水平,最终使血液中胆固醇水平升高。
1、sgRNA表达载体(sgRNA质粒)构建
本实施例中靶向PCSK9的sgRNA质粒的构建方式如实施例1中所述。所用到的sgRNA序列如SEQ ID NO:32所示。
2、细胞培养与转染
本实施例中HEK293T细胞的培养与转染方法与实施例1相同。
3、优化后的碱基编辑工具在PCSK9位点编辑效率检测
本实施例中编辑效率检测方法同实施例1中所述,所用到的鉴定引物序列如SEQID NO:39~40所示。
本实施例将腺嘌呤碱基编辑器表达载体p004V1-nCas9与靶向PCSK9的sgRNA质粒共转到HEK293T细胞中,如图5所示,相比于ABE8e腺嘌呤碱基编辑器,p004V1-nCas9的编辑效率优于ABE8e。说明p004V1-nCas9可以靶向治疗PCSK9高表达导致的高胆固醇血症。
实施例3
本实施例采用腺苷脱氨酶004V2、腺苷脱氨酶004V3、腺苷脱氨酶004V4、腺苷脱氨酶004V7、腺苷脱氨酶004V8、腺苷脱氨酶004V10、腺苷脱氨酶004V12、腺苷脱氨酶004V13采用与实施例1或实施例2相同的方法构建腺嘌呤碱基编辑器表达载体、sgRNA表达载体,并进行细胞培养及转染,检测编辑效率。
各腺苷脱氨酶的核苷酸序列如下:
004V2-nCas9的核苷酸序列(SEQ ID NO:54)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgacagagaaggaatatcaggatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V3-nCas9的核苷酸序列(SEQ ID NO:55)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgattttttcatgaagcgcgcaattacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatac gtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggaca ttctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaac atcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V4-nCas9的核苷酸序列(SEQ ID NO:56)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccagaaagtctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V7-nCas9的核苷酸序列(SEQ ID NO:57)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcgccaatgccattaacagctggcggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatac gtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactggg accctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcac cgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V8-nCas9的核苷酸序列(SEQ ID NO:58)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgctgggaacagacctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V10-nCas9的核苷酸序列(SEQ ID NO:59)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagattgaagaaactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V12-nCas9的核苷酸序列(SEQ ID NO:60)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaagatcttccactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctg ggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggtt caacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
004V13-nCas9的核苷酸序列(SEQ ID NO:61)
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactacttcgccctgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
本实施例具体结果如图6所示。其中,如图6所示,相比于ABE8e,004V2-nCas9、004V3-nCas9、004V4-nCas9、004V7-nCas9、004V8-nCas9、004V10-nCas9、004V12-nCas9、004V13-nCas9在位点1的编辑窗口明显变窄(+5,+7),其中以004v12-nCas9的编辑窗口最窄,仅对位置+5处具有编辑活性,并且碱基编辑效率为46%,可以实现高效精准编辑。在位点18,004V1-nCas9的不同突变体的编辑效率都明显优于ABE8e。对于PCSK9位点,004V1-nCas9和004V3-nCas9的编辑效率也优于ABE8e。
实施例4
本实施例采用腺苷脱氨酶005V1,将其与nCas9融合表达构成一种新的编辑窗口更窄的腺嘌呤碱基编辑器005V1-nCas9。
在本实施例中,腺嘌呤碱基编辑器005V1-nCas9构建策略为:将ABE8e中的腺苷脱氨酶替换为005V1,从而得到一种新的腺苷碱基编辑器005V1-nCas9。
1、腺嘌呤碱基编辑器005V1-nCas9表达载体(p005V1-nCas9质粒)的构建
本实施例制备了腺嘌呤碱基编辑器表达载体p005V1-nCas9。005V1的核苷酸序列如SEQ ID NO:44所示。
005V1的核苷酸序列(SEQ ID NO:44)
ATGAGTGAGCTGAATGATGCTTACTGGATGAAACAGGCACTCGCTTTAGCTCAGAAGGCCCGGGAACAGGGAGAAGTTCCAGTGGGCGCTATTCTGGTGCTGGATGATGAAGTGATAGGACAGGGATGGAATAGAGCCATCACCCTGCACGACCCCACCGCCCACGCCGAGATCATGGCCCTGCAGCAGGGCGGCCAGATCGTGCAGAACTACCGGCTGCTGAACGCCACCCTGTACGTGACCTTCGAGCCCTGCGTGATGTGCGCCGGCGCCATGGTGCACAGCAGGATCAAGAGACTGGTCTACGGCGTGAGCAACTCAAAAAGAGGCGCCGCCGGCAGCCTGCTGAACGTGCTGAACTACCCCGGCATGAACCACCAGATCGAGATCACCGCCGGCGTGATGGCCAACGAGTGCAGCGAGATGCTGTGCCAGTTCTATCAGCAGCCTAGGGAAGTGTTCAATGCTGAGCGTGAGGCTAGGCGGCTGAACCAACCTGATAGAGCTGAC
上述005V1脱氨酶的核苷酸序列已根据人密码子使用的偏好性进行密码子优化,委托生工生物工程(上海)股份有限公司完成510bp的005V1基因人工合成工作并将合成的基因替换ABE8e序列的第63-560位核苷酸。p005V1-nCas9质粒图谱如图7所示。
其中,005V1-nCas9的氨基酸序列如SEQ ID NO:23所示。
005V1-nCas9的核苷酸序列如下所示(SEQ ID NO:45):
atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgagtgagctgaatgatgcttactggatgaaacaggcactcgctttagctcagaaggcccgggaacagggagaagttccagtgggcgctattctggtgctggatgatgaagtgataggacagggatggaatagagccatcaccctgcacgaccccaccgcccacgccgagatcatggccctgcagcagggcggccagatcgtgcagaactaccggctgctgaacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcacagcaggatcaagagactggtctacggcgtgagcaactcaaaaagaggcgccgccggcagcctgctgaacgtgctgaactaccccggcatgaaccaccagatcgagatcaccgccggcgtgatggccaacgagtgcagcgagatgctgtgccagttctatcagcagcctagggaagtgttcaatgctgagcgtgaggctaggcggctgaaccaacctgatagagctgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc
2、细胞培养与转染
本实施例中HEK293T细胞的培养与转染的方法同实施例1。
3、本实施例的腺嘌呤碱基编辑器005V1-nCas9在位点1编辑效率检测
本实施例中编辑效率检测方法如实施例1中所述,所用到的鉴定引物序列如SEQID NO:33~34所示。相关结果如图8所示。在位点1,ABE8e的编辑窗口为+3,+5,+7,+8,而005V1-nCas9的编辑窗口仅为+5。而且在+5处的编辑效率,005V1-nCas9与ABE8e相近,证明005V1-nCas9可以实现高效精准编辑。
以上示例性实施方式所呈现的描述仅用以说明本发明的技术方案,并不想要成为毫无遗漏的,也不想要把本发明限制为所描述的精确形式。显然,本领域的普通技术人员根据上述教导做出很多改变和变化都是可能的。选择示例性实施方式并进行描述是为了解释本发明的特定原理及其实际应用,从而使得本领域的其它技术人员便于理解、实现并利用本发明的各种示例性实施方式及其各种选择形式和修改形式。本发明的保护范围意在由所附权利要求书及其等效形式所限定。
Claims (17)
1.一种腺苷脱氨酶,其包含以下序列中的一种或多种:
(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列;
(ii)与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ IDNO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性;
(iii)在SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:1或SEQID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
2.根据权利要求1所述的腺苷脱氨酶,其中,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:
S15、D16、H17、F19、N20、D21、E22、Y23、W24、R26、H27、L29、K33、R34、A35、V41、V43、L47、L49、N59、A61、I62、A69、E72、G80、L81、V82、L83、Q84、N85、Y86、I89、D90、A91、T92、V95、F97、I112、S113、R114、L115、F117、V119、R120、N121、K123、R124、N132、V133、L134、N135、P137、G138和M139;和/或,
所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代:
K19、A20、R21、E22、V33、L34、D35、D36、A46、I47、T48、L49、V80、T81、F82、E83、P84、I97、K98、R99、G103、V104、S105、N106、S107、K108、R109、G110、L116、N117、V118、L119、N120、Y121、P122、G123、C144、Q145、F146、Y147、Q148、Q149、P150、R151、E152、V153、F154、N155。
3.根据权利要求2所述的腺苷脱氨酶,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代:S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L;
优选地,所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代:
(1)S15T、D16E、H17K、F19Y、N20Q;
(2)E22D、Y23F、W24F、R26K、H27R、L29I;
(3)K33R、R34K、A35S;
(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W;
(5)I89L、D90G、A91T、T92D;
(6)I112L、S113K、R114K;
(7)N132K、V133I、L134F、N135H;和/或
(8)P137F、G138A、M139L。
4.一种碱基编辑器融合蛋白,其包含如权利要求1~3中任一项所述的腺苷脱氨酶,以及核酸可编程核苷酸结合结构域。
5.根据权利要求4所述的碱基编辑器融合蛋白,其中,所述核酸可编程核苷酸结合结构域为Cas蛋白或AGO蛋白。
6.根据权利要求4或5所述的碱基编辑器融合蛋白,其中,所述碱基编辑器融合蛋白中还包括至少一条核定位信号序列;
可选地,所述碱基编辑器融合蛋白中还包括接头;
任选地,所述接头包含如SEQ ID NO:3~12所示的序列中的一种或多种。
7.根据权利要求4~6中任一项所述的碱基编辑器融合蛋白,其中,所述碱基编辑器融合蛋白包含以下序列中的一种或多种:
(i)如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列;
(ii)与SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列具有至少80%、82%、85%、87%、90%、92%、95%、96%、97%、98%或99%同一性的氨基酸序列,并且其保留如SEQ IDNO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;
(iii)在SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列,并且其保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性;或者,
(iv)由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码如SEQ ID NO:22或SEQID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交,并且所述氨基酸序列保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性,所述严格条件是中等严格条件,中-高严格条件,高严格条件或非常高严格条件。
8.根据权利要求7所述的碱基编辑器融合蛋白,其中,所述的碱基编辑器融合蛋白包含SEQ ID NO:46~53所示序列中的任一种。
9.一种多核苷酸,其编码如权利要求1~3中任一项所述的腺苷脱氨酶或者编码如权利要求4~8中任一项所述的碱基编辑器融合蛋白。
10.一种载体,其包含如权利要求9所述的多核苷酸。
11.一种细胞,其包含如权利要求1~3中任一项所述的腺苷脱氨酶、如权利要求4~8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸和如权利要求10所述的载体中的一种或多种。
12.一种碱基编辑器系统,其包含如权利要求1~3中任一项所述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸;
或者,其包含如权利要求4~8中任一项所述的碱基编辑器融合蛋白,以及引导多核苷酸。
13.一种药物组合物,其包含如权利要求1~3中任一项所述的腺苷脱氨酶、如权利要求4~8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种,以及药学上可接受的载体。
14.一种试剂盒,其包含如权利要求1~3中任一项所述的腺苷脱氨酶、如权利要求4~8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种。
15.一种递送系统,其包含如权利要求1~3中任一项所述的腺苷脱氨酶、如权利要求4~8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种,以及递送介质。
16.一种核酸的碱基编辑方法,其包括将待被编辑碱基的核酸与如权利要求12所述的碱基编辑器系统相接触的步骤。
17.如权利要求1~3中任一项所述的腺苷脱氨酶、如权利要求4~8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞、如权利要求12所述的碱基编辑器系统、如权利要求13所述的药物组合物或如权利要求15所述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410261107.5A CN117925585A (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410261107.5A CN117925585A (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
CN202210363757.1A CN114634923B (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210363757.1A Division CN114634923B (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117925585A true CN117925585A (zh) | 2024-04-26 |
Family
ID=81952358
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410261107.5A Pending CN117925585A (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
CN202210363757.1A Active CN114634923B (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210363757.1A Active CN114634923B (zh) | 2022-04-07 | 2022-04-07 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN117925585A (zh) |
WO (1) | WO2023193536A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117925585A (zh) * | 2022-04-07 | 2024-04-26 | 尧唐(上海)生物科技有限公司 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
CN117965505A (zh) * | 2023-06-28 | 2024-05-03 | 微光基因(苏州)有限公司 | 工程化的腺苷脱氨酶及碱基编辑器 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020163396A1 (en) * | 2019-02-04 | 2020-08-13 | The General Hospital Corporation | Adenine dna base editor variants with reduced off-target rna editing |
AU2020223060B2 (en) * | 2019-02-13 | 2023-04-13 | Beam Therapeutics Inc. | Compositions and methods for treating hemoglobinopathies |
CN114072496A (zh) * | 2019-02-13 | 2022-02-18 | 比姆医疗股份有限公司 | 腺苷脱氨酶碱基编辑器及使用其修饰靶标序列中的核碱基的方法 |
EP3924480A4 (en) * | 2019-02-13 | 2023-08-02 | Beam Therapeutics, Inc. | MODIFIED IMMUNE CELLS HAVING ADENOSINE DEAMINASE BASE EDITORS TO MODIFY A NUCLEOBASE IN A TARGET SEQUENCE |
CA3128878A1 (en) * | 2019-02-13 | 2020-08-20 | Beam Therapeutics Inc. | Compositions and methods for treating alpha-1 antitrypsin deficiency |
CN110804628B (zh) * | 2019-02-28 | 2023-05-12 | 中国科学院脑科学与智能技术卓越创新中心 | 高特异性无脱靶单碱基基因编辑工具 |
CN111778233B (zh) * | 2019-04-04 | 2023-11-21 | 辉大(上海)生物科技有限公司 | 一种新型的单碱基编辑技术及其应用 |
CN113699135B (zh) * | 2021-08-10 | 2022-05-24 | 国家卫生健康委科学技术研究所 | 一种无pam限制的腺嘌呤碱基编辑器融合蛋白及应用 |
CN117925585A (zh) * | 2022-04-07 | 2024-04-26 | 尧唐(上海)生物科技有限公司 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
-
2022
- 2022-04-07 CN CN202410261107.5A patent/CN117925585A/zh active Pending
- 2022-04-07 CN CN202210363757.1A patent/CN114634923B/zh active Active
-
2023
- 2023-02-24 WO PCT/CN2023/078133 patent/WO2023193536A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN114634923B (zh) | 2024-02-23 |
WO2023193536A1 (zh) | 2023-10-12 |
CN114634923A (zh) | 2022-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11661590B2 (en) | Programmable CAS9-recombinase fusion proteins and uses thereof | |
US20240173430A1 (en) | Base editing for treating hutchinson-gilford progeria syndrome | |
EP3116533B1 (en) | Dystrophin gene exon deletion using engineered nucleases | |
US20230227857A1 (en) | Class ii, type v crispr systems | |
EP2539445B1 (en) | Use of endonucleases for inserting transgenes into safe harbor loci | |
KR20210023831A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법 | |
CA3009727A1 (en) | Compositions and methods for the treatment of hemoglobinopathies | |
AU2015330699A1 (en) | Compositions and methods for promoting homology directed repair | |
KR102151065B1 (ko) | 동물 배아의 염기 교정용 조성물 및 염기 교정 방법 | |
JP2022500017A (ja) | 核酸塩基編集システムを送達するための組成物および方法 | |
WO2023193536A1 (zh) | 一种腺苷脱氨酶、碱基编辑器及应用 | |
CA3102037A1 (en) | Gene targeting | |
JP2024504981A (ja) | 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ | |
KR20240017367A (ko) | 클래스 ii, v형 crispr 시스템 | |
CN111065736A (zh) | 针对颗粒状角膜变性症的基因治疗药物 | |
CN118146390A (zh) | 一种包含np220的融合蛋白、包含该融合蛋白的基因表达沉默工具及其应用 | |
CN117210435A (zh) | 一种用于调控rna甲基化修饰的编辑系统及其应用 | |
WO2023227669A2 (en) | Novel nucleic acid-editing proteins | |
류석민 | Highly efficient genome editing using RNA-guided base editors in mouse embryos | |
CN117210445A (zh) | 一种基于rna特异性脱氨酶突变体及其应用 | |
WO2024026478A1 (en) | Compositions and methods for treating a congenital eye disease | |
CN117431235A (zh) | CRISPR-Cas系统及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |