CN117965505A - 工程化的腺苷脱氨酶及碱基编辑器 - Google Patents
工程化的腺苷脱氨酶及碱基编辑器 Download PDFInfo
- Publication number
- CN117965505A CN117965505A CN202410206824.8A CN202410206824A CN117965505A CN 117965505 A CN117965505 A CN 117965505A CN 202410206824 A CN202410206824 A CN 202410206824A CN 117965505 A CN117965505 A CN 117965505A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- acid sequence
- adenosine deaminase
- seq
- nls
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000055025 Adenosine deaminases Human genes 0.000 title claims abstract description 311
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 title claims abstract description 303
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 402
- 238000006467 substitution reaction Methods 0.000 claims description 135
- 230000004568 DNA-binding Effects 0.000 claims description 84
- 102220602457 Cyclin-dependent kinases regulatory subunit 1_L83Y_mutation Human genes 0.000 claims description 51
- 102220411436 c.247C>T Human genes 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 48
- 108091033409 CRISPR Proteins 0.000 claims description 45
- 101000959719 Rattus norvegicus AP-3 complex subunit mu-1 Proteins 0.000 claims description 31
- 102200044494 rs28903098 Human genes 0.000 claims description 31
- 102200003390 rs142609245 Human genes 0.000 claims description 29
- 102220356559 c.104A>T Human genes 0.000 claims description 28
- 102220079370 rs369233658 Human genes 0.000 claims description 28
- 102000040430 polynucleotide Human genes 0.000 claims description 27
- 108091033319 polynucleotide Proteins 0.000 claims description 27
- 239000002157 polynucleotide Substances 0.000 claims description 27
- 239000008194 pharmaceutical composition Substances 0.000 claims description 22
- 230000030648 nucleus localization Effects 0.000 claims description 17
- 108020005004 Guide RNA Proteins 0.000 claims description 12
- 239000004109 brown FK Substances 0.000 claims description 12
- 102100026846 Cytidine deaminase Human genes 0.000 claims description 2
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 2
- 102200080026 rs794729202 Human genes 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 35
- 229930024421 Adenine Natural products 0.000 abstract description 34
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 abstract description 34
- 229960000643 adenine Drugs 0.000 abstract description 34
- 108700040115 Adenosine deaminases Proteins 0.000 abstract description 5
- 238000006243 chemical reaction Methods 0.000 abstract description 5
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 108
- 108090000623 proteins and genes Proteins 0.000 description 68
- 210000004027 cell Anatomy 0.000 description 57
- 102000004169 proteins and genes Human genes 0.000 description 44
- 235000018102 proteins Nutrition 0.000 description 42
- 101150102092 ccdB gene Proteins 0.000 description 41
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 102220473607 Cytochrome b5_P48A_mutation Human genes 0.000 description 31
- 201000010099 disease Diseases 0.000 description 29
- 102220335283 rs574731221 Human genes 0.000 description 29
- 102220089709 rs869320709 Human genes 0.000 description 29
- 102220559704 DENN domain-containing protein 2B_H51L_mutation Human genes 0.000 description 28
- 102220562876 Lymphotoxin-alpha_H51P_mutation Human genes 0.000 description 28
- 230000035772 mutation Effects 0.000 description 28
- 235000001014 amino acid Nutrition 0.000 description 26
- 238000012163 sequencing technique Methods 0.000 description 26
- 102000053602 DNA Human genes 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 24
- 239000002773 nucleotide Substances 0.000 description 24
- 125000003729 nucleotide group Chemical group 0.000 description 24
- 238000006481 deamination reaction Methods 0.000 description 23
- 102220264742 rs864622263 Human genes 0.000 description 23
- 230000009615 deamination Effects 0.000 description 22
- 238000000034 method Methods 0.000 description 21
- 239000013612 plasmid Substances 0.000 description 21
- 241000588724 Escherichia coli Species 0.000 description 19
- 150000007523 nucleic acids Chemical group 0.000 description 16
- 108010052875 Adenine deaminase Proteins 0.000 description 15
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 14
- 108090000765 processed proteins & peptides Proteins 0.000 description 14
- 102000039446 nucleic acids Human genes 0.000 description 13
- 108020004707 nucleic acids Proteins 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 108091027544 Subgenomic mRNA Proteins 0.000 description 12
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 12
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 12
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 12
- 239000000203 mixture Substances 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 101150114950 HEK2 gene Proteins 0.000 description 9
- 108091081024 Start codon Proteins 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 239000008103 glucose Substances 0.000 description 9
- 101710163270 Nuclease Proteins 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 7
- 101710096438 DNA-binding protein Proteins 0.000 description 7
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 7
- 229960005305 adenosine Drugs 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 210000001236 prokaryotic cell Anatomy 0.000 description 7
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 230000027455 binding Effects 0.000 description 5
- 210000003527 eukaryotic cell Anatomy 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 230000000415 inactivating effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 239000013646 rAAV2 vector Substances 0.000 description 4
- 210000000130 stem cell Anatomy 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 230000001018 virulence Effects 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- 101150075644 ATP7B gene Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- 102000003844 DNA helicases Human genes 0.000 description 2
- 108090000133 DNA helicases Proteins 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 208000027276 Von Willebrand disease Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000008512 biological response Effects 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 238000002873 global sequence alignment Methods 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000001613 neoplastic effect Effects 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000012137 von Willebrand disease (hereditary or acquired) Diseases 0.000 description 2
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 102000036365 BRCA1 Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102100023321 Ceruloplasmin Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000588699 Erwinia sp. Species 0.000 description 1
- 241001586974 Erwinia sp. 198 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 1
- 241000701109 Human adenovirus 2 Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 201000011062 Li-Fraumeni syndrome Diseases 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 1
- 208000035719 Maculopathy Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241000762023 Mangrovibacter Species 0.000 description 1
- 241000011620 Mangrovibacter sp. MFB070 Species 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 102100032543 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN Human genes 0.000 description 1
- 241001505332 Polyomavirus sp. Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 235000009697 arginine Nutrition 0.000 description 1
- 150000001484 arginines Chemical class 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 239000012867 bioactive agent Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- -1 cell Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 208000007345 glycogen storage disease Diseases 0.000 description 1
- 208000034737 hemoglobinopathy Diseases 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 150000007857 hydrazones Chemical class 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003140 lateral ventricle Anatomy 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- YIQPUIGJQJDJOS-UHFFFAOYSA-N plerixafor Chemical compound C=1C=C(CN2CCNCCCNCCNCCC2)C=CC=1CN1CCCNCCNCCCNCC1 YIQPUIGJQJDJOS-UHFFFAOYSA-N 0.000 description 1
- 229960002169 plerixafor Drugs 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 102200068100 rs104894368 Human genes 0.000 description 1
- 102200125377 rs1801175 Human genes 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本文公开了工程化的腺苷脱氨酶、基于这些腺苷脱氨酶的碱基编辑器以及包含这些碱基编辑器的复合物。所述腺苷脱氨酶及碱基编辑器显示出良好的腺嘌呤编辑效果,实现DNA水平A·T碱基对向G·C碱基对的转变。
Description
本申请是申请号为202310776962.5、申请日为2023年6月28日、发明名称为“工程化的腺苷脱氨酶及碱基编辑器”的发明专利申请的分案申请。
技术领域
本公开涉及工程化的腺苷脱氨酶、基于这些腺苷脱氨酶的碱基编辑器以及包含这些碱基编辑器的复合物。本公开还涉及编码工程化的腺苷脱氨酶的多核苷酸、密码子优化的多核苷酸、包含这些核苷酸的载体以及包含这些载体的细胞。本公开还涉及包含所述碱基编辑器、复合物、载体或细胞的药物组合物,以及使用所述碱基编辑器、复合物、载体、细胞或药物组合物治疗疾病的方法和用途。
背景技术
2016年,科学家首次基于CRISPR-Cas9系统结合化学生物学和基因编辑的方法,开发出单碱基编辑(BE)技术,可以在不产生DNA双链断裂(double strand breaks,DsBs)的情况下精确实现单个碱基的转换,从而有效地规避了由于双链DNA断裂后非同源末端连接修复(non-homologous end joining,NHEJ)和同源重组修复(homology directed repair,HDR)所带来的基因编辑技术的不足。随后,科学家开发出基于E.coli TadA(ecTadA)的新型单碱基编辑器——腺嘌呤单碱基编辑技术(adenine base editor,ABE),实现了靶位点A到G和互补链的T到C的精确转换。目前,ABE系统在基础生物学和医学领域应用广泛,主要体现在以下几个方面:(1)实现非分裂细胞的精准编辑;(2)基因功能筛选;(3)提前终止密码子的创建和纠正;(4)保守功能氨基酸的鉴定;(5)剪接位点变体的创建;(6)加速单个碱基位点处的功能缺失或功能获得性研究;(7)单碱基突变引起的遗传性疾病的临床治疗及基础理论研究。
目前的腺嘌呤碱基编辑器(ABE),由RNA引导的Cas蛋白与作用于单链DNA(ssDNA)的腺苷脱氨酶融合而成。当融合蛋白在引导RNA(如sgRNA)的引导下靶向基因组DNA时,腺苷脱氨酶可结合到ssDNA上,将特定位置的腺嘌呤(A)脱氨变成肌苷(I),I在DNA水平会被当做G进行读码与复制,最终实现A·T碱基对至G·C碱基对的直接替换。目前的ABE7.10和miniABEmax,需要较长时间才能完成反应,效率都很低,运行缓慢;科学家在ABE7.10的基础上进一步改进,得到包含单个脱氨酶结构(TadA-8e)而能同时对多个腺嘌呤进行脱氨的ABE8e。但是,目前此类能高效对多个腺嘌呤进行脱氨的腺苷脱氨酶和碱基编辑器种类较少,限制了其在商业上的应用。
发明内容
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ IDNO:17所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种碱基编辑器,其包含本发明提供的任何一种腺苷脱氨酶;以及所述碱基编辑器与引导RNA形成的复合物。
本发明的其他方面提供编码本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;以及包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物。
本发明还提供了使用本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物治疗疾病的方法。
本发明还提供了本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物在制备治疗疾病中的药物中的应用。
本发明还提供了用于治疗疾病的本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物。
附图说明
图1.通过观察大肠杆菌是否能在固体培养基上生长显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图2.通过观察大肠杆菌是否能在固体培养基上生长显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的终止密码子的编辑效果。
图3.通过测序显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图4.通过测序显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的终止密码子的编辑效果。
图5.通过测序显示本发明的另一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图6至10显示各种腺嘌呤碱基编辑器在293T细胞中编辑HEK2基因的测序图。
图11至15显示各种腺嘌呤碱基编辑器在293T细胞中编辑p992L基因的测序图。
图16至22显示根据本发明的实施例构建的各种碱基编辑器质粒的结构示意图。
具体实施方式
定义
本文使用的术语“碱基编辑器(BE)”是指包含能够对核酸序列(如DNA或RNA)内的碱基(如A、T、C、G或U)进行修饰的多肽的试剂。在一些实施方案中,碱基编辑器能够使核酸(例如DNA分子)内的碱基脱氨基。在腺嘌呤碱基编辑器(或称腺苷编辑器)的情况下,碱基编辑器能够使DNA中的腺嘌呤(A)脱氨基。这样的碱基编辑器可以包括与腺苷脱氨酶融合的可编程DNA结合蛋白。可编程DNA结合蛋白包括CRISPR介导的Cas效应蛋白。在一些实施方案中,碱基编辑器包含与脱氨酶融合的核酸酶非活性Cas9(dCas9),其结合核酸但不切割核酸。例如,碱基编辑器的dCas9结构域可以包括D10A和H840A突变。脓杆菌Cas9的DNA切割结构域包括两个亚结构域,即HNH核酸酶亚结构域和RuvC I亚结构域。HNH亚结构域切割与gRNA互补的链(“靶向链”,或发生编辑或脱氨基的链),而RuvC I亚结构域则切割含有PAM序列的非互补链(“非编辑链”)。RuvC I突变体D10A在靶向链中产生缺口,而HNH突变体H840A在未编辑的链上产生缺口。在本发明中,术语“碱基编辑器”是指包含腺苷脱氨酶结构域的碱基编辑器,例如腺嘌呤碱基编辑器(ABE)或胞嘧啶及腺嘌呤碱基编辑器(CABE)
术语“Cas9”或“Cas9核酸酶”或“Cas9结构域”是指CRISPR相关蛋白9或其变体,包括来自任何生物体的任何天然Cas9、任何天然Cas9等同体或其片段、来自任何生物的任何Cas9同源物、直向同源物或旁系同源物,以及任何天然存在或工程化的Cas9的任何变体。术语Cas9不限于任何具体的Cas9,可以称为“Cas9或其变体”。本文描述了示例性的Cas9蛋白。
如本文所使用的,术语“dCas9”是指核酸酶无活性的Cas9或核酸酶死亡的Cas9,或其变体,并包括来自任何生物体的任何天然存在的dCas9、任何天然存在dCas9等同体或其功能片段、来自任何生物的任何dCas9同源物、直系同源物或旁系同源物,以及任何天然存在或工程化的dCas 9变体。本文将描述示例性的dCas9蛋白。任何使Cas9核酸内切酶失活的合适突变都可以用于形成dCas9,例如野生型化脓性链球菌Cas9氨基酸序列中的D10A和H840A突变,或野生型金黄色葡萄球菌Cas9氨基酸序列中的D10A和N580A突变。
如本文所用,术语“nCas9”、“Cas9切口酶”或“Cas9缺口酶”是指仅切割靶切割位点的一条链,从而在双链DNA分子中引入缺口而不是产生双链断裂的Cas9或其变体。这可以通过在野生型Cas9中引入适当的突变来实现,以使Cas9的两个核酸内切酶之一单独活性失活。任何使Cas9核酸内切酶活性的一个失活但使另一个保持不变的合适突变都可用于形成nCas9,例如野生型化脓性链球菌Cas9氨基酸序列中的D10A或H840A突变之一,或野生型金黄色葡萄球菌Cas9氨基酸序列中的D10A突变。
术语“脱氨酶”或“脱氨酶结构域”是指对脱氨基反应进行催化的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化核碱基腺嘌呤的水解脱氨基。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(DNA)中的腺嘌呤水解脱氨基为次黄嘌呤。本文提供的脱氨酶可以来自任何生物体,例如细菌。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域不是天然存在的。例如,在一些实施方案中,脱氨酶或脱氨酶结构域不是天然存在的,但与天然存在的脱氨酶至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。
如本文所用,术语“腺苷脱氨酶结构域”是指包含一种或多种腺苷脱氨蛋白酶的碱基编辑器内的结构域。例如,腺苷脱氨酶结构域可以包括单个腺苷脱氨蛋白酶。在其它实施方案中,腺苷脱氨酶结构域可包含第一腺苷脱氨蛋白酶和第二脱氨酶的异二聚体,例如,其中两种脱氨酶通过连接体连接。本文提供的腺苷脱氨酶(例如,工程化的腺苷脱氨化酶)可以包括将DNA中的腺苷(A)转化为肌苷(I)的酶。这种腺苷脱氨化酶可以引起A:T到G:C碱基对的转化。在一些实施方案中,腺苷脱氨酶来源于细菌,例如Mangrovibacter sp.
(如Mangrovibacter sp.MFB070)、Zophobihabitans entericus或Erwinia sp.
(如Erwinia sp.198)。
如本文所用,术语“DNA结合蛋白”或“DNA结合蛋白结构域”是指定位并结合特定靶DNA核苷酸序列(例如,基因组的基因座)的任何蛋白质。这个术语包括RNA可编程蛋白,其与一种或多种核酸分子(即,在Cas系统的情况下包括例如引导RNA)结合(例如,形成复合物),所述核酸分子引导或以其他方式编程蛋白质定位到与一种或更多种核酸分子(或其一部分或区域)互补的特定靶核苷酸序列(例如,DNA序列)。示例性的RNA可编程蛋白是CRISPR-Cas9蛋白,以及Cas9等同物、同源物、直链同源物或旁系同源物,无论是天然存在的还是非天然存在的(例如,工程化或修饰的),并且可以包括来自任何类型的CRISPR系统(例如II型、V型、VI型)的Cas9等价物,包括Cpfl(V型CRISPR-Cas系统)、C2c1(V型CRISPR-Cas系统)、C2c2(VI型CRISPR-Cas系统)、C2c3(V型CRISPR-Cass系统)、dCas9、GeoCas9、CjCas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12f、Cas12g、Cas12h、Cas12i、Cas12m、Cas13d、Cas14、Argonaute和nCas9。
本文使用的术语“有效量”是指足以引发所需生物反应的生物活性剂的量。例如,在一些实施方案中,组合物的有效量可以指足以编辑核苷酸序列(例如基因组)的靶位点的组合物的量。在一些实施方案中,本文提供的组合物的有效量,例如,包含核酸酶无活性的可编程DNA结合蛋白结构域、脱氨酶结构域、gRNA的组合物,可以指足以诱导由碱基编辑器特异性结合和编辑的靶位点的编辑的组合物的量。在一些实施方案中,本文提供的组合物的有效量可指足以诱导编辑的组合物的量,其具有以下特征:>50%的产物纯度、<5%的indel和2-8个核苷酸的编辑窗口。如本领域技术人员所理解的,试剂(例如组合物或碱基编辑器-gRNA复合物)的有效量可以根据各种因素而变化,包括但不限于所需的生物反应、待编辑的特定等位基因、基因组或靶位点、待靶向的细胞或组织和/或所使用的碱基编辑器。
本文所用的术语“融合蛋白”是指包含至少两种蛋白质的蛋白质结构域的杂交多肽。一种蛋白质可能位于融合蛋白的氨基末端(N-末端)部分或羧基末端(C-末端)。本文提供的任何蛋白质都可以通过本领域已知的任何方法生产。例如,本文提供的蛋白质可以通过重组蛋白质表达和纯化生产,这特别适用于包含肽接头的融合蛋白。
本文中使用的术语“连接体”或“接头”是指连接两个分子或结构域的化学基团或分子,例如连接dCas9和脱氨酶的连接体。通常,连接体位于两个基团、分子或其他结构域之间或两侧,并通过共价键相互连接,从而连接两者。在一些实施方案中,连接体是一种氨基酸或多种氨基酸(例如肽或蛋白质)。在一些实施方案中,连接体是有机分子、基团、聚合物或化学结构域。化学基团包括但不限于二硫化物、腙和叠氮化物结构域。在一些实施方案中,接头的长度为5-100个氨基酸,例如,长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可以考虑更长或更短的连接体。在一些实施方案中,所述连接体是XTEN连接体。在一些实施方案中,连接体是由甘氨酸和丝氨酸构成的32个氨基酸的连接体。在其它实施方案中,连接体是由甘氨酸和丝氨酸构成的30、31、33或34个氨基酸的连接体。
“非天然的”或“工程化的”这两个术语可以互换使用,表示人工参与,当提及核酸分子或多肽(例如脱氨酶)时,意指核酸分子或肽至少基本上不含它们在自然界中天然结合和/或在自然界中发现的至少一种其它组分(例如,在自然界中未发现的氨基酸序列)。
术语“可编程DNA结合蛋白”是指可以与一个或多个核酸分子结合(例如,形成复合物)并指导或以其他方式编程蛋白质定位到特异性靶核苷酸序列(例如,基因组的基因座)的任何蛋白质,该核酸分子与与该蛋白相关的一个或多个核酸分子(或其一部分或区域)互补,从而使蛋白质在特异性靶位点与核苷酸序列结合。示例性的可编程DNA结合蛋白包括CRISPR-Cas9蛋白及其功能性变体。
核定位信号或序列(NLS)是一种标记、指定或以其他方式标记蛋白质以通过核转运输入细胞核的氨基酸序列。通常,该信号由暴露在蛋白质表面的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成。不同的核定位蛋白可能共享相同的NLS。NLS具有与核输出信号(NES)相反的功能,后者靶向细胞核外的蛋白质。因此,单个细胞核定位信号可以将与其相关联的实体引导到细胞的细胞核。这样的序列可以是任何大小和组成,例如超过25、25、15、12、10、8、7、6、5或4个氨基酸。
本文中使用的术语“对象”或“受试者”是指个体生物体,例如个体哺乳动物。在一些实施例中,对象是人。
如本文所用,术语“变体”是指与所参考的对象相比具有变化但仍保留至少一种功能或特性(如结合、相互作用和/或酶活性)的对象等同体。“变体”与参考对象(例如野生型蛋白)可至少约70%相同、至少约80%相同、至少大约90%相同、至少大致95%相同、至少至少大约96%相同、至少大体97%相同、至少基本98%相同、至少99%相同、至少99.5%相同或至少约99.9%相同。例如,与野生型Cas9氨基酸序列相比,Cas9的变体可以包括在氨基酸残基上具有一个或多个变化的Cas9。作为另一个例子,脱氨酶的变体可以包括与野生型脱氨酶氨基酸序列相比具有一个或多个氨基酸残基变化的脱氨酶。这些变化包括化学修饰,例如不同氨基酸残基的取代、截短、共价连接标签和任何其他突变。该术语也包括野生型蛋白质的片段。该特性或功能的保留水平或程度可以相对于野生型蛋白质降低或提高,但通常是相同或相似的。通常,变体总体上非常相似,并且在许多区域中与本文所述的蛋白质的氨基酸序列相同。变体蛋白可以包含与例如野生型蛋白的氨基酸序列或本文提供的任何蛋白(例如腺嘌呤碱基编辑器的腺苷脱氨酶结构域)至少80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,或由其组成。对于多核苷酸分子,其变体包括在严格的杂交条件下与该多核苷酸分子的互补物杂交的多核苷酸分子,所述严格的杂交条件例如是约45℃、6x氯化钠/柠檬酸钠(SSC)中过滤结合的DNA,随后在约50-65℃再0.2xSSC、0.1%SDS中洗涤一次或多次。
具有与参考氨基酸序列具有至少例如是95%“同一性”的氨基酸序列的多肽,是指该多肽的氨基酸序列与参考序列相比,可以在该多肽的氨基酸序列的每100个氨基酸中包括至多5个氨基酸改变。换言之,为了获得具有与参考氨基酸序列至少95%相同的氨基酸序列的多肽,可以插入、删除或取代参考序列中高达5%的氨基酸残基。参考序列的这些改变可以发生在参考氨基酸序列的氨基或羧基末端位置处,或者发生在这些末端位置之间的任何地方,或者单独地散布在参考序列中的残基之间,或者在参考序列内的一个或多个连续残基中。
任何特定的多肽是否与参考蛋白的氨基酸序列(例如本发明的示例性的脱氨酶中的任何一个)至少80%、85%、90%、95%、96%、97%、98%或99%相同,可以使用已知的计算机程序常规地确定。用于确定查询序列(例如本发明的脱氨酶序列)和主题序列之间的最佳总体匹配(也称为全局序列比对)的优选方法,可以使用FASTDB计算机程序,其基于Brutlag等人在(Comp.App.Biosci.6:237-245(1990))中描述的算法。在序列比对中,查询序列和主题序列可以是核苷酸序列或者氨基酸序列。所述全局序列比对的结果表示为同一性百分比。FASTDB氨基酸比对中使用的优选参数为:Matrix=PAM 0,k-tupie=2,MismatchPenalty=1,Joining Penalty=20,Randomization Group Length=0,Cutoff Score=1,Window Size=sequence length,Gap Penalty=5,Gap Size Penalty=0.05,WindowSize=500与主题氨基酸序列的长度中择其短者。如果主题序列比查询序列短是由于N或C端缺失,而不是因为内部缺失,则必须对结果进行手动更正。这是因为FASTDB程序在计算全局同一性百分比时没有考虑主题序列的N端和C端截短。对于在N端和C端被截短的主题序列,相对于查询序列,通过计算作为主题序列的N端和C-端的查询序列的未与相应主题残基匹配/对齐的残基的数量作为查询序列的总碱基的百分比来校正同一性百分比。残基是否匹配/对齐由FASTDB序列比对的结果来确定。然后从上述FASTDB程序使用指定参数计算的同一性百分比中减去该百分比,得出最终的同一性百分比分数。这个最终的同一性百分比分数是用于本发明目的的分数。对于手动调整同一性百分比分数,只考虑与查询序列不匹配/对齐的主题序列的N-和C-末端的残基。也就是说,只查询主题序列的最远N端和C端残基之外的残基位置。
如本文所用,术语“野生型”是本领域技术人员所理解的术语,是指在自然界中出现的生物体、菌株、基因或特征的典型形式,与突变或变体形式不同。
腺苷脱氨酶
本发明的一个方面提供腺苷脱氨酶。
在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:1所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:1所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:1所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23K;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36V;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36I;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51V;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51I;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84W;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106I;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106L;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111K;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119R;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156W;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的任一腺苷脱氨酶相对于SEQ ID NO:1不含F149Q取代。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:2所示的氨基酸序列,或与SEQ ID NO:2所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:3所示的氨基酸序列,或与SEQ ID NO:3所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:4所示的氨基酸序列,或与SEQ ID NO:4所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:5所示的氨基酸序列,或与SEQ ID NO:5所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:6所示的氨基酸序列,或与SEQ ID NO:6所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:7所示的氨基酸序列,或与SEQ ID NO:7所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:8所示的氨基酸序列,或与SEQ ID NO:8所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:9所示的氨基酸序列,或与SEQ ID NO:9所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:10所示的氨基酸序列,或与SEQ ID NO:10所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:2至10任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:2至10任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:2所示的氨基酸序列组成,或实质上由SEQ ID NO:2所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:3所示的氨基酸序列组成,或实质上由SEQ ID NO:3所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:4所示的氨基酸序列组成,或实质上由SEQ ID NO:4所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:5所示的氨基酸序列组成,或实质上由SEQ ID NO:5所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:6所示的氨基酸序列组成,或实质上由SEQ ID NO:6所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:7所示的氨基酸序列组成,或实质上由SEQ ID NO:7所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:8所示的氨基酸序列组成,或实质上由SEQ ID NO:8所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:9所示的氨基酸序列组成,或实质上由SEQ ID NO:9所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:10所示的氨基酸序列组成,或实质上由SEQID NO:10所示的氨基酸序列组成。在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:12所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15或16个具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:12所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15或16个具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:12所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22K;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83W;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105I;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105L;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108I;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108L;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110K;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154I;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154L;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:13所示的氨基酸序列,或与SEQ ID NO:13所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:14所示的氨基酸序列,或与SEQ ID NO:14所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:15所示的氨基酸序列,或与SEQ ID NO:15所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:16所示的氨基酸序列,或与SEQ ID NO:16所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:13至16任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:13至16任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:13所示的氨基酸序列组成,或实质上由SEQ ID NO:13所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:14所示的氨基酸序列组成,或实质上由SEQ ID NO:14所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:15所示的氨基酸序列组成,或实质上由SEQ ID NO:15所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:16所示的氨基酸序列组成,或实质上由SEQ ID NO:16所示的氨基酸序列组成。
在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQID NO:17所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:17所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:17所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:17所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22K;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35V;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35I;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50V;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50I;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83W;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105I;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105L;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110K;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154I;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154L;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155W;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:18所示的氨基酸序列,或与SEQ ID NO:18所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:19所示的氨基酸序列,或与SEQ ID NO:19所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:20所示的氨基酸序列,或与SEQ ID NO:20所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:21所示的氨基酸序列,或与SEQ ID NO:21所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:18至21任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:18至21任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:18所示的氨基酸序列组成,或实质上由SEQ ID NO:18所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:19所示的氨基酸序列组成,或实质上由SEQ ID NO:19所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:20所示的氨基酸序列组成,或实质上由SEQ ID NO:20所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:21所示的氨基酸序列组成,或实质上由SEQ ID NO:21所示的氨基酸序列组成。
如本领域技术人员可以意识到的,本发明提供的任何一个腺苷脱氨酶可以是独立的,或者与其他部分共价结合从而以腺苷脱氨酶结构域形式出现,该腺苷脱氨酶结构域与所述其他部分一起构成包含该腺苷脱氨酶结构域的分子,例如碱基编辑器。本文所使用的术语“腺苷脱氨酶”意在包括该腺苷脱氨酶结构域形式。腺苷脱氨酶结构域可是通过在N端、C端或两者之间的任何位置中的一个、多个或全部共价连接至其他部分。例如,腺苷脱氨酶的N端共价连接至核定位序列的C端(例如通过腺苷脱氨酶最N端的氨基酸残基的-NH2与核定位序列的最C端的氨基酸残基的-COOH形成肽键),而腺苷脱氨酶的C端可保持游离状态(即包含游离-COOH)。又例如,腺苷脱氨酶的C端共价连接至核定位序列的N端(例如通过-NH2与-COOH形成肽键),而腺苷脱氨酶的N端可保持游离状态(即包含游离-NH2)。又例如,腺苷脱氨酶的N端共价连接至核定位序列的C端,腺苷脱氨酶的C端共价连接至DNA结合蛋白的N端。因此,本发明提供的任何一个腺苷脱氨酶可被包括在更大的蛋白分子中而形成腺苷脱氨酶结构域,其保留腺苷脱氨酶活性并与所述其他结构域一起使所述更大的蛋白分子中发挥功能,例如碱基编辑功能。下文将更详细描述。
碱基编辑器
本发明的另一个方面提供碱基编辑器。
在一些实施方式中,本发明提供一种碱基编辑器,其包含本发明以上任何一种腺苷脱氨酶。在一些实施方式中,所述碱基编辑器是腺嘌呤碱基编辑器。在另一些实施方式中,所述碱基编辑器是腺嘌呤及胞嘧啶碱基编辑器,其同时包含腺苷脱氨酶和胞苷脱氨酶,从而实现腺嘌呤和胞嘧啶的同时编辑。在本发明中,碱基编辑器在细胞中以融合蛋白形式起作用。
因此,在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,该腺苷脱氨酶结构域由本发明以上任何一种腺苷脱氨酶形成。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:2所示的氨基酸序列或与SEQ ID NO:2所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:3所示的氨基酸序列或与SEQ ID NO:3所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:4所示的氨基酸序列或与SEQ ID NO:4所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:5所示的氨基酸序列或与SEQ ID NO:5所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:6所示的氨基酸序列或与SEQ ID NO:6所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:7所示的氨基酸序列或与SEQ ID NO:7所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:8所示的氨基酸序列或与SEQ ID NO:8所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:9所示的氨基酸序列或与SEQ ID NO:9所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:10所示的氨基酸序列或与SEQ ID NO:10所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:13所示的氨基酸序列或与SEQ ID NO:13所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:14所示的氨基酸序列或与SEQ ID NO:14所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:15所示的氨基酸序列或与SEQ ID NO:15所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:16所示的氨基酸序列或与SEQ ID NO:16所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:18所示的氨基酸序列或与SEQ ID NO:18所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:19所示的氨基酸序列或与SEQ ID NO:19所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:20所示的氨基酸序列或与SEQ ID NO:20所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:21所示的氨基酸序列或与SEQ ID NO:21所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列;所述第二脱氨酶结构域包含选自SEQ ID NO:1、12和17中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:1所示的氨基酸序列或与SEQ ID NO:1具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:12所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:12所示的氨基酸序列或与SEQ ID NO:12具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:17所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:17所示的氨基酸序列或与SEQ ID NO:12具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含可编程DNA结合结构域。在这样的实施方式中,所述可编程DNA结合结构域可以是CRISPR相关核酸酶。示例性的CRISPR相关核酸酶包括Cas9核酸酶及其任何变体。在各种实施方案中,可编程DNA结合结构域具有切口酶活性,即仅切割靶DNA序列的一条链(如nCas9)。在其他实施方案中,所述可编程DNA结合结构域具有非活性核酸酶,例如,“死”蛋白(如dCas9)。本文所述的碱基编辑器也可包含Cas9等同物,包括Cas12a、Cas12b、Cas12f、Cas12i和Cas12m蛋白。本文中使用的可编程DNA结合结构域(例如,SpCas9、SaCas9、SaCas9变体或SpCas9变体)也可以包含改变/增强其PAM特异性的各种修饰。本公开涉及与参考Cas9序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.9%序列同一性的任何Cas9、Cas9变体或Cas9等效物,所述参考序列例如是SEQ ID NO:22或23中所示的dCas9和nCas9核酸酶。
在一些实施方案中,可编程DNA结合结构域可以包含多于一种的可编程DNA结合蛋白。因此,在一些实施方案中,上述任一碱基编辑器可以包含第一可编程DNA结合结构域和第二可编程DNA结合结构域。在一些实施方案中,所述可编程DNA结合结构域(或分别为所述第一和第二可编程DNA结合结构域)包含第一Cas同源物或变体和第二Cas同源体或变体(例如,第一Cas变体包含Cas9-NG,而第二Cas变体包含Cas9-CP1041,例如“SpCas9-NG-CPI041”)。在一些实施方案中,第一Cas变体包括Cas9-NG,第二Cas变体包含SpCas9-VRQR。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含一个或多个核定位序列(或称核定位信号)。在一些实施方式中,所述碱基编辑器包含一个核定位序列(NLS)。在另一些实施方式中,所述碱基编辑器包含两个核定位序列。在另一些实施方式中,每个所述核定位序列可已是单组分(monopartite)或双组分(bipartite)NLS。在一些实施方式中,所述碱基编辑器包含两个双组分核定位序列。
在一些实施方式中,所述核定位序列包含SEQ ID NO:32至36任一个所示的核苷酸序列或氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:32所示的核苷酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:33所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:34所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:35所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:36所示的氨基酸序列。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含胞嘧啶脱氨酶,以形成可以同时编辑胞嘧啶和腺嘌呤的碱基编辑器(CABE)。示例性的胞嘧啶脱氨酶包括AID、APOBEC3A、APOBEC1、PmCDA1、LjCDA1或其同源物。
在某些实施方案中,连接体可用于连接任何肽或肽结构域或碱基编辑器的结构域(例如,腺苷脱氨酶结构域共价连接至可编程DNA结合结构域,其又共价连接至NLS结构域)。本文所述的碱基编辑器可以包括长度为32个氨基酸的连接体。在一些实施方案中,连接体能连接Cas9与脱氨酶。在一些实施方案中,连接体能连接dCas9与脱氨酶。在一些实施方案中,连接体能连接nCas9与脱氨酶。连接体可位于两个基团、分子、或其它部分之间,或侧翼有两个基团、分子、或其它部分,且通过共价键或非共价交互作用彼此连结。在一些实施方案中,连接体可以是多核苷酸。在一些实施方案中,连接体可以是DNA连接序列。示例性的连接体包含如SEQ ID NO:11、26、27、37至41的任何一个所示的氨基酸序列或核苷酸序列。在一些实施方案中,所述碱基编辑器可以包含多个连接体,每个连接体相同或不同。
本公开进一步提供了根据所公开的编辑方法使用的引导RNA。本公开提供了被设计用于识别靶序列的引导RNA。这样的gRNA可以被设计为具有与靶序列内的原间隔区互补的引导序列(或“间隔区”)。还提供了与一种或多种公开的碱基编辑器一起使用的引导RNA。这样的gRNA可以被设计为具有与待编辑的靶序列内的原间隔区互补的引导序列,并且具有与任何公开的碱基编辑器的可编程DNA结合结构域(例如公开的碱基编辑的Cas9切口酶结构域)特异性相互作用的主链序列。
在一些实施方案中,引导序列的长度为约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在一些实施方案中,每个gRNA包含至少与靶序列互补的10个连续核苷酸(例如,10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸)。编码引导RNA的DNA序列可以是线性的也可以是环状。在一些实施方案中,核酸酶Cas9或Cas9结构域与一个或多个gRNA一起使用。
在一些实施方式中,示意性的碱基编辑器包括以下结构:
NH2-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;或
NH2-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-COOH,
其中]-[表示可任选地存在的根据上文定义的连接体(下同)。
在一些实施方式中,包含第一和第二腺苷脱氨酶的碱基编辑器的示意性结构包括:
NH2-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[第一腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[第二腺苷脱氨酶结构域]-COOH;
NH2-[可编程DNA结合结构域]-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-COOH;
NH2-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[第二腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[第一腺苷脱氨酶结构域]-COOH;和
NH2-[可编程DNA结合结构域]-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-COOH。
在一些实施方式中,包含NLS的碱基编辑器的示意性结构包括:
NH2-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;和
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.3]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.4]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.4]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.5]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.5]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ZoTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTada1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ErTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTada1.0]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA-WT]-[MaTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0]-[MaTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA-WT]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0]-[可编程DNA结合结构域]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[MaTadA-WT]-[MaTadA1.1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[MaTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.1]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA-WT]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[可编程DNA结合结构域]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA-WT]-[ZoTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0]-[ZoTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0]-[ZoTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA-WT]-[ZoTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[可编程DNA结合结构域]-[ZoTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[ErTadA-WT]-[ErTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0]-[ErTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0]-[ErTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA-WT]-[ErTadA1.0]-[NLS]-COOH;或
NH2-[NLS]-[ErTadA1.0-1]-[可编程DNA结合结构域]-[ErTadA-WT]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-3]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.3]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.4]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.4]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.5]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.5]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ZoTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.00-3]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ErTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.00-3]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器可包含如SEQ ID NO:46至54的任一个所示的氨基酸序列,或与SEQ ID NO:46至54的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由所述任何一个氨基酸序列组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:46所示的氨基酸序列或与SEQ ID NO:46的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:47所示的氨基酸序列或与SEQ ID NO:47的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:48所示的氨基酸序列或与SEQ ID NO:48的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:49所示的氨基酸序列或与SEQ ID NO:49的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:50所示的氨基酸序列或与SEQ ID NO:50的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:51所示的氨基酸序列或与SEQ ID NO:51的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:52所示的氨基酸序列或与SEQ ID NO:52的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:53所示的氨基酸序列或与SEQ ID NO:53的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:54所示的氨基酸序列或与SEQ ID NO:54的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
多核苷酸、载体、细胞
本发明的另一个方面提供编码本发明提供的腺苷脱氨酶或包含所述腺苷脱氨酶的碱基编辑器的多核苷酸。
在一些实施方式中,所述编码腺苷脱氨酶的多核苷酸是DNA或RNA序列。在一些实施方式中,所述多核苷酸是密码子优化的,例如用于在真核细胞(例如人细胞)中表达。
示例性的编码本发明的腺苷脱氨酶的多核苷酸的序列包含SEQ ID NO:24、25、28至31中的任何一个所述的核酸序列。
本发明的另一个方面提供载体,其包含上述任何一个多核苷酸,特别是编码本发明的任何一个碱基编辑器的多核苷酸。载体可以被设计为克隆和/或表达本发明的碱基编辑器。载体还可以被设计成将本发明的腺嘌呤碱基编辑器转染到一个或多个细胞中,例如靶病变真核细胞中,用于用本文发明的碱基编辑器和方法进行治疗。载体可以被设计用于在原核或真核细胞中表达碱基编辑转录物(例如核酸转录物、蛋白质或酶)。例如,碱基编辑器转录物可以在细菌细胞如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、植物细胞或哺乳动物细胞中表达。或者,编码本文所述的一种或多种碱基编辑器的表达载体可以在体外转录和翻译,例如使用T7启动子调控序列和T7聚合酶。
载体可以被引入到原核细胞中并在其中复制。在一些实施方案中,原核生物用于扩增将被引入真核细胞的载体的拷贝,或用于生产将被引入到真核细胞中的载体的中间载体(例如扩增质粒作为病毒载体包装系统的一部分)。在一些实施方案中,原核生物用于扩增载体的拷贝并表达一个或多个核酸,例如提供一种或多种蛋白质的来源以递送至宿主细胞或宿主生物体。蛋白质在原核生物中的表达通常在大肠杆菌中用含有组成型或诱导型启动子的载体进行。
在一些实施方案中,载体能够使用哺乳动物表达载体驱动一个或多个序列在哺乳动物细胞中的表达。哺乳动物表达载体的实例包括pCDM8和pMT2PC。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调节元件提供。例如,常用的启动子来源于多瘤病毒、腺病毒2、巨细胞病毒、猴病毒40,以及本领域已知的其它启动子。
本发明的一些实施例提供了包含本文提供的任何碱基编辑器或复合体的细胞。在一些实施方案中,细胞包含编码本文提供的任何碱基编辑器的核苷酸构建体。在一些实施方案中,细胞包括本文提供的任何核苷酸或载体。在一些实施方案中,所述细胞是干细胞。在一些实施方案中,细胞是人干细胞,例如人干和祖细胞(HSPC)。在一些实施方案中,所述细胞是激活的(例如plerixafor激活的)外周血HSPC。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在受试者中自然地被转染。在一些实施方案中,被转染的细胞取自受试者。在一些实施方案中,细胞来源于取自受试者的细胞,例如细胞系。本领域已知多种用于组织培养的细胞系。在一些实施方案中,从受试者身上取出细胞,并与任何公开的碱基编辑器、复合物、载体或多核苷酸进行体外接触。
药物组合物、治疗方法、用途
本发明的另一个方面提供了用于治疗被诊断患有与点突变相关或由点突变引起的疾病的受试者的方法,所述点突变可以通过本文提供的碱基编辑器来校正。例如,在一些实施例中,提供了一种方法,包括向患有这种疾病的受试者(例如,与如上所述的点突变相关联的癌症)施用有效量的腺苷碱基编辑器,该编辑器纠正点突变或将失活突变引入疾病相关基因。在一些实施方案中,该疾病是增殖性疾病。在一些实施方案中,该疾病是遗传性疾病。在一些实施方案中,该疾病是肿瘤性疾病。在一些实施方案中,该疾病是一种代谢性疾病。在一些实施方案中,该疾病是溶酶体贮积病。可以通过校正点突变或将失活突变引入疾病相关基因中来治疗的其他疾病将是本领域技术人员已知的。
在一些实施方案中,突变的A的脱氨作用导致编码野生型氨基酸的密码子。在一些实施方案中,接触是在受试者体内进行的。在一些实施方案中,受试者已经或已经被诊断患有疾病或病症。在一些实施方案中,所述疾病或病症是血红蛋白病。在一些实施方案中,所述疾病或病症是镰状细胞病。在一些实施方案中,该疾病或病症是地中海贫血。在一些实施方案中,该疾病或病症是与葡萄糖-6-磷酸酶-α(G6PC)酶中的R83C突变相关的1A型糖原储存病,以及与ATP结合盒A亚家族成员4(ABCA4)蛋白中的G1961E突变相关的Stargardt黄斑营养不良。在一些实施方案中,该疾病或病症是苯丙酮尿症、von Willebrand病(vWD)、与突变PTEN或BRCA1相关的肿瘤性疾病或Li-Fraumeni综合征。
一些实施例提供了使用本文提供的碱基编辑器的方法。在一些实施方案中,碱基编辑器用于通过将靶核碱基(例如A碱基)脱氨基而将点突变引入核酸。在一些实施方案中,靶核碱基的脱氨基导致遗传缺陷的校正,例如导致基因产物中引起功能丧失的点突变的校正。在一些实施方案中,本文提供的方法用于将失活点突变引入编码与疾病或病症相关的基因产物的基因或等位基因中。例如,在一些实施方案中,本文提供了使用碱基编辑器将失活点突变引入癌基因的方法(例如,在治疗增殖性疾病中)。在一些实施方案中,失活突变可以在编码序列中产生过早终止密码子,其导致截短的基因产物(例如缺乏全长蛋白功能的截短的蛋白)的表达。
在一些实施方案中,本文提供的方法的目的是通过基因组编辑恢复功能失调基因的功能。本文提供的碱基编辑器可以在体外验证用于基于基因编辑的人类治疗,例如,通过校正人类细胞培养中的疾病相关突变。本领域技术人员将理解,本文提供的碱基编辑器可用于校正任何单点G至A或C至T突变。
本发明的其他方面涉及包含本文所述的腺苷脱氨酶、碱基编辑器或碱基编辑器-gRNA复合物中的任何一种的药物组合物。本发明的其它方面涉及包含任何所述多核苷酸或载体的药物组合物,所述多核苷酸或载体包含编码本文所述腺苷脱氨酶、碱基编辑器或碱基编辑器-gRNA复合物的核酸片段。
在一些实施方案中,本文所述的任何碱基编辑器、gRNA和/或复合物作为药物组合物的一部分提供。在一些实施方案中,药物组合物包含本文提供的任何碱基编辑器。在一些实施方案中,药物组合物包含本文提供的任何复合物。在一些实施方案中,药物组合物包含gRNA、碱基编辑器和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种额外的治疗活性物质。
在一些实施方案中,本文提供的组合物被配制用于递送至受试者,例如递送至人类受试者以在受试者内实现靶向基因组修饰。在一些实施方案中,从受试者获得细胞并与本文提供的任何药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需的基因组修饰之后,将从受试者移除并与药物组合物离体接触的细胞重新引入受试者中。
本文所述的药物组合物的制剂可以通过药理学领域中已知的任何方法制备。通常,这种制备方法包括使活性成分与赋形剂和/或一种或多种其他辅助成分结合,然后,如果必要和/或需要,将产品成型和/或包装成所需的单剂量或多剂量单元的步骤。
在一些实施方案中,药物组合物被配制用于递送至受试者,例如用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于:局部、皮下、透皮、皮内、病变内、关节内、腹膜内、膀胱内、透粘膜、牙龈、颏内、耳蜗内、经鼓室、耳内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和侧脑室给药。
在各种实施方案中,碱基编辑器构建体(包括分裂构建体)可以被设计用于在一个或多个rAAV载体中递送。与本文提供的任何方法和组合物相关的rAAV可以是任何血清型,包括任何衍生物或假型(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、2/1、2/5、2/8、2/9、3/1、3/5、3/8或3/9)。rAAV可以包括将被递送到细胞的遗传负载(即,表达感兴趣基因的重组核酸载体,例如由rAAV携带到细胞中的全碱基或分裂碱基编辑器)。rAAV可以是嵌合的。如本文所用,rAAV的血清型是指重组病毒衣壳蛋白的血清型。衍生物和假型的非限制性实例包括rAAV2/1、rAAV2/5、rAAV2/8、rAAV2/9、AAV2-AAV3杂合体、AAVrh.10、AAVrh.74、AAVhu.14、AAV3a/3b、AAVrh32.33、AAV-HSC15、AAV-HSC17、AAVhu.37、AAVrh.8、CHt-P6、AAV2.5、AAV6.2、AAV2i8、AAV-HSC15/17、AAVM41、AAV9.45、AAV6(Y445F/Y731F)、AAV2.5T、AAV-HAE1/2、AAV32/83、AAVShH10、AAV2(Y->F)、AAV 8(Y733F),AAV2.15、AAV2.4、AAVM41和AAVr3.45。
在各种实施方案中,所公开的编辑方法在靶核碱基对处产生至少约35%、40%、50%、60%、70%、80%、85%、90%、95%、98%或99%的靶上DNA碱基编辑效率。接触步骤可导致至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%或75%的DNA碱基编辑效率。特别地,接触的步骤导致大于75%的基于目标的编辑效率。在某些实施例中,可以实现99%的碱基编辑效率。
在一些实施方案中,所公开的碱基编辑器的编辑方法导致在一些实施例中约2.0%或更小、1.75%或更小、1.5%或更小、1.2%或更小、1%或更小、0.9%或更小、0.8%或更小、0.75%或更小、0.7%或更小、0.65%或更小或0.6%或更小的实际或平均脱靶DNA编辑频率,公开的编辑方法产生0.5%、小于0.5%、小于0.4%、小于0.35%、小于0.3%、小于0.25%、小于0.2%或小于0.1%的实际或平均脱靶DNA编辑频率。
在一些实施方案中,预期编辑的碱基对是PAM位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,预期编辑的碱基对在PAM位点的下游。在一些实施方案中,预期编辑的碱基对是PAM位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要正统的(例如,NGG)PAM位点。在一些实施方案中,靶区包括靶窗口,其中靶窗口包括靶核碱基对。在一些实施例中,靶窗口包括1-10个核苷酸。在一些实施方案中,靶窗口的长度为1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸。在一些实施方案中,靶窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,预期编辑的碱基对在靶窗口内。在一些实施方案中,使用本文提供的任何碱基编辑器来执行该方法。在一些实施例中,靶窗口是脱氨基窗口。
在一些实施例中,腺嘌呤碱基编辑器的腺苷脱氨酶对活性窗口的第3、4、5、6、7、8或9位腺嘌呤A编辑效率较高,第3、4、5或6位腺嘌呤A编辑效率更高。在一些实施例中,MaTadA1.0、ZoTadA1.0、ErTadA1.0的编辑窗口为3-9位(编辑窗口更窄,特异性更高),更优选的是4-8位;其中,MaTadA1.0在真核中的编辑效率最高。
本发明的再一方面提供本文提供的腺苷脱氨酶、碱基编辑器、多核苷酸、载体、复合物、细胞或药物组合物在制备用于治疗核碱基A突变介导的疾病中的应用。本发明的再一方面还提供用于治疗核碱基A突变介导的疾病的本文提供的腺苷脱氨酶、碱基编辑器、多核苷酸、载体、复合物、细胞或药物组合物。核碱基A突变介导的疾病可以是上文所提及的任何一种可治疗的疾病。
序列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
实施例
实施例1.腺苷脱氨酶在原核细胞中脱氨作用的验证(作用于ccdB的起始密码子)
1.1多个实验组和对照组碱基编辑器质粒的构建
实验组碱基编辑器质粒:包括两种,一种是将含有启动子的sgRNA-ccdB1(可靶向ccdB毒素基因反义链的起始密码子,序列为5’-CTGCATTTATGTCAGACTTG-3’,SEQ ID NO:42)构建在含有阿拉伯糖诱导启动子的ccdB毒素基因的商用载体中,ccdB和sgRNA构建得到质粒A,标记为pBR322-ccdB-sgRNA-KanaR-ATG-1-gRNA1(图16A)。另一种是分别将本发明提供的腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)和dCas9通过接头构建在商用载体中,重组形成腺苷脱氨酶-dCas9的重组质粒B,分别标记为MaTadA1.0-dCas9、ZoTadA1.0-dCas9和ErTadA1.0-dCas9(图16B至D)。
对照组碱基编辑器质粒:按照上述方法,构建二种质粒,一种是将现有常规腺嘌呤脱氨酶TadA-8e和dCas9通过接头构建在商用载体中,重组形成TadA-8e-dCas9的重组质粒C,标记为TadA-8e-dCas9(图17A);另一种是将未突变的野生型蛋白(MaTadA-WT、ZoTadA-WT或ErTadA-WT)和dCas9通过接头构建在商用载体中,重组形成阴性对照质粒D,分别标记为MaTadA-WT-dCas9、ZoTadA-WT-dCas9和ErTadA-WT-dCas9(图17A至D)。
1.2上述碱基编辑器在原核系统中脱氨活性的验证
本实验采用的ccdB毒性基因检测腺苷脱氨酶的脱氨活性原理:ccdB毒性基因的表达受到AraBAD操纵子的调控:当培养环境中含有大量葡萄糖(终浓度100mM)时,ccdB的表达受到抑制;当培养环境中含有阿拉伯糖时,ccdB被诱导表达(阿拉伯糖浓度越高,表达量越高),ccdB被诱导表达后,会与DNA解旋酶相互作用,破坏宿主双链DNA的结构。
若腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)有腺苷脱氨活性,dCas9在sgRNA作用下靶向结合ccdB基因的起始密码子区域,在腺苷脱氨酶脱氨作用下,其ccdB基因的反义链的起始密码子被编辑(即从原来的TAC突变为TGC),导致ccdB基因的正义链的起始密码子由ATG被编辑为ACG,使得ccdB基因的表达发生移码,无法诱导表达正确的ccdB,重组质粒表达的蛋白失去破坏宿主双链DNA结构的能力,宿主菌体能够正常繁殖;若腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)没有腺苷脱氨活性,该碱基编辑器不能正常工作,宿主菌体能诱导表达正常的ccdB蛋白,其会与DNA解旋酶相互作用,破坏宿主双链DNA的结构,宿主菌体被杀死,从大肠杆菌是否生长即可判断碱基编辑器是否有脱氨作用。
本实验方案为将上述重组质粒pBR322-ccdB-sgRNA-KanaR-ATG-1-gRNA1转化到大肠杆菌感受态细胞中,形成稳定感受态株,然后分别将MaTadA1.0-dCas9、ZoTadA1.0-dCas9、ErTadA1.0-dCas9、TadA-8e-dCas9、MaTadA-WT-dCas9、ZoTadA-WT-dCas9或ErTadA-WT-dCas9转入该含有质粒的稳定感受态株中。然后将大肠杆菌涂布至含有添加了100nM的葡萄糖和不同浓度的阿拉伯糖(0nM、20nM和40nM)的含有抗生素(卡那霉素)的LB固体培养基上,37℃培养过夜,然后观察大肠杆菌是否能在固体培养基上生长,结果如图1和图3A所示。结果显示,本发明的腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)和TadA-8e对ccdB基因的起始密码子有编辑效果。所有组在不添加阿拉伯糖添加葡萄糖的条件下,大肠杆菌正常生长;dCas9 control对照组、MaTadA-WT-dCas9组、ZoTadA-WT-dCas9组和ErTadA-WT-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均不生长,说明大肠杆菌内碱基编辑器不起作用,阿拉伯糖诱导ccdB蛋白正常表达,导致大肠杆菌死亡;TadA-8e-dCas9组、MaTadA1.0-dCas9组、ZoTadA1.0-dCas9组和ErTadA1.0-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均可以生长,说明碱基编辑器的腺苷脱氨酶具有脱氨作用,导致ccdB表达时移码,菌体内不产生正常的ccdB蛋白,导致大肠杆菌存活。
实施例2.其他腺嘌呤脱氨酶在原核细胞中的功能性验证
按照上述实施例1的方法验证腺嘌呤脱氨酶MaTadA1.0-1、MaTadA1.0-2、MaTadA1.0-3、ZoTadA1.0-1、ZoTadA1.0-2、ZoTadA1.0-3、ErTadA1.0-1、ErTadA1.0-2和ErTadA1.0-3与dCas9构建的ABE的碱基编辑作用(在原核细胞中编辑起始密码子区域),结果如图5A至C所示。
实施例3.腺嘌呤脱氨酶MaTadA1.0与TadA-8e在原核系统中编辑位点效率的比较(作用于ccdB的终止密码子)
3.1实验组和对照组碱基编辑器质粒的构建
实验组碱基编辑器质粒:包括两种,一种是将含有启动子的sgRNA-ccdB2(可靶向ccdB毒素基因反义链的终止密码子,序列为5’-atatagctaagatgtcacgg-3’,SEQ ID NO:43)构建在含有阿拉伯糖诱导启动子的ccdB毒素基因的商用载体中,ccdB和sgRNA构建得到质粒E,标记为pBR322-CcdB-sgRNA-KanaR-TAG-gRNA1(图18)。另一种为实施例1中步骤1.1的MaTadA1.0-dCas9(图16B)。
对照组碱基编辑器质粒:为上述实施例1中步骤1.1构建的TadA-8e-dCas9(图17A)。
3.2上述碱基编辑器在原核系统中的腺嘌呤A的脱氨作用验证(作用于ccdB的终止密码子)
本实验采用的ccdB毒性基因检测腺苷脱氨酶的脱氨活性原理:ccdB的主要活性域位于其肽链的末端的氨基酸WGI。上述实验证明:腺嘌呤脱氨酶MaTadA1.0有腺苷脱氨活性,dCas9在sgRNA作用下靶向结合ccdB基因的终止密码子区域,在腺苷脱氨酶脱氨作用下,其ccdB基因的反义链的终止密码子被编辑(即从原来的ATC突变为GTC),导致ccdB基因的正义链的终止密码子由TAG被编辑为CAG,使得ccdB基因的表达发生移码,不能正确的终止表达,无法表达正确的ccdB蛋白,重组质粒表达的蛋白失去破坏宿主双链DNA结构的能力,宿主菌体能够正常繁殖,从大肠杆菌是否生长即可判断碱基编辑器是否有脱氨作用。
本实验方案为将上述重组质粒pBR322-CcdB-sgRNA-KanaR-TAG-gRNA1转化到大肠杆菌感受态细胞中,形成稳定感受态株,然后分别将MaTadA1.0-dCas9、TadA-8e-dCas9转入该含有质粒的稳定感受态株中。然后将大肠杆菌涂布至含有添加了100nM的葡萄糖和不同浓度的阿拉伯糖(0nM、20nM和40nM)的含有抗生素的LB固体培养基上,37℃培养过夜,然后观察大肠杆菌是否能在固体培养基上生长,结果如图2和图4所示。所有组在不添加阿拉伯糖添加葡萄糖的条件下,大肠杆菌正常生长;dCas9 control对照组、MaTadA-WT-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均不生长,说明大肠杆菌内碱基编辑器不起作用,阿拉伯糖诱导ccdB蛋白正常表达,导致大肠杆菌死亡;TadA-8e-dCas9组、MaTadA1.0-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均可以生长,说明碱基编辑器的腺苷脱氨酶具有脱氨作用,导致ccdB表达时移码,菌体内不产生正常的ccdB蛋白,导致大肠杆菌存活。结果显示,本发明提供的MaTadA1.0与TadA-8e对ccdB基因的终止密码子有编辑效果,但较起始密码子编辑效果稍弱。
实施例4.其他腺嘌呤脱氨酶MaTadA1.1、MaTadA1.2、MaTadA1.3、MaTadA1.4和MaTadA1.5在原核细胞中的功能性验证
按照上述实施例1的方法验证腺嘌呤脱氨酶MaTadA1.1、MaTadA1.2、MaTadA1.3、MaTadA1.4和MaTadA1.5与dCas9构建的ABE的碱基编辑作用(在原核细胞中编辑起始密码子区域),结果如图1C、图1D、图3B和图3C所示。图3B和3C可知,所验证的腺嘌呤脱氨酶均具有编辑效果,其中MaTadA1.1编辑效果最优,MaTadA1.2、MaTadA1.3和MaTadA1.5次之,MaTadA1.4编辑效率再次之。
实施例5.腺苷脱氨酶在293T人类细胞系中脱氨作用的验证
分别将腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0、TadA-8e和MaTadA-WT)构建在含有chickenβ-actin promoter启动子与nCas9基因、和含有U6启动子和sgRNA序列(sgRNA序列包含两个区段,即靶向区段((在内源性CRISPR系统背景下也称为间隔序列(spacer))和蛋白质结合区段(含同向(direct)重复序列),该sgRNA的靶向区段作用的靶基因为Hek-2位点和ATP7B基因P992L位点)的真核表达载体中形成重组腺嘌呤碱基编辑器载体,分别标记为:pX330-MaTadA1.0-HeK2(图20A)、pX330-ZoTadA1.0-HeK2(图20B)、pX330-ErTadA1.0-HeK2(图20C)、pX330-TadA-8e-HeK2(图19B),pX330-MaTadA1.0-P992L(图21B)、pX330-ErTadA1.0-P992L(图22A)、pX330-TadA-8e-P992L(图21A)、pX330-MaTadA-WT-P992L(图22B);同时构建不含有腺嘌呤脱氨酶序列的空白对照质粒(该sgRNA序列只含有蛋白质结合区段scaffold,不含有靶向区段),标记为px330(图19A)。靶向Hek-2位点的sgRNA为5’-gaacacaaagcatagactgc-3’(SEQ ID NO:44)。靶向p992L位点的sgRNA为5’-gcgtgagcgtggccagcccca-3’(SEQ ID NO:45)。
然后,将腺嘌呤碱基编辑器载体通过脂质体转染的方法转入到人类细胞中,在37℃、5%二氧化碳浓度下培养72h。提取全部细胞的DNA,并对包含靶位点的序列进行扩增,将PCR产物进行一代测序,将测序结果比对到人类基因组对应的基因,测定到腺嘌呤碱基编辑器对目标靶基因的编辑效率。结果显示,本发明提供的腺嘌呤碱基编辑器载体对Hek-2位点和ATP7B基因P992L位点的编辑效率能达到50%以上,部分原始测序数据如图6至15所示。
图6显示pX330-MaTadA1.0-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第3、5、7位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第三位A→G效率约为13%、第五位A→G效率约为54%、第七位A→G效率约为53%。
图7显示pX330-ZoTadA1.0-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第5位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第五位A→G效率约为31%。
图8显示pX330-ErTadA1.0-HEK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第3、5、7、8位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第三位A→G效率约为16%、第五位A→G效率约为51%、第七位A→G效率约为40%、第八位A→G效率约为42%。其中第七、八和九位均为A,测序图上明显为腺苷酸A连峰,其他碱基没有出峰,但是软件读数被连峰干扰,显示有其他碱基的比例,这是软件读数的错误,以测序图为准,测序图可知,A8位点编辑效率很高。
图9显示pX330-TadA-8e-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第5、7位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第五位A→G效率约为41%、第七位A→G效率约为41%。
图10显示pX330空白载体在293T细胞中编辑HEK2基因的测序图,结果显示无编辑效果。
图11显示pX330-MaTadA1.0-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果(套峰)。第六位A→G效率约为29%。测序图因为引物原因测的是sgRNA的反义链(方向为3’→5’),下同。
图12显示pX330-MaTadA-WT-nCas9-P992L在293T细胞中编辑p992L基因的测序图,结果显示其无编辑效果(无套峰)。
图13显示pX330-ErTadA1.0-nCas9-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果(套峰)。第六位A→G效率约为31%。
图14显示pX330-TadA-8e-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果。第六位A→G效率约为26%,该位点的编辑效果比HEK2基因编辑效率低。
图15显示pX330空白载体在293T细胞中编辑p992L基因的测序图,结果显示无编辑效果。
Claims (17)
1.腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
2.根据权利要求1所述的腺苷脱氨酶,其中:
(a)E22的取代选自:E22R、E22K和E22H;
(b)T47的取代为T47A;
(c)L83的取代选自:L83F、L83W和L83Y;
(d)A105的取代选自:A105V、A105I、A105L和A105P;
(e)D107的取代为D107N;
(f)F108的取代选自:F108V、F108I、F108L和F108P;
(g)T110的取代选自:T110R、T110K和T110H;
(h)D118的取代位D118N;
(i)R121的取代为R121N;
(j)S145的取代为S145C;
(k)F148的取代为F148Y;
(l)R151的取代为R151P;
(m)E154的取代选自:E154V、E154I、E154L和E154P;
(n)K156的取代为K156N;
(o)V167的取代为V167I;或
(p)E168的取代为E168N。
3.根据权利要求1或2所述的腺苷脱氨酶,其中腺苷脱氨酶包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
4.腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99.5%的序列同一性。
5.根据权利要求4所述的腺苷脱氨酶,其中:
(a)W22的取代选自:W22R、W22K和W22H;
(b)Q35的取代选自:Q35L、Q35V、Q35I和Q35P;
(c)P47的取代为P47A;
(d)Y50的取代选自:Y50L、Y50V、Y50I和Y50P;
(e)L83的取代选自:L83F、L83W和L83Y;
(f)A105的取代选自:A105V、A105I、A105L和A105P;
(g)D107的取代为D107N;
(h)E108的取代为E108S;
(i)T110的取代选自:T110R、T110K和T110H;
(j)D118的取代位D118N;
(k)G121的取代为G121N;
(l)H122的取代为H122Y;
(m)S145的取代为S145C;
(n)F148的取代为F148Y;
(o)R151的取代为R151P;
(p)E154的取代选自:E154V、E154I、E154L和E154P;
(q)K155的取代选自:K155F、K155W和K155Y;
(r)K156的取代为K156N。
6.根据权利要求4或5所述的腺苷脱氨酶,其中腺苷脱氨酶包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
7.包含权利要求1至6任一项所述的腺苷脱氨酶的碱基编辑器。
8.根据权利要求7所述的碱基编辑器,其进一步包含胞苷脱氨酶结构域。
9.根据权利要求7所述的碱基编辑器,其进一步包含第二腺苷脱氨酶结构域,所述第二腺苷脱氨酶结构域与权利要求1至6任一项所述的腺苷脱氨酶相同或不同。
10.根据权利要求7至9任一项所述的碱基编辑器,其中所述碱基编辑器进一步包含一个或多个核定位序列。
11.根据权利要求7至10任一项所述的碱基编辑器,其中所述碱基编辑器进一步包括可编程的DNA结合结构域,所述可编程的DNA结合结构域优选地选自Cas9结构域或Cas12结构域;更优选为dCas9结构域或nCas9结构域。
12.根据权利要求7至11任一项所述的碱基编辑器,其中所述碱基编辑器包含选自SEQID NO:49至54的氨基酸序列或与SEQ ID NO:49至54的氨基酸序列具有至少80%序列同一性的氨基酸序列。
13.包含权利要求11或12所述的碱基编辑器和引导RNA的复合物,所述引导RNA连接至碱基编辑器的可编程的DNA结合结构域。
14.编码权利要求1至6任一项所述的腺苷脱氨酶或权利要求7至12任一项所述的碱基编辑器的多核苷酸。
15.包含权利要求14所述的多核苷酸的载体。
16.包含权利要求15所述的载体的细胞。
17.一种药物组合物,其包含权利要求7至12任一项所述的碱基编辑器、权利要求13所述的复合物、权利要求14所述的载体或权利要求15所述的细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410206824.8A CN117965505A (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310776962.5A CN116836962B (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
CN202410206824.8A CN117965505A (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310776962.5A Division CN116836962B (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117965505A true CN117965505A (zh) | 2024-05-03 |
Family
ID=88173710
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310776962.5A Active CN116836962B (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
CN202410206824.8A Pending CN117965505A (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310776962.5A Active CN116836962B (zh) | 2023-06-28 | 2023-06-28 | 工程化的腺苷脱氨酶及碱基编辑器 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN116836962B (zh) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7231935B2 (ja) * | 2016-08-03 | 2023-03-08 | プレジデント アンド フェローズ オブ ハーバード カレッジ | アデノシン核酸塩基編集因子およびそれらの使用 |
CN109957569B (zh) * | 2017-12-22 | 2022-10-25 | 苏州齐禾生科生物科技有限公司 | 基于cpf1蛋白的碱基编辑系统和方法 |
CN112805379A (zh) * | 2018-08-03 | 2021-05-14 | 比姆医疗股份有限公司 | 多效应核碱基编辑器和使用其修饰核酸靶序列的方法 |
WO2020181195A1 (en) * | 2019-03-06 | 2020-09-10 | The Broad Institute, Inc. | T:a to a:t base editing through adenine excision |
CA3140093A1 (en) * | 2019-05-21 | 2020-11-26 | Beam Therapeutics Inc. | Methods of editing a single nucleotide polymorphism using programmable base editor systems |
US20230075877A1 (en) * | 2019-09-09 | 2023-03-09 | Beam Therapeutics Inc. | Novel nucleobase editors and methods of using same |
CA3170326A1 (en) * | 2020-02-13 | 2021-08-19 | Beam Therapeutics Inc. | Compositions and methods for engraftment of base edited cells |
CN117925585A (zh) * | 2022-04-07 | 2024-04-26 | 尧唐(上海)生物科技有限公司 | 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途 |
CN115927271A (zh) * | 2022-09-29 | 2023-04-07 | 复旦大学 | 一种小型化碱基编辑器及其构建方法与应用 |
-
2023
- 2023-06-28 CN CN202310776962.5A patent/CN116836962B/zh active Active
- 2023-06-28 CN CN202410206824.8A patent/CN117965505A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN116836962A (zh) | 2023-10-03 |
CN116836962B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230108687A1 (en) | Gene editing methods for treating spinal muscular atrophy | |
US20240173430A1 (en) | Base editing for treating hutchinson-gilford progeria syndrome | |
EP3114227B1 (en) | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa | |
US11344609B2 (en) | Compositions and methods for treating hemoglobinopathies | |
US20190345490A1 (en) | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use | |
WO2021050571A1 (en) | Novel nucleobase editors and methods of using same | |
KR20210023831A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법 | |
EP4010474A1 (en) | Base editors with diversified targeting scope | |
AU2015330699A1 (en) | Compositions and methods for promoting homology directed repair | |
WO2020168051A9 (en) | Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease | |
EP3972654A1 (en) | Methods of editing a single nucleotide polymorphism using programmable base editor systems | |
WO2023193536A1 (zh) | 一种腺苷脱氨酶、碱基编辑器及应用 | |
JP2024504981A (ja) | 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ | |
WO2020168088A1 (en) | Compositions and methods for treating glycogen storage disease type 1a | |
CN116836962B (zh) | 工程化的腺苷脱氨酶及碱基编辑器 | |
KR20240017367A (ko) | 클래스 ii, v형 crispr 시스템 | |
WO2019194320A1 (ja) | エンジニアリングされたBlCas9ヌクレアーゼ | |
WO2024026478A1 (en) | Compositions and methods for treating a congenital eye disease | |
CN118147120A (zh) | 胞苷脱氨酶及碱基编辑器 | |
WO2023227669A2 (en) | Novel nucleic acid-editing proteins | |
KR20230016751A (ko) | 염기 편집기 및 이의 용도 | |
BR112021013605B1 (pt) | Sistemas de edição de base, célula ou um progenitor da mesma,população de células, composição farmacêutica, e métodos para editar um polinucleotídeo de beta globina (hbb) associado à anemia falciforme e para produzir um glóbulo vermelho ou progenitor do mesmo | |
CA3237317A1 (en) | Direct replacement genome editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |