CN110407945A - 一种腺嘌呤碱基编辑工具及其用途 - Google Patents
一种腺嘌呤碱基编辑工具及其用途 Download PDFInfo
- Publication number
- CN110407945A CN110407945A CN201910514432.7A CN201910514432A CN110407945A CN 110407945 A CN110407945 A CN 110407945A CN 201910514432 A CN201910514432 A CN 201910514432A CN 110407945 A CN110407945 A CN 110407945A
- Authority
- CN
- China
- Prior art keywords
- ectada
- amino acid
- segment
- fusion protein
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229930024421 Adenine Natural products 0.000 title abstract description 25
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 title abstract description 25
- 229960000643 adenine Drugs 0.000 title abstract description 25
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 48
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 48
- 239000000539 dimer Substances 0.000 claims abstract description 36
- 108091027544 Subgenomic mRNA Proteins 0.000 claims abstract description 35
- 239000012634 fragment Substances 0.000 claims abstract description 27
- 150000001413 amino acids Chemical class 0.000 claims abstract description 21
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims abstract description 19
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims abstract description 19
- 210000004027 cell Anatomy 0.000 claims description 56
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 52
- 230000014509 gene expression Effects 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 16
- 108091033319 polynucleotide Proteins 0.000 claims description 16
- 102000040430 polynucleotide Human genes 0.000 claims description 16
- 239000002157 polynucleotide Substances 0.000 claims description 16
- 102000007079 Peptide Fragments Human genes 0.000 claims description 13
- 108010033276 Peptide Fragments Proteins 0.000 claims description 13
- 238000010362 genome editing Methods 0.000 claims description 13
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 11
- 108090000623 proteins and genes Proteins 0.000 claims description 10
- 210000004899 c-terminal region Anatomy 0.000 claims description 8
- 108010052875 Adenine deaminase Proteins 0.000 claims description 7
- 239000002253 acid Substances 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 4
- 206010009944 Colon cancer Diseases 0.000 claims description 3
- 210000004556 brain Anatomy 0.000 claims description 3
- 208000019065 cervical carcinoma Diseases 0.000 claims description 3
- 208000029742 colonic neoplasm Diseases 0.000 claims description 3
- 210000003292 kidney cell Anatomy 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims description 3
- 201000008968 osteosarcoma Diseases 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 2
- 229930182470 glycoside Natural products 0.000 claims 1
- 150000002338 glycosides Chemical class 0.000 claims 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract description 18
- 230000035772 mutation Effects 0.000 abstract description 7
- 102220473226 Glycodelin_N46A_mutation Human genes 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 55
- 239000002585 base Substances 0.000 description 48
- 239000013612 plasmid Substances 0.000 description 23
- 235000001014 amino acid Nutrition 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 18
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 12
- 108091033409 CRISPR Proteins 0.000 description 9
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 8
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 229920001184 polypeptide Polymers 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 101100285511 Escherichia coli (strain K12) hokB gene Proteins 0.000 description 6
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 5
- 108010077544 Chromatin Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 239000012124 Opti-MEM Substances 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000009615 deamination Effects 0.000 description 4
- 238000006481 deamination reaction Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000005498 polishing Methods 0.000 description 4
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 230000008265 DNA repair mechanism Effects 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 239000012097 Lipofectamine 2000 Substances 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000012154 double-distilled water Substances 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 229950010131 puromycin Drugs 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000013456 study Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- QWWVBNODQCWBAZ-WHFBIAKZSA-N (2r)-2-amino-3-[(2r)-2-carboxy-2-(methylamino)ethyl]sulfanylpropanoic acid Chemical compound CN[C@H](C(O)=O)CSC[C@H](N)C(O)=O QWWVBNODQCWBAZ-WHFBIAKZSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101150116295 CAT2 gene Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 101100326920 Caenorhabditis elegans ctl-1 gene Proteins 0.000 description 1
- 101100297347 Caenorhabditis elegans pgl-3 gene Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 101900213984 Escherichia coli Adenine deaminase Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100126846 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) katG gene Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710130181 Protochlorophyllide reductase A, chloroplastic Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100025292 Stress-induced-phosphoprotein 1 Human genes 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/33—Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及生物技术领域,特别是涉及一种腺嘌呤碱基编辑工具及其用途。本发明提供一种融合蛋白,包括ecTadA‑ecTadA*二聚体片段和SpCas9‑D10A nickase片段,所述ecTadA‑ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。本发明所提供的腺嘌呤碱基编辑工具在ecTadA‑ecTadA*二聚体片段中ecTadA片段相对于野生型存在R153P、N46A氨基酸突变,可以限制ecTadA与RNA的结合,在将sgRNA 5’端4‑7位的A突变为G的碱基编辑中,可以极大地降低甚至消除腺嘌呤碱基编辑工具的RNA脱靶效应。
Description
技术领域
本发明涉及生物技术领域,特别是涉及一种腺嘌呤碱基编辑工具及其用途。
背景技术
CRISPR/Cas9(Clustered regularly interspaced short palindromicrepeats/CRISPR-associated protein)是目前最有效、最便捷的基因组编辑技术。Cas9核酸酶在引导RNA(guide RNA,sgRNA) 引导下,可以到达基因组特定靶点,对其进行切割,从而产生DNA双链断裂(double strand breaks,DSB),然后通过内源的DNA修复机制来实现编辑。DNA修复机制包括非同源末端连 接(Non-Homologous End Join,NHEJ)和同源重组修复(Homologous Directly Repair,HDR)。其中, NHEJ修复的结果是随机引入插入、缺失,导致基因的失活,这在基因组修复中占据主要地 位。而HDR可利用模版进行准确修复,从而完成基因突变的校正。
但实际上,HDR介导的准确修复的几率很低,通常小于5%,因此极大限制了CRISPR/Cas9 从科研向应用的转化方面的应用。尤其是基因精准治疗方面,一直是基因编辑领域的一大难 题。
最近新开发的碱基编辑器(Base Editor,BE)成功解决了上述问题,大大提高了基因突变的 校正效率。现有的碱基编辑器有胞嘧啶碱基编辑工具(Cytosine Base Editor,CBE)和腺嘌呤碱 基编辑工具(Adenine Base Editor,ABE)两种。
CBE和ABE是将RuvC结构域失活的Cas9D10Anickase(nCas9)和胞嘧啶脱氨酶/腺嘌呤 脱氨酶整合在一起,在sgRNA的引导下到达靶向位点并与sgRNA互补的DNA链进行结合,胞嘧啶脱氨酶对周边一定范围的胞嘧啶C进行脱氨成为尿嘧啶U,U可以与腺嘌呤A互补配对,经过DNA的复制,U最终会被A的互补配对碱基T所取代;类似的,腺嘌呤脱氨酶对 周边一定范围的腺嘌呤A进行脱氨成为次黄嘌呤I,I可以与胞嘧啶C互补配对,经过DNA 的复制,I最终会被C的互补配对碱基G所取代。从而达到C-to-T或A-to-G的目的。在经过 核定位信号以及密码子的优化后,目前BE4max和ABEmax的效率最高,BE4max对应的编 辑窗口是sgRNA5’端的4-8位,ABEmax对应的编辑窗口是sgRNA 5’端的4-7位。
目前应用最广泛的ABEmax中的脱氨酶是大肠杆菌腺嘌呤脱氨酶ecTadA进化后的变体, 其中,内源状态的ecTadA只具有编辑RNA的功能。近期研究发现ABEmax碱基编辑器作用 过程中会产生严重的RNA脱靶效应(off-Target)5,极大的限制了此碱基编辑器的应用。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种腺嘌呤碱基编辑工具及其用 途,用于解决现有技术中的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种融合蛋白,包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段,所述ecTadA-ecTadA*二聚体片段 包括ecTad片段和ecTadA*片段。
在本发明一些实施方式中,所述ecTadA片段的氨基酸序列包括:
a)如SEQ ID NO.41所示的氨基酸序列;或,
b)与SEQ ID NO.41具有80%以上序列相似性的氨基酸序列、且具有a)所限定的氨基 酸序列的功能,优选为能够与ecTadA*片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。
在本发明一些实施方式中,所述ecTadA*片段的氨基酸序列包括:
c)如SEQ ID NO.42所示的氨基酸序列;或,
d)与SEQ ID NO.42具有80%以上序列相似性的氨基酸序列、且具有c)所限定的氨基 酸序列的功能,优选为能够与ecTadA片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。
在本发明一些实施方式中,所述SpCas9-D10A nickase片段的氨基酸序列包括:
e)如SEQ ID NO.43所示的氨基酸序列;或,
f)与SEQ ID NO.43具有80%以上序列相似性的氨基酸序列、且具有e)所限定的氨基 酸序列的功能,优选为能够识别NG作为PAM。
在本发明一些实施方式中,所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚 体片段和SpCas9-D10A nickase片段;
和/或,所述ecTadA-ecTadA*二聚体片段自N端至C端依次包括ecTad片段和ecTadA* 片段。
在本发明一些实施方式中,所述融合蛋白还包括核定位信号片段,优选的,所述核定位 信号片段位于ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段的N端和/或C端, 优选的,所述核定位信号片段的氨基酸序列如SEQ ID NO.44所示;
和/或,所述融合蛋白还包括柔性连接肽片段,优选的,所述柔性连接肽段的氨基酸序列 如SEQ ID NO.45、SEQ ID NO.46所示。
在本发明一些实施方式中,所述融合蛋白的氨基酸序列如SEQ ID No.47所示。
本发明另一方面提供一种分离的多核苷酸,编码所述的融合蛋白。
本发明另一方面提供一种构建体,所述构建体含有所述的分离的多核苷酸。
本发明另一方面提供一种表达系统,所述表达系统含有所述的构建体或基因组中整合有 外源的所述的多核苷酸。
在本发明一些实施方式中,所述表达系统的宿主细胞选自真核细胞或原核细胞,优选选 自小鼠细胞、人细胞,更优选选自小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞、人 结肠癌细胞、人骨肉瘤细胞,更优选选自N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细胞。
本发明另一方面提供所述的融合蛋白、所述的分离的多核苷酸、所述的构建体或所述的 表达系统在基因编辑中的用途。
在本发明一些实施方式中,所述用途具体为在真核生物的基因编辑中的用途。
本发明另一方面提供一种碱基编辑体系,包括所述的融合蛋白,所述碱基编辑体系还包 括sgRNA。
本发明另一方面提供一种基因编辑方法,包括:通过所述的融合蛋白、或所述的碱基编 辑体系进行基因编辑。
附图说明
图1显示为本发明实施例中所使用的eABEmax质粒和ABEmax质粒结构示意图。
图2显示为本发明eABEmax的编辑能力验证示意图,其中,a为hokB过表达报告系统示意图;b为该报告系统中ABEmax以及eABEmax在hokB位点的RNA以及DNA编辑效率 统计图;c为ABEmax以及eABEmax在HEK293Site3位点的编辑效率的统计图。
图3为eABEmax在HEK293T细胞中对内源基因位点编辑的效率统计图。
具体实施方式
本发明发明人经过大量探索性研究,提供了一种融合蛋白,所述融合蛋白是一种新的腺 嘌呤碱基编辑工具,所述融合蛋白可以识别NG位点并进行精确的碱基编辑,可以极大降低 甚至消除RNA脱靶效应,在此基础上完成了本发明。
本发明第一方面提供一种融合蛋白,包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段,所述ecTadA-ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。所述融合蛋 白可以以NGG为PAM序列,与靶向靶点区域的sgRNA相配合,实现对靶点区域内sgRNA5’ 端4-7位的A-to-G的高效碱基编辑,在目标位点具有更高的编辑效率、更高的编辑准确性。
本发明所提供的融合蛋白中,所述ecTadA片段的氨基酸序列可以包括:a)如SEQID NO. 41所示的氨基酸序列;或,b)与SEQ ID NO.41具有80%以上序列相似性的氨基酸序列、 且具有a)所限定的氨基酸序列的功能。具体的,所述b)中的氨基酸序列具体指:如SEQID No.49所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、1-30个、 1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的,或者在N-末端和/ 或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5个、1-3个、 1个、2个、或3个)氨基酸而得到的,且具有氨基酸如SEQ ID No.49所示的多肽片段的功 能的多肽片段,例如,可以是具有能够与ecTadA*片段形成二聚体、且二聚体具有腺嘌呤脱 氨酶活性,更具体可以是将腺嘌呤(adenine,A)脱氨产生次黄嘌呤(hypoxanthine,I)的功 能。所述b)中的氨基酸序列可与SEQ ID No.41具有80%、85%、90%、93%、95%、97%、 或99%以上的相似性。所述ecTadA片段源自大肠杆菌(Escherichia coli),相对于野生型的 ecTadA来说,本发明中的ecTadA片段存在R153P、N46A氨基酸突变,可以限制ecTadA与 RNA的结合,从而极大地降低甚至消除腺嘌呤碱基编辑工具的RNA脱靶效应。
本发明所提供的融合蛋白中,所述ecTadA*片段的氨基酸序列可以包括:c)如SEQID NO. 42所示的氨基酸序列;或,d)与SEQ ID NO.42具有80%以上序列相似性的氨基酸序列、 且具有c)所限定的氨基酸序列的功能。具体的,所述d)中的氨基酸序列具体指:如SEQID No.50所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、1-30个、 1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的,或者在N-末端和/ 或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5个、1-3个、 1个、2个、或3个)氨基酸而得到的,且具有氨基酸如SEQ ID No.50所示的多肽片段的功 能的多肽片段,例如,可以是具有能够与ecTadA片段形成二聚体、且二聚体具有腺嘌呤脱 氨酶活性,更具体可以是将腺嘌呤(adenine,A)脱氨产生次黄嘌呤(hypoxanthine,I)的功 能。所述d)中的氨基酸序列可与SEQ ID No.42具有80%、85%、90%、93%、95%、97%、 或99%以上的相似性。所述ecTadA*片段源自大肠杆菌(Escherichia coli),由人工定向进化 获得。
本发明所提供的融合蛋白中,所述SpCas9-D10A nickase的氨基酸序列可以包括:e)如 SEQ ID NO.43所示的氨基酸序列;或,f)与SEQ ID NO.51具有80%以上序列相似性的氨 基酸序列、且具有e)所限定的氨基酸序列的功能。具体的,所述f)中的氨基酸序列具体指: 如SEQ ID No.43所示的氨基酸序列经过取代、缺失或者添加一个或多个(具体可以是1-50、 1-30个、1-20个、1-10个、1-5个、1-3个、1个、2个、或3个)氨基酸而得到的,或者在 N-末端和/或C-末端添加一个或多个(具体可以是1-50个、1-30个、1-20个、1-10个、1-5 个、1-3个、1个、2个、或3个)氨基酸而得到的,且具有氨基酸如SEQ ID No.43所示的 多肽片段的功能的多肽片段,例如,可以是能够识别NG作为PAM的功能,具体可以是能够 将NG序列作为PAM,并可以与特异性靶向位点的sgRNA以及ecTadA-ecTadA*二聚体片段 相配合,实现靶点区域内sgRNA 5’端4-7位的A-to-G的碱基编辑。所述f)中的氨基酸序列 可与SEQ ID No.43具有80%、85%、90%、93%、95%、97%、或99%以上的相似性。CRISPR/Cas9 系统的靶向识别通常需要靶位点旁边具有前间隔序列邻近基序(protospacer adjacent motif, PAM),作为一种最为频繁用于基因组编辑的Cas9酶,来自酿脓链球菌(Streptococcus pyogenes)的Cas9(SpCas9)仅能够识别NGG序列的PAM,这就限制了基因组中能够被靶向的范围, 而本发明中的SpCas9-D10A nickase来源于酿脓链球菌(Streptococcus pyogenes),能够识别NG序列作为PAM。
本发明所提供的融合蛋白中,所述的取代、缺失或者添加可以是保守氨基酸取代。所述 “保守氨基酸取代”具体可以是指氨基酸残基被其他具有相似侧链的氨基酸残基取代的情况。 具有相似侧链的氨基酸残基家族对于本领域技术人员来说应该是已知的,例如,可以是包括 但不限于碱性侧链(例如赖氨酸,精氨酸,组氨酸),酸性侧链(例如天冬氨酸,谷氨酸), 不带电荷的极性侧链(例如,甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半 胱氨酸),非极性侧链(例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,甲硫氨酸,色氨酸)异亮氨酸)和芳族侧链(例如酪氨酸,苯丙氨酸,色氨酸,组氨酸)等家 族。保守型氨基酸取代更具体可以包括但不限于下表中所列的具体情况,表1(氨基酸相似 度矩阵)中的数字表示两个氨基酸之间的相似度,当数字大于等于0时认为是保守氨基酸取代,表2为示例性的保守氨基酸取代的方案。
表1
C | G | P | S | A | T | D | E | N | Q | H | K | R | V | M | I | L | F | Y | W | |
W | -8 | -7 | -6 | -2 | -6 | -5 | -7 | -7 | -4 | -5 | -3 | -3 | 2 | -6 | -4 | -5 | -2 | 0 | 0 | 17 |
Y | 0 | -5 | -5 | -3 | -3 | -3 | -4 | -4 | -2 | -4 | 0 | -4 | -5 | -2 | -2 | -1 | -1 | 7 | 10 | |
F | -4 | -5 | -5 | -3 | -4 | -3 | -6 | -5 | -4 | -5 | -2 | -5 | -4 | -1 | 0 | 1 | 2 | 9 | ||
L | -6 | -4 | -3 | -3 | -2 | -2 | -4 | -3 | -3 | -2 | -2 | -3 | -3 | 2 | 4 | 2 | 6 | |||
I | -2 | -3 | -2 | -1 | -1 | 0 | -2 | -2 | -2 | -2 | -2 | -2 | -2 | 4 | 2 | 5 | ||||
M | -5 | -3 | -2 | -2 | -1 | -1 | -3 | -2 | 0 | -1 | -2 | 0 | 0 | 2 | 6 | |||||
V | -2 | -1 | -1 | -1 | 0 | 0 | -2 | -2 | -2 | -2 | -2 | -2 | -2 | 4 | ||||||
R | -4 | -3 | 0 | 0 | -2 | -1 | -1 | -1 | 0 | 1 | 2 | 3 | 6 | |||||||
K | -5 | -2 | -1 | 0 | -1 | 0 | 0 | 0 | 1 | 1 | 0 | 5 | ||||||||
H | -3 | -2 | 0 | -1 | -1 | -1 | 1 | 1 | 2 | 3 | 6 | |||||||||
Q | -5 | -1 | 0 | -1 | 0 | -1 | 2 | 2 | 1 | 4 | ||||||||||
N | -4 | 0 | -1 | 1 | 0 | 0 | 2 | 1 | 2 | |||||||||||
E | -5 | 0 | -1 | 0 | 0 | 0 | 3 | 4 | ||||||||||||
D | -5 | 1 | -1 | 0 | 0 | 0 | 4 | |||||||||||||
T | -2 | 0 | 0 | 1 | 1 | 3 | ||||||||||||||
A | -2 | 1 | 1 | 1 | 2 | |||||||||||||||
S | 0 | 1 | 1 | 1 | ||||||||||||||||
P | -3 | -1 | 6 | |||||||||||||||||
G | -3 | 5 | ||||||||||||||||||
C | 12 |
表2
本发明所提供的融合蛋白中,还可以包括核定位信号片段(NLS),所述核定位信号片 段通常可以与入核载体相互作用,从而可以使蛋白能够被运送进细胞核。所述核定位信号片 段可以位于ecTadA-ecTadA*二聚体片段的N端,也可以位于SpCas9-D10A nickase的C端。 所述核定位信号片段的氨基酸序列可以包括如SEQ ID NO.44所示的氨基酸序列。
本发明所提供的融合蛋白中,还可以包括柔性连接肽段,所述柔性连接肽段可以位于 ecTadA-ecTadA*二聚体片段的N端、ecTad片段和ecTadA*片段之间、ecTadA-ecTadA*二聚 体片段和SpCas9-D10A nickase之间、或SpCas9-D10A nickase的C端。本领域技术人员通常 可以选择合适的柔性连接肽段以连接各多肽片段,例如,ecTad片段和ecTadA*片段之间可以 设有第一柔性连接肽段,所述第一柔性连接肽段的氨基酸序列可以包括如SEQID NO.45所 示的氨基酸序列;再例如,ecTadA-ecTadA*二聚体片段和SpCas9-D10Anickase之间可以设 有第二柔性连接肽段,所述第二柔性连接肽段的氨基酸序列可以包括如SEQ ID NO.46所示 的氨基酸序列。
本发明所提供的融合蛋白中,所述融合蛋白自N端至C端可以依次包括ecTadA-ecTadA* 二聚体片段和SpCas9-D10A nickase,所述ecTadA-ecTadA*二聚体片段自N端至C端可以依 次包括ecTadA片段和ecTadA*片段,优选可以依次包括ecTadA片段、第一柔性连接肽段和 ecTadA*片段。在本发明一具体实施例中,所述融合蛋白自N端至C端可以依次包括第一核 定位信号片段、ecTadA-ecTadA*二聚体片段、第二柔性连接肽段、SpCas9-D10Anickase、第 二核定位信号片段,所述融合蛋白的氨基酸序列如SEQ ID No.47所示。
本发明第二方面提供一种分离的多核苷酸,编码本发明第一方面所提供的融合蛋白。
本发明第三方面提供一种构建体,所述构建体含有本发明第二方面所提供的分离的多核 苷酸。所述构建体通常可以通过将所述分离的多核苷酸插入合适的表达载体中构建获得,本 领域技术人员可选择合适的表达载体,例如,所述表达载体可以是包括但不限于pCMV表达 载体、pSV2表达载体、pGL3表达载体等。
本发明第四方面提供一种表达系统,所述表达系统含有本发明第三方面所提供的构建体 或基因组中整合有外源的本发明第二方面所提供的分离的多核苷酸。所述表达系统可以是宿 主细胞,所述宿主细胞可以表达如上所述的融合蛋白,所述融合蛋白可以与sgRNA相配合, 从而可以将所述融合蛋白定位到目标区域,实现目标区域的碱基编辑。在本发明另一具体实 施例中,所述宿主细胞可以是真核细胞和/或原核细胞,更具体可以是小鼠细胞、人细胞等, 更具体可以是小鼠脑神经瘤细胞、人胚胎肾细胞、人宫颈癌细胞、人结肠癌细胞、人骨肉瘤 细胞等,更具体可以是N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细 胞等。
本发明第五方面提供本发明第一方面所提供的融合蛋白、或本发明第二方面所提供的分 离的多核苷酸、或本发明第三方面所提供的构建体、或本发明第四方面所提供的表达系统在 基因编辑中的用途,优选为真核生物的基因编辑中的用途,所述真核生物具体可以是后生动 物,具体可以是包括但不限于人、小鼠等。所述用途具体可以是包括但不限于由A到G的碱 基编辑(更具体为靶点区域内sgRNA 5’端4-7位的A-to-G的碱基编辑)、编辑剪接受体/供体 位点来调节RNA剪接、利用本工具进行模型(例如,疾病模型、细胞模型、动物模型等)的 构建或人类疾病的治疗等。在本发明一具体实施例中,所述用途具体为细胞株的构建,更具 体为细胞中特定基因位点的碱基编辑,具体的编辑位点可以是靶点sgRNA区域5’端4-7位。 本发明另一具体实施例中,被编辑的对象可以是胚胎、细胞等。
本发明第六方面提供一种碱基编辑体系,包括本发明第一方面所提供的融合蛋白,所述 碱基编辑体系还包括sgRNA。本领域技术人员可以根据基因的目标编辑区域,选择合适的靶 向特异性位点的sgRNA。例如,所述sgRNA的序列通常可以与目标区域至少部分互补,从 而可以与所述融合蛋白相配合,将所述融合蛋白定位到目标区域,实现靶点区域内sgRNA 5’ 端4-7位的A-to-G的碱基编辑,具体可以是腺嘌呤脱氨基反应,即将腺嘌呤(A)编辑为次 黄嘌呤(I)。本发明所提供的碱基编辑体系地拓宽了基因组可靶向的范围,可以将NG序列 作为PAM,实现sgRNA靶点区域内5’端4-7位的A-to-G的碱基,且突变具有很高的精准性,, 可以极大降低甚至消除RNA脱靶效应。在本发明一具体实施例中,所述用途具体为细胞株的 构建,更具体为细胞中特定基因位点的碱基编辑,具体的编辑位点可以是任意基因中符合 sgRNA设计要求的位点。本发明另一具体实施例中,被编辑的对象可以是胚胎、细胞等。
本发明第七方面提供一种碱基编辑方法,包括:通过本发明第一方面所提供的融合蛋白、 或本发明第六方面所提供的碱基编辑体系进行基因编辑。例如,所述基因编辑方法可以包括: 在适当条件下培养本发明第四方面所提供的表达系统,从而表达所述融合蛋白,所述融合蛋 白可以在与其配合的靶向目标区域的sgRNA存在的条件下,对靶标区域进行碱基编辑。提供 所述sgRNA存在的条件的方法对于本领域技术人员来说应该是已知的,例如,可以是在适当 条件下培养能够表达所述sgRNA的表达系统,所述表达系统可以是包括含有编码所述sgRNA 的多核苷酸的表达载体的宿主细胞、或染色体中整合有编码所述sgRNA的多核苷酸的宿主细 胞。在本发明一具体实施例中,所述sgRNA与所述融合蛋白可以在同一宿主细胞中表达,所 述宿主细胞可以为靶细胞。在本发明另一具体实施例中,所述基因编辑为体外基因编辑。
本发明提供了一种新的腺嘌呤碱基编辑工具(eABEmax),所述腺嘌呤碱基编辑工具包括 ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase,在ecTadA-ecTadA*二聚体片段中, ecTadA片段相对于野生型存在R153P、N46A氨基酸突变,可以限制ecTadA与RNA的结合, 在将sgRNA 5’端4-7位的A突变为G的碱基编辑中,可以极大地降低甚至消除腺嘌呤碱基编 辑工具的RNA脱靶效应。另外,本发明所提供的腺嘌呤碱基编辑工具(eABEmax)在DNA上 的编辑效率与未存在R153P、N46A氨基酸突变的腺嘌呤碱基编辑工具(ABEmax)持平,在保证了编辑效率的前提下,大大提升了突变的精准性,具有良好的产业化前景。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露 的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加 以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精 神下进行各种修饰或改变。
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定 的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案, 而不是为了限制本发明的保护范围;在本发明说明书和权利要求书中,除非文中另外明确指 出,单数形式“一个”、“一”和“这个”包括复数形式。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以 及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术 语与本技术领域技术人员通常理解的意义相同。除实施例中使用的具体方法、设备、材料外, 根据本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例 中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常 规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress, San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
实施例中所使用的构建eABEmax质粒的构建方法如下:通过Mut Express II FastMutagenesis Kit V2(Vazyme,C214-02)将2个氨基酸突变(N46A和R153P)引入ABEmax质粒中TadA部分(图1),ABEmax质粒购自Addgene(#112095)。构建得到的eABEmax质粒序 列如SEQ ID NO.1所示。
实施例1
本实施例中,利用hokB过表达报告系统在HEK293T上验证eABEmax的编辑能力以及RNA脱靶效应,结果如图2所示。
1.1hokB过表达报告系统质粒构建
通过Mut Express II Fast Mutagenesis Kit V2(Vazyme,C214-02)构建hokB过表达载体。构 建得到的hokB过表达报告系统质粒序列见附录序列表SEQ ID NO.2。
1.2sgRNA质粒的构建
设计sgRNA并合成oligos,上游序列为:5’-accgGGCCCAGACTGAGCACGTGA-3’(SEQID NO.3),下游序列为:5’-aaacTCACGTGCTCAGTCTGGGCC-3’(SEQ ID NO.4),上下游序 列通过程序(95℃,5min;95℃-85℃at-2℃/s;85℃-25℃at-0.1℃/s;hold at 4℃)退火,连接到经过BsaI(NEB:R0539L)线性化的pGL3-U6-sgRNA(Addgene#51133)载体上。线性化体系如下所示:pGL3-U6-sgRNA 2μg;buffer(NEB:R0539L)6μL;BsaI 2μL;ddH2O补齐到60μL。 37℃酶切过夜。连接体系如下:T4连接buffer(NEB:M0202L)1μL,线性化载体20ng,退 火的oligo片段(10μM)5μL,T4连接酶(NEB:M0202L)0.5μL,ddH2O补齐到10μL.16℃连 接过夜。连接的载体通过转化,挑菌,鉴定。对阳性克隆摇菌提取质粒(Axygene:AP-MN-P-250G) 并测定浓度。
1.3细胞的培养转染与收取
HEK293T细胞(购自ATCC)接种培养于添加10%FBS的DMEM高糖培养液中(HyClone,SH30022.01B),其中含1%Penicillin Streptomycin(v/v)(Gibco)。当细胞浓度为80%时,用10% 血清的DMEM培养基换液,培养2小时使细胞状态恢复最佳。每孔转染的质粒的量分别是 ABEmax质粒0.5μg,sgRNA质粒0.3μg,hokB过表达报告系统质粒0.2μg;eABEmax质 粒0.5μg,sgRNA质粒0.3μg,hokB过表达报告系统质粒0.2μg。两种组合分别做两组。分 别将质粒混在25μl的Opti-MEM(Gibco,11058021)培养基。将1μl的Lipofectamine 2000转染 试剂(Thermo,11668019)混入25μl的Opti-MEM培养基并混匀,静置5分钟。将混有质粒的 Opti-MEM加入混有Lipofectamine 2000的Opti-MEM,慢速吹打混匀,静置20分钟。将混有 质粒和Lipofectamine 2000的Opti-MEM分别加入24孔板(孔板中细胞浓度为80%转染)。 转染6小时后用10%FBS的DMEM换液。转染24小时后用puromycin(Invivogen,ant-pr-1) 进行药杀。药杀48h后收取细胞,每种组合中一组用于RNA脱靶检测,一组用于DNA编辑 效率检测。
1.4DNA编辑效率检测
DNA检测先是通过裂解得到基因组,裂解液的成分为50mM KCl,1.5mM MgCl2,10mMTris pH 8.0,0.5%Nonidet P-40,0.5%Tween 20,100g/ml protease K。对靶点附近序列进行 PCR扩增,将扩增产物纯化后用Sanger测序进行鉴定。扩增体系如下:2Xbuffer(Vazyme, P505)25μL;dNTP 1μL;F(10pmol/μL)1μL;R(10pmol/μL)1μL;模板1μL;DNA聚合酶(Vazyme, P505)0.5μL;ddH2O补齐到50μL。扩增出来的PCR产物经过下述步骤纯化:加入三倍体积 的PCR-A(Axygen:AP-PCR-250G)过柱,离心,12000转/分钟离心1分钟;加入700μLW2, 离心1分钟;弃废液,加入700μL W2,离心1分钟;弃废液,空转1分钟;加入20μL水洗脱。所用到的PCR扩增引物如SEQ ID NO.5和SEQ ID NO.6所示。
1.5RNA脱靶效应效率检测
在RNA检测中,先用Trizol(Vazyme,R401-01)抽取总RNA,抽取步骤如下:每孔加入1ml Trizol,混匀后收集,加入200ul三氯甲烷,上下颠倒充分混匀后4℃温度下离心,12000转/分钟离心15分钟;吸取上清400ul,加入等体积异丙醇,上下颠倒混匀后4℃温度下离心,12000转/分钟离心10分钟;弃上清,加入1mL 75%乙醇,上下颠倒混匀后,4℃温度下离心,12000转/分钟离心10分钟;弃上清,风干后加水溶解。配置反转录体系如下:4xbuffer(Vazyme, C215-02)2ul;RNA 1ug,ddH2O补齐到8ul。42度5分钟后加入2ul 5xbuffer,通过程序(42℃ 5min;85℃15min;hold at 4℃)进行反转录。取cDNA 1ul,用P505酶按上述步骤扩增,扩增引 物分别如SEQ ID NO.7和SEQ ID NO.8所示。将扩增产物纯化后用Sanger测序进行鉴定, 相关结果如图2b所示。
实施例2
本实施例中,利用eABEmax在HEK293T细胞上对内源基因位点进行编辑。
2.1sgRNA质粒的构建
挑选8个人源内源基位点,设计sgRNA,所用到的oligos的多核苷酸序列如SEQ IDNO. 9~26所示,所用到的8条sgRNA在基因组的位置分别为,NC_000004.12:52670026-52670045; NC_000022.11:19401208-19401227;NC_000015.10:47301029-47301048;NC_000014.9: 88099864-88099883;NC_000001.11:154311091-154311110;NC_000001.11:179826686- 179826705;NC_000001.11:184974900-184974919;NC_000001.11:184974901-184974920。 按1.2进行sgRNA质粒的构建。
2.2细胞的培养转染与鉴定
HEK293T细胞按1.3进行培养与转染,转染的质粒量为eABEmax 0.6μg,sgRNA表达载 体质粒0.3μg,以ABEmax作为对照。转染12小时后按上述1.3中加药puromycin,加药48h后收取细胞,按1.3进行裂解、PCR扩增与纯化,产物用Sanger测序进行鉴定。相关结果如 图3所示。扩增引物的多核苷酸序列如SEQ ID NO.27~40所示。由图3可知,eABEmax可 以在HEK293T细胞中高效地编辑内源基因位点,而且精准性高、RNA脱靶低。
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技 术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡 所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等 效修饰或改变,仍应由本发明的权利要求所涵盖。
序列表
<110> 上海科技大学
<120> 一种腺嘌呤碱基编辑工具及其用途
<160> 47
<170> SIPOSequenceListing 1.0
<210> 1
<211> 8811
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctaaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggtga ctctggcggc tcaaaaagaa ccgccgacgg cagcgaattc 4140
gagcccaaga agaagaggaa agtctaaccg gtcatcatca ccatcaccat tgagtttaaa 4200
cccgctgatc agcctcgact gtgccttcta gttgccagcc atctgttgtt tgcccctccc 4260
ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg 4320
aaattgcatc gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg 4380
acagcaaggg ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta 4440
tggcttctga ggcggaaaga accagctggg gctcgatacc gtcgacctct agctagagct 4500
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 4560
acaacatacg agccggaagc ataaagtgta aagcctaggg tgcctaatga gtgagctaac 4620
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 4680
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 4740
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 4800
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 4860
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 4920
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 4980
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5040
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5100
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5160
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 5220
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 5280
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 5340
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 5400
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 5460
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 5520
tttctacggg gtctgacact cagtggaacg aaaactcacg ttaagggatt ttggtcatga 5580
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 5640
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 5700
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 5760
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 5820
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 5880
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 5940
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6000
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6060
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6120
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6180
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 6240
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 6300
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 6360
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 6420
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 6480
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 6540
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 6600
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 6660
cacctgacgt cgacggatcg ggagatcgat ctcccgatcc cctagggtcg actctcagta 6720
caatctgctc tgatgccgca tagttaagcc agtatctgct ccctgcttgt gtgttggagg 6780
tcgctgagta gtgcgcgagc aaaatttaag ctacaacaag gcaaggcttg accgacaatt 6840
gcatgaagaa tctgcttagg gttaggcgtt ttgcgctgct tcgcgatgta cgggccagat 6900
atacgcgttg acattgatta ttgactagtt attaatagta atcaattacg gggtcattag 6960
ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 7020
gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 7080
caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 7140
cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 7200
ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 7260
tctacgtatt agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc 7320
gtggatagcg gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga 7380
gtttgttttg gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat 7440
tgacgcaaat gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctggtttag 7500
tgaaccgtca gatccgctag agatccgcgg ccgctaatac gactcactat agggagagcc 7560
gccaccatga aacggacagc cgacggaagc gagttcgagt caccaaagaa gaagcggaaa 7620
gtctctgaag tcgagtttag ccacgagtat tggatgaggc acgcactgac cctggcaaag 7680
cgagcatggg atgaaagaga agtccccgtg ggcgccgtgc tggtgcacaa caatagagtg 7740
atcggagagg gatggaacag gccaatcggc cgccgcgacc ctaccgcaca cgcagagatc 7800
atggcactga ggcagggagg cctggtcatg cagaattacc gcctgatcga tgccaccctg 7860
tatgtgacac tggagccatg cgtgatgtgc gcaggagcaa tgatccacag caggatcgga 7920
agagtggtgt tcggagcacg ggacgccaag accggcgcag caggctccct gatggatgtg 7980
ctgcaccacc ccggcatgaa ccaccgggtg gagatcacag agggaatcct ggcagacgag 8040
tgcgccgccc tgctgagcga tttctttaga atgcggccac aggagatcaa ggcccagaag 8100
aaggcacaga gctccaccga ctctggagga tctagcggag gatcctctgg aagcgagaca 8160
ccaggcacaa gcgagtccgc cacaccagag agctccggcg gctcctccgg aggatcctct 8220
gaggtggagt tttcccacga gtactggatg agacatgccc tgaccctggc caagagggca 8280
cgcgatgaga gggaggtgcc tgtgggagcc gtgctggtgc tgaacaatag agtgatcggc 8340
gagggctgga acagagccat cggcctgcgc gacccaacag cccatgccga aattatggcc 8400
ctgagacagg gcggcctggt catgcagaac tacagactga ttgacgccac cctgtacgtg 8460
acattcgagc cttgcgtgat gtgcgccggc gccatgatcc actctaggat cggccgcgtg 8520
gtgtttggcg tgaggaacgc aaaaaccggc gccgcaggct ccctgatgga cgtgctgcac 8580
taccccggca tgaatcaccg cgtcgaaatt accgagggaa tcctggcaga tgaatgtgcc 8640
gccctgctgt gctatttctt tcggatgcct agacaggtgt tcaatgctca gaagaaggcc 8700
cagagctcca ccgactccgg aggatctagc ggaggctcct ctggctctga gacacctggc 8760
acaagcgaga gcgcaacacc tgaaagcagc gggggcagca gcggggggtc a 8811
<210> 2
<211> 7313
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60
cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120
tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180
ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240
agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300
agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360
ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420
cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480
gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540
tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600
agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660
cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720
caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780
aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840
aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900
caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960
gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020
cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080
ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140
aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200
tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260
aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320
gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380
cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440
gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500
ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560
actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620
gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680
aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740
ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800
tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860
actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920
cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980
cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccgaa ttgacaaatg 2040
gcagtattca tccacaattt taaaagaaaa ggggggattg gggggtacag tgcaggggaa 2100
agaatagtag acataatagc aacagacata caaactaaag aattacaaaa acaaattaca 2160
aaaattcaaa attttcgggt ttattacagg gacagcagag atccagtttg gactagcgat 2220
gctagctgat gcgggccctt agttattaat agtaatcaat tacggggtca ttagttcata 2280
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 2340
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 2400
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 2460
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 2520
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 2580
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 2640
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 2700
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 2760
aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctctc cctatcagtg 2820
atagagatct ccctatcagt gatagagatc gtcgacgagc tcgtttagtg aaccgtcaga 2880
tcgcctggag acgccatcca cgctgttttg acctccatag aagacaccgg gaccgatcca 2940
gcctttccgg ttaaggtgaa cgcgtgcagg ccctgcaggg cgccaccatg aaacggacag 3000
ccgacggaag cgagttcgag tcaccaaaga agaagcggaa agtctctaga atggcttcaa 3060
actttactca gttcgtgctc gtggacaatg gtgggacagg ggatgtgaca gtggctcctt 3120
ctaatttcgc taatggggtg gcagagtgga tcagctccaa ctcacggagc caggcctaca 3180
aggtgacatg cagcgtcagg cagtctagtg cccagaagag aaagtatacc atcaaggtgg 3240
aggtccccaa agtggctacc cagacagtgg gcggagtcga actgcctgtc gccgcttgga 3300
ggtcctacct gaacatggag ctcactatcc caattttcgc taccaattct gactgtgaac 3360
tcatcgtgaa ggcaatgcag gggctcctca aagacggtaa tcctatccct tccgccatcg 3420
ccgctaactc aggtatctac agcggcagcg agactcccgg gacctcagag tccgccacac 3480
ccgaaagtat gaagcacaac cctctggtgg tgtgtctgct cattatctgc attacgattc 3540
tgacattcac actcctgacc cgacaaacgc tctacgaact gcggttccgg gacggtgata 3600
aggaggttgc tgcgctcatg gcctgcacgt ccaggtctgg cggccgctct ggcatcgatg 3660
ggagcctcga gccaaagaaa aagcggaaag tgtaatctag ataatcaacc tctggattac 3720
aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac gctatgtgga 3780
tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt cattttctcc 3840
tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt tgtcaggcaa 3900
cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg cattgccacc 3960
acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac ggcggaactc 4020
atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac tgacaattcc 4080
gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt tgccacctgg 4140
attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc ggaccttcct 4200
tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg ccctcagacg 4260
agtcggatct ccctttgggc cgcctccccg cctgagatcc tttaagacca atgacttaca 4320
aggcagctgt agatcttagc cactttttaa aagaaaaggg gggactggaa gggctaattc 4380
actcccaacg aagacaagat ctgctttttg cttgtactgg gtctctctgg ttagaccaga 4440
tctgagcctg ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct 4500
tgccttgagt gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat 4560
ccctcagacc cttttagtca gtgtggaaaa tctctagcag tagtagttca tgtcatctta 4620
ttattcagta tttataactt gcaaagaaat gaatatcaga gagtgagagg cccgggttaa 4680
ttaaggaaag ggctagatca ttcttgaaga cgaaagggcc tcgtgatacg cctattttta 4740
taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 4800
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 4860
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 4920
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 4980
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 5040
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 5100
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tgttgacgcc 5160
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 5220
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 5280
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 5340
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 5400
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 5460
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 5520
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 5580
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 5640
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 5700
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 5760
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 5820
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 5880
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 5940
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 6000
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 6060
agcagagcgc agataccaaa tactgttctt ctagtgtagc cgtagttagg ccaccacttc 6120
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 6180
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 6240
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 6300
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 6360
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 6420
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 6480
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 6540
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 6600
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 6660
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata 6720
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagcaagct catggctgac 6780
taattttttt tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt 6840
agtgaggagg cttttttgga ggcctaggct tttgcaaaaa gctccccgtg gcacgacagg 6900
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 6960
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 7020
ggataacaat ttcacacagg aaacagctat gacatgatta cgaatttcac aaataaagca 7080
tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 7140
tggatcaact ggataactca agctaaccaa aatcatccca aacttcccac cccataccct 7200
attaccactg ccaattacct gtggtttcat ttactctaaa cctgtgattc ctctgaatta 7260
ttttcatttt aaagaaattg tatttgttaa atatgtacta caaacttagt agt 7313
<210> 3
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
accgggccca gactgagcac gtga 24
<210> 4
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aaactcacgt gctcagtctg ggcc 24
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctacgcctgt gatgggctaa 20
<210> 6
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccatcacttt ctggcctcag t 21
<210> 7
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cgccacaccc gaaagtatga agcacaaccc t 31
<210> 8
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ccagagcggc cgccagacct ggacgtgcag gc 32
<210> 9
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
accggatgag ataatgatga gtca 24
<210> 10
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
aaactgactc atcattatct catc 24
<210> 11
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
accgggattg acccaggcca gggc 24
<210> 12
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaacgccctg gcctgggtca atcc 24
<210> 13
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
accggaatac taagcataga ctcc 24
<210> 14
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
aaacggagtc tatgcttagt attc 24
<210> 15
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
accggaagac caaggataga ctgc 24
<210> 16
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aaacgcagtc tatccttggt cttc 24
<210> 17
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
accgggacag gcagcataga ctgt 24
<210> 18
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
aaacacagtc tatgctgcct gtcc 24
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
accggtagaa aaagtataga ctgc 24
<210> 20
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaacgcagtc tatacttttt ctac 24
<210> 21
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
accggggaat aaatcataga atcc 24
<210> 22
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
aaacggattc tatgatttat tccc 24
<210> 23
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
accgacacac acacttagaa tctg 24
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
aaaccagatt ctaagtgtgt gtgt 24
<210> 25
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
accgcacaca cacttagaat ctgt 24
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aaacacagat tctaagtgtg tgtg 24
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gatgccctcc atcttctccg 20
<210> 28
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
taggtttgca tagacctgcc c 21
<210> 29
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
cctccatctt cctacacgcc 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gaacaggcag cgtattgctt 20
<210> 31
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
aaccacctgc agaggactac t 21
<210> 32
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gaaggcctag aaagagacag c 21
<210> 33
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tggtgattat ggttacacag cg 22
<210> 34
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
acccatgtgc ctgacatagg 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tcctgaggtc taggaacccg 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gggaggtgga gagaggatgt 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
agctcaagat cacgttgcct 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ctccttggtc caggttctcg 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
agctcaagat cacgttgcct 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ctccttggtc caggttctcg 20
<210> 41
<211> 498
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
tctgaagtcg agtttagcca cgagtattgg atgaggcacg cactgaccct ggcaaagcga 60
gcatgggatg aaagagaagt ccccgtgggc gccgtgctgg tgcacaacaa tagagtgatc 120
ggagagggat ggaacaggcc aatcggccgc cacgacccta ccgcacacgc agagatcatg 180
gcactgaggc agggaggcct ggtcatgcag aattaccgcc tgatcgatgc caccctgtat 240
gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagcag gatcggaaga 300
gtggtgttcg gagcacggga cgccaagacc ggcgcagcag gctccctgat ggatgtgctg 360
caccaccccg gcatgaacca ccgggtggag atcacagagg gaatcctggc agacgagtgc 420
gccgccctgc tgagcgattt ctttagaatg cggagacagg agatcaaggc ccagaagaag 480
gcacagagct ccaccgac 498
<210> 42
<211> 498
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tctgaggtgg agttttccca cgagtactgg atgagacatg ccctgaccct ggccaagagg 60
gcacgcgatg agagggaggt gcctgtggga gccgtgctgg tgctgaacaa tagagtgatc 120
ggcgagggct ggaacagagc catcggcctg cacgacccaa cagcccatgc cgaaattatg 180
gccctgagac agggcggcct ggtcatgcag aactacagac tgattgacgc caccctgtac 240
gtgacattcg agccttgcgt gatgtgcgcc ggcgccatga tccactctag gatcggccgc 300
gtggtgtttg gcgtgaggaa cgcaaaaacc ggcgccgcag gctccctgat ggacgtgctg 360
cactaccccg gcatgaatca ccgcgtcgaa attaccgagg gaatcctggc agatgaatgt 420
gccgccctgc tgtgctattt ctttcggatg cctagacagg tgttcaatgc tcagaagaag 480
gcccagagct ccaccgac 498
<210> 43
<211> 4101
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
gacaagaagt acagcatcgg cctggccatc ggcaccaact ctgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 180
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 240
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 300
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 660
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 720
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 780
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 900
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 960
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1020
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1140
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1260
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1320
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1380
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1440
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1560
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1620
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1680
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1740
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1800
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1860
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 1920
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2040
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2160
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2220
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2520
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctaaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3360
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3660
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3840
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggtga c 4101
<210> 44
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtc 57
<210> 45
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tctggaggat ctagcggagg atcctctgga agcgagacac caggcacaag cgagtccgcc 60
acaccagaga gctccggcgg ctcctccgga ggatcc 96
<210> 46
<211> 96
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tctggaggat ctagcggagg atcctctgga agcgagacac caggcacaag cgagtccgcc 60
acaccagaga gctccggcgg ctcctccgga ggatcc 96
<210> 47
<211> 5409
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
atgaaacgga cagccgacgg aagcgagttc gagtcaccaa agaagaagcg gaaagtctct 60
gaagtcgagt ttagccacga gtattggatg aggcacgcac tgaccctggc aaagcgagca 120
tgggatgaaa gagaagtccc cgtgggcgcc gtgctggtgc acaacaatag agtgatcgga 180
gagggatgga acaggccaat cggccgccgc gaccctaccg cacacgcaga gatcatggca 240
ctgaggcagg gaggcctggt catgcagaat taccgcctga tcgatgccac cctgtatgtg 300
acactggagc catgcgtgat gtgcgcagga gcaatgatcc acagcaggat cggaagagtg 360
gtgttcggag cacgggacgc caagaccggc gcagcaggct ccctgatgga tgtgctgcac 420
caccccggca tgaaccaccg ggtggagatc acagagggaa tcctggcaga cgagtgcgcc 480
gccctgctga gcgatttctt tagaatgcgg ccacaggaga tcaaggccca gaagaaggca 540
cagagctcca ccgactctgg aggatctagc ggaggatcct ctggaagcga gacaccaggc 600
acaagcgagt ccgccacacc agagagctcc ggcggctcct ccggaggatc ctctgaggtg 660
gagttttccc acgagtactg gatgagacat gccctgaccc tggccaagag ggcacgcgat 720
gagagggagg tgcctgtggg agccgtgctg gtgctgaaca atagagtgat cggcgagggc 780
tggaacagag ccatcggcct gcgcgaccca acagcccatg ccgaaattat ggccctgaga 840
cagggcggcc tggtcatgca gaactacaga ctgattgacg ccaccctgta cgtgacattc 900
gagccttgcg tgatgtgcgc cggcgccatg atccactcta ggatcggccg cgtggtgttt 960
ggcgtgagga acgcaaaaac cggcgccgca ggctccctga tggacgtgct gcactacccc 1020
ggcatgaatc accgcgtcga aattaccgag ggaatcctgg cagatgaatg tgccgccctg 1080
ctgtgctatt tctttcggat gcctagacag gtgttcaatg ctcagaagaa ggcccagagc 1140
tccaccgact ccggaggatc tagcggaggc tcctctggct ctgagacacc tggcacaagc 1200
gagagcgcaa cacctgaaag cagcgggggc agcagcgggg ggtcagacaa gaagtacagc 1260
atcggcctgg ccatcggcac caactctgtg ggctgggccg tgatcaccga cgagtacaag 1320
gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat caagaagaac 1380
ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg gctgaagaga 1440
accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca agagatcttc 1500
agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga gtccttcctg 1560
gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt ggacgaggtg 1620
gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt ggacagcacc 1680
gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa gttccggggc 1740
cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa gctgttcatc 1800
cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc cagcggcgtg 1860
gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga aaatctgatc 1920
gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa acctgattgc cctgagcctg 1980
ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa actgcagctg 2040
agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg cgaccagtac 2100
gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag cgacatcctg 2160
agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa gagatacgac 2220
gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct gcctgagaag 2280
tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat tgacggcgga 2340
gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat ggacggcacc 2400
gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg gaccttcgac 2460
aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct gcggcggcag 2520
gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat cctgaccttc 2580
cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc ctggatgacc 2640
agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga caagggcgct 2700
tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc caacgagaag 2760
gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga gctgaccaaa 2820
gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga gcagaaaaag 2880
gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca gctgaaagag 2940
gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt ggaagatcgg 3000
ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga caaggacttc 3060
ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct gacactgttt 3120
gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt cgacgacaaa 3180
gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag ccggaagctg 3240
atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct gaagtccgac 3300
ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac ctttaaagag 3360
gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca cattgccaat 3420
ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt ggtggacgag 3480
ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat ggccagagag 3540
aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg gatcgaagag 3600
ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa cacccagctg 3660
cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta cgtggaccag 3720
gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc tcagagcttt 3780
ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa ccggggcaag 3840
agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg gcggcagctg 3900
ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc cgagagaggc 3960
ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga aacccggcag 4020
atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta cgacgagaat 4080
gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt gtccgatttc 4140
cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca cgcccacgac 4200
gcctacctaa acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa gctggaaagc 4260
gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc caagagcgag 4320
caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat gaactttttc 4380
aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat cgagacaaac 4440
ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt gcggaaagtg 4500
ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg cggcttcagc 4560
aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa gaaggactgg 4620
gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt gctggtggtg 4680
gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct gctggggatc 4740
accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga agccaagggc 4800
tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct gttcgagctg 4860
gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg aaacgaactg 4920
gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga gaagctgaag 4980
ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa gcactacctg 5040
gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc cgacgctaat 5100
ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag agagcaggcc 5160
gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc cttcaagtac 5220
tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct ggacgccacc 5280
ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc tcagctggga 5340
ggtgactctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 5400
aggaaagtc 5409
Claims (15)
1.一种融合蛋白,包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段,所述ecTadA-ecTadA*二聚体片段包括ecTad片段和ecTadA*片段。
2.如权利要求1所述的融合蛋白,其特征在于,所述ecTadA片段的氨基酸序列包括:
a)如SEQ ID NO.41所示的氨基酸序列;或,
b)与SEQ ID NO.41具有80%以上序列相似性的氨基酸序列、且具有a)所限定的氨基酸序列的功能,优选为能够与ecTadA*片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。
3.如权利要求1所述的融合蛋白,其特征在于,所述ecTadA*片段的氨基酸序列包括:
c)如SEQ ID NO.42所示的氨基酸序列;或,
d)与SEQ ID NO.42具有80%以上序列相似性的氨基酸序列、且具有c)所限定的氨基酸序列的功能,优选为能够与ecTadA片段形成二聚体、且二聚体具有腺嘌呤脱氨酶活性。
4.如权利要求1所述的融合蛋白,其特征在于,所述SpCas9-D10A nickase片段的氨基酸序列包括:
e)如SEQ ID NO.43所示的氨基酸序列;或,
f)与SEQ ID NO.43具有80%以上序列相似性的氨基酸序列、且具有e)所限定的氨基酸序列的功能,优选为能够识别NG作为PAM。
5.如权利要求1所述的融合蛋白,其特征在于,所述融合蛋白自N端至C端依次包括ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段;
和/或,所述ecTadA-ecTadA*二聚体片段自N端至C端依次包括ecTad片段和ecTadA*片段。
6.如权利要求1所述的融合蛋白,其特征在于,所述融合蛋白还包括核定位信号片段,优选的,所述核定位信号片段位于ecTadA-ecTadA*二聚体片段和SpCas9-D10A nickase片段的N端和/或C端,优选的,所述核定位信号片段的氨基酸序列如SEQ ID NO.44所示;
和/或,所述融合蛋白还包括柔性连接肽片段,优选的,所述柔性连接肽段的氨基酸序列如SEQ ID NO.45、SEQ ID NO.46所示。
7.如权利要求1所述的融合蛋白,其特征在于,所述融合蛋白的氨基酸序列如SEQ IDNo.47所示。
8.一种分离的多核苷酸,编码如权利要求1~7任一权利要求所述的融合蛋白。
9.一种构建体,所述构建体含有如权利要求8所述的分离的多核苷酸。
10.一种表达系统,所述表达系统含有如权利要求9所述的构建体或基因组中整合有外源的如权利要求8所述的多核苷酸。
11.如权利要求10所述的表达系统,其特征在于,所述表达系统的宿主细胞选自真核细胞或原核细胞,优选选自小鼠细胞、人细胞,更优选选自小鼠脑神经瘤细胞、人胚胎肾细胞、或人宫颈癌细胞、人结肠癌细胞、人骨肉瘤细胞,更优选选自N2a细胞、HEK293FT细胞、Hela细胞、HCT116细胞、或U2OS细胞。
12.如权利要求1~7任一权利要求所述的融合蛋白、如权利要求8所述的分离的多核苷酸、如权利要求9所述的构建体或如权利要求10~11任一权利要求所述的表达系统在基因编辑中的用途。
13.如权利要求12所述的用途,其特征在于,所述用途具体为在真核生物的基因编辑中的用途。
14.一种碱基编辑体系,包括如权利要求1~7任一权利要求所述的融合蛋白,所述碱基编辑体系还包括sgRNA。
15.一种基因编辑方法,包括:通过如权利要求1~7任一权利要求所述的融合蛋白、或如权利要求14所述的碱基编辑体系进行基因编辑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514432.7A CN110407945A (zh) | 2019-06-14 | 2019-06-14 | 一种腺嘌呤碱基编辑工具及其用途 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910514432.7A CN110407945A (zh) | 2019-06-14 | 2019-06-14 | 一种腺嘌呤碱基编辑工具及其用途 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110407945A true CN110407945A (zh) | 2019-11-05 |
Family
ID=68359126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910514432.7A Pending CN110407945A (zh) | 2019-06-14 | 2019-06-14 | 一种腺嘌呤碱基编辑工具及其用途 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110407945A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110878305A (zh) * | 2019-12-09 | 2020-03-13 | 安徽省农业科学院水稻研究所 | 一种高效的宽窗口单碱基编辑基因及其应用和育种方法 |
CN110951773A (zh) * | 2019-12-20 | 2020-04-03 | 北京市农林科学院 | FNLS-sABE系统在创制水稻除草剂抗性材料中的应用 |
CN110964742A (zh) * | 2019-12-20 | 2020-04-07 | 北京市农林科学院 | 一种抗除草剂水稻的制备方法 |
CN110982818A (zh) * | 2019-12-20 | 2020-04-10 | 北京市农林科学院 | 核定位信号f4nls在高效创制水稻除草剂抗性材料中的应用 |
CN114438110A (zh) * | 2022-01-25 | 2022-05-06 | 浙江大学杭州国际科创中心 | 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法 |
WO2023036189A1 (zh) * | 2021-09-07 | 2023-03-16 | 华东师范大学 | 腺嘌呤脱氨酶、包含其的腺嘌呤碱基编辑器及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109021111A (zh) * | 2018-02-23 | 2018-12-18 | 上海科技大学 | 一种基因碱基编辑器 |
WO2018230976A1 (ko) * | 2017-06-15 | 2018-12-20 | 주식회사 툴젠 | 반복 확장 돌연변이에 대한 게놈 편집 시스템 |
CN109652439A (zh) * | 2018-12-27 | 2019-04-19 | 宜春学院 | 利用CRISPR/Cas9介导的腺嘌呤碱基编辑系统改良水稻稻瘟病广谱抗性的方法 |
CN109706185A (zh) * | 2019-02-01 | 2019-05-03 | 国家卫生计生委科学技术研究所 | 基于碱基编辑系统突变起始密码子实现基因敲除的方法及应用 |
-
2019
- 2019-06-14 CN CN201910514432.7A patent/CN110407945A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018230976A1 (ko) * | 2017-06-15 | 2018-12-20 | 주식회사 툴젠 | 반복 확장 돌연변이에 대한 게놈 편집 시스템 |
CN109021111A (zh) * | 2018-02-23 | 2018-12-18 | 上海科技大学 | 一种基因碱基编辑器 |
CN109652439A (zh) * | 2018-12-27 | 2019-04-19 | 宜春学院 | 利用CRISPR/Cas9介导的腺嘌呤碱基编辑系统改良水稻稻瘟病广谱抗性的方法 |
CN109706185A (zh) * | 2019-02-01 | 2019-05-03 | 国家卫生计生委科学技术研究所 | 基于碱基编辑系统突变起始密码子实现基因敲除的方法及应用 |
Non-Patent Citations (2)
Title |
---|
LEI YANG ET AL.: ""Increasing targeting scope of adenosine base editors in mouse and rat embryos through fusion of TadA deaminase with Cas9 variants"", 《PROTEIN CELL》 * |
LUKE W KOBLAN ET AL.: ""Improving cytidine and adenine base editors by expression optimization and ancestral reconstruction"", 《NATURE BIOTECHNOLOGY》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110878305A (zh) * | 2019-12-09 | 2020-03-13 | 安徽省农业科学院水稻研究所 | 一种高效的宽窗口单碱基编辑基因及其应用和育种方法 |
CN110878305B (zh) * | 2019-12-09 | 2022-04-12 | 安徽省农业科学院水稻研究所 | 一种宽窗口单碱基编辑基因及其应用和育种方法 |
CN110951773A (zh) * | 2019-12-20 | 2020-04-03 | 北京市农林科学院 | FNLS-sABE系统在创制水稻除草剂抗性材料中的应用 |
CN110964742A (zh) * | 2019-12-20 | 2020-04-07 | 北京市农林科学院 | 一种抗除草剂水稻的制备方法 |
CN110982818A (zh) * | 2019-12-20 | 2020-04-10 | 北京市农林科学院 | 核定位信号f4nls在高效创制水稻除草剂抗性材料中的应用 |
CN110964742B (zh) * | 2019-12-20 | 2022-03-01 | 北京市农林科学院 | 一种抗除草剂水稻的制备方法 |
CN110951773B (zh) * | 2019-12-20 | 2022-04-12 | 北京市农林科学院 | FNLS-sABE系统在创制水稻除草剂抗性材料中的应用 |
WO2023036189A1 (zh) * | 2021-09-07 | 2023-03-16 | 华东师范大学 | 腺嘌呤脱氨酶、包含其的腺嘌呤碱基编辑器及其应用 |
CN114438110A (zh) * | 2022-01-25 | 2022-05-06 | 浙江大学杭州国际科创中心 | 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法 |
CN114438110B (zh) * | 2022-01-25 | 2023-08-04 | 浙江大学杭州国际科创中心 | 一种精确无pam限制的腺嘌呤碱基编辑器及其构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110407945A (zh) | 一种腺嘌呤碱基编辑工具及其用途 | |
AU2018279457B2 (en) | Method for manufacturing DNA-edited eukaryotic cell, and kit used in method | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
US6420524B1 (en) | Gain of function mutations in ATP-dependent transposition proteins | |
KR20010024296A (ko) | 벡터 구조체와 세포 dna의 비상동 재조합법에 의한내생 유전자 발현 | |
US20200188531A1 (en) | Single-vector gene construct comprising insulin and glucokinase genes | |
KR102628872B1 (ko) | 세포의 증식을 제어하기 위해 세포 분열 좌위를 사용하기 위한 도구 및 방법 | |
CN113817775B (zh) | 修饰的阿柏西普、组合物、方法及其在基因治疗中的应用 | |
KR101961667B1 (ko) | 돼지유행성설사병 바이러스에 내성을 가지는 형질전환 복제돼지 및 이의 제조방법 | |
CN106755036B (zh) | 一种细菌和抗体结合双靶向抑杀实体瘤药物的制备方法 | |
CN106687592B (zh) | 一种重组质粒、其构建的重组疟原虫及其应用 | |
KR20240001708A (ko) | 유전적 장애의 치료를 위해 생체내 뉴클레아제-매개의 유전자 표적화를 위한 조성물 및 방법 | |
CN101646774A (zh) | 用于生产蛋白,特别是治疗用蛋白的高转录活性细胞株 | |
KR102070176B1 (ko) | 신경회로 연결망을 검출할 수 있는 이중표지 바이러스 벡터 및 이의 용도 | |
CN116113427A (zh) | 天然外膜囊泡中的sars-cov-2受体结合结构域 | |
CN109082442B (zh) | 一种可解除免疫抑制并增强肿瘤靶向性杀伤的间充质干细胞的制备方法 | |
KR102416059B1 (ko) | 에레모테시움의 발효를 통한 리보플라빈의 더 높은 생성을 위한 베타-산화 경로의 효소를 엔코딩하는 유전자 및 지방산 수송체 유전자의 과-발현 | |
KR102143644B1 (ko) | 웅성불임유발 방법 | |
KR20190131081A (ko) | 세포 내재성 dna 변형 효소를 사용하여 표적화된 dna의 핵산 염기를 특이적으로 변환시키는, 세포의 핵산 서열의 변환 방법 및 이에 사용하는 분자 복합체 | |
CN112921007A (zh) | 用于预防猫感染新冠病毒的重组腺相关病毒及其构建方法和应用 | |
CN116323942A (zh) | 用于基因组编辑的组合物及其使用方法 | |
KR20210122801A (ko) | 간 특이적 유도성 프로모터 및 이의 사용 방법 | |
CN108949690B (zh) | 一种制备可实时检测间充质干细胞骨分化的细胞模型的方法 | |
CN112852759A (zh) | 一种嵌合犬细小病毒vp2基因的重组狂犬病病毒及其应用 | |
CN113025638B (zh) | 一种基于双链核酸的折纸结构及其制备方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191105 |
|
RJ01 | Rejection of invention patent application after publication |