CN112585272A - 基因靶向 - Google Patents
基因靶向 Download PDFInfo
- Publication number
- CN112585272A CN112585272A CN201980048679.2A CN201980048679A CN112585272A CN 112585272 A CN112585272 A CN 112585272A CN 201980048679 A CN201980048679 A CN 201980048679A CN 112585272 A CN112585272 A CN 112585272A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- replication
- fusion protein
- cell
- donor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010363 gene targeting Methods 0.000 title description 4
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 107
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 107
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 75
- 230000010076 replication Effects 0.000 claims abstract description 69
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 66
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 66
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 45
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000027455 binding Effects 0.000 claims abstract description 15
- 108020004414 DNA Proteins 0.000 claims description 118
- 108090000623 proteins and genes Proteins 0.000 claims description 46
- 239000013598 vector Substances 0.000 claims description 39
- 230000008439 repair process Effects 0.000 claims description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 21
- 230000003612 virological effect Effects 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 17
- 108091033409 CRISPR Proteins 0.000 claims description 16
- 108060002716 Exonuclease Proteins 0.000 claims description 15
- 102000013165 exonuclease Human genes 0.000 claims description 15
- 230000004570 RNA-binding Effects 0.000 claims description 14
- 230000006798 recombination Effects 0.000 claims description 14
- 238000005215 recombination Methods 0.000 claims description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 13
- 108010091086 Recombinases Proteins 0.000 claims description 13
- 102000018120 Recombinases Human genes 0.000 claims description 13
- 239000012634 fragment Substances 0.000 claims description 13
- 230000037361 pathway Effects 0.000 claims description 13
- 230000005782 double-strand break Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 11
- 230000001404 mediated effect Effects 0.000 claims description 11
- 239000002773 nucleotide Substances 0.000 claims description 10
- 125000003729 nucleotide group Chemical group 0.000 claims description 10
- 239000003550 marker Substances 0.000 claims description 9
- 230000033607 mismatch repair Effects 0.000 claims description 8
- 238000003776 cleavage reaction Methods 0.000 claims description 7
- 230000007017 scission Effects 0.000 claims description 7
- 230000000977 initiatory effect Effects 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 5
- 108020005004 Guide RNA Proteins 0.000 claims description 4
- 239000003112 inhibitor Substances 0.000 claims description 4
- 230000008265 DNA repair mechanism Effects 0.000 claims description 3
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 2
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 2
- 101710105008 RNA-binding protein Proteins 0.000 claims description 2
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 15
- 239000000203 mixture Substances 0.000 abstract description 12
- 238000012239 gene modification Methods 0.000 abstract description 10
- 230000005017 genetic modification Effects 0.000 abstract description 10
- 235000013617 genetically modified food Nutrition 0.000 abstract description 10
- 238000001727 in vivo Methods 0.000 abstract description 7
- 210000004102 animal cell Anatomy 0.000 abstract description 5
- 201000010099 disease Diseases 0.000 abstract description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 102000053602 DNA Human genes 0.000 description 114
- 210000004027 cell Anatomy 0.000 description 52
- 244000061176 Nicotiana tabacum Species 0.000 description 37
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 36
- 241000196324 Embryophyta Species 0.000 description 35
- 102000004169 proteins and genes Human genes 0.000 description 26
- 108020004682 Single-Stranded DNA Proteins 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 230000006780 non-homologous end joining Effects 0.000 description 20
- 101150008404 PPOX1 gene Proteins 0.000 description 16
- 230000035772 mutation Effects 0.000 description 16
- 101710132601 Capsid protein Proteins 0.000 description 15
- 101710094648 Coat protein Proteins 0.000 description 15
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 15
- 101710125418 Major capsid protein Proteins 0.000 description 15
- 101710141454 Nucleoprotein Proteins 0.000 description 15
- 101710083689 Probable capsid protein Proteins 0.000 description 15
- 238000003780 insertion Methods 0.000 description 15
- 230000037431 insertion Effects 0.000 description 15
- 241000589158 Agrobacterium Species 0.000 description 13
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- 230000003007 single stranded DNA break Effects 0.000 description 12
- 230000009261 transgenic effect Effects 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 108091027544 Subgenomic mRNA Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 101150101900 uidA gene Proteins 0.000 description 11
- 101150038500 cas9 gene Proteins 0.000 description 10
- 241000894006 Bacteria Species 0.000 description 9
- 101710163270 Nuclease Proteins 0.000 description 9
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 8
- 108010000700 Acetolactate synthase Proteins 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000002363 herbicidal effect Effects 0.000 description 7
- 239000004009 herbicide Substances 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 238000005096 rolling process Methods 0.000 description 7
- 101150073246 AGL1 gene Proteins 0.000 description 6
- 108091023037 Aptamer Proteins 0.000 description 6
- 241000219194 Arabidopsis Species 0.000 description 6
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 241000702463 Geminiviridae Species 0.000 description 6
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 6
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 6
- 238000000137 annealing Methods 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 229910015837 MSH2 Inorganic materials 0.000 description 5
- 101150108119 PDS gene Proteins 0.000 description 5
- 238000010459 TALEN Methods 0.000 description 5
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 229960000318 kanamycin Drugs 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 101150066583 rep gene Proteins 0.000 description 5
- 229940027257 timentin Drugs 0.000 description 5
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 4
- 241000701959 Escherichia virus Lambda Species 0.000 description 4
- 108060004795 Methyltransferase Proteins 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 239000003242 anti bacterial agent Substances 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 108010064144 endodeoxyribonuclease VII Proteins 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 101100326267 Arabidopsis thaliana BOR2 gene Proteins 0.000 description 3
- 241000702325 Beet curly top virus Species 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 241000701533 Escherichia virus T4 Species 0.000 description 3
- 108010085220 Multiprotein Complexes Proteins 0.000 description 3
- 102000007474 Multiprotein Complexes Human genes 0.000 description 3
- 108020005091 Replication Origin Proteins 0.000 description 3
- 101100028962 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PDR1 gene Proteins 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 3
- 229960003669 carbenicillin Drugs 0.000 description 3
- 229960004261 cefotaxime Drugs 0.000 description 3
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 3
- 230000037433 frameshift Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 108010001545 phytoene dehydrogenase Proteins 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 3
- 229960001225 rifampicin Drugs 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241001515965 unidentified phage Species 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 2
- 108010014310 Arabidopsis XPG-like endonuclease 1 Proteins 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 239000005496 Chlorsulfuron Substances 0.000 description 2
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 239000005558 Fluroxypyr Substances 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108091064358 Holliday junction Proteins 0.000 description 2
- 102000039011 Holliday junction Human genes 0.000 description 2
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 108010055016 Rec A Recombinases Proteins 0.000 description 2
- 102000001218 Rec A Recombinases Human genes 0.000 description 2
- 101710173823 Short transient receptor potential channel 4 Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 239000007844 bleaching agent Substances 0.000 description 2
- 210000004671 cell-free system Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- VJYIFXVZLXQVHO-UHFFFAOYSA-N chlorsulfuron Chemical compound COC1=NC(C)=NC(NC(=O)NS(=O)(=O)C=2C(=CC=CC=2)Cl)=N1 VJYIFXVZLXQVHO-UHFFFAOYSA-N 0.000 description 2
- 238000003501 co-culture Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000012361 double-strand break repair Effects 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- MEFQWPUMEMWTJP-UHFFFAOYSA-N fluroxypyr Chemical compound NC1=C(Cl)C(F)=NC(OCC(O)=O)=C1Cl MEFQWPUMEMWTJP-UHFFFAOYSA-N 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 230000012357 postreplication repair Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- 230000009044 synergistic interaction Effects 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- 230000006269 (delayed) early viral mRNA transcription Effects 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101150001232 ALS gene Proteins 0.000 description 1
- ANNKVZSFQJGVDY-XUXIUFHCSA-N Ala-Val-Pro-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ANNKVZSFQJGVDY-XUXIUFHCSA-N 0.000 description 1
- 108700038994 Arabidopsis ATRAD51 Proteins 0.000 description 1
- 101000856618 Arabidopsis thaliana Flap endonuclease GEN-like 1 Proteins 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 101100184662 Caenorhabditis elegans mogs-1 gene Proteins 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 241001533384 Circovirus Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 241000192091 Deinococcus radiodurans Species 0.000 description 1
- 241000701832 Enterobacteria phage T3 Species 0.000 description 1
- 101000889812 Enterobacteria phage T4 Endonuclease Proteins 0.000 description 1
- 241000709744 Enterobacterio phage MS2 Species 0.000 description 1
- 101100316841 Escherichia phage lambda bet gene Proteins 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 101000833646 Homo sapiens Flap endonuclease GEN homolog 1 Proteins 0.000 description 1
- 101000598921 Homo sapiens Orexin Proteins 0.000 description 1
- 101001123245 Homo sapiens Protoporphyrinogen oxidase Proteins 0.000 description 1
- 101000639763 Homo sapiens Regulator of telomere elongation helicase 1 Proteins 0.000 description 1
- 101000940063 Homo sapiens Ubiquitin-conjugating enzyme E2 variant 2 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101000611412 Oryza sativa subsp. japonica Protoporphyrinogen oxidase, chloroplastic Proteins 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 102100029028 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 241000205156 Pyrococcus furiosus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 102100034469 Regulator of telomere elongation helicase 1 Human genes 0.000 description 1
- 101710088839 Replication initiation protein Proteins 0.000 description 1
- 101710203837 Replication-associated protein Proteins 0.000 description 1
- 101100005532 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cce1 gene Proteins 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 102100031122 Ubiquitin-conjugating enzyme E2 variant 2 Human genes 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 150000001413 amino acids Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 244000285940 beete Species 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- JEDYYFXHPAIBGR-UHFFFAOYSA-N butafenacil Chemical compound O=C1N(C)C(C(F)(F)F)=CC(=O)N1C1=CC=C(Cl)C(C(=O)OC(C)(C)C(=O)OCC=C)=C1 JEDYYFXHPAIBGR-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 235000011222 chang cao shi Nutrition 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 108091007738 digestive nucleases Proteins 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 101150088049 dna2 gene Proteins 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- NVGOPFQZYCNLDU-UHFFFAOYSA-N norflurazon Chemical compound O=C1C(Cl)=C(NC)C=NN1C1=CC=CC(C(F)(F)F)=C1 NVGOPFQZYCNLDU-UHFFFAOYSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 108700010839 phage proteins Proteins 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 238000004161 plant tissue culture Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 101150079601 recA gene Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/85—Fusion polypeptide containing an RNA binding domain
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1024—In vivo mutagenesis using high mutation rate "mutator" host strains by inserting genetic material, e.g. encoding an error prone polymerase, disrupting a gene for mismatch repair
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2820/00—Vectors comprising a special origin of replication system
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/11—Exodeoxyribonucleases producing 5'-phosphomonoesters (3.1.11)
- C12Y301/11003—Exodeoxyribonuclease (lambda-induced) (3.1.11.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/22—Endodeoxyribonucleases producing 3'-phosphomonoesters (3.1.22)
- C12Y301/22004—Crossover junction endodeoxyribonuclease (3.1.22.4)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
提供了用于提供更准确和更可靠的基因修饰的方法、试剂和组合物。特别地,描述了编码融合蛋白的核酸,所述融合蛋白包含核酸内切酶结构域和复制起点的结合结构域。还提供了用于对非动物细胞或有机体的基因组进行体内遗传修饰的方法、试剂和组合物。此外,本申请涉及所述方法、试剂和组合物用于将所需特性引入非动物有机体的用途或改善或去除这些生物有机体中在疾病治疗中的不希望的特性的用途。
Description
技术领域
本发明涉及用于提供更准确和可靠的遗传修饰的方法、试剂和组合物。本发明进一步提供了用于对非动物细胞或有机体的基因组进行体内遗传修饰和对修饰的克隆/植物进行选择的方法、试剂和组合物。此外,本发明涉及所述方法、试剂和组合物用于将所需特性引入至非动物有机体的用途,或改善或去除这些有机体中不希望的特性的用途,包括疾病的治疗和转基因有机体的生产中不希望的特性。
背景技术
近年来,通过随机诱变的遗传修饰已为使用序列特异性蛋白质复合物对特定核苷酸序列进行定向诱变所替代。
此类蛋白质复合物的例子包括锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALENs)、源自酿脓链球菌(Streptococcus pyrogenes)和其他细菌的CRISPR-Cas9系统的复合物以及CRISPR-Cpf1。
ZFN和TALENs都是蛋白核酸酶,所述蛋白核酸酶的蛋白质结构使它们能够与特定的DNA序列相互作用并识别特定的DNA序列,然后再在定义的位置切割DNA。因此,切割特定的DNA序列需要独特设计的ZFN或TALEN蛋白。
相反,CRISPR-Cas9和CRISPR-Cpf1系统使用单一的蛋白质,所述单一蛋白质的活性由RNA辅因子控制,所述RNA辅因子的核苷酸序列限定了核酸内切酶产生双链断裂所作用的位置。
因此,所有这些蛋白质复合物通过在预定的DNA序列上使DNA双链断裂而起作用。然后通常通过非同源性末端接合(NHEJ)途径修复此双链断裂。
通过NHEJ的修复是高效且快速的,但与DNA双链断裂修复的替代途径-同源介导修复(HDR)相比更容易出错。因此,一定比例的NHEJ配对事件将导致在断裂位点插入或缺失核苷酸。这种插入或缺失事件称为“indels”。
或者,通过在人工创建的DNA双链断裂附近存在供体DNA分子,可以进行更大的遗传修饰。在这种情况下,诱导的DSB的HDR通过使用供体分子的序列引起DSB的修复。这样,可以进行特异性修饰,并且短序列插入也是可能的。WO 2010/084331中公开了这种供体分子和用于产生大量这种供体分子的载体的一个示例。
同源重组在几个不同的阶段进行:最早的步骤是处理DNA末端以产生3'单链DNA(ssDNA)。在5'链切除后,3'ssDNA被RecA型重组酶结合,该酶催化同源配对和DNA链交换。然后3'末端引发DNA合成,新合成末端之间的霍利迪连接体(Holliday junction)的分离或链退火导致初始DSB的修复(Seitz等人,2001,PMID:11677683)。
但是,使用同源依赖重组(HDR)进行基因修饰的效率很低,因为双链断裂的大多数修复是通过更快速的NHEJ途径进行的。
此外,尽管上述蛋白质复合物是针对特异性序列的,但是已知其核酸内切酶活性可在其他位点起作用。由于NHEJ更容易出错,因此这种“不在目标位点的断裂”尤其成问题。
因此,需要替代的且优选改进的方法和试剂,用于核酸序列特别是DNA序列的序列特异性修饰。此外,需要更可靠和有效地产生所需遗传修饰的技术和试剂。另外,需要可靠地允许将更长的DNA序列插入预定位点的技术和试剂。
发明内容
本发明的目的是提供试剂和使用这些试剂的技术,所述试剂提供替代方案并且优选地允许在基因组内的特定位点处对靶基因组进行更可靠、有效和准确的修饰和/或突变。
本文提供的蛋白质和蛋白质-核酸复合物提供改进的转化效率,本文还提供进行此类转化的方法。此外,本文的方法、试剂和组合物可用于将所需特性引入植物、藻类、细菌和其他非动物有机体,或改善或去除这些有机体中在疾病治疗中包含的不希望的特征。
将供体DNA靶向靶标是同源依赖重组(HDR)的关键因素。已经开发出许多将供体DNA与靶标连接的方法(Sharma&McLaughlin,2002,doi:10.1021/ja020500n;Aird等人,2018,doi:10.1038/s42003-018-0054-2;Savic等人,2018,doi:10.7554/eLife.33761)。有趣的是,供体DNA与cas9融合蛋白的共价连接将同源依赖重组的效率提高了24-30倍,如HUH核酸内切酶与cas9的融合(Aird等人,2018,doi:10.1038/s42003-018-0054-2)或cas9-SNAP-标记结构域融合(Savic等人,2018,doi:10.7554/eLife.33761)所表明的那样。
通过噬菌体蛋白质将蛋白质与RNA连接已经得到认可了数十年(Baron-Benhamou等人,2004,doi:10.1385/1-59259-750-5:135;Coller&Wickens,2007,doi:10.1016/S0076-6879(07)29014-7;Keryer-Bibens等人,2008,doi:10.1042/BC20070067;Tsai等人,2011,doi:10.1074/mcp.M110.007385),此类方法也可用于通过DNA结合蛋白连接供体DNA,所述DNA结合蛋白融合至识别特异性茎环RNA结构的噬菌体外壳蛋白。许多茎环和噬菌体外壳蛋白可用于结合,例如MS2茎环-MS2外壳蛋白(Peabody,1993,PMID:8440248)、PP7茎环-PP7外壳蛋白(Lim&Peabody,2002,PMID:12364592),B-盒茎环-λN外壳蛋白(Keryer-Biben等人,2008,doi:10.1042/BC20070067)。
描述了CRISPR定制的sgRNA与噬菌体外壳蛋白结合RNA茎环的连接,其中将茎环RNA结构引入sgRNA的内部或3'末端,并将潜在的目标蛋白融合到噬菌体外壳蛋白(Konermann等人,2015,doi:10.1038/nature14136;Nowak等人,2016,doi:10.1093/nar/gkw908;Park等人,2017,doi:10.1371/journal.pone.0179410;Anton等人,2018,doi:10.1093/biomethods/bpy002),用于基因组元件、转录调控和表观遗传操作的位点特异性可视化。
但是,供体DNA与靶标的连接在技术上具有挑战性,因为(i)单链线性DNA(sslDNA)应在体外产生,(ii)将sslDNA递送至细胞的效率不如dsDNA,(iii)sslDNA在体内不稳定,会迅速被核酸内切酶降解,导致,(iv)靶位点周围低浓度的供体DNA会显著降低HDR。
因此,将ssDNA递送至细胞具有挑战性。ssDNA在技术上难以递送,因为ssDNA不能天然导入细胞中并会迅速降解。有利的是,本发明通过递送dsDNA然后由该dsDNA在所需位置产生ssDNA来解决该问题。
为了解决这些问题,我们利用了例如来自噬菌体、圆环病毒、双生病毒的HUH rep蛋白,来自细菌或植物优先在植物细胞中具有滚环复制活性的滚环转座子(例如helitrons),和含有双链供体DNA的复制供体载体,所述双链供体DNA的侧翼是一个或两个病毒复制起点。
通过在体内产生ssDNA并使之积聚在要修饰的位点附近,可以显著改善靶标的修饰。ssDNA积聚在要修饰的位点附近意味着它可以在HDR过程中使用更长的时间,这有利于促进HDR。另外,ssDNA拷贝数的扩增允许更多的ssDNA部分在目标位点附近积累,如上所述,这促进了靶位点的更有效编辑。
我们的方法允许通过以下一个或多个或所有手段解决以上所示的所有问题:
(i)在体内细胞中由双链DNA产生单链线性DNA(sslDNA)或单链环状DNA(sscDNA),所述双链DNA例如为复制的供体载体的更稳定的双链DNA(dsDNA);
(ii)通过将供体DNA与rep蛋白共价连接将sslDNA与靶标连接,所述rep蛋白融合至核酸内切酶例如cas9,或融合至噬菌体外壳蛋白(例如MS2外壳蛋白),所述噬菌体外壳蛋白与引入至sgRNA中的茎环RNA结构(例如MS2茎环)结合;
(iii)增强供体DNA在靶位点附近的积累,从而更长时间提供过量的供体DNA。
单链供体DNA可以由线性dsDNA供体复制载体产生,所述线性dsDNA供体复制载体具有一个与供体DNA的5'端融合的复制起点,或者由线性或环状dsDNA复制载体产生,其中供体DNA片段的侧翼为5'和3'端的复制起点。
因此,本发明提供了编码第一融合蛋白的核酸,所述第一融合蛋白包含核酸内切酶或噬菌体外壳蛋白结构域和对于复制起点的结合结构域。
可以组合不同蛋白质或多肽的功能上重要的结构域或区,从而由编码核酸表达为融合蛋白。例如,可以将不同蛋白质或多肽的特别有利或期望的性质组合在杂合蛋白质中,使得所得到的表达产物可以包括各种亲本蛋白质或多肽的片段。
在本文所述的融合蛋白中,融合蛋白的结构域优选通过接头肽连接在一起。接头的具体选择将取决于融合蛋白的组成结构域。合适的接头肽的适合性和选择在Chen等人中有所讨论(Adv Drug Deliv Rev.2013;65(10):1357–1369)。
核酸内切酶可以序列特异性方式切割靶核酸分子。核酸分子的序列特异性切割可以是双链或单链的(包括双螺旋核酸分子的“切口(nicking)”;双链切割可以产生平端或突出端(5'或3'突出)。序列特异性核酸酶优选以单体起作用,但可以二聚体或多聚体起作用。例如,其中两个单体均在靶位点形成单链切口的同型二聚体可在靶分子中产生双链断裂。优选地,切割事件可在靶分子中产生双链断裂。
序列特异性核酸内切酶的例子包括锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALENs)、源自酿脓链球菌(Streptococcus pyrogenes)和其他细菌的CRISPR-Cas9系统的复合物、以及CRISPR-Cpf1。
核酸分子可包含双链或单链DNA或RNA。核酸分子也可以包含DNA-RNA双链体。优选地,核酸分子是双链DNA。优选地,切割事件使靶分子中出现双链DNA断裂。
优选地,核酸内切酶是DNA核酸内切酶,最优选地,其是Cas9。这可以是源自酿脓链球菌的Cas9,也可以源自另一种细菌的同源或功能等效的酶。
融合蛋白可包含核酸内切酶和复制起始复合体组分或复制复合体组分。
复制起始复合体组分或复制复合体组分必须与复制起点相关,并且可以共价结合于其上或结合至延伸核酸分子。适当地,复制起点来自噬菌体、真核病毒和各种类型的转座子,在靶细胞中维持滚环复制功能。对于特异性复制起点的核酸内切酶可以首先在与供体融合的dsDNA起点上产生茎环,在茎环处切割单链,然后形成共价磷酸酪氨酸中间体,从而使DNA链的5'末端与HUH蛋白中的特定酪氨酸连接。最适合用于植物的是双生病毒、植物滚环转座子或其他rep基因家族。
双生病毒Rep蛋白(GV-Rep)与双生病毒的复制起点结合,因此共价连接至复制起点开始的滚环复制产生的供体DNA的ssDNA链。由此,新复制的供体DNA分子与第一融合蛋白共价连接,并且必须与核酸内切酶引起的双链DNA断裂的位点非常接近。
本发明进一步提供了编码第二融合蛋白的核酸,所述第二融合蛋白包含5'至3'DNA核酸外切酶结构域和RNA结合结构域。作为第二融合蛋白的替代,本发明还提供了没有RNA结合结构域的5'至3'DNA核酸外切酶的用途。
Zalatan等人(Cell(2015)160,339-350)和Ma等人(Nat Biotechnol.2016APR18.doi:10.1038/nbt.3526)最初描述的CRISPRainbow系统利用含有3'RNA发夹适配子的修饰sgRNA,所述3'RNA发夹适配子结合唯一标记的RNA结合蛋白(SEQ ID NO:16)。因此,对sgRNA进行了功能化,使其可以用于定位包含对于与sgRNA结合的适配子的结合结构域的融合蛋白,并因此定位与之结合的核酸内切酶。
第二融合蛋白的作用可以是在细胞基因组转化过程中抑制NHEJ,从而促进HDR。这种5'至3'切除对DNA双链断裂的作用,是通过产生不太适合NHEJ但明显更适合HDR的底物来抑制DNA断裂的重新连接(即通过阻断NHEJ)。第二融合蛋白的作用可以是在基因组转化过程中抑制NHEJ,从而促进HDR。
核酸外切酶可以是dsDNA核酸外切酶。核酸外切酶可以是λ核酸外切酶λ核酸外切酶(SEQ ID NO:15)是5'至3'核酸外切酶,并参与重组、双链断裂修复、复制后修复(PRR)途径的MMS2无错误分支和DNA错配修复。
λ核酸外切酶(λexo)在DNA修复中切除DNA末端起重要作用。λ核酸外切酶是一种5'→3'核酸外切酶,可逐步消化双链DNA分子的一条链以产生3'-单链突出端(Carter&Radding,1971,PMID:4928646)。由于其强大的性能和低成本,λexo被广泛用于多种生物技术应用中,例如使用同源重组的基因工程中。
在具有DNA的复合物中,λexo展开底物链5'端的两个碱基,将其拉入反应中心。其水解双链DNA(dsDNA)的速度比单链DNA(ssDNA)快130倍(Little,1967,PMID:6017737)。具有5'磷酸化钝端或凹端的DNA双链体是λexo的合适底物,而具有5'羟基末端或5'磷酸化突出端的dsDNA的消化速率则明显较慢(Mitsis&Kwagh,1999,PMID:10454600,Tongbo等人,2018,doi:10.1093/nar/gky154)。
具有5'-3'活性的核酸外切酶存在于其他有机体中。Cas4蛋白是核心与CRISPR相关(Cas)蛋白之一,所述Cas蛋白与原核CRISPR系统有关,可用于抗病毒防御。Cas4蛋白是体外5'至3'单链DNA核酸外切酶,参与DNA双链体切除以产生重组3'单链DNA突出端(Zhang等人,(2012)https://doi.org/10.1371/journal.pone.0047232)。
源自耐辐射球菌(Deinococcus radiodurans)的RecJ,作为DHH家族蛋白成员,是唯一参与RecF重组途径的5'核酸酶,它提供了双链断裂处5'末端的DNA链切除,这是重组DNA修复的重要步骤。作为一种消化性核酸酶,RecJ仅能沿5′-3′方向降解ssDNA,且单独的该核酸酶能够消化具有5′-ssDNA突出端的DNA(Jiao等人,2012,doi:10.1016/j.dnarep.2011.11.008)。
酿酒酵母(Saccharomyces cerevisiae)的遗传研究表明,末端切除分两个步骤进行。首先,通过高度保守的Mre11-Rad50-Xrs2(MRX)复合物和Sae2,从5'链上去除了一条短的寡核苷酸链,从而创建具有短3'突出端的早期中间体。然后在第二步中,通过核酸外切酶Exo1和/或具有核酸内切酶Dna2的解旋酶-拓扑异构酶复合物Sgs1-Top3-Rmi1,迅速消化早期中间体,生成大量ssDNA(Mimitou&Symington,2011,doi:10.1016/j.dnarep.2010.12.004)。
在古生菌中,例如激烈热球菌(Pyrococcus furiosus),通过两极解旋酶HerA和5'-3'核酸外切酶NurA进行末端切除(Hopkins&Paull,2008,doi:10.1016/j.cell.2008.09.054)。因此,加载或激活HerA-NurA复合物促进了双链DNA断裂(DSB)5'链的切除和链入侵的开始。
有关生命的三种结构域中参与5'末端DNA切除的酶和3'DNA末端形成机制的更多信息,请参阅Blackwood等人,2013,(doi:10.1042/BST20120307);Liu&Huang,2016,(doi:10.1016/j.gpb.2016.05.002);Raynard等人,2019,(doi/10.1101/gad.1742408);Sharad&You,2016,(doi:10.1093/abbs/gmw043);Yin&Petes,2014,(doi.org/10.1534/genetics.114.164517)。
本发明进一步提供了编码第三融合蛋白的核酸,所述第三融合蛋白包含重组诱导结构域和RNA结合结构域。
重组结构域可以是与靶或供体核酸分子相互作用的蛋白质或多肽,以相对于供体核酸分子的核苷酸序列催化靶核酸的核苷酸序列的修饰。
靶核酸的修饰可通过插入供体核酸分子的全部或部分序列或用供体核酸分子的全部或部分序列替代靶核酸分子的同源部分来进行。以这种方式,可以实现缺失、插入、移码突变和单核苷酸突变。
由重组诱导结构域引起或介导的重组诱导事件可以引发或催化靶核酸分子与供体核酸分子之间的链交换。
重组结构域可以是来自大肠杆菌的RecA或其同源物,来自植物或另一种有机体的Rad51或其同源物,或来自诸如噬菌体λ重组蛋白β(BET;Redβ)的退火酶或其同源物。噬菌体λ的体内研究表明,噬菌体λβ蛋白可以催化对重组链退火和重组链入侵途径至关重要的步骤(Matsubara等人,2013,doi:10.1371/journal.pone.0078869)。在这种情况下,同源蛋白可具有功能或序列同源性,优选功能同源性。
优选地,重组结构域是RecA(SEQ ID NO:17)或Rad51单体(SEQ ID NO:18)的三聚体。最优选地,单体通过肽接头连接。将单体的三聚体用于重组结构域是有利的,因为这允许核酸螺旋的结合,以便更有效地引发链交换并因此引发HDR。
本发明进一步提供了编码第四融合蛋白的核酸,所述第四融合蛋白包含具有错配修复途径的抑制剂的结构域和RNA结合结构域。
MSH2和MSH6是参与碱基错配修复和短插入/缺失环修复的蛋白质。MSH2显性阴性突变体(Sia等人,2001,doi:10.1128/MCB.21.23.8157-8167.2001)(SEQ ID NO:25)与结合错配的MSH2竞争,从而阻断了野生型MSH2蛋白修复这些错配的能力。还已知MSH6的显性阴性等位基因,并且可以与MSH2的显性阴性等位基因相同的方式使用(Bowers等人,1999,doi:10.1074/jbc.274.23.16115)。
本发明进一步提供了编码第五融合蛋白的核酸,所述第五融合蛋白包含霍利迪连接体解离酶结构域和RNA结合结构域。合适的解离酶是例如噬菌体T4核酸内切酶VII(T4E7)(SEQ ID NO:26)、噬菌体T7核酸内切酶I(Babon等人,2003,doi:10.1385/MB:23:1:73);CCE1(SEQ ID NO:27),作为来自酵母的YDC2解离酶(Kleff等人,1992,PMCID:PMC556502;White等人,1997,doi:10.1128/MCB.17.11.6465);来自人的GEN1解离酶(Ip等人,2008,doi:10.1038/nature07470)和来自拟南芥(Arabidopsis thaliana)的AtGEN1解离酶(SEQID NO:28)(Bauknecht&Kobbe,2014,doi:10.1104/pp.114.237834)。
通过同源重组的DNA重排和修复涉及霍利迪连接体的创建,所述霍利迪连接体被一类连接体特异性核酸内切酶切割以产生重组双链DNA产物。
DNA接头分子的形成是一个短暂的过程,通常在早期被抗重组解旋酶如Srs2、Mph1或RTEL1破坏(Gangloff等人,1994,PMCID:PMC359378;Malkova等人,2003,PMCID:PMC4493758;Prakash等人,doi:10.1101/gad.1737809)。
在体细胞中,解离酶的低表达和抗重组解旋酶的高活性抑制HDR。在3'至5'方向沿单链DNA移位的DNA解旋酶置换了退火的DNA片段,并从产生交叉的修复途径中去除了霍利迪连接中间体,从而减少了交叉和HDR(Malkova等人,2003,PMCID:PMC4493758)。
为了提高HDR的效率,因此将解离酶及时递送到在供体DNA退火期间形成的霍利迪连接体,以固定重组事件并在靶位点将其转化为修饰。
第二、第三、第四和第五融合蛋白可以结合RNA引导的核酸内切酶的RNA组分,所述RNA组分用于RNA引导的核酸内切酶介导的转化。优选地,RNA组分是用于使用CRISPR–Cas9系统的转化中的tracrRNA分子或结构域。应当注意,通篇提及的给定结构域(包括例如RNA结合结构域),可以是给定的特定结构域本身,也可以是含有该特定结构域的给定结构域。
本发明还提供了一种转化非动物细胞基因组的方法,包括以下步骤:
a.在细胞中表达或向细胞中引入RNA引导的核酸内切酶;
b.在细胞中表达或向细胞中引入序列特异性向导RNA,以将核酸内切酶结构域导致的切割引导至特异性位点;和
c.在细胞中表达编码第二融合蛋白的核酸或将第二融合蛋白引入细胞中。
因此,本发明提供的系统具有多个特征,这些特征可以单独使用或一起使用。这些特征包括以下一项或多项或全部:
a.使用第一融合蛋白的序列特异性核酸内切酶诱导dsDNA断裂。
b.通过将供体核酸分子与第一融合蛋白的起始点结合结构域相关联,扩增和递送供体核酸分子到诱导的DNA断裂附近。
c.使用非同源性末端接合(即阻断NHEJ),如上所述优选通过5'至3'切除双链DNA断裂,来抑制DNA断裂的修复,以产生不适合NHEJ但更适合HDR的底物。
d.将重组酶递送至诱导的dsDNA断裂。
e.提供错配修复途径的抑制剂来抑制所诱导的dsDNA断裂附近的错配修复途径。如上所述,这优选是包含错配修复系统的显性阴性抑制蛋白的融合蛋白。
f.解离供体与靶标DNA之间相互作用诱导的霍利迪连接体。
通过以第二、第三、第四和第五融合蛋白的形式提供特征(c)、(d)、(e)和(f),可以将特征(c)、(d)、(e)和(f)适当地提供给HDR复合体,即各融合蛋白包含与适配子结合的结构域,所述适配子被工程化为指导第一融合蛋白的核酸内切酶活性的sgRNA的一部分(例如SEQ ID NO:16的sgRNA)。
第二、第三、第四和第五融合蛋白各自合适地包含与适配子结合的结构域,所述适配子被工程化为sgRNA的一部分,所述sgRNA指导RNA引导的核酸内切酶的核酸内切酶活性。因此,第二、第三、第四和第五融合蛋白可以与第一融合蛋白以外的RNA引导的核酸内切酶例如Cas9或Cpf1一起使用。
也可以提供特征(b),其包含与适配子结合的结构域,所述适配子被工程化为sgRNA的一部分,所述sgRNA指导RNA引导的核酸内切酶的核酸内切酶活性。
通过使用本发明的第一、第二、第三、第四和/或第五融合蛋白中的任何一个或全部而产生的一个优点是更可靠且更有效的遗传修饰。
另一个优点是,使用本发明的第一、第二、第三、第四和/或第五融合蛋白中的任何一种或全部,可以将较长的DNA序列插入到由已报道的序列引导的核酸内切酶所作用的位点上。
本发明还提供了修饰非动物有机体或细胞的基因组的方法,包括:
a.在细胞中表达编码第一融合蛋白的核酸或将第一融合蛋白引入细胞中;和
b.在所述细胞中表达或向所述细胞中引入包含复制起点的供体核酸分子。
应当理解,第一融合蛋白包含核酸内切酶结构域和对于复制起点的结合结构域,其中所述结合结构域适当地匹配供体核酸的复制起点,例如与之结合。
有利地,第一融合蛋白能够执行多种功能。这些功能包括以下一项或多项或全部:
–由dsDNA产生供体的ssDNA;
–供体DNA的扩增;
–供体DNA与靶标的连接;和
–供体DNA在靶标附近的积累。
通过扩增供体DNA和/或在靶标附近积累供体DNA来获得特别的优点:在DNA双链断裂位点附近的供体DNA的积累促进了HDR对断裂的修复。在目标位点附近提供更高浓度的供体DNA会促进HDR。在不希望受理论的束缚的情况下,据信这是因为具有与靶标同源的部分的供体的更大可用性意味着在这些条件下不适用准确度较低但较快的NHEJ途径。
在本公开内容的上下文中,非动物有机体可以是原核生物(细菌和古细菌)、藻类、植物或任何其他非动物有机体,包括原生生物和真菌。优选地,非动物有机体是植物及其任何部分或繁殖体、种子、自交或杂种后代。植物可以是单子叶植物或双子叶植物。合适的植物是拟南芥、烟草、水稻或转基因作物。合适的转基因作物的示例包括烟草(Nicotianatabacum)和其他烟草种、胡萝卜、蔬菜和油籽芸苔(oilseed Brassicas)、甜瓜、辣椒、葡萄藤、生菜、草莓、甜菜、小麦、大麦、玉米、大米、大豆、豌豆、高粱、向日葵、番茄、棉花和马铃薯。非动物有机体可以是藻类。
供体核酸分子可具有:
a.供体核酸序列;
b.位于供体核酸序列5'末端的病毒复制起点序列,
c.在供体DNA序列的5'和3'末端的病毒复制起点,或者
d.在供体DNA序列的5'端的病毒复制起点,以及在供体DNA序列的3'端的复制终止子。
复制终止子可为无功能的复制起点,当复制叉到达复制终止子时,该复制起点仍然能够终止复制。如果线性dsDNA供体在5'端侧翼连接病毒复制起点,则可以选择省略。在一个具体的示例中,双生病毒的复制起点在复制起点特有的茎环上的特定位置被Rep蛋白切割。只要存在茎环并正确切割,复制就可以在该位置终止。起点的其他序列元素对于终止来说不是必需的,因此在此示例中可以从复制终止子中省略这些其他序列元素。
然而,在源自(例如,在双子病毒中)此类复制起点的复制终止子处的切口仍可以完成具有活性的复制起点和下游终止子/复制起点处的切口茎环的连接。以这种方式,提供了具有活性复制起点的核酸环,并且可以通过滚环复制或另一种复制方式来主动复制。
供体DNA酸分子的滚环复制具有提供大量供体DNA核酸的优点。提供相对大量的供体核酸分子意味着成功转化的可能性增加。
尽管可以在细胞的所需位点中引入修饰,但是由于修饰的和未修饰的细胞之间的竞争,难以从此类细胞中回收修饰的克隆或植物。从修饰的和未修饰的细胞群体再生克隆或植物是乏味且耗时的。
该方法提供了特异性复制供体载体,其允许选择具有所需修饰的克隆/植物。
因此,本发明还提供了包含第一病毒复制起点和第二病毒复制起点的选择载体,其中所述第一病毒复制起点和第二病毒复制起点被布置在供体DNA片段的侧翼;所述供体DNA片段包含不参与融合的可选择的标记基因。
第一病毒复制起点和第二病毒复制起点可以被布置在在包含启动子和供体DNA片段的DNA序列的侧翼,所述供体DNA片段可以包含不影响启动子的可选择的标记基因。
实施例3和图10给出了选择载体的一个示例,该选择载体用于在细胞中引入敲除突变和在选择培养基上回收克隆或植物。
引入的选择载体通常包括两个病毒复制起点和选择标记基因,所述两个病毒复制起点位于供体DNA片段的侧翼,所述选择标记基因相对于产物翻译而整码融合,从而产生标记作用。供体DNA的5'端的病毒复制起点含有具有ATG翻译密码子、与供体DNA片段整码融合的真核启动子,接头,选择标记基因(例如nptII,潮霉素或草丁膦抗性基因),终止子(例如,nos终止子),然后是3'端病毒复制起点(SEQ ID NO:29)。在ATG密码子之后引入的所有序列代表一个翻译单元,产生选择标记,例如对抗生素有抗性,在此示例中:对卡那霉素抗生素有抗性。
为了将敲除突变引入特定基因,在供体DNA片段中引入了终止密码子/缺失/插入。当终止密码子在选择标记基因优选为nptII之前引入供体片段中时,由于选择载体上翻译单元的过早终止,未观察到选择供体载体产生的抗生素抗性。
供体DNA片段与靶标的重组将终止密码子转移至靶序列,而不具有来自靶标的终止密码子的DNA片段替代了选择供体载体中的供体片段。结果,将恢复供体载体上的翻译单元,并将载体扩增,从而可以在补充卡那霉素的培养基上进行选择。通过重组过程中供体和靶标DNA链之间交换而恢复供体载体翻译单元的细胞将对卡那霉素具有抗性,并且可以在选择培养基上从此类细胞中回收克隆或植物。
本文所述的方法可包括在存在外源供体核酸分子的情况下将双链断裂引入基因组,所述外源供体核酸分子包含供体核酸序列作为修饰基因组的模板或作为待整合至基因组中的外源序列;DNA修复机制通过同源介导修复(HDR)来修饰基因组。
该方法可进一步包括通过在细胞中表达编码第二融合蛋白的核酸或将第二融合蛋白引入细胞中,来抑制DNA双链断裂的非同源性末端接合(NHEJ)修复的步骤或效果,以促进HDR对断裂的修复。
本文所述的方法可以包括在存在外源供体核酸分子的情况下将双链断裂引入基因组,所述外源供体核酸分子包含供体核酸序列作为修饰基因组的模板或作为待整合至基因组中的外源序列;并且其中DNA修复机制通过同源介导修复(HDR)来修饰基因组,所述方法包括:
通过在细胞中表达编码第二融合蛋白的核酸或将第二融合蛋白引入细胞中,来抑制断裂的非同源性末端接合(NHEJ)修复,从而促进HDR的修复。
该方法可进一步包括以下步骤:
a.在细胞中表达或向细胞中引入序列特异性向导RNA,以将核酸内切酶结构域的切割作用引导至特异性位点;和
b.在细胞中表达第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白的一种或多种核酸,或将第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白中的一种或多种引入至细胞中。
该方法可进一步包括以下步骤:
a.在细胞中表达编码第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白中的一种或多种的核酸;或
b.将第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白中的一种或多种引至入细胞中。
该方法可进一步包括以下步骤:在细胞中表达编码第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白中的两个或更多个的核酸,或将第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白中的两个或更多个引入至细胞中,其中各个融合蛋白的RNA结合蛋白结构域结合至不同的RNA序列。
以这种方式,第一融合蛋白可以与第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白一起用于与RNA引导的核酸内切酶一起转化非动物细胞或生物有机体。
在如本文所述的修饰基因组的方法中,第一融合蛋白、第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白的表达可以通过诱导和/或瞬时表达来进行。
设想了多种用于引入编码融合蛋白的核酸和本发明的核酸的方法;这些方法包括为了引入蛋白质、DNA和/或RNA的电穿孔和渗透。还设想使用包括脂质体或脂质纳米颗粒(LNP)的用于直接引入蛋白质、DNA和/或RNA的递送系统,优选通过将蛋白质、DNA和/或RNA封装在其中。
本发明还提供了第一融合蛋白,其包含核酸内切酶和复制起始复合体组分或复制复合体组分。
复制起始复合体组分或复制复合体组分也可被引入与噬菌体外壳蛋白(MS2外壳蛋白)融合,所述噬菌体外壳蛋白结合有引入到CRISPR系统的sgRNA的茎环。
本发明进一步提供了第二融合蛋白,其包含5'至3'DNA核酸外切酶结构域和RNA结合结构域。
本发明还提供了第三融合蛋白,其包含重组诱导结构域和RNA结合结构域。
本发明进一步提供了第四融合蛋白,其包含具有错配修复途径的抑制剂的结构域和RNA结合结构域。
本发明进一步提供了第一融合蛋白或编码第一融合蛋白的核酸在非动物有机体或细胞转化中的用途。
本发明进一步提供了第二融合蛋白或编码第二融合蛋白的核酸在使用RNA引导的核酸内切酶转化非动物有机体或细胞中的用途。
本发明还提供了第一融合蛋白或编码第一融合蛋白的核酸与第二融合蛋白、第三融合蛋白和第四融合蛋白协同作用在使用RNA引导的核酸内切酶转化非动物有机体或细胞中的用途。
本发明提供了第一融合蛋白或编码第一融合蛋白的核酸与第二融合蛋白、第三融合蛋白、第四融合蛋白和第五融合蛋白协同作用在使用RNA引导的核酸内切酶转化非动物有机体或细胞中的用途。
本发明提供了第一融合蛋白或编码第一融合蛋白的核酸与依赖于所需基因修饰的任何融合蛋白(第二、第三、第四和/或第五融合蛋白)组合在使用RNA引导的核酸内切酶的转化非动物有机体或细胞中的用途。
本发明进一步提供了包含本发明核酸的载体。此类载体可适合于体外或体内修饰以及选择修饰的克隆和植物。
能够表达本发明的核苷酸上所编码的产物的本发明的载体也适合在宿主细胞或无细胞系统中表达。合适地,宿主细胞可以是培养的植物细胞、酵母细胞或细菌细胞,例如大肠杆菌(Escherichia coli)。本发明的组合物和产物可以通过包括在合适的宿主细胞或无细胞系统中表达这种编码产物的方法获得。
本发明还提供了本文公开的方法、试剂和组合物用于治疗非动物有机体中的疾病。
本发明还提供了本文公开的方法、试剂和组合物用于将所需的遗传特性引入非动物有机体或改善或去除这些生物有机体中不希望的遗传学特性的用途。
本发明还提供本文公开的方法、试剂和组合物用于将所需的可遗传特性引入非动物有机体或改善或去除不希望的可遗传特性的用途。
因此,本发明还提供了非动物转基因有机体,其转基因细胞和转基因非动物细胞系。还提供了包括根据本发明的转基因细胞的有机体。
本发明进一步提供了通过利用本文公开的方法、试剂和组合物来治疗非动物有机体或细胞的疾病或其他症状的方法。
现在参考附图以特定实施例说明本发明,其中:
图1示出了用Cas9蛋白(Cas9)诱导DNA双链断裂并用exo1切除DNA DSB的示意图。exo1-MS2融合蛋白被工程化,使其通过sgRNA上的适配子环与单向导RNA(sgRNA)结合,该sgRNA与MS2结构域(SEQ ID NO:22的一部分)结合。
图2示出了cas9-Rep(病毒复制相关蛋白)融合蛋白(SEQ ID NO:14)和exo1-MS2融合蛋白的示意图,显示了exo1-MS2融合蛋白与适配子环(SEQ ID NO:19)的结合。还显示了展示cas9-Rep融合蛋白活性的电泳凝胶,以及与Rep基因融合的其他核酸酶的实例。
图3示出了带有来自不同噬菌体(MS2、PP7和P22噬菌体;SEQ ID NO:19-21)的发夹的多茎环sgRNA的设计。
图4示出了烟草叶片的示例,其中修复了具有两碱基对移码突变(SEQ ID NO:2)的uidA。根据McCabe等人(Nature Biotechnology,1988,6,923-926)所述,测定转基因株系的GUS活性。蓝色表示已修复uidA基因突变;蓝色的程度表示修复的程度。
图5示出了一种载体,其含有在35S启动子(SEQ ID NO:1)下来自大肠杆菌的突变的uidA基因(SEQ ID NO:2),该载体用于烟草的稳定转化和随后利用稳定转化的烟草株系进行基因编辑。
图6示出了一种载体,该载体用于在烟草ALG492稳定的转基因株系中递送用于修复uidA(SEQ ID NO:4)的供体分子以及诱变来自烟草的PPOX1基因以诱导除草剂抗性。BOR1和BOR2表示来自甜菜曲顶病毒(BCTV)(SEQ ID NO:7)的病毒复制起点。“uidA供体”包含修复PAM三联体中2bp缺失的序列。“PPOX1 Nt供体”表示在内源性烟草PPOX1基因(SEQ ID NO:5)中产生突变的序列,以诱导对氟硝草醚或氟丙嘧草酯除草剂产生除草剂抗性。设计了两个引入除草剂抗性的突变:S136L和W437M。修饰了PAM三联体,以防止供体被cas9切割。
图7(a)示出了sgRNA的设计,用于将蛋白质精确靶向双链DNA断裂。将来自噬菌体MS2(SEQ ID NO:19)的两个茎环引入sgRNA。图7(b)示出了FVLW载体,其含有cas9(SEQ IDNO:8)盒和Rep-BCTV(SEQ ID NO:7)盒,用于植物中的表达。该构建体还具有带有uidA基因的向导的sgRNAs(SEQ ID NO:10),和带有靶向烟草PPOX1基因的向导的另外两个sgRNAs(SEQ ID NO:10和11)。拟南芥U6A启动子(SEQ ID NO:9)用于表达含有基因特异性向导的sgRNAs和具有两个MS2环(SEQ ID NO:19)的sgRNAs。
图8示出了FVLN载体,其含有与Rep-BCTV(SEQ ID NO:7)翻译性融合的cas9基因(SEQ ID NO:8),产生了cas9-B-rep融合基因(SEQ ID NO:14)。该构建体还具有三个分别带有uidA和烟草PPOX1基因的向导的sgRNAs(SEQ ID NO:9-11)。拟南芥U6A启动子(SEQ IDNO:9)用于表达含有基因特异性向导的sgRNAs和具有两个MS2环(SEQ ID NO:19)的sgRNAs。
图9示出了FLVS载体,其包含具有与Rep-BCTV(SEQ ID NO:7)翻译性融合的cas9基因(SEQ ID NO:8)的盒,从而产生cas9-B-rep的融合基因(SEQ ID NO:14),以及包含带有MS2-exoI融合蛋白(SEQ ID NO 19和15)的盒。该构建体还具有三个分别带有uidA和烟草PPOX1基因的向导的sgRNAs(SEQ ID NO:9-11)。拟南芥U6A启动子(SEQ ID NO:9)用于表达包含基因特异性向导的sgRNAs和具有两个MS2环(SEQ ID NO:19)的sgRNAs。
图10示出了用于将修饰引入所需的基因组位点(SEQ ID NO:29)的选择供体载体。
图11示出了用于将nptII基因插入烟草ALS和PPOX1位点中的载体(实施例2)。
图12示出了在烟草PDS基因中引入敲除突变的载体(实施例3)。
图13(a)示出了使用失效的Cas9结合霍利迪连接体解离酶在烟草PDS基因中产生敲除突变体的载体(实施例4)。图13(b)示出了与Rep基因融合的其他DNA结合结构域的实例。
实施例1将2bp插入烟草基因组基因。
为了评估在烟草中基因靶向的效率,制备了一套用于靶向大肠杆菌外源uidA基因的构建体。
通过渗透进行转化(参见下面的方法)
在大肠杆菌的uidA基因(SEQ ID NO:2)中引入了两个碱基对的缺失。将经修饰的uidA基因在带有nos终止子(SEQ ID NO:3)的花椰菜花叶病毒(CMV)35S启动子(SEQ ID NO:1)下引入烟草中(ALG 492,图5)。根据McCabe等人(Nature Biotechnology,1988,6,923-926)所述,测定转基因株系的GUS活性。由于uidA基因开放阅读框的移码,在转基因株系中未检测到GUS活性。
然后将携带突变的uidA基因的烟草植物与修复供体和构建体共转化,该修复供体包含SEQ ID NO:4作为构建体FVLR(图6)的一部分,所述构建体表达(i)Cas9(构建体FVLW;图7b),(ii)Cas9-Rep融合蛋白(构建体FVLN;图8)(SEQ ID NO:14)或(iii)旨在与sgRNA结合的Cas9-Rep融合蛋白(构建体FVLS;图9)(SEQ ID NO:14)和exo1-MS2融合蛋白,所述sgRNA反过来与cas9结合。评估了随后产生的植物的GUS活性。使用我们的基因靶向系统,蓝色区域确认了植物中uidA基因的修复(图4)。部分蓝色表示转化,产生了嵌合植物。完全蓝色表示完全或基本上完全转化的植物。这些实验的结果列于表1。
表格1
这些结果表明,Cas9-Rep融合介导的基因编辑(实验(ii))比单独使用cas9的对照实验更有效。
这些结果还表明,与单独使用cas9的对照实验或单独使用Cas9-Rep融合蛋白的实验(ii)相比,由旨在与Cas9-sgRNA复合体结合的Cas9-Rep融合蛋白和exo1-MS2融合蛋白介导的基因编辑(实验(iii))更有效。
实施例2将DNA片段插入烟草基因组的所需位点。
将长DNA序列插入双链断裂代表了针对不同有机体的基因组修饰的挑战。在这里,我们提出了使用本发明的分子组合提高对烟草基因组的插入效率的方法。
实验选择了两个目标,即乙酰乳酸合酶(ALS)基因和原卟啉原氧化酶1(PPOX1)基因。使用nptII基因(SEQ ID NO:32)的翻译融合,设计了两个载体,用于插入到ALS(SEQ IDNO:30)基因和PPOX1(SEQ ID NO:31)基因的末端(图11)。左翼序列(LRF)进行了特定的突变修饰,以产生ALS的氯磺隆除草剂抗性和PPOX1基因的氟氟草醚除草剂抗性,该左翼序列(LRF)与nptII基因翻译融合。右侧侧翼序列(RFS)用位点的非编码区表示。sgRNA是为ALS基因(SEQ ID NO:33)和PPOX1基因(SEQ ID NO:34)而设计的。
使用农杆菌介导的方法,用构建体FTTA和AVPP插入ALS位点,将FTTB和AVPR插入PPOX1位点,转化烟草植物(图11)。在卡那霉素选择培养基上每次转化产生十个株系,并用相应的除草剂处理所产生的株系。十分之二的植物对氯磺隆(ALS位点)具有抗性,十分之四的株系对氟氟草醚(PPOX1位点)具有抗性。PCR和测序分析已确认nptII基因已插入设计的位点中。因此,本发明允许同时引入突变和插入。
实施例3.在烟草基因组中产生敲除突变。
CRISPR/cas9系统被广泛用于产生敲除突变。然而,此类突变是不可控制的,因为非同源性末端接合(NHEJ)会在断裂位点引起核苷酸的各种插入或缺失。这种插入或缺失事件称为“indels”。
本发明提供了一种在所需靶标中产生终止密码子并使用选择供体载体选择细胞/克隆/植物的方法。如果需要的话,选择供体载体还可被设计用于精确缺失和插入,以引入敲除突变。
如Wang等人(2010)(doi:10.1016/j.envexpbot.2009.09.007)所示,选择了一种烟草八氢番茄红素脱氢酶(PDS)基因,将不成熟的终止密码子引入其中一个基因外显子中,以引起白化病植物的再生。
设计供体DNA片段(SEQ ID NO:35),其在PDS外显子中具有不成熟的终止密码子,并被引入在具有nptII基因的翻译框架中的选择供体载体中(图10)。设计相应的sgRNA(SEQID NO:36),用于在位点中产生DSB。
用构建体FVTX和AVPS(图12)进行农杆菌介导的烟草转化,并在补充卡那霉素的培养基上再生植物。
实施例4.使用选择供体载体和霍利迪连接体解离酶在烟草基因组中产生敲除突变而不引入双链DNA断裂。
我们制备了cas9-Rep的突变形式(SEQ ID NO:37),其中两个核酸酶活性位点都被去除,产生了所谓的失活cas9核酸酶(dCas9-Rep)。尽管去除了核酸酶活性,但dCas9-Rep仍与sgRNA结合并识别靶标。当Rep基因与dCas9融合时,与Rep共价连接的供体DNA分子仍被连接在靶标上,并可以与靶标进行退火形成霍利迪连接体。内源解旋酶抑制了供体DNA与靶标的这种退火和霍利迪连接体的形成。为了促进供体DNA退火后目标位点的霍利迪连接体的快速分离,我们使用整合到sgRNA中的MS2茎环,将AVPT载体与噬菌体T4的解离酶(T4核酸外切酶VII(T4E7)),或AVPU载体与融合到MS2外壳蛋白的拟南芥AtGEN1解离酶共同递送到靶位点(图13)。如实施例3中所述,将选择供体载体FVTX设计为将终止密码子引入烟草PDS基因。噬菌体解离酶和拟南芥解离酶均与选择供体载体结合促进了突变植物的回收。
转化方法–渗透
用农杆菌菌株AGL1转化烟叶片外植体
使用前,所有物品均经过高压灭菌。对抗生素进行过滤消毒,防止真菌生长,将用于植物组织培养的抗生素保存在单独的盒子里。
对植物材料消毒:取约9厘米高的尚未开始开花的植物。切下具有表皮的叶片(每个构造体4-6片叶子,切下100个外植体足以),浸入70%的乙醇中并立即浸入1%的次氯酸钠(因为含氯气体蒸发,需要使用一瓶3个月内的漂白剂),用镊子夹住叶片并搅拌20分钟。避免损坏表皮,否则漂白剂会进入脉管系统。在无菌水中短暂漂洗5-6次,并保留在水中直至准备切开。
农杆菌与烟草外植体的共培养:将AGL1在具有适当的抗生素的LB或L液体培养基中在28-30℃下培养过夜,第二天将农杆菌重悬浮于共培养溶液中,以使最终浓度的OD6oonm约为0.4-0.6。将烟草叶片放在共培养液体培养基中,并用圆形无菌手术刀滚动切成1-1.5cm×1-1.5cm的正方形。用无菌镊子将叶片外植体浸入农杆菌溶液中(储存在100%乙醇中,在接触叶片组织之前先进行火烧然后冷却),然后在无菌滤纸上印迹,并在非选择性TSM板上转移(每板6个外植体;每个构建体需要准备约15个平板)。对每个构建体重复此过程,确保将手术刀和镊子浸入乙醇中并在每个构建体之间进行火烧,以防止交叉污染。AGL1仅保留2天(其他农杆菌菌株保留3-4天)。
在选择性TSM板上转移:使用无菌火烧的镊子在100ml补充有特美汀320mg/l的共培养液体培养基(每个构建体一份)中取出并洗涤外植体,摇匀,在无菌滤纸上吸干,然后将洗涤后的外植体置于选择性TSM板上,该TSM板添加有适当的选择性抗生素和特美汀320mg/l以杀死农杆菌。
嫩芽再生:大约需要1个月才能看到嫩芽出现,每10-14天应将外植体转移到新鲜的平板上。当特美汀不足以杀死土壤杆菌时,应提防AGL1的反复生长,加入250mg/l头孢噻肟。
根再生:大约需要1周。从外植体上切下芽,将其置入含有TRM的生长箱中,该TRM补充有适当的选择性抗生素和特美汀320mg/l+头孢噻肟250mg/l,以防止农杆菌的反复生长。将植物保存在TRM的生长箱中:每两周将它们分类一次,直到准备转移到温室中为止。
适应温室条件:将泥炭颗粒浸泡在无菌水中直至膨胀至正常大小,并小心地将每个颗粒种植一株植物,在繁殖器中于100%湿度条件下孵育植物,逐渐打开小窗户直到植物可以适应正常大气压几天。
根据McCabe等人(Nature Biotechnology,1988,6,923-926)的描述,测定转基因植物的GUS活性。
试剂:
–共培养:含维生素和MES+0.1mg/1 NAA+1mg/1 BA+3%蔗糖的MS,pH 5.7
–TSM:含维生素和MES+0.1mg/1 NAA+1mg/1 BA+3%蔗糖的MS,pH5.7,0.2%凝胶
–TRM:含维生素和MES+0.5%蔗糖的^MS盐,pH5.7,0.2%凝胶。
高压灭菌器。
农杆菌LB或L培养物的抗生素浓度:
–要生长携带pGreen/pSOUP的AGL1:羧苄青霉素100mg/1、四环素5mg/ml、利福平50mg/ml、卡那霉素50mg/ml,携带pSOUP的AGL1:羧苄青霉素100mg/1、四环素5mg/ml、利福平50mg/ml。空的AGL1:羧苄青霉素100mg/1、利福平50mg/ml。
用于植物培养的抗生素浓度:
–卡那霉素:300mg/l(如果使用本氏菌,则为100mg/1),潮霉素:30mg/l(如果使用本氏菌,则为10mg/1),PPT:20mg/l(如果使用本氏菌,则为2mg/l)
–特美汀:320mg/l。用于杀死农杆菌,相当不稳定,补足少量原料,在冰箱中保存长达1个月(此后抗生素不再有效)。头孢噻肟:250mg/l。也可用于杀死农杆菌,添加到TS中。
核苷酸序列
35S启动子(SEQ ID NO:1)
ggaattccaatcccacaaaaatctgagcttaacagcacagttgctcctctcagagcagaatcgggtattcaacaccctcatatcaactactacgttgtgtataacggtccacatgccggtatatacgatgactggggttgtacaaaggcggcaacaaacggcgttcccggagttgcacacaagaaatttgccactattacagaggcaagagcagcagctgacgcgtacacaacaagtcagcaaacagacaggttgaacttcatccccaaaggagaagctcaactcaagcccaagagctttgctaaggccctaacaagcccaccaaagcaaaaagcccactggctcacgctaggaaccaaaaggcccagcagtgatccagccccaaaagagatctcctttgccccggagattacaatggacgatttcctctatctttacgatctaggaaggaagttcgaaggtgaagtagacgacactatgttcaccactgataatgagaaggttagcctcttcaatttcagaaagaatgctgacccacagatggttagagaggcctacgcagcaggtctcatcaagacgatctacccgagtaacaatctccaggagatcaaataccttcccaagaaggttaaagatgcagtcaaaagattcaggactaattgcatcaagaacacagagaaagacatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgcttcataaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcctactgaatctaaggccatgcatggagtctaagattcaaatcgaggatctaacagaactcgccgtgaagactggcgaacagttcatacagagtcttttacgactcaatgacaagaagaaaatcttcgtcaacatggtggagcacgacactctggtctactccaaaaatgtcaaagatacagtctcagaagaccaaagggctattgagacttttcaacaaaggataatttcgggaaacctcctcggattccattgcccagctatctgtcacttcatcgaaaggacagtagaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggctatcattcaagatctctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgacatctccactgacgtaagggatgacgcacaatcccactatccttcgcaagacccttcctctatataaggaagttcatttcatttggagaggacacgctcgagtataagagctcatttttacaacaattaccaacaacaacaaacaacaaacaacattacaattacatttacaattatcgata
具有2bp缺失的uidA基因(SEQ ID NO:2)
atgttacgtcctgtagaaaccccaacccgtgaaatcaaaaaactcgacggcctgtgggcattcagtctggatcgcgaaaactgtggaattgatcagcgttggtgggaaagcgcgttacaagaaagccgggcaattgctgtgccaggcagttttaacgatcagttcgccgatgcagatattcgtaattatgcgggcaacgtctggtatcagcgcgaagtctttataccgaaaggttgggcaggccagcgtatcgtgctgcgtttcgatgcggtcactcattacggcaaagtgtgggtcaataatcaggaagtgatggagcatcagggcggctatacgccatttgaagccgatgtcacgccgtatgttattgccgggaaaagtacgtatcaccgtttgtgtgaacaacgaactgaactggcagactatcccgccgggaatggtgattaccgacgaaaacggcaagaaaaagcagtcttacttccatgatttctttaactatgccgcgatccatcgcagcgtaatgctctacaccacgccgaacacctgggtggacgatatcaccgtggtgacgcatgtcgcgcaagactgtaaccacgcgtctgttgactggcaggtggtggccaatggtgatgtcagcgttgaactgcgtgatgcggatcaacaggtggttgcaactggacaaggcactagcgggactttgcaagtggtgaatccgcacctctggcaaccgggtgaaggttatctctatgaactgtgcgtcacagccaaaagccagacagagtgtgatatctacccgcttcgcgtcggcatccggtcagtggcagtgaagggcgaacagttcctgattaaccacaaaccgttctactttactggctttggtcgtcatgaagatgcggacttacgtggcaaaggattcgataacgtgctgatggtgcacgaccacgcattaatggactggattggggccaactcctaccgtacctcgcattacccttacgctgaagagatgctcgactgggcagatgaacatggcatcgtggtgattgatgaaactgctgctgtcggctttaacctctctttaggcattggtttcgaagcgggcaacaagccgaaagaactgtacagcgaagaggcagtcaacggggaaactcagcaagcgcacttacaggcgattaaagagctgatagcgcgtgacaaaaaccacccaagcgtggtgatgtggagtattgccaacgaaccggatacccgtccgcaagtgcacgggaatatttcgccactggcggaagcaacgcgtaaactcgacccgacgcgtccgatcacctgcgtcaatgtaatgttctgcgacgctcacaccgataccatcagcgatctctttgatgtgctgtgcctgaaccgttattacggatggtatgtccaaagcggcgatttggaaacggcagagaaggtactggaaaaagaacttctggcctggcaggagaaactgcatcagccgattatcatcaccgaatacggcgtggatacgttagccgggctgcactcaatgtacaccgacatgtggagtgaagagtatcagtgtgcatggctggatatgtatcaccgcgtctttgatcgcgtcagcgccgtcgtcggtgaacaggtatggaatttcgccgattttgcgacctcgcaaggcatattgcgcgttggcggtaacaagaaagggatcttcactcgcgaccgcaaaccgaagtcggcggcttttctgctgcaaaaacgctggactggcatgaacttcggtgaaaaaccgcagcagggaggcaaacaatga
nos终止子(SEQ ID NO:3)
gtcgaagcagatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggtttttatgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatcgac
uidA供体(SEQ ID NO:4)
cgtcctgtagaaaccccaacccgtgaaatcaaaaaactcgacggcctgtgggcattcagtctggatcgcgaaaactgtggaattgatcagcgttggtgggaaagcgcgttacaagaaagccgggcaattgctgtgccaggcagttttaacgatcagttcgccgatgcagatattcgtaattatgcgggcaacgtctggtatcagcgcgaagtctttataccgaaaggttgggcaggccagcgtatcgtgctgcgtttcgatgcggtcactcattacggcaaagtgtgggtcaataatcaggaagtgatggagcatcagggcggctatacgccatttgaagccgatgtcacgccgtatgttattgccgggaaaagtgtacgtatcactgtttgtgtgaacaacgaactgaactggcagactatcccgccgggaatggtgattaccgacgaaaacggcaagaaaaagcagtcttacttccatgatttctttaactatgccggaatccatcgcagcgtaatgctctacaccacgccgaacacctgggtggacgatatcaccgtggtgacgcatgtcgcgcaagactgtaaccacgcgtctgttgactggcaggtggtggccaatggtgatgtcagcgttgaactgcgtgatgcggatcaacaggtggttgcaactggacaaggcactagcgggactttgcaagtggtgaatccgcacctctggcaaccgggtgaaggttatctctatgaactgtgcgtcacagccaaaagccagacagagtgtgatatctacccgcttcgcgtcggcatccggtcagtggcagtgaagggcgaacagttcctgattaaccacaaaccgttctactttactggctttggtcgtcatgaagatgcggacttgcgtggcaaaggattcgataacgtgctgatggtgcacgaccacgcattaatggactggattggggccaactcctaccgtacctcgcattacccttacgctgaagagatgctcgactgggcagatgaacatggcatcgtggtgattgatgaaactgctgctgtcggctttaacctctctttaggcattggtttcgaagcgggcaacaagccgaaagaactgtacagcgaagaggcagtcaacggggaaactcagcaagcgcacttacaggcgattaaagagctgatagcgcgtgacaaaaaccacccaagcgtggtgatgtggagtattgccaacgaaccggatacccgtccgcaaggtgcacgggaatatttcgcgccactggcggaagcaacgcgtaaactcgacccgacgcgtccgatcacctgcgtcaatgtaatgttctgcgacgctcacaccgataccatcagcgatctctttgatgtgctgtgcctgaaccgttattacggatggtatgtccaaagcggcgatttggaaacggcagagaaggtactggaaaaagaacttctggcctggcaggagaaactgcatcagccgattatcatcaccga
烟草PPOX1供体(SEQ ID NO:5)
tgctgccggatgcaatcagtgcaaggtgcccttctcctttcccagttcaatgtctccaccccactcccacccccagtataaaaattcaggggggaaaaagagaagaaaaatatcaaaatttaaggactagttaaagttcagttttggcattttttctgcctaagtgcaatattatcaaaggtgaaaagcgcaaaaaagctctaaagtctattggggctttaagcgcaaagcgcaaataaagcatgggctttaatgcagaaaggctcaaatgaaaatgaaaagaaaaagaaaactacaaatatgtatgtatagtccaagactaatatctataagcatgaataccaaatatatggacaaagacattgaagaaactttattataaagtgaaatatcaattgtttagcatcgcctcttcaggattacgcttattggcaaggaaaagtatgcttttagagccttgatgacaacgctgaagcgcccgctaagcgaggcaaagcgctcaacatgttttgagcctcgcttcagggcttaagcgttatcaaagtgtgttctttggtgcccttgttcaagcagttctctagtatttttaccttggctccaccccactcccaccccctgtataaacgtttagggggggaaaagaaagagaagaaaaattatcaaaagttaagaaagctaagttttggcttttttctgctaggtgtgttctttggtgctcttgttcaagcagttctctagtatttttaccttggaaatgctaataagttgtcgccgtgtttccttagattgggaagcaaattaaaactatcatggaagcttcttagcattactaagtcagaaaaagcaggatatcgcttgacatacgagacaccagaaggagtagtttctcttcaaagtcgaagcattgtcatgactgtgccatcctatgtagcaagcaacatattacgtcctctttcggtgtgtttccattactgtttgctccaaagtcgttattgctattgttcatttggcactctaatatagaaacttggataaaaaaggggatcctttaatttttctttttcatttggactaggaaaagcggctcaaacacatgtataacagtcatatactgtgtataatatgtgtatgcaatataatgtgcagagaaagacttatcggagagaagagaattaaaaaaaagaacatttgtgtcacacggagaattaacatgtacatgcttaatgaggtcaagagcgcaaccgtatcccacccctcatgaaagattgaacctgtatctcatgttattgtgagcttttttcatatataaatttatgagcaattttctttaaatgctttgaccttggatttttcgaaggttactacttctgataattgctttgcaagaaatgcggctcacttaaaatgggaaacgtttatctataggttgtggttcagcttcttctgtttcttgctaaagcaagatgtctcctaaacttatattaaactcaggttgccgcagcagatgcactttcaaatttctactatcccccagttggagcagtcacaatttcatatcctcaagaagctattcgtgatgaacgtctggttgatggtgaactaaagggatttgggcagttgcatccacgtacacagggagtggaaacactaggtagctttctgtttgaaggattcactctaattttaacttcaagaatccatattgaagatggaaaacttttattacgacaattgcaagatgcaactcactgaagtagcattcctctattgcatctgcaggaataatatatagcgtatcagtcttccctgaccatcattacctagaaattttgacagtaccatgcaaatcgaagatgaatgagttcagaacaataacatcaggatttgattcatcttaaatataatacttgcgtttcatatgcaggaacgatatatagttcatcactcttccctaaccgtgccccaaaaggtcgggtgctactcttgaacatgattgcaggagcaaaaaatccggaaattttgtctaaggtaaggcatttaaattgagcgcaacttcaagtcctgccggtattgatttatcataatgaatattcatgggctggccagttggggcatcgcttgaaggttcctatggtaacaaacagaaaactgagaatgaccttatcccctgatctcttttggttgcaaatacgttaaccttgcagtgatgaggagaatgttttcagtgttattttctctagattaatggcgtagttggtttggattacaaaaccgtttaggcttatatgtgattagagtctccaggtttttgatctagcagtaagagcaaaatgtgtgatgttttaaaaaaacagtcaagtgattacaaatactcagaatagtttcaccataaagaactaaagagctaagaagattgtggtttctctttcctctatgttcgactgcattttgtgggttttccatagcatgactttcttttatggtacttgtacgaaagcatttcgctgttattctttatgcttcagggcctagaataaattgctttgagatttgatccctcattcttcttgcagacggagagccaacttgtggaagtagttgatcgtgacctcagaaaaatgcttatagaacccaaagcacaagatccccttgttgtgggtgtgcgagtatggccac
来自甜菜曲顶病毒(BCTV)的复制起点(BOR)(SEQ ID NO:6)
tcctgtactccgatgacgtggcttagcatattaacatatctattggagtattggagtattatatatattagtacaactttcataagggccatccgttataatattaccggatggcccgaaaaaaatgggcacccaatcaaaacgtgacacgtggaaggggactgttgaatgatgtgacgtttttgagcgggaaacttcctgaag
BCTV rep基因(SEQ ID NO:7)
atgcctcctactaaaagatttcgtattcaagcaaaaaacatatttcttacatatcctcagtgttctctttcaaaagaagaagctcttgagcaaattcaaagaatacaactttcatctaataaaaaatatattaaaattgccagagagctacacgaagatgggcaacctcatctccacgtcctgcttcaactcgaaggaaaagttcagatcacaaatatcagattattcgacctggtatccccaaccaggtcagcacatttccatccaaacattcagagagctaaatccagctccgacgtcaagtcctacgtagacaaggacggagacacaattgaatggggagaattccagatcgacggtagaagtgctagaggaggtcaacagacagctaacgactcatatgccaaggcgttaaacgcaacttctcttgaccaagcacttcaaatattgaaggaagaacaaccaaaggattacttccttcaacatcacaatcttttgaacaatgctcaaaagatatttcagaggccacctgatccatggactccactatttcctctgtcctcattcacaaacgttcctgaggaaatgcaagaatgggctgatgcatatttcggggttgatgccgctgcgcggcctttaagatataatagtatcatagtagagggtgattcaagaacagggaagactatgtgggctagatctttaggggcccacaattacatcacagggcacttagattttagccctagaacgtattatgatgaagtggaatacaacgtcattgatgacgtagatcccacttacttaaagatgaaacactggaaacaccttattggagcacaaaaggagtggcagacaaacttaaagtatggaaaaccacgtgtcattaaaggtggtatcccctgcattatattatgcaatccaggacctgagagctcataccaacaatttcttgaaaaaccagaaaatgaagcccttaagtcctggacattacataattcaaccttctgcaaactccaaggtccgctctttaataaccaagcagcagcatcctcgcaaggtgactctaccctgtaactgccacttcacaatacaccatgaatgtaatagaggattttcgcacaggggaacctattactctccatcaggcaacaaattccgtcgaattcgagaatgtaccgaatccactgtatatgaaactcctatggttcgagagatacgggccaatctatcaactgaagatacaaatcagattcaactacaacctccggagagcgttgaatcttcacaagtgctggatagagctgacgataactggatcgaacaggatattgactggaccccgtttcttgaaggtcttgaaaaagagactagagatatacttggataatctaggtttaatttgtattaataatgtaattagaggtttaaatcatgtcctgtatgaagaatttacttttgtatcaagtgtaattcagaaccagagtgttgcaatgaacttgtactaatttcattattaataataaatattattaataaaaatagcatctacaattgccaaataatgtggcatacatattagtattatccgtattatcattaacaacaacatagagtaaagcattctccttcacgtcttcatacttccc
cas9基因(SEQ ID NO:8)
atggacaagaagtacagcatcggcctggacatcggcacgaactcggtgggctgggcggtgatcacggacgagtacaaggtgccctccaagaagttcaaggtgctgggcaacaccgaccgccactcgatcaagaagaacctgatcggcgccctgctgttcgactccggcgagaccgccgaggcgacgcgcctgaagcgcaccgcgcgtcgccgctacacgcgtcgcaagaaccgcatctgctacctgcaggagatcttcagcaacgagatggccaaggtggacgactcgttcttccaccgcctggaggagtccttcctggtggaggaagacaagaagcacgagcgccaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtacccgacgatctaccacctgcgcaagaagctggtggacagcaccgacaaggcggacctgcgcctgatctacctggccctggcgcacatgatcaagttccgcggccacttcctgatcgagggcgacctgaaccccgacaactcggacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaacccgatcaacgcctccggcgtggacgccaaggcgatcctgagcgcgcgcctgtccaagagccgtcgcctggagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgatcgcgctgtcgctgggcctgacgccgaacttcaagtccaacttcgacctggccgaggacgcgaagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgcggacctgttcctggccgcgaagaacctgtcggacgccatcctgctgtccgacatcctgcgcgtgaacaccgagatcacgaaggcccccctgtcggcgtccatgatcaagcgctacgacgagcaccaccaggacctgaccctgctgaaggcgctggtgcgccagcagctgccggagaagtacaaggagatcttcttcgaccagagcaagaacggctacgccggctacatcgacggcggcgcgtcgcaagaggagttctacaagttcatcaagcccatcctggagaagatggacggcacggaggagctgctggtgaagctgaaccgcgaggacctgctgcgcaagcagcgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcacgccatcctgcgtcgccaagaggacttctacccgttcctgaaggacaaccgcgagaagatcgagaagatcctgacgttccgcatcccctactacgtgggcccgctggcccgcggcaacagccgcttcgcgtggatgacccgcaagtcggaggagaccatcacgccctggaacttcgaggaagtggtggacaagggcgccagcgcgcagtcgttcatcgagcgcatgaccaacttcgacaagaacctgcccaacgagaaggtgctgccgaagcactccctgctgtacgagtacttcaccgtgtacaacgagctgacgaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctgagcggcgagcagaagaaggcgatcgtggacctgctgttcaagaccaaccgcaaggtgacggtgaagcagctgaaagaggactacttcaagaagatcgagtgcttcgacagcgtggagatctcgggcgtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgacgctgttcgaggaccgcgagatgatcgaggagcgcctgaagacgtacgcccacctgttcgacgacaaggtgatgaagcagctgaagcgtcgccgctacaccggctggggccgcctgagccgcaagctgatcaacggcatccgcgacaagcagtccggcaagaccatcctggacttcctgaagagcgacggcttcgcgaaccgcaacttcatgcagctgatccacgacgactcgctgaccttcaaagaggacatccagaaggcccaggtgtcgggccagggcgactccctgcacgagcacatcgccaacctggcgggctcccccgcgatcaagaagggcatcctgcagaccgtgaaggtggtggacgagctggtgaaggtgatgggccgccacaagccggagaacatcgtgatcgagatggcccgcgagaaccagaccacgcagaagggccagaagaacagccgcgagcgcatgaagcgcatcgaggaaggcatcaaggagctgggctcgcagatcctgaaggagcaccccgtggagaacacccagctgcagaacgagaagctgtacctgtactacctgcagaacggccgcgacatgtacgtggaccaggagctggacatcaaccgcctgtccgactacgacgtggaccacatcgtgccccagagcttcctgaaggacgactcgatcgacaacaaggtgctgacccgcagcgacaagaaccgcggcaagagcgacaacgtgccgtcggaggaagtggtgaagaagatgaagaactactggcgccagctgctgaacgccaagctgatcacgcagcgcaagttcgacaacctgaccaaggccgagcgcggtggcctgtcggagctggacaaggcgggcttcatcaagcgccagctggtggagacccgccagatcacgaagcacgtggcgcagatcctggactcccgcatgaacacgaagtacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagtccaagctggtcagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaactaccaccacgcccacgacgcgtacctgaacgccgtggtgggcaccgcgctgatcaagaagtaccccaagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaagatgatcgccaagtcggagcaggagatcggcaaggccaccgcgaagtacttcttctactccaacatcatgaacttcttcaagaccgagatcacgctggccaacggcgagatccgcaagcgcccgctgatcgagaccaacggcgagacgggcgagatcgtgtgggacaagggccgcgacttcgcgaccgtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtgcagacgggcggcttctccaaggagagcatcctgccgaagcgcaactcggacaagctgatcgcccgcaagaaggactgggaccccaagaagtacggcggcttcgactccccgaccgtggcctacagcgtgctggtggtggcgaaggtggagaagggcaagtccaagaagctgaagagcgtgaaggagctgctgggcatcaccatcatggagcgcagctcgttcgagaagaaccccatcgacttcctggaggccaagggctacaaagaggtgaagaaggacctgatcatcaagctgccgaagtactcgctgttcgagctggagaacggccgcaagcgcatgctggcctccgcgggcgagctgcagaagggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggcgtcccactacgagaagctgaagggctcgccggaggacaacgagcagaagcagctgttcgtggagcagcacaagcactacctggacgagatcatcgagcagatctcggagttctccaagcgcgtgatcctggccgacgcgaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaagcccatccgcgagcaggcggagaacatcatccacctgttcaccctgacgaacctgggcgccccggccgcgttcaagtacttcgacaccacgatcgaccgcaagcgctacacctccacgaaagaggtgctggacgcgaccctgatccaccagagcatcaccggcctgtacgagacgcgcatcgacctgagccagctgggcggcgactcccgcgcggacccgaagaagaagcgcaaggtgtaa
拟南芥U6A启动子(SEQ ID NO:9)
catcttcattcttaagatatgaagataatcttcaaaaggcccctgggaatctgaaagaagagaagcaggcccatttatatgggaaagaacaatagtatttcttatataggcccatttaagttgaaaacaatcttcaaaagtcccacatcgcttagataagaaaacgaagctgagtttatatacagctagagtcgaagtagt
uidA基因的具有MS2适配子发夹的sgRNA2.0(SEQ ID NO:10)
cagttcgttgttcacacaagttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgcttttttttttt
烟草PPOX1基因的sgRNA2.0-1(SEQ ID NO:11)
attactaagtcagaaaagttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgcttttttttttt
烟草PPOX1基因的sgRNA2.0-2(SEQ ID NO:12)
tgctactcttgaactacatggttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgcttttttttttt
ags终止子(SEQ ID NO:13)
gaattaacagaggtggatggacagacccgttcttacaccggactgggcgcgggataggatattcagattgggatgggattgagcttaaagccggcgctgagaccatgctcaaggtaggcaatgtcctcagcgtcgagcccggcatctatgtcgagggcattggtggagcgcgcttcggggataccgtgcttgtaactgagaccggatatgaggccctcactccgcttgatcttggcaaagatatttgacgcatttattagtatgtgttaattttcatttgcagtgcagtattttctattcgatctttatgtaattcgttacaattaataaatattcaaatcagattattgactgtcatttgtatcaaatcgtgtttaatggatatttttattataatattgatgat
cas9-B-rep融合基因(SEQ ID NO:14)
atggacaagaagtacagcatcggcctggacatcggcacgaactcggtgggctgggcggtgatcacggacgagtacaaggtgccctccaagaagttcaaggtgctgggcaacaccgaccgccactcgatcaagaagaacctgatcggcgccctgctgttcgactccggcgagaccgccgaggcgacgcgcctgaagcgcaccgcgcgtcgccgctacacgcgtcgcaagaaccgcatctgctacctgcaggagatcttcagcaacgagatggccaaggtggacgactcgttcttccaccgcctggaggagtccttcctggtggaggaagacaagaagcacgagcgccaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtacccgacgatctaccacctgcgcaagaagctggtggacagcaccgacaaggcggacctgcgcctgatctacctggccctggcgcacatgatcaagttccgcggccacttcctgatcgagggcgacctgaaccccgacaactcggacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaacccgatcaacgcctccggcgtggacgccaaggcgatcctgagcgcgcgcctgtccaagagccgtcgcctggagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgatcgcgctgtcgctgggcctgacgccgaacttcaagtccaacttcgacctggccgaggacgcgaagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgcggacctgttcctggccgcgaagaacctgtcggacgccatcctgctgtccgacatcctgcgcgtgaacaccgagatcacgaaggcccccctgtcggcgtccatgatcaagcgctacgacgagcaccaccaggacctgaccctgctgaaggcgctggtgcgccagcagctgccggagaagtacaaggagatcttcttcgaccagagcaagaacggctacgccggctacatcgacggcggcgcgtcgcaagaggagttctacaagttcatcaagcccatcctggagaagatggacggcacggaggagctgctggtgaagctgaaccgcgaggacctgctgcgcaagcagcgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcacgccatcctgcgtcgccaagaggacttctacccgttcctgaaggacaaccgcgagaagatcgagaagatcctgacgttccgcatcccctactacgtgggcccgctggcccgcggcaacagccgcttcgcgtggatgacccgcaagtcggaggagaccatcacgccctggaacttcgaggaagtggtggacaagggcgccagcgcgcagtcgttcatcgagcgcatgaccaacttcgacaagaacctgcccaacgagaaggtgctgccgaagcactccctgctgtacgagtacttcaccgtgtacaacgagctgacgaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctgagcggcgagcagaagaaggcgatcgtggacctgctgttcaagaccaaccgcaaggtgacggtgaagcagctgaaagaggactacttcaagaagatcgagtgcttcgacagcgtggagatctcgggcgtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgacgctgttcgaggaccgcgagatgatcgaggagcgcctgaagacgtacgcccacctgttcgacgacaaggtgatgaagcagctgaagcgtcgccgctacaccggctggggccgcctgagccgcaagctgatcaacggcatccgcgacaagcagtccggcaagaccatcctggacttcctgaagagcgacggcttcgcgaaccgcaacttcatgcagctgatccacgacgactcgctgaccttcaaagaggacatccagaaggcccaggtgtcgggccagggcgactccctgcacgagcacatcgccaacctggcgggctcccccgcgatcaagaagggcatcctgcagaccgtgaaggtggtggacgagctggtgaaggtgatgggccgccacaagccggagaacatcgtgatcgagatggcccgcgagaaccagaccacgcagaagggccagaagaacagccgcgagcgcatgaagcgcatcgaggaaggcatcaaggagctgggctcgcagatcctgaaggagcaccccgtggagaacacccagctgcagaacgagaagctttacctgtactacctgcagaacggccgcgacatgtacgtggaccaggagctggacatcaaccgcctgtccgactacgacgtggaccacatcgtgccccagagcttcctgaaggacgactcgatcgacaacaaggtgctgacccgcagcgacaagaaccgcggcaagagcgacaacgtgccgtcggaggaagtggtgaagaagatgaagaactactggcgccagctgctgaacgccaagctgatcacgcagcgcaagttcgacaacctgaccaaggccgagcgcggtggcctgtcggagctggacaaggcgggcttcatcaagcgccagctggtggagacccgccagatcacgaagcacgtggcgcagatcctggactcccgcatgaacacgaagtacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagtccaagctggtcagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaactaccaccacgcccacgacgcgtacctgaacgccgtggtgggcaccgcgctgatcaagaagtaccccaagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaagatgatcgccaagtcggagcaggagatcggcaaggccaccgcgaagtacttcttctactccaacatcatgaacttcttcaagaccgagatcacgctggccaacggcgagatccgcaagcgcccgctgatcgagaccaacggcgagacgggcgagatcgtgtgggacaagggccgcgacttcgcgaccgtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtgcagacgggcggcttctccaaggagagcatcctgccgaagcgcaactcggacaagctgatcgcccgcaagaaggactgggaccccaagaagtacggcggcttcgactccccgaccgtggcctacagcgtgctggtggtggcgaaggtggagaagggcaagtccaagaagctgaagagcgtgaaggagctgctgggcatcaccatcatggagcgcagctcgttcgagaagaaccccatcgacttcctggaggccaagggctacaaagaggtgaagaaggacctgatcatcaagctgccgaagtactcgctgttcgagctggagaacggccgcaagcgcatgctggcctccgcgggcgagctgcagaagggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggcgtcccactacgagaagctgaagggctcgccggaggacaacgagcagaagcagctgttcgtggagcagcacaagcactacctggacgagatcatcgagcagatctcggagttctccaagcgcgtgatcctggccgacgcgaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaagcccatccgcgagcaggcggagaacatcatccacctgttcaccctgacgaacctgggcgccccggccgcgttcaagtacttcgacaccacgatcgaccgcaagcgctacacctccacgaaagaggtgctggacgcgaccctgatccaccagagcatcaccggcctgtacgagacgcgcatcgacctgagccagctgggcggcgactcccgcgcggacccgaagaagaagcgcaaggtgagcgctggaggaggtggaagcggaggaggaggaagcggaggaggaggtagcggatccatgcctcctactaaaagatttcgtattcaagcaaaaaacatatttcttacatatcctcagtgttctctttcaaaagaagaagctcttgagcaaattcaaagaatacaactttcatctaataaaaaatatattaaaattgccagagagctacacgaagatgggcaacctcatctccacgtcctgcttcaactcgaaggaaaagttcagatcacaaatatcagattattcgacctggtatccccaaccaggtaattttcatctttgtttggccttccaagtgctttttttgctgtttacgggtggaacttcagtaaaaatgggatcaaaacatcatatggcataaataaattttaagaatggcgaactcggggttaccgaatatggcttcctttttcagtgtttcttagtccattgtacttatgagattgcaggtcagcacatttccatccaaacattcagagagctaaatccagctccgacgtcaagtcctacgtagacaaggacggagacacaattgaatggggagaattccagatcgacggtagaagtgctagaggaggtcaacagacagctaacgactcatatgccaaggcgttaaacgcaacttctcttgaccaagcacttcaaatattgaaggaagaacaaccaaaggattacttccttcaacatcacaatcttttgaacaatgctcaaaagatatttcagaggccacctgatccatggactccactatttcctctgtcctcattcacaaacgttcctgaggaaatgcaagaatgggctgatgcatatttcggggttgatgccgctgcgcggcctttaagatataatagtatcatagtagagggtgattcaagaacagggaagactatgtgggctagatctttaggggcccacaattacatcacagggcacttagattttagccctagaacgtattatgatgaagtggaatacaacgtcattgatgacgtagatcccacttacttaaagatgaaacactggaaacaccttattggagcacaaaaggagtggcagacaaacttaaagtatggaaaaccacgtgtcattaaaggtggtatcccctgcattatattatgcaatccaggacctgagagcacataccaacaatttcttgaaaaaccagaaaatgaagcccttaagtcctggacattacataattcaaccttctgcaaactccaaggtccgctctttaataaccaagcagcagcatcctcgcaaggtgactctaccctgtaactgccacttcacaatacaccatgaatgtaatagaggattttcgcacaggggaacctattactctccatcaggcaacaaattccgtcgaattcgagaatgtaccgaatccactgtatatgaaactcctatggttcgagagatacgggccaatctatcaactgaagatacaaatcagattcaactacaacctccggagagcgttgaatcttcacaagtgctggatagagctgacgataactggatcgaacaggatattgactggaccccgtttcttgaaggtaagaaatcttttcccatcttgaagtcacctcaaaccgaacgttaggaaattccaaaatgttttgatagtagtctacttagtttcaagttttgggtttgtgtatactttcactaataatatgcgtggaaacattgcaggtcttgaaaaagagactagagatatacttggataatctaggtttaatttgtattaataatgtaattagaggtttaaatcatgtcctgtatgaagaatttacttttgtatcaagtgtaattcagaaccagagtgttgcaatgaacttgtactaa
来自噬菌体λ的exoI基因(SEQ ID NO:15)
atgacaccggacattatcctgcagcgtaccgggatcgatgtgagagctgtcgaacagggggatgatgcgtggcacaaattacggctcggcgtcatcaccgcttcagaagttcacaacgtgatagcaaaaccccgctccggaaagaagtggcctgacatgaaaatgtcctacttccacaccctgcttgctgaggtttgcaccggtgtggctccggaagttaacgctaaagcactggcctggggaaaacagtacgagaacgacgccagaaccctgtttgaattcacttccggcgtgaatgttactgaatccccgatcatctatcgcgacgaaagtatgcgtaccgcctgctctcccgatggtttatgcagtgacggcaacggccttgaactgaaatgcccgtttacctcccgggatttcatgaagttccggctcggtggtttcgaggccataaagtcagcttacatggcccaggtgcagtacagcatgtgggtgacgcgaaaaaatgcctggtactttgccaactatgacccgcgtatgaagcgtgaaggcctgcattatgtcgtgattgagcgggatgaaaagtacatggcgagttttgacgagatcgtgccggagttcatcgaaaaaatggacgaggcactggctgaaattggttttgtatttggggagcaatggcgatga
包含多个茎环的sgRNA(SEQ ID NO:16)
gttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaactttaaggagtttatatggaaacccttaaagtggcaccgagtcggtgctaccgccgacaacgcggttttttttttt
大肠杆菌recA基因的三重融合(SEQ ID NO:17)
atggacgagaacaagaagcgcgccctggccgcggccctgggacagatcgaacgccaattcggcaaaggcgcggtcatgcgcatgggcgaccatgagcgccaggcgatcccggccatctccaccggctccctgggtctggacatcgccctcggcatcggcggcctgcccaagggccggatcgtcgagatctacggtccggaatcctcgggcaagaccaccctgaccctctcggtgatcgccgaggcccagaaacagggcgccacctgtgccttcgtcgacgccgagcacgcgctcgatcccgactatgccggcaagctgggcgtcaacgtcgacgacctgctggtctcccagccggacaccggcgagcaggccctggaaatcaccgacatgctggtgcgctccaacgcggtcgacgtgatcatcgtcgactccgtggccgcgctggtacccaaggccgagatcgaaggcgagatgggcgacgcccacgtcggcctgcaggcacgcctgatgtcccaggcgctgcgcaagatcaccggcaatatcaagaacgccaactgcctggtcatcttcatcaaccagatccgcatgaagatcggcgtcatgttcggcaacccggaaaccaccaccggcggtaacgcactgaagttctacgcctcggtccgcctggacatccgtcgtaccggcgcggtgaaggaaggcgacgaggtggtgggtagcgaaacccgcgtcaaggtggtgaagaacaaggtttccccgccgttccgccaggccgagttccagatcctctacggtaagggcatctaccgtaccggcgagatcatcgatctgggcgtgcaattgggcctggtcgagaagtccggcgcctggtacagctaccagggcagcaagatcggccagggcaaggcgaacgccgccaagtacctggaagacaatccggaaatcggttcggtactggagaagaccattcgcgaccagttgctggccaagagcggcccggtgaaggccgacgccgaagaagtggctgacgccgaagccgattcagagctcggagaaggtcaaggacagggacaaggtccaggacgaggatacgcatataagcttgacgagaacaagaagcgcgccctggccgcggccctgggacagatcgaacgccaattcggcaaaggcgcggtcatgcgcatgggcgaccatgagcgccaggcgatcccggccatctccaccggctccctgggtctggacatcgccctcggcatcggcggcctgcccaagggccggatcgtcgagatctacggtccggaatcctcgggcaagaccaccctgaccctctcggtgatcgccgaggcccagaaacagggcgccacctgtgccttcgtcgacgccgagcacgcgctcgatcccgactatgccggcaagctgggcgtcaacgtcgacgacctgctggtctcccagccggacaccggcgagcaggccctggaaatcaccgacatgctggtgcgctccaacgcggtcgacgtgatcatcgtcgactccgtggccgcgctggtacccaaggccgagatcgaaggcgagatgggcgacgcccacgtcggcctgcaggcacgcctgatgtcccaggcgctgcgcaagatcaccggcaatatcaagaacgccaactgcctggtcatcttcatcaaccagatccgcatgaagatcggcgtcatgttcggcaacccggaaaccaccaccggcggtaacgcactgaagttctacgcctcggtccgcctggacatccgtcgtaccggcgcggtgaaggaaggcgacgaggtggtgggtagcgaaacccgcgtcaaggtggtgaagaacaaggtttccccgccgttccgccaggccgagttccagatcctctacggtaagggcatctaccgtaccggcgagatcatcgatctgggcgtgcaattgggcctggtcgagaagtccggcgcctggtacagctaccagggcagcaagatcggccagggcaaggcgaacgccgccaagtacctggaagacaatccggaaatcggttcggtactggagaagaccattcgcgaccagttgctggccaagagcggcccggtgaaggccgacgccgaagaagtggctgacgccgaagccgattcaggatccggagaaggtcaaggacagggacaaggtccaggacgaggatacgcatatgcatgcgacgagaacaagaagcgcgccctggccgcggccctgggacagatcgaacgccaattcggcaaaggcgcggtcatgcgcatgggcgaccatgagcgccaggcgatcccggccatctccaccggctccctgggtctggacatcgccctcggcatcggcggcctgcccaagggccggatcgtcgagatctacggtccggaatcctcgggcaagaccaccctgaccctctcggtgatcgccgaggcccagaaacagggcgccacctgtgccttcgtcgacgccgagcacgcgctcgatcccgactatgccggcaagctgggcgtcaacgtcgacgacctgctggtctcccagccggacaccggcgagcaggccctggaaatcaccgacatgctggtgcgctccaacgcggtcgacgtgatcatcgtcgactccgtggccgcgctggtacccaaggccgagatcgaaggcgagatgggcgacgcccacgtcggcctgcaggcacgcctgatgtcccaggcgctgcgcaagatcaccggcaatatcaagaacgccaactgcctggtcatcttcatcaaccagatccgcatgaagatcggcgtcatgttcggcaacccggaaaccaccaccggcggtaacgcactgaagttctacgcctcggtccgcctggacatccgtcgtaccggcgcggtgaaggaaggcgacgaggtggtgggtagcgaaacccgcgtcaaggtggtgaagaacaaggtttccccgccgttccgccaggccgagttccagatcctctacggtaagggcatctaccgtaccggcgagatcatcgatctgggcgtgcaattgggcctggtcgagaagtccggcgcctggtacagctaccagggcagcaagatcggccagggcaaggcgaacgccgccaagtacctggaagacaatccggaaatcggttcggtactggagaagaccattcgcgaccagttgctggccaagagcggcccggtgaaggccgacgccgaagaagtggctgacgccgaagccgattaa
拟南芥rad51基因的三重融合(SEQ ID NO:18)
atgacgacgatggagcagcgtagaaaccagaatgctgtccaacaacaagacgatgaagaaacccagcacggacctttccctgtcgaacagcttcaggcagcaggtattgcttctgttgatgtaaagaagcttagggatgctggtctctgtactgttgaaggtgttgcttatactccgaggaaggatctcttgcagattaaaggaattagtgatgccaaggttgacaagattgtagaagcagcttcaaagctagttcctctggggttcacaagtgcgagccagctccatgctcagagacaggaaattattcagattacctctggatcacgggagctcgataaagttctagaaggaggtattgaaactggttccatcacagagttatatggtgagttccgctctggaaagactcagctgtgccatacactgtgtgtgacttgtcaacttcccatggatcaaggaggtggagagggaaaggccatgtacattgatgctgagggaacattcaggccacaaagactcttacagatagctgacaggtttggattaaatggagctgatgtactagaaaacgttgcctatgcgagggcgtataatacagatcatcagtcaaggcttttgcttgaagcagcatcaatgatgattgaaacaaggtttgctctcctgattgtcgatagtgctaccgctctctacagaacagatttctctggaaggggagagctttcggctcgacaaatgcatcttgcaaagttcttgagaagtcttcagaagttagcagatgagtttggtgtggctgttgttataacaaaccaagtagttgcgcaagtagatggttcagctctttttgctggtccccaatttaagccgattggtgggaatatcatggctcatgccaccacaacaaggttggcgttgaggaaaggaagagcagaggagagaatctgtaaagtgataagctcgccatgtttgccagaagcggaagctcgatttcaaatatctacagaaggtgtaacagattgcaaggatgagctcggagaaggtcaaggacagggacaaggtccaggacgaggatacgcatataagcttatgacgacgatggagcagcgtagaaaccagaatgctgtccaacaacaagacgatgaagaaacccagcacggacctttccctgtcgaacagcttcaggcagcaggtattgcttctgttgatgtaaagaagcttagggatgctggtctctgtactgttgaaggtgttgcttatactccgaggaaggatctcttgcagattaaaggaattagtgatgccaaggttgacaagattgtagaagcagcttcaaagctagttcctctggggttcacaagtgcgagccagctccatgctcagagacaggaaattattcagattacctctggatcacgggagctcgataaagttctagaaggaggtattgaaactggttccatcacagagttatatggtgagttccgctctggaaagactcagctgtgccatacactgtgtgtgacttgtcaacttcccatggatcaaggaggtggagagggaaaggccatgtacattgatgctgagggaacattcaggccacaaagactcttacagatagctgacaggtttggattaaatggagctgatgtactagaaaacgttgcctatgcgagggcgtataatacagatcatcagtcaaggcttttgcttgaagcagcatcaatgatgattgaaacaaggtttgctctcctgattgtcgatagtgctaccgctctctacagaacagatttctctggaaggggagagctttcggctcgacaaatgcatcttgcaaagttcttgagaagtcttcagaagttagcagatgagtttggtgtggctgttgttataacaaaccaagtagttgcgcaagtagatggttcagctctttttgctggtccccaatttaagccgattggtgggaatatcatggctcatgccaccacaacaaggttggcgttgaggaaaggaagagcagaggagagaatctgtaaagtgataagctcgccatgtttgccagaagcggaagctcgatttcaaatatctacagaaggtgtaacagattgcaaggatggatccggagaaggtcaaggacagggacaaggtccaggacgaggatacgcatatgcatgcatgacgacgatggagcagcgtagaaaccagaatgctgtccaacaacaagacgatgaagaaacccagcacggacctttccctgtcgaacagcttcaggcagcaggtattgcttctgttgatgtaaagaagcttagggatgctggtctctgtactgttgaaggtgttgcttatactccgaggaaggatctcttgcagattaaaggaattagtgatgccaaggttgacaagattgtagaagcagcttcaaagctagttcctctggggttcacaagtgcgagccagctccatgctcagagacaggaaattattcagattacctctggatcacgggagctcgataaagttctagaaggaggtattgaaactggttccatcacagagttatatggtgagttccgctctggaaagactcagctgtgccatacactgtgtgtgacttgtcaacttcccatggatcaaggaggtggagagggaaaggccatgtacattgatgctgagggaacattcaggccacaaagactcttacagatagctgacaggtttggattaaatggagctgatgtactagaaaacgttgcctatgcgagggcgtataatacagatcatcagtcaaggcttttgcttgaagcagcatcaatgatgattgaaacaaggtttgctctcctgattgtcgatagtgctaccgctctctacagaacagatttctctggaaggggagagctttcggctcgacaaatgcatcttgcaaagttcttgagaagtcttcagaagttagcagatgagtttggtgtggctgttgttataacaaaccaagtagttgcgcaagtagatggttcagctctttttgctggtccccaatttaagccgattggtgggaatatcatggctcatgccaccacaacaaggttggcgttgaggaaaggaagagcagaggagagaatctgtaaagtgataagctcgccatgtttgccagaagcggaagctcgatttcaaatatctacagaaggtgtaacagattgcaaggattaactagtg
用于结合的衍生自MS2的茎环(SEQ ID NO:19)
ggccaacatgaggatcacccatgtctgcagggcc
用于结合的衍生自PP7的茎环(SEQ ID NO:20)
taaggagtttatatggaaaccctta
用于结合B-盒的衍生自P22的茎环(SEQ ID NO:21)
accgccgacaacgcggt
MS2噬菌体外壳蛋白(SEQ ID NO:22)
atggcttcaaactttactcagttcgtgctcgtggacaatggtgggacaggggatgtgacagtggctccttctaatttcgctaatggggtggcagagtggatcagctccaactcacggagccaggcctacaaggtgacatgcagcgtcaggcagtctagtgcccagaagagaaagtataccatcaaggtggaggtccccaaagtggctacccagacagtgggcggagtcgaactgcctgtcgccgcttggagatcctacctgaacatggaactcactatcccaattttcgctaccaattctgactgtgaactcatcgtgaaggcaatgcaggggctcctcaaagacggcaatcctatcccttccgccatcgccgctaactcaggca
PP7噬菌体外壳蛋白(SEQ ID NO:23)
atgtccaaaaccatcgttctttcggtcggcgaggctactcgcactctgactgagatccagtccaccgcagaccgtcagatcttcgaagagaaggtcgggcctctggtgggtcggctgcgcctcacggcttcgctccgtcaaaacggagccaagaccgcgtatcgagtcaacctaaaactggatcaggcggacgtcgttgattgctccaccagcgtctgcggcgagcttccgaaagtgcgctacactcaggtatggtcgcacgacgtgacaatcgttgcgaatagcaccgaggcctcgcgcaaatcgttgtacgatttgaccaagtccctcgtcgcgacctcgcaggtcgaagatcttgtcgtcaaccttgtgccgctgggccgttaa
P22噬菌体外壳蛋白(SEQ ID NO:24)
atgacggttatcacctacgggaagtcaacgtttgcaggcaatgctaaaactcgccgtcatgagcggcgcagaaagctagccatagagcgcgacaccatctgcaatatcatcgattcaatttttggctgcgatgctcctgatgcttctcaggaagttaaagccaaaagaattgaccgtgtcaccaaagccatttcgcttgccggaacgcgtcagaaggaagttgaaggaggatctgtacttcttccaggcgtagcactttacgcggctggtcatcgtaagagcaaacaaataacagcgaggtaa
MSH2显性阴性等位基因序列(SEQ ID NO:25)
atggctgggttaaggcaggatcttagacagcatctgaagcgaatctcagatgttgagaggcttttgcgcagtctcgagagaagaagaggtgggttacagcacattattaaactctatcaggtactttccgcacttcaatctgcttctctcaatgttaacaaaattgcattttcattgtcctaaatgtgtttatgcaactctgaagttataggtatgttattaagttcattactaattaagtcttcatcttttctctgcagtcagctataaggcttcccttcatcaaaacagctatgcaacagtacaccggagaattcgcatcactcatcagcgagaggtacctgaaaaagcttgaggctttatcagatcaagatcaccttggaaagttcatcgatttggttgagtgctctgtagatcttgaccagctagaaaatggagaatacatgatatcttcaaactacgacaccaaattggcatctctgaaagatcagaaagaattgctggagcagcagattcacgaattgcacaaaaagacagcgatagaacttgatcttcaggtcgacaaggctcttaaacttgacaaagcagcgcaatttgggcatgtcttcaggatcacgaagaaggaagagccaaagatcaggaagaagctgacgacacagtttatagtgctggagactcgcaaagacggagtgaagttcacaaacacaaagctaaaaaaactgggcgaccagtaccaaagtgttgtggatgattataggagctgtcaaaaggagctcgttgatcgtgtagttgagactgttaccagcttctctgaggtatgtttagttattcatattaagcattggactgttacagaattggttgtttaaaatcatagtaaactatatgtggaatttatatgtatattgtatggttataggtatttgaggacttagctgggttactttctgaaatggatgttttgttaagctttgctgatttggctgccagttgccctactccatactgtaggccagaaatcacctctttggttagtacaatctcaagttgattattttgttctgaaaatgaatagttttttctttccaagtttatgacataatgttgagagcacggttaataaattgtaggatgctggagatattgtactagaaggaagcagacatccatgtgtagaagctcaagattgggtgaatttcataccaaatgattgcagactcgtaagtattgaatgtggtaaataaactgagacgtctttgtttttcttgtttcccttttgacttgaacaaatacttgtttgccctttactgttctttgaaatcagatgagagggaagagttggtttcaaatagtaacagggcctaacatgggagataagtccactttcatccgccaggtatgatgatttcctctagttcagttttgcttcatagacgtatgactaaagtcggtttccggccattataaatcccaggttggtgtgattgtgctgatggctcaagttggttcctttgttccttgtgataaagcatcaatttccataagagactgcatctttgcccgtgtaggagcaggcgattgccaagtgagtttaagtttagccctcaatgaacgaaaaactgctgatatcctgaacacccttattccaactttttttcctttggtgtgttagctgcgtggagtgtcaacttttatgcaagaaatgcttgaaaccgcatcgatattgaaaggcgctactgataagtcactgataattatcgatgaacttggtcgtggaacatcaacttatgatggttttggttagtttctctgcaatttctcttctttcatttggatgtttttagtaagttttctattatatattcatttttatggtcatatgtgagatttcagtgctcttgacatcatcgtggtgaatatatcaggtttagcttgggctatatgtgagcatctggttcaagtgaaaagagcaccaactctgtttgctactcacttccatgaacttactgccttggctcaagcaaactctgaggtctctggtaacactgttggtgtggcaaacttccatgtcagcgctcacattgacactgaaagccgcaaactcaccatgctttacaaggtctggtttataaattaaaaaattgctgatctgttgcagttaaaagtgtctctgtttttatgtttaatctaaattacttatttgattttcttacaaagatgaaattgaaattaattttgtgtggtgtgttgtttgtctggttaggttgaaccaggggcctgtgaccagagctttgggattcatgtggcggaatttgccaacttccctgaaagcgtcgtggccctcgcaagagagaaagctgcagagctggaagatttctctccctcctcgatgataatcaacaatgaggtcttgattcatttccccctttgtttttggttgatgatggaatcattctatcattcacccattctgcagtttatgctatattattataaatctatgtgacaaagatttaattctcgtattgttgtttgcaggagagtgggaagagaaagagcagagaagatgatccagatgaagtatcaagaggggcagagcgagctcacaagtttctgaaagagtttgcagcgatgccacttgataaaatggagcttaaagattcacttcaacgggtacgtgagatgaaagatgagctagagaaagatgctgcagactgccactggctcaggcagtttctgtgaagaacccctga
噬菌体T4核酸内切酶VII、T4E7(SEQ ID NO:26)
Atgttattgactggcaaattatacaaagaagaaaaacagaaattttatgatgcacaaaacggtaaatgcttaatttgccaacgagaactaaatcctgatgttcaagctaatcacctcgaccatgaccatgaattaaatggaccaaaagcaggaaaggtgcgtggattgctttgtaatctatgcaatgctgcagaaggtcaaatgaagcataaatttaatcgttctggcttaaagggacaaggtgttgattatcttgaatggttagaaaatttacttacttatttaaaatccgattacacccaaaataatattcaccctaactttgttggagataaatcaaaggaattttctcgtttaggaaaagaggaaatgatggccgagatgcttcaaagaggatttgaatataatgaatctgacaccaaaacacaattaatagcttcattcaagaagcagcttagaaagagtttaaaatga
酵母CCE1解离酶(SEQ ID NO:27)
atgtcgacagcacagaaagctaagatattgcaactcatcgattcctgctgccaaaatgcaaaaagcacacaactgaaatctttatcatttgttattggagcagtaaatggcacgacgaaagaagctaaaagaacctacattcaagaacagtgtgaatttttggagaagttacgacaacaaaagataagagagggaagaattaacatattgtctatggatgctggtgtttctaactttgctttctctaagatgcaattgctcaataatgatccgctccctaaagtactagactggcaaaagataaatctagaggagaaattttttcaaaacctcaaaaagttaagcttgaatcctgctgaaacttctgagcttgtatttaaccttacggagtatttatttgaatctatgccgataccagatatgtttacaattgaaaggcaacgtaccagaactatgtcttcgaggcatattttagacccaattttaaaagtgaatattctcgaacagattcttttctctaacttggaaaataaaatgaagtatacgaataaaataccgaatacgtccaagttgaggtatatggtatgttcgtccgatccacatcggatgacttcatattggtgcattccaagagaagagacaccgaccagttcaaaaaagttaaaatctaacaaacatagcaaagattctcgaataaagctagtgaaaaaaatactttcaacctcaatactagaaggtaattcaactagttctacaaaactggtcgagttcataggagtttggaataataggataagaaatgcccttaccaaaaaaaaaagtttcaagctatgtgatatactagagatccaagataattcgggggtgagaaaagatgacgatttggcagattcattcctccattgtttgtcttggatggagtggttaaaaaattatgaaagtattactgaactcttgaattcaaaaacactggttaaaacacagttcggacaggtgtttgaattttgtgaaaataaggtacaaaagctgaaatttttgcagaacacttacaacaatgactaa
拟南芥AtGEN1解离酶(SEQ ID NO:28)
atgggtgtgggaggcaatttctgggatttgctgagaccatatgctcagcaacaaggctttgattttctcagaaacaaacgagtcgctgttgatctctccttctggatcgttcagcatgaaaccgctgttaagggtttcgtccttaaacctcacctccgactcactttcttccgtactatcaacctcttctcaaagtttggagcgtacccggtttttgtggttgatggaacaccatcacctttgaaatctcaggcgagaatctccaggtttttccgttcttctggaattgatacttgtaatctacctgtgattaaagatggtgtctcggttgagagaaacaagctgttttctgaatgggttagggaatgtgtggagctactcgaattgctcggtattccggtgctgaaagctaatggtgaggctgaagctctctgtgcacagttaaacagccaaggttttgtggatgcttgcattactcctgatagtgatgctttcctttttggtgctatgtgcgtgatcaaagacatcaagcctaattcaagagaaccttttgaatgctaccatatgtcacatatcgagtctggcctcggtttgaagcggaaacacttgattgctatttctctattggtgggaaacgattatgattcaggcggtgttcttgggattggtgtggataaagcactgcgcattgttcgtgagttttctgaagaccaagtacttgaaagactacaggacattggaaatgggttgcaacctgcagttcctggtggaatcaaatccggggatgatggtgaagaattccgctcagagatgaaaaaaagatctcctcactgttcccgttgtggacacctgggcagcaagagaactcattttaagtcctcttgtgagcactgcggttgtgatagtggttgcattaaaaaaccattagggtttagatgtgaatgctccttttgttccaaggatcgagatttaagggaacaaaagaaaaccaatgattggtggatcaaagtctgcgataagattgctctagcgccagagtttcccaacagaaagattattgaactttatctatccgatggtttgatgacaggagatggatcgtcaatgtcttggggaactcctgatactggaatgctagtggatctcatggttttcaaactgcactgggacccatcttatgttagaaaaatgttgcttccgatgctgtcgaccatttatctgagagaaaaggcaagaaacaacacaggatacgctttgttgtgtgatcaatacgaatttcattcaatcaagtgcataaaaactagatatgggcatcagtcctttgtaataaggtggagaaaacccaaatctacaagtggttatagtcatagtcacagcgagccagaagaatcaattgttgtattggaagaagaagaagagtctgttgatccgttggatggtttaaatgaacctcaggtgcaaaatgataatggtgactgcttcttgctaactgatgaatgcataggacttgttcagtctgctttccctgatgaaacagagcattttctacatgagaagaaactgagagagtcgaaaaagaagaatgtttctgaagaagaaacagcaacaccaagagcaacaacaatgggtgtacaaagaagcattaccgatttctaccgttcagcgaagaaagcagcagcaggtcaaagtatagagacaggcgggagttcaaaagcttctgcggaaaagaagagacaggcaacttctactagtagtagtaaccttacaaagtcggtcaggcgtcgtctcttgtttggatag
将不成熟的终止密码子引入到烟草PDS基因中的选择供体载体(SEQ ID NO:29)
cttcaggaagtttcccgctcaaaaacgtcacatcattcaacagtccccttccacgtgtcacgttttgattgggtgcccatttttttcgggccatccggtaatattataacggatggcccttatgaaagttgtactaatatatataatactccaatactccaatagatatgttaatatgctaagccacgtcatcggagtacaaacatggaattcctggctgatgctggtcacaaaccgatattgctggaggcaagagatgtcctaggtggaaaggtgaagaatatccatgctttcctttaattttattcctttttcttttgtgtccttccctattgatagtcccttttcaggaaggcttctatttgttttgtttaaaatcatttttcatactctttaaacattcagttgctcaaacaattgcaagggtgttcactattcctatttttgactgtcttcctttctctcagtttagttttattcctctctctctctctctctctatttttggaggaaatagatctgtcctaaaaatttccagctttactactaatagtgttaattgtcgagaaaatagtacagcatattaggtaaaagatatggaaagtatattattattattattattattattattattattattattattattattattattattattattattattattctctattattttaagattgagtcaattttacctgtcctgttggttgcatttctcatataaacattcttttctgtgagatgctatgtgaattagctgatgtttttggtatagagcactatgttagtcagttttatcttactgaagcagtcaccaagaatctagttgtataggctaaaagattgaattagcattaatctttatgtgttctgcacctgaatacttatacctaccttttaggtagctgcatagaaagatgatgatagagattggtatgagactgggttgcacatattctgtaagtttgactcctcaagaatgcatactttaatcttctagtacaacagtttctttcaagatctcttttgtccattaatcagatagctatccctgtttgtcttttgcaaatagccaatatgtcagtcgatctgtattctgccttgcctatctttttttatctgttaatttcgtatggtgactcatacaagttggtgcatctcctttaagttggggcttacccaaatatgcagaacttgtttggagaactagggataaacgatcggttgcagtggaaggaacattcaatgatatttgcgatgcctaacaagccagggggatcccgcagggaggcaaacaatgatatcacaactctcctgacgcgtcatcgtcggctacagcctcgggaattgctacctagctcgagcaagatccaaggagatataacaatggcttcctcctggattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactccaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcggatgcccgacggcgaggatctcgtcgtgacccacggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgaactagtgatcgttcaaacatttggcaataaagtttcttaagattgaatcctgttgccggtcttgcgatgattatcatataatttctgttgaattacgttaagcatgtaataattaacatgtaatgcatgacgttatttatgagatgggttttttgattagagtcccgcaattatacatttaatacgcgatagaaaacaaaatatagcgcgcaaactaggataaattatcgcgcgcggtgtcatctatgttactagatcgacccgggcttcaggaagtttcccgctcaaaaacgtcacatcattcaacagtccccttccacgtgtcacgttttgattgggtgcccatttttttcgggccatccggtaatattataacggatggcccttatgaaagttgtactaatatatataatactccaatactccaatagatatgttaatatgctaagccacgtcatcggagtaca
BOR1-ALS LFS-nptII-ALS RFS BOR2(SEQ ID NO:30)
tcctgtactccgatgacgtggcttagcatattaacatatctattggagtattggagtattatatatattagtacaactttcataagggccatccgttataatattaccggatggcccgaaaaaaatgggcacccaatcaaaacgtgacacgtggaaggggactgttgaatgatgtgacgtttttgagcgggaaacttcctgaaggcgcgccggagagtaaggaaggtaaactgaagttggatttttctgcttggaggcaggagttgacggtgcagaaagtgaagtacccgttgaattttaaaacttttggtgatgctattcctccgcaatatgctatccaggttctagatgagttaactaatgggagtgctattataagtaccggtgttgggcagcaccagatgtgggctgctcaatattataagtacagaaagccacgccaatggttgacatctggtggattaggagcgatgggatttggtttgcccgctgctattggtgcggctgttggaagacctgatgaagttgtggttgacattgatggtgatggcagtttcatcatgaatgtgcaggagctagcaactattaaggtggagaatctcccagttaagattatgttactgaataatcaacacttgggaatggtggttcaattggaggatcggttctataaggctaacagagcacacacatacctggggaatccttctaatgaggcggagatctttcctaatatgttgaaatttgcagaggcttgtggcgtacctgctgcgagagtgacacacagggatgatcttagagcggctattcaaaagatgttagacactcctgggccatacttgttggatgtgattgtacctcatcaggaacatgttctacctatgattcccagtggcggggctttcaaagatgtgatcacagagggtgacagaagttcctatggatcccgcagggaggcaaacaatgatatcacaactctcctgacgcgtcatcgtcggctacagcctcgggaattgctacctagctcgagcaagatccaaggagatataacaatggcttcctcctggattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactccaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcggatgcccgacggcgaggatctcgtcgtgacccacggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgaactagtgtttgagaagctacagagctagttctaggccttgtattatctaaaataaacttctattaaaccaaaaatgttatgtctattagtttgttattagtttttccgtggctttgctcattgtcagtgttgtactattaagtagttgatatttatgtttgctttaagttttgcatcatctcgctttggttttgaatgtgaaggatttcagcaatgtttcattctctattcgcaacatccagtcggtatccggagctctatgtagtatgtctggagattaatttctagtggagtagtttagtgcgataaagttagcttgttccacatttttatttcgtaacctgggtcagattggaacttcctctttaggttggatgcaatccctatttgggctttctcttaatttcattattgaaattgttggcttttaatctgagcaagttgatttgcagctttctctcttgagtcctagcgagcaatacgttatctctgtctcctatttcttagtggataatcttatgatggaaatctgtggagataggaaagcggccgctcctgtactccgatgacgtggcttagcatattaacatatctattggagtattggagtattatatatattagtacaactttcataagggccatccgttataatattaccggatggcccgaaaaaaatgggcacccaatcaaaacgtgacacgtggaaggggactgttgaatgatgtgacgtttttgagcgggaaacttcctgaagccg
BOR1-PPOX1 LFS-nptII-PPOX1 RFS BOR2(SEQ ID NO:31)
tcctgtactccgatgacgtggcttagcatattaacatatctattggagtattggagtattatatatattagtacaactttcataagggccatccgttataatattaccggatggcccgaaaaaaatgggcacccaatcaaaacgtgacacgtggaaggggactgttgaatgatgtgacgtttttgagcgggaaacttcctgaagggcgcgccacaataacatcaggatttgattcatcttaaatataatacttgcgtttcatatgcaggaacgatatatagttcatcactcttccctaaccgtgccccaaaaggtcgggtgctactcttgaacatgattggaggagcaaaaaatccggaaattttgtctaaggtaaggcatttaaattgagcgcaacttcaagtcctgccggtattgatttatcataatgaatattcatgggctggccagttggggcatcgcttgaaggttcctatggtaacaaacagaaaactgagaatgaccttatcccctgatctcttttggttgcaaatacgttaaccttgcagtgatgaggagaatgttttcagtgttattttctctagattaatggcgtagttggtttggattacaaaaccgtttaggcttatatgtgattagagtctccaggtttttgatctagcagtaagagcaaaatgtgtgatgttttaaaaaaacagtcaagtgattacaaatactcagaatagtttcaccataaagaactaaagagctaagaagattgtggtttctctttcctctatgttcgactgcattttgtgggttttccatagcatgactttcttttatggtacttgtacgaaagcatttcgctgttattctttatgcttcagggcctagaataaattgctttgagatttgatccctcattcttcttgcagacggagagccaacttgtggaagtagttgatcgtgacctcagaaaaatgcttatagaacccaaagcacaagatccccttgttgtgggtgtgcgagtatggccacaagctatcccacagtttttggttggtcatctgggtacgctaagtactgcaaaagctgctatgagtgataatgggcttgaagggctgtttcttgggggtaattatgtgtcaggtgtagcattggggaggtgtgttgaaggagcttatgaagttgcatctgaggtaacaggatttctgtctcggtatgcttacaaaggatcccgcagggaggcaaacaatgatatcacaactctcctgacgcgtcatcgtcggctacagcctcgggaattgctacctagctcgagcaagatccaaggagatataacaatggcttcctcctggattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactccaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcggatgcccgacggcgaggatctcgtcgtgacccacggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgaactagtaacctgtctgggggtactgctaggtccaaaccttgttagtaatacgatcatgccttgggaatattggcatgtgcctaaaagttttgctcgttagagttattttagccttggtaaatgatttgtacttgatatcagtcgttttctttgagataaaatgttcctgttcaggaaaatataatgtatatcaattttaaacacttgaatgttgaagatcattttttcccctcagcttacccataaatgtgaaaggtcctttgcttctgcatggtgagactgccgatatattttctccaacttcctatggttaaatatggtttgccttgtcattctttgttttctttgggagattatttattccacgaccagaagtaagggagtataccacattgattcaagggctgatacttgtggcaacaaagactaactgtgcaagggtaacagtgagagtatatttattactcacttctaataaagagcaaagttaagggaattcgatgatttaggagcaaattaggccttttcccttgagttaataaagagatgctattaaaattatacttctttgtatttaaatttgatataggtaatatgttctgtcatacaacatttattaggtgtaattcaatagtacttttaaaaaataaagttttttaacatgaaatcaaaaatagatcaggactgctcttgtatagatctagtctagttaaaataaataactgcataagtgtttgcccacactaatcatataggcacccaaaactctcctcctttttcgtccccaaacgtctcctccctcgctgcggccgctcctgtactccgatgacgtggcttagcatattaacatatctattggagtattggagtattatatatattagtacaactttcataagggccatccgttataatattaccggatggcccgaaaaaaatgggcacccaatcaaaacgtgacacgtggaaggggactgttgaatgatgtgacgtttttgagcgggaaacttcctgaagccg
nptII基因(SEQ ID NO:32)
atggaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactccaagacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcggatgcccgacggcgaggatctcgtcgtgacccacggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctg
烟草ALS sgRNA(SEQ ID NO:33)
gatgtgatcacagagggtgacgttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgctttttttttttgcggccatcttgctgaaaaa
烟草PPOX1 sgRNA(SEQ ID NO:34)
ggctgcatggaaagatgatgagttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgcttttttttttt
用于敲除突变的烟草PDS供体(SEQ ID NO:35)
Ctggctgatgctggtcacaaaccgatattgctggaggcaagagatgtcctaggtggaaaggtgaagaatatccatgctttcctttaattttattcctttttcttttgtgtccttccctattgatagtcccttttcaggaaggcttctatttgttttgtttaaaatcatttttcatactctttaaacattcagttgctcaaacaattgcaagggtgttcactattcctatttttgactgtcttcctttctctcagtttagttttattcctctctctctctctctctctatttttggaggaaatagatctgtcctaaaaatttccagctttactactaatagtgttaattgtcgagaaaatagtacagcatattaggtaaaagatatggaaagtatattattattattattattattattattattattattattattattattattattattattattattattattctctattattttaagattgagtcaattttacctgtcctgttggttgcatttctcatataaacattcttttctgtgagatgctatgtgaattagctgatgtttttggtatagagcactatgttagtcagttttatcttactgaagcagtcaccaagaatctagttgtataggctaaaagattgaattagcattaatctttatgtgttctgcacctgaatacttatacctaccttttaggtagctgcatagaaagatgatgatagagattggtatgagactgggttgcacatattctgtaagtttgactcctcaagaatgcatactttaatcttctagtacaacagtttctttcaagatctcttttgtccattaatcagatagctatccctgtttgtcttttgcaaatagccaatatgtcagtcgatctgtattctgccttgcctatctttttttatctgttaatttcgtatggtgactcatacaagttggtgcatctcctttaagttggggcttacccaaatatgcagaacttgtttggagaactagggataaacgatcggttgcagtggaaggaacattcaatgatatttgcgatgcctaacaagccaggg
用于对烟草PDS基因进行敲除突变的sgRNA(SEQ ID NO:36)
ggctgcatggaaagatgatgagttttagagctaggccaacatgaggatcacccatgtctgcagggcctagcaagttaaaataaggctagtccgttatcaacttggccaacatgaggatcacccatgtctgcagggccaagtggcaccgagtcggtgcttttttttttt
产生失活核酸酶(dCas9)的突变cas9基因(SEQ ID NO:37)
以蓝色大写字母表示Asp到Ala和His到Ala的两种突变
atggacaagaagtacagcatcggcctgGCCatcggcacgaactcggtgggctgggcggtgatcacggacgagtacaaggtgccctccaagaagttcaaggtgctgggcaacaccgaccgccactcgatcaagaagaacctgatcggcgccctgctgttcgactccggcgagaccgccgaggcgacgcgcctgaagcgcaccgcgcgtcgccgctacacgcgtcgcaagaaccgcatctgctacctgcaggagatcttcagcaacgagatggccaaggtggacgactcgttcttccaccgcctggaggagtccttcctggtggaggaagacaagaagcacgagcgccaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtacccgacgatctaccacctgcgcaagaagctggtggacagcaccgacaaggcggacctgcgcctgatctacctggccctggcgcacatgatcaagttccgcggccacttcctgatcgagggcgacctgaaccccgacaactcggacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggagaacccgatcaacgcctccggcgtggacgccaaggcgatcctgagcgcgcgcctgtccaagagccgtcgcctggagaacctgatcgcccagctgcccggcgagaagaagaacggcctgttcggcaacctgatcgcgctgtcgctgggcctgacgccgaacttcaagtccaacttcgacctggccgaggacgcgaagctgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgcggacctgttcctggccgcgaagaacctgtcggacgccatcctgctgtccgacatcctgcgcgtgaacaccgagatcacgaaggcccccctgtcggcgtccatgatcaagcgctacgacgagcaccaccaggacctgaccctgctgaaggcgctggtgcgccagcagctgccggagaagtacaaggagatcttcttcgaccagagcaagaacggctacgccggctacatcgacggcggcgcgtcgcaagaggagttctacaagttcatcaagcccatcctggagaagatggacggcacggaggagctgctggtgaagctgaaccgcgaggacctgctgcgcaagcagcgcaccttcgacaacggcagcatcccccaccagatccacctgggcgagctgcacgccatcctgcgtcgccaagaggacttctacccgttcctgaaggacaaccgcgagaagatcgagaagatcctgacgttccgcatcccctactacgtgggcccgctggcccgcggcaacagccgcttcgcgtggatgacccgcaagtcggaggagaccatcacgccctggaacttcgaggaagtggtggacaagggcgccagcgcgcagtcgttcatcgagcgcatgaccaacttcgacaagaacctgcccaacgagaaggtgctgccgaagcactccctgctgtacgagtacttcaccgtgtacaacgagctgacgaaggtgaagtacgtgaccgagggcatgcgcaagcccgccttcctgagcggcgagcagaagaaggcgatcgtggacctgctgttcaagaccaaccgcaaggtgacggtgaagcagctgaaagaggactacttcaagaagatcgagtgcttcgacagcgtggagatctcgggcgtggaggaccgcttcaacgccagcctgggcacctaccacgacctgctgaagatcatcaaggacaaggacttcctggacaacgaggagaacgaggacatcctggaggacatcgtgctgaccctgacgctgttcgaggaccgcgagatgatcgaggagcgcctgaagacgtacgcccacctgttcgacgacaaggtgatgaagcagctgaagcgtcgccgctacaccggctggggccgcctgagccgcaagctgatcaacggcatccgcgacaagcagtccggcaagaccatcctggacttcctgaagagcgacggcttcgcgaaccgcaacttcatgcagctgatccacgacgactcgctgaccttcaaagaggacatccagaaggcccaggtgtcgggccagggcgactccctgcacgagcacatcgccaacctggcgggctcccccgcgatcaagaagggcatcctgcagaccgtgaaggtggtggacgagctggtgaaggtgatgggccgccacaagccggagaacatcgtgatcgagatggcccgcgagaaccagaccacgcagaagggccagaagaacagccgcgagcgcatgaagcgcatcgaggaaggcatcaaggagctgggctcgcagatcctgaaggagcaccccgtggagaacacccagctgcagaacgagaagctttacctgtactacctgcagaacggccgcgacatgtacgtggaccaggagctggacatcaaccgcctgtccgactacgacgtggacGCCatcgtgccccagagcttcctgaaggacgactcgatcgacaacaaggtgctgacccgcagcgacaagaaccgcggcaagagcgacaacgtgccgtcggaggaagtggtgaagaagatgaagaactactggcgccagctgctgaacgccaagctgatcacgcagcgcaagttcgacaacctgaccaaggccgagcgcggtggcctgtcggagctggacaaggcgggcttcatcaagcgccagctggtggagacccgccagatcacgaagcacgtggcgcagatcctggactcccgcatgaacacgaagtacgacgagaacgacaagctgatccgcgaggtgaaggtgatcaccctgaagtccaagctggtcagcgacttccgcaaggacttccagttctacaaggtgcgcgagatcaacaactaccaccacgcccacgacgcgtacctgaacgccgtggtgggcaccgcgctgatcaagaagtaccccaagctggagagcgagttcgtgtacggcgactacaaggtgtacgacgtgcgcaagatgatcgccaagtcggagcaggagatcggcaaggccaccgcgaagtacttcttctactccaacatcatgaacttcttcaagaccgagatcacgctggccaacggcgagatccgcaagcgcccgctgatcgagaccaacggcgagacgggcgagatcgtgtgggacaagggccgcgacttcgcgaccgtgcgcaaggtgctgagcatgccccaggtgaacatcgtgaagaagaccgaggtgcagacgggcggcttctccaaggagagcatcctgccgaagcgcaactcggacaagctgatcgcccgcaagaaggactgggaccccaagaagtacggcggcttcgactccccgaccgtggcctacagcgtgctggtggtggcgaaggtggagaagggcaagtccaagaagctgaagagcgtgaaggagctgctgggcatcaccatcatggagcgcagctcgttcgagaagaaccccatcgacttcctggaggccaagggctacaaagaggtgaagaaggacctgatcatcaagctgccgaagtactcgctgttcgagctggagaacggccgcaagcgcatgctggcctccgcgggcgagctgcagaagggcaacgagctggccctgcccagcaagtacgtgaacttcctgtacctggcgtcccactacgagaagctgaagggctcgccggaggacaacgagcagaagcagctgttcgtggagcagcacaagcactacctggacgagatcatcgagcagatctcggagttctccaagcgcgtgatcctggccgacgcgaacctggacaaggtgctgagcgcctacaacaagcaccgcgacaagcccatccgcgagcaggcggagaacatcatccacctgttcaccctgacgaacctgggcgccccggccgcgttcaagtacttcgacaccacgatcgaccgcaagcgctacacctccacgaaagaggtgctggacgcgaccctgatccaccagagcatcaccggcctgtacgagacgcgcatcgacctgagccagctgggcggcgactcccgcgcggacccgaagaagaagcgcaaggtgagcgctggaggaggtggaagcggaggaggaggaagcggaggaggaggtagc
Claims (19)
1.一种编码第一融合蛋白的核酸,所述第一融合蛋白包含核酸内切酶结构域和对于复制起点的结合结构域。
2.根据权利要求1所述的核酸,其中所述核酸内切酶以序列特异性方式切割靶核酸分子。
3.根据前述权利要求中任一项所述的核酸,其中所述核酸内切酶是Cas9。
4.根据前述权利要求中任一项所述的核酸,其中所述融合蛋白包含核酸内切酶和所述复制起始复合体组分或复制复合体组分。
5.一种编码第二融合蛋白的核酸,所述第二融合蛋白包含5'至3'DNA核酸外切酶结构域和RNA结合结构域。
6.一种编码第三融合蛋白的核酸,所述第三融合蛋白包含重组诱导结构域和RNA结合结构域。
7.一种编码第四融合蛋白的核酸,所述第四融合蛋白包含具有错配修复途径的抑制剂的结构域和RNA结合结构域。
8.一种编码第五融合蛋白的核酸,所述第五融合蛋白包含霍利迪连接体解离酶结构域和RNA结合结构域。
9.根据权利要求5、6、7或8所述的核酸,其中所述RNA结合结构域结合至RNA引导的核酸内切酶的RNA组分,所述RNA组分用于RNA引导的核酸内切酶介导的转化。
10.一种修饰非动物有机体或细胞的基因组的方法,包括:
a.在细胞中表达权利要求1至4中任一项所述的核酸或将如权利要求1至4中任一项所限定的所述第一融合蛋白引入细胞中;和
b.在所述细胞中表达或向所述细胞中引入包含复制起点的供体核酸分子。
11.根据权利要求10所述的方法,其中所述供体核酸分子具有:
a.供体核酸序列;
b.位于所述供体核酸序列的5'和3'的侧翼核酸序列;
c.到5'侧翼核苷酸序列的复制起点5',以及
d.到3'侧翼核苷酸序列的复制终止子3'。
12.根据权利要求10或11所述的修饰基因组的方法,其中,在存在外源供体核酸分子的情况下将双链断裂引入至所述基因组,所述外源供体核酸分子包含供体核酸序列作为用于修饰所述基因组的模板或作为整合到所述基因组中的外源序列,并且DNA修复机制通过同源介导修复(HDR)修饰所述基因组。
13.根据权利要求10、11或12所述的方法,还包括以下步骤:
a.在所述细胞中表达或向细胞中引入序列特异性向导RNA,以将核酸内切酶结构域的切割引导至特异性位点;和
b.在所述细胞中表达权利要求5至9所述的一种或多种核酸或将如权利要求5至9中所限定的一种或多种融合蛋白引入至所述细胞中。
14.根据权利要求13所述的方法,包括在所述细胞中表达权利要求5至9所述的两种或多种核酸或将如权利要求5至9中所限定的两种或多种融合蛋白引入至所述细胞中,其中各融合蛋白的RNA结合蛋白结构域结合至不同的RNA序列。
15.根据权利要求10至14中任一项所述的方法,其中所述第一融合蛋白的复制起点的结合结构域与所述供体核酸的复制起点结合。
16.一种融合蛋白,包含核酸内切酶和复制起始复合体组分或复制复合体组分。
17.如权利要求16所述的融合蛋白或编码所述融合蛋白的核酸在使用RNA引导的核酸内切酶转化非动物有机体或细胞中的用途。
18.一种选择载体,包含第一病毒复制起点和第二病毒复制起点,其中所述第一病毒复制起点和第二病毒复制起点被布置在供体DNA片段的侧翼;所述供体DNA片段包含不参与融合的可选择的标记基因。
19.根据权利要求18所述的载体,其中所述第一病毒复制起点和第二病毒复制起点被布置在包含启动子和供体DNA片段的DNA序列的侧翼,所述供体DNA片段包含不影响启动子的可选择的标记基因。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18175623.0A EP3575402A1 (en) | 2018-06-01 | 2018-06-01 | Gene targeting |
EP18175623.0 | 2018-06-01 | ||
PCT/EP2019/064215 WO2019229252A1 (en) | 2018-06-01 | 2019-05-31 | Gene targeting |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112585272A true CN112585272A (zh) | 2021-03-30 |
Family
ID=62567281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980048679.2A Pending CN112585272A (zh) | 2018-06-01 | 2019-05-31 | 基因靶向 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210230615A1 (zh) |
EP (2) | EP3575402A1 (zh) |
CN (1) | CN112585272A (zh) |
AU (1) | AU2019276360A1 (zh) |
CA (1) | CA3102072A1 (zh) |
WO (1) | WO2019229252A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114807086A (zh) * | 2022-04-15 | 2022-07-29 | 杭州师范大学 | 一种霍利迪连接体解离酶DrRuvC及其编码基因和应用 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3575402A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
CN115820718A (zh) * | 2022-11-28 | 2023-03-21 | 深圳大学 | 一种莱茵衣藻叶绿体中附加体质粒的构建方法及其应用 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120042411A1 (en) * | 2009-01-26 | 2012-02-16 | Isabelle Malcuit | Gene targeting in plants |
CN105142669A (zh) * | 2012-12-06 | 2015-12-09 | 西格马-奥尔德里奇有限责任公司 | 基于crispr的基因组修饰和调控 |
US20160237455A1 (en) * | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
CN105916987A (zh) * | 2013-08-22 | 2016-08-31 | 纳幕尔杜邦公司 | 使用向导rna/cas内切核酸酶系统的植物基因组修饰及其使用方法 |
CN106795488A (zh) * | 2014-09-16 | 2017-05-31 | 桑格摩治疗股份有限公司 | 用于造血干细胞中核酸酶介导的基因组工程化和校正的方法和组合物 |
WO2017155715A1 (en) * | 2016-03-11 | 2017-09-14 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
CN108138155A (zh) * | 2015-10-20 | 2018-06-08 | 先锋国际良种公司 | 经由指导cas系统恢复非功能性基因产物的功能及使用方法 |
US20180230494A1 (en) * | 2014-10-01 | 2018-08-16 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
EP3575396A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
EP3575402A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
CN111344403A (zh) * | 2017-09-15 | 2020-06-26 | 利兰斯坦福初级大学董事会 | 遗传工程细胞的多元性产生和条形码编制 |
US20210207119A1 (en) * | 2016-02-16 | 2021-07-08 | Emendobio Inc. | Compositions and methods for promoting homology directed repair mediated gene editing |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2963820A1 (en) * | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
US20170088587A1 (en) * | 2015-09-29 | 2017-03-30 | Agenovir Corporation | Antiviral fusion proteins and genes |
WO2018231999A1 (en) * | 2017-06-13 | 2018-12-20 | Regents Of The University Of Minnesota | Materials and methods for increasing gene editing frequency |
-
2018
- 2018-06-01 EP EP18175623.0A patent/EP3575402A1/en not_active Ceased
-
2019
- 2019-05-31 US US15/733,848 patent/US20210230615A1/en not_active Abandoned
- 2019-05-31 CA CA3102072A patent/CA3102072A1/en active Pending
- 2019-05-31 CN CN201980048679.2A patent/CN112585272A/zh active Pending
- 2019-05-31 WO PCT/EP2019/064215 patent/WO2019229252A1/en unknown
- 2019-05-31 AU AU2019276360A patent/AU2019276360A1/en active Pending
- 2019-05-31 EP EP19732908.9A patent/EP3802833A1/en active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120042411A1 (en) * | 2009-01-26 | 2012-02-16 | Isabelle Malcuit | Gene targeting in plants |
CN105142669A (zh) * | 2012-12-06 | 2015-12-09 | 西格马-奥尔德里奇有限责任公司 | 基于crispr的基因组修饰和调控 |
CN105916987A (zh) * | 2013-08-22 | 2016-08-31 | 纳幕尔杜邦公司 | 使用向导rna/cas内切核酸酶系统的植物基因组修饰及其使用方法 |
US20160237455A1 (en) * | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
CN106795488A (zh) * | 2014-09-16 | 2017-05-31 | 桑格摩治疗股份有限公司 | 用于造血干细胞中核酸酶介导的基因组工程化和校正的方法和组合物 |
US20180230494A1 (en) * | 2014-10-01 | 2018-08-16 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
CN108138155A (zh) * | 2015-10-20 | 2018-06-08 | 先锋国际良种公司 | 经由指导cas系统恢复非功能性基因产物的功能及使用方法 |
US20210207119A1 (en) * | 2016-02-16 | 2021-07-08 | Emendobio Inc. | Compositions and methods for promoting homology directed repair mediated gene editing |
WO2017155715A1 (en) * | 2016-03-11 | 2017-09-14 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
CN111344403A (zh) * | 2017-09-15 | 2020-06-26 | 利兰斯坦福初级大学董事会 | 遗传工程细胞的多元性产生和条形码编制 |
EP3575396A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
EP3575402A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
US20210230615A1 (en) * | 2018-06-01 | 2021-07-29 | Algentech Sas | Gene Targeting |
US20210363507A1 (en) * | 2018-06-01 | 2021-11-25 | Algentech Sas | Gene Targeting |
Non-Patent Citations (3)
Title |
---|
ERIC J. AIRD等: "Increasing Cas9-mediated homology-directed repair efficiency through covalent tethering of DNA repair template", COMMUNICATIONS BIOLOGY, vol. 1, no. 1, 31 May 2018 (2018-05-31), pages 1 - 2 * |
杨帆等: "新一代基因组编辑CRISPR/Cpf1", 生物工程学报, 1 March 2017 (2017-03-01), pages 361 - 371 * |
陈怡李;姚书忠;: "CRISPR/Cas9基因编辑技术的应用研究进展", 国际生殖健康/计划生育杂志, no. 06, 15 November 2017 (2017-11-15), pages 34 - 27 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114807086A (zh) * | 2022-04-15 | 2022-07-29 | 杭州师范大学 | 一种霍利迪连接体解离酶DrRuvC及其编码基因和应用 |
CN114807086B (zh) * | 2022-04-15 | 2024-02-20 | 杭州师范大学 | 一种霍利迪连接体解离酶DrRuvC及其编码基因和应用 |
Also Published As
Publication number | Publication date |
---|---|
EP3575402A1 (en) | 2019-12-04 |
EP3802833A1 (en) | 2021-04-14 |
AU2019276360A1 (en) | 2021-01-21 |
US20210230615A1 (en) | 2021-07-29 |
CA3102072A1 (en) | 2019-12-05 |
WO2019229252A1 (en) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022100170A4 (en) | Improved methods for modification of target nucleic acids | |
US10612043B2 (en) | Methods of in vivo engineering of large sequences using multiple CRISPR/cas selections of recombineering events | |
EP3110945B1 (en) | Compositions and methods for site directed genomic modification | |
CA2658926C (en) | Cosmid vector for transforming plant and use thereof | |
JP2004121248A (ja) | 複数遺伝子組換えベクターコンストラクトの作成方法とその応用 | |
EP3737691A1 (en) | Optimized plant crispr/cpf1 systems | |
CN112585272A (zh) | 基因靶向 | |
Rolloos et al. | Enhanced targeted integration mediated by translocated I-SceI during the Agrobacterium mediated transformation of yeast | |
CN104450745A (zh) | 一种获得水稻指定基因突变体的方法及其应用 | |
CN116286742B (zh) | CasD蛋白、CRISPR/CasD基因编辑系统及其在植物基因编辑中的应用 | |
WO2019234132A1 (en) | Base editing in polymerase theta deficient plants | |
CA3112164C (en) | Virus-based replicon for plant genome editing without inserting replicon into plant genome and use thereof | |
EP4243608A1 (en) | Fusion protein for editing endogenous dna of a eukaryotic cell | |
Alburquerque et al. | New transformation technologies for trees | |
Kumar et al. | Gene targeting in plants | |
EP4059341A1 (en) | Method for introducing genome editing enzyme into plant cell using plasma | |
Ramirez | Precise genomic deletions and insertions via paired prime editing for crop bioengineering | |
Moreno-Ramírez | Precise genomic deletions and insertions via paired prime editing for crop bioengineering | |
CN116829707A (zh) | 提高定点整合频率的方法 | |
Piatek | Targeted Genome Regulation and Editing in Plants | |
Huhdanmäki | CRISPR-Cas9 based genetic engineering and mutation detection in genus Nicotiana | |
WO2023111130A1 (en) | Modified agrobacteria for editing plants | |
CN113462717A (zh) | BSMV投送splited-Sacas9和sgRNA介导的基因编辑方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |