CN115725543A - Crispr酶以及系统 - Google Patents
Crispr酶以及系统 Download PDFInfo
- Publication number
- CN115725543A CN115725543A CN202211306408.2A CN202211306408A CN115725543A CN 115725543 A CN115725543 A CN 115725543A CN 202211306408 A CN202211306408 A CN 202211306408A CN 115725543 A CN115725543 A CN 115725543A
- Authority
- CN
- China
- Prior art keywords
- sequence
- target
- pam
- nucleic acid
- grna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 30
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 108
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 90
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 76
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 67
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 67
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 23
- 108020005004 Guide RNA Proteins 0.000 claims description 53
- 210000004027 cell Anatomy 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 38
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 26
- 230000008685 targeting Effects 0.000 claims description 26
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 25
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 16
- 230000001105 regulatory effect Effects 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- 238000009396 hybridization Methods 0.000 claims description 9
- 210000004102 animal cell Anatomy 0.000 claims description 8
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims 1
- 230000000694 effects Effects 0.000 description 33
- 102000040430 polynucleotide Human genes 0.000 description 22
- 108091033319 polynucleotide Proteins 0.000 description 22
- 239000002157 polynucleotide Substances 0.000 description 22
- 239000002773 nucleotide Substances 0.000 description 21
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 10
- 102000004196 processed proteins & peptides Human genes 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 230000027455 binding Effects 0.000 description 9
- 238000010453 CRISPR/Cas method Methods 0.000 description 8
- 238000010362 genome editing Methods 0.000 description 7
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 6
- 241000482268 Zea mays subsp. mays Species 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 244000241257 Cucumis melo Species 0.000 description 5
- 235000007164 Oryza sativa Nutrition 0.000 description 5
- 108091006619 SLC11A1 Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 210000001236 prokaryotic cell Anatomy 0.000 description 5
- 235000009566 rice Nutrition 0.000 description 5
- 244000291564 Allium cepa Species 0.000 description 4
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 3
- 240000007124 Brassica oleracea Species 0.000 description 3
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 3
- 244000221633 Brassica rapa subsp chinensis Species 0.000 description 3
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 3
- 235000009854 Cucurbita moschata Nutrition 0.000 description 3
- 240000001980 Cucurbita pepo Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241000167854 Bourreria succulenta Species 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 2
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 244000304217 Brassica oleracea var. gongylodes Species 0.000 description 2
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 description 2
- 240000006740 Cichorium endivia Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 2
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 241000208822 Lactuca Species 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 235000015802 Lactuca sativa var crispa Nutrition 0.000 description 2
- 101710128836 Large T antigen Proteins 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 2
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 230000007022 RNA scission Effects 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 240000007651 Rubus glaucus Species 0.000 description 2
- 235000011034 Rubus glaucus Nutrition 0.000 description 2
- 235000009122 Rubus idaeus Nutrition 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 240000003829 Sorghum propinquum Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 235000019693 cherries Nutrition 0.000 description 2
- 235000003733 chicria Nutrition 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000001212 derivatisation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 235000021384 green leafy vegetables Nutrition 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 235000020354 squash Nutrition 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101150059931 tus gene Proteins 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 235000009434 Actinidia chinensis Nutrition 0.000 description 1
- 244000298697 Actinidia deliciosa Species 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 235000010167 Allium cepa var aggregatum Nutrition 0.000 description 1
- 240000002234 Allium sativum Species 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 235000003276 Apios tuberosa Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000010744 Arachis villosulicarpa Nutrition 0.000 description 1
- 235000011330 Armoracia rusticana Nutrition 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000001171 Brassica oleracea var gongylodes Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 241000219357 Cactaceae Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 235000009025 Carya illinoensis Nutrition 0.000 description 1
- 244000068645 Carya illinoensis Species 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 241000723346 Cinnamomum camphora Species 0.000 description 1
- 244000223760 Cinnamomum zeylanicum Species 0.000 description 1
- 241000132536 Cirsium Species 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 240000009226 Corylus americana Species 0.000 description 1
- 235000001543 Corylus americana Nutrition 0.000 description 1
- 235000007466 Corylus avellana Nutrition 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 235000015001 Cucumis melo var inodorus Nutrition 0.000 description 1
- 240000002495 Cucumis melo var. inodorus Species 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 235000017788 Cydonia oblonga Nutrition 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 244000236655 Diospyros kaki Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000510678 Falcaria vulgaris Species 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 1
- 102000017013 Heterogeneous Nuclear Ribonucleoprotein A1 Human genes 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 206010020460 Human T-cell lymphotropic virus type I infection Diseases 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 244000025221 Humulus lupulus Species 0.000 description 1
- 235000010702 Insulata Nutrition 0.000 description 1
- 244000165077 Insulata Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 240000004201 Lactuca sativa var. crispa Species 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 241001596950 Larimichthys crocea Species 0.000 description 1
- 241000218195 Lauraceae Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 241001072282 Limnanthes Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 244000108452 Litchi chinensis Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 235000015742 Nephelium litchi Nutrition 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 241000219925 Oenothera Species 0.000 description 1
- 235000004496 Oenothera biennis Nutrition 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000004370 Pastinaca sativa Species 0.000 description 1
- 235000017769 Pastinaca sativa subsp sativa Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 235000001537 Ribes X gardonianum Nutrition 0.000 description 1
- 235000001535 Ribes X utile Nutrition 0.000 description 1
- 235000016919 Ribes petraeum Nutrition 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 235000002355 Ribes spicatum Nutrition 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 244000044822 Simmondsia californica Species 0.000 description 1
- 235000004433 Simmondsia californica Nutrition 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000294925 Tragopogon dubius Species 0.000 description 1
- 235000004478 Tragopogon dubius Nutrition 0.000 description 1
- 235000012363 Tragopogon porrifolius Nutrition 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 229960000846 camphor Drugs 0.000 description 1
- 229930008380 camphor Natural products 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 235000017803 cinnamon Nutrition 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 235000004611 garlic Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 235000013599 spices Nutrition 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明属于核酸编辑领域,特别是规律成簇的间隔短回文重复(CRISPR)技术领域。具体而言,本发明涉及CRISPR酶以及系统,涉及一种扩大PAM识别范围的Cas蛋白及其应用,具有广泛的应用前景。
Description
技术领域
本发明涉及基因编辑领域,特别是规律成簇的间隔短回文重复(CRISPR)技术领域。具体而言,本发明涉及CRISPR酶以及系统,具体涉及一种扩大PAM识别范围的Cas蛋白、相应的CRISPR系统及应用。
背景技术
CRISPR/Cas技术是一种被广泛使用的基因编辑技术,它通过RNA引导对基因组上的靶序列进行特异性结合并切割DNA产生双链断裂,利用生物非同源末端连接或同源重组进行定点基因编辑。
CRISPR/Cas9系统是最常用的II型CRISPR系统,它识别3’-NGG的PAM基序,对靶标序列进行平末端切割。CRISPR/Cas Type V系统是一类新发现的CRISPR系统,它具有5’-TTN的基序,对靶标序列进行粘性末端切割,例如Cpf1,C2c1,CasX,CasY。然而目前存在的不同的CRISPR/Cas各有不同的优点和缺陷。例如Cas9,C2c1和CasX均需要两条RNA进行指导RNA,而Cpf1只需要一条指导RNA而且可以用来进行多重基因编辑。CasX具有980个氨基酸的大小,而常见的Cas9,C2c1,CasY和Cpf1通常大小在1300个氨基酸左右。此外,Cas9,Cpf1,CasX,CasY的PAM序列都比较复杂多样,而C2c1识别严谨的5’-TTN,因此它的靶标位点比其他系统容易被预测从而降低了潜在的脱靶效应。
中国发明专利CN114672473A中公开了一种氨基酸产生突变的Cas蛋白,还公开了该蛋白可以在真核细胞中进行基因编辑,但是,其识别的PAM位点为TTN,本申请经过实验验证,拓宽了该蛋白对于PAM的识别范围,提高了在真核细胞中的编辑范围,扩展了其应用范围。
发明内容
本申请的发明人经过大量实验和反复摸索,提供了一种PAM识别范围更大的CRISPR/CAS系统,扩展了靶点的选择范围,增加了其应用范围,有良好的应用前景。
一方面,本发明提供了一种工程化的、非天然存在的CRISPR系统,包含
a)Cas蛋白,所述Cas蛋白的氨基酸序列如SEQ ID No.1所示,以及
b)至少一种被设计与所述Cas蛋白形成复合物的gRNA,其中所述gRNA包含与靶序列杂交的区域,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
一方面,本发明提供了一种工程化、非天然存在的CRISPR系统,包含
a)一种或多种编码上述Cas蛋白的核苷酸序列,以及
b)一种或多种编码至少一种gRNA的核苷酸序列,所述至少一种gRNA与所述Cas蛋白形成复合物,其中所述gRNA与靶核酸杂交,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
上述系统中,所述Cas蛋白的生物学功能包括但不限于,与指导RNA结合的活性、核酸内切酶活性、在指导RNA引导下与靶序列特定位点结合并切割的活性,包括但不限于Cis切割活性和Trans切割活性。
本发明中,“Cas突变蛋白”也可以称之为突变的Cas蛋白,或者Cas蛋白变体。
本发明中,所述gRNA包括第一区段和第二区段;所述第一区段称为“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复(Direct Repeat)序列”;所述第二区段又称为“靶向核酸的靶向序列”或者“靶向核酸的靶向区段”,或者“靶向靶序列的引导序列”。
所述gRNA的第一区段能够与本发明的Cas蛋白相互作用,从而使Cas蛋白和gRNA形成复合物。
在优选的实施方式中,所述第一区段为如上所述的同向重复序列。
本发明靶向核酸的靶向序列或靶向核酸的靶向区段包含与靶核酸中的靶序列互补的核苷酸序列。换言之,本发明靶向核酸的靶向序列或靶向核酸的靶向区段经过杂交(即,碱基配对)以序列特异性方式与靶核酸相互作用。其中,所述靶序列位于原型间隔区相邻基序(PAM)的3’端;前述PAM序列为5’-ATN-3’,其中,N=C/G/A/T。
因此,靶向核酸的靶向序列或靶向核酸的靶向区段可改变,或可被修饰以杂交靶核酸内的任何希望的序列。所述核酸选自DNA或RNA。
在一种实施方式中,所述编码所述Cas蛋白的核酸序列和编码一种或多种指导RNA的核酸是人工合成的。
在一种实施方式中,所述编码所述Cas蛋白的核酸序列和编码一种或多种指导RNA的核酸并不共同天然存在。
在一个实施方式中,所述的核苷酸序列经过密码子优化用于在原核细胞中进行表达。
在一个实施方式中,所述的核苷酸序列经过密码子优化用于在真核细胞中进行表达。
一方面,本发明还提供了一种包含一种或多种载体的工程化的、非天然存在的载体系统,其中包含
a)可操作地连接一种或多种编码上述Cas蛋白的核苷酸序列的第一调控元件;
b)可操作地连接一种或多种编码至少一种gRNA的核苷酸序列的第二调控元件,所述至少一种gRNA与所述Cas蛋白形成复合物,其中所述gRNA与靶序列杂交,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种;
组分(a)和(b)位于所述系统的相同或者不同的载体上。
所述第一和第二调控元件包括启动子(例如,组成型启动子或诱导型启动子)、增强子(例如35S promoter或35S enhanced promoter)、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚U序列)。
在一些实施方案中,所述系统中的载体是病毒载体(例如逆转录病毒载体,慢病毒载体,腺病毒载体,腺相关载体和单纯疱疹载体),还可以是质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的。
在一些实施例中,本文提供的系统处于递送系统中。在一些实施方案中,递送系统是纳米颗粒,脂质体,外体,微泡和基因枪。
在一个实施方式中,所述靶序列是来自原核细胞或真核细胞的DNA或RNA序列。在一个实施方式中,所述靶序列是非天然存在的DNA或RNA序列。
在一个实施方式中,所述靶序列存在于细胞内。在一个实施方式中,所述靶序列存在于细胞核内或细胞质(例如,细胞器)内。在一个实施方式中,所述细胞是真核细胞。在其他实施方式中,所述细胞是原核细胞。
另一方面,本发明涉及一种工程化、非天然存在的CRISPR系统,所述系统包含
(a)上述Cas蛋白,所述Cas蛋白的氨基酸序列如SEQ ID No.1所示;或一种或多种编码所述Cas蛋白核苷酸序列,以及
(b)至少一种与所述Cas蛋白形成复合物的gRNA,其中所述gRNA与靶序列杂交,或一种或多种编码所述至少一种gRNA的核苷酸序列,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
在一个实施方式中,本发明中的Cas蛋白还包括其他的修饰部分;在一个实施方式中,所述Cas蛋白和其他的修饰部分可以为融合蛋白。
在一个实施方式中,所述修饰部分选自另外的蛋白或多肽、可检测的标记或其任意组合。
在一个实施方式中,所述修饰部分选自表位标签、报告基因序列、核定位信号(NLS)序列、靶向部分、转录激活结构域(例如,VP64)、转录抑制结构域(例如,KRAB结构域或SID结构域)、核酸酶结构域(例如,Fok1),以及具有选自下列的活性的结构域:核苷酸脱氨酶,甲基化酶活性,去甲基化酶,转录激活活性,转录抑制活性,转录释放因子活性,组蛋白修饰活性,核酸酶活性,单链RNA切割活性,双链RNA切割活性,单链DNA切割活性,双链DNA切割活性和核酸结合活性;以及其任意组合。所述NLS序列是本领域技术人员熟知的,其实例包括但不限于所述,SV40大T抗原,EGL-13,c-Myc以及TUS蛋白。
在一个实施方式中,所述NLS序列位于、靠近或接近本发明的Cas蛋白的末端(例如,N端、C端或两端)。
所述表位标签(epitope tag)是本领域技术人员熟知的,包括但不限于His、V5、FLAG、HA、Myc、VSV-G、Trx等,并且本领域技术人员可以选择其他合适的表位标签(例如,纯化、检测或示踪)。
所述报告基因序列是本领域技术人员熟知的,其实例包括但不限于GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP等。
在一个实施方式中,本发明的融合蛋白包含能够与DNA分子或细胞内分子结合的结构域,例如麦芽糖结合蛋白(MBP)、Lex A的DNA结合结构域(DBD)、GAL4的DBD等。
在一个实施方式中,本发明的融合蛋白包含可检测的标记,例如荧光染料,例如FITC或DAPI。
在一个实施方式中,本发明的Cas蛋白任选地通过接头与所述修饰部分偶联、缀合或融合。
在一个实施方式中,所述修饰部分直接连接至本发明的Cas蛋白的N端或C端。
在一个实施方式中,所述修饰部分通过接头连接至本发明的Cas蛋白的N端或C端。这类接头是本领域熟知的,其实例包括但不限于包含一个或多个(例如,1个,2个,3个,4个或5个)氨基酸(如,Glu或Ser)或氨基酸衍生物(如,Ahx、β-Ala、GABA或Ava)的接头,或PEG等。
本发明的Cas蛋白、蛋白衍生物或融合蛋白不受其产生方式的限定,例如,其可以通过基因工程方法(重组技术)产生,也可以通过化学合成方法产生。
在一个实施方式中,所述靶序列为真核细胞中的靶序列。
在一个实施方式中,所述真核细胞是动物细胞,例如,哺乳动物细胞。
在一个实施方式中,所述真核细胞是人类细胞。
在一个实施方式中,所述真核细胞是植物细胞,例如栽培植物(如水稻、玉米、高粱、小麦或木薯)、藻类、树或蔬菜具有的细胞。
在一个实施方式中,所述的多核苷酸优选是单链的或双链的。
另一方面,本发明提供了一种修饰真核细胞靶序列特定位点的方法,包括递送上述所述CRISPR/Cas系统、上述载体系统到所述细胞中,其中所述gRNA与所述靶序列杂交产生特定位点的修饰,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
在一个实施方式中,该方法包括将包含Cas蛋白和一种和多种核酸组分形成复合物递送至所述细胞后,Cas蛋白诱导对特定位点的靶序列的修饰。
在一个实施方式中,修饰是链断裂的引入。
在一个实施方式中,链断裂是交错切割的。
在一个实施方式中,所述递送包括将一种或多种编码所述Cas蛋白的核苷酸序列和一种或多种编码所述至少一种gRNA的核苷酸序列递送至所述细胞中。
在一个实施方式中,所述一个或多个核酸序列被包含在一个或多个载体中。
本发明还提供了一种编辑靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括将靶核酸与前述CRISPR系统、载体系统进行接触的步骤,所述系统中的gRNA包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
在一个实施方式中,所述编辑靶核酸、靶向靶核酸或切割靶核酸的方法为在细胞内或细胞外编辑靶核酸、靶向靶核酸或切割靶核酸。
所述基因编辑或编辑靶核酸包括修饰基因、敲除基因、改变基因产物的表达、修复突变、和/或插入多核苷酸、基因突变。
所述编辑可以在原核细胞和/或真核细胞中进行编辑。
本发明还提供了上述CRISPR系统、载体系统在制备试剂或试剂盒中的用途,所述试剂或试剂盒用于编辑靶核酸、靶向靶核酸、切割靶核酸,上述所述系统中的gRNA包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
在一个实施方式中,所述靶核酸为真核细胞中的靶核酸;优选的,所述真核细胞为植物细胞、动物细胞和人类细胞。
术语定义
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
本文中的核酸切割或切割核酸包括:由本文所述Cas酶产生的靶核酸中的DNA或RNA断裂(Cis切割)、DNA或RNA在侧枝核酸底物(单链核酸底物)中的断裂(即非特异性或非靶向性,Trans切割)。在一些实施方式中,所述切割是双链DNA断裂。在一些实施方案中,切割是单链DNA断裂或单链RNA断裂。
CRISPR系统
如本文中所使用的,术语“规律成簇的间隔短回文重复(CRISPR)-CRISPR-相关(Cas)(CRISPR-Cas)系统”或“CRISPR系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与CRISPR相关(“Cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述Cas基因活性的转录产物或其他元件。
CRISPR/Cas复合物
如本文中所使用的,术语“CRISPR/Cas复合物”是指,指导RNA(guide RNA)或成熟crRNA与Cas蛋白结合所形成的复合体,其包含杂交到靶序列的引导序列上并且与Cas蛋白结合的同向重复序列,该复合体能够识别并切割能与该指导RNA或成熟crRNA杂交的多核苷酸。
指导RNA(guide RNA,gRNA)
如本文中所使用的,术语“指导RNA(guide RNA,gRNA)”、“成熟crRNA”、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导RNA可以包含同向重复序列(direct repeat)和引导序列,或者基本上由或由同向重复序列和引导序列组成。
在某些情况下,指导序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,指导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于ClustalW、matlab中的史密斯-沃特曼算法(Smith-Waterman)、Bowtie、Geneious、Biopython以及SeqMan。
靶序列
“靶序列”是指被gRNA中的引导序列所靶向的多核苷酸,例如与该引导序列具有互补性的序列,其中靶序列与引导序列之间的杂交将促进CRISPR/Cas复合物(包括Cas蛋白和gRNA)的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种CRISPR/Cas复合物的形成即可。
靶序列可以包含任何多核苷酸,如DNA或RNA。在某些情况下,所述靶序列位于细胞内或细胞外。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一个实施方式中,所述编辑模板为外源核酸。在一个实施方式中,该重组是同源重组。
在本发明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是对细胞(例如,真核细胞)而言任何内源或外源的多核苷酸。例如,该靶多核苷酸可以是一种存在于真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。在某些情况下,该靶序列应该与原间隔序列临近基序(PAM)相关。
野生型
如本文中所使用的,术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。
衍生化
如本文中所使用的,术语“衍生化”是指,对氨基酸、多肽或蛋白的化学修饰,其中一个或多个取代基已与所述氨基酸、多肽或蛋白共价连接。取代基也可称为侧链。
衍生化的蛋白是该蛋白的衍生物,通常,蛋白的衍生化不会不利影响该蛋白的期望活性(例如,与指导RNA结合的活性、核酸内切酶活性、在指导RNA引导下与靶序列特定位点结合并切割的活性),也就是说蛋白的衍生物与蛋白有相同的活性。
衍生化蛋白
又称“蛋白衍生物”,是指蛋白的经修饰形式,例如其中所述蛋白的一个或多个氨基酸可以被缺失、插入、修饰和/或取代。
非天然存在的
如本文中所使用的,术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。当这些术语用于描述核酸分子或多肽时,其表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。
载体
术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括DNA、RNA、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,CRISPR转录物,如核酸转录物、蛋白质、或酶)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。
另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。
其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。
宿主细胞
如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如微生物细胞、真菌细胞、动物细胞和植物细胞的真核细胞。
本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。
调控元件
如本文中所使用的,术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚U序列),其详细描述可参考戈德尔(Goeddel),《基因表达技术:酶学方法》(GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY)185,学术出版社(Academic Press),圣地亚哥(SanDiego),加利福尼亚州(1990)。在某些情况下,调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。在某些情况下,调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在某些情况下,术语“调控元件”涵盖的是增强子元件,如WPRE;CMV增强子;在HTLV-I的LTR中的R-U5’片段((Mol.Cell.Biol.,第8(1)卷,第466-472页,1988);SV40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,第78(3)卷,第1527-31页,1981)。
启动子
如本文中所使用的,术语“启动子”具有本领域技术人员公知的含义,其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子是这样的核苷酸序列:当其与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列,当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当对应于所述启动子的诱导物在细胞中存在时,其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列:当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当细胞是该启动子对应的组织类型的细胞时,其才导致在细胞中产生基因产物。
NLS
“核定位信号”或“核定位序列”(NLS)是对蛋白质“加标签”以通过核转运导入细胞核的氨基酸序列,即,具有NLS的蛋白质被转运至细胞核。典型地,NLS包含暴露在蛋白质表面的带正电荷的Lys或Arg残基。示例性核定位序列包括但不限于来自以下的NLS:SV40大T抗原,EGL-13,c-Myc以及TUS蛋白。在一些实施例中,该NLS包含PKKKRKV序列。在一些实施例中,该NLS包含AVKRPAATKKAGQAKKKKLD序列。在一些实施例中,该NLS包含PAAKRVKLD序列。在一些实施例中,该NLS包含MSRRRKANPTKLSENAKKLAKEVEN序列。在一些实施例中,该NLS包含KLKIKRPVK序列。其他核定位序列包括但不限于hnRNP A1的酸性M9结构域、酵母转录抑制子Matα2中的序列KIPIK和PY-NLS。
可操作地连接
如本文中所使用的,术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调控元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。
互补性
如本文中所使用的,术语“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。
严格条件
如本文中所使用的,对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。
杂交
术语“杂交”或“互补的”或“基本上互补的”是指核酸(例如RNA、DNA)包含使其能够非共价结合的核苷酸序列,即以序列特异性,反平行的方式(即核酸特异性结合互补核酸)与另一核酸形成碱基对和/或G/U碱基对,“退火”或“杂交”。
杂交需要两个核酸含有互补序列,尽管碱基之间可能存在错配。两个核酸之间杂交的合适条件取决于核酸的长度和互补程度,这是本领域公知的变量。典型地,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多,12个核苷酸或更多,15个核苷酸或更多,20个核苷酸或更多,22个核苷酸或更多,25个核苷酸或更多,或30个核苷酸或更多)。
应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或与其杂交的靶核酸序列中的靶区域的序列互补性为100%。
靶序列与gRNA的杂交代表靶序列和gRNA的核酸序列至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的可以杂交,形成复合物;或者代表靶序列和gRNA的核酸序列至少有12个、15个、16个、17个、18个、19个、20个、21个、22个或更多个碱基可以互补配对,杂交形成复合物。
表达
如本文中所使用的,术语“表达”是指,藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。
接头
如本文中所使用的,术语“接头”是指,由多个氨基酸残基通过肽键连接形成的线性多肽。本发明的接头可以为人工合成的氨基酸序列,或天然存在的多肽序列,例如具有铰链区功能的多肽。此类接头多肽是本领域众所周知的(参见例如,Holliger,P.等人(1993)Proc.Natl.Acad.Sci.USA 90:6444-6448;Poljak,R.J.等人(1994)Structure 2:1121-1123)。
治疗
如本文中所使用的,术语“治疗”是指,治疗或治愈病症,延缓病症的症状的发作,和/或延缓病症的发展。
受试者
如本文中所使用的,术语“受试者”包括但不限于各种动物、植物和微生物。
动物
例如哺乳动物,例如牛科动物、马科动物、羊科动物、猪科动物、犬科动物、猫科动物、兔科动物、啮齿类动物(例如,小鼠或大鼠)、非人灵长类动物(例如,猕猴或食蟹猴)或人。在某些实施方式中,所述受试者(例如人)患有病症(例如,疾病相关基因缺陷所导致的病症)。
植物
术语“植物”应理解为能够进行光合作用的任何分化的多细胞生物,在包括处于任何成熟或发育阶段的作物植物,特别是单子叶或双子叶植物,蔬菜作物,包括洋蓟、球茎甘蓝、芝麻菜、韭葱、芦笋、莴苣(例如,结球莴苣、叶莴苣、长叶莴苣)、小白菜(bok choy)、黄肉芋、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、洋白菜(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲防风草、菊苣、胡椒、马铃薯、葫芦(例如,西葫芦、黄瓜、小西葫芦、倭瓜、南瓜)、萝卜、干球洋葱、芜菁甘蓝、紫茄子(也称为茄子)、婆罗门参、苣菜、青葱、苦苣、大蒜、菠菜、绿洋葱、倭瓜、绿叶菜类(greens)、甜菜(糖甜菜和饲料甜菜)、甘薯、唐莴苣、山葵、西红柿、芜菁、以及香辛料;水果和/或蔓生作物,如苹果、杏、樱桃、油桃、桃、梨、李子、西梅、樱桃、榅桲、杏仁、栗子、榛子、山核桃、开心果、胡桃、柑橘、蓝莓、博伊增莓(boysenberry)、小红莓、穗醋栗、罗甘莓、树莓、草莓、黑莓、葡萄、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三叶草、苜蓿、月见草、白芒花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、红花、小粒谷类作物(大麦、燕麦、黑麦、小麦等)、高粱、烟草、木棉、豆科植物(豆类、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生)、拟南芥属、纤维植物(棉花、亚麻、黄麻)、樟科(肉桂、莰酮)、或一种植物如咖啡、甘蔗、茶、以及天然橡胶植物;和/或花坛植物,如开花植物、仙人掌、肉质植物和/或观赏植物,以及树如森林(阔叶树和常绿树,如针叶树)、果树、观赏树、以及结坚果的树(nut-bearing tree)、以及灌木和其他苗木。
发明的有益效果
本发明拓宽了Cas蛋白PAM识别范围,扩大了CRISPR系统靶点可选择的范围,具有广泛的应用前景。
下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。
附图说明
图1.PAM为ATA时,不同蛋白对于靶点1的识别编辑的效率。其中横坐标代表靶点,1代表靶点1:396-g1;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型Cas12i(WT),黑色柱子代表第369和第433双突的Cas12i蛋白(369/433),条纹柱子代表第7位突变的Cas12i蛋白(S7R)。
图2.PAM为ATT时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g2,2代表靶点2:PYL-6-g2,3代表靶点3:NAL-g2;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型Cas12i(WT),黑色柱子代表第369和第433双突的Cas12i蛋白(369/433),条纹柱子代表第7位突变的Cas12i蛋白(S7R)。
图3.PAM为ATC时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g3,2代表靶点2:PYL-6-g3,3代表靶点3:NAL-g3,4代表靶点4:Nramp5-g3;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型Cas12i(WT),黑色柱子代表第369和第433双突的Cas12i蛋白(369/433),条纹柱子代表第7位突变的Cas12i蛋白(S7R)。
图4.PAM为ATG时,不同蛋白对于不同靶点的识别编辑的效率。其中横坐标代表不同靶点,1代表靶点1:396-g4,2代表靶点2:PYL-6-g4,3代表靶点3:NAL-g4,4代表靶点4:Nramp5-g4;纵坐标代表编辑效率;不同柱子代表不同蛋白,空白柱子代表野生型Cas12i(WT),黑色柱子代表第369和第433双突的Cas12i蛋白(369/433),条纹柱子代表第7位突变的Cas12i蛋白(S7R)。
具体实施方式
以下实施例仅用于描述本发明,而非限定本发明。除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。例如,本发明中所使用的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA等常规技术,可参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis),《分子克隆:实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL),第2次编辑(1989);《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑,(1987));《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司):《PCR 2:实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson)、B.D.黑姆斯(B.D.Hames)和G.R.泰勒(G.R.Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体:实验室手册》(ANTIBODIES,A LABORATORYMANUAL),以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
实施例1.基因编辑载体构建
针对水稻中的mi396、PYL-6、NAL和Nramp5基因分别设计PAM为ATA、ATT、ATC和ATG的靶点,具体靶点信息见表1-表4。每个载体使用单独的U3/U6启动子分别与表1-表4所示的mi396、PYL-6、NAL和Nramp5的靶点杂交的gRNA(gRNA的设计为本领域常规的方法,具体也可参见CN111757889B或CN114672473A)连接,再分别与野生型Cas12i3(专利CN111757889B中的Cas12f.4,本实施例中,将其称之为Cas12i3)、S7R(专利CN114672473A中公开,本申请中的SEQ ID No.1所示序列)、双突蛋白369/433(专利2022107953737中记载,为Cas12i3第369和第433位氨基酸分别突变为R的双突蛋白,本发明中也可以称之为双突蛋白N369/S433)连接构成相应的载体。
表1.PAM为ATA时靶点信息
表2.PAM为ATT时靶点信息
表3.PAM为ATC时靶点信息
表4.PAM为ATG时靶点信息
实施例2、水稻遗传转化及编辑效率的验证
将实施例1中构建的载体分别通过农杆菌转化,侵染水稻愈伤组织,每个载体稳定获得36株水稻。通过PCR以及测序对以上植株进行鉴定,发现不同蛋白对不同PAM位点的识别以及编辑效率存在不同。
结果如图1-图4所示。图1所示PAM为ATA时,S7R蛋白在靶点1(396-g1)处有明显的编辑,编辑效率为12%,但野生型Cas12i3(WT)与双突蛋白N369/S433在靶点1均未发生编辑;图2所示PAM为ATT时,S7R在靶点1(396-g2)有15%左右、靶点2(PYL-6-g2)有92%以及靶点3(NAL-g2)有90%的编辑效率,明显优于其他两种蛋白的编辑活性,N369/S433在靶点2(PYL-6-g2)以及靶点3(NAL-g2)表现出一定的活性,分别为68%和10%左右的编辑效率,WT仅在靶点2(PYL-6-g2)处表现出一定的活性,编辑效率为65%左右;图3所示PAM为ATC时,S7R在靶点1(396-g3)、靶点2(PYL-6-g3)、靶点3(NAL-g3)以及靶点4(Nramp5-g3)均表现出活性,编辑效率分别为80%、14%、10%、84%左右,在靶点1(396-g3)和靶点4(Nramp5-g3)中具有极显著的编辑活性,N369/S433在靶点1(396-g3)以及靶点4(Nramp5-g3)表现出较弱的编辑活性,编辑效率分别为6%、7%左右,WT仅在靶点1(396-g3)表现出较弱的编辑活性,编辑效率仅为8%;图4所示PAM为ATG时,S7R在靶点1(396-g4),靶点2(PYL-6-g4),靶点3(NAL-g4)和靶点4(Nramp5-g4)都具有编辑活性,编辑效率分别为:2%、54%、39%以及82%,N369/S433在靶点3(NAL-g4)和靶点4(Nramp5-g4)具有一定的编辑活性,编辑效率为14%和2%,WT在四个位点处均没有检测到编辑活性。
综上所述,野生型的Cas12i3除了ATT的PAM有一个靶点有编辑以外,其他类型的ATN PAM序列基本不能识别;369/433的双突对ATN的PAM提升有限,而S7R对所测试的ATN的PAM序列都能实现编辑,最高的编辑效率在92%。因此S7R的突变体能对ATN的PAM实现编辑,扩增了Cas12i3的PAM识别范围。
尽管本发明的具体实施方式已经得到详细的描述,但本领域技术人员将理解:根据已经公布的所有教导,可以对细节进行各种修改和变动,并且这些改变均在本发明。
Claims (13)
1.一种工程化的、非天然存在的CRISPR系统,包含
a)Cas蛋白,所述Cas蛋白的氨基酸序列如SEQ ID No.1所示,以及
b)至少一种被设计为与所述Cas蛋白形成复合物的gRNA,其中所述gRNA包含与靶序列杂交的区域,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
2.一种工程化的、非天然存在的CRISPR系统,包含
a)一种或多种编码权利要求1中的Cas蛋白的核苷酸序列,以及
b)一种或多种编码至少一种gRNA的核苷酸序列,所述至少一种gRNA与所述Cas蛋白形成复合物,其中所述gRNA与靶序列杂交,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
3.一种包含一种或多种载体的工程化的、非天然存在的载体系统,包含
a)可操作地连接至一种或多种编码权利要求1中的Cas蛋白的核苷酸序列的第一调控元件;
b)可操作地连接至一种或多种编码至少一种gRNA的核苷酸序列的第二调控元件,所述至少一种gRNA与所述Cas蛋白形成复合物,其中所述gRNA与靶序列杂交,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种;
组分(a)和(b)位于所述系统的相同或不同的载体上。
4.一种工程化的、非天然存在的CRISPR系统,包含
a)Cas蛋白,所述Cas蛋白的氨基酸序列如SEQ ID No.1所示;或一种或多种编码所述Cas蛋白核苷酸序列,以及
b)至少一种与所述Cas蛋白形成复合物的gRNA,其中所述gRNA与靶序列杂交,或一种或多种编码所述至少一种gRNA的核苷酸序列,其中所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
5.根据权利要求1-4任一所述的系统,其中所述Cas蛋白还连接一个或多个核定位信号。
6.根据权利要求1-4任一所述的系统,其特征在于,所述靶序列为真核细胞中的靶序列;优选的,所述真核细胞为植物细胞、动物细胞和人类细胞。
7.一种修饰真核细胞靶序列特定位点的方法,包括递送权利要求1、2、3或4所述的系统到所述真核细胞,其中所述gRNA与所述靶序列杂交导致特定位点的修饰,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
8.根据权利要求7所述的方法,其特征在于,所述递送包括递送一种或多种编码所述Cas蛋白的核苷酸序列和一种或多种编码所述至少一种gRNA的核苷酸序列。
9.根据权利要求8所述的方法,其特征在于,所述一个或多个核苷酸序列被包含在一个或多个载体中。
10.一种编辑靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括将靶核酸与权利要求1-4任一所述的系统进行接触的步骤,权利要求1-4任一所述系统中的gRNA包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
11.根据权利要求10的方法,其特征在于,所述靶核酸为真核细胞中的靶核酸;优选的,所述真核细胞为植物细胞、动物细胞和人类细胞。
12.权利要求1-4任一所述的系统在制备试剂或试剂盒中的用途,所述试剂或试剂盒用于:编辑靶核酸、靶向靶核酸、切割靶核酸,权利要求1-4任一所述系统中的gRNA包含与所述靶核酸上的靶序列杂交的区域,其中,所述靶序列位于原型间隔区相邻基序(PAM)的3’端,且所述PAM序列为ATN,其中N选自A、T、C或G中的任意一种。
13.根据权利要求12的用途,其特征在于,所述靶核酸为真核细胞中的靶核酸;优选的,所述真核细胞为植物细胞、动物细胞和人类细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211306408.2A CN115725543B (zh) | 2022-10-25 | 2022-10-25 | Crispr酶以及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211306408.2A CN115725543B (zh) | 2022-10-25 | 2022-10-25 | Crispr酶以及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115725543A true CN115725543A (zh) | 2023-03-03 |
CN115725543B CN115725543B (zh) | 2024-08-20 |
Family
ID=85293870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211306408.2A Active CN115725543B (zh) | 2022-10-25 | 2022-10-25 | Crispr酶以及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115725543B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114438055A (zh) * | 2021-10-26 | 2022-05-06 | 山东舜丰生物科技有限公司 | 新型的crispr酶和系统以及应用 |
CN114507654A (zh) * | 2022-04-20 | 2022-05-17 | 山东舜丰生物科技有限公司 | 新型Cas酶和系统以及应用 |
CN114517190A (zh) * | 2021-02-05 | 2022-05-20 | 山东舜丰生物科技有限公司 | Crispr酶和系统以及应用 |
CN114672473A (zh) * | 2022-05-31 | 2022-06-28 | 舜丰生物科技(海南)有限公司 | 一种优化的Cas蛋白及其应用 |
-
2022
- 2022-10-25 CN CN202211306408.2A patent/CN115725543B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114517190A (zh) * | 2021-02-05 | 2022-05-20 | 山东舜丰生物科技有限公司 | Crispr酶和系统以及应用 |
CN114438055A (zh) * | 2021-10-26 | 2022-05-06 | 山东舜丰生物科技有限公司 | 新型的crispr酶和系统以及应用 |
CN114507654A (zh) * | 2022-04-20 | 2022-05-17 | 山东舜丰生物科技有限公司 | 新型Cas酶和系统以及应用 |
CN114672473A (zh) * | 2022-05-31 | 2022-06-28 | 舜丰生物科技(海南)有限公司 | 一种优化的Cas蛋白及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115725543B (zh) | 2024-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114672473B (zh) | 一种优化的Cas蛋白及其应用 | |
CN114517190B (zh) | Crispr酶和系统以及应用 | |
CN114438055B (zh) | 新型的crispr酶和系统以及应用 | |
CN114410609B (zh) | 一种活性提高的Cas蛋白以及应用 | |
CN114507654B (zh) | Cas酶和系统以及应用 | |
CN116004573B (zh) | 编辑活性提高的Cas蛋白及其应用 | |
CN117106752A (zh) | 优化的Cas12蛋白及其应用 | |
CN116286739A (zh) | 突变的Cas蛋白及其应用 | |
CN114277015B (zh) | Crispr酶以及应用 | |
CN115725543A (zh) | Crispr酶以及系统 | |
CN117821424B (zh) | 一种优化的IscB蛋白及其应用 | |
CN116790559B (zh) | 一种融合HNH结构域的V型Cas酶及其应用 | |
CN116555225B (zh) | 活性改善的Cas蛋白及其应用 | |
WO2023174249A1 (zh) | 活性改善的Cas蛋白及其应用 | |
WO2023173682A1 (zh) | 一种优化的Cas蛋白及其应用 | |
WO2024041299A1 (zh) | 突变的CRISPR-Cas蛋白及其应用 | |
WO2023231456A1 (zh) | 一种优化的Cas蛋白及其应用 | |
CN118006585B (zh) | 一种优化的Cas蛋白及其应用 | |
WO2023143150A1 (zh) | 新型Cas酶和系统以及应用 | |
WO2024040874A1 (zh) | 突变的Cas12j蛋白及其应用 | |
CN118813586A (zh) | 突变的Cas蛋白及其应用 | |
CN117327679A (zh) | 碱基编辑工具及其应用 | |
CN118147110A (zh) | 突变的Cas蛋白及其应用 | |
CN114480383A (zh) | 一种具有碱基突变的同向重复序列及其应用 | |
CN117286123A (zh) | 一种优化的Cas蛋白及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |